
Dữ liệu
• Gọi D= 𝑥1,𝑦1, 𝑥2,𝑦2,…, 𝑥𝑀,𝑦𝑀là tập dữ liệu cỡ 𝑀
• Mỗi quan sát 𝑥𝑖là một biến 𝑛chiều
vd: 𝑥𝑖= 𝑥𝑖1,𝑥𝑖2,𝑥𝑖3,…,𝑥𝑖𝑛 với mỗi chiều là một thuộc tính.
•𝑦là đầu ra đơn biến
• Dự đoán: cho vào tập dữ liệu D, có thể nhận
xét gì về 𝑦∗cho một giá trị 𝑥∗chưa biết.
• Để dự đoán, chúng ta cần có giả thuyết
•Mô hình (model) Hmã hóa những giả thuyết này và thường phụ
thuộc vào một vài tham số 𝜃, ví dụ:
𝑦 = 𝑓 𝑥 𝜃
•Quá trình học chính là tìm được H từ tập D.
5