CHƯƠNG 2
HỒI QUY
Nội dung
2.1 Bài toán hồi quy
2.2 Hồi quy tuyến tính
2.2.1. Hồi quy tuyến tính đơn giản
2.2.2. Hồi quy tuyến tính đa biến
2.3 Hồi quy dựa trên cây
2.1.1 Giới thiệu
Hồi quy (Regression) một kỹ thuật học máy giám sát nhằm dự
đoán giá trị của biến đầu ra (phụ thuộc) Y dựa trên mối quan hệ với
đặc trưng của một biến đầu vào (độc lập) X hoặc một nhóm các biến
đầu vào 𝑋𝑗𝑗 = 1,2,..𝑘 .
dụ: Dự đoán doanh thu bán hàng (Y) với các yếu tố đầu vào gồm
giá bán (𝑋1), chi phí quảng cáo (𝑋2), số lượng khách hàng (𝑋3).
2.1 Bài toán Hồi quy
2.1.2 Các loại hình Hồi quy phổ biến:
- Hồi quy tuyến tính. dụ như dự đoán tốc độ tăng trưởng GDP dựa trên
các chỉ số kinh tế gồm chỉ số giá tiêu dùng, tăng trưởng xuất khẩu,
- Hồi quy đa thức. dụ như dự đoán tốc độ phản ng hóa học theo nhiệt
độ.
-Hồi quy Ridge/Lasso: cải tiến của hình hồi quy tuyến tính, thêm
regularization để tránh hiện tượng quá khớp (overfitting).
2.1 Bài toán Hồi quy
2.1.3 Đánh giá hình hồi quy
Ta thường dùng các chỉ số phổ biến sau đây để đánh giá hình Hồi quy :
Sai số bình phương trung bình - MSE (Mean Squared Error)
Căn bậc 2 của sai số bình phương trung bình RMSE (Root MSE)
Sai số tuyệt đối trung bình MAE (Mean Absolute Error)
Sai số phần trăm tuyệt đối trung bình MAPE (Mean Absolute Percentage Error)
Hệ số xác định bội 𝑅2.
2.1 Bài toán Hồi quy