Bài giảng Học máy: Bài 3 - Nguyễn Hoàng Long
lượt xem 2
download
Bài giảng "Học máy - Bài 3: Kỹ thuật kiểm tra chéo, hiệu chỉnh mô hình, mô hình thưa" cung cấp cho người học các kiến thức: Các giải thuật học máy, hàm tổn thất, kỹ thuật kiểm tra chéo, mô hình có điều chỉnh,... Mời các bạn cùng tham khảo.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Học máy: Bài 3 - Nguyễn Hoàng Long
- Kỹ thuật kiểm tra chéo, hiệu chỉnh mô hình, mô hình thưa Nguyễn Thanh Tùng Khoa Công nghệ thông tin – Đại học Thủy Lợi tungnt@tlu.edu.vn Website môn học: https://sites.google.com/a/wru.vn/cse445spring2016/ Bài giảng có sử dụng hình vẽ trong cuốn sách “An Introduction to Statistical Learning with Applications in R” với sự cho phép của tác giả, có sử dụng slides các khóa học CME250 của ĐH Stanford và IOM530 của ĐH Southern California CSE 445: Học máy | Học kỳ 1, 2016-2017 1
- Các dạng giải thuật Học máy Do you have labeled data? Yes No Supervised Unsupervised What do you want to predict? Do you want to group the data? Category Quantity Yes No Classification Regression Cluster Dimensionality Analysis Reduction SVM KNN CART LASSO Logistic Linear K-means Regression Regression ICA PCA CSE 445: Học máy | Học kỳ 1, 2016-2017 2
- Nhắc lại Hồi quy tuyến tính đơn giản Figure 3.1 , ISL 2013 CSE 445: Học máy | Học kỳ 1, 2016-2017 3
- Nhắc lại Bình phương nhỏ nhất • Sử dụng phương pháp bình phương nhỏ nhất để đo lường độ xấp xỉ của mô hình áp dụng trên dữ liệu • Phần dư (Residual): sai số giữa giá trị quan sát được và giá trị dự đoán. (i) = (i) ˆ (i) • Tổng phần dư bình phương-Residual sum of squares (RSS): 2 2 = (1) (2) (n) 2 + + ⋯+ • Lỗi bình phương trung bình-Mean squared error (MSE): CSE 445: Học máy | Học kỳ 1, 2016-2017 4
- Hàm tổn thất Loss Functions CSE 445: Học máy | Học kỳ 1, 2016-2017 5
- Loss Functions L(θi ,θˆi ) CSE 445: Học máy | Học kỳ 1, 2016-2017 6
- Loss Functions L(θi ,θˆi ) Lỗi bình phương (Squared error) θ − ∑ i i ( θˆ ) 2 i Lỗi tuyệt đối (Absolute error) ∑ θ − θˆ i i i Lỗi điều hướng (Indicator error) ∑ I(θ ≠ θˆ ) i i i CSE 445: Học máy | Học kỳ 1, 2016-2017 7
- Học máy chỉ để giải 1 vấn đề CSE 445: Học máy | Học kỳ 1, 2016-2017 8
- Kỹ thuật kiểm tra chéo Cross-validation CSE 445: Học máy | Học kỳ 1, 2016-2017 9
- Kỹ thuật kiểm tra chéo “Dùng lỗi trên tập dữ liệu kiểm thử để ước lượng lỗi dự đoán” err = E[L(Y, fˆ(X))] CSE 445: Học máy | Học kỳ 1, 2016-2017 10
- Kỹ thuật kiểm tra chéo Tập huấn luyện-Training Set Tập kiểm thử-Test Set Tập kiểm chứng-Validation Set Training Data Testing Data CSE 445: Học máy | Học kỳ 1, 2016-2017 11
- Kỹ thuật kiểm tra chéo K--fold Vídụ5--fold Hastie, Trevor, et al. The elements of statistical learning. Vol. 2. No. 1. New York: Springer, 2009. 10 CSE 445: Học máy | Học kỳ 1, 2016-2017 12
- Kỹ thuật kiểm tra chéo 5-fold và 10-fold thường được ưa dùng (lỗi bias cao, phương sai thấp) CSE 445: Học máy | Học kỳ 1, 2016-2017 13
- Kỹ thuật kiểm tra chéo N-fold gọi là kỹ thuật kiểm tra chéo “leave one out-LOOCV” (lỗi bias thấp, phương sai cao) CSE 445: Học máy | Học kỳ 1, 2016-2017 14
- Kỹ thuật kiểm tra chéo • Dùng để ước lượng lỗi dự đoán • Dùng để chọn các giá trị tham số phù hợp cho mô hình (vd: tham số k trong k--láng giềng gần nhất) CSE 445: Học máy | Học kỳ 1, 2016-2017 15
- Auto Data: LOOCV vs. K-fold CV Hình trái: Sai số LOOCV Hình phải: 10-fold CV được chạy nhiều lần, đồ thị biểu diễn sai khác nhỏ về lỗi CV LOOCV là trường hợp đặc biệt của k-fold, khi k = n Cả hai đều ổn định, tuy nhiên LOOCV mất nhiều thời gian tính toán hơn! CSE 445: Học máy | Học kỳ 1, 2016-2017 16
- Thách thức: Overfitting • Overfitting: Kết quả tốt trên tập huấn luyện nhưng cho kết quả kém trên tập kiểm thử Figures 2.4 and 2.6 ,ISL 2013 CSE 445: Học máy | Học kỳ 1, 2016-2017 17
- Overfitting Sai số trên tập kiểm thử “With four parameters I can fit an elephant, and with five I can make him wiggle his trunk” Sai số trên tập huấn --John von Neumann according to Enrico Fermi luyện Figure2.9 , ISL 2013 CSE 445: Học máy | Học kỳ 1, 2016-2017 18
- Kỹ thuật kiểm tra chéo (đường cong của hàm học) Ta cần thêm biến (mô hình mới) hoặc thêm dữ liệu? CSE 445: Học máy | Học kỳ 1, 2016-2017 19
- Mô hình có điều chỉnh CSE 445: Học máy | Học kỳ 1, 2016-2017 20
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng mạng máy tính (ĐH FPT) - Chương 3 Mạng Ethernet và mạng Wi-Fi
45 p | 416 | 113
-
Bài giảng IC3 GS4 - Bài 3: Phần cứng
50 p | 342 | 60
-
Bài giảng Mạng máy tính - Chương 3: Tầng giao vận
104 p | 335 | 41
-
Bài giảng Mạng máy tính căn bản: Chương 3 - Phan Vĩnh Thuần
110 p | 179 | 25
-
Bài giảng Mạng máy tính: Bài 3 - Trường TCN Tôn Đức Thắng
39 p | 130 | 14
-
Bài giảng Mạng máy tính và hệ thống thông tin công nghiệp: Chương 2.3 - Đào Đức Thịnh
44 p | 92 | 10
-
Bài giảng Mạng máy tính: Chương 3 - ThS. Phạm Nguyễn Huy Phương
24 p | 91 | 8
-
Bài giảng Học phần Mạng máy tính – Computer networks: Chương 3 - Lớp vật lý Physical Layer
42 p | 138 | 8
-
Bài giảng Mạng máy tính: Chương 3 - Hoàng Thanh Hòa
56 p | 92 | 7
-
Bài giảng Mạng máy tính: Chương 3 - PGS. TS. Nguyễn Hữu Thanh
20 p | 96 | 6
-
Bài giảng Tin 1: Chương 3 - ĐH Kinh doanh và Công nghệ Hà Nội
23 p | 64 | 6
-
Bài giảng Web search - Bài 3: Máy tìm kiếm Facebook graph search và Facebook trends
23 p | 30 | 5
-
Bài giảng Mạng máy tính (Computer Networking) - Chương 3: Tầng giao vận
56 p | 53 | 4
-
Bài giảng Mạng máy tính (Computer Network): Chương 3 - Lưu Đức Trung
10 p | 22 | 4
-
Bài giảng Học máy (IT 4862): Chương 4.3 - Nguyễn Nhật Quang
30 p | 53 | 4
-
Bài giảng Mạng máy tính (Computer Network): Chương 8 - Lưu Đức Trung
23 p | 24 | 2
-
Bài giảng CAD/CAM - Chương 3: Đồ họa máy tính
12 p | 8 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn