TRƯỜNG ĐẠI HỌC CNTT&TT
KHOA CÔNG NGHỆ THÔNG TIN
Đàm Thanh Phương
Thị Thanh
Trần Quang Quý
BÀI GIẢNG
HỌC Y
NĂM HỌC 2022-2023
LƯU HÀNH NỘI BỘ
Mục lục
Mục lục
Chương I TỔNG QUAN
1 Các khái niệm bản......................................... 6
1.1 Khái niệm học y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Dliu.................................................... 6
1.3 Các bài toán bản trong học y . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Các thuật toán học y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Hàm mất mát và tham số hình . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Những thách thức chính của học y . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.7 Quy trình thực hiện một dự án học y . . . . . . . . . . . . . . . . . . . . . . . 14
2 Các kỹ thuật xây dựng đặc trưng ............................. 20
2.1 Giithiu ................................................. 20
2.2 hình chung cho các bài toán học máy . . . . . . . . . . . . . . . . . . . . . 20
2.3 Một số kỹ thuật trích chọn đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Chuẩn hoá vector đặc trưng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 BÀI TẬP CUỐI CHƯƠNG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Bài giảng học y 1
Mục lục
Chương II C THUẬT TOÁN HỌC GIÁM T
3 Hồi quy tuyến tính ........................................... 30
3.1 Giithiu ................................................. 30
3.2 y dựng và tối ưu hàm mất mát . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 VídtrênPython.......................................... 33
3.4 Tholun ................................................. 36
4Klân cận .................................................... 39
4.1 Giithiu ................................................. 39
4.2 Phântíchtoánhc ......................................... 39
4.3 dụ trên sở dữ liệu Iris . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Tholun ................................................. 44
2 Bài giảng học máy
Mục lục
5 Bộ phân loại naive Bayes ..................................... 46
5.1 Bộ phân loại naive Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.2 Các phân phối thường dùng trong NBC . . . . . . . . . . . . . . . . . . . . . . . 48
5.3 Víd .................................................... 49
5.4 Tholun ................................................. 56
6 Hạ Gradient .................................................. 57
6.1 Giithiu ................................................. 57
6.2 Hạ gradient cho hàm một biến . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.3 Hạ gradient cho hàm nhiều biến . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.4 Hạ gradient với momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.5 Nesterov accelerated gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.6 Hạ gradient ngẫu nhiên. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.7 Tholun ................................................. 72
7 Thuật toán học perceptron ................................... 74
7.1 Giithiu ................................................. 74
7.2 Thuật toán học perceptron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7.3 dụ và minh hoạ trên Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7.4 hình mạng neuron đầu tiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.5 ThoLun ................................................ 81
Bài giảng học y 3
Mục lục
8 Hồi quy logistic .............................................. 83
8.1 Giithiu ................................................. 83
8.2 Hàm mất mát và phương pháp tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.3 Triển khai thuật toán trên Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
8.4 Tính chất của hồi quy logistic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8.5 Bài toán phân biệt hai chữ số viết tay . . . . . . . . . . . . . . . . . . . . . . . . 93
8.6 Bài toán phân loại đa lớp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.7 Tholun ................................................ 96
9 Hồi quy softmax.............................................. 99
9.1 Giithiu ................................................. 99
9.2 Hàmsoftmax .............................................. 100
9.3 Hàm mất mát và phương pháp tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.4 dụ trên Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
9.5 Tholun ................................................ 111
10 y vector hỗ trợ ............................................ 112
10.1 Giithiu ................................................. 112
10.2 y dựng bài toán tối ưu cho y vector hỗ trợ . . . . . . . . . . . . . . . . 114
10.3 Bài toán đối ngẫu của y vector hỗ trợ. . . . . . . . . . . . . . . . . . . . . . . 116
10.4 Lập trình tìm nghiệm cho máy vector hỗ trợ . . . . . . . . . . . . . . . . . . . 119
10.5 Tómtt................................................... 121
10.6 BÀI TẬP CUỐI CHƯƠNG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Chương III C THUẬT TOÁN HỌC KHÔNG GIÁM T
4 Bài giảng học máy