i
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cu ca riêng tôi.
Các s liu, kết qu u trong luận văn trung thực chưa từng đưc ai
công b trong bt k công trình o khác. Nếu không đúng như đ nêu trên, tôi xin
hoàn toàn chu trách nhim v đ tài ca mình.
Tp. HCM, ngày 15 tháng 07 năm 2022
Hc viên thc hin luận văn
Lê Đức Hòa Bình
ii
LI CẢM ƠN
Trong thi gian thc hin luận văn tt nghip, đưc s hướng dn tn tình
của giáo viên hướng dẫn được phía nhà trường tạo điu kin thun lợi, tôi đ
mt quá trình nghiên cu, tìm hiu hc tập nghiêm túc để hoàn thành đ tài. Kết
qu thu đưc không ch do n lc ca cá nhân tôi mà còn có s giúp đỡ ca quý thy
cô, gia đình và các bạn.
Tôi xin chân thành cảm ơn TS. Tân Hnh. Thầy đ hướng dn, h tr tôi
hoàn thành tt luận văn v phương pháp, lý lun và ni dung lun văn.
Cảm ơn n Giám Hiu, Khoa Đào Tạo Sau Đại Học, Phòng Đào To &
KHCN Hc Vin Công Ngh Bưu Chính Viễn Thông sở tại Tp. HCM đ quan
tâm, tạo điu kin giúp i hoàn thành luận văn tốt nghip.
Cám ơn Ban giám đốc các đồng nghip ti Viễn thông Tây Ninh đ h
trợ, giúp đỡ tôi trong sut quá trình thc hin luận văn.
Trong quá trình thc hin và trình bày không th tránh khi nhng hn chế,
do vy tôi rt mong nhận được s góp ý, nhn xét phê bình ca quý thy các
bạn để hoàn thin kiến thc và bn thân.
Tp. HCM, ngày 15 tháng 07 năm 2022
Hc viên thc hin luận văn
Lê Đức Hòa Bình
iii
MC LC
LỜI CAM ĐOAN ............................................................................................. i
LI CẢM ƠN .................................................................................................. ii
MC LC ....................................................................................................... iii
DANH MC CÁC THUT NG, CH VIT TT ................................. vi
DANH SÁCH HÌNH V ............................................................................... vii
DANH SÁCH BNG ................................................................................... viii
M ĐẦU .......................................................................................................... 1
CHƯƠNG 1 - CƠ S LÝ THUYT VÀ CÁC NGHIÊN CU CÓ LIÊN
QUAN ............................................................................................................... 4
1.1. Tng quan v hc máy ......................................................................... 4
1.1.1. Khái nim ........................................................................................ 6
1.1.2. Phân loi các k thut hc máy ..................................................... 6
1.2. Bài toán phân lp d liu .................................................................... 7
1.2.1. Khái nim v phân lp d liu và bài toán phân lp d liu ....... 7
1.2.2. Các bước gii quyết bài toán phân lp d liu ............................. 8
1.2.3. Các độ đo để đánh giá mô hình phân lp d liu ...................... 10
1.3. Thut toán Cây quyết định ............................................................... 11
1.3.1. Gii thiệu phương pháp ............................................................... 11
1.3.2. Thut toán Rng ngu nhiên ...................................................... 15
1.4. Các công trình nghiên cu liên quan ............................................... 17
1.4.1.Model based collaborative filtering .............................................. 18
1.4.2. A Survey of Collaborative Filtering Techniques ........................ 18
1.4.3. Collaborative Filtering for Multi-class Data Using Belief Nets 19
1.4.4. An intelligent decision support system for production planning
based on machine learning .................................................................... 19
1.4.5. Machine learning based decision support systems (DSS) for
heart disease diagnosis ........................................................................... 20
iv
1.5. Thư viện Scikit-learn ......................................................................... 21
1.6. Pycharm .............................................................................................. 22
1.6.1. Gii thiu ...................................................................................... 22
1.6.2. Các tính năng của Pycharm ........................................................ 22
CHƯƠNG 2 PHƯƠNG PHÁP KHUYẾN NGH GÓI CƯỚC ............. 24
2.1. Phân tích các yếu t ảnh hưởng tới gói cước phù hp vi khách
hàng ............................................................................................................ 24
2.1.1. Các yếu t v khách hàng ............................................................ 24
2.1.2. Các yếu t v chất lượng dch v ................................................. 24
2.2. Mô hình d đoán gói cước cho khách hàng ..................................... 25
2.3. S dng thut tn phân lp Rng ngu nhiên thông qua b thư
vin Scikit-learn ......................................................................................... 26
2.4. S dụng Pycharm để xây dng ng dng web ................................ 29
CHƯƠNG 3 - XÂY DNG MÔ HÌNH ....................................................... 30
3.1. D liu ................................................................................................. 31
3.1.1. Thu thp d liu ........................................................................... 31
3.1.2. X lý d liu ................................................................................. 33
3.1.3. Mã hóa d liu ............................................................................. 34
3.2. Xây dng mô hình khuyến ngh gói cước da vào thut toán rng
ngu nhiên .................................................................................................. 34
3.2.1. Ly mu d liu cho vic xây dng cây quyết định trong rng
ngu nhiên .............................................................................................. 35
3.2.2. Xây dng cây quyết định trong rng ngu nhiên ...................... 37
3.2.3. Xây dng rng ngu nhiên ......................................................... 39
3.3. Xây dng ng dng web .................................................................... 40
CHƯƠNG 4 – PHÂN TÍCH VÀ ĐÁNH GIÁ ............................................. 42
4.1. Phân tích độ chính xác ca mô hình ................................................. 42
4.2. Xác định mức đ quan trng ca các thuc tính ............................ 45
CHƯƠNG 5 - KT LUN ........................................................................... 48
5.1. Kết qu đạt được ................................................................................ 48
v
5.1.1. V mt lý thuyết .......................................................................... 48
5.1.2. V mt thc tin .......................................................................... 48
5.2. Hn chế ................................................................................................ 49
5.3. Hướng phát trin ................................................................................ 49
DANH MC TÀI LIU THAM KHO ..................................................... 51