i
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cu ca riêng tôi.
Các số liu, kết qu nêu trong luận văn là trung thực và chưa từng được ai công
b trong bt k công trình nào khác. Nếu không đúng như đ nêu trên, tôi xin hoàn
toàn chịu trách nhiệm v đ tài của mình.
Tp. HCM, ngày 15 tháng 07 năm 2022
Học viên thực hin lun văn
Đàm Thanh Giang
ii
LI CẢM ƠN
Trong suốt quá trình học tập nghiên cứu thc hin luận văn, ngoài nỗ lc ca
bản thân, tôi đ nhận được s hướng dn nhiệt tình quý báu của quý Thầy Cô, cùng
vi s động viên và ủng h của gia đình, bạn bè và đồng nghip. Với lòng kính trọng
và biết ơn sâu sắc, tôi xin gửi li cảm ơn chân thành tới: Ban Giám Đốc, Phòng đào
tạo sau đại học quý Thầy đ to mọi điu kin thun lợi giúp tôi hoàn thành
luận văn.
Tôi xin chân thành cảm ơn Thầy TS. Tân Hnh đ hết lòng giúp đỡ, hướng
dẫn, động viên, tạo điu kiện cho tôi trong sut quá trình thực hiện hoàn thành
luận văn.
Tôi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong quan đ
động viên, hỗ tr tôi trong lúc khó khăn để tôi có thể hc tập và hoàn thành luận văn.
Mặc dù đ có nhiu c gng, n lực, nhưng do thi gian kinh nghiệm nghiên cứu
khoa học còn hạn chế nên không th tránh khỏi nhng thiếu sót. Tôi rất mong nhn
được s góp ý của quý Thầy Cô cùng bạn đồng nghiệp để kiến thc của tôi ngày
mt hoàn thiện hơn.
Xin chân thành cảm ơn!
Tp. HCM, ngày 15 tháng 07 năm 2022
Học viên thực hin lun văn
Đàm Thanh Giang
iii
MC LC
LỜI CAM ĐOAN ............................................................................................. i
LI CẢM ƠN .................................................................................................. ii
MC LC ....................................................................................................... iii
DANH MỤC CÁC THUẬT NG, CH VIT TT .................................. v
DANH SÁCH HÌNH VẼ ................................................................................ vi
DANH SÁCH BẢNG .................................................................................... vii
M ĐẦU .......................................................................................................... 1
CHƯƠNG 1 – HÌNH HỒI QUY, CÁC KỸ THUT HỌC MÁY ÁP
DỤNG CHO BÀI TOÁN DỰ ĐOÁN ............................................................ 4
1.1 Mô hình Logistic Regression................................................................ 4
1.1.1 Gii thiu..................................................................................... 4
1.1.2 Mô hình Logistic .............................................................................. 5
1.1.3 Hàm Sigmoid .................................................................................... 5
1.1.4 Hàm mất mát và phương pháp tối ưu .............................................. 6
1.2 Support Vector Machine ....................................................................... 8
1.2.1 Gii thiu..................................................................................... 8
1.2.2 Độ rng ca margin .................................................................. 10
1.3 Thuật toán Cây quyết định ................................................................. 11
1.3.1 Gii thiu................................................................................... 11
1.3.2 Thuật toán ID3 .......................................................................... 13
1.3.3. Thuật toán C4.5 ............................................................................. 14
1.4 Các công trình nghiên cứu trong nước ............................................... 15
1.4.1. Áp dụng k thuật khai phá dữ liu d báo thuê bao rời mng
trong mạng di động ................................................................................. 15
1.4.2. Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói
c trong mạng di động ........................................................................ 16
1.5 Các công trình nghiên cứu ngoài nước ............................................... 16
1.5.1. Churn Prediction in the Telecommunications Sector Using
Support Vector Machines ........................................................................ 16
iv
1.5.2. A comparison of machine learning techniques for customer
churn prediction ...................................................................................... 16
CHƯƠNG 2 – PHÂN TÍCH VÀ ĐÁNH GIÁ DỮ LIỆU KHÁCH HÀNG
S DNG DCH V FIBERVNN CỦA VNPT TÂY NINH .................... 18
1.1. Đánh giá thị trường Internet tại Tây Ninh ....................................... 18
1.1.1. Các yếu t v khách hàng ......................................................... 18
1.1.2. Các yếu t v chất lượng dch v .............................................. 19
1.2. Bài toán chăm sóc và dự đoán khách hàng rời mng của VNPT Tây
Ninh ......................................................................................................... 19
CHƯƠNG 3 - Y DỰNG MÔ HÌNH ....................................................... 22
KT LUẬN VÀ HƯỚNG PHÁT TRIỂN ................................................... 37
1. Kết qu đạt được ................................................................................. 37
1.1. V mặt lý thuyết ........................................................................... 37
1.2. V mt thc tin ........................................................................... 37
2. Hn chế ............................................................................................... 37
3. ớng phát triển ................................................................................. 38
DANH MỤC TÀI LIỆU THAM KHO ..................................................... 39
v
DANH MỤC CÁC THUẬT NG, CH VIT TT
Viết tt
Tiếng Anh
Tiếng Vit
LR
Logistic Regression
Hi quy logic
RF
Random Forest
Rng ngẫu nhiên
SVM
Support Vector Machines
Máy véc tơ h tr
DT
Decision Tree
Cây quyết định
TP
True Positive
FP
False Positive
FN
False Negative
TN
True Negative
Acc
Accuracy
Độ chính xác