NGUYỄN VIỆT ANH
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM
KHOA HỌC VÀ CÔNG NGHỆ VN
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Nguyễn Việt Anh
HỆ THỐNG THÔNG TIN
NGHIÊN CỨU VÀ THỬ NGHIỆM PHẦN MỀM PHÂN
LOẠI HÀNH VI BÒ SỬ DỤNG THUẬT TOÁN CÂY
QUYẾT ĐỊNH
LUẬN VĂN THẠC SĨ
Hệ thống thông tin
2021
Nội - 2021
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM
KHOA HỌC VÀ CÔNG NGHỆ VN
Chuyên ngành:
Hệ thống thông tin
số:
ITT801
1
LỜI CAM ĐOAN
Tôi xin cam đoan đề i nghiên cu trong lun văn này là công trình nghiên cu
ca tôi da trên nhng tài liu, s liu do chính tôi t tìm hiu nghiên cu. Chính
vy, các kết qu nghiên cứu đảm bo trung thc khách quan nhất. Đồng thi, kết
qu này chưa tng xut hin trong bt c mt nghiên cu nào. Các s liu, kết qu nêu
trong luận văn là trung thực nếu sai tôi hoàn chu trách nhim.
Tác gi luận văn
Nguyn Vit Anh
2
LI CẢM ƠN
Để hoàn thành luận văn này, tôi xin gửi li cm ơn chân thành và tình cảm đặc
bit ti ngƣi thy đồng thời cũng là đồng nghiệp cùng nơi công tác ca tôi là TS. Trn
Đức Nghĩa. Thy là ngƣời đã luôn theo sát, tn tình ch bảo, góp ý, hƣng dẫn và định
hƣớng cho tôi trong sut quá trình làm luận văn này tại Hc Vin Khoa hc và Công
ngh, Vin Hàn lâm Khoa hc và Công ngh Vit Nam.
Nghiên cứu này đƣợc thc hin trong khuôn kh đề tài mã s KC.01.21/16-20
tài tr bi B Khoa hc và Công ngh.
Tiếp theo, tôi cũng xin gửi li cm ơn sâu sắc ti các thy cô, các bn trong Hc
Vin Khoa hc và Công ngh; các anh ch đồng nghip ti Vin Công ngh Thông tin
đã luôn sẵn sàng giúp đ tạo điều kin tt nht cho tôi trong quá trình làm luận văn.
Tôi cũng xin cảm ơn sự h tr ca nhóm nghiên cu tiềm năng Cảm nhn thông
minh và ng dng (SSA), Tờng đại hc Phenikaa.
Mc dù có nhiu c gng, song thi gian thc hin luận văn có hạn, nên lun
văn còn nhiều hn chế. Tôi rt mong nhận đƣợc nhiu s góp ý, ch bo ca các thy,
cô đ hoàn thiện hơn luận văn của mình.
Tôi xin chân thành cảm ơn!
Hà Ni, ngày 12 tháng 7 m 2021
Hc viên
Nguyn Vit Anh
3
MC LC
LỜI CAM ĐOAN ......................................................................................................... 1
LI CẢM ƠN ............................................................................................................... 2
MC LC ..................................................................................................................... 3
DANH MC HÌNH V ................................................................................................ 5
DANH MC BNG BIU .......................................................................................... 6
DANH MC VIT TT .............................................................................................. 7
CHƢƠNG 1: TNG QUAN V ĐỀ TÀI NGHIÊN CU ...................................... 8
1.1. Yêu cu thc tin ...................................................................................... 8
1.2. Mc tiêu ca luận văn ............................................................................... 9
1.3. Cu trúc ca luận văn................................................................................ 9
CHƢƠNG 2: CƠ S LÝ THUYT ......................................................................... 10
2.1. Các nghiên cu liên quan .......................................................................... 10
2.2. Gii thiu v hc máy ............................................................................... 10
2.3. Các thut toán phân loi ph biến ............................................................. 11
2.3.1. K-Nearest Neighbors (k-NN) ................................................................ 11
2.3.2. Support Vector Machines ...................................................................... 13
2.3.3. Decision Tree ........................................................................................ 13
2.3.4. Random Forest ...................................................................................... 16
2.3.5. Gradient Boosted Decision Tree ........................................................... 17
2.4. Ngôn ng lp trình Python........................................................................ 17
2.4.1. Đặc đim chung và thế mnh ................................................................ 17
2.4.2. Thƣ viện scikit-learn cho hc máy ........................................................ 18
CHƢƠNG 3: PHƢƠNG PHÁP ĐÁNH GIÁ VÀ KT QU.................................. 19
3.1. Quy trình đề xut ...................................................................................... 19
3.2. Gia tc kế 3 trc và phn cng cm biến .................................................. 20
3.3. Ly mu d liu và tin x ................................................................... 22
3.4. Kết qu đánh giá ....................................................................................... 25
3.5. Nhn xét .................................................................................................... 29