ĐẠI HC THÁI NGUYÊN
TRƯỜNG ĐẠI HC CÔNG NGH THÔNG TIN VÀ TRUYN THÔNG
SENGTHONG XAYAVONG
PHÂN LP D LIU HOA IRIS S DNG THUT TOÁN
NAIVE BAYES, RANDOMFOREST VÀ KNN
(K - NEAREST NEIGHBORS)
LUẬN VĂN THẠC S KHOA HC MÁY TÍNH
Thái Nguyên 2020
ĐẠI HC THÁI NGUYÊN
TRƯỜNG ĐẠI HC CÔNG NGH THÔNG TIN VÀ TRUYN THÔNG
SENGTHONG XAYAVONG
PHÂN LP D LIU HOA IRIS S DNG THUT TOÁN
NAIVE BAYES, RANDOMFOREST VÀ KNN
(K - NEAREST NEIGHBORS)
LUẬN VĂN THẠC S KHOA HC MÁY TÍNH
Chuyên ngành: KHOA HC MÁY TÍNH
Mã s: 84 8 01 01
Ngưi hưng dn khoa hc: TS. Nguyễn Văn Núi
Thái Nguyên 2020
I
LỜI CAM ĐOAN
H và tên hc viên: Sengthong Xayavong
Lp cao hc: CK17A Trường Đại hc Công ngh thông tin và Truyn thông Đại
hc Thái Nguyên.
Chuyên ngành: Khoa hc máy tính
Tên đ tài luận văn: PHÂN LP D LIU HOA IRIS S DNG THUT TOÁN
NAIVE BAYES, RANDOMFOREST VÀ KNN (K - NEAREST NEIGHBORS).
Học viên xin cam đoan đây công trình nghiên cu ca bn than hc vin.
Các kết qu nghiên cu và các kết lun trong luận văn là trung thực, không sao chép
t bt k mt nguồn nào và dưới bt k hình thc nào. Trong quá trình làm hc viên
có tham kho các tài liu liên quan nhm khẳng định thêm s tin cy và cp thiết ca
đề tài. Vic tham kho các ngun tài liệu đã được thc hin trích dn ghi ngun
tài liu tham kho đúng quy định.
Thái Nguyên, ngày 08 tháng 10 năm 2020
Tác gi luận văn
Sengthong xayavong
II
LỜI CẢM ƠN
Tôi xin gi li cảm ơn sâu sắc ti TS. Nguyễn Văn Núi, Trưng Đại hc Công
ngh Thông tin và Truyn thông, người thy đã dành nhiều thi gian tn tình ch bo,
hướng dẫn, giúp đỡ tôi trong sut quá trình tìm hiu, nghiên cu. Thầy là người định
hướng và đưa ra nhiu góp ý quý báu trong quá trình tôi thc hin lun văn.
Tôi xin chân thành cm ơn các thy, cô khoa Công ngh thông tin trưng
Đại hc Công ngh Thông tin và Truyn thông đã cung cấp cho tôi nhng kiến thc
và to cho tôi những điều kin thun li trong sut quá trình tôi hc tp ti trưng.
Tôi cũng bày t lòng biết ơn về s giúp đỡ của lãnh đạo cơ quan, đồng nghip
đã cung cp d liu, tài liu và cho tôi nhng li khuyên quý báu. Tôi xin cm ơn gia
đình, người thân, bn bè và các thành viên trong nhóm nghiên cứu luôn động viên và
to mi điu kin tt nht cho tôi.
Tôi xin chân thành cảm ơn!
Thái Nguyên, ngày 08 tháng 10 m 2020
Tác gi luận văn
Sengthong Xayavong
III
MC LC
LỜI CAM ĐOAN ...................................................................................................... I
LI CM ƠN .......................................................................................................... II
DANH MC CÁC KÝ HIU VÀ CH VIT TT .......................................... VI
DANH MC CÁC BNG ....................................................................................VII
DANH MC HÌNH ............................................................................................. VIII
M ĐẦU .................................................................................................................... 1
Chương 1: Tổng quan v khai phá d liu và phát hin tri thc ......................... 3
1.1 Gii thiu tng quan ........................................................................................ 3
1.1.1 Gii thiu chung v khám phá tri thc và khai phá d liu ........................ 3
1.1.2 Quá trình khám phá tri thc ........................................................................ 3
1.1.3 Khai phá d liu .......................................................................................... 5
1.1.4 Quá trình ca khai phá d liu .................................................................... 6
1.1.5 ng dng ca khai phá d liu ................................................................... 7
1.2 Mt s k thut khai phá d liệu cơ bản ....................................................... 7
1.2.1 Lut kết hp (Association Rules)................................................................. 7
1.2.2 Khai thác mu tun t (Sequential / Temporal patterns) ............................ 7
1.2.3 Phân cm d liu (Clustering) .................................................................... 8
1.2.4 Phân nhóm- đoạn (Clustering / Segmentation) ........................................... 8
1.2.5 Hi quy (Regression) .................................................................................. 9
1.2.6 Tng hp hóa (Summarization) ................................................................... 9
1.2.7 Mô hình hóa s ph thuc (dependency modeling) .................................... 9
1.2.8 Phát hin s biến đổi và đ lch (Change and deviation detection) ......... 10
1.3. Mt s so sánh gia khai phá d liệu và các phương pháp cơ bản khác 10
1.3.1. So sánh với phương pháp hệ chuyên gia .................................................. 10
1.3.2. So sánh với phương pháp phân loại thng kê .......................................... 11
1.3.3. So sánh với phương pháp học máy .......................................................... 12
1.3.4 So sánh vi phương pháp học sâu ............................................................. 14
Chương 2: Một s k thut phân lp d liu ....................................................... 16
2.1 Tng quan v phân lp d liu .................................................................... 16
2.2. Phân lp d liu Naive Bayes ..................................................................... 19