ĐẠI HC QUC GIA HÀ NI
TRƢỜNG ĐẠI HC CÔNG NGH
HOÀNG TH KIM OANH
KHAI PHÁ D LIU DA TRÊN BNG QUYẾT ĐỊNH
NH LÝ THUYT TP THÔ
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Ni - 2014
ĐẠI HC QUC GIA HÀ NI
TRƢỜNG ĐẠI HC CÔNG NGH
HOÀNG TH KIM OANH
KHAI PHÁ D LIU DA TRÊN BNG QUYẾT ĐỊNH
NH LÝ THUYT TP THÔ
Ngành: Công ngh thông tin
Chuyên ngành: H thng thông tin
Mã s: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGH THÔNG TIN
NGƢỜI HƢỚNG DN KHOA HC: GS.TS. VŨ ĐỨC THI
Hà Ni - 2014
1
LI CẢM ƠN
Tc tn, tôi xin gi li cảm ơn chân thành nht ti GS.TS Vũ Đc Thi,
Vin Công ngh tng tin Đi hc Quc gia Hà Ni đã tận tình ng dẫn, định
ng, đóng p nhng ý kiến quý u cho i trong quá trình thc hin lun n.
Tôi xin cn thành cảm ơn các Thầy, Cô go trong Tng Đi hc Công
ngh - Đi hc Quc gia Hà Nội đã tn nh ging dy truyn th cho tôi nhng
kiến thc q báu trong sut quá trình hc tp ti trường. Đng thi, tôi cũng xin
cảm ơn gia đình, bạn bè, nhng ngưi ln khuyến khích và giúp đỡ i trong mi
hn cảnh khó kn.i xin cảm ơn cơ quan vàc đng nghiệp đã hết sc tạo điu
kin cho tôi trong sut q tnh hc tp làm lun n y.
Hà Ni, ngày tháng 6 năm 2014
Hc viên
Hoàng Th Kim Oanh
2
LỜI CAM ĐOAN
Tôi xin cam đoan những kiến thc trình bày trong luận văn này do tôi
tìm hiu, nghiên cu và trình bày li theo cách hiu ca tôi. Trong quá trình làm
luận văn tôi tham khảo các tài liệu liên quan đã ghi ngun tài liu
tham khảo đó. Phần ln nhng kiến thc tôi trình bày trong luận văn này chưa
đưc trình bày hoàn chnh trong bt c tài liu nào.
Hà Ni, ngày tháng 6 m 2014
Hc viên
Hoàng Th Kim Oanh
3
MC LC
LI CM ƠN ............................................................................................................................................................ 1
LI CAM ĐOAN..................................................................................................................................................... 2
MC LC ................................................................................................................................................................... 3
DANH MC CÁC THUT NG .................................................................................................................... 5
DANH MC CÁC KÝ HIU, CÁC CH VIT TT ........................................................................... 6
DANH MC CÁC BNG ................................................................................................................................... 7
DANH MC CÁC HÌNH V ............................................................................................................................. 8
M ĐU ...................................................................................................................................................................... 9
Chƣơng 1. KHAI PHÁ D LIU THEO TIP CN TP THÔ .................................................... 12
1.1. H tng tin ........................................................................................................................... 12
1.2. Bng quyết đnh .................................................................................................................... 13
1.3. Quan h không phân biệt được ............................................................................................ 14
1.4. Các tp xp x ........................................................................................................................ 16
1.5. Tp t gn tp lõi ............................................................................................................ 18
1.6. Ma trn phân bit và m pn bit .................................................................................... 20
Chƣơng 2. PHƢƠNG PHÁP RÚT GN THUC TÍNH VÀ SINH LUT TRÊN BNG
QUYT ĐNH ........................................................................................................................................................ 21
2.1. Pơng pháp t gọn thuc nh tn bng quyết đnh ...................................................... 21
2.2. Pơng pháp t gọn thuc nh da tn entropy Shannon ............................................. 25
2.2.1. Entropy Shannon trên bng quyết định .................................................................. 25
2.2.2. Tp lõi ca bng quyết định da trên Entropy Shannon ........................................ 26
2.2.3. Tp rút gn ca bng quyết định da trên Entropy Shannon .................................. 27
2.2.4. Độ quan trng ca thuc tính da trên entropy Shannon ....................................... 27
2.2.5. Thut toán tìm tp rút gn ca bng quyết định s dng Entropy Shannon .......... 28
2.3. Sinh lut quyết đnh trên tp rút gn ca bng quyết đnh ................................................ 34
2.3.1. Lut quyết định ....................................................................................................... 34
2.3.2. Các độ đo đánh giá hiệu năng tập lut quyết định trên các tp rút gn .................. 35
2.3.3. Thut toán sinh lut quyết định da trên tp rút gn ca bng quyết định ............. 38
Chƣơng 3. TH NGHIM VÀ ĐÁNH GIÁ KT QU ...................................................................... 40
3.1. Bài toán .................................................................................................................................. 40
3.2. Mt s kết qu th nghim .................................................................................................. 40