ĐẠI HC THÁI NGUYÊN
TRƯỜNG ĐẠI HC CÔNG NGH THÔNG TIN VÀ TRUYN THÔNG
NGUYN ANH TUN
RÚT GN THUC TÍNH TRONG BNG QUYT ĐỊNH
KHÔNG ĐẦY Đ CÓ D LIỆU THAY ĐI
THEO TIP CN MÔ HÌNH TP THÔ DUNG SAI
LUN ÁN TIẾN SĨ KHOA HC MÁY TÍNH
THÁI NGUYÊN - 2022
ii
ĐẠI HC THÁI NGUYÊN
TRƯỜNG ĐẠI HC CÔNG NGH THÔNG TIN VÀ TRUYN THÔNG
RÚT GN THUC TÍNH TRONG BNG QUYT ĐỊNH
KHÔNG ĐẦY Đ CÓ D LIỆU THAY ĐI
THEO TIP CN MÔ HÌNH TP THÔ DUNG SAI
Chuyên ngành: Khoa hc máy tính
Mã s: 9 48 01 01
LUN ÁN TIẾN SĨ KHOA HC MÁY TÍNH
THÁI NGUYÊN - 2022
i
MC LC
MC LC ......................................................................................................... i
BNG CÁC KÝ HIU, T VIT TT ....................................................... v
DANH MC CÁC BNG ............................................................................. vi
DANH MC HÌNH V ............................................................................... viii
M ĐẦU .......................................................................................................... 1
CHƯƠNG 1. TNG QUAN V H THÔNG TIN PHƯƠNG PHÁP
RÚT GN THUC TÍNH THEO TIP CN TP THÔ DUNG SAI .... 8
1.1. M đầu ....................................................................................................... 8
1.2. Các khái nim cơ bn v h thông tin ....................................................... 8
1.2.1. H thông tin đầy đủ và mô hình tp thô truyn thng .................... 8
1.2.2. H thông tin không đầy đủ và mô hình tp thô dung sai .............. 12
1.3. Phương pháp rút gọn thuc tính theo tiếp cn tp thô dung sai ............... 14
1.3.2. Phương pháp rút gn thuc tính theo tiếp cn lai ghép lc - đóng gói .. 17
1.3.3. Bài toán phân lp trong khai phá d liu ..................................... 18
1.4. Các nghiên cu liên quan và các vấn đền tn ti ................................ 21
1.4.1. Các nghiên cứu liên quan đến rút gn thuc tính trong bng quyết
định không đầy đủ ........................................................................................... 21
1.4.2. Các nghiên cứu liên quan đến rút gn thuc tính trong bng quyết
định thay đổi .................................................................................................... 22
1.4.3. Các vấn đền tn ti và mc tiêu nghiên cu ca lun án ........ 26
1.5. B d liu thc nghim ............................................................................. 27
1.6. Kết luận chương 1 ..................................................................................... 27
ii
CHƯƠNG 2. PHƯƠNG PP RÚT GN THUC TÍNH TRONG BNG
QUYT ĐỊNH KHÔNG ĐY Đ KHI TẬP ĐỐI TƯỢNG THAY ĐỔI .. 28
2.1. M đầu ..................................................................................................... 28
2.2. Phương pháp gia tăng tìm tp rút gn ca bng quyết định không đầy đủ
khi b sung, loi b tập đối tượng ................................................................... 29
2.2.1. Thuật toán gia tăng lc - đóng gói tìm tập rút gn ca bng quyết
định trong trường hp b sung tập đối tượng ................................................ 30
2.2.2. Thuật toán gia tăng lc - đóng gói tìm tập rút gn ca bng quyết
định trong trường hp loi b tập đối tượng .................................................. 37
2.3. Phương pháp gia tăng tìm tập rút gn ca bng quyết định không đầy đủ khi
tập đối tượng thay đi giá tr ............................................................................ 43
2.3.1. Công thc gia tăng tính khong cách khi tp đi tưng thay đi g tr 43
2.3.2. Thuật toán gia tăng lọc - đóng gói tìm tp rút gn ca bng quyết
định kng đầy đ khi tập đối tượng thay đổi giá tr ...................................... 48
2.3.3. Thc nghiệm, đánh giá thuật toán FWIA_U_Obj......................... 52
2.3.4. Đánh giá thuật toán FWIA_U_Obj so vi vic thc hin gián tiếp
hai thut toán IDS_IFW_DO và IDS_IFW_AO .............................................. 58
2.4. Kết luận chương 2 .................................................................................... 61
CHƯƠNG 3. PHƯƠNG PHÁP RÚT GN THUC TÍNH TRONG BNG
QUYT ĐỊNH KHÔNG ĐY Đ KHI TP THUỘC TÍNH THAY ĐỔI 62
3.1. M đầu ..................................................................................................... 62
3.2. Phương pháp gia tăng tìm tập rút gn ca bng quyết định không đầy đủ khi
b sung tp thuc tính. ..................................................................................... 63
3.2.1. Công thc cp nht khong cách khi b sung tp thuc tính ....... 63
3.2.2. Thuật toán gia tăng lc - đóng gói tìm tập rút gn ca bng quyết
định không đầy đủ khi b sung tp thuc tính. ............................................... 67
iii
3.2.3. Thc nghiệm, đánh giá thuật toán FWIA_AA ............................... 69
3.3. Phương pháp gia tăng tìm tp rút gn ca bng quyết định không đầy đủ
khi loi b tp thuc tính. ................................................................................ 74
3.3.1. Công thc gia tăng cập nht khong cách khi loi b tp thuc tính. 74
3.3.2. Thuật toán gia tăng lc - đóng gói tìm tập rút gn ca bng quyết
định không đầy đủ khi loi b tp thuc tính. ................................................. 76
3.3.3. Thc nghiệm, đánh giá thuật toán FWIA_DA .............................. 79
3.4. Phương pp gia ng m tập rút gn ca bng quyết định không đầy đ khi
tp thuộc tính thay đi giá tr ............................................................................ 84
3.4.1. Công thc gia tăng tính khong cách khi tp thuc tính thay đi g tr 84
3.4.2. Thuật toán gia tăng lc - đóng gói tìm tập rút gn ca bng quyết
định không đầy đủ khi tp thuộc tính thay đổi giá tr ..................................... 88
3.4.3. Thc nghiệm, đánh giá thuật toán FWIA_U_Attr ......................... 91
3.4.4. Thc nghiệm, đánh giá thuật toán FWIA_U_Attr so vi vic thc
hin gián tiếp hai thut toán FWIA_DA và FWIA_AA ................................... 96
3.5. Kết luận chương 3 .................................................................................... 99
KT LUN .................................................................................................. 100
DANH MC CÁC CÔNG TRÌNH KHOA HC CA LUN ÁN ....... 102
TÀI LIU THAM KHO .......................................................................... 103