ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
GIANG TH THU HUYN
NGHIÊN CỨU CÁC LUẬT KẾT HỢP SONG SONG
TRONG KHAI PHÁ DỮ LIỆU
Ngành: Công nghthông tin
Chuyên ngành: Hệ thống thông tin
số: 60 48 05
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS Đoàn Văn Ban
Hà Nội – 2010
LI CẢM ƠN
Để được kết qunhư ngày hôm nay, tôi luôn ghi nhcông ơn của các thy
cô, bạn bè, đng nghiệp gia đình, những người đã dy bo ng h tôi trong sut
quá trình hc tp.
Trước hết, tôi mun gi li cảm ơn đến các thầy giáo trường Đại hc Công
Nghệ, Đại hc Quc Gia Nội đã quan tâm t chc chđạo trc tiếp ging dy
khoá cao hc của chúng tôi. Đặc bit, tôi xin gi li cảm ơn sâu sắc đến thy giáo
hướng dẫn PGS.TS Đoàn Văn Ban, người đã tn tình ch bo góp ý v mt chuyên
môn cho tôi trong sut quá trình làm luận văn. Nếu không sgiúp đỡ ca thy thì
tôi khó có thể hoàn thành được luận văn này.
Cũng qua đây, tôi xin gi li cảm ơn đến ban lãnh đạo Khoa H thng thông
tin Kinh tế thuc Hc viện Ngân hàng, nơi tôi đang công tác, đã to mọi điều kin
thun li cho tôi trong thi gian hoàn thành các môn hc cũng như trong suốt quá
trình làm luận văn tốt nghip.
Cui cùng, tôi xin cảm ơn bố m, chng các bạn bè, đồng nghiệp đã luôn
ng hộ, động viên để tôi yên tâm nghiên cu và hoàn thành luận văn.
Trong sut quá trình làm luận văn, bản thân tôi đã c gng tp trung tìm hiu,
nghiên cu và tham kho thêm nhiu tài liu liên quan. Tuy nhiên, do bn thân mi bt
đầu trên con đường nghiên cu khoa hc, chc chn bn luận văn vẫn còn nhiu thiếu
sót. Tôi rất mong được nhn s ch bo ca các Thy Cô giáo và các góp ý ca bn bè,
đồng nghiệp để luận văn được hoàn thiện hơn.
Hà Nội, tháng 04 năm 2010
Giang Th Thu Huyn
LỜI CAM ĐOAN
Tôi xin cam đoan đề tài “Nghiên cu các lut kết hp song song trong khai
phá d liu” kết qu ca t bn thân tôi tìm hiu, nghiên cu. Các tài liu tham
khảo được trích dẫn chú thích đầy đủ. Tôi xin chu trách nhim v luận văn của
mình.
MC LC
MỞ ĐẦU.....................................................................................................................1
CHƯƠNG 1 TNG QUAN V KHAI PHÁ D LIU.............................................3
1. 1. Khai phá d liu...............................................................................................3
1. 1. 1. Khái nim Khai phá d liu ......................................................................3
1. 1. 2. Kiến trúc ca mt h thng khai phá d liu .............................................5
1. 1. 3. Mt s k thut khai phá d liu ...............................................................6
1. 1. 4. La chọn phương pháp khai phá d liu....................................................8
1. 2. ng dng ca khai phá d liu .........................................................................9
1. 3. Mt số khó khăn trong khai phá dữ liu..........................................................10
1. 4. Kết luận chương 1 ..........................................................................................11
CHƯƠNG 2 KHAI PHÁ CÁC LUẬT KT HP SONG SONG.............................12
2. 1. Lut kết hp trong khai phá d liu.................................................................12
2. 1. 1. Mt số hướng tiếp cn trong khai phá lut kết hp..................................12
2. 1. 2. Các tính cht ca lut kết hp .................................................................13
2. 1. 3. Bài toán khai phá lut kết hp.................................................................17
2. 1. 4. Mt s thut toán khai phá lut kết hp...................................................17
2. 2. Các thut toán song song phát hin lut kết hp .............................................26
2. 2. 1. Thut toán song song ..............................................................................27
2. 2. 2. Khai phá các lut kết hp song song .......................................................30
2. 3. Kết luận chương 2 ..........................................................................................49
CHƯƠNG 3 CÀI ĐẶT THUT TOÁN KHAI PHÁ CÁC LUT KT HP SONG
SONG TRONG KHAI PHÁ D LIU......................................................................50
3. 1. Cài đặt thut toán khai phá các lut kết hp song song ...................................50
3. 1. 1. Môi trường cài đặt chương trình th nghim...........................................50
3. 1. 2. Mô t d liu ca bài toán.......................................................................51
3. 1. 3. Giao diện chương trình ...........................................................................52
3. 2. Đánh giá kết qu.............................................................................................58
3. 2. 1. Phương pháp đánh giá các chương trình song song .................................58
3. 2. 2. Kết quả cài đặt chương trình th nghim.................................................59
KT LUN...............................................................................................................60
TÀI LIU THAM KHO..........................................................................................62
PH LC..................................................................................................................64
DANH MC CÁC KÝ HIU, CÁC CH VIT TT
Tên viết tt Din gii
Ck Tp các k-itemset ng viên (Candidate sets)
Conf Độ tin cy (Confidence)
D Cơ sở d liu giao dch
Di Phn th i của cơ sở d liu D
Item Mc
Itemset Tp mc
k-itemset Tp mc gm k mc
Lk Tp các k-itemset ph biến
MPI Truyền thông điệp (Message Passing Interface)
minconf Ngưỡng tin cy ti thiu (minimum confidence)
minsup Ngưỡng h tr ti thiu (minimum support)
SC Số đếm h tr (Support count)
Sup Độ h tr (Support)
T Giao dch (Transaction)
TID Định danh ca giao dch (Unique Transaction Identifer)
Tid-List Danh sách các định danh ca giao dch
X Y Lut kết hp (Vi X là tiền đề, Y là h qu)