ĐẠI HC QUC GIA NI
TRƢỜNG ĐI HC CÔNG NGH
-------------------------------------------
TRN QUANG O
PHÂN CM D LIU DA TRÊN ĐỒ TH
S DNG Y KHUNG CC TIU
LUẬN VĂN THẠC SC NG NGHTH NG TIN
Hà Ni 2014
ĐẠI HC QUC GIA NI
TRƢỜNG ĐI HC CÔNG NGH
---------------------
TRN QUANG O
PHÂN CM D LIU DA TrN ĐỒ TH
S DNG Y KHUNG CC TIU
Ngành: Công Ngh Thông Tin
Chuyên ngành: K thut Phn mm (Software Engineering)
Mã s: 60480103
LUẬN VĂN THẠC SỸ C NG NGHỆ TH NG TIN
NGƢỜI NG DN KHOA HC: PGS.TS. HNG XUÂN HUN
Hà Ni 2014
1
LI CẢM ƠN
Điều ầu ti n tôi xin gi li cảm ơn sâu sắc nhất ến PGS.TS Hoàng Xuân Hun.
Thầy ã cung cấp cho tôi nhng kiến thc, tài liu, phƣơng pháp khi nghi n cứu v l m
luận v n. Tôi xin cảm ơn thầy v s h tr chân thành và nhit tình trong sut thi gian
qua. Đối với t i thầy l một ngƣời thầy áng k nh v lu n hết l ng v học vi n
T i xin gửi lời cảm ơn chân th nh ến các thầy c ã giảng y các cán
trong kho c ng nghệ th ng tin kho s u i học ph ng t chức h nh ch nh
T i xin gửi lời cảm ơn ến gi nh ng nghiệp v n những ngƣời ã
ộng vi n t i rất nhiều trong quá tr nh học tập
Ni, ngày 2 tháng 12 n m 2014
Hc viên
Trn Quang Hào
2
LỜI CAM ĐOAN
T i xin c m o n những kiến thc trình bày trong luận v n n y l o t i t m hiểu,
nghiên cu trình bày theo ch hiu ca bản thân ƣới s ng dn trc tiếp ca
PGS.TS Hoàng Xuân Hun. Trong quá trình làm luận v n t i th m khảo các tài liu
có li n qu n v ã ghi ngu n gc tham kho tài liệu ó Mọi sao chép không hp l,
vi ph m quy chế o t o tôi xin chu hoàn toàn trách nhim.
Ni, ngày 2 tháng 12 n m 2014
Hc viên
Trn Quang Hào
3
MC LC
LI CẢM ƠN .................................................................................................................... 1
LỜI CAM ĐOAN .............................................................................................................. 2
MC LC .......................................................................................................................... 3
DANH MC CÁC KÝ HIU, CÁC CH VIT TT ................................................... 5
DANH MC HÌNH V .................................................................................................... 6
LI M ĐẦU .................................................................................................................... 7
CHƢƠNG 1: GIỚI THIỆU VỀ KH M PH TRI TH C V PH N CỤM Ữ LIỆU
............................................................................................................................................ 8
1.1. Khám phá tri thc ....................................................................................................... 8
1.2. Vai trò các mc tu chính ca KDD .................................................................... 9
1.3. Khái nim phân cụm liệu: ..................................................................................... 10
1.4. Các ng dng ca phân cm ...................................................................................... 11
1 5 Một số phƣơng pháp phân cụm iển h nh ................................................................... 12
1 5 1 Phƣơng pháp phân cm phân ho ch ........................................................................ 12
1 5 2 Phƣơng pháp phân cm phân cp............................................................................. 13
1 5 3 Phƣơng pháp phân cm da trên mt ................................................................. 16
1 5 4 Phƣơng pháp phân cm dự tr n lƣới ...................................................................... 17
1.6. Một số vấn ề li n qu n ến phân cụm ...................................................................... 18
1.6.1. Mêtric trên d liu hn hp. .................................................................................... 18
1.6.2.Độ tƣơng ng. ......................................................................................................... 20
1.6.3. Entropy ..................................................................................................................... 23
CHƢƠNG 2: THU T TO N PH N CỤM S ỤNG C Y KHUNG CỰC TIỂU ... 24
2.1.Cây khung cc tiu ...................................................................................................... 24
2 1 1 Đ nh ngh cây khung cực tiểu ................................................................................ 24
2 1 2 Thuật toán y ựng cây khung cực tiu ................................................................. 24
2.2. Mt s khái niệm cần dùng ....................................................................................... 26
2.3. Cm ƣc mô t bi Zahn v H n l .......................................................................... 27
2.4. Thiết lập i toán phân cụm ng thị: ................................................................... 28
2 5 Độ phức t p củ thuật toán 2-MSTs ...................................................................... 35