Ch ng 7: ươ
Khai m d li u
Ph n III: Khai m d li u km phá tri th c
Tham kh o thêm:
[1] GS.TSKH Hng Ki m. Bài gi ng cao h c môn h c c s tri ế ơ
th c ng d ng. ĐHKHTN-TPHCM.
[2] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski.
Data Mining Methods for Knowledge Discovery. Kluwer
Academic Publishers, 1998
[3] Citeseer - Scientific Literature Digital Library. Artificial
Intelligence-http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003
Bài toán khám p lu t k t h p ế
Bài toán phân lo i d li u
Bài toán gom nhóm d li u
Bài toán l p mô hình
Bài toán d o
I. M t s bài toán đi n hình v data mining
I. M t s bài toán đi n hình v data mining (tt)
a. Phát hi n lu t k t h p (association rules) ế
Tìm ra nh ng m i liên h gi a các tr ng mô t đ i t ng ườ ượ
trong CSDL và y d ng thành c lu t c th .
Lu t k t h p là tri th c quan tr ng nh t ti m n trong ế
CSDL.
Ví d : Sau khi pn tích m t CSDL n ng ta tìm ra đ c c ượ
lu t
(1): N u kch hàng mua món A cũng s mua món B.ế
(2): N u kháchng mua món C thì tháng sau s mua món D.ế
I. M t s bài toán đi n hình v data mining (tt)
b. Phân l p (classification)
Lp A Lp BLp C
Phân nh ng đ i
t ng d li u ượ
có đ c tr ng ư
c a l p C vào
l p C
I. M t s bài toán đi n hình v data mining (tt)
c. Gom nhóm (Clustering)
Nhoùm
1
Nhoùm
2
Nhoùm
3
Gom nh ng
đ i t ng ượ
d li u
t ng t vào ươ
1 nm
Tham kh o thêm:
[1] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining
Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998
[2] Citeseer - Scientific Literature Digital Library. Artificial Intelligence-
http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003