
Ch ng 7: ươ
Khai m d li uỏ ữ ệ
Ph n III: Khai m d li u và khám phá tri th cầ ỏ ữ ệ ứ
Tham kh o thêm: ả
[1] GS.TSKH Hoàng Ki m. Bài gi ng cao h c môn h c c s tri ế ả ọ ọ ơ ở
th c và ng d ng. ĐHKHTN-TPHCM.ứ ứ ụ
[2] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski.
Data Mining Methods for Knowledge Discovery. Kluwer
Academic Publishers, 1998
[3] Citeseer - Scientific Literature Digital Library. Artificial
Intelligence-http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003

Bài toán khám phá lu t k t h pậ ế ợ
Bài toán phân lo i d li uạ ữ ệ
Bài toán gom nhóm d li uữ ệ
Bài toán l p mô hìnhậ
Bài toán d báoự
…
I. M t s bài toán đi n hình v data mining ộ ố ể ề

I. M t s bài toán đi n hình v data mining (tt)ộ ố ể ề
a. Phát hi n lu t k t h p (association rules)ệ ậ ế ợ
Tìm ra nh ng m i liên h gi a các tr ng mô t đ i t ng ữ ố ệ ữ ườ ả ố ượ
trong CSDL và xây d ng thành các lu t c th .ự ậ ụ ể
Lu t k t h p là tri th c quan tr ng nh t ti m n trong ậ ế ợ ứ ọ ấ ề ẩ
CSDL.
Ví d :ụ Sau khi phân tích m t CSDL bán hàng ta tìm ra đ c các ộ ượ
lu tậ
(1): N u khách hàng mua món A cũng s mua món B.ế ẽ
(2): N u khách hàng mua món C thì tháng sau s mua món D.ế ẽ
…

I. M t s bài toán đi n hình v data mining (tt)ộ ố ể ề
b. Phân l p (classification)ớ
Lớp A Lớp BLớp C
Phân nh ng đ i ữ ố
t ng d li u ượ ữ ệ
có đ c tr ng ặ ư
c a l p C vào ủ ớ
l p Cớ

I. M t s bài toán đi n hình v data mining (tt)ộ ố ể ề
c. Gom nhóm (Clustering)
Nhoùm
1
Nhoùm
2
Nhoùm
3
Gom nh ng ữ
đ i t ng ố ượ
d li u ữ ệ
t ng t vào ươ ự
1 nhóm
Tham kh o thêm:ả
[1] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining
Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998
[2] Citeseer - Scientific Literature Digital Library. Artificial Intelligence-
http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003

