Gom cm
ThS. Dương Phi Long Email: longdp@uit.edu.vn
Chương 7:
TRƯNG ÐI HC CÔNG NGH THÔNG TIN
KHOA H THNG THÔNG TIN
Tài liu bài ging:
KHAI THÁC D LIU IS252
2
Supervised vs. Unsupervised Learning
-Supervised learning (classification)
Supervision: Dliuhunluyn(quan sát, đolường, v.v.) được
kèm theo nhãnlp
Dliumiđượcphânlpdatrêntphunluyn
-Unsupervised learning (phâncm)
Nhãnlpcadliuhunluynkhông xácđịnh
Đưara mttphpcácphépđo, quan sát, ... vimcđích
thiết lpstn tica cáclphoccmtrong dliu
01
02
03
04
05
3
NI DUNG BÀI HC
Tng quan vgom cmdliu
Phương pháp phânhoch
Phương pháp phâncp
Phương phápdatrênmtđộ
Phương phápdatrênmôhình
4
Tng quan v
Gom cmdliu
1. Gom cmlà
2. Tiêuchungom cm
3. Độ đokhong cách
4. Yêucuvàthách thc
5. Mtsphương pháp gom
cm
5
1. Gom cmdliu
-Cluster (cm/nhóm/lp): tphpcácđốitượng dliu
Tương đồng hocliênquan vinhau trong cùng 1nhóm
Không tương đồng hockhông liênquan vicácđốitượng trong
cácnhómkhác
-Gom cm:Tìmstương đồng giadliutheo cácđặcđimđược
tìm thy trong dliuvànhómcácđốitượng dliutương đồng thành
các cm