
Gom cụm
ThS. Dương Phi Long –Email: longdp@uit.edu.vn
Chương 7:
TRƯỜNG ÐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA HỆ THỐNG THÔNG TIN
Tài liệu bài giảng:
KHAI THÁC DỮ LIỆU –IS252

2
Supervised vs. Unsupervised Learning
-Supervised learning (classification)
•Supervision: Dữliệuhuấnluyện(quan sát, đolường, v.v.) được
kèm theo nhãnlớp
•Dữliệumớiđượcphânlớpdựatrêntậphuấnluyện
-Unsupervised learning (phâncụm)
•Nhãnlớpcủadữliệuhuấnluyệnkhông xácđịnh
•Đưara mộttậphợpcácphépđo, quan sát, ... vớimụcđích
thiết lậpsựtồn tạicủa cáclớphoặccụmtrong dữliệu

01
02
03
04
05
3
NỘI DUNG BÀI HỌC
Tổng quan vềgom cụmdữliệu
Phương pháp phânhoạch
Phương pháp phâncấp
Phương phápdựatrênmậtđộ
Phương phápdựatrênmôhình

4
Tổng quan về
Gom cụmdữliệu
1. Gom cụmlàgì
2. Tiêuchuẩngom cụm
3. Độ đokhoảng cách
4. Yêucầuvàthách thức
5. Mộtsốphương pháp gom
cụm

5
1. Gom cụmdữliệu
-Cluster (cụm/nhóm/lớp): tậphợpcácđốitượng dữliệu
•Tương đồng hoặcliênquan vớinhau trong cùng 1nhóm
•Không tương đồng hoặckhông liênquan vớicácđốitượng trong
cácnhómkhác
-Gom cụm:Tìmsựtương đồng giữadữliệutheo cácđặcđiểmđược
tìm thấy trong dữliệuvànhómcácđốitượng dữliệutương đồng thành
các cụm