
CHƯƠNG 4: PHÂN LỚP DỮ LIỆU
08/2021
Bài giảng môn học:
Khai phá Dữ liệu(7080508)

Nội dung chương 4
4.1 Tổng quan về học có giám sát
4.2 Phân lớp dữ liệu
4.3 Thuật toán phân lớp dữ liệu
4.4 Ứng dụng bài toán phân lớp dữ liệu
2

4.1. Tổng quan về học có giám sát
•Mt thut ton hc my đc gi l hc c gim st (supervised
learning) n u vi!c x#y d$ng m% h&nh d$ đon m'i quan h! gi)a
đ*u vo v đ*u ra đc th$c hi!n d$a tr+n cc c,p (đ*u vo -
input, đ*u ra – label) đ1 bi t trong tp hu2n luy!n. Đ#y l nhm
thut ton ph5 bi n nh2t trong cc thut ton machine learning.
•Tập dữ liệu học (Training data) bao g.m các quan sát (Examples,
Observations), mà m5i quan sát đư7c g8n k:m với một giá tr;
đ<u ra mong mu=n (Label)
3

4.1. Tổng quan về học có giám sát
Ví dụ, bạn mu'n đo tạo mt cỗ my để giúp bạn d$ đon bạn sẽ
m2t bao l#u để li xe về nh từ nơi lm vi!c. Tại đ#y, bạn bắt đ*u
bằng cch tạo mt tp hp d) li!u đc dn nh1n. D) li!u ny bao
gồm
•Điều ki!n thời ti t
•Thời gian trong ngy
•Ngy lễ
•Chn đờng đi
4

Ưu như7c điểm học có giám sát
Ưu điểm:
+ Hc c gim st cho phép bạn thu thp d) li!u ho,c tạo đ*u ra d)
li!u từ trải nghi!m trớc đ
+ Giúp bạn t'i u ha ti+u chí hi!u su2t bằng kinh nghi!m
+ Hc my đc gim st giúp bạn giải quy t cc loại v2n đề tính
ton trong th giới th$c.
Như7c điểm:
+ Ranh giới quy t định c thể đc tp trung qu mức n u tp
hu2n luy!n của bạn kh%ng c ví dụ m bạn mu'n c trong mt lớp
+ Bạn c*n chn nhiều ví dụ hay từ mỗi lớp trong khi bạn đang đo
tạo tr&nh ph#n loại.
+ Ph#n loại d) li!u lớn c thể l mt thch thức th$c s$.
+ Đo tạo cho vi!c hc c gim st c*n r2t nhiều thời gian tính ton.
5

