Hc Máy
(IT 4862)
h
Nguy
n N
h
t Quang
quangnn-fit@mail.hut.edu.vn
Trường Đại hc Bách Khoa Hà Ni
Vin Công ngh thông tin và truyn thông
Năm hc 2011-2012
Ni
d
ô
h
Ni
d
ung m
ô
n
h
c:
Gii thiu chun
g
g
Đánh giá hiunăng hthng hcmáy
Các phương pháp hcdatrênxácsut
Các
phương
pháp
hc
da
trên
xác
sut
Các phương pháp hc có giám sát
h
h
khô
át
cp
h
ương p
p
h
c
khô
ng g
ms
át
Giithiuvphân cm
Ph
â
n
c
m
da
t
r
ê
n
p
h
â
n
tác
h: k-M
ea
n
s
â
c
da
tác
ea s
Lccng tác
Hc
tăng
cường
Hc
tăng
cường
2
Hc Máy (IT 4862)
Hc có vs. không có giám sát
Hc giám sát (Supervised learning)
Tp
d
liu
(dataset)
bao
gm
các
d
mi
d
được
gn
Tp
d
liu
(dataset)
bao
gm
các
d
,
mi
d
được
gn
kèm vimt nhãn lp/giá trịđu ra mong mun
Mcđích hc(xpx) mtgithiết(vd: mt phân lp, mt hàm
mc
tiêu
)
phù
hp
vi
tp
d
liu
hin
mc
tiêu
,...
)
phù
hp
vi
tp
d
liu
hin
Githiếthcđược (learned hypothesis) sau đósẽđưc dùng để
phân lp/dựđoán đốivicácvídmi
Hc không giám sát (Unsupervised learning)
Tpdliu (dataset) bao gmcácvíd, mà mivídkhông
thông
tin
v
nhãn
lp/giá
tr
đầu
ra
mong
mun
thông
tin
v
nhãn
lp/giá
tr
đầu
ra
mong
mun
Mcđích tìm ra (hc) các cm/các cu trúc/các quan htnti
trong tpdliuhincó
3
Hc Máy (IT 4862)
Phân c
m
Phân cm/nhóm (Clustering) là phương pháp hc không
giám
sát
được
s
dng
ph
biến
nht
giám
sát
được
s
dng
ph
biến
nht
Tnti các phương pháp hc không giám sát khác, ví d: Lc
cng tác (Collaborative filtering), Khai phá lutkếthp
(Association rule mining)
(Association
rule
mining)
, ...
Hc phân cm
Đầu
vào
:
mt
tp
d
liu
không
nhãn
(
các
d
không
nhãn
Đầu
vào
:
mt
tp
d
liu
không
nhãn
(
các
d
không
nhãn
lp/giá trịđu ra mong mun)
Đầura: cáccm (nhóm) cacácvíd
Mtcm(cluster) mttp các d
Tương tvi nhau (theo mt ý nghĩa, đánh giá nào đó)
Khác
bit
vi
các
d
thuc
các
cm
khác
Khác
bit
vi
các
d
thuc
các
cm
khác
4
Hc Máy (IT 4862)
Phân c
m – V
í
d
Mtvídvphân cm:
Các dụđưc phân chia thành 3 cm
[Liu, 2006]
5
Hc Máy (IT 4862)