Hc Máy
(IT 4862)
h
Nguy
n N
h
t Quang
quangnn-fit@mail.hut.edu.vn
Trường Đại hc Bách Khoa Hà Ni
Vin Công ngh thông tin và truyn thông
Năm hc 2011-2012
Ni
d
ô
h
Ni
d
ung m
ô
n
h
c:
Gii thiu chun
g
g
Đánh giá hiunăng hthng hcmáy
Các phương pháp hcdatrênxácsut
Các
phương
pháp
hc
da
trên
xác
sut
Các phương pháp hccógiámsát
Máy
vectơ
h
tr
(Support vector machine)
Máy
vectơ
h
tr
(Support
vector
machine)
Các phương pháp hc không giám sát
L
L
cc
ng
c
Hctăng cường
2
Hc Máy – IT 4862
Máy vectơhtr-Giithiu(1)
Máy vectơ h tr (Support vector machine - SVM) được
đề cbi V Vapnik các đồng nghipca ông vào
đề
c
bi
V
.
Vapnik
các
đồng
nghip
ca
ông
vào
nhng năm 1970s Nga, và sau đó đã tr nên ni tiếng
và ph biến vào nhng năm 1990s
SVM là mt phương pháp phân lp tuyến tính (linear
classifier), vi mc đích xác định mt siêu phng
(hyperplane) để phân tách
hai lp
cadliu
d:
(hyperplane)
để
phân
tách
hai
lp
ca
d
liu
d:
lp các ví d có nhãn dương (positive) và lp các ví d
có nhãn âm (negative)
Các hàm nhân (kernel functions), cũng được gi là các
hàm biến đổi (transformation functions), được dùng cho
các trường hp phân lp phi tuyến
các
trường
hp
phân
lp
phi
tuyến
3
Hc Máy – IT 4862
Máy vectơhtr-Giithiu(2)
SVM có mt nn tng lý thuyết cht ch –da trên nhiu
định toán hc
định
toán
hc
SVM là mt phương pháp tt (phù hp) đối vi nhng bài
toán phân lp không gian biudinthuc tính ln
toán
phân
lp
không
gian
biu
din
thuc
tính
ln
các đối tượng cn phân lp được biu din bi mt tp
rt ln các thuc tính
ế ế
SVM đã được bi
ế
t đ
ế
n là mt trong s
các phương pháp
phân lp tt nht đối vi các bài toán phân lp văn bn
(text/document classification)
(text/document
classification)
4
Hc Máy – IT 4862
Máy vectơhtr-Giithiu(3)
Các vectơđưckýhiubicácchữđm nét!
Bi
di
t
á
í
d
h
l
(t i i l )
Bi
u
di
n
t
p
r
c
á
cv
í
d
h
u
n
l
uy
n
(t
ra
i
n
i
ng examp
l
es
)
{(x1, y1), (x2, y2), …, (xr, yr)},
x
i
mt
vectơ
đầu
vào
được
biu
din
trong
không
gian
X
R
n
x
i
mt
vectơ
đầu
vào
được
biu
din
trong
không
gian
X
R
yi mtnhãn lp(giá trịđura), yi{1,-1}
yi=1: lpdương (positive); yi=-1: lpâm (negative)
Đốivimtvídxi:
<+
+
=01
01
bnêu
bnêu
y
i
i
ixw
xw [Eq.1]
SVM xác định mt hàm phân tách tuyến tính
f(x)= w x+ b
[Eq.2]
w vectơtrng s
các thuc tính;
b
mtgiátrs
thc
5
Hc Máy – IT 4862