
Học Máy
(IT 4862)
ễhậ
Nguy
ễ
n N
hậ
t Quang
quangnn-fit@mail.hut.edu.vn
Trường Đại học Bách Khoa Hà Nội
Viện Công nghệ thông tin và truyền thông
Năm học 2011-2012

Nội
d
ô
h
Nội
d
ung m
ô
n
h
ọc:
Giới thiệu chun
g
g
Đánh giá hiệu năng hệ thống học máy
Cá h há h dtê á ất
Cá
c p
h
ương p
há
p
h
ọc
d
ựa
t
r
ê
n x
á
c su
ất
Các phương pháp họccógiámsát
Hồi quy tuyến tính (Linear regression)
Các phương pháp học không giám sát
Lọccộng tác
H
tă
ờ
2
Học Máy – IT 4862
H
ọc
tă
ng cư
ờ
ng

Hồi
q
uy tu
y
ến tính
–
Giới thiệu
q
Với một ví dụ đầu vào, dự đoán một giá trị đầu ra kiểu số thực
Mộtphương pháp họcmáyđơn
-
giản
-
nhưng
-
hiệu
-
quả
phù hợp
Một
phương
pháp
học
máy
đơn
giản
nhưng
hiệu
quả
phù
hợp
khi hàm mục tiêu (cần học) là một hàm tuyến tínhh
∑
+
=
+
+
+
+
=n
i
i
x
w
w
x
w
x
w
x
w
w
x
f
0
2
2
1
1
0
...
)
(
(
w
i
,x
i
∈
R
)
Cần học (xấp xỉ) một hàm mục tiêu f
f: X →Y
∑
=
+
+
+
+
+
i
i
i
nn
x
w
w
x
w
x
w
x
w
w
x
f
1
0
2
2
1
1
0
...
)
(
(
w
i
,x
i
∈
R
)
f:
X
→
Y
•X: Miền không gian đầu vào (không gian vectơ nchiều – Rn)
•Y: Miền khôn
g
g
ian đầu ra
(
miền các
g
iá tr
ị
số th
ự
c
–
R
)
gg ( g ị ự
)
•f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính)
Thực chất, là học một vectơ các trọng số: w= (w0, w1, w2, …,wn)
3
Học Máy – IT 4862

Hồi
q
uy tu
y
ến tính
–
Ví dụ
q
Hàm tuyến tính f(x) nào phù hợp?
f(x)
x f(x)
0.13 -0.91
1.02 -0.17
3.17 1.61
-2.76 -3.31
1.44
0.18
x
1.44
0.18
5.28 3.36
-1.74 -2.46
793
556
7
.
93
5
.
56
... ...
Ví d
ụ
: f(x) =
-
1
.02 + 0.83x
ụ
4
Học Máy – IT 4862

Các ví dụhọc/kiểm thử
Đối với mỗi ví dụ học x=(x
1
,x
2
,...,xn), trong đó x
i
∈R
•Giá trị đầu ra mong muốn cx(∈R)
•Giá trị đầu ra thực tế (tính bởi hệ thống) ∑
+= n
i
iix xwwy
1
0
→wilà đánh giá hiện thời của hệ thống đối với giá trị trọng số của
thuộc tính thứ i
=
i
1
→Giá trị đầu ra thực tế yxđược mong muốn là (xấp xỉ) cx
Đốivớimỗivídụkiểmthử
=
(
)
Đối
với
mỗi
ví
dụ
kiểm
thử
z
=
(
z1,z2,...,
z
n
)
•Cần dự đoán (tính) giá trị đầu ra
•
Bằng cách áp dụng hàm mụctiêuđãhọcđược
f
•
Bằng
cách
áp
dụng
hàm
mục
tiêu
đã
học
được
f
5
Học Máy – IT 4862