
Học Máy
(IT 4862)
ễhậ
Nguy
ễ
n N
hậ
t Quang
quangnn-fit@mail.hut.edu.vn
Trường Đại học Bách Khoa Hà Nội
Viện Công nghệ thông tin và truyền thông
Năm học 2011-2012

Nội
d
ô
h
Nội
d
ung m
ô
n
h
ọc:
Giới thiệu chun
g
g
Đánh giá hiệunăng hệthống họcmáy
Các phương pháp họcdựatrênxácsuất
Các
phương
pháp
học
dựa
trên
xác
suất
Các phương pháp học có giám sát
Cá
h
há
h
khô
iá
át
Cá
cp
h
ương p
há
p
h
ọc
khô
ng g
iá
ms
át
Giớithiệuvềphân cụm
Ph
â
n
cụ
m
dựa
t
r
ê
n
p
h
â
n
tác
h: k-M
ea
n
s
â
cụ
dựa
tê
pâ
tác
ea s
Lọccộng tác
Học
tăng
cường
Học
tăng
cường
2
Học Máy (IT 4862)

Học có vs. không có giám sát
Học có giám sát (Supervised learning)
Tập
dữ
liệu
(dataset)
bao
gồm
các
ví
dụ
mà
mỗi
ví
dụ
được
gắn
Tập
dữ
liệu
(dataset)
bao
gồm
các
ví
dụ
,
mà
mỗi
ví
dụ
được
gắn
kèm vớimột nhãn lớp/giá trịđầu ra mong muốn
Mụcđích là học(xấpxỉ) mộtgiảthiết(vd: một phân lớp, một hàm
mục
tiêu
)
phù
hợp
với
tập
dữ
liệu
hiện
có
mục
tiêu
,...
)
phù
hợp
với
tập
dữ
liệu
hiện
có
Giảthiếthọcđược (learned hypothesis) sau đósẽđược dùng để
phân lớp/dựđoán đốivớicácvídụmới
Học không có giám sát (Unsupervised learning)
Tậpdữliệu (dataset) bao gồmcácvídụ, mà mỗivídụkhông có
thông
tin
về
nhãn
lớp/giá
trị
đầu
ra
mong
muốn
thông
tin
về
nhãn
lớp/giá
trị
đầu
ra
mong
muốn
Mụcđích là tìm ra (học) các cụm/các cấu trúc/các quan hệtồntại
trong tậpdữliệuhiệncó
3
Học Máy (IT 4862)

Phân c
ụ
m
ụ
Phân cụm/nhóm (Clustering) là phương pháp học không
có
giám
sát
được
sử
dụng
phổ
biến
nhất
có
giám
sát
được
sử
dụng
phổ
biến
nhất
Tồntại các phương pháp học không có giám sát khác, ví dụ: Lọc
cộng tác (Collaborative filtering), Khai phá luậtkếthợp
(Association rule mining)
(Association
rule
mining)
, ...
Học phân cụm
Đầu
vào
:
một
tập
dữ
liệu
không
có
nhãn
(
các
ví
dụ
không
có
nhãn
Đầu
vào
:
một
tập
dữ
liệu
không
có
nhãn
(
các
ví
dụ
không
có
nhãn
lớp/giá trịđầu ra mong muốn)
Đầura: cáccụm (nhóm) củacácvídụ
Mộtcụm(cluster)là mộttập các ví dụ
Tương tựvới nhau (theo một ý nghĩa, đánh giá nào đó)
Khác
biệt
với
các
ví
dụ
thuộc
các
cụm
khác
Khác
biệt
với
các
ví
dụ
thuộc
các
cụm
khác
4
Học Máy (IT 4862)

Phân c
ụ
m – V
í
d
ụ
ụ
ụ
Mộtvídụvềphân cụm:
Các ví dụđược phân chia thành 3 cụm
[Liu, 2006]
5
Học Máy (IT 4862)