Học Máy<br />
(IT 4862)<br />
<br />
Nguyễn<br />
ễ Nhật<br />
hậ Quang<br />
quangnn-fit@mail.hut.edu.vn<br />
<br />
Trường Đại học Bách Khoa Hà Nội<br />
Viện Công nghệ thông tin và truyền thông<br />
Năm học 2011-2012<br />
<br />
Nội dung<br />
d<br />
môn<br />
ô học:<br />
h<br />
<br />
<br />
Giới thiệu chung<br />
g<br />
<br />
<br />
<br />
Đánh giá hiệu năng hệ thống học máy<br />
<br />
<br />
<br />
Các phương pháp học dựa trên xác suất<br />
<br />
<br />
<br />
Các phương pháp học có giám sát<br />
<br />
<br />
Học cây quyết định (Decision tree learning)<br />
<br />
<br />
<br />
Các phương pháp học không giám sát<br />
<br />
<br />
<br />
L cộng<br />
Lọc<br />
ộ tác<br />
tá<br />
<br />
<br />
<br />
Học tăng cường<br />
Học Máy – IT 4862<br />
<br />
2<br />
<br />
Học câyy quyết<br />
q y định – Giới thiệu<br />
<br />
<br />
Học cây quyết định (Decision tree –DT– learning)<br />
• Để học (xấp xỉ) một hàm mục tiêu có giá trị rời rạc (discretevalued target function) – hàm phân lớp<br />
• Hàm phân lớp được biểu diễn bởi một cây quyết định<br />
<br />
<br />
<br />
Một cây quyết định có thể được biểu diễn (diễn giải) bằng một<br />
tập các luật IF-THEN (dễ đọc và dễ hiểu)<br />
<br />
<br />
<br />
Học cây<br />
H<br />
â quyết<br />
ết định<br />
đị h có<br />
ó thể thực<br />
th hiện<br />
hiệ ngay cả<br />
ả với<br />
ới các<br />
á dữ liệu<br />
liệ có<br />
ó<br />
chứa nhiễu/lỗi (noisy data)<br />
<br />
<br />
<br />
Là một<br />
ộ trong<br />
g các p<br />
phương<br />
gp<br />
pháp<br />
p học<br />
ọ q<br />
quy<br />
y nạp<br />
ạp ((inductive<br />
learning) được dùng phổ biến nhất<br />
<br />
<br />
<br />
Được áp dụng thành công trong rất nhiều các bài toán ứng<br />
d<br />
dụng<br />
thực<br />
th tế<br />
Học Máy – IT 4862<br />
<br />
3<br />
<br />
Ví dụ về DT: Những tin tức nào mà tôi quan tâm?<br />
“sport”?<br />
is present<br />
<br />
is absent<br />
<br />
“player”?<br />
is present<br />
<br />
Interested<br />
<br />
is absent<br />
<br />
Uninterested<br />
<br />
“football”?<br />
is present<br />
<br />
Interested<br />
is present<br />
<br />
Interested<br />
<br />
• (…,“sport”,…,“player”,…)<br />
<br />
→ Interested<br />
<br />
• (…,“goal”,…)<br />
<br />
→ Interested<br />
<br />
• (…,<br />
( “sport”<br />
sport ,…))<br />
<br />
→ Uninterested<br />
Học Máy – IT 4862<br />
<br />
is absent<br />
<br />
“goal”?<br />
is absent<br />
<br />
Uninterested<br />
<br />
4<br />
<br />
Ví dụ về DT: Một người có chơi tennis không?<br />
Outlook=?<br />
Sunny<br />
<br />
Overcast<br />
<br />
Humidity=?<br />
<br />
Rain<br />
<br />
Wind=?<br />
<br />
Yes<br />
<br />
High<br />
<br />
Normal<br />
<br />
No<br />
<br />
Yes<br />
<br />
Strong<br />
<br />
No<br />
<br />
Weak<br />
<br />
Yes<br />
<br />
• (Outlook=Overcast, Temperature=Hot, Humidity=High,<br />
Wind=Weak)<br />
→ Yes<br />
(Outlook=Rain,<br />
a , Temperature=Mild,<br />
p<br />
d, Humidity=High,<br />
y<br />
g , Wind=Strong)<br />
St o g)<br />
• (O<br />
→ No<br />
• (Outlook=Sunny, Temperature=Hot, Humidity=High, Wind=Strong)<br />
→ No<br />
Học Máy – IT 4862<br />
<br />
5<br />
<br />