Chương 9. p.1
Ch ng 9ươ
H c Máy
Giáo viên: Tr n Ngân Bình
Ch ng 9. p.ươ 2
Hc Máy (Machine Learning)
H c (learning) b t c s thay đ i nào trong m t h th ng
cho phép ti nnh t t h n trong l n th hai khi l p l i cùng ế ơ
m t nhi m v ho c v i nhi m v kc t cùng m t qu n th
đó. (Herbert Simon)
H c liên quan đ n v n đ khái quát hóa t kinh ế
nghi m (d li u rèn luy n) => bài toán quy n p
(induction)
Vì d li u rèn luy n th ng h n ch , nên th ng khái ườ ế ườ
quát hóa theo m t s khía c nh nào đó (heuristic) =>
tính thiên l ch quy n p (inductive bias)
Có ba ti p c n h c:ế
Các ph ng pp h c d a trên ký hi u (symbol-based): ID3ươ
Ti p c n k t n i: Các m ng neuron sinh h cế ế
Ti p c n di truy n hay ti na: gi i thu t genetic ế ế
Ch ng 9. p.ươ 3
Cây quy t đ nh (ID3)ế
Là m t gi i thu t h c đ n gi n nh ng thành công ơ ư
Cây quy t đ nh (QĐ) ế m t ch bi u di n cho phép chúng
ta xác đ nh phân lo i c a m t đ i t ng b ng cách ki m tra g ượ
tr c a m t s thu c tính.
Gi i thu t có:
Đ u o: M t đ i t ng hay m t t p h p các thu c tính mô ượ
t m t tình hu ng
Đ u ra: th ng quy t đ nh yes/no, ho c c pn lo i.ườ ế
Trong cây quy t đ nh:ế
M i nút trong bi u di n m t s ki m tra trên m t thu c tính
o đó, m i g tr có th c a t ng đ ng v i m t nhánh ươ ươ
c a cây
Các nút th hi n s phân lo i.
Kích c c a cây QĐ tùy thu c vào th t c a các ki m
tra trên các thu c tính.
Ch ng 9. p.ươ 4
Ví d Cây QĐ: Ch i Tennis ơ
Mc đích: h c đ xem có ch i Tennis không? ơ
Cây quy t đ nh:ế
Yes
Quang c nh
n ngÂm u m aư
Đ m Yes Gió
cao Trung bình m nhnh
No
Yes
No
Ch ng 9. p.ươ 5
Quy n p cây QĐ t các ví d
Ví d (hay d li u rèn luy n cho h th ng) g m:
Giá tr c a các thu c tính + Phân lo i c a ví d
Ngày Quang c nhNhi t đ Đ m Gió Ch i Tennisơ
D1 N ng Nóng Cao nhKhông
D2 N ngNóng Cao M nhKhông
D3 Âm u Nóng Cao Nh
D4 M aưm ápCao nh
D5 M a ưMát TB nh
D6 M aưMát TB M nhKhông
D7 Âm u Mát TB M nh
D8 N ngm ápCao nhKhông
D9 N ng Mát TB nh
D10 M aưm ápTB nh
D11 N ngm ápTB M nh
D12 Âm u m ápCao M nh
D13 Âm u Nóng TB nh
D14 M aưm ápCao M nhkhông