
Chương 9. p.1
Chương 9
Học Máy
Giáo viên: Trần Ngân Bình

Chương 9. p.2
Học Máy (Machine Learning)
Học (learning) là bất cứsựthay đổi nào trong một hệthống cho
phép nó tiến hành tốthơn trong lần thứhai khi lặp lại cùng một
nhiệm vụhoặc với nhiệm vụkhác từcùng một quần thể đó.
(Herbert Simon)
Học liên quan đến vấnđề khái quát hóa từkinh nghiệm
(dữliệu rèn luyện) => bài toán quy nạp(induction)
Vì dữliệu rèn luyệnthường hạn chế, nên thường khái
quát hóa theo một sốkhía cạnh nào đó (heuristic) =>
tính thiên lệch quy nạp(inductive bias)
Có ba tiếp cận học:
– Các phương pháp học dựa trên ký hiệu (symbol-based): ID3
– Tiếp cận kết nối: Các mạng neuron sinh học
– Tiếp cận di truyền hay tiến hóa: giải thuật genetic

Chương 9. p.3
Cây quyếtđịnh (ID3)
Là một giải thuật họcđơn giảnnhưng thành công
Cây quyếtđịnh (QĐ) là một cách biểu diễn cho phép chúng ta
xác định phân loại của mộtđốitượng bằng cách kiểm tra giá trị
của một sốthuộc tính.
Giải thuật có:
–Đầu vào: Mộtđốitượng hay một tập hợp các thuộc tính mô tả
một tình huống
–Đầu ra: thường là quyếtđịnh yes/no, hoặc các phân loại.
Trong cây quyếtđịnh:
– Mỗi nút trong biểu diễn một sựkiểm tra trên một thuộc tính
nào đó, mỗi giá trịcó thểcủa nó tương đương với một nhánh
của cây
– Các nút lá thểhiện sựphân loại.
Kích cỡcủa cây QĐ tùy thuộc vào thứtựcủa các kiểm
tra trên các thuộc tính.

Chương 9. p.4
Ví dụCây QĐ: Chơi Tennis
Mụcđích: họcđể xem có chơi Tennis không?
Cây quyếtđịnh:
Yes
Quang cảnh
nắng Âm u mưa
Độ ẩm Yes Gió
cao Trung bình mạnh nhẹ
No
Yes
No

Chương 9. p.5
Quy nạp cây QĐ từcác ví dụ
Ví dụ(hay dữliệu rèn luyện cho hệthống) gồm:
Giá trịcủa các thuộc tính + Phân loại của ví dụ
khôngMạnhCaoấm ápMưaD14
CónhẹTBNóngÂm uD13
CóMạnhCaoấm ápÂm uD12
CóMạnhTBấm ápNắngD11
CónhẹTBấm ápMưaD10
CónhẹTBMátNắngD9
KhôngnhẹCaoấm ápNắngD8
CóMạnhTBMátÂm uD7
KhôngMạnhTBMátMưaD6
CónhẹTBMátMưaD5
CónhẹCaoấm ápMưaD4
CóNhẹCaoNóngÂm uD3
KhôngMạnhCaoNóngNắngD2
Cao
Độ ẩm
KhôngnhẹNóngNắngD1
Chơi TennisGióNhiệtđộQuang cảnhNgày

