Trang 1
Cây quyết định (ID3) và
Cây quyết định (ID3) và
Học Quy nạp (ILA)
Học Quy nạp (ILA)
Tô Hoài Việt
Khoa Công nghệ Thông tin
Đại học Khoa học Tự nhiên TPHCM
thviet@fit.hcmuns.edu.vn
Trang 2
Nội dung
Nội dung
Cây quyết định
Học cây quyết định – Thuật toán ID3
Biểu diễn tri thức bằng luật
Rút luật từ cây quyết định
Thuật toán học quy nạp
Trang 3
Cây quyết định
Cây quyết định
Cây quyết định biểu diễn:
Mỗi nút trong kiểm tra
một thuộc tính
Mỗi nhánh tương ứng
với giá trị thuộc tính
Mỗi nút lá được gán một
phân lớp
Định luật Occam: những
cây đơn giản là những
cây quyết định tốt hơn
Trang 4
Thuật toán học ID3
Thuật toán học ID3
Được phát triển đồng thời bởi Quinlan trong AI và Breiman, Friedman,
Olsen và Stone trong thống kê
Lặp:
1. Chọn A thuộc tính quyết định “tốt nhất” cho nút kế tiếp
2. Gán A là thuộc tính quyết định cho nút
3. Với mỗi giá trị của A, tạo nhánh con mới của nút
4. Phân loại các mẫu huấn luyện cho các nút lá
5. Nếu các mẫu huấn luyện được phân loại hoàn toàn thì NGƯNG,
Ngược lại, lặp với các nút lá mới.
Thuộc tính tốt nhất là gì?
Trang 5
Entropy
Entropy
S là tập các mẫu huấn luyện
p là tỷ lệ các mẫu dương trong S
H – p.log2p – (1 – p).log2(1 – p)