Nghiên c u và cài đt các thu t toán phân l p d li u v i Mapleứ ặ ậ ớ ữ ệ ớ
Ch ng 1: THU T TOÁN FIND-Sươ Ậ
1. H C KHÁI NI M VÀ BÀI TOÁN C THỌ Ệ Ụ Ể
Theo Tom M.Mitchell: “Nhi u v n đ h c đòi h i các khái ni m t ng quát thu đc ề ấ ề ọ ỏ ệ ổ ượ
t các ví d hu n luy n. … V n đ t đng k t lu n v s xác đnh t ng quát nh t c a ừ ụ ấ ệ ấ ề ự ộ ế ậ ề ự ị ổ ấ ủ
m t vài khái ni m, các ví d cho tr c đc ghi nhãn có ph i là b ph n c a khái ni m ộ ệ ụ ướ ượ ả ộ ậ ủ ệ
hay không, nhi m v đó th ng đc xem nh là ệ ụ ườ ượ ư h c khái ni m.ọ ệ ”
1.1. H c khái ni mọ ệ
-Cho tr c các ví d hu n luy n. m i ví d hu n luy n cho bi t có thu c khái ướ ụ ấ ệ ỗ ụ ấ ệ ế ộ
ni m hay không? (thu c: positive; không: negative)ệ ộ
-Đa ra khái ni m t ng quát phân lo i t p hu n luy n. Khái ni m t ng quát là ư ệ ổ ạ ậ ấ ệ ệ ổ
hàm boolean đc đnh nghĩa trên t p cá th .ượ ị ậ ể
-“H c khái ni m là đa ra m t hàm boolean t t p input và putput c a các ví dọ ệ ư ộ ừ ậ ủ ụ
hu n luy n” (Tom M.Mitchell – ấ ệ Machine Learning)
Ví d :ụ
o(Input) Các ví d hu n luy n:ụ ấ ệ
T p các animal cùng thu c tính c a nó.ậ ộ ủ
o(Output) Khái ni m đc trích ra:ệ ượ
Bird
Cat
…
1.2. Bài toán c thụ ể
-(Input) T p ví d hu n luy n g m 4 cá th sau:ậ ụ ấ ệ ồ ể
oT p này nói v nh ng ngày (nh th nào đó) mà Aldo thích ch i ậ ề ữ ư ế ơ
môn th thao d i n c c a anh ta ể ướ ướ ủ (Table 2.1 – Positive and
negative training examples gor thw target concept EnjoySport, Machine
Learning – Tom M.Mitchell, 2003).
Exampl
e
Sky
AirTem
p
Humidity Wind Water Forecast EnjoySport
1 Sunny Warm Normal Strong Warm Same Positive
2 Sunny Warm High Strong Warm Same Positive
3 Rainy Cold High Strong Warm Change Negative
GV: PGS. TS. Đ Văn Nh nỗ ơ 4HVTH: Hu nh Tu n Anhỳ ấ