
Phân l p d li uớ ữ ệ
(Data Classification)
Ch ng 4:ươ

N i dungộ
1. Phân l p và d đoán?ớ ự
2. Quy n p trên cây quy t đ nhạ ế ị
3. Phân l p Bayesớ
4. Các ph ng pháp phân l p khácươ ớ

Phân l p là gì ? D ớ ự đoán là gì?
•Có th dùng phân l p và d đoán đ xác ể ớ ự ể
l p mô hình/m u nh m mô t các l p ậ ẫ ằ ả ớ
quan tr ng hay d đoán khuynh h ng d ọ ự ướ ữ
li u trong t ng lai. ệ ươ
•Phân l p(classification) d đoán các nhãn ớ ự
phân lo i.ạ
•D đoán (prediction) hàm giá tr liên t c.ự ị ụ

Phân l p d li u là ti n ớ ữ ệ ế
trình có 2 b cướ
–Hu n luy nấ ệ : D li u ữ ệ
hu n luy n đ c phân ấ ệ ượ
tích b i thu t tóan ở ậ
phân l p ( có thu c ớ ộ
tính nhãn l p) ớ
–Phân l p:ớ D li u ữ ệ
ki m tra đ c dùng đ ể ượ ể
c l ng đ chính ướ ượ ộ
xác c a b phân l p. ủ ộ ớ
N u đ chính xác là ế ộ
ch p nh n đ c thì có ấ ậ ượ
th dùng b phân l p ể ộ ớ
đ phân l p các m u ể ớ ẫ
d li u m i. ữ ệ ớ
Phân lớp và Dự đoán

Độ chính xác (accuracy) của bộ phân lớp trên
tập kiểm tra cho trước là phần trăm của các mẫu
trong tập kiểm tra được bộ phân lớp xếp lớp
đúng
Phân lớp và Dự đoán?
sampltest ofnumber total
sampletest classifiedcorrectly
Accuracy =

