Phân l p d li u
(Data Classification)
Ch ng 4:ươ
N i dung
1. Phân l p và d đoán?
2. Quy n p trên cây quy t đ nh ế
3. Phân l p Bayes
4. Các ph ng pháp phân l p khácươ
Phân l p gì ? D đoán là gì?
th dùng phân l p d đoán đ xác
l p hình/m u nh m mô t các l p
quan tr ng hay d đoán khuynh h ng d ướ
li u trong t ng lai. ươ
Phân l p(classification) d đoán các nhãn
phân lo i.
D đoán (prediction) hàm giá tr liên t c.
Phân l p d li u là ti n ế
trình có 2 b cướ
Hu n luy n : D li u
hu n luy n đ c phân ượ
tích b i thu t tóan
phân l p ( có thu c
tính nhãn l p)
Phân l p: D li u
ki m tra đ c dùng đ ượ
c l ng đ chính ướ ượ
xác c a b phân l p.
N u đ chính xác là ế
ch p nh n đ c thì có ượ
th dùng b phân l p
đ phân l p các m u
d li u m i.
Phân lp và D đoán
Độ chính xác (accuracy) ca b phân lp trên
tp kim tra cho trước là phn trăm ca các mu
trong tp kim tra được b phân lp xếp lp
đúng
Phân lp và D đoán?
sampltest ofnumber total
sampletest classifiedcorrectly
Accuracy =