SEMINAR: C S D LI U NÂNG CAOƠ
NGHIÊN C U B L C TH SPAM Ư
TRÊN C S M NG BAYESƠ
H c viên: Nguy n Vi t Linh ế
MS: CH0601038
GI I THI U
Các b l c th spam trên c s lu t và d u hi u ư ơ
không kh năng t t o ra quy t đ nh và l c ế
c spam m i.
Các b l c th tn c s m ng Bayes cho pp ư ơ
b l c th ‘h c’ và có kh năng t ra quy t ế
đ nh v i các spam m i.
Các b phân l p trên c s máy h c cho ta hi u ơ
qu l c và phán đoán c th spam hi u qu ư
cao. V i c b l c trên c s m ng Bayes đ c ơ ượ
hu n luy n t t, đ cnh xác có th đ t t i 99 %.
GI I THI U
Trong seminar này chúng ta s đ c p đ n c ế
v n c đ sau đ xây d ng b l c spam k
thu t Bayes:
B l c spam trên c s m ng Bayes đ n gi n ơ ơ
B l c spam trên c s m ng Bayes đ y đ ơ
Các ph ng th c hu n luy n choc b l c spam kươ
Pn l p Email và s pn l p sai
Hi n th c b pn l p spam Bayes
I. B L C SPAM TRÊN C S M NG BAYES Đ N GI N Ơ Ơ
(T ng quan v m ng Bayes)
M ng Bayes m t d ng mô hình đ th
theo xác su t không cung tr c ti p. ế
Các nút bi u di n các bi n ng u nhiên, ế
các cung bi u di n m i quan h ph
thu c gi a các bi n. ế
N u các bi n là X1, ... , Xn và “parents(A)” ế ế
các cha c a nút A, thì phân b k t n i ế
cho X1 t i Xn đ c bi u di n d i d ng ượ ướ
k t qu c a phân b theo xác su t: ế
P(X1,..., Xn) = ∏P(Xi | parents(Xi)) for i = 1 to n.
I. B L C SPAM TRÊN C S M NG BAYES Đ N GI N Ơ Ơ
(Mô hình m ng Bayes đ n gi n) ơ
M t m ng Bayes đ n gi n nh t g ơ m mt nút cha
và t t c c bi n khác con c a t cha. N u ế ế
bi n cha “Xp”, thì công th c pn b k t n i ế ế
nh sau: P(Xp, X1, ..., Xn) = P(Xp) ưP(Xi|Xp) for
i = 1 to n.
B phân l p Naive Bayes m t b phân l p
theo c su t đ n gi n. L i ích chính c a b ơ
phân l p Naive Bayes th hu n luy n r t
hi u qu b ng vi c h c có giám sát.