Ch
ng 3:
ươ
Dãy ph bi n Dãy ph bi n
ổ ế ổ ế
1
Ch Ch
ng 3: Dãy ph bi n ng 3: Dãy ph bi n
ươ ươ
ổ ế ổ ế
1. CÁC KHÁI Ni M C B N 1. CÁC KHÁI Ni M C B N Ơ Ả Ơ Ả Ệ Ệ
Lu t k t h p mô t Lu t k t h p mô t
các s ki n xu t hi n cùng các s ki n xu t hi n cùng
ự ệ ự ệ
ệ ệ
ấ ấ
ả ả ữ ệ ữ ệ
ả
ẩ ẩ
ẽ
ả
ậ ế ợ ậ ế ợ nhau trong d li u nhau trong d li u – Ví d : "IF khách hàng mua s n ph m A v i s ớ ố ụ ng 10 THEN s mua s n ph m B v i s ớ ố ng 20.
l ượ l ượ
ả ả
quan h th i gian ệ ờ quan h th i gian ệ ờ
ậ ậ
ổ ế ổ ế
Các lu t dãy ph bi n mô t Các lu t dãy ph bi n mô t ự ệ ự ệ
ữ ữ
ụ
ả
ẩ ế
ẽ
ầ
2
gi a các s ki n gi a các s ki n – Ví d : IF hôm nay khách hàng mua s n ph m A THEN sau 1 tu n khách hàng s mua ti p s n ph m B và C” ả
ẩ
ạ ự ệ
– T p ậ R các lo i s ki n. – M iỗ s ki n là m t c p
ộ ặ (A, t), v i ớ
1. CÁC KHÁI Ni M C B N (tt) Ệ 1. CÁC KHÁI Ni M C B N (tt) Ệ Ơ Ả Ơ Ả
ự ệ ệ
ự ệ R là lo i ạ s ki n (ví d lo i tín hi u báo đ ng ) ụ ạ ờ
• A ˛ • t là m t s nguyên xác đ nh th i đi m xu t hi n ộ ệ ể ấ ị
ộ ố ự ệ
ộ (s, Ts, Te) Te là th i đi m k t thúc ể ờ
c a s ki n ủ ỗ ự ệ S trên R là b ba – Chu i s ki n ắ ầ ờ ế
ớ ọ • Ts là th i đi m b t đ u và ể • Ts < Te là các s nguyên ố • S = Æ (A1, t1), (A2, t2), …, (An, tn) æ • Ai ˛ R và Ts £ ti < Te v i m i i=1, …, n`
3
1. CÁC KHÁI NI M C B N (tt) Ệ 1. CÁC KHÁI NI M C B N (tt) Ệ Ơ Ả Ơ Ả
Ví d chu i s ki n: Ví d chu i s ki n: ỗ ự ệ ỗ ự ệ ụ ụ
D C A B D A B C A D C A B D A
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
– A, B, C, D: là các lo i s ki n
ạ ự ệ
– 10…150 là các th i đi m x y ra s ki n ờ
ự ệ
ể
ả
– S = Æ (D, 10), (C, 20), …, (A, 150) æ
ắ ầ
ể
ờ
ể
ế
ờ
– Ts (th i đi m b t đ u) = 10 and
Te (th i đi m k t thúc) =
150
• Trong đó Trong đó::
4
2. DÃY PH Bi N TRONG M T CHU I (Episode) 2. DÃY PH Bi N TRONG M T CHU I (Episode) Ổ Ế Ổ Ế Ộ Ộ Ỗ Ỗ
Episodes: Episodes:
)
– Episode là c p (ặ V, £ ậ
• V là t p h p các lo i s ki n,ví d lo i tín hi u báo ợ ạ ự ệ ụ ạ ệ
đ ngộ
" £ là th t riêng ph n trên V ứ ự
ế
a = (V, £ ) S n u các lo i s ki n ạ ự ệ c xác
S theo th t
– Cho chu i ỗ S các s ki n, episode ạ ệ
đ ứ ự ượ
x y ra trong ph m vi ả trong V xu t hi n trong ấ đ nh b ng quan h th t
. ệ ứ ự
ằ
ị
ầ ự ệ
5
2. DÃY PH Bi N TRONG M T CHU I (Episode) 2. DÃY PH Bi N TRONG M T CHU I (Episode) Ổ Ế Ổ Ế Ộ Ộ Ỗ Ỗ
ổ ụ ổ ụ
ư ư
riêng ph n ph d ng nh : riêng ph n ph d ng nh : toàn ph n toàn ph n ị ừ ủ
ứ ự ố ị
Các th t ứ ự Các th t ứ ự – Th t Th t ứ ự ứ ự • Các v t • Các episodes nh v y đ
c a m i episode có th t c g i là ọ
ầ ầ ầ ầ ỗ ư ậ
ượ c đ nh tu n tầ ự (hay
riêng ph n hi n nhiên ể ầ riêng ph n hi n nhiên ể ầ c a các v t ị ừ song song (hay c g i là ọ
ượ
“có th t ") ứ ự – Các th t Các th t ứ ự ứ ự • Không xét tr t t ậ ự ủ • Các episodes này đ “không có th t ") ứ ự
6
2. DÃY PH Bi N TRONG M T CHU I (Episode) 2. DÃY PH Bi N TRONG M T CHU I (Episode) Ổ Ế Ổ Ế Ộ Ộ Ỗ Ỗ
Ví d :ụVí d :ụ
A
A
B
A
C
B
B
ầ ự
Episode v a tu n t ừ v a song song ừ
Episode tu n t ầ ự
Episode song song
7
3. THU T TOÁN WINEPI 3. THU T TOÁN WINEPI Ậ Ậ
ng pháp WINEPI xu t phát t ng pháp WINEPI xu t phát t
Tên c a ph ủ Tên c a ph ủ
ươ ươ
ấ ấ
ừ ừ
ổ ổ
ử ử
k thu t dùng c a s tru t ợ ỹ k thu t dùng c a s tru t ợ ỹ ậ – C a s đ
c tr
ổ ượ
ượ
t qua chu i d li u các s ự ỗ ữ ệ
ậ ậ ậNh n xét: Nh n xét: ử ki nệ
– M i c a s là m t “khung nh" gi ng nh m t
ư ộ
ỗ ử
ả
ộ
ổ
ố
dòng c a CSDL ủ
– T p các “khung nh" t o thành các dòng c a ạ
ủ
ả
ậ CSDL
8
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
Ví d chu i d li u s ki n: ỗ ữ ệ Ví d chu i d li u s ki n: ỗ ữ ệ
ự ệ ự ệ
ụ ụ
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
• B r ng c a s là 40 giây B r ng c a s là 40 giây ử ổ ử ổ • C a s đ u/cu i ch ch a s ki n đ u/cu i C a s đ u/cu i ch ch a s ki n đ u/cu i ỉ ố ỉ ố
ề ộ ề ộ ử ổ ầ ử ổ ầ
ứ ự ệ ứ ự ệ
ố ố
ầ ầ
9
ạ ự ệ
ỗ
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
ỗ ự ệ S S = = chu i s ki n các s ki n ự ệ eventi ọ i=1, …, n-1, và
eventi+1 v i m i ớ
Cho t p ậ E các lo i s ki n, ((ss,,TTss,T,Tee)) là m t chu i có th t ứ ự ộ sao cho eventi £ ớ Ts £ ọ i=1, …, n
eventi < Te v i m i
event1 event2 event3 … … eventn
Ts Te
t1 t2 t3 … … tn
10
là chu i s ki n
ỗ ự ệ ứ
ặ
ủ
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
chu i s ki n S ử ổ trêntrên chu i s ki n S C a s ỗ ự ệ C a s ỗ ự ệ ử ổ Sw=(w,ts,te), v i ớ ts < Te, te > Ts, và w ch a các c p t < te (event, t) c a s mà
ts £ c g i là b r ng c a s ề ộ ọ
ử
ổ W
ượ
Giá tr ị ts £
t < te đ
event1 event2 event3 … … eventn
Ts Te
t1 t2 t3 tn
WWttss
ttee
11
ị
ử
ỗ
ổ ầ ố
ố ử ổ
ậ ử
ơ ứ
ể
ầ
Theo đ nh nghĩa, c a s đ u và cu i trên chu i có ổ ầ th vu n ra ngoài chu i, do v y c a s đ u tiên ỗ ch ch a th i đi m đ u và c a s cu i cùng ch ỉ ch a th i đi m cu i ố
ể ỉ ứ
ờ ể
ờ
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
event1 event2 event3 … … eventn
Ts Te
t1 t2 t3 tn
WWttss
WWttss
ttee
ttee
12
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
T n su t (đ h tr v i lu t k t h p) c a
ấ
ủ
ấ
ổ
ộ ỗ ợ ớ ầ episode a là t ỷ ố ữ hi n v i t ng s các c a s kh dĩ.
ậ ế ợ s gi a các c a s có xu t ử ố
ớ ổ
ử
ệ
ả
ổ
xu t hi n trong ệ
|Sw ˛
Sw |
W(S, W) | a
fr(a
, S, W) =
|W(S, W)|
ấ
ổ w c a ủ
t c các c a s S V i ớ W(S, W) là t p t chu i S sao cho b r ng c a s là W
ậ ấ ả ề ộ
ử ổ
ử
ỗ
13
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
ng
Khi tìm episodes c n s d ng m t ng ầ
ử ụ
ộ
ưỡ
t n su t ầ
ấ min_fr Episode a là ph bi n
ổ ế n u ế fr(a , s, win) ‡
t quá ng
ụ
ượ
ấ
min_fr ấ ủ a v Ví d , “n u t n su t c a ng t n ầ ưỡ ế ầ ỗ ữ ệ s và su t nh nh t trong ph m vi chu i d li u ạ ấ ỏ ổ win" v i b r ng c a s ớ ề ộ
ử
ổ ế
F(s, win, min_fr): t p h p các episodes ph bi n ợ ớ win và min_fr
ậ trong s ng v i ứ
ổ ế
Apriori: N uếN uế episode a là ph bi n trong chu i s ỗ ự Apriori: b a là ph ổ t c các episodes con
ấ ả
ki n ệ s, thì t bi nế
14
(cid:222)
a
là
, v i ớ b
ứ b Lu t ậLu t ậ episode rule là bi u th c
ể các episodes sao cho b là episode con c a ủ a
bi u di n
và a a ), n u đ th ồ ị ế .
Episode b ể
là episode con c a ủ a ễ a ễ b là đ th con c a đ th bi u di n ủ ồ ị
(b ồ ị ể
A
A
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
b :
:
C
B
B
g
15
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
Phân số
ộ
fr(a , S, W) fr(b , S, W) : t n su t c a toàn b episode : t n su t c a episode v trái ấ ủ ấ ủ ầ ầ ế
a
là đ tin c y c a lu t ậ ủ ộ ậ b (cid:222)
Đ tin c y đ ượ ư ệ ậ
c ộ x y ra trong c a s khi cho tr ử ả ộ ủ a c xem nh xác su t đi u ki n c a toàn b c a ủ ề ấ ướ b x y ra trong c a s đó. ổ ử ả ổ
16
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
ậNh n xét: Nh n xét:
ậ – Các lu t WINEPI gi ng lu t k t h p nh ng có
ậ
ế
ư
ợ
ố th i gian: ề ỏ
ủ
ậ
ấ
ả
ơ
ậ
ệ ị
ệ
ầ c mô t W đ n v th i gian.
ậ thêm y u t ế ố ờ N u s ki n th a v trái c a lu t xu t hi n theo ệ ế ự ệ W đ n v th i gian, bên ph i trong ph m vi th t ị ờ ạ ứ ự thì cũng xu t hi n trong ph n k t lu n (v ph i ) ả ế ế ấ xu t hi n trong v trí đ b i quan h th ệ ứ ả ở ấ ự £ , trong ph m vi t
ượ ơ
ị ờ
ạ
17
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
ỗ ự ệ Input: T p ậ R các lo i s ki n Input trên R, t p ậ E
ạ ự ệ , chu i s ki n S ổ win, và ngu ng t n su t ỡ ử ấ ầ ề ộ
các episodes, b r ng c a s min_fr
ậ ợ F(s, win, min_fr)
Output: T p h p Output Method: Method
| = 1}; ˛ E | |a
„ do
˛ , s, win) ‡ Ck | fr(a min_fr}; //Quét CSDL
|(s, win, min_fr) // t o ng
˛ E | |a cho t F|b a ạ ứ | = k, and b ˛ E và b ấ ả b ˛ t c
18
1.Tính C1 := {a 2. k := 1; ˘ 3.while Ck 4. Tính F(s, win, min_fr) = {a 5. k := k+1; 6. Tính Ck= {a viên 7. End While
ự
ị
ỗ ự ệ ộ ầ
ỗ ệ ổ
ấ ử
ủ
ệ
ấ
ố
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
Bài toán: cho chu i s ki n và episode, xác đ nh ệ episode có xu t hi n trong chu i s ki n đó không. Tìm s các c a s có ch a m t l n xu t hi n c a ứ episode.
Cách x lý?
ậ ế ợ
h p c a hai episodes có
ng lu t k t h p ổ ợ
ủ
kích th
ử – Gi ng ý t ưở ố – Episode ng viên là t ứ c nh h n ướ
ỏ ơ
– Các episodes song song, episodes tu n tầ ự
19
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
Ví d chu i d li u s ki n: ỗ ữ ệ Ví d chu i d li u s ki n: ỗ ữ ệ
ự ệ ự ệ
ụ ụ
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
ớ ớ
ể ể
• B r ng c a s là 40 giây, bu c di chuy n là 10 giây B r ng c a s là 40 giây, bu c di chuy n là 10 giây • Chi u dài c a chu i là 70 (10-80) Chi u dài c a chu i là 70 (10-80)
ử ổ ử ổ ủ ủ
ề ộ ề ộ ề ề
ỗ ỗ
20
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
B ng cách tr B ng cách tr t c a s , chúng ta có 11 c a s (U t c a s , chúng ta có 11 c a s (U ằ ằ ượ ử ổ ượ ử ổ ử ổ 11-U-U1111):): ử ổ
…
U2
U1 U11
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
c n đ nh là 40%, ví d episode x y c n đ nh là 40%, ví d episode x y
ị ị
ụ ụ
ả ả
• Ngu ng t n s đ Ngu ng t n s đ ầ ầ ra t ể ra t ể
ỡ ỡ i thi u trong 5 c a 11 c a s . ử ổ ố i thi u trong 5 c a 11 c a s . ử ổ ố
ố ượ ấ ố ượ ấ ủ ủ
21
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
WINEPI Approach WINEPI Approach
22
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
Gi Gi ấ ả ấ ả
s c n tìm t ả ử ầ s c n tìm t ả ử ầ – Đ u tiên, t o singletons, ví d episodes song song có ạ t c các episodes song song: t c các episodes song song: ụ ầ
– Ti p đ n nh n d ng các singletons ph bi n ( đây ổ ế ở ậ (A, B, C, D) ạ
kích thu c là 1 ớ ế t c ) ấ ả
– T các episodes ph bi n này, t o các episodes ng ế là t ừ ứ ạ
AB, AC, AD, BC, BD, CD
– Ti p đ n nh n d ng các episodes song song ph ổ
viên có kích th ậ ế bi n( đây là t ổ ế c là 2: ướ ạ t c ) ấ ả
– T các episodes ph bi n này, t o các episodes ph ổ ạ
ổ ế c là 3: ABC, ABD, ACD, BCD ướ ế ế ở ừ ế
ạ ổ ế ỉ
bi n có kích th ậ ệ – Khi nh n d ng các episodes ph bi n, ch có ABD ử xu t hi n trong h n 4 c a s ổ ấ
ơ – Không có episodes ng viên có kích th c là 4. ướ ứ
23
3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ
T n su t Episode và các lu t ví d v i WINEPI: T n su t Episode và các lu t ví d v i WINEPI:
ụ ớ ụ ớ
ấ ấ
ậ ậ
ầ ầ
D (cid:222) A [40] (55%, 75%)
D C A B D C D A D B C A C B A B D A B : 73% : 73% : 64% : 64% : 45% : 55% : 45% : 45% : 45% : 55% : 45% D A (cid:222) B [40] (45%, 82%)
24
4. THU T TOÁN MINEPI 4. THU T TOÁN MINEPI Ậ Ậ
ậ ậ
ế ế
ử
M t cách ti p c n khác đ khám phá episodes ộ ể M t cách ti p c n khác đ khám phá episodes ộ ể – Không dùng c a s tr t ổ ượ – Đ i v i t ng episode quan tâm ti n năng, tìm
ề
ổ
i: i: i h n th i gian cho m t lu t : ớ ạ
ậ
ủ i h n th i gian, ờ ớ ạ ộ ạ
ố ớ ừ s l n xu t hi n chính xác c a episode. ệ ấ ố ầ ệ ợ d s a đ i các gi Các ti n l ễ ử Các ti n l ệ ợ nhi u gi ờ ề “N u ế A và B x y ra trong ph m vi 15 giây, thì ả C s theo sau trong ph m vi 30 giây" ạ
ả
ố
ẽ ấ ệ dùng nhi u kho ng tr ng B t ti n: ề B t ti n: ấ ệ
25
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
ấ
ả
Cho episode a và chu i s ki n ỗ ự ệ S, kho ng ả ấ a c a ủ S, [ts,te] là xu t hi n nh nh t ỏ ệ – N u ế a x y ra trong c a s ng v i kho ng ả ớ ổ ứ ử – N u ế a không x y ra trong b t kỳ kho ng con ấ
ả
ả
đúng nào ấ
ỏ
c đ
a c ký
ướ
ộ
T p các xu t hi n nh nh t c a episode ấ ủ ệ ậ trong m t chu i s ki n cho tr ượ ỗ ự ệ hi u là mo
(a ):
ệ
ự
ệ
ấ
nh nh t c a
mo(a ) = { [ts,te] | [ts,te] là s xu t hi n ỏ
ấ ủ a }
26
ạ ự ệ
ứ
ầ
ỏ
ấ ộ ầ
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
Ví d :ụ Episode song song b ch a các lo i s ki n s là : A và B có ba l n xu t hi n nh nh t trong ệ ấ {[30,40], [40,60], [60,70]}, a có m t l n xu t hi n ệ ấ trong s là : {[60,80]}
A
A
b :
a :
C
B
B
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
27
ấ
ậ
ệ
ề ả
ả
ợ ờ
ự ệ
ệ episode là b [win1] (cid:222) • Lu t ậ episode là
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
a (b là episode
• Lu t Episode MINEPI cho xác su t đi u ki n đ t ể ổ h p các s ki n ( tín hi u báo đ ng) x y ra trong m t ộ ộ ệ ự ệ h p khác các s ki n c t th i kho ng khi cho tr ướ ổ ợ khác đã xu t hi n trong th i kho ng ả ờ ấ a [win2] b và a là các episodes sao cho b con c a ủ a ) • N u episode
ệ
ế
ả
ấ
ỏ
"
£
ấ win1, thì episode a ớ
[ts,te] v i ớ te - ts kho ng [ ứ ả
b có xu t hi n nh nh t trong kho ng x y ra trong win2
ả t'e sao cho t'e - ts
ts,t'e] ng v i vài
£
28
ề
ờ
a [win2] là xác su t ấ ướ b x y raả i ướ , d c ch đ nh b i các ở ị
c ỉ
ậ b [win1] (cid:222) Đ tin c y c a lu t ậ ộ ủ ể a x y ra khi cho tr đi u ki n đ ả ệ các ràng bu c th i gian đ ượ ộ lu t:ậ
|mo(a )| / |mo(b )|
ố
ệ
ấ
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
ư ế
ủ
ệ
ệ
ấ
v i ớ |mo(b )| là s các xu t hi n nh nh t [ ấ ts,te] ỏ c a ủ b sao cho te - ts win1 và |mo(a )| là s các ố xu t hi n nh th và cũng có m t xu t hi n c a ấ a trong ph m vi kho ng ạ
ả
ộ [ts,ts+win2]
£
29
ậ b [win1] (cid:222)
a [win2] là |mo(a )|,
T n su t c a lu t ấ ủ ỏ
ậ
ầ v i s l n lu t th a trong CSDL ớ ố ầ Xét ví d :ụ Xét ví d :ụ
– Bài toán: tìm t
t c các episodes tu n t
ầ
ằ
ự
ạ
ấ ả ờ ử ầ
ả ổ ấ
ưỡ
ượ
ự b ng cách dùng th i kho ng c c đ i là 40 giây và kích thu c c a s là 10, 20, 30 and ớ c gán cho ng t n su t đ 40 giây Ng m t l n xu t hi n. ệ ấ
ộ ầ
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
30
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
Tìm t t c các episodes tu n t Tìm t t c các episodes tu n t
(1/3): (1/3):
– Đ u tiên, t o singletons, ví d episodes có kích th c ạ ướ
ầ ự ầ ự ụ
ấ ả ấ ả ầ
là 1 (A, B, C, D)
ạ ạ ả ấ
ệ ầ ầ
ả ả
– Trong khi t o singletons, chúng ta cũng t o b ng xu t hi n cho chúng. Sau l n quét CSDL đ u tiên, chúng ta không c n quét CSDL n a mà dùng các b ng đ o ữ ng c đ ượ ượ ạ ậ
– Sau đó, nh n d ng các singletons ph bi n (v i ví d ụ ổ ế ớ
này là t ầ c t o l p. ạ ậ t c ) ấ ả
ừ ứ ạ
– T các episodes ph bi n này, t o các episodes ng AB, BA, AC, CA, AD, DA, BC, ổ ế c là 2: ướ
viên có kích th CB, BD, DB, CD, DC
31
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
Tìm t t c các episodes tu n t Tìm t t c các episodes tu n t
ấ ả ấ ả
ả
(2/3): (2/3): ượ
ể ạ ụ
c đ t o xu t ấ AB episodes con, có tên là A và
ư
ủ A (30-30), và tìm xu t ấ ầ
ệ hi n đ u tiên theo sau
ầ ự ầ ự – Sau đó, dùng b ng đ o ng ả hi n nh nh t cho các ng viên. Ví d cho ỏ ứ ấ ệ t c các nh n t ậ ấ ả mo(AB) nh sau: B, r i tính ồ • Đ c xu t hi n đ u tiên c a ấ ọ ầ ệ
• Sau đó l y xu t hi n th hai c a ủ A (60-60) và tìm ệ ấ ấ
B (40-40) ứ B (70-70) xu t hi n đ u tiên sau ầ
ệ • R i ti p t c v i ấ ồ ế ụ ớ BA
32
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
Tìm t Tìm t (3/3): (3/3): t c các episodes tu n t t c các episodes tu n t ấ ả ấ ả
ấ
– Trong giai đo n nh n d ng, chúng ta tìm t ậ ạ ứ
ầ ầ ạ ổ ế c 3. L n n a, h u nh t ữ ư ấ ả ứ ề
– Cu i cùng, th t c t ng t ầ ự ầ ự t c ả ạ episodes ph bi n và t o các episodes ng viên có kích t c các ng viên đ u ph th ổ ướ bi n.ế ố ự ượ ặ
ủ ụ ươ c là 4 và tìm đ đ ượ ứ ả ướ
– Không tìm th y các ng viên có kích th c 5, do v y c l p cho các ng viên có kích th c các episodes x y ra là DCAB trong 10-40, DABC trong 50-80, CABD trong 20- 50, CBDA trong 20-60, và BDAC trong 40-80 ướ ứ ậ ấ
thu t toán k t thúc. ế ậ
33
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
i thi u Các xu t hi n (tu n t ể i thi u Các xu t hi n (tu n t ể + các t n su t trong d li u ví d ụ + các t n su t trong d li u ví d ụ
) t ầ ự ố ) t ầ ự ố ữ ệ ữ ệ
ệ ệ ấ ấ
ấ ấ ầ ầ
34
IF
D A
THEN C WITH [40] [40] 0.50 (1/2) [20] [40] 1.00 (1/1) D IF THEN C WITH [0] [10] 0.00 (0/2) [0] [20] 0.50 (1/2) [0] [40] 1.00 (2/2)
IF
THEN
D C A B IF D THEN A C
WITH [40] [40] 0.50 (1/2) [30] [40] 1.00 (1/1) WITH [0] [10] 0.00 (0/2) [0] [40] 0.50 (1/2)
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
35
4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ
IF
• D i đây là xu t hi n t ậ
ệ ố ữ ệ
D A B
i thi u ể ấ ướ c a các lu t trong d li u ví ủ d : ụ
THEN C WITH [40] [40] 0.50 (1/2) [30] [40] 1.00 (1/1)
DAB, DCAB
DC
DC, DAC, DABC
D C A B D A B C
0 10 20 30 40 50 60 70 80 90
DA
DA
DAB
36
K T LU N K T LU N Ậ Ậ Ế Ế
Khai phá lu t Episode: ậ Khai phá lu t Episode: ậ
ỹ ậ ự ậ ế ợ
ng th i gian ờ ướ
ế ế
t – D a trên k thu t lu t k t h p – D li u h ữ ệ Hai cách ti p c n: ậ Hai cách ti p c n: ậ ớ ử
– WINEPI v i c a s tr ổ ượ – MINEPI v i vi c tìm s xu t hi n nh nh t ấ ớ ệ ự ệ ấ ỏ
Các ti p c n đ ế Các ti p c n đ ế ậ ậ ượ ượ c dùng cho các m c tiêu khác nhau ụ c dùng cho các m c tiêu khác nhau ụ