Ch

ng 3:

ươ

Dãy ph bi n Dãy ph bi n

ổ ế ổ ế

1

Ch Ch

ng 3: Dãy ph bi n ng 3: Dãy ph bi n

ươ ươ

ổ ế ổ ế

1. CÁC KHÁI Ni M C B N 1. CÁC KHÁI Ni M C B N Ơ Ả Ơ Ả Ệ Ệ

Lu t k t h p mô t Lu t k t h p mô t

các s ki n xu t hi n cùng các s ki n xu t hi n cùng

ự ệ ự ệ

ệ ệ

ấ ấ

ả ả ữ ệ ữ ệ

ẩ ẩ

ậ ế ợ ậ ế ợ nhau trong d li u nhau trong d li u – Ví d : "IF khách hàng mua s n ph m A v i s ớ ố ụ ng 10 THEN s mua s n ph m B v i s ớ ố ng 20.

l ượ l ượ

ả ả

quan h th i gian ệ ờ quan h th i gian ệ ờ

ậ ậ

ổ ế ổ ế

Các lu t dãy ph bi n mô t Các lu t dãy ph bi n mô t ự ệ ự ệ

ữ ữ

ẩ ế

2

gi a các s ki n gi a các s ki n – Ví d : IF hôm nay khách hàng mua s n ph m A THEN sau 1 tu n khách hàng s mua ti p s n ph m B và C” ả

ạ ự ệ

– T p ậ R các lo i s ki n. – M iỗ s ki n là m t c p

ộ ặ (A, t), v i ớ

1. CÁC KHÁI Ni M C B N (tt) Ệ 1. CÁC KHÁI Ni M C B N (tt) Ệ Ơ Ả Ơ Ả

ự ệ ệ

ự ệ R là lo i ạ s ki n (ví d lo i tín hi u báo đ ng ) ụ ạ ờ

• A ˛ • t là m t s nguyên xác đ nh th i đi m xu t hi n ộ ệ ể ấ ị

ộ ố ự ệ

ộ (s, Ts, Te) Te là th i đi m k t thúc ể ờ

c a s ki n ủ ỗ ự ệ S trên R là b ba – Chu i s ki n ắ ầ ờ ế

ớ ọ • Ts là th i đi m b t đ u và ể • Ts < Te là các s nguyên ố • S = Æ (A1, t1), (A2, t2), …, (An, tn) æ • Ai ˛ R và Ts £ ti < Te v i m i i=1, …, n`

3

1. CÁC KHÁI NI M C B N (tt) Ệ 1. CÁC KHÁI NI M C B N (tt) Ệ Ơ Ả Ơ Ả

Ví d chu i s ki n: Ví d chu i s ki n: ỗ ự ệ ỗ ự ệ ụ ụ

D C A B D A B C A D C A B D A

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150

– A, B, C, D: là các lo i s ki n

ạ ự ệ

– 10…150 là các th i đi m x y ra s ki n ờ

ự ệ

– S = Æ (D, 10), (C, 20), …, (A, 150) æ

ắ ầ

ế

– Ts (th i đi m b t đ u) = 10 and

Te (th i đi m k t thúc) =

150

• Trong đó Trong đó::

4

2. DÃY PH Bi N TRONG M T CHU I (Episode) 2. DÃY PH Bi N TRONG M T CHU I (Episode) Ổ Ế Ổ Ế Ộ Ộ Ỗ Ỗ

Episodes: Episodes:

)

– Episode là c p (ặ V, £ ậ

• V là t p h p các lo i s ki n,ví d lo i tín hi u báo ợ ạ ự ệ ụ ạ ệ

đ ngộ

" £ là th t riêng ph n trên V ứ ự

ế

a = (V, £ ) S n u các lo i s ki n ạ ự ệ c xác

S theo th t

– Cho chu i ỗ S các s ki n, episode ạ ệ

đ ứ ự ượ

x y ra trong ph m vi ả trong V xu t hi n trong ấ đ nh b ng quan h th t

. ệ ứ ự

ầ ự ệ

5

2. DÃY PH Bi N TRONG M T CHU I (Episode) 2. DÃY PH Bi N TRONG M T CHU I (Episode) Ổ Ế Ổ Ế Ộ Ộ Ỗ Ỗ

ổ ụ ổ ụ

ư ư

riêng ph n ph d ng nh : riêng ph n ph d ng nh : toàn ph n toàn ph n ị ừ ủ

ứ ự ố ị

Các th t ứ ự Các th t ứ ự – Th t Th t ứ ự ứ ự • Các v t • Các episodes nh v y đ

c a m i episode có th t c g i là ọ

ầ ầ ầ ầ ỗ ư ậ

ượ c đ nh tu n tầ ự (hay

riêng ph n hi n nhiên ể ầ riêng ph n hi n nhiên ể ầ c a các v t ị ừ song song (hay c g i là ọ

ượ

“có th t ") ứ ự – Các th t Các th t ứ ự ứ ự • Không xét tr t t ậ ự ủ • Các episodes này đ “không có th t ") ứ ự

6

2. DÃY PH Bi N TRONG M T CHU I (Episode) 2. DÃY PH Bi N TRONG M T CHU I (Episode) Ổ Ế Ổ Ế Ộ Ộ Ỗ Ỗ

Ví d :ụVí d :ụ

A

A

B

A

C

B

B

ầ ự

Episode v a tu n t ừ v a song song ừ

Episode tu n t ầ ự

Episode song song

7

3. THU T TOÁN WINEPI 3. THU T TOÁN WINEPI Ậ Ậ

ng pháp WINEPI xu t phát t ng pháp WINEPI xu t phát t

Tên c a ph ủ Tên c a ph ủ

ươ ươ

ấ ấ

ừ ừ

ổ ổ

ử ử

k thu t dùng c a s tru t ợ ỹ k thu t dùng c a s tru t ợ ỹ ậ – C a s đ

c tr

ổ ượ

ượ

t qua chu i d li u các s ự ỗ ữ ệ

ậ ậ ậNh n xét: Nh n xét: ử ki nệ

– M i c a s là m t “khung nh" gi ng nh m t

ư ộ

ỗ ử

dòng c a CSDL ủ

– T p các “khung nh" t o thành các dòng c a ạ

ậ CSDL

8

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

Ví d chu i d li u s ki n: ỗ ữ ệ Ví d chu i d li u s ki n: ỗ ữ ệ

ự ệ ự ệ

ụ ụ

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

• B r ng c a s là 40 giây B r ng c a s là 40 giây ử ổ ử ổ • C a s đ u/cu i ch ch a s ki n đ u/cu i C a s đ u/cu i ch ch a s ki n đ u/cu i ỉ ố ỉ ố

ề ộ ề ộ ử ổ ầ ử ổ ầ

ứ ự ệ ứ ự ệ

ố ố

ầ ầ

9

ạ ự ệ

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

ỗ ự ệ S S = = chu i s ki n các s ki n ự ệ eventi ọ i=1, …, n-1, và

eventi+1 v i m i ớ

Cho t p ậ E các lo i s ki n, ((ss,,TTss,T,Tee)) là m t chu i có th t ứ ự ộ sao cho eventi £ ớ Ts £ ọ i=1, …, n

eventi < Te v i m i

event1 event2 event3 … … eventn

Ts Te

t1 t2 t3 … … tn

10

là chu i s ki n

ỗ ự ệ ứ

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

chu i s ki n S ử ổ trêntrên chu i s ki n S C a s ỗ ự ệ C a s ỗ ự ệ ử ổ Sw=(w,ts,te), v i ớ ts < Te, te > Ts, và w ch a các c p t < te (event, t) c a s mà

ts £ c g i là b r ng c a s ề ộ ọ

ổ W

ượ

Giá tr ị ts £

t < te đ

event1 event2 event3 … … eventn

Ts Te

t1 t2 t3 tn

WWttss

ttee

11

ổ ầ ố

ố ử ổ

ậ ử

ơ ứ

Theo đ nh nghĩa, c a s đ u và cu i trên chu i có ổ ầ th vu n ra ngoài chu i, do v y c a s đ u tiên ỗ ch ch a th i đi m đ u và c a s cu i cùng ch ỉ ch a th i đi m cu i ố

ể ỉ ứ

ờ ể

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

event1 event2 event3 … … eventn

Ts Te

t1 t2 t3 tn

WWttss

WWttss

ttee

ttee

12

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

T n su t (đ h tr v i lu t k t h p) c a

ộ ỗ ợ ớ ầ episode a là t ỷ ố ữ hi n v i t ng s các c a s kh dĩ.

ậ ế ợ s gi a các c a s có xu t ử ố

ớ ổ

xu t hi n trong ệ

|Sw ˛

Sw |

W(S, W) | a

fr(a

, S, W) =

|W(S, W)|

ổ w c a ủ

t c các c a s S V i ớ W(S, W) là t p t chu i S sao cho b r ng c a s là W

ậ ấ ả ề ộ

ử ổ

13

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

ng

Khi tìm episodes c n s d ng m t ng ầ

ử ụ

ưỡ

t n su t ầ

ấ min_fr Episode a là ph bi n

ổ ế n u ế fr(a , s, win) ‡

t quá ng

ượ

min_fr ấ ủ a v Ví d , “n u t n su t c a ng t n ầ ưỡ ế ầ ỗ ữ ệ s và su t nh nh t trong ph m vi chu i d li u ạ ấ ỏ ổ win" v i b r ng c a s ớ ề ộ

ổ ế

F(s, win, min_fr): t p h p các episodes ph bi n ợ ớ win và min_fr

ậ trong s ng v i ứ

ổ ế

Apriori: N uếN uế episode a là ph bi n trong chu i s ỗ ự Apriori: b  a là ph ổ t c các episodes con

ấ ả

ki n ệ s, thì t bi nế

14

(cid:222)

a

, v i ớ b

ứ b Lu t ậLu t ậ episode rule là bi u th c

ể các episodes sao cho b là episode con c a ủ a

bi u di n

và a  a ), n u đ th ồ ị ế .

Episode b ể

là episode con c a ủ a ễ a ễ b là đ th con c a đ th bi u di n ủ ồ ị

(b ồ ị ể

A

A

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

b :

:

C

B

B

g

15

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

Phân số

fr(a , S, W) fr(b , S, W) : t n su t c a toàn b episode : t n su t c a episode v trái ấ ủ ấ ủ ầ ầ ế

a

là đ tin c y c a lu t ậ ủ ộ ậ b (cid:222)

Đ tin c y đ ượ ư ệ ậ

c ộ x y ra trong c a s khi cho tr ử ả ộ ủ a c xem nh xác su t đi u ki n c a toàn b c a ủ ề ấ ướ b x y ra trong c a s đó. ổ ử ả ổ

16

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

ậNh n xét: Nh n xét:

ậ – Các lu t WINEPI gi ng lu t k t h p nh ng có

ế

ư

ố th i gian: ề ỏ

ơ

ệ ị

ầ c mô t W đ n v th i gian.

ậ thêm y u t ế ố ờ N u s ki n th a v trái c a lu t xu t hi n theo ệ ế ự ệ W đ n v th i gian, bên ph i trong ph m vi th t ị ờ ạ ứ ự thì cũng xu t hi n trong ph n k t lu n (v ph i ) ả ế ế ấ xu t hi n trong v trí đ b i quan h th ệ ứ ả ở ấ ự £ , trong ph m vi t

ượ ơ

ị ờ

17

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

ỗ ự ệ Input: T p ậ R các lo i s ki n Input trên R, t p ậ E

ạ ự ệ , chu i s ki n S ổ win, và ngu ng t n su t ỡ ử ấ ầ ề ộ

các episodes, b r ng c a s min_fr

ậ ợ F(s, win, min_fr)

Output: T p h p Output Method: Method

| = 1}; ˛ E | |a

„ do

˛ , s, win) ‡ Ck | fr(a min_fr}; //Quét CSDL

|(s, win, min_fr) // t o ng

˛ E | |a cho t F|b  a ạ ứ | = k, and b ˛ E và b ấ ả b ˛ t c

18

1.Tính C1 := {a 2. k := 1; ˘ 3.while Ck 4. Tính F(s, win, min_fr) = {a 5. k := k+1; 6. Tính Ck= {a viên 7. End While

ỗ ự ệ ộ ầ

ỗ ệ ổ

ấ ử

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

Bài toán: cho chu i s ki n và episode, xác đ nh ệ episode có xu t hi n trong chu i s ki n đó không. Tìm s các c a s có ch a m t l n xu t hi n c a ứ episode.

Cách x lý?

ậ ế ợ

h p c a hai episodes có

ng lu t k t h p ổ ợ

kích th

ử – Gi ng ý t ưở ố – Episode ng viên là t ứ c nh h n ướ

ỏ ơ

– Các episodes song song, episodes tu n tầ ự

19

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

Ví d chu i d li u s ki n: ỗ ữ ệ Ví d chu i d li u s ki n: ỗ ữ ệ

ự ệ ự ệ

ụ ụ

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

ớ ớ

ể ể

• B r ng c a s là 40 giây, bu c di chuy n là 10 giây B r ng c a s là 40 giây, bu c di chuy n là 10 giây • Chi u dài c a chu i là 70 (10-80) Chi u dài c a chu i là 70 (10-80)

ử ổ ử ổ ủ ủ

ề ộ ề ộ ề ề

ỗ ỗ

20

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

B ng cách tr B ng cách tr t c a s , chúng ta có 11 c a s (U t c a s , chúng ta có 11 c a s (U ằ ằ ượ ử ổ ượ ử ổ ử ổ 11-U-U1111):): ử ổ

U2

U1 U11

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

c n đ nh là 40%, ví d episode x y c n đ nh là 40%, ví d episode x y

ị ị

ụ ụ

ả ả

• Ngu ng t n s đ Ngu ng t n s đ ầ ầ ra t ể ra t ể

ỡ ỡ i thi u trong 5 c a 11 c a s . ử ổ ố i thi u trong 5 c a 11 c a s . ử ổ ố

ố ượ ấ ố ượ ấ ủ ủ

21

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

WINEPI Approach WINEPI Approach

22

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

Gi Gi ấ ả ấ ả

s c n tìm t ả ử ầ s c n tìm t ả ử ầ – Đ u tiên, t o singletons, ví d episodes song song có ạ t c các episodes song song: t c các episodes song song: ụ ầ

– Ti p đ n nh n d ng các singletons ph bi n ( đây ổ ế ở ậ (A, B, C, D) ạ

kích thu c là 1 ớ ế t c ) ấ ả

– T các episodes ph bi n này, t o các episodes ng ế là t ừ ứ ạ

AB, AC, AD, BC, BD, CD

– Ti p đ n nh n d ng các episodes song song ph ổ

viên có kích th ậ ế bi n( đây là t ổ ế c là 2: ướ ạ t c ) ấ ả

– T các episodes ph bi n này, t o các episodes ph ổ ạ

ổ ế c là 3: ABC, ABD, ACD, BCD ướ ế ế ở ừ ế

ạ ổ ế ỉ

bi n có kích th ậ ệ – Khi nh n d ng các episodes ph bi n, ch có ABD ử xu t hi n trong h n 4 c a s ổ ấ

ơ – Không có episodes ng viên có kích th c là 4. ướ ứ

23

3. THU T TOÁN WINEPI (tt) 3. THU T TOÁN WINEPI (tt) Ậ Ậ

T n su t Episode và các lu t ví d v i WINEPI: T n su t Episode và các lu t ví d v i WINEPI:

ụ ớ ụ ớ

ấ ấ

ậ ậ

ầ ầ

D (cid:222) A [40] (55%, 75%)

D C A B D C D A D B C A C B A B D A B : 73% : 73% : 64% : 64% : 45% : 55% : 45% : 45% : 45% : 55% : 45% D A (cid:222) B [40] (45%, 82%)

24

4. THU T TOÁN MINEPI 4. THU T TOÁN MINEPI Ậ Ậ

ậ ậ

ế ế

M t cách ti p c n khác đ khám phá episodes ộ ể M t cách ti p c n khác đ khám phá episodes ộ ể – Không dùng c a s tr t ổ ượ – Đ i v i t ng episode quan tâm ti n năng, tìm

i: i: i h n th i gian cho m t lu t : ớ ạ

ủ i h n th i gian, ờ ớ ạ ộ ạ

ố ớ ừ s l n xu t hi n chính xác c a episode. ệ ấ ố ầ ệ ợ d s a đ i các gi Các ti n l ễ ử Các ti n l ệ ợ nhi u gi ờ ề “N u ế A và B x y ra trong ph m vi 15 giây, thì ả C s theo sau trong ph m vi 30 giây" ạ

ẽ ấ ệ dùng nhi u kho ng tr ng B t ti n: ề B t ti n: ấ ệ

25

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

Cho episode a và chu i s ki n ỗ ự ệ S, kho ng ả ấ a c a ủ S, [ts,te] là xu t hi n nh nh t ỏ ệ – N u ế a x y ra trong c a s ng v i kho ng ả ớ ổ ứ ử – N u ế a không x y ra trong b t kỳ kho ng con ấ

đúng nào ấ

c đ

a c ký

ướ

T p các xu t hi n nh nh t c a episode ấ ủ ệ ậ trong m t chu i s ki n cho tr ượ ỗ ự ệ hi u là mo

(a ):

nh nh t c a

mo(a ) = { [ts,te] | [ts,te] là s xu t hi n ỏ

ấ ủ a }

26

ạ ự ệ

ấ ộ ầ

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

Ví d :ụ Episode song song b ch a các lo i s ki n s là : A và B có ba l n xu t hi n nh nh t trong ệ ấ {[30,40], [40,60], [60,70]}, a có m t l n xu t hi n ệ ấ trong s là : {[60,80]}

A

A

b :

a :

C

B

B

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

27

ề ả

ợ ờ

ự ệ

ệ episode là b [win1] (cid:222) • Lu t ậ episode là

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

 a (b là episode

• Lu t Episode MINEPI cho xác su t đi u ki n đ t ể ổ h p các s ki n ( tín hi u báo đ ng) x y ra trong m t ộ ộ ệ ự ệ h p khác các s ki n c t th i kho ng khi cho tr ướ ổ ợ khác đã xu t hi n trong th i kho ng ả ờ ấ a [win2] b và a là các episodes sao cho b con c a ủ a ) • N u episode

ế

"

£

ấ win1, thì episode a ớ

[ts,te] v i ớ te - ts kho ng [ ứ ả

b có xu t hi n nh nh t trong kho ng x y ra trong win2

ả t'e sao cho t'e - ts

ts,t'e] ng v i vài

£

28

a [win2] là xác su t ấ ướ b x y raả i ướ , d c ch đ nh b i các ở ị

c ỉ

ậ b [win1] (cid:222) Đ tin c y c a lu t ậ ộ ủ ể a x y ra khi cho tr đi u ki n đ ả ệ các ràng bu c th i gian đ ượ ộ lu t:ậ

|mo(a )| / |mo(b )|

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

ư ế

v i ớ |mo(b )| là s các xu t hi n nh nh t [ ấ ts,te] ỏ c a ủ b sao cho te - ts win1 và |mo(a )| là s các ố xu t hi n nh th và cũng có m t xu t hi n c a ấ a trong ph m vi kho ng ạ

ộ [ts,ts+win2]

£

29

ậ b [win1] (cid:222)

a [win2] là |mo(a )|,

T n su t c a lu t ấ ủ ỏ

ầ v i s l n lu t th a trong CSDL ớ ố ầ Xét ví d :ụ Xét ví d :ụ

– Bài toán: tìm t

t c các episodes tu n t

ấ ả ờ ử ầ

ả ổ ấ

ưỡ

ượ

ự b ng cách dùng th i kho ng c c đ i là 40 giây và kích thu c c a s là 10, 20, 30 and ớ c gán cho ng t n su t đ 40 giây Ng m t l n xu t hi n. ệ ấ

ộ ầ

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

30

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

Tìm t t c các episodes tu n t Tìm t t c các episodes tu n t

(1/3): (1/3):

– Đ u tiên, t o singletons, ví d episodes có kích th c ạ ướ

ầ ự ầ ự ụ

ấ ả ấ ả ầ

là 1 (A, B, C, D)

ạ ạ ả ấ

ệ ầ ầ

ả ả

– Trong khi t o singletons, chúng ta cũng t o b ng xu t hi n cho chúng. Sau l n quét CSDL đ u tiên, chúng ta không c n quét CSDL n a mà dùng các b ng đ o ữ ng c đ ượ ượ ạ ậ

– Sau đó, nh n d ng các singletons ph bi n (v i ví d ụ ổ ế ớ

này là t ầ c t o l p. ạ ậ t c ) ấ ả

ừ ứ ạ

– T các episodes ph bi n này, t o các episodes ng AB, BA, AC, CA, AD, DA, BC, ổ ế c là 2: ướ

viên có kích th CB, BD, DB, CD, DC

31

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

Tìm t t c các episodes tu n t Tìm t t c các episodes tu n t

ấ ả ấ ả

(2/3): (2/3): ượ

ể ạ ụ

c đ t o xu t ấ AB episodes con, có tên là A và

ư

ủ A (30-30), và tìm xu t ấ ầ

ệ hi n đ u tiên theo sau

ầ ự ầ ự – Sau đó, dùng b ng đ o ng ả hi n nh nh t cho các ng viên. Ví d cho ỏ ứ ấ ệ t c các nh n t ậ ấ ả mo(AB) nh sau: B, r i tính ồ • Đ c xu t hi n đ u tiên c a ấ ọ ầ ệ

• Sau đó l y xu t hi n th hai c a ủ A (60-60) và tìm ệ ấ ấ

B (40-40) ứ B (70-70) xu t hi n đ u tiên sau ầ

ệ • R i ti p t c v i ấ ồ ế ụ ớ BA

32

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

Tìm t Tìm t (3/3): (3/3): t c các episodes tu n t t c các episodes tu n t ấ ả ấ ả

– Trong giai đo n nh n d ng, chúng ta tìm t ậ ạ ứ

ầ ầ ạ ổ ế c 3. L n n a, h u nh t ữ ư ấ ả ứ ề

– Cu i cùng, th t c t ng t ầ ự ầ ự t c ả ạ episodes ph bi n và t o các episodes ng viên có kích t c các ng viên đ u ph th ổ ướ bi n.ế ố ự ượ ặ

ủ ụ ươ c là 4 và tìm đ đ ượ ứ ả ướ

– Không tìm th y các ng viên có kích th c 5, do v y c l p cho các ng viên có kích th c các episodes x y ra là DCAB trong 10-40, DABC trong 50-80, CABD trong 20- 50, CBDA trong 20-60, và BDAC trong 40-80 ướ ứ ậ ấ

thu t toán k t thúc. ế ậ

33

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

i thi u Các xu t hi n (tu n t ể i thi u Các xu t hi n (tu n t ể + các t n su t trong d li u ví d ụ + các t n su t trong d li u ví d ụ

) t ầ ự ố ) t ầ ự ố ữ ệ ữ ệ

ệ ệ ấ ấ

ấ ấ ầ ầ

34

IF

D A

THEN C WITH [40] [40] 0.50 (1/2) [20] [40] 1.00 (1/1) D IF THEN C WITH [0] [10] 0.00 (0/2) [0] [20] 0.50 (1/2) [0] [40] 1.00 (2/2)

IF

THEN

D C A B IF D THEN A C

WITH [40] [40] 0.50 (1/2) [30] [40] 1.00 (1/1) WITH [0] [10] 0.00 (0/2) [0] [40] 0.50 (1/2)

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

35

4. THU T TOÁN MINEPI (tt) 4. THU T TOÁN MINEPI (tt) Ậ Ậ

IF

• D i đây là xu t hi n t ậ

ệ ố ữ ệ

D A B

i thi u ể ấ ướ c a các lu t trong d li u ví ủ d : ụ

THEN C WITH [40] [40] 0.50 (1/2) [30] [40] 1.00 (1/1)

DAB, DCAB

DC

DC, DAC, DABC

D C A B D A B C

0 10 20 30 40 50 60 70 80 90

DA

DA

DAB

36

K T LU N K T LU N Ậ Ậ Ế Ế

Khai phá lu t Episode: ậ Khai phá lu t Episode: ậ

ỹ ậ ự ậ ế ợ

ng th i gian ờ ướ

ế ế

t – D a trên k thu t lu t k t h p – D li u h ữ ệ Hai cách ti p c n: ậ Hai cách ti p c n: ậ ớ ử

– WINEPI v i c a s tr ổ ượ – MINEPI v i vi c tìm s xu t hi n nh nh t ấ ớ ệ ự ệ ấ ỏ

Các ti p c n đ ế Các ti p c n đ ế ậ ậ ượ ượ c dùng cho các m c tiêu khác nhau ụ c dùng cho các m c tiêu khác nhau ụ

37