1
LU T K T H P
(Association Rules)
Ch ng 2ươ
2
01/18/13 www.lhu.edu.vn
Phân tích vi c
Phân tích vi c
mua hàng c a
mua hàng c a
khách hàng b ng
khách hàng b ng
cách tìm ra nh ng
cách tìm ra nh ng
“m i k t h p” gi a ế
“m i k t h p” gi a ế
nh ng m t hàng
nh ng m t hàng
mà khách đã mua.
mà khách đã mua.
Bài toán đ c ượ
Bài toán đ c ượ
Agrawal thu c
Agrawal thu c
nhóm nghiên c u
nhóm nghiên c u
c a IBM đ a ra ư
c a IBM đ a ra ư
vào năm 1994.
vào năm 1994.
Bài toán phân tích gi ng
Bài toán phân tích gi ng
3
Lu t k t h p: C s ế ơ
Lu t k t h p: C s ế ơ
Khai phá lu t k t h p: ế
Khai phá lu t k t h p: ế
Tìm t n s m u, m i k t h p, s t ng quan, hay các c u ế ươ
trúc nhân qu gi a các t p đ i t ng trong các c s d ượ ơ
li u giao tác, c s d li u quan h , và nh ng kho thông tin ơ
khác.
Tính hi u đ c: ượ
Tính hi u đ c: ượ d hi u
Tính s d ng đ c: ượ
Tính s d ng đ c: ượ Cung c p thông tin thi t th c ế
Tính hi u qu :
Tính hi u qu : Đã có nh ng thu t toán khai thác hi u
qu
Các ng d ng:
Các ng d ng:
Phân tích bán hàng trong siêu th , cross-marketing, thi t k ế ế
catalog, loss-leader analysis, gom c m, phân l p, ...
4
Đ nh d ng th hi n đ c tr ng cho các lu t k t h p: ư ế
Đ nh d ng th hi n đ c tr ng cho các lu t k t h p: ư ế
khăn bia [0.5%, 60%]
mua:khăn mua:bia [0.5%, 60%]
N uế mua khăn thì mua bia trong 60% tr ng h p. Khăn và ườ
bia đ c mua chung trong 0.5% dòng d li u."ượ
Các bi u di n khác:
Các bi u di n khác:
mua(x, “khăn") mua(x, “bia") [0.5%, 60%]
khoa(x, "CS") ^ hc(x, "DB") đi m(x, "A") [1%, 75%]
Lu t k t h p: C s ế ơ
Lu t k t h p: C s ế ơ
5
khăn bia [0.5%, 60%]
Lu t k t h p: C s ế ơ
Lu t k t h p: C s ế ơ
Ti n đ
Ti n đ , v trái lu tế
M nh đ k t qu ế
M nh đ k t qu ế , v ph i lu t ế
Support
Support, đ h tr / ng h (“trong bao nhiêu ph n trăm d
li u thì nh ng đi u v trái và v ph i cùng x y ra") ế ế
Confidence
Confidence, đ m nh (“n u v trái x y ra thì có bao nhiêu ế ế
kh năng v ph i x y ra") ế
N U mua khăn
T mua bia
trong 60% tr ng h pườ
trên 0.5%ng d li u"
1 2 3 4