LUẬT KẾT HỢP
(Association Rules)
LUẬT KẾT HỢP
(Association Rules)
Chương 2
Phân loại luật kết hợp
4
Khái niệm cơ bản
1
Thuật toán Apriori
2
Tìm tập phbiến tối đại với FP-Tree
3
Tối ưu tập luật
5
Nội dung
7/12/2014 www.lhu.edu.vn
Các khái niệm bản
Phân ch thói quen mua
hàng của khách hàng
bằng cách m ra nhng
“mối kết hợp” giữa
những mặt hàng mà
khách đã mua
Mục tiêu giúp gia ng
doanh số, tạo thun lợi
cho khách khi mua hàng
trong siêu th
Bài toán được Agrawal
thuộc nhóm nghiên cứu
của IBM đưa ra vào năm
1994
i toán phân tích giỏ hàng
7/12/2014 www.lhu.edu.vn
Các khái niệm bản
Khai pluật kết hợp:
Tìm tần số mẫu, mối kết hợp, sự tương quan, hay các cấu trúc
nhân qugiữa các tập đối tượng trong các cơ sở dữ liệu giao
tác, sở dữ liệu quan hệ, và những kho thông tin khác.
nh hiểu được: dễ hiểu
nh sử dụng được: Cung cấp thông tin thiết thực
nh hiệu quả: Đã có những thuật toán khai thác hiệu
quả
c ứng dụng:
Phân ch bán hàng trong siêu thị, cross-marketing, thiết kế
catalog, loss-leader analysis, gom cụm, phân lớp, ...
Luật kết hợp
Định dạng thể hiện đặc trưng cho c luật kết
hợp:
khăn bia [0.5%, 60%]
mua:khăn mua:bia [0.5%, 60%]
Nếu mua khăn thì mua bia trong 60% trường hợp. Khăn và
bia được mua chung trong 0.5% dòng dữ liệu."
c biểu diễn khác:
mua(x, “khăn") mua(x, “bia") [0.5%, 60%]
khoa(x, "CS") ^ học(x, "DB") điểm(x, "A") [1%, 75%]
Các khái niệm bản
Luật kết hợp
khăn bia [0.5%, 60%]
1Tiền đề, vế trái luật
2Mệnh đề kết quả, vế phải luật
3Support, tần số, độ hỗ trợ (“trong bao nhiêu phần trăm dữ liệu thì
những điều ở vế trái và vế phải cùng xảy ra")
4Confidence, độ mạnh, độ tin cậy (“nếu vế trái xảy ra thì có bao nhiêu
khả năng vế phải xảy ra")
NẾU mua khăn
THÌ mua bia
trong 60% trường hợp
trên 0.5% số dòng dữ liệu"
12 3 4
Các khái niệm bản
Luật kết hợp