MẪU THƯỜNG XUYÊN,
LUẬT KẾT HỢP
Phan Hiền
XÂY DỰNG HỆ
KHAI MỎ DỮ LIỆU
KHÁI QUÁT
Đây là phương pháp khai mỏ dựa trên độ
lặp lại thường xuyên của mẫu tin nào đó.
Xác định quy luật quan hệ giữa các
thuộc tính (phần tử) trong mẫu tin đó.
Lấy ví dụ: Trong vô số khách ng mua
hàng của siêu thị, nhà quản lý đặt ra vấn
đề là các giỏ hàng thường xuyên có các
món hàng gì.
KHÁI QUÁT
Ta nhận thấy thường người dùng mua áo đầm
mua nón kiểu.
mua áo đầm mua nón kiểu
(Hỗ trợ là 0.2 và độ tin là 0.8)
Ta có thể nói như sau: Chỉ có 20% số người
mua áo đầm và nón kiểu trên toàn bộ người
mua. Nhưng trong số tất cả người mua áo
đầm, có 80% người mua kèm nón kiểu.
Quan tâm đến 2 khái niệm độ tin & hỗ trợ
KHÁI NIỆM
Tập giá trị (ItemSet) I = {I1,I2,…,In}
Giao tác (Transaction) T = {Ik,..,Ih} con của I.
Luật kết hợp AB
A con I, B con I, và A,B cùng thuộc vào T
Suy ra A
B hay B
A
Cho tập các sản phẩm I = {G,D,M}
T1 = {G,D} T4 = {M,D} Kết hợp G
D
T2 = {G,M,D} T5 = {M} Hỗ trợ : 2/5
T3 = {G} Độ tin : 2/3
Các giá trị trong ItemSet là cùng thuộc tính.
KHÁI NIỆM
Các giá trị trong ItemSet nhiều thuộc tính.
I = {X,.,W,.,Y,.} = {X1,…,Xn,… Wk,…, Y1,…, Ym}
Giao tác T con của I
Luật Xk
Yhnghĩa
Xk con của X, Yh con của Y, cùng T.
dụ: I = {Tuổi, màu}
Màu = {xanh, vàng, đỏ} Tuổi = {20,21,22}
Giao tác T ý nghĩa độ tuổi thích màu
T1={20,vàng} T2={21,vàng} T3={22,đỏ} T4={20,xanh} ,..