Trang chủ » Công Nghệ Thông Tin » Kỹ thuật phần mềm

47 trang

241 lượt xem

Khai Phá Dữ Liệu-Phát hiện các luật kết hợp

Với một tập các giao dịch transactions) cho trước, cần ộ ập g ị ( ) , n tìm các luật dự đoán khả năng xuất hiện trong một giao dịch của các mục (items) này dựa trên việc xuất hiện của các mục khác

Chủ đề:

phuonggm

Khai phá dữ liệu

Khai Phá Dữ Liệu

Nguyễn Nhật Quang

quangnn-fit@mail.hut.edu.vn

Viện Công nghệ Thông tin và Truyền thông

Trường Đại học Bách Khoa Hà Nội

Năm học 2010-2011

Nội dung môn học:

Giới thiệu về Khai phá dữ liệu

ề

Giới thiệu v

ề

công cụ WEK

Tiền xử lý dữ liệu

Phát hiện các luật kết hợp



Các kỹthuật phân lớpvàdự đoán



Các

kỹ

thuật

phân

lớp

và

dự

đoán

Các kỹ thuật phân nhóm

Khai Phá Dữ Liệu

Phát hiện các luật kết hợp – Giới thiệu

Bài toán phát hiện luật kết hợp (Association rule mining)

Với m

ộ

t t

ập

các

iao d

ị

(

transactions

)

cho trước

cần tìm các

ộ ậpgị(),

luật dự đoán khả năng xuất hiện trong một giao dịch của các mục

(items) này dựa trên việc xuất hiện của các mục khác

TID Items

1 Bread, Milk

Các ví dụ của luật kết hợp:

{Diaper}

→

{Beer}

2 Bread, Diaper, Beer, Eggs

3 Milk, Diaper, Beer, Coke

Bread, Milk,

Diaper

Beer

{Diaper}

→

{Beer}

{Milk, Bread} →{Eggs, Coke}

{Beer, Bread} →{Milk}

Bread,

Milk,

Diaper

Beer

5 Bread, Milk, Diaper, Coke

Khai Phá Dữ Liệu

Các định nghĩa cơbản (1)

Tập mục (Itemset)

Một tập hợp gồm một hoặc nhiều mục

Ví dụ: {Milk, Bread, Diaper}

Tập mục mức k(k-itemset)

Một tập mục gồm kmục

ổ ố ỗ (S )

TID Items

1 Bread, Milk

Bread Diaper Beer Eggs

T

ổ

ng s

ố

ỗ

trợ

upport count

)

Số lần xuất hiện của một tập mục

Ví dụ: σ({Milk, Bread, Diaper}) = 2

Bread

Diaper

Beer

Eggs

Milk, Diaper, Beer, Coke

Bread, Milk, Diaper, Beer

Bread Milk Diaper Coke



ộ hỗ trợ (Support) s

Tỷ lệ các giao dịch chứa một tập mục

Ví dụ: s({Milk, Bread, Diaper}) = 2/5

Bread

Milk

Diaper

Coke

Tập mục thường xuyên

(Frequent/large itemset)

Một tập mục mà độ hỗ trợ lớn hơn

hoặc bằng một giá trị ngưỡng minsup

Khai Phá Dữ Liệu

Các định nghĩa cơbản (2)

Luật kết hợp (Association

rule)

ể

TID Items

1 Bread, Milk

Một bi

ể

u thức kéo theo có

dạng: X →Y, trong đó X và Y

là các tập mục



Ví dụ: {Milk Diaper}

→

{Beer}

Bread, Diaper, Beer, Eggs

Milk, Diaper, Beer, Coke

Bread, Milk, Diaper, Beer



Ví

dụ:

{Milk

Diaper}

→

{Beer}

Các độ đo đánh giá luật



Độ

hỗ tr

ợ

(

ort

)

Beer

}

Diaper

Milk

{

→

Bread, Milk, Diaper, Coke

ộ ợ (pp)

Tỷ lệ các giao dịch chứa cả

X và Y đối với tất cả các

giao dịch

Beer

}

Diaper

Milk

{

→

4.0

)Bee

Diaper,,Milk( ===



ộ tin cậy (Confidence) c

Tỷ lệ các giao dịch chứa cả

X và Y đối với các giao dịch

chứaX

67.0

)Diaper,Milk(

)BeerDiaper,Milk,( ===

chứa

Khai Phá Dữ Liệu

Khai Phá Dữ Liệu-Phát hiện các luật kết hợp

Với một tập các giao dịch transactions) cho trước, cần ộ ập g ị ( ) , n tìm các luật dự đoán khả năng xuất hiện trong một giao dịch của các mục (items) này dựa trên việc xuất hiện của các mục khác

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi