Trang chủ » Công Nghệ Thông Tin » Khoa học dữ liệu

60 trang

283 lượt xem

44

0

Bài giảng Nhập môn khai phá dữ liệu (PGS.TS. Hà Quang Thụy) - Chương 4: Khai phá luật kết hợp

Khai phá luệt kết hợp:  Tìm tất cả mẫu phổ biến, kết hợp, tương quan, hoặc cấu trú nhanquả trong tập các mục hoặc đối tượng trong CSDL quan hệ hoặc các kho chứa thông tin khác.  Mẫu phổ biến (Frequent pattern): là mẫu (tập mục, dãy mục…) mà xuất hiện phổ biến trong 1 CSDL [AIS93]

Chủ đề:

Khai phá dữ liệu

Bài giảng Khai phá dữ liệu

/

60

December 27, 2012 1

Chương 4:

Khai phá luật kết hợp

Dựa theo “Data Mining: Concepts and Techniques”

Chapter 6. Mining Association Rules in Large Databases

©Jiawei Han and Micheline Kamber

www.cs.uiuc.edu/~hanj

December 27, 2012 2

Chương 4: Khai phá luật kết hợp

Khai phá luật kết hợp (Association rule)

Các thuật toán khai phá vô hướng luật kết hợp (giá trị

lôgic đơn chiều) trong CSDL giao dịch

Khai phá kiểu đa dạng luật kết hợp/tương quan

Khai phá kết hợp dựa theo ràng buộc

Khai phá mẫu dãy

Ứng dụng/mở rộng khai phá mẫu phổ biến

December 27, 2012 3

Khái niệm cơ sở: Tập phổ biến và luật kết hợp

M t s ví d v ộ ố ụ ề “lu t k t h p” (associate rule)ậ ế ợ

•“98% khách hàng mà mua t p chí th thaoạ ể thì đ u ềmua

các t p chí v ôtôạ ề ”



s ựk t h pế ợ gi a ữ“t p chí th thaoạ ể ”

v i ớ“t p chí v ôtôạ ề ”

•“60% khách hàng mà mua bia t i siêu thạ ị thì đ u ềmua b m ỉ

tr em” ẻ



s ựk t h pế ợ gi a ữ“bia” v i ớ“b m tr emỉ ẻ ”

•“Có t i 70% ng i truy nh p Web vào đ a ch Url 1 thì ớ ườ ậ ị ỉ

cũng vào đ a ch Url 2 trong m t phiên truy nh p web” ị ỉ ộ ậ



s ựk t h pế ợ gi a ữ“Url 1” v i ớ“Url 2”. Khai phá d li u s ữ ệ ử

d ng Web (D li u t file log c a các site, ch ng h n ụ ữ ệ ừ ủ ẳ ạ

đ c MS cung c p). ượ ấ

•Các Url có g n v i nhãn “l p” là các đ c tr ng thì có lu t ắ ớ ớ ặ ư ậ

k t h p liên quan gi a các l p Url này.ế ợ ữ ớ

December 27, 2012 4

Khái niệm cơ sở: Tập phổ biến và luật kết hợp

[IV06] Renáta Iváncsy, István Vajk (2006). Frequent Pattern Mining in Web Log Data,

Acta Polytechnica Hungarica, 3(1):77-90, 2006

December 27, 2012 5

Khái niệm cơ sở: Tập phổ biến và luật kết hợp

C s d li u giao d ch (transaction database)ơ ở ữ ệ ị

•Giao d chị: danh sách các m t hàng (m c: item) trong m t phi u mua hàng ặ ụ ộ ế

c a khách hàng. Giao d ch T là m t t p m c.ủ ị ộ ậ ụ

•T p toàn b các m c I = {iậ ộ ụ 1, i2, …, ik} “t t c các m t hàng”. M t giao d ch ấ ả ặ ộ ị

T là m t t p con c a I: T ộ ậ ủ ⊆ I. M i giao d ch T có m t đ nh danh là Tỗ ị ộ ị ID.

• A là m t t p m c A ộ ậ ụ ⊆ I và T là m t giao d ch: G i T ch a A n u A ộ ị ọ ứ ế ⊆ T.

•Lu t k t h pậ ế ợ

•G i A ọ→ B là m t “lu t k t h p” n u A ộ ậ ế ợ ế ⊆ I, B ⊆ I và A∩B=∅.

•Lu t k t h p A ậ ế ợ → B có đ h tr (support) ộ ỗ ợ s trong CSDL giao d ch D n u ị ế

trong D có s% các giao d ch T ch a AB: chính là xác su t P(AB). T p m c ị ứ ấ ậ ụ

A có P(A) ≥ s>0 (v i s cho tr c) đ c g i là ớ ướ ượ ọ t p ph bi n (frequent set)ậ ổ ế .

Lu t k t h p A ậ ế ợ → B có đ tin c y (confidence) ộ ậ c trong CSDL D n u nh ế ư

trong D có c% các giao d ch T ch a A thì cũng ch a B: chính là xác su t ị ứ ứ ấ

P(B|A).

•Support (A → B) = P(A∪B) : 1 ≥ s (A → B) ≥ 0

•Confidence (A → B) = P(B|A) : 1 ≥ c (A → B) ≥ 0

•Lu t A ậ→ B đ c g i là đ m b o đ h tr s trong D n u s(A ượ ọ ả ả ộ ỗ ợ ế → B) ≥ s.

Lu t Aậ→B đ c g i là đ m b o đ tin c y c trong D n u c(A ượ ọ ả ả ộ ậ ế → B) ≥ c.

Tài liệu liên quan

Bài giảng Khai phá dữ liệu: Chương 5 - Phân lớp dữ liệu (mới nhất)

Bài giảng môn Khai phá dữ liệu: Chương 5 - Phân lớp dữ liệu

Bài giảng Khai phá dữ liệu: Phân cụm dữ liệu (Chương 4)

Bài giảng môn Khai phá dữ liệu: Chương 4 - Phân cụm dữ liệu

Luật kết hợp trong khai phá dữ liệu: Bài giảng chương 3

Bài giảng môn Khai phá dữ liệu: Chương 3 - Luật kết hợp

Bài giảng Khai phá dữ liệu: Tiền xử lý dữ liệu - Chương 2

Bài giảng môn Khai phá dữ liệu: Chương 2 - Tiền xử lý dữ liệu

Bài giảng Khai phá dữ liệu: Tổng quan về Khai phá dữ liệu - Chương 1

Bài giảng môn Khai phá dữ liệu: Chương 1 - Tổng quan về Khai phá dữ liệu

Bài giảng Khai phá dữ liệu - Chương 1: Tổng quan về khai phá dữ liệu

Bài giảng Khai phá dữ liệu - Chương 1: Tổng quan về khai phá dữ liệu

Bài giảng Khai phá dữ liệu - Chương 2: Tiền xử lý dữ liệu

Bài giảng Khai phá dữ liệu - Chương 2: Tiền xử lý dữ liệu

Phân lớp dữ liệu: Bài giảng Khai phá dữ liệu - Chương 4 (tt)

Bài giảng Khai phá dữ liệu - Chương 4 (tt): Phân lớp dữ liệu

Bài giảng Khai phá dữ liệu - Chương 4: Phân cụm dữ liệu

Bài giảng Khai phá dữ liệu - Chương 4: Phân cụm dữ liệu

Bài giảng Khai phá dữ liệu - Chương 3: Luật kết hợp

Bài giảng Khai phá dữ liệu - Chương 3: Luật kết hợp

Tài liêu mới

Tài liệu Nhập môn khoa học dữ liệu [Chuẩn nhất]

Tài liệu Nhập môn khoa học dữ liệu

Giáo trình Dữ liệu lớn trong kinh tế và kinh doanh

Giáo trình Dữ liệu lớn trong kinh tế và kinh doanh

Giáo trình Cơ sở dữ liệu (Trình độ Cao đẳng) chuẩn nhất - Trường Cao đẳng Cơ điện Hà Nội

Giáo trình Cơ sở dữ liệu (Trình độ Cao đẳng) - Trường Cao đẳng Cơ điện Hà Nội

Đề thi kết thúc học phần Hệ quản trị cơ sở dữ liệu

Đề thi kết thúc học phần Hệ quản trị cơ sở dữ liệu

Đề thi học kì 1 Cơ sở dữ liệu năm 2023-2024: Tổng hợp đề thi và đáp án

Đề thi học kì 1 kết thúc học phần Cơ sở dữ liệu năm 2023-2024

Tập bài giảng Cơ sở dữ liệu Phần 2: Kiến thức cơ bản và nâng cao

Tập bài giảng Cơ sở dữ liệu: Phần 2

Cơ sở dữ liệu: Tập bài giảng Phần 1 [Full]

Tập bài giảng Cơ sở dữ liệu: Phần 1

Giáo trình Cơ sở dữ liệu (Phần 2): ThS. Võ Văn Phúc (Chuẩn Nhất)

Giáo trình Cơ sở dữ liệu: Phần 2 - ThS. Võ Văn Phúc

Giáo trình Cơ sở dữ liệu Phần 1: ThS. Võ Văn Phúc (Chuẩn Nhất)

Giáo trình Cơ sở dữ liệu: Phần 1 - ThS. Võ Văn Phúc

Giáo trình Cơ sở dữ liệu Phần 2 - Trường Đại học Kỹ thuật – Công nghệ Cần Thơ (mới nhất)

Giáo trình Cơ sở dữ liệu: Phần 2 - Trường Đại học Kỹ thuật – Công nghệ Cần Thơ

Giáo trình Cơ sở dữ liệu Phần 1: Trường Đại học Kỹ thuật – Công nghệ Cần Thơ

Giáo trình Cơ sở dữ liệu: Phần 1 - Trường Đại học Kỹ thuật – Công nghệ Cần Thơ

Bài giảng Cơ sở dữ liệu ThS. Trương Hải: Tổng hợp kiến thức cơ bản

Bài giảng Cơ sở dữ liệu - ThS. Trương Hải

Giáo trình Cơ sở dữ liệu (TC): Lập trình máy tính - Trường Trung cấp nghề Nhân Đạo

Giáo trình Cơ sở dữ liệu (Nghề: Lập trình máy tính - TC) - Trường Trung cấp nghề Nhân Đạo

Đề thi Cấu trúc dữ liệu học kì 3 năm 2022-2023 (có đáp án)

Đề thi học kì 3 kết thúc học phần Cấu trúc dữ liệu năm 2022-2023

Đề thi thực hành Cơ sở dữ liệu học kì 1 năm 2023-2024

Đề thi thực hành học kì 1 môn Cơ sở dữ liệu năm 2023-2024

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 38/GP-BVHTTDL cấp ngày 09/3/2026