Giới thiệu tài liệu
Tài liệu này thuộc loại 'tài liệu' vì nội dung được trình bày trong một cấu trúc logic và có các khái niệm, định nghĩa về dữ liệu mining, luật kết hợp, thuật toán Apriori. Tài liệu này mô tả về quá trình phát hiện các mẫu trong lượng lớn dữ liệu (data mining) và sử dụng thuật toán Apriori để phát hiện luật kết hợp.
Đối tượng sử dụng
Nhà nghiên cứu, sinh viên trong lớp nghiên cứu hoặc học tập về dữ liệu, khoa học máy tính, thống kê hoặc trường đại học hoặc trường đào tạo chuyên nghiệp
Nội dung tóm tắt
Tài liệu này giới thiệu về các yếu tố chính trong việc phát hiện các mẫu (pattern) trong lượng lớn dữ liệu (data mining), bao gồm định nghĩa về dữ liệu mining, luật kết hợp, thuật toán Apriori. Tài liệu cũng mô tả cách định nghĩa và mô hình hóa bài toán data mining bằng các khái niệm tập mục (itemset), giao dịch (transaction) và cơ sở dữ liệu giao dịch (transaction database). Tuy nhiên, tài liệu chỉ trình bày thuật toán Apriori theo hai bước: sinh ra các tập phổ biến (frequent itemsets) và sinh ra các luật kết hợp. Tài liệu cũng cung cấp một số ví dụ về cách sử dụng thuật toán Apriori để phát hiện luật kết hợp trong một cơ sở dữ liệu giao dịch bán hàng. Cuối cùng, tài liệu thảo luận về các yếu tố ảnh hưởng đến độ phức tạp của thuật toán Apriori và giới thiệu về khai phá các luật kết hợp dạng phủ định (mining negative association rules).