Trang chủ » Công Nghệ Thông Tin » Khoa học dữ liệu

32 trang

140 lượt xem

5

0

Bài giảng Khai phá dữ liệu: Chương 6 - Trường ĐH Phan Thiết

Bài giảng Khai phá dữ liệu: Chương 6 Phân cụm dữ liệu, cung cấp cho người học những kiến thức như: Giới thiệu bài toán phân cụm; Một số độ đo cơ bản cho phân cụm; Phân cụm K-mean gán cứng; Phân cụm phân cấp; Biểu diễn cụm và gán nhãn; Đánh giá phân cụm. Mời các bạn cùng tham khảo!

Chủ đề:

caphesuadathemmatong

Khai phá dữ liệu

Bài giảng Khai phá dữ liệu

/

32

Chương 6

Phân cụm dữ liệu

KHAI PHÁ DỮ LIỆU

DM

DW

348

Nội dung

1. Giới thiệu bài toán phân cụm

2. Một số độ đo cơ bản cho phân cụm

3. Phân cụm K-mean gán cứng

4. Phân cụm phân cấp

5. Biểu diễn cụm và gán nhãn

6. Đánh giá phân cụm

DM

DW

349

1. Giới thiệu bài toán phân cụm

Bài toán

Tập dữ liệu D = {di}

Phân các dữ liệu thuộc D thành các cụm

Các dữ liệu trong một cụm: “tương tự” nhau (gần nhau)

Dữ liệu hai cụm: “không tương tự” nhau (xa nhau)

Đo “tương tự” (gần) nhau ?

Tiên đề phân cụm:Nếu người dùng lựa chọn một đối tượng dthì

họ cũng lựa chọn các đối tượng cùng cụm với d

Khai thác “cách chọn lựa” của người dùng

Đưa ra một số độ đo “tương tự” theo biểu din dữ liệu

Một số nội dung liên quan

Xây dựng độ đo tương tự

Khai thác thông tin bổ sung

Số lượng cụm cho trước, số lượng cụm không cho trước

DM

DW

350

Sơ bộ tiếp cận phân cụm

Phân cụm mô hình và phân cụm phân vùng

Mô hình: Kết quả là mô hình biểu din các cụm dữ liệu

Vùng: Danh sách cụm và vùng dữ liệu thuộc cụm

Phân cụm đơn định và phân cụm xác suất

Đơn định: Mỗi dữ liệu thuộc duy nhất một cụm

Xác suất: Danh sách cụm và xác suất một dữ liệu thuộc vào

các cụm

Phân cụm phẳng và phân cụm phân cấp

Phẳng: Các cụm dữ liệu không giao nhau

Phân cấp: Các cụm dữ liệu có quan hệ phân cấp cha- con

Phân cụm theo lô và phân cụm tăng

Lô: Tại thời điểm phân cụm, toàn bộ dữ liệu đã có

Tăng: Dữ liệu tiếp tục được bổ sung trong quá trình phân

cụm

DM

DW

351

Các phương pháp phân cụm

Các phương pháp phổ biến

Phân vùng, phân cấp, dựa theo mật độ, dựa theo lưới, dựa theo mô

hình, và phân cụm mờ

Phân cụm phân vùng (phân cụm phẳng)

Xây dựng từng bước phân hoạch các cụm và đánh giá chúng theo

các tiêu chí tương ứng

Tiếp cận: từ dưới lên (gộp dần), từ trên xuống (chia dần)

Độ đo tương tự / khoảng cách

K-mean, k-mediod, CLARANS, …

Hạn chế: Không điều chỉnh được lỗi

Phân cụm phân cấp

Xây dựng hợp (tách) dần các cụm tạo cấu trúc phân cấp và đánh

giá theo các tiêu chí tương ứng

Độ đo tương tự / khoảng cách

HAC: Hierarchical agglomerative clustering

CHAMELEON, BIRRCH và CURE, …

Tài liệu liên quan

Bài giảng Mẫu thiết kế Visitor: Tổng quan và ứng dụng

Bài giảng Mẫu thiết kế: Visitor

Bài giảng Mẫu thiết kế Strategy: Tổng quan và ứng dụng

Bài giảng Mẫu thiết kế: Strategy

Bài giảng Mẫu thiết kế Proxy: Tổng quan và ứng dụng

Bài giảng Mẫu thiết kế: Proxy

Bài giảng Mẫu thiết kế Prototype: Tổng quan và ứng dụng

Bài giảng Mẫu thiết kế: Prototype

Bài giảng Mẫu thiết kế Observer: Tổng quan và ứng dụng

Bài giảng Mẫu thiết kế: Observer

Bài giảng Mẫu thiết kế Mediator: Tổng quan và ứng dụng

Bài giảng Mẫu thiết kế: Mediator

Bài giảng Mẫu thiết kế Iterator

Bài giảng Mẫu thiết kế: Iterator

Bài giảng Mẫu thiết kế Factory Method và Abstract Factory

Bài giảng Mẫu thiết kế: Factory method và abstract factory

Bài giảng mẫu thiết kế Facade

Bài giảng Mẫu thiết kế: Facade

Bài giảng Mẫu thiết kế Decorator: Hướng dẫn chi tiết

Bài giảng Mẫu thiết kế: Decorator

Tài liêu mới

Bài giảng Hệ quản trị cơ sở dữ liệu SQL Server Chương 3: ThS. Vũ Thị Thanh Hương

Bài giảng Hệ quản trị cơ sở dữ liệu SQL Server: Chương 3 - ThS. Vũ Thị Thanh Hương

Bài giảng Hệ quản trị cơ sở dữ liệu SQL Server: Chương 2 (ThS. Vũ Thị Thanh Hương)

Bài giảng Hệ quản trị cơ sở dữ liệu SQL Server: Chương 2 - ThS. Vũ Thị Thanh Hương

Bài giảng Hệ quản trị cơ sở dữ liệu SQL Server: Chương 1 (ThS. Vũ Thị Thanh Hương)

Bài giảng Hệ quản trị cơ sở dữ liệu SQL Server: Chương 1 - ThS. Vũ Thị Thanh Hương

Đề thi học kì 1 Cơ sở dữ liệu năm 2024-2025: Tổng hợp đề thi kết thúc học phần

Đề thi học kì 1 kết thúc học phần Cơ sở dữ liệu năm 2024-2025

Kiểm Tra CSDL: Câu Hỏi & Giải Pháp Tối Ưu, Kinh Nghiệm và Hướng Dẫn

Đề Kiểm tra học kì 2 Năm học 2014-2015 môn Hệ cơ sở dữ liệu

Lưu Trữ Dữ Liệu & Cấu Trúc Indexing: Giải Pháp Tối Ưu Nhất

Lecture Database Systems: Chapter 9 - Trần Thị Quế Nguyệt

An Ninh Cơ Sở Dữ Liệu: Giải Pháp Bảo Vệ Dữ Liệu Quan Trọng Toàn Diện

Lecture Database Systems: Chapter 8 - Trần Thị Quế Nguyệt

Phụ Thuộc Hàm và Chuẩn Hóa CSDL Quan Hệ: Hướng Dẫn Chi Tiết, Dễ Hiểu

Lecture Database Systems: Chapter 7 - Trần Thị Quế Nguyệt

SQL: Ngôn Ngữ Truy Vấn Cấu Trúc và DDL, DML, DCL [Hướng Dẫn Chi Tiết]

Lecture Database Systems: Chapter 6 - Trần Thị Quế Nguyệt

Đại Số Quan Hệ: Toàn Tập Kiến Thức, Bài Tập Có Giải (Chi Tiết)

Lecture Database Systems: Chapter 5 - Trần Thị Quế Nguyệt

Mô Hình Dữ Liệu Quan Hệ & Ánh Xạ ER/EER: Hướng Dẫn Chi Tiết, Chuẩn Nhất

Lecture Database Systems: Chapter 4 - Trần Thị Quế Nguyệt

Mô Hình ER Nâng Cao: Chuyên Biệt Hóa và Tổng Quát Hóa (Chi Tiết)

Lecture Database Systems: Chapter 3 - Trần Thị Quế Nguyệt

Mô Hình ER: Thiết Kế Cơ Sở Dữ Liệu Quan Hệ Hiệu Quả, Chuẩn Nhất

Lecture Database Systems: Chapter 2 - Trần Thị Quế Nguyệt

Hệ Thống Cơ Sở Dữ Liệu: Khái Niệm và Kiến Trúc [Chuẩn SEO]

Lecture Database Systems: Chapter 1 - Trần Thị Quế Nguyệt

Hệ Cơ Sở Dữ Liệu: Tổng Quan, Thiết Kế, Ứng Dụng [A-Z Mới Nhất]

Lecture Database Systems: Introduction to Database Systems - Trần Thị Quế Nguyệt

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015