Trang chủ » Công Nghệ Thông Tin » Khoa học dữ liệu

70 trang

101 lượt xem

4

0

Bài giảng Nhập môn khai phá dữ liệu: Chương 5 - PGS. TS. Hà Quang Thụy

Bài giảng Nhập môn khai phá dữ liệu - Chương 5: Phân lớp. Những nội dung chính trong chương này gồm có: Giới thiệu phân lớp, phân lớp học giám sát, phân lớp học bán giám sát. Mời các bạn cùng tham khảo để biết thêm nội dung chi tiết.

Chủ đề:

Khai phá dữ liệu

Bài giảng Khai phá dữ liệu

/

70

BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU

CHƯƠNG 5. PHÂN LỚP

1

Charu C. Aggarwal. Data Classification: Algorithms.CRC Press, 2014.

PGS. TS. Hà Quang Thụy

HÀ NỘI, 08-2018

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

ĐẠI HỌC QUỐC GIA HÀ NỘI

http://uet.vnu.edu.vn/~thuyhq/

Nội dung

Giới thiệu phân lớp

Phân lớp học giám sát

Phân lớp học bán giám sát

2

3

Phân lớp: Một vài bài toán ví dụ

⚫1. Bài toán phân lớp kết quả xét nghiệm

▪Miền dữ liệu I = {phiếu xét nghiệm},

▪Biến mục tiêu “tập hợp lớp” O = {dương tinh, âm tính}

▪Ánh xạ f: I →O, fchưa biết

▪Input: Tập ví dụ mẫu ILgồm phiếu xét nghiệm đã có nhãn

dương tình/âm tính.

▪Output: Ánh xạ xấp xỉ tốt nhất f* để xây dựng chương trình

tự động gán nhãn cho mọi phiếu xét nghiệm.

⚫2. Bài toán phân lớp cam kết khách hàng

▪Miền dữ liệu:Tập thông tin mua hàng khách hàng RFM

▪Mục tiêu “tập hợp lớp” O = {Trung thành cao, Trung thành

thấp, Bình thường}

▪Ánh xạ f: I →O, fchưa biết

▪Input: Tập ví dụ mẫu ILgồm khách hàng với RFM và nhãn

tương ứng.

▪Output: Ánh xạ xấp xỉ tốt nhất f* để xây dựng chương trình

tự động gán nhãn cho mọi khách hàng.

4

Phân lớp: Một vài bài toán ví dụ

⚫3. Bài toán phân lớp quan điểm

▪Miền dữ liệu I = {nhận xét sản phẩm A},

▪Mục tiêu “tập hợp lớp” O = {khen, chê}

▪Ánh xạ f: I →O, fchưa biết

▪Input: Tập ví dụ mẫu ILgồm đánh giá đã có nhãn khen/chê.

▪Output: Ánh xạ xấp xỉ tốt nhất f* để xây dựng chương trình

tự động gán nhãn cho mọi nhận xét.

⚫4. Bài toán phân lớp trang web

▪Miền dữ liệu:Tập các trang web miền lính vực quan tâm

▪Mục tiêu “tập hợp lớp” O = {Kinh tế, Thế giới, Thể thao, Giáo

dục, v.v.}

▪Ánh xạ f: I →O, fchưa biết

▪Input: Tập ví dụ mẫu ILgồm trang web có nhãn thuộc O.

▪Output: Ánh xạ xấp xỉ tốt nhất f* để xây dựng chương trình

tự động gán nhãn cho mọi trang web mới tải về.

Các mức phân tích kinh doanh

5

Tối ưu hóa thông tin

Phân tích khuyến nghị

Phân tích dự báo

Phân tích chẩn đoán

Phân tích

mô tả

Thông tin

Giá trị kinh doanh

Điều gì đã xảy ra?

Vì sao điều đó xảy ra?

Khi nào nó sẽ xảy ra?

Làm gì khi nó xảy ra

một lần nữa?

-Hiểu sâu sắc thị trường và khách hàng,

-Hiểu vận hành nội bộ và nhân viên,

-Hiểu giá trị dữ liệu

KHAI PHÁ LUẬT KẾT HỢP

PHÂN CỤM

PHÂN LỚP

Tài liệu liên quan

Ứng dụng khai thác dữ liệu: Bài thuyết trình về Multi-label classification of enzyme subtrates

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Multi-label classification of enzyme subtrates

Ứng dụng khai thác dữ liệu: Bài thuyết trình Heart Failure Prediction

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Heart Failure Prediction

Ứng dụng khai thác dữ liệu (Data Mining): Bài thuyết trình Child Mind Institute về Problematic Internet Use

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Child Mind Institute - Problematic Internet Use

Ứng dụng khai thác dữ liệu: Bài thuyết trình Flight delay prediction

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Flight delay prediction

Ứng dụng khai thác dữ liệu (Data Mining): Bài thuyết trình về dự đoán và can thiệp sức khỏe tâm thần, phòng chống trầm cảm

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Understanding and predicting depression to enhance mental health interventions

Ứng dụng khai thác dữ liệu (Data Mining): Bài thuyết trình Market Basket Analysis Based on RFM Analysis

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Market Basket Analysis Based on RFM Analysis

Phân tích cảm xúc văn bản Tiếng Việt: Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application)

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Phân tích cảm xúc văn bản Tiếng Việt

Abstractive News Summarization for Vietnamese: Bài Thuyết Trình Ứng Dụng Khai Thác Dữ Liệu (Data Mining and Application)

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Abstractive News Summarization for Vietnamese

Ứng dụng Data Mining: Bài thuyết trình phương pháp khai thác dữ liệu trong phát triển hệ thống hỏi-đáp y tế

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Các phương pháp khai thác dữ liệu trong phát triển hệ thống hỏi-đáp y tế

Ứng dụng khai thác dữ liệu (Data Mining and Application): Bài thuyết trình về dự đoán Loan approval

Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Loan approval prediction

Tài liêu mới

Bài giảng Hệ quản trị cơ sở dữ liệu phi quan hệ: Chương 4 - An toàn và quản trị

Bài giảng Hệ quản trị và an toàn cơ sở dữ liệu: Chương 4 - Hệ quản trị cơ sở dữ liệu phi quan hệ

Bài giảng Hệ quản trị CSDL và An toàn CSDL: Làm việc với tính năng nâng cao của SQL Server (Chương 3)

Bài giảng Hệ quản trị và an toàn cơ sở dữ liệu: Chương 3 - Làm việc với các tính năng nâng cao của SQL Server

Bài giảng Hệ quản trị CSDL: Làm việc với đối tượng trong SQL SERVER (Chương 2)

Bài giảng Hệ quản trị và an toàn cơ sở dữ liệu: Chương 2 - Làm việc với các các đối tượng trong SQL SERVER

Tổng quan về các hệ quản trị cơ sở dữ liệu: Bài giảng Hệ quản trị và an toàn cơ sở dữ liệu, Chương 1

Bài giảng Hệ quản trị và an toàn cơ sở dữ liệu: Chương 1 - Tổng quan về các hệ quản trị cơ sở dữ liệu

Truy vấn dữ liệu: Bài giảng Cơ sở dữ liệu Chương 7

Bài giảng Cơ sở dữ liệu: Chương 7 - Truy vấn dữ liệu

Chuẩn Hóa Dữ Liệu: Bài Giảng Cơ Sở Dữ Liệu Chương 6

Bài giảng Cơ sở dữ liệu: Chương 6 - Chuẩn hóa dữ liệu

Bài giảng Cơ sở Dữ Liệu: Thiết kế Cơ Sở Dữ Liệu Luận Lý, Mô Hình Quan Hệ & Sơ Lược Chuẩn Hóa Dữ Liệu (Chương 5)

Bài giảng Cơ sở dữ liệu: Chương 5 - Thiết kế cơ sở dữ liệu luận lý - Mô hình quan hệ - Sơ lược chuẩn hóa dữ liệu

Bài giảng Cơ sở dữ liệu: Mô hình thực thể quan hệ mở rộng Chương 4

Bài giảng Cơ sở dữ liệu: Chương 4 - Mô hình thực thể quan hệ mở rộng

Bài giảng Cơ sở dữ liệu: Mô hình thực thể mối quan hệ (Chương 3)

Bài giảng Cơ sở dữ liệu: Chương 3 - Mô hình thực thể mối quan hệ

Bài giảng Cơ sở dữ liệu: Quá trình phát triển cơ sở dữ liệu - Chương 2

Bài giảng Cơ sở dữ liệu: Chương 2 - Quá trình phát triển cơ sở dữ liệu

Cơ sở dữ liệu: Bài giảng Nhập môn Cơ sở dữ liệu Chương 1

Bài giảng Cơ sở dữ liệu: Chương 1 - Nhập môn về Cơ sở dữ liệu

Efficient algorithms to mine concise representations of frequent high utility occupancy patterns

Efficient algorithms to mine concise representations of frequent high utility occupancy patterns

Đề thi Khai thác và Phân tích Dữ liệu học kì 1 năm 2024-2025 (có đáp án)

Đề thi kết thúc học phần học kì 1 môn Khai thác và phân tích dữ liệu năm 2024-2025

Bộ câu hỏi ôn tập Khai phá dữ liệu (Data Mining) đầy đủ nhất

Bộ câu hỏi ôn tập môn Khai phá dữ liệu (Data Mining)

Bài Thực Hành SQL: Hướng Dẫn Chi Tiết và Bài Tập Mẫu

Bài thực hành SQL

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015