Trang chủ » Công Nghệ Thông Tin » Trí tuệ nhân tạo AI

23 trang

187 lượt xem

Bài giảng Học máy (IT 4862): Chương 11 - Nguyễn Nhật Quang

Chương 4 - Các phương pháp học có giám sát (Giới thiệu về phân cụm, phân cụm dựa trên phân tách). Chương này trình bày những nội dung chính sau: Lý thuyết về phân cụm, ví dụ phân cụm, phân loại phân cụm, thành phần, các bước phân loại, điểm trung tâm, hàm khoảng cách,... Mời các bạn cùng tham khảo.

Chủ đề:

tieu_vu16

Học máy

Bài giảng Học máy

Học Máy

(IT 4862)

ễhậ

Nguy

ễ

n N

hậ

t Quang

quangnn-fit@mail.hut.edu.vn

Trường Đại học Bách Khoa Hà Nội

Viện Công nghệ thông tin và truyền thông

Năm học 2011-2012

Nội

ung m

ọc:

Giới thiệu chun

Đánh giá hiệunăng hệthống họcmáy



Các phương pháp họcdựatrênxácsuất



Các

phương

pháp

học

dựa

trên

xác

suất

Các phương pháp học có giám sát

Cá

há

khô

iá

át



Cá

ương p

há

ọc

khô

ng g

iá

át

Giớithiệuvềphân cụm

Ph

cụ

dựa

tác

h: k-M

cụ

dựa

tê

pâ

tác

ea s

Lọccộng tác



Học

tăng

cường



Học

tăng

cường

Học Máy (IT 4862)

Học có vs. không có giám sát

Học có giám sát (Supervised learning)



Tập

dữ

liệu

(dataset)

bao

gồm

các

ví

dụ

mà

mỗi

ví

dụ

được

gắn



Tập

dữ

liệu

(dataset)

bao

gồm

các

ví

dụ

mà

mỗi

ví

dụ

được

gắn

kèm vớimột nhãn lớp/giá trịđầu ra mong muốn

Mụcđích là học(xấpxỉ) mộtgiảthiết(vd: một phân lớp, một hàm

mục

tiêu

)

phù

hợp

với

tập

dữ

liệu

hiện

có

mục

tiêu

,...

)

phù

hợp

với

tập

dữ

liệu

hiện

có

Giảthiếthọcđược (learned hypothesis) sau đósẽđược dùng để

phân lớp/dựđoán đốivớicácvídụmới

Học không có giám sát (Unsupervised learning)

Tậpdữliệu (dataset) bao gồmcácvídụ, mà mỗivídụkhông có

thông

tin

về

nhãn

lớp/giá

trị

đầu

mong

muốn

thông

tin

về

nhãn

lớp/giá

trị

đầu

mong

muốn

Mụcđích là tìm ra (học) các cụm/các cấu trúc/các quan hệtồntại

trong tậpdữliệuhiệncó

Học Máy (IT 4862)

Phân c

ụ

Phân cụm/nhóm (Clustering) là phương pháp học không

có

giám

sát

được

sử

dụng

phổ

biến

nhất

có

giám

sát

được

sử

dụng

phổ

biến

nhất

Tồntại các phương pháp học không có giám sát khác, ví dụ: Lọc

cộng tác (Collaborative filtering), Khai phá luậtkếthợp

(Association rule mining)

(Association

rule

mining)

, ...

Học phân cụm



Đầu

vào

một

tập

dữ

liệu

không

có

nhãn

(

các

ví

dụ

không

có

nhãn



Đầu

vào

một

tập

dữ

liệu

không

có

nhãn

(

các

ví

dụ

không

có

nhãn

lớp/giá trịđầu ra mong muốn)

Đầura: cáccụm (nhóm) củacácvídụ

Mộtcụm(cluster)là mộttập các ví dụ

Tương tựvới nhau (theo một ý nghĩa, đánh giá nào đó)



Khác

biệt

với

các

ví

dụ

thuộc

các

cụm

khác



Khác

biệt

với

các

ví

dụ

thuộc

các

cụm

khác

Học Máy (IT 4862)

Phân c

ụ

m – V

ụ

Mộtvídụvềphân cụm:

Các ví dụđược phân chia thành 3 cụm

[Liu, 2006]

Học Máy (IT 4862)

Bài giảng Học máy (IT 4862): Chương 11 - Nguyễn Nhật Quang

Chủ đề:

Tài liệu liên quan

Tài liêu mới

Xác nhận đăng nhập

Đăng nhập từ tài khoản này?

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi