Trang chủ » Công Nghệ Thông Tin » Kỹ thuật phần mềm

47 trang

105 lượt xem

Bài giảng Học máy (IT 4862): Chương 4.5 - Nguyễn Nhật Quang

Chương 4 - Các phương pháp học có giám sát (Máy vectơ hỗ trợ - Support vector machine). Chương này trình bày những nội dung chính sau: Giới thiệu về máy vectơ hỗ trợ, mặt siêu phẳng phân tách, mặt siêu phẳng có lề cực đại, dữ liệu phân tách được tuyền tính, tính toán mức lề, cực đại hóa mức lề, bài toán tối ưu,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:

tieu_vu16

Kỹ thuật lập trình nâng cao

Học Máy

(IT 4862)

ễhậ

Nguy

ễ

n N

hậ

t Quang

quangnn-fit@mail.hut.edu.vn

Trường Đại học Bách Khoa Hà Nội

Viện Công nghệ thông tin và truyền thông

Năm học 2011-2012

Nội

ung m

ọc:

Giới thiệu chun

Đánh giá hiệunăng hệthống họcmáy



Các phương pháp họcdựatrênxácsuất



Các

phương

pháp

học

dựa

trên

xác

suất

Các phương pháp họccógiámsát



Máy

vectơ

hỗ

trợ

(Support vector machine)



Máy

vectơ

hỗ

trợ

(Support

vector

machine)

Các phương pháp học không giám sát

ộ

tá



ọcc

ộ

tá

Họctăng cường

Học Máy – IT 4862

Máy vectơhỗtrợ-Giớithiệu(1)

Máy vectơ hỗ trợ (Support vector machine - SVM) được

đề cửbởi V Vapnik và các đồng nghiệpcủa ông vào

đề

cử

bởi

Vapnik

và

các

đồng

nghiệp

của

ông

vào

những năm 1970s ở Nga, và sau đó đã trở nên nổi tiếng

và phổ biến vào những năm 1990s

SVM là một phương pháp phân lớp tuyến tính (linear

classifier), với mục đích xác định một siêu phẳng

(hyperplane) để phân tách

hai lớp

củadữliệu

ví dụ:

(hyperplane)

để

phân

tách

hai

lớp

của

dữ

liệu

–

ví

dụ:

lớp các ví dụ có nhãn dương (positive) và lớp các ví dụ

có nhãn âm (negative)

Các hàm nhân (kernel functions), cũng được gọi là các

hàm biến đổi (transformation functions), được dùng cho

các trường hợp phân lớp phi tuyến

các

trường

hợp

phân

lớp

phi

tuyến

Học Máy – IT 4862

Máy vectơhỗtrợ-Giớithiệu(2)

SVM có một nền tảng lý thuyết chặt chẽ –dựa trên nhiều

định lý toán học

định

lý

toán

học

SVM là một phương pháp tốt (phù hợp) đối với những bài

toán phân lớp có không gian biểudiễnthuộc tính lớn

–

toán

phân

lớp

có

không

gian

biểu

diễn

thuộc

tính

lớn

các đối tượng cần phân lớp được biểu diễn bởi một tập

rất lớn các thuộc tính

ế ế ố

SVM đã được bi

ế

t đ

ế

n là một trong s

ố

các phương pháp

phân lớp tốt nhất đối với các bài toán phân lớp văn bản

(text/document classification)

(text/document

classification)

Học Máy – IT 4862

Máy vectơhỗtrợ-Giớithiệu(3)

Các vectơđượckýhiệubởicácchữđậm nét!

Biể

diễ

tậ

hấ

lệ

(t i i l )



Biể

diễ

tậ

ụ

ấ

ệ

ng examp

)

{(x1, y1), (x2, y2), …, (xr, yr)},



là

một

vectơ

đầu

vào

được

biểu

diễn

trong

không

gian

⊆



là

một

vectơ

đầu

vào

được

biểu

diễn

trong

không

gian

⊆

yilà mộtnhãn lớp(giá trịđầura), yi∈{1,-1}

yi=1: lớpdương (positive); yi=-1: lớpâm (negative)

Đốivớimộtvídụxi:

⎩

⎨

⎧

<+〉⋅〈−

≥+〉⋅〈

=01

bnêu

ixw

xw [Eq.1]

SVM xác định một hàm phân tách tuyến tính

f(x)= 〈w ⋅x〉+ b

ố

⎩

[Eq.2]

wlà vectơtrọng s

ố

các thuộc tính;

là mộtgiátrịs

ố

thực

Học Máy – IT 4862

Bài giảng Học máy (IT 4862): Chương 4.5 - Nguyễn Nhật Quang

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi