Bài giảng Học máy: Các phương pháp học có giám sát (P1) - Nguyễn Nhật Quang
lượt xem 7
download
Bài giảng Học máy - Hồi quy tuyến tính đã trình bày những nội dung chính sau: Ví dụ về các phương pháp học có giám sát, hàm đánh giá lỗi, hồi quy tuyến tính, quy tắc delta, cập nhật theo đợt, các điều kiện kết thúc học. Mời các bạn cùng tham khảo nội dung chi tiết.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Học máy: Các phương pháp học có giám sát (P1) - Nguyễn Nhật Quang
- Học Máy (IT 4862) Nguyễn ễ Nhật hậ Quang quangnn-fit@mail.hut.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin và truyền thông Năm học 2011-2012
- Nội dung d môn ô học: h Giới thiệu chung g Đánh giá hiệu năng hệ thống học máy Cá phương Các h pháp há hhọc dựa d trên t ê xác á suất ất Các phương pháp học có giám sát Hồi quy tuyến tính (Linear regression) Các phương pháp học không giám sát Lọc cộng tác H tăng Học tă cường ờ Học Máy – IT 4862 2
- Hồi qquy tuyến tính – Giới thiệu Với một ví dụ đầu vào, dự đoán một giá trị đầu ra kiểu số thực Một phương pháp học máy đơnđơn-giản-nhưng-hiệu-quả giản nhưng hiệu quả phù hợp khi hàm mục tiêu (cần học) là một hàm tuyến tínhh n f ( x) = w0 + w1 x1 + w2 x2 + ... + wn xn = w0 + ∑ wi xi (wi,xi ∈R) i =1 Cần học (xấp xỉ) một hàm mục tiêu f f: X → Y • X: Miền không gian đầu vào (không gian vectơ n chiều – Rn) gg • Y: Miền không gian đầu ra ((miền các g giá trịị số thực ự – R)) • f: Hàm mục tiêu cần học (một hàm ánh xạ tuyến tính) Thực chất, là học một vectơ các trọng số: w = (w0, w1, w2, …,wn) Học Máy – IT 4862 3
- Hồi qquy tuyến tính – Ví dụ Hàm tuyến tính f(x) nào phù hợp? x f(x) f(x) 0.13 -0.91 1.02 -0.17 3.17 1.61 -2.76 -3.31 1.44 0.18 5.28 3.36 -1.74 -2.46 x 7 93 7.93 5 56 5.56 ... ... Ví dụ: ụ f(x) = -1.02 + 0.83x Học Máy – IT 4862 4
- Các ví dụ học/kiểm thử Đối với mỗi ví dụ học x=(x1,x2,...,xn), trong đó xi∈R • Giá trị đầu ra mong muốn cx (∈R) n • Giá trị đầu ra thực tế (tính bởi hệ thống) y x = w0 + ∑ wi xi i =1 → wi là đánh giá hiện thời của hệ thống đối với giá trị trọng số của thuộc tính thứ i → Giá trị đầu ra thực tế yx được mong muốn là (xấp xỉ) cx Đối với mỗi ví dụ kiểm thử z=(z =( 1,z2,...,zn) • Cần dự đoán (tính) giá trị đầu ra • Bằng cách áp dụng hàm mục tiêu đã học được f Học Máy – IT 4862 5
- Hàm đánh ggiá lỗi Giải thuật học hồi quy tuyến tính cần phải xác định hàm đá h giá đánh iá lỗi → Đánh giá mức độ lỗi của hệ thống trong giai đoạn huấn luyện Định nghĩa hàm lỗi E • Lỗi của hệ thống đối với mỗi ví dụ học x: 2 1 1⎛ n ⎞ E ( x) = (c x − y x ) = ⎜ c x − w0 − ∑ wi xi ⎟⎟ 2 ⎜ 2 2⎝ i =1 ⎠ • Lỗi của hệ thống đối với toàn bộ tập huấn luyện D: 2 1 1 ⎛ n ⎞ E = ∑ E ( x) = ∑ (c x − y x ) = ∑ ⎜⎜ c x − w0 − ∑ wi xi ⎟⎟ 2 x∈D 2 x∈D 2 x∈D⎝ i =1 ⎠ Học Máy – IT 4862 6
- Hồi qquy tuyến tính – Giải thuật Việc học hàm mục tiêu f là tương đương với việc học vectơ trọng ọ g số w sao cho cực ự tiểu hóa giá g trịị lỗi huấn luyện yệ E → Phương pháp này có tên gọi là “Least-Square Linear Regression” Giai đoạn huấn luyện • Khởi tạo vectơ trọng số w • Tính toán giá trị lỗi huấn luyện E • Cập nhật vectơ trọng số w theo quy tắc delta (delta rule) • Lặp lại, cho đến khi hội tụ về một giá trị lỗi nhỏ nhất (cục bộ) E Giai đoạn dự đoán Đối với một ví dụ mới z, giá trị đầu ra được dự đoán bằng: n f ( z ) = w *0 + ∑ w *i zi Trong đó w*=(w*0,w*1,..., w*n) i =1 là vectơ trọng số đã học được Học Máy – IT 4862 7
- Quy tắc delta Để cập nhật vectơ trọng số w theo hướng giúp giảm bớt giá trị lỗi huấn luyện E • η là tốc độ học (là một hằng số dương) → Xác định mức độ thay đổi đối với các giá trị trọng số tại mỗi bước học • Cập nhật theo từng ví dụ (Instance-to-instance/incremental update): wi ← wi + η(cx-yx)xi • Cập nhật theo đợt (Batch update): wi ← wi + η ∑ (c x − y x ) xi x∈D Các tên gọi khác của quy tắc delta • LMS (least mean square) rule • Adaline rule • Widrow-Hoff Widrow Hoff rule Học Máy – IT 4862 8
- LSLR_batch(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) được khởi tạo ngẫu nhiên while not CONVERGENCE for each thuộc tính fi delta_wi ← 0 for each ví dụ học x∈D Tính toán giá trị đầu ra thực tế yx for each thuộc tính fi delta_wi ← delta_wi + η(cx-yx)xi for each thuộc tính fi wi ← wi + delta_wi end while return w Học Máy – IT 4862 9
- Cập p nhật theo đợt/theo từngg ví dụ Giải thuật trên tuân theo chiến lược cập nhật theo đợt Cập nhật theo đợt (Batch update) • Tại mỗi bước học, các giá trị trọng số được cập nhật sau khi tất cả các ví dụ học được đưa vào (được học bởi) hệ thống - Giá trị lỗi được tính tích lũy đối với tất cả các ví dụ học - Các giá trị trọng số được cập nhật theo giá trị lỗi tích lũy tổng thể Cập nhật theo từng ví dụ (Instance-to-instance/ incremental update) • T Tạii mỗi ỗi b bước ớ hhọc, các á giá iá ttrịị trọng t số ố được đ cập ậ nhật hật ngay lập lậ tứ tức sau khi mỗi ví dụ học được đưa vào (được học bởi) hệ thống - Giá trị lỗi (riêng biệt) được tính cho ví dụ học đưa vào - Các giá trị trọng số được cập nhật ngay lập tức theo giá trị lỗi này Học Máy – IT 4862 10
- LSLR_incremental(D, η) for each thuộc tính fi wi ← giá trị (nhỏ) được khởi tạo ngẫu nhiên while not CONVERGENCE for each ví dụ học x∈D Tính toán giá trị đầu ra thực tế yx for each thuộc tính fi wi ← wi + η(cx-yx)xi end while return w Học Máy – IT 4862 11
- Các điều kiện kết thúc học Trong các giải thuật LSLR_batch và LSLR_incremental, S i l quá á ttrình ì h học h kết thúc thú khi các á điều điề kiện được chỉ định bởi CONVERGENCE được thỏa mãn Các điề Cá điều kiện kiệ kết thúc thú học h thường th ờ đ được định đị h nghĩa hĩ dựa d trên một số tiêu chí đánh giá hiệu năng hệ thống • Kết thúc,, nếu giá g trịị lỗi nhỏ hơn giá g trịị ngưỡng g g • Kết thúc, nếu giá trị lỗi ở một bước học lớn hơn giá trị lỗi ở bước học trước • Kết thúc, thú nếu ế sự khá khác biệt giữa iữ các á giá iá ttrịị lỗi ở 2 b bước ớ học h liên liê tiếp nhỏ hơn giá trị ngưỡng • ... Học Máy – IT 4862 12
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Mạng máy tính và truyền thông - Chương 6: An toàn mạng máy tính
10 p | 31 | 8
-
Bài giảng Học máy: Các phương pháp học có giám sát (P7) - Nguyễn Nhật Quang
11 p | 51 | 7
-
Bài giảng Học máy: Các phương pháp học có giám sát (P2) - Nguyễn Nhật Quang
17 p | 56 | 7
-
Bài giảng Mạng máy tính: Chương 3 - PGS. TS. Nguyễn Hữu Thanh
20 p | 96 | 6
-
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 0: Giới thiệu môn học
12 p | 24 | 6
-
Bài giảng học phần Tin học đại cương: Chương 6 - Học viện Nông nghiệp Việt Nam
14 p | 34 | 6
-
Bài giảng Học máy (IT 4862): Chương 4.6 - Nguyễn Nhật Quang
11 p | 41 | 5
-
Bài giảng Học máy: Các phương pháp học không giám sát (P2) - Nguyễn Nhật Quang
16 p | 42 | 4
-
Bài giảng Nhập môn tin học: Chương 3 - Trần Phước Tuấn
16 p | 75 | 4
-
Bài giảng Học máy (IT 4862): Chương 5 - Nguyễn Nhật Quang
16 p | 57 | 3
-
Bài giảng Học máy (IT 4862): Chương 4.1 - Nguyễn Nhật Quang
17 p | 56 | 3
-
Bài giảng Mạng máy tính: Mở đầu - TS. Trần Quang Diệu
7 p | 63 | 3
-
Bài giảng Tin học đại cương: Chương 4 - Trần Phước Tuần
19 p | 58 | 3
-
Bài giảng Tin học đại cương: Chương 3 - ThS. Trần Quang Hải Bằng
18 p | 118 | 3
-
Bài giảng học phần Tin học cơ sở - Chương 8: Giải thuật (Algorithms)
18 p | 13 | 3
-
Bài giảng Học máy (IT 4862): Chương 4 - Nguyễn Nhật Quang
12 p | 49 | 2
-
Bài giảng Mạng máy tính: Chương mở đầu - PGS. TS. Nguyễn Hữu Thanh
6 p | 65 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn