intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Học máy: Các phương pháp học có giám sát (P5) - Nguyễn Nhật Quang

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:68

46
lượt xem
7
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Học máy - Các phương pháp học có giám sát: Học quy nạp luật - Rule induction" cung cấp cho người học các kiến thức: Phương pháp học quy nạp luật, các bài toán ví dụ, phân loại, chiến lược bao phủ gia tăng, Learn - one - Rule, đánh giá hiệu quản của một luật, các luật logic vị từ,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Học máy: Các phương pháp học có giám sát (P5) - Nguyễn Nhật Quang

  1. Học Máy (IT 4862) Nguyễn ễ Nhật hậ Quang quangnn-fit@mail.hut.edu.vn Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin và truyền thông Năm học 2011-2012
  2. Nội dung d môn ô học: h „ Giới thiệu chung g „ Đánh giá hiệu năng hệ thống học máy „ Các phương pháp học dựa trên xác suất „ Các phương pháp học có giám sát „ Học mạng nơron nhân tạo (Artificial neural network) „ Các phương pháp học không giám sát „ L cộng Lọc ộ tác tá „ Học tăng cường Học Máy – IT 4862 2
  3. Mạng nơ-ron nhân tạo – Giới thiệu (1) „ Mạng nơ-ron nhân tạo (Artificial neural network – ANN) ‰ Mô phỏng các hệ thống nơ-ron sinh học (các bộ não con người) ‰ ANN là một cấu trúc (structure/network) được tạo nên bởi một số lượng các nơ-ron (artificial neurons) liên kết với nhau „ Mỗi nơ-ron ‰ Có một đặc tính vào/ra ‰ Th hiệ Thực hiện một ột tính tí h toán t á cục bộ ((một ột hàm hà cục bộ) „ Giá trị đầu ra của một nơ-ron được xác định bởi ‰ Đặc tính vào/ra của nó ‰ Các liên kết của nó với các nơ-ron khác ‰ (Có thể) các đầu vào bổ sung Học Máy – IT 4862 3
  4. Mạng nơ-ron nhân tạo – Giới thiệu (2) „ ANN có thể được xem như một cấu trúc xử lý thông tin một cách p phân tán và song g song g ở mức cao „ ANN có khả năng học (learn), nhớ lại (recall), và khái quát hóa (generalize) từ các dữ liệu học –bằng cách gán và điều chỉnh (thích nghi) các giá trị trọng số ố (mức độ quan trọng) của các liên kết giữa các nơ-ron „ Chứ năng Chức ă (hà (hàm mục tiê tiêu)) của ủ một ột ANN đ được xác á đị định h bởi ‰ Kiến trúc (topology) của mạng nơ-ron ‰ Đặc tính vào/ra của mỗi nơ nơ-ron ron ‰ Chiến lược học (huấn luyện) ‰ Dữ liệu ệ học ọ Học Máy – IT 4862 4
  5. ANN – Các ứng dụng điển hình (1) „ Xử lý ảnh và Computer vision ‰ Ví dụ: So khớp, khớp tiền xử lý, lý phân đoạn và phân tích ảnh, ảnh computer vision, vision nén ảnh, xử lý và hiểu các ảnh thay đổi theo thời gian „ Xử lý tín hiệu ‰ Ví dụ: d Phâ Phân tí tích h tí tín hiệu hiệ và à hì hình h thái đị địa chấn, hấ động độ đất „ Nhận dạng mẫu ‰ Ví dụ: Trích chọn thuộc tính, phân loại và phân tích tín hiệu ra-đa, ra đa, nhận dạng và hiểu giọng nói, nhận dạng dấu vân tay, nhận dạng ký tự (chữ hoặc số), nhận dạng mặt người, và phân tích chữ viết tay „ Y tế ‰ Ví dụ: Phân tích và hiểu tín hiệu điện tim, chẩn đoán các loại bệnh, và xử lý các ảnh trong lĩnh vực y tế Học Máy – IT 4862 5
  6. ANN – Các ứng dụng điển hình (2) „ Các hệ thống quân sự ‰ Ví dụ: Phát hiện thủy lôi, lôi phân loại nhiễu ra ra-đa đa „ Các hệ thống tài chính ‰ Ví dụ: Phân tích thị trường chứng khoán, đánh giá giá trị bất động sản, kiểm tra truy cập thẻ tín dụng, dụng kinh doanh cổ phiếu „ Lập kế hoạch, điều khiển, và tìm kiếm ‰ Ví dụ: Cài đặt song song các bài toán thỏa mãn ràng buộc, tìm lời giải cho h bài toán t á người ời đưa đ hà hàng, điề khiển điều khiể và à khoa kh học h nghiên hiê cứuứ về ề người máy (robotics) „ Các hệ thống năng lượng ‰ Ví dụ: Đánh giá trạng thái hệ thống, phát hiện và khắc phục sự cố, dự đoán tải (khối lượng) công việc, và đánh giá mức độ an toàn „ ...(và ( à nhiều ều lĩnh vực ực bà bài toá toán khác!) ác ) Học Máy – IT 4862 6
  7. Cấu trúc và hoạt động của một nơ-ron „ Các tín hiệu đầu vào (input signals) của nơ-ron (xi, x0=1 i=1 m) i=1..m) ‰ Mỗi tín hiệu đầu vào xi gắn x1 w0 với một trọng số wi w1 x2 Giá trị w2 „ Trọng ọ g số điều chỉnh ((bias)) w0 (với x0=1) … Σ đầ ra đầu „ Đầu vào tổng thể (Net wm của xm nơ-ron input) là một hàm tích hợp của ủ các á títín hiệu hiệ đầu đầ vào à – (Out) Net(w,x) „ Hàm tác động/truyền (Activation/transfer Các tín Đầu vào Hàm tác hiệu đầu function) tính giá trị đầu ra tổng thể động của nơ-ron – f(Net(w,x)) vào của (Net) (truyền) Giá trị đầu ra (Output) của nơ-ron „ ((f)) nơ-ron: Out=f(Net(w,x)) ( ) (x) Học Máy – IT 4862 7
  8. Đầu vào tổngg thể và dịch chuyển y „ Đầu vào tổng thể (net input) thường được tính toán bởi một hàm tuyến tính m m Net = w0 + w1 x1 + w2 x2 + ... + wm xm = w0 .1 + ∑ wi xi = ∑ wi xi i =1 i =0 „ Ý nghĩa của tín hiệu dịch chuyển (bias) w0 → Họ các hàm phân tách Net=w N t 1x1 không thể phân tách đ được ợc các ví dụ thành 2 lớp (two classes) → Nhưng: họ các hàm Net=w1x1+w0 có thể! Net Net Net = w1x1 Net = w1x1 + w0 x1 x1 Học Máy – IT 4862 8
  9. Hàm tác động: Giới hạn cứng (Hard-limiter) „ Còn được gọi là hàm ngưỡng ⎧1, nêu Net ≥ θ (threshold function) Out ( Net ) = hl1( Net , θ ) = ⎨ „ Giá trị đầu ầ ra lấy ấ một trong 2 giá trị ⎩0, 0 nêu nguoc lai „ θ là giá trị ngưỡng „ Nhược ợ điểm: không g liên tục, ụ , đạo ạ Out ( Net ) = hl 2( Net , θ ) = sign( Net , θ ) hàm không liên tục Binary Out Bipolar Out hard-limiter hard-limiter 1 1 θ 0 Net θ 0 Net -1 Học Máy – IT 4862 9
  10. Hàm tác động: Logic ngưỡng (Threshold logic) ⎧ ⎪ 0, if Net < −θ ⎪⎪ 1 Out ( Net ) = tl ( Net , α , θ ) = ⎨α ( Net + θ ), ) if − θ ≤ Net ≤ − θ ⎪ α ⎪ 1, if 1 Net > − θ ⎪⎩ α ((α >0)) = max(0, min(1, α ( Net + θ ))) O t Out „ Còn được gọi là hàm tuyến tính bã hò bão hòa ((saturating t ti linear li ffunction) ti ) 1 „ Kết hợp của 2 hàm tác động: tuyến tính và giới hạn chặt -θ 0 (1/α)-θ Net „ α xác định độ dốc ố của khoảng tuyến tính 1/α „ Nhược điểm: Liên tục – nhưng đ hàm đạo hà khô không liên liê ttục Học Máy – IT 4862 10
  11. Hàm tác động: g Xích-ma ((Sigmoidal) g ) 1 Out ( Net ) = sf ( Net , α , θ ) = 1 + e −α ( Net +θ ) „Được dùng phổ biến nhất Out „Tham số α xác định độ dốc 1 „Giá trị đầu ra trong khoảng (0,1) 0.5 „Ưu điểm ‰ Liên tục, và đạo hàm liên tục -θ 0 Net ‰ Đạo hàm Đ hà củaủ mộtột hàm hà xích-ma í h được biểu diễn bằng một hàm của chính nó Học Máy – IT 4862 11
  12. Hàm tác động: Hyperbolic tangent 1 − e −α ( Net +θ ) 2 Out ( Net ) = tanh(( Net , α , θ ) = −α ( Net +θ ) = −α ( Net +θ ) −1 1+ e 1+ e „ Cũng hay được sử dụng Out „ Tham số α xác định độ dốc „ Giá trị đầu ra trong khoảng (-1,1) 1 „ Ưu điểm ‰ Liên tục, và đạo hàm liên tục -θ 0 Net ‰ Đạo hàm của một hàm tanh có thể -1 được biểu diễn bằng một hàm của chính nó Học Máy – IT 4862 12
  13. ANN – Kiến trúc mạng (1) „ Kiến trúc của một ANN được x/đ bởi: bias ‰ Số lượng các tín hiệu đầu vào và đầu ra input p ‰ Số lượng các tầng ‰ Số lượng các nơ-ron trong mỗi tầng hidden ‰ Số lượng các trọng số (các liên kết) đối layer với mỗi ỗ nơ-ron output ‰ Cách thức các nơ-ron (trong một tầng, layer hoặc giữa các tầng) liên kết với nhau output p ‰ Những Nhữ nơ-ron nào à nhận hậ cácá títín hiệu hiệ điều chỉnh lỗi Ví dụ: Một ANN với một tầng ẩn „ Một ANN phải có • Đầu vào: 3 tín hiệu ‰ Một tầng ầ đầuầ vào (input layer) • Đầu ra: 2 giá trị ‰ Một tầng đầu ra (output layer) • Tổng cộng, có 6 neurons ‰ Không, một, hoặc nhiều tầng ẩn (hidden - 4 ở tầng ẩn l layer(s)) ( )) - 2 ở tầng đầu ra Học Máy – IT 4862 13
  14. ANN – Kiến trúc mạngg (2) ( ) „ Một tầng (layer) chứa một nhóm các nơ-ron „ Tầng ẩn (hidden layer) là một tầng nằm ở giữa tầng đầu vào (input layer) và tầng đầu ra (output layer) „ Các nút Cá út ở tầng tầ ẩnẩ (hidden (hidd nodes) d ) không khô tương t tá trực tác t tiếp với môi trường bên ngoài (của mạng nơ-ron) „ Một ANN được gọi là liên kết đầy đủ (fully connected) nếu mọi đầu ra từ một tầng liên kết với mọi nơ-ron của tầng kế tiếp Học Máy – IT 4862 14
  15. ANN – Kiến trúc mạngg (3) ( ) „ Một ANN được gọi là mạng lan truyền tiến (feed- forward network) nếu không có bất kỳ đầu ra của một nút là đầu vào của một nút khác thuộc cùng tầng (hoặc thuộc một tầng phía trước) „ Khi các đầu ra của một nút liên kết ngược lại làm các đầu vào của một nút thuộc cùng tầng (hoặc thuộc một tầng phía trước), trước) thì đó là một mạng phản hồi (feedback network) ‰ Nếu phản hồi là liên kết đầu vào đối với các nút thuộc cùng tầng, thì đó là phản hồi bên (lateral feedback) „ Các mạng phản hồi có các vòng lặp kín (closed loops) được gọi là các mạng hồi quy (recurrent networks) Học Máy – IT 4862 15
  16. Kiến trúc mạngg – Ví dụ Mạng lan Một nơ-ron với truyền tiến phản hồi đến p một tầng ầ chính nó Mạng hồi quy một tầng Mạng lan truyền tiến nhiều tầng Mạng hồi quy nhiều tầng Học Máy – IT 4862 16
  17. ANN – Các quy tắc học „ 2 kiểu học trong các mạng nơ-ron nhân tạo ‰ Học tham số (Parameter learning) → Mục tiêu là thay đổi thích nghi các trọng số (weights) của các liên kết trong mạng nơ-ron ‰ Học cấu trúc (Structure learning) → Mục tiêu là thay đổi thích nghi cấu trúc mạng, bao gồm số lượng các nơ-ron và các kiểu liên kết giữa chúng „ 2 kiểu học này có thể được thực hiện đồng thời hoặc riêng rẽ „ Phần ầ lớn các quy tắc ắ học trong ANN thuộc kiểu ể học tham số „ Trong bài học này, chúng ta sẽ chỉ xét việc học tham số ố Học Máy – IT 4862 17
  18. Quyy tắc học trọngg số tổngg quát Q q „ Tạibước học (t), mức độ điều chỉnh vec vec-tơ tơ trọng số w tỷ lệ x0= 1 w0 thuận với tích của tín hiệu học r(t) x1 w1 a neuron và đầu vào x(t) Out x ... wj Δw(t) ~ r(t).x(t) xj Δw Δw(t) = η.r(t).x(t) ... wm x Learning d xm signal trong đó η (>0) là tốc độ học η generator (learning rate) „ Tínhiệu học r là một hàm của w, Lưu ý: xj có thể là: x, và giá trị đầu ra mong muốn d • một tín hiệu đầu vào, hoặc r = g(w,x,d) • một giá trị đầu ra của một nơ- „ Quy tắc học trọng số tổng quát ron khác Δw(t) = η.g(w(t),x(t),d(t)).x(t) Học Máy – IT 4862 18
  19. Perceptron „ Một perceptron là một kiểu đơn ggiản nhất của ANNs x0=11 (chỉ gồm duy nhất một nơ- x1 w0 ron) w1 x2 Out w2 „ Sử dụng hàm tác động … Σ giới hạn chặt xm wm ⎛ m ⎞ Out = sign( Net ( w, x) ) = sign⎜ ∑ w j x j ⎟⎟ ⎜ ⎝ j =0 ⎠ „ Đối với một ộ ví dụ ụ x,, giá g trịị đầu ra của perceptron là ‰ 1, nếu Net(w,x)>0 ‰ -1, 1 nếu ế ngược lại l i Học Máy – IT 4862 19
  20. Perceptron p – Minh họa Mặt phẳng phân tách x1 w0+w1x1+w2x2=0 Đầu ra = 1 Đầu ra = -1 1 x2 Học Máy – IT 4862 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2