Bài giảng Các hệ thống thông minh nhân tạo và ứng dụng - Chương 7: Máy học
lượt xem 5
download
Bài giảng Các hệ thống thông minh nhân tạo và ứng dụng - Chương 7: Máy học có nội dung trình bày về khái niệm máy học, phương pháp Naïve Bayes, phương pháp ID3, phương pháp ILA, thuật toán máy học,... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Các hệ thống thông minh nhân tạo và ứng dụng - Chương 7: Máy học
- CÁC HỆ THỐNG THÔNG MINH NHÂN TẠO & ỨNG DỤNG Máy Học THS. BÙI THỊ DANH BM.KHMT, KHOA CNTT, ĐH.KHTN TP.HCM
- Nội dung chính Máy học là gì? Phương pháp Naïve Bayes Phương pháp ID3 Phương pháp ILA 2
- Máy học là gì? Arthur Samuel (1959): Máy học là một lĩnh vực nghiên cứu mang lại cho máy tính khả năng học mà không phải lập trình một cách tường minh. 3
- Máy học là gì? Tom Mitchell (1998): Một chương trình máy tính được nói là “học” từ 𝑘𝑖𝑛ℎ 𝑛𝑔ℎ𝑖ệ𝑚 𝐸 tương ứng với 𝑐ô𝑛𝑔 𝑣𝑖ệ𝑐 𝑇 và độ đo ℎ𝑖ệ𝑢 𝑠𝑢ấ𝑡 𝑃 nếu hiệu suất trên 𝑇, được đo bởi 𝑃, cải thiện nhờ kinh nghiệm 𝐸 Ví dụ: một chương trình máy tính xem xét các emails mà chúng ta đã đánh dấu và không đánh dấu là “spam”, từ đó học được cách để lọc các email spam. ◦ 𝐶ô𝑛𝑔 𝑣𝑖ệ𝑐 𝑇: phân loại email là spam hay không phải spam ◦ 𝐾𝑖𝑛ℎ 𝑛𝑔ℎ𝑖ệ𝑚 𝐸: xem xét việc đánh dấu và không đánh dấu spam của chúng ta ◦ 𝐻𝑖ệ𝑢 𝑠𝑢ấ𝑡 𝑃: số lượng email phân loại đúng là spam/không phải spam 4
- Máy học là gì? Máy học có thể được dùng để: ◦ Khai thác dữ liệu: nhiều tập dữ liệu lớn đến từ sự phát triển của tự động hóa/web ◦ Dữ liệu click web, hồ sơ bệnh án, mạng xã hội … ◦ Xây dựng các ứng dụng không thể lập trình thủ công ◦ Xe hơi tự lái, nhận dạng chữ viết tay, xử lý ngôn ngữ tự nhiên (NLP), thị giác máy tính… ◦ Các chương trình tự điều chỉnh ◦ Hệ thống đề cử sản phẩm của Amazon, Netflix… ◦ Hiểu về việc học của con người (bộ não) 5
- Máy học là gì? Các thuật toán máy học có thể chia thể các nhóm: ◦ Supervised learning (học có giám sát) ◦ Unsupervised learning (học không có giám sát) ◦ Reinforcement learning (học tăng cường) ◦… 6
- Học có giám sát Dữ liệu dùng để “học” (hay huấn luyện) cần có “câu trả lời đúng” đi kèm. Ví dụ - Phát hiện và lọc email spam ◦ Dữ liệu học: các email đã được đánh dấu là spam và không được đánh dấu là spam. ◦ Dựa trên các thuộc tính(đặc trưng): chiều dài email, tỉ lệ kí tự, số lượng url… ◦ Phân loại cho các email mới. Ví dụ - Dự đoán giá nhà ◦ Dữ liệu học: các căn nhà và giá tương ứng ◦ Dựa trên các thuộc tính (đặc trưng): vị trí, diện tích, năm xây dựng ◦ Dự đoán giá cho các ngôi nhà không có trong dữ liệu học 7
- Học có giám sát Ví dụ - Chẩn đoán y khoa ◦ Học từ dữ liệu là những bệnh án của các bệnh nhân. ◦ Các thuộc tính: Sốt, nôn, tiêu chảy, rét run, … ◦ Dự đoán cho các ca mới Mẫu Sốt Nôn Tiêu chảy Rét run Phân loại d1 không không không không khỏe mạnh d2 trung bình không không không cúm d3 cao không không có cúm d4 cao có có không ngộ độc salmonella d5 trung bình không có không ngộ độc salmonella d6 không có có không viêm ruột d7 trung bình có có không viêm ruột d8 không không có có ? 8
- Học không giám sát Dữ liệu dùng để học không có “câu trả lời đúng” đi kèm Cố gắng hiểu dữ liệu và phát hiện ra các cấu trúc hay các mẫu trong dữ liệu 9
- Học không có giám sát 10
- Học tăng cường Tương tác với môi trường, nhận phản hồi và từ đó rút ra mô hình mà môi trường đang vận hành. Thực hiện tương tác agent Môi trường Nhận phản hồi (phần thưởng r) 11
- Học tăng cường 12
- Nội dung chính Máy học là gì? Phương pháp Naïve Bayes Phương pháp ID3 Phương pháp ILA 13
- Chẩn đoán y khoa Tính xác suất cho từng khả Mẫu Sốt Nôn Tiêu chảy Rét run Phân loại năng: d1 không không không không khỏe mạnh ◦ 𝑃 𝑘ℎỏ𝑒 𝑚ạ𝑛ℎ 𝑑8 d2 trung bình không không không cúm ◦ 𝑃(𝑐ú𝑚|𝑑8 ) d3 cao không không có cúm ◦ 𝑃 𝑛𝑔ộ độ𝑐 𝑑8 d4 cao có có không ngộ độc salmonella ◦ 𝑃(𝑣𝑖ê𝑚 𝑟𝑢ộ𝑡|𝑑8 ) d5 trung bình không có không ngộ độc salmonella d6 không có có không viêm ruột Chọn ra xác suất lớn nhất để quyết định nhóm bệnh của 𝑑8 d7 trung bình có có không viêm ruột d8 không không có có ? Tính như thế nào? 14
- Phương pháp Naïve Bayes Gọi 𝑋1, 𝑋2, … , 𝑋𝑛 là các thuộc tính trong tập dữ liệu, 𝑌 là thuộc tính phân lớp. Giả sử 𝑋1, 𝑋2, … , 𝑋𝑛 độc lập điều kiện với nhau khi cho 𝑌 Phương pháp dựa trên luật suy diễn xác suất Bayes: 𝑃 𝑋 𝑌 . 𝑃(𝑌) 𝑃 𝑌𝑋 = 𝑃(𝑋) 𝑃 𝑋 = 𝑑8 𝑌 = 𝑐ú𝑚 .𝑃(𝑌=𝑐ú𝑚) Ví dụ: 𝑃 𝑌 = 𝑐ú𝑚 𝑋 = 𝑑8 = 𝑃(𝑋=𝑑8 ) Mẫu Sốt Nôn Tiêu chảy Rét run Phân loại d1 không không không không khỏe mạnh d2 trung bình không không không cúm 15
- Phương pháp Naïve Bayes Ước lượng giá trị của 𝑃 𝑌 = 𝑐 : 𝑪𝒐𝒖𝒏𝒕(𝒄) 𝐏(𝐘 = 𝐜) = 𝑪𝒐𝒖𝒏𝒕(𝑫) ◦ 𝐶𝑜𝑢𝑛𝑡 𝑐 : số mẫu có 𝑌 = 𝑐 ◦ 𝐶𝑜𝑢𝑛𝑡(𝐷): tổng số mẫu có trong dữ liệu học. Ước lượng giá trị của 𝑃 𝑋 = d 𝑌 = 𝑐): ◦ 𝑋 được xác định bởi các thuộc tính 𝑋1, 𝑋2, … , 𝑋𝑛 và chúng độc lập nhau nên: 𝒏 𝑷 𝑿 = 𝒅 𝒀 = 𝒄 = 𝑷 𝑿𝟏 = 𝒙𝟏 , … , 𝑿𝒏 = 𝒙𝒏 𝒀 = 𝒄 = ෑ 𝑷(𝑿𝒊 = 𝒙𝒊 |𝒀 = 𝒄) 𝒊=𝟏 ◦ Theo đó, chúng ta cần ước lượng 𝑃(𝑋𝑖 = 𝑥𝑖 |𝑌 = 𝑐): 𝑪𝒐𝒖𝒏𝒕(𝒙𝒊 , 𝒄) 𝑷 𝑿𝒊 = 𝒙𝒊 𝒀 = 𝒄 = 𝑪𝒐𝒖𝒏𝒕(𝒄) ◦ C𝑜𝑢𝑛𝑡(𝑥𝑖 , 𝑐): số mẫu có 𝑌 = 𝑐 và thuộc tính thứ 𝑖 có giá trị là 𝑥𝑖 ◦ 𝐶𝑜𝑢𝑛𝑡(𝑐): số mẫu có 𝑌 = 𝑐 16
- Ví dụ 1 Mẫu Tuyết Thời tiết Mùa Sức khỏe Trượt tuyết? 1 ẩm sương mù vắng tốt không 2 khô nắng vắng bị thương không 3 khô nắng vắng tốt có 4 khô nắng cao điểm tốt có 5 khô nắng vừa phải tốt có 6 băng gió cao điểm mệt mỏi không 7 ẩm nắng vắng tốt có 8 băng sương mù vừa phải tốt không 9 khô gió vắng tốt có 10 khô gió vắng tốt có 11 khô sương mù vắng tốt có 12 khô sương mù vắng tốt có 13 ẩm nắng vừa phải tốt có 14 băng sương mù vắng bị thương không 17
- Ví dụ 1 Ước lượng 𝑃(𝑌 = 𝑐): ◦ 𝑃(𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 9/14 ◦ 𝑃(𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 5/14 Ước lượng 𝑃 𝑋1 = 𝑥𝑖 𝑌 = 𝑐 , với 𝑋1 ≡ 𝑇𝑢𝑦ế𝑡 ◦ 𝑃(𝑇𝑢𝑦ế𝑡 = ẩ𝑚 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 2/9 ◦ 𝑃(𝑇𝑢𝑦ế𝑡 = 𝑘ℎô | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 7/9 ◦ 𝑃(𝑇𝑢𝑦ế𝑡 = 𝑏ă𝑛𝑔 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 0/9 ◦ 𝑃(𝑇𝑢𝑦ế𝑡 = 𝑏ă𝑛𝑔 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 3/5 ◦ 𝑃(𝑇𝑢𝑦ế𝑡 = ẩ𝑚 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 1/5 ◦ 𝑃(𝑇𝑢𝑦ế𝑡 = 𝑘ℎô | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 1/5 18
- Ví dụ 1 Ước lượng 𝑃 𝑋2 = 𝑥𝑖 𝑌 = 𝑐 , với 𝑋2 ≡ 𝑇ℎờ𝑖 𝑡𝑖ế𝑡 ◦ 𝑃(𝑇ℎờ𝑖 𝑡𝑖ế𝑡 = 𝑔𝑖ó | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 2/9 ◦ 𝑃(𝑇ℎờ𝑖 𝑡𝑖ế𝑡 = 𝑛ắ𝑛𝑔 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 5/9 ◦ 𝑃(𝑇ℎờ𝑖 𝑡𝑖ế𝑡 = 𝑠ươ𝑛𝑔 𝑚ù | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 2/9 ◦ 𝑃(𝑇ℎờ𝑖 𝑡𝑖ế𝑡 = 𝑔𝑖ó | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 1/5 ◦ 𝑃(𝑇ℎờ𝑖 𝑡𝑖ế𝑡 = 𝑛ắ𝑛𝑔 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 1/5 ◦ 𝑃(𝑇ℎờ𝑖 𝑡𝑖ế𝑡 = 𝑠ươ𝑛𝑔 𝑚ù | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 3/5 19
- Ví dụ 1 Ước lượng 𝑃 𝑋3 = 𝑥𝑖 𝑌 = 𝑐 , với 𝑋3 ≡ 𝑀ù𝑎 ◦ 𝑃(𝑀ù𝑎 = 𝑐𝑎𝑜 đ𝑖ể𝑚 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 1/9 ◦ 𝑃(𝑀ù𝑎 = 𝑣ắ𝑛𝑔 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 6/9 ◦ 𝑃(𝑀ù𝑎 = 𝑣ừ𝑎 𝑝ℎả𝑖 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑐ó) = 2/9 ◦ 𝑃(𝑀ù𝑎 = 𝑐𝑎𝑜 đ𝑖ể𝑚 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 1/5 ◦ 𝑃(𝑀ù𝑎 = 𝑣ắ𝑛𝑔 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 3/5 ◦ 𝑃(𝑀ù𝑎 = 𝑣ừ𝑎 𝑝ℎả𝑖 | 𝑇𝑟ượ𝑡 𝑡𝑢𝑦ế𝑡 = 𝑘ℎô𝑛𝑔) = 1/5 20
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài Gi ảng Hệ Thống Thông Tin Quản Lý-Ths. Lê Thành Trung
18 p | 95 | 15
-
Bài giảng Các hệ quản trị cơ sở dữ liệu: Bài tập - Tiết Gia Hồng
4 p | 156 | 9
-
Bài giảng Các hệ thống Tin học công nghiệp (Industrial Information Systems): Chương giới thiệu - Bùi Quốc Anh
3 p | 92 | 7
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 1 - TS. Đặng Tuấn Linh
67 p | 13 | 5
-
Bài giảng Các hệ thống thông tin và chiến lược
17 p | 20 | 5
-
Bài giảng Các hệ thống thông tin tích hợp
63 p | 27 | 5
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 8 - TS. Đặng Tuấn Linh
50 p | 14 | 5
-
Bài giảng Các hệ cơ sở dữ liệu - Lương Trần Hy Hiến
2 p | 100 | 5
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 7 - TS. Đặng Tuấn Linh
33 p | 11 | 4
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 6 - TS. Đặng Tuấn Linh
47 p | 14 | 4
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 5 - TS. Đặng Tuấn Linh
72 p | 10 | 4
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 4 - TS. Đặng Tuấn Linh
53 p | 12 | 4
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 3 - TS. Đặng Tuấn Linh
82 p | 12 | 4
-
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 2 - TS. Đặng Tuấn Linh
118 p | 26 | 4
-
Bài giảng Các hệ thống Tin học công nghiệp (Industrial Information Systems): Chương 4 - Bùi Quốc Anh
17 p | 33 | 4
-
Bài giảng Các hệ thống thông minh nhân tạo và ứng dụng - Chương 1: Giới thiệu môn học
8 p | 48 | 4
-
Bài giảng Các hệ thống Tin học công nghiệp (Industrial Information Systems): Chương 0 - Bùi Quốc Anh
8 p | 46 | 4
-
Bài giảng Các hệ quản trị cơ sở dữ liệu: Giới thiệu hệ quản trị cơ sở dữ liệu - ThS. Hoàng Mạnh Hà
7 p | 110 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn