
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 1 - Hoàng Anh Việt
lượt xem 1
download

Bài giảng "Xử lý ngôn ngữ tự nhiên" Chương 1 - Giới thiệu tổng quan về Xử lý ngôn ngữ tự nhiên; được biên soạn gồm các nội dung chính sau: Tổng quan; Các hướng nghiên cứu trong Xử lý ngôn ngữ; Những khó khăn trong Xử lý ngôn ngữ; Các ứng dụng cụ thể;...Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 1 - Hoàng Anh Việt
- Giảng viên: Hoàng Anh Việt hoanganhviet@gmail.com 2011
- Nội dung chương 01 2 ¨ Tổng quan ¨ Các hướng nghiên cứu trong XLNN ¨ Những khó khăn trong XLNN ¨ Các ứng dụng cụ thể 9/6/11
- Tổng quan 3 9/6/11
- Máy tính trung tâm- Trí tuệ ảo 4 9/6/11
- Ngôn ngữ tự nhiên 5 ¨ Ngôn ngữ dùng giao tiếp hằng ngày C++, java, c#? 9/6/11
- Xử lý ngôn ngữ tự nhiên (NLP) 6 ¨ Xử lý ngôn ngữ tự nhiên (natural language processing - NLP) là một trong những lĩnh vực khó nhất của trí tuệ nhân tạo, tập trung vào các ứng dụng "dạy" máy tính hiểu được ý nghĩa và tương tác, giao tiếp bằng chính ngôn ngữ con người. ¨ Kết quả trên thế giới >> Việt Nam. ¨ ‘Xử lý tiếng Việt’ phải do người Việt thực hiện. 9/6/11
- Chúng ta nên quan tâm NLP? 7 ¨ Xu hướng: ¤ Lượng lớn tri thức tồn tại ở dạng ngôn ngữ tự nhiên trên các thiết bị điện tử, máy tính ¤ Các phương tiện giao tiếp giữa con người ngày càng đóng vai trò quan trọng. Trong đó máy tính là trung gian. 9/6/11
- Tiềm năng 8 ¨ Ngành công nghiệp IT (Số liệu năm 2005): ¤ Yahoo, Google, AltaVista ($100-$1,000) mil./yr. à Information Retrieval ¤ Monster.com, HotJobs.com (Job finders) – a market expected to reach $4,5 billions in 2004 à Information Extraction + Information Retrieval ¤ Systran powers Babelfish AltaVista, (€ 24 mil./yr.) à Machine Translation ¤ Ask Jeeves ($60 mil./yr.) à Question Answering ¨ Nghiên cứu ¤ Các tập đoàn, công ty lớn có phòng thí nghiệm NLP: n IBM, Microsoft, AT&T, Xerox, Sun, etc. ¤ Phòng nghiên cứu, nhóm nghiên cứu tại các trường đại học. 9/6/11
- Thế giới thương mại 9 9/6/11 Slide from: Speech and Language Processing Jurafsky and Martin !
- Google Translate Slide from: Speech and Language Processing Jurafsky and Martin !
- Google Translate Slide from: Speech and Language Processing Jurafsky and Martin !
- Web Q/A Slide from: Speech and Language Processing Jurafsky and Martin !
- Xây dựng Máy tính trung tâm – Trí tuệ ảo 13 ¨ Các thử thách chính: ¤ Nhận dạng giọng nói ¤ Hiểu ngôn ngữ tự nhiên ¤ Truy vấn, trích rút thông tin ¤ Suy luận ¤ Sinh tiếng nói. ¤ … 9/6/11
- Các chủ đề nghiên cứu 14 ¨ Các ứng dụng ¨ Các mức phân tích ¨ Các bài toán con ¨ Các thuật toán và cách tiếp cận 9/6/11
- Các chủ đề nghiên cứu 15 ¨ Các Ứng dụng: ¤ Phân loại văn bản (Classify text into categories) ¤ Đánh chỉ số và tìm kiếm (Index and search large texts) ¤ Dịch tự động (Automatic translation) ¤ Hiểu tiếng nói (Speech understanding): n Hiểu nội dung hội thoại qua điện thoại. ¤ Khai phá thông tin (Information extraction) n Trích rút các thông tin quan trọng ¤ Tóm tắt văn bản (Automatic summarization) n Cô đọng 1 quyển sách trên một trang giấy ¤ Hỏi đáp (Question answering) ¤ Thu tri thức (Knowledge acquisition) ¤ Sinh ngôn ngữ (Text generations / dialogs) ¤ Kiểm tra cú pháp văn bản (grammar checking) ¨ … 9/6/11
- NLP trong Computer Science Computers Databases Artificial Intelligence Algorithms Networking Robotics Natural Language Processing Search Information Machine Language Retrieval Translation Analysis Semantics Parsing
- Nhiệm vụ của NLP Language Language Computer Understanding Generation
- Các chủ đề nghiên cứu 18 ¨ Các bài toán con: ¤ Tách từ ¤ Gán nhãn từ loại ¤ Phân cụm từ ¤ Phân tích cú pháp ¤ Phân giải nhập nhằng ¤ Phân tích ngữ nghĩa ¤ Phân tích thực nghĩa ¤ … ¨ Các thuật toán và phương pháp tiếp cận: ¤ Dựa từ điển, tập ngữ liệu (corpus) ¤ Dựa trên tri thức ¤ Thống kê ¤ Học máy 9/6/11 ¤ ….
- Các chủ đề nghiên cứu 19 ¨ Các mức phân tích: ¤ Phonology (âm vị): Âm, chữ cái và cách phát âm ¤ Morphology (hình thái học): Cách từ được xây dựng, các tiền tố và hậu tố cũng như thành tố chính. ¤ Syntax (cú pháp): Mối liên hệ giữa các từ và ngữ để tạo nên cấu trúc của câu. ¤ Semantics (ngữ nghĩa): Ý nghĩa của một từ hay một cụm từ, câu. ¤ Discourse (Diễn ngôn): Quan hệ giữa các ý hoặc các câu. ¤ Pragmatic (Thực chứng): mục đích phát ngôn, cách sử dụng ngôn ngữ trong giao tiếp ¤ World Knowledge (tri thức thế giới): các tri thức về thế giới, các tri thức ngầm 9/6/11
- NLP thực sự khó? 20 ¨ Máy tính thiếu: ¤ Trithức ¤ Khả năng suy luận ¤ Kinh nghiệm ¨ Những thực tế khó khăn tại Việt Nam: ¤ Bản thân ngôn ngữ: nhiều NHẬP NHẰNG ¤ Thiếu các tập ngữ liệu cần thiết ¤ Nghiên cứu rời rạc ¤ Chưa nhiều ứng dụng thực tế n Baomoi.com, VnDOCR 9/6/11

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 1 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
14 p |
181 |
13
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 2 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
8 p |
135 |
11
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 4 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
9 p |
103 |
10
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 3 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
7 p |
108 |
9
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 6 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
6 p |
106 |
9
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 5 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
12 p |
104 |
9
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 7 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)
7 p |
146 |
7
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Bài 1 - Lê Thanh Hương
13 p |
132 |
5
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 1 - Viện Công nghệ Thông tin và Truyền thông
50 p |
46 |
3
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 5b - Viện Công nghệ Thông tin và Truyền thông
41 p |
38 |
3
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 2 - Viện Công nghệ Thông tin và Truyền thông
20 p |
63 |
3
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 6 - Viện Công nghệ Thông tin và Truyền thông
67 p |
41 |
3
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 5a - Viện Công nghệ Thông tin và Truyền thông
117 p |
38 |
3
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 9 - Viện Công nghệ Thông tin và Truyền thông
74 p |
34 |
3
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 0 - Hoàng Anh Việt
7 p |
1 |
1
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 2 - Hoàng Anh Việt
32 p |
2 |
1
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 4 - Hoàng Anh Việt
40 p |
1 |
1


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
