ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐI HỌC CÔNG NGHỆ THÔNG TIN
1
CS431 CÁC KỸ THUẬT HỌC SÂU
VÀ ỨNG DỤNG
TS. Nguyễn Vinh Tiệp
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
Bài 05
Học sâu trong xử lý ngôn ngữ tự nhiên
Word2Vec
10/10/2023
NỘI DUNG
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
1. Xử ngôn ngữ tự nhiên (NLP)
2. Học sâu trong xử lý ngôn ngữ tự nhiên
3. Word2Vec
10/10/2023
Xử lý ngôn ngữ tự nhiên (NLP)
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
10/10/2023 3
Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực nghiên cứu kết hợp Khoa
học máy tính (CS), Trí tuệ nhân tạo (AI) và Ngôn ngữ học
Mục tiêu: Máy tính có thể hiểu được ngôn ngữ của con người
NLP Thách thức
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
10/10/2023 4
Sự mơ hồ -“Ông già đi nhanh quá”
Ngôn ngữ không chuẩn - "M0ther ui, hum n4i con hk zia,
k0n f4i h0k th3m"
Thành ngữ -“Ra ngô ra khoai”
Phụ thuộc vào bối cảnh và kiến thức thực tế
NLP Ứng dụng
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
10/10/2023 5
Kiểm tra chính t
(Spelling checking)
Phát hiện thư rác
(Spam detection)
Gán nhãn từ loại
(Part-of-speech tagging)
Nhận dạng các đối tượng tên riêng
(Named entity recognition)
Tìm kiếm từ khóa
(Keyword search)
Tìm kiếm từ đồng nghĩa
(Synonym search)