
ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
1
CS431 – CÁC KỸ THUẬT HỌC SÂU
VÀ ỨNG DỤNG
TS. Nguyễn Vinh Tiệp
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
Bài 05
Học sâu trong xử lý ngôn ngữ tự nhiên
Word2Vec
10/10/2023

NỘI DUNG
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
1. Xử lý ngôn ngữ tự nhiên (NLP)
2. Học sâu trong xử lý ngôn ngữ tự nhiên
3. Word2Vec
10/10/2023

Xử lý ngôn ngữ tự nhiên (NLP)
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
10/10/2023 3
●Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực nghiên cứu kết hợp Khoa
học máy tính (CS), Trí tuệ nhân tạo (AI) và Ngôn ngữ học
●Mục tiêu: Máy tính có thể hiểu được ngôn ngữ của con người

NLP – Thách thức
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
10/10/2023 4
●Sự mơ hồ -“Ông già đi nhanh quá”
●Ngôn ngữ không chuẩn - "M0ther ui, hum n4i con hk zia,
k0n f4i h0k th3m"
●Thành ngữ -“Ra ngô ra khoai”
●Phụ thuộc vào bối cảnh và kiến thức thực tế

NLP – Ứng dụng
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
10/10/2023 5
●Kiểm tra chính tả
(Spelling checking)
●Phát hiện thư rác
(Spam detection)
●Gán nhãn từ loại
(Part-of-speech tagging)
●Nhận dạng các đối tượng tên riêng
(Named entity recognition)
●Tìm kiếm từ khóa
(Keyword search)
●Tìm kiếm từ đồng nghĩa
(Synonym search)