ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐI HỌC CÔNG NGHỆ THÔNG TIN
1
CS431 CÁC KỸ THUẬT HỌC SÂU
VÀ ỨNG DỤNG
TS. Nguyễn Vinh Tiệp
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
Bài 06
Recurrent Neural Network
20/10/2023
NỘI DUNG
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
1. hình ngôn ngữ (Bài toán trong NLP)
2. Giới thiệu về RNN
1. Các ví dụ thực tiễn
2. Kiến trúc
3. Các vấn đề & hướng giải quyết
1. Vanishing và Exploding Gradients
20/10/2023
Mô hình ngôn ngữ (Language Model)
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
20/10/2023 3
Language Model là bài toán dự đoán các từ tiếp theo trong
một câu.
Cho trước (m-1) từ, LM tính toán xác suất để dự đoán từ
thứ m.
Mô hình ngôn ngữ (Language Model)
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
20/10/2023 4
Language Model tính toán xác suất của một chuỗi từ (chuỗi
ký tự):
Sử dụng trong nhiều ứng dụng:
Sắp xếp các từ theo đúng thứ tự
Sử dụng các từ đúng ngữ pháp (ngữ pháp/cú pháp)
Sử dụng c từ đúng ngữ nghĩa (ngữ nghĩa)
Mô hình ngôn ngữ (Language Model) - Ứng dụng
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
20/10/2023 5