
iii
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................................... i
LỜI CẢM ƠN ......................................................................................................................... ii
Danh mục các ký hiệu và chữ viết tắt ......................................................................... v
Danh mục các bảng .......................................................................................................... vi
Danh mục các hình vẽ, đồ thị ..................................................................................... vii
MỞ ĐẦU ................................................................................................................................. 1
CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN BIẾT NGÔN NGỮ ............... 3
1.1 Giới thiệu chung .......................................................................................... 3
1.2 Các phương pháp xác định ngôn ngữ .......................................................... 3
1.2.1 Mô hình ngôn ngữ ................................................................................ 3
1.2.2 Phương pháp xác định ngôn ngữ dựa trên n-gram ............................... 6
1.2.3 Phương pháp xác định ngôn ngữ dựa vào Naive Bayes ...................... 7
1.2.4 Phương pháp xác định ngôn ngữ dựa vào máy hỗ trợ vectơ (SVM) ... 8
1.2.5 Phương pháp láng giềng gần nhất (K-Nearest Neighbor).................... 9
1.2.6 Phương pháp Word2vec ..................................................................... 10
1.2.6.1 Skip-gram .................................................................................... 12
1.2.6.2 Túi từ liên tục (CBOW) .............................................................. 16
1.2.7 Phương pháp xác định ngôn ngữ dựa vào học sâu ............................. 17
CHƯƠNG 2: MÔ HÌNH MẠNG LSTM ....................................................................... 18
2.1 Mạng Nơ ron nhân tạo .............................................................................. 18
2.1.1 Hàm kích hoạt. ................................................................................... 19
2.1.2 Chức năng kích hoạt đầu ra ................................................................ 22
2.2 Mạng nơ ron hồi qui RNN ........................................................................ 25
2.3 Mạng LSTM .............................................................................................. 27
2.3.1 Cổng đầu vào, cổng quên và cổng đầu ra .......................................... 27
2.3.2 Ô nhớ tiềm năng ................................................................................. 28
2.3.3 Ô nhớ .................................................................................................. 29
2.3.4 Các trạng thái ẩn ................................................................................. 30
2.4 Kỹ thuật Dropout ....................................................................................... 31