
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
MỤC LỤC
DANH MỤC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
DANH MỤC HÌNH VẼ
DANH MỤC CÁC BẢNG, ĐỒ THỊ
CHƯƠNG 1 MỞ ĐẦU
1.1 Lý do chọn đề tài 1
1.2 Mục tiêu nghiên cứu 2
1.3 Đối tượng, phạm vi nghiên cứu 2
1.4 Phương pháp nghiên cứu 3
1.5 Ý nghĩa khoa học và thực tiễn 3
1.6 Bố cục luận văn 4
CHƯƠNG 2 TỔNG QUAN 5
2.1 Công trình nghiên cứu có liên quan 5
2.2 Người Ba Na 5
2.2.1. Ngôn ngữ tiếng Ba Na 7
2.2.2. Từ điển Ba Na Kriêm 7
2.2.3. Bảng chữ cái và dấu tiếng Ba Na 8
2.2.4. Một số quy luật của tiếng Ba Na 9
2.3 Vấn đề chung còn tồn đọng 10
CHƯƠNG 3 CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP ĐỀ XUẤT
11
3.1 Mô hình ngôn ngữ 11
3.2 Kiến trúc RNN 12
3.3 Kiến trúc LSTM 13
3.4 Xây dựng tập dữ liệu tiếng Ba Na 15
3.4.1. Thu thập dữ liệu văn bản 17
3.4.2. Làm giàu dữ liệu 18
3.5 Đặt bài toán cho mô hình ngôn ngữ tiếng Ba Na 24
3.6 Đề xuất hướng giải quyết 25
3.7 Các đặc trưng của mô hình đề xuất 26
3.7.1. Xây dựng mô hình ngôn ngữ mức ký tự tiếng Ba Na left-
to-right (Char L2R) 26
3.7.2. Xây dựng mô hình ngôn ngữ mức ký tự tiếng Ba Na
right-to-left (Char R2L) 27
3.7.3. Xây dựng mô hình ngôn ngữ mức ký tự tiếng Ba Na
Look-ahead 28
CHƯƠNG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ 30
4.1 Tiêu chí đánh giá với độ đo WER 30
4.2 Chuẩn bị dữ liệu 30
4.3 Huấn luyện dữ liệu 31
4.4 Kết quả thực nghiệm 32