
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
NGÔ HOÀNG HUY
NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ
RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT
LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT
LUẬN ÁN TIẾN SĨ TOÁN HỌC
Hà Nội – 2016

2
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
NGÔ HOÀNG HUY
NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ
RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT
LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT
Chuyên ngành: Cơ sở Toán học cho Tin học
Mã số: 62 46 01 10
LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS. LƯƠNG CHI MAI
2. PGS.TS. NGÔ QUỐC TẠO
Hà Nội – 2016

3
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết quả
nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép từ bất kỳ một
nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã được thực hiện
trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Tác giả luận án
Ngô Hoàng Huy

4
LỜI CẢM ƠN
Luận án này báo cáo một phần các kết quả nghiên cứu và làm việc của tôi trong hơn
hai chục năm qua. Trong suốt thời gian này ngoài nỗ lực làm việc của bản thân tôi, phòng
Nhận dạng và Công nghệ Tri thức, Viện Công nghệ Thông tin đã tạo cho tôi một môi trường
làm việc, điều kiện để thực hiện các nghiên cứu về chuyên nghành rộng là nhận dạng và
chuyên nghành hẹp nhận dạng và tổng hợp tiếng Việt.
Tôi xin chân thành cảm ơn PGS.TS Lương Chi Mai và PGS.TS Ngô Quốc Tạo đã chỉ
dẫn tôi làm việc trong bước đường khoa học của tôi, tận tình chỉ dẫn tôi để hoàn thành được
luận án này.
Xin cảm ơn các đồng nghiệp tại Phòng Nhận dạng và Công nghệ tri thức, Viện Công
nghệ Thông tin đã đóng góp những ý kiến thiết thực để tôi hiệu chỉnh lại các tiếp cận nghiên
cứu của mình, cảm ơn các kỹ sư tại công ty Cổ phần Phần mềm và Công nghệ ứng dụng đã hỗ
trợ tôi thử nghiệm các kết quả về tổng hợp và nhận dạng khẩu lệnh tiếng Việt trên nền tảng
chip PSoC.
Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới vợ tôi Mai Thị Bạch Tuyết mà thiếu
điều này chắc chắn tôi đã không đủ nghị lực để hoàn thành bản luận án này.

5
MỤC LỤC
Danh mục các thuật ngữ và từ viết tắt i
Danh sách bảng ii
Danh sách hình vẽ iii
MỞ ĐẦU 1
1. Tính cấp thiết của đề tài .................................................................................... 1
2. Mục tiêu, phạm vi nghiên cứu của luận án. ....................................................... 4
3. Phương pháp và nội dung nghiên cứu ............................................................... 5
4. Kết quả đạt được của luận án ............................................................................ 6
CHƯƠNG 1. TỔNG QUAN VỀ TỔNG HỢP VÀ NHẬN DẠNG TIẾNG
NÓI 10
1.1. Tổng hợp tiếng nói ....................................................................................... 10
1.1.1. Chuẩn hóa văn bản và phân tích câu – xử lý ngôn ngữ tự nhiên ........ 11
1.1.2. Chuyển văn bản sang đơn vị tiếng nói .............................................. 11
1.1.3. Dự báo ngôn điệu ............................................................................. 11
1.1.4. Các phương pháp tổng hợp tiếng nói ................................................ 12
1.1.5. Các hệ thống tổng hợp tiếng nói tiếng Việt ....................................... 21
1.1.6. Các tham số ngôn điệu ..................................................................... 23
1.1.7. Tổng quan về âm học và các hiện tượng ngôn điệu tiếng Việt trong
ngữ lưu ..................................................................................................... 25
1.1.8. Hiệu chỉnh đường tần số cơ bản ....................................................... 33
1.2. Nhận dạng tiếng nói ..................................................................................... 38
1.2.1. Liệt kê các lớp bài toán nhận dạng tiếng nói ..................................... 38
1.2.2. Môi trường thu nhận tín hiệu ............................................................ 39
1.2.3. Biểu diễn tiếng nói - đặc trưng tiếng nói ........................................... 40

