
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
HÀ THỊ THU GIANG
NGHIÊN CỨU VỀ NHẬN DẠNG TIẾNG NÓI
ỨNG DỤNG VÀO ĐIỀU KHIỂN XE LĂN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2017

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
HÀ THỊ THU GIANG
NGHIÊN CỨU VỀ NHẬN DẠNG TIẾNG NÓI
ỨNG DỤNG VÀO ĐIỀU KHIỂN XE LĂN
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS. Vũ Việt Vũ
THÁI NGUYÊN - 2017

i
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Nghiên cứu về nhận dạng tiếng nói ứng
dụng vào điều khiển xe lăn” là công trình nghiên cứu của riêng tôi, các kết quả
nghiên cứu được trình bày trong luận án là trung thực, khách quan và chưa
từng dùng bảo vệ để lấy bất kì học vị nào. Trong phần kiến thức chung,
nghiên cứu giải thuật áp dụng tôi có tham khảo ở một số tài liệu và đã có trích
dẫn đúng và đầy đủ. Nếu sai tôi hoàn toàn chịu trách nhiệm trước hội đồng
khoa học và trước pháp luật.
Thái Nguyên, tháng 11 năm 2017
Tác giả luận văn
Hà Thị Thu Giang

ii
LỜI CẢM ƠN
Đầu tiên, em xin bày tỏ lòng biết ơn chân thành tới thầy Vũ Việt Vũ,
người đã tận tình hướng dẫn và tạo mọi điều kiện thuận lợi để em hoàn thành
luận văn này.
Em cũng xin cảm ơn sự dạy dỗ và giúp đỡ nhiệt tình của tất cả các quý
thầy cô tại trường đại học Công Nghệ Thông Tin và Truyền Thông Thái
Nguyên. Tất cả các kiến thức mà em được truyền đạt sẽ là hành trang quí giá
trên con đường học tập, làm việc và nghiên cứu sau này.
Em xin chân thành cảm ơn!
Thái Nguyên, tháng năm 2017
Tác giả luận văn
Hà Thị Thu Giang

iii
MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC TỪ VIẾT TẮT ...................................................................................... v
DANH MỤC CÁC BẢNG ........................................................................................ vi
DANH MỤC CÁC HÌNH ........................................................................................ vii
MỞ ĐẦU ..................................................................................................................... 1
Chương 1 ..................................................................................................................... 3
TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI ........................................................ 3
1.1 Tổng quan về lĩnh vực xử lý tiếng nói ............................................................... 3
1.1.1. Tiếng nói là gì? ........................................................................................... 3
1.1.2. Biểu diễn tín hiệu tiếng nói ........................................................................ 3
1.1.3. Các bài toán trong lĩnh vực xử lý tiếng nói ................................................ 6
1.2. Nhận dạng tiếng nói .......................................................................................... 7
1.2.1. Khái niệm nhận dạng tiếng nói .................................................................. 7
1.2.2 Tổng quan về bài toán nhận dạng ................................................................ 9
1.2.3. Các bước xử lý trong bài toán nhận dạng tiếng nói ................................. 11
1.3. Các khó khăn gặp phải trong nghiên cứu về nhận dạng tiếng nói .................. 14
1.4. Nghiên cứu về nhận dạng tiếng nói ở Việt Nam ............................................ 15
1.5. Ứng dụng ........................................................................................................ 16
1.6. Kết luận ........................................................................................................... 16
Chương 2 ................................................................................................................... 17
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG TIẾNG NÓI .............. 17
2.1. Mô hình Markov ẩn (Hidden Markov Model - HMM) .................................. 17
2.1.1. Chuỗi Markov ........................................................................................... 17
2.1.2. Mô hình Markov ẩn .................................................................................. 18
2.1.3. Tính Likelihood: thuật toán Forward ....................................................... 21
2.1.4. Thuật toán Viterbi cho bài toán giải mã ................................................... 25
2.1.5. Học trên mô hình Markov ẩn: Thuật toán Forward-Backward ................ 27

