B GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HC BÁCH KHOA HÀ NI
Phm Ngọc Hưng
NHN DNG T ĐỘNG TING NÓI PHÁT ÂM LIÊN TC
CHO CÁC PHƯƠNG NGỮ CHÍNH CA TING VIT
THEO PHƯƠNG THỨC PHÁT ÂM
Chuyên ngành: H thng thông tin
Mã s: 62480104
LUN ÁN TIN SĨ H THNG THÔNG TIN
NGƯỜI NG DN KHOA HC:
1. PGS.TS. Trịnh Văn Loan
2. TS. Nguyn Hng Quang
Hà Ni - 2017
2
LỜI CAM ĐOAN
Tôi xin cam đoan tt c các ni dung trong luận án “Nhận dng t động tiếng nói
phát âm liên tục cho các phương ng chính ca tiếng Vit theo phương thức phát âm”
công trình nghiên cu ca riêng tôi. Các s liu, kết qu trong lun án trung thc
chưa từng được công b trong bt k công trình nào. Vic tham kho c ngun tài liệu đã
được thc hin trích dn và ghi ngun tài liu tham khảo đúng quy định.
TP TH NG DN KHOA HC
TÁC GI LUN ÁN
PGS.TS. Trịnh Văn Loan
Phm Ngọc Hưng
TS. Nguyn Hng Quang
3
LI CẢM ƠN
Tôi xin bày t lòng biết ơn tới Trường Đại hc Bách khoa Hà Ni, Vin Công ngh
Thông tin Truyn thông, B môn K thut máy tính, B môn H thống thông tin đã tạo
điều kin thun li cho tôi trong quá trình hc tp tại Trường.
Tôi mun gi li cảm ơn đặc bit ti tp th hướng dn trc tiếp
PGS.TS. Trịnh Văn Loan TS. Nguyn Hng Quang. Hai Thy đã luôn tận tình giúp đỡ,
đưa ra những li khuyên, những định hướng khoa hc rất quý báu để tôi th trin khai
và hoàn thành công vic nghiên cu ca mình.
Xin chân thành cảm ơn các thầy cô, các đồng nghip trong B môn H thng
Thông tin, B môn K thut máy tính, Vin Công ngh Thông tin Truyn thông,
Trường Đi hc Bách khoa Ni nơi tôi hc tp, thc hiện đề tài nghiên cứu đã nhit
tình giúp đỡ và động viên tôi trong sut quá trình nghiên cu.
Cảm ơn Khoa Công ngh Thông tin Tng Đại học phm K thut Hưng
Yên, nơi tôi đang công tác đã luôn tạo điều kin cho tôi trong sut quá trình nghiên cu và
hoàn thành lun án này.
Vi tm lòng biết ơn đến các thy cô, các nhà khoa học, các đồng nghip và bn
thân hữu đã động viên và giúp đỡ tôi trong quá trình nghiên cu.
Cui cùng tôi mun y t lòng biết ơn sâu sc tới gia đình, nơi nuôi dưỡng
nguồn động lực để tôi vượt mi tr ngại khó khăn để hoàn thành lun án này.
Phm Ngọc Hưng
4
MC LC
MC LC ............................................................................................................................. 4
GII THÍCH CÁC KÝ HIU VÀ CH VIT TT ............................................................ 7
DANH MC CÁC BNG .................................................................................................. 10
DANH MC CÁC HÌNH ẢNH, ĐỒ TH .......................................................................... 12
M ĐẦU ............................................................................................................................. 14
1. TNG QUAN V NHN DNG TING NÓI NHN DNG PHƯƠNG NGỮ
18
1.1. Nhn dng tiếng nói .............................................................................................. 18
1.1.1. Tng quan v nhn dng tiếng nói ................................................................ 18
1.1.2. Lch s phát trin và các tiến b trong nghiên cu nhn dng tiếng nói ...... 19
1.1.3. Các thách thức đối vi nhn dng t động tiếng nói ..................................... 20
1.1.4. Phân loi h thng nhn dng t động tiếng nói ........................................... 21
1.2. Nhn dạng phương ngữ ......................................................................................... 23
1.2.1. Các mô hình nhn dạng phương ngữ ............................................................. 23
1.2.2. Nhn dạng phương ngữ theo các phương diện khác nhau ............................. 24
1.3. Nghiên cu nhn dng tiếng nói và nhn dạng phương ngữ tiếng Vit ............... 29
1.4. Mt s mô hình nhn dng ................................................................................... 30
1.4.1. Mô hình GMM .............................................................................................. 30
1.4.2. B phân lp SVM .......................................................................................... 32
1.4.3. Mạng nơ ron nhận to .................................................................................... 38
1.5. Kết chương ............................................................................................................ 54
2. XÂY DNG B NG LIU CHO NGHIÊN CU NHN DẠNG PHƯƠNG NGỮ
TING VIT ....................................................................................................................... 56
2.1. Tổng quan phương ngữ tiếng Vit ........................................................................ 56
2.1.1. Phương ngữ và phân vùng phương ngữ tiếng Vit ........................................ 56
2.1.2. Đặc điểm ng âm ba vùng phương ngữ chính ca tiếng Vit ....................... 57
2.1.3. S khác bit v t vng và ng nghĩa giữa ba vùng phương ngữ tiếng Vit 58
2.2. Cu trúc âm tiết, âm v trong phương ngữ tiếng Vit ........................................... 60
2.2.1. Âm tiết và âm v trong tiếng Vit .................................................................. 60
2.2.2. Âm đệm và cách kết hợp âm đệm trong các phương ngữ ............................. 64
5
2.3. Ph âm đầu trong phương ngữ tiếng Vit ............................................................. 65
2.3.1. H thng ph âm đầu ..................................................................................... 65
2.3.2. So sánh h thng ph âm đầu ba phương ngữ Bc-Trung-Nam ................... 67
2.4. H thống thanh điệu và các biến th trong phương ngữ tiếng Vit ...................... 67
2.4.1. H thống thanh điệu Hà Ni .......................................................................... 68
2.4.2. H thống thanh điệu Ngh - Tĩnh và Huế ...................................................... 68
2.4.3. H thống thanh điệu Đà Nẵng và Thành ph H Chí Minh .......................... 69
2.4.4. Mt s nhn xét v h thống thanh điệu các phương ngữ ............................. 70
2.5. Ảnh hưởng của phương ngữ ti nhn dng tiếng nói ........................................... 71
2.6. Ng liệu phương ngữ trên thế gii xây dng b ng liu dùng cho nhn dng
phương ngữ tiếng Vit ..................................................................................................... 71
2.6.1. Phương pháp xây dựng b ng liệu phương ngữ tiếng Vit ......................... 72
2.6.2. Chun b và chuẩn hóa văn bản ..................................................................... 73
2.6.3. Ghi âm ........................................................................................................... 75
2.6.4. Kết qu ghi âm và đặc tính VDSPEC ............................................................ 78
2.7. Phân tích mt s đặc trưng phương ngữ tiếng Vit ca b ng liu VDSPEC .... 79
2.7.1. Biến thiên tn s cơ bản F0 theo thanh điệu của ba phương ngữ .................. 79
2.7.2. Phân tích thng kê phân b F0 của các thanh điệu ........................................ 81
2.7.3. Phân tích d liu dùng LDA .......................................................................... 83
2.8. Kết chương ............................................................................................................ 87
3. NHN DẠNG PHƯƠNG NGỮ TING VIT .......................................................... 89
3.1. Nhn dạng phương ngữ tiếng Vit vi GMM ...................................................... 89
3.1.1. Công c th nghim nhn dạng phương ngữ ALIZE .................................... 89
3.1.2. La chn s ng h s MFCC .................................................................... 91
3.1.3. Th nghim nhn dạng phương ngữ tiếng Việt trong trường hp kết hp
MFCC vi tham s F0 ................................................................................................. 92
3.1.4. Th nghim nhn dạng phương ngữ tiếng Việt trong trường hp kết hp
formant, dải thông tương ứng và tham s F0 .............................................................. 95
3.1.5. Ảnh hưởng ca s ng thành phần Gauss đối vi hiệu năng nhận dng
phương ngữ tiếng Vit ................................................................................................. 96
3.2. SVM nhn dạng phương ngữ tiếng Vit ............................................................... 98
3.2.1. B phân lp SMO .......................................................................................... 98