
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
CẤP CƠ SỞ
NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU
PHI TUYẾN TRONG MIỀN WAVELET NHẰM
NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI
Mã số: T2016-07-05
Chủ nhiệm đề tài: ThS. Dương Ngọc Pháp
Đà Nẵng, 12/2016

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
CẤP CƠ SỞ
NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU
PHI TUYẾN TRONG MIỀN WAVELET NHẰM
NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI
Mã số: T2016-07-05
Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài
Đà Nẵng, 12/2016

MỤC LỤC
i
MỤC LỤC
DANH MỤC HÌNH VẼ .................................................................................................. 1
DANH MỤC BẢNG BIỂU ............................................................................................. 3
DANH MỤC TỪ VIẾT TẮT .......................................................................................... 4
THÔNG TIN KẾT QUẢ NGHIÊN CỨU ....................................................................... 6
MỞ ĐẦU ......................................................................................................................... 8
I. TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU THUỘC LĨNH VỰC ĐỀ TÀI
TRONG VÀ NGOÀI NƯỚC .......................................................................................... 8
1. NGOÀI NƯỚC ......................................................................................................... 8
2. TRONG NƯỚC......................................................................................................... 8
II. TÍNH CẤP THIẾT CỦA ĐỀ TÀI ............................................................................ 8
III. MỤC TIÊU CỦA ĐỀ TÀI ........................................................................................ 9
IV. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU .......................................................... 9
1. ĐỐI TƯỢNG NGHIÊN CỨU ....................................................................................... 9
2. PHẠM VI NGHIÊN CỨU ........................................................................................... 9
V. NỘI DUNG NGHIÊN CỨU ..................................................................................... 9
CHƯƠNG 1:TỔNG QUAN VỀ XỬ LÝ TIẾNG NÓI ................................................. 10
1.1. GIỚI THIỆU CHƯƠNG ..................................................................................... 10
1.2. TỔNG QUAN VỀ PHÂN TÍCH TÍN HIỆU TIẾNG NÓI .................................. 10
1.2.1. Đặc điểm ngôn ngữ học của tiếng nói ....................................................... 10
1.2.2. Xử lý tiếng nói ........................................................................................... 10
1.3. NHIỄU ................................................................................................................ 15
1.4. NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI ........................................................ 17
1.5. CÁC KỸ THUẬT GIẢM NHIỄU ...................................................................... 18
1.5.1. Các thuật toán trừ phổ ............................................................................... 19
1.5.2. Sử dụng bộ lọc Wiener .............................................................................. 19
1.5.3. Hàm nén nhiễu dựa trên ước lượng MMSE .............................................. 19
1.6. ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI ......................................................... 20
1.6.1. Phương pháp đánh giá chủ quan................................................................ 20
1.6.2. Phương pháp đánh giá khách quan ............................................................ 23
1.7. KẾT LUẬN CHƯƠNG ...................................................................................... 26
CHƯƠNG 2:CÁC PHƯƠNG PHÁP GIẢM NHIỄU TÍN HIỆU TIẾNG NÓI TRONG
MIỀN WAVELET ......................................................................................................... 27
2.1. GIỚI THIỆU CHƯƠNG ..................................................................................... 27
2.2. PHÉP BIẾN ĐỔI WAVELET ............................................................................ 27

MỤC LỤC
ii
2.3. MÔ HÌNH NHIỄU CỘNG TRONG MIỀN WAVELET .................................... 29
2.4. KỸ THUẬT CHỌN NGƯỠNG .......................................................................... 29
2.5. HÀM NÉN NHIỄU ............................................................................................. 30
2.6. THUẬT TOÁN GIẢM NHIỄU DÙNG PHƯƠNG PHÁP LỌC WAVELET CÓ
TÍNH CẢM QUAN PSWF ........................................................................................ 32
2.6.1. Ánh xạ ngưỡng giác quan .......................................................................... 32
2.6.2. Kỹ thuật lọc percentile thích nghi ............................................................. 33
2.6.3. Trọng số hóa trong miền thời gian và tần số ............................................. 34
2.6.4. Hàm nén nhiễu thích nghi.......................................................................... 35
2.7. KẾT LUẬN CHƯƠNG ...................................................................................... 36
CHƯƠNG 3:THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ ..................... 37
3.1. GIỚI THIỆU CHƯƠNG ..................................................................................... 37
3.2. CƠ SỞ DỮ LIỆU ................................................................................................ 37
3.3. KẾT QUẢ ĐÁNH GIÁ VÀ PHÂN TÍCH .......................................................... 38
3.3.1. Kết quả đánh giá theo phương pháp LLR ................................................. 39
3.3.2. Đánh giá hiệu quả nén nhiễu trên các môi trường nhiễu khác nhau ......... 42
3.3.3. Hiệu quả các hàm nén nhiễu theo các phương pháp đánh giá khác nhau . 46
3.3.4. Kết quả phương pháp đánh giá cảm quan PESQ cho các môi trường nhiễu
(Babble, Car, White, Train, Street)........................................................................ 52
3.3.5. Kết quả đánh giá CEP-PESQ-WSS-SNRseg với các thuật toán nén nhiễu ..
................................................................................................................... 55
3.4. KẾT LUẬN CHƯƠNG ...................................................................................... 60
KẾT LUẬN ................................................................................................................... 61
KIẾN NGHỊ ................................................................................................................... 61

DANH MỤC HÌNH VẼ
Trang 1
DANH MỤC HÌNH VẼ
Hình 1.1: Dạng sóng của tín hiệu âm thanh trong miền thời gian ............................... 11
Hình 1.2: Tín hiệu tiếng nói được thu từ hai micro khác nhau [1]. ............................... 11
Hình 1.3: Tín hiệu tiếng nói từ hai người khác nhau [1]. .............................................. 11
Hình 1.4: Tín hiệu tiếng nói do một người nói tại hai thời điểm khác nhau [1]. .......... 12
Hình 1.5: Dạng sóng và công suất phổ tín hiệu tiếng nói theo thời gian ...................... 12
Hình 1.6: Đường bao phổ tín hiệu tiếng nói do hai người nói khác nhau ..................... 13
Hình 1.7: Dạng sóng và ảnh phổ của các tín hiệu tiếng nói: sạch, bị nhiễu và tín hiệu
đã được tăng cường ....................................................................................................... 13
Hình 1.8: Kỹ thuật phân khung [1]. ............................................................................... 14
Hình 1.9: a) Biên độ và b) Trung bình phổ biên độ nhiễu xe (Car) .............................. 15
Hình 1.10: a) Biên độ và b) Trung bình phổ biên độ nhiễu đường phố (Street) ........... 16
Hình 1.11: a) Biên độ và b) Trung bình phổ biên độ nhiễu nhà hàng (Restaurant) ...... 16
Hình 1.12: Mô hình nhiễu cộng ..................................................................................... 17
Hình 1.13: Sơ đồ khối tổng quát thuật toán giảm nhiễu ................................................ 17
Hình 2.1: Miền phân tích của phép biến đổi Wavelet ................................................... 28
Hình 2.2: Cấu trúc cây phân chia gói ............................................................................ 29
Hình 2.3: Đặc tuyến hàm nén nhiễu ngưỡng cứng trong miền Wavelet [16]. .............. 31
Hình 2.4: Đặc tuyến hàm nén nhiễu ngưỡng mềm trong miền Wavelet [16]. .............. 31
Hình 2.5: Sơ đồ của thuật toán PSWF [14]. .................................................................. 32
Hình 2.6: Mô tả cách lấy percentile q để xác định ngưỡng thích nghi cho từng kênh
Wavelet [14]. ................................................................................................................. 34
Hình 2.7: Đặc tuyến hàm nén nhiễu thích nghi trong miền Wavelet [16]. .................. 36
Hình 3.1: Đáp ứng tần số của bộ lọc IRS ...................................................................... 37
Hình 3.2: Kết quả đánh giá LLR của 6 thuật toán tăng cường chất lượng tiếng nói với
loại nhiễu tiếng ồn đám đông (Bable). .......................................................................... 39
Hình 3.3: Kết quả đánh giá LLR của 6 thuật toán tăng cường chất lượng tiếng nói với
loại nhiễu tiếng ồn ôtô (Car). ......................................................................................... 40
Hình 3.4: Kết quả đánh giá LLR của 6 thuật toán tăng cường chất lượng tiếng nói với
loại nhiễu trắng (White). ................................................................................................ 40
Hình 3.5: Kết quả đánh giá LLR của 6 thuật toán tăng cường chất lượng tiếng nói với
loại nhiễu tàu hỏa (Train). ............................................................................................. 41
Hình 3.6: Kết quả đánh giá LLR của 6 thuật toán tăng cường chất lượng tiếng nói với
loại nhiễu đường phố (Street). ....................................................................................... 41
Hình 3.7: Kết quả đánh giá hàm nén ngưỡng cứng cho 5 môi trường nhiễu. ............... 42
Hình 3.8: Kết quả đánh giá hàm nén ngưỡng mềm cho 5 môi trường nhiễu. ............... 43