Đ án t ồ ố t nghi p ệ

C NG HÒA XÃ H I CH NGHĨA VI T NAM Ộ Ộ Ủ Ệ

Đ c l p – T do – H nh phúc ộ ậ ự ạ

L I CAM ĐOAN Ờ

t nghi p Khoa Đi n t Kính g i:ử H i đ ng b o v đ án t ộ ồ ệ ồ ả ố ệ ử ệ _ Vi n thông ễ

_ Tr ng Đ i h c Bách Khoa Đà N ng. ườ ạ ọ ẵ

Em tên là: Nguy n Th Ng c Di p ệ ị ễ ọ

Hi n đang h c l p 04ĐT1- Khoa: Đi n t - Vi n thông – Tr ọ ớ ệ ử ệ ễ ườ ạ ng: Đ i

h c Bách Khoa Đà N ng. ọ ẵ

Nhóm em xin cam đoan n i dung c a đ án này không ph i là b n sao chép ủ ồ ả ả ộ

c. c a b t c đ án ho c công trình đã có t ặ ủ ấ ứ ồ tr ừ ướ

Sinh viên th c hi n ự ệ

Nguy n Th Ng c Di p ệ ị ễ ọ

Trang 1 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

M C L C Ụ Ụ

1 L I CAM ĐOAN ........................................................................................................ Ờ

2 M C L C .................................................................................................................... Ụ Ụ

4 DANH M C CÁC T VI T T T VÀ CÁC THU T NG TI NG ANH ........... Ừ Ế Ữ Ế Ụ Ắ Ậ

6 M Đ UỞ Ầ .....................................................................................................................

CH .... 10 ƯƠ NG 1: T NG QUAN V NÂNG CAO CH T L Ề Ấ ƯỢ Ổ NG TI NG NÓI Ế

CH NG 2 : ĐÁNH GIÁ CHÂT L 28 NG TIÊNG NOI .................................... ƯƠ ́ ƯỢ ́ ́

CH NG 3: THU T TOÁN SPECTRAL–SUBTRACTION VÀ WIENER ƯƠ Ậ

39 FILTERING ...............................................................................................................

CH 52 NG 4: TH C HI N VÀ ĐÁNH GIÁ CÁC THU T TOÁN .................... ƯƠ Ự Ậ Ệ

K T LU N Đ ÁN VÀ H 73 NG PHÁT TRI N Đ TÀI .................................. Ồ Ậ Ế ƯỚ Ể Ề

75 PH L C ................................................................................................................... Ụ Ụ

DANH MỤC CÁC HÌNH VẼ VÀ BẢNG

12 ................................................................................ Hình 1.1 Tín hi u ti ng nói [2]. ệ ế

ng trung bình nhi u trên xe [4]. 15 ...... Hình 1.2 D ng và s phân b ph năng l ự ạ ố ổ ượ ễ

ng trung bình c a nhi u trên tàu [4]. Hình 1.3 D ng và s phân b ph năng l ự ạ ố ổ ượ ủ ễ

16 .....................................................................................................................................

Hình 1.4 D ng và s phân b ph năng l ự ạ ố ổ ượ ng trung bình c a nhi u trong nhà ủ ễ

16 hàng[4]. .......................................................................................................................

c đo b ng SPL dB) trong các môi tr Hình 1.5 M c nhi u và ti ng nói (đ ễ ứ ế ượ ằ ườ ng

17 khác nhau [4]. .............................................................................................................

c l y m u v i t n s l y m u 8kHz [11]. ... 23 Hình 1.6 M u ti ng nói “eee” đ ế ẫ ượ ấ ớ ầ ố ấ ẫ ẫ

Hình 1.7 D ng sóng tín hi u ti ng nói c a câu “The wife helped her husband” và ủ ệ ế ạ

“wife, d ng sóng c a đo n nguyên âm “er” d ng sóng c a ph âm “f” trong t ạ ủ ụ ừ ủ ạ ạ

trong t 24 “her” [11]. .................................................................................................... ừ

Trang 2 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

Hình 1.8 m t c t d c c a c quan t o ti ng nói [11]. 25 ........................................... ặ ắ ọ ủ ơ ế ạ

Hình 1.9 mô hình k thu t t o ti ng nói[11]. 26 ......................................................... ậ ạ ế ỹ

Hình 1.10 b ng phân lo i âm v trong ti ng Anh c a ng ủ ế ả ạ ị ườ 26 i M [11] .................. ỹ

Bang 2.1.Thang điêm đanh gia chât l 29 ng tiêng noi theo MOS [12] ..................... ́ ượ ̉ ̉ ́ ́ ́ ́

Bang 2.4. Thang điêm đanh gia chât l 30 ng tin hiêu tiêng noi theo CCR ............... ́ ượ ̉ ̉ ́ ́ ́ ̣ ́ ́

30 Bang 2.5. Thang đanh gia DCR ................................................................................. ̉ ́ ́

39 Hình 3.1 S đ kh i cho hai thu t toán SS và WF ................................................. ơ ồ ậ ố

43 .............................. Hình 3.2 S đ kh i c a thu t toán Spectral subtraction [26]. ậ ố ủ ơ ồ

Hình 3.3 S đ kh i c a thu t toán Wiener Filtering. 46 ........................................... ố ủ ơ ồ ậ

47 ................................................... Hình 3.4 Phân tích tín hi u thành các frame [31]. ệ

48 .............................................. Hình 3.5 quá trình th c hi n overlap và adding [32]. ệ ự

Hình 4.1. S đ th c hi n và đánh giá thu t toán tăng c 52 ng .............................. ơ ồ ự ệ ậ ườ

54 Hình 4.2 L u đ thu t toán SS ................................................................................. ư ồ ậ

55 Hình 4.3 L u đ thu t toán WF ............................................................................... ư ồ ậ

56 Hình 4.4 d ng sóng và spectrogram c a tín hi u s ch ........................................... ệ ạ ủ ạ

56 Hình 4.5 D ng sóng và ph c a tín hi u b nhi u xe h i v i SNR = 10dB ......... ơ ớ ệ ị ổ ủ ễ ạ

ơ ằ Hình 4.6 D ng sóng và spectrogram c a tín hi u sau khi x lý nhi u xe h i b ng ủ ử ệ ễ ạ

57 SS v i SNR = 10dB. .................................................................................................. ớ

ơ ằ Hình 4.7 D ng sóng và spectrogram c a tín hi u sau khi x lý nhi u xe h i b ng ủ ử ệ ễ ạ

57 WF v i SNR = 10dB. ................................................................................................ ớ

Hình 4.8 Quy trình th c hi n đánh giá 59 ..................................................................... ự ệ

60 Hình 4.9. Đ th ki m tra đ n đ nh c a đánh giá OE đ i v i nhi u xe h i .... ồ ị ể ố ớ ộ ổ ủ ễ ơ ị

i nói Hình 4.10. Đ th ki m tra đ n đ nh c a đánh giá OE đ i v i nhi u ng ị ồ ị ể ố ớ ộ ổ ủ ễ ườ

60 xung quanh ................................................................................................................

62 Hình 4.11 Đ th đánh giá Objective v i h s IS=0.2, NoiseMargin=3 .............. ớ ệ ố ồ ị

Trang 3 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

Hình 4.12 Đ th đánh giá Objective v i h s IS=0.15, NoiseMargin=2. 63 ........... ớ ệ ố ồ ị

Hình 4.14 Đ th đánh giá objective v i h s alpha=0.5, 0.8,0.9 v i IS=0.15 và ớ ệ ố ồ ị ớ

65 NoiseMargin = 2 .........................................................................................................

66 Hình 4.15 Đ th đánh giá objective v i h s gamma = 1 và gamma = 2. .......... ớ ệ ố ồ ị

ậ Hình 4.16 Đ th đánh giá v i IS=0.15 NoiMargin= 2 và alpha = 0.8 cho thu t ồ ị ớ

68 toán WF, gama=1 cho thu t toán SS. ....................................................................... ậ

Hình 4.17 Đ th đánh giá OE v i nhi u ng 69 i nói xung quanh. .......................... ồ ị ễ ớ ườ

DANH M C CÁC T VI T T T VÀ CÁC THU T NG TI NG ANH Ừ Ế Ữ Ế Ụ Ắ Ậ

T vi ừ ế t Ti ng Anh Nghĩa ti ng Vi ế ế t ệ

ễ ỉ ố

Signal Noise Ratio Personal Computer Sound Pressure Level t tắ SNR PC SPL

T s tín hi u trên nhi u ệ Máy tính cá nhân M c áp su t c a âm thanh ấ ủ T i thi u hoá sai l ch trung ứ ố ể ệ MMSE Minium Mean-Squared Error ngươ

Singular Value Decomposition Discrete Fourier Transform Fast Fourier Transform SVD DFT FFT bình bình ph Phép phân tích giá tr đ n ị ơ Phép bi n đ i Fourier r i r c ờ ạ ổ Phép bi n đ i Fourier nhanh ổ ế ế

Trang 4 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

Phép bi n đ i Fourier c a tín ủ ế ổ DTFT Discrete-Time Fourier Transform hi u r i r c. ệ ờ ạ

ZT ROC

Z Transform Region of Convergence Inverse Discrete Fourier c Fourier Phép bi n đ i Z ổ ế Mi n h i t ề ộ ụ Phép bi n đ i ng ổ ế ượ IDTFT Transform

r i r c ờ ạ ấ H th ng tuy n tính và b t ế ệ ố LTI Linear Time-Invariant

InternationalTelecommunications bi n theo th i gian ờ ễ Hi p h i tiêu chu n vi n ẩ ế ệ ộ ITU-T

ACR Union-Telecommunication Absolute Categories Rating ị

thông qu c tố ế Đánh giá theo giá tr tuy t đ i ệ ố Đánh giá theo quan đi mể MOS Mean Opinion Scores ườ

CCR Comparison Category Rating

i nghe ng Đánh giá b ng cách so sánh ằ ấ Đánh giá suy gi m ch t ả DCR Degradation Category Rating

l ngượ Đánh giá ch quan Đánh giá khách quan

ọ ố ủ

SE OE IS LLR WSS LPC Subjective Evaluation Objective Evaluation Itakura_Saito Log likehook Raito Weighted Spectral Slope Linear Prediction Coefficients ́ ự ̣ ́ ́ ́

Đo theo tr ng s c a ph ổ Hê sô d đoan tuyên tinh ủ Thăm dò s ho t đ ng c a ự ạ ộ VAD Voice Activity Detection ế

ti ng nói Nâng cao ch t l ấ ượ ế ng ti ng Speech Enhancement

nói Thu t toán gi m nhi u tín ả ễ ậ

SS Spectral Subtraction hi u ti ng nói b ng ph ệ ế ằ ươ ng

pháp tr ph . ừ ổ Thu t toán gi m nhi u tín ả ễ ậ

WF Wiener Filter hi u ti ng nói b ng cách s ệ ế ằ ử

d ng b l c Wiener. ộ ọ ụ Thu t toán gi m nhi u tín ễ ả ậ

Statistical-model-based hi u ti ng nói d a trên ự ế ệ

nguyên lý th ng kê ố

Trang 5 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

Khung tín hi u.ệ Frame

Hamming Overlap và Adding C a s Hamming X p ch ng và c ng ộ ồ ử ổ ế

M Đ UỞ Ầ

Trong cu c s ng, ti ng nói đóng m t vai trò r t quan tr ng đ i v i con ộ ộ ố ố ớ ế ấ ọ

ng ườ ạ i. Cùng v i ti ng nói là s xu t hi n c a r t nhi u các lo i d ch v tho i ệ ủ ấ ớ ế ạ ị ự ụ ề ấ

nh ngày nay. Tuy nhiên vi c b o toàn đ c tín hi u ti ng nói trên các d ch v ệ ả ư ượ ệ ế ị ụ

ả này là đi u vô cùng khó khăn do s m t mát và suy gi m tín hi u và nh t là nh ự ấ ệ ề ấ ả

ng c a nhi u s làm cho tín hi u ti ng nói không còn nh ban đ u. Vì lý do h ưở ễ ẽ ư ủ ế ệ ầ

đó mà các thu t toán v Speech Enhancement ra đ i. Tuy không th b o toàn ể ả ề ậ ờ

đ ượ c y nguyên tín hi u ban đ u nh ng s d ng các thu t toán này ta có th tăng ử ụ ư ệ ể ậ ầ

ng đ c ch t l c ườ ượ ấ ượ ng ti ng nói và gi m b t nhi u n n đ tín hi u sau khi x ễ ế ể ề ệ ả ớ ử

lý đ n ng ế ườ ị i nghe v n mang đ y đ n i dung thông tin và không gây khó ch u ủ ộ ầ ẫ

b i nhi u đ i v i ng ở ố ớ ễ ườ ấ i nghe. Vì v y, Speech Enhancement đóng m t vai trò r t ậ ộ

quan tr ng trong lĩnh v c tho i. ự ạ ọ

Xu t phát t th c t này nhóm đã b t tay vào tìm hi u v Speech ấ ừ ự ế ề ể ắ

ệ Enhancement, nghiên c u các thu t toán c a nó đ th c hi n và đánh giá hi u ể ự ứ ủ ệ ậ

qu c a các thu t toán đó trong môi tr ng th c t ả ủ ậ ườ . ự ế

Đ th c hi n đ c đ án, nhóm đã phân chia thành 3 ph n t ể ự ệ ượ ồ ầ ươ ứ ớ ng ng v i

3 thành viên :

- Nguy n Ng c Trung : nghiên c u và th c hi n thu t toán x lý ti ng nói ễ ọ ự ứ ử ệ ế ậ

ng pháp Spectral Subtraction. s d ng ph ử ụ ươ

Trang 6 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

- Nguy n Phúc Nguyên ễ : nghiên c u và th c hi n thu t x lý ti ng nói s ệ ậ ử ứ ự ế ử

d ng b l c Wiener. ộ ọ ụ

- Nguy n Th Ng c Di p ng pháp đánh ệ : nghiên c u và th c hi n các ph ứ ự ệ ễ ọ ị ươ

giá t các k t qu đ t đ c c a 2 thu t toán trên trong môi tr ừ ả ạ ượ ủ ế ậ ườ ự ng th c

.ế t

Đ th c hi n đ c n i dung ph n c a em thì đ án c a em đ ể ự ệ ượ ộ ầ ủ ủ ồ ượ ế ấ c k t c u

ng : thành 2 ph n, g m 5 ch ầ ồ ươ

Ph n 1 : Lý thuy t ế ầ

Ch ng 1 : T ng quan v nâng cao ch t l ng ti ng nói. Ch ng này gi ươ ấ ượ ề ổ ế ươ ớ i

thi u m t s khái ni m c b n v tín hi u s , các phép bi n đ i, tìm hi u v ệ ố ộ ố ơ ả ệ ệ ề ế ể ổ ề

các lo i nhi u , tín hi u ti ng nói và s hình thành ti ng nói. Bên c nh đó còn ự ễ ệ ế ế ạ ạ

gi i thi u khái quát v m t s thu t toán trong Speech Enhancement . ớ ề ộ ố ệ ậ

Ch ng 2 : Đánh giá ch t l ng ti ng nói. Ch ng này gi i thi u m t s ươ ấ ượ ế ươ ớ ộ ố ệ

ph ươ ồ ng pháp đánh giá hi u qu c a thu t toán gi m nhi u trong ti ng nói. G m ả ủ ệ ễ ế ậ ả

có đánh giá ch quan và đánh giá khách quan. ủ

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering. Ch ươ ậ ươ ng

này đi sâu vào nghiên c u nguyên lý c b n c a t ng thu t toán. ơ ả ủ ừ ứ ậ

Ph n 2 : Th c hi n và đánh giá ự ệ ầ

Ch ng 4 : Th c hi n và đánh giá thu t toán. Ch ng này trình bày các ươ ự ệ ậ ươ

c g m có th c hi n gi m nhi u tín hi u ti ng nói k t qu nhóm đã làm đ ế ả ượ ự ệ ễ ệ ế ả ồ

ng 3. Đ ng th i so sánh k t qu thu b ng hai thu t toán đã nghiên c u ằ ch ứ ở ươ ậ ế ả ờ ồ

đ c b ng cách dùng các ph ng pháp đánh giá đã đ c gi i thi u ng 2 ượ ằ ươ ượ ớ ch ệ ở ươ

Ph ng pháp nghiên c u c a đ án là xây d ng l u đ c a thu t toán, ươ ồ ủ ứ ủ ự ư ậ ồ

ả ạ th c hi n x lý ti ng nói b ng các thu t toán đó. D a trên các k t qu đ t ử ự ự ệ ế ế ậ ằ

đ c sau khi x lý, sau đó s d ng các ph ng pháp đánh giá khách quan đ ượ ử ụ ử ươ ể

đánh giá tính hi u qu c a các thu t toán x lý trong môi tr ng th c t ả ủ ử ệ ậ ườ . ự ế

Đ án c a nhóm đã th c hi n đ ủ ự ệ ồ ượ c 2 thu t toán x lý ti ng nói trong ử ế ậ

Speech Enhancement và đ a ra đ c các k t qu đánh giá khách quan làm c s ư ượ ơ ở ế ả

Trang 7 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

đ đánh giá tính hi u qu c a 2 thu t toán trên. Đó chính là đi m m i trong đ ể ả ủ ệ ể ậ ớ ồ

c trong cùng ch đ nghiên c u. án c a nhóm so v i các đ án đã có tr ớ ủ ồ ướ ủ ề ứ

Trang 8 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

Trang 9 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

CH ƯƠ NG 1: T NG QUAN V NÂNG CAO CH T L Ề Ấ ƯỢ Ổ NG TI NG NÓI Ế

1.1 Gi ng ớ i thi u ch ệ ươ

N i dung c a ch ng trình bày m c đích c a nâng cao ch t l ủ ộ ươ ấ ượ ụ ủ ế ng ti ng

ặ nói là gì, các lo i nhi u trong ti ng nói, cách hình thành c a ti ng nói và các đ c ủ ế ế ễ ạ

ng này còn gi đi m cu tín hi u ti ng nói. Ch ệ ế ể ả ươ ớ ậ i thi u khái quát v các thu t ệ ề

toán s d ng trong speech enhancement. ử ụ

1.2 Nâng cao ch t l ng ti ng nói là gì ? ấ ượ ế

Nâng cao ch t l ấ ượ ố ng ti ng nói liên quan đ n vi c c i thi n c m nh n đ i ệ ả ệ ả ế ế ậ

ng do s có m t c a nhi u trong ti ng nói. v i ti ng nói b suy gi m ch t l ị ớ ế ấ ượ ả ặ ủ ự ễ ế

Trong h u h t các ng d ng, thì m c đích c a nâng cao ch t l ng ti ng nói là ấ ượ ụ ụ ứ ủ ế ầ ế

s c i thi n ch t l ệ ự ả ấ ượ ễ ng và tính d nghe c a ti ng nói đã b suy gi m do nhi u. ủ ế ễ ả ị

ng mà t t thì nó làm gi m đi s khó khăn cho ng S c i thi n v ch t l ệ ự ả ấ ượ ề ố ự ả ườ i

nghe khi nghe và trong nhi u tr ng h p nó còn giúp cho ng i nghe có th ề ườ ợ ườ ể

nghe trong môi tr ng có nhi u v i m c đ cao và nhi u đó t n t ườ ứ ộ ồ ạ ễ ễ ớ ờ i trong th i

gian dài. Các thu t toán âng cao ch t l ấ ượ ậ ễ ng ti ng nói làm gi m và nén nhi u ế ả

c xem nh là các thu t toán nén nhi u. n n đ n m t m c đ nào đó và nó đ ứ ộ ề ế ộ ượ ư ễ ậ

Trong nhi u tr ng h p, s c n thi ề ườ ự ầ ợ ế ủ t c a vi c tăng c ệ ườ ệ ng trong tín hi u

ặ ti ng nói xu t hi n khi tín hi u ti ng nói hình thành trong vùng có nhi u ho c ệ ệ ế ế ễ ấ

nh h ng b i nhi u trong các kênh truy n thông. Có r t nhi u k ch b n yêu ả ưở ề ề ễ ả ấ ở ị

ng h p khác nhau, ví d c u đ t ra đ i v i Speech enhancement trong nhi u tr ầ ố ớ ề ặ ườ ợ ụ

đ i v i thông tin tho i, trên các h th ng đi n tho i t ố ớ ệ ố ạ ế ệ ạ ự ả bào thì ch u s nh ị

h ưở ng nhi u n n t ễ ề ừ ô tô, nhà hàng,.. khi truy n đ n đích. Chính vì v y mà các ế ề ậ

thu t toán trong nâng cao ch t l ng ti ng nói có th đ ấ ượ ậ ể ượ ử ụ ể ả c s d ng đ c i ế

thi n ch t l ng c a ti ng nói t i đi m thu, m t khác, nó có th đ ấ ượ ệ ủ ế ạ ể ượ ử ụ c s d ng ể ặ

ệ trong các kh i ti n x lý c a h th ng mã hoá ti ng nói dùng trong các đi n ố ề ệ ố ử ủ ế

tho i t bào chu n [1]. Khi nh n d ng ti ng nói, ti ng nói b nhi u đ ạ ế ế ế ễ ậ ạ ẩ ị ượ ề c ti n

ng tr c khi đ x lý b i các thu t toán nâng cao ch t l ử ấ ượ ậ ở ướ ượ c nh n d ng. Trong ạ ậ

thông tin liên l c hàng không, các k thu t nâng cao ti ng nói c n đ ầ ượ ử ụ c s d ng ế ậ ạ ỹ

Trang 10 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

đ c i thi n ch t l ệ ể ả ấ ượ ị ả ng và tính d nghe c a ti ng nói c a phi công b nh ế ủ ủ ễ

ng b i nhi u trong bu ng lái. Vì v y mà nâng cao ch t l ng ti ng nói cũng h ưở ấ ượ ễ ậ ở ồ ế

t trong thông tin liên l c c a quân s . Trong h th ng h i ngh qua r t c n thi ấ ầ ế ạ ủ ệ ố ự ộ ị

tho i, thì ngu n nhi u xu t hi n m t vùng nào đó thì nó s đ ệ ở ộ ẽ ượ ễ ạ ấ ồ ế c truy n đ n ề

t c các vùng khác. Các thu t toán nâng cao ch t l ng ti ng nói đ t ấ ả ấ ượ ậ ế ượ ử c s

c khi đ d ng nh ti n x lý ho c làm s ch nhi u trong ti ng tr ụ ư ề ử ễ ế ạ ặ ướ ượ ế c khu ch

đ i. ạ

trên thì m c tiêu c a các thu t toán tăng c Nh các ví d minh h a ụ ọ ở ư ụ ủ ậ ườ ng

tuỳ thu c vào các ng d ng mà chúng ta đang dùng. Xét trên ph ứ ụ ộ ươ ng di n lý ệ

ng, thì chúng ta mong mu n Speech enhancement c i thi n đ t ưở ệ ả ố ượ ấ c c ch t ả

ng và tính d nghe hay s trong su t c a ti ng nói. Tuy nhiên, xét trên l ượ ố ủ ự ễ ế

ph ng di n th c t ươ ự ế ệ ệ thì các thu t toán Speech enhancement ch có th c i thi n ể ả ậ ỉ

đ c ch t l ng c a ti ng nói. Nó có th làm gi m đ c nhi u n n trong ượ ấ ượ ủ ể ế ả ượ ề ễ

ti ng nói nh ng nó s làm gia tăng thêm đ méo c a tín hi u ti ng nói, chính ư ủ ế ẽ ệ ế ộ

đi u này làm gi m đi tính d nghe c a ti ng nói. Do đó, yêu c u chính trong ủ ề ễ ế ầ ả

vi c thi t k m t thu t toán Speech enhancement ph i đ m b o nén đ ệ ế ế ộ ả ả ả ậ ượ c

nhi u và không đ c gây ra méo trong s c m nh n tín hi u ti ng nói. ễ ượ ự ả ệ ế ậ

Gi ả ộ i pháp t ng quát trong các v n đ c a Speech enhancement ph thu c ề ủ ụ ẩ ổ

ồ r t l n vào ng d ng chúng ta c n s d ng, đó là các v n đ nh là ngu n ầ ử ụ ấ ớ ứ ụ ư ề ầ

nhi u và giao thoa gây ra nhi u, m i liên h gi a nhi u và tín hi u s ch, s ệ ữ ễ ễ ệ ễ ạ ố ố

ặ microphone và c m bi n có th có. S giao thoa có th xem nh là nhi u ho c ự ư ế ể ể ễ ả

đ c xem nh tín hi u ti ng nói, nó tuỳ thu c vào môi tr ng ta đang xét, nó có ượ ư ệ ế ộ ườ

th đ c xem nh là s tranh ch p gi a các speaker. Đ c tính âm nhi u có th ể ượ ư ự ữ ễ ấ ặ ể

đ c hình thành trong căn ượ c c ng thêm vào tín hi u s ch n u âm thanh đ ệ ế ạ ộ ượ

phòng b d i âm thanh. H n n a, nhi u có th có tính t ng quan ho c không ị ộ ữ ể ễ ơ ươ ặ

ng quan v m t th ng kê v i tín hi u s ch. S l ng microphone cũng có t ươ ệ ạ ề ặ ố ượ ố ớ

kh năng nh h ng đ n tính hi u qu c a các thu t toán Speech enhancement. ả ả ưở ả ủ ế ệ ậ

Trang 11 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

1.3 Lý thuy t v tín hi u và nhi u ế ề ễ ệ

1.3.1 Tín hi u, h th ng và x lý tín hi u ệ ố ử ệ ệ

1.3.1.1 Tín hi u ệ

Tín hi u(signal) dùng đ ch m t đ i l ệ ỉ ộ ạ ượ ể ề ặ ng v t lý mang tin t c. V m t ứ ậ

toán h c, ta có th mô t tín hi u nh m t hàm theo bi n th i gian, không gian ể ọ ả ư ộ ệ ế ờ

2 mô t

hay các bi n đ c l p khác. Ch ng h n nh , hàm: x(t) = 20t ộ ậ ư ế ạ ẳ ả ế tín hi u bi n ệ

2 mô

thiên theo bi n th i gian t. Hay m t ví d khác, hàm: s(x,y) = 3x + 5xy + y ụ ế ờ ộ

tín hi u là hàm theo hai bi n đ c l p x và y, trong đó x và y bi u di n cho hai t ả ộ ậ ể ế ệ ễ

t a đ trong m t ph ng [2]. ọ ộ ẳ ặ

Hai tín hi u trong ví d trên v l p tín hi u đ ụ ề ớ ệ ệ ượ c bi u di n chính xác ễ ể

, các m i quan h gi a các b ng hàm theo bi n đ c l p. Tuy nhiên, trong th c t ằ ộ ậ ự ế ế ệ ư ố

ng v t lý và các bi n đ c l p th đ i l ạ ượ ộ ậ ế ậ ườ ể ể ng r t ph c t p nên không th bi u ứ ạ ấ

di n tín hi u nh trong hai ví d v a nêu trên. ụ ừ ư ễ ệ

Hình 1.1 Tín hi u ti ng nói [2]. ệ ế

L y ví d tín hi u ti ng nói – đó là s bi n thiên c a áp su t không khí ự ế ủ ụ ế ệ ấ ấ

theo th i gian. Ch ng h n khi ta phát âm t “away”, d ng sóng c a nó đ ẳ ạ ờ ừ ủ ạ ượ c

bi u di n nh hình trên. ư ể ễ

1.3.1.2 Ngu n tín hi u ồ

ứ T t c các tín hi u đ u do m t ngu n nào đó t o ra, theo m t cách th c ồ ấ ả ệ ề ạ ộ ộ

nào đó. Ví d tín hi u ti ng nói đ c t o ra băngg cách ép không khí đi qua dây ụ ệ ế ượ ạ

Trang 12 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

thanh âm. M t b c nh có đ ộ ứ ả ượ ộ c b ng cách ph i sáng m t t m phim ch p m t ộ ấ ụ ằ ơ

c nh/đ i t ả ố ượ ng nào đó. Quá trình t o tín hi u nh v y th ạ ư ậ ệ ườ ế ng liên quan đ n

m t h th ng, h th ng này đáp ng l ệ ố ộ ệ ố ứ ạ ệ i m t kích thích nào đó. Trong tín hi u ộ

ti ng nói, h th ng là h th ng phát âm, g m môi, răng, l i, dây thanh…Kích ệ ố ệ ố ế ồ ưỡ

thích liên quan đ n h th ng đ c g i là ngu n tín hi u. ệ ố ế ượ ọ ồ ệ Nh v y ta có ngu n ư ậ ồ

ti ng nói, ngu n nh và các ngu n tín hi u khác. ồ ả ệ ế ồ

1.3.1.3 H th ng và x lý tín hi u

ệ ố ử ệ

H th ng ệ ố là m t thi ộ ế ị ậ ệ t b v t lý th c hi n m t tác đ ng nào đó lên tín hi u. ự ệ ộ ộ

Ví d , b l c dùng đ gi m nhi u trong tín hi u mang tin đ c g i là m t h ụ ộ ọ ể ả ễ ệ ượ ọ ộ ệ

th ng. Khi ta truy n tín hi u qua m t h th ng, nh b l c ch ng h n, ta nói ộ ệ ố ư ộ ọ ề ệ ạ ẳ ố

r ng đã x lý tín hi u đó. Trong tr ằ ử ệ ườ ế ọ ng này, x lý tín hi u liên quan đ n l c ệ ử

nhi u ra kh i tín hi u mong mu n. ễ ệ ỏ ố

X lý tín hi u ệ là ý mu n nói đ n m t lo t các công vi c hay các phép toán ử ế ệ ạ ố ộ

đ ượ ứ c th c hi n trên các tín hi u nh m đ t m c đích nào đó, nh là tách tin t c ạ ự ư ụ ệ ệ ằ

ch a bên trong tín hi u ho c là truy n tín hi u mang tin t ứ ệ ệ ề ặ ừ ơ ơ n i này đ n n i ế

khác.

đây ta c n l u ý đ n đ nh nghĩa h th ng, nó không ch đ n thu n là Ở ầ ư ệ ố ỉ ơ ế ầ ị

thi ế ị ậ ầ t b v t lý mà còn là ph n m m x lý tín hi u ho c là s k t h p gi a ph n ự ế ợ ữ ử ệ ề ặ ầ

c ng và ph n m m. Ví d khi x lý s tín hi u b ng m ch logic, h th ng x ố ứ ệ ố ụ ử ệ ề ằ ạ ầ ử

lý đây là ph n c ng. Khi x lý b ng máy tính s , tác đ ng lên tín hi u bao ở ứ ử ệ ằ ầ ộ ố

g m m t lo t các phép toán th c hi n b i ch ồ ự ệ ạ ộ ở ươ ử ng trình ph n m m. Khi x lý ề ầ

ề b ng các b vi x lý-h th ng bao g m k t h p c ph n c ng và ph n m m, ằ ầ ứ ế ợ ệ ố ử ả ầ ộ ồ

m i ph n th c hi n các công vi c riêng nào đó. ự ệ ệ ầ ỗ

1.3.1.4 Phân lo i tín hi u

ệ ạ

Các ph ng pháp ta s d ng trong x lý tín hi u ph thu c ch t ch vào ươ ử ụ ử ụ ẽ ệ ặ ộ

đ c đi m c a tín hi u. Có nh ng ph ặ ủ ữ ệ ể ươ ng pháp riêng áp d ng cho m t lo i tín ụ ạ ộ

hi u nào đó. Do v y, tr c tiên ta c n xem qua cách phân lo i tín hi u liên quan ệ ậ ướ ệ ầ ạ

đ n nh ng ng d ng c th . Chúng ta có th phân tín hi u thành các lo i : ế ữ ứ ụ ể ụ ệ ể ạ

- Tín hi u nhi u h ệ ề ướ ng và tín hi u đa kênh ệ

Trang 13 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

- Tín hi u liên t c và tín hi u r i r c ệ ờ ạ ụ ệ

- Tín hi u biên đ liên t c và tín hi u biên đ r i r c ộ ờ ạ ụ ệ ệ ộ

- Tín hi u xác đ nh và tín hi u ng u nhiên ệ ệ ẫ ị

1.4 Lý thuy t v nhi u ế ề ễ

1.4.1 Ngu n nhi u ồ ễ

m i n i, trên đ i ng ph , trên xe, trong Nhi u m t hi n th c, nó t n t ệ ồ ạ ở ọ ơ ự ễ ộ ườ ố

văn phòng, trong nhà hàng, trong các toà nhà. Nó có th là ti ng xe ch y trên ế ể ạ

đ ng, ti ng n trên các công tr ườ ế ồ ườ ng xây d ng, ti ng n phát ra t ế ự ồ ừ ạ các qu t

ch y trong PC, chuông đi n tho i…, nó t n t ồ ạ ớ ứ i v i các hình d ng và hình th c ạ ệ ạ ạ

khác nhau trong cu c s ng h ng ngày c a chúng ta. ộ ố ủ ằ

Nhi u có th hình thành ể ễ ở ộ ơ ố ị ờ m t n i c đ nh, và không thay đ i theo th i ổ

gian, ví d nh là ti ng n phát ra t qu t ch y trong PC. Nhi u cũng có th ư ụ ế ồ ừ ễ ạ ạ ể

ủ không đ ng yên m t ch , ví d nh nhi u trong nhà hàng, đó là ti ng nói c a ứ ụ ư ễ ế ỗ ộ

i xen l n v i nhi u cách khác nhau v i ti ng n phát ra t nhi u ng ề ườ ớ ế ề ẫ ớ ồ ừ ế nhà b p.

ổ Các đ c tính v ph cũng nh th i gian c a nhi u trong nhà hàng thay đ i ư ờ ủ ề ễ ặ ổ

không theo quy lu t nên vi c nén nhi u trong các môi tr ệ ễ ậ ườ ổ ng có nhi u thay đ i ễ

nh v y s khó khăn h n nhi u so v i các ngu n nhi u đ ng yên không thay ớ ư ậ ẽ ứ ề ễ ơ ồ

đ i.ổ

Các đ c tính đ c bi ặ ặ ệ ủ t khác nhau c a các lo i nhi u đó là hình d ng c a ủ ễ ạ ạ

ph và s phân b c a năng l ng nhi u trong mi n t n s . Ví d , nhi u gây ra ố ủ ự ổ ượ ề ầ ố ụ ễ ễ

ng c a nó t p trung t n s th p d b i gió thì năng l ở ượ ủ ậ ở ầ ố ấ ướ ố i 500Hz. Nh ng đ i ư

v i nhi u trong nhà hàng, trên xe, trên tàu thì khác, năng l ớ ễ ượ ng c a nó đ ủ ượ c

phân b trên m t d i t n s r ng [3]. ộ ả ầ ố ộ ố

Trang 14 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

ng trung bình nhi u trên xe Hình 1.2 D ng và s phân b ph năng l ự ạ ổ ố ượ ễ

[4].

Trang 15 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

ng trung bình c a nhi u trên Hình 1.3 D ng và s phân b ph năng l ự ố ổ ạ ượ ủ ễ

tàu [4].

Hình 1.4 D ng và s phân b ph năng l ự ố ổ ạ ượ ng trung bình c a nhi u trong ủ ễ

nhà hàng[4].

ng khác nhau 1.4.2 Nhi u và m c tín hi u ti ng nói trong các môi tr ệ ứ ế ễ ườ

i h n trong vi c thi Đi m t ể ớ ạ ệ ế ế t k các thu t toán c a Speech enhancement ủ ậ

là s nh n bi ng đ nhi u trong ự ậ ế ả t d i bi n thiên c a ti ng nói và m c đ c ế ứ ộ ườ ủ ế ễ ộ

môi tr ng th c t . T đó, chúng ta có th mô t mi n bi n thiên c a m c đ ườ ự ế ừ ể ả ứ ộ ủ ế ề

s tín hi u trên nhi u(SNR) đ c b t g p trong môi tr ng th c t t ỷ ố ễ ệ ượ ắ ặ ườ ự ế ề . Đi u

này r t quan tr ng đ đánh giá tính hi u qu c a các thu t toán Speech ả ủ ệ ể ậ ấ ọ

enhancement trong vi c nén nhi u và c i thi n ch t l ng c a ti ng nói trong ấ ượ ệ ệ ễ ả ủ ế

d i bi n thiên c a m c SNR. ả ứ ủ ế

M c đ c a ti ng nói và nhi u đ c đo l ng b ng m c đ âm thanh. ộ ủ ứ ế ễ ượ ườ ứ ằ ộ

Phép đo l ng ườ ở đây là đo m c đ áp su t c a âm thanh tính b ng dB ấ ủ ứ ằ ộ

SPL(sound pressure level)[4]. Kho ng cách gi a ng i nói và ng i nghe cũng ữ ả ườ ườ

nh h ng đ n m c c ng đ âm thanh, nó t ả ưở ứ ườ ế ộ ươ ứ ng ng v i phép đo đ ớ ượ ự c th c

hi n khi microphone đ c đ t t i nh ng v trí có kho ng cách khác nhau. ệ ượ ặ ạ ữ ả ị

Trang 16 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

Kho ng cách đ c tr ng trong giao ti p face-to-face là 1m, khi kho ng cách đó ư ế ả ặ ả

tăng g p đôi thì m c c ứ ườ ấ ng đ âm gi m đi 6 dB[6]. ả ộ

Hình bên d i này là s t ng h p v m c đ âm trung bình gi a ti ng nói ướ ề ứ ộ ữ ế ự ổ ợ

và nhi u trong các môi tr trong ễ ườ ng khác nhau. M c đ c a nhi u nh nh t ứ ộ ủ ấ ở ễ ỏ

các môi tr ng nh phòng h c, trong nhà , trong b nh vi n và trong các toà ườ ư ọ ở ệ ệ

nhà. Trong các môi tr ườ ạ ng khác nhau, thì m c đ âm c a nhi u n m trong ph m ễ ằ ứ ộ ủ

vi bi n thiên t 50 đ n 55 dB SPL, và m c đ âm c a ti ng nói là 60 đ n 70 dB ế ừ ủ ế ứ ộ ế ế

SPL. Và khuy n ngh đ a ra là m c t s SNR có hi u qu trong các môi ị ư ứ ỷ ố ế ệ ả

tr ng này là 5 đ n 15 dB. M c đ âm c a nhi u r t cao trong các môi tr ườ ứ ộ ễ ấ ủ ế ườ ng

tàu đi n ng m, trên máy bay, nó đ t kho ng 70 đ n 75 dB SPL. Và m c đ ở ệ ầ ở ứ ộ ế ạ ả

âm c a ti ng nói trong các môi tr ng này cũng đ t m c đó, nên m c t s ủ ế ườ ứ ỷ ố ứ ạ

SNR trong các môi tr ng này g n nh là 0 dB. ườ ư ầ

c đo b ng SPL dB) trong các môi Hình 1.5 M c nhi u và ti ng nói (đ ễ ứ ế ượ ằ

tr ng khác nhau [4]. ườ

1.5 Tín hi u r i r c theo th i gian ệ ờ ạ ờ

Tín hi u r i r c theo th i gian x(n) có th t o ra b ng cách l y m u tín ệ ờ ạ ể ạ ằ ẫ ấ ờ

a(t) v i chu kỳ l y m u là T

s (t n s l y m u F

s =

hi u liên t c theo th i gian x ụ ệ ờ ẫ ấ ớ ầ ố ấ ẫ

1/ T). Ta có

(1.1) xa(t)|t=nT = xa(nT) = x(n) , -∞ < n< ∞

L u ý n là bi n nguyên, x(n) là hàm theo bi n nguyên, ch đ nh t i các giá ư ế ế ị ỉ ạ

ả ằ tr n nguyên. Khi n không nguyên, thì x(n) không xác đ nh, ch không ph i b ng ứ ị ị

Trang 17 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

0. Trong nhi u sách v x lý tín hi u s , ng i ta quy c: khi bi n nguyên thì ệ ố ề ử ề ườ ướ ế

c đ t trong d u ngo c vuông và khi bi n liên t c thì đ c đ t trong bi n đ ế ượ ụ ế ặ ấ ặ ượ ặ

d u ngo c tròn. T đây tr đi, ta ký hi u tín hi u r i r c là: x[n].[7] ấ ệ ờ ạ ừ ệ ặ ở

M t s tín hi u r i r c c b n ệ ờ ạ ơ ả ộ ố

1.5.1 Tín hi u b ệ ướ c nh y đ n v ả ơ ị

,1

n

0

<

,2

n

0

‡ (cid:236) (cid:237) (1.2) u[n] = (cid:238)

Tín hi u b ệ ướ c nh y d ch chuy n có d ng sau: ể ạ ả ị

,1

n

no

<

,0

n

no

‡ (cid:236) (cid:237) (1.3) u[n - no] = (cid:238)

=

1.5.2 Tín hi u xung đ n v ơ ị ệ

,1

n

0

=

nd ][

,0

n

0

(cid:236) (cid:237) (1.4) „ (cid:238)

=

Tín hi u xung d ch chuy n có d ng sau ể ệ ạ ị

,1

n

no

=

[d

n

no

]

,0

n

no

(cid:236) - (cid:237) (1.5) „ (cid:238)

Chúng ta có th bi u di n tín hi u r i r c theo th i gian x[n] thông qua tín ệ ờ ạ ể ể ễ ờ

hi u xung đ n v nh sau ơ ị ư ệ

d [][ kx

kn

]

¥=

k

¥ - (1.6) x[n] = (cid:229) -

1.5.3 Tín hi u hàm mũ ệ

x[n] = C.an (C,a : là nh ng h ng s ) (1.7) ữ ằ ố

n.u[n]

Tín hi u hàm mũ phía ph i : x[n] = C.a ệ ả

n.u[-n]

Tín hi u hàm mũ phía trái : x[n] = C.a ệ

=

+

q

1.5.4 Tín hi u hàm sin r i r c ờ ạ ệ

][ nx

A

cos(

p 2

fn

)

¥<<¥ n

- (1.8)

A : là biên đ c a tín hi u sin ộ ủ q : pha ban đ u c a tín hi u sin ầ ủ ệ

Trang 18 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

F sF

f : t n s s , , F : là t n s c a tín hi u, F ầ ố ố f = ầ ố ủ ệ ầ ố ấ s : t n s l y

m u ẫ

-0.5 < f < 0.5

1.6 Phép bi n đ i Fourier c a tín hi u r i r c DTFT ệ ờ ạ ế ổ ủ

Phép bi n đ i này áp d ng đ phân tích cho c tín hi u và h th ng. Nó ệ ố ụ ế ệ ể ả ổ

đ c dùng trong tr ng h p dãy r i r c dài vô h n và không tu n hoàn. ượ ườ ờ ạ ạ ầ ợ

=

X

(

)

njenx ][

¥=

n

¥ W - W (cid:229) DTFT : (1.9) -

ư Ta nh n xét th y r ng tuy tín hi u r i r c trong mi n th i gian nh ng ệ ờ ạ ấ ằ ề ậ ờ

DTFT l ạ i liên t c và tu n hoàn trong mi n t n s . ề ầ ố ụ ầ

DTFT chính là hàm ph c theo bi n t n s th c. Ta g i DTFT là ế ầ ố ự ứ ọ ổ ứ ph ph c

(complex spectrum) hay ng n g n là ph c a tín hi u r i r c x[n]. ệ ờ ạ ắ ọ ổ ủ

1.6.1 S h i t c a phép bi n đ i Fourier ự ộ ụ ủ ế ổ

Không ph i là t t c DTFT đ u t n t i (h i t ) vì DTFT ch h i t khi ả ấ ả ề ồ ạ ỉ ộ ụ ộ ụ

¥<

njenx ][

¥=

n

¥ W - (cid:229) (1.10) -

nj

nj

][ enx

][ enx

¥=

¥=

n

n

nj

nj

][ enx

||][| nx

e

|

¥=

¥=

n

n

nj

][ enx

|][| nx

¥=

¥=

n

n

¥ ¥ W - W - £ (cid:229) (cid:229) - - ¥ ¥ W - W - £ (cid:229) (cid:229) Ta luôn luôn có : (1.11) - - ¥ ¥ W - £ (cid:229) (cid:229) - -

|][| nx

¥

¥=n

< ¥ thì bi n đ i Fourier h i t ệ (cid:229) Nh v y, n u x[n] tho đi u ki n ả ề ư ậ ế ộ ụ ế ổ -

[7].

1.6.2 Quan h gi a bi n đ i Z và bi n đ i Fourier ế ổ ế ổ ệ ữ

=

)( zX

nznx ][

¥=

n

¥ - (cid:229) Bi u th c tính ZT là: (1.12) ứ ể -

Gi s ROC có ch a đ ng tròn đ n v . Tính X(Z) trên đ ả ử ứ ườ ơ ị ườ ị ng tròn đ n v , ơ

ta đ c ượ

Trang 19 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

nj

=

zX )(

enx ][

X

(

)

= (cid:229)

= W j ez

¥=

n

¥ W - W (1.13) -

Nh v y, bi n đ i Fourier chính là bi n đ i Z tính trên đ ư ậ ế ế ổ ổ ườ ị ng tròn đ n v . ơ

D a vào đây, ta có th phát bi u l i đi u ki n t n t i c a DTFT nh sau : ể ạ ự ể ệ ồ ạ ủ ư ề

Bi n đ i Fourier c a m t tín hi u ch t n t i khi ROC c a bi n Z c a tín ỉ ồ ạ ủ ế ệ ổ ộ ủ ủ ế

hi u đó có ch a đ ứ ườ ệ ng tròn đ n v . ị ơ

c 1.6.3 Phép bi n đ i Fourier ng ế ổ ượ

c - Bi u th c tính bi n đ i Fourier ng ế ứ ể ổ ượ

p2 , do Wje

p2

W ) là m t hàm tu n hoàn v i chu kỳ Ta th y X( ấ ầ ộ ớ ớ tu n hoàn v i ầ

+W

p

j

j

(

p )2

j

2

j

=

=

=

e

e

j ee

e

chu kỳ W W W

p-

p

(

,

)

(1.14) p Do đó d i t n s c a tín hi u r i r c là m t d i t n b t kỳ r ng 2 , ệ ờ ạ ộ ả ầ ả ầ ấ ộ

p

th ố ủ hay (0,2p ). ườ ng ch n là: ọ

,p

)

- W ) thành chu i Fourier trong kho ng ( ả ỗ

)2,0(

W hay i c a X( V y ta có th khai tri n X( ể ậ ể p n u đi u ki n t n t ề ệ ồ ạ ủ ế ) tho mãn. Các h s Fourier là x[n], ệ ố ả

l

je W

W c x[n] t X( ) theo cách sau: ta có th tính đ ể ượ ừ

1 p2

p

r i l y tích phân trong Nhân 2 v c a bi u th c DTFT v i ể ế ủ ứ ớ ồ ấ

,p

)

p

p

p

- kho ng ( tacó ả

j

l

nj

j

l

j

(

nl

)

=W

=W

X

(

)

e

d

enx ][

d

e

nx ][

e

d

lx ][

¥=

¥=

1 p 2

1 p 2

1 p 2

p

p

p

n

n

¥ ¥ ø Ø ø Ø - W W W - W W W Œ (cid:229) (cid:229) œ Œ (cid:242) (cid:242) (cid:242) - - ß º - - - ß º

p

(1.15)

,p

)

p

- Thay l = n và thay c n tích phân, không nh t thi ấ ậ ế t ph i là ( ả mà chỉ

i là 2 , ta đ c bi u th c tính bi n đ i Fourier c n kho ng gi a cân trên và d ữ ầ ả ướ ượ ế ổ ứ ể

ng c (IDTFT) nh sau ượ ư

nj

=

nx ][

X

(

)

e

d

1 p 2

p

2

W W W (cid:242) (1.16)

Trang 20 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

Ta có th tính IDFT b ng hai cách : m t là tính tr c ti p tích phân trên, hai ự ế ể ằ ộ

c. Tuỳ vào t ng tr là chuy n v bi n đ i Z r i tính nh bi n đ i Z ng ồ ư ế ề ế ể ổ ổ ượ ừ ườ ng

ng pháp nào cho thu n ti n. h p c th mà ta ch n ph ợ ụ ể ọ ươ ệ ậ

+

+

1.6.4 Các tính ch t c a phép bi n đ i Fourier ế ổ ấ ủ

n ][

bx

n ][

aX

(

)

bX

(

)

ax 1

2

1

2

W W « Tính tuy n tính ế

(1.17)

Tính d ch th i gian ờ ị

(1.18)

ả Qua đây ta th y s d ch chuy n tín hi u trong mi n th i gian s không nh ệ ấ ự ị ẽ ể ề ờ

ng biên đ c a DTFT, tuy nhiên pha đ c thêm m t l ng. h ưở ộ ủ ượ ộ ượ

Tính d ch t n s / đi u ch ầ ố ề ị ế

nx ][

X

(

)

j

n

0

e

nx ][

X

(

)

0

+

W+W

cos(

nxn ][)

x

(

)

X

(

)

0

0

0

1 2

1 2

W « W W - W « (1.18) W - W « W

Nh vây, vi c đi u ch gây ra d ch t n s [12]. ế ầ ố ư ệ ề ị

Tính ch p th i gian ậ ờ

F

T ng t ươ ự ư ế nh bi n đ i Z, v i bi n đ i Fourier ta cũng có: ế ổ ổ ớ

X

(

)

X

(

)

nx 1

nx ][*][ 2

1

2

l

l

W W (cid:190) fi ‹ (1.19)

[

l )(

X

X

(

)

d

nxnx ]. ][ 1

2

1

2

1 p 2

p

2

- W « (cid:242) Tính nhân th i gian (1.20) ờ

1.6.5 Phân tích t n s (ph ) cho tín hi u r i r c ệ ờ ạ ầ ố ổ

Trong mi n t n s , m i tín hi u đ u có m t đ c đi m riêng c a nó. Ví d ề ầ ố ộ ặ ủ ệ ể ề ỗ ụ

nh , tín hi u sin ch có duy nh t m t t n s đ n, trong khi nhi u tr ng ch a t ộ ầ ố ơ ứ ấ t ư ễ ệ ấ ắ ỉ

ầ ố ấ c các thành ph n t n s . S bi n thiên ch m c a tín hi u là do t n s th p, ả ầ ầ ố ự ế ủ ệ ậ

trong khi s bi n thi n nhanh và nh ng xung nh n là do t n s cao. Nh xung ầ ố ự ế ữ ư ế ọ

vuông ch ng h n, nó ch a t t c t n s và c t n s cao. ứ ấ ả ầ ố ả ầ ố ẳ ạ

Trang 21 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

Ph c a tín hi u là mô t chi ti ổ ủ ệ ả ế t các thành ph n t n s ch a bên trong tín ầ ầ ố ứ

hi u. Ví d nh tín hi u xung vuông, ph c a nó ch ra t ụ ư ổ ủ ệ ệ ỉ ấ ả ọ ủ t c các đ nh nh n c a ỉ

các sóng sin riêng có th k t h p l i h p v i nhau t o ra xung vuông. Thông tin ể ế ợ ạ ợ ạ ớ

này quan tr ng vì nhi u lý do. Ví d , thành ph n t n s trong m t m u nh c ch ầ ầ ố ụ ề ẫ ạ ọ ộ ỉ

cho ta bi t các đ c tr ng c a loa, đ t ế ể ừ ư ủ ặ đó khi s n xu t ta l ả ấ ạ i có c i ti n cho ả ế

hay h n. Đ d đoán các nh h ng c a b l c trên tín hi u, c n ph i bi ể ự ả ơ ưở ộ ọ ủ ệ ầ ả ế t

t c ph c a tín hi u n a. không ch b n ch t c a b l c mà còn ph i bi ấ ủ ộ ọ ỉ ả ả ế ả ổ ủ ệ ữ

1.6.6 Ph tín hi u và ph pha ổ ổ ệ

Ph c a tín hi u g m hai ph n: ph biên đ (magnitude spectrum) và ph ổ ổ ủ ệ ầ ồ ộ ổ

ố pha (phase spectrum). Ph biên đ ch ra đ l n c a t ng thành ph n t n s . ầ ầ ủ ừ ộ ớ ổ ộ ỉ

Ph pha ch quan h pha gi a các thành ph n t n s khác nhau. Công c đ tính ầ ầ ố ụ ể ữ ệ ổ ỉ

ph tín hi u r i r c không tu n hoàn là DTFT. ệ ờ ạ ầ ổ

Đ tính ph tín hi u , ta qua hai b c : m t là tính DTFT c a tín hi u – ệ ể ổ ướ ủ ệ ộ

W là X( W ), hai là tính biên đ và pha c a X( ) ủ ộ

(

)

=

X

(

)

X

(

qje

)

W W W (1.21)

q ( W

W đây |X( )| là ph biên đ và ở ổ ộ ) là ph pha. ổ

Ta d dàng ch ng minh đ ễ ượ ằ ộ c r ng đ i v i tín hi u th c, ph biên đ là ệ ố ớ ự ổ

W và ph pha là m t hàm l theo . ứ ầ ố W m t hàm ch n theo t n s ẵ ộ ộ ổ

W Do đó, n u bi ế ế t ph X( ổ ổ

0 đ n t trong toàn d i t n s . Đ d gi ả ầ ố ể ễ ả ẻ ế p ) trong kho ng 0 đ n ả ổ ầ ố ố W i thích ph , t n s s , ta có th suy ra ph ể ế p th ừ ngườ

s.

đ c chuy n đ i thành t n s t ng t 0 đ n f ượ ầ ố ươ ể ổ t ự ừ ế s/2 n u t n s l y m u là f ế ầ ố ấ ẫ

Trang 22 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

c l y m u v i t n s l y m u 8kHz Hình 1.6 M u ti ng nói “eee” đ ế ẫ ượ ấ ẫ ớ ầ ố ấ ẫ

[11].

1.7 Các thu t toán s d ng nâng cao ch t l ử ụ ấ ượ ậ ng ti ng nói ế

1.7.1 Tr phừ ổ

Spectral-subtraction (SS) hay còn g i là tr ọ ừ ả ph là m t thu t toán gi m ậ ổ ộ

nhi u đ n gi n nh t. Nó d a trên nguyên lý c b n là nó s mô t ơ ả ự ẽ ễ ấ ả ơ ả ậ và c p nh t ậ

ệ nhi u trong tín hi u có nhi u b ng cách thu nhi u khi không có s hi n di n ự ệ ễ ễ ệ ễ ằ

c a tín hi u. Và nhi u đó s đ ủ ẽ ượ ễ ệ ệ c tr v i tín hi u có nhi u, k t qu là tín hi u ừ ớ ễ ế ệ ả

c a chúng ta sau khi x lý b ng thu t toán này s đ ủ ẽ ượ ử ậ ằ c lo i đi nhi u và xét trên ễ ạ

ph ng thì nó là tín hi u s ch. SS lúc ban đ u đ ươ ng di n lý t ệ ưở ệ ạ ầ ượ ề ấ ở c đ xu t b i

Weiss[8] trong mi n t ng quan, và sau đó đ c đ xu t b i Boll [9] trong ề ươ ượ ấ ở ề

mi n chuy n đ i Fourier. ể ổ ề

1.7.2 Mô hình th ng kê ố

V n đ c a nâng cao ch t l ng ti ng nói là ph i đ ra đ c khung mô ề ủ ấ ượ ấ ả ề ế ượ

mang tính th ng kê. Nó là m t t p các phép đo t t ả ộ ậ ố ươ ứ ổ ng ng v i h chuy n đ i ớ ệ ể

Fourier c a tín hi u nhi u, và chúng ta mong mu n s tìm ra đ ố ẽ ủ ễ ệ ượ c m t ph ộ ươ ng

th c c l ng tuy n tính ho c phi tuy n các tham s có l ứ ướ ượ ế ế ặ ố ợ ể i, đó là h chuy n ệ

Trang 23 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

c s d ng đó là thu t toán Wiener và đ i c a tín hi u s ch. Hai thu t toán đ ổ ủ ệ ạ ậ ượ ử ụ ậ

minium mean-squared error(MMSE)[10].

1.8 Tín hi u ti ng nói ệ ế

ng thay đ i theo Tín hi u ti ng nói là tín hi u liên t c và có ph năng l ệ ụ ệ ế ổ ượ ổ

ả th i gian. Tuy nhiên khi kh o sát trong m t kho ng th i gian đ ng n (kho ng ủ ả ắ ả ờ ộ ờ

10 đ n 30 ms) thì đ c tính ph c a nó coi nh không thay đ i. ổ ủ ư ế ặ ổ

Hình 1.7 D ng sóng tín hi u ti ng nói c a câu “The wife helped her ủ ệ ế ạ

husband” và d ng sóng c a ph âm “f” trong t ụ ủ ạ ừ ạ “wife, d ng sóng c a đo n ủ ạ

nguyên âm “er” trong t “her” [11]. ừ

D ng sóng c a tín hi u có th đ ể ượ ủ ệ ạ c chia thành m t s phân đo n t ộ ố ạ ươ ng

ng v i các âm/t ứ ớ ừ ầ . Trong ví d trên ta th y m t s phân đo n có d ng sóng g n ộ ố ụ ạ ạ ấ

nh tu n hoàn còn s khác thì không có tính tu n hoàn và b nhi u ễ ư ầ ầ ố ị

Trang 24 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

Nh ng ki u c a đo n ti ng nói_chu kỳ, nhi u, kho ng l ng… th ữ ủ ễ ể ế ả ặ ạ ườ ng

đ c tìm th y trong ti ng nói trôi ch y v i s thay đ i v c ượ ổ ề ườ ớ ự ế ả ấ ả ng đ , kho ng ộ

th i gian và đ c tính ph . ổ ặ ờ

1.9 C ch t o ti ng nói ơ ế ạ ế

1.9.1.1 B máy phát âm c a con ng

ủ ộ i ườ

Hình 1.8 m t c t d c c a c quan t o ti ng nói [11]. ặ ắ ọ ủ ơ ế ạ

Trang 25 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

1.9.2 Mô hình k thu t c a vi c t o ti ng nói ậ ủ ệ ạ ế ỹ

Hình 1.9 mô hình k thu t t o ti ng nói[11]. ậ ạ ế ỹ

1.9.3 Phân lo i âm ạ

Các âm trong ti ng Anh đ c phân lo i g m: nguyên âm và nguyên âm ế ượ ạ ồ

đôi, bán nguyên âm, âm mũi, âm stops, fricative, africatives, whisper.

Hình 1.10 b ng phân lo i âm v trong ti ng Anh c a ng ủ ế ạ ả ị ườ i M [11] ỹ

1.9.4 Thu c tính âm h c c a ti ng nói ọ ủ ế ộ

Tín hi u ti ng nói là tín hi u t ng t ệ ươ ệ ế ự ề ặ , bi u di n cho thông tin v m t ễ ể

ngôn ng và đ c th hi n b ng các âm v khác nhau. S l ng các âm v tuỳ ữ ượ ể ệ ố ượ ằ ị ị

Trang 26 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 1 : T ng quan v nâng cao ch t l ươ ấ ượ ề ổ ng ti ng nói ế

thu c vào t ng ngôn ng , vào kho ng 20 đ n 30 và không v ữ ừ ế ả ộ ượ ố ớ t quá 50. Đ i v i

t ng lo i âm v nó có đ c tính âm thanh khác nhau.T h p các âm v t o nên âm ừ ổ ợ ị ạ ạ ặ ị

ti t. Âm ti t đóng vai trò m t t tr n v n mang ng nghĩa. ế ế ộ ừ ọ ẹ ữ

ng 1.10 K t lu n ch ế ậ ươ

Ch ng này đã trình bày đ c m c đích chính c a speech enhancement là ươ ượ ủ ụ

tri ệ ộ t nhi u ho c là nén nhi u trong tín hi u ti ng nói đã b nhi u. Ngoài ra, n i ệ ễ ế ễ ễ ặ ị

dung c a ch ng cũng đã nêu rõ đ ủ ươ ượ c các lo i nhi u xu t hi n trong t ng môi ấ ừ ệ ễ ạ

tr ng c th đ t đó chúng ta có tìm ra đ ườ ụ ể ể ừ ượ ợ ứ c thu t toán x lý thích h p ng ử ậ

v i m i tr ớ ỗ ườ ng h p c th . ợ ụ ể

Trang 27 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

CH NG 2 : ĐÁNH GIÁ CHÂT L NG TIÊNG NOI ƯƠ ́ ƯỢ ́ ́

1.11 Gi ng ớ i thi u ch ệ ươ

Cho đ n nay đã có r t nhi u thu t toán nâng cao ch t l ề ấ ượ ế ậ ấ ng ti ng nói, ế

ấ nh ng làm th nào đ đánh giá đúng hi u qu c a chúng. Ph n này cung c p ệ ả ủ ư ể ế ầ

các ph ng pháp đánh giá khác nhau đ ươ ượ ử ụ c s d ng đ đánh giá ể ̉ hiêu qua cua ̣ ̉

thu t toán nâng cao ti ng nói ế ậ

Đánh giá ch t l ng có th th c hi n b ng cách s d ng ph ng pháp ấ ượ ể ự ử ụ ệ ằ ươ

đanh gia i nghe theo môt thang đo đa đ c xac đinh ́ theo cam nh n ậ cua ng ườ ̃ ượ ́ ̉ ̉ ̣ ́ ̣

tr c (Subjective Evaluation _ SE) ho c d a trên phép đo các thu c tính c a tín ướ ặ ự ủ ộ

ng quan hi u ệ (Objective Evaluation_ OE). Dù OE có giá tr thì nó v n ph i t ả ươ ẫ ị

i nghe v i ớ cam nhân ̣ c a ng ủ ườ ̉

ng pháp đánh Ph n này s cung c p m t cái nhìn t ng quan v ộ ề cac ́ ph ẽ ấ ầ ổ ươ

giá ch t l ng c a ti ng nói đã đ c x lý ấ ượ ủ ế ượ ử

1.12 Ph ng pháp đánh giá ch quan ươ ủ

Đánh giá ch t l ng ch quan là đánh giá ch t l ấ ượ ấ ượ ủ ậ ng d a trên c m nh n ự ả

i đ i v i ti ng nói nghe c a con ng ủ ườ ố ớ ế

Ch t l ấ ượ ề ả ng là m t trong các thu c tính c a tín hi u ti ng nói. V b n ủ ệ ế ộ ộ

ch t thì ch t l ng có tính ch quan cao và khó có th đánh giá m t cách đáng ấ ượ ấ ủ ể ộ

tin c y.Nó ch đóng vai trò ph n nào trong k thu t đánh giá vì m i cá nhân ậ ầ ậ ỗ ỹ ỉ

ng i nghe có nh ng tiêu chu n riêng v ch t l ng “t ườ ấ ượ ữ ề ẩ ố ấ t” hay “x u”, ch t ấ

ng là k t qu c a s c m nh n và phán đoán ch quan c a ng l ượ ả ủ ự ả ủ ủ ế ậ ườ ẫ i nghe, d n

ng có r t nhi u ch tiêu đ n s chênh l ch l n trong k t qu đánh giá. Ch t l ế ự ấ ượ ệ ế ả ớ ề ấ ỉ

c. Tùy vào các m c đích th c t không th đ m h t đ ể ế ế ượ ự ế ụ ỗ ứ và tùy vào m i ng

d ng mà ch t p trung vào m t s ch tiêu ch t l ụ ộ ố ỉ ỉ ậ ấ ượ ng ti ng nói. ế

Đánh giá ch t l ấ ượ ng ti ng nói là m t công vi c đ y khó khăn do tính đa ệ ế ầ ộ

ch tiêu và tính ch quan cao. Có m t s l ộ ố ượ ủ ỉ ng l n các đ c tr ng đ đánh giá ư ể ặ ớ

khi th c hi n ph ng pháp nghe ch quan này. Đ k t qu đánh giá là đáng tin ự ệ ươ ể ế ủ ả

c y thì s l a ch n đúng đ n các tham s cho vi c đánh giá là đi u c n thi ậ ự ự ề ệ ầ ắ ọ ố ế t.

Trang 28 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

D a trên th c t ự ế ự ẩ đó ITU-T đã đ a ra các khuy n ngh ban hành trong các chu n ư ế ị

t ừ ệ ITU-T Rec P.800 đ n ITU-T Rec P.899. Có hai lo i đánh giá chính là Tuy t ế ạ

ng đ i. S đánh giá d a trên các thang đi m chu n đã đ đ i và T ố ươ ự ự ể ẩ ố ượ ề c đ ra

trong chu n ITU-T Rec.P.800[11] ẩ

1.12.1 Các ph ươ ng pháp đánh giá tuy t đ i ệ ố

Ph ng pháp đánh giá tuy t đ i ACR

1.12.1.1

ươ ệ ố

ACR đ c s d ng r ng rãi. ITU-T[11] đã khuy n ngh dùng ph ượ ử ụ ế ộ ị ươ ng

pháp này trong h u h t các ng d ng. Thang đo đ c khuy n là ầ ế ứ ụ ượ ế

 Mean Opinion Scores (MOS)

Đ c mô t ượ ả ộ trong khuy n ngh P.800 c a ITU-T, MOS là m t ủ ế ị

phép đo ch t l ng tho i n i ti ng. Đây là m t ph ấ ượ ạ ổ ế ộ ươ ấ ng pháp đo ch t

ng mang tính ch t ch quan. Có hai ph ng pháp ki m tra là đánh l ượ ủ ấ ươ ể

giá đàm tho i và đánh giá đ nghe. ạ ộ

Bang 2.1.Thang điê [12] ̉m đanh gia chât l ́ ượng tiêng noi theo MOS ̉ ́ ́ ́ ́

Score 5 4 3 2 1 Quality of the Speech Excellent Good Fair Poor Bad Level of Distortion Imperceptible Just perceptible, but not annoying Perceptible and slight annoying Annoying but not Objectinable Very annoying and Objectionable

1.12.2 Các ph ng pháp đánh giá t ươ ươ ng đ i ố

Nhìn chung ph ng pháp đánh giá này có đ nh y cao h n đ i v i s suy ươ ố ớ ự ạ ộ ơ

gi m ch t l ấ ượ ả ng c a tín hi u đã qua x lý ệ ủ ử

Đánh giá b ng ph ng pháp so sánh các m u tín hi u

1.12.2.1

ằ ươ ệ ẫ

D ng đ n gi n nh t c a ph ả ấ ủ ạ ơ ươ ơ ng pháp này là thích nghe m u nào h n ẫ

Preference test hay còn g i là so sánh đánh giá theo t ng c p tín hi u ệ Paired ừ ặ ọ

Comparison Test. Đ i v i ph ng pháp này thì ng i nghe s đ c nghe hai ố ớ ươ ườ ẽ ượ

m u tho i và s đánh giá thích m u tín hi u nào h n ơ ẽ ệ ẫ ẫ ạ

Trang 29 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

Đánh giá b ng cách so sánh Comparison Category Rating (CCR) đ ằ cượ

khuy n ngh b i ITU-T đ đánh giá các h th ng dùng nâng cao ch t l ệ ố ị ở ấ ượ ng ể ế

ti ng nói. [13] ế

Bang R 2.4. Thang điểm đanh gia chât l ́ ượng tin hiê ̣u tiêng noi theo CC ̉ ́ ́ ́ ́ ́

Rating 3 2 1 0 -1 -2 -3 Quality of Speech Much better Better Slightly Better About the Same Slightly Worse Worse Much Worse

Theshold Test hay còn g i là ọ ể ủ Isopreference Test là m t bi n th c a ế ộ

Preference Test. Ph ươ ệ ng pháp này là so sánh tín hi u đã qua x lý v i tín hi u ệ ử ớ

ng c a nó có th đ c ki m soát. Đ c đ gốc chu n mà đ suy gi m ch t l ộ ấ ượ ả ẩ ể ượ ủ ượ ề ể

ra trong chu n ITU-T Rec.P.810 ẩ

Ph ng pháp đánh giá theo s suy gi m ch t l ng

1.12.2.2

ươ ấ ượ ự ả

Đánh giá s suy gi m ch t l ng ấ ượ Degradation Category Rating (DCR) ự ả

S gi m sút v ch t l ề ấ ượ ự ả ng c a tín hi u đã qua x lý so v i tín hi u ch t l ử ấ ượ ng ủ ệ ệ ớ

cao ch a qua x lý đ c xác đ nh qua năm thang đi m ử ư ượ ể ị

Bang 2.5. Thang đanh gia DCR ̉ ́ ́

Rating Degradation

1 Very annoying

2 Annoying

3 Sightly annoying

4 Audible but not annoying

5 Inaudible

Trang 30 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

1.13 Ph ng pháp đ anh gia ươ ́ khách quan ́

Đánh giá ch t l ng khách quan là ph ng pháp đánh giá ch t l ấ ượ ươ ấ ượ ự ng d a

trên các phép đo thu c tính c a tín hi u ệ ộ ủ

1.13.1 Đo ty sô tin hiêu trên nhiêu trên t ng khung ừ ̉ ́ ́ ̣ ̃

Đo SNR trên t ng khung trong mi n th i gian là m t trong nh ng ph ề ừ ữ ờ ộ ươ ng

pháp đánh giá vê măt toan đ n gi n nh t. Đ ph ng pháp này có hi u qu thì ể ả ấ ơ ươ ệ ả ̀ ̣ ́

ề đi u quan tr ng là tín hi u g c và tín hi u đã qua x lý ph i trong cùng mi n ử ề ệ ệ ả ố ọ

i ph i đ c hi u ch nh chính xác. SNRseg đ th i gian và đ l ch pha hi n t ộ ệ ệ ạ ờ ả ượ ệ ỉ ượ c

[12]

(2.1)

xác đ nh nh sau ư ị

: tín hi u g c (tín hi u s ch) Trong đo ́ ệ ố ệ ạ

c tăng c ng : tín hi u đã đ ệ ượ ườ

N: chi u dài khung (th ng đ c ch n t 15-20ms) ề ườ ượ ọ ừ

M: s khung c a tín hi u ệ ủ ố

M t v n đ ti m n v i ph ng pháp đánh giá SNRseg là năng l ề ề ẩ ộ ấ ớ ươ ượ ủ ng c a

tín hi u trong su t kho ng l ng c a tín hi u tho i (xu t hi n nhi u trong các ủ ệ ề ệ ệ ạ ấ ặ ả ố

đo n h i tho i) s r t bé, d n đ n k t qu là giá tr c a ai s SNRseg l n l ế ẽ ấ ớ am̀ ị ủ ế ả ẫ ạ ạ ộ ố

sai lêch toan bô đanh gia. Ph ng an giai quyêt duy nhât la loai tr nh ng khung ươ ̣ ừ ữ ̣ ̀ ̣ ́ ́ ́ ̉ ́ ́ ̀

lăng trong biêu th c trên băng cach đo m c năng l ứ ứ ượ ng trong th i gian ngăn ờ ́ nén ̣ ̉ ̀ ́

giá tr SNRseg ng ng đên môt gia tri be. c gi i han ị ưỡ ́ N uế gia tri SNRseg đ ượ ớ ́ ̣ ́ ̣ ́ ̣ ̣

trong khoang [-10dB, 35dB] c viêc cân phai dung bô tach tin [14] sẽ tranh đ ượ ̉ ́ ̣ ̀ ̉ ̀ ̣ ́ ́

hiêu thoai va khoang lăng ̣ ̣ ̀ ̉ ̣

S xac đinh tr c cua SNRseg d a trên tin hiêu vao gôc va tin hiêu đa đ c ự ướ ̃ ượ ự ́ ̣ ̉ ́ ̣ ̀ ́ ̀ ́ ̣

c x ly qua bô loc d đoan th ng đ x ly. Ta co thê dung tin hiêu đ ử ượ ử ̣ ự ườ ượ ử c s ́ ́ ̉ ̀ ́ ̣ ́ ̣ ́

dung trong thuât toan CELP ́ [15]. Sau khi đ a tin hiêu gôc va tin hiêu đa qua x ly ư ́ ử ̣ ̣ ́ ̣ ́ ̀ ́ ̣ ̃

qua cac bô loc nay, ta co thê tinh toan SNRseg d a trên tin hiêu ra cua cac bô ự ̣ ́ ̣ ̣ ̀ ́ ̉ ́ ́ ́ ̣ ̉ ́

Trang 31 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

c tinh SNR nay mang lai hê sô t ng quan cao đôi v i cac ph loc̣ [16]. S ự ướ ́ ươ ́ ớ ươ ng ́ ̀ ̣ ̣ ́

phap đanh gia chu quan ́ ́ ́ ̉

Môt cach xac đinh SNRseg khac đ ượ c đê xuât b i Richards ́ ở [17] trong đó ̣ ́ ́ ̣ ́ ̀

ham log co thay đôi so v i công th c ứ 3.1 ớ ̀ ́ ̉

(2.2)

Nh vây co thê tranh đ c cac gia tri sai ư ượ l chệ l n trong suôt cac khoang ớ ̣ ́ ̉ ́ ́ ́ ̣ ́ ́ ̉

lăng cua tin hiêu tiêng noi. Chu y răng gia tri nho nhât co thê đat đ ̣ ượ ̉ c cua ̣ ̉ ́ ̣ ́ ́ ́ ́ ̀ ́ ̣ ̉ ́ ́ ̉

SNRsegR bây gi ờ ̀ Ư la 0 thi đa tôt h n nhiêu so v i nh ng gia tri âm vô cung. u ớ ́ ơ ữ ̀ ̀ ̃ ̀ ́ ̣

điêm chinh cua viêc xac đinh tr c phân đoan SNR la tranh đ ướ ượ ́ c viêc cân thiêt ̉ ́ ̉ ̣ ́ ̣ ̣ ̀ ́ ̣ ̀

phai lam ro rang gi a cac khoang tiêng noi va khoang lăng ữ ̉ ̀ ̃ ̀ ́ ̉ ́ ́ ̀ ̉ ̣

Đo SNR cho t ng khung co thê đ c m rông trong miên tân sô theo ừ ̉ ượ ở ́ ̣ ̀ ̀ ́

(2.3)

ng tai dai tân sô th j Bj : Trong l Trong đo ́ ượ ́ ứ ̣ ̣ ̉ ̀

K : Sô dai tân ́ ̉ ̀

M : Tông sô khung tin hiêu ̉ ́ ́ ̣

F(m,j) : Day tin hiêu gôc qua bo loc đa đ ̃ ượ ̣ c khuêch đai tai ̃ ́ ̣ ́ ̣ ̣ ́ ̣

daỉ

lân th ứ j va khung th ứ m ̀ ̀

: Day tin hiêu đa đ c tăng c ng qua loc khuêch ̃ ượ ườ ̃ ́ ̣ ̣ ́

đai cung môt dai tân v i ̣ ở ớ F(m,j) ̀ ̣ ̉ ̀

u điêm chinh cua viêc s dung SNRseg trên miên tân sô thay vi miên Ư ̣ ử ̉ ́ ̉ ̣ ̀ ̀ ́ ̀ ̀

th i gian tăng thêm tinh linh đông cua viêc phân bô trong ờ ố ủ phô khac nhau s c a ́ ̣ ̉ ̣ ́ ̣ ̉ ́

cho nh ng dai tân khac nhau ữ ̉ ̀ ́

Môt cach khac, trong c băng cach dung ố cua môi dai co thê thu đ s ượ ̣ ́ ́ ̣ ̉ ̃ ̉ ́ ̉ ̀ ́ ̀

ph ng phap phân tich hôi quy, con goi la ph ng phap đanh gia chu quan biên ươ ươ ́ ́ ̀ ̀ ̣ ̀ ́ ́ ́ ̉ ́

đôi tân sô. Băng cach nay , trong c chon đê co hê sô t số co thê đ ̉ ượ ́ ươ ng quan l n ớ ̉ ̀ ́ ̀ ́ ̀ ̣ ́ ̣ ̉ ́ ̣

nhât gi a đanh gia khach quan va đanh gia chu quan. V i ph ng phap nay, tông ữ ớ ươ ́ ́ ́ ́ ̀ ́ ́ ̉ ́ ̀ ̉

Trang 32 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

j

cua K (cho môi dai) cua cac ph ng phap đanh gia khach quan khac nhau va D ươ ̉ ̃ ̉ ̉ ́ ́ ́ ́ ́ ́ ̀

j đ

đ c tinh cho môi day, tai D c cho nh sau [12] c ượ ướ ượ ư ́ ̃ ̃ ̣

(2.4)

j cua môi dai đat đ

Trong l ng tôi u cho môi D c khi dung ph ượ ́ ư ̣ ượ ươ ng ̣ ̃ ̉ ̃ ̉ ̀

phap phân tich hôi quy tuyên tinh bâc K, cho ra đanh gia chu quan biên đôi tân sô: ́ ́ ̀ ́ ́ ̣ ́ ́ ̉ ́ ̉ ̀ ́

(2.5)

: Cac hê sô hôi quy, c cho b i Dj : đ ượ ở (3.4), K la sô dai ̀ .Phân tich hôi ́ ̣ ́ ̀ ̀ ́ ̉ ́

quy không tuyên tinh cung co thê đ c s dung nh ̉ ượ ử ́ ư m tộ cach đê chuyên hoa ́ ́ ̃ ́ ̣ ́ ̉ ̉

đanh gia khach quan biên đôi tân sô ́ ́ ́ ́ ̉ ̀ ́

1.13.2 Đo khoang cach phô d a trên LPC ̉ ự ̉ ́

LPC (Linear Prediction Coefficient)s :Hê sô d đoan tuyên tinh ́ ự ̣ ́ ́ ́

G m các ph ng phap phô biên la LLR ( Log Likelihood Ratio) , IS (Itakura ồ ươ ́ ̉ ́ ̀

Saito) và đo theo kho ng cách cepstrum ả

Ph ng phap đo LLR

1.13.2.1

ươ ́

(2.6)

:hê sô LPC cua tin hiêu sach ̣ ́ ̉ ́ ̣ ̣

:hê sô cua tin hiêu đa đ ̃ ượ c ̣ ́ ̉ ́ ̣

tăng c ng chât l ng ườ ́ ượ

ng quan(Toeplitz) cua tin hiêu sach Rx la ̀ (p+1)*(p+1)ma trân t t ̣ ự ươ ̉ ́ ̣ ̣

Biêu th c trên đ c viêt lai trong miên tân sô nh sau [9] ứ ượ ́ ư ̉ ́ ̣ ̀ ̀

[17] (2.7)

lân l t la phô cua . Biêu th c trên chi ra s va ̀ ̀ ượ va ̀ ứ ự ̀ ̉ ̉ ̉ ̉

khac nhau gi a phô tin hiêu va phô tăng c ng co anh h ng nhiêu h n khi ữ ườ ưở ơ ́ ̉ ́ ̣ ̀ ̉ ́ ̉ ̀

Trang 33 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

l n, th ớ ườ ́ ng gân v i đinh tân sô formant. Do đo, cach đo nay xac ớ ̀ ̉ ̀ ́ ́ ́ ̀

đinh s khac nhau vi tri cua đinh tân sô formant ự ̣ ́ ̣ ́ ̉ ̉ ̀ ́

Ph ng pháp đ o IS

1.13.2.2

ươ

Đo IS đ c xác đ nh nh sau ượ ư ị

[12] (2.8)

lân l t la hê sô khuêch đai cua tin hiêu sach va tin hiêu va ̀ ̀ ượ ̀ ̣ ́ ́ ̣ ̉ ́ ̣ ̣ ̀ ́ ̣

tăng c ng. Hê sô khuêch đai co thê đ c tinh nh sau: ườ ̉ ượ ư ̣ ́ ́ ̣ ́ ́

(2.9)

ch a hê sô t ứ t ́ ự ươ ̉ ng quan cua ̣

tin hiêu sach (no cung la hang đâu tiên cua ma trân t ng quan ) t ̣ ự ươ ́ ̣ ̣ ́ ̃ ̀ ̀ ̀ ̉

Ph ng pháp đo theo kho ng cách cepstrum

1.13.2.3

ươ ả

Không giông v i đo LLR, IS chu trong s khac nhau gi a hê sô khuêch đai , ữ ự ớ ́ ́ ̣ ́ ̣ ́ ́ ̣

s khác nhau v m c ph c a tín hi u s ch và tín hi u tăng c ự ệ ạ ề ứ ổ ủ ệ ườ ạ ng. Bên c nh

đó cũng có th là h n ch c a đánh giá IS, s khác nhau gi a các m c ph có ế ủ ữ ứ ự ể ạ ổ

tác đ ng nh đ n ch t l ng[18] ỏ ế ấ ượ ộ

H s LPC cũng có th xu t phát t kho ng cách đo đ c d a trên h s ệ ố ể ấ ừ ả ượ ự ệ ố

cepstrum. Kho ng cách này quy đ nh s ng kho ng cách log c a ph c l ự ướ ượ ả ị ủ ả ổ

j} s d ng công th c sau

c a gi a hai ph tín hi u. H s cepstrum có th thu đ ủ ệ ố ữ ể ệ ổ c t ượ ừ phép đ quy h ệ ệ

s LPC {a ố ử ụ ứ

(2.10)

V i ớ p là b c c a phân tích LPC .Phép đo d a trên h s cepstrum có th ậ ủ ệ ố ự ể

đ ượ c tính nh sau [19] ư

(2.11)

Trang 34 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

và l n l V i ớ ầ ượ t là h s c a tín hi u s ch và tín hi u đã ệ ệ ố ủ ệ ạ

đ c tăng c ng ượ ườ

1.13.3 Đánh giá mô ph ng theo c m nh n nghe c a con ng ủ ỏ ả ậ i ườ

Nh ng ph ng pháp đánh giá đã đ c đ c p trên đ c a dùng vì tính ữ ươ ượ ề ậ ượ ư

ấ đ n gi n đ th c hi n và d dàng đánh giá. Tuy nhiên, kh năng d đoán ch t ơ ể ự ự ệ ễ ả ả

ng ch quan c a chúng thì h n ch khi mà các ph l ượ ủ ủ ế ạ ươ ệ ng pháp x lý tín hi u ử

i. đó không tính đ n ph m vi nghe c a con ng ạ ủ ế ườ

Ph ng pháp đo Weighted Spectral Slope

1.13.3.1

ươ

Ph ng pháp đánh giá này đ c tính b i d c ph đ u tiên đ ươ ượ ở ố ổ ầ ượ ấ c tìm th y

i h n c a tín hi u s ch và Cx(k) là ph d i t c a m i d i ph . Xét ủ ỗ ả ổ ổ ả ớ ạ ủ ệ ạ là c aủ

tín hi u tăng c ng, xét trong đ n v dB. Ph ng trình sai phân b c nh t đ ệ ườ ơ ị ươ ấ ượ c ậ

dùng đ tính đ c d c ph đ c cho nh sau: ộ ố ổ ượ ể ư

(2.12)

và l n l t bi u di n cho đ d c d i t n th V i ớ ầ ượ ả ầ ộ ố ể ễ ứ k c a tín ủ

hi u s ch và tín hi u tăng c ệ ạ ệ ườ ộ ng. S khác nhau gi a các đ d c ph ph thu c ổ ụ ộ ố ự ữ

ấ vào tr ng s m t là d i t n g n v i đ nh ho c rãnh, hai là đ nh là đ nh l n nh t ố ộ ả ầ ớ ỉ ầ ặ ọ ớ ỉ ỉ

c tính nh sau c a ph . Tr ng s c a d i th ủ ố ủ ả ứ k, ký hi u ệ W(k) đ ổ ọ ượ ư

[12] (2.13)

đ r ng loga l n nh t c a ph trong t t c các băng, là giá ấ ủ ộ ộ ớ ổ ấ ả

, là h ng s có đ tr c a đ nh g n v i băng ầ ị ủ ỉ ớ k nh t, và ấ ằ ố ượ ằ c b ng

phép phân tích h i quy đ c c đ i hóa s t ng quan gi a đánh giá ch quan và ể ự ạ ự ươ ồ ữ ủ

giá tr c a đánh giá khách quan. V i nh ng thí nghi m đã đ c th c hi n thì ị ủ ữ ệ ớ ượ ự ệ

Trang 35 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

ng i ta tìm đ ng quan l n nh t s có đ c v i =20 và ườ c s t ượ ự ươ ấ ẽ ớ ượ ớ

=1[18]

Phép đo WSS tính cho m i khung c a tín hi u tho i: ỗ ủ ệ ạ

(2.14)

ng d i t Với L là s l ố ượ i h n ả ớ ạ

c tính b ng cách l y trung bình các giá tr WSS thu đ Giá tr WSS đ ị ượ ằ ấ ị ượ c

các khung trong câu t ừ

WSS là ph ng pháp đánh giá khá h p d n b i vì nó không đòi h i ph i có ươ ấ ẫ ả ở ỏ

formant rõ ràng. Nó chú ý t ớ ị i v trí đ nh ph và ít nh y c m v i các đ nh xung ạ ả ớ ổ ỉ ỉ

quanh cũng nh các chi ti t c a ph các vùng th p. Đánh giá LPC c b n (ví ư ế ủ ổ ở ơ ả ấ

ớ d nh đánh giá LLR) nh y v i các t n s formant khác, nh ng cũng nh y v i ầ ố ụ ư ư ạ ạ ớ

s thay đ i biên đ và s thay đ i đ nghiêng ph . Không có gì là b t ng khi ự ổ ộ ự ấ ổ ộ ổ ờ

đánh giá WSS mang l i m t s t ng quan l n ( ạ ộ ự ươ ớ ớ ρ=0.74) h n đánh giá LPC, v i ơ

ng ch quan c a ti ng nói b gi m ch t l s đánh giá ch t l ự ấ ượ ị ả ấ ượ ủ ủ ế ng b i s mã ở ự

hóa[20]

Ph ng pháp đo Bark Distortion

1.13.3.2

ươ

Ph ng pháp đánh giá WSS là b c đ u làm m u cho vi c làm th nào đ ươ ướ ầ ệ ế ẫ ể

con ng c ti ng nói, đ c bi t là nguyên âm. Các ph ng pháp ườ i nh n bi ậ t đ ế ượ ế ặ ệ ươ

đánh giá sau này càng d a vào s x lý âm thanh c a tai ng i, cách mà thính ự ử ự ủ ườ

giác con ng i x lý âm thanh và nhi u. Nh ng ph ng pháp đánh giá m i này ườ ử ữ ễ ươ ớ

đã d a trên nh ng l p lu n sau: ữ ự ậ ậ

1. S phân tích t n s c a tai ng i là không thay đ i, t c là s phân ầ ố ủ ự ườ ổ ứ ự

tích t n s c a tín hi u âm thanh không d a trên ph m vi t n s ố ủ ự ệ ạ ầ ầ ố

tuy n tính ế

2. Đ nh y c a tai ng i ph thu c vào t n s âm thanh ạ ủ ộ ườ ầ ố ụ ộ

3. Âm thanh to t ươ ng ng v i đ m nh c a tín hi u trong mi n phi ủ ớ ộ ạ ứ ệ ề

tuy n tính ế

Trang 36 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

Thính giác con ng i ph ng theo m t lo t bi n đ i c a tín hi u âm thanh. ườ ổ ủ ế ệ ạ ộ ỏ

ổ C tín hi u g c và tín hi u đã qua x lý ph i tr i qua hàng lo t các bi n đ i ả ả ử ệ ế ệ ạ ả ố

này, d n đ n cái g i là ph âm l ế ẫ ổ ọ ượ ữ ng. Đánh giá BSD s d ng kho ng cách gi a ử ụ ả

các ph này nh là đánh giá ch t l ấ ượ ư ổ ng ch quan ủ

Ph ng pháp đánh giá c m nh n ch t l

1.13.3.3

ươ ấ ượ ậ ả ng tho i PESQ ạ

Trong các ph ng pháp đánh giá OE thì PESQ là ph ng pháp đánh giá ươ ươ

ph c t p nh t và đ c khuy n ngh b i ITU_T cho đánh giá ch t l ứ ạ ấ ượ ị ở ấ ượ ế ạ ng tho i

băng h p (3,2KHz) và là m t ph ng pháp đánh giá khách quan có tính t ẹ ộ ươ ươ ng

quan cao v i đánh giá theo c m nh n c a ng i nghe ậ ủ ả ớ ườ

ng 1.14 K t lu n ch ế ậ ươ

Ch ng này đã trình bày m t s ph ng pháp đánh giá ch t l ươ ộ ố ươ ấ ượ ế ng ti ng

ng ti ng nói. Các nói sau khi x lý gi m nhi u b ng các thu t toán tăng c ễ ử ằ ậ ả ườ ế

đánh giá SE đ c gi i thi u g m có các ph ng pháp đánh giá tuy t đ i và ượ ớ ệ ồ ươ ệ ố

đánh giá t ng đ i. Các ph ng pháp đánh giá OE đ c trình bày chính trong ươ ố ươ ượ

ch ng này g m : Đo SNRseg, đánh giá LLR, IS và WSS, trong ph n này cũng ươ ầ ồ

đã gi i thi u s b v BSD và PESQ ớ ệ ơ ộ ề

Trang 37 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 2 : Đánh giá ch t l ươ ấ ượ ng ti ng nói ế

Trang 38 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

CH NG 3: THU T TOÁN SPECTRAL–SUBTRACTION VÀ WIENER ƯƠ Ậ

FILTERING

1.15 Gi ng ớ i thi u ch ệ ươ

N i dung c a ch ng này trình bày nguyên lý chung c a thu t toán ủ ộ ươ ủ ậ

Spectral – subtraction và Wiener filtering,nguyên lý c b n c a t ng thu t toán, ơ ả ủ ừ ậ

các b c th c hi n c n thi t đ phân tích liên k t tín hi u, đ c p đ n v n đ ướ ệ ầ ự ế ể ề ậ ệ ế ế ấ ề

ng r t l n đ n quá trình x lý ướ c lu ng nhi u, v n đ này nh h ấ ễ ề ả ợ ưở ấ ớ ử ế

1.16 S đ kh i chung c a Spectral Subtraction và Wiener Filtering ơ ồ ố ủ

Trong đ án này, chúng tôi đã d a trên các c s lý thuy t c a các thu t toán đã ế ủ ở ở ự ậ ồ

có trong speech enhancement, và đã l a ch n ra 2 thu t toán đó là : Spectral ự ậ ọ

subtraction và Wiener filter đ s d ng làm thu t toán x lý tri ể ử ụ ử ậ ệ t nhi u. ễ

Overlap và

S đ kh i chung cho c 2 thu t toán : ơ ồ ậ ả ố

adding FFT IDFT Hàm x lý ử gi m nhi u ễ ả Phân tích tín hi u thành các ệ frame Tín hi u ệ

ng

s chạ Tín hi u b ị ệ

c l Ướ ượ nhi uễ

nhi u ễ

Hình 3.1 S đ kh i cho hai thu t toán SS và WF ơ ồ ố ậ

C 2 thu t toán Spectral subtraction và Wiener filter ch khác nhau ậ ả ỉ ở ố kh i

t c các kh i còn l hàm x lý tri ử ệ t nhi u, t ễ ấ ả ố ạ i thì gi ng nhau. ố

1.17 Thu t toán Spectral Subtraction ậ

1.17.1 Gi i thi u chung ớ ệ

Spectral – subtraction là thu t toán đ ậ ượ ề ậ c đ xu t s m nh t trong các thu t ấ ấ ớ

toán đ c s d ng đ gi m nhi u trong tín hi u. Đã có r t nhi u bài lu n mô ượ ử ụ ể ả ệ ề ễ ấ ậ

t ả ộ các bi n th c a thu t toán này so v i các thu t toán khác. Nó d a trên m t ớ ể ủ ự ế ậ ậ

nguyên t c c b n, th a nh n s có m t c a nhi u, nó có th đ t đ ắ ơ ả ể ạ ượ ậ ự ặ ủ ừ ễ ụ c m c

đích ng ph c a ti ng nói s ch b ng cách tr đi ph c a nhi u v i ph c l ướ ượ ổ ủ ế ổ ủ ừ ễ ạ ằ ớ ổ

Trang 39 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

c l c a ti ng nói đã b nhi u. Ph c a nhi u có th đ ủ ổ ủ c ể ượ ướ ượ ế ễ ễ ị ậ ng, c p nh t ậ

trong nhi u chu kỳ khi không có m t c a tín hi u. S th a nh n đó ch đ ặ ủ ự ừ ỉ ượ c ề ệ ậ

th c hi n đ i v i nhi u không đ i ho c có t c đ x lý bi n đ i ch m, và khi ặ ố ộ ử ố ớ ự ệ ễ ế ậ ổ ổ

ậ đó ph c a nhi u s không thay đ i đáng k gi a các kho ng th i gian c p ể ữ ổ ủ ễ ẽ ả ổ ờ

c b ng cách tính IDFT(bi n đ i Fourier nh t. Vi c tăng c ệ ậ ườ ng tín hi u đ t đ ệ ạ ượ ằ ế ổ

c) c a ph tín hi u đã đ c l c ng có s d ng pha c a tín r i r c ng ờ ạ ượ ủ ệ ổ ượ ướ ượ ử ụ ủ

hi u có nhi u. Thu t toán này là m t phép tính ệ ễ ậ ộ c l ướ ượ ng đ n gi n vì nó ch ả ơ ỉ

c. g m bi n đ i DFT thu n và DFT ng ồ ế ổ ậ ượ

Quá trình x lý hi u đ n gi n nh v y ph i tr m t cái giá, n u quá trình ả ả ộ ư ậ ử ệ ế ả ơ

c th c hi n m t cách c n th n thì ti ng nói c a chúng ta s b x lý không đ ử ượ ẽ ị ự ủ ệ ế ẩ ậ ộ

méo. N u nh vi c l y hi u quá l n thì có th lo i b đi m t ph n thông tin ể ạ ỏ ư ệ ấ ế ệ ầ ớ ộ

c a ti ng nói, còn n u vi c th c hi n l y hi u đó nh thì nhi u s v n còn ệ ấ ủ ẽ ẫ ự ế ế ệ ệ ễ ỏ

đ c gi i trong tín hi u. Có r t nhi u ph ng pháp đ ượ l ữ ạ ệ ề ấ ươ ượ ấ ể ả c đ xu t đ gi m ề

đi h u h t méo trong quá trình x lý ti ng nói b ng spectral subtraction[21], và ế ử ế ằ ầ

trong s đó cũng có m t vài tr ố ộ ườ ng h p b lo i b . ợ ị ạ ỏ

1.17.2 Spectral subtraction đ i v i ph biên đ ộ ố ớ ổ

Gi thi ả ế ằ ệ ạ t r ng y[n] là tín hi u vào đã b nhi u, nó t ng c a tín hi u s ch ủ ệ ễ ổ ị

x[n] và tín hi u nhi u d[n]: ệ ễ

y[n] = x[n] + d[n] (3.1)

=

c ệ ự ế ế ổ ượ

D

Y

)

)

Th c hi n bi n đ i Fourier r i r c c 2 v ,ta đ w ( ờ ạ ả + w ( (3.2)

w ) ( X w ) d

f

w

(

)

Y

w (

= |

Y

w (

)

yje

|)

Chúng ta có th bi u di n Y( ể ể ễ ướ ạ i d ng ph c nh sau: ứ ư

f

(w

)

y

(3.3)

Khi đó |Y(w )| là biên đ ph , và ộ là pha c a tín hi u đã b nhi u. ệ ủ ễ ị

w

)

(

D

|)

D

w (

)

Ph c a tín hi u nhi u D( c bi u di n d ng biên đ và pha: ổ ủ ệ ễ ễ ạ ộ ể ượ ể

(3.4)

ổ w ) có th đ f = w dje | ( w )| không xác đ nh đ c, nh ng có th thay th ị Biên đ ph c a nhi u |D( ổ ủ ễ ộ ượ ư ể ế

c tính trong khi không có ti ng nói(ti ng nói b b ng giá tr trung bình c a nó đ ằ ủ ị ượ ế ế ị

ễ d ng), và pha c a tín hi u nhi u có th thay th b ng pha c a tín hi u b nhi u ể ừ ế ằ ủ ủ ệ ễ ệ ị

Trang 40 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

f

(w

)

y

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

, vi c làm này không nh h ng đ n tính d nghe c a ti ng nói [22], có ệ ả ưở ủ ế ễ ế

ng đ n ch t l ng c a ti ng nói là làm thay đ i pha c a ti ng nói th nh h ể ả ưở ấ ượ ế ủ ế ủ ế ổ

nh ng cũng ch vài đ . ộ ư ỉ

Khi đó chúng ta có th ng đ c ph c a tín hi u s ch: c l ể ướ ượ ượ ệ ạ ổ ủ

f

w

(

)

=

X

w (

[|

Y

w (

)

|)

D

w (

|

yje

|])

(cid:217) (cid:217) - (3.5)

D

(w

)

""(cid:217)

(cid:217) đây | | là biên đ ph ng c a nhi u đ c tính trong khi ở c l ổ ướ ượ ộ ủ ễ ượ

không có ti ng nói ho t đ ng. Ký hi u ạ ộ ế ệ đ ch r ng giá tr đó là giá tr ể ỉ ằ ị ướ c ị

tính g n đúng. Tín hi u ti ng nói đ c tăng c ng có th đ t đ c b ng cách ệ ế ầ ượ ườ ể ạ ượ ằ

X

(w

)

(cid:217) . r t đ n gi n là bi n đ i IDFT c a ế ấ ơ ủ ả ổ

c tăng c ng là C n chú ý r ng biên đ ph c a tín hi u đã đ ộ ổ ủ ệ ầ ằ ượ ườ

|

X

w (

= |(|)

Y

w (

|)

D

w (

|

|))

- c l , có th b âm do s sai sót trong vi c ự ể ị ệ ướ ượ ổ ủ ng ph c a

ễ ộ ủ ể ổ

nhi u. Tuy nhiên, biên đ c a ph thì không th âm, nên chúng c n ph i đ m ả ả ầ w )| luôn luôn ng |X( b o r ng khi th c tr hai ph thì ph c a tín hi u tăng c ổ ả ằ ổ ủ ườ ự ừ ệ

không âm. Gi i pháp đ ả ượ ư c đ a ra đ kh c ph c đi u này là ch nh l u bán sóng ề ụ ư ể ắ ỉ

hi u c a ph , n u thành ph n ph nào mà âm thì chúng ta s gán nó b ng 0: ệ ủ ổ ế ẽ ằ ầ ổ

>

Y

w (

)

^ D

w (

|

|)

,

|

Y

w (

|)

^ D

w (

|

|)

=

X

w (

)

,0

(cid:236) (cid:239) - (cid:237) (3.6) (cid:239) „ (cid:238)

w )| không b âm.

Ph ng pháp x lý b ng ch nh l u bán sóng là m t trong nh ng cách đ ươ ử ư ữ ằ ộ ỉ ể

đ m b o cho |X( ả ả ị

1.17.3 Spectral subtraction đ i v i ph công su t ố ớ ổ ấ

Thu t toán Spectral subtraction đ i v i ph biên đ có th đ ố ớ ể ượ ậ ổ ộ ở ộ c m r ng

ng h p, nó có th làm vi c t sang mi n ph công su t. Vì trong m t vài tr ấ ề ổ ộ ườ ệ ố t ể ợ

v i ph công su t h n là v i ph biên đ . L y ph công su t c a tín hi u b ớ ộ ấ ấ ơ ấ ủ ệ ổ ớ ổ ổ ị

w )|, ta đ

2

2

2

*

*

=

+

+

+

Y

w (

)

X

w (

)

D

w (

)

w (

X

D

w (

)

w (

)

D

w (

)

nhi u trong m t kho ng ng n, chúng ta bình ph ng |Y( c: ễ ả ắ ộ ươ ượ

2

2

*

+

+

=

)

D

w (

)

.) { Re.2

X

w (

X

w (

)

D

w (

X })

(3.7)

Trang 41 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

(wD

)

*D

(w

)

X *

w D ). (

w (

)

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

(wD

)

*D

(w

)

X *

w D ). (

w (

)

| |2, X(w ). và không th tính đ ể ượ ự c m t cách tr c ộ

(wD

)

ti p và x p x b ng E{| |2}, E{ X(w ). } và E{ }, khi đó ỉ ằ ế ấ

E[.] là toán t kỳ v ng. Bình th ng thì E{| |2} đ c l c ng khi không ử ọ ườ ượ ướ ượ

D

(w

)

(cid:217) có ti ng nói ho t đ ng và đ c bi u th là | |2. N u chúng ta th a nh n d[n] ạ ộ ế ượ ể ị ừ ế ậ

w ).

*D

(w

)

X *

w D ( ).

w (

)

= 0 và không có m t s t ộ ự ươ ng quan nào v i tín hi u s ch x[n], thì E{ X( ệ ạ ớ

} và E{ } xem là 0. Khi đó ph công su t c a tín hi u s ch có ệ ạ ấ ủ ổ

2

2

2

th tính đ ể ượ c nh sau ư

^ X

w (

|

|)

= |

Y

w (

|)

^ D

w (

|

|)

- (3.8)

Công th c trên bi u di n thu t toán tr ể ứ ễ ậ ừ ứ ph công su t. Nh công th c ư ấ ổ

|

X

w (

2|)

(cid:217) c l ng không đ trên, thì ph công su t đ ổ c ấ ượ ướ ượ ượ c đ m b o luôn là ả ả

m t s d ng, nh ng có th s d ng ph ng pháp ch nh l u bán sóng nh đã ộ ố ươ ể ử ụ ư ươ ư ư ỉ

trình bày trên. Tín hi u đ c tăng c c b ng cách tính IDFT ở ệ ượ ườ ng s thu đ ẽ ượ ằ

2 ), có s d ng pha c a tín

|

X

w (

|)

|

X

w (

|)

(cid:217) (cid:217) (b ng cách l y căn b c hai c a c a ủ ủ ậ ằ ấ ử ụ ủ

hi u ti ng nói b nhi u. Chú ý r ng, n u chúng ta l y IDFT c hai v c a công ế ế ủ ệ ế ễ ằ ấ ả ị

=

th c (4.8) trên thì ta có m t ph ng trình t ng t trong mi n t t ng quan: ứ ộ ươ ươ ự ề ự ươ

(

(

)

)

)

mrmrmr ( yy ^^ xx

^^ dd

)

)

)

(mryy

- (3.9)

(^^ mr xx

(^^ mr dd

Khi đó , , là các h s t t ệ ố ự ươ ệ ng quan c a tín hi u ủ

c l c ng [23,24]. s ch, tín hi u ti ng nói b nhi u, và tín hi u nhi u đã đ ạ ệ ế ễ ệ ễ ị ượ ướ ượ

2

2

2

=

Công th c (1) có th đ c vi t theo d ng sau: ể ượ ứ ế ạ

^ X

w (

|

|)

H

w (

|)

Y

w (

|)

2

=

( 3.10)

H

w (

)

1

^ w D ( w ( Y

| |

|) 2 |)

- Khi đó: (3.11)

w ) là hàm truy n đ t c a h ề

Trong lý thuy t h th ng tuy n tính, H( ế ệ ố ế

th ng. Trong lý thuy t c a Speech enhancement, chúng ta xem H( ế ủ ố ệ ạ ủ w ) là hàm độ

w ) là m t s th c và luôn luôn d

i hay hàm nén. Và H( ng, và có giá tr nàm l ợ ộ ố ự ươ ị

Trang 42 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

0

wH (

1)

£ £ . N u nó có giá tr âm là do có sai sót trong quá trình trong ph m v ị ạ ị

ế w ) đ ng ph c a nhi u. H( c g i là hàm nén là vì nó cho ta bi t t s c l ướ ượ ổ ủ ễ ượ ọ ế ỷ ố

gi a ph công su t c a tín hi u đ c tăng c ng v i ph công su t c a tín ấ ủ ữ ệ ổ ượ ườ ấ ủ ổ ớ

ậ hi u b nhi u. Hình d ng c a hàm nén là m t đ c tr ng duy nh t c a m i thu t ộ ặ ấ ủ ủ ư ễ ệ ạ ỗ ị

toán Speech enhancement.

Chính vì v y mà chúng ta th ậ ườ ậ

các đáp ng c a hàm nén c a chúng. H s H( ứ ủ ủ ng so sánh các thu t toán b ng cách so sánh ằ w ) có giá tr th c nên bi n đ i ổ ị ự ệ ố ế

ờ IDFT là h[n] đ i x ng v i nhau qua đi m 0 và không nhân qu . Trong mi n th i ố ứ ể ề ả ớ

gian thì h[n] đ ượ ộ ộ ọ ẽ ả

ph ng pháp đ c đ xu t đ hi u ch nh hàm H( ươ ượ c xem là m t b l c không nhân qu [25]. Nên s có m t ộ w ) đ đáp ng c a nó tr ứ ấ ể ệ ở ủ ể ề ỉ

thành b l c nhân qu trong mi n th i gian. ả ộ ọ ề ờ

Tr ng h p chung thì thu t toán Spectral subtraction có th đ ườ ể ượ ậ ợ ể c bi u

p

p

p

di n: ễ

^ X

w (

|

|)

= |

Y

w (

|)

^ D

w (

|

|)

- (3.12)

Trong đó p là s mũ công su t, v i ng pháp tr ph biên ớ p = 1 là đó là ph ấ ố ươ ừ ổ

p = 2 là ph đ đi n hình, ộ ể ươ ng pháp tr ph công su t. ừ ổ ấ

p

ng, c l Ướ ượ c p nh t ậ ậ nhi uễ

S đ kh i c a thu t toán Spectral Subtraction : ố ủ ơ ồ ậ

^ D

-

w (

|

|)

(wY

)

Tín hi u ệ b nhi u ị

Pha c a ủ tín hi uệ

|.|p + FFT

Tín hi u sau khi ệ ngườ tăng c

IFFT |.|1/p

Hình 3.2 S đ kh i c a thu t toán Spectral subtraction [26]. ơ ồ ố ủ ậ

Trang 43 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

1.18 Thu t toán Wiener Filtering ậ

1.18.1 Gi i thi u chung ớ ệ

Thu t toán Spectral Subtraction d a ch y u vào tr c giác và kinh ự ủ ế ự ậ

c phát tri n d a trên m t nhi u có nghi m.Chính xác h n thu t toán này đ ơ ệ ậ ượ ự ể ễ ộ

th t đ c c ng vào và tín hi u s ch đ c l c ậ ượ ộ ệ ạ ượ ướ ượ ằ ng m t cách đ n gi n b ng ơ ả ộ

cách tr đi ph c a nhi u t ph c a tính hi u ti ng nói có nhi u. V i cách làm ổ ủ ễ ừ ổ ủ ừ ệ ế ễ ớ

này tín hi u ti ng nói s ch không th có đ c b ng cách t ệ ế ể ạ ượ ằ ố ư ắ i u nh t. Đ kh c ể ấ

c đi m này ta s d ng thu t toán Wiener Filtering (WF). ph c nh ụ ượ ử ụ ể ậ

c s d ng r ng rãi trong nâng cao ch t l WF là thu t toán đ ậ ượ ử ụ ấ ượ ộ ế ng ti ng

ằ nói. Ngu n g c c b n c a thu t toán WF là t o ra tín hi u ti ng nói s ch b ng ố ơ ả ủ ệ ế ậ ạ ạ ồ

cách nén nhi u. c l ng đ c th c hi n b ng cách h th p sai s bình ễ Ướ ượ ượ ạ ấ ự ệ ằ ố

ph ươ ệ ng trung bình (Mean Square Error) gi a tín hi u mong mu n và tín hi u ữ ệ ố

ng. c l ướ ươ

1.18.2 Nguyên lý c b n c a Wiener Filtering ơ ả ủ

Gi thi ả ế ằ ệ ạ t r ng y[n] là tín hi u vào đã b nhi u, nó là t ng c a tín hi u s ch ủ ệ ễ ổ ị

và tín hi u nhi u d[n]: ệ ễ

y[n]=x[n]+d[n] (3.13)

=

+

)

Th c hi n bi n đ i Fourier r i r c c 2 v ,ta đ c ự ệ ế ổ ượ

w (

)

Y

D

ờ ạ ả w ( ế w ( (3.14)

) X w ) d

f

w

(

)

Y

w (

= |

Y

w (

)

yje

|)

Chúng ta có th bi u di n Y( ể ể ễ ướ ạ i d ng ph c nh sau: ứ ư

f

(w

)

y

(3.15)

Khi đó |Y(w )| là biên đ ph , và ộ là pha c a tín hi u đã b nhi u. ệ ủ ễ ị

w

(

)

Ph c a tín hi u nhi u D( c bi u di n d ng biên đ và pha: ổ ủ ệ ễ ể ượ ễ ạ ể ộ

)

D

f dje

w ( D |) w )| không xác đ nh đ

ổ w ) có th đ = w ( | (3.16)

c, nh ng có th thay th ị Biên đ ph c a nhi u |D( ổ ủ ễ ộ ượ ư ể ế

c tính trong khi không có ti ng nói(ti ng nói b b ng giá tr trung bình c a nó đ ằ ủ ị ượ ế ế ị

f

(w

)

y

ễ d ng), và pha c a tín hi u nhi u có th thay th b ng pha c a tín hi u b nhi u ể ừ ế ằ ủ ủ ệ ễ ệ ị

, vi c làm này không nh h ng đ n tính d nghe c a ti ng nói [27], có ệ ả ưở ủ ế ễ ế

Trang 44 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

ng đ n ch t l ng c a ti ng nói là làm thay đ i pha c a ti ng nói th nh h ể ả ưở ấ ượ ế ủ ế ủ ế ổ

nh ng cũng ch vài đ . ộ ư ỉ

w )

X

(w

)

(cid:217) Ta có th ng đ c l ể ướ ượ ượ c biên đ c a ph tín hi u s ch ổ ệ ạ ộ ủ Y(ừ t

c xác đ nh nh sau : b ng m t hàm phi tuy n đ ằ ế ượ ộ ư ị

=

G

w (

)

X

w (

/)

Y

w (

)

(wG

)

(cid:217) (3.17)

w SE ({

2 })

=

G

w (

)

có th đ c áp d ng theo Wiener Filtering [28]: ể ượ ụ

+

w SE ({

2 })

w DE ({

2 })

(w

)

(w

)

(3.18)

sP

dP

Trong đó và là ph công su t c a tin hi u s ch. ấ ủ ệ ạ ổ

w SE ({

2 })

=

SNR pri

Đ t Priori SNR và Posteriori SNR nh sau[11]: ư ặ

w DE ({

2 })

w YE ({

2 })

=

SNR post

w DE ({

2 })

(3.19)

(3.20)

M t khó khăn trong các thu t toán nâng cao ch t l ng ti ng nói là ta ấ ượ ậ ộ ế

pri

không có tín hi u tr c tín hi u s ch s[n] nên ta không th bi t ph c a nó. Do ệ ướ ệ ạ ể ế ổ ủ

SNR mà trong các h th ng nâng cao ch t l

pri

đó ta không th tính đ c ể ượ ệ ố ấ ượ ng

SNR là tham s r t c n thi

pri

gi ng nói thì t đ c l ọ ố ấ ầ ế ể ướ ượ ng tín hi u s ch.Trong ệ ạ

SNR và

SNR

post

các h th ng nâng cao ch t l ng gi ng nói có th ng đ c ệ ố ấ ượ c l ể ướ ượ ọ ượ

b ng cách cho các thông s thích h p vào các ph ng trình sau[12]: ằ ố ợ ươ

t

t

1

2

t

=

l

l

d

d

P

w (

)

P

w (

-+ 1(

)

)

D

v (

)

w YE ({

2 })

=

SNR

post

t

- (cid:217) (cid:217) (3.21)

d

P

w (

)

(3.22) (cid:217)

Trang 45 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

2

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

t

1

^ S

w (

)

-

=

b

b

SNR

w (

)

1(

)

P

SNR

w (

1)

t pri

t post

d

P

w (

)

(cid:217) (cid:217) ø Ø (3.23) - - Œ (cid:217) ß º

>

Trong đó P[.] là hàm ch nh l u bán sóng có d ng nh sau: ư ư ạ ỉ

X

,

X

0

=

XP (

)

,0

(cid:236) (cid:237) (3.24) „ (cid:238)

SNR

pri

Và và ch s i kho ng th i gian đang x lý. ỉ ố t[.] đ tín hi u t ể ệ ạ ử ả ờ

SNR

post

Trong ph ta có th ng đ c ươ ệ ố b ng trình n u cho h s ế c l ể ướ ượ ượ

b =0.98 r t t ấ ố

. Trong th c t h s t cho các tín hi u có b ng ằ ự ế ệ ố ệ

(wG

)

SNR<4dB.

=

G

(w

)

T ph ng trình (3.18) và (3.19) có theo WF nh sau: ừ ươ ư

SNR +

pri SNR

1

pri

(3.25)

ng, c p

Priori SNR

c l Ướ ượ nh t nhi u ậ

p

^ D

w (

|

|)

S đ kh i c a thu t toán Wiener Filtering: ố ủ ơ ồ ậ

(wY

)

SNR pri

Tín hi u ệ b nhi u ị

Hàm x lý ử gi m ả nhi uWF ễ

Pha c a ủ tín hi uệ

Tín hi u sau khi

FFT |.|2

ệ tăng c

IFFT |.|1/2 ngườ

Hình 3.3 S đ kh i c a thu t toán Wiener Filtering. ơ ồ ố ủ ậ

Trang 46 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

1.19 Overlap và Adding trong quá trình x lý tín hi u ti ng nói ử ế ệ

1.19.1 Phân tích tín hi u theo t ng frame ừ ệ

Do tín hi u c n x lý c a chúng ta là tín hi u liên t c, nên khi chúng ta ụ ử ủ ệ ệ ầ

mi n th i gian mà không thông qua m t quá bi n đ i FFT tr c ti p tín hi u t ự ệ ừ ế ế ổ ề ộ ờ

trình ti n x lý nào tr ề ử ướ c đó thì tín hi u sau khi đ ệ ượ ổ c bi n đ i FFT s bi n đ i ẽ ế ế ổ

nhanh, lúc đó chúng ta không th th c hi n đ c các thu t toán x lý tri ể ự ệ ượ ử ậ ệ ễ t nhi u

trong tín hi u vì khi đó tín hi u đ c xem là đ ng. ệ ượ ệ ộ

Chính vì v y, tín hi u c a chúng ta c n ph i đ ệ ủ ả ượ ầ ậ ữ c phân tích thành nh ng

khung tín hi u(frame) liên t c trong mi n th i gian tr ụ ề ệ ờ ướ ề c khi chuy n sang mi n ể

t n s b ng bi n đ i FFT. Khi tín hi u đ ổ ầ ố ằ ệ ượ ế ụ c phân tích thành các frame liên t c,

thì trong t ng frame, tín hi u c a chúng ta s bi n đ i ch m và nó đ c xem là ệ ủ ẽ ế ừ ậ ổ ượ

tĩnh. N u tín hi u đ ệ ượ ế ử c phân tích theo t ng frame thì khi đó các thu t toán x lý ừ ậ

tri t nhi u trong tín hi u m i có th th c hi n đ c m t cách hi u qu . Và ệ ể ự ệ ệ ễ ớ ượ ệ ả ộ

cách phân tích tín hi u c a chúng ta là “frame by frame”. ệ ủ

ạ Đ th c hi n vi c phân tích tín hi u thành các frame, c n s d ng các lo i ầ ử ụ ể ự ệ ệ ệ

c a s thích h p. ử ổ ợ Ở ẫ đây, chúng ta s d ng c a s Hamming, v i N = 256 m u ử ổ ử ụ ớ

+

=

trong t ng frame : ừ

.01

85185

.

cos((

2

k

p )1

/

N

)

,

k

,...,0

N

1

- - (3.27)

N : kích th c c a frame ướ ủ

m : s l ng frame ố ượ

Hình 3.4 Phân tích tín hi u thành các frame [31]. ệ

Trang 47 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

1.19.2 Overlap và Adding

Sau khi phân tích tín hi u thành các frame liên t c trong mi n th i gian ụ ệ ề ờ

ộ b ng c a s Hamming, n u các frame này liên t c v i nhau và không theo m t ằ ụ ớ ử ổ ế

đi u ki n nào c thì khi th c hi n bi n đ i FFT thì vô tình chúng ta đã làm suy ự ề ế ệ ệ ả ổ

gi m tín hi u do Hamming là c a s phi tuy n. ử ổ ế ệ ả

Nên khi th c hi n phân tích tín hi u thành các frame thì yêu c u đ t ra là ự ệ ệ ặ ầ

các frame ph i s p x p ch ng lên nhau, g i là “overlap”. Vi c x p ch ng các ả ắ ế ệ ế ồ ồ ọ

frame v i nhau s đ c th c hi n theo m t t l ch ng l p thích h p, thông ẽ ượ ớ ộ ỷ ệ ự ệ ấ ợ ồ

th ng là 40% ho c 50%. ườ ặ

Sau khi các frame tín hi u đ c x lý tri t nhi u trong mi n t n s , các ệ ượ ử ệ ề ầ ố ễ

frame này đ c liên k t l ng pháp thích h p v i ph ng pháp ượ ế ạ i nhau b ng ph ằ ươ ớ ợ ươ

phân tích tín hi u thành các frame đ u vào g i là “adding”. ệ ở ầ ọ

T p h p các m u tín hi u trong cùng m t frame sau khi đ c phân tích ệ ẫ ậ ợ ộ ượ ở

đ u vào g i là m t “segment”. V i cách th c hi n phân tích và liên k t các ầ ự ệ ế ộ ọ ớ

ng pháp overlap và adding thì tín hi u c a chúng ta thu đ frame b ng ph ằ ươ ệ ủ ượ c

sau khi x lý tri ử ệ ệ t nhi u s không b méo d ng và s không xu t hi n hi n ẽ ệ ẽ ễ ấ ạ ị

ng “gi t ượ ả nhi u”. ễ

Hình 3.5 quá trình th c hi n overlap và adding [32]. ệ ự

Trang 48 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

1.20 ng và c p nh t nhi u c l Ướ ượ ễ ậ ậ

Ph ng th c c l ng nhi u có th nh h ươ ứ ướ ượ ể ả ễ ưở ng l n đ n ch t l ế ấ ượ ớ ủ ng c a

tín hi u sau khi đ c tăng c ng. N u nhi u đ c l c ng quá nh thì ệ ượ ườ ễ ế ượ ướ ượ ỏ

nhi u s v n còn trong tín hi u và nó s đ ễ ẽ ẫ ẽ ượ ệ ễ c nghe th y, còn n u nh nhi u ư ế ấ

đ c l c ượ ướ ượ ủ ng quá l n thì ti ng nói s b méo, và làm s làm tính d nghe c a ẽ ị ế ẽ ễ ớ

ti ng nói b nh h ng. Cách đ n gi n nh t đ c l ị ả ế ưở ấ ể ướ ượ ả ơ ổ ủ ng và c p nh t ph c a ậ ậ

nhi u trong đo n tín hi u không có m t c a ti ng nói s d ng thu t toán thăm ặ ủ ử ụ ệ ễ ế ậ ạ

dò ho t đ ng c a ti ng nói (voice activity detection - VAD). Tuy nhiên ph ạ ộ ủ ế ươ ng

pháp đó ch tho mãn đ i v i nhi u không thay đ i(nhi u tr ng), nó s không ố ớ ễ ễ ẽ ắ ả ổ ỉ

hi u qu trong các môi tr ng th c t nh ng n i đó ệ ả ườ ự ế (ví d nh nhà hàng), ư ụ ở ữ ơ

ẽ ề ậ đ c tính ph c a nhi u thay đ i liên t c. Trong m c này chúng ta s đ c p ụ ặ ổ ủ ụ ễ ổ

đ n thu t toán ậ ế c l ướ ượ ế ng nhi u thay đ i liên t c và th c hi n trong lúc ti ng ự ụ ệ ễ ổ

nói ho t đ ng, thu t toán này s phù h p môi tr ng có nhi u thay đ i cao. ạ ộ ẽ ậ ợ ườ ễ ổ

1.20.1 Voice activity detection

Quá trình x lý đ phân bi t khi nào có ti ng nói ho t đ ng, khi nào không ử ể ệ ạ ộ ế

có ti ng nói (im l ng) đ ế ặ ượ ọ c g i là s thăm dò ho t đ ng c a ti ng nói – Voice ạ ộ ủ ế ự

activity detection (VAD). Thu t toán VAD có tín hi u ra ệ ậ ở ạ ế d ng nh phân quy t ị

đ nh trên m t n n t ng frame-by-frame, khi đó frame có th x p x 20-40 ms. ị ộ ề ả ể ấ ỉ

M t đo n ti ng nói có ch a ti ng nói ho t đ ng thì VAD = 1, còn n u ti ng nói ứ ế ạ ộ ế ế ế ạ ộ

không ho t đ ng hay đó chính là nhi u thì VAD = 0. ạ ộ ễ

c đ a ra d a trên nhi u đ c tính c a tín Có m t vài thu t toán VAD đ ậ ộ ượ ủ ự ư ề ặ

c đ a ra s m nh t thì d a vào các đ c tính nh hi u. Các thu t toán VAD đ ậ ệ ượ ư ự ấ ặ ớ ư

m c năng l ng, zero-crossing, đ c tính cepstral, phép đo kho ng cách ph ứ ượ ả ặ ổ

Itakura LPC, phép đo chu kỳ.

ệ Ph n l n các thu t toán VAD đ u ph i đ i m t v i v n đ là đi u ki n ặ ớ ấ ả ố ầ ớ ề ề ề ậ

t khi nhi u b thay đ i. M t thu t toán VAD có đ chính xác SNR th p, đ c bi ấ ặ ệ ễ ậ ổ ộ ộ ị

trong môi tr ng thay đ i không th đ trong các ng d ng c a Speech ườ ể ủ ứ ụ ủ ổ

enhancement, nh ng vi c c l ng nhi u m t cách chính xác là r t c n thi ệ ướ ượ ư ấ ầ ễ ộ ế t

. t ạ i m i th i đi m khi ti ng nói ho t đ ng [26] ế ạ ộ ể ọ ờ

Trang 49 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

1.20.2 Quá trình ng và c p nh t nhi u c l ướ ượ ễ ậ ậ

Nhi u s đ c l ng lúc ban đ u b ng cách l y trung bình biên đ c ễ ẽ ượ ướ ượ ầ ằ ấ ộ

ph c a tín hi u b nhi u ệ ị ổ ủ ễ

M

=

w (

)

w (

)

D i

1 Y i

=

1 M

0

i

- (cid:229) (3.28)

Sau đó, s d ng ph ng pháp VAD đ nh n bi t các frame ti p theo, ử ụ ươ ể ậ ế ế

frame nào là frame nhi u và s c p nh t nhi u đó cho các frame ti p theo. Đ ậ ẽ ậ ễ ễ ế ể

có th nh n bi c frame nào là nhi u thì chúng ta th c hi n so sánh biên đ ể ậ t đ ế ượ ự ễ ệ ộ

p

w (

)

=

w

T

20

log

|

|

d

ph c a nhi u đ c l ng v i biên đ ph c a tín hi u b nhi u : ổ ủ c ễ ượ ướ ượ ổ ủ ệ ễ ớ ộ ị

1 p 2

w (

)

p

Y i D i

1

(cid:242) (3.29) - -

T

12

dB

- £ thì frame đó không ph i là frame có ti ng nói, khi đó ta có N u ế ế ả

th c p nh t l c l c ng tr c đó. ể ậ ậ ạ i nhi u đã đ ễ ượ ướ ượ ướ

ng 1.21 K t lu n ch ế ậ ươ

N i dung c a ch ng giúp nguyên lý chung c a thu t toán Spectral – ủ ộ ươ ủ ậ

Subtraction và Wiener Filtering. Đ hai thu t toán có th th c hi n đ ể ể ự ệ ượ ậ ầ c thì c n

ph i phân tích tín hi u thành các frame và các frame ph i x p ch ng lên nhau, ả ế ệ ả ồ

và sau khi các frame đ c x lý trong mi n t n s và chuy n đ i v l ượ ử ề ầ ố ổ ề ạ ể ề i mi n

th i gian thì các frame đó ph i đ c liên k t l i v i nhau theo đúng ph ả ượ ờ ế ạ ớ ươ ng

pháp t ng ng v i ph ng pháp phân tích tín hi u ươ ứ ớ ươ ệ ở ầ ọ đ u vào, quá trình đó g i

là overlap và adding. Chính đi u đó s làm cho tín hi u c a chúng ta sau khi x ệ ủ ề ẽ ử

lý tri t nhi u s không b méo, đ m b o ch t l ng c a ti ng nói. N i dung ệ ễ ẽ ấ ượ ả ả ị ủ ế ộ

ng cũng trình bày v n đ ng nhi u, đây là cái chính mà speech c a ch ủ ươ c l ề ướ ượ ấ ễ

enhancement c n gi ầ ả ấ i quy t, nó quy t đ nh tính hi u qu c a thu t toán và ch t ệ ả ủ ế ị ế ậ

ng c a ti ng nói sau khi x lý tri t nhi u. l ượ ủ ế ử ệ ễ

Trang 50 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 3 : Thu t toán Spectral Subtraction và Wiener Filtering ươ ậ

Trang 51 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

CH NG 4: TH C HI N VÀ ĐÁNH GIÁ CÁC THU T TOÁN ƯƠ Ự Ậ Ệ

1.22 Gi ng ớ i thi u ch ệ ươ

c, ch D a vào lý thuy t đã nghiên c u đ ế ứ ự ượ ươ ư ng này đã xây d ng các l u ự

đ thu t toán và th c hi n các thu t toán gi m nhi u mô ph ng b ng Matlab, ồ ự ễ ệ ậ ả ằ ậ ỏ

sau đó đánh giá các k t qu thu đ c ch y u b ng ph ng pháp đánh giá ế ả ượ ủ ế ằ ươ

Objective Measure

1.23 Quy trình th c hi n và đánh giá thu t toán ệ ự ậ

Xây d ng các thu t toán ự ậ

Tri n khai thu t toán trên Matlab ể ậ

Th c hi n x lý ti ng nói b ng ằ ự các thu t toán gi m nhi u ễ ệ ử ậ ế ả

ệ ự

Th c hi n các thu t toán đánh giá d a trên các k t qu đ t ả ạ ậ ế

c sau khi x lý ự đ ượ ử

Nh n xét đánh giá ậ

Hình 4.1. S đ th c hi n và đánh giá thu t toán tăng c ng ơ ồ ự ệ ậ ườ

Xây d ng thu t toán : ự ậ d a trên các c s toán h c, các phép bi n đ i trong ọ ự ơ ở ế ổ

ậ mi n th i gian và t n s đ i v i x lý tín hi u s đ xây d ng nên các thu t ầ ố ố ớ ử ệ ố ể ự ề ờ

toán x lý nhi u trong ti ng nói. ử ế ễ

Tri n khai trên Matlab: t thu t toán đã xây d ng đ t mã ể ừ ự ậ ượ c, th c vi ự ế

ngu n b ng ngôn ng l p trình và s d ng các công c trên Matlab t o nên ử ụ ữ ậ ụ ạ ằ ồ

ch ng trình th c hi n x lý nhi u trong ti ng nói trên n n Matlab. ươ ệ ử ự ế ề ễ

Trang 52 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Th c hi n x lý ti ng nói b ng các thu t toán: ệ ử ự ế ậ ằ th c hi n x lý tri ệ ử ự ệ ễ t nhi u

trong các file âm thanh b nhi u b ng ch ng trình đã xây d ng trên. ễ ằ ị ươ ự ở

ng pháp đánh giá d a trên các k t qu đ t đ c sau Th c hi n các ph ệ ự ươ ả ạ ượ ự ế

sau khi các file âm thanh b nhi u v i các m c đ và lo i nhi u khác khi x lý :ử ứ ộ ễ ễ ạ ớ ị

nhau đã đ c x lý tri t nhi u, cùng v i các file âm thanh s ch t ng ng, ta s ượ ử ệ ễ ạ ớ ươ ứ ử

ng pháp đánh giá c a Speech enhancement đ th c ki m tra, đánh d ng các ph ụ ươ ể ự ủ ể

giá tính hi u c a thu t toán. ệ ủ ậ

các k t qu sau khi th c hi n các ph ng pháp đánh t Nh n xét đánh giá: ừ ậ ự ệ ế ả ươ

giá đã có ở ạ trên, đ a ra các k t lu n đánh giá : thu t toán nào thích h p cho lo i ư ế ậ ậ ợ

nhi u nào, v i m c đ bao nhiêu, thu t toán nào có kh x lý nhi u t ả ử ễ ố ơ t h n ứ ễ ậ ộ ớ

trong m i tr ọ ườ ng h p. ợ

Trang 53 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Begin

X

=

=

Phân chia Frame tín hi u đ u vào

Y=bi n đ i FFT cho các frame

ế

Tinh cong suat nhieu trung binh N ban đ uầ

I=0;Nh p frame đ u tiên

VAD

S

SpeechFlag==0?

D=YS(:,i)-N; % Th c hi n tr ph

ừ ổ

Đ

Đ

Tính l

i m c nhi u N

1.24 L u đ thu t toán Spectral Subtraction ư ồ ậ

X(:,i)=Beta*Y(:,i)

I=I+1;nh p frame ti p theo

ế

Đ

I

S

Th c hiên IFFT và n i các

X

=

X

=

frame

End

X(:,i)=max(D,0);

Hình 4.2 L u đ thu t toán SS ư ồ ậ

Trang 54 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Begin

Phân chia Frame tín hi u đ u

=

X

vào

Y=bi n đ i FFT cho các frame

ế

Tinh cong suat nhieu trung bình N ban

đ uầ

I=0;Nh p frame đ u tiên

VAD

S

S

SpeechFlag==0?

Tính l

i m c nhi u trung

bình N

Đ

Tính Priori SNR

Tính Gain Function G

X(:,i)=G.*Y(:,i);tin hi u s ch

ệ ạ

I=I+1;nh p frame ti p theo

ế

Đ

I

Đ

Th c hiên IFFT và n i các

X

=

frame X

End

1.25 L u đ thu t toán Wiener Filtering ư ồ ậ

Hình 4.3 L u đ thu t toán WF ư ồ ậ

Trang 55 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

1.26 Th c hi n thu t toán ệ ự ậ

Chúng ta th c hi n x lý các file âm thanh b nhi u, v i 2 lo i nhi u đó là ệ ử ự ễ ễ ạ ớ ị

nhi u do ti ng xe h i và nhi u do ng i nói xung quanh t ng ng v i SNR ễ ễ ế ơ ườ ươ ứ ớ

=10dB

D ng sóng và ph c a tín hi u s ch: ổ ủ ệ ạ ạ

Hình 4.4 d ng sóng và spectrogram c a tín hi u s ch ệ ạ ủ ạ

D ng sóng và spectrogram c a tín hi u b nhi u xe h i v i SNR = 10dB ơ ớ ệ ị ủ ễ ạ

- Tr c khi x lý nhi u: ướ ử ễ

Hình 4.5 D ng sóng và ph c a tín hi u b nhi u xe h i v i SNR = 10dB ơ ớ ổ ủ ệ ễ ạ ị

- Sau khi x lý tri t nhi u b ng thu t toán Spectral Subtraction ử ệ ễ ằ ậ

Trang 56 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Hình 4.6 D ng sóng và spectrogram c a tín hi u sau khi x lý nhi u xe ủ ử ệ ễ ạ

h i b ng SS v i SNR = 10dB. ớ ơ ằ

- Sau khi x lý b ng thu t toán Wiener filtering ử ậ ằ

Hình 4.7 D ng sóng và spectrogram c a tín hi u sau khi x lý nhi u xe ử ủ ễ ệ ạ

h i b ng WF v i SNR = 10dB. ớ ơ ằ

 Nh n xét s b ơ ộ ậ

ử Sau khi nghe các file âm thanh c a tín hi u s ch, tín hi u sau khi x lý ủ ệ ệ ạ

nhi u, d a trên d ng sóng và spectrogram c a tín hi u s ch, tín hi u sau khi x ệ ạ ủ ự ễ ệ ạ ử

lý tri t nhi u b ng 2 thu t toán SS và WF, ta có th đ a ra m t s nh n xét nh ệ ộ ố ể ư ễ ậ ậ ằ ư

sau

• C hai thu t toán đ u có th x lý tri t nhi u t t h n môi ử ể ề ậ ả ệ ễ ố ơ ở

tr ng có SNR cao h n, và x lý t ườ ử ơ ố ơ ễ t h n đ i v i tín hi u b nhi u ố ớ ệ ị

bi n đ i ch m và có phân b đ u. ố ề ế ậ ổ

Trang 57 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

• C hai thu t toán đ u có tính hi u qu gi ng nhau đ i v i nhi u ệ ố ớ ả ố ễ ở ề ả ậ

m c SNR th p, nh ng đ i v i môi tr ư ố ớ ứ ấ ườ ậ ng có SNR cao h n thi thu t ơ

toán Wiener x lý tri t nhi u t ễ ố ơ ử ệ

t h n. • Nhìn chung thì thu t toán WF x lý tri t nhi u t t h n so v i SS ử ậ ệ ễ ố ơ ớ

1.27 Đánh giá ch t l ng ti ng nói đã đ c x lý ấ ượ ế ượ ử

1.27.1 C s d li u cho vi c đánh giá ơ ở ữ ệ ệ

La 30 câu thoai đ c ghi âm trong phong thi nghiêm theo chuân cua IEEE ̣ ượ ̀ ̀ ́ ̣ ̉ ̉

[32] la tin hiêu thoai sach. ề M i câu trung bình kho ng 2s. N i dung các câu đ u ả ỗ ộ ̀ ́ ̣ ̣ ̣

có s cân b ng v m t ng âm nên có th th y đ c s tác đ ng c a thu t toán ể ấ ượ ự ề ặ ữ ự ủ ậ ằ ộ

lên t ấ ả t c các âm v có th có trong tín hi u tho i ạ ể ệ ị

Cac tin hiêu thoai đo sau đo đ c công nhiêu vao ( gôm co loai nhiêu co ́ ượ ́ ́ ́ ̣ ̣ ́ ̣ ̃ ̀ ̀ ́ ̣ ̃

trong thê gi i th c, v i cac ty sô SNR khac nhau. Nh vây ta đa co săn tin hiêu ́ ớ ư ̣ ự ớ ́ ̉ ́ ́ ̃ ́ ̃ ́ ̣

. sach va tin hiêu bi nhiêu theo chuân chung ̣ ̀ ́ ̣ ̣ ̃ ̉

Hai lo i nhi u đ c dùng là: nhi u xe h i (car noise) đ c dùng làm d ễ ạ ượ ễ ơ ượ ữ

li u chính đ x lý và đánh giá, và nhi u do nh ng ng i nói xung quanh ể ử ữ ệ ễ ườ

(babble noise) đ ki m tra tác đ ng c a thu t toán trong môi tr ộ ể ể ủ ậ ườ ng nhi u khác, ễ

v i các SNR 0dB, 5dB, 10dB, 15dB. ớ

Sau khi tăng chât l ng tiêng noi t ́ ượ ́ ừ ́ cac tin hiêu tiêng noi bi nhiêu băng cac ́ ́ ́ ̣ ́ ́ ̣ ̃ ̀

thuât toan đa nghiên c u là SS và WF, co đ c tin hiêu tiêng noi đa đ c tăng ứ ́ ượ ̃ ượ ̣ ́ ̃ ́ ̣ ́ ́

. Nh vây ta co đ c c s d liêu cho viêc đanh gia chât l ng cua tin ngườ c ư ̣ ́ ượ ơ ở ữ ́ ượ ̣ ̣ ́ ́ ̉ ́

hiêu tiêng noi sau khi đa đ c tăng c . ng ̃ ượ ườ ̣ ́ ́

1.27.2 T ng quan v quy trình đánh giá ề ổ

Đ đánh giá ch t l ng ti ng nói sau khi đã x lý s d ng c hai ph ấ ượ ể ử ụ ử ế ả ươ ng

pháp đánh giá d a trên ch t l ng do ng c (SE) và đánh ấ ượ ự ườ i nghe c m nh n đ ả ậ ượ

giá d a trên các phép đo thu c tính c a tín hi u (OE). Trong đ án này ph ủ ự ệ ộ ồ ươ ng

pháp đánh giá chính đ c dùng là OE, SE đ c dùng làm ph ng pháp đánh giá ượ ượ ươ

c th c hi n b i các thành viên trong nhóm th c hi n . b sung và đ ổ ượ ệ ở ự ự ệ

Do đ c tính c a các thu t toán gi m nhi u đ c s d ng trong đ tài là có ễ ượ ử ụ ủ ề ả ặ ậ

các th ng s nh h ng đ n cách th c x lý n u ch nh các thông s này ta s ố ả ố ưở ứ ử ế ế ố ỉ ẽ

Trang 58 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

có các k t qu khác nhau có th t t, có th x u đ i v i m t file âm thanh. Đ ể ố ế ả ố ớ ể ấ ộ ể

có th có các thông s t ố ố ể t nh t và có các nh n xét v tính n đ nh, thu t toán t ề ấ ậ ậ ổ ị ố t

hay x u ta ph i th c hi n quá trình tinh ch nh thông s đ đ c các k t qu ố ể ượ ự ệ ấ ả ỉ ế ả

khác nhau t ừ đó so sánh và đ a ra các thông s t ư ố ố ư i u nh t có th . Quá trình này ể ấ

là th c hi n đánh giá thu t toán. ự ệ ậ

Các thu t toán gi m nhi u ễ ả ậ

Ti ng nói đã ế ả nhi uễ đ c gi m ợ

Tín hi u s ch ệ ạ

Đánh giá SE Đánh giá OE

Ch nh s a các thông s c a

ố ủ

thu t toán gi m nhi u ễ

Nh n xét ậ

Hình 4.8 Quy trình th c hi n đánh giá ự ệ

ng pháp đánh giá 1.27.3 Ki m tra đ tin c y c a các ph ộ ậ ủ ể ươ

Các đánh giá OE đ c dùng là : SNRseg, IS, LLR, WSS. ượ

Ki m tra đ n đ nh c a các ph ng pháp đánh giá trên b ng cách so sánh ộ ổ ủ ể ị ươ ằ

tín hi u ti ng nói b nhi u xe h i và nhi u ng i nói xung quanh ch a đ c x ễ ế ễ ệ ơ ị ườ ư ượ ử

lý v i tín hi u s ch ệ ạ ớ

Trang 59 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Hình 4.9. Đ th ki m tra đ n đ nh c a đánh giá OE đ i v i nhi u xe ồ ị ể ố ớ ộ ổ ủ ễ ị

h i ơ

ễ Hình 4.10. Đ th ki m tra đ n đ nh c a đánh giá OE đ i v i nhi u ị ồ ị ể ố ớ ộ ổ ủ

ng i nói xung quanh ườ

Trang 60 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

K t qu ki m tra cho th y ấ ả ể ế

 Đ i v i đánh giá SNRseg đ th đi lên theo chi u tăng d n c a ủ ồ ị ố ớ ề ầ

SNR

 Đ i v i đánh giá LLR, IS và WSS thì đ th có h ng đi xu ng và ố ớ ồ ị ướ ố

variance cũng gi m d n theo chi u tăng d n c a SNR ch ng t ủ ứ ề ầ ầ ả ỏ

ph c a tín hi u có SNR cao g n v i ph tín hi u s ch h n ầ ệ ạ ổ ủ ệ ớ ơ ổ

Qua ki m tra th y đ c các ph ng pháp đánh giá trên đ u n đ nh và đ ể ấ ượ ươ ề ổ ị ủ

tin c y đ th c hi n đánh giá đ i v i các tín hi u ti ng nói đã qua x lý. ể ự ố ớ ử ệ ệ ế ậ

1.27.4 Th c hi n đánh giá ự ệ

Trong quá trình nghiên c u và tri n khai thu t toán ta nh n th y các thông ứ ể ấ ậ ậ

ng l n đ n thu t toán: s sau nh h ố ả ưở ế ậ ớ

- NoiseMargin :là ng ng đ nh n bi ưỡ ể ậ ế ủ t nhi u trong VAD .M c đ nh c a ễ ặ ị

thu t toán Noise margin s là 3db. ẽ ậ

- IS :h s ch th i gian không có ti ng nói đ u tiên trong m i file âm ỉ ờ ệ ố ế ầ ỗ

thanh đ c dùng đ tính toán nhi u ban đ u. Do khi ki m tra nh ng đo n im ượ ữ ể ễ ể ầ ạ

0.15s l ng ban đ u trong các file s ch ta nh n th y r ng đ i v i t ng file thì t ặ ố ớ ừ ấ ằ ậ ạ ầ ừ

đ n 0.2s là nh ng đo n im l ng.Ta l a giá tr IS là 0.2 ế ữ ự ạ ặ ị

- Đ i v i thu t toán WF thì ta có thêm h s alpha là h s làm tr n trong ố ớ ệ ố ệ ố ậ ơ

ph ng pháp ng t s Priori SNR. ươ c l ướ ượ ỉ ố

-Đ i v i thu t toán SS thì có h s Gramma là h s quy t đ nh nhi u s ố ớ ế ị ệ ố ệ ố ễ ẽ ậ

đ c tr theo biên đ hay năng l ượ ừ ộ ượ ậ ng. Ta ch n giá tr Gramma là 1 t c là thu t ứ ọ ị

toán Subtraction s tr nhi u theo biên đ . ộ ẽ ừ ễ

Đánh giá thu t toán v i các h s d đoán ban đ u

1.27.4.1

ệ ố ự ớ ậ ầ

H s IS=0.2, NoiseMargin=3 ệ ố

 Đánh giá OE

Sau khi th c hi n thu t toán SS và WF v i các thông s alpha=0.9, ự ệ ậ ố ớ

gamma=1, NoiseMargin=3,IS=0.2 ta có đ th c a đánh giá b ng SNR, LLR, IS, ồ ị ủ ằ

WSS nh sauư

Trang 61 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Hình 4.11 Đ th đánh giá Objective v i h s IS=0.2, NoiseMargin=3 ớ ệ ố ồ ị

Theo đ th ta có các nh n xét nh sau : ồ ị ư ậ

ớ Đ i v i thông s đánh giá SNR cho ta th y t s SNR đã có tăng h n so v i ấ ỉ ố ố ớ ố ơ

thu t toán đã lo i tr file ch a x lý. Ch ng t ử ư ứ ỏ ạ ừ ậ môt ph n nhi u ra kh i file ể ầ ỏ

i th y file ch a x lý l i có s ch. Nh ng đ i v i so sánh IS, LLR, WSS thì ta l ạ ố ớ ư ạ ư ử ấ ạ

t h n file đã x lý. Do đánh giá IS, LLR, WSS là so sánh kho ng cách k t qu t ế ả ố ơ ử ả

ph gi a file đã x lý và file s ch r i tính giá tr trung bình nên ta có th d đoán ổ ữ ể ự ử ạ ồ ị

là năng l ng c a file đã x lý l ch r t nhi u v i file s ch có th do thu t toán ượ ử ủ ệ ề ể ấ ạ ậ ớ

i ho c là năng l t ồ ặ ượ ng tín hi u s ch b nén m t ph n . ị ệ ạ ầ ộ

 Đánh giá SE

Sau khi ki m tra các file đ u ra b ng ph ể ầ ằ ươ ậ ng pháp nghe th ta có các nh n ử

xét sau đây: M t s file đ u ra c a các thu t toán SS và WF có m c đ nén ộ ố ủ ứ ậ ầ ộ

nhi u khác cao d n t i vi c m t m t ph n ti ng nói. ẫ ớ ễ ệ ế ấ ầ ộ

i u các thông s cho thu t toán VAD  K t lu n và t ế ậ ố ư ố ậ

Qua các nh n xét v đánh giá OE và SE ta rút ra k t lu n nh sau: ư ề ế ậ ậ

Do thu t toán VAD v i các thông s đ ra là IS=0.2 và NoiseMargin=3 là ố ề ậ ớ

không t ng là nhi u nên đã b thu t toán nén ố t nên m t ph n âm thanh b ầ ộ c l ị ướ ượ ễ ậ ị

đi d n t ng c a ph n âm thanh s ch. ẫ ớ i vi c m t năng l ấ ệ ượ ủ ầ ạ

Trang 62 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Đ i v i thông s IS ta ph i thay đ i nh sau : Do đo n l ng trong file ổ ạ ặ ố ớ ư ả ố

ộ s ch ch n m trong kho ng 0.15s đ n 0.2s. N u ta đ 0.2 là quá l n đ i v i m t ạ ố ớ ỉ ằ ể ế ế ả ớ

ng ti ng nói trong nh ng file nay s đ sô file nên m t ph n năng l ộ ầ ượ ẽ ượ ữ ế ậ c thu t

ộ ạ toán VAD xem là nhi u vì th m t ph n ti ng nói s b lo i b . Đó là m t h n ẽ ị ạ ỏ ế ộ ễ ế ầ

c dùng trong đ tài : gi ch c a thu t toán VAD đ ậ ế ủ ượ ề ữ ứ c ng giá tr IS( đo n im ị ạ

t c m i file âm thanh. l ng) đ cài đ t nhi u là không phù h p cho t ặ ễ ể ặ ợ ấ ả ọ

Đ i v i thông s NoiseMargin: Vì ta ch n m c ng ng đ nh n bi ố ớ ứ ố ọ ưỡ ể ậ ế t

nhi u là 3dB là khá l n nên t ng t nh giá tr IS v i m c ng ễ ớ ươ ự ư ứ ớ ị ưỡ ư ậ ng nh v y

m t ph n tín hi u s ch s b lo i b do khác g n v i nhi u dù IS có t i u th ẽ ị ạ ỏ ệ ạ ễ ầ ầ ộ ớ ố ư ế

nào đi n a. Qua th c nghi m ta có h s NoiseMargin t i u là 2. Đó là giá tr ệ ố ữ ự ệ ố ư ị

mà tín hi u s ch không b ng là nhi u. ệ ạ c l ị ướ ượ ễ

V y các giá tr t i u cho thu t toán VAD là : h s IS ph i đi u ch nh l ị ố ư ệ ố ề ậ ả ậ ỉ ạ i

là 0.15s, h s NoiseMargin là 2. ệ ố

H s IS=0.15 ,h s NoiseMargin=2 ệ ố ệ ố

 Đánh giá OE

Sau khi thu t hi n l i thu t toán SS và WF v i h s IS=0.15,h s ệ ạ ậ ớ ệ ố ệ ố ậ

NoiseMargin=2 ta có đ th đánh giá IS, SNR, WSS, LLS nh sau : ồ ị ư

Hình 4.12 Đ th đánh giá Objective v i h s IS=0.15, NoiseMargin=2. ớ ệ ố ồ ị

Trang 63 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Ta nh n th y thông s SNR t ng t nh tr ng h p IS = 0.2 và ậ ấ ố ươ ự ư ườ ợ

ử NoiseMargin=2. Nh ng ta các giá tr LLR và IS c a so sánh tín hi u đã x lý ủ ư ệ ị

b ng SS và WF đã gi m, trong đó giá tr IS đã gi m đáng k .Đ c bi ằ ể ặ ả ả ị ệ ớ ậ t v i thu t

i ng ng c a file nhi u. Đi u đó ch ng t các toán SS giá tr IS đã xu ng d ị ố ướ ưỡ ứ ủ ễ ề ỏ

thông s này th t s t t. Nh ng các giá tr IS còn rât l n đ i v i thu t toán WF ậ ự ố ố ố ớ ư ậ ớ ị

và các m c SNR 0dB và 10dB và các giá tr IS c a thu t toán Wiener v n còn ứ ủ ậ ẫ ị

n m trên giá tr IS c a file ch a x lý và file s ch. ằ ư ử ủ ạ ị

 Đánh giá SE

Sau khi nghe th các file đ u ra c a thu t toán SS và thu t toán WF. Ta ử ủ ầ ậ ậ

nh n th y thu t toán SS th t s làm viêc t t đã h đ ậ ự ậ ấ ậ ố ạ ượ c m c nhi u c a các file ễ ủ ứ

âm thanh. Nh ng đ i v i thu t toán WF m c dù đã h đ c m c nhi u c a các ố ớ ạ ượ ư ậ ặ ễ ủ ứ

file âm thanh nh ng m t s file v n b m t ti ng nói đi u đó ch ng t ẫ ị ấ ế ộ ố ư ứ ề ỏ ệ ố h s

t. c a thu t toán WF ch a t ủ ư ố ậ

 K t lu n ế ậ

K t h p gi a nh n xét trong OE và SE ta có k t lu n là v i h s IS=0.15 ớ ệ ố ế ợ ữ ế ậ ậ

và NoiseMargin=2 thì thu t toán VAD làm vi c th t s t ậ ự ố ư ơ i u cho nhi u xe h i. ệ ễ ậ

Và h s c a thu t toán Wiener ch a t i u đó chính là h s alpha. ệ ố ủ ư ố ư ệ ố ậ

T i u h s alpha cho thu t toán WF

1.27.4.2

ố ư ệ ố ậ

Ta đánh giá h s alpha cho thu t toán WF qua các tr ệ ố ậ ườ ng h p h s ợ ệ ố

alpha=0.5, 0.8,0.9 v i IS=0.15 và NoiseMargin = 2 đ ch n ra tr ng h p t ể ớ ọ ườ ợ ố t

nh t.ấ

 Đánh giá objective

Trang 64 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

ớ Hình 4.14 Đ th đánh giá objective v i h s alpha=0.5, 0.8,0.9 v i ớ ệ ố ồ ị

IS=0.15 và NoiseMargin = 2

Qua đ th SNR ta nh n th y h s alpha càng l n thì m c nhi u b nén ồ ị ệ ố ứ ễ ấ ậ ớ ị

càng l n (t s SNR l n). Qua đ th IS ta th y h s alpha càng nh thì tác ồ ị ệ ố ỉ ố ấ ớ ớ ỏ

t. Giá tr alpha=0.9 tác đ ng vào file có đ ng vào file t s SNR càng l n càng t ộ ỉ ố ớ ố ộ ị

SNR=10 dB cho ra file output có kho ng cách ph xa h n so v i file s ch và file ả ạ ổ ơ ớ

nhi u. Còn l i các giá tr alpha khác và alpha=0.9 v i các m c file nhi u có t s ễ ạ ỉ ố ứ ễ ớ ị

SNR khác đ u cho ra k t qu t t h n so v i file s ch và file nhi u.Và h s ả ố ơ ệ ố ề ế ễ ạ ớ

alpha b ng 0.5 có v r t t t trên đ th is đ c biêt là v i file nhi u có t s ẻ ấ ố ằ ồ ị ỉ ố ễ ặ ớ

SNR=15dB tác đ ng r t n đ nh (variant nh ). ấ ổ ộ ỏ ị

 Đánh giá subjective

ấ Qua vi c ki m tra subjective ta nh n th y v i h s alpha=0.5 tác đ ng r t ớ ệ ố ể ệ ấ ậ ộ

n đ nh và t ổ ị ố ớ ớ t v i file nhi u có m c SNR=15dB cho ra file r t s ch. Nh ng v i ấ ạ ứ ư ễ

các m c dB khác thì ko t t b ng so v i các h s alpha khác, nhi u còn t ứ ố ằ ệ ố ễ ớ ươ ng

đ i nhi u.Đ i v i h s alpha là 0.9 thì v i m c file nhi u có SNR=10dB tác ố ố ớ ệ ố ứ ề ễ ớ

t, m t s file c tín hi u s ch cũng b nén. đ ng không t ộ ố ệ ạ ộ ố ả ị

 K t lu n ế ậ

Trang 65 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Qua các nh n xét v đánh giá SE và OE ta rút ra k t lu n là h s ệ ố ế ề ậ ậ

alpha=0.8 là h s t t c các tr ệ ố ố ư i u nh t cho t ấ ấ ả ườ ễ ng h p có th nó nén nhi u ể ợ

không nhi u b ng h s alpha nh ng không nén luôn tín hi u s ch, b o đ m tín ệ ạ ệ ố ư ề ả ả ằ

hi u v n còn nghe t ng đ i nhi u. ệ ẫ ố t, nhi u b h xu ng t ễ ị ạ ố ươ ề ố

Ta có thêm nh n xét v cách đánh giá OE là không ph i lúc nào cũng hoàn ề ả ậ

toàn chính xác nh đ i v i h s alpha=0.5 trên đ th IS nó là t ư ố ớ ệ ố ồ ị ố ư t nh t nh ng ấ

t nh t trong tr v i vi c ki m tra b ng SE thì nó ch t ằ ớ ỉ ố ệ ể ấ ườ ố ng h p 15dB hay đ i ợ

t nh t nh ng có m t s tr v i đ th SNR thì h s alpha t ớ ồ ị ệ ố ố ộ ố ườ ư ấ ệ ng h p tín hi u ợ

s ch đã b nén luôn. ị ạ

H s gamma cho thu t toán SS

1.27.4.3

ệ ố ậ

Vì thu t toán SS là thu t toán tr nhi u nên ta có 2 cách tr ậ ậ ừ ễ ừ nhi u là tr ễ ừ

theo năng l ng và tr ượ ừ ế theo biên đ nên ta cung c p h s gamma n u ệ ố ấ ộ

gamma=1 thì tr theo biên đ gamma =2 thì tr theo năng l ng. Sau đây ta s ừ ộ ừ ượ ẽ

đánh giá và tìm ra cách tr nào là t t nh t( gamma=1 hay 2). ừ ố ấ

 Đánh giá OE

Hình 4.15 Đ th đánh giá objective v i h s gamma = 1 và gamma = 2. ớ ệ ố ồ ị

Trang 66 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Ta nh n th y đ i v i c thông s SNR và IS thì h s gamma=2 t c là tr ố ớ ả ệ ố ứ ấ ậ ố ừ

theo năng l ng đ u t t h n ngo i tr đ i v i file nhi u có SNR là 10dB.Và ượ ề ố ơ ạ ừ ố ớ ễ

gamma=1 hay gamma = 2 đ u đ a ra đ th t ồ ị ố ơ ớ t h n đ th gi a file nhi u v i ồ ị ữ ư ễ ề

file s chạ

 Đánh giá SE

Sau khi ki m tra SE ta nh n th y r ng đ i v i h s gamma=2 t c là tr ố ớ ệ ố ấ ằ ứ ể ậ ừ

theo năng l ng thì nhi u b nén r t ít, file đ u ra không t t b ng h s ượ ễ ấ ầ ị ố ệ ố ằ

gamma=1.

 K t lu n ế ậ

Sau khi so sánh OE và SE ta có k t lu n là m c dù trên đ th ph n ánh h ồ ị ế ậ ặ ả ệ

t h n nh ng trên th c t thì h s gamma=1 m i t s gamma=2 t ố ố ơ ự ế ư ệ ố ớ ố ơ ứ t h n.Ch ng

vi c đánh giá OE nh nói trên không ph i lúc nào cũng đúng. t ỏ ệ ư ở ả

Ta ch n h s gamma t i u là 1. ọ ệ ố ố ư

Đánh giá thu t toán sau khi đã t i u

1.27.4.4

ậ ố ư

Sau khi th c hi n m t lo t các h s th nghiêm ta ch n ra h s t i u là ệ ố ử ệ ố ố ư ự ệ ạ ộ ọ

:

-Thu t toán VAD: h s IS=0.15, NoiseMargin = 2. ệ ố ậ

-Thu t toán WF h s alpha=0.8. ệ ố ậ

-Thu t toán SS tr theo biên đ . ộ ừ ậ

Và vi c đánh giá OE ch đánh giá v m t toán không ph i lúc nào cũng ề ặ ệ ả ỉ

đúng , đánh giá OE ph i đi kèm v i đánh giá SE. ả ớ

Trang 67 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Hình 4.16 Đ th đánh giá v i IS=0.15 NoiMargin= 2 và alpha = 0.8 cho ồ ị ớ

thu t toán WF, gama=1 cho thu t toán SS. ậ ậ

1.27.4.5

Đánh giá đ n đ nh c a thu t toán trong môi tr ủ ộ ổ ậ ị ườ ễ ng nhi u

khác

 Đánh giá OE

Th c hi n nghe đ i v i tín hi u đã qua x lý th y r ng m t s file tín ấ ằ ố ớ ộ ố ự ử ệ ệ

hi u có nh ng đo n ch nghe đ c nhi u ch không nghe đ ữ ệ ạ ỉ ượ ứ ễ ượ ề c ti ng nói. Đi u ế

này đ c gi i thích là do nhi u ng i nói có năng l ng nhi u t ng đ ượ ả ễ ườ ượ ễ ươ ươ ng

ng ti ng nói, trong m t s file thì tín hi u ti ng nói có m c năng v i năng l ớ ượ ộ ố ứ ế ệ ế

ng th p h n m c năng l l ượ ứ ấ ơ ượ ng c a nhi u nên đo n ti ng nói đó b tr m t ch ế ị ừ ấ ủ ễ ạ ỉ

còn l ạ i nhi u. ễ

 Đ thồ ị

Áp d ng các thông s t i u đ i v i nhi u xe h i cho nhi u ng i nói ố ố ư ố ớ ụ ễ ễ ơ ườ

xung quanh có đ th đánh giá nh sau ồ ị ư

Trang 68 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Hình 4.17 Đ th đánh giá OE v i nhi u ng i nói xung quanh. ồ ị ễ ớ ườ

 Nh n xét ậ

ễ Nh n xét theo đ th đ i v i c b n phép đánh giá ta th y đ i v i nhi u ồ ị ố ớ ả ố ố ớ ấ ậ

ng i nói xung quanh thì SS có v x lý t t h n WF. ườ ẻ ử ố ơ

Nh ng đ i v i c ba ph ng pháp đánh giá đ u tiên thì c ba giá tr WSS, ố ớ ả ư ươ ầ ả ị

LLR, IS c a các tín hi u đã đ c x lý so v i tín hi u s ch l i không t ủ ệ ượ ử ệ ạ ớ ạ ố ằ t b ng

ệ giá tr c a tín hi u nhi u ch a x lý so v i tín hi u s ch (so sánh c a tín hi u ư ử ệ ạ ị ủ ủ ệ ễ ớ

đã x lý có giá tr l n h n). ị ớ ử ơ

Riêng v i phép đánh giá IS ta th y thu t toán x lý nhi u có tác đ ng t ử ễ ậ ấ ớ ộ ố t

đ i v i nhi u 0dB và 5dB. Bên c nh đó variant còn l n vì có m t s file có giá ố ớ ộ ố ễ ạ ớ

ố tr so sánh l n h n giá tr c a các file khác r t nhi u (đi u này cũng x y ra đ i ị ủ ề ề ả ấ ớ ơ ị

c th hi n trong b ng giá tr IS [matlab file]. Lý gi v i car noise) đ ớ ượ ể ệ ả ị ả ề i cho đi u

này là do m t s tín hi u b nhi u đ t bi n. ộ ố ệ ị ễ ế ộ

 Đánh giá SE

Khi th c hi n nghe đ i v i các file âm thanh b nhi u ng i nói xung ố ớ ự ệ ễ ị ườ

quanh đ ượ ử c x lý b ng SS và WF thì có m t s đo n ti ng nói b m t, ch nghe ộ ố ị ấ ế ạ ằ ỉ

đ c nhi u ch không nghe đ c ti ng nói. ượ ứ ễ ượ ế

Trang 69 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Ch ng 4: Th c hi n và đánh giá các thu t toán ươ ự ệ ậ

Đi u này đ c lý gi i là do nhi u ng i nói xung quanh có m c năng ề ượ ả ễ ườ ứ

ng t ng đ ng c a ti ng nói nên m t s file âm thanh l ượ ươ ươ ng v i m c năng l ứ ớ ượ ủ ế ộ ố

có đo n ti ng nói có m c năng l ng th p h n m c năng l ng c a nhi u thì ứ ế ạ ượ ứ ấ ơ ượ ủ ễ

ti ng nói đó s b tr m t ch còn l i nhi u. ẽ ị ừ ấ ế ỉ ạ ễ

 Nh n xét chung ậ

Khi đem các thông s t i u đ x lý nhi u xe h i áp d ng v i ng i nói ố ố ư ể ử ụ ễ ơ ớ ườ

xung quanh thì k t qu không t t. ế ả ố

Đ i v i nhi u ng i nói xung quanh thì thu t toán SS tác đ ng t ố ớ ễ ườ ậ ộ ớ ơ t h n

WF.

ng 1.27.5 K t lu n ch ế ậ ươ

c k t lu n là : Qua k t qu đánh giá b ng OE và SE đ a ra đ ằ ư ế ả ượ ế ậ

- Đ i v i t ng lo i nhi u khác nhau thì tác đ ng c a các thu t toán tăng ố ớ ừ ủ ễ ậ ạ ộ

ng là khác nhau. c ườ

- Đ i v i t ng m c nhi u khác nhau thì thu t toán cũng tác đ ng cũng ố ớ ừ ứ ễ ậ ộ

khác nhau.

Trang 70 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

TÀI LI U THAM KH O Ả Ệ

[1]. Ramabadran, T.,Ashley, J., and McLaughin, M.(1997), Background noise

suppression for speech enhancement and coding, Proc. IEEE Workshop Speech

Coding Telecommun.

[2]. Ths.Hoàng Lê Uyên Th c, Giáo trình x lý tín hi u s , Đ i h c Bách Khoa ệ ố ạ ọ ụ ử

– Đ i h c Đà N ng. ạ ọ ẵ

[3].Hu, Y. and Loizou, P(2006), Subjective comparison of speech enhancement

algorithms, Proc. IEEE Int.Conf. Acoust. Speech Signal Process, I.

[4]. Philippos C.Loizou, Speech Enhancement Theory and Practice,pp. 2-7.

[5]. Long, M. (2005), Dinner Conversation (An oxymoron?), Acoustics Today,l(1),

pp. 25-27.

[6]. Lombard, E.(1911), Le signe de lelevation de la voix, Ann. Mal. Oreil.

Larynx.,37, 101-119.

[7]. Nguy n Qu c Trung, X lý tín hi u s - t p 1, NXB Khoa h c kĩ thu t. ệ ố ậ ử ễ ậ ố ọ

[8]. Lim, J. and Oppenheim, A.V.(1979), Enhancement and bandwidth

compression of noisy speech, Proc. IEEE, 67(12),pp. 1586-1604.

[9]. Weiss, M., Aschkenasy, E., and Parsons, T.(1974), Study and the development

of the INTEL technique for improving speech intelligibility, Technical Report

NSC-FR/ 4023.

[10]. Boll, S.F. (1979), Suppression of acoustic noise in speech using spectral

subtraction, IEEE Trans, Acoust. Speech Signal Process.,27(2), 113-120.

[10]. Philippos C.Loizou, Speech Enhancement Theory and Practice,pp. 46-57.

[11] “Methods for Subjective Determination of Transmission Quality”, ITU_T

Recommendation P.800, August 1996.

[12] Philipos C.Loizou, “Speech Enhancement Theory and Practice”, CRC Press,

Taylor and Francis Group.

[13] Friedrich Schafer, “Artificial Bandwidth Extension of Narrowband Speech”,

Signal Processing and Speech Communication Lab, Technical University Graz.

Trang 71 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

[14] Hansen J. and Pellon B. , “An effective quality evaluation protocol for Speech

Enhancement algorithms”, Proc. Int Conf. Spoken Language Process, 1998.

[15] http://en.wikipedia.org/wiki/Code_Excited_Linear_Prediction

[16] Beey Y. , Shpiro Z. , Simchony T. , Shatz L. and Piasetzky J., “An efficient

variable_bit_rate_low_delay (VBR_LP_CELP) code” , New York, Marcel Pekker,

1990.

[17] Yi Hu and Philipos C. Loizou, “Evaluation of Objective Quality Measures for

Speech Enhancement”, IEEE.

[18] Klatt D., “Prediction of perceived phonetic distance from critical band

spectra”, Proc IEEE Int. Conf. Acoust. Speech Signal Process.

[19] Kitawaki N., Nagabuchi H., and Itoh K., “Objective Evaluation for low

bit_rate Speech Coding systems”, IEEE J, Sel. Areas Commun.

[20] Quackenbush S., Barnwell T. and Clements M., “Objective Measure of

Speech Quality”, Englewood Cliffs NJ: Prentic Hall. ư

[21]. Boll, S.F(1979), Suppression of acoustic noise in speech using spectral

subtraction, IEEE Trans. Acoust. Speech Signal Process., 27(2), 113-120.

[22]. Paliwal, K. and Alsteris, L.(2005), On the usefulness of STFT phase

spectrum in human listening tests, Speech Commun., 45(2), 153-170.

[23]. Weiss, M., Aschkenasy, E., and Parsons, T., (1974), Study and the

Development of the INTEL Technique for Improving Speech Intelligibility,

Technical Report NSC-FR/4023, Nicolet Scientific Corporation.

[24]. Deller, J., Hansen, J.H.L., and Proakis, J. (2000), Discrete –time Processing

of Speech Signals, New York : IEEE Press.

[25]. Guastafsson, H., Nordholm, S., and Claesson, I.(2001), Spectral subtraction

using reduced delay convolution and adaptive averaging, IEEE Trans. Speech

Audio Process., 9(8), 799-807.

[26]. Philippos C.Loizou, Speech Enhancement Theory and Practice,pp. 100.

[27]. Paliwal, K. and Alsteris, L.(2005), On the usefulness of STFT phase

spectrum in human listening tests, Speech Commun., 45(2), 153-170.

Trang 72 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

[28]. Lim, Oppenheim, Speech Enhancement Using a Soft-Decision noise

Suppression EEE Trans. Acoustics, Speech and Signal Processing, vol. assp-28,

no. 2, april 1980.

[29]. Y. Ephraim and D. Malah, Speech Enhancement Using a Minimum Mean-

Square Error Short-Time Spectral Amplitude Estimator, IEEE Trans. Acoustics,

Speech and Signal Processing, vol. 32, no. 6, pp. 1109–1121, December 1984.

[30]. P. Scalart and J. Vieira-Filho, “Speech enhancement based on a priori signal

to noise estimation,” in Proc. 21st IEEE Int. Conf. Acoust. Speech Signal

Processing, Atlanta, GA, May 1996, pp. 629–632.

[31]. Dominic K. C. Ho, Speech Enhancement : concept and methodology, Demo

prepared by Tong Wang, University of Missouri-Columbia.

[32] http://www.utdallas.edu/~loizou/speech/noizeus/

NG PHÁT TRI N Đ TÀI K T LU N Đ ÁN VÀ H Ậ Ồ Ế ƯỚ Ề Ể

Ch t l ng c a ti ng nói b suy gi m do s tác đ ng c a nhi u trong môi ấ ượ ủ ế ự ủ ễ ả ộ ị

tr ng xung quanh là m t v n đ quan tr ng c n ph i đ c gi ườ ộ ấ ả ượ ề ầ ọ ả ệ i quy t. Vi c ế

tìm ra các ph ng pháp đ tri t nhi u và gi m nhi u trong ti ng nói luôn luôn ươ ể ệ ế ễ ễ ả

Trang 73 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

c quan tâm r t nhi u. Trong các d ch v truy n thông v i ph đ tài đ ề ượ ụ ề ề ấ ớ ị ươ ng

ti n ngôn ng là ti ng nói thì vi c tăng c ng, c i thi n ch t l ữ ệ ệ ế ườ ấ ượ ệ ả ng ti ng nói ế

t, giúp cho ng i nghe có th nghe rõ và đúng nh ng gì đã b nhi u là r t thi ễ ấ ị ế ườ ữ ể

ng i nói đã nói. ườ

Đ án đã th c hi n đ ệ ượ ự ồ c các v n đ : ấ ề

- Tìm hi u và nghiên c u các ph ng pháp c i thi n ch t l ứ ể ươ ấ ượ ệ ả ế ng ti ng

nói, nh ng t p trung vào 2 thu t toán đã có trong Speech enhancement ư ậ ậ

là : Spectral Subtraction và Wiener Filtering

- Xây d ng đ c ch ng trình th c hi n x lý nhi u trong các file âm ự ượ ươ ự ử ệ ễ

thanh đã b nhi u d a trên 2 thu t toán : Spectral Subtraction và ự ễ ậ ị

Wiener Filtering.

- Th c hi n và đánh giá tính hi u qu c a 2 thu t toán trong các môi ả ủ ự ệ ệ ậ

tr ng nhi u và m c đ nhi u khác nhau, t đó đ a ra các bi n pháp ườ ứ ộ ễ ễ ừ ư ệ

i u hóa các thu t toán. K t qu đ t đ t ố ư ả ạ ượ ế ậ ậ c cho th y WF là thu t ấ

toán gi m nhi u t t h n SS. Các thu t toán gi m nhi u có hi u qu ễ ố ơ ệ ễ ậ ả ả ả

khác nhau đ i v i t ng môi tr ng nhi u khác nhau ố ớ ừ ườ ễ

Tuy nhiên đ án v n ch a gi i quy t h t đ ư ẫ ồ ả ế ế ượ c các v n đ trong Speech ề ấ

enhancement nên h ng lai s là : ướ ng phát tri n c a đ tài trong t ể ủ ề ươ ẽ

- Tìm hi u, nghiên c u và xây d ng các ch ứ ự ể ươ ử ng trình th c hi n x lý ự ệ

nhi u trong ti ng nói d a trên các thu t toán khác trong Speech ự ễ ế ậ

enhancement.

- Nghiên c u và đ a ra thu t toán m i v x lý nhi u và tri ớ ề ử ư ứ ễ ậ ệ ễ t nhi u

trong Speech enhancement.

Phát tri n ch ể ươ ờ ng trình đã th c hi n đ i v i các d ch v ng d ng th i ố ớ ụ ứ ự ụ ệ ị

gian th c và các d ch v trong lĩnh v c truy n thông đa ph ụ ự ự ề ị ươ ạ ng ti n nh : tho i, ư ệ

âm nh c, truy n hình h i ngh . ị ề ạ ộ

Trang 74 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị

Đ án t ồ ố t nghi p ệ

PH L C Ụ Ụ

Toàn b mã ngu n c a ch c l u tr trên đĩa CD ồ ủ ộ ươ ng trình th c hi n đ ự ệ ượ ư ữ

đính kèm.

Trang 75 SVTH: Nguy n Th Ng c Di p ệ ễ ọ ị