intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn đề tài : Nghiên cứu giải pháp giảm nhiễu tiếng van trong thông tin thoại

Chia sẻ: Nhung Thi | Ngày: | Loại File: PDF | Số trang:26

66
lượt xem
9
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phương pháp thứ nhất loại bỏ thành phần phổ tiếng vang bằng cách trừ giá trị trung bình ước lượng của logarit của phổ tần số. Phương pháp thứ hai thực hiện việc ước lượng hằng số thời gian của nhiễu tiếng vang ở các băng tần số khác nhau, rồi xây dựng mặt nạ loại bỏ phần nhiễu tiếng vang. Các thuật toán này được kiểm tra trên cơ sở dữ liệu tiếng nói tiếng Việt. Kết quả đánh giá khách quan cho thấy hai thuật tóan trên đều nâng cao chất lượng tiếng nói bị nhiễu tiếng vang....

Chủ đề:
Lưu

Nội dung Text: Luận văn đề tài : Nghiên cứu giải pháp giảm nhiễu tiếng van trong thông tin thoại

  1. 1 B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG TR N Đ C H I NGHIÊN C U CÁC GI I PHÁP GI M NHI U TI NG VANG TRONG THÔNG TIN THO I Chuyên ngành: K thu t Đi n t Mã s : 60.52.70 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011
  2. 2 Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: TS PH M VĂN TU N Ph n bi n 1: TS. Ngô Văn S Ph n bi n 2: TS. Nguy n Hoàng C m Lu n văn ñư c b o v t i H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày 21 tháng 5 năm 2011 *. Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng.
  3. 1 M Đ U 1. Tính c p thi t c a ñ tài S d ng ti ng nói ñ giao ti p là m t cách t nhiên và d dàng nh t ñ trao ñ i các ý tư ng và suy nghĩ c a con ngư i. Ngày nay, khi xã h i phát tri n, nhu c u trao ñ i thông tin c a con ngư i càng tr nên c p thi t và yêu c u v ch t lư ng ngày càng cao. Các h th ng thông tin ho c ñi u khi n b ng gi ng nói ñang ñư c ng d ng ngày càng nhi u trong th c t , ví d ñi n tho i hands-free hay h th ng thông tin dùng trong phòng ph u thu t….... M t trong các tr ng i chính c a vi c phát tri n các h th ng này là s suy gi m ch t lư ng và tính hi u ñư c c a ti ng nói do nhi u ti ng vang. Nhi u này sinh ra do quá trình truy n ña ñư ng c a âm thanh t ngu n ñ n m t hay nhi u microphone. X lý tri t hay gi m ti ng vang là v n ñ không ñơn gi n vì thông thư ng thông tin v tính ch t c a ngu n tín hi u và ñi u ki n c a kênh truy n âm thanh không ñư c bi t trư c ho c ch có r t ít ki n th c liên quan ñư c cung c p Chính vì v y “ nghiên c u các gi i pháp gi m nhi u ti ng vang trong thông tin tho i ” là ñ tài có tính khoa h c và th c tri n cao. 2. M c ñích ñ tài - Các cơ ch gây ra ti ng vang t i ñ u cu i. - Các gi i pháp gi m nhi u ti ng vang d a trên thông tin kênh truy n và thông tin c a ngu n phát. - Các k thu t ñánh giá (khách quan và ch quan) hi u qu c a các thu t toán gi m nhi u ti ng vang. 3. Ph m vi ñ tài - Nghiên c u các gi i pháp ñ gi m nhi u ti ng vang. - L p trình th c hi n các thu t toán trên b ng ngôn ng Matlab. - Nghiên c u các phương pháp ñánh giá.
  4. 2 - Đánh giá và so sánh hi u qu c a các gi i pháp d a trên cơ s d li u ti ng Vi t. 4. Phương pháp nghiên c u - Nghiên c u lý thuy t, tìm hi u các gi i pháp gi m nhi u ti ng vang trong thông tin tho i và các phương pháp ñánh giá. - Xây d ng cơ s d li u ti ng nói (Ti ng Vi t ñư c tích t VOA), v i các kho ng cách ngu n – microphone khác nhau. - Xây d ng chương trình th c hi n các thu t toán c a các gi i pháp trên b ng ngôn ng Matlab. - Đánh giá hi u qu và hi u ch nh thu t toán. 5. Ý nghĩa khoa h c và th c ti n ñ tài - ng d ng lý thuy t h c máy, k thu t x lý tín hi u và các gi i pháp x lý ti ng nói ñ nâng cao ch t lư ng thông tin tho i. - H tr cho vi c ño lư ng và giám sát ch t lư ng tho i, nâng cao ch t lư ng tho i t i ñ u cu i, gián ti p c i thi n hi u su t c a h th ng nh n d ng ti ng nói t ñ ng. - V i các ki n th c và k t qu ñ t ñư c trong quá trình th c hi n ñ tài, tác gi có th áp d ng trong công tác chuyên môn trong vi c gi ng d y t i trư ng Cao ñ ng công nghi p Hu trong tương lai. 6. C u trúc lu n văn Lu n văn g m 4 chương: Chương 1: T ng quan v nhi u ti ng vang. Chương 2: Các gi i pháp ñ gi m nhi u ti ng vang Chương 3: Các phương pháp ñánh giá thu t toán Chương 4: Mô ph ng và ñánh giá
  5. 3 CHƯƠNG 1 - T NG QUAN V NHI U TI NG VANG 1.1. GI I THI U CHƯƠNG N i dung c a chương này ñ c p ñ n ñ c ñi m c a nhi u ti ng vang và s nh hư ng c a ti ng vang ñ n ch t lư ng ti ng nói. 1.2. Đ C ĐI M NHI U TI NG VANG Ti ng vang là x y ra khi sóng âm thanh truy n ñi trong m t không gian h p như trong phòng và t o ra quá trình truy n ña ñư ng c a tín hi u âm thanh t ngu n ñ n microphone như hình 1.2. Hình 1.2. Các ñư ng ñi c a âm thanh Kênh âm thanh t ngu n ñ n microphone có th ñư c mô t b i m t ñáp ng xung âm thanh (AIR) như hình 1.4. Hình 1.4. Đáp ng xung c a phòng. Th i gian ph n x là kho ng th i gian mà cư ng ñ âm thanh gi m xu ng 60dB sau khi t t ngu n, ñư c tính theo công th c: 0.049V RT 60 = (1.1) Sa 1.3. NH HƯ NG C A NHI U TI NG VANG Đ N CH T LƯ NG TÍN HI U TI NG NÓI
  6. 4 Tín hi u b nhi u ti ng vang có th ñư c mô t là âm thanh có thêm lư ng âm vang và nhi u màu ñáng k . Ch t lư ng và tính d hi u là hai thông s quan tr ng cho tín hi u ti ng nói. Ch t lư ng bao g m các thu c tính như ñ t nhiên, ñ khàn hay ti ng h n t p… còn tính d hi u là nh n xét v nh ng gì ngư i nói ñang nói, ví d như nghĩa c a nh ng t ñang ñư c nghe. M c ñích c a vi c nâng cao ch t lư ng ti ng nói tùy thu c vào nh ng ng d ng khác nhau và có th phân lo i thành nh ng m ng sau: - C i thi n tính d nghe c a ti ng nói sao cho phù h p v i ngư i nghe. - C i thi n ch t lư ng ti ng nói sao cho ngư i nghe có th ch p nh n ñư c. - Thay ñ i ti ng nói ñ ho t ñ ng c a h th ng nh n d ng ti ng nói và h th ng ti ng nói t ñ ng ñư c c i thi n. - Thay ñ i ti ng nói ñ vi c mã hóa trong lưu tr và truy n d li u hi u qu hơn. 1.4. K T LU N CHƯƠNG Trong chương này s gi i thi u lý thuy t v ñ c ñi m nhi u ti ng vang, các cơ ch gây ra ti ng vang và nh hư ng c a nhi u ti ng vang ñ n ch t lư ng tín hi u ti ng nói. CHƯƠNG 2 - CÁC GI I PHÁP Đ GI M NHI U TI NG VANG 2.1. M Đ U CHƯƠNG chương 1 ta ñã ñ c p ñ n nhi u ti ng vang và nh hư ng c a nó lên ch t lư ng ti ng nói. Vi c x lý tín hi u b nhi u ti ng vang là m t lĩnh v c ñang ñư c quan tâm. Cho ñ n nay, k thu t x lý ti ng vang ñư c phân thành hai lo i là các k thu t gi m ti ng vang và các k thu t lo i b ti ng vang [7] tùy thu c kĩ thu t ñó có ư c lư ng ñáp ng
  7. 5 xung c a kênh truy n hay không. Chương này s tìm hi u hai thu t toán nâng cao ch t lư ng ti ng nói b nhi u ti ng vang là: thu t toán tr ph [6] và thu t toán t o m t n [10]. 2.2. THU T TOÁN TR PH Sơ ñ kh i c a thu t toán tr ph hình 2.1. Phân Ư c lư ng Tr ư c Khôi ño n ñáp ng lư ng này ph c l i tín xung c a ra kh i tín tín hi u hi u kênh truy n hi u ban ñ u Hình 2.1. Sơ ñ kh i c a thu t toán tr ph Mô ph ng tín hi u ti ng nói b nhi u ti ng vang b ng cách nhân ch p tín hi u s ch s(n) v i ñáp ng xung h(n) c a kênh truy n. x(n ) = s(n ) ∗ h(n ) (2.1) Tín hi u này qua bi n ñ i Fourier [6] X(m,ωk ) = S(m,ωk)H(m,ωk) (2.2) V i m là ch s th i gian, ch th ño n tín hi u vào ñư c l y c a s , ωk là bi n t n s r i r c. N u c a s ta ch n b ng ph ng và có chi u dài tương ñ i l n so v i chi u dài c a h(n) thì tác ñ ng t o ti ng vang c a môi trư ng (qua phép ch p trong mi n t n s v i hàm h(n)) có th xem như phép nhân. X(m,ωk ) = S(m,ωk)H(ωk) (2.3) Coi ñáp ng xung c a phòng không thay ñ i theo th i gian, H(m,ωk)=H(ωk). log|X(m,ωk)| ≈ log|S(m,ωk)| + log|H(ωk)| (2.4) L y trung bình c 2 v , gi s Đ t mean(log|X(m,ωk)|) =M(ωk), mean(log|S(m,ωk)|)=F(ωk) (2.5) M(ωk) = F(ωk) + log|H(ωk)| (2.6) log|X(m,ωk)|- M(ωk) ≈ log|S(m,ωk)| - F(ωk) (2.7)
  8. 6 Như v y ta ñã lo i tr ñư c thành ph n t o ti ng vang trong tín hi u ti ng nói, ta cũng ñã tr M(ωk) kh i tín hi u s ch, tuy nhiên n u l y trung bình trên s lư ng frame ñ l n thì có th coi thành ph n M(ωk) không ch a nhi u thông tin v các âm ñư c phát ra. Khi th c hi n thu t toán, có 2 cách ñ ư c lư ng giá tr c a ñáp ng xung c a kênh truy n. Có th l y trung bình logarit biên ñ c a m t t n s nh t ñ nh qua s lư ng nh t ñ nh các frame, ho c l y trung bình trên c tr c th i gian. Phân tích thu t toán trên Trong th c t , nhìn chung các ñ c tính v truy n, ph n x , h p th …sóng âm thanh c a phòng ph thu c vào t n s . Âm thanh t ns cao b suy gi m nhi u hơn khi truy n ñi trong không khí, b h p th b i các b m t nhi u hơn là ph n x so v i âm thanh t n s th p. Vì th , ñáp ng xung c a phòng có khuynh hư ng như b l c thông th p. Nên vi c tr giá tr trung bình trong mi n logarit c a biên ñ ph t n s có tác d ng lo i b nh hư ng c a l c thông th p này. Ngư c l i, các thành ph n t n s cao có biên ñ th p, sau khi x lý biên ñ các thành ph n t n s này tăng. Thu t toán này cũng làm cho t t c các thành ph n t n s có cùng giá tr trung bình theo th i gian là 0 (trong mi n logarit) hay 1 (trong mi n tuy n tính). Theo [6], c n áp d ng c a s có chi u dài N g p ít nh t 4 l n chi u dài ñáp ng xung, khi ñó ñ phân gi i t n s cao, làm xu t hi n các thành ph n t n s cùng khung th i gian mà biên ñ b ng 0 tín hi u chưa x lý, ta g i ñây là nhi u nhân t o. Nhi u này nh hư ng nhi u ñ n ch t lư ng và tính d hi u c a tín hi u ti ng nói. Vì th c n thi t có quá tŕnh x lý sau ñ gi m nhi u nhân t o. 2.3. C I TI N THU T TOÁN TR PH Thu t toán tr ph t o ra nhi u nhân t o, ñ gi m nhi u này ph i có thêm quá trình x lý sau (Post Processing).
  9. 7 Post Processing th c hi n normalize logarit biên ñ c a c tín hi u b nhi u và tín hi u sau khi qua tr ph , dùng c a s có chi u dài bé hơn nhi u so v i N. So sánh biên ñ c a hai tín hi u trên cùng m t t n s và khung th i gian, n u biên ñ tín hi u sau khi qua tr ph l n hơn thì cho r ng ph n biên ñ l n hơn là do nhi u nhân t o và làm suy gi m biên ñ này b ng m t h s tùy thu c m c năng lư ng dôi ra. V i nh ng ô mà năng lư ng sau khi x lý bé hơn năng lư ng trư c khi x lý, h s này b ng 1. Tuy nhiên, chi u dài c a s ñ phân tích tín hi u nh hơn, nên ñ phân gi i th i gian t t hơn và ñ phân gi i t n s kém hơn. Đi u này bù ñ p cho nh ng h n ch c a vi c l y chi u dài c a s l n trư c ñó, nhưng do ñ phân gi i t n s kém nên không th lo i tr ñư c h t nhi u nhân t o. Thu t toán ñ gi m nhi u nhân t o trên chưa th t s t t, vì: Thu t toán tri t ti ng vang, v m t lý thuy t, ph i d ch ph n năng lư ng c a tín hi u do ph n x theo các ñư ng khác nhau ngư c tr l i v trí c a tín hi u tr c ti p trong mi n th i gian, làm năng lư ng tín hi u m t s ô tăng. D ng sóng trong mi n th i gian c a tín hi u nhi u b méo và tín hi u sau khi qua tr ph ñư c ñem so sánh v i tín hi u b nhi u này, nên ph n tín hi u do ti ng vang s không b tri t tiêu hoàn toàn. Thu t toán trên có th làm thay ñ i phân b năng lư ng c a tín hi u ti ng nói, làm gi m kh năng so sánh các ô trong spectrogram c a tín hi u trư c và sau x lý tr ph . 2.4. THU T TOÁN T O M T N Ti ng vang g m hai thành ph n là âm thanh ph n x s m và âm thanh ph n x mu n. ñây, ta ch t p trung vào ñ kh các âm thanh ph n x mu n. Quan sát, ta th y ñư ng bao c a tín hi u b ti ng vang có d ng c a ñ th hàm mũ.
  10. 8 n  1 exp  −  = a n (2.8)  τ Thông s a ñ c trưng cho th i gian ph n x c a kênh truy n và liên quan ñ n T60 qua công th c: log(1000) T 60 = − (2.9) log(a ) N u chúng ta ư c lư ng a t ñư ng bao c a tín hi u b ti ng vang thì có th ư c lư ng ñư c T60, t ñó xác ñ nh và lo i b các vùng tín hi u ch y u do ti ng vang, sơ ñ kh i c a thu t toán t o m t n như hình 2.4. Phân Ư c lư ng Xây d ng Nhân m t ño n RT60 c a m tn n v i tín tín kênh truy n hi u b hi u các d i t n nhi u + theo khôi ph c d it n l i tín hi u Hình 2.4. Sơ ñ kh i c a thu t toán t o m t n ph Tín hi u ñư c phân tích thành các d i t n s khác nhau sau ñó tính toán ñư ng bao c a m i d i t n s này r i chuy n sang thang dB. H ng s th i gian a c a nhi u ti ng vang ñư c ư c lư ng m i t n s b ng cách tính ñ d c c a ñư ng bao trên N m u. M t c a s có chi u dài N s ñư c d ch trên ñư ng bao c a tín hi u qua t ng m u, dùng phép x p x tuy n tính ñ tính ñ d c. Theo cách ư c lư ng trong [11], giá tr chính xác c a a ñư c xác ñ nh d a vào b s nh n ñư c. Ti p theo ta s d ng m t n nh phân ñ lo i b ph n tín hi u ch y u do ti ng vang.
  11. 9 Ph n dư i ñây l n lư t trình bày các kh i b l c băng thông, tính toán ñư ng bao, ư c lư ng T60 và xây d ng m t n trong thu t toán. 2.4.1. B l c băng thông 2.4.2. Phương pháp tính ñư ng bao L y ñư ng bao t phép bi n ñ i Hilbert T tín hi u g(t) qua bi n ñ i Hilbert ^g(t) M i tín hi u ^g(t) ñ u có th bi u di n dư i d ng như sau : ∧ g (t ) = Re{∧ g (t )}+ Im{∧ g (t )} ∧ g ∗ (t ) = Re{∧ g (t )}− Im{∧ g (t )} env = ∧ g (t ) ∗ ∧ g ∗ (t ) = Re {∧ g(t )} + Im{∧ g(t )} (2.14) 2 2 Hình 2.8. Tín hi u và ñư ng bao tín hi u ti ng nói S d ng m ch l c thông th p K thu t l y ñư ng bao tín hi u b ng m ch l c thông th p b ng cách bình phương tín hi u và sau ñó cho qua m ch l c thông th p. Sau ñó qua m ch l c thông th p ta l ai b t n s cao ñi => ch còn l i năng lư ng m t chi u + t n s th p, khai căn tín hi u ta ñư c ñư ng bao tín hi u.
  12. 10 2.4.3. Ư c lư ng T60 Trong th c t , nhi u ti ng vang suy gi m và c ng vào nhi u n n c a môi trư ng truy n, nên vi c xác ñ nh th i ñi m t i ñó m c nhi u ti ng vang bé hơn 60dB so v i tín hi u tr c ti p s khó khăn. Vì th , t c ñ suy gi m c a nhi u ti ng vang ñư c tính trong vùng tín hi u suy gi m t 5dB ñ n 35dB so v i m c tín hi u tr c ti p, dùng phương pháp x p x tuy n tính. Sau ñó, tính th i gian c n thi t ñ tín hi u suy gi m 60dB v i cùng t c ñ suy gi m ño ñư c trên. Phương pháp x p x tuy n tính Đây là m t trong nh ng phương pháp x p x ñơn gi n nh t, tìm quan h tuy n tính gi a các ñ i lư ng quan sát ñư c. Tín hi u ti ng nói ñư c phân tích thành các băng t n khác nhau, l y ñư ng bao và chuy n sang thang dB. Dùng x p x tuy n tính ñ ch n a sao cho ñư ng th ng h s góc là a g n trùng khít v i ñư ng bao tín hi u trong mi n logarit. Cách ư c lư ng T60 Ư c lư ng c a a ñư c tính t i m i khung th i gian có chi u dài N. T nh ti n khung này theo th i gian, ta s có b s là các ư c lư ng c a a m t d i t n nh t ñ nh. Vài trong s các giá tr này nh n ñư c khung th i gian mà tín hi u tr c ti p ñã ng t, vài giá tr l i nh n ñư c trong khung th i gian mà ti ng nói v n còn ho c ñư c ng t ch m d n, tương ng v i ư c lư ng sai. Vì th , c n ch n l a h s a ñúng gi a các ư c lư ng ak* (k là ch s th i gian c a khung) nh n ñư c, b ng cách xem xét phân b c a các ư c lư ng này trên s lư ng giá tr a v a ñ . Trong trư ng h p nh n ñư c giá tr ư c lư ng sai, τ có khuynh hư ng ti n ñ n ∞ nên a ti n ñ n 1 ho c bi n thiên nhanh không xác ñ nh. Ch xét các giá tr a âm thu ñư c, ngư i ta quan sát th y a tương ng v i khung th i gian còn có ti ng nói s l n hơn trong trư ng h p nhi u ti ng vang. Vì th , ư c lư ng ñúng c a a chính là biên dư i c a các giá
  13. 11 tr nh n ñư c, giá tr biên dư i này ch xu t hi n khi ti ng nói ng ng ñ t ng t, khi ñó mô hình [11] m i có ý nghĩa. Tuy nhiên, ngay c khi ch ư c lư ng trong các khung th i gian ch có nhi u ti ng vang, giá tr ư c lư ng ñư c v n có khuynh hư ng bé hơn giá tr ñúng th c s , do cách ư c lư ng này d a trên mô hình th ng kê. M t phương pháp hi u qu hơn là ch n m t giá tr a ngư ng a*, là ư c lư ng ñúng c a a, sao cho ph n di n tích dư i ñư ng cong m t ñ xác su t c a a-p(a*) tính t a* ñ n -∞ ñ t giá tr cho trư c. Có th th c hi n ñi u này d a vào bi u th c sau:  ( )  x a = arg  P (x ) = γ : P(x ) = ∫ p a∗ d a∗ (2.16)  0  Có th th y n u ch n γ ti n ñ n 0, a=min(ak*) T phân tích trên, N ñóng vai trò quan tr ng trong vi c ư c lư ng ñư c giá tr ñúng c a a. Giá tr N bé s tăng giá tr c a ư c lư ng. Trong th c t , dù c n có N l n, nhưng N l i b gi i h n b i ñ dài c a kh ang l ng gi a các ño n có ti ng nói. N u ñ dài c a kh ang l ng bé, khung th i gian có N quá l n s l n vào ño n có ti ng nói k ti p d n ñ n ư c lư ng sai. Nên N c n l n hơn ít nh t ½τ hay 1/3τ, còn gi i h n trên c a N ph thu c vào chi u dài trung bình c a kh ang l ng trong tín hi u ti ng nói s ch. Sau khi ñã tìm ñư c b giá tr ư c lư ng c a a và ư c lư ng ñư c giá tr ñúng c a a, xây d ng m t n như sau. V i ak*>>a* xem ñó không ph i do nhi u ti ng vang và giá tr m t n t i ñó b ng 1, ngư c l i n u ak* sai khác a* trong m t kh ang cho phép, coi ph n tín hi u ch y u do nhi u ti ng vang và cho giá tr m t n b ng 0. Giá tr m t n t i v trí i d i t n nào ñó ñư c xác ñ nh.
  14. 12 2.4.4. Xây d ng m t n Ph n tín hi u ngõ ra ch y u do ti ng vang s b lo i b cách s d ng m t n nh phân. Trong th c t , ta th y r ng m t n nh phân t o nên nhi u nhân t o r t khó ch u trong các kh ang chuy n ti p. Đ gi i quy t v n ñ này, ta “ làm mư t “ m t n b ng b l c làm mư t trung bình. 2.4. K T LU N CHƯƠNG Chương này nghiên c u hai thu t toán gi m nhi u ti ng vang là tr ph và t o m t n . C 2 thu t toán này ñ u không yêu c u thông tin v ngu n và kênh truy n. Thu t toán tr ph lo i b thành ph n ph ti ng vang b ng cách tr giá tr trung bình ư c lư ng c a logarit c a ph t n s . Thu t toán t o m t n th c hi n vi c ư c lư ng h ng s th i gian c a nhi u ti ng vang các băng t n s khác nhau, r i xây d ng m t n lo i b ph n nhi u ti ng vang. Ta cũng ñã phân tích v lý thuy t cách ch n giá tr các tham s m i thu t toán ñ tín hi u sau x lý có ch t lư ng t t nh t. CHƯƠNG 3 - CÁC PHƯƠNG PHÁP ĐÁNH GIÁ CÁC THU T TOÁN 3.1. M Đ U CHƯƠNG chương 2 ta ñã phân tích các thu t toán ñ làm gi m nhi u ti ng vang c a tín hi u. Tuy nhiên làm cách nào ñ ñánh giá ñư c thu t toán nào là hi u qu nh t. Đ xác ñ nh ñư c ñi u này ta ph i xét ñ n các phương pháp ñánh giá ch t lư ng ti ng nói. Có hai phương pháp ñánh giá ch t lư ng ch y u là ñánh giá ch quan và ñánh giá khách quan. chương này ta s gi i thi u v các phương pháp ñánh giá ch t lư ng ti ng nói mà t p trung ch y u vào các phương pháp ñánh giá khách quan.
  15. 13 3.2. PHƯƠNG PHÁP ĐÁNH GIÁ CH QUAN Đánh giá ch quan là phương pháp ñánh giá ch t lư ng ti ng nói d a trên c m nh n ch quan c a ngư i nghe. ITU-T ñã chu n hóa h u h t các phương pháp chung cho vi c ño ch t lư ng ñánh giá ch quan c a vi c truy n tín hi u ti ng nói thông qua các h th ng thông tin âm thanh. M t cu c ki m tra nghe ñư c th c hi n b i m t s lư ng ngư i s nghe các ph n ghi âm, ñó là nh ng ño n ñã b suy gi m b i kênh truy n và nh ng ño n ñư c nâng cao ch t lư ng nh các thu t toán ñang ki m tra. Các ngư i ñánh giá s ñưa ra các ý ki n c a mình v ch t lư ng c a m i tín hi u s d ng thang ño ch t lư ng ti ng nói ñư c quy ñ nh. MOS là ñi m ñánh giá trung bình thông qua các ý ki n ch quan và ch ra ch t lư ng ñánh giá c a h th ng hay các thu t toán c n ki m tra. Có nhi u ch tiêu ñ ñánh giá ch t lư ng ti ng nói theo phương pháp ñánh giá ch quan. ñây ta t p trung vào các ch tiêu sau: Tín hi u ti ng nói riêng bi t ñư c ki m tra b ng cách s d ng thang ño 5 ñi m c a ñ méo tín hi u. Như b ng 3.1. Nhi u n n b ng cách s d ng thang ño 5 ñi m c a nhi u n n. Như b ng 3.2. 3.3. PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN V i vi c t o ra nhi u h th ng nâng cao ch t lư ng ti ng nói và h th ng trao ñ i âm thanh m t cách nhanh chóng, thì cũng c n có s phát tri n các phép ño ch t lư ng ti ng nói cái mà tương quan v i ch t lư ng ti ng nói ch quan. Trong su t quá trình thi t k và th c hi n các thu t toán, các b mã hóa gi i mã và các h th ng thông tin, ñánh giá ch t lư ng khách quan là công c ñánh giá có giá tr . Đánh giá ch t lư ng khách quan là phương pháp ñánh giá ch t lư ng d a trên các phép ño thu c tính c a tín hi u.
  16. 14 Thông thư ng, ñánh giá ch t lư ng khách quan có th ñư c phân chia trong 3 mi n: mi n th i gian, mi n ph và mi n giác quan. Mi n th i gian thư ng thích h p v i h th ng tương t ho c h th ng ñư c mã hóa d ng sóng trong ñó nơi nh n t o ra l i d ng sóng. Tuy nhiên, nó có th còn ñư c s d ng ñ xác ñ nh s c i thi n ch t lư ng ti ng nói. T s tín hiêu trên nhi u (SNR) và SNR trên t ng ño n tín hi u là các phép ño thông thư ng trong mi n th i gian. Các phép ño d a trên phép d ñoán tuy n tính trong mi n ph thư ng ñư c dùng nhi u hơn mi n th i gian và ít b nh hư ng b i các sai s v th i gian có th có gi a tín hi u ban ñ u và tín hi u nh n ñư c hay ñư c x lý. H u h t các phép ño trong mi n ph liên quan ñ n thi t k b mã hóa và gi i mã ti ng nói. Các phép ño trong mi n giác quan d a trên các m u h th ng thính giác c a con ngư i. Phép ño này có s tương quan v i ch t lư ng ch quan c a ti ng nói cao hơn khi so sánh v i các phép ño trong mi n th i gian hay mi n ph . Theo lý thuy t, các thông tin liên quan ñ n tri giác có kh năng và c n thi t cho s ñánh giá chính xác ch t lư ng ti ng nói. 3.3.1. Các phép ño trong mi n th i gian 3.3.1.1. Phép ño t s gi a tín hi u và ti ng vang trên t ng khung 3.3.1.2. Phép ño d a vào ñáp ng xung 3.3.2. Các phép ño trong mi n ph 3.3.2.1. Phép ño LLR 3.3.2.2. Phép ño IS 3.3.2.3. Phép ño CEP 3.3.3. Các phép ño trong mi n tri giác Các phép ñánh giá khách quang trên ñư c quan tâm vì chúng ñơn gi n ñ th c hi n và d dàng ñánh giá ñư c. Tuy nhiên, kh năng c a chúng trong vi c d ñoán sujbjective quality là có gi i h n, như chúng
  17. 15 không th th c hi n vi c x lý tín hi u bao g m các thi t b ngo i vi âm thanh. Do v y ñã có nhi u nghiên c u ñư c th c hi n ñ phát tri n phép ñánh giá khách quang d a trên các kh i human auditory speech preception. Do v y ñây ta s xét các phương pháp ño d a trên c m nh n c a con ngư i. 3.3.3.1. Phép ño WSS 3.3.3.2. Phép ño BSD 3.3.3.3. Phép ño PESQ 3.3.4. Phép ño k t h p 3.4. K T LU N CHƯƠNG Chương này ñã trình bày m t s phép ño ch t lư ng ti ng nói sau khi x lý gi m nhi u b ng các thu t toán x lý ti ng nói b ti ng vang mà t p trung ch y u các phép ño khách quan. Qua ñánh giá ta th y m i phép ño ch t lư ng ti ng nói khác nhau d a trên nh ng ch tiêu khác nhau v ch t lư ng ti ng nói. Trong các phép ño khách quan trên thì các phép ño trong mi n tri giác có h s tương quan cao nh t v i các phép ño ch quan. CHƯƠNG 4 – K T QU TH C NGHI M VÀ ĐÁNH GIÁ 4.1. M Đ U CHƯƠNG Đ ñánh giá hi u qu c a các thu t toán nâng cao ch t lư ng ti ng nói. chương này s th c hi n mô ph ng d a trên tín hi u âm thanh trư c và sau x lý ñ tìm ra k t qu t t nh t c a các thu t toán cũng như ki m tra ñ tin c y c a các phép ño khách quan. 4.2. CƠ S D LI U S D NG Đ ñánh giá hi u qu c a kĩ thu t này, cơ s d li u ñư c xây d ng g m các câu ti ng Vi t trích t VOA, có chi u dài trung bình là 8s, g m c gi ng nam và n . Đáp ng xung c a kênh truy n ñư c xây d ng t ñáp ng xung c a m t phòng, v i nh ng kh ang cách ghi âm
  18. 16 khác nhau [0.1 0.25 0.5 0.75 1 1.5 3 4] m, chi u dài ñáp ng xung trung bình kho ng 0.3s. Tín hi u ti ng nói b nhi u ti ng vang có ñư c b ng cách nhân ch p tín hi u s ch v i ñáp ng xung trên. 4.3. KI M TRA Đ TIN C Y C A CÁC PHÉP ĐO KHÁCH QUAN Các phép ño ch t lư ng ti ng nói khách quan ñã trình bày chương 3 thư ng ñư c s d ng trong các ng d ng nâng cao ch t lư ng ti ng nói tuy nhiên ta v n chưa xác ñ nh ñư c nó có th ñánh giá t t ch t lư ng ti ng nói trong môi trư ng b nhi u ti ng vang hay không. Đ ki m tra ñ tin c y c a các phép ño này ñ i v i tín hi u trong môi trư ng b nhi u ti ng vang, ta ti n hành phép ño ch t lư ng c a tín hi u b nhi u ti ng vang so v i tín hi u s ch theo các phương pháp ñánh giá trên. Các m u ti ng nói ñư c th c hi n t i t n s l y m u là f=8000. 4.3.1. Các phép ño trong mi n th i gian - Phép ño t s tín hi u trên ti ng vang (SRR) - Phép ño t s tín hi u trên ti ng vang (trên m i ño n: SEG_SRR) Nh n xét: Theo các hình 4.1 và hình 4.2 nh n th y, phép ño SEG_SRR cho k t qu chính xác hơn, b i vì tín hi u gi m d n theo kho ng cách t ngu n ñ n nơi thu, ñi u này ph n ánh ñúng ch t lư ng ti ng nói b nhi u ti ng vang. Phép ño này có ñ tin c y t t tuy nhiên ñ n ñ nh theo các tín hi u khác nhau v n còn khá l n nh t là trong d i băng t n h p. Có th dùng phép ño SEG_SRR ñ ño ch t lư ng ti ng nói sau x lý nhi u ti ng vang. Còn phép ño SRR không ph n ánh ñúng b n ch t c a tín hi u b nhi u ti ng vang nh t là kho ng cách g n nên không dùng ñ ño ch t lư ng ti ng nói sau x lý nhi u ti ng vang. 4.3.2. Các phép ño trong mi n ph
  19. 17 - Phép ño CEP - Phép ño IS - Phép ño LLR Nh n xét: Theo các hình 4.3, hình 4.4 và hình 4.5 nh n th y các phép ño trong mi n ph có ñ tin c y không cao trong môi trư ng b nhi u ti ng vang. Nh t là phép ño IS, phép ño h u như không ñánh giá ñư c ch t lư ng tín hi u b nhi u ti ng vang, ñ c bi t là kho ng cách 100-150cm. Các phép ño CEP và LLR có ñánh giá ñư c ch t lư ng tín hi u b ti ng vang nhưng ñ n ñ nh kém, phép ño CEP cho k t qu chính xác hơn, nên không th dùng ñ ñánh giá tín hi u b nhi u ti ng vang. 4.3.3. Các phép ño trong mi n tri giác - Phép ño WSS - Phép ño PESQ Nh n xét: Theo hình 4.5 và hình 4.7 ta th y các phép ño trong mi n tri giác ñánh giá ch t lư ng ti ng nói r t t t ph n ánh ñúng ch t lư ng c a ti ng nói b nhi u ti ng vang. Đ n ñ nh c a phương pháp theo kho ng cách cũng như theo các tín hi u r t t t. Như v y ñ tin c y c a các phép toán này t t nh t trong môi trư ng b nhi u ti ng vang, nên dùng ñ ñánh giá tín hi u b nhi u ti ng vang. 4.4. THU T TOÁN TR PH Các tín hi u ti ng nói b nhi u ti ng vang ñư c x lý qua thu t toán tr ph , sau ñó ki m tra ch t lư ng c a ti ng nói sau khi x lý b ng các phép ño ñã ñư c ki m tra, so sánh ch t lư ng ti ng nói trư c và sau x lý. 4.4.1. D ng sóng và ph c a tín hi u Nh n xét:
  20. 18 Sau khi nghe các ño n âm thanh và th c hi n quan sát d ng sóng, ph c a tín hi u s ch như hình 4.8, d ng sóng và ph c a tín hi u b nhi u ti ng vang như hình 4.9 và d ng sóng, ph tín hi u sau khi x lý b ng thu t toán tr ph như hình 4.10, nh n th y: Tín hi u sau khi x lý b ng thu t toán tr ph có r t nhi u thành ph n nhi u nhân t o. Ch t lư ng không nh ng không ñư c c i thi n mà còn t hơn khi chưa x lý. Ch t lư ng không nh ng không ñư c c i thi n mà còn t hơn khi chưa x lý. 4.4.2. D ng sóng và ph c a tín hi u sau x lý post processing Nh n xét: Sau khi nghe các ño n âm thanh và quan sát các d ng sóng và ph c a tín hi u ñã x lý b ng thu t toán tr ph có thêm ph n x lý post processing hình 4.11 nh n th y, ch t lư ng tín hi u khi có x lý post processing ñư c c i thi n ñáng k so v i khi không có x lý post processing. Nhi u nhân t o ñã ñư c gi m ñáng k tuy nhiên v n còn t n t i. 4.4.3. Thay ñ i thông s c a thu t toán Trong quá trình nghiên c u và tri n khai thu t toán tác gi nh n th y thông s chi u dài c a s nh hư ng l n ñ n hi u qu thu t toán: Khi thay ñ i chi u dài c a s v i các giá tr khác nhau N=0.064, 0.256 ,1.024...Sau khi tín hi u ñư c ñánh giá b i các phép ñánh giá, nh n th y khi chi u dài c a s thay ñ i thì ch t lư ng c a tín hi u cũng thay ñ i theo. C th giá tr N=0.064 và N=0.256 cho ra k t qu g n như nhau. Đ i v i các phép ño mi n th i gian và mi n ph thì N=0.256 cho k t qu t t nh t. Còn v i các phép ño trong mi n tri giác thì N=0.064 cho ra k t qu t t nh t. - Nhìn chung giá tr N=0.064 cho ra k t qu t t hơn. 4.4.4. Đánh giá thu t toán tr ph
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2