intTypePromotion=3

Bài giảng Xử lý tiếng nói - Trịnh Văn Loan (ĐH Bách khoa Hà Nội)

Chia sẻ: Minh Vũ | Ngày: | Loại File: PDF | Số trang:30

0
65
lượt xem
22
download

Bài giảng Xử lý tiếng nói - Trịnh Văn Loan (ĐH Bách khoa Hà Nội)

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

 Bài giảng Xử lý tiếng nói do Trịnh Văn Loan biên soạn cung cấp cho người học các kiến thức: Một số khái niệm cơ bản, xử lý tín hiệu tiếng nói,  mã hóa tiếng nói, tổng hợp tiếng nói, nhận dạng tiếng nói. Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Xử lý tiếng nói - Trịnh Văn Loan (ĐH Bách khoa Hà Nội)

  1. Tài liệu tham khảo „ La parole et son traitement automatique Calliope, Masson, 1989 „ Traitement de la parole Rene Boite et Murat Kunt, Presse Polytechnique Romandes, 1987 XỬ LÝ TIẾNG NÓI „ Fundamentals of Speech Signal Processing Saito S., Nakata K. , Academic Press, 1985 „ Digital Processing of Speech Signals Trị Trịnh Văn Loan Lawrence R. Rabiner, Ronald W. Schafer, Prentice- Prentice-Hall .1978 „ Discrete- Discrete-Time Processing of Speech Signals Bộ môn Kỹ Kỹ thuậ thuật Má Máy tí tính John R. Deller, John G. Proakis, Hansen John H. L. 1999 Khoa CNTT, ĐHBK HàHà Nội „ Tiế Tiếng Việ Nguyễ Việt hiệ Nguyễn Hữ hiện đạ Hữu Quỳ đại (Ngữ (Ngữ âm, ngữ Quỳnh, Hà ngữ phá Hà Nội, 1994 pháp, phong cá cách) „ Dẫn luậ luận Ngôn ngữ ngữ học Nguyễ Nguyễn Thiệ Thiện Giá Giáp, Đoà Đoàn Thiệ Thiện Thuậ Thuật , Nguyễ Nguyễn Minh Thuyế Thuyết, Hà Hà Nội, 1994 „ http://dce.hut.edu.vn 1 2 Nội dung 1. Một số khái niệm cơ bản 1. Mộ Một số số khá khái niệ niệm cơ bảbản „ Xử lý thông tin chứ chứa trong tí tín hiệ hiệu tiế tiếng nó nói nhằ nhằm truyề truyền, lưu trữ trữ tín hiệ hiệu nànày hoặ hoặc tổ tổng 2. Xử Xử lý tí tín hiệ hiệu tiế tiếng nó nói hợp, nhậ nhận dạ dạng tiế tiếng nónói. 3. Mã hoá hoá tiế tiếng nónói 4. Tổ Tổng hợ hợp tiế tiếng nónói „ Các nghiên cứcứu đượ được tiế tiến hà hành để để xử lý 5. Nhậ Nhận dạ dạng tiếtiếng nó nói tiế tiếng nó nói yêu cầ cầu nhữ những hiể hiểu biế biết trên nhiề nhiều lĩnh vự ự c ngà v ng c à y cà à ng đa dạ dạ ng: từ ừ ngữ t ng ữ âm và và ngôn ngữ ngữ học cho đế đến xử xử lý tí tín hiệ hiệu... 3 4 1
  2. Mục đích Một số khái niệm cơ bản „ Mã hoá hoá một cá cách cócó hiệ hiệu quảquả tín hiệ hiệu „ Phân biệ biệt tiế tiếng nó nói và và âm thanh tiế tiếng nó nói để để truyề truyền vàvà lưu trữ trữ tiế tiếng nónói. Tiế Tiếng nó nói đượ được phân biệbiệt vớ với cá các âm „ Tổng hợhợp và nhậnhận dạ dạng tiế tiếng nónói tiế tiến thanh khá khác bở bởi cá các đặ đặc tí tính âm họhọc có có tới giao tiế tiếp ngườ người-máy bằ bằng tiếtiếng nónói. nguồ nguồn gố gốc từ chế tạo tiế từ cơ chế tiếng nó nói. „ Tất cả cả các ứng dụ dụng củ của xửxử lý tiế tiếng „ Có 2 loạ loại nguồ nguồn âm nói đề đều cầ cần phả phải dựdựa trên cácác kếkết quả quả – tuầ tuần hoà hoàn (dây thanh rung) của phân tí tích tiế tiếng nó nói – tạp âm (dây thanh không rung) 5 6 Bộ máy phát âm Bộ máy phát âm 7 8 2
  3. Bộ máy phát âm Sơ đồ khối bộ máy phát âm NASAL CAVITY: Khoang mũi SOFT PALATE: Vòm miệng mềm EPIGLOTTIS: Nắp thanh quản VOCAL FOLDS (CORDS): Dây thanh OESOPHAGUS: Thực quản TRACHEA: Khí quản PHARYNX: Họng 9 10 1. Mét sè sè kh¸ kh¸i niÖ niÖm c¬ c¬ b¶n Thanh môn Thanh môn „ Ở các vị vị trí trí hít, thở thở,phá ,phát âm, nó nói thì thì thà thào Thanh môn Dây thanh A. Glotte pendant la respiration B. Glotte pour la phonation 1. Glotte 2. Cordes vocales 3. Epiglotte 5. Cartilages aryténoïdes 11 12 3
  4. Dây thanh trong một chu kỳ Biểu diễn tín hiệu tiếng nói dao động „ Dạng só sóng theo thờ thời gian 13 14 File WAV Biểu diễn tín hiệu tiếng nói „ Tần số số lấy mẫ mẫu: 8kHz, F1= 11025 Hz, „ Phổ Phổ tín hiệ hiệu tiế tiếng nó nói 2F1, 4F1 (16kHz, 10kHz) „ Số bit/mẫ bit/mẫu: 8,16 „ Mono, Stereo 15 16 4
  5. Biểu diễn tín hiệu tiếng nói Biểu diễn tín hiệu tiếng nói „ Spectrogram (Sonagram) 17 18 Biểu diễn tín hiệu tiếng nói Biểu diễn tín hiệu tiếng nói „ Thu bằ bằng micro khá khác loạ loại 19 20 5
  6. Biểu diễn tín hiệu tiếng nói Biểu diễn tín hiệu tiếng nói „ Hai giọ giọng khá khác nhau cho cù cùng mộ một âm „ Cùng ngườ người nó nói, cù cùng mộ một âm 21 22 Năng lượ lượng, tỷ tỷ lệ biế biến thiên qua giá giá trị trị không Tạo âm hữu thanh 0.4 file:C:\wav\1-6-5-8-10-0.wav, ss,es:1, 43029, window length, shift (samples):160, 40, wtype:1 Formant và antiformant 0.2 amplitude 0 -0.2 -0.4 Signal -0.6 0 0.5 1 1.5 2 2.5 3 3.5 En short-time energy 4 3 2 1 0.5 1 1.5 2 2.5 3 3.5 short-time magnitude 15 Mn 10 5 0.5 1 1.5 2 2.5 3 3.5 80 zero crossing rate ZC 60 40 20 23 24 0 0.5 1 1.5 2 2.5 3 3.5 time in seconds 6
  7. Một số đặc điểm ngữ âm Tạo âm vô thanh tiếng Việt „ Đơn âm tiế tiết „ Có thanh điệ điệu (6), biế biến đổ đổi thanh điệ điệu kèm theo biế biến đổ đổi nghĩ nghĩa „ Không biế biến đổđổi hì hình thá thái 25 26 Một số đặc điểm ngữ âm Một số đặc điểm ngữ âm tiếng Việt tiếng Việt „ Hệ thố thống âm vị vị: 14 nguyên âm (11 „ Hệ thố thống âm vị vị: 22 phụ phụ âm nguyên âm đơn, đơn, 3 nguyên âm đôi, đôi, 22 phụ phụ âm) 1 b bồng bề bềnh 12 tr trồ trồng 1 i,y ý chí chí 2 p ốp ép 13 s sinh viên 2 ê ê chề chề 3 v vẩn vơ 14 r rừng 3 e e dè dè 1 ia,yê,ya,iê kia kì kìa, yêu (đọc ia, yê) kiề kiều, khuya, tiên 4 ph phôi pha 15 ch chông 4 a a ha tiế tiến 5 m mơ mà màng 16 nh nhọ nhọc 5 ă mắt 2 ua,uô tua rua, luôn 6 đ đất đai 17 ng,ngh ngô nghê 6 ơ bơ phờ phờ (đọc ua) 7 t tin tưở tưởng 18 c,k,q con,kẹ con,kẹt,qua 7 â ân cầ cần 3 ưa, ưa,ươ lưa thưa, thưa, 8 th thơ thẩ thẩn 19 kh khú khúc 8 ư từ từ (đọc ưa) ưa) lượ lượt 9 d,gi duyên, giữ giữ 20 g,gh gồ ghề ghề 9 ô ôtô 10 o co ro 10 n nóng 21 h hả hê 27 28 11 u lù mù 11 l long lanh 22 x xa xôi 7
  8. Một số đặc điểm ngữ âm Một số đặc điểm ngữ âm tiếng Việt tiếng Việt „ Phân loạ loại nguyên âm theo độ độ nâng „ Phân loạ loại nguyên âm theo độ độ mở của của lưỡ lưỡi và và chuyể chuyển độ động củ của lưỡ lưỡi miệ miệng và và chuyể chuyển độ động củ của lưỡ lưỡi Hàng hàng sau không hàng sau Độ nâng hàng trướ trước cao trung bì bình thấ thấp Độ mở tròn môi tròn môi Hàng hẹp i ia,yê,ya,iê ư ưa u ua trướ trước i e e hơi hẹ hẹp ê ơ â ô giữ giữa ư ơ â a ă hơi rộ rộng e o sau u ô o rộng a ă 29 30 Một số đặc điểm ngữ âm Một số đặc điểm ngữ âm tiếng Việt tiếng Việt Âm tắ tắc: tiế tiếng nổ nổ, phá phát sinh do luồ luồng khíkhí từ phổphổi đi ra bị bị cản trở trở hoà hoàn Phân loạ loại phụ phụ âm theo tắ tắc hay xá xát, „ „ toà toàn, phả phải phá phá vỡ sự cản trở trở đó đó để để thoá thoát ra. Âm xá xát: tiế tiếng cọ cọ xát, phá phát sinh do luồ luồng không khí khí đi ra bị bị cản trở trở hữu thanh hay vô thanh, mũ mũi hó hóa „ không hoà hoàn toà toàn (chỉ (chỉ bị khó khó khăn), khăn), phảphải lálách qua mộ một khe hở hở nhỏ nhỏ và trong khi thoá thoát ra như vậ vậy phả phải cọcọ xát vàvào thàthành củ của bộ bộ máy phá phát Vị trí cấu âm Đầu lưỡi âm. Môi Răng Vòm miệng Mặt lưỡi Cuối lưỡi Họng „ Phụ Phụ âm bên: bên: đầu lưỡ lưỡi tiế tiếp xúxúc vớvới lợ lợi chặ chặn lố lối thoá thoát củ của không khí khí, Phương thức cấu âm buộ buộc nó nó phả phải lálách qua khe hở hở ở hai bên cạ cạnh lưỡlưỡi tiế tiếp giá giáp vớ với má má Bật hơi th mà ra ngoà ngoài tạ tạo nên tiế tiếng xá xát nhẹ nhẹ (l). Vô „ Luồ Luồng không khí khí thoá thoát ra ngoà ngoài bị bị cản trở trở, tạtạo nên tiế tiếng xáxát hay tiế tiếng thanh p t tr ch c,k,qu Ồn Không bật nổ, dạ dạng títín hiệ hiệu không tuầ tuần hoà hoàn gọ gọi là là tiế tiếng độ động (ồ (ồn). Tắc hơi Hữu „ Trong khi phá ph á t âm mộộ t m s phsốố phụ ụ âm, dây thanh cũ c ũng hoạạ ho đt độộ ng đồ đ ng ồ thanh b đ thờ thời tạ tạo nên tiế tiếng thanh. „ Phụ Phụ âm có có tỉ lệ tiế tiếng độđộng lớ lớn hơn gọ gọi là là phụ phụ âm ồn. Vang mũi m n nh ng,ngh „ Phụ Phụ âm có có tỉ lệ tiế tiếng thanh lớ lớn hơn gọ gọi là là phụ phụ âm vang. Vô thanh ph x s kh h Ồn Xát Hữu thanh v d,gi r g Vang bên l 31 32 8
  9. Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt phê bé trị tìm tám đánh vẽ chè 33 34 Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt CHUR.WAV, Fs = 11025Hz, 5669 samples, Time = 514ms 0.5 0.4 0.3 0.2 0.1 kệ lạ Amplitude 0 -0.1 -0.2 -0.3 -0.4 -0.5 0 50 100 150 200 250 300 350 400 450 500 Time in ms khả 35 36 9
  10. Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt DDEER.WAV, Fs = 11025Hz, 5278 samples, Time = 479ms 0.4 KHAR.WAV, Fs = 11025Hz, 7718 samples, Time = 700ms 0.3 0.4 0.2 0.2 0.1 0 Amplitude Amplitude 0 -0.2 -0.1 -0.4 -0.2 -0.6 -0.3 -0.4 -0.8 0 100 200 300 400 500 600 Time in ms 0 50 100 150 200 250 300 350 400 450 37 38 Time in ms Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt XOA.WAV, Fs = 11025Hz, 7690 samples, Time = 697ms 0.6 N G H IR .W A V , F s = 1 1 0 2 5 H z , 6 7 0 7 s a m p le s , T im e = 6 0 8 m s 0 .3 0.4 0 .2 0.2 0 .1 Amplitude 0 0 Amplitude -0 .1 -0.2 -0 .2 -0.4 -0 .3 0 1 0 0 2 0 0 30 0 4 0 0 5 0 0 6 0 0 T im e in m s -0.6 -0.8 39 0 100 200 300 400 500 600 40 Time in ms 10
  11. Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt MEJ.WAV, Fs = 11025Hz, 4922 samples, Time = 446ms P H A I R . W A V , F s = 1 1 0 2 5 H z , 6 9 3 4 s a m p le s , T im e = 6 2 9 m s 0.2 0.6 0.15 0.4 0.1 0.2 0.05 Amplitude Amplitude 0 0 -0 . 2 -0.05 -0 . 4 -0.1 -0.15 -0 . 6 0 100 200 300 400 500 600 -0.2 T im e in m s 41 42 0 50 100 150 200 250 300 350 400 Time in ms Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt BUF.WAV, Fs = 11025Hz, 6779 samples, Time = 615ms TAMS.WAV, Fs = 11025Hz, 4989 samples, Time = 452ms 0.6 0.4 0.3 0.4 0.2 0.1 0.2 0 Amplitude Amplitude -0.1 0 -0.2 -0.3 -0.2 -0.4 -0.5 -0.4 -0.6 43 0 50 100 150 200 250 300 350 400 450 44 -0.6 Time in ms 0 100 200 300 400 500 600 Time in ms 11
  12. Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt GIAF.WAV, Fs = 11025Hz, 8772 samples, Time = 796ms VIF.WAV, Fs = 11025Hz, 9872 samples, Time = 895ms 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 Amplitude Amplitude 0 -0.1 -0.2 -0.1 -0.3 -0.4 -0.2 -0.5 -0.3 45 46 0 100 200 300 400 500 600 700 800 0 100 200 300 400 500 600 700 Time in ms Time in ms Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt KHOONG.WAV, Fs = 11025Hz, 6743 samples, Time = 612ms NHAAN.WAV, Fs = 11025Hz, 5713 samples, Time = 518ms 0.4 0.6 0.2 0.4 0 0.2 Amplitude Amplitude -0.2 0 -0.4 -0.2 -0.6 -0.4 47 48 0 50 100 150 200 250 300 350 400 450 500 0 100 200 300 400 500 600 Time in ms Time in ms 12
  13. Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt TRIJ.WAV, Fs = 11025Hz, 4108 samples, Time = 373ms LAJ.WAV, Fs = 11025Hz, 5442 samples, Time = 494ms 0.4 0.4 0.3 0.2 0.2 0.1 0 Amplitude Amplitude 0 -0.2 -0.1 -0.4 -0.2 -0.6 -0.3 0 50 100 150 200 250 300 350 0 50 100 150 200 250 300 350 400 450 49 Time in ms 50 Time in ms Dạng sóng một số từ tiếng Việt Dạng sóng một số từ tiếng Việt TIMF.WAV, Fs = 11025Hz, 5589 samples, Time = 507ms SOOS.WAV, Fs = 11025Hz, 8888 samples, Time = 806ms 0.6 0.4 0.3 0.4 0.2 0.1 0.2 Amplitude 0 Amplitude 0 -0.1 -0.2 -0.2 -0.3 -0.4 -0.4 -0.5 51 52 0 100 200 300 400 500 600 700 800 0 50 100 150 200 250 300 350 400 450 500 Time in ms Time in ms 13
  14. Mô hình tạo tiếng nói Mô hình toàn điểm cực (AR) (Fant-1960) u(n) σ Lọc Lọcthông Tuyế Tuy ến âm TTải ải bứức xạ bbức ạ xxạ thấp thông Tuyến âm T( z ) = G ( z )V ( z )R ( z ) = T0 thấpG(z) G(z) V(z) V(z) R(z) R(z) x(n) A( z ) „ A(z): Hà Hàm truyề truyền đạ đạt củ của bộ bộ lọc đả đảo A R ( z ) = C(1 − z −1 ) G(z ) = σ 2K +1 p (1 + αz −1 )(1 + β z −1 ) T( z ) = A(z) = 1 + ∑az i −i A(z) = ∑ a i z − i a0 = 1 A( z ) i =1 i =0 B V(z ) = p x( n ) + ∑ a i x ( n − i ) = σ u ( n ) K ∏ (1 + b1k z −1 + b 2k z −2 ) k =1 i =1 P = 2K+1 53 54 Mô hình ARMA Dải thông Biên độ σ1 σ2 C( z ) q 1 T( z ) = + =σ C( z ) = ∑ c i z -i c0 = 1 A1 ( z ) A 2 ( z ) A( z ) i=0 1/ 2 Dải thông Bk p q x( n ) + ∑ a i x( n − i ) = σ ∑ c i u ( n − i ) i =1 i =0 Fk Tần số 55 56 14
  15. 2. Xử lý tín hiệu tiếng nói x(n) „ Phân tí tích phổ phổ Bộ lọc Cửa sổ FFT Log |.| hiệu chỉnh Hamming N – Bộ lọc hiệ hiệu chỉ chỉnh H(z) = 1 – az-1, a = 0,95..0,98 57 58 frame 0 Xử lý đồng hình (homomorphic) Sơ đồ khối xử lý đồng hình „ s(n)=h(n)*e(n) S(ω S(ω) = H(ωH(ω).E(ω ).E(ω) „ log[S(ω log[S( ω)]= log[H(ω log[H( ω )]+ log[E(ω)] log[E(ω - 1 {log[S(ω)]} = F {log[H(ω F {log[S(ω - 1 {log[H(ω)]} + F-1{log[E(ω {log[E(ω)]} Bộ lọc Cửa sổ FFT Log |.| - 1 $ {log[S(ω)]} = s(n) F {log[S(ω hiệu chỉnh Hamming - 1 F {log[H(ω $ {log[H(ω)]} = h(n) - 1 $ {log[H(ω)]} = e(n) F {log[H(ω FFT-1 $ = h(n) s(n) $ $ + e(n) $ s(n) 59 60 15
  16. Tiên đoán tuyến tính (Linear Ví dụ Prediction Coding) c(n) „ Mô hì hình AR p x(n) + ∑ ai x(n − i) = σu(n) i=1 T0 T0 p Tiên đoá đoán x(n) ∑ $ = − a$ i x(n − i) i=1 Sai số số tiên đoá đoán $ e(n) = x(n) − x(n) Sai số E = ∑ e2 (n) số bình phương toà toàn phầ phần n Tối thiể thiểu hó hóa sai số số ∂E ) ∂a$ i = 0, i = 1,2,...,p h(n) 61 62 Xác định tần số cơ bản Một số phương pháp xác định Fo „ Giá Giá trị trị F0 phụ phụ thuộ thuộc và vào giớ giới tí tính và và „ Dựa và vào hà hàm tựtự tương quan lứa tuổ tuổi „ Dựa và vào hà hàm vi sai biên độ độ trung bì bình – Giọ Giọng nam: 80..250 Hz „ Dùng bộ bộ lọc đả đảo và và hàm tự tự tương – Giọ Giọng nữ nữ: 150..500 Hz quan Tiền Xác định Đánh giá „ Xử lý đồ đồng hì hình Tín hiệu xử lý Fo kết quả tiếng nói 63 64 16
  17. Phương pháp tự tương quan có Dựa vào hàm tự tương quan cải tiến „ Tính hà hàm tự tự tương quan R(k) của tí tín hiệ hiệu tiế tiếng nó nói „ Hạn chế chế, loạ loại bỏ bỏ |x| < CL x(n) N −1− k R(k ) = ∑ n =0 x(n) x(n + k ) k = 0,1,..., K Fs = 10 kHz, N = 300, K = 150.Tì 150.Tìm cự cực đạ đại trong khoả khoảng (0, K) 65 66 Dựa vào hàm vi sai biên độ trung Ví dụ bình (Average Magnitude Difference Function) N −1 D (k ) = ∑ x(n + m) − x(n + m − k ) k = 0,1,..., K 0.3 0.3 m=0 0.2 0.2 0.1 1/ 2 0.1 1 N −1 ⎡1 N −1 ⎤ x(n) 0 D(iP) = 0, i = 0,1,... N ∑ u (n) ≤ ⎢ N ∑ u (n) ⎥ x(n) 0 -0.1 2 -0.1 -0.2 -0.2 ⎣ n=0 ⎦ 700 750 800 850 900 950 1000 1050 1100 1150 700 750 800 850 900 n 950 1000 1050 1100 1150 n=0 0.015 0.015 n 0.01 1/2 ⎧ 1 N-1 ⎫ 0.01 D(k ) = λ ⎨ ∑ [ x(n + m) − x(n + m − k )]2 ⎬ 0.005 0.005 r(k) r(k) 0 0 -0.005 -0.005 ⎩ N m=0 ⎭ -0.01 0 -0.01 50 100 150 200 250 300 0 50 100 k 150 200 250 300 k 0.2 1/ 2 0.2 ⎧1 ⎫ 0.15 0.15 = λ ⎨ [2r (0) − 2r (k )]⎬ k = 0,1,..., K D(k) 0.1 D(k) 0.1 0.05 ⎩N ⎭ 0.05 0 00 50 100 150 200 250 300 víi λ < 1 0 50 100 k 150 200 250 300 k 67 68 17
  18. Dùng bộ lọc đảo (Simplified Inverse Xử lý đồng hình Filter Tracking) 10kHz Thông thấ thấp Thông thấp 1-z-1 W(n) W(n) LPC(p=4) LPC(p=4) 4700Hz 900Hz A(z) Hàm tự tương quan HT/VT Đánh giá kết quả Nội suy Tìm cực đại Fo 69 70 Xác định formant Xử lý đồng hình „ Tham số số cần xá xác đị định Tín hiệu – Formant Fk tiếng nói Bộ lọc Cửa sổ FFT – Dải thông Bk hiệu chỉnh „ Phương phá pháp – Xử lý đồ đồng hì hình Log10|.| FFT-1 FFT – LPC Wc(n) 71 72 18
  19. Xử lý đồng hình Phương pháp LPC Bộ lọc Cửa sổ Tính hệ hiệu chỉnh số ai s(n) Tính1/ |A(ejω)| Tìm Fk,Bk bằng FFT cực đại Quyết định Tính nghiệm của A(z) 73 74 Một số tính chất thống kê của 3. Mã hóa tiếng nói tín hiệu tiếng nói „ Dãy thao tá tác mã hoá hoá và giả giải m㠄 Mật độ độ xác suấ suất Nhiễu, suy giảm, Nξ : số lượ lượ ng mẫ mẫu x(n) sai số Lọc1 AD Mã có biên độ độ trong Lọc1 AD Mã hoá hoá khoả [ξ-∆ξ/2, khoảng [ξ ∆ξ/2, ξ+∆ξ/2] ∆ξ/2] Nhiễu, suy giảm, n ∈[-N,...,N ,...,N] sai số Giải x egodic và và dừng Giải mã mã DA DA Lọc2 Lọc2 px (ξ ) = lim [ Nξ /(2 N + 1)] N →∞ ∆ξ → 0 75 76 19
  20. Giá trị trung bình và phương sai Lượng tử tức thời (không nhớ) „ Giá Giá trị trị trung bìbình củ của tí tín hiệ hiệu dừ dừng „ Luậ Luật lượ lượng tử tử y = Q(x) Q(x) đượ được đị định nghĩ nghĩa: ∞ – (L+1) mứ mức tí tín hiệ hiệu x(0), x(1), ..., x(L) 1 N µ x = ∫ ξ px (ξ ) d ξ = lim ∑ x ( n) – L mứ mức lượ lượng tử tử hoá hoá N →∞ 2 N + 1 „ Mỗi mứ mức lượ lượng tử tử hoá hoá biể biểu diễ diễn bằbằng từ từ b bit −∞ n =− N L = 2b. với tí tín hiệ hiệu tiế nói µx = 0 tiếng nó „ Sai số số lượ lượng tử tử (tạ (tạp âm lượ lượng tử tử) e = Q(x) - x „ Bướ Bước lượ lượng tử tử : hiệ hiệu 2 mứ mức tí tín hiệ hiệu kề kề nhau „ Phương sai δ(i) = x(i) x(i)--x(i- x(i-1) ∞ 1 N Thông lượ lượng I = bFs (bit/s). Fs : tầtần số số lấy mẫ mẫu ∑ „ σ = ∫ ξ px (ξ ) d ξ = lim 2 2 x 2 (n) N →∞ 2 N + 1 x −∞ n =− N 77 78 Thông lượng Thông lượng „ Tín hiệ hiệu lượ lượng tử tử 8 bit (256 mứ mức), Fs = 8 Tần số số lấy Số bit cho Thông Dung lượ lượng / Lĩnh vự vực kHz → Thông lượ lượng = 64 kbit/s mẫu (kHz) 1 mẫ mẫu luợ luợng kbit/s phú phút (kbyte) 48 16 768 11520 Ghi âm chuyên „ Tín hiệ hiệu lượ lượng tử tử 16 bit (65536 mứ mức), nghiệ nghiệp Fs = 16 kHz → Thông lượ lượng = 256 kbit/s , 44,1 16 705,6 10584 CD Audio 1 giờ giờ tiế tiếng nó nói ~100 ~100 Mbyte 32 16 512 7680 Radio FM „ Cần phả phải mã hoá hoá tín hiệ hiệu tiế tiếng nó nói (MPEG, 22 12 264 3960 Radio AM GSM, G723, ...) để truyề truyền tiế tiếng nó nói trên mạ mạng hoặ hoặc lưu trữ trữ 8 8 64 960 Điệ Điện thoạ thoại 79 80 20

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản