intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

tài liệu tham khảo đa truyền thông phần 4

Chia sẻ: Thái Duy Ái Ngọc | Ngày: | Loại File: PDF | Số trang:10

108
lượt xem
32
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tham khảo tài liệu 'tài liệu tham khảo đa truyền thông phần 4', công nghệ thông tin, đồ họa - thiết kế - flash phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả

Chủ đề:
Lưu

Nội dung Text: tài liệu tham khảo đa truyền thông phần 4

  1. MÃ HOÁ AUDIO C M QUAN MÃ QUAN • C u trúc d ng cây ñơn phân gi i H020(ejω) ↓2 x(n) H01(ejω) ↓2 H120(ejω) ↓2 H021(ejω) ↓2 H11(ejω) ↓2 H121(ejω) ↓2 MÃ HOÁ AUDIO C M QUAN QUAN • C u trúc d ng cây ña phân gi i – C u trúc này cho ta lư ng bit ngõ ra t i ưu và phù thu c vào s phân b ph c a tín hi u. H020(ejω) ↓2 x(n) H01(ejω) ↓2 H120(ejω) ↓2 H11(ejω) ↓2
  2. MÃ HOÁ AUDIO C M QUAN MÃ QUAN • Các phương pháp mã hoá chuy n ñ i – FFT (Fast Fourier Transform) – DFT (Discrete Fourier Transform) – DCT (Discrete Cosine Transform) – MDCT (Modified DCT) – Wavelets. MÃ HOÁ AUDIO C M QUAN QUAN • DCT (Discrete Cosine Transform) DCT là phép bi n ñ i tr c giao, m t thu t toán hi u qu , cho các ñ c tính nén m nh và gi m ñ tương quan. π (2n + 1)k N −1 X (k ) = ∑ ∆(n) x(n) cos Chuy n ñ i DCT thu n: k = 0,..N − 1 , 2N n =0  1 , n = 0;   N ∆ ( n) =   2 ,0 < n ≤ N − 1 N  Chuy n ñ i DCT ngư c π (2n + 1)k N −1 x(n) = ∑ ∆(n) X (k ) cos n = 0,.., N − 1 , 2N k =0  1 , n = 0;   N ∆ ( n) =   2 ,0 < n ≤ N − 1 N 
  3. MÃ HOÁ AUDIO C M QUAN MÃ QUAN • MDCT (Modified DCT): DCT ñư c hi u ch nh. MDCT là phép bi n ñ i tr c giao tuy n tính ñư c hi u ch nh t DCT. MDCT thu n: π N −1  N N X (k ) = ∑ p (n) x(n)cos  (2n + 1 + )(2k + 1)  ; n = 0,.., N − 1; k = 0,.., − 1.   2N 2 2 n =0 Và chuy n ñ i MDCT ngư c (IMDCT): N −1 π  4 2 N N ∑ p(n) X (k ) cos  2 N (2n + 1 + 2 )(2k + 1), x ( n) = n = 0,.., N − 1; k = 0,.., − 1.   2 N k =0 πx V i p(x) là hàm c a s sin ñư c xác ñ nh: p ( x) = sin( ) N • Wavelets Wavelets có th ñư c xem như m t b phân tích băng con, v i cây không cân b ng, nghĩa là các t n s ñư c chia m t cách không ñ ng nh t. V y, băng l c tương ñ ng v i d i t i h n. MÃ HOÁ AUDIO C M QUAN QUAN • DWT (Discrete Wavelet Transform) M r ng và d ch chuy n “hàm m ” h(t) b ng cách ñ nh nghĩa m t cơ s tr c giao, wavelet cơ s : ( ) hn.m (t ) = 2− m / 2 h 2− m t − n Trong ñó: n là t l , m là ñ d i và t là th i gian. H s t l n ch th ñ r ng c a các wavelet và h s v trí m xác ñ nh v trí c a nó. V i hàm m h(t), ta ñư c m t t p hàm wavelet tr c giao cơ s . Tr c giao: f(t), g(t) là hai vector thu c không gian L2(a,b). t∈[a,b]. Hai vector g i là tr c giao khi tích vô hư ng c a chúng b ng 0. b < f (t ), g (t ) >= ∫ f (t ) g * (t ) dt = 0 a
  4. MÃ HOÁ AUDIO C M QUAN MÃ QUAN • Cơ s tr c giao: T p các vector {vk}={v1,v2, …,vn} ñư c g i là cơ s tr c giao n u chúng tr c giao t ng ñôi m t và có ñ dài b ng 1. b =δmn. Hay: ∫ h (t ) h * (t ) dt = δ kl . k l a 1, k = l •Hàm delta: δ kl =  0, k ≠ l Chuy n ñ i Wavelet: X ω (n, m) = cn ,m = ∑ x(t )hn ,m * Chuy n ñ i wavelet ngư c: +∞ +∞ x(t ) = ∑∑ cn.m hn ,m (t ) −∞ −∞ PHÂN TÍCH TÂM LÝ ÂM H C • H th ng thính giác c a con ngư i – ðư c chú tr ng khai thác trong mã hoá audio c m quan. – Con ngư i có th nghe trong d i 20Hz ñ n 20kHz v i kh năng nghe không ñ ng nh t v i các t n s trong d i này. Vi c c m nh n còn ph thu c vào m c áp l c và tuỳ thu c vào t ng ngư i. – D i 20Hz÷20kHz ñư c chia thành các d i con không ñ ng nh t và không tuy n tính. C m nh n t t trong kho ng 2kHz ñ n 4kHz và ngư ng nghe ñ n ngư ng ñau kho ng 96dB. – Ph thu c vào môi trư ng nghe, v i môi trư ng nhi u l n thì h n ch kh năng nghe và kh năng phân bi t các âm thanh khác nhau. – V y, phân tích tâm lý nghe là xét các v n ñ : • ð nh y c a tai, kh năng ñáp ng c a các cư ng ñ khác nhau. • ðáp ng c a tai v i các t n s khác nhau. • Nghe m t âm khi có m t m t âm khác.
  5. PHÂN TÍCH TÂM LÝ ÂM H C PHÂN • Ngư ng nghe tuy t ñ i ATH (Absolute Theshold of Hearing) – Thí nghi m:ð t m t ngư i trong phòng kín, im l ng, phát âm ki m tra (test tone) v i t n s xác ñ nh (1kHz), tăng m c âm thanh cho ñ n khi có th nghe ñư c, ghi l i các giá tr và l p l i v i t n s khác. – V ñ th , ta ñư c ngư ng nghe tuy t ñ i. Th v i ngư i khác, ghi k t qu . PHÂN TÍCH TÂM LÝ ÂM H C • D i t i h n (critical bankwidth) – Fletcher ti n hành các th nghi m và cho th y vi c nghe c a con ngư i gi ng như s d ng các b l c tâm sinh lý có ñ r ng g n b ng m t giá tr t i h n và Flecher g i ñ r ng c a b l c t i h n là d i t i h n. – D i t i h n bi u di n công su t xác ñ nh c a tai cho cho các t n s hay d i t n s liên t c. – Các thí nghi m cho th y r ng: • V i các t n s che nh hơn 500Hz thì d i t i h n không ñ i v i ñ r ng kho ng 100Hz. • V i các t n s che l n hơn 500Hz thì d i t i h n có ñ r ng tăng tương ñ i tuy n tính theo t n s . – V y, thang t n s không tuy n tính thang bark (Barkhausen)
  6. PHÂN TÍCH TÂM LÝ ÂM H C PHÂN • D i t i h n (critical bankwidth) – Flecher chia băng thông âm thanh thành 25 d i t i h n. Di T n s th p Ts trung tâm T n s cao Băng thông 1 - 50 100 - 2 100 150 200 100 .. .. .. .. .. 4 300 350 400 100 5 400 450 510 110 6 510 570 630 120 7 630 700 770 140 … … … … … 25 15500 18775 22050 6550 PHÂN TÍCH TÂM LÝ ÂM H C • D i t i h n (critical bankwidth) – Bark là ñơn v ñ bi u di n m t d i t i h n, 1 bark=1 ñ r ng d i t i h n.  – Công th c chuy n ñ i: f f < 500 ,  100 1bark =  f 9 + 4 log 2 ( f ≥ 500 ),  1000 – Công th c khác: 1bark=13arctg(0.76f)+3.5arctg(f/7500) [bark] – Công th c khác n a: 1bark=13arctg(0.76f)+3.5arctg(f2/65.25) [bark]
  7. PHÂN TÍCH TÂM LÝ ÂM H C PHÂN • K thu t che (masking) Con ngư i khi nghe m t âm v i s có m t c a m t âm khác s c m nh n y u ñi khi âm này có t n s g n v i âm c n nghe ho c biên ñ l n. – Che t n s (frequency masking) Thí nghi m: ð t m t ngư i trong phòng kín, phát ra m t âm che (masking tone) v i t n s xác ñ nh (1kHz) m t m c nào ñó (60dB), sau ñó, phát âm ki m tra (test tone) (1,1kHz) , tăng m c ñ n khi có th nghe ñư c. Thay ñ i âm ki m tra, v ngư ng nghe, l p l i v i âm che khác. PHÂN TÍCH TÂM LÝ ÂM H C – Che th i gian (temporal masking) Thí nghi m: Phát m t âm che t n s 1kHz, biên ñ 55dB, thêm m t âm ki m tra 1,1kHz, biên ñ 20dB trư c và sau âm che. Âm ki m tra không th nghe ñư c (nó ñang b che). L p l i các m c khác c a âm ki m tra và v . V i thí nghi m trên, ta th y âm 1,1kHz v i 20dB b che trư c kho ng 15ms và che sau kho ng 50ms.
  8. K THU T NÉN AUDIO THU • Cơ s Âm thanh trung th c và ch t lư ng d ch v tho mãn thì t c ñ dòng d li u ph i l n. Ví d : H th ng âm thanh ña kênh mã hoá 16 bits, t n s l y m u 48kHz (6 kênh) s có t c ñ : 48x16x6=4.5Mbps. T c ñ cao Khó khăn lưu tr , truy n d n và giá thành thi t b . Nén. • Nén không t n hao Khôi ph c ñúng thông tin ban ñ u sau khi gi i nén. Cơ s : Lo i b dư th a th ng kê, các thông tin xu t hi n trong tín hi u mà có th d báo trư c. T s nén th p, kho ng 2:1, ph thu c vào ñ ph c t p c a tín hi u ngu n. Thư ng s d ng k thu t mã hoá d ñoán trong mi n th i gian. K THU T NÉN AUDIO THU – Thu t toán vi sai: Tín hi u âm thanh có ñ c tính l p ñi l p l i nên xu t hi n s dư th a s li u. Thông tin l p s ñư c lo i b trong quá trình mã hoá và ñư c ñưa vào l i trong quá trình gi i mã s d ng k thu t DPCM. Các tín hi u audio ñ u tiên ñư c phân tích thành t p h p các d i băng con bao g m m t s lư ng âm thanh r i r c, sau ñó, DPCM ñư c s d ng ñ d báo các tín hi u l p l i theo chu kỳ. N u s d ng ADPCM còn cho k t qu t t hơn. – Mã hoá Entropy: T n d ng ñ dư th a trong cách miêu t các h s băng con ñã lư ng t hoá nh m c i thi n tính hi u qu c a quá trình mã hoá. Các h s lư ng t ñư c g i ñi theo s tăng d n c a t n s . K t qu nh n ñư c là b ng mã t i ưu th ng kê các giá tr mi n t n s th p và cao. S d ng mã hoá Hufman, Lempel-Zip ñ nén.
  9. K THU T NÉN AUDIO THU • Nén t n hao H th ng thính giác c a con ngư i không th phân bi t các thành ph n ph có biên ñ nh gi a các thành ph n ph có biên ñ l n. H s nén l n, kho ng 20:1 ph thu c vào quá trình nén và gi i nén và ch t lư ng audio yêu c u. – Các k thu t ñư c s d ng: - K thu t che (masking) ñ i v i các thành ph n tín hi u trong mi n th i gian và t ns . - Che m c t p âm lư ng t cho t ng âm ñ c a tín hi u âm thanh b ng cách ch ñ nh s bit v a ñ ñ ch c ch n r ng m c nhi u lư ng t luôn n m dư i m c giá tr c n che. - Mã hoá ghép: Khai thác ñ dư th a trong h th ng audio ña kênh v i các thành ph n s li u trong các kênh gi ng nhau. Mã hoá m t ph n s li u chung trên m t kênh và ch ñ nh cho b gi i mã l p l i tín hi u ñó trên các kênh còn l i. MPEG-1 • Gi i thi u MPEG-1 Mono và Stereo 32, 44.1, 48kHz L pI L p II L p III ðư c phát tri n trên cơ s ph i h p chu n ISO/IEC 11172. S d ng t n s l y m u c a CD-DA, v i fs=32;44.1;48kHz, mã hoá 16bits/m u tín hi u. T c ñ bít: 32 - 768 kbps/channel. Các ki u: Mono, dual-mono, dual-stereo, joint-stereo. Xác ñ nh các tham s khác nhau v t c ñ , dòng s sau khi nén, s m u trong header cho m t kênh, c u trúc th i gian khung, phương pháp mã hoá d ñoán và các ch ñ làm vi c.
  10. MPEG-1 MPEG • ð c tính L pI L p II L p III Dùng cho thi t b dân d ng Dùng cho thi t b chuyên Dùng cho thi t b chuyên d ng, ña môi trư ng d ng, ña môi trư ng T c ñ dòng s li u t 32- T c ñ dòng s li u t 32- T c ñ dòng s li u t 32- 448kbps 384kbps 320kbps 384m u/khung/kênh 1152m u/khung/kênh 1152m u/khung/kênh 32 băng con ñ u nhau, m i 32 băng con ñ u nhau, m i 32 băng con t i h nthành băng con g m block 12 m u băng con g m block 36 m u 18 MDCT Chu kỳ m t khung 8ms cho Chu kỳ m t khung 24ms Chu kỳ m t khung 24ms kênh có fs=48kHz cho kênh có fs=48kHz cho kênh có fs=48kHz H s t l 6 bits/băng, phân H s t l 6 bits/băng, H s t l 6 bits/băng, ph i bit theo phương th c ng phân ph i bit theo phương phân ph i bit theo phương trư c. th c ng trư c. th c ng trư c. MPEG-1 12 m u 12 m u 12 m u L c băng con 0 Các m u 12 m u 12 m u 12 m u Audio L c băng con 1 ngõ vào 12 m u 12 m u 12 m u L c băng con 2 … 12 m u 12 m u 12 m u L c băng con 31 • Khung Khung l p I : 12x32 =384. Khung l p II l pI và l p III • Khung l p II, III: 12x32x3=1152.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2