tài liệu tham khảo đa truyền thông phần 4
lượt xem 32
download
Tham khảo tài liệu 'tài liệu tham khảo đa truyền thông phần 4', công nghệ thông tin, đồ họa - thiết kế - flash phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: tài liệu tham khảo đa truyền thông phần 4
- MÃ HOÁ AUDIO C M QUAN MÃ QUAN • C u trúc d ng cây ñơn phân gi i H020(ejω) ↓2 x(n) H01(ejω) ↓2 H120(ejω) ↓2 H021(ejω) ↓2 H11(ejω) ↓2 H121(ejω) ↓2 MÃ HOÁ AUDIO C M QUAN QUAN • C u trúc d ng cây ña phân gi i – C u trúc này cho ta lư ng bit ngõ ra t i ưu và phù thu c vào s phân b ph c a tín hi u. H020(ejω) ↓2 x(n) H01(ejω) ↓2 H120(ejω) ↓2 H11(ejω) ↓2
- MÃ HOÁ AUDIO C M QUAN MÃ QUAN • Các phương pháp mã hoá chuy n ñ i – FFT (Fast Fourier Transform) – DFT (Discrete Fourier Transform) – DCT (Discrete Cosine Transform) – MDCT (Modified DCT) – Wavelets. MÃ HOÁ AUDIO C M QUAN QUAN • DCT (Discrete Cosine Transform) DCT là phép bi n ñ i tr c giao, m t thu t toán hi u qu , cho các ñ c tính nén m nh và gi m ñ tương quan. π (2n + 1)k N −1 X (k ) = ∑ ∆(n) x(n) cos Chuy n ñ i DCT thu n: k = 0,..N − 1 , 2N n =0 1 , n = 0; N ∆ ( n) = 2 ,0 < n ≤ N − 1 N Chuy n ñ i DCT ngư c π (2n + 1)k N −1 x(n) = ∑ ∆(n) X (k ) cos n = 0,.., N − 1 , 2N k =0 1 , n = 0; N ∆ ( n) = 2 ,0 < n ≤ N − 1 N
- MÃ HOÁ AUDIO C M QUAN MÃ QUAN • MDCT (Modified DCT): DCT ñư c hi u ch nh. MDCT là phép bi n ñ i tr c giao tuy n tính ñư c hi u ch nh t DCT. MDCT thu n: π N −1 N N X (k ) = ∑ p (n) x(n)cos (2n + 1 + )(2k + 1) ; n = 0,.., N − 1; k = 0,.., − 1. 2N 2 2 n =0 Và chuy n ñ i MDCT ngư c (IMDCT): N −1 π 4 2 N N ∑ p(n) X (k ) cos 2 N (2n + 1 + 2 )(2k + 1), x ( n) = n = 0,.., N − 1; k = 0,.., − 1. 2 N k =0 πx V i p(x) là hàm c a s sin ñư c xác ñ nh: p ( x) = sin( ) N • Wavelets Wavelets có th ñư c xem như m t b phân tích băng con, v i cây không cân b ng, nghĩa là các t n s ñư c chia m t cách không ñ ng nh t. V y, băng l c tương ñ ng v i d i t i h n. MÃ HOÁ AUDIO C M QUAN QUAN • DWT (Discrete Wavelet Transform) M r ng và d ch chuy n “hàm m ” h(t) b ng cách ñ nh nghĩa m t cơ s tr c giao, wavelet cơ s : ( ) hn.m (t ) = 2− m / 2 h 2− m t − n Trong ñó: n là t l , m là ñ d i và t là th i gian. H s t l n ch th ñ r ng c a các wavelet và h s v trí m xác ñ nh v trí c a nó. V i hàm m h(t), ta ñư c m t t p hàm wavelet tr c giao cơ s . Tr c giao: f(t), g(t) là hai vector thu c không gian L2(a,b). t∈[a,b]. Hai vector g i là tr c giao khi tích vô hư ng c a chúng b ng 0. b < f (t ), g (t ) >= ∫ f (t ) g * (t ) dt = 0 a
- MÃ HOÁ AUDIO C M QUAN MÃ QUAN • Cơ s tr c giao: T p các vector {vk}={v1,v2, …,vn} ñư c g i là cơ s tr c giao n u chúng tr c giao t ng ñôi m t và có ñ dài b ng 1. b =δmn. Hay: ∫ h (t ) h * (t ) dt = δ kl . k l a 1, k = l •Hàm delta: δ kl = 0, k ≠ l Chuy n ñ i Wavelet: X ω (n, m) = cn ,m = ∑ x(t )hn ,m * Chuy n ñ i wavelet ngư c: +∞ +∞ x(t ) = ∑∑ cn.m hn ,m (t ) −∞ −∞ PHÂN TÍCH TÂM LÝ ÂM H C • H th ng thính giác c a con ngư i – ðư c chú tr ng khai thác trong mã hoá audio c m quan. – Con ngư i có th nghe trong d i 20Hz ñ n 20kHz v i kh năng nghe không ñ ng nh t v i các t n s trong d i này. Vi c c m nh n còn ph thu c vào m c áp l c và tuỳ thu c vào t ng ngư i. – D i 20Hz÷20kHz ñư c chia thành các d i con không ñ ng nh t và không tuy n tính. C m nh n t t trong kho ng 2kHz ñ n 4kHz và ngư ng nghe ñ n ngư ng ñau kho ng 96dB. – Ph thu c vào môi trư ng nghe, v i môi trư ng nhi u l n thì h n ch kh năng nghe và kh năng phân bi t các âm thanh khác nhau. – V y, phân tích tâm lý nghe là xét các v n ñ : • ð nh y c a tai, kh năng ñáp ng c a các cư ng ñ khác nhau. • ðáp ng c a tai v i các t n s khác nhau. • Nghe m t âm khi có m t m t âm khác.
- PHÂN TÍCH TÂM LÝ ÂM H C PHÂN • Ngư ng nghe tuy t ñ i ATH (Absolute Theshold of Hearing) – Thí nghi m:ð t m t ngư i trong phòng kín, im l ng, phát âm ki m tra (test tone) v i t n s xác ñ nh (1kHz), tăng m c âm thanh cho ñ n khi có th nghe ñư c, ghi l i các giá tr và l p l i v i t n s khác. – V ñ th , ta ñư c ngư ng nghe tuy t ñ i. Th v i ngư i khác, ghi k t qu . PHÂN TÍCH TÂM LÝ ÂM H C • D i t i h n (critical bankwidth) – Fletcher ti n hành các th nghi m và cho th y vi c nghe c a con ngư i gi ng như s d ng các b l c tâm sinh lý có ñ r ng g n b ng m t giá tr t i h n và Flecher g i ñ r ng c a b l c t i h n là d i t i h n. – D i t i h n bi u di n công su t xác ñ nh c a tai cho cho các t n s hay d i t n s liên t c. – Các thí nghi m cho th y r ng: • V i các t n s che nh hơn 500Hz thì d i t i h n không ñ i v i ñ r ng kho ng 100Hz. • V i các t n s che l n hơn 500Hz thì d i t i h n có ñ r ng tăng tương ñ i tuy n tính theo t n s . – V y, thang t n s không tuy n tính thang bark (Barkhausen)
- PHÂN TÍCH TÂM LÝ ÂM H C PHÂN • D i t i h n (critical bankwidth) – Flecher chia băng thông âm thanh thành 25 d i t i h n. Di T n s th p Ts trung tâm T n s cao Băng thông 1 - 50 100 - 2 100 150 200 100 .. .. .. .. .. 4 300 350 400 100 5 400 450 510 110 6 510 570 630 120 7 630 700 770 140 … … … … … 25 15500 18775 22050 6550 PHÂN TÍCH TÂM LÝ ÂM H C • D i t i h n (critical bankwidth) – Bark là ñơn v ñ bi u di n m t d i t i h n, 1 bark=1 ñ r ng d i t i h n. – Công th c chuy n ñ i: f f < 500 , 100 1bark = f 9 + 4 log 2 ( f ≥ 500 ), 1000 – Công th c khác: 1bark=13arctg(0.76f)+3.5arctg(f/7500) [bark] – Công th c khác n a: 1bark=13arctg(0.76f)+3.5arctg(f2/65.25) [bark]
- PHÂN TÍCH TÂM LÝ ÂM H C PHÂN • K thu t che (masking) Con ngư i khi nghe m t âm v i s có m t c a m t âm khác s c m nh n y u ñi khi âm này có t n s g n v i âm c n nghe ho c biên ñ l n. – Che t n s (frequency masking) Thí nghi m: ð t m t ngư i trong phòng kín, phát ra m t âm che (masking tone) v i t n s xác ñ nh (1kHz) m t m c nào ñó (60dB), sau ñó, phát âm ki m tra (test tone) (1,1kHz) , tăng m c ñ n khi có th nghe ñư c. Thay ñ i âm ki m tra, v ngư ng nghe, l p l i v i âm che khác. PHÂN TÍCH TÂM LÝ ÂM H C – Che th i gian (temporal masking) Thí nghi m: Phát m t âm che t n s 1kHz, biên ñ 55dB, thêm m t âm ki m tra 1,1kHz, biên ñ 20dB trư c và sau âm che. Âm ki m tra không th nghe ñư c (nó ñang b che). L p l i các m c khác c a âm ki m tra và v . V i thí nghi m trên, ta th y âm 1,1kHz v i 20dB b che trư c kho ng 15ms và che sau kho ng 50ms.
- K THU T NÉN AUDIO THU • Cơ s Âm thanh trung th c và ch t lư ng d ch v tho mãn thì t c ñ dòng d li u ph i l n. Ví d : H th ng âm thanh ña kênh mã hoá 16 bits, t n s l y m u 48kHz (6 kênh) s có t c ñ : 48x16x6=4.5Mbps. T c ñ cao Khó khăn lưu tr , truy n d n và giá thành thi t b . Nén. • Nén không t n hao Khôi ph c ñúng thông tin ban ñ u sau khi gi i nén. Cơ s : Lo i b dư th a th ng kê, các thông tin xu t hi n trong tín hi u mà có th d báo trư c. T s nén th p, kho ng 2:1, ph thu c vào ñ ph c t p c a tín hi u ngu n. Thư ng s d ng k thu t mã hoá d ñoán trong mi n th i gian. K THU T NÉN AUDIO THU – Thu t toán vi sai: Tín hi u âm thanh có ñ c tính l p ñi l p l i nên xu t hi n s dư th a s li u. Thông tin l p s ñư c lo i b trong quá trình mã hoá và ñư c ñưa vào l i trong quá trình gi i mã s d ng k thu t DPCM. Các tín hi u audio ñ u tiên ñư c phân tích thành t p h p các d i băng con bao g m m t s lư ng âm thanh r i r c, sau ñó, DPCM ñư c s d ng ñ d báo các tín hi u l p l i theo chu kỳ. N u s d ng ADPCM còn cho k t qu t t hơn. – Mã hoá Entropy: T n d ng ñ dư th a trong cách miêu t các h s băng con ñã lư ng t hoá nh m c i thi n tính hi u qu c a quá trình mã hoá. Các h s lư ng t ñư c g i ñi theo s tăng d n c a t n s . K t qu nh n ñư c là b ng mã t i ưu th ng kê các giá tr mi n t n s th p và cao. S d ng mã hoá Hufman, Lempel-Zip ñ nén.
- K THU T NÉN AUDIO THU • Nén t n hao H th ng thính giác c a con ngư i không th phân bi t các thành ph n ph có biên ñ nh gi a các thành ph n ph có biên ñ l n. H s nén l n, kho ng 20:1 ph thu c vào quá trình nén và gi i nén và ch t lư ng audio yêu c u. – Các k thu t ñư c s d ng: - K thu t che (masking) ñ i v i các thành ph n tín hi u trong mi n th i gian và t ns . - Che m c t p âm lư ng t cho t ng âm ñ c a tín hi u âm thanh b ng cách ch ñ nh s bit v a ñ ñ ch c ch n r ng m c nhi u lư ng t luôn n m dư i m c giá tr c n che. - Mã hoá ghép: Khai thác ñ dư th a trong h th ng audio ña kênh v i các thành ph n s li u trong các kênh gi ng nhau. Mã hoá m t ph n s li u chung trên m t kênh và ch ñ nh cho b gi i mã l p l i tín hi u ñó trên các kênh còn l i. MPEG-1 • Gi i thi u MPEG-1 Mono và Stereo 32, 44.1, 48kHz L pI L p II L p III ðư c phát tri n trên cơ s ph i h p chu n ISO/IEC 11172. S d ng t n s l y m u c a CD-DA, v i fs=32;44.1;48kHz, mã hoá 16bits/m u tín hi u. T c ñ bít: 32 - 768 kbps/channel. Các ki u: Mono, dual-mono, dual-stereo, joint-stereo. Xác ñ nh các tham s khác nhau v t c ñ , dòng s sau khi nén, s m u trong header cho m t kênh, c u trúc th i gian khung, phương pháp mã hoá d ñoán và các ch ñ làm vi c.
- MPEG-1 MPEG • ð c tính L pI L p II L p III Dùng cho thi t b dân d ng Dùng cho thi t b chuyên Dùng cho thi t b chuyên d ng, ña môi trư ng d ng, ña môi trư ng T c ñ dòng s li u t 32- T c ñ dòng s li u t 32- T c ñ dòng s li u t 32- 448kbps 384kbps 320kbps 384m u/khung/kênh 1152m u/khung/kênh 1152m u/khung/kênh 32 băng con ñ u nhau, m i 32 băng con ñ u nhau, m i 32 băng con t i h nthành băng con g m block 12 m u băng con g m block 36 m u 18 MDCT Chu kỳ m t khung 8ms cho Chu kỳ m t khung 24ms Chu kỳ m t khung 24ms kênh có fs=48kHz cho kênh có fs=48kHz cho kênh có fs=48kHz H s t l 6 bits/băng, phân H s t l 6 bits/băng, H s t l 6 bits/băng, ph i bit theo phương th c ng phân ph i bit theo phương phân ph i bit theo phương trư c. th c ng trư c. th c ng trư c. MPEG-1 12 m u 12 m u 12 m u L c băng con 0 Các m u 12 m u 12 m u 12 m u Audio L c băng con 1 ngõ vào 12 m u 12 m u 12 m u L c băng con 2 … 12 m u 12 m u 12 m u L c băng con 31 • Khung Khung l p I : 12x32 =384. Khung l p II l pI và l p III • Khung l p II, III: 12x32x3=1152.
CÓ THỂ BẠN MUỐN DOWNLOAD
-
tài liệu tham khảo đa truyền thông phần 1
12 p | 362 | 82
-
tài liệu tham khảo đa truyền thông phần 2
12 p | 196 | 47
-
tài liệu tham khảo đa truyền thông phần 3
10 p | 127 | 39
-
tài liệu tham khảo đa truyền thông phần 5
9 p | 119 | 34
-
tài liệu tham khảo đa truyền thông phần 6
13 p | 126 | 33
-
tài liệu tham khảo đa truyền thông phần 7
12 p | 111 | 30
-
Chương 1: Tổng quan về mạng máy tính - ĐH Cần Thơ
10 p | 189 | 26
-
Các phương pháp đa hợp
15 p | 59 | 10
-
Mô tả công việc nhân viên thiết kế đồ họa
1 p | 95 | 4
-
Thiết lập và sử dụng Home Sharing với iPhone, iPad hoặc iPod Touch –P.1
5 p | 103 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn