BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH
lượt xem 86
download
Trong những năm gần đây, cùng với sự tiến bộ của khoa học kỹ thuật, sự phát triển mạnh mẽ của máy tính, thông tin di dộng và của Internet thì nhu cầu trao đổi các dịch vụ truyền thông đa phương tiện trên mạng thông tin là rấ lớn đặc biệt là các ứng dụng truyền âm thanh và videp thời gian qua mạng IP...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH
- T P OÀN BƯU CHÍNH VI N THÔNG VI T NAM H C VI N CÔNG NGH BƯU CHÍNH VI N THÔNG BÀI GI NG X LÝ ÂM THANH VÀ HÌNH NH Chuyên ngành i n t Vi n thông (Lưu hành n i b ) Biên so n: TS. Lê Nh t Thăng Hà N i - 7/2010
- M CL C i M CL C iii L I NÓI U iv CÁC THU T NG VI T T T 1 Chương 1: Gi i thi u chung 1 1.1. Các khái ni m và lý thuy t cơ s 8 1.2. Vai trò c a x lý âm thanh và hình nh trong truy n thông a phương ti n 11 1.3 K t lu n chương 1 11 Hư ng d n ôn t p chương 1 12 Chương 2: K thu t x lý âm thanh 12 2.1. Các c trưng cơ b n c a âm thanh 12 2.1.1. Khái ni m v âm thanh và các tham s ánh giá 14 2.1.2. Các c i m c a h th ng thính giác con ngư i 20 2.2. Mã hóa tín hi u tho i 20 2.2.1. Quá trình t o ra ti ng nói 25 2.2.2. T ng quan v mã hóa tín hi u tho i 27 2.2.3. Các phương pháp mã hóa 29 2.2.3.1. Mã hóa d ng sóng 32 2.2.3.2. Mã hóa tham s 35 2.2.3.3. Mã hóa lai 37 2.3. Mã hóa âm thanh 41 2.4. K t lu n chương 2 42 Hư ng d n ôn t p chương 2 43 Chương 3: K thu t x lý nh 43 3.1. Gi i thi u chung 43 3.1.1. Khái ni m cơ b n v nh và x lý nh, video 44 3.1.2. Các ng d ng ph bi n c a x lý nh 49 3.1.3. Các bư c x lý nh s 50 3.1.4. Các thành ph n c a h th ng x lý nh s 51 3.1.5. h a và các ki u d li u nh 56 3.1.6. M u s c trong nh và video
- 60 3.1.7. Cơ b n v video 65 3.2. Cơ s k thu t x lý nh 65 3.2.1. Cơ s c a c m nh n th giác 68 3.2.2. Quá trình thu tín hi u hình nh 71 3.2.3. L y m u và lư ng t hóa 78 3.2.4. X lý nh trong mi n không gian 80 3.2.5. X lý nh trong mi n t n s 84 3.3. K thu t nén nh 84 3.3.1. T ng quan v nén nh 88 3.3.2. Hi u qu c a quá trình nén và ch t lư ng nh 89 3.3.3 Phân lo i các phương pháp nén nh 91 3.3.4. Các phương pháp mã hoá dùng trong k thu t nén không t n th t 100 3.3.5. Các phương pháp mã hoá dùng trong k thu t nén có t n th t 105 3.4. Nén trong nh 114 3.5. Nén liên nh 118 3.6. K t lu n chương 3 119 Hư ng d n ôn t p chương 3 121 Chương 4: Các chu n mã hóa âm thanh và nén nh trong truy n thông a phương ti n 121 4.1. Các chu n mã hóa tín hi u tho i 123 4.2. Các chu n mã hóa âm thanh 125 4.3. Các chu n nén nh JPEG 130 4.4. Các chu n nén Video MPEG-1, 2, 4, 7 và MPEG-21 143 4.5. Các chu n nén Video H26x c a ITU 143 4.6. K t lu n chương 4 144 Hư ng d n ôn t p chương 4 145 TÀI LI U THAM KH O
- L I NÓI U Trong nh ng năm g n ây, cùng v i s ti n b c a khoa h c k thu t, s phát tri n m n h m c a m áy tính, thông tin di n g và c a I nternet thì nhu c u t rao i các d ch v truy n thông a phương ti n trên m ng thông tin là r t l n c bi t là các ng d ng truy n âm thanh và video th i gian th c qua m ng IP như âm nh c theo yêu c u, video phone, video-conferencing, tele-medical hay video theo yêu c u…Cho nên, v n x lý âm thanh và hình nh sao cho có hi u qu cao, m b o ti t ki m băng thông truy n d n, gi m b t không gian lưu tr truy n thông tin trên m ng m t cách d dàng và nhanh chóng tr nên c p thi t hơn bao gi h t. Bài gi ng “X lý âm thanh và hình nh” s gi i thi u nh ng ki n th c cơ b n v các k thu t x lý âm thanh, hình nh, video và c bi t chú tr ng n các phương pháp nén, lưu tr , các tiêu chu n nén âm thanh, hình nh, video ã và ang ư c ng d ng trong truy n thông a phương ti n nh m m b o ch t lư ng âm thanh, hình nh và tăng hi u su t truy n d n thông tin. N i dung c a bài gi ng bao g m: • Chương 1: Gi i thi u chung: Gi i thi u t ng quan các khái ni m và lý thuy t cơ s ph c v cho môn h c và vai trò c a x lý âm thanh và hình nh ng d ng trong truy n thông a phương ti n. • Chương 2: K thu t x lý âm thanh: Gi i thi u các c trưng cơ b n c a âm thanh, phân tích các c i m c a cơ quan phát âm và t o ra ti ng nói c a con ngư i, các phương pháp mã hóa tho i, âm thanh. • Chương 3: K thu t x lý nh: T p trung trình bày các khái ni m cơ b n v nh và video; gi i thi u v k thu t x lý nh, nén nh tĩnh, nén video. • Chương 4: Các chu n nén âm thanh và hình nh: Gi i thi u các chu n nén tho i, âm thanh, các chu n nén nh JPEG và nén video MPEG, H26x. M c dù ã có nhi u c g ng, song do ây là l n biên so n u tiên và còn có nhi u h n ch v th i gian nên bài gi ng này không tránh kh i thi u sót. R t mong nh n ư c s óng góp c a các ng nghi p, các h c viên, sinh viên và b n c bài gi ng này ư c hoàn thi n hơn. Nh ng ý ki n óng góp xin g i v : B môn K thu t Chuy n m ch- Khoa Vi n thông 1 H c Vi n Công ngh Bưu chính Vi n thông a ch : Km 10, ư ng Hà N i – Hà ông, Hà ông, Hà N i Tel: 0433820860; 0438549352; 0904342557 Fax: 0433511405 E-mail: thangln@ptit.edu.vn Xin trân tr ng cám ơn! Hà N i, tháng 7 năm 2010 TS. Lê Nh t Thăng
- CÁC THU T NG VI T T T ư ng dây thuê bao s b t i ADSL Asymmetric Digital Subscriber Line x ng Adaptive Differential Pulse Code ADPCM i u ch xung mã vi sai thích ng Modulation BRR Bit Rate Reduction S gi m t c bit BSC Binary Symmetric Channel Kênh nh phân i x ng Context Adaptive Binary Arithmetic Mã hoá thu t toán nh phân theo CABAC Coding tình hu ng Thi t b c m bi n quang i n bán CCD Charge Coupled Device dn CIF Common Intermediate Format Khuôn d ng trung gian chung DCT Discrete Cosine Transform Bi n i Cosin r i r c DDC Double Delta Coding Mã hoá delta kép DFT Discrete Fourier Transform Bi n i r i r c Fourier DPCM Differential Pulse Code Modulation i u ch xung mã vi sai DSL Digital Subcriber Line ư ng dây thuê bao s Digital Subscriber Line Access DSLAM B t p trung ư ng dây thuê bao s Multiplexer DSM Digital Storage Media Phương ti n lưu tr s DVB Digital Video Broadcasting Qu ng bá truy n hình s DVD Digital Video Disc ĩa nh s (quang) DWT Descrete Wavelet Transform Bi n i Wavelet r i r c Embedded Block Coding with Optimal Mã hóa kh i nhúng v i c t gi m t i EBCOT Truncation ưu EDTV Extended Definition TeleVision Truy n hình m r ng EOB End of Block K t thúc kh i FIR Finite Impulse Response áp ng xung h u h n GIF Graphics Interchange Format nh d ng trao i nh GOP Group of Picture Nhóm các khung nh GOV Group of VOPs Nhóm các GOV HDTV High-Definition TeleVision Truy n hình phân gi i cao HVS Human Vision System H th ng th giác c a ngư i Chuy n i màu không thu n ICT Irreversible color transform ngh ch IGMP Internet Group Management Protocol Giao th c qu n lý nhóm Internet IIR Infinte impulse responce áp ng xung vô h n IPTV Internet Protocol Television Truy n hình d a trên Internet International Organization for ISO T ch c chu n qu c t Standardization JIF JPEG Interchange Format nh d ng trao i JPEG Joint Photographic Experts Group/ Joint JPEG/ JVT Nhóm chuyên gia ghép n i ha Video Team
- KLT Karhunen – Loeve Transform Chuy n i Karhunen – Loeve LZW Lempel Ziv-Wench Transform Chuy n i Lempel Ziv-Wench MoD Music on Demand Âm nh c theo yêu c u MPEG Moving Picture Experts Group Nhóm chuyên gia v nh ng y ban h th ng truy n hình qu c NTSC National Television System Committee gia PAL Phase Alternating Line PAL PCM Pulse Code Modulation i u ch xung mã PDF Portable Document Format nh d ng tài li u linh ng PON Passive Optical Networks M ng quang th ng QCIF Quarter Common Intermediate Format nh d ng có phân gi i ¼ CIF RAC Relative Address Coding Mã hóa a ch tương i RCT Reversible Color Transform Chuy n i thu n ngh ch RLC/ RLE Run Length Coding/ Encoding Mã hóa dài ch y RMS Root Mean Square l ch trung bình bình phương SECAM Sequential Color with Memory SECAM SNR Signal to Noise Ratio T s tín hi u trên nhi u STB Set Top Box Set Top Box TIFF Tagged Image File Format Khuôn d ng file tiêu chu n TVoD TeleVision on Demand Tivi theo yêu c u Very High Speed Digital Subscriber VDSL ư ng thuê bao s t c r t cao Line VLC Variable Length Code Mã hóa dài thay i VO Video Object i tư ng hình nh VoD Video on Demand Video theo yêu c u L p i tư ng hình nh chuy n VOL Video Object Layer ng M t ph ng i tư ng hình nh VOP Video Object Plane chuy n ng
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung Chương 1: Gi i thi u chung 1.1. Các khái ni m và lý thuy t cơ s 1.1.1. Tín hi u 1.1.1.1. nh nghĩa Tín hi u là bi u di n v t lý c a thông tin. Trong th c t , các tín hi u nhìn th y là các sóng ánh sáng mang thông tin t i m t c a con ngư i và các tín hi u nghe th y là các s bi n i c a áp su t không khí truy n thông tin t i tai chúng ta. V m t toán h c, tín hi u ư c bi u di n b i hàm c a m t ho c nhi u bi n s c l p. Ví d , tín hi u âm thanh có biên âm bi n i theo th i gian như hình v dư i ây. Hình 1.1: Tín hi u âm thanh T ng quát hơn, tín hi u có th bi n i theo hai chi u: không gian/th i gian. Ví d v i nh, có màu bi n i theo không gian hai chi u; v i video, màu bi n i theo c không gian và th i gian. 1.1.1.2. Tín hi u liên t c N u bi n c l p c a s bi u di n toán h c c a m t tín hi u là liên t c, thì tín hi u ó ư c g i là liên t c. D a theo biên , ngư i ta có th phân lo i tín hi u liên t c thành: tín hi u tương t và tín hi u lư ng t hóa. 1
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung N u biên c a tín hi u liên t c là liên t c thì tín hi u ó ư c g i là tín hi u tương t . Còn n u biên c a tín hi u liên t c là r i r c thì tín hi u ó ư c g i là tín hi u lư ng t hóa. 1.1.1.3. Tín hi u r i r c N u tín hi u ư c bi u di n b i hàm c a các bi n r i r c thì tín hi u ó ư c g i là tín hi u r i r c. D a theo biên , ngư i ta có th phân lo i tín hi u r i r c thành: tín hi u l y m u và tín hi u s . N u biên c a tín hi u r i r c là liên t c (không ư c lư ng t hóa) thì tín hi u ó ư c g i là tín hi u l y m u. Còn n u biên c a tín hi u r i r c là r i r c thì tín hi u ó ư c g i là tín hi u s . 1.1.2. S hóa tín hi u tương t Nói chung tín hi u tương t thì liên t c theo th i gian và giá tr . Theo quan i m lý thuy t thông tin, lư ng thông tin ch a trong tín hi u tương t là vô h n. Rõ ràng, i u này này t o ra quan h v i các tín hi u này m t nhi m v khó khăn trong i u ki n dung lư ng b nh và năng l c x lý c a máy tính b h n ch . M t khác, các tín hi u s ch xu t hi n trong nh ng kho ng th i gian nh t nh và ch ư c bi u di n b ng các giá tr biên ri r c. S suy gi m thông tin này là m c tiêu làm cho quá trình x lí thêm h u ích và trên th c t là nh ng bư c nén u tiên. S hóa là phương pháp gi m lư ng thông tin n m c h p lý b ng cách l y nh ng giá tr i di n có tính toán cân nh c k . Vi c này làm thành hai ph n. Ph n l y m u theo th i gian và l y m u biên . Theo lý thuy t c hai bư c c l p nhau, trong th c t , chúng thư ng ư c th c hi n b i cùng ph n t x lý là b chuy n i tương t thành s (ADC). ó là s s hóa trong gi i h n thu ư c thông tin mong mu n có ích ch a trong tín hi u tương t và lo i b thông tin dư th a không c n thi t. Cho nên chúng ta ph i bi t các thu c tính c a các tín hi u c n thi t ư c s hóa th c hi n bi n i tín hi u tương t sang tín hi u s m t cách thích h p. Thu c tính chung c a tín hi u video và âm thanh bao g m băng t n, t s tín hi u trên nhi u, t s tín hi u trên méo, và d i ng. r ng băng t n miêu t s thay i tín hi u tương t kh d ng trong quãng th i gian cho trư c, nó l n lư t xác nh s lư ng m u ư c l y trong m t ơn v th i gian b o toàn ư c thông tin ch a trong tín hi u. Thông tin v d i ng và các nhân t khác (ví d như nhi u ch ng l n tín hi u) xác nh chính xác biên c a tin hi u ph i ư c gi ch ng l i b t kỳ t p âm chú ý hay không mong mu n. chuy n i tín hi u tương t sang tín hi u s , tín hi u tương t thư ng ư c l y m u t i nh ng kho ng th i gian b ng nhau. Và biên c a m i m u ư c lư ng t hoá 2
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung r i ư c gán v i m t t mã s . Vì th tín hi u s là m t chu i v i t c bit không i hình thành t quá trình x lí l y m u v i mã s nh phân dài b ng nhau. Hình 1.2 mô t vi c l y m u tín hi u. Tín hi u vào tương t liên t c theo th i gian x(t) ư c l c thông qua b l c ngoài. Sau ó i qua b l y m u, b này là m t m ch i n l y m u v i t n s fs l n hơn hai l n t n s l n nh t c a tín hi u. B l y m u bi n i tín hi u tương t thành tín hi u r i r c theo th i gian, tín hi u này sau ó, trong o n sau c a b chuy n i ADC, ư c lư ng t hoá và gán b i m t t mã nh phân. Toàn b quá trình trên ư c minh h a trong hình 1.3. Hình 1.2: L y m u tín hi u tương t Hình 1.3: Nguyên lý cơ b n c a x lý s tín hi u Tín hi u ư c l y m u và ư c lư ng t hóa như trên ư c g i là i u ch xung mã PCM (Pulse Code Modulation) vì m i m t m u ư c mã hóa c l p v i các m u khác và các t mã có chi u dài không i. M i t mã bao g m nhi u bit: 8 n 10 bít ư c s d ng cho tín hi u video; 8 bit cho tín hi u âm thanh d i t n th p và 16 n 20 bít dùng cho tín hi u âm thanh yêu c u ch t lư ng cao. 3
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung 1.1.3. Bi n i Fourier Bi n i là công c khá m nh cho vi c mô hình hóa n i dung thông tin và áp d ng cho các nguyên lý nén. Trong lĩnh v c âm thanh, m t bi n i cho phép ta th y n i dung thông qua ph âm thanh. Trong lĩnh v c video (hình nh ng), các phép bi n i có th giúp ta phân tích t n s không gian trong t ng b c tranh ơn l ; và nó có th cũng ư c s d ng các chu kỳ theo chi u cao ho c r ng c a b c tranh. Phân tích Fourier d a trên vi c b t kỳ m t d ng sóng tín hi u tu n hoàn nào u có th ư c tái c u trúc thành m t s các tín hi u hình sin có bi n và pha thay i và có quan h i u hòa v i nhau. Bi n i Fourier là m t công c m nh và ư c ng d ng khá nhi u trong x lý âm thanh và hình nh. Lưu ý r ng, các tín hi u âm thanh và video hi m khi là t h p c a các tín hi u có tính chu kỳ nên chúng ta c n xác nh rõ c a s th i gian ho c không gian mà chúng ta s áp d ng khi bi n i. 1.1.3.1. Bi n i Fourier thu n N u dãy x(n) tho mãn i u ki n: ∞ ∑ x( n)
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung Bi u th c bi n i Fourier c a dãy s x(n) (1.2) là su t phát t bi u th c bi n i Fourier c a hàm liên t c x(t), vì khi hàm dư i d u tích phân là dãy r i r c thì ph i thay d u tích phân b ng d u t ng. Do tính ch t tu n hoàn c a hàm mũ ejω, nên X(ejω) là hàm tu n hoàn c a bi n ω v i chu kỳ 2π : ∞ ∞ ∑ x ( n) e ∑ x ( n) e X (e j (ω + k .2π ) ) = − j (ω + k .2π ).n − jω .n = X (e jω ) = n = −∞ n = −∞ i u ó có nghĩa là ch c n nghiên c u hàm t n s X(ejω) c a các dãy r i r c x(n) v i ω ∈ (-π , π ) ho c ω ∈ ( 0 , 2π ). S d ng bi n i Fourier cho phép nghiên c u ph c a tín hi u s và c tính t n s c a h x lý s . N u x(n) là tín hi u s thì FT[ x(n)] = X (e j∞ ) là ph c a tín hi u x(n), còn v i h(n) là c tính xung c a h x lý s thì FT[h(n)] = H (e j∞ ) là c tính t n s c a h x lý s . 1.1.3.2. Bi n i Fourier ngư c Bi n i Fourier ngư c cho phép tìm dãy x(n) t hàm nh X(ejω). tìm bi u th c c a phép bi n i Fourier ngư c, xu t phát t bi u th c Fourier thu n (1.2): ∞ ∑ x ( n) e − jω .n X (e jω ) = (1.6) n = −∞ Nhân c hai v c a (1.6) v i ejω.m r i l y tích phân trong kho ng (-π , π ) , nh n ư c: π π π ∞ ∞ ∫π ∑ x(n).e ∑ x(n) ∫ .e ω ∫π X (e jω .m − jω .n jω .m j .( m − n ) jω ).e .e dω = dω = dω n = −∞ n = −∞ −π − − 2π π khi m = n ∫π e Vì : jω ( m − n ) dω = 0 khi m ≠ n − π ∫π X (e Nên : ).e jωn dω = 2π .x(n) jω − T ó suy ra bi u th c c a phép bi n i Fourier ngư c: π 1 ∫π X (e ).e jω .n dω x ( n) = jω (1.7) 2π − Phép bi n i Fourier ngư c ư c ký hi u như sau: (1.8) IFT [ X (e jω )] = x(n) 5
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung Hay : (1.9) IFT X (e jω ) → x(n) (IFT là ch vi t t t c a thu t ng ti ng Anh Inverse Fourier Transform). Bi u th c bi n i Fourier thu n (1.6) và bi u th c bi n i Fourier ngư c (1.7) h p thành c p bi n i Fourier c a dãy s x(n). 1.1.4. Bi n i Cosin r i r c Phép bi n i ư c xem là t t nh t cho nén nh là phép bi n i cosin r i r c (DCT). DCT là m t trư ng h p c bi t c a bi n i Fourier. Bi n i DCT là m t công o n chính trong các phương pháp nén s d ng bi n i. Hai công th c ây minh ho cho 2 phép bi n i DCT thu n ngh ch i v i m i kh i nh có kích thư c 8 x 8. Giá tr x(n1, n2) bi u di n các m c xám c a nh trong mi n không gian, X(k1, k2) là các h s sau bi n i DCT trong mi n t n s . (1.10) (1.11) vi và 1.1.5. Bi n i Wavelet Bi n i Wavelet là phép bi n i ư c s d ng phân tích các tín hi u không n nh (non-stationary) – là nh ng tín hi u có áp ng t n s thay i theo th i gian. Bi n i Wavelet ư c th c hi n theo cách: tín hi u ư c nhân v i hàm Wavelet r i th c hi n bi n i riêng r cho các kho ng tín hi u khác nhau trong mi n th i gian t i các t n s khác nhau. Cách ti p c n như v y còn ư c g i là: phân tích a phân gi i – MRA (Multi Resolution Analysis): phân tích tín hi u các t n s khác nhau và cho các phân gi i khác nhau. MRA khi phân tích tín hi u cho phép: phân gi i th i gian t t và phân gi i t n s kém các t n s cao; phân gi i t n s t t và phân gi i th i gian kém các t n s 6
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung th p. Như v y k thu t này r t thích h p v i nh ng tín hi u: có các thành ph n t n s cao xu t hi n trong kho ng th i gian ng n, các thành ph n t n s th p xu t hi n trong kho ng th i gian dài ch ng h n như nh và khung nh video. 1.1.5.1. Bi n i Wavelet liên t c B ng cách l y thang t l (scaling) và d ch chuy n m t hàm th i gian ψ(t) g i wavelet m hay wavelet cơ s , ta ư c m t h wavelet: (1.12) trong ó a là thông s thang t l ch s co giãn c a wavelet, b là thông s d ch chuy n ch v trí th i gian c a wavelet. D ng sóng t ng quát c a các wavelet trong cùng h ư c b o toàn trong m i co giãn và t nh ti n. Bi n i wavelet liên t c (CWT) c a m t hàm th i gian (tín hi u) x(t) ư c nh nghĩa như sau: (1.13) trong ó * ch liên hi p ph c, 〈⋅〉 ch tích n i. Bi n i wavelet Wx(a,b) di n t s tương quan gi a tín hi u x(t) và wavelet ψa,b(t). Bi n i thu n trên là phân tích, ngư c l i là t ng h p ph c h i tín hi u th i gian. 1.1.5.2. Bi n i Wavelet r i r c Bi n i wavelet liên t c ch a nhi u trùng l p và òi h i tính toán công phu nên ít ư c dùng. C hai tr ng i trên ư c gi i quy t ng th i b ng cách r i r c hóa thông s a, b: (1.14) trong ó m, n là s nguyên. H wavelet (1.12) tr thành: (1.15) Thông d ng nh t là r i r c hóa d ng bát phân (octave) hay lũy th a c a 2 (dyadic) v i a0=2, b0 = 1, k t qu : (1.16) V i s ch n l a thông s a, b như trên ta có bi n i wavelet r i r c (DWT) có các h s wavelet là: 7
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung (1.17) Vi c t ng h p s cho l i tín hi u th i gian: (1.18) 1.2. Vai trò c a x lý âm thanh và hình nh trong truy n thông a phương ti n Truy c p thông tin a phương ti n kh p m i nơi bây gi là ng l c chính cho vi c thi t k nh ng m ng máy tính và m ng truy n thông th h m i. Hơn n a, các s n ph m ang ư c phát tri n m r ng kh năng t i t t c các k t n i m ng hi n có h tr lưu lư ng truy n thông a phương ti n. ây là m t s chuy n d ch t m ng i n tho i tương t phát tri n b i Bell System n m ng chuy n m ch gói d li u – cơ s c a m ng Internet n m ng truy n thông h p nh t h tr ngư i dùng kh p m i nơi. a phương ti n là s n ph m c a quá trình k t h p d li u, tho i, h a, âm thanh, hình nh và video theo m t cách th c nh t nh ph c v nhu c u truy n thông c a con ngư i. Truy n thông a phương ti n liên quan n vi c truy n thông tin a phương ti n qua m ng truy n thông. Ngày nay, các công ngh truy n thông hi n i ã tr thành m t ph n không th thi u trong giao ti p h ng ngày c a chúng ta. Nó ã làm thay i nhanh chóng cách s ng c a chúng ta, cách ti p nh n s giáo d c, cách làm vi c và là ph n cơ b n t t y u giúp th c hi n nhi m v m t cách suôn s trong xã h i ương th i cũng như cu c s ng cá nhân c a m i con ngư i. S l n m nh m t cách nhanh chóng trong k thu t truy n thông c a chúng ta là m t cu c cách m ng ã làm thay i xã h i ch trong m t th i gian ng n cu i th k 20, c bi t là trong hai th p k cu i. Trong nh ng ti n b c a cu c cách m ng truy n thông g n ây, chúng ta th y có b n phát tri n k thu t ã làm thay i toàn c nh trong lĩnh v c vi n thông. u tiên là s tăng nhanh c a t c trao i thông tin, v i s t phá c a công ngh cáp quang, vi c truy n thông tin ã ư c nâng lên t kho ng 100Mbps cho m t s i quang b t u t năm 1980 cho n bây gi là 400Gbps. Dung lư ng s i quang n 4000 l n ch trong vòng 20 năm qua. Th 2 là, s có m t kh p nơi c a các m ng chuy n m ch gói b i s ph bi n m t cách nhanh chóng c a Internet và các trang Web. S ra i và phát tri n c a Internet và Web ã t o ra m t n n t ng chung cho chúng ta chia s nhi u lo i thông tin m t cách nhanh chóng trong nhi u m i quan h theo nhi u cách khác nhau. So sánh v i các m ng chuy n m ch kênh truy n th ng thì các m ng chuy n m ch gói có chi phí hi u qu hơn và có năng l c x lý và ph c v t t hơn. Hơn n a, vi c b sung thêm nhi u d ch v m i và nh ng ng d ng m i d dàng và linh ho t hơn so v i m ng chuy n m ch kênh. 8
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung Th 3 là s phát tri n c a truy n thông không dây. Hơn hai th p niên trư c ây, t t c m i ngư i u bi t r t ít v truy n thông cá nhân không dây, nhưng ngày nay nó ã ư c ón nh n n ng nhi t b i c c ng ng và công vi c kinh doanh c a nó ang l n m nh t ng ngày kh p m i nơi. Công ngh truy n thông không dây ã phát tri n t nh ng h th ng tương t u tiên (1G) cho n th h th hai (2G) là h th ng kĩ thu t s , và nó hi n ang ti p t c ti n tri n n th h th 3 (3G), th 4 (4G) mà ó có s t i ư u cho c các d ch v truy n thông tho i, d li u, nh và video h p nh t. Th 4 là nhu c u phát tri n truy nh p băng thông r ng qua các k t n i như ư ng dây thuê bao s DSL (Digital Subscriber Line) ho c cáp t i m ng Internet là r t l n…Chính s phát tri n này cho th y trư c ư c truy n thông trong tương lai g n s ti n t i các m ng chuy n m ch gói dung lư ng cao, t c truy n t i l n v i truy nh p băng r ng không dây vào b t kỳ lúc nào và b t kỳ âu. Theo các nhà nghiên c u, truy n thông a phương ti n bao g m r t nhi u ch : • X lý a phương ti n và mã hóa: bao g m phân tích n i dung a phương ti n, tìm ki m a phương ti n d a trên n i dung, an ninh a phương ti n, x lý âm thanh, hình nh và video, nén ... a phương ti n h tr và h th ng m ng: bao g m các giao th c m ng, Internet, • các h i u hành, máy ch và khách, ch t lư ng d ch v (QoS), và cơ s d li u. Các công c a phương ti n, h th ng u cu i, và các ng d ng. Chúng bao • g m h th ng siêu a phương ti n (hypermedia), giao di n ngư i dùng, h th ng phân quy n, tương tác a phương th c, và tích h p: có m t kh p nơi "ubiquity" - thi t b duy t Web kh p m i nơi, giáo d c a phương ti n, bao g m c máy tính h tr d y h c và thi t k , và các ng d ng c a môi trư ng o. T ây chúng ta có th th y r ng x lý âm thanh, hình nh và video mà c bi t là các k thu t nén âm thanh, tho i, hình nh và video là m t trong nh ng n i dung nghiên c u c a truy n thông a phương ti n, h tr c l c cho vi c truy n t i cũng như lưu tr các n i dung a phương ti n m t cách có hi u qu nh t. Ví d như m t tín hi u âm thanh ch t lư ng cao c n x p x 1.5 Mbps hay m t tín hi u video màu phân gi i th p ch t lư ng TV ch a 30 khung hình/giây, v i m i khung hình ch a 640x480 i m nh (24 bit cho m i i m nh màu) c n hơn 210 Megabit/giây cho lưu tr . Do ó, m t gi phim màu s hóa c n x p x 95 Gigabyte lưu tr . V i tín hi u video có phân gi i cao – HDTV (High-Definition Television) có phân gi i 1280x720 v i 60 khung hình/giây thì òi h i lưu tr càng nhi u hơn n a. M t gi phim màu s hóa c a tín hi u video HDTV s c n kho ng 560 Gigabyte lưu tr . Hình ch p X- quang s hóa kích thư c 14x17 inch2 chi m g n 45 Megabyte lưu tr . 9
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung Hơn th n a, vi c truy n nh ng tín hi u a phương ti n có yêu c u băng thông r t l n qua nh ng kênh truy n thông v i băng thông gi i h n là m t thách th c l n và ôi khi không th truy n ư c d ng thô c a nh ng tín hi u ó. M c dù giá thành lưu tr ã gi m áng k qua th p niên v a r i, nhưng nhu c u c a nh ng ng d ng lưu tr và x lý d li u ang phát tri n bùng n vư t qua ti n b này. H u h t nh ng tín hi u như nh, video, và âm thanh thư ng ch a nhi u thông tin dư th a trong bi u di n c a chúng. Nén d li u nói chung cũng như nén âm thanh, tho i, hình nh và video là gi m dư th a trong bi u di n d li u gi m òi h i lưu tr d li u và do ó gi m chi phí truy n thông. Nh ng l i ích và ng d ng c a nén d li u ư c li t kê dư i ây: • Gi m không gian lưu tr d li u. • Gi m chi phí khi truy n kh i lư ng l n d li u trên ư ng dài qua vi c t i ưu băng thông ư ng truy n có s n. • Tăng ch t lư ng hi n th qua kênh truy n có băng thông gi i h n. Do ó, ngư i dùng có th thư ng th c nh ng tín hi u nghe nhìn ch t lư ng cao. Ví d : kênh TV 6 MHz có th mang tín hi u HDTV v i ch t lư ng âm thanh, hình nh t t hơn t c cao hơn và phân gi i cao hơn mà không c n thêm băng thông ư ng truy n. • Vì vi c gi m t c d li u b i vi c nén, m ng máy tính và Internet ang ngày càng tr nên thân thi n hơn v âm thanh và h a, hơn là ch t p trung vào d li u và văn b n như trư c ây. • Tăng cư ng b o m t d li u nh mã hóa và truy n d li u phân tán t nh ng t p tin cơ s d li u ã nén nh m ngăn vi c truy xu t nh ng thông tin ã ư c s h u. • Tăng áng k t c tính toán nh p-xu t trong thi t b nh bi u di n d li u ng n hơn. • Gi m chi phí sao lưu và khôi ph c d li u nh lưu tr b n sao c a nh ng t p tin cơ s d li u d ng nén. • Nh ng l i ích này s cho phép nhi u ng d ng a phương ti n hơn v i giá thành gi m và do ó hư ng t i nhi u ngư i dùng hơn trong m t tương lai g n. Tóm l i, nén d li u ã t o ra nhi u cơ h i cho nh ng ng d ng sáng t o như thư vi n s , lưu tr s , h i ngh truy n hình t xa, gi i trí s … Hi n t i, có r t nhi u các chu n nén âm thanh, tho i, hình nh và video ang ư c s d ng ph bi n trong truy n thông a phương ti n như: G711, G729; JPEG; MPEG; H264… 10
- X lý âm thanh và hình nh Chương 1: Gi i thi u chung 1.3. K t lu n chương 1 Chương 1 ã gi i thi u nh ng khái ni m cơ b n liên quan n âm thanh, hình nh và video, trình bày v xu hư ng phát tri n c a vi n thông: các nhu c u v d ch v băng thông r ng, t c cao và các h n ch c a công ngh truy n d n, chuy n m ch liên quan th y ư c vai trò c a x lý âm thanh, tho i, hình nh và video trong truy n thông a phương ti n. Hư ng d n ôn t p chương 1 1. Phân bi t các lo i tín hi u (liên t c, r i r c). 2. Quá trình s hóa tín hi u tương t . 3. Ý nghĩa c a các bi n i Fourier, DCT và Wavelet. 4. Nh ng l i ích và ng d ng c a nén d li u trong truy n thông a phương ti n. 5. M t tín hi u hình Sin có biên 5V c n ư c bi n i thành d ng s sao cho nh n ư c t s tín hi u trên t p âm lư ng t hóa không th p hơn 25 dB. Yêu c u c n bao nhiêu bư c lư ng t hóa như nhau và c n có bao nhiêu bít mã hóa m i thành ph n r i r c. 6. Gi s m t tín hi u có phân b u (uniform), ư c lư ng t u 256 m c, có t s S/N là 18dB. N u mu n tăng t s S/N c a tín hi u thành 30dB thì s m c lư ng t s ph i là bao nhiêu? 11
- X lý âm thanh và hình nh Chương 2:K thu t x lý âm thanh Chương 2: K thu t x lý âm thanh 2.1. Các c trưng cơ b n c a âm thanh 2.1.1. Khái ni m v âm thanh và các tham s ánh giá Âm thanh trong th gi i t nhiên v b n ch t là nh ng sóng âm ư c t o ra t dao ng c a v t th và ư c truy n i trong m t môi trư ng truy n âm nh t nh. Âm thanh c a ti ng nói, tương t , là nh ng sóng âm ư c t o ra t dao ng c a các b ph n trong b máy phát âm và ư c truy n i trong môi trư ng truy n âm (thư ng là không khí). Nh ng sóng âm này truy n n tai ngư i nghe, p vào màng nhĩ - m t màng m ng r t nh y c m c a tai ngư i – làm cho màng nhĩ cũng dao ng, các dây th n kinh c a màng nhĩ s nh n ư c c m giác âm khi t n s dao ng c a sóng t n m t l n nh t nh và ngư i nghe nh n bi t ư c l i nói. Liên l c thông tin b ng ti ng nói là truy n thông tin t não ngư i nói sang não ngư i nghe. Có th xem như ti ng nói (tho i) là m t trư ng h p riêng nhưng ph bi n c a âm thanh. Âm thanh có các tham s ánh giá c trưng sau ây: 1. T n s : T n s c a âm ơn là s l n dao ng c a không khí truy n d n âm trong m t ơn v th i gian là 1 giây. T n s bi u th cao (pitch) c a âm thanh. T n s càng l n thì âm thanh càng cao và ngư c l i. Ðơn v o t n s c a âm thanh là Hertz (vi t t t là Hz). Tai con ngư i ch c m th ư c nh ng dao ng có t n s t kho ng 16Hz n kho ng 20000Hz. D i t n s t 16Hz n 20000Hz ư c g i là d i t n s âm thanh hay âm t n ho c sóng âm. Nh ng âm có t n s nh hơn 16Hz g i là sóng h âm, còn nh ng âm có t n s l n hơn 20000 Hz g i là sóng siêu âm và con ngư i không c m nh n ư c các sóng âm này nhưng có khá nhi u loài v t có th c m nh n ư c (ví d loài dơi có th nghe ư c sóng siêu âm). Sóng âm, sóng siêu âm và h âm không ch truy n trong không khí mà còn có th lan truy n t t nh ng môi trư ng r n, l ng, do ó s d ng r t nhi u trong các thi t b máy móc hi n nay. ng v i m i t n s dao ng f, có chu kỳ dao ng T là m t bư c sóng λ c a âm thanh ư c xác nh theo bi u th c λ = c.T (c là t c lan truy n c a âm thanh trong không khí = 340m/s). Do ó, bư c sóng c a âm thanh trong d i âm t n là t 21.25m n 0.017m. Trong th c t , m t âm phát ra thư ng không ph i là m t âm ơn mà là m t âm ph c bao g m m t âm ơn và m t s âm hài có t n s g p 2, 3 ho c 4… l n âm ơn. Ngoài ra, trong d i âm t n ngư i ta chia ra: ti ng tr m t 16Hz n 300Hz; ti ng v a t 12
- X lý âm thanh và hình nh Chương 2:K thu t x lý âm thanh 300Hz n 3000Hz và ti ng b ng (ti ng thanh) 3000Hz n 12000Hz. Ti ng nói con ngư i thư ng có d i t n s t 300Hz n 3400Hz. 2. Áp su t âm thanh: Áp su t âm thanh hay còn g i là thanh áp. Âm thanh truy n lan n âu thì làm thay i áp su t không khí ó. Áp su t do âm thanh t o thêm ra m t i m g i là thanh áp i m ó. ơn v o thanh áp là bar. M t bar là thanh áp tác ng lên m t di n tích 1cm2 m t l c là 1dyn. 1 bar = 1dyn/cm2. Tuy nhiên, ngày nay, ngư i ta thư ng dùng ơn v Pascan (Pa) o thanh áp. 1 bar = 10 Kpa; 1 Pa = 1 N/m2. 3. Công su t âm thanh: Là năng lư ng âm thanh i qua m t di n tích S trong th i gian m t giây. Công su t âm thanh P có th tính b ng bi u th c: (2.1) P = p.S.v Trong ó p là thanh áp, v là t c dao ng c a m t ph n t không khí t i ó và S là di n tích. Công su t âm thanh tính theo ơn v oát (W). Thông thư ng máy bay ph n l c có công su t âm thanh là 10.000W; ô tô v n t i phóng nhanh: 0.12W; nói chuy n bình thư ng: 0.0003W. 4. Cư ng âm thanh: Cư ng âm thanh I là công su t âm thanh i qua m t ơn v di n tích là 1cm2. (2.2) I = P/S = p.v Ba i lư ng: áp su t âm thanh, công su t âm thanh; cư ng âm thanh g n li n v i nhau. C ba u bi u th l n nh c a âm thanh. Âm thanh có năng lư ng càng l n thì công su t, cư ng và áp su t c a âm thanh càng l n. 5. Ð m nh (Intensity): Do biên dao ng c a v t th quy t nh. Biên dao ng là tr s l n nh t mà dao ng t t i trong m t n a chu kì. Biên dao ng càng l n, âm thanh càng vang to và ngư c l i. Ðơn v o m nh c a âm thanh là décibel (vi t t t là dB). Trong l i nói c a m t ngư i, m nh c a âm thanh là y u t cơ b n t o nên âm lư ng c a âm và tr ng âm c a t . 6. Ð dài (Length): Do th i gian dao ng c a v t th quy t nh. Ð dài c a âm thanh t o nên s tương ph n gi a các b ph n c a l i nói, là y u t t o nên tr ng âm, t o nên các nguyên âm i l p nhau v dài. Hai t "tang" và "tăng" trong ti ng Vi t có s i l p âm a dài (trong "tang") và âm a ng n (trong "tăng"). 7. Âm s c (Timbre): Ph thu c vào cao, dài và m nh tham gia b sung vào các thành ph n k t c u c a âm. Ðây là v riêng bi t c a m t âm. Âm s c ư c quy t nh b i: th ch t c a v t th dao ng, tính ch t ph c h p do hi n tư ng c ng hư ng âm thanh và phương pháp làm cho v t th dao ng. M t âm có cùng cao, m nh, dài ư c phát ra t dây tơ s khác v i t m t dây ng; t m t ng sáo to dài, s khác v i t m t ng sáo nh , ng n; t vi c g y s khác v i t vi c gõ, búng, c xát ho c th i. 13
- X lý âm thanh và hình nh Chương 2:K thu t x lý âm thanh Âm s c chính là cái s c thái riêng c a t ng âm. Âm s c còn ư c quy t nh b i v t th dao ng theo chu kì u n hay không u n; dao ng theo chu kì u n thì t o ra âm vang (sonants), chu kì không u n thì t o ra âm n hay âm có nhi u ti ng ng (non - sonants ho c bruyants). X lý âm thanh bao g m nhi u lĩnh v c khác nhau, và t t c u liên quan n s hi n di n c a âm thanh i v i ngư i nghe. Chúng bao g m: (1) Tái t o l i âm nh c v i trung th c cao (high fidelity music) như là âm thanh các ĩa Compact (CD – audio compact discs); (2) Vi n thông tho i ho c là các m ng i n tho i; (3) t ng h p tho i (synthetic speech) mà ó các máy tính t o và nh n d ng các m u tho i c a con ngư i. Các lĩnh v c c th liên quan n x lý âm thanh (trong ó có tho i) bao g m: Nén âm thanh, tho i, nh n d ng ti ng nói; t ng h p ti ng nói; nâng cao ch t lư ng (enhancement) và h i ph c ti ng nói (restoration). Nén các tín hi u tho i có r t nhi u ng d ng, ví d như trong công ngh thông tin di ng s có nhi u ngư i s d ng dùng chung băng t n s . Nói cách khác, k thu t nén cho phép nhi u ngư i s d ng chia s tài nguyên c a h th ng hơn và làm cho vi c s d ng tài nguyên h th ng có hi u qu hơn. M t ví d khác n a là lưu tr tho i s (các máy tr l i i n tho i t ng), v i m t dung lư ng b nh cho trư c, nén cho phép lưu nhi u b n tin dài hơn. có th x lý âm thanh/tho i c n hi u rõ ư c các cơ s c a quá trình t o ra ti ng nói và c trưng h th ng thính giác con ngư i. 2.1.2. Các c i m c a h th ng thính giác con ngư i 2.1.2.1. C u trúc tai ngư i H th ng thính giác c a con ngư i - Tai ngư i là m t cơ quan c c kỳ ph c t p. Hình 2.1 minh h a nh ng k t c u chính c a tai ngư i. Tai ngoài (outer ear) g m có hai ph n, vành tai – l p da và s n, g n vào phía c nh bên c a u và ng tai có ư ng kính 0.5cm và c m sâu vào trong u kho ng ch ng 3cm. Cơ c u tai ngoài này d n hư ng âm thanh t môi trư ng bên ngoài t i các cơ quan nh y c m là tai gi a và tai trong n m an toàn trong h p s c a ngư i. Cu i ng tai là m t màng m ng ư c g i là màng nhĩ (tympanic membrane) hay còn g i là tr ng tai (ear drum). Các sóng âm thanh p vào màng nhĩ và làm cho nó rung ng. Tai gi a là m t t p h p các xương nh có nhi m v truy n nh ng rung ng c a màng nhi t i c tai (cochlea) hay còn g i là tai trong (inner ear), mà ó nh ng rung ng ư c bi n i thành các xung th n kinh (neural impulses). Tai trong là m t ng nh có ch a dung d ch ch t l ng, có ư ng kính kho ng 2 mm và dài kho ng 3 cm. M c d u ư c minh h a d ng du i th ng hình 2.1, trên th c t , tai trong ư c cu n l i và trông 14
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Xử lý âm thanh và hình ảnh: Chương 2 - GV. Lê Nhật Thăng
75 p | 288 | 49
-
Bài giảng Xử lý tiếng nói - Trịnh Văn Loan
30 p | 294 | 40
-
Bài giảng Xử lý số tín hiệu - Chương 4: Bộ lọc FIR và tích chập
34 p | 266 | 36
-
Bài giảng Xử lý nhiệt đồ hộp
97 p | 176 | 29
-
Bài giảng Xử lý âm thanh và hình ảnh: Chương 1 - GV. Lê Nhật Thăng
25 p | 132 | 22
-
Bài giảng Xử lý âm thanh và hình ảnh: Chương 3 - GV. Lê Nhật Thăng
121 p | 140 | 17
-
Bài giảng Xử lý tín hiệu số và ứng dụng - Chương 4: Vi xử lý tín hiệu số
75 p | 17 | 5
-
Bài giảng Xử lý tín hiệu số và ứng dụng - Chương 1: Khái niệm chung
28 p | 16 | 5
-
Bài giảng Xử lý số tín hiệu: Giới thiệu môn học - TS. Chế Viết Nhật Anh
10 p | 61 | 3
-
Bài giảng Xử lý tín hiệu số: Chương 2 - ThS. Bùi Thanh Hiếu
50 p | 9 | 3
-
Bài giảng Xử lý tin hiệu số với FPGA: Chương 4 - Hoàng Trang
28 p | 3 | 2
-
Bài giảng Xử lý tin hiệu số với FPGA: Chương 3 - Hoàng Trang
22 p | 4 | 2
-
Bài giảng Xử lý tin hiệu số với FPGA: Chương 2 - Hoàng Trang
24 p | 2 | 2
-
Bài giảng Xử lý tin hiệu số với FPGA: Chương 1 - Hoàng Trang
55 p | 4 | 2
-
Bài giảng Xử lý tín hiệu số: Chương 4 - ThS. Bùi Thanh Hiếu
37 p | 5 | 2
-
Bài giảng Xử lý tín hiệu số: Chương 3 - ThS. Bùi Thanh Hiếu
70 p | 5 | 2
-
Bài giảng Xử lý tín hiệu số: Chương 1 - ThS. Bùi Thanh Hiếu
25 p | 6 | 2
-
Bài giảng Xử lý số tín hiệu: Chương 5 - TS. Chế Viết Nhật Anh
15 p | 58 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn