intTypePromotion=1

Bài giảng Kỹ thuật audio và video - Chương 1: Tổng quan

Chia sẻ: Estupendo Estupendo | Ngày: | Loại File: PDF | Số trang:24

0
118
lượt xem
14
download

Bài giảng Kỹ thuật audio và video - Chương 1: Tổng quan

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Kỹ thuật Audio và Video - Chương 1: Tổng quan gồm có những nội dung chính sau: Tổng quan về multimedia, khái niệm chung về audio và video, hệ thống audio-video, một số vấn đề về tín hiệu. Mời các bạn cùng tham khảo để biết thêm các nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Kỹ thuật audio và video - Chương 1: Tổng quan

  1. MULTIMEDIA MULTIMEDIA 1 TÀI LIỆU THAM KHẢO • CMPT 365 Course Contents, Spring 2000, Website: http://www.cs.sfu.ca/CourseCentral/365/li/index.html • “Principles of Digital Audio”, Ken C.Pohmanm Fourth Edition McGraw-Hill. • “Digital Video processing”, A. Murat Tekalp, University of Rochester, Prentice Hall PTR. • “Multimedia processing”, Andrew Calway, COMS72200. • “Fundamentals of Digital Image Processing”., Anil.K.Jan, Prentice Hall, 1996. • MPEG Home Page, http://www.cselt.it/mpeg/ • “Emerging Wireless Multimedia Services and Technologies”, JohnWileySons, Aug 2005 • “Multimedia Content and the Semantic Web Standards Methods and Tools”, John Wiley Sons, Jun 2005 • “Introduction To Digital Audio Signal Processing”, Davide Rocchesso, 2003 Page 2
  2. NỘI DUNG • TỔNG QUAN • KỸ THUẬT AUDIO • KỸ THUẬT VIDEO Page 3 TỔNG QUAN 4
  3. TỔNG QUAN • TỔNG QUAN VỀ MULTIMEDIA • KHÁI NIỆM CHUNG VỀ AUDIO VÀ VIDEO • HỆ THỐNG AUDIO-VIDEO • MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU Page 5 TỔNG QUAN VỀ MULTIMEDIA • Lịch sử phát triển của hệ thống ña môi trường – Báo, tạp chí - môi trường: văn bản, ñồ hoạ và hình ảnh. – Cáp ñồng: môi trường truyền tải tín hiệu ñiện. – 1895, Guglemo Marconi phát minh ra máy radio ở Pontechio – Ý, môi trường chuyển tải tín hiệu audio quảng bá hiện nay. – Truyền hình, môi trường truyền thông của thế kỷ 20, truyền hình ảnh và âm thanh ñến mọi nơi. – Các hệ thống máy tính tích hợp nhiều dạng môi trường số khác nhau, khả năng biểu diễn, tương tác với các dạng thông tin, tiềm năng lớn phục vụ nhu cầu trao ñổi thông tin chất lượng cao. – Các hệ thống ña môi trường trở nên phong phú, kết hợp các công nghệ khác nhau với khả năng di ñộng, liên lạc từ xa dưới nhiều hình thức. Page 6
  4. TỔNG QUAN VỀ MULTIMEDIA ðồ hoạ Văn bản thường (tuyến tính) Âm Siêu văn thanh bản Siêu văn bản Video Siêu môi trường Hình 1-1 Hypertext, Hypermedia Page 7 TỔNG QUAN VỀ MULTIMEDIA • Siêu môi trường và ña môi trường (hypermedia – multimedia) – Hypertext: “Siêu văn bản là một tài liệu không tuyến tính, bằng cách kích vào một ñiểm nóng nào ñó trên văn bản, nó có thể chuyển ñến một tài liệu hay một văn bản khác, rồi có thể quay về, thuận tiện cho người ñọc trong việc duyệt văn bản hoặc muốn tổng quan một văn bản từ phần mục lục”. (Ted Nelson ,1965) – Hypermedia: Bao gồm nhiều môi trường truyền thông khác nhau như ñồ thị, hình ảnh, âm thanh, hoạt hình và ảnh ñộng. (Ted Nelson). – Multimedia: thông tin máy tính có thể ñược mô tả bằng audio, video hay hoạt hình ngoài những môi trường truyền thống. Page 8
  5. TỔNG QUAN VỀ MULTIMEDIA • Ví dụ một số ứng dụng multimedia: • Hệ thống xây dựng và soạn thảo video số. • Tạp chí ñiện tử. • Trò chơi. • Thương mại ñiện tử. • Truyền hình tương tác iTV. • Truyền hình hội nghị. • Truyền hình theo yêu cầu. • Thực tế ảo. • ... Page 9 TỔNG QUAN VỀ MULTIMEDIA • Các dạng môi trường và tín hiệu: dạng môi trường liên tục audio video animation rời rạc images text graphic gốc tín hiệu thu nhận tổng hợp Hình 1-2 Dạng môi trường Page 10
  6. TỔNG QUAN VỀ MULTIMEDIA Hình 1-3 Thu nhận và tổng hợp Page 11 TỔNG QUAN VỀ MULTIMEDIA • Âm thanh (audio) • Âm thanh: Là dao ñộng sóng âm gây ra áp lực làm dịch chuyển các hạt vật chất trong môi trường ñàn hồi làm tai người cảm nhận ñược các dao ñộng này. Tai người có thể nghe ñược trong khoảng tần số từ 20Hz ñến 20kHz. • Âm thanh tự nhiên: Là sự kết hợp phức giữa các sóng âm có tần số và dạng sóng khác nhau. • Dải ñộng của tai: Giới hạn bởi ngường nghe thấy (0dB) ñến ngưỡng ñau (120dB) của người. • Ngưỡng nghe tối thiểu: Mức thấp nhất của biên ñộ mà tai người có thể cảm nhận ñược âm thanh tuỳ thuộc vào từng người, mức áp lực và tần số của âm thanh. Page 12
  7. TỔNG QUAN VỀ MULTIMEDIA • Hiệu ứng che khuất âm thanh: Hiện tượng âm thanh mà tại ñó ngưỡng nghe của một âm tăng lên trong khi có mặt của một âm khác (khó nghe hơn). ðược sử dụng trong kỹ thuật nén. • Hướng âm thanh: Tai và não có thể giúp ta xác ñịnh hướng âm thanh, ñiều này có thể ứng dụng ñể tạo các hiệu ứng âm thanh như stereo, surround. • Vang và trễ: Vang là hiện tượng kép dài âm thanh sau khi nguồn âm ñã tắt. Trễ là thời gian τ âm thanh phản xạ ñến ñích so với âm thanh trực tiếp. Nếu τ>50ms thì trễ ñó gọi là tiếng vọng. Biên ñộ của âm thanh cứ sau 1 lần phản xạ thì bị suy giảm. • Âm nhạc: Là âm thanh có chu kỳ ở những tần số mà tai người cảm nhận một cách dễ chịu, êm ái, ñược kết hợp một cách phù hợp. Âm nhạc gồm cao ñộ, âm sắc và nhịp ñiệu. Page 13 TỔNG QUAN VỀ MULTIMEDIA • Video • Tín hiệu video: Là sự tái tạo ảnh tự nhiên với những khoảng cách về không gian, thời gian hoặc cả hai. • Ảnh tự nhiên: ñược tạo nên từ các nguồn sáng mặt trời hay ánh sáng nhân tạo phản xạ lên các vật thể mà ta có thể nhìn thấy ñược. • Ảnh: Là một ma trận các ñiểm ảnh mang thông tin về ñộ chói và màu sắc. • Sự lưu ảnh: Khả năng lưu hình của mắt trong một giây. Mắt có thể lưu ñược 24 hình trong một giây. Chọn số hình trong một giây của ảnh ñộng phù hợp Page 14
  8. TỔNG QUAN VỀ MULTIMEDIA • ðộ chói: Là biên ñộ của thành phần trong ảnh (pixel). • Ví dụ tín hiệu chói Y ñược tổng hợp bởi các tín hiệu RGB theo công thức: • EY=0,299ER+0,587EG+0,114EB (1-2) • Thông tin màu ñược xác ñịnh: • EB-EY=0,587EG+0,889EB+0,229ER • ER-EY=0,587EG+0,114EB+0,701ER (1-3) • ðộ tương phản: Tỷ số của ñộ chói thành phần sáng nhất so với ñộ chói của thành phần tối nhất. Page 15 TỔNG QUAN VỀ MULTIMEDIA • Hệ thống audio tương tự Tiền khuếch ñại Khuếch ñại Nguồn âm Xử lý Xuất Lưu trữ Hình 1-4 Hệ thống audio tương tự Page 16
  9. HỆ THỐNG AUDIO-VIDEO • Hệ thống video tương tự Chuyển ñổi Xử lý tín hiệu ảnh- tín hiệu Cảnh tự Ống kính nhiên Tạo xung Ảnh tái tạo ñồng bộ Chuyển ñổi Lưu trữ hoặc Xử lý tín hiệu tín hiệu - ảnh truyền dẫn Mắt Tách xung người ñồng bộ Hình 1-5 Hệ thống Video tương tự Page 17 HỆ THỐNG AUDIO-VIDEO • Hệ thống audio-video số: Nguồn tín hiệu Chuyển ñổi (Analog) Analog - Digital Xử lý, Lưu trữ, Truyền dẫn (Digital) Xuất âm, Chuyển ñổi hiển thị Digital - Analog (Analog) Hình 1-6 Hệ thống audio-video số Page 18
  10. HỆ THỐNG AUDIO-VIDEO • Các thành phần của hệ thống: – Bộ phận thu: Micro và Camera thu và chuyển tín hiệu (âm thanh hoặc ảnh) sang tín hiệu ñiện tương tự. ðối với các hệ thống số phải thực hiện việc chuyển ñổi tương tự sang số. – Lưu trữ: Thiết bị lưu trữ là băng từ hoặc ñĩa từ. Có thể là các thiết bị riêng biệt sử dụng với muc ñích thuận tiện và yêu cầu một chất lượng nào ñó. – Xử lý tín hiệu: ðiều chỉnh ñặc tuyến tần số, màu sắc, tạo hiệu ứng.. – Truyền dẫn: Truyền tín hiệu từ vị trí này sang vị trí khác với một khoảng cách không gian nào ñó qua một môi trường truyền dẫn nào ñó. Page 19 HỆ THỐNG AUDIO-VIDEO • Phân loại các hệ thống Audio-Video: Lớp hệ thống Giá Chất Dễ sử Linh Khả năng Yếu tố quan lượng dụng hoạt mở rộng trọng nhất A-V gia ñình Giá, dễ sử dụng Bán chuyên Chất lượng, giá nghiệp Cầu hội thảo Nén video Phân phối video Khả năng lưu trữ Sản xuất studio Chất lượng, linh họat Sản xuất chương Cơ ñộng, dễ sử trình ngoài trời dụng Sản xuất hậu kỳ Chất lượng, linh họat Máy tính cá nhân Toàn bộ Page 20
  11. HỆ THỐNG AUDIO-VIDEO • Hệ thống Audio – Video dân dụng: – Xây dựng hoặc tạo lại một số chương trình nhất ñịnh – Ghi, lưu trữ những sự kiện cá nhân. – Hầu hết các chương trình ñược thu và tạo ra tại chỗ. – Hệ thống ñáp ứng nhu cầu giá thành thấp, dễ sử dụng ñể phổ biến rộng rãi. – Sử dụng phương pháp sản xuất hậu kỳ với chất lượng giới hạn nhất ñịnh. – ða hệ và tương thích với mọi tiêu chuẩn. – Mối quan tâm của các nhà sản xuất. Page 21 HỆ THỐNG AUDIO-VIDEO • Hệ thống Audio-Video dân dụng VCR, VCD, DVD Camera Interface card PAL, NTSC Hình 1-7 Hệ thống Audio – Video dân dụng Page 22
  12. HỆ THỐNG AUDIO-VIDEO • Hệ thống Audio – Video bán chuyên dụng Interface card Camera VCR, VCD, DVD VCR, VCD, DVD Băng, ñĩa PAL, NTSC Băng, ñĩa Tới khách hàng Hình 1-8 Hệ thống Audio – Video bán chuyên dụng Page 23 HỆ THỐNG AUDIO-VIDEO • Hệ thống phân phối: – Tập hợp chương trình thành một dòng dữ liệu ñể phát quảng bá, truyền hình cáp hay vệ tinh. – Khả năng chuyển tải ñến người xem thông qua máy phát, mạng hay một phương thức nào ñó. – Máy chủ phải ñáp ứng khả năng lưu trữ ñối với tín hiệu nhằm tạo ñường truyền thông suốt giữa các chương trình. – Yêu cầu tự ñộng cao, giảm chi phí nhân công. – Truyền hình tương tác yêu cầu khả năng xử lý và chất lượng ñường truyền khá cao, ñồng thời hệ thống phải có khả năng phát các chương trình khác nhau trong cùng thời ñiểm. Page 24
  13. HỆ THỐNG AUDIO-VIDEO • Hệ thống Audio – Video studio sản xuất chương Cam1 trình Camera1 Cam2 Camera2 Cam3 Camera3 Cam4 Camera4 VCR1 VCR2 VCR3 EFF EFF2 EFF1 VCR1 LINE LINE Bộ tạo ðầu ra video VCR2 VCR1 kỹ VCR2 xảo VCR3 VCR3 Page 25 Hình 1-9 Hệ thống Audio – Video studio sản xuất chương trình HỆ THỐNG AUDIO-VIDEO • Hệ thống sản xuất chương trình ngoài trời: – ðược sử dụng ñể thu các bản tin hay một chương trình nào ñó mà không cần nhiều người thực hiện, thường sử dụng các thiết bị cầm tay. – Các chương trình truyền trực tiếp thì hệ thống có thể là các hệ thống cố ñịnh nhưng với quy mô nhỏ và chất lượng thấp hơn. – Yêu cầu tính cơ ñộng cao. – Camera ñược nối với máy ghi riêng mà khôg sử dụng ma trận chuyển mạch. – Máy ghi âm ña ñường ñược sử dụng ñể thuận tiện trong hậu kỳ âm thanh nhưng phải yêu cầu ñồng bộ với hình. Page 26
  14. HỆ THỐNG AUDIO-VIDEO • Hệ thống sản xuất hậu kỳ TITL1 Bộ tạo tiêu ñề GRPH1 Bộ tạo ñồ họa Cam1 Camera copy VCR1 VCR2 VCR3 EFFA EFFB EFFB1 EFFB2 VCR1 EFFA1 EFFA2 VCR2 Kỹ Kỹ xảo VCR3 xảo B A BỘ ðIỀU KHIỂN DỰNG Hình 1-10 Hệ thống Audio – Video sản xuất hậu kỳ Page 27 HỆ THỐNG AUDIO-VIDEO • Hệ thống cầu hội thảo Monitor Camera Bộ xử lý và Micro ñiều khiển số Vị trí A Audio Máy chiếu Vị trí B Monitor Camera Bộ xử lý và Micro ñiều khiển số Audio Máy chiếu Hình 1-11 Hệ thống cầu hội thảo Page 28
  15. HỆ THỐNG AUDIO-VIDEO • Hệ thống audio video trong PC – PC dùng ñể trình diễn, lưu trữ, xử lý âm thanh, hình ảnh. – ðiều khiển bằng phần mềm chuyên dụng kết hợp với các card ñồ họa, xử lý kỷ xảo. – ða dạng về tiêu chuẩn dẫn ñến khó tương thích. – Có thể yêu cầu nhiều dạng card thích ứng khác nhau và có thể sử dụng hơn một màn hình ñể hiển thị. – Dữ liệu có thể yêu cầu nén và giải nén vì phạm vi ứng dụng khả rộng. Page 29 MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU • Tín hiệu và hàm – Tín hiệu tương tự là hàm theo thời gian. – Biên ñộ âm thanh ñược biểu diễn bằng mức ñộ âm thanh tại thời ñiểm ñã cho. – Tín hiệu ñược biểu diễn bằng hàm f(t). • Tín hiệu có chu kỳ – Sự lặp lại trong một khoảng thời gian ngắn nhất không ñổi của tín hiệu gọi là chu kỳ T. – Tần số là nghịch ñảo của chu kỳ: u=1/T. Biên ñộ f(t0) Thời gian t0 t Hình 1-7 Biểu diễn biên ñộ-thời gian Page 30
  16. MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU • Phân tích Fourier – Trong thực tế, rất ít khi ta có ñược một tín hiệu ñơn tần, mà thông thường là các tín hiệu phức tạp, kết hợp bởi nhiều tần số và các hài của nó. – Việc phân tích Fourier cho kết quả là tổng của các hàm sin và cosin của các tần số khác nhau. • Phân tích Fourier một chiều: ∞ F(u)=FR(u)+jFI(u) − j 2π ut F (u ) = ∫ −∞ f (t )e dt ∞ F (u ) = FR2 (u ) + FI2 (u ) f (t ) = ∫ F (u )e j 2π ut du FI (u ) θ (u ) = arctan( ) −∞ FR (u ) F (u ) = FR (u ) + jFI (u ) = F (u ) e jθ (u ) Page 31 MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU • Phổ tần số – Sự phân bố của |F(u)| gọi là phổ tần của tín hiệu. – Tín hiệu biến thiên chậm thì phổ tần tập trung ở tần số thấp và ngược lại. Từ ñó hình thành tín hiệu tần số thấp và tần số cao. Biên ñộ phổ |Fu| Tần số (u) Page 32
  17. MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU • Tín hiệu Audio và Video – Tín hiệu âm thanh thường là tín hiệu một chiều. – Tín hiệu ảnh là tín hiệu hai chiều. – Tín hiệu Video là tín hiệu 3 chiều. – Với các chiều khác nhau, ta sẽ có số biến khác nhau tương ứng. • Chuyển ñổi Fourier 2 chiều ∞ ∞ − j 2π ( ux + vy ) F (u , v ) = ∫ ∫ f ( x, y ) e − ∞− ∞ dxdy ∞ ∞ e− j 2π (ux+vy) = e− j 2πuxe− j 2πvy j 2π ( ux + vy ) f ( x, y ) = ∫ ∫ F (u, v)e − ∞− ∞ dudv Page 33 MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU • Mằu sắc – Việc kết hợp các màu khác nhau tạo nên một màu mới. Thông thường, chọn các màu cơ bản ñể kết hợp, ví dụ RGB Red Yellow Magenta White Green Blue Hình 1-8 Lý thuyết 3 màu RGB Page 34
  18. MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU • Không gian cảm quan màu 3 chiều: – Con người cảm quan màu sắc ở các khía cạnh sau: brightness: ñộ sáng như thế nào. hue: màu nào. saturation: sự tinh khiết – Sự cảm quan này ñối với mỗi người là mỗi khác biệt, do ñó, không thể so ñược giữa người này với người kia. Hình 1-9 Cảm quan 3 chiều Page 35 NÉN DỮ LIỆU • ðại lượng ño thông tin – Lượng thông tin trong tín hiệu có thể không bằng lượng dữ liệu của nó mà quan hệ mật thiết với xác suất xuất hiện của nó. • Tự-thông tin (lượng tin) – Thông tin ñược mang bởi một biến cố A có xác suất xuất hiện P[A] là: 1 IA I A = log 2 = − log 2 P [ A ] P [ A] – Thông tin không (lượng tin =0): • Mặt trời mọc ñằng ñông. – Lượng tin ít • Máy ñiện thoại di ñộng trong tương lai ñều có P[A] khả năng multimedia – Lượng tin nhiều: 0 1 • Trường ðKBK ðN ñược xếp hạng nhất trên thế giới về ðTVT Page 36
  19. NÉN DỮ LIỆU • Entropy – Lượng tin trung bình của nguồn tin, một cách gần ñúng, là số bit trung bình của thông tin yêu cầu ñể biểu diễn các ký hiệu của nguồn tin. – Với nguồn N ký hiệu Xi thì entropy ñược ñịnh nghĩa như sau: N H ( S ) = −∑ P [ X i ] log 2 P [ X i ] i =1 • H(S)≥0; ñối với mã hoá nhị phân, H(S) thể hiện mã hoá với số bít/ký hiệu tối thiểu. • Ví dụ: Trong một ảnh phân bố ñều ở thang xám (256 mức): pi=1/256, số bit mã hoá cho mức xám là log2256=8bits. Entropy của ảnh này là H(S)=Σpilog2(1/pi)=8bits/ký hiệu. Vậy, trong trường hợp phân bố ñều này, mã hoá ñộ dài cố ñịnh sẽ ñạt ñược số bit tối thiểu. Trong trường hợp tổng quan thì mã hóa ñộ dài cố ñịnh sẽ không hiệu quả. Page 37 NÉN DỮ LIỆU • Mã hoá ñộ dài cố ñịnh FLC (Fixed-Length Code) – ðặc ñiểm: • Sử dụng số bit cố ñịnh ñể biểu diễn mọi ký hiệu của nguồn. • ðơn giản trong quá trình mã hoá/giải mã. – Ví dụ • Mã ASCII (American Standard Code for Information Interchange) sử dụng 8 bits ñể mã hoá các ký tự. – Truyền chuỗi: DTVT: 68 84 86 84: 01101000 10000100 10000110 10000100 – Nhược ñiểm: • Không hiệu quả Page 38
  20. NÉN DỮ LIỆU • Mã hoá ñộ dài thay ñổi VLC (Variable-Length Code) – ðặc ñiểm • Sử dụng số bit khác nhau ñể biểu diễn các ký tự khác nhau. • Các ký tự có xác suất xuất hiện cao ñược phân bố bởi từ mã ngắn và ngược lại. • Hiệu quả trong việc biểu diễn hơn, nén tốt hơn. – Ví dụ: • Mã Morse. • Shannon-Fano. • Huffman. • Mã hoá loạt dài (RLC). Page 39 NÉN DỮ LIỆU • Thuật toán Shannon-Fano • Ví dụ mô tả thuật toán: Ký hiệu A B C D E Số lầ xuất hiện 15 7 6 5 6 • Mã hoá theo thuật toán Shannon-Fano: - Sắp xếp các ký tự theo thứ tự giảm dần của tần suất xuất hiện. - Tính xác suất. - ðệ quy làm hai phần, mỗi phần có tổng xác suất gần bằng nhau. Mã hoá phần trên bằng bit 0 (hoặc bit 1), phần dưới bằng bit 1 (hoặc bit 0). - Vẽ sơ ñồ cây. - Tính Entropy, số bits mã hoá trung bình và số bit mã hoá thông thường. - Nhận xét. Page 40
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2