intTypePromotion=1

Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh

Chia sẻ: NGuyễn Hữu Quang | Ngày: | Loại File: DOC | Số trang:98

0
112
lượt xem
30
download

Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nén dữ liệu hình ảnh và video đề cập đến một quá trình mà trong đó lượng dữ liệu sử dụng mà tiêu biểu là hình ảnh và video được nén xuống để đáp ứng yêu cầu về tốc độ bít (thấp hơn hoặc bằng giá trị tốc độ bít tối đa), trong khi chất lượng của tái tạo hình ảnh và video đáp ứng 1 yêu cầu dành cho 1 ứng dụng nào đó và độ phức tạp tính toán ở mức phải chăng dành cho 1 ứng dụng....

Chủ đề:
Lưu

Nội dung Text: Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh

  1. Luận văn Xử lí âm thanh và hình ảnh hoàn chỉnh 1
  2. MỤC LỤC DANH MỤC HÌNH VẼ, BẢNG BIỂU ........................................................................ 5 CÁC THUẬT NGỮ VIẾT TẮT .................................................................................. 7 CHƯƠNG I: GIỚI THIỆU ........................................................................................ 11 1 .1. Nhu cầu cần thiết của việc nén hình ảnh và video: .......................................... 12 1.2. Tính khả thi của việc nén hình ảnh và video:....................................................... 13 1 .2.1. Dư thừa thống kê: ........................................................................................ 13 1.2.1.1. Không gian Redundancy ....................................................................... 13 1.2.1.2 Thời gian dự phòng................................................................................ 15 1.2.1.3. Mã hóa Dự phòng. ................................................................................ 19 1 .2.2. Dự p hòng PSYCHOVISUAL ...................................................................... 21 1.2.2.1. Mặt nạ chói ................................ ................................ ........................... 22 1.2.2.2. Kết cấu m ặt nạ ...................................................................................... 25 1.2.2.3 Tần số m ặt nạ ........................................................................................ 27 1.2.2.4 Mặt nạ th ời gian ................................ ................................ ..................... 29 1.2.2.5 Mặt nạ màu ................................................................ ............................ 29 1.2.2.6. Chắn màu và ứng d ụng của nó trong việc nén Video............................. 32 1.2.2.7. Tóm tắt: Độ nhạy vi phân ..................................................................... 33 1.3. Đo lư ờng ch ất lượng hình ảnh ............................................................................. 34 1 .3.1 Đo lường ch ất lượng chủ quan ...................................................................... 35 1 .3.2. Mụ c tiêu ch ất lượng đo lường: ..................................................................... 37 1.3.2.2 Mục tiêu đo lường chất lượng: ............................................................... 39 2
  3. 1.4 Kết quả lý thuyết thông tin ................................................................................... 42 1 .4.1 Dữ liệu ngẫu nhiên (ENTROPY) ................................ ................................ .. 43 1.4.1.1 Biện pháp thông tin ................................................................................ 43 1.4.1.1. Đơn vị đo lư ờng thông tin ..................................................................... 43 1.4.1.2 Thông tin trung bình trong mỗi kí hiệu .................................................. 44 1 .4.2 Thuyết mã hóa ngu ồn Shannon ..................................................................... 44 1 .4.3 Mã hóa đ ịnh kênh nhiễu của shannon................................ ............................ 45 1 .4.4. Định lý mã hóa nguồn của shannon ............................................................. 46 1 .4.5 Định lý truyền tải thông tin ........................................................................... 47 1.5 TÓM TẮT ........................................................................................................... 47 1.6. Các bài tập .......................................................................................................... 48 CHƯƠNG 11: KHỐI KẾT HỢP ................................................................................ 50 11.1. Không chồng chéo, cách đều nhau, kích thước cố định, khối kết hợp nhỏ h ình chữ nhật ................................................................ ................................ ..................... 50 11.2. Tiêu chí kết hợp ................................................................................................ 52 11.3. Thủ tục tìm kiếm ............................................................................................... 54 11.3.1. Tìm kiếm đầy đủ. ....................................................................................... 55 11.3.2. Tìm kiếm Logarít. ...................................................................................... 55 11.3.3. Ba bước tìm kiếm đ ơn giản. ...................................................................... 57 11.3.4. Hướng tìm kiếm liên hợp. .......................................................................... 57 11.3.5. Lấy mẫu con trong cửa sổ tương quan. ....................................................... 59 11.3.6. Đa phân giải khối kết hợp. ................................................................ ......... 59 11.3.7. Ngưỡng phù h ợp với nhiều độ phân giải. ................................................... 61 3
  4. 11.4. Kết hợp chính xác ............................................................................................. 70 11.5 Giới hạn với kỹ thu ật kết hợp khối ..................................................................... 71 11.6. Những cải tiến mới................................................................ ............................ 73 11.6.1. Cấu trúc khố i kết hợp ................................................................................. 73 11.6.2. Khớp khố i đa lưới ...................................................................................... 77 11.6.3 Đoán trước sự thay đổi lĩnh vực chia nhỏ gói d ữ liệu ................................ .. 84 11.6.4. Sự thích ứng vùng phủ các khối ................................................................. 88 11.7 Tổ ng kết................................ ............................................................................. 90 11.8 - Bài tập ................................ ............................................................................. 93 4
  5. DANH MỤC HÌNH VẼ, BẢNG BIỂU Hình 1.1: Hình ảnh và video nén đ ể truyền h ình ảnh và lưu trữ. ................................ 12 Hình 1.3: Tự tương quan theo chiều ngang đối với một số hình ả nh.(Sau khi Kretzmer, 1952.) ........................................................................................................................ 17 Hình 1.4: Phổ công suấ t điển hình của mộ t tín hiệu phát sóng truyền hình. ............... 18 Hình 1.5: (a) khung 21, và (b) khung hình 22 "Hoa hậu Mỹ" ..................................... 19 Hình 1.6 Mô hình hai đơn vị xếp tầng của hệ thống th ị giác củ a con người (HVS)..... 21 Hình 1.7: Một đối tượng thống nhất với màu xám mức I1 với nền tảng là màu xám ở mức I2 ........................................................................................................................ 23 Hình 1.8 Cầu Burrard ở Vancouver. (a) hình ảnh gốc (lịch sự Shi của Minhuai). (b) Hình ảnh đồng nhất bị hỏng bởi nhiễu phụ trắng Gaussian.25 Hình 1.9 Giáng sinh tại Winorlia. (a) Bản gốc. (b)-bit lượng tử hóa. (c) Cải thiện lượng IGS với bốn bit................................................................................................. 26 Hình 1.10: Mức độ nhạ y cảm so với tần số không gian. (Sửa đổi từ Van Ness và Bouman[1967] và Mullen[1985].) ............................................................................. 34 Hình 1.11. Hệ thống xử lý âm thanh hình ảnh ................................ ............................ 37 Hình 11.1. Khố i kết h ợp. ................................................................ ............................ 51 Hình 11.2. Cửa sổ tìm kiếm và cửa sổ tương quan. .................................................... 53 Hình 11.3: (a) 2 -D lôgarít tìm kiếm thủ tục. tại điểm (j, k+2), (j+2, k+2), (j+2, k+4), và (j+1, k+4). Được tìm thấy đ ể cung cấp cho sự khác nhau tố i thiểu trong các bước 1 , 2, 3, và 4, tương ứng lôgarít tìm kiếm thủ tục. (b) A 2-D lôgarít tìm kiếm thủ tục tại điểm (j, k-2), (j +2, k-2), và (j +2, k-1) được tìm thấ y đ ể cung cấp cho sự khác nhau tối thiểu trong các bước 1 , 2, 3, và 4, tương ứng. .............................................. 56 Hình 11.4 thủ tục tìm kiếm ba bước. Điểm (j +4, k-4), (j +4, k-6), và (j +5,k-7) cung cấp cho tối thiểu sự khác nhau trong các bước 1, 2 và 3, tương ứng. ......................... 57 5
  6. Hình 11.5: Hướng tìm kiếm liên hợp. ................................ ........................................ 58 Hình 11.6: một ví dụ về lấ y mẫu con 2 x 2 trong khối ban đầu và cửa sổ tương quan cho tìm kiếm một cách nhanh chóng . ................................ ........................................ 60 Hình 11.7 Gaussian cấ u trúc kim tự tháp. ................................ ................................ .. 61 Hình 11.8: Sơ đồ chặn cho phù h ợp với ngưỡng ba cấ p độ phân giả i ........................ 64 Bảng 11.1: Các tham số được sử dụng trong nh ững thí nghiệm này........................... 64 Hình 11.10: Khung thứ 20 của chuỗi “Tàu hỏa” ...................................................... 68 Hình 11.11: Khung thứ 20 của chuỗ i “Bóng đá” ....................................................... 68 Bảng 11.2: Kết qu ả thí nghiệm .................................................................................. 69 Hình 11.12. Khung 21 tái tạo của "Hoa hậu Mỹ" trình tự bằ ng cách sử dụngmột cách giả i mã H.263 ............................................................................................................ 72 Hình 11.13: Kết hợp khối phân cấp ........................................................................... 74 Bảng 11.3: Các Kết quả thí nghiệm (II). .................................................................... 74 Bảng 11.4: Các tham số được sử dụng trong khớp khối theo thứ tự 3 mức................. 76 Hình 11.14: Một phần của bức ảnh với các điểm ảnh được xử lý trong cả 3 mức ..... 77 Hình 11.15: Cấu trúc phân cấp 3 mức khác nhau ...................................................... 78 Hinh 11.16 : S ơ đ ồ của nhiều khối kết hợp ................................................................. 80 Hình 11.18 : Khung hình thứ 20 của chuỗi “ vườn hoa”............................................ 84 Hình 11.20: Khung hìn h th ứ 20 của sự phối hợp chuỗi “bàn đánh bóng bàn” ......... 87 Hình 11.21: S ự chổng chéo của các khố i thích ứng .................................................... 89 6
  7. CÁC THUẬT NGỮ VIẾT TẮT Từ viết tắt Nghĩa Tiếng Anh Nghĩa Tiếng Việt Thời gian trễ quản Mean Administrative Delay (Series E) MAD Các thực thể bảo Maintenance Sub-Entities (Series M) MSE Tỉ số tín hiệu đỉnh trên PSNR Peak Signal to Noise Ratio nhiễu Ban tiêu chu ẩn hóa viễn International Telecommunication ITU-T Union --Telecommunication thông trong Liên minh viễn thông quốc tế Standardization Bureau signal-to -noise ratio SNR Nhiễu tạp âm Truyền hình độ nét cao HDTV High-definition television Tích h ợp quy mô rất lớn Very Large Scale Integration VLSI Ủy ban tiêu chuẩn hóa Úc Australian Telecommunications ATSC Standardisation Committee Hội Đồng Truyền Thông Federal Communications Commission FCC Liên Bang Truyền hình số Digital Television DTV Vệ tinh quảng bá trực tiếp Direct Broadcast Satellite DBS Video theo yêu cầu Video on Demand VOD 7
  8. Đổi hướng cuộc gọi Call Deflection CD Truyền hình Television TV World Wide Web Internet WWW Viện kỹ thu ật điện và điện Institute of Electrical and Electronic IEEE tử Engineers Mã phát hiện lỗ i Cyclic redundancy check CRC Điều khiển liên kết logic logical link control LLC Nhóm các chuyên gia về Motion Picture Experts MPEG hình ảnh động Group(ISO/IEC) Điều xung mã Pulse-code modulation PCM Điều ch ế xung mã vi phân Differential pulse-code modulation DPCM Điều ch ế delta Delta modulation DM Âm báo cuộc gọ i dữ liệu DCT Data Calling Tone Nhóm liên hợp các chuyên JPEG Joint Photographic Experts Group gia đồ h ọa (ISO) Suy hao quay trở về RL Return Loss Đề mục làm việc (diễn đàn Working Text (DSL Forum) WT DSL Sự khác nhau về khung Displaced Frame Difference DFD 8
  9. thay thế Mã hoá lai nhân tạo - tự Synthetic-Natural Hybrid Coding SNHC nhiên Dạng trung gian chung Common Intermediate Format CIF Hệ Thống Hình Ảnh Củ a Human visual system HVS Con Người Nhiễu trắng Gauss bổ sung Additive white gaussian noise AWGN Nhận dạng siêu danh mụ c Identify Graphic Subrepertoire (Series IGS đồ họ a T, X) Red -green-blue Mô Hình Màu RGB Ống tia cathode Cathode Ray Tube CRT Uỷ b an hệ thống truyền National Television System NTSC hình quố c gia Committee système electronique couleur avec SECAM Tiêu chuẩn tín hiệu truyền memoire hình (625 dòng, 50 Hz, 220 V) dùng ở Pháp, các nước đông Âu, Liên xô cũ và một số nước Châu Phi. CCIR International Radio Consultative Tiền thân củ a tổ chức ITU- Committee T 9
  10. Lỗi trung bình toàn Root mean square Error (Series E) RMSE phương 10
  11. CHƯƠNG I: GIỚI THIỆU Nén dữ liệu h ình ảnh và video đề cập đến một quá trình mà trong đó lượng dữ liệu sử dụng mà tiêu biểu là hình ảnh và video đư ợc nén xuống để đáp ứng yêu cầu về tốc độ bít (thấp hơn hoặc bằng giá trị tốc độ bít tối đa), trong khi chất lư ợng của tái tạo hình ảnh và video đáp ứng 1 yêu cầu d ành cho 1 ứng dụng nào đó và độ phức tạp tính toán ở mức phải chăng dành cho 1 ứng dụng. Các sơ đ ồ khối trong hình 1.1 mô tả các chức năng của nén dữ liệu hình ảnh và video trong truyền dẫn hình ảnh và lưu trữ. Việc nén dữ liệu ảnh và video được tìm thấy được cho là cần thiết dành cho các ứng dụng quan trọng bởi vì 1 lượng lớn dữ liệu sẽ làm phức tạp hóa cho các ứng dụng này và các ứng dụng khác mà nó rất thường xuyên rất lớn và vượt quá khả năng của phần cứng ngày nay b ất chấp những tiến bộ nhanh chóng trong lĩnh vực chất bán dẫn, máy tính và các ngành công nghiệp liên quan khác. Cần phải chú ý là thông tin và dữ liệu là 2 khái n iệm rất gần nhau nhưng lại khác nhau. Mô tả dữ liệu thông tin và có thể đo được số lượng. Trong bối cảnh của hình ảnh số và video, d ữ liệu thường được đo bằng số lượng các đơn vị nhị phân (bits). Trông tin được định nghĩa như là kiến thức (sự hiểu biết), các sự kiện và các tin tức theo từ điển tiếng Anh quốc tế Cambridge. Trong khi dữ liệu là sự biểu thị của kiến thức, các sự kiện và các tin tức th ì thông tin là kiến thức, sự kiện và tin tức. Tuy nhiên, thông tin cũng có thể đo lường, định lượng. Tỷ lệ bít (tốc độ mã hóa), là 1 tham số quan trọng trong nén hình ảnh và video và thường đ ược thể hiện theo 1 đơn vị là bits/sec, điều n ày rất tiện dụng trong truyền thông hình ảnh. Trong thực tế, ví dụ như trong mục 1.1 về việc giả video (1 trường hợp của truyền hình ảnh) sử dụng tốc độ bít trong thuật ngữ bits/sec hoặc bps. Trong ứng dụng lưu trữ hình ảnh, tốc độ bít thường được biểu diễn bằng 1 đơn vị là bits/pixel (bpp). Thu ật ngữ pixel là 1 từ viết tắt của các phần tử ảnh và đôi khi được gọi là PEL. Trong mã hóa nguồn thông tin, tốc độ bít đôi khi được thể hiện bằng 1 đơn vị là bit/symbol (bit/ký tự). Trong mục 1.4.2, khi thảo luận về định lý mã hóa nguồn không nhiễu, chúng ta xem xét tốc độ bít trên phương diện độ dài trung bình của các từ m ã theo đơn vị bit/symbol. Yêu cầu về chất lượng của việc tái tạo hình ảnh và video phụ thuộc vào từng ứng dụng. Trong chẩn đoán y học và 1 số đo lường khoa học, chúng ta có thể cần việc tái tạo hình ảnh và video để nhân bản hình ảnh và video gốc. Nói theo cách khác, cơ chế bảo quản thông tin được cho phép. Đây là k ỹ thuật nén không tổn thất. Trong các ứng dụng như ảnh động và ti vi, cho phép có 1 lượng thông tin nhât định bị mất mát . Đây là k ỹ thuật nén có tổn thất. Từ định nghĩa, người ta có thể thấy nén dữ liệu hình ảnh và âm thanh bao gồm 1 số khái niệm cơ b ản như thông tin, dữ 11
  12. liệu, chất lượng h ình ảnh của hình ảnh và video và độ phức tạp tính toán. Chương này đề cập đến 1 số khái niệm cơ bản trong nén hình ảnh và video. Đầu tiên, thảo luận về sự cần thiết cũng như tính khả thi của nén dữ liệu hình ảnh và video. Việc thảo luận xung quanh việc sử dụng 1 số dư th ừa tồn tại trong dữ liệu hình ảnh và video, và nhận thức trực quan về cơ quan th ị giác của con người. Từ đó chất lượng của việc tái tạo hình ảnh và video là 1 trong những mối quan tâm chính, để các biện pháp chủ quan cũng như khách quan về chất lư ợng hình ảnh được giải quyết. Từ đó, chúng ta trình bày 1 số kết quả lý thuyết thông tin cơ bản để thấy rằng nó đóng vai trò chủ chốt trong nén hình ảnh và video. Hình 1.1: Hình ảnh và video n én để truyền hình ảnh và lưu trữ. 1.1. Nhu cầu cần thiết của việc nén hình ảnh và video: Không cần ph ải nói, thị giác đóng tầm quan trọng sống còn giúp con người nhận thức, nhận biết, và hiểu th ế giới xung quanh. Với sự tiến bộ to lớn của công ngh ệ tiên tiến, đặc biệt là ở quy mô sự tích hợp mạch cỡ lớn (VLSI), và hơn bao giờ h ết video được sử dụng rộng rãi trong cuộc sống hàng ngày. Ví d ụ như videophony, hội nghị truyền hình, truyền hình độ nét cao (HDTV), và đĩa video k ỹ thuật số (DVD)… Video như là một chuỗi các khung hình video, tuy nhiên, liên quan đến một số lượng lớn dữ liệu. Chúng ta hãy xem xét một ví d ụ minh họ a. Giả sử h iện nay việc chuyển đ ổi modem m ạng điện thoại (PSTN) có thể hoạt động với tố c độ bit tố i đa là 56.600 bit mỗi giây. Giả sử mỗi khung hình video có độ phân giải là 288 và 352 (288 dòng và 352 điểm ảnh trên mỗi dòng), đó là so sánh với mộ t hình ảnh truyền hình bình thường và được gọ i là định dạng trung gian phổ biến (CIF). Ba màu cơ bản RGB (đỏ, xanh lá cây, xanh dương) được đại diện cho 1 p ixel với 8 b it, và tỷ số khung hình trong truyền tải là 30 khung hình mỗi giây để cung cấp mộ t đo ạn video chuyển động liên tụ c. Sau đó tỷ số bit yêu cầu là 288 x 352 x 8 x 3 x 30 = 72.990.720 bps. Do đó, tỷ số giữ a tỷ số bit yêu cầu và tốc độ b it lớn nh ất có thể là khoảng 1289. Nghĩa là chúng 12
  13. ta phải nén dữ liệu video ít nh ất 1289 lần đ ể thực hiện việc truyền tải được mô tả trong ví dụ n ày. Với các dịch vụ video n gày càng phức tạp như phim 3D, trò chơi 3D và video ch ất lượng cao như HDTV, việc nén dữ liệu video là cần thiết. Nó trở thành một công nghệ cho phép thu hẹp khoảng cách giữa số lượng lớn yêu cầu củ a d ữ liệu video và khả n ăng hạn ch ế của ph ần cứng. 1.2. Tính khả thi của việc nén hình ảnh và video: Trong ph ần này chúng ta sẽ thấy rằng việc n én hình ảnh và video không ch ỉ là mộ t điều cần thiết cho sự phát triển nhanh chóng của truyền thông hình ảnh kỹ thu ật số, m à nó cũng khả thi. Tính khả thi của nó thuộc về hai kiểu dư thừa, ví dụ, dư thừa thống kê và dư thừa tâm lí thị giác. Bằng cách loại bỏ các dư th ừa, chúng ta có thể nén hình ảnh và video. 1.2.1. Dư thừa thống kê: Dư thừa thống kê có thể được phân lo ại thành hai loại: dư thừa interpixel và dư thừa mã hóa. Dư thừa interpixel nghĩa là điểm ảnh của một khung hình ảnh và các điểm ảnh củ a một nhóm các hình ảnh kế tiếp hoặc khung video không phải là thống kê độc lập. Ngược lại, chúng là tương quan với mức độ khác nhau.(Lưu ý rằng sự khác biệt và mối quan hệ giữa hình ảnh và chuỗi video được th ảo luận trong Chương 10, khi chúng ta b ắt đầu th ảo luận về nén video). Mối tương quan interpixel được gọi là dư thừa interpixel( trong điểm ảnh ). Dư th ừa Interpixel có thể được chia thành hai loại, dư thừa không gian và dư th ừa thời gian. Bằng cách mã hóa d ư thừ a, dư th ừa thống kê liên quan đến k ỹ thuật mã hóa. 1.2.1.1. K hông gian Redundancy Không gian dự phòng đại diện cho mối tương quan th ống kê giữa các điểm ảnh trong một khung h ình ảnh. Do đó nó còn được gọi là intraframe d ự ph òng. Nó cũng được biết rằng đối với hầu hết đúng mẫu TV tín hiệu tự tương quan bình thường h ệ số cùng một h àng (ho ặc một cột) với một sự thay đổi một điểm ảnh là rất gần với giá trị tối đa là 1. Đó là, các giá trị cường độ của các điểm ảnh cùng một hàng (hoặc một cột) có tự tương quan rất cao (Gần với tự tương tối đa) với những điểm ảnh dọc theo cùng một hàng (hoặc tương tự cột), nhưng thay đ ổi bởi một điểm ảnh. Điều n ày không có gì đáng ngạc nhiên bởi vì cường độ giá trị thay đổi liên tục từ điểm ảnh cho điểm ảnh trong một khung hình ảnh ngoại trừ các khu vực cạnh. Điều n ày được thể hiện trong hình 1.2. Hình 1.2 (a) là một h ình ảnh bình thư ờng - một cậu bé và một cô gái trong 13
  14. công viên, và có độ phân giải 883 x 710. Cường độ hồ sơ dọc theo dòng 318 và 262 cột được mô tả trong hình 1.2 (b) và (c), tương ứng. Để tham khảo dễ d àng, vị trí của các 318 dòng và 262 cột hình ảnh được hiển thị trong h ình 1.2 (d). Đó là, trục thẳng đứng đ ại diện cho giá trị cường độ, trong khi trục ngang cho biết vị trí pixel trong hàng hoặc cột. Hai lô (thể hiện trong hình 1.2 (b) và 1.2 (c)) chỉ ra các giá trị cường độ thường xuyên thay đổi dần dần từ một trong những điểm ảnh khác dọc theo hàng một và cùng một cột. Nghiên cứu về các tính chất thống kê của tín hiệu video có thể được truy trở lại những năm 1950. Biết Kretzmer thiết kế m à chúng ta ph ải nghiên cứu và hiểu dự phòng để loại bỏ sự dư thừa, một số thiết bị thử nghiệm như một autocorrelator hình ảnh và một probabiloscope để đo lường một số thống kê số lượng tín hiệu truyền hình và xu ất bản tác phẩm xuất sắc của m ình (Kretzmer, 1952). Ông thấy rằng tự tương trong cả hai hướng ngang và thẳng đứng trưng bày các hành vi tương tự, như thể hiện trong hình 1.3. Tự tương quan ch ức năng của một số hình ảnh phức tạp khác nhau đ ược đo. Nó được tìm thấy rằng các hình ảnh, hình d ạng của tự tươn g quan đường cong dao động từ nhiều tuyến tính để phần nào theo cấp số nhân.Đối xứng trung tâm đối với các trục thẳng đứng và phân phối hình chuông, tuy nhiên, vẫn giống nhau. Khi các điểm ảnh thay đổi trở n ên nhỏ, nó đ ã được tìm thấy rằng tự tương quan cao. Tự tương quan này "địa phương" có thể cao 0,97-0,99 cho một hoặc hai điểm ảnh thay đổi.Đối với hình ảnh rất chi tiết, nó có thể đ ược từ 0,43 đến 0,75. Nó cũng được tìm th ấy rằng tự tương quan không có hướng ưa thích. Biến đổi Fourier của tự tương quan, quang phổ điện, được biết đến như một quan trọng chức năng trong nghiên cứu hành vi thống kê. Hình 1.4 cho thấy một quang phổ năng lượng điển hình của truyền hình tín hiệu (Fink, 1957; Connor và cộng sự, 1972). Đó là thông báo rằng quang phổ khá bằng phẳng cho đến khi 30 kHz cho một tín hiệu truyền hình phát sóng. Ngoài phổ tần số dòng này bắt đầu giảm với tốc độ khoảng 6 dB cho mỗi quãng tám. Điều này cho thấy nồng độ nặng của các tín hiệu video tần số thấp, xem xét danh nghĩa của một băng thông 5 MHz. Không gian dư thừa h àm ý rằng giá trị cường độ của một điểm ảnh có thể đư ợc đoán tối đa láng giềng pixels. Nói cách khác, nó không phải là cần thiết để đại diện cho mỗi điểm ảnh trong một khung hình ảnh độc lập. Thay vào đó, người ta có thể dự đoán một điểm ảnh từ các nước láng giềng. Đoán trước m ã hóa, cũng đư ợc biết đến như mã hóa khác biệt, dựa trên quan sát này và được thảo luận trong Chương 3. Trực tiếp h ậu quả của sự công nhận của sự dư thừa không gian là bằng cách loại bỏ một số lượng lớn dự phòng (hoặc sử dụng các mối tương quan cao) trong một khung h ình ảnh, chúng tôi có thể tiết kiệm rất nhiều dữ liệu đại diện cho khung, do đó đạt được nén dữ liệu. 14
  15. 1.2.1.2 Thời gian dự phòng Th ời gian d ự phòng là có liên quan với mố i tương quan thống kê giữa các điểm ảnh từ tiếp khung hình trong một hình ảnh thời gian hoặc chuỗi video. Vì vậy, nó cũng được gọi là interframe dự phòng. Hãy xem xét một chuỗi hình ảnh thời gian. Đó là, mộ t máy ảnh là cố định trong thế giới 3-D và phải mất hình ảnh của một cảnh như thời gian trôi qua. Miễn là khoảng thời gian giữa hai hình ảnh liên tiếp là đủ ngắn, tức là, những hình ảnh được đông đủ, chúng ta có thể tưởng tượng rằng sự giống nhau giữa hai khung hình láng giềng mạnh mẽ. Hình 1 .5 (a) và (b) chương trình , tương ứng, 21 và 22 khung h ình của "Hoa hậu Mỹ" trình tự. 15
  16. Hình 1.2 : (a) Một b ức ảnh của "Boy và Girl," hồ sơ cá nhân Cường độ (b) cùng hàng 318 , (c) Cường độ hồ sơ dọ c theo cột 2 62, (d) Vị trí củ a dòng 318 và 2 62 cột. 16
  17. Hình 1.2: (tiếp theo) Hình 1.3: Tự tương quan theo chiều ngang đối với một số hình ảnh.(Sau khi Kretzmer, 1952.) 17
  18. Trình tự 21 và 22 khung hình của "Hoa hậu Mỹ". Các khung hình có độ phân giải 176x 144 . Trong số tổng cộng 25.344 điểm ảnh, ch ỉ có 3,4% thay đổi giá trị màu xám của nó hơn 1% giá trị m àu xám tối đ a (255trong trường hợp n ày) từ khung 21 đến khung 22. Điều này khẳng định mộ t sự quan sát được thực hiện trong (Mounts, 1969). Cho mộ t tín hiệu điện thoại truyền hình giống như với chuyển động trung bình trong cảnh , trung bình, ít hơn 10% các điểm ảnh thay đ ổi giá trịmàu xám củ a nó giữa hai khung hình liên tiếp b ởi một số lượng 1 % tín hiệu cao đ iểm. Tương quan interframe cao đã được báo cáo (Kretzmer, năm 1952). Có, tự tương quan giữa hai khung liền kề đ ược đo trong hai bộ phim hình ảnh chuyển động điển hình. Các mối tương quan tự động đo là 0,80 và 0,86. Tóm lại, đ iểm ảnh trong khung hình kế tiếp thường p hải ch ịu một sự tương đồng hoặc tương quan mạnh mẽ. Kết quả là, chúng ta có thể dự đoán một khung từ khung lân cận dọ c theo chiều thời gian. Điều này đư ợc gọi là interframe m ã hóa dự đoán và được th ảo luận trong Chương 3. Do đó, chính xác hơn h iệu qu ả hơn interframe dự đoán m ã hóa đề án, đ ã được phát triển từ Hình 1.4: Phổ công suất điển hình của một tín hiệu phát sóng truyền hình. (Phỏng Fink, D.G., Cẩm nang kỹ thuật tivi, McGraw-Hill, New York, 1957.) 18
  19. Hình 1.5: (a) khung 21, và (b) khung hình 22 "Hoa hậu Mỹ" năm 1980, sử dụng phân tích chuyển động.Nghĩa là, nó cho rằng những thay đổ i từmột khung hình tiếp theo chủ yếu là do chuyển động củ a một số đố i tư ợng trong khung hình. Lấy thông tin chuyển động này,vào xem xét, chúng tôi đề cập đến phương pháp như chuyển động bồ i thường mã hóa tiên đoán. Chèn cả tương quan và chuyển động bù vào mã hóa tiên đoán được đ ề cập chi tiết trong Chương 10. Lo ại bỏ mộ t số lượng lớn của sự dư thừa theo thời gian dẫn đến một lượng lớn dữ liệu được n én. Hiện nay tất cả các tiêu chu ẩn video quốc tế m ã hóa đ ã thông qua chuyển bù dự báo mã hóa, mà đã là một yếu tố quan trọng để tăng cường sử dụng video số trong các phương tiện truyền thông k ỹ thuật số. 1.2.1.3. Mã hóa Dự phòng. Như chúng ta đã thảo luận, dự phòng interpixel là có liên quan với mối tương quan giữa các điểm ảnh. Đó là, mộ t số thông tin liên kết với các điểm ảnh là không cần thiết. Psychovisual dự phòng , được thảo luận trong phần tiếp theo, liên quan đến các thông tin đó là psychovisually dự phòng, nghĩa là, mà HVS không phải là đ ộ nhạy. Do đó, nó cho th ấy rằng cả hai dư thừa interpixel và psychovisual b ằng cách n ào đó liên kết với một số thông tin ch ứa trong hình ảnh và video. Loại bỏ những dư thừ a, hoặc sử dụng những mối tương quan này b ằng cách sử dụng các bit ít hơn đ ể m iêu tả cho thông tin kết quả trong hình ảnh và video nén dữ liệu. Nó có nghĩa là, sự thừa m ã hóa là khác nhau. Nó không có gì đ ể làm với kh ả năng dự phòng thông tin, nhưng với các đ ại diện tứ c là, thông tin, mã hóa riêng củ a mình. Để xem đ iều này, chúng ta hãy xem ví dụ sau đây. 19
  20. Một ví dụ m inh họa được cho b ởi trong Bảng 1.1.Cột đầu tiên liệt kê các biểu tượng riêng biệt mà cần phải được mã hóa. Cột thứ h ai có xác suất xu ất hiện củ a 5 ký hiệu.Cộ t thứ b a danh sách m ã số 1, một bộ các Từ m ã thu được bằng cách sử dụng đồng hình có độ dài từ m ã dài. (Mã này đ ược gọi là các mã nhị phân ngẫu nhiên.) Cột thứ 4 cho th ấy 2 mã, trong đó mỗi từ mã có chiều dài thay đổi.Vì vậy,mã 2 được gọi là mã có độ dài thay đ ổi. Lưu ý rằng các ký hiệu với mộ t xác suất xảy ra cao hơn được mã hóa với chiều dài n gắn hơn. Đó là, chúng tôi sẽ khảo sát mà một tron g những cung cấp một chiều dài trung bình ngắn hơn từ m ã.Rõ ràng là chiều dài trung b ình củ a từ m ã trong mã 1 Lavg,1 , Ba bit. Chiều dài trung bình của Từ mã trong mã 2, Lavg, 2 , Có thể đ ược tính toán như sau. Vì vậ y, kết quả là mã 2 với m ã hóa biến chiều dài là hữu hiệu hơn mã số 1 với m ã hóa nh ị phân tự nhiên. Từ ví dụ n ày, chúng ta có thể thấy rằng đối với cùng m ột bộ các ký hiệu m ã số khác nhau có thể thự c h iện khác nhau. Một số có th ể có h iệu quả hơn hơn những người khác. Đối với cùng mộ t lượng thông tin, mã 1 có chứa số dự phòng. Đó là, m ột số thông tin trong mã 1 là không cần thiết và có thể đ ược loại bỏ m à không có bất kỳ ảnh hưởng nào. Mã hóa Huffman và mã hóa số học, kỹ thuật mã hóa độ d ài thay đổ i sẽ được thảo luận trong chương 5 Từ việc nghiên cứu m ã hóa dự phòng, nó là rõ ràng rằng chúng ta nên tìm cách để hiệu quả hơn kỹ thuật mã hóa để nén các dữ liệu hình ảnh và video. 20
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản