MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh

Chia sẻ: Toduy Huy | Ngày: | Loại File: DOC | Số trang:4

0
309
lượt xem
161
download

MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của internet, thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt không gian lưu trữ thông tin và truyền thông trên mạng là yêu cầu cấp thiết. Các kỹ thuật nén Video đều cố gắng giảm lượng thông tin cần thiết cho một chuỗi các bức ảnh, mà không làm giảm chất lượng ảnh. Mục đích của nén video là giảm bớt số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừa trong từng frame và dùng kỹ thuật mã hoá để tối thiểu...

Chủ đề:
Lưu

Nội dung Text: MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh

  1. MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh 12:56 - Thứ sáu, Theo AG Tổng hợp 05/01/2007 Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của internet, thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt không gian lưu trữ thông tin và truyền thông trên mạng là yêu cầu cấp thiết. Các kỹ thuật nén Video đều cố gắng giảm lượng thông tin cần thiết cho  một chuỗi các bức ảnh, mà không làm giảm chất lượng ảnh. Mục đích của  nén video là giảm bớt số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừa trong  từng frame và dùng kỹ thuật mã hoá để tối thiểu hoá lượng thông tin quan trọng cần lưu giữ.  Công nghệ nén hình phổ biến hiện nay Với một thiết bị lưu hình kỹ thuật số thông thường, ảnh sau khi được số hoá sẽ được nén lại. Quá  trình nén sẽ xử lý các dữ liệu trong ảnh để đưa hình ảnh vào một không gian hẹp hơn như trong  thiết bị nhớ kỹ thuật số hoặc qua đường dây điện thoại,.. Với thị trường lưu hình kỹ thuật số hiện nay, các chuẩn nén phổ biến là Motion JPEG (MJPEG),  Wavelet, H.261/ H.263/ H.263+/ H.263++  và MPGE1/ MPGE2/ MPGE4. Nhìn chung, có hai nhóm tiêu chuẩn chủ yếu: nhóm một gồm định dạng nén MJPEG và Wavelet;  và nhóm hai gồm các định dạng chuẩn còn lại. Sơ lược nguyên tắc nén ảnh áp dụng ở MJPEG và Wavelet Tính chất chung của các ảnh số là tương quan giữa các pixel ở cạnh nhau lớn, điều này dẫn tới  dư thừa thông tin để biểu diễn ảnh. Việc dư thừa thông tin dẫn tới việc mã hoá không tối ưu. Do  vậy, ta cần tìm phương án biểu diễn ảnh với tương quan nhỏ nhất, để giảm thiểu độ dư thừa thông  tin của ảnh. Có 2 kiểu dư thừa thông tin như sau: ­ Dư thừa trong miền không gian: là tương quan giữa không gian pixel của ảnh (các pixel  lân cận  của ảnh có giá trị gần giống nhau, trừ những pixel ở giáp đường biên ảnh) ­ Dư thừa trong miền tần số: là tương quan giữa những dải màu hoặc các dải phổ  khác nhau. Trọng tâm của các nghiên cứu về nén ảnh là giảm bớt một số bit để biểu diễn ảnh bằng việc loại  bỏ dư thừa trong miền không gian và miền tần số càng nhiều càng tốt. Các chuẩn nén MJPEG và  Wavelet đều tuân theo nguyên tắc tìm ra các phần tử dư thừa miền không gian (mỗi Frame nén tự 
  2. động). Trong khi đó, đặc trưng của các chuẩn nén thuộc nhóm 2 là loại bỏ dư thừa ở cả miền  không gian và miền tần số của ảnh. MJPEG là định dạng nén ảnh lâu đời nhất và đã được dùng phổ biến. Khi dùng chuẩn nén  MJPEG, ảnh được phân chia thành các khối vuông ảnh, mỗi khối vuông có kích thước 8 x 8 pixel  và biểu diễn mức sám của 64 điểm ảnh. Mã hoá biến đổi cosin rời rạc DCT (Discrete Cosin  Tranform) trong chuẩn nén này khai thác sự tương đồng giữa các pixel trong mỗi khối, để lấy ra  các biểu diễn ảnh với tương quan nhỏ. Chuỗi biểu diễn sẽ bị rút ngắn, tuỳ theo mức nén của hệ  thống hiện hành với qui trình rút ngắn chuỗi biểu diễn. Vì vậy, hình ảnh sau khi giải nén thường  có nhiều sai lệch so với ảnh gốc.  ở chuẩn nén Wavelet, thay vì mã hoá theo từng khối 8 x 8,  việc thực hiện trên toàn bộ bề mặt  ảnh, một loạt các bộ phận lọc ở khâu chuyển đổi sẽ phân tích các dữ kiện về từng điểm ảnh và  cho ra  một tập các hệ số. Do chuẩn Wavelet có tác dụng với toàn bộ bề mặt ảnh, nên các sai  lệch ở ảnh giải nén sẽ khác với MJPEG. Hiệu ứng ghép mảnh không xảy đến với ảnh được quan  sát, nhưng độ phân giải hình ảnh giảm cũng như một vài vết mờ sẽ xuất hiện. Các định dạng Wavelet và MJPEG đều gây ra hiện tượng mất thông tin ở ảnh giải nén. Sự dư  thừa khả năng lưu ảnh ở mắt người cảm thụ khi dùng chuẩn nén Wavelet ít hơn MJPEG 30%. Sơ lược về chuẩn mã hoá H.26x và MPEGx MPEG không phải là một công cụ nén đơn lẻ, mà ưu điểm của ảnh nén dùng MPEG là ở chỗ  MPEG có một tập hợp các công cụ mã hoá chuẩn, chúng có thể kết hợp với nhau một cách linh  động để phục vụ cho một loạt các ứng dụng khác nhau. Nguyên lý chung của nén tín hiệu video  là loại bỏ sự dư thừa về không gian (spatial redunancy) và sự dư thừa về thời gian (temporal  redunancy). Trong MPEG, việc loại bỏ sự dư thừa về thời gian (nén liên ảnh), được thực hiện  trước hết nhờ sử dụng tính chất giữa các ảnh liên tiếp. Chúng ta dùng tính chất này để tạo ra các  bức ảnh mới nhờ vào thông tin từ những bức ảnh gửi trước đó. Do vậy ở phía bộ mã hoá ta chỉ  cần giữ lại những ảnh có sự thay đổi so với ảnh trước, sau đó ta dùng phương pháp nén về không  gian trong những bức ảnh sai khác này. Nói một cách cụ thể, nguyên lý chung của các chuẩn nén  là phỏng đoán trước chuyển động của các frame ở bộ mã hoá. Mỗi frame ở tại một thời điểm nhất  định sẽ có nhiều khả năng giống với các frame đứng  ngay trước và sau đó. Các bộ mã hoá sẽ  tiến hành quét lần lượt những phần nhỏ trong mỗi frame (marco blocks) và phát hiện ra marco  block nào không thay đổi từ frame này tới frame khác. Phía bên thu, tức bộ giải mã đã lưu trữ sẵn  những thông tin không thay đổi từ frame này tới frame khác, chúng được dùng để điền thêm vào  vị trí trống trong ảnh được khôi phục. Tuy nhiên, do sự tương đồng giữa các frame là rất lớn, nên sự phát hiện ra các sai lệch là rất khó.  Do vậy ảnh khôi phục khó đạt được như  ảnh gốc. Điều này đồng nghĩa với việc chất lượng ảnh  cũng tương tự như khi dùng chuẩn Wavelet và MJPEG, nhưng dung lượng kênh truyền và không  gian lưu trữ của các chuẩn nén H.26x và MPEGx là nhỏ hơn (ví dụ như không gian lưu trữ của  chuẩn H.263 nhỏ hơn Motion JPEG từ 3 tới 5 lần). Sự khác biệt giữa các chuẩn nén này (như ở  H.26x và MPEGx) chủ yếu nằm ở khâu tiên đoán các frame mới và cách thức tính toán sai lệch  giữa các frame hiện tại và frame phỏng đoán. Chuẩn nén H.26x (gồm các thế hệ H.261, H.262 và 
  3. H.263...), thường có tốc độ mã hoá tín hiệu thấp hơn MPEGx (khoảng 1.5 Mbit/s với độ phân giải  hình 352 x 288) do dùng chủ yếu trong viễn thông. Trong khi đó, chuẩn MPEG2 dùng cho thị  trường giải trí có độ phân giải hình cao hơn, và mang  lại chất lượng hình ảnh tốt (cao hơn 1,5Mb/ s với độ phân giải 352x288 hoặc 6Mb/s cho phân giải hoàn chỉnh). Sơ lược định dạng nén ảnh MPEG4 So với các chuẩn nén đã nêu ở trên, chuẩn MPEG4 là định dạng nén hình ảnh tiên tiến nhất,  đáp  ứng những đòi hỏi về kỹ thuật cũng như phù hợp với nhiều loại thị trường. Với nỗ lực không ngừng để đưa ra thị trường sản phẩm ưu việt nhất của ngành công nghiệp . Máy  ghi hình kỹ thuật số chuẩn MPEG4 với bản chất là một  thiết bị thu hình kỹ thuật số có hiệu suất  cao, được chọn để đáp ứng nhu cầu cấp thiết của thị trường về một định dạng nén ảnh hoàn hảo  với tính năng nổi trội là, có thể thu được hệ thống lớn các nguồn hình ảnh.  MPEG4 thực sự là một dạng nén ảnh mang tính đột phá của công nghệ nén hình đương đại, thể  hiện rõ nét ở những tiêu chuẩn sau: ­ áp dụng những tiêu chuẩn có tính mở cao với sự hỗ trợ đắc lực từ ngành công nghiệp an ninh và  công nghiệp máy tính. ­ Hiệu suất lớn. ­ Khả năng truyền theo dòng và mạng lưới.  ­ Tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung  thực của ảnh. Định dạng nén ảnh MPEG4 Chuẩn MPEG4 cung cấp các phân bộ  trong kết cấu logic và năng lực giải mã từng dòng bits  riêng rẽ. Một profile là một phân bộ xác định trên toàn bit stream (điều chỉnh bitstream và bộ  phân giải màu) một level sẽ xác định một số tiêu chí bắt buộc cho tham số của bức ảnh (kích  thước ảnh, số lượng bit..). Những chuẩn nén MPEG4 có profile dạng đơn giản chiếm lĩnh đa phần thị trường. MPEG4 mà  Daicat tư vấn đã được phát triển và hoàn thiện trở thành định dạng nén hình tiên tiến, hoàn hảo,  với tiêu chí tập trung phát triển những nhân tố giúp tăng cường chất lượng hình ảnh, cũng như  phục vụ đắc lực cho các thiết bị giám sát có các frame dạng chữ nhật. Mỗi bitstream hiển thị trong  định dạng nén MPEG4 cung cấp một mô tả mang tính phân tầng về hình ảnh hiển thị. Từng lớp  dữ liệu được đưa vào bit stream bởi những mật mã đặc biệt gọi là mật mã khởi nguồn. Mỗi vật thể ảnh có thể được mã hoá dưới dạng đa lớp (scalable) hoặc đơn lớp (non scalable) VOL (video object layer) sẽ hỗ trợ quá trình mã hoá đa lớp. Một  vật thể ảnh được mã hoá dưới  dạng đa lớp không gian hoặc đa lớp thời gian, đi từ phân giải thô tới phân giải tinh. Bộ phận giải  mã có thể đạt được độ phân giải hình mong muốn, tuỳ theo những thông số như giải thông tần  hiện có, hiệu su t máy và theo mong muốn của người dùng.
  4. Có hai loại VOL, loại thứ nhất mang đầy đủ chức năng của định dạng nén MPEG4, loại còn lại với  những chức năng được giảm bớt (VOL với header dạng ngăn). Loại VOL này giúp bitstream tương  thích với đường biên ở H.263. VOP (video object plane)­ ảnh đựoc mã hoá độc lập hoặc mã hoá trên cơ sở tham khảo các ảnh  khác qua khâu bù chuyển động ở bộ giải mã. Mỗi frame ảnh thông thường có thể được biểu diễn  bởi một VOP dạng chữ nhật. Với chuẩn nén MPEG4, có 3 kiểu khác nhau để mã hoá cho khối ảnh. 1 . VOP được mã hoá độc lập. Trong trường hợp này VOP được mã hoá gọi là Intra  VOP (I­VOP). 2. VOP được tiên đoán qua kỹ thuật bù chuyển động nhờ một VOP khác đã được tiên đoán trước  đó. Đó là loại P­VOP (Predicted VOP). 3. VOP được tiên đoán dựa trên các VOP trước và sau nó thuộc dạng B­VOP ( Bi ­ directiional  Interpolated VOP). B­VOP được thêm vào dựa trên I­VOP và P­VOP. Ngoài việc có thể nâng cao chất lượng hình  ảnh khi dùng, một ưu điểm khác của B­VOP là dùng kỹ thuật đa lớp thời gian. Với kỹ thuật này,  Frame dữ liệu hiển thị được tăng cường. Những lớp tăng cường đưa thông tin vào giữa các lớp  frame. Định dạng nén ảnh MPEG4 hỗ trợ quá trình lượng tử hoá, do vậy cũng giúp đáp ứng những đòi  hỏi khác nhau về tốc độ bít. Lượng tử hoá đã có ở các chuẩn nén như H263 và MPEG1, MPEG2.  Bộ phận mã hoá ở định dạng nén mà  Daicat tư vấn tương thích với những bộ mã hóa trước đây  trong các chuẩn nén 
Đồng bộ tài khoản