intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sỹ khoa học: Nén ảnh động dùng Wavelet

Chia sẻ: Nguyen Van Dau | Ngày: | Loại File: PDF | Số trang:124

258
lượt xem
117
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Sự ra đời của Wavelet đã mở ra một công nghệ mới. Đó là chuẩn MJPEG2000. Sự ra đời của MJPEG2000 mở ra một tương lai mới cho kỹ thuật nén ảnh với những tính năng cao.Kỹ thuật wavelet cũng được nghiên cứu trong nhiều phần mềm như: Matlap…

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sỹ khoa học: Nén ảnh động dùng Wavelet

  1. LUẬN VĂN Nén ảnh động dùng Wavelet
  2. Bé gi¸o dôc vµ ®µo t¹o TR−êNG §¹I Häc B¸CH KHOA Hµ Néi ------------------------------------------------ LuËn v¨n th¹c sÜ khoa häc nÐn ¶nh ®éng dïng wavelet Ngµnh: §iÖn tö viÔn th«ng NguyÔn H÷u ph¸t Ng−êi h−íng dÉn khoa häc: PGS TS. Hå Anh Tuý Hµ néi 2005 0
  3. Môc lôc Trang Lêi nãi ®Çu .................................................................................................. 4 Ch−¬ng 1 TæNG QUAN VÒ NÐN ¶NH Video THEO CHUÈN MPEG ......................................................................................................................... 6 1.1. Kh¸i niÖm vÒ Video vµ ph−¬ng ph¸p nÐn Video ........................................ 5 1.1.1. Kh¸i niÖm Video ..................................................................................... 5 1.1.1.1. Kh«ng gian mÇu (Color Space)............................................................ 5 1.1.1.2. C¸c c¬ cÊu sè ho¸ tÝn hiÖu Video ........................................................ 6 1.1.2. C¸c ph−¬ng ph¸p nÐn Video ................................................................... 8 1.1.2.1. Gi¶m tèc ®é dßng bit............................................................................ 9 1.1.2.2. NÐn dßng tÝn hiÖu Video sè theo kh«ng gian ..................................... 10 1.1.2.3. NÐn dßng tÝn hiÖu theo thêi gian........................................................ 11 1.1.2.4. NÐn hçn hîp sö dông tæ hîp c¸c ph−¬ng ph¸p trªn .......................... 11 1.1.3. Tham sè nÐn Video. .............................................................................. 11 1.2. Giíi thiÖu chung vÒ chuÈn MPEG ........................................................... 12 1.3. C¸c kh¸i niÖm c¬ b¶n trong nÐn Video theo chuÈn MPEG...................... 14 1.3.1. CÊu tróc ph©n cÊp Video theo chuÈn MPEG. ...................................... 14 1.3.2. Ph©n lo¹i frame Video. ......................................................................... 17 1.3.3. Nhãm ¶nh (GOP: Group Of Picture).................................................... 19 1.4. Ph−¬ng ph¸p nÐn ¶nh Video theo chuÈn MPEG. ..................................... 21 1.4.1. M« h×nh tæng qu¸t bé m· ho¸ Video theo chuÈn MPEG...................... 21 1.4.2. LÊy mÉu th«ng tin vÒ mµu..................................................................... 22 1.4.3. L−îng tö ho¸. ........................................................................................ 23 1.4.4. Néi suy ¶nh. .......................................................................................... 23 1.4.5. Dù ®o¸n bï chuyÓn ®éng. ..................................................................... 24 1.4.5.1. §¸nh gi¸ chuyÓn ®éng (motion estimation)....................................... 24 1.4.5.2. Bï chuyÓn ®éng (Motion Compensation). ......................................... 24 1.4.6. BiÕn ®æi Cosine rêi r¹c. ........................................................................ 26 1.4.7. M· VLC................................................................................................. 27 1.5. Qu¸ tr×nh nÐn Video theo chuÈn MPEG-1. .............................................. 27 1.5.1. Tham sè ®Æc tr−ng. ............................................................................... 27 1.5.2. Qu¸ tr×nh m· ho¸................................................................................. 28 1.5.3.Qu¸ tr×nh gi¶i m·.................................................................................. 32 1.6. Qu¸ tr×nh nÐn Video theo chuÈn MPEG-2. .............................................. 33 1
  4. 1.6.1. Tham sè ®Æc tr−ng. .............................................................................. 36 1.6.2. M« h×nh m· ho¸ Non-scalable theo MPEG-2. .................................... 37 1.6.3. M« h×nh m· ho¸ scalable theo MPEG-2. ............................................ 38 Ch−¬ng 2 M∙ ho¸ SCALABLE VIDEO .............................................. 42 2.1. B¨ng läc 1/2 pixel biÕn ®æi ng−îc theo thêi gian - tÝnh to¸n bï chuyÓn ®éng................................................................................................................ 42 2.1.1. Giíi thiÖu............................................................................................... 44 2.1.2. ThuËt to¸n ............................................................................................. 46 2.1.2.1 M« h×nh Video phæ biÕn...................................................................... 46 2.1.2.2. QuÐt luü tiÕn Video víi vÐct¬ chuyÓn ®éng chÝnh x¸c 1/2 ®iÓm ¶nh . 49 2.1.2.3. Di chuyÓn côc bé më réng ................................................................. 51 2.1.3. Ba tham sè m· ho¸ b¨ng con sö dông IMCTF ..................................... 54 2.1.4. KÕt qu¶ thùc nghiÖm ............................................................................. 55 2.1.5. Tãm t¾t vµ kÕt luËn................................................................................ 59 2.2. M· ho¸ scalable video.............................................................................. 61 2.2.1. Kh¸i qu¸t............................................................................................... 62 2.2.1.1. M· ho¸ lai truyÒn thèng..................................................................... 63 2.2.1.1.1.M· ho¸ Scalable SNR ..................................................................... 63 2.2.1.1.2 Ph©n gi¶i m· Scalable ..................................................................... 66 2.2.1.2. Embedded Coding and Fine Granularity Scalability ........................ 66 2.2.1.3. M· ho¸ sö dông b¨ng con 3 chiÒu vµ m· ho¸ Wavelet ........................... 69 2.2.2. HÖ thèng tæng quan.................................................................................. 70 2.2.3. B¨ng con m· ho¸ 3 chiÒu...................................................................... 71 2.2.4. Tû lÖ dßng bÝt m· ho¸............................................................................... 74 2.2.4.1.HÖ thèng dßng bÝt................................................................................ 74 2.2.4.2. Lùa chän dßng bÝt m· ho¸ vµ truyÒn dÉn ......................................... 78 2.2.5. KÕt qu¶ thùc nghiÖm ............................................................................. 81 2.2.5.1. So s¸nh víi m· ho¸ Nonscalable....................................................... 81 2.2.5.2. So s¸nh m· ho¸ LZC vµ 3D-SPIHT........................................................ 83 2.2.5.3. M· ho¸ tèc ®é ®a ph©n gi¶i................................................................... 86 2.2.6. Tãm t¾t vµ kÕt luËn................................................................................ 91 Ch−¬ng 3 §èi t−îng-c¬ së m∙ ho¸ SCALABLE ............... 95 3.1. §èi t−îng c¬ b¶n - C¬ së m· ho¸............................................................. 97 3.1.1 MÆt ph¼ng ®èi t−îng Video.................................................................... 97 3.1.2. C«ng cô m· ho¸ cho ®èi t−îng Video................................................... 98 3.1.2.1. §Þnh d¹ng m· ho¸.............................................................................. 98 3.1.2.2. CÊu tróc m· ho¸ ................................................................................ 99 3.2. §èi t−îng-C¬ së m· ho¸ sö dông EZBC................................................ 100 2
  5. 3.2.1. Tæng quan ........................................................................................... 101 3.2.2. MiÒn – C¬ së biÕn ®æi Wavelet rêi r¹c.............................................. 102 3.2.3. §èi t−îng-C¬ së m· ho¸ mÆt ph¼ng bÝt EZBC .................................. 103 3.3. KÕt qu¶ thùc nghiÖm .............................................................................. 104 3.4. Tãm t¾t vµ kÕt luËn................................................................................. 106 Ch−¬ng 4: Ch−¬ng tr×nh thö nghiÖm vµ ®¸nh gi¸ kÕt qu¶ .............................................................................................................. 111 4.1. X©y dùng ch−¬ng tr×nh .......................................................................... 111 4.1.1. Kh¸i qu¸t chung .................................................................................... 111 4.1.2. CÊu tróc ch−¬ng tr×nh ............................................................................ 111 4.2. §¸nh gi¸ kÕt qu¶ thö nghiÖm ................................................................. 112 4.2.1 D÷ liÖu thö nghiÖm.................................................................................. 112 4.2.2. KÕt qu¶ thö nghiÖm ................................................................................ 112 4.2.3. NhËn xÐt vÒ tû sè nÐn,chÊt l−îng nÐn....................................................... 115 KÕt luËn .................................................................................................. 118 1. øng dông luËn v¨n .................................................................................... 118 2. H−íng ph¸t triÓn cho t−¬ng lai ................................................................. 119 TµI LIÖU THAM KH¶O ............................................................................. 120 PHô LôC...................................................................................................... 122 THUËT NG÷ tiÕng anh ......................................................................... 122 3
  6. Lêi nãi ®Çu Trong nh÷ng n¨m gÇn ®©y do sù ph¸t triÓn m¹nh mÏ cña Internet nªn vÊn ®Ò truyÒn d÷ liÖu trªn m¹ng ®Æc biÖt lµ truyÒn ¶nh vµ ©m thanh ®−îc quan t©m. Do ®ã viÖc nÐn d÷ liÖu ®Æc biÖt d÷ liÖu phim ¶nh lµ cÇn thiÕt h¬n bao giê hÕt. Trong ph¹m vi luËn v¨n nµy t«i tËp trung vµo viÖc nÐn d÷ liÖu video. §èi víi nÐn ¶nh ®éng, chuÈn MPEG(Moving Photographic Experts Group) ®· ®−îc x¸c lËp bëi ISO vµ IEC. §©y lµ mét kü thuËt nÐn ¶nh ®éng ®· mang l¹i nhiÒu thµnh c«ng. Nã cã thÓ ®¹t tû lÖ nÐn kh¸ cao 10:1 mµ m¾t th−êng khã ph©n biÖt ®−îc. Tuy nhiªn ®©y vÉn ch−a ph¶i lµ tû lÖ cao tèi −u. Sù ra ®êi cña Wavelet ®· më ra mét c«ng nghÖ míi. §ã lµ chuÈn MJPEG2000. Sù ra ®êi cña MJPEG2000 më ra mét t−¬ng lai míi cho kü thuËt nÐn ¶nh víi nh÷ng tÝnh n¨ng cao. Kü thuËt Wavelet còng ®−îc nghiªn cøu trong nhiÒu phÇn mÒm nh− Matlap... Môc ®Ých cña luËn v¨n nµy nh»m nghiªn cøu mét sè ph−¬ng ph¸p nÐn ¶nh ®éng ®ang ®−îc quan t©m. LuËn v¨n nµy ®−îc tr×nh bµy thµnh bèn ch−¬ng vµ mét phô lôc. Ch−¬ng Mét lµ tæng quan vÒ nÐn ¶nh ®éng. Ch−¬ng nµy giíi thiÖu mét sè chuÈn nÐn ¶nh ®éng lµ MPEG1,MPEG2,MPEG4 vµ MPEG7. §ång thêi còng tr×nh bµy cÊu tróc cña video. Ch−¬ng Hai tr×nh bµy ph−¬ng ph¸p nÐn Scalable video. Ch−¬ng nµy ®Ò cËp ®Õn thuËt to¸n LZC vµ 3D-SPIHT. Ch−¬ng Ba ®i s©u vµo nghiªn cøu ®èi t−îng m· ho¸ cña video dùa trªn biÕn ®æi Wavelet. Ch−¬ng Bèn nªu kh¸i qu¸t c¸ch thiÕt kÕ vµ cµi ®Æt ch−¬ng tr×nh. Ch−¬ng nµy mang tÝnh chÊt minh ho¹ cho nh÷ng g× ®· ®−îc tr×nh bµy ë c¸c ch−¬ng tr−íc. PhÇn phô lôc nªu mét sè ch−¬ng tr×nh nguån th«ng dông viÕt trªn Visual C + + 6. 0. Do thêi gian cã h¹n nªn t«i chØ míi nghiªn cøu ®−îc phÇn nµo trong kü thuËt nÐn ¶nh ®éng do vËy ch¾c ch¾n kh«ng tr¸nh khái thiÕu sãt. Cuèi cïng t«i xin ch©n thµnh c¶m ¬n sù gióp ®ì nhiÖt t×nh vµ hiÖu qu¶ cña PGS TS Hå Anh Tuý ®· gióp ®ì t«i hoµn thµnh luËn v¨n nµy. Hµ néi ngµy 20/10/2005 4
  7. §å ¸n cao häc §TVT 2003 Ch−¬ng 1 TæNG QUAN VÒ NÐN ¶NH Video THEO CHUÈN MPEG 1.1. Kh¸i niÖm vÒ Video vµ ph−¬ng ph¸p nÐn Video 1.1.1. Kh¸i niÖm Video Video lµ sù biÓu diÔn ®iÖn tö cña mét chuçi c¸c ¶nh liªn tiÕp. Nh÷ng ¶nh nµy lµ nh÷ng ¶nh tÜnh vµ ®−îc gäi lµ c¸c frame. Chuçi c¸c frame xuÊt hiÖn víi tèc ®é rÊt nhanh sÏ cho ta c¶m gi¸c chuyÓn ®éng liªn tôc (tèi thiÓu lµ 25frame/gi©y). MÆc dï mçi frame cã sù kh¸c nhau, cÇn thiÕt ph¶i cã tèc ®é frame cao ®Ó ®¹t ®−îc c¶m gi¸c chuyÓn ®éng thùc sù. Tèc ®é frame vµ ®é ph©n gi¶i cña mçi frame lµ c¸c nh©n tè quan träng ¶nh h−ëng trùc tiÕp ®Õn chÊt l−îng Video. Trong truyÒn h×nh, ®é ph©n gi¶i cña truyÒn h×nh lµ 720x576 vµ tèc ®é frame lµ 25 hoÆc 30 Hz. 1.1.1.1. Kh«ng gian mÇu (Color Space) Dùa theo lý thuyÕt vÒ ¶nh mµu, c¶m thô vÒ mµu cña m¾t trªn c¬ së 3 mµu c¬ b¶n: mµu ®á (Red), mµu lôc (Green) vµ mµu lam (Blue). Trong hÖ mµu RGB, c¸c mµu cã thÓ ®−îc m« t¶ lµ c¸c ®iÓm bªn trong h×nh lËp ph−¬ng ®¬n vÞ, víi gèc to¹ ®é (0, 0, 0) lµ mµu ®en; 3 thµnh phÇn R (®á), G (lôc), B (lam) biÓu diÔn cho 3 trôc. Mét hÖ thèng biÓu diÔn mµu kh¸c ®−îc sö dông chÝnh trong lÜnh vùc truyÒn h×nh nh»m gióp viÖc sè hãa ®−îc thuËn lîi h¬n lµ hÖ mµu YUV, miªu t¶ mçi ¶nh trong Video gåm c¸c thµnh phÇn ®é chãi (Y) vµ s¾c mµu (UV). HÖ mµu nµy nh»m ®¹t ®−îc hiÖu suÊt truyÒn cao h¬n, vµ gi÷ nguyªn tÝnh t−¬ng thÝch víi hÖ sè truyÒn h×nh mµu ®en tr¾ng. Thµnh phÇn chãi (luminance) cung cÊp gi¸ trÞ møc x¸m cña ¶nh, hai thµnh phÇn cßn l¹i mang th«ng tin vÒ mµu s¾c (chrominance) ®Ó chuyÓn ®æi tõ ¶nh x¸m sang ¶nh mµu. NguyÔn H÷u Ph¸t 5
  8. §å ¸n cao häc §TVT 2003 ChuyÓn ®æi RGB sang YUV ®−îc thùc hiÖn theo chuÈn CCIR 601 nh− sau: Y = 0.299R + 0.587G + 0.114B U = 0.493 (B - Y) V = 0.877 (R - Y) trong ®ã: Y lµ thµnh phÇn chãi vµ U, V lµ hai thµnh phÇn mµu. §Æc biÖt: khi R = G = B th× Y = R = G = B vµ U = V = 0. Mét ®Þnh d¹ng mµu kh¸c lµ, t−¬ng tù YUV lµ Y, CB, CR víi Y t−¬ng tù nh− trªn vµ hai thµnh phÇn nh− sau: CB = U/2 + 0.5 CR = V/1.6 + 0.5 Do ®ã, mµu CB, CR lu«n n»m trong kho¶ng [0, 1]. Víi −u ®iÓm trªn hÖ YCBCR ®−îc ¸p dông réng r·i trong viÖc sè ho¸ Video. 1.1.1.2. C¸c c¬ cÊu sè ho¸ tÝn hiÖu Video H×nh 1.1. CÊu tróc lÊy mÉu NguyÔn H÷u Ph¸t 6
  9. §å ¸n cao häc §TVT 2003 Trong truyÒn h×nh, c¸c frame trong chuçi Video cã ®é ph©n gi¶i lµ 720 x 576 ®iÓm vµ cã tèc ®é frame lµ 25 hoÆc 30Hz. Mçi ¶nh trong chuçi Video ®−îc lÊy sè ho¸ nh− h×nh 1.1. CÊu tróc 4: 2: 2 Gi¶ sö mét dßng ngang cña TV gåm 720 ®iÓm ¶nh. H×nh 1.2. CÊu tróc lÊy mÉu 4: 2: 2 ViÖc lÊy mÉu sÏ tuÇn tù diÔn ra nh− sau: - §iÓm ®Çu lÊy mÉu tÝn hiÖu chãi (Y) vµ lÊy mÉu 2 mµu (CB, CR). - §iÓm tiÕp theo chØ lÊy mÉu tÝn hiÖu chãi (Y) vµ kh«ng lÊy mÉu 2 tÝn hiÖu. Khi gi¶i m·, mµu suy ra tõ ®iÓm ¶nh tr−íc. TuÇn tù nh− vËy, cø 4 lÇn lÊy mÉu Y, cã 2 lÇn lÊy mÉu CR, 2 lÇn lÊy mÉu CB. CÊu tróc 4: 1: 1 H×nh 1.3. CÊu tróc lÊy mÉu 4: 1: 1 §iÓm ¶nh ®Çu tiªn lÊy mÉu ®ñ Y, CR, CB, 3 ®iÓm kÕ tiÕp chØ lÊy mÉu Y, kh«ng lÊy mÉu tÝn hiÖu mµu. Khi gi¶i m·, mÇu cña 3 ®iÓm ¶nh ph¶i suy ra tõ ®iÓm ¶nh ®Çu. TuÇn tù nh− vËy, cø 4 lÇn lÊy mÉu Y, cã 1 lÇn lÊy mÉu CR, 1 lÇn lÊy mÉu CB. CÊu tróc lÊy mÉu 4: 2: 0 NguyÔn H÷u Ph¸t 7
  10. §å ¸n cao häc §TVT 2003 LÊy mÉu tÝn hiÖu Y t¹i tÊt c¶ c¸c ®iÓm ¶nh cña dßng, cßn tÝn hiÖu mµu th× cø 4 Y, cã 2 mµu CR vµ CB c¸ch nhau theo tõng hµng. H×nh 1.4. CÊu tróc lÊy mÉu 4: 2: 0 CÊu tróc lÊy mÉu 4: 4: 4 LÊy mÉu tÝn hiÖu Y, CR, CB t¹i tÊt c¶ c¸c ®iÓm ¶nh cña dßng. H×nh 1.5. CÊu tróc lÊy mÉu 4: 4: 4 1.1.2. C¸c ph−¬ng ph¸p nÐn Video Môc tiªu chÝnh cña viÖc nÐn tÝn hiÖu Video lµ biÓu diÔn mét nguån tÝn hiÖu Video b»ng mét sè bit Ýt nhÊt cã thÓ ®−îc mµ vÉn ®¶m b¶o yªu cÇu chÊt l−îng c¶m thô. Víi tÝn hiÖu Video, giíi h¹n d¶i th«ng cña tÝn hiÖu t−¬ng tù kho¶ng 6MHz, trong khi tÝn hiÖu Video sè ho¸ theo tiÓu chuÈn CCIR 601 víi tèc ®é bit lµ 270Mbit/s chiÕm d¶i th«ng kh«ng d−íi 189MHz, tøc lµ lín h¬n 31,5 lÇn so víi d¶i th«ng cña tÝn hiÖu t−¬ng tù. ChÝnh v× vËy, gi¶m d¶i th«ng lµ vÊn ®Ò quan träng víi c«ng nghÖ Video sè. VÒ c¬ b¶n gi¶m d¶i th«ng ®−îc thùc hiÖn b»ng 4 c¸ch: - Gi¶m tèc ®é dßng bit (bit Rate Reduction - BRR). NguyÔn H÷u Ph¸t 8
  11. §å ¸n cao häc §TVT 2003 - NÐn dßng tÝn hiÖu Video sè theo kh«ng gian, tøc gi¶m ®é d− thõa trong mét sè frame (spatial redundancy). - NÐn dßng tÝn hiÖu theo thêi gian, tøc gi¶m ®é d− thõa theo thêi gian (temporal redundancy). - NÐn hçn hîp sö dông tæ hîp c¸c ph−¬ng ph¸p trªn. 1.1.2.1. Gi¶m tèc ®é dßng bit. Cã hai ph−¬ng ph¸p gi¶m tèc ®é dßng bit. C¸ch thø nhÊt dùa trªn ®Æc ®iÓm sinh lý cña m¾t ng−êi. M¾t ng−êi kh«ng nh¹y c¶m víi c¸c tÝn hiÖu mµu nªn trong ph−¬ng ph¸p nµy, ng−êi ta gi¶m bít ®é ph©n gi¶i c¸c tÝn hiÖu mµu. C¸ch thø hai dùa trªn ý nghÜa cña c¸c bit l−îng tö ho¸ c¸c ®iÓm ¶nh. Víi 8 bit l−îng tö ho¸, c¸c bit cña byte nµy ®−îc chia lµm hai nhãm: nhãm cã ý nghÜa h¬n (MMB-More Meaning Bit) vµ nhãm Ýt ý nghÜa h¬n (LMB-Less Meaning Bit). ViÖc ta c¾t gi¶m c¸c bit cña nhãm LMB sÏ kh«ng ¶nh h−ëng nhiÒu tíi chÊt l−îng cña ¶nh. Tuy nhiªn, ph−¬ng ph¸p nµy kh«ng ®−îc chÊp nhËn trong c¸c gi¶i ph¸p gi¶m d¶i th«ng hiÖn t¹i, nªn còng sÏ kh«ng ®−îc ®Ò cËp ®Õn. PhÇn lín c¸c ®Þnh d¹ng sè thµnh phÇn hiÖn nay ®Òu sö dông tÇn sè lÊy mÉu 13.5MHz ®èi víi tÝn hiÖu chãi. Theo chuÈn CCIR 601, nÕu 2 tÝn hiÖu mµu ®−îc lÊy mµu ®−îc lÊy mÉu víi tÇn sè nh− tÝn hiÖu chãi, chóng ta sÏ cã ®Þnh d¹ng 4: 4: 4.§Þnh d¹ng nµy ®−îc sö dông trong c¸c thiÕt bÞ dùng phim phi tuyÕn vµ trong ®å ho¹ vi tÝnh liªn quan ®Õn phim nhùa. Tèc ®é bit cña ®Þnh d¹ng nµy cho hÖ PAL lµ: Víi l−îng tö ho¸ 8 bit: (720 + 720 +720) x 576 x 8 x 25 = 249 Mbit/s Víi l−îng tö hãa 10 bit: (720 + 720 +720) x 576 x 10 x 25 = 311 Mbit/s. Trong ®ã: 720 x 576 lµ ®é ph©n gi¶i mµn h×nh (576 lµ sè dßng /frame). 25 lµ tèc ®é chuyÓn ¶nh (25 frames/s). NguyÔn H÷u Ph¸t 9
  12. §å ¸n cao häc §TVT 2003 HiÖn nay, c¸c thiÕt bÞ sö dông kü thuËt sè ë thÞ tr−êng thiÕt bÞ Video chuyªn dông th−êng sö dông chuÈn CCIR 601 4: 2: 2. Theo ®Þnh d¹ng sè ho¸ nµy, tÝn hiÖu Video thµnh phÇn ®−îc lÊy mÉu víi tÇn sè 13.5 MHz ®èi víi tÝn hiÖu chãi, vµ 6,75 MHz ®èi víi hai tÝn hiÖu mµu. Tèc ®é dßng d÷ liÖu cña ®Þnh d¹ng nµy ®−îc tÝnh nh− sau: Khi lÊy mÉu 8 bit: (720 +360 +360) x 576 x 8 x 25 = 166 Mbit/s. 10 bit: (720 +360 +360) x 576 x 10 x 25 = 207 Mbit/s. Nh− vËy, so víi ph−¬ng ph¸p lÉy mÉu kh«ng c¾t gi¶m (4: 4: 4), ph−¬ng ph¸p nµy cho phÐp c¾t gi¶m ®−îc 33% tèc ®é dßng bit. Víi ®Þnh d¹ng 4: 1: 1 vµ 4: 2: 0, tèc ®é dßng bit cßn ®−îc c¾t gi¶m nhiÒu h¬n. Víi 8 bit lÊy mÉu, tèc ®é dßng bit tÝnh cho PAL lµ: (720 +180 +180) x 576 x 8 x 25 = 124.4 Mbit/s. tøc lµ gi¶m ®−îc 50% so víi nguyªn mÉu 4: 4: 4. 1.1.2.2. NÐn dßng tÝn hiÖu Video sè theo kh«ng gian GÇn nh− tÊt c¶ c¸c ¶nh ®Òu chøa mét sè l−îng lín c¸c gi¸ trÞ d÷ liÖu th«ng tin gièng nhau. Trong c¸c hÖ thèng kh«ng gi¶m d÷ liÖu, c¸c d÷ liÖu gièng nhau nµy ®−îc lÆp l¹i ®Ó t¹o l¹i c¸c vïng ®Òu nhau trong mét ¶nh (vÝ dô, bÇu trêi xanh), vµ do ®ã cã th«ng tin d− thõa trong dßng d÷ liÖu. §Ó gi¶m ®é d− thõa trong mét frame, ta sö dông c¸c ph−¬ng ph¸p nÐn ¶nh. C¸c ph−¬ng ph¸p nÐn ¶nh cã thÓ chia lµm 2 lo¹i: • NÐn kh«ng tæn hao (lossless compression): lµ ph−¬ng ph¸p nÐn mµ tÝn hiÖu gèc ®èi chiÕu víi tÝn hiÖu ®−îc nÐn (m· ho¸), sau ®ã gi¶i nÐn (gi¶i m·) th× kh«ng cã sù ph©n biÖt. • NÐn cã tæn hao (lossy compression): lµ ph−¬ng ph¸p nÐn mµ tÝn hiÖu gèc cã sù kh¸c biÖt víi tÝn hiÖu ®−îc kh«i phôc sau khi nÐn vµ gi¶i nÐn. • ChÊt l−îng h×nh ¶nh cña c¸c thiÕt bÞ dïng ph−¬ng ph¸p nÐn kh«ng tæn hao lµ rÊt tèt, cã thÓ so s¸nh ®−îc víi chÊt l−îng ¶nh kh«ng nÐn. Tuy nhiªn, tØ sè nÐn cña ph−¬ng ph¸p nµy rÊt thÊp. ChÝnh v× vËy, c¸c −u ®iÓm cña viÖc NguyÔn H÷u Ph¸t 10
  13. §å ¸n cao häc §TVT 2003 nÐn tÝn hiÖu kh«ng ®−îc ph¸t huy mét c¸ch tèi ®a, gi¸ thµnh thiÕt bÞ vÉn cßn rÊt cao. §Ó n©ng tØ sè nÐn, ph¸t huy tèi ®a −u ®iÓm cña viÖc nÐn tÝn hiÖu, ph−¬ng ph¸p nÐn cã tæn hao ®−îc sö dông trong hÇu hÕt c¸c thiÕt bÞ hiÖn nay. Cã hai ®Þnh d¹ng nÐn ®−îc ¸p dông réng r·i trong c¸c thiÕt bÞ truyÒn h×nh, nÐn Video lµ JPEG vµ MPEG, cïng c¸c phiªn b¶n cña nã. 1.1.2.3. NÐn dßng tÝn hiÖu theo thêi gian. C¸c frame trong Video cã quan hÖ mËt thiÕt víi nhau, thËm chÝ c¸c frame hiÖn t¹i chØ thay ®æi chót Ýt so víi c¸c frame tr−íc vµ sau ®ã. §Ó gi¶m bít th«ng tin truyÒn t¶i, ng−êi ta chØ truyÒn nh÷ng phÇn th«ng tin sai lÖch vµ kÕt hîp víi th«ng tin cò. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau ®Ó x¸c ®Þnh sù thay ®æi gi÷a c¸c frame, ®ã lµ c¸c ph−¬ng ph¸p x¸c ®Þnh vÐct¬ chuyÓn ®éng. Ngoµi ra cßn nhiÒu ph−¬ng ph¸p kh¸c, nh÷ng gi¶i thuËt nµy cã chÊt l−îng cao, nh−ng møc ®é tÝnh to¸n phøc t¹p vµ cßn ®ang trong giai ®o¹n nghiªn cøu. 1.1.2.4. NÐn hçn hîp sö dông tæ hîp c¸c ph−¬ng ph¸p trªn §Ó ®¹t ®−îc hiÖu qu¶ nÐn cao mµ vÉn ®¶m b¶o chÊt l−îng h×nh ¶nh, ng−êi ta sö dông tæ hîp c¸c ph−¬ng ph¸p trªn. Ph−¬ng ph¸p nÐn Video theo chuÈn MPEG lµ mét ph−¬ng ph¸p nÐn tæ hîp cña c¸c ph−¬ng ph¸p trªn. 1.1.3. Tham sè nÐn Video. Tham sè nÐn Video ®−îc ®Ò cËp ®Õn ë ®©y lµ ®Þnh d¹ng ¶nh vµ tØ sè nÐn, tØ sè nÐn cho phÐp ®¸nh gi¸ hiÖu qu¶ cña hÖ thèng nÐn. Khi so s¸nh tØ sè nÐn cña c¸c hÖ thèng nÐn kh¸c nhau, th× ®Þnh d¹ng ¶nh cña c¸c hÖ thèng nÐn trªn ph¶i gièng nhau. §Þnh d¹ng bao gåm: • Sè dßng/¶nh vµ sè pixel/dßng. NguyÔn H÷u Ph¸t 11
  14. §å ¸n cao häc §TVT 2003 • Sè frame/s. Vµ cÊu tróc lÊy mÉu bao gåm: 4: 4: 4, 4: 2: 2, 4: 2: 0, 4: 1: 1, ®é ph©n gi¶i cña mÉu lµ 8/10 bit (hoÆc 12 bit). Tèc ®é bit cña ¶nh gèc (tr−íc khi nÐn) cã thÓ rót ra tõ c«ng thøc: Tèc ®é d÷ liÖu ¶nh gèc TØ sè nÐn = Tèc ®é d÷ liÖu ¶nh nÐn VÝ dô: víi tèc ®é bit d÷ liÖu ¶nh gèc 166 Mbit/s ë trªn ¸p dông vµo m¸y ghi h×nh ®Üa PDR-100 (Tektronix), vµ gi¶ sö chÊt l−îng nÐn t−¬ng ®−¬ng 24Mbit/s, th× tØ sè nÐn lµ 166/24 = 6.92. 1.2. Giíi thiÖu chung vÒ chuÈn MPEG ChuÈn MPEG (Moving Picture Expert Group) ®−îc x©y dùng vµ ph¸t triÓn bëi c¸c tæ chøc ISO vµ IEC (International Electrotechnical Commission) víi môc ®Ých m· ho¸ tÝn hiÖu h×nh ¶nh vµ ©m thanh cho DSM (Digital Storage Media), DSS (Digital Satellite System), HDTV (High Definition Television), VideoConferencing, Internet Video, vµ c¸c øng dông Video sè. ChuÈn MPEG ngµy cµng ®−îc sö dông réng r·i trong nhiÒu øng dông l−u tr÷, truyÒn th«ng ®a ph−¬ng tiÖn, vµ ®−îc biÕt ®Õn víi c¸c chuÈn MPEG-1, MPEG-2, MPEG-4, MPEG-7. • MPEG-1 (~1992): m· ISO/IEC 11172, lµ chuÈn ®Çu tiªn cña MPEG nh»m môc ®Ých nÐn Video cã kÝch th−íc khu«n h×nh 320x240 cho dßng d÷ liÖu cã tèc ®é tõ 1 ®Õn 1.5 Mb/s trong c¸c øng dông DSM (nh− c«ng nghÖ ghi VCD), v« tuyÕn truyÒn h×nh. • MPEG-2 (~1995): m· ISO/IEC 13818, lµ chuÈn dµnh cho gi¶i ph¸p cao h¬n dïng trong studio sè, DVD, truyÒn h×nh sè vµ HDTV. Kh¸c víi MPEG-1 tÝn hiÖu Video lu«n lµ quÐt liªn tôc (progressive), MPEG-2 ¸p dông cho c¶ quÐt liªn tôc vµ quÐt xen kÏ (interlace). Tèc ®é dßng d÷ liÖu lªn tíi 15 Mb/s. NguyÔn H÷u Ph¸t 12
  15. §å ¸n cao häc §TVT 2003 • MPEG-4 (~1998): m· ISO/IEC 14496, lµ chuÈn chñ yÕu dµnh cho c¸c øng dông ®a ph−¬ng tiÖn t−¬ng t¸c, ph©n lo¹i khung c¶nh ®a ph−¬ng tiÖn thµnh c¸c ®èi t−îng néi dung media, tËp trung vµo dån kªnh, ®ång bé d÷ liÖu víi c¸c ®èi t−îng media ®Ó truyÒn qua m¹ng. MPEG-4 sö dông tèc ®é bit (Video) rÊt thÊp: 5÷64 Kb/s. Vai trß nÐn Ýt ®−îc ®Ò cËp trong phiªn b¶n nµy. • MPEG-7 (~2001): MPEG-7 lµ chuÈn m« t¶ th«ng tin cña rÊt nhiÒu lo¹i ph−¬ng tiÖn. M« t¶ nµy cho kh¶ n¨ng t×m kiÕm nhanh vµ hiÖu qu¶ theo yªu cÇu ng−êi dïng. Tuy nhiªn, chuÈn MPEG-7 ®−îc m« t¶ vÒ phÇn néi dung gièng nh− MPEG-4, vµ ®−îc gäi chÝnh thøc lµ “Giao thøc m« t¶ néi dung ®a ph−¬ng tiÖn” (Multimedia Content Description Interface). MPEG-7 ®Æc tr−ng cho mét tËp tiªu chuÈn biÓu diÔn nhiÒu lo¹i th«ng tin multimedia kh¸c nhau. MPEG-7 kh«ng ph¶i lµ chuÈn nÐn. S¬ ®å giíi thiÖu c¸c chuÈn nÐn vµ c¸c c«ng nghÖ nÐn xem h×nh 1.6: H×nh 1.6. C¸c chuÈn, c¸c c«ng nghÖ nÐn, truyÒn th«ng ®a ph−¬ng tiÖn NguyÔn H÷u Ph¸t 13
  16. §å ¸n cao häc §TVT 2003 1.3. C¸c kh¸i niÖm c¬ b¶n trong nÐn Video theo chuÈn MPEG. 1.3.1. CÊu tróc ph©n cÊp Video theo chuÈn MPEG. CÊu tróc dßng bit Video ®−îc chia thµnh ph©n cÊp c¸c líp (layer) ®Ó hç trî qu¶n lý lçi, truy cËp ngÉu nhiªn, dùng h×nh (editting) vµ ®ång bé víi dßng bit audio. • Block: Lµ c¸c khèi kÝch th−íc 8x8 ®iÓm ¶nh cña tÝn hiÖu chãi vµ mµu ®−îc dïng ®Ó biÕn ®æi DCT. • Macroblock: Mét Macroblock lµ mét nhãm c¸c khèi DCT (theo néi dung th«ng tin) trong ¶nh gèc. Header cña Marcroblock chøa th«ng tin vÒ c¸c khèi ®é chãi vµ ®é mµu, vµ th«ng tin bï chuyÓn ®éng. Cã ba lo¹i Macroblock (ph©n lo¹i theo ph−¬ng ph¸p m· ho¸ Macroblock): u Skipped MB: sö dông dù ®o¸n tõ frame gi¶i m· tr−íc ®ã víi vÐct¬ chuyÓn ®éng b»ng 0. Kh«ng cã th«ng tin vÒ Macroblock ®−îc gi¶i m· còng nh− ®−îc truyÒn ®Õn n¬i nhËn. u Inter MB: sö dông dù ®o¸n bï chuyÓn ®éng tõ frame tr−íc ®ã. Do ®ã, cÇn truyÒn ®i kiÓu MB, ®Þa chØ MB, vect¬ chuyÓn ®éng, c¸c hÖ sè DCT vµ kÝch th−íc b−íc l−îng tö. u Intra MB: kh«ng dïng dù ®o¸n tõ frame tr−íc ®ã. Nªn chØ cÇn truyÒn kiÓu MB, ®Þa chØ MB, c¸c hÖ sè DCT vµ kÝch th−íc b−íc l−îng tö ®Õn n¬i nhËn. • Slice: Slice cung cÊp kh¶ n¨ng phßng ngõa sù sai lÖch d÷ liÖu. Khi gÆp lçi trong dßng bit cña mét ¶nh, bé gi¶i m· cã thÓ kh«i phôc b»ng c¸ch ®îi Slice tiÕp theo mµ kh«ng ph¶i huû bá toµn bé ¶nh. Slice chøa header vµ mét hoÆc nhiÒu Macroblock liªn tiÕp. KÝch th−íc Slice cùc ®¹i cã thÓ lµ toµn c¶nh, kÝch th−íc cùc tiÓu cã thÓ lµ mét Macroblock. Header cña Slice chøa th«ng tin vÒ vÞ trÝ cña nã trong ¶nh vµ hÖ sè thang ®é cña bé l−îng tö ho¸. NguyÔn H÷u Ph¸t 14
  17. §å ¸n cao häc §TVT 2003 • Picture (frame): Mét ¶nh t−¬ng øng víi mét frame cña Video. Cã ba kiÓu ¶nh chÝnh lµ: ¶nh I, P vµ B. C¸c ¶nh nµy kh«ng ®éc lËp nhau, nªn thø tù dßng bit (tøc lµ thø tù c¸c c¶nh ®−îc truyÒn, l−u tr÷ vµ kh«i phôc) kh«ng theo thø tù hiÓn thÞ, mµ lµ thø tù cho phÐp bé gi¶i m· cã thÓ gi¶i m· dßng bit. Líp ¶nh bao gåm phÇn header vµ mét hoÆc nhiÒu Slice. Header chØ thÞ sù s¾p xÕp ®Ó truyÒn frame, cho phÐp bé gi¶i m· hiÓn thÞ frame ®óng theo bËc, kiÓu ¶nh vµ th«ng tin m· ho¸. • GOP (Group Of Picture): Mét nhãm ¶nh lµ mét ®iÓm truy nhËp ngÉu nhiªn (random access point), lµ ®¬n vÞ m· ho¸ nhá nhÊt mµ cã thÓ ®−îc gi¶i m· ®éc lËp, bao gåm phÇn header vµ c¸c ¶nh. Header chøa th«ng tin thêi gian vµ dùng h×nh (editting). Mét nhãm ¶nh GOP h×nh thµnh tõ liªn kÕt mét hoÆc nhiÒu frame I, vµ c¸c frame P, vµ/hoÆc frame B. CÊu tróc GOP ®−îc biÓu diÔn th«ng qua hai tham sè: n (sè frame trong GOP) vµ m (kho¶ng c¸ch dù ®o¸n), th«ng th−êng n=15, m = 3. Mçi GOP b¾t ®Çu b»ng mét frame I. Thø tù c¸c ¶nh dßng m· lµ thø tù mµ qua qu¸ tr×nh gi¶i m· ®−a chóng trë l¹i b×nh th−êng. §Æc biÖt, ¶nh B trong dßng gi¶i m· ®−îc ®−a ngay ra mµn h×nh; ¶nh m· cuèi cïng cña nhãm ¶nh (trong thø tù tr×nh diÔn) lµ ¶nh I hoÆc P. • Chuçi Video (Video sequence): Lµ líp cao nhÊt cña ph©n cÊp m· ho¸. Chuçi chøa mét header, mét hoÆc nhiÒu GOP vµ mét m· kÕt thóc chuçi. Th«ng tin quan träng nhÊt chøa trong header lµ kÝch th−íc theo chiÒu ngang vµ ®øng cña mçi ¶nh, tØ lÖ pixel, tèc ®é bit cña ¶nh trong chuçi, tèc ®é ¶nh vµ c¸c kÝch th−íc tèi thiÓu cña bé nhí cho bé gi¶i m·, . . . . ®Ó khëi g¸n tr¹ng th¸i cña bé gi¶i m·. Chuçi Video vµ th«ng tin header t¹o thµnh dßng bit m· ho¸, ®−îc gäi lµ dßng s¬ cÊp Video ES (elementary stream). NguyÔn H÷u Ph¸t 15
  18. §å ¸n cao häc §TVT 2003 H×nh 1.7. C¸c líp video theo chuÈn MPEG H×nh 1.8. CÊu tróc dßng d÷ liÖu MPEG NguyÔn H÷u Ph¸t 16
  19. §å ¸n cao häc §TVT 2003 1.3.2. Ph©n lo¹i frame Video. C¨n cø vµo ®Æc tÝnh cña Video cã sù d− thõa kh«ng gian vµ d− thõa thêi gian ®Ó ®−a ra hai ph−¬ng ph¸p nÐn gi¶m ®é d− thõa kh«ng gian (m· ho¸ “intraframe”) vµ nÐn gi¶m ®é d− thõa thêi gian t−¬ng øng (m· ho¸ “intrerframe”), vµ do ®ã chia c¸c frame Video thµnh 3 lo¹i lµ: frame I, frame P, frame B. • Frame I (Intra Coded Picture): Frame I lµ frame ®Çu tiªn trong mçi nhãm ¶nh cña chuçi Video, frame nµy ®−îc m· ho¸ t−¬ng tù nh− m· ho¸ ¶nh tÜnh theo chuÈn JPEG. C¸c frame I ®−îc m· ho¸ ®éc lËp, kh«ng cÇn tham chiÕu ®Õn c¸c frame kh¸c trong chuçi Video. M· ho¸ c¸c frame I chØ lµm gi¶m ®é d− thõa kh«ng gian vµ cho mét tØ lÖ nÐn võa ph¶i. Frame I cã thÓ dïng lµm ®iÓm truy cËp ngÉu nhiªn trong chuçi cho bé gi¶i m·, vµ cã thÓ dïng nh− nh− lµ frame tham chiÕu (reference frame) ®Ó dù ®o¸n c¸c frame kh¸c. • Frame P (Predictive Code Picture): Qua frame I, bé m· ho¸ cã thÓ dù ®o¸n thuËn (forward predection) frame tiÕp theo. Frame ®−îc dù ®o¸n gäi lµ frame P (predicted frame), vµ frame P còng cã thÓ ®−îc dù ®o¸n tõ c¸c frame tr−íc ®ã. Nh− vËy, mçi frame P ®−îc dù ®o¸n tõ frame I hoÆc P tr−íc ®ã. ViÖc m· ho¸ ¶nh P cã sö dông bï chuyÓn ®éng. Th«ng tin −íc l−îng chuyÓn ®éng cña c¸c khèi n»m trong vÐct¬ chuyÓn ®éng. vÐct¬ nµy x¸c ®Þnh mét Macroblock (MB) nµo ®ã ®−îc sö dông tõ ¶nh gèc. Frame P cho hÖ sè nÐn cao h¬n, vµ cã thÓ sö dông lµm mét frame so s¸nh, tham chiÕu cho viÖc bï chuyÓn ®éng cho c¸c frame P vµ B kh¸c. NguyÔn H÷u Ph¸t 17
  20. §å ¸n cao häc §TVT 2003 H×nh 1.9. Néi suy bï chuyÓn ®éng • Frame B (Bidirectionally Predicted 0icture): Bé m· ho¸ còng cã thÓ sö dông ®ång thêi dù ®o¸n thuËn vµ ng−îc. Nh÷ng frame nµy gäi lµ frame dù ®o¸n néi suy 2 chiÒu (Bi-directional Interpolated Prediction), hay frame B. Kh«ng nh− frame I (®−îc dù ®o¸n ®éc lËp) vµ frame P (®−îc dù ®o¸n dùa vµo frame I hoÆc P tr−íc ®ã), frame B ®−îc dù ®o¸n 2 chiÒu dùa vµo cÆp frame I vµ P, hoÆc P vµ P, hoÆc P vµ I (víi frame I cña nhãm ¶nh tiÕp theo). ViÖc sö dông th«ng tin lÊy tõ ¶nh trong t−¬ng lai hoµn toµn cã thÓ thùc hiÖn ®−îc v× t¹i thêi ®iÓm m· ho¸ th× bé m· ho¸ ®· s½n sµng truy cËp tíi ¶nh phÝa sau. Frame B cho tØ lÖ nÐn cao nhÊt, vµ kh«ng ®−îc dïng lµm frame tham chiÕu. Theo ph−¬ng ph¸p nÐn nµy, frame I gäi lµ frame intra (sö dông kü thuËt m· ho¸ intraframe), frame P vµ B gäi lµ c¸c frame Inter (sö dông kü thuËt m· ho¸ interframe). NguyÔn H÷u Ph¸t 18
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2