intTypePromotion=1

BÁO CÁO CHUYÊN ĐỀ: LÝ THUYẾT XỬ LÝ VIDEO

Chia sẻ: Nguyen Bao Ngoc | Ngày: | Loại File: PDF | Số trang:49

0
90
lượt xem
35
download

BÁO CÁO CHUYÊN ĐỀ: LÝ THUYẾT XỬ LÝ VIDEO

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Video ra đời vào những năm đầu của thế kỷ XX nh−ng nó phát triển khá chậm chạp và có nhiều người còn không tin vμo khả năng của nó. Như Darryl.Zanuck, giám đốc hãng phim Fox-TK20 phát biểu đầu năm 1946 “ Tivi sẽ không thể nμo tiếp tục được trọng dụng quá 6 tháng. Ng−ời ta sẽ nhanh chóng chán ngay việc theo dõi một cái hộp gỗ mỗi tối”. Video chỉ thực sự phát triển vào những năm cuối của thế kỷ XX. Với sự phát triển nhanh chóng của công nghệ, ngμy nay Tivi-Video đã trở thành một thμnh phần không thể...

Chủ đề:
Lưu

Nội dung Text: BÁO CÁO CHUYÊN ĐỀ: LÝ THUYẾT XỬ LÝ VIDEO

  1. CHƯƠNG TRÌNH KC01 ĐỀ TÀI MÃ SỐ KC01-14 ------&------ ĐỀ TÀI THUỘC CHƯƠNG TRÌNH KHCN CẤP NHÀ NƯỚC KC 01 MÃ SỐ KC 01.14 NGHIÊN CỨU PHÁT TRI ỂN ỨNG DỤNG CÔNG NGHỆ ĐA PHƯƠNG TIỆN Ch ủ nhiệm đề tài: PGS.TS. Nguyễn Cát Hồ CẤP QUẢN LÝ: Nhà nước CƠ QUAN CHỦ TRÌ: Viện công nghệ thông tin – Đại học Quốc gia Hà nội BÁO CÁO CH CHUYÊN ĐỀ: LÝ THUYẾT XỬ LÝ VIDEO CHỦ TRÌ CHUYÊN ĐỀ: PHAN THẾ HÙNG 6352-10 20/4/2007 HÀ NỘI, 4/2005
  2. Lý thuyết xử lý Video Môc lôc 3 I. Kh¸i niÖm vÒ Video 1. Kh¸i niÖm chung 3 2. Kh¸i niÖm Digital Video (Video sè) 4 3. §Æc ®iÓm Video sè 4 II. NÐn d÷ liÖu Video 6 1. Sù cÇn thiÕt ph¶i nÐn víi hiÖu suÊt (tØ lÖ nÐn) cao 6 2. Mét sè thuËt to¸n nÐn dïng cho Video 7 11 III. C¸c ®Þnh d¹ng Video sè 1. §Þnh d¹ng Video 11 IV. ¢m thanh 17 1. ¢m thanh tù nhiªn 17 2. H×nh thøc sè ho¸ ©m thanh 17 3. ¢m thanh gèc 18 4. Ph−¬ng thøc lÊy mÉu trong ©m thanh 19 5. Mét sè chuÈn nÐn d÷ liÖu ©m thanh 20 6. T¹o ©m thanh 22 7. ¢m thanh 3D thùc 22 8. §Þnh d¹ng ©m thanh 23 24 V. C¸c tham sè trong Video vµ audio 1. C¸c tham sè cho Video 24 2. C¸c tham sè cho Audio 30 Trang 1
  3. Lý thuyết xử lý Video VI. ChuyÓn ®æi d÷ liÖu tõ video, b¨ng, ®Üa CD thµnh c¸c tÖp Video-Audio cho m¸y tÝnh vµ ng−îc l¹i 33 1. C¸c cæng chuyÓn ®æi tÝn hiÖu 33 2. Thu tÝn hiÖu tõ c¸c thiÕt bÞ ph¸t Video-Audio vµo m¸y tÝnh 34 3. ChuyÓn ®æi d÷ liÖu Video-Audio thµnh c¸c ®Þnh d¹ng kh¸c nhau 36 VII. Mét sè kü thuËt xö lý Video-Audio trªn m¸y tÝnh 41 1. Kü thuËt ®¸nh dÊu (Marker) vµ keyframe 41 2. ChuyÓn c¶nh (Transition) 41 3. Kü thuËt trén (mix) 42 4. Kü thuËt t¹o ®é trong suèt (Transparence) 44 Trang 2
  4. Lý thuyết xử lý Video I. Kh¸i niÖm vÒ Video 1. Kh¸i niÖm chung Video ra ®êi vµo nh÷ng n¨m ®Çu cña thÕ kû XX nh−ng nã ph¸t triÓn kh¸ chËm ch¹p vµ cã nhiÒu ng−êi cßn kh«ng tin vµo kh¶ n¨ng cña nã. Nh− Darryl.Zanuck, gi¸m ®èc h·ng phim Fox-TK20 ph¸t biÓu ®Çu n¨m 1946 “ Tivi sÏ kh«ng thÓ nµo tiÕp tôc ®−îc träng dông qu¸ 6 th¸ng. Ng−êi ta sÏ nhanh chãng ch¸n ngay viÖc theo dâi mét c¸i hép gç mçi tèi”. Video chØ thùc sù ph¸t triÓn vµo nh÷ng n¨m cuèi cña thÕ kû XX. Víi sù ph¸t triÓn nhanh chãng cña c«ng nghÖ, ngµy nay Tivi-Video ®· trë thµnh mét thµnh phÇn kh«ng thÓ thiÕu ®−îc trong ®êi sèng x· héi. Video lµ g×? Chóng ta cã thÓ hiÓu Video lµ mét d¹ng d÷ liÖu bao gåm ©m thanh vµ h×nh ¶nh kÕt hîp víi nhau vµ lu«n cã sù biÕn ®æi vÒ néi dung (khu«n h×nh) theo thêi gian. C¸c yªu cÇu hÖ thèng cña Video: Th«ng th−êng, nÕu chóng ta xem mét ®o¹n Video mµ ©m thanh vµ h×nh ¶nh kh«ng khíp hay tèc ®é qu¸ chËm so víi kh¶ n¨ng nh×n cña chóng ta th× ch¾c ch¾n video kh«ng thÓ ®¨ng t¶i ®−îc néi dung thùc sù cña nã . NÕu chóng ta xem c¸c phim ®−îc s¶n xuÊt ®Çu thÕ kû XX th× chóng ta thÊy c¸c h×nh ¶nh trªn mµn h×nh th−êng bÞ chËm hay bÞ giËt so víi ho¹t ®éng thùc. Lý do lµ c¸c m¸y quay ®· kh«ng thu ®ñ 24 h×nh trªn 1 gi©y. Do ®ã, c¸c hÖ thèng Video hiÖn nay ®Òu yªu cÇu c¸c thiÕt bÞ thu, ph¸t, ®−êng truyÒn video ph¶i ®¶m b¶o viÖc hiÓn thÞ h×nh ¶nh vµ ©m thanh trong thêi gian thùc. HiÖn nay trªn thÕ giíi sö dông 3 hÖ Video chÝnh: NTSC (National Television Standard Committee) theo chuÈn 29,97 h×nh/gi©y, PAL, SECAM theo chuÈn 25 h×nh/gi©y. TruyÒn h×nh NTSC dïng mµnh 525 dßng vµ hiÓn thÞ ®Çy mµnh víi tÇn sè 30 mµnh mçi gi©y, b»ng ph−¬ng ph¸p quÐt xen dßng 60 b¸n mµnh mçi gi©y ®Ó phï hîp víi tÇn sè xoay chiÒu ë Mü lµ 60 Hz. C¸c ghÐp nèi video NTSC sö dông c¸c ®Çu c¾m vµ jack c¾m chuÈn RCA. C¸c chuyªn gia v« tuyÕn truyÒn h×nh th−êng nãi ®ïa r»ng NTSC lµ viÕt t¾t cña " Never Twice The Same Color" (cïng Trang 3
  5. Lý thuyết xử lý Video mét mµu kh«ng bao giê lÆp l¹i hai lÇn) v× kh¶ n¨ng kiÓm so¸t mµu cña chuÈn NTSC rÊt kÐm. TruyÒn h×nh NTSC ®−îc qu¶ng b¸ ë Mü, nhËt vµ hÇu hÕt c¸c n−íc Trung vµ Nam Mü nh−ng kh«ng dïng ë Ch©u ¢u vµ Ch©u ¸. HÇu hÕt c¸c n−íc ch©u ¢u vµ ch©u ¸ ®Òu dïng chuÈn PAL dùa trªn c¬ së tÇn sè ®iÖn lµ 50 Hz. 2. Kh¸i niÖm Digital Video (Video sè) Cïng víi sù ra ®êi vµ ph¸t triÓn m¹nh mÏ cña m¸y tÝnh vµ hÖ thèng viÔn th«ng trong nh÷ng thËp kû cuèi cña thÕ kû XX, m¸y tÝnh ®· ®−îc sö dông trong rÊt nhiÒu ngµnh c«ng nghiÖp. Do ®ã ®Æt ra yªu cÇu cÇn ph¶i cã d÷ liÖu d¹ng ©m thanh vµ h×nh ¶nh cho m¸y tÝnh (®Ó m¸y tÝnh cã thÓ hiÓu ®−îc). ChÝnh v× vËy ra ®êi kh¸i niÖm Digital Video. Digital Video lµ Video nh−ng ®−îc ghi (m· ho¸) d−íi d¹ng sè b»ng c¸c m· 0 vµ 1. Video th«ng th−êng ®−îc ghi d−íi d¹ng tÝn hiÖu t−¬ng tù (Analog) 3. §Æc ®iÓm Video sè - Video sè sö dông ®é ph©n gi¶i 72dpi. Video sè th−êng sö dông ®é ph©n gi¶i 72 dpi (sè ®iÓm ¶nh cho 1 inch). §Æc ®iÓm nµy dùa trªn giíi h¹n vÒ kh¶ n¨ng nh×n cña m¾t ng−êi. Víi mµu huúnh quang th× m¾t ng−êi chØ nhËn biÕt ®−îc sù kh¸c nhau cña chÊt l−îng h×nh ¶nh chuyÓn ®éng víi ®é ph©n gi¶i d−íi 72 dpi. Chóng ta chØ sö dông ®é ph©n gi¶i trªn 72 dpi cho mét sè tr−êng hîp ®Æc biÖt khi cÇn cã Video hoÆc ¶nh chÊt l−îng cao nh− c¸c ®o¹n phim ¶nh sö dông cho viÖc ph©n tÝch khoa häc cÇn phãng to lªn nhiÒu lÇn hoÆc c¸c ¶nh dïng trong ngµnh c«ng nghiÖp in Ên. NÕu muèn cã mét tÊm ¶nh in víi chÊt l−îng cao cã thÓ ng−êi ta ph¶i ®Æt ®é ph©n gi¶i lªn trªn 400 dpi. - KÝch cì tÖp video lµ rÊt lín. Chóng ta cã thÓ lµm mét phÐp tÝnh nh− sau: Trang 4
  6. Lý thuyết xử lý Video NÕu mét ®o¹n Video th«ng th−êng hÖ PAL (24 h×nh trªn gi©y) cã thêi l−îng lµ 1 phót cã kÝch cì khung h×nh lµ 640x480 ®é s©u mµu 16 bit th× kÝch cì tÖp nµy lµ: 16x640x480x24x60= 7077888000bit= 843MB Nh− vËy chóng ta thÊy r»ng d÷ liÖu cña video lµ rÊt lín so víi thiÕt bÞ l−u tr÷ th«ng tin hiÖn nay. Do vËy ng−êi ta lu«n ph¶i t×m mäi c¸ch ®Ó gi¶m kÝch cì cña Video. Cã nhiÒu c¸ch gi¶m kÝch cì tÖp video vÝ dô nh− gi¶m kÝch cì khu«n h×nh, gi¶m ®é s©u mÇu... nh−ng c¸ch hiÖu qu¶ ®ã lµ sö dông c¸c thuËt to¸n nÐn ¶nh. C¸c thuËt to¸n nÐn ¶nh ®¶m b¶o cho viÖc sö dông c¸c tÖp video trªn m¸y tÝnh còng nh− truyÒn d÷ liÖu video trªn m¹ng lµ hiÖu qu¶, trong thêi gian thùc. HiÖn nay, ®· cã rÊt nhiÒu thuËt to¸n nÐn video kh¸c nhau, nh−ng nÒn t¶ng vÉn chñ yÕu dùa trªn c¸c thuËt to¸n nÐn ¶nh nh− thuËt to¸n RLE, LZW, Wavalet, DCT... Ngoµi ra ng−êi ta cßn cã mét sè thuËt to¸n giµnh riªng cho Video sè nh− nÐn kh«ng gian mµu, nÐn cÊu tróc trong, nÐn dùa vµo ®èi t−îng c¬ b¶n. Trang 5
  7. Lý thuyết xử lý Video II. NÐn d÷ liÖu Video 1. Sù cÇn thiÕt ph¶i nÐn víi hiÖu suÊt (tØ lÖ nÐn) cao Nh− chóng ta ®· biÕt d÷ liÖu Video sè lµ rÊt lín vµ yªu cÇu hiÓn thÞ trong thêi gian thùc, do ®ã muèn sö dông ®−îc video sè mét c¸ch hiÖu qu¶ th× ph¶i cã thuËt to¸n nÐn víi hiÖu suÊt cao. HiÖn nay, cã nhiÒu thuËt to¸n nÐn kh¸c nhau nh−ng cã thÓ ph©n thµnh hai d¹ng chÝnh: ®ã lµ thuËt to¸n nÐn mÊt th«ng tin vµ nÐn kh«ng mÊt th«ng tin. NÐn kh«ng mÊt th«ng tin: ®©y lµ nhãm c¸c thuËt to¸n nÐn mµ khi d÷ liÖu ®−îc phôc håi vÉn ®¶m b¶o ®−îc chÊt l−îng nh− d÷ liÖu gèc ( chÊt l−îng Video kh«ng hÒ thay ®æi). Nh−ng nh÷ng thuËt to¸n nµy cã tû lÖ nÐn rÊt thÊp . Nã chØ nÐn ®−îc kho¶ng 2 lÇn so víi kÝch cì gèc. Trong thùc tÕ chØ sö dông c¸c thuËt to¸n nÐn nµy ®Ó t¹o c¸c tÖp video nguån cho so¹n th¶o hoÆc ®Ó di chuyÓn video tõ hÖ thèng nµy sang hÖ thèng kh¸c. Khi lµm viÖc víi c¸c tÖp video sö dông thuËt to¸n nµy chóng ta cÇn chó ý c¸c tÖp video lµ rÊt lín ®èi víi nhiÒu hÖ thèng m¸y tÝnh ®ång thêi yªu cÇu vÒ tèc ®é truyÒn d÷ liÖu còng rÊt cao khi hiÓn thÞ ( playback). NÐn mÊt th«ng tin: c¸c thuËt to¸n thuéc nhãm nµy th−êng cã tû lÖ nÐn rÊt cao cã thÓ nÐn víi tû lÖ tõ 10 ®Õn 100 lÇn so víi kÝch cì gèc. VÝ dô khi ta cã 1 tÖp Video kÝch cì 100 Mb, nÕu ¸p dông thuËt to¸n nÐn nµy th× kÝch cì cña tÖp Video chØ cßn kho¶ng tõ 1-10 Mb. Nh−îc ®iÓm cña c¸c thuËt to¸n nµy lµ chØ ®¶m b¶o chÊt l−îng h×nh ¶nh Video t−¬ng ®èi tèt nh−ng kh«ng ®−îc nh− h×nh ¶nh Video gèc. Tøc lµ khi dïng c¸c thuËt to¸n nÐn nµy mét nhãm th«ng tin cña video ®· ®−îc l−îng tö ho¸ vÝ dô mét nhãm mµu gÇn gièng nhau gÇn nhau ®−îc chuyÓn thµnh mét mµu ®Æc tr−ng ®Ó gi¶m sù m· ho¸ mµu nh− vËy sÏ lµm gi¶m kÝch cì tÖp video. Khi phôc håi c¸c tÖp video ®Ó hiÓn thÞ trªn mµn h×nh th× th«ng tin vÒ mµu s¾c sÏ kh«ng ®−îc ®Çy ®ñ nh− tÖp gèc nh−ng kÌm vµo ®ã lµ c¸c ph−¬ng ph¸p xö lý mµu gi÷a c¸c vïng mµu cña thuËt to¸n lµm cho c¸c c¶nh video cã chÊt l−îng gÇn nh− ban ®Çu. §iÓn h×nh lµ mét sè kiÓu nÐn nh− JPEG, Planar RGB. Trang 6
  8. Lý thuyết xử lý Video Trong thùc tÕ th× ng−êi ta sö dông nhiÒu c¸c thuËt to¸n nÐn nµy cho c¸c tÖp video sö dông trªn ®Üa CD-ROM, trªn Internet v× cã thÓ thay ®æi ®−îc chÊt l−îng tÖp video lµm cho kÝch cì cña tÖp nhá ®i, vµ tèc ®é hiÓn thÞ ( play back) nhanh h¬n. 2. Mét sè thuËt to¸n nÐn dïng cho Video 2.1 NÐn kh«ng gian mµu §©y lµ thuËt to¸n dùa trªn nguyªn lý lµm gi¶m th«ng tin mµu (trong kh«ng gian YUV) vµ sù kÐm nh¹y c¶m cña m¾t ng−êi víi mµu s¾c ®Æc biÖt víi viÖc mµu s¾c liªn tôc thay ®æi trong c¸c chuyÓn ®éng. Dùa trªn 3 mµu c¬ b¶n RGB ng−êi ta cã mét kh«ng gian mµu nh− sau: NÕu lÊy O lµm gèc víi ba trôc lµ ba mµu c¬ B M b¶n ®á, xanh vµ xanh l¸ c©y (Red,Green,Blue), ta sÏ cã kh«ng gian mµu (ORGB). Trôc KO lµ ®−êng N K OI tæng hîp ¸nh s¸ng cña 3 mµu víi gi¸ trÞ b»ng nhau R do ®ã nã chÝnh lµ ®−êng thÓ hiÖn ®é s¸ng cña mµu G s¾c. T¹i gèc O sÏ lµ mµu ®en. A Tõ kh«ng gian nµy ta x©y dùng kh«ng gian YUV b»ng c¸ch: Dïng mÆt ph¼ng GRB lµm mÆt ph¼ng mµu. MÆt ph¼ng nµy cã mµu s¾c ®−îc tæng hîp tõ 3 mµu c¬ b¶n. §Æt tªn mÆt ph¼ng nµy lµ mÆt ph¼ng (U,V) víi hai ®−êng th¼ng U,V vu«ng gãc víi nhau vµ c¾t nhau t¹i I. Trôc Y vu«ng gãc víi mÆt ph¼ng (U,V) lµ ®−êng th¼ng KO thÓ hiÖn ®é s¸ng (®é chãi) cña ¸nh s¸ng. YUV (Luminance, 2 Color diferences) Y U V Y:U:V = 4:2:2 Y U V Y:U:V = 4:1:1 Y U V Y:U:V = 4:2:0 Trang 7
  9. Lý thuyết xử lý Video Trong thuËt to¸n nµy ng−êi ta nÐn vµ lµm gi¶m gi¸ trÞ mµu ë trªn 2 trôc U vµ V cßn gi¸ trÞ ®é s¸ng Y ®−îc gi÷ nguyªn v× gi¸ trÞ nµy rÊt quan träng( m¾t ng−êi rÊt nhËy c¶m ®èi víi ®éi s¸ng). Ng−êi ta th−êng ¸p dông réng r·i thuËt to¸n nÐn nµy trong c¸c m¸y m¸y ghi Video, Tivi... NÐn kh«ng gian mµu lµ c¸ch m« pháng ¶o c¸c vïng cña khu«n h×nh víi b¶n chÊt lµ viÖc t×m ra c¸c mÉu vµ t¹o l¹i c¸c ®iÓm ¶nh. VÝ dô: trong mét ¶nh cã vïng mµu xanh da trêi, thuËt to¸n nÐn kh«ng gian sÏ nhËn biÕt nhiÒu ®iÓm mµu xanh gièng nhau trong kh«ng gian nµy. §Ó m« t¶ l¹i c¸c ®iÓm mµu xanh nµy, thuËt to¸n nÐn kh«ng gian ghi l¹i c¸c m« t¶ ¶nh mét c¸ch ng¾n gän nhÊt vÝ dô nh− sè ®iÓm trong vïng mµu xanh, m· mµu trong khu vùc ®ã...Nh− vËy nÕu b¹n t¨ng kh«ng gian nÐn (kÝch cì vïng mµu) th× d÷ liÖu vµ kÝch cì tÖp video sÏ gi¶m vµ ¶nh sÏ bÞ mÊt ®é nÐt. VËy cÊp ®é nÐn cã thÓ ®−îc ®iÒu khiÓn th«ng qua c¸c chØ sè lùa chän chÊt l−îng vµ tèc ®é truyÒn d÷ liÖu. 2.2 NÐn cÊu tróc bªn trong ThuËt to¸n nµy dùa trªn gi¶i ph¸p nÐn theo cÊu tróc vµ nÐn theo biÕn thêi gian kÕt hîp víi kü thuËt bï chuyÓn ®éng. §©y lµ c¸ch t×m kiÕm c¸c ®iÓm ¶nh thay ®æi trong mét kho¶ng thêi gian hay mét chuçi c¸c khu«n h×nh. VÝ dô, trong mét ®o¹n video cã mét nh©n vËt ®ang nãi trªn mét nÒn tÜnh. ThuËt to¸n nÐn theo thêi gian sÏ nhËn biÕt c¸c pixel thay ®æi tõ khu«n h×nh nµy sang khu«n h×nh kia ®ã lµ h×nh khu«n mÆt nh©n vËt ®ang nãi. Cßn tÊt c¶ c¸c ®iÓm kh¸c kh«ng thay ®æi. §Ó m« t¶ l¹i nhiÒu ®iÓm ¶nh vµ nhiÒu khu«n h×nh th× thuËt to¸n nµy sÏ m« t¶ l¹i tÊt c¶ c¸c ®iÓm trong khu«n h×nh ®Çu tiªn. Cßn c¸c khu«n h×nh tiÕp theo thuËt to¸n chØ m« t¶ l¹i c¸c ®iÓm thay ®æi. Ph−¬ng ph¸p nµy gäi lµ ph−¬ng ph¸p tÝnh sai ph©n cña khu«n h×nh. Nh− vËy b»ng c¸ch ph©n tÝch trªn thuËt to¸n sÏ ghi l¹i khu«n h×nh ®Çu (keyframe) vµ kho¶ng thêi gian nµo ®ã cho chuyÓn ®éng. TiÕp theo c¸c néi dung cña keyframe nh− vÞ trÝ, c¸c vïng ®iÓm mµu.. C¸c vïng ®iÓm ¶nh thay ®æi theo thêi gian còng sÏ ®−îc l−u l¹i. Khi hiÓn thÞ l¹i tÖp video trªn mµn h×nh Trang 8
  10. Lý thuyết xử lý Video ch−¬ng tr×nh dùa vµo c¸c chØ sè vÒ keyframe, mµu s¾c, ¸nh s¸ng, c¸c ®iÓm ¶nh chuyÓn ®éng... ®Ó t¸i t¹o l¹i chuyÓn ®éng. Nh− vËy thuËt to¸n nµy ®· lµm mÊt ®i mét sè ®¸ng kÓ c¸c khu«n h×nh trong mét kho¶ng thêi gian vµ nh− vËy kÝch cì tÖp video sÏ nhá ®i. K e y -fra m e (in d e p e n d e n t) tim e D e fe re n tia l D a ta O n ly Theo thuËt to¸n nµy nÕu sè keyframe cµng nhiÒu (thêi l−îng gi÷a c¸c keyframe cµng ng¾n) th× chÊt l−îng video cµng tèt. V× vËy ng−êi ta dïng tham sè keyframe vµ chÊt l−îng khu«n h×nh (keyframe) ®Ó ®iÒu chØnh cÊp ®é nÐn. 2.3 NÐn dùa vµo ®èi t−îng c¬ b¶n ThuËt to¸n nµy dùa trªn kü thuËt ph©n gi· ¶nh thµnh cÊu tróc c©y ®èi t−îng sau ®ã vÐct¬ ho¸ c¸c ®èi t−îng nµy (Vector Quantization (VQ)). VÝ dô c¶nh video nh− ë h×nh bªn d−íi: H×nh ®èi t−îng con c¸ sÏ ®−îc t¸ch ra khái nÒn vµ ®−îc Vector ho¸. Nh− vËy viÖc ghi d÷ liÖu cho tÖp Video víi kiÓu nÐn nµy chÝnh lµ ghi c¸c th«ng tin ¶nh Vector vµ c¸c th«ng tin chuyÓn ®éng cña ¶nh vÐct¬ trong mét kho¶ng thêi gian nµo ®ã. Trang 9
  11. Lý thuyết xử lý Video Khi gi¶i nÐn ch−¬ng tr×nh dùa trªn c¸c th«ng tin vÒ ®−êng biªn, mµu s¾c vµ h−íng chuyÓn ®éng cña c¸c ®èi t−îng trong khu«n h×nh ®Ó x©y dùng l¹i chuyÓn ®éng. Tøc lµ sÏ sinh ra mét lo¹t c¸c Frame ®Ó h×nh thµnh ®o¹n video. C¸c thuËt to¸n trªn ®Òu cã chung mét ®Æc ®iÓm lµ chØ l−u l¹i c¸c th«ng tin cÇn thiÕt nhÊt cña video vµ trªn c¬ së ®ã x©y dùng c¸c frame cho video. ChÝnh dùa trªn ®Æc ®iÓm nµy nªn hÇu hÕt c¸c thuËt to¸n nµy ®Òu cho phÐp thay ®æi chÊt l−îng cña video tuú vµo môc ®Ých sö dông. Vi dô nh− nÕu ng−êi ta muèn sö dông ®o¹n video cho Internet tèc ®é chËm th× cã thÓ ®iÒu chØnh chÊt l−îng kÐm ®i vµ nh− vËy kÝch cì tÖp video sÏ nhá ®i nhiÒu. Trong tr−êng hîp môc ®Ých sö dông cÇn cã chÊt l−îng cao mµ kh«ng bÞ giíi h¹n vÒ ®−êng truyÒn nh− c¸c tÖp Video ®−îc ghi trªn ®Üa CD, DVD th× chóng ta cã thÓ ®iÒu chØnh chÊt l−îng nÐn phï hîp ®Ó cã ®−îc c¸c tÖp video tho¶ m·n yªu cÇu ®Æt ra. Trang 10
  12. Lý thuyết xử lý Video III. C¸c ®Þnh d¹ng Video sè 1. §Þnh d¹ng Video 1.1 §Þnh d¹ng chuÈn cho hÖ ®iÒu hµnh 1.1.1 §Þnh d¹ng AVI §©y lµ ®Þnh d¹ng ®−îc thiÕt kÕ ®Ó dïng trong m«i tr−êng Windows. §Þnh d¹ng nµy cã thÓ sö dông rÊt nhiÒu thuËt to¸n nÐn video ®−îc ph¸t triÓn tõ tr−íc ®Õn nay. 1.1.2 §Þnh d¹ng QuickTime §©y lµ ®Þnh d¹ng ®−îc thiÕt kÕ ®Ó dïng trong m«i tr−êng Macintosh. ®Þnh d¹ng Quicktime ®−îc x©y dùng tõ nhiÒu thuËt to¸n nÐn ¶nh vµ ©m thanh trong m«i tr−êng Macintosh. Quick time còng lµ ®Þnh d¹ng ®−îc rÊt nhiÒu phÇn mÒm øng dông hç trî. Kh«ng nh÷ng thÕ nã cßn ®−îc cµi ®Æt trong nhiÒu chÝp xö lý cña hÖ thèng. HiÖn nay c¶ hÖ hÖ ®iÒu hµnh Windows vµ Macintosh ®Òu cho phÐp sö dông c¶ hai ®Þnh d¹ng Video nµy. 1.2 ChuÈn quèc tÕ MPEG-1/2/4- ISO (chuÈn quèc tÕ) §Þnh d¹ng MPEG-1/2/4 ®−îc ph¸t triÓn bëi MPEG (Moving Picture Experts Group). §Þnh d¹ng nµy ®−îc sö dông ®Ó t¹o c¸c s¶n phÈm video trong ngµnh c«ng nghiÖp ph¸t thanh truyÒn h×nh, Internet vµ c¸c øng dông ®å häa . 1.2.1 MPEG-1 MPEG-1 ®−îc b¾t ®Çu ph¸t triÓn tõ n¨m 1993 vµ ®−îc hoµn thiÖn vµo n¨m 1998 víi nhiÒu −u ®iÓm nh−: ®Þnh d¹ng nµy cã chÊt l−îng cao t−¬ng ®−¬ng víi chÊt l−îng hiÓn thÞ h×nh trªn Tivi, cã kh¶ n¨ng ®iÒu chØnh chÊt l−îng... Nã sö dông thuËt to¸n DCT(Discrete Cosine Transformation ) víi khu«n h×nh chuÈn Trang 11
  13. Lý thuyết xử lý Video 352x240 ®iÓm víi yªu cÇu tèc ®é ®−êng truyÒn lµ 1.5Mbps (Mb trªn mét gi©y). §Þnh d¹ng nµy ®−îc øng dông ®Ó x©y dùng c¸c s¶n phÈm Video trªn ®Üa CD- ROM. MPEG-1 ®−îc thiÕt kÕ nh− sau : Theo chuÈn MPEG-1 nã ph©n ®Þnh ®Þa chØ cña c¸c kªnh d÷ liÖu ©m thanh vµ h×nh ¶nh kÕt hîp víi thêi gian. §©y lµ chøc n¨ng quan träng v× tõ d¹ng d÷ liÖu nµy sÏ ®−îc chuyÓn ®æi thµnh c¸c kªnh d÷ liÖu phï hîp. S¬ ®å nguyªn mÉu chuÈn gi¶n nÐn ISO/IEC 11172 Theo s¬ ®å nµy chóng ta thay th«ng qua c¸c ®Þa chØ ®−îc l−u tr÷ trong chuÈn MPEG-1, khi gi¶i nÐn sÏ x¸c ®Þnh ®−îc chÝnh x¸c c¸c kªnh audio vµ video. ThuËt to¸n nÐn cho chuÈn MPEG-1 cã kh¶ n¨ng nÐn cao. §Çu tiªn ng−êi ta ph¶i lùa chän kh«ng gian phï hîp vµ gi¶i ph¸p tÝn hiÖu. Sau ®ã dïng thuËt to¸n bï chuyÓn ®éng vµ gi¶m thêi gian d− thõa. Bï chuyÓn ®éng ®−îc sö dông trong viÖc t¹o khu«n h×nh hiÖn t¹i dùa trªn khu«n h×nh tr−íc ®ã (chØ cÇn mét keyframe tr−íc mµ kh«ng cÇn dùa vµo keyframe sau). C¸c tÝn hiÖu kh¸c, c¸c lçi ®−îc l−îng ho¸ vµ nÐn b»ng c¸ch sö dông thuËt to¸n DCT (discrete cosine transform). Trang 12
  14. Lý thuyết xử lý Video H×nh 2: m« t¶ thêi gian cÇu tróc c¸c khu«n h×nh trong ®Þnh d¹ng MPEG-1 H×nh 2 m« t¶ sù kÕt hîp gi÷a 3 lo¹i th«ng tin vÒ ¶nh: C¸c pixel ¶nh thay ®æi, c¸c chØ sè vÒ vÞ trÝ , sè l−îng khu«n h×nh ®−îc sinh ra tõ keyframe. H×nh 3 CÊu tróc gi¶i nÐn c¬ b¶n cña Audio §Çu vµo lµ c¸c tÝn hiÖu m· víi tÇn sè 32, 44.1, 48 kHz. B¶n ®å (mapping) sÏ läc vµ lÊy ra c¸c mÉu ®Æc tr−ng. A psychoacoustic model lµ qu¸ tr×nh tËp hîp d÷ liÖu vµ ®iÒu khiÓn viÖc l−îng tö ho¸ vµ m· ho¸ ®Ó t¹o ra khèi c¸c Frame. Khèi c¸c frame lµ c¸c gãi chuÈn (c¬ së) ®−îc m· ho¸. Trang 13
  15. Lý thuyết xử lý Video 1.2.2 MPEG-2 Th¸ng 11/1994, MPEG-2 ®−îc phª chuÈn vµ b¾t ®Çu ®−îc ph¸t triÓn trªn c¬ së c¸c kü thuËt nÐn tèt nhÊt cña MPEG-1 nh−ng phÇn m· ho¸ ®−îc më réng h¬n. C¸c m· nµy ®−îc ¸p dông cho c¸c ¶nh cã ®é ph©n gi¶i 4:2:2 vµ cao h¬n. Tuy nhiªn MPEG-2 vÉn kh«ng ®−îc triÓn khai trong c¸c øng dông video. §Õn th¸ng 4/1997, MPEG-2 ®−a thªm c¸c m· ph©n ®Þnh nhiÒu kªnh audio. Mét sè thuËt to¸n nÐn ©m thanh ®−îc ¸p dông trong phÇn nµy kh«ng cßn bÞ lÖ thuéc vµo c¸c thuËt to¸n ®−îc ¸p dông trong MPEG-1. Vµ chuÈn nµy ®· ®−îc tæ chøc ISO c«ng nhËn. M« h×nh hÖ thèng gi¶i m· MPEG-2 Theo m« h×nh nµy MPEG-2 ®¸nh ®Þa chØ phèi hîp mét hoÆc nhiÒu luång d÷ liÖu cña video vµ audio thµnh mét luång ®¬n thèng nh©t. C¸c d÷ liÖu trªn luång d÷ liÖu nµy ®−îc tæ chøc phï hîp nhÊt cho viÖc l−u tr÷ vµ ph¸t video. ViÖc tæ chøc nµy dùa vµo hai líp chÝnh: Program Stream vµ Transport Stream. Program Stream(PS) lµ viÖc phèi hîp mét hoÆc nhiÒu gãi tin c¬ b¶n PES (Packetised Elementary Streams ) trong c¸c luång d÷ liÖu ®¬n thµnh mét luång d÷ liÖu ®¬n thèng nhÊt. Gãi tin Program Stream cã ®é lín kh¸c nhau vµ nh− vËy thêi gian truyÒn gãi tin lµ kh¸c nhau. Trong qu¸ tr×nh truyÒn c¸c gãi tin, nÕn ph¸t hiÖn cã mét gãi tin bÞ mÊt th× hÖ thèng sÏ yªu cÇu truyÒn l¹i toµn bé c¸c gãi tin.( v× Program Stream kh«ng x¸c ®Þnh gãi tin nµo ph¶i ®−îc truyÒn l¹i). Trang 14
  16. Lý thuyết xử lý Video Program Stream ®−îc thiÕt kÕ cho viÖc sö dông trong hÖ thèng ®−êng truyÒn rÊt Ýt lçi. Nã phï hîp víi c¸c øng dông cã dïng phÇn mÒm ®Ó xö lý. Transport Stream(TS) lµ viÖc phèi hîp mét hoÆc nhiÒu gãi tin c¬ b¶n PES (Packetised Elementary Streams ) trong c¸c luång d÷ liÖu ®¬n thµnh mét luång d÷ liÖu ®¬n thèng nhÊt. Gãi tin Transport Stream cã ®é lín b»ng nhau lµ188byte vµ nh− vËy thêi gian truyÒn gãi tin lµ nh− nhau. Trong qu¸ tr×nh truyÒn c¸c gãi tin, nÕn ph¸t hiÖn cã mét gãi tin bÞ mÊt th× hÖ thèng kh«ng yªu cÇu truyÒn l¹i toµn bé c¸c gãi tin mµ chØ yªu cÇu truyÒn l¹i gãi tin bÞ mÊt.( v× Transport Stream ®¸nh chØ sè cho c¸c gãi tin). Transport Stream ®−îc thiÕt kÕ cho viÖc sö dông trong hÖ thèng ®−êng truyÒn( m«i tr−êng) cã nhiÒu lçi. §Þnh d¹ng MPEG-2 cã khu«n h×nh chuÈn lµ 720x480. Víi yªu cÇu ®−êng truyÒn cã tèc ®é tõ 5-20Mbps. HiÖn nay MPEG-2 ®−îc øng dông cho viÖc x©y dùng Video víi chÊt l−îng cao trªn thiÕt bÞ DVD. 1.2.3 MPEG-4 MPEG-4 lµ chuÈn ISO/IEC ®−îc ph¸t triÓn bëi MPEG (Moving Picture Experts Group). Uû ban nµy còng ®· ph¸t triÓn chuÈn MPEG-1 vµ MPEG-2. C¸c chuÈn nµy cho phÐp ph¸t hµnh video trªn CD-ROM vµ truyÒn h×nh sè. MPEG-4 lµ kÕt qu¶ cña hµng tr¨m nhµ nghiªn cøu vµ kü s− trªn toµn thÕ giíi. MPEG-4 ®−îc hoµn thµnh vµ th¸ng 10/1998 vµ trë thµnh chuÈn quèc tÕ th¸ng 1/1999. Cuèi n¨m 1999 ra ®êi phiªn b¶n 2 cña MPEG-4. MPEG-4 sö dông thuËt to¸n nÐn ®èi t−îng c¬ b¶n. §Þnh d¹ng nµy yªu cÇu tèc ®é ®−êng truyÒn thÊp (64kbps) vµ kh«ng cã kÝch cì khu«n h×nh chuÈn. NÐn h×nh ¶nh trong Mpeg-4 sö dông kü thuËt phÇn líp vµ l−u c¸c th«ng tin ®èi l−îng. Mçi líp l−u m· nÐn vÒ néi dung cña mét chuçi c¸c ¶nh( bao gåm: ®−êng viÒn, quü ®¹o chuyÓn ®éng, kÕt cÊu bÒ mÆt). Khi gi¶i nÐn, th«ng qua néi dung ®−îc l−u trong c¸c líp ®Ó x©y dùng l¹i tõng phÇn cña ®o¹n video. Trang 15
  17. Lý thuyết xử lý Video M« h×nh nÐn vµ gi¶i nÐn theo tõng líp Theo m« h×nh nµy, Video ®−îc nÐn trªn 3 líp víi tû lÖ gi¶m kÝch cì (kh«ng gian) lµ 2 lÇn trªn tõng líp. Trªn c¸c líp ngoµi nh÷ng th«ng tin vÒ néi dung cña mét chuçi h×nh ¶nh cßn l−u tû lÖ gi¶m kh«ng gian cña líp so víi líp trªn ®ã. Khi gi¶i nÐn dùa vµo tû lÖ nµy cïng víi c¸c th«ng tin vÒ ®−êng viÒn, quü ®¹o chuyÓn ®éng, kÕt cÊu bÒ mÆt cña ®èi t−îng trong video ®Ó phôc håi l¹i ®o¹n video gèc. Nh− vËy dùa vµo tû lÖ gi¶m kÝch cì kh«ng gian video chóng ta cã thÓ ®iÒu chØnh ®−îc tèc ®é ph¸t h×nh còng nh− kÝch cì cña tÖp video cho phï hîp víi b¨ng th«ng. Víi tÝnh mÌm dÎo cña MPEG-4, nã ®· ®−îc triÓn khai trong 3 lÜnh vùc : TruyÒn h×nh sè (Digital television) T−¬ng t¸c tèt víi c¸c øng dông ®å ho¹ (Interactive graphics applications ) T−¬ng t¸c víi ®a ph−¬ng tiÖn (Interactive multimedia) ChuÈn kü thuËt cña MPEG-4 ®−îc thèng nhÊt cho s¶n xuÊt, ph©n phèi c¸c s¶n phÈm Video cho c¶ 3 lÜnh vùc trªn. Trang 16
  18. Lý thuyết xử lý Video IV. ¢m thanh Khi nãi ®Õn video bao giê ng−êi ta còng ®Ò cËp ®Õn 2 vÊn ®Ò ®ã lµ h×nh ¶nh vµ ©m thanh. Cã thÓ nãi ©m thanh lµ mét phÇn kh«ng thÓ t¸ch rêi ®èi víi video, vËy ©m thanh lµ g×? Chóng ta sÏ xem xÐt c¸c vÊn ®Ò vÒ ©m thanh ë c¸c phÇn d−íi ®©y. 1. ¢m thanh tù nhiªn Cã thÓ nãi b¶n chÊt cña ©m thanh ®ã lµ sù dao ®éng kh«ng khÝ. Khi mét vËt ph¸t ra ©m thanh chÝnh lµ vËt ®ã ®· lµm kh«ng khÝ xung quanh ®ã bÞ dao ®éng. ®o dao ®éng cña ©m thanh b»ng Hz vµ ®¬n vÞ ®o ®é ån cña ©m thanh lµ dB. §é ån : dB = 20.log10 (P1/P2) víi P lµ tÇn sè ©m thanh §Æc ®iÓm: ©m thanh gióp cho con ng−êi cã thÓ hiÓu nhanh, râ rµng mét vÊn ®Ò. Nã kh¸c xa víi c¸c tÝn hiÖu tõ Text bëi v× sù phèi hîp gi÷a ©m thanh vµ h×nh ¶nh gióp cho con ng−êi cã thÓ hiÓu râ ®−îc mäi sù vËt mét c¸ch nhanh chãng. Trong tù nhiªn kh¶ n¨ng nghe cña con ng−êi kho¶ng 40 Hz ~ 44KHz, nÕu tÇn sè ©m thanh qu¸ cao hoÆc qu¸ thÊp th× ng−êi ta còng kh«ng thÓ nghe ®−îc nh÷ng ©m thanh nµy. Ta cã thÓ nghe thÊy ©m thanh cã trong thùc tÕ hoÆc ®−îc con ng−êi s¸ng t¹o ra. 2. H×nh thøc sè ho¸ ©m thanh Ng−êi ta cã thÓ sè ho¸ video theo s¬ ®å sau: § Çu vµo H×nh thøc sè ho¸ §Çu ra ©m thanh ¢m thanh thùc D÷ liÖu d¹ng sãng Micro Loa PhÇn mÒm Thu ghi ©m thanh tæng hîp ThiÕt bÞ audio Tæng hîp T¹o míi PhÇn mÒm dao ®éng Hîp thµnh D÷ liÖu d¹ng kÝ hiÖu Bµn phÝm, chuét Trang 17
  19. Lý thuyết xử lý Video Theo s¬ ®å trªn chóng ta thÊy ®Çu vµo cña ©m thanh cã tõ rÊt nhiÒu nguån kh¸c nhau. Cã thÓ lµ ©m thanh thùc cã trong tù nhiªn. Th«ng qua c¸c thiÕt bÞ thu nh− micro chuyÓn hãa ©m thanh thµnh d¹ng sãng ®iÖn tõ vµ ghi vµo b¨ng ®Üa. Chóng ta còng cã thÓ dïng c¸c thiÕt bÞ sao chÐp ©m thanh nh− ®Çu video, radio cassette,... ®Ó chuyÓn ©m thanh tõ b¨ng, sang b¨ng, tõ b¨ng sang ®Üa,... Chóng ta còng cã thÓ t¹o ©m thanh b»ng c¸ch x©y dùng c¸c bé dao ®éng nh− c¸c thiÕt bÞ ©m nh¹c... Víi sù hç trî cña c¸c phÇn mÒm tæng hîp ©m thanh chóng ta co thÓ t¹o ©m thanh tõ c¸c ký hiÖu. VÝ dô: chóng ta cã thÓ ch¬i nh¹c b»ng bµn phÝm, x©y dùng mét b¶n nh¹c b»ng c¸ch so¹n c¸c nèt nh¹c sau ®ã cho ph¸t l¹i trªn m¸y tÝnh. Tõ c¸c nguån ©m thanh kh¸c nhau c¸c ©m thanh nµy ®Òu ®−îc chuyÓn ho¸ thµnh sãng ®iÖn tõ vµ ®−îc sè ho¸. C¸c d÷ liÖu sau khi ®−îc sè ho¸ sÏ ®−îc m¸y tÝnh xö lý. Sau ®ã c¸c d÷ liÖu nµy sÏ ®−îc chuyÓn ng−îc thµnh ©m thanh thùc th«ng qua hÖ thèng loa. 3. ¢m thanh gèc C¸c tÝn hiÖu ©m thanh ë d¹ng nguyªn thÓ cã d¹ng h×nh sãng. Tr−íc ®©y ng−êi ta th−êng thu tÝn hiÖu ©m thanh vµ ghi l¹i d−íi d¹ng t−¬ng tù. Ngµy nay, víi sù ph¸t triÓn cña c«ng nghÖ sè nªn ng−êi ta ®· sè ho¸ ©m thanh ®Ó cã thÓ xö lý tèt h¬n cho c¸c øng dông thùc tÕ. Amplitude Analog Input Quantized Data Time Time Trang 18
  20. Lý thuyết xử lý Video S¬ ®å l−îng tö ho¸ tÝn hiÖu ©m thanh ¢m thanh trong tù nhiªn lµ sù dao ®éng d¹ng sãng cña khÝ. Khi ®−îc m· ho¸ ®−íi d¹ng sãng ®iÖn tõ, ©m thanh cã cã d¹ng ®å thÞ nh− trªn. §Ó sè ho¸ ng−êi ta sÏ lÊy mÉu t¹i c¸c ®iÓm kh¸c nhau däc theo ®å thÞ cña ©m thanh. Sè ®iÓm lÊy mÉu cµng lín chÊt l−îng ©m thanh sè cµng cao. Ph−¬ng thøc lÊy mÉu trong ©m thanh 4. V× ©m thanh chÝnh lµ sù dao ®éng h×nh sãng quanh mét trôc nªn ng−êi ta chØ tÝnh tÇn sè ©m thanh lµ phÇn trªn cña ®å thÞ th«ng qua trôc ®èi xøng. Hay nãi c¸ch kh¸c ng−êi ta chØ lÊy mÉu lµ mét nöa chu kú dao ®éng. VÝ dô nÕu nãi giäng nãi cã tÇn sè lµ ~5.5 KHz th× tøc lµ tÇn sè thùc khi nghe sÏ lµ 11KHz. Trong thùc tÕ khi s¶n xuÊt ®Üa CD nh¹c th× ng−êi ta th−êng ghi víi tÇn sè nghe - >44.1KHz . Khi xem xÐt vÊn ®Ò vÒ tÝn hiÖu chóng ta thÊy r»ng: nÕu tÝn hiÖu tÇn sè vµo lín h¬n kh¶ n¨ng nghe cña con ng−êi th× sÏ g©y ra c¸c biÕn d¹ng ©m thanh. Do ®ã cÇn ph¶i cã c¸c ph−¬ng ph¸p läc bá c¸c tÇn sè kh«ng phï hîp. Khi sè ho¸ ng−êi ta lÊy mÉu trong tõng khu vùc vµ Information Information ghi l¹i tÇn sè ®Æc tr−ng trong khu vùc ®ã. loss Analog L−îng tö ho¸ ®é s©u Input Quantization 1 bit = 20.log10(2)= 6.021 dB Limit Quantized 16 bit= 6.021*16 =96 dB Data ChuÈn DVD kho¶ng l−îng tö ho¸ : 16/20/24 bit Trong qu¸ tr×nh l−îng tö ho¸, ng−êi ta th−êng c¾t tiÕng ån b»ng c¸ch ®Æt ra giíi h¹n khi l−îng tö ®Ó kh«ng g©y ta hiÖn t−îng d÷ liÖu bÞ sai lÖch. Nh−ng c¸ch tèt nhÊt vÉn lµ ®iÒu chØnh møc thu ©m thanh nguån. Trang 19
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2