CHƯƠNG TRÌNH KC01 ĐỀ TÀI MÃ SỐ KC01-14 ------&------

ĐỀ TÀI THUỘC CHƯƠNG TRÌNH KHCN CẤP NHÀ NƯỚC KC 01 MÃ SỐ KC 01.14 NGHIÊN CỨU PHÁT TRI ỂN ỨNG DỤNG CÔNG NGHỆ ĐA PHƯƠNG TIỆN

Ch ủ nhiệm đề tài: PGS.TS. Nguyễn Cát Hồ

CẤP QUẢN LÝ: Nhà nước CƠ QUAN CHỦ TRÌ: Viện công nghệ thông tin – Đại học Quốc

gia Hà nội

BÁO CÁO CH CHUYÊN ĐỀ: LÝ THUYẾT XỬ LÝ VIDEO

CHỦ TRÌ CHUYÊN ĐỀ: PHAN THẾ HÙNG

6352-10 20/4/2007

HÀ NỘI, 4/2005

Lý thuyết xử lý Video

Môc lôc

3

I. Kh¸i niÖm vÒ Video 3

4

1. Kh¸i niÖm chung

4

2. Kh¸i niÖm Digital Video (Video sè)

3. §Æc ®iÓm Video sè

6

II. NÐn d÷ liÖu Video 6

7

1. Sù cÇn thiÕt ph¶i nÐn víi hiÖu suÊt (tØ lÖ nÐn) cao

2. Mét sè thuËt to¸n nÐn dïng cho Video

11

III. C¸c ®Þnh d¹ng Video sè 11

1. §Þnh d¹ng Video

17

IV. ¢m thanh 17

17

1. ¢m thanh tù nhiªn

18

2. H×nh thøc sè ho¸ ©m thanh

19

3. ¢m thanh gèc

20

4. Ph−¬ng thøc lÊy mÉu trong ©m thanh

22

5. Mét sè chuÈn nÐn d÷ liÖu ©m thanh

22

6. T¹o ©m thanh

23

7. ¢m thanh 3D thùc

8. §Þnh d¹ng ©m thanh

24

V. C¸c tham sè trong Video vµ audio 24

30

1. C¸c tham sè cho Video

Trang 1

2. C¸c tham sè cho Audio

Lý thuyết xử lý Video

VI. ChuyÓn ®æi d÷ liÖu tõ video, b¨ng, ®Üa CD thµnh

33

c¸c tÖp Video-Audio cho m¸y tÝnh vµ ng−îc l¹i 33

34

1. C¸c cæng chuyÓn ®æi tÝn hiÖu

2. Thu tÝn hiÖu tõ c¸c thiÕt bÞ ph¸t Video-Audio vµo m¸y tÝnh

3. ChuyÓn ®æi d÷ liÖu Video-Audio thµnh c¸c ®Þnh d¹ng kh¸c nhau 36

VII. Mét sè kü thuËt xö lý Video-Audio trªn m¸y

41

tÝnh 41

41

1. Kü thuËt ®¸nh dÊu (Marker) vµ keyframe

42

2. ChuyÓn c¶nh (Transition)

44

3. Kü thuËt trén (mix)

Trang 2

4. Kü thuËt t¹o ®é trong suèt (Transparence)

Lý thuyết xử lý Video

I. Kh¸i niÖm vÒ Video

1. Kh¸i niÖm chung

Video ra ®êi vµo nh÷ng n¨m ®Çu cña thÕ kû XX nh−ng nã ph¸t triÓn kh¸

chËm ch¹p vµ cã nhiÒu ng−êi cßn kh«ng tin vµo kh¶ n¨ng cña nã. Nh−

Darryl.Zanuck, gi¸m ®èc h·ng phim Fox-TK20 ph¸t biÓu ®Çu n¨m 1946 “ Tivi

sÏ kh«ng thÓ nµo tiÕp tôc ®−îc träng dông qu¸ 6 th¸ng. Ng−êi ta sÏ nhanh

chãng ch¸n ngay viÖc theo dâi mét c¸i hép gç mçi tèi”. Video chØ thùc sù ph¸t

triÓn vµo nh÷ng n¨m cuèi cña thÕ kû XX. Víi sù ph¸t triÓn nhanh chãng cña

c«ng nghÖ, ngµy nay Tivi-Video ®· trë thµnh mét thµnh phÇn kh«ng thÓ thiÕu

®−îc trong ®êi sèng x· héi.

Video lµ g×? Chóng ta cã thÓ hiÓu Video lµ mét d¹ng d÷ liÖu bao gåm ©m

thanh vµ h×nh ¶nh kÕt hîp víi nhau vµ lu«n cã sù biÕn ®æi vÒ néi dung (khu«n

h×nh) theo thêi gian.

C¸c yªu cÇu hÖ thèng cña Video: Th«ng th−êng, nÕu chóng ta xem mét

®o¹n Video mµ ©m thanh vµ h×nh ¶nh kh«ng khíp hay tèc ®é qu¸ chËm so víi

kh¶ n¨ng nh×n cña chóng ta th× ch¾c ch¾n video kh«ng thÓ ®¨ng t¶i ®−îc néi

dung thùc sù cña nã . NÕu chóng ta xem c¸c phim ®−îc s¶n xuÊt ®Çu thÕ kû

XX th× chóng ta thÊy c¸c h×nh ¶nh trªn mµn h×nh th−êng bÞ chËm hay bÞ giËt so

víi ho¹t ®éng thùc. Lý do lµ c¸c m¸y quay ®· kh«ng thu ®ñ 24 h×nh trªn 1 gi©y.

Do ®ã, c¸c hÖ thèng Video hiÖn nay ®Òu yªu cÇu c¸c thiÕt bÞ thu, ph¸t, ®−êng

truyÒn video ph¶i ®¶m b¶o viÖc hiÓn thÞ h×nh ¶nh vµ ©m thanh trong thêi gian

thùc. HiÖn nay trªn thÕ giíi sö dông 3 hÖ Video chÝnh: NTSC (National

Television Standard Committee) theo chuÈn 29,97 h×nh/gi©y, PAL, SECAM

theo chuÈn 25 h×nh/gi©y.

TruyÒn h×nh NTSC dïng mµnh 525 dßng vµ hiÓn thÞ ®Çy mµnh víi tÇn sè

30 mµnh mçi gi©y, b»ng ph−¬ng ph¸p quÐt xen dßng 60 b¸n mµnh mçi gi©y ®Ó

phï hîp víi tÇn sè xoay chiÒu ë Mü lµ 60 Hz. C¸c ghÐp nèi video NTSC sö dông

c¸c ®Çu c¾m vµ jack c¾m chuÈn RCA. C¸c chuyªn gia v« tuyÕn truyÒn h×nh

Trang 3

th−êng nãi ®ïa r»ng NTSC lµ viÕt t¾t cña " Never Twice The Same Color" (cïng

Lý thuyết xử lý Video

mét mµu kh«ng bao giê lÆp l¹i hai lÇn) v× kh¶ n¨ng kiÓm so¸t mµu cña chuÈn

NTSC rÊt kÐm. TruyÒn h×nh NTSC ®−îc qu¶ng b¸ ë Mü, nhËt vµ hÇu hÕt c¸c

n−íc Trung vµ Nam Mü nh−ng kh«ng dïng ë Ch©u ¢u vµ Ch©u ¸. HÇu hÕt c¸c

n−íc ch©u ¢u vµ ch©u ¸ ®Òu dïng chuÈn PAL dùa trªn c¬ së tÇn sè ®iÖn lµ 50

Hz.

2. Kh¸i niÖm Digital Video (Video sè)

Cïng víi sù ra ®êi vµ ph¸t triÓn m¹nh mÏ cña m¸y tÝnh vµ hÖ thèng viÔn

th«ng trong nh÷ng thËp kû cuèi cña thÕ kû XX, m¸y tÝnh ®· ®−îc sö dông

trong rÊt nhiÒu ngµnh c«ng nghiÖp. Do ®ã ®Æt ra yªu cÇu cÇn ph¶i cã d÷ liÖu

d¹ng ©m thanh vµ h×nh ¶nh cho m¸y tÝnh (®Ó m¸y tÝnh cã thÓ hiÓu ®−îc). ChÝnh

v× vËy ra ®êi kh¸i niÖm Digital Video. Digital Video lµ Video nh−ng ®−îc ghi

(m· ho¸) d−íi d¹ng sè b»ng c¸c m· 0 vµ 1. Video th«ng th−êng ®−îc ghi d−íi

d¹ng tÝn hiÖu t−¬ng tù (Analog)

3. §Æc ®iÓm Video sè

- Video sè sö dông ®é ph©n gi¶i 72dpi.

Video sè th−êng sö dông ®é ph©n gi¶i 72 dpi (sè ®iÓm ¶nh cho 1 inch).

§Æc ®iÓm nµy dùa trªn giíi h¹n vÒ kh¶ n¨ng nh×n cña m¾t ng−êi. Víi mµu

huúnh quang th× m¾t ng−êi chØ nhËn biÕt ®−îc sù kh¸c nhau cña chÊt l−îng h×nh

¶nh chuyÓn ®éng víi ®é ph©n gi¶i d−íi 72 dpi.

Chóng ta chØ sö dông ®é ph©n gi¶i trªn 72 dpi cho mét sè tr−êng hîp ®Æc

biÖt khi cÇn cã Video hoÆc ¶nh chÊt l−îng cao nh− c¸c ®o¹n phim ¶nh sö dông

cho viÖc ph©n tÝch khoa häc cÇn phãng to lªn nhiÒu lÇn hoÆc c¸c ¶nh dïng

trong ngµnh c«ng nghiÖp in Ên. NÕu muèn cã mét tÊm ¶nh in víi chÊt l−îng

cao cã thÓ ng−êi ta ph¶i ®Æt ®é ph©n gi¶i lªn trªn 400 dpi.

- KÝch cì tÖp video lµ rÊt lín.

Trang 4

Chóng ta cã thÓ lµm mét phÐp tÝnh nh− sau:

Lý thuyết xử lý Video

NÕu mét ®o¹n Video th«ng th−êng hÖ PAL (24 h×nh trªn gi©y) cã thêi

l−îng lµ 1 phót cã kÝch cì khung h×nh lµ 640x480 ®é s©u mµu 16 bit th× kÝch

cì tÖp nµy lµ: 16x640x480x24x60= 7077888000bit= 843MB

Nh− vËy chóng ta thÊy r»ng d÷ liÖu cña video lµ rÊt lín so víi thiÕt bÞ l−u

tr÷ th«ng tin hiÖn nay. Do vËy ng−êi ta lu«n ph¶i t×m mäi c¸ch ®Ó gi¶m kÝch cì

cña Video. Cã nhiÒu c¸ch gi¶m kÝch cì tÖp video vÝ dô nh− gi¶m kÝch cì

khu«n h×nh, gi¶m ®é s©u mÇu... nh−ng c¸ch hiÖu qu¶ ®ã lµ sö dông c¸c thuËt

to¸n nÐn ¶nh.

C¸c thuËt to¸n nÐn ¶nh ®¶m b¶o cho viÖc sö dông c¸c tÖp video trªn m¸y

tÝnh còng nh− truyÒn d÷ liÖu video trªn m¹ng lµ hiÖu qu¶, trong thêi gian thùc.

HiÖn nay, ®· cã rÊt nhiÒu thuËt to¸n nÐn video kh¸c nhau, nh−ng nÒn t¶ng vÉn

chñ yÕu dùa trªn c¸c thuËt to¸n nÐn ¶nh nh− thuËt to¸n RLE, LZW, Wavalet,

DCT... Ngoµi ra ng−êi ta cßn cã mét sè thuËt to¸n giµnh riªng cho Video sè

Trang 5

nh− nÐn kh«ng gian mµu, nÐn cÊu tróc trong, nÐn dùa vµo ®èi t−îng c¬ b¶n.

Lý thuyết xử lý Video

II. NÐn d÷ liÖu Video

1. Sù cÇn thiÕt ph¶i nÐn víi hiÖu suÊt (tØ lÖ nÐn) cao

Nh− chóng ta ®· biÕt d÷ liÖu Video sè lµ rÊt lín vµ yªu cÇu hiÓn thÞ trong

thêi gian thùc, do ®ã muèn sö dông ®−îc video sè mét c¸ch hiÖu qu¶ th× ph¶i

cã thuËt to¸n nÐn víi hiÖu suÊt cao.

HiÖn nay, cã nhiÒu thuËt to¸n nÐn kh¸c nhau nh−ng cã thÓ ph©n thµnh hai

d¹ng chÝnh: ®ã lµ thuËt to¸n nÐn mÊt th«ng tin vµ nÐn kh«ng mÊt th«ng tin.

NÐn kh«ng mÊt th«ng tin: ®©y lµ nhãm c¸c thuËt to¸n nÐn mµ khi d÷ liÖu

®−îc phôc håi vÉn ®¶m b¶o ®−îc chÊt l−îng nh− d÷ liÖu gèc ( chÊt l−îng Video

kh«ng hÒ thay ®æi). Nh−ng nh÷ng thuËt to¸n nµy cã tû lÖ nÐn rÊt thÊp . Nã chØ

nÐn ®−îc kho¶ng 2 lÇn so víi kÝch cì gèc. Trong thùc tÕ chØ sö dông c¸c thuËt

to¸n nÐn nµy ®Ó t¹o c¸c tÖp video nguån cho so¹n th¶o hoÆc ®Ó di chuyÓn video

tõ hÖ thèng nµy sang hÖ thèng kh¸c. Khi lµm viÖc víi c¸c tÖp video sö dông

thuËt to¸n nµy chóng ta cÇn chó ý c¸c tÖp video lµ rÊt lín ®èi víi nhiÒu hÖ thèng

m¸y tÝnh ®ång thêi yªu cÇu vÒ tèc ®é truyÒn d÷ liÖu còng rÊt cao khi hiÓn thÞ

( playback).

NÐn mÊt th«ng tin: c¸c thuËt to¸n thuéc nhãm nµy th−êng cã tû lÖ nÐn rÊt

cao cã thÓ nÐn víi tû lÖ tõ 10 ®Õn 100 lÇn so víi kÝch cì gèc. VÝ dô khi ta cã 1

tÖp Video kÝch cì 100 Mb, nÕu ¸p dông thuËt to¸n nÐn nµy th× kÝch cì cña tÖp

Video chØ cßn kho¶ng tõ 1-10 Mb. Nh−îc ®iÓm cña c¸c thuËt to¸n nµy lµ chØ

®¶m b¶o chÊt l−îng h×nh ¶nh Video t−¬ng ®èi tèt nh−ng kh«ng ®−îc nh− h×nh

¶nh Video gèc. Tøc lµ khi dïng c¸c thuËt to¸n nÐn nµy mét nhãm th«ng tin cña

video ®· ®−îc l−îng tö ho¸ vÝ dô mét nhãm mµu gÇn gièng nhau gÇn nhau ®−îc

chuyÓn thµnh mét mµu ®Æc tr−ng ®Ó gi¶m sù m· ho¸ mµu nh− vËy sÏ lµm gi¶m

kÝch cì tÖp video. Khi phôc håi c¸c tÖp video ®Ó hiÓn thÞ trªn mµn h×nh th× th«ng

tin vÒ mµu s¾c sÏ kh«ng ®−îc ®Çy ®ñ nh− tÖp gèc nh−ng kÌm vµo ®ã lµ c¸c

ph−¬ng ph¸p xö lý mµu gi÷a c¸c vïng mµu cña thuËt to¸n lµm cho c¸c c¶nh

video cã chÊt l−îng gÇn nh− ban ®Çu. §iÓn h×nh lµ mét sè kiÓu nÐn nh− JPEG,

Trang 6

Planar RGB.

Lý thuyết xử lý Video

Trong thùc tÕ th× ng−êi ta sö dông nhiÒu c¸c thuËt to¸n nÐn nµy cho c¸c

tÖp video sö dông trªn ®Üa CD-ROM, trªn Internet v× cã thÓ thay ®æi ®−îc chÊt

l−îng tÖp video lµm cho kÝch cì cña tÖp nhá ®i, vµ tèc ®é hiÓn thÞ ( play back)

nhanh h¬n.

2. Mét sè thuËt to¸n nÐn dïng cho Video

2.1 NÐn kh«ng gian mµu

§©y lµ thuËt to¸n dùa trªn nguyªn lý lµm gi¶m th«ng tin mµu (trong kh«ng

gian YUV) vµ sù kÐm nh¹y c¶m cña m¾t ng−êi víi mµu s¾c ®Æc biÖt víi viÖc

mµu s¾c liªn tôc thay ®æi trong c¸c chuyÓn ®éng. Dùa trªn 3 mµu c¬ b¶n RGB

ng−êi ta cã mét kh«ng gian mµu nh− sau:

NÕu lÊy O lµm gèc víi ba trôc lµ ba mµu c¬

B

M

b¶n ®á, xanh vµ xanh l¸ c©y (Red,Green,Blue), ta sÏ

cã kh«ng gian mµu (ORGB). Trôc KO lµ ®−êng

N

K

I

O

tæng hîp ¸nh s¸ng cña 3 mµu víi gi¸ trÞ b»ng nhau

R

do ®ã nã chÝnh lµ ®−êng thÓ hiÖn ®é s¸ng cña mµu

G

s¾c. T¹i gèc O sÏ lµ mµu ®en.

A

Tõ kh«ng gian nµy ta x©y dùng kh«ng gian YUV b»ng c¸ch: Dïng mÆt

ph¼ng GRB lµm mÆt ph¼ng mµu. MÆt ph¼ng nµy cã mµu s¾c ®−îc tæng hîp tõ

3 mµu c¬ b¶n. §Æt tªn mÆt ph¼ng nµy lµ mÆt ph¼ng (U,V) víi hai ®−êng th¼ng

U,V vu«ng gãc víi nhau vµ c¾t nhau t¹i I.

Trôc Y vu«ng gãc víi mÆt ph¼ng (U,V) lµ ®−êng th¼ng KO thÓ hiÖn

®é s¸ng (®é chãi) cña ¸nh s¸ng.

V

Y

U

YUV (Luminance, 2 Color diferences)

V

Y

U

Y:U:V = 4:2:2

V

Y

U

Y:U:V = 4:1:1

Trang 7

Y:U:V = 4:2:0

Lý thuyết xử lý Video

Trong thuËt to¸n nµy ng−êi ta nÐn vµ lµm gi¶m gi¸ trÞ mµu ë trªn 2 trôc U

vµ V cßn gi¸ trÞ ®é s¸ng Y ®−îc gi÷ nguyªn v× gi¸ trÞ nµy rÊt quan träng( m¾t

ng−êi rÊt nhËy c¶m ®èi víi ®éi s¸ng). Ng−êi ta th−êng ¸p dông réng r·i thuËt

to¸n nÐn nµy trong c¸c m¸y m¸y ghi Video, Tivi...

NÐn kh«ng gian mµu lµ c¸ch m« pháng ¶o c¸c vïng cña khu«n h×nh víi

b¶n chÊt lµ viÖc t×m ra c¸c mÉu vµ t¹o l¹i c¸c ®iÓm ¶nh. VÝ dô: trong mét ¶nh cã

vïng mµu xanh da trêi, thuËt to¸n nÐn kh«ng gian sÏ nhËn biÕt nhiÒu ®iÓm mµu

xanh gièng nhau trong kh«ng gian nµy. §Ó m« t¶ l¹i c¸c ®iÓm mµu xanh nµy,

thuËt to¸n nÐn kh«ng gian ghi l¹i c¸c m« t¶ ¶nh mét c¸ch ng¾n gän nhÊt vÝ dô

nh− sè ®iÓm trong vïng mµu xanh, m· mµu trong khu vùc ®ã...Nh− vËy nÕu b¹n

t¨ng kh«ng gian nÐn (kÝch cì vïng mµu) th× d÷ liÖu vµ kÝch cì tÖp video sÏ

gi¶m vµ ¶nh sÏ bÞ mÊt ®é nÐt. VËy cÊp ®é nÐn cã thÓ ®−îc ®iÒu khiÓn th«ng qua

c¸c chØ sè lùa chän chÊt l−îng vµ tèc ®é truyÒn d÷ liÖu.

2.2 NÐn cÊu tróc bªn trong

ThuËt to¸n nµy dùa trªn gi¶i ph¸p nÐn theo cÊu tróc vµ nÐn theo biÕn thêi

gian kÕt hîp víi kü thuËt bï chuyÓn ®éng.

§©y lµ c¸ch t×m kiÕm c¸c ®iÓm ¶nh thay ®æi trong mét kho¶ng thêi gian

hay mét chuçi c¸c khu«n h×nh.

VÝ dô, trong mét ®o¹n video cã mét nh©n vËt ®ang nãi trªn mét nÒn tÜnh.

ThuËt to¸n nÐn theo thêi gian sÏ nhËn biÕt c¸c pixel thay ®æi tõ khu«n h×nh nµy

sang khu«n h×nh kia ®ã lµ h×nh khu«n mÆt nh©n vËt ®ang nãi. Cßn tÊt c¶ c¸c

®iÓm kh¸c kh«ng thay ®æi. §Ó m« t¶ l¹i nhiÒu ®iÓm ¶nh vµ nhiÒu khu«n h×nh

th× thuËt to¸n nµy sÏ m« t¶ l¹i tÊt c¶ c¸c ®iÓm trong khu«n h×nh ®Çu tiªn. Cßn

c¸c khu«n h×nh tiÕp theo thuËt to¸n chØ m« t¶ l¹i c¸c ®iÓm thay ®æi. Ph−¬ng

ph¸p nµy gäi lµ ph−¬ng ph¸p tÝnh sai ph©n cña khu«n h×nh.

Nh− vËy b»ng c¸ch ph©n tÝch trªn thuËt to¸n sÏ ghi l¹i khu«n h×nh ®Çu

(keyframe) vµ kho¶ng thêi gian nµo ®ã cho chuyÓn ®éng. TiÕp theo c¸c néi

dung cña keyframe nh− vÞ trÝ, c¸c vïng ®iÓm mµu.. C¸c vïng ®iÓm ¶nh thay ®æi

Trang 8

theo thêi gian còng sÏ ®−îc l−u l¹i. Khi hiÓn thÞ l¹i tÖp video trªn mµn h×nh

Lý thuyết xử lý Video

ch−¬ng tr×nh dùa vµo c¸c chØ sè vÒ keyframe, mµu s¾c, ¸nh s¸ng, c¸c ®iÓm ¶nh

chuyÓn ®éng... ®Ó t¸i t¹o l¹i chuyÓn ®éng. Nh− vËy thuËt to¸n nµy ®· lµm mÊt

®i mét sè ®¸ng kÓ c¸c khu«n h×nh trong mét kho¶ng thêi gian vµ nh− vËy kÝch

f r a m e ( i n d e p e n d e n t ) K e y -- f r a m e ( i n d e p e n d e n t ) K e y

t i m e t i m e

D e f e r e n t i a l D e f e r e n t i a l D a t a O n l y D a t a O n l y

cì tÖp video sÏ nhá ®i.

Theo thuËt to¸n nµy nÕu sè keyframe cµng nhiÒu (thêi l−îng gi÷a c¸c

keyframe cµng ng¾n) th× chÊt l−îng video cµng tèt. V× vËy ng−êi ta dïng tham

sè keyframe vµ chÊt l−îng khu«n h×nh (keyframe) ®Ó ®iÒu chØnh cÊp ®é nÐn.

2.3 NÐn dùa vµo ®èi t−îng c¬ b¶n

ThuËt to¸n nµy dùa trªn kü thuËt ph©n gi· ¶nh thµnh cÊu tróc c©y ®èi t−îng

sau ®ã vÐct¬ ho¸ c¸c ®èi t−îng nµy (Vector Quantization (VQ)).

VÝ dô c¶nh video nh− ë h×nh bªn d−íi: H×nh ®èi t−îng con c¸ sÏ ®−îc t¸ch

ra khái nÒn vµ ®−îc Vector ho¸.

Nh− vËy viÖc ghi d÷ liÖu cho tÖp Video víi kiÓu nÐn nµy chÝnh lµ ghi c¸c

th«ng tin ¶nh Vector vµ c¸c th«ng tin chuyÓn ®éng cña ¶nh vÐct¬ trong mét

Trang 9

kho¶ng thêi gian nµo ®ã.

Lý thuyết xử lý Video

Khi gi¶i nÐn ch−¬ng tr×nh dùa trªn c¸c th«ng tin vÒ ®−êng biªn, mµu s¾c vµ

h−íng chuyÓn ®éng cña c¸c ®èi t−îng trong khu«n h×nh ®Ó x©y dùng l¹i chuyÓn

®éng. Tøc lµ sÏ sinh ra mét lo¹t c¸c Frame ®Ó h×nh thµnh ®o¹n video.

C¸c thuËt to¸n trªn ®Òu cã chung mét ®Æc ®iÓm lµ chØ l−u l¹i c¸c th«ng tin

cÇn thiÕt nhÊt cña video vµ trªn c¬ së ®ã x©y dùng c¸c frame cho video. ChÝnh

dùa trªn ®Æc ®iÓm nµy nªn hÇu hÕt c¸c thuËt to¸n nµy ®Òu cho phÐp thay ®æi chÊt

l−îng cña video tuú vµo môc ®Ých sö dông. Vi dô nh− nÕu ng−êi ta muèn sö

dông ®o¹n video cho Internet tèc ®é chËm th× cã thÓ ®iÒu chØnh chÊt l−îng kÐm

®i vµ nh− vËy kÝch cì tÖp video sÏ nhá ®i nhiÒu. Trong tr−êng hîp môc ®Ých sö

dông cÇn cã chÊt l−îng cao mµ kh«ng bÞ giíi h¹n vÒ ®−êng truyÒn nh− c¸c tÖp

Video ®−îc ghi trªn ®Üa CD, DVD th× chóng ta cã thÓ ®iÒu chØnh chÊt l−îng nÐn

Trang 10

phï hîp ®Ó cã ®−îc c¸c tÖp video tho¶ m·n yªu cÇu ®Æt ra.

Lý thuyết xử lý Video

III. C¸c ®Þnh d¹ng Video sè

1. §Þnh d¹ng Video

1.1 §Þnh d¹ng chuÈn cho hÖ ®iÒu hµnh

1.1.1 §Þnh d¹ng AVI

§©y lµ ®Þnh d¹ng ®−îc thiÕt kÕ ®Ó dïng trong m«i tr−êng Windows. §Þnh

d¹ng nµy cã thÓ sö dông rÊt nhiÒu thuËt to¸n nÐn video ®−îc ph¸t triÓn tõ tr−íc

®Õn nay.

1.1.2 §Þnh d¹ng QuickTime

§©y lµ ®Þnh d¹ng ®−îc thiÕt kÕ ®Ó dïng trong m«i tr−êng Macintosh. ®Þnh

d¹ng Quicktime ®−îc x©y dùng tõ nhiÒu thuËt to¸n nÐn ¶nh vµ ©m thanh trong

m«i tr−êng Macintosh. Quick time còng lµ ®Þnh d¹ng ®−îc rÊt nhiÒu phÇn mÒm

øng dông hç trî. Kh«ng nh÷ng thÕ nã cßn ®−îc cµi ®Æt trong nhiÒu chÝp xö lý

cña hÖ thèng.

HiÖn nay c¶ hÖ hÖ ®iÒu hµnh Windows vµ Macintosh ®Òu cho phÐp sö

dông c¶ hai ®Þnh d¹ng Video nµy.

1.2 ChuÈn quèc tÕ

MPEG-1/2/4- ISO (chuÈn quèc tÕ)

§Þnh d¹ng MPEG-1/2/4 ®−îc ph¸t triÓn bëi MPEG (Moving Picture

Experts Group). §Þnh d¹ng nµy ®−îc sö dông ®Ó t¹o c¸c s¶n phÈm video trong

ngµnh c«ng nghiÖp ph¸t thanh truyÒn h×nh, Internet vµ c¸c øng dông ®å häa .

1.2.1 MPEG-1

MPEG-1 ®−îc b¾t ®Çu ph¸t triÓn tõ n¨m 1993 vµ ®−îc hoµn thiÖn vµo n¨m

1998 víi nhiÒu −u ®iÓm nh−: ®Þnh d¹ng nµy cã chÊt l−îng cao t−¬ng ®−¬ng víi

chÊt l−îng hiÓn thÞ h×nh trªn Tivi, cã kh¶ n¨ng ®iÒu chØnh chÊt l−îng... Nã sö

Trang 11

dông thuËt to¸n DCT(Discrete Cosine Transformation ) víi khu«n h×nh chuÈn

Lý thuyết xử lý Video

352x240 ®iÓm víi yªu cÇu tèc ®é ®−êng truyÒn lµ 1.5Mbps (Mb trªn mét gi©y).

§Þnh d¹ng nµy ®−îc øng dông ®Ó x©y dùng c¸c s¶n phÈm Video trªn ®Üa CD-

ROM.

MPEG-1 ®−îc thiÕt kÕ nh− sau :

Theo chuÈn MPEG-1 nã ph©n ®Þnh ®Þa chØ cña c¸c kªnh d÷ liÖu ©m thanh

vµ h×nh ¶nh kÕt hîp víi thêi gian. §©y lµ chøc n¨ng quan träng v× tõ d¹ng d÷

liÖu nµy sÏ ®−îc chuyÓn ®æi thµnh c¸c kªnh d÷ liÖu phï hîp.

S¬ ®å nguyªn mÉu chuÈn gi¶n nÐn ISO/IEC 11172

Theo s¬ ®å nµy chóng ta thay th«ng qua c¸c ®Þa chØ ®−îc l−u tr÷ trong chuÈn

MPEG-1, khi gi¶i nÐn sÏ x¸c ®Þnh ®−îc chÝnh x¸c c¸c kªnh audio vµ video.

ThuËt to¸n nÐn cho chuÈn MPEG-1 cã kh¶ n¨ng nÐn cao. §Çu tiªn ng−êi ta

ph¶i lùa chän kh«ng gian phï hîp vµ gi¶i ph¸p tÝn hiÖu. Sau ®ã dïng thuËt to¸n

bï chuyÓn ®éng vµ gi¶m thêi gian d− thõa. Bï chuyÓn ®éng ®−îc sö dông trong

viÖc t¹o khu«n h×nh hiÖn t¹i dùa trªn khu«n h×nh tr−íc ®ã (chØ cÇn mét

keyframe tr−íc mµ kh«ng cÇn dùa vµo keyframe sau). C¸c tÝn hiÖu kh¸c, c¸c lçi

®−îc l−îng ho¸ vµ nÐn b»ng c¸ch sö dông thuËt to¸n DCT (discrete cosine

Trang 12

transform).

Lý thuyết xử lý Video

H×nh 2: m« t¶ thêi gian cÇu tróc c¸c khu«n h×nh trong ®Þnh d¹ng MPEG-1

H×nh 2 m« t¶ sù kÕt hîp gi÷a 3 lo¹i th«ng tin vÒ ¶nh: C¸c pixel ¶nh thay ®æi,

c¸c chØ sè vÒ vÞ trÝ , sè l−îng khu«n h×nh ®−îc sinh ra tõ keyframe.

H×nh 3 CÊu tróc gi¶i nÐn c¬ b¶n cña Audio

§Çu vµo lµ c¸c tÝn hiÖu m· víi tÇn sè 32, 44.1, 48 kHz. B¶n ®å (mapping)

sÏ läc vµ lÊy ra c¸c mÉu ®Æc tr−ng. A psychoacoustic model lµ qu¸ tr×nh tËp

hîp d÷ liÖu vµ ®iÒu khiÓn viÖc l−îng tö ho¸ vµ m· ho¸ ®Ó t¹o ra khèi c¸c Frame.

Trang 13

Khèi c¸c frame lµ c¸c gãi chuÈn (c¬ së) ®−îc m· ho¸.

Lý thuyết xử lý Video

1.2.2 MPEG-2

Th¸ng 11/1994, MPEG-2 ®−îc phª chuÈn vµ b¾t ®Çu ®−îc ph¸t triÓn trªn c¬

së c¸c kü thuËt nÐn tèt nhÊt cña MPEG-1 nh−ng phÇn m· ho¸ ®−îc më réng

h¬n. C¸c m· nµy ®−îc ¸p dông cho c¸c ¶nh cã ®é ph©n gi¶i 4:2:2 vµ cao h¬n.

Tuy nhiªn MPEG-2 vÉn kh«ng ®−îc triÓn khai trong c¸c øng dông video. §Õn

th¸ng 4/1997, MPEG-2 ®−a thªm c¸c m· ph©n ®Þnh nhiÒu kªnh audio. Mét sè

thuËt to¸n nÐn ©m thanh ®−îc ¸p dông trong phÇn nµy kh«ng cßn bÞ lÖ thuéc

vµo c¸c thuËt to¸n ®−îc ¸p dông trong MPEG-1. Vµ chuÈn nµy ®· ®−îc tæ chøc

ISO c«ng nhËn.

M« h×nh hÖ thèng gi¶i m· MPEG-2

Theo m« h×nh nµy MPEG-2 ®¸nh ®Þa chØ phèi hîp mét hoÆc nhiÒu luång d÷

liÖu cña video vµ audio thµnh mét luång ®¬n thèng nh©t. C¸c d÷ liÖu trªn luång

d÷ liÖu nµy ®−îc tæ chøc phï hîp nhÊt cho viÖc l−u tr÷ vµ ph¸t video. ViÖc tæ

chøc nµy dùa vµo hai líp chÝnh: Program Stream vµ Transport Stream.

Program Stream(PS) lµ viÖc phèi hîp mét hoÆc nhiÒu gãi tin c¬ b¶n PES

(Packetised Elementary Streams ) trong c¸c luång d÷ liÖu ®¬n thµnh mét luång

d÷ liÖu ®¬n thèng nhÊt. Gãi tin Program Stream cã ®é lín kh¸c nhau vµ nh− vËy

thêi gian truyÒn gãi tin lµ kh¸c nhau. Trong qu¸ tr×nh truyÒn c¸c gãi tin, nÕn

ph¸t hiÖn cã mét gãi tin bÞ mÊt th× hÖ thèng sÏ yªu cÇu truyÒn l¹i toµn bé c¸c

Trang 14

gãi tin.( v× Program Stream kh«ng x¸c ®Þnh gãi tin nµo ph¶i ®−îc truyÒn l¹i).

Lý thuyết xử lý Video

Program Stream ®−îc thiÕt kÕ cho viÖc sö dông trong hÖ thèng ®−êng truyÒn rÊt

Ýt lçi. Nã phï hîp víi c¸c øng dông cã dïng phÇn mÒm ®Ó xö lý.

Transport Stream(TS) lµ viÖc phèi hîp mét hoÆc nhiÒu gãi tin c¬ b¶n PES

(Packetised Elementary Streams ) trong c¸c luång d÷ liÖu ®¬n thµnh mét luång

d÷ liÖu ®¬n thèng nhÊt. Gãi tin Transport Stream cã ®é lín b»ng nhau

lµ188byte vµ nh− vËy thêi gian truyÒn gãi tin lµ nh− nhau. Trong qu¸ tr×nh

truyÒn c¸c gãi tin, nÕn ph¸t hiÖn cã mét gãi tin bÞ mÊt th× hÖ thèng kh«ng yªu

cÇu truyÒn l¹i toµn bé c¸c gãi tin mµ chØ yªu cÇu truyÒn l¹i gãi tin bÞ mÊt.( v×

Transport Stream ®¸nh chØ sè cho c¸c gãi tin). Transport Stream ®−îc thiÕt kÕ

cho viÖc sö dông trong hÖ thèng ®−êng truyÒn( m«i tr−êng) cã nhiÒu lçi.

§Þnh d¹ng MPEG-2 cã khu«n h×nh chuÈn lµ 720x480. Víi yªu cÇu

®−êng truyÒn cã tèc ®é tõ 5-20Mbps. HiÖn nay MPEG-2 ®−îc øng dông cho

viÖc x©y dùng Video víi chÊt l−îng cao trªn thiÕt bÞ DVD.

1.2.3 MPEG-4

MPEG-4 lµ chuÈn ISO/IEC ®−îc ph¸t triÓn bëi MPEG (Moving Picture Experts

Group). Uû ban nµy còng ®· ph¸t triÓn chuÈn MPEG-1 vµ MPEG-2. C¸c chuÈn

nµy cho phÐp ph¸t hµnh video trªn CD-ROM vµ truyÒn h×nh sè. MPEG-4 lµ

kÕt qu¶ cña hµng tr¨m nhµ nghiªn cøu vµ kü s− trªn toµn thÕ giíi. MPEG-4

®−îc hoµn thµnh vµ th¸ng 10/1998 vµ trë thµnh chuÈn quèc tÕ th¸ng 1/1999.

Cuèi n¨m 1999 ra ®êi phiªn b¶n 2 cña MPEG-4.

MPEG-4 sö dông thuËt to¸n nÐn ®èi t−îng c¬ b¶n. §Þnh d¹ng nµy yªu cÇu tèc

®é ®−êng truyÒn thÊp (64kbps) vµ kh«ng cã kÝch cì khu«n h×nh chuÈn.

NÐn h×nh ¶nh trong Mpeg-4 sö dông kü thuËt phÇn líp vµ l−u c¸c th«ng tin ®èi

l−îng. Mçi líp l−u m· nÐn vÒ néi dung cña mét chuçi c¸c ¶nh( bao gåm: ®−êng

viÒn, quü ®¹o chuyÓn ®éng, kÕt cÊu bÒ mÆt). Khi gi¶i nÐn, th«ng qua néi dung

Trang 15

®−îc l−u trong c¸c líp ®Ó x©y dùng l¹i tõng phÇn cña ®o¹n video.

Lý thuyết xử lý Video

M« h×nh nÐn vµ gi¶i nÐn theo tõng líp

Theo m« h×nh nµy, Video ®−îc nÐn trªn 3 líp víi tû lÖ gi¶m kÝch cì (kh«ng

gian) lµ 2 lÇn trªn tõng líp. Trªn c¸c líp ngoµi nh÷ng th«ng tin vÒ néi dung

cña mét chuçi h×nh ¶nh cßn l−u tû lÖ gi¶m kh«ng gian cña líp so víi líp trªn

®ã. Khi gi¶i nÐn dùa vµo tû lÖ nµy cïng víi c¸c th«ng tin vÒ ®−êng viÒn, quü

®¹o chuyÓn ®éng, kÕt cÊu bÒ mÆt cña ®èi t−îng trong video ®Ó phôc håi l¹i

®o¹n video gèc.

Nh− vËy dùa vµo tû lÖ gi¶m kÝch cì kh«ng gian video chóng ta cã thÓ ®iÒu

chØnh ®−îc tèc ®é ph¸t h×nh còng nh− kÝch cì cña tÖp video cho phï hîp víi

b¨ng th«ng.

Víi tÝnh mÌm dÎo cña MPEG-4, nã ®· ®−îc triÓn khai trong 3 lÜnh vùc :

(cid:138) TruyÒn h×nh sè (Digital television)

(cid:138) T−¬ng t¸c tèt víi c¸c øng dông ®å ho¹ (Interactive graphics

applications )

(cid:138) T−¬ng t¸c víi ®a ph−¬ng tiÖn (Interactive multimedia)

ChuÈn kü thuËt cña MPEG-4 ®−îc thèng nhÊt cho s¶n xuÊt, ph©n phèi c¸c s¶n

Trang 16

phÈm Video cho c¶ 3 lÜnh vùc trªn.

Lý thuyết xử lý Video

IV. ¢m thanh

Khi nãi ®Õn video bao giê ng−êi ta còng ®Ò cËp ®Õn 2 vÊn ®Ò ®ã lµ h×nh

¶nh vµ ©m thanh. Cã thÓ nãi ©m thanh lµ mét phÇn kh«ng thÓ t¸ch rêi ®èi víi

video, vËy ©m thanh lµ g×? Chóng ta sÏ xem xÐt c¸c vÊn ®Ò vÒ ©m thanh ë c¸c

phÇn d−íi ®©y.

1. ¢m thanh tù nhiªn

Cã thÓ nãi b¶n chÊt cña ©m thanh ®ã lµ sù dao ®éng kh«ng khÝ. Khi mét vËt

ph¸t ra ©m thanh chÝnh lµ vËt ®ã ®· lµm kh«ng khÝ xung quanh ®ã bÞ dao ®éng.

®o dao ®éng cña ©m thanh b»ng Hz vµ ®¬n vÞ ®o ®é ån cña ©m thanh lµ dB.

§é ån : dB = 20.log10 (P1/P2) víi P lµ tÇn sè ©m thanh

§Æc ®iÓm: ©m thanh gióp cho con ng−êi cã thÓ hiÓu nhanh, râ rµng mét vÊn ®Ò.

Nã kh¸c xa víi c¸c tÝn hiÖu tõ Text bëi v× sù phèi hîp gi÷a ©m thanh vµ h×nh

¶nh gióp cho con ng−êi cã thÓ hiÓu râ ®−îc mäi sù vËt mét c¸ch nhanh chãng.

Trong tù nhiªn kh¶ n¨ng nghe cña con ng−êi kho¶ng 40 Hz ~ 44KHz, nÕu tÇn

sè ©m thanh qu¸ cao hoÆc qu¸ thÊp th× ng−êi ta còng kh«ng thÓ nghe ®−îc

nh÷ng ©m thanh nµy. Ta cã thÓ nghe thÊy ©m thanh cã trong thùc tÕ hoÆc ®−îc

con ng−êi s¸ng t¹o ra.

2. H×nh thøc sè ho¸ ©m thanh

Ng−êi ta cã thÓ sè ho¸ video theo s¬ ®å sau:

§Çu vµo

H×nh thøc sè ho¸

§Çu ra

©m thanh

¢m thanh thùc

D÷ liÖu d¹ng sãng

Micro

Loa

Thu ghi ©m thanh

PhÇn mÒm tæng hîp

ThiÕt bÞ audio

Tæng hîp

T¹o míi

PhÇn mÒm dao ®éng

Hîp thµnh

D÷ liÖu d¹ng kÝ hiÖu

Bµn phÝm, chuét

Trang 17

Lý thuyết xử lý Video

Theo s¬ ®å trªn chóng ta thÊy ®Çu vµo cña ©m thanh cã tõ rÊt nhiÒu nguån kh¸c

nhau. Cã thÓ lµ ©m thanh thùc cã trong tù nhiªn. Th«ng qua c¸c thiÕt bÞ thu

nh− micro chuyÓn hãa ©m thanh thµnh d¹ng sãng ®iÖn tõ vµ ghi vµo b¨ng ®Üa.

Chóng ta còng cã thÓ dïng c¸c thiÕt bÞ sao chÐp ©m thanh nh− ®Çu video, radio

cassette,... ®Ó chuyÓn ©m thanh tõ b¨ng, sang b¨ng, tõ b¨ng sang ®Üa,... Chóng

ta còng cã thÓ t¹o ©m thanh b»ng c¸ch x©y dùng c¸c bé dao ®éng nh− c¸c thiÕt

bÞ ©m nh¹c... Víi sù hç trî cña c¸c phÇn mÒm tæng hîp ©m thanh chóng ta co

thÓ t¹o ©m thanh tõ c¸c ký hiÖu. VÝ dô: chóng ta cã thÓ ch¬i nh¹c b»ng bµn

phÝm, x©y dùng mét b¶n nh¹c b»ng c¸ch so¹n c¸c nèt nh¹c sau ®ã cho ph¸t l¹i

trªn m¸y tÝnh.

Tõ c¸c nguån ©m thanh kh¸c nhau c¸c ©m thanh nµy ®Òu ®−îc chuyÓn ho¸

thµnh sãng ®iÖn tõ vµ ®−îc sè ho¸. C¸c d÷ liÖu sau khi ®−îc sè ho¸ sÏ ®−îc

m¸y tÝnh xö lý. Sau ®ã c¸c d÷ liÖu nµy sÏ ®−îc chuyÓn ng−îc thµnh ©m thanh

thùc th«ng qua hÖ thèng loa.

3. ¢m thanh gèc

C¸c tÝn hiÖu ©m thanh ë d¹ng nguyªn thÓ cã d¹ng h×nh sãng. Tr−íc ®©y ng−êi

ta th−êng thu tÝn hiÖu ©m thanh vµ ghi l¹i d−íi d¹ng t−¬ng tù. Ngµy nay, víi sù

ph¸t triÓn cña c«ng nghÖ sè nªn ng−êi ta ®· sè ho¸ ©m thanh ®Ó cã thÓ xö lý tèt

Analog Analog Analog Analog Input Input Input Input

e e e e d d d d u u u u t t t t i i i i l l l l p p p p m m m m A A A A

Quantized Quantized Quantized Quantized DataData DataData

h¬n cho c¸c øng dông thùc tÕ.

TimeTimeTimeTime

Trang 18

Lý thuyết xử lý Video

S¬ ®å l−îng tö ho¸ tÝn hiÖu ©m thanh

¢m thanh trong tù nhiªn lµ sù dao ®éng d¹ng sãng cña khÝ. Khi ®−îc m· ho¸

®−íi d¹ng sãng ®iÖn tõ, ©m thanh cã cã d¹ng ®å thÞ nh− trªn. §Ó sè ho¸ ng−êi

ta sÏ lÊy mÉu t¹i c¸c ®iÓm kh¸c nhau däc theo ®å thÞ cña ©m thanh. Sè ®iÓm lÊy

mÉu cµng lín chÊt l−îng ©m thanh sè cµng cao.

4. Ph−¬ng thøc lÊy mÉu trong ©m thanh

V× ©m thanh chÝnh lµ sù dao ®éng h×nh sãng quanh mét trôc nªn ng−êi ta chØ

tÝnh tÇn sè ©m thanh lµ phÇn trªn cña ®å thÞ th«ng qua trôc ®èi xøng. Hay nãi

c¸ch kh¸c ng−êi ta chØ lÊy mÉu lµ mét nöa chu kú dao ®éng. VÝ dô nÕu nãi

giäng nãi cã tÇn sè lµ ~5.5 KHz th× tøc lµ tÇn sè thùc khi nghe sÏ lµ 11KHz.

Trong thùc tÕ khi s¶n xuÊt ®Üa CD nh¹c th× ng−êi ta th−êng ghi víi tÇn sè nghe -

>44.1KHz .

Khi xem xÐt vÊn ®Ò vÒ tÝn hiÖu chóng ta thÊy r»ng: nÕu tÝn hiÖu tÇn sè vµo lín

h¬n kh¶ n¨ng nghe cña con ng−êi th× sÏ g©y ra c¸c biÕn d¹ng ©m thanh. Do ®ã

cÇn ph¶i cã c¸c ph−¬ng ph¸p läc bá c¸c tÇn sè kh«ng phï hîp.

Khi sè ho¸ ng−êi ta lÊy mÉu trong tõng khu vùc vµ

Information Information lossloss

ghi l¹i tÇn sè ®Æc tr−ng trong khu vùc ®ã.

AnalogAnalog Input Input

L−îng tö ho¸ ®é s©u

Quantization Quantization LimitLimit

1 bit = 20.log10(2)= 6.021 dB

Quantized Quantized DataData

16 bit= 6.021*16 =96 dB

ChuÈn DVD kho¶ng l−îng tö ho¸ : 16/20/24

bit

Trong qu¸ tr×nh l−îng tö ho¸, ng−êi ta th−êng c¾t tiÕng ån b»ng c¸ch ®Æt ra

giíi h¹n khi l−îng tö ®Ó kh«ng g©y ta hiÖn t−îng d÷ liÖu bÞ sai lÖch. Nh−ng

Trang 19

c¸ch tèt nhÊt vÉn lµ ®iÒu chØnh møc thu ©m thanh nguån.

Lý thuyết xử lý Video

5. Mét sè chuÈn nÐn d÷ liÖu ©m thanh

Nh− chóng ta ®· biÕt d÷ liÖu cña video lµ rÊt lín. Trong ®ã kh«ng chØ cã

d÷ liÖu h×nh ¶nh ph¶i nÐn mµ d÷ liÖu ©m thanh còng ph¶i nÐn v× kÝch cì cña nã

còng rÊt lín. VÝ dô mét ®o¹n ©m thanh 1 phót cã kÝch cì kho¶ng 10MB. HiÖn

nay cã nhiÒu ph−¬ng ph¸p nÐn ©m thanh kh¸c nhau nh− cã thÓ chia thµnh 2 lo¹i:

NÐn kh«ng mÊt th«ng tin

ThuËt ng÷ nÐn kh«ng mÊt th«ng tin ë ®©y ®−îc hiÓu theo nghÜa lµ mäi file

©m thanh nÐn ®Òu ®−îc gi¶i nÐn thµnh chÝnh ©m thanh gèc ®· ®−îc nÐn tr−íc ®ã.

- NÐn d¹ng entropy víi tØ lÖ: 1.5 ~3.0

- NÐn kiÓu LPAC víi tØ lÖ: 1.5 ~4.0

§©y lµ chuÈn nÐn kh«ng mÊt th«ng tin d¹ng sãng 8 bit, 16 bit, 20 bit hoÆc

24 bit (©m thanh ®¬n hoÆc ®a kªnh) ®−îc hç trî trong hÇu hÕt c¸c hÖ ®iÒu hµnh:

Windows, Linux vµ Solaris. Nã sö dông thuËt to¸n CRC ®¶m b¶o qu¸ tr×nh xö lý,

truyÒn ph¸t kh«ng mÊt th«ng tin. Qu¸ tr×nh m· hãa nhanh trong thêi gian thùc

(4x-12x trªn m¸y 500 MHZ Pentium).

NÐn kh«ng mÊt th«ng tin lµ −u ®iÓm chÝnh cña ®Þnh d¹ng file LPAC so víi

c¸c ®Þnh d¹ng file ©m thanh nÐn mÊt th«ng tin th«ng dông hiÖn nay nh− MP3,

WMA, RealAudio. Ng−îc l¹i, viÖc sö dông thuËt to¸n nÐn mÊt th«ng tin cho ta

tû lÖ nÐn ©m thanh rÊt cao. MP3 víi tèc ®é 128 kbit/s cã tû lÖ nÐn lµ 11 trong

khi LPAC chØ ®¹t tû lÖ nÐn tõ 1,5 ®Õn 4 vµ phô thuéc hoµn toµn vµo d÷ liÖu ©m

thanh. VÝ dô nh− LPAC cã tû lÖ nÐn lµ 2 cho ©m thanh d¹ng nh¹c pop vµ 2,5 cho

lo¹i ©m nh¹c cæ ®iÓn. Khi sö dông ®Þnh d¹ng nÐn nµy rÊt cã thÓ chóng ta sÏ

nhËn ®−îc hoµn toµn ©m thanh d¹ng bit ®¬n trong qu¸ tr×nh nÐn vµ gi¶i nÐn file

©m thanh. HÇu hÕt c¸c ®Þnh d¹ng nÐn nguyªn thuû kh«ng mÊt th«ng tin kh¸c

nh− Zip, LZH, Gzip ®Òu cã tû lÖ nÐn lµ 1 (hoµn toµn kh«ng nÐn ®−îc file ©m

thanh)

LPAC ®−îc sö dông trong tr−êng hîp file ©m thanh cÇn ®¹t chÊt l−îng tèt

Trang 20

nhÊt trong qu¸ tr×nh ph¸t mµ ®Þnh d¹ng MP3 kh«ng ®¸p øng ®−îc. C¸c ®Þnh

Lý thuyết xử lý Video

d¹ng file LPAC cã ®u«i lµ .PAC ®−îc x©y dùng kh«ng mÊt th«ng tin vµ t−¬ng

thÝch víi mäi hÖ ®iÒu hµnh còng nh− bÊt kú qu¸ tr×nh xö lý ©m thanh nµo.

NÐn mÊt th«ng tin:

- NÐn kiÓu AAC (Advanced Audio Coding ) cã tØ lÖ nÐn: ~14lÇn ®−îc sö

dông trong MPEG-2/4

Ng−êi ta coi AAC lµ ®Þnh d¹ng nÐn ©m thanh cã chÊt l−îng tèt nhÊt trªn

Internet hay trªn c¸c ®−êng truyÒn b¨ng th«ng réng. AAC ®−îc sö dông réng r·i

trong c¸c m¸y h¸t tù ®éng vµ c¸c thiÕt bÞ ©m nh¹c kh¸c. Kh«ng nh÷ng thÕ, AAC

cßn ®−îc coi lµ c¬ së h¹ tÇng trong viÖc truyÒn ph¸t d÷ liÖu ©m thanh trªn

Internet. H·ng Liquid Audio dù ®Þnh ph¸t triÓn mét kü thuËt tiªn tiÕn nhÊt trong

viÖc xö lý ©m thanh ®Ó tÝch hîp vµo AAC trong n¨m tíi.

So s¸nh víi MP3 ng−êi ta thÊy r»ng kü thuËt AAC ®· gi¶m tíi 30% kh«ng

gian l−u tr÷ d÷ liÖu. Kü thuËt AAC ®¹t ®−îc ®iÒu nµy do ®· lo¹i trõ ®−îc tíi

90% tÝn hiÖu ©m thanh gèc mµ kh«ng hÒ ¶nh h−ëng tíi chÊt l−îng cña ©m thanh

®ã. AAC ®· chÝnh thøc trë thµnh ®Þnh d¹ng chuÈn quèc tÕ vÒ ©m thanh nh− c¸c

chuÈn kü thuËt MPEG-2 hay MPEG-4.

AAC lµ kü thuËt m· ©m thanh dïng cho viÖc ph¸t hµnh vµ ph©n phèi c¸c

s¶n phÈm ©m nh¹c. Kü thuËt AAC cho chÊt l−îng nÐn cao. C¸c kiÓm chøng ®éc

lËp nhau vÒ hiÖu qu¶ cña qu¸ tr×nh nÐn vµ gi¶i nÐn cho thÊy AAC h¬n h¼n c¸c

®Þnh d¹ng ©m thanh kh¸c nh− MP3 hay bÊt kú m· nÐn ©m

thanh trùc gi¸c nµo kh¸c. AAC cung cÊp 48 kªnh ©m thanh,

SinSin

vµ tèc ®é lªn tíi 96kHz.

- NÐn theo chuÈn MP3

Xung nhÞÞpp Xung nh

- NÐn kiÓu WMA cã tØ lÖ nÐn: ~15 lÇn ®−îc sö dông

lµm Audio trong Windows

R¨ng c−a

- TwinVQ cã tØ lÖ nÐn: ~18 lÇn ®−îc sö dông trong

MPEG-4

- NÐn kh«ng theo trùc gi¸c dïng ph−¬ng ph¸p nÐn ADPCM (Adaptive

Trang 21

Differential Pulse Code Modulation) cã tØ lÖ nÐn: ~4.0

Lý thuyết xử lý Video

6. T¹o ©m thanh

Ng−êi ta cã thÓ t¹o ®−îc c¸c d¹ng ©m thanh nh©n t¹o b»ng c¸ch x©y dùng

©m thanh dùa trªn c¸c ®å thÞ cña c¸c hµm to¸n häc.

T¹o ©m thanh d¹ng sãng h×nh Sin, h×nh xung nhÞp, h×nh r¨ng c−a...ViÖc t¹o

©m thanh nh©n t¹o nµy ®−îc øng dông trong rÊt nhiÒu trong c¸c ch−¬ng tr×nh trß

ch¬i gi¶i trÝ.

¢m thanh d¹ng kÝ hiÖu c¬ b¶n cã nghÜa lµ øng víi mét kho¶ng møc tÇn

sè ©m thanh nµo ®ã th× ng−êi ta m· ho¸ vµ chuyÓn thµnh mét ký hiÖu nh− c¸c

nèt nh¹c (®å, rª, mi, fa, son, la, si ...) Nã cã ®Æc ®iÓm d÷ liÖu ©m thanh kh«ng

chÝnh x¸c, chØ mang tÝnh gi¶i thÝch logic chóng ta cã thÓ thay ®æi ©m thanh

b»ng c¸ch thay ®æi c−êng ®é, thêi gian, vËn tèc.. ChÊt l−îng ©m thanh phô

thuéc vµo thiÕt bÞ ®Çu ra.

§Æc tr−ng cña lo¹i nµy lµ kÝch th−íc d÷ liÖu nhá ~1/1000 so víi d÷ liÖu

d¹ng sãng. ¢m thanh ë d¹ng nµy th−êng cã ®Þnh d¹ng MIDI. Nã ®−îc øng

dông trong c¸c nh¹c cô ®iÖn tö.

7. ¢m thanh 3D thùc

Tr−íc tiªn muèn cã ®−îc ©m thanh 3D

cÇn ph¶i cã mét thiÕt bÞ ghi, thu ®Æc biÖt.

ThiÕt bÞ nµy sÏ thu ©m thanh theo nhiÒu kªnh

kh¸c nhau vµ ë c¸c gãc ®é kh¸c nhau.

C¸ch m« pháng hay ph¸t l¹i ©m thanh

ng−êi ta th−êng sö dông hµm chuyÓn HRTF

HiÖn nay ng−êi ta øng dông rÊt réng r·i hµm HRTF ®Ó m« pháng vµ t¹o

©m thanh 3D tõ ©m thanh 2D

T¹o ©m thanh 3D ®−îc øng dông nhiÒu trong c¸c trß ch¬i m¸y tÝnh, hÖ

Trang 22

thèng nhµ h¸t nhá, häp tõ xa...

Lý thuyết xử lý Video

8. §Þnh d¹ng ©m thanh

§èi víi d÷ liÖu ©m thanh d¹ng sãng ch−a ®−îc xö lý

Ng−êi ta sö dông ®Þnh d¹ng WAV. §©y lµ ®Þnh d¹ng d÷ liÖu d¹ng sãng

®−îc sö dông trong m«i tr−êng Windows.

AIFF lµ ®Þnh d¹ng Audio dïng trong c¸c hÖ m¸y Macintosh, Amiga,

Silicon Graphics.

§èi víi d÷ liÖu ©m thanh d¹ng sãng ®· ®−îc nÐn

§Æc tr−ng nhÊt cña d÷ liÖu ©m thanh nµy lµ ®Þnh d¹ng MP3. MP3 cã chÊt

l−îng cao, ®ång thêi tû lÖ nÐn tèt. Nã ®−îc sö dông nhiÒu trong c¸c Êm phÈm

ph¸t hµnh trªn Interrnet.

D÷ liÖu d¹ng MIDI :

SMF lµ ®Þnh d¹ng theo chuÈn MIDI ®¹i diÖn cho sù m· ho¸ ©m thanh b»ng

Trang 23

ký hiÖu.

Lý thuyết xử lý Video

V. C¸c tham sè trong Video vµ audio

Trong thùc tÕ, chóng ta ph¶i sö dông video vµ audio víi c¸c môc ®Ýnh kh¸c

nhau trong c¸c m«i tr−êng kh¸c nhau do ®ã ®Æt c¸c tham sè cho video lµ rÊt cÇn

thiÕt. Nh÷ng tham sè nµy sÏ x¸c ®Þnh râ chÊt l−îng cña s¶n phÈm. VÝ dô khi

chóng ta muèn x©y dùng mét ch−¬ng tr×nh Video cho ®Üa CD, hoÆc DVD th×

chóng ta ph¶i cã c¸c lùa chän nÐn kh¸c so víi c¸c ch−¬ng tr×nh video x©y dùng

cho Web v× tèc ®é truyÓn tÝn hiÖu trong c¸c thiÕt bÞ CD hoÆc DVD lín h¬n rÊt

nhiÒu so víi tèc ®é truyÒn tÝn hiÖu trªn Internet .

1. C¸c tham sè cho Video

1.1 Compressor

Tham sè nµy x¸c ®Þnh c¸c kiÓu nÐn cña video. Th«ng th−êng c¸c kiÓu nµy dùa

vµo c¸c chuÈn nÐn kh¸c nhau ®−îc viÕt cho Video.

1.1.1 Video cho Window ng−êi ta th−êng sö dông c¸c kiÓu nÐn

sau

Microsoft RLE : KiÓu nµy dïng ®Ó nÐn c¸c frame cã kÝch cì lín vµ mµu

ph¼ng (c¸c ¶nh kh«ng cã chiÒu s©u), vÝ dô: ®Ó lµm c¸c phim ho¹t h×nh. KiÓu

nÐn nµy cã m· ®é dµi 8 bit dïng thuËt to¸n nÐn kh«ng mÊt th«ng tin RLE(Run

–Length-Encoding). ChÊt l−îng video cao.

(cid:190) Microsoft Video1: Dïng cho cho nÐn video d¹ng t−¬ng tù (analog video).

KiÓu m· nÐn nµy hç trî c¸c ®iÓm cã 8bit, 16 bit ®é s©u.

(cid:190) Indeo (R) video R3:2 : Sö dông ®Ó nÐn video 24 bit dïng cho ®Üa CD.

KiÓu nÐn nµy cã tû lÖ nÐn tèt h¬n, chÊt l−îng tèt h¬n, vµ tèc ®é hiÓn thÞ

(khi xem video) nhanh h¬n so víi kiÓu nÐn Microsoft Video1. Cho kÕt

qu¶ tèt nhÊt nÕu sö dông m· nÐn Indeo Video trªn d÷ liÖu video mµ tr−íc

®ã d÷ liÖu kh«ng bÞ nÐn víi tû lÖ cao. Khi sö dông lo¹i d÷ liÖu nµy ®Ó

hiÓn thÞ l¹i th× chóng ta cã thÓ so s¸nh c¸c m· nÐn nµy víi kiÓu nÐn

Trang 24

Cinepak.

Lý thuyết xử lý Video

(cid:190) Cinepak code by Radius: Sö dông ®Ó nÐn video 24 bit dïng cho CD-Rom

hoÆc Web. §©y lµ kiÓu nÐn ®¹t ®−îc tû lÖ nÐn cao h¬n vµ tèc ®é ph¸t l¹i

(gi¶i nÐn) nhanh h¬n so víi kiÎu nÐn video 1. Chóng ta cã thÓ ®Æt chÊt

l−îng h×nh ¶nh ®Ó cã thÓ hiÓn thÞ l¹i video tèt víi tèc ®é 30KBps. M·

Cinepak ®−îc hiÓn thÞ l¹i rÊt nhanh nh−ng khi nÐn mÊt rÊt nhiÒu thêi

gian. Nã kh«ng phï hîp cho viÖc so¹n th¶o video mµ chØ phï hîp cho

viÖc chuyÓn mét ®o¹n video thµnh kÕt qu¶ cuèi cïng.

(cid:190) Intel Indeo 5.10 ®−îc sö dông cho c¸c ®Þnh d¹ng Video ph©n t¸n trªn

m¹ng Internet cho c¸c m¸y tÝnh cã bé xö lý MMX or Pentium II. §©y lµ

kiÓu nÐn cã ®Æc tr−ng: lùa chän nÐn nhanh, mÒm dÎo. KiÓu nÐn nµy cho

phÐp ng−êi xö lý video cã thÓ ®iÒu chØnh viÖc hiÓn thÞ video ®èi víi c¸c

b¨ng th«ng kh¸c nhau. VÝ dô cã thÓ ®iÒu chØnh ®Ó video cã thÓ

download víi modem 56KB, 28,8KB hay ®−êng c¸p m¹ng... M· nÐn nµy

®−îc thiÕt kÕ ®Ó lµm viÖc phï hîp víi m· Intel Audio Software.

(cid:190) Intel Indeo Video Raw R1.1: ®−îc sö dông tèt nhÊt cho viÖc thu c¸c

th«ng tin Video ë d¹ng d÷ liÖu kh«ng nÐn. Nã lµm viÖc cïng víi thiÕt bÞ

Intel video-capture cards. M· nÐn nµy cung cÊp c¸c h×nh ¶nh chÊt l−îng

cao. C¸c tÖp video dïng lùa chän nµy cã kÝch cì nhá h¬n c¸c tÖp kh«ng

dïng lùa chän v× ë kiÓu nµy mµu s¾c ®· ®−îc chuyÓn tõ model RGB

thµnh model YUV .

(cid:190) Intel Indeo Video Interactive: ®©y lµ kiÓu nÐn t−¬ng tù nh− ®Þnh d¹ng

5.10 nh−ng nã cã mét sè hç trî cho c¸c ®Æc tÝnh trong suèt, nhiÒu ®èi

t−îng chuyÓn ®éng.. trong video. Nã ®−îc hç trî bëi c¸c phÇn mÒm tiÖn

Ých cña Intel.

1.1.2 Video cho Macintosh th−êng sö dông c¸c kiÓu nÐn.

(cid:190) Component video: §−îc sö dông cho thu video, l−u tr÷ video hay t¹o c¸c

®o¹n video trung gian (t¹m thêi). KiÓu nÐn nµy cã tû lÖ nÐn rÊt thÊp do

Trang 25

®ã chiÕm rÊt nhiÒu kh«ng gian ®Üa

Lý thuyết xử lý Video

(cid:190) Graphics: ®−îc sö dông cho viÖc nÐn c¸c ¶nh chÊt l−îng cao víi ®é s©u

mµu 8 bÝt. M· nÐn (Graphics codec) nµy th−êng sö dông cho c¸c ¶nh tÜnh

nh−ng ®«i khi còng sö dông cho viÖc nÐn video bëi v× m· nÐn nµy kh«ng

®¹t ®−îc tû lÖ nÐn cao. Nã thÝch hîp cho c¸c tÖp video ®−îc ch¹y (l−u

tr÷) trªn ®Üa cøng chø kh«ng phï hîp víi c¸c tÖp video ®Æt trªn CD-ROM

(cid:190) Video: ®−îc sö dông cho viÖc thu vµ nÐn c¸c tÝn hiÖu video cã nguån ë

d¹ng Analog. M· nÐn nµy cho kÕt qu¶ cao khi xem l¹i c¸c tÖp video

®−îc l−u tr÷ trªn æ ®Üa cøng. Cho chÊt l−îng võa ph¶i nÕu xem trªn CD-

ROM. Nã hç trî c¶ hai lo¹i nÐn: nÐn theo kh«ng gian vµ nÐn theo thêi

gian cho video 16 bÝt. D÷ liÖu cã thÓ nÐn l¹i hoÆc dÞch l¹i sau khi nÐn víi

tû lÖ cao h¬n mµ chÊt l−îng kh«ng suy gi¶m.

(cid:190) Animation: §−îc sö dông cho viÖc nÐn c¸c khu«n h×nh cã vïng mµu cã

kÝch cì lín. VÝ dô: c¸c khu«n h×nh cho phim ho¹t h×nh. M· nÐn mµu cho

phÐp thay ®æi tû lÖ nÐn. Víi tû lÖ nÐn lµ 100%, video kh«ng bÞ nÐn. NÕu

tû lÖ d−íi 100% tÖp video bÞ nÐn ë d¹ng mÊt th«ng tin. M· nÐn

Animation dùa trªn lý thuyÕt nÐn cña Apple vµ thuËt to¸n nÐn RLE.

(cid:190) Motion JPEGA and Motion JPEG: ®−îc dïng cho môc ®Ých chuyÓn m·

video vÝ dô nh− chuyÓn c¸c tÖp video trong m¸y tÝnh, c¸c ®o¹n video

trªn b¨ng ra c¸c thiÕt bÞ kh¸c cña mµy tÝnh nh− ®Üa CD ... th«ng qua

thiÕt bÞ thu video (video-capture card). C¸c m· nÐn nµy ®−îc hç trî

nhiÒu trong c¸c chÝp cã trªn c¸c thiÕt bÞ thu video nh− video-capture card

do ®ã tèc ®é xö lý rÊt nhanh.

(cid:190) Photo–JPEG: kiÓu nÐn nµy ®−îc dïng ®Ó nÐn c¸c ¶nh tÜnh cã mµu s¾c

biÕn ®æi dÇn ( c¸c ®−êng biªn kh«ng râ nÐt). §©y lµ kiÓu nÐn mÊt th«ng

tin nh−ng cã thÓ ®Æt ®−îc tham sè nÐn ®Ó ¶nh cã chÊt l−îng r¸t cao. M·

nÐn Photo-JPEG lµ kiÓu nÐn ®èi xøng theo thêi gian nh−ng thêi gian nÐn

rÊt l©u. C¸c ¶nh ®· ®−îc nÐn theo kiÓu nµy th× kh«ng nªn dïng lµm

nguån ®Ó so¹n th¶o v× nã ®· bÞ mÊt th«ng tin. Tuy nhiªn nã cã tû lÖ nÐn

cao vµ chÊt l−îng ¶nh tèt nªn cã thÓ dïng ®Ó l−u tr÷ hoÆc ®Ó di chuyÓn

Trang 26

gi÷a c¸c hÖ thèng m¸y tÝnh.

Lý thuyết xử lý Video

(cid:190) Chó ý: rÊt nhiÒu phÇn cøng nÐn (hardware compression ) sö dông ®Þnh

d¹ng JPEG. Víi phÇn mÒm QuickTime cã thÓ ch−a cã trong danh s¸ch

c¸c m· nÐn v× vËy kh«ng hiÓn thÞ ®−îc c¸c tÖp video. Chóng ta cÇn cÇn

thªm m· nÐn cña phÇn cøng ®ã vµo danh s¸ch m· nÐn cho QuickTime.

(cid:190) H.263: Sö dông t¹o c¸c video cho héi th¶o. M· nÐn nµy cã tû lÖ nÐn thÊp.

Kh«ng nªn sö dông chuÈn nµy cho so¹n th¶o video th«ng th−êng.

(cid:190) DV - PAL and DV – NTSC : Sö dông m· nµy t¹o video sè theo chuÈn

PAL vµ NTSC. M· nÐn nµy dïng ®Ó t¹o c¸c tÖp video víi ®Þnh d¹ng PAL,

NTSC phôc vô in ra b¨ng theo c¸c hÖ trªn hoÆc ng−îc l¹i lÊy tõ b¨ng vµo

m¸y tÝnh th«ng qua digital-video capture card. ChuÈn nÐn nµy rÊt h÷u

dông cho viÖc chuyÓn d÷ liÖu video tõ hÖ thèng m¸y tÝnh nµy sang hÖ

thèng kh¸c hoÆc tõ thiÕt bÞ nµy sang thiÕt bÞ kh¸c.

(cid:190) Cinepak : ®−îc sö dông ®Ó nÐn video 24 bit. C¸c tÖp sö dông kiÓu nÐn

nµy ®Ó dïng cho CD-ROM vµ Web video. M· nÐn nµy cã tû lÖ nÐn cao vµ

tèc ®é gi¶i nÐn nhanh. Cinepak dung thuËt to¸n nÐn kh«ng ®èi xøng c¸c

tÖp video cã kÝch cì nhá nh−ng thêi gian nÐn rÊt l©u. Cho kÕt qu¶ tèt nhÊt

nÕu dïng m· nÐn nµy ®Ó t¹o tÖp video kÕt qu¶.

(cid:190) Sorenson Video : ®−îc sö dông ®Ó nÐn video 24 bit. C¸c tÖp sö dông kiÓu

nÐn nµy ®Ó dïng cho CD-ROM vµ Web video. Nã còng gièng nh− kiÓu

nÐn Cinepak nh−ng ®©y lµ kiÓu nÐn míi thiÓt kÕ ®Ó nÐn víi chÊt l−îng

cao. M· nÐn nµy cho h×nh ¶nh tèt h¬n, kÝch cì tÖp video nhá h¬n so víi

kiÓu Cinepak v× vËy nã phï hîp cho viÖc t¹o c¸c tÖp video cuèi cïng chø

kh«ng phï hîp cho so¹n th¶o.

(cid:190) Planar RGB: m· nÐn nµy ®−îc sö dông hiÖu qu¶ cho c¸c khu«n h×nh cã

vïng mµu ®Æc nh− c¸c tÖp Animation. Nã sö dông thuËt to¸n nÐn RLE

kÕt hîp víi kü thuËt t¹o m· animation (Animation codec).

§èi víi c¸c thiÕt bÞ phÇn cøng hç trî so¹n th¶o Video th−êng cã c¸c kiÓu nÐn

Trang 27

riªng ®−îc viÕt bëi nhµ s¶n xuÊt thiÕt bÞ phÇn cøng.

Lý thuyết xử lý Video

1.2 Depth

Tham sè nµy x¸c ®Þnh ®é s©u mµu hay sè mµu cña video khi hiÓn thÞ.

(cid:138) NÕu ®é s©u mµu cã gi¸ trÞ lµ 8 bit tøc lµ ®o¹n Video ®−îc thÓ hiÖn ë

chÕ ®é 256 mµu

(cid:138) NÕu ®é s©u mµu cã gi¸ trÞ lµ 24 bit tøc lµ ®o¹n Video ®−îc thÓ hiÖn

ë chÕ ®é 16 triÖu mµu.

(cid:138) NÕu ®é s©u mµu cã gi¸ trÞ trªn 24 bit tøc lµ ®o¹n Video ®−îc thÓ hiÖn

ë chÕ ®é trªn 16 triÖu mµu.

1.3 Frame size

Tham sè nµy x¸c ®Þnh kÝch cì cña khung h×nh tÝnh b»ng Pixel. Tham sè

nµy ¶nh h−ëng rÊt lín ®Õn kÝch cì cña tÖp video vµ thêi gian xö lý video khi

so¹n th¶o.

Khi ®Æt kÝch th−íc cho frame chóng ta ph¶i chó ý ®Õn tham sè Aspect. Tham

sè nµy lµ hÖ sè co hay tû lÖ co trong ®å ho¹ m¸y tÝnh. Gi¸ trÞ cña nã lµ trÞ sè

gi÷a kÝch th−íc theo chiÒu ngang vµ kÝch th−íc theo chiÒu däc cña mét khu«n

h×nh. Khi thay ®æi cì h×nh ph¶i duy tr× tû lÖ réng/cao ®Ó tr¸nh mÐo h×nh.

(cid:138) §èi víi chuÈn Video NTSC ng−êi ta th−êng sö dông kÝch cì theo tØ lÖ

720x480

(cid:138) §èi víi chuÈn Video PAL ng−êi ta th−êng sö dông kÝch cì theo tØ lÖ

4:3

1.4 Frame Rate

Tham sè nµy x¸c ®Þnh sè khung h×nh trong mét gi©y khi hiÓn thÞ Video. Tham

sè nµy ¶nh h−ëng lín ®Õn tèc ®é xö lý cña m¸y tÝnh khi hiÓn thÞ. Chóng cã mét

tÖp Video ®−îc so¹n th¶o ë chÕ ®é 24 h×nh trªn gi©y khi ®−îc hiÓn thÞ ë tèc ®é

12 h×nh trªn gi©y th× chóng ta cã c¶m gi¸c nh− c¸c c¶nh video bÞ chËm lai. Vµ

ng−îc l¹i nÕu chóng ta hiÓn thÞ tÖp Video ®ã ë chÕ ®é 48 h×nh trªn gi©y th×

Trang 28

c¶nh video sÏ chuyÓn ®éng nhanh gÊp ®«i.

Lý thuyết xử lý Video

1.5 Time base

Tham sè nµy x¸c ®Þnh sè khung h×nh trong chÕ ®é so¹n th¶o trong 1 gi©y.

(cid:190) Khi so¹n th¶o Video ë chÕ ®é NTSC th× chóng ta cã thÓ ®Æt gi¸ trÞ nµy

b»ng 29,97 h×nh (trªn gi©y). Khi ph¸t l¹i ®o¹n Video nµy theo chuÈn

NTSC th× chóng ta sÏ ®−îc chÊt l−îng tèt nhÊt .

(cid:190) Khi so¹n th¶o Video ë chÕ ®é PAL hay SECAM th× chóng ta cã thÓ ®Æt

gi¸ trÞ nµy b»ng 25 h×nh (trªn gi©y). Khi ph¸t l¹i ®o¹n Video nµy theo

chuÈn PAL th× chóng ta sÏ ®−îc chÊt l−îng tèt nhÊt .

(cid:190) Khi so¹n th¶o Video cho c¸c kiÓu kh¸c th× chóng ta cã thÓ ®Æt gi¸ trÞ

nµy b»ng 30 h×nh (trªn gi©y).

1.6 Quality

Tham sè nµy x¸c ®Þnh chÊt l−îng cña c¸c khung h×nh theo mét chuÈn nÐn

x¸c ®Þnh. Gi¸ trÞ cña tham sè nµy ¶nh h−ëng lín ®Õn chÊt l−îng cña khu«n

h×nh còng nh− kÝch cì cña tÖp Video. NÕu chÊt l−îng thÊp th× kÝch cì tÖp video

nhá. NÕu chÊt l−îng cao th× kÝch cì cña tÖp video lín. Mét sè tr−êng hîp ®Æc

biÖt, trong mét sè chuÈn nÐn kh«ng ®Æt ®−îc tham sè cho chÊt l−îng.

1.7 Data Rate

Tham sè nµy x¸c ®Þnh giíi h¹n cña tèc ®é truyÒn d÷ liÖu cña tÖp Video ra

mµn h×nh hiÓn thÞ. Gi¸ trÞ nµy ®−îc tÝnh b»ng Kilobit / gi©y (Kbps). Mét sè

chuÈn nÐn cho phÐp thay ®æi tham sè nµy. Khi ®Æt tham sè Data rate cÇn ph¶i

chó ý ®Õn tèc ®é truyÒn d÷ liÖu cña hÖ thèng (kh«ng dÆt tham sè nµy cao h¬n

Trang 29

tèc ®é truyÒn d÷ liÖu cña hÖ thèng).

Lý thuyết xử lý Video

2. C¸c tham sè cho Audio

2.1 Rate

Tham sè nµy x¸c ®Þnh d¶i tÇn sè cña Audio. Nã x¸c ®Þnh chÊt l−îng ©m

thanh khi ph¸t l¹i. Th«ng th−êng tham sè nµy cao th× chÊt l−îng ©m thanh sÏ

tèt h¬n nh−ng kÌm theo ®ã lµ kÝch cì cña tÖp Video-Audio còng sÏ t¨ng lªn

®¸ng kÓ. Khi ®Æt tham sè nµy trong chÕ ®é so¹n th¶o Video-Audio chóng ta

còng cÇn ph¶i chó ý ®Õn tÇn sè ®Çu vµo cña c¸c tÖp Video-Audio. C¸ch tèt nhÊt

lµ ®Æt tham sè nµy b»ng víi tÇn sè ®Çu vµo.

§èi víi hÖ thèng Windows hoÆc Macintosh c¸c gi¸ trÞ cã thÓ ®Æt lµ :

5000Hz, 8000Hz, 11025 Hz, 32000Hz, 44100Hz, 48000 Hz

2.2 Format

Sè bÝt ®Ó m· ho¸ ©m thanh cµng cao th× chÊt l−îng ©m thanh cµng cao vµ

kÝch cì tÖp Video-Audio cµng lín. Cã 4 ®Þnh d¹ng chÝnh:

(cid:138) 8 bit – Mono ( ©m thanh ®¬n, 1 kªnh ©m thanh )

(cid:138) 16 bit – Mono

(cid:138) 8 bit – Stereo ( ©m thanh næi, nhiÒu kªnh ©m thanh)

(cid:138) 16 bit – Stereo

2.3 Compressor

Tham sè nµy x¸c ®Þnh c¸c kiÓu nÐn cho audio. Nã quyÕt ®Þnh chÊt l−îng

cóng nh− ®é lín cña tÖp ©m thanh.

2.3.1 §èi víi hÖ thèng Window ng−êi ta th−êng sö dông c¸c kiÓu

nÐn ©m thanh sau

(cid:190) Intel Audio Software codec: KiÓu nÐn nµy sö dông cho nh¹c vµ lêi nãi

trªn Internet. Kh¶ n¨ng nÐn tèi ®a lµ 8:1. M· nÐn nµy ®−îc thiÕt kÕ ®Ó

Trang 30

lµm viÖc víi ch−¬ng tr×nh Intel Video Software .

Lý thuyết xử lý Video

(cid:190) TrueSpeech : KiÓu nÐn nµy sö dông cho nãi chuyÖn trªn m¹ng Internet

víi tèc ®é truyÒn thÊp.

(cid:190) Microsoft GSM 6.10: Sö dông cho telephone trªn Internet ë ch©u ©u.

(cid:190) MS-ADPCM (Microsoft implementation of Adaptive Differential Pulse

Code Modulation ) kiÓu nÐn nµy sö dông ®Ó t¹o c¸c tÖp audio cã chÊt

l−îng cao ghi trªn ®Üa CD-ROM. KiÓu nÐn nµy ®−îc sö dông réng r·i.

(cid:190) Microsoft IMA ADPCM: kiÓu nÐn nµy ®−îc sö dông t¹o c¸c tÖp audio

cho c¸c s¶n phÈm multimedia. KiÓu nÐn nµy dùa trªn m· nÐn ADPCM

®−îc ph¸t triÓn bëi IMA(Interactive Multimedia Association ).

(cid:190) Lucent Technologies SX8300P: kiÓu nÐn nµy sö dông cho giao tiÕp trªn

Internet tèc ®é thÊp

(cid:190) elemedia TM AX2400P: kiÓu nÐn nµy ®−îc sö dông t¹o c¸c tÖp ©m nh¹c

chÊt l−îng cao trªn Internet

(cid:190) Voxware Audio Codecs: kiÓu nÐn nµy sö dông cho c¸c tÖp ©m thanh d¹ng

tiÕng nãi trªn Internet tèc ®é thÊp

2.3.2 §èi víi hÖ thèng Macintosh ng−êi ta th−êng sö dông c¸c kiÓu

nÐn ©m thanh sau

(cid:190) mLaw 2:1 : kiÓu nÐn nµy ®−îc sö dông cho viÖc chuyÓn c¸c tÖp audio ®Ó

sö dung tèt víi c¸c øng dông trªn c¸c m¸y tr¹m. Tai ®ã mLaw lµ ®Þnh

d¹ng audio chuÈn . mLaw ®−îc dö dông cho telephone sè ë B¾c Mü vµ

Japan

(cid:190) 16-bit Big Endian vµ 16-bit Little Endian: kiÓu nÐn nµy ®−îc sö dông cho

c¸c phÇn cøng vµ phÇn mÒm chuyªn dông nh−ng th«ng th−êng nã kh«ng

Trang 31

tèt cho viÖc so¹n th¶o.

Lý thuyết xử lý Video

(cid:190) 24-bit Integer vµ 32-bit Integer: kiÓu nÐn nµy ®−îc sö dông cho audio

24-bit hoÆc 32-bit nguyªn. m· nÐn nµy ®−îc sö dông tèt cho c¸c phÇn

cøng vµ phÇn mÒm chuyªn dông nh−ng th«ng th−êng nã kh«ng tèt cho

viÖc so¹n th¶o.

(cid:190) IMA 4:1: kiÓu nÐn nµy ®−îc sö dông cho c¸c tÖp audio t¹i c¸c tr¹m.

IMA 4:1 ®−îc ph¸t triÓn bëi IMA sö dông m· ADPCM.

(cid:190) 32-bit Floating vµ 64-bit Floating: C¸c kiÓu nÐn nµy ®−îc sö dông trong

c¸c thiÕt bÞ phÇn cøng vµ phÇn mÒm chuyªn dông nh−ng th«ng th−êng

kh«ng sö dông cho so¹n th¶o Video.

(cid:190) ALaw 2:1: gièng mLaw nh−ng ®−îc sö dông cho telephone sè ë Ch©u

©u

(cid:190) QDesign Music Codec: Sö dông ®Ó nÐn c¸c tÖp audio chÊt l−îng cao sö

dông trªn Internet. ChÊt l−îng cña nã t−¬ng ®−¬ng c¸c tÖp ©m thanh trªn

CD-ROM cã ®Þnh d¹ng 16-bit, 44.1 kHz. C¸c tÖp ©m thanh ®−îc nÐn

theo kiÓu nµy cã thÓ nghe trùc tiÕp b»ng ®−êng Internet cã tèc ®é 28.8

Kbps.

(cid:190) Qualcomm PureVoice: §©y lµ kiÓu nÐn ®−îc thiÕt kÕ t¹o c¸c tÖp ©m

thanh tèt nhÊt ë tÇn sè 8 kHz. C¬ së cña kiÓu nÐn nµy dùa trªn thuËt to¸n

nÐn chuÈn cña Telephone CDMA ( Code Division Multiple Access )

(cid:190) MACE 3:1 and MACE 6:1 :kiÓu nÐn nµy ®Ó t¹o c¸c tÖp audio th«ng

th−êng cho hÖ ®iÒu hµnh Macintosh. Nã dùa trªn thuËt to¸n nÐn ©m

thanh MACE (Macintosh Audio Compression and Expansion codec ).

KiÓu nÐn MACE 3:1 cã tû lÖ nÐn thÊp h¬n kiÓu nÐn MACE 6:1 nh−ng

cã chÊt l−îng cao h¬n

2.4 Data Rate

Tham sè nµy x¸c ®Þnh giíi h¹n cña tèc ®é truyÒn d÷ liÖu cña tÖp Audio khi

Trang 32

ph¸t l¹i. Gi¸ trÞ nµy ®−îc tÝnh b»ng Kilobit/gi©y (Kbps).

Lý thuyết xử lý Video

ChuyÓn ®æi d÷ liÖu tõ video, b¨ng, ®Üa CD thµnh c¸c tÖp Video-Audio cho

m¸y tÝnh vµ ng−îc l¹i

3. C¸c cæng chuyÓn ®æi tÝn hiÖu

Chóng ta cã thÓ chuyÓn d÷ liÖu tõ nhiÒu nguån video kh¸c nhau, cã thÓ

lµ b¨ng (tape), tËp hîp c¸c ¶nh liªn tiÕp (t¹o thµnh film) cña mét c¶nh, tõ ¶nh

®éng, ho¹t h×nh, audio,…thµnh c¸c tÖp Video-Audio vµ ®−îc l−u tr÷ trªn m¸y

tÝnh.

Digital media ®©y lµ c¸c ph−¬ng tiÖn sè. C¸c ph−¬ng tiÖn sè cã thÓ lµ c¸c

thiÕt bÞ thu, ph¸t tÝn hiÖu sè nh− m¸y quay sè, m¸y ¶nh sè.... C¸c thiÕt bÞ nµy

l−u c¸c tÝn hiÖu Video-Audio ë d¹ng sè vµ cã ®Þnh d¹ng theo c¸c chuÈn mµ

m¸y tÝnh cã thÓ ®äc vµ xö lý trùc tiÕp ®−îc.

Analog media: ®©y lµ c¸c ph−¬ng tiÖn l−u d÷ liÖu d−íi d¹ng tÝn hiÖu

t−¬ng tù. C¸c thiÕt bÞ nµy th−êng lµ c¸c thiÕt bÞ truyÒn thèng vÝ dô nh− m¸y

quay th−êng, m¸y ¶nh th−êng.... Nh− vËy muèn xö lý c¸c d÷ liÖu nµy b»ng m¸y

tÝnh th× chóng ta ph¶i sè ho¸ c¸c d÷ liÖu nµy. Th«ng th−êng, ng−êi ta sö dông

c¸c thiÕt bÞ phÇn cøng (video capture board) ®Ó thùc hiÖn viÖc sè ho¸ c¸c tÝn

hiÖu Analog.

C¸c cæng kÕt nèi tõ c¸c m¸y ph¸t tÝn hiÖu video vµo m¸y tÝnh:

Cæng vµo ra tÝn hiÖu Video-Audio d¹ng t−¬ng tù th«ng th−êng:

(cid:138) Cæng S-video

Trang 33

(cid:138) Cæng ®a hîp (composite video).

Lý thuyết xử lý Video

NÕu dïng cæng ®a hîp ng−êi ta cã thÓ ®iÒu chØnh ®Ó thu: chØ tÝn hiÖu h×nh

A lµ cæng S-video , B lµ cæng ®a hîp

¶nh hoÆc chØ thu tÝn hiÖu ©m thanh hoÆc c¶ h×nh ¶nh vµ ©m thanh víi ®Çy ®ñ tÝn

hiÖu video (left, right).

C¸c thiÕt bÞ thu tÝn hiÖu t−¬ng tù vµ chuyÓn thµnh d¹ng sè th−êng sö dông

c¸c cæng nµy ®Ó trao ®æi th«ng tin vÝ dô thiÕt bÞ DV500, DC2000, TV Capture

board ®Òu cã s½n c¸c cæng nµy ®Ó trao ®æi tÝn hiÖu Video-Audio d¹ng t−¬ng tù

Cæng vµo ra tÝn hiÖu Video-Audio sè th«ng th−êng:

Cæng IEEE 1394

Th«ng th−êng ®Ó trao ®æi th«ng tin gi÷a c¸c m¸y ph¸t tÝn hiÖu Video-

Audio vµ m¸y tÝnh ng−êi ta sö dông cæng IEEE 1394. C¸c thiÕt bÞ sè nh− m¸y

quay sè, m¸y ¶nh sè, c¸c thiÕt bÞ chuyÓn c¸c d÷ liÖu Video-Audio sè vµo m¸y

tÝnh nh− Card VD500, DC2000... ®Òu cã s½n cæng nµy. C¸c thiÕt bÞ hç trî

viÖc trao ®æi tÝn hiÖu Video-Audio sè qua cæng nµy cã tèc ®é rÊt cao ®¶m b¶o

viÖc thu vµ hiÓn thÞ Video-Audio sè trong thêi gian thùc.

4. Thu tÝn hiÖu tõ c¸c thiÕt bÞ ph¸t Video-Audio vµo m¸y tÝnh

4.1 Thu tÝn hiÖu d¹ng t−¬ng tù

4.1.1 Yªu cÇu phÇn cøng

NhÊt thiÕt cÇn cã thiÕt bÞ giao tiÕp gi÷a m¸y tÝnh vµ m¸y ph¸t tÝn hiÖu

Trang 34

Video-Audio d¹ng t−¬ng tù. ThiÕt bÞ ®ã cã thÓ lµ TV card, hay DV500... cã

Lý thuyết xử lý Video

cæng giao tiÕp lµ S-video hay Composite video. ThiÕt bÞ nµy ®−îc cµi ®Æt trªn

m¸y tÝnh vµ ®−îc hÖ thèng (Windows, Macintosh..) hç trî.

M¸y ph¸t tÝn hiÖu Video-Audio d¹ng t−¬ng tù. Nã cã thÓ lµ Video-

Cassette, m¸y quay video, thiÕt bÞ thu tÝn hiÖu tõ c¸c ®µi ph¸t hay vÖ tinh nh−

Angten...

M¸y tÝnh tèc ®é cao, cã bé nhí (RAM) lín, kh«ng gian ®Üa cøng (HDD)

lín vµ Card video cã bé nhí lín. D©y c¸p nèi c¸c thiÕt bÞ Video-Audio víi m¸y

tÝnh.

4.1.2 Yªu cÇu phÇn mÒm

M¸y tÝnh ph¶i ®−îc cµi ®Æt c¸c phÇn mÒm hç trî thiÕt bÞ giao tiÕp vµ cã

thÓ c¶ c¸c ch−¬ng tr×nh so¹n th¶o Video-Audio. VÝ dô nh− ch−¬ng tr×nh Ulead,

Adobe Premiere...

4.1.3 C¸c tham sè cho c«ng viÖc thu Video-Audio d¹ng t−¬ng tù

KÝch cì cña khu«n h×nh : NÕu c¸c tÝn hiÖu thu ®−îc ®−îc ghi víi ®Þnh

d¹ng Quick time th× chóng ta ®Æt khu«n h×nh theo tû lÖ 4:3. NÕu c¸c tÝn hiÖu thu

®−îc ®−îc ghi víi ®Þnh d¹ng Video cho Windows th× chóng ta cã thÓ ®Æt kÝch

th−íc khu«n h×nh bÊt kú.

Tèc ®é cña khu«n h×nh: chóng ta cÇn ®Æt tèc ®é cña khu«n h×nh phï hîp

víi hÖ cña Video khi ph¸t. NÕu lµ hÖ NTSC th× chóng ta ®Æt tèc ®é lµ 29,97

khu«n h×nh trong 1 gi©y (fps). NÕu lµ hÖ PAL hay SECAM th× chóng ta ®Æt tèc

®é lµ 25 fps.

4.2 Thu tÝn hiÖu d¹ng sè

Trang 35

§Ó thu c¸c tÝn hiÖu Video-Audio sè th× chóng ta cÇn cã c¸c yªu cÇu sau:

Lý thuyết xử lý Video

4.2.1 Yªu cÇu vÒ phÇn cøng

GÇn gièng nh− c¸c yªu cÇu phÇn cøng ®Ó thu c¸c tÝn hiÖu d¹ng t−¬ng tù

nh−ng trªn thiÕt bÞ giao tiÕp (card DC2000, DV300, DV500...) ph¶i cã cæng

giao tiÕp IEEE 1394.

4.2.2 Yªu cÇu phÇn mÒm

Gièng hoµn toµn nh− c¸c yªu cÇu ®Ó thu c¸c tÝn hiÖu d¹ng t−¬ng tù.

4.2.3 §Æt c¸c tham sè cho c«ng viÖc thu Video-Audio d¹ng sè

KÝch cì cña khu«n h×nh : ®Æt kÝch cì cña khu«n phï hîp víi tû lÖ cña

khu«n h×nh trªn c¸c thiÕt bÞ ph¸t. VÝ dô nÕu khu«n h×nh trªn m¸y ph¸t digital

camera lµ 720x480 dpi th× chóng ta cã thÓ ®Æt kÝch cì khu«n h×nh khi thu lµ

720x480 hoÆc 360x240... NÕu ®Æt nh− vËy th× tÖp video thu ®−îc sÏ ®−îc ®¶m

b¶o vÒ chÊt l−îng.

Tèc ®é cña khu«n h×nh: chóng ta cÇn ®Æt tèc ®é cña khu«n h×nh phï hîp

víi hÖ cña Video khi ph¸t.

§Æt d¶i tÇn sè ©m thanh: Chóng ta ph¶i ®Æt d¶i tÇn sè ©m thanh phï hîp

víi hÖ cña Video. Th«ng th−êng DV audio th−êng sö dông kiÓu 16bit Stereo.

§èi víi hÖ c¸c m¸y ph¸t video sè (digital camera) sö dông hÖ NTSC hoÆc PAL

chóng ta ®Æt d¶i tÇn cho audio lµ 32kHz hoÆc 48 kHz. Tuy nhiªn trong mét sè

tr−êng hîp ®Æc biÖt mét sè m¸y ph¸t video sè sö dông d¶i tÇn Audio 44.1kHz

v× vËy khi thu chóng ta ph¶i ®Æt theo gi¸ trÞ nµy.

5. ChuyÓn ®æi d÷ liÖu Video-Audio thµnh c¸c ®Þnh d¹ng kh¸c

nhau

Sau khi chóng ta ®· n¹p ®−îc c¸c d÷ liÖu Video-Audio vµo m¸y tÝnh

chóng ta cã thÓ söa ®æi d÷ liÖu ®ã phï hîp víi môc ®Ých vµ yªu cÇu ®Æt ra. Sau

khi ®· cã ®−¬c c¸c ®o¹n Video-Audio sè phï hîp chóng ta ph¶i chuyÓn chóng

thµnh c¸c tÖp Video-Audio theo c¸c ®Þnh d¹ng kh¸c nhau hoÆc ghi ra b¨ng, ®Üa

Trang 36

CD.

Lý thuyết xử lý Video

5.1 ChuyÓn c¸c ®o¹n Video-Audio sè ®· ®−îc xö lý trªn m¸y tÝnh

ra b¨ng, ®Üa

5.1.1 Yªu cÇu vÒ thiÕt bÞ

Trong tr−êng hîp nµy c¸c yªu cÇu t−¬ng tù nh− yªu cÇu vÒ thiÕt bÞ khi thu

tÝn hiÖu Video-Audio vµo m¸y tÝnh. §ã lµ: thiÕt bÞ giao tiÕp gi÷a m¸y tÝnh vµ

m¸y thu tÝn hiÖu Video-Audio (Cã thÓ thiÕt bÞ lµ card DV300. DV500, TV

Capture board... . ), m¸y tÝnh cã tèc ®é cao, m¸y thu tin hiÖu Video-Audio

(video cassette, Video camera..).

5.1.2 §Æt c¸c tham sè cho ®o¹n Video-Audio khi in ra b¨ng

Tû lÖ khu«n h×nh: Khi in ra b¨ng theo hÖ nµo th× chóng ta ph¶i ®Æt tû sè

gi÷a ®é réng vµ chiÒu cao khu«n h×nh theo ®óng hÖ ®ã. VÝ dô nÕu chóng ta

®Þnh in ra b¨ng theo hÖ NTSC th× ®Æt khu«n h×nh theo tû lÖ 720x480. NÕu

muèn chÊt l−îng h×nh ¶nh trªn b¨ng cao th× chóng ta cã thÓ ghi ë chÕ ®é toµn

mµn h×nh.

Tèc ®é khu«n h×nh (rate): Tèc ®é khu«n h×nh ph¶i ®Æt theo tèc ®é khu«n

h×nh cña hÖ thèng thu. §èi víi hÖ PAL ph¶i ®Æt tèc ®é khu«n h×nh lµ 25 h×nh

trªn gi©y, hÖ NTSC lµ 29,97 h×nh trªn gi©y.

§Æt d¶i tÇn sè cho audio : Gi¸ trÞ nµy ph¶i phï hîp víi d¶i tÇn sè ©m

thanh cña hÖ. HÇu hÕt c¸c DV camera ®Òu sö dông d¶i tÇn 32KHz hoÆc

48KHz.

Lùa chän kiÓu nÐn vµ ®Æt chÊt l−îng Video-Audio: NÕu chóng ta in ra

b¨ng th× nªn lùa chän kiÓu nÐn cã chÊt l−îng cao nhÊt. Th«ng th−êng ng−êi ta

lùa chän kiÓu nÐn theo thiÕt bÞ phÇn cøng (c¸c Card chuyÓn ®æi tÝn hiÖu).

5.1.3 Lùa chän c¸c ®Þnh d¹ng tÖp trung gian tr−íc khi in ra b¨ng

Trong tr−êng hîp chóng ta kh«ng ghi trùc tiÕp ®−îc ra b¨ng th× sau khi ®·

Trang 37

®Æt c¸c th«ng sè cho tÖp Video-Audio kÕt qu¶ chóng ta sÏ ghi kÕt qu¶ ®ã ra ®Üa

Lý thuyết xử lý Video

cøng víi ®Þnh d¹ng AVI vµ MOV. Sau ®ã chóng ta ph¸t l¹i tÖp AVI vµ MOV

trªn m¸y tÝnh ®Ó thùc hiÖn viÖc thu tÝn hiÖu.

5.2 ChuyÓn c¸c ®o¹n Video-Audio sè ®· ®−îc xö lý trªn m¸y tÝnh

®Ó sö dông cho Web hoÆc CD-ROM

5.2.1 Yªu cÇu vÒ phÇn cøng

Trong tr−êng hîp nµy yªu cÇu vÒ phÇn cøng kh«ng ®ßi hái ph¶i cã thiÕt bÞ

giao tiÕp gi÷a m¸y tÝnh vµ m¸y thu ph¸t tÝn hiÖu Video-Audio. Nh−ng yªu cÇu

mét sè phÇn mÒm hç trî hiÓn thÞ.

5.2.2 C¸c ®Þnh d¹ng tÖp Video-Audio

Lùa chän ®Þnh d¹ng cho tÖp Video-Audio kÕt qu¶. V× kÕt qu¶ sö dông

cho c¸c môc ®Ých kh¸c nhau ®o ®ã cÇn x¸c ®Þnh chÝnh x¸c ®Þnh d¹ng tÖp kÕt qu¶.

D−íi ®©y lµ mét sè ®Þnh d¹ng tiªu biÓu:

§Þnh d¹ng video theo chuÈn Quicktime :

Quick time lÊy (down load) vÒ tõ m¹ng

Quick time cho phÐp xem trùc tiÕp trªn m¹ng

Quick time CD-ROM

§Þnh d¹ng audio theo chuÈn Real G2:

Real G2 dïng ®Ó lÊy (down load) vÒ tõ m¹ng

Real G2 cho phÐp xem trùc tiÕp trªn m¹ng

§Þnh d¹ng Video-Audio theo chuÈn Windows

Windows media video

Windows media audio

AVI CD-ROM

§Þnh d¹ng Video-Audio theo chuÈn MPEG

Trang 38

Cho Video dïng MPEG-1, MPEG-2

Lý thuyết xử lý Video

Cho Audio dïng MP3

NÕu kÕt qu¶ dïng cho CD-ROM th× chóng ta ph¶i lùa chän ®Þnh d¹ng

tÖp lµ MPEG-1, MPEG-2 cã sö dông thuËt to¸n nÐn MPEG ( Moition Picture

Experts Group). Sö dông ®Þnh d¹ng MPEG-1 chóng ta cã ®−îc s¶n phÈm

Video-Audio cã chÊt l−îng t−¬ng ®−¬ng VHS. Sö dông ®Þnh d¹ng MPEG-2

chóng ta cã ®−îc s¶n phÈm Video-Audio cã chÊt l−îng t−¬ng ®−¬ng SVHS.

Tuy nhiªn nÕu chóng ta ®Æt tû lÖ nÐn cao vµ chÊt l−îng video thÊp khi th× chÊt

l−îng video sÏ kh«ng ®−îc nh− mong muèn.

NÕu kÕt qu¶ sö dông ®Ó lµm ¶nh ®éng cho Web th× chóng ta sö dông ®Þnh

d¹ng GIF. §Þnh d¹ng GIF sö dông chuÈn nÐn kh«ng mÊt th«ng tin, sö dông tõ

2-256 mµu ®Ó thÓ hiÖn h×nh ¶nh vµ tèc ®é khu«n h×nh thÊp. V× ®Æc tÝnh trªn nªn

®Þnh d¹ng GIF chØ phï hîp cho viÖ t¹o c¸c logo, nót bÊm ®éng trªn WEB. Chó

ý khi sö dông ®Þnh d¹ng nµy kh«ng nªn ®Æt qu¸ nhiÒu khu«n h×nh v× nh− vËy

kÝch cì cña tÖp qu¸ lín ¶nh h−ëng ®Õn viÖc thÓ hiÖn l¹i trªn WEB.

NÕu muèn cã kÕt qu¶ lµ tÖp ©m thanh th× chóng ta sö dông ®Þnh d¹ng

MP3 ( Moition Picture Experts Group 1 layer 3). TØ lÖ nÐn cña ®Þnh d¹ng nµy lµ

kh¸ cao tõ 5 ®Õn 24 lÇn. KÝch cì tÖp nÐn nhá, chÊt l−îng kh¸ cao.

NÕu kÕt qu¶ sö dông trong m«i tr−¬ng Windows dïng ®Þnh d¹ng AVI.

NÕu kÕt qu¶ sö dông trong m«i tr−êng Macintosh th× dïng ®Þnh d¹ng chuÈn

Quick time.

Trong mçi chuÈn ®Þnh d¹ng dïng cho Web th× ng−êi ta ph©n ra lµm

nhiÒu møc chÊt l−îng ®Ó phï hîp víi tèc ®é ®−êng truyÒn. VÝ dô nh− 28,8k,

56k, ISDN, LAN...

Th«ng th−êng c¸c ®Þnh d¹ng trªn ®i kÌm theo c¸c chuÈn nÐn x¸c ®Þnh.

5.3 ChuyÓn c¸c ®o¹n Video-Audio sè ®· ®−îc xö lý trªn m¸y tÝnh

thµnh chuçi c¸c ¶nh

Kh«ng nh÷ng chóng ta cã thÓ chuyÓn kÕt qu¶ Video ®· ®−îc xö lý thµnh

Trang 39

c¸c tÖp Video mµ chóng ta cßn cã thÓ chuyÓn thµnh c¸c khu«n h×nh trong

Lý thuyết xử lý Video

video thµnh c¸c tÖp ¶nh ®Ó sö dông trong c¸c ch−¬ng tr×nh kh¸c. C¸c ®Þnh d¹ng

Trang 40

¶nh kÕt qu¶ th−êng lµ : BMP, GIF, TIFF, Targa

Lý thuyết xử lý Video

VI. Mét sè kü thuËt xö lý Video-Audio trªn m¸y tÝnh

1. Kü thuËt ®¸nh dÊu (Marker) vµ keyframe

§¸nh dÊu (marker) cho biÕt c¸c ®iÓm quan träng trong mét chuçi c¸c

khu«n h×nh hay mét sè thêi ®iÓm nµo ®ã trong mét ®o¹n video. §¸nh dÊu gióp

chóng ta biÕt ®−îc khu vùc Video-Audio cÇn xö lý. Th−êng ng−êi ta dïng

Marker ®Ó, chän, xo¸ hoÆc chuyÓn ®Õn mét ®o¹n Video mét c¸ch dÔ dµng h¬n.

Ng−êi ta chØ dïng Marker trong chÕ ®é so¹n th¶o vµ xö lý Video-Audio.

Marker kh«ng tån t¹i trong c¸c tÖp Video.

Trong c¸c ch−¬ng tr×nh xö lý phim ¶nh kü thuËt keyframe dïng ®Ó ®¸nh

dÊu khu vùc Frame hoÆc c¸c Frame chÞu t¸c ®éng cña mét hiÖu øng nµo ®ã. VÝ

dô chóng ta cã mét ®o¹n video A (5 gi©y). Hai gi©y ®Çu cña video A chóng ta

muèn cã hiÖu øng më dÇn, hai gi©y tiÕp theo cã hiÖu øng râ dÇn vµ gi©y cuèi

cïng cã hiÖu øng sãng. Lóc nµy chóng ta ph¶i sö dông 4 keyframe ®Ó x¸c ®Þnh

Keyframe c¸c ®Þnh c¸c ®o¹n chÞu hiÖu øng

3 ®o¹n chÞu c¸c hiÖu øng trªn.

2. ChuyÓn c¶nh (Transition)

ChuyÓn c¶nh (Transition) cho phÐp chóng ta t¹o mét hiÖu øng chuyÓn gi÷a

c¶nh A vµ c¶nh B. Kü thuËt nµy lµm ®o¹n Video-Audio ®−îc mÒm m¹i h¬n.

VÝ dô: Ta cã c¶nh cuèi cña ®o¹n video A lµ

Trang 41

Ta cã c¶nh ®Çu cña ®o¹n video B lµ

Lý thuyết xử lý Video

KÕt qu¶ sau khi t¹o chuyÓn c¶nh

Líp Mask gi÷a hai Video A vµ B:

( líp Mask lµ mét c¶nh mµu x¸m víi d¶i mµu 256 mµu chuyÓn tõ mµu

tr¾ng sang ®en vµ cã ®é trong suèt theo s¾c ®é s¸ng. T¹i c¸c ®iÓm mµu ®en

h¬n th× c¶nh ë phÝa d−íi líp Mask ®−îc hiÓn thÞ râ h¬n. T¹i c¸c ®iÓm mµu

s¸ng h¬n th× c¶nh ë d−íi líp Mask hiÓn thÞ mê h¬n.

Trong chuyÓn c¶nh trªn ng−êi ta ®· sö dông mét líp Mask ë gi÷a hai

®o¹n video. Líp nµy cã t¸c dông che dÇn c¶nh A vµ hiÖn dÇn c¶nh B. H×nh

d¹ng vµ ®é trong suèt cña líp Mask cã thÓ ®iÒu chØ ®−îc trong c¸c ch−¬ng tr×nh

so¹n th¶o Video-Audio.

3. Kü thuËt trén (mix)

Trén hai kªnh Video

Trong nhiÒu ch−¬ng trinh so¹n th¶o Video-Audio cã hç trî kü thuËt nµy.

Gi¶ thiÕt ta cã hai ®o¹n Video A vµ B ®−îc ®Æt chång lªn nhau. Th«ng th−êng

nÕu ®Æt nh− vËy th× ta chØ cã thÓ nh×n thÊy ®−îc Video ë phÝa trªn. §Ó nh×n

thÊy ®−îc c¶nh ë cña video phÝa d−íi th× chóng ta cÇn ph¶i thay ®æi ®é trong

suèt cña cña c¸c ®iÓm ¶nh ë Video phÝa trªn. Nh− vËy nÕu ta thay ®æi ®é trong

suèt cña c¸c ®iÓm ¶nh mét c¸ch ®¸ng kÓ cña video phÝa trªn th× chóng ta cã

Trang 42

®−îc mét c¶nh mµ cã c¶ h×nh ¶nh Video A vµ c¶ h×nh ¶nh video B.

Lý thuyết xử lý Video

C¶nh video A C¶nh video B

§Æt Video A chång lªn video B vµ thay ®æi ®é trong suèt cña c¶nh A ta

thu ®−îc c¶nh:

Sö dông kü thuËt nµy chóng ta cã thÓ t¹o ®−îc rÊt nhiÒu hiÖu øng cho

Video tõ c¸c ®o¹n video ®¬n lÎ.

Trén 2 kªnh ©m thanh

NÕu cã hai kªnh ©m thanh A vµ B, qu¸ tr×nh trén hai kªnh lµ viÖc ph¸t

cïng mét lóc hai kªnh ©m thanh víi ®é lín kh¸c nhau. KÕt qu¶ , chóng ta sÏ thu

Kªnh A Kªnh B

Trang 43

®−îc mét ©m thanh hçn t¹p cña hai kªnh A vµ B.

Lý thuyết xử lý Video

§−êng gÊp khóc thÓ hiÖn c−êng ®é ©m thanh cña mçi kªnh t¹i c¸c thêi

®iÓm kh¸c nhau.

4. Kü thuËt t¹o ®é trong suèt (Transparence)

Transparence lµ mét kü thuËt ®−îc ¸p dông rÊt nhiÒu trong viÖc xö lý ®å

ho¹. §©y lµ kü thuËt lµm mÊt mét hoÆc nhiÒu mµu x¸c ®Þnh cho mét ®o¹n

Video. VÝ dô chóng ta cã hai ®o¹n Video-Audio A vµ B Video A chång lªn

video B. Video A cã mµu nÒn lµ mµu ®en. Chóng ta cã thÓ dïng kü thuËt nµy

lµm mÊt mµu ®en trªn video A vµ nh− vËy t¹i c¸c ®iÓm cã mµu ®en trªn Video

A sÏ kh«ng xuÊt hiÖn. Thay vµo ®ã lµ c¸c ®iÓm trong suèt. KÕt qu¶ lµ t¹i c¸c

®iÓm cã mµu ®en cña video A ta cã thÓ nh×n thÊy c¸c ®iÓm ¶nh cña Video B.

Cßn t¹i c¸c ®iÓm kh¸c chóng ta nh×n thÊy video A.

C¶nh video A C¶nh video B

§Æt Video A chång lªn video B vµ ®Æt Transparence cho mµu ®en trªn

video A ta thu ®−îc c¶nh:

Trong c¸c tr−¬ng hîp lµm mÊt mét d¶i mµu x¸m tõ tr¾ng ®Õn ®en (256

Trang 44

mµu) th× chóng ta thu ®−îc kÕt qu¶ :

Lý thuyết xử lý Video

Chó ý khi sö dông kü thuËt nµy mµu bÞ mÊt kh«ng trïng víi mµu trong

c¶nh Video. NÕu trïng sÏ g©y ra lçi “thñng h×nh” tøc lµ sÏ cã mét sè vïng

mµu trong ®èi t−îng chÝnh mÊt ®i kh«ng theo ý muèn

4.1 Kü thuËt sö dông kªnh Alpha

Kü thuËt sö dông kªnh Alpha lµ mét kü thuËt tiªn tiÕn th−êng ®−îc sö

dông nhiÒu trong c¸c ch−¬ng tr×nh so¹n th¶o phim vµ t¹o c¸c kü x¶o cho phim

¶nh. Ph−¬ng ph¸p nµy dùa trªn viÖc ®¸nh dÊu ®−êng biªn kÝn cña c¸c ®èi t−îng

trªn mét khu«n h×nh vµ l−u ®−êng biªn d−íi d¹ng mét kªnh Alpha. Khi tiÕn

hµnh ghÐp hai khu«n h×nh cña hai ®o¹n phim víi nhau ng−êi ta sÏ lµm mÊt ®i

khu vùc phÝa ngoµi cña t−îng chøa kªnh Alpha vµ nh− vËy nã sÏ ®¶m b¶o chÊt

cña h×nh ¶nh trong khu vùc ®−îc ®¸nh

dÊu.

Chóng ta cã Video A lµ mét nh©n

vËt nh− c¶nh bªn:

Gi¶ thiÕt chóng ta cã Video B

Trang 45

lµ mét c¶nh nÒn nh− c¶nh bªn:

Lý thuyết xử lý Video

§Æt Video A chång lªn B .

NÕu dïng kü thuËt trén hai kªnh video A vµ B th× ta sÏ cã kÕt qu¶ lµ hai

video ë chÕ ®é kh«ng râ nÐt vµ cã nhiÒu phÇn hoµ trén víi nhau.

NÕu dïng kü thuËt Transparence lµm mÊt mµu tr¾ng th× cã hiÖn t−îng

Mµu tr¾ng t¹i vÞ trÝ nµy bÞ mÊt ®i

Trang 46

phÇn ngoµi cña m¾t gµ còng sÏ bÞ mÊt. KÕt qu¶ ®¹t chÊt l−îng kh«ng cao

Lý thuyết xử lý Video

Trong tr−êng hîp nµy chØ cã thÓ dïng kü thuËt kªnh Alpha. L−u l¹i ®−êng

biªn cña ®èi t−îng d−íi d¹ng kªnh Alpha vµ lµm mÊt phÇn ngoµi cña kªnh

Mµu tr¾ng t¹i vÞ trÝ nµy kh«ng bÞ mÊy ®i

Alpha . Nh− vËy chÊt l−îng ®¹t ®−îc lµ rÊt cao.

Kªnh Alpha dïng cho khung h×nh trªn video A cã d¹ng sau :

Khi sö dông kªnh Alpha chóng ta cÇn lùa chän ®Þnh d¹ng ¶nh hîp lý dÓ

l−u kªnh Alpha. HiÖn nµy cã ®Þnh d¹ng ¶nh TIFF ®©y lµ mét ®Þnh d¹ng theo

chuÈn c«ng nghiÖp cã chøa kªnh Alpha. Khi sö dông ®Þnh d¹ng nµy chóng ta

Trang 47

cã thÓ t¹o ra d−îc nh÷ng kü x¶o chÊt l−îng cao.

Lý thuyết xử lý Video

Tµi liÖu tham kh¶o

1. Adobe Primerie 6.0 uses guide

2. DV300 uses guide

3. Bµi gi¶ng cña chuyªn gia Yichi Kogure

4. http://mpeg.telecomitalialab.com/standards/mpeg-1/mpeg-1.htm

5. http://mpeg.telecomitalialab.com/mpeg_books.htm

6. http://wwwam.hhi.de/mpeg-video/contact.htm

7. http://www.ebu.ch/trev_dolby_frm.html

8. http://www.msstate.edu/movies/

9. http://wwwam.hhi.de/mpeg-video/#MPEG_Video_Group

Trang 48

10. http://mp3.lycos.com/