CHƯƠNG TRÌNH KC01 ĐỀ TÀI MÃ SỐ KC01-14 ------&------
ĐỀ TÀI THUỘC CHƯƠNG TRÌNH KHCN CẤP NHÀ NƯỚC KC 01 MÃ SỐ KC 01.14 NGHIÊN CỨU PHÁT TRI ỂN ỨNG DỤNG CÔNG NGHỆ ĐA PHƯƠNG TIỆN
Ch ủ nhiệm đề tài: PGS.TS. Nguyễn Cát Hồ
CẤP QUẢN LÝ: Nhà nước CƠ QUAN CHỦ TRÌ: Viện công nghệ thông tin – Đại học Quốc
gia Hà nội
BÁO CÁO CH CHUYÊN ĐỀ: LÝ THUYẾT XỬ LÝ VIDEO
CHỦ TRÌ CHUYÊN ĐỀ: PHAN THẾ HÙNG
6352-10 20/4/2007
HÀ NỘI, 4/2005
Lý thuyết xử lý Video
Môc lôc
3
I. Kh¸i niÖm vÒ Video 3
4
1. Kh¸i niÖm chung
4
2. Kh¸i niÖm Digital Video (Video sè)
3. §Æc ®iÓm Video sè
6
II. NÐn d÷ liÖu Video 6
7
1. Sù cÇn thiÕt ph¶i nÐn víi hiÖu suÊt (tØ lÖ nÐn) cao
2. Mét sè thuËt to¸n nÐn dïng cho Video
11
III. C¸c ®Þnh d¹ng Video sè 11
1. §Þnh d¹ng Video
17
IV. ¢m thanh 17
17
1. ¢m thanh tù nhiªn
18
2. H×nh thøc sè ho¸ ©m thanh
19
3. ¢m thanh gèc
20
4. Ph−¬ng thøc lÊy mÉu trong ©m thanh
22
5. Mét sè chuÈn nÐn d÷ liÖu ©m thanh
22
6. T¹o ©m thanh
23
7. ¢m thanh 3D thùc
8. §Þnh d¹ng ©m thanh
24
V. C¸c tham sè trong Video vµ audio 24
30
1. C¸c tham sè cho Video
Trang 1
2. C¸c tham sè cho Audio
Lý thuyết xử lý Video
VI. ChuyÓn ®æi d÷ liÖu tõ video, b¨ng, ®Üa CD thµnh
33
c¸c tÖp Video-Audio cho m¸y tÝnh vµ ng−îc l¹i 33
34
1. C¸c cæng chuyÓn ®æi tÝn hiÖu
2. Thu tÝn hiÖu tõ c¸c thiÕt bÞ ph¸t Video-Audio vµo m¸y tÝnh
3. ChuyÓn ®æi d÷ liÖu Video-Audio thµnh c¸c ®Þnh d¹ng kh¸c nhau 36
VII. Mét sè kü thuËt xö lý Video-Audio trªn m¸y
41
tÝnh 41
41
1. Kü thuËt ®¸nh dÊu (Marker) vµ keyframe
42
2. ChuyÓn c¶nh (Transition)
44
3. Kü thuËt trén (mix)
Trang 2
4. Kü thuËt t¹o ®é trong suèt (Transparence)
Lý thuyết xử lý Video
I. Kh¸i niÖm vÒ Video
1. Kh¸i niÖm chung
Video ra ®êi vµo nh÷ng n¨m ®Çu cña thÕ kû XX nh−ng nã ph¸t triÓn kh¸
chËm ch¹p vµ cã nhiÒu ng−êi cßn kh«ng tin vµo kh¶ n¨ng cña nã. Nh−
Darryl.Zanuck, gi¸m ®èc h·ng phim Fox-TK20 ph¸t biÓu ®Çu n¨m 1946 “ Tivi
sÏ kh«ng thÓ nµo tiÕp tôc ®−îc träng dông qu¸ 6 th¸ng. Ng−êi ta sÏ nhanh
chãng ch¸n ngay viÖc theo dâi mét c¸i hép gç mçi tèi”. Video chØ thùc sù ph¸t
triÓn vµo nh÷ng n¨m cuèi cña thÕ kû XX. Víi sù ph¸t triÓn nhanh chãng cña
c«ng nghÖ, ngµy nay Tivi-Video ®· trë thµnh mét thµnh phÇn kh«ng thÓ thiÕu
®−îc trong ®êi sèng x· héi.
Video lµ g×? Chóng ta cã thÓ hiÓu Video lµ mét d¹ng d÷ liÖu bao gåm ©m
thanh vµ h×nh ¶nh kÕt hîp víi nhau vµ lu«n cã sù biÕn ®æi vÒ néi dung (khu«n
h×nh) theo thêi gian.
C¸c yªu cÇu hÖ thèng cña Video: Th«ng th−êng, nÕu chóng ta xem mét
®o¹n Video mµ ©m thanh vµ h×nh ¶nh kh«ng khíp hay tèc ®é qu¸ chËm so víi
kh¶ n¨ng nh×n cña chóng ta th× ch¾c ch¾n video kh«ng thÓ ®¨ng t¶i ®−îc néi
dung thùc sù cña nã . NÕu chóng ta xem c¸c phim ®−îc s¶n xuÊt ®Çu thÕ kû
XX th× chóng ta thÊy c¸c h×nh ¶nh trªn mµn h×nh th−êng bÞ chËm hay bÞ giËt so
víi ho¹t ®éng thùc. Lý do lµ c¸c m¸y quay ®· kh«ng thu ®ñ 24 h×nh trªn 1 gi©y.
Do ®ã, c¸c hÖ thèng Video hiÖn nay ®Òu yªu cÇu c¸c thiÕt bÞ thu, ph¸t, ®−êng
truyÒn video ph¶i ®¶m b¶o viÖc hiÓn thÞ h×nh ¶nh vµ ©m thanh trong thêi gian
thùc. HiÖn nay trªn thÕ giíi sö dông 3 hÖ Video chÝnh: NTSC (National
Television Standard Committee) theo chuÈn 29,97 h×nh/gi©y, PAL, SECAM
theo chuÈn 25 h×nh/gi©y.
TruyÒn h×nh NTSC dïng mµnh 525 dßng vµ hiÓn thÞ ®Çy mµnh víi tÇn sè
30 mµnh mçi gi©y, b»ng ph−¬ng ph¸p quÐt xen dßng 60 b¸n mµnh mçi gi©y ®Ó
phï hîp víi tÇn sè xoay chiÒu ë Mü lµ 60 Hz. C¸c ghÐp nèi video NTSC sö dông
c¸c ®Çu c¾m vµ jack c¾m chuÈn RCA. C¸c chuyªn gia v« tuyÕn truyÒn h×nh
Trang 3
th−êng nãi ®ïa r»ng NTSC lµ viÕt t¾t cña " Never Twice The Same Color" (cïng
Lý thuyết xử lý Video
mét mµu kh«ng bao giê lÆp l¹i hai lÇn) v× kh¶ n¨ng kiÓm so¸t mµu cña chuÈn
NTSC rÊt kÐm. TruyÒn h×nh NTSC ®−îc qu¶ng b¸ ë Mü, nhËt vµ hÇu hÕt c¸c
n−íc Trung vµ Nam Mü nh−ng kh«ng dïng ë Ch©u ¢u vµ Ch©u ¸. HÇu hÕt c¸c
n−íc ch©u ¢u vµ ch©u ¸ ®Òu dïng chuÈn PAL dùa trªn c¬ së tÇn sè ®iÖn lµ 50
Hz.
2. Kh¸i niÖm Digital Video (Video sè)
Cïng víi sù ra ®êi vµ ph¸t triÓn m¹nh mÏ cña m¸y tÝnh vµ hÖ thèng viÔn
th«ng trong nh÷ng thËp kû cuèi cña thÕ kû XX, m¸y tÝnh ®· ®−îc sö dông
trong rÊt nhiÒu ngµnh c«ng nghiÖp. Do ®ã ®Æt ra yªu cÇu cÇn ph¶i cã d÷ liÖu
d¹ng ©m thanh vµ h×nh ¶nh cho m¸y tÝnh (®Ó m¸y tÝnh cã thÓ hiÓu ®−îc). ChÝnh
v× vËy ra ®êi kh¸i niÖm Digital Video. Digital Video lµ Video nh−ng ®−îc ghi
(m· ho¸) d−íi d¹ng sè b»ng c¸c m· 0 vµ 1. Video th«ng th−êng ®−îc ghi d−íi
d¹ng tÝn hiÖu t−¬ng tù (Analog)
3. §Æc ®iÓm Video sè
- Video sè sö dông ®é ph©n gi¶i 72dpi.
Video sè th−êng sö dông ®é ph©n gi¶i 72 dpi (sè ®iÓm ¶nh cho 1 inch).
§Æc ®iÓm nµy dùa trªn giíi h¹n vÒ kh¶ n¨ng nh×n cña m¾t ng−êi. Víi mµu
huúnh quang th× m¾t ng−êi chØ nhËn biÕt ®−îc sù kh¸c nhau cña chÊt l−îng h×nh
¶nh chuyÓn ®éng víi ®é ph©n gi¶i d−íi 72 dpi.
Chóng ta chØ sö dông ®é ph©n gi¶i trªn 72 dpi cho mét sè tr−êng hîp ®Æc
biÖt khi cÇn cã Video hoÆc ¶nh chÊt l−îng cao nh− c¸c ®o¹n phim ¶nh sö dông
cho viÖc ph©n tÝch khoa häc cÇn phãng to lªn nhiÒu lÇn hoÆc c¸c ¶nh dïng
trong ngµnh c«ng nghiÖp in Ên. NÕu muèn cã mét tÊm ¶nh in víi chÊt l−îng
cao cã thÓ ng−êi ta ph¶i ®Æt ®é ph©n gi¶i lªn trªn 400 dpi.
- KÝch cì tÖp video lµ rÊt lín.
Trang 4
Chóng ta cã thÓ lµm mét phÐp tÝnh nh− sau:
Lý thuyết xử lý Video
NÕu mét ®o¹n Video th«ng th−êng hÖ PAL (24 h×nh trªn gi©y) cã thêi
l−îng lµ 1 phót cã kÝch cì khung h×nh lµ 640x480 ®é s©u mµu 16 bit th× kÝch
cì tÖp nµy lµ: 16x640x480x24x60= 7077888000bit= 843MB
Nh− vËy chóng ta thÊy r»ng d÷ liÖu cña video lµ rÊt lín so víi thiÕt bÞ l−u
tr÷ th«ng tin hiÖn nay. Do vËy ng−êi ta lu«n ph¶i t×m mäi c¸ch ®Ó gi¶m kÝch cì
cña Video. Cã nhiÒu c¸ch gi¶m kÝch cì tÖp video vÝ dô nh− gi¶m kÝch cì
khu«n h×nh, gi¶m ®é s©u mÇu... nh−ng c¸ch hiÖu qu¶ ®ã lµ sö dông c¸c thuËt
to¸n nÐn ¶nh.
C¸c thuËt to¸n nÐn ¶nh ®¶m b¶o cho viÖc sö dông c¸c tÖp video trªn m¸y
tÝnh còng nh− truyÒn d÷ liÖu video trªn m¹ng lµ hiÖu qu¶, trong thêi gian thùc.
HiÖn nay, ®· cã rÊt nhiÒu thuËt to¸n nÐn video kh¸c nhau, nh−ng nÒn t¶ng vÉn
chñ yÕu dùa trªn c¸c thuËt to¸n nÐn ¶nh nh− thuËt to¸n RLE, LZW, Wavalet,
DCT... Ngoµi ra ng−êi ta cßn cã mét sè thuËt to¸n giµnh riªng cho Video sè
Trang 5
nh− nÐn kh«ng gian mµu, nÐn cÊu tróc trong, nÐn dùa vµo ®èi t−îng c¬ b¶n.
Lý thuyết xử lý Video
II. NÐn d÷ liÖu Video
1. Sù cÇn thiÕt ph¶i nÐn víi hiÖu suÊt (tØ lÖ nÐn) cao
Nh− chóng ta ®· biÕt d÷ liÖu Video sè lµ rÊt lín vµ yªu cÇu hiÓn thÞ trong
thêi gian thùc, do ®ã muèn sö dông ®−îc video sè mét c¸ch hiÖu qu¶ th× ph¶i
cã thuËt to¸n nÐn víi hiÖu suÊt cao.
HiÖn nay, cã nhiÒu thuËt to¸n nÐn kh¸c nhau nh−ng cã thÓ ph©n thµnh hai
d¹ng chÝnh: ®ã lµ thuËt to¸n nÐn mÊt th«ng tin vµ nÐn kh«ng mÊt th«ng tin.
NÐn kh«ng mÊt th«ng tin: ®©y lµ nhãm c¸c thuËt to¸n nÐn mµ khi d÷ liÖu
®−îc phôc håi vÉn ®¶m b¶o ®−îc chÊt l−îng nh− d÷ liÖu gèc ( chÊt l−îng Video
kh«ng hÒ thay ®æi). Nh−ng nh÷ng thuËt to¸n nµy cã tû lÖ nÐn rÊt thÊp . Nã chØ
nÐn ®−îc kho¶ng 2 lÇn so víi kÝch cì gèc. Trong thùc tÕ chØ sö dông c¸c thuËt
to¸n nÐn nµy ®Ó t¹o c¸c tÖp video nguån cho so¹n th¶o hoÆc ®Ó di chuyÓn video
tõ hÖ thèng nµy sang hÖ thèng kh¸c. Khi lµm viÖc víi c¸c tÖp video sö dông
thuËt to¸n nµy chóng ta cÇn chó ý c¸c tÖp video lµ rÊt lín ®èi víi nhiÒu hÖ thèng
m¸y tÝnh ®ång thêi yªu cÇu vÒ tèc ®é truyÒn d÷ liÖu còng rÊt cao khi hiÓn thÞ
( playback).
NÐn mÊt th«ng tin: c¸c thuËt to¸n thuéc nhãm nµy th−êng cã tû lÖ nÐn rÊt
cao cã thÓ nÐn víi tû lÖ tõ 10 ®Õn 100 lÇn so víi kÝch cì gèc. VÝ dô khi ta cã 1
tÖp Video kÝch cì 100 Mb, nÕu ¸p dông thuËt to¸n nÐn nµy th× kÝch cì cña tÖp
Video chØ cßn kho¶ng tõ 1-10 Mb. Nh−îc ®iÓm cña c¸c thuËt to¸n nµy lµ chØ
®¶m b¶o chÊt l−îng h×nh ¶nh Video t−¬ng ®èi tèt nh−ng kh«ng ®−îc nh− h×nh
¶nh Video gèc. Tøc lµ khi dïng c¸c thuËt to¸n nÐn nµy mét nhãm th«ng tin cña
video ®· ®−îc l−îng tö ho¸ vÝ dô mét nhãm mµu gÇn gièng nhau gÇn nhau ®−îc
chuyÓn thµnh mét mµu ®Æc tr−ng ®Ó gi¶m sù m· ho¸ mµu nh− vËy sÏ lµm gi¶m
kÝch cì tÖp video. Khi phôc håi c¸c tÖp video ®Ó hiÓn thÞ trªn mµn h×nh th× th«ng
tin vÒ mµu s¾c sÏ kh«ng ®−îc ®Çy ®ñ nh− tÖp gèc nh−ng kÌm vµo ®ã lµ c¸c
ph−¬ng ph¸p xö lý mµu gi÷a c¸c vïng mµu cña thuËt to¸n lµm cho c¸c c¶nh
video cã chÊt l−îng gÇn nh− ban ®Çu. §iÓn h×nh lµ mét sè kiÓu nÐn nh− JPEG,
Trang 6
Planar RGB.
Lý thuyết xử lý Video
Trong thùc tÕ th× ng−êi ta sö dông nhiÒu c¸c thuËt to¸n nÐn nµy cho c¸c
tÖp video sö dông trªn ®Üa CD-ROM, trªn Internet v× cã thÓ thay ®æi ®−îc chÊt
l−îng tÖp video lµm cho kÝch cì cña tÖp nhá ®i, vµ tèc ®é hiÓn thÞ ( play back)
nhanh h¬n.
2. Mét sè thuËt to¸n nÐn dïng cho Video
2.1 NÐn kh«ng gian mµu
§©y lµ thuËt to¸n dùa trªn nguyªn lý lµm gi¶m th«ng tin mµu (trong kh«ng
gian YUV) vµ sù kÐm nh¹y c¶m cña m¾t ng−êi víi mµu s¾c ®Æc biÖt víi viÖc
mµu s¾c liªn tôc thay ®æi trong c¸c chuyÓn ®éng. Dùa trªn 3 mµu c¬ b¶n RGB
ng−êi ta cã mét kh«ng gian mµu nh− sau:
NÕu lÊy O lµm gèc víi ba trôc lµ ba mµu c¬
B
M
b¶n ®á, xanh vµ xanh l¸ c©y (Red,Green,Blue), ta sÏ
cã kh«ng gian mµu (ORGB). Trôc KO lµ ®−êng
N
K
I
O
tæng hîp ¸nh s¸ng cña 3 mµu víi gi¸ trÞ b»ng nhau
R
do ®ã nã chÝnh lµ ®−êng thÓ hiÖn ®é s¸ng cña mµu
G
s¾c. T¹i gèc O sÏ lµ mµu ®en.
A
Tõ kh«ng gian nµy ta x©y dùng kh«ng gian YUV b»ng c¸ch: Dïng mÆt
ph¼ng GRB lµm mÆt ph¼ng mµu. MÆt ph¼ng nµy cã mµu s¾c ®−îc tæng hîp tõ
3 mµu c¬ b¶n. §Æt tªn mÆt ph¼ng nµy lµ mÆt ph¼ng (U,V) víi hai ®−êng th¼ng
U,V vu«ng gãc víi nhau vµ c¾t nhau t¹i I.
Trôc Y vu«ng gãc víi mÆt ph¼ng (U,V) lµ ®−êng th¼ng KO thÓ hiÖn
®é s¸ng (®é chãi) cña ¸nh s¸ng.
V
Y
U
YUV (Luminance, 2 Color diferences)
V
Y
U
Y:U:V = 4:2:2
V
Y
U
Y:U:V = 4:1:1
Trang 7
Y:U:V = 4:2:0
Lý thuyết xử lý Video
Trong thuËt to¸n nµy ng−êi ta nÐn vµ lµm gi¶m gi¸ trÞ mµu ë trªn 2 trôc U
vµ V cßn gi¸ trÞ ®é s¸ng Y ®−îc gi÷ nguyªn v× gi¸ trÞ nµy rÊt quan träng( m¾t
ng−êi rÊt nhËy c¶m ®èi víi ®éi s¸ng). Ng−êi ta th−êng ¸p dông réng r·i thuËt
to¸n nÐn nµy trong c¸c m¸y m¸y ghi Video, Tivi...
NÐn kh«ng gian mµu lµ c¸ch m« pháng ¶o c¸c vïng cña khu«n h×nh víi
b¶n chÊt lµ viÖc t×m ra c¸c mÉu vµ t¹o l¹i c¸c ®iÓm ¶nh. VÝ dô: trong mét ¶nh cã
vïng mµu xanh da trêi, thuËt to¸n nÐn kh«ng gian sÏ nhËn biÕt nhiÒu ®iÓm mµu
xanh gièng nhau trong kh«ng gian nµy. §Ó m« t¶ l¹i c¸c ®iÓm mµu xanh nµy,
thuËt to¸n nÐn kh«ng gian ghi l¹i c¸c m« t¶ ¶nh mét c¸ch ng¾n gän nhÊt vÝ dô
nh− sè ®iÓm trong vïng mµu xanh, m· mµu trong khu vùc ®ã...Nh− vËy nÕu b¹n
t¨ng kh«ng gian nÐn (kÝch cì vïng mµu) th× d÷ liÖu vµ kÝch cì tÖp video sÏ
gi¶m vµ ¶nh sÏ bÞ mÊt ®é nÐt. VËy cÊp ®é nÐn cã thÓ ®−îc ®iÒu khiÓn th«ng qua
c¸c chØ sè lùa chän chÊt l−îng vµ tèc ®é truyÒn d÷ liÖu.
2.2 NÐn cÊu tróc bªn trong
ThuËt to¸n nµy dùa trªn gi¶i ph¸p nÐn theo cÊu tróc vµ nÐn theo biÕn thêi
gian kÕt hîp víi kü thuËt bï chuyÓn ®éng.
§©y lµ c¸ch t×m kiÕm c¸c ®iÓm ¶nh thay ®æi trong mét kho¶ng thêi gian
hay mét chuçi c¸c khu«n h×nh.
VÝ dô, trong mét ®o¹n video cã mét nh©n vËt ®ang nãi trªn mét nÒn tÜnh.
ThuËt to¸n nÐn theo thêi gian sÏ nhËn biÕt c¸c pixel thay ®æi tõ khu«n h×nh nµy
sang khu«n h×nh kia ®ã lµ h×nh khu«n mÆt nh©n vËt ®ang nãi. Cßn tÊt c¶ c¸c
®iÓm kh¸c kh«ng thay ®æi. §Ó m« t¶ l¹i nhiÒu ®iÓm ¶nh vµ nhiÒu khu«n h×nh
th× thuËt to¸n nµy sÏ m« t¶ l¹i tÊt c¶ c¸c ®iÓm trong khu«n h×nh ®Çu tiªn. Cßn
c¸c khu«n h×nh tiÕp theo thuËt to¸n chØ m« t¶ l¹i c¸c ®iÓm thay ®æi. Ph−¬ng
ph¸p nµy gäi lµ ph−¬ng ph¸p tÝnh sai ph©n cña khu«n h×nh.
Nh− vËy b»ng c¸ch ph©n tÝch trªn thuËt to¸n sÏ ghi l¹i khu«n h×nh ®Çu
(keyframe) vµ kho¶ng thêi gian nµo ®ã cho chuyÓn ®éng. TiÕp theo c¸c néi
dung cña keyframe nh− vÞ trÝ, c¸c vïng ®iÓm mµu.. C¸c vïng ®iÓm ¶nh thay ®æi
Trang 8
theo thêi gian còng sÏ ®−îc l−u l¹i. Khi hiÓn thÞ l¹i tÖp video trªn mµn h×nh
Lý thuyết xử lý Video
ch−¬ng tr×nh dùa vµo c¸c chØ sè vÒ keyframe, mµu s¾c, ¸nh s¸ng, c¸c ®iÓm ¶nh
chuyÓn ®éng... ®Ó t¸i t¹o l¹i chuyÓn ®éng. Nh− vËy thuËt to¸n nµy ®· lµm mÊt
®i mét sè ®¸ng kÓ c¸c khu«n h×nh trong mét kho¶ng thêi gian vµ nh− vËy kÝch
f r a m e ( i n d e p e n d e n t ) K e y -- f r a m e ( i n d e p e n d e n t ) K e y
t i m e t i m e
D e f e r e n t i a l D e f e r e n t i a l D a t a O n l y D a t a O n l y
cì tÖp video sÏ nhá ®i.
Theo thuËt to¸n nµy nÕu sè keyframe cµng nhiÒu (thêi l−îng gi÷a c¸c
keyframe cµng ng¾n) th× chÊt l−îng video cµng tèt. V× vËy ng−êi ta dïng tham
sè keyframe vµ chÊt l−îng khu«n h×nh (keyframe) ®Ó ®iÒu chØnh cÊp ®é nÐn.
2.3 NÐn dùa vµo ®èi t−îng c¬ b¶n
ThuËt to¸n nµy dùa trªn kü thuËt ph©n gi· ¶nh thµnh cÊu tróc c©y ®èi t−îng
sau ®ã vÐct¬ ho¸ c¸c ®èi t−îng nµy (Vector Quantization (VQ)).
VÝ dô c¶nh video nh− ë h×nh bªn d−íi: H×nh ®èi t−îng con c¸ sÏ ®−îc t¸ch
ra khái nÒn vµ ®−îc Vector ho¸.
Nh− vËy viÖc ghi d÷ liÖu cho tÖp Video víi kiÓu nÐn nµy chÝnh lµ ghi c¸c
th«ng tin ¶nh Vector vµ c¸c th«ng tin chuyÓn ®éng cña ¶nh vÐct¬ trong mét
Trang 9
kho¶ng thêi gian nµo ®ã.
Lý thuyết xử lý Video
Khi gi¶i nÐn ch−¬ng tr×nh dùa trªn c¸c th«ng tin vÒ ®−êng biªn, mµu s¾c vµ
h−íng chuyÓn ®éng cña c¸c ®èi t−îng trong khu«n h×nh ®Ó x©y dùng l¹i chuyÓn
®éng. Tøc lµ sÏ sinh ra mét lo¹t c¸c Frame ®Ó h×nh thµnh ®o¹n video.
C¸c thuËt to¸n trªn ®Òu cã chung mét ®Æc ®iÓm lµ chØ l−u l¹i c¸c th«ng tin
cÇn thiÕt nhÊt cña video vµ trªn c¬ së ®ã x©y dùng c¸c frame cho video. ChÝnh
dùa trªn ®Æc ®iÓm nµy nªn hÇu hÕt c¸c thuËt to¸n nµy ®Òu cho phÐp thay ®æi chÊt
l−îng cña video tuú vµo môc ®Ých sö dông. Vi dô nh− nÕu ng−êi ta muèn sö
dông ®o¹n video cho Internet tèc ®é chËm th× cã thÓ ®iÒu chØnh chÊt l−îng kÐm
®i vµ nh− vËy kÝch cì tÖp video sÏ nhá ®i nhiÒu. Trong tr−êng hîp môc ®Ých sö
dông cÇn cã chÊt l−îng cao mµ kh«ng bÞ giíi h¹n vÒ ®−êng truyÒn nh− c¸c tÖp
Video ®−îc ghi trªn ®Üa CD, DVD th× chóng ta cã thÓ ®iÒu chØnh chÊt l−îng nÐn
Trang 10
phï hîp ®Ó cã ®−îc c¸c tÖp video tho¶ m·n yªu cÇu ®Æt ra.
Lý thuyết xử lý Video
III. C¸c ®Þnh d¹ng Video sè
1. §Þnh d¹ng Video
1.1 §Þnh d¹ng chuÈn cho hÖ ®iÒu hµnh
1.1.1 §Þnh d¹ng AVI
§©y lµ ®Þnh d¹ng ®−îc thiÕt kÕ ®Ó dïng trong m«i tr−êng Windows. §Þnh
d¹ng nµy cã thÓ sö dông rÊt nhiÒu thuËt to¸n nÐn video ®−îc ph¸t triÓn tõ tr−íc
®Õn nay.
1.1.2 §Þnh d¹ng QuickTime
§©y lµ ®Þnh d¹ng ®−îc thiÕt kÕ ®Ó dïng trong m«i tr−êng Macintosh. ®Þnh
d¹ng Quicktime ®−îc x©y dùng tõ nhiÒu thuËt to¸n nÐn ¶nh vµ ©m thanh trong
m«i tr−êng Macintosh. Quick time còng lµ ®Þnh d¹ng ®−îc rÊt nhiÒu phÇn mÒm
øng dông hç trî. Kh«ng nh÷ng thÕ nã cßn ®−îc cµi ®Æt trong nhiÒu chÝp xö lý
cña hÖ thèng.
HiÖn nay c¶ hÖ hÖ ®iÒu hµnh Windows vµ Macintosh ®Òu cho phÐp sö
dông c¶ hai ®Þnh d¹ng Video nµy.
1.2 ChuÈn quèc tÕ
MPEG-1/2/4- ISO (chuÈn quèc tÕ)
§Þnh d¹ng MPEG-1/2/4 ®−îc ph¸t triÓn bëi MPEG (Moving Picture
Experts Group). §Þnh d¹ng nµy ®−îc sö dông ®Ó t¹o c¸c s¶n phÈm video trong
ngµnh c«ng nghiÖp ph¸t thanh truyÒn h×nh, Internet vµ c¸c øng dông ®å häa .
1.2.1 MPEG-1
MPEG-1 ®−îc b¾t ®Çu ph¸t triÓn tõ n¨m 1993 vµ ®−îc hoµn thiÖn vµo n¨m
1998 víi nhiÒu −u ®iÓm nh−: ®Þnh d¹ng nµy cã chÊt l−îng cao t−¬ng ®−¬ng víi
chÊt l−îng hiÓn thÞ h×nh trªn Tivi, cã kh¶ n¨ng ®iÒu chØnh chÊt l−îng... Nã sö
Trang 11
dông thuËt to¸n DCT(Discrete Cosine Transformation ) víi khu«n h×nh chuÈn
Lý thuyết xử lý Video
352x240 ®iÓm víi yªu cÇu tèc ®é ®−êng truyÒn lµ 1.5Mbps (Mb trªn mét gi©y).
§Þnh d¹ng nµy ®−îc øng dông ®Ó x©y dùng c¸c s¶n phÈm Video trªn ®Üa CD-
ROM.
MPEG-1 ®−îc thiÕt kÕ nh− sau :
Theo chuÈn MPEG-1 nã ph©n ®Þnh ®Þa chØ cña c¸c kªnh d÷ liÖu ©m thanh
vµ h×nh ¶nh kÕt hîp víi thêi gian. §©y lµ chøc n¨ng quan träng v× tõ d¹ng d÷
liÖu nµy sÏ ®−îc chuyÓn ®æi thµnh c¸c kªnh d÷ liÖu phï hîp.
S¬ ®å nguyªn mÉu chuÈn gi¶n nÐn ISO/IEC 11172
Theo s¬ ®å nµy chóng ta thay th«ng qua c¸c ®Þa chØ ®−îc l−u tr÷ trong chuÈn
MPEG-1, khi gi¶i nÐn sÏ x¸c ®Þnh ®−îc chÝnh x¸c c¸c kªnh audio vµ video.
ThuËt to¸n nÐn cho chuÈn MPEG-1 cã kh¶ n¨ng nÐn cao. §Çu tiªn ng−êi ta
ph¶i lùa chän kh«ng gian phï hîp vµ gi¶i ph¸p tÝn hiÖu. Sau ®ã dïng thuËt to¸n
bï chuyÓn ®éng vµ gi¶m thêi gian d− thõa. Bï chuyÓn ®éng ®−îc sö dông trong
viÖc t¹o khu«n h×nh hiÖn t¹i dùa trªn khu«n h×nh tr−íc ®ã (chØ cÇn mét
keyframe tr−íc mµ kh«ng cÇn dùa vµo keyframe sau). C¸c tÝn hiÖu kh¸c, c¸c lçi
®−îc l−îng ho¸ vµ nÐn b»ng c¸ch sö dông thuËt to¸n DCT (discrete cosine
Trang 12
transform).
Lý thuyết xử lý Video
H×nh 2: m« t¶ thêi gian cÇu tróc c¸c khu«n h×nh trong ®Þnh d¹ng MPEG-1
H×nh 2 m« t¶ sù kÕt hîp gi÷a 3 lo¹i th«ng tin vÒ ¶nh: C¸c pixel ¶nh thay ®æi,
c¸c chØ sè vÒ vÞ trÝ , sè l−îng khu«n h×nh ®−îc sinh ra tõ keyframe.
H×nh 3 CÊu tróc gi¶i nÐn c¬ b¶n cña Audio
§Çu vµo lµ c¸c tÝn hiÖu m· víi tÇn sè 32, 44.1, 48 kHz. B¶n ®å (mapping)
sÏ läc vµ lÊy ra c¸c mÉu ®Æc tr−ng. A psychoacoustic model lµ qu¸ tr×nh tËp
hîp d÷ liÖu vµ ®iÒu khiÓn viÖc l−îng tö ho¸ vµ m· ho¸ ®Ó t¹o ra khèi c¸c Frame.
Trang 13
Khèi c¸c frame lµ c¸c gãi chuÈn (c¬ së) ®−îc m· ho¸.
Lý thuyết xử lý Video
1.2.2 MPEG-2
Th¸ng 11/1994, MPEG-2 ®−îc phª chuÈn vµ b¾t ®Çu ®−îc ph¸t triÓn trªn c¬
së c¸c kü thuËt nÐn tèt nhÊt cña MPEG-1 nh−ng phÇn m· ho¸ ®−îc më réng
h¬n. C¸c m· nµy ®−îc ¸p dông cho c¸c ¶nh cã ®é ph©n gi¶i 4:2:2 vµ cao h¬n.
Tuy nhiªn MPEG-2 vÉn kh«ng ®−îc triÓn khai trong c¸c øng dông video. §Õn
th¸ng 4/1997, MPEG-2 ®−a thªm c¸c m· ph©n ®Þnh nhiÒu kªnh audio. Mét sè
thuËt to¸n nÐn ©m thanh ®−îc ¸p dông trong phÇn nµy kh«ng cßn bÞ lÖ thuéc
vµo c¸c thuËt to¸n ®−îc ¸p dông trong MPEG-1. Vµ chuÈn nµy ®· ®−îc tæ chøc
ISO c«ng nhËn.
M« h×nh hÖ thèng gi¶i m· MPEG-2
Theo m« h×nh nµy MPEG-2 ®¸nh ®Þa chØ phèi hîp mét hoÆc nhiÒu luång d÷
liÖu cña video vµ audio thµnh mét luång ®¬n thèng nh©t. C¸c d÷ liÖu trªn luång
d÷ liÖu nµy ®−îc tæ chøc phï hîp nhÊt cho viÖc l−u tr÷ vµ ph¸t video. ViÖc tæ
chøc nµy dùa vµo hai líp chÝnh: Program Stream vµ Transport Stream.
Program Stream(PS) lµ viÖc phèi hîp mét hoÆc nhiÒu gãi tin c¬ b¶n PES
(Packetised Elementary Streams ) trong c¸c luång d÷ liÖu ®¬n thµnh mét luång
d÷ liÖu ®¬n thèng nhÊt. Gãi tin Program Stream cã ®é lín kh¸c nhau vµ nh− vËy
thêi gian truyÒn gãi tin lµ kh¸c nhau. Trong qu¸ tr×nh truyÒn c¸c gãi tin, nÕn
ph¸t hiÖn cã mét gãi tin bÞ mÊt th× hÖ thèng sÏ yªu cÇu truyÒn l¹i toµn bé c¸c
Trang 14
gãi tin.( v× Program Stream kh«ng x¸c ®Þnh gãi tin nµo ph¶i ®−îc truyÒn l¹i).
Lý thuyết xử lý Video
Program Stream ®−îc thiÕt kÕ cho viÖc sö dông trong hÖ thèng ®−êng truyÒn rÊt
Ýt lçi. Nã phï hîp víi c¸c øng dông cã dïng phÇn mÒm ®Ó xö lý.
Transport Stream(TS) lµ viÖc phèi hîp mét hoÆc nhiÒu gãi tin c¬ b¶n PES
(Packetised Elementary Streams ) trong c¸c luång d÷ liÖu ®¬n thµnh mét luång
d÷ liÖu ®¬n thèng nhÊt. Gãi tin Transport Stream cã ®é lín b»ng nhau
lµ188byte vµ nh− vËy thêi gian truyÒn gãi tin lµ nh− nhau. Trong qu¸ tr×nh
truyÒn c¸c gãi tin, nÕn ph¸t hiÖn cã mét gãi tin bÞ mÊt th× hÖ thèng kh«ng yªu
cÇu truyÒn l¹i toµn bé c¸c gãi tin mµ chØ yªu cÇu truyÒn l¹i gãi tin bÞ mÊt.( v×
Transport Stream ®¸nh chØ sè cho c¸c gãi tin). Transport Stream ®−îc thiÕt kÕ
cho viÖc sö dông trong hÖ thèng ®−êng truyÒn( m«i tr−êng) cã nhiÒu lçi.
§Þnh d¹ng MPEG-2 cã khu«n h×nh chuÈn lµ 720x480. Víi yªu cÇu
®−êng truyÒn cã tèc ®é tõ 5-20Mbps. HiÖn nay MPEG-2 ®−îc øng dông cho
viÖc x©y dùng Video víi chÊt l−îng cao trªn thiÕt bÞ DVD.
1.2.3 MPEG-4
MPEG-4 lµ chuÈn ISO/IEC ®−îc ph¸t triÓn bëi MPEG (Moving Picture Experts
Group). Uû ban nµy còng ®· ph¸t triÓn chuÈn MPEG-1 vµ MPEG-2. C¸c chuÈn
nµy cho phÐp ph¸t hµnh video trªn CD-ROM vµ truyÒn h×nh sè. MPEG-4 lµ
kÕt qu¶ cña hµng tr¨m nhµ nghiªn cøu vµ kü s− trªn toµn thÕ giíi. MPEG-4
®−îc hoµn thµnh vµ th¸ng 10/1998 vµ trë thµnh chuÈn quèc tÕ th¸ng 1/1999.
Cuèi n¨m 1999 ra ®êi phiªn b¶n 2 cña MPEG-4.
MPEG-4 sö dông thuËt to¸n nÐn ®èi t−îng c¬ b¶n. §Þnh d¹ng nµy yªu cÇu tèc
®é ®−êng truyÒn thÊp (64kbps) vµ kh«ng cã kÝch cì khu«n h×nh chuÈn.
NÐn h×nh ¶nh trong Mpeg-4 sö dông kü thuËt phÇn líp vµ l−u c¸c th«ng tin ®èi
l−îng. Mçi líp l−u m· nÐn vÒ néi dung cña mét chuçi c¸c ¶nh( bao gåm: ®−êng
viÒn, quü ®¹o chuyÓn ®éng, kÕt cÊu bÒ mÆt). Khi gi¶i nÐn, th«ng qua néi dung
Trang 15
®−îc l−u trong c¸c líp ®Ó x©y dùng l¹i tõng phÇn cña ®o¹n video.
Lý thuyết xử lý Video
M« h×nh nÐn vµ gi¶i nÐn theo tõng líp
Theo m« h×nh nµy, Video ®−îc nÐn trªn 3 líp víi tû lÖ gi¶m kÝch cì (kh«ng
gian) lµ 2 lÇn trªn tõng líp. Trªn c¸c líp ngoµi nh÷ng th«ng tin vÒ néi dung
cña mét chuçi h×nh ¶nh cßn l−u tû lÖ gi¶m kh«ng gian cña líp so víi líp trªn
®ã. Khi gi¶i nÐn dùa vµo tû lÖ nµy cïng víi c¸c th«ng tin vÒ ®−êng viÒn, quü
®¹o chuyÓn ®éng, kÕt cÊu bÒ mÆt cña ®èi t−îng trong video ®Ó phôc håi l¹i
®o¹n video gèc.
Nh− vËy dùa vµo tû lÖ gi¶m kÝch cì kh«ng gian video chóng ta cã thÓ ®iÒu
chØnh ®−îc tèc ®é ph¸t h×nh còng nh− kÝch cì cña tÖp video cho phï hîp víi
b¨ng th«ng.
Víi tÝnh mÌm dÎo cña MPEG-4, nã ®· ®−îc triÓn khai trong 3 lÜnh vùc :
(cid:138) TruyÒn h×nh sè (Digital television)
(cid:138) T−¬ng t¸c tèt víi c¸c øng dông ®å ho¹ (Interactive graphics
applications )
(cid:138) T−¬ng t¸c víi ®a ph−¬ng tiÖn (Interactive multimedia)
ChuÈn kü thuËt cña MPEG-4 ®−îc thèng nhÊt cho s¶n xuÊt, ph©n phèi c¸c s¶n
Trang 16
phÈm Video cho c¶ 3 lÜnh vùc trªn.
Lý thuyết xử lý Video
IV. ¢m thanh
Khi nãi ®Õn video bao giê ng−êi ta còng ®Ò cËp ®Õn 2 vÊn ®Ò ®ã lµ h×nh
¶nh vµ ©m thanh. Cã thÓ nãi ©m thanh lµ mét phÇn kh«ng thÓ t¸ch rêi ®èi víi
video, vËy ©m thanh lµ g×? Chóng ta sÏ xem xÐt c¸c vÊn ®Ò vÒ ©m thanh ë c¸c
phÇn d−íi ®©y.
1. ¢m thanh tù nhiªn
Cã thÓ nãi b¶n chÊt cña ©m thanh ®ã lµ sù dao ®éng kh«ng khÝ. Khi mét vËt
ph¸t ra ©m thanh chÝnh lµ vËt ®ã ®· lµm kh«ng khÝ xung quanh ®ã bÞ dao ®éng.
®o dao ®éng cña ©m thanh b»ng Hz vµ ®¬n vÞ ®o ®é ån cña ©m thanh lµ dB.
§é ån : dB = 20.log10 (P1/P2) víi P lµ tÇn sè ©m thanh
§Æc ®iÓm: ©m thanh gióp cho con ng−êi cã thÓ hiÓu nhanh, râ rµng mét vÊn ®Ò.
Nã kh¸c xa víi c¸c tÝn hiÖu tõ Text bëi v× sù phèi hîp gi÷a ©m thanh vµ h×nh
¶nh gióp cho con ng−êi cã thÓ hiÓu râ ®−îc mäi sù vËt mét c¸ch nhanh chãng.
Trong tù nhiªn kh¶ n¨ng nghe cña con ng−êi kho¶ng 40 Hz ~ 44KHz, nÕu tÇn
sè ©m thanh qu¸ cao hoÆc qu¸ thÊp th× ng−êi ta còng kh«ng thÓ nghe ®−îc
nh÷ng ©m thanh nµy. Ta cã thÓ nghe thÊy ©m thanh cã trong thùc tÕ hoÆc ®−îc
con ng−êi s¸ng t¹o ra.
2. H×nh thøc sè ho¸ ©m thanh
Ng−êi ta cã thÓ sè ho¸ video theo s¬ ®å sau:
§Çu vµo
H×nh thøc sè ho¸
§Çu ra
©m thanh
¢m thanh thùc
D÷ liÖu d¹ng sãng
Micro
Loa
Thu ghi ©m thanh
PhÇn mÒm tæng hîp
ThiÕt bÞ audio
Tæng hîp
T¹o míi
PhÇn mÒm dao ®éng
Hîp thµnh
D÷ liÖu d¹ng kÝ hiÖu
Bµn phÝm, chuét
Trang 17
Lý thuyết xử lý Video
Theo s¬ ®å trªn chóng ta thÊy ®Çu vµo cña ©m thanh cã tõ rÊt nhiÒu nguån kh¸c
nhau. Cã thÓ lµ ©m thanh thùc cã trong tù nhiªn. Th«ng qua c¸c thiÕt bÞ thu
nh− micro chuyÓn hãa ©m thanh thµnh d¹ng sãng ®iÖn tõ vµ ghi vµo b¨ng ®Üa.
Chóng ta còng cã thÓ dïng c¸c thiÕt bÞ sao chÐp ©m thanh nh− ®Çu video, radio
cassette,... ®Ó chuyÓn ©m thanh tõ b¨ng, sang b¨ng, tõ b¨ng sang ®Üa,... Chóng
ta còng cã thÓ t¹o ©m thanh b»ng c¸ch x©y dùng c¸c bé dao ®éng nh− c¸c thiÕt
bÞ ©m nh¹c... Víi sù hç trî cña c¸c phÇn mÒm tæng hîp ©m thanh chóng ta co
thÓ t¹o ©m thanh tõ c¸c ký hiÖu. VÝ dô: chóng ta cã thÓ ch¬i nh¹c b»ng bµn
phÝm, x©y dùng mét b¶n nh¹c b»ng c¸ch so¹n c¸c nèt nh¹c sau ®ã cho ph¸t l¹i
trªn m¸y tÝnh.
Tõ c¸c nguån ©m thanh kh¸c nhau c¸c ©m thanh nµy ®Òu ®−îc chuyÓn ho¸
thµnh sãng ®iÖn tõ vµ ®−îc sè ho¸. C¸c d÷ liÖu sau khi ®−îc sè ho¸ sÏ ®−îc
m¸y tÝnh xö lý. Sau ®ã c¸c d÷ liÖu nµy sÏ ®−îc chuyÓn ng−îc thµnh ©m thanh
thùc th«ng qua hÖ thèng loa.
3. ¢m thanh gèc
C¸c tÝn hiÖu ©m thanh ë d¹ng nguyªn thÓ cã d¹ng h×nh sãng. Tr−íc ®©y ng−êi
ta th−êng thu tÝn hiÖu ©m thanh vµ ghi l¹i d−íi d¹ng t−¬ng tù. Ngµy nay, víi sù
ph¸t triÓn cña c«ng nghÖ sè nªn ng−êi ta ®· sè ho¸ ©m thanh ®Ó cã thÓ xö lý tèt
Analog Analog Analog Analog Input Input Input Input
e e e e d d d d u u u u t t t t i i i i l l l l p p p p m m m m A A A A
Quantized Quantized Quantized Quantized DataData DataData
h¬n cho c¸c øng dông thùc tÕ.
TimeTimeTimeTime
Trang 18
Lý thuyết xử lý Video
S¬ ®å l−îng tö ho¸ tÝn hiÖu ©m thanh
¢m thanh trong tù nhiªn lµ sù dao ®éng d¹ng sãng cña khÝ. Khi ®−îc m· ho¸
®−íi d¹ng sãng ®iÖn tõ, ©m thanh cã cã d¹ng ®å thÞ nh− trªn. §Ó sè ho¸ ng−êi
ta sÏ lÊy mÉu t¹i c¸c ®iÓm kh¸c nhau däc theo ®å thÞ cña ©m thanh. Sè ®iÓm lÊy
mÉu cµng lín chÊt l−îng ©m thanh sè cµng cao.
4. Ph−¬ng thøc lÊy mÉu trong ©m thanh
V× ©m thanh chÝnh lµ sù dao ®éng h×nh sãng quanh mét trôc nªn ng−êi ta chØ
tÝnh tÇn sè ©m thanh lµ phÇn trªn cña ®å thÞ th«ng qua trôc ®èi xøng. Hay nãi
c¸ch kh¸c ng−êi ta chØ lÊy mÉu lµ mét nöa chu kú dao ®éng. VÝ dô nÕu nãi
giäng nãi cã tÇn sè lµ ~5.5 KHz th× tøc lµ tÇn sè thùc khi nghe sÏ lµ 11KHz.
Trong thùc tÕ khi s¶n xuÊt ®Üa CD nh¹c th× ng−êi ta th−êng ghi víi tÇn sè nghe -
>44.1KHz .
Khi xem xÐt vÊn ®Ò vÒ tÝn hiÖu chóng ta thÊy r»ng: nÕu tÝn hiÖu tÇn sè vµo lín
h¬n kh¶ n¨ng nghe cña con ng−êi th× sÏ g©y ra c¸c biÕn d¹ng ©m thanh. Do ®ã
cÇn ph¶i cã c¸c ph−¬ng ph¸p läc bá c¸c tÇn sè kh«ng phï hîp.
Khi sè ho¸ ng−êi ta lÊy mÉu trong tõng khu vùc vµ
Information Information lossloss
ghi l¹i tÇn sè ®Æc tr−ng trong khu vùc ®ã.
AnalogAnalog Input Input
L−îng tö ho¸ ®é s©u
Quantization Quantization LimitLimit
1 bit = 20.log10(2)= 6.021 dB
Quantized Quantized DataData
16 bit= 6.021*16 =96 dB
ChuÈn DVD kho¶ng l−îng tö ho¸ : 16/20/24
bit
Trong qu¸ tr×nh l−îng tö ho¸, ng−êi ta th−êng c¾t tiÕng ån b»ng c¸ch ®Æt ra
giíi h¹n khi l−îng tö ®Ó kh«ng g©y ta hiÖn t−îng d÷ liÖu bÞ sai lÖch. Nh−ng
Trang 19
c¸ch tèt nhÊt vÉn lµ ®iÒu chØnh møc thu ©m thanh nguån.
Lý thuyết xử lý Video
5. Mét sè chuÈn nÐn d÷ liÖu ©m thanh
Nh− chóng ta ®· biÕt d÷ liÖu cña video lµ rÊt lín. Trong ®ã kh«ng chØ cã
d÷ liÖu h×nh ¶nh ph¶i nÐn mµ d÷ liÖu ©m thanh còng ph¶i nÐn v× kÝch cì cña nã
còng rÊt lín. VÝ dô mét ®o¹n ©m thanh 1 phót cã kÝch cì kho¶ng 10MB. HiÖn
nay cã nhiÒu ph−¬ng ph¸p nÐn ©m thanh kh¸c nhau nh− cã thÓ chia thµnh 2 lo¹i:
NÐn kh«ng mÊt th«ng tin
ThuËt ng÷ nÐn kh«ng mÊt th«ng tin ë ®©y ®−îc hiÓu theo nghÜa lµ mäi file
©m thanh nÐn ®Òu ®−îc gi¶i nÐn thµnh chÝnh ©m thanh gèc ®· ®−îc nÐn tr−íc ®ã.
- NÐn d¹ng entropy víi tØ lÖ: 1.5 ~3.0
- NÐn kiÓu LPAC víi tØ lÖ: 1.5 ~4.0
§©y lµ chuÈn nÐn kh«ng mÊt th«ng tin d¹ng sãng 8 bit, 16 bit, 20 bit hoÆc
24 bit (©m thanh ®¬n hoÆc ®a kªnh) ®−îc hç trî trong hÇu hÕt c¸c hÖ ®iÒu hµnh:
Windows, Linux vµ Solaris. Nã sö dông thuËt to¸n CRC ®¶m b¶o qu¸ tr×nh xö lý,
truyÒn ph¸t kh«ng mÊt th«ng tin. Qu¸ tr×nh m· hãa nhanh trong thêi gian thùc
(4x-12x trªn m¸y 500 MHZ Pentium).
NÐn kh«ng mÊt th«ng tin lµ −u ®iÓm chÝnh cña ®Þnh d¹ng file LPAC so víi
c¸c ®Þnh d¹ng file ©m thanh nÐn mÊt th«ng tin th«ng dông hiÖn nay nh− MP3,
WMA, RealAudio. Ng−îc l¹i, viÖc sö dông thuËt to¸n nÐn mÊt th«ng tin cho ta
tû lÖ nÐn ©m thanh rÊt cao. MP3 víi tèc ®é 128 kbit/s cã tû lÖ nÐn lµ 11 trong
khi LPAC chØ ®¹t tû lÖ nÐn tõ 1,5 ®Õn 4 vµ phô thuéc hoµn toµn vµo d÷ liÖu ©m
thanh. VÝ dô nh− LPAC cã tû lÖ nÐn lµ 2 cho ©m thanh d¹ng nh¹c pop vµ 2,5 cho
lo¹i ©m nh¹c cæ ®iÓn. Khi sö dông ®Þnh d¹ng nÐn nµy rÊt cã thÓ chóng ta sÏ
nhËn ®−îc hoµn toµn ©m thanh d¹ng bit ®¬n trong qu¸ tr×nh nÐn vµ gi¶i nÐn file
©m thanh. HÇu hÕt c¸c ®Þnh d¹ng nÐn nguyªn thuû kh«ng mÊt th«ng tin kh¸c
nh− Zip, LZH, Gzip ®Òu cã tû lÖ nÐn lµ 1 (hoµn toµn kh«ng nÐn ®−îc file ©m
thanh)
LPAC ®−îc sö dông trong tr−êng hîp file ©m thanh cÇn ®¹t chÊt l−îng tèt
Trang 20
nhÊt trong qu¸ tr×nh ph¸t mµ ®Þnh d¹ng MP3 kh«ng ®¸p øng ®−îc. C¸c ®Þnh
Lý thuyết xử lý Video
d¹ng file LPAC cã ®u«i lµ .PAC ®−îc x©y dùng kh«ng mÊt th«ng tin vµ t−¬ng
thÝch víi mäi hÖ ®iÒu hµnh còng nh− bÊt kú qu¸ tr×nh xö lý ©m thanh nµo.
NÐn mÊt th«ng tin:
- NÐn kiÓu AAC (Advanced Audio Coding ) cã tØ lÖ nÐn: ~14lÇn ®−îc sö
dông trong MPEG-2/4
Ng−êi ta coi AAC lµ ®Þnh d¹ng nÐn ©m thanh cã chÊt l−îng tèt nhÊt trªn
Internet hay trªn c¸c ®−êng truyÒn b¨ng th«ng réng. AAC ®−îc sö dông réng r·i
trong c¸c m¸y h¸t tù ®éng vµ c¸c thiÕt bÞ ©m nh¹c kh¸c. Kh«ng nh÷ng thÕ, AAC
cßn ®−îc coi lµ c¬ së h¹ tÇng trong viÖc truyÒn ph¸t d÷ liÖu ©m thanh trªn
Internet. H·ng Liquid Audio dù ®Þnh ph¸t triÓn mét kü thuËt tiªn tiÕn nhÊt trong
viÖc xö lý ©m thanh ®Ó tÝch hîp vµo AAC trong n¨m tíi.
So s¸nh víi MP3 ng−êi ta thÊy r»ng kü thuËt AAC ®· gi¶m tíi 30% kh«ng
gian l−u tr÷ d÷ liÖu. Kü thuËt AAC ®¹t ®−îc ®iÒu nµy do ®· lo¹i trõ ®−îc tíi
90% tÝn hiÖu ©m thanh gèc mµ kh«ng hÒ ¶nh h−ëng tíi chÊt l−îng cña ©m thanh
®ã. AAC ®· chÝnh thøc trë thµnh ®Þnh d¹ng chuÈn quèc tÕ vÒ ©m thanh nh− c¸c
chuÈn kü thuËt MPEG-2 hay MPEG-4.
AAC lµ kü thuËt m· ©m thanh dïng cho viÖc ph¸t hµnh vµ ph©n phèi c¸c
s¶n phÈm ©m nh¹c. Kü thuËt AAC cho chÊt l−îng nÐn cao. C¸c kiÓm chøng ®éc
lËp nhau vÒ hiÖu qu¶ cña qu¸ tr×nh nÐn vµ gi¶i nÐn cho thÊy AAC h¬n h¼n c¸c
®Þnh d¹ng ©m thanh kh¸c nh− MP3 hay bÊt kú m· nÐn ©m
thanh trùc gi¸c nµo kh¸c. AAC cung cÊp 48 kªnh ©m thanh,
SinSin
vµ tèc ®é lªn tíi 96kHz.
- NÐn theo chuÈn MP3
Xung nhÞÞpp Xung nh
- NÐn kiÓu WMA cã tØ lÖ nÐn: ~15 lÇn ®−îc sö dông
lµm Audio trong Windows
R¨ng c−a
- TwinVQ cã tØ lÖ nÐn: ~18 lÇn ®−îc sö dông trong
MPEG-4
- NÐn kh«ng theo trùc gi¸c dïng ph−¬ng ph¸p nÐn ADPCM (Adaptive
Trang 21
Differential Pulse Code Modulation) cã tØ lÖ nÐn: ~4.0
Lý thuyết xử lý Video
6. T¹o ©m thanh
Ng−êi ta cã thÓ t¹o ®−îc c¸c d¹ng ©m thanh nh©n t¹o b»ng c¸ch x©y dùng
©m thanh dùa trªn c¸c ®å thÞ cña c¸c hµm to¸n häc.
T¹o ©m thanh d¹ng sãng h×nh Sin, h×nh xung nhÞp, h×nh r¨ng c−a...ViÖc t¹o
©m thanh nh©n t¹o nµy ®−îc øng dông trong rÊt nhiÒu trong c¸c ch−¬ng tr×nh trß
ch¬i gi¶i trÝ.
¢m thanh d¹ng kÝ hiÖu c¬ b¶n cã nghÜa lµ øng víi mét kho¶ng møc tÇn
sè ©m thanh nµo ®ã th× ng−êi ta m· ho¸ vµ chuyÓn thµnh mét ký hiÖu nh− c¸c
nèt nh¹c (®å, rª, mi, fa, son, la, si ...) Nã cã ®Æc ®iÓm d÷ liÖu ©m thanh kh«ng
chÝnh x¸c, chØ mang tÝnh gi¶i thÝch logic chóng ta cã thÓ thay ®æi ©m thanh
b»ng c¸ch thay ®æi c−êng ®é, thêi gian, vËn tèc.. ChÊt l−îng ©m thanh phô
thuéc vµo thiÕt bÞ ®Çu ra.
§Æc tr−ng cña lo¹i nµy lµ kÝch th−íc d÷ liÖu nhá ~1/1000 so víi d÷ liÖu
d¹ng sãng. ¢m thanh ë d¹ng nµy th−êng cã ®Þnh d¹ng MIDI. Nã ®−îc øng
dông trong c¸c nh¹c cô ®iÖn tö.
7. ¢m thanh 3D thùc
Tr−íc tiªn muèn cã ®−îc ©m thanh 3D
cÇn ph¶i cã mét thiÕt bÞ ghi, thu ®Æc biÖt.
ThiÕt bÞ nµy sÏ thu ©m thanh theo nhiÒu kªnh
kh¸c nhau vµ ë c¸c gãc ®é kh¸c nhau.
C¸ch m« pháng hay ph¸t l¹i ©m thanh
ng−êi ta th−êng sö dông hµm chuyÓn HRTF
HiÖn nay ng−êi ta øng dông rÊt réng r·i hµm HRTF ®Ó m« pháng vµ t¹o
©m thanh 3D tõ ©m thanh 2D
T¹o ©m thanh 3D ®−îc øng dông nhiÒu trong c¸c trß ch¬i m¸y tÝnh, hÖ
Trang 22
thèng nhµ h¸t nhá, häp tõ xa...
Lý thuyết xử lý Video
8. §Þnh d¹ng ©m thanh
§èi víi d÷ liÖu ©m thanh d¹ng sãng ch−a ®−îc xö lý
Ng−êi ta sö dông ®Þnh d¹ng WAV. §©y lµ ®Þnh d¹ng d÷ liÖu d¹ng sãng
®−îc sö dông trong m«i tr−êng Windows.
AIFF lµ ®Þnh d¹ng Audio dïng trong c¸c hÖ m¸y Macintosh, Amiga,
Silicon Graphics.
§èi víi d÷ liÖu ©m thanh d¹ng sãng ®· ®−îc nÐn
§Æc tr−ng nhÊt cña d÷ liÖu ©m thanh nµy lµ ®Þnh d¹ng MP3. MP3 cã chÊt
l−îng cao, ®ång thêi tû lÖ nÐn tèt. Nã ®−îc sö dông nhiÒu trong c¸c Êm phÈm
ph¸t hµnh trªn Interrnet.
D÷ liÖu d¹ng MIDI :
SMF lµ ®Þnh d¹ng theo chuÈn MIDI ®¹i diÖn cho sù m· ho¸ ©m thanh b»ng
Trang 23
ký hiÖu.
Lý thuyết xử lý Video
V. C¸c tham sè trong Video vµ audio
Trong thùc tÕ, chóng ta ph¶i sö dông video vµ audio víi c¸c môc ®Ýnh kh¸c
nhau trong c¸c m«i tr−êng kh¸c nhau do ®ã ®Æt c¸c tham sè cho video lµ rÊt cÇn
thiÕt. Nh÷ng tham sè nµy sÏ x¸c ®Þnh râ chÊt l−îng cña s¶n phÈm. VÝ dô khi
chóng ta muèn x©y dùng mét ch−¬ng tr×nh Video cho ®Üa CD, hoÆc DVD th×
chóng ta ph¶i cã c¸c lùa chän nÐn kh¸c so víi c¸c ch−¬ng tr×nh video x©y dùng
cho Web v× tèc ®é truyÓn tÝn hiÖu trong c¸c thiÕt bÞ CD hoÆc DVD lín h¬n rÊt
nhiÒu so víi tèc ®é truyÒn tÝn hiÖu trªn Internet .
1. C¸c tham sè cho Video
1.1 Compressor
Tham sè nµy x¸c ®Þnh c¸c kiÓu nÐn cña video. Th«ng th−êng c¸c kiÓu nµy dùa
vµo c¸c chuÈn nÐn kh¸c nhau ®−îc viÕt cho Video.
1.1.1 Video cho Window ng−êi ta th−êng sö dông c¸c kiÓu nÐn
sau
Microsoft RLE : KiÓu nµy dïng ®Ó nÐn c¸c frame cã kÝch cì lín vµ mµu
ph¼ng (c¸c ¶nh kh«ng cã chiÒu s©u), vÝ dô: ®Ó lµm c¸c phim ho¹t h×nh. KiÓu
nÐn nµy cã m· ®é dµi 8 bit dïng thuËt to¸n nÐn kh«ng mÊt th«ng tin RLE(Run
–Length-Encoding). ChÊt l−îng video cao.
(cid:190) Microsoft Video1: Dïng cho cho nÐn video d¹ng t−¬ng tù (analog video).
KiÓu m· nÐn nµy hç trî c¸c ®iÓm cã 8bit, 16 bit ®é s©u.
(cid:190) Indeo (R) video R3:2 : Sö dông ®Ó nÐn video 24 bit dïng cho ®Üa CD.
KiÓu nÐn nµy cã tû lÖ nÐn tèt h¬n, chÊt l−îng tèt h¬n, vµ tèc ®é hiÓn thÞ
(khi xem video) nhanh h¬n so víi kiÓu nÐn Microsoft Video1. Cho kÕt
qu¶ tèt nhÊt nÕu sö dông m· nÐn Indeo Video trªn d÷ liÖu video mµ tr−íc
®ã d÷ liÖu kh«ng bÞ nÐn víi tû lÖ cao. Khi sö dông lo¹i d÷ liÖu nµy ®Ó
hiÓn thÞ l¹i th× chóng ta cã thÓ so s¸nh c¸c m· nÐn nµy víi kiÓu nÐn
Trang 24
Cinepak.
Lý thuyết xử lý Video
(cid:190) Cinepak code by Radius: Sö dông ®Ó nÐn video 24 bit dïng cho CD-Rom
hoÆc Web. §©y lµ kiÓu nÐn ®¹t ®−îc tû lÖ nÐn cao h¬n vµ tèc ®é ph¸t l¹i
(gi¶i nÐn) nhanh h¬n so víi kiÎu nÐn video 1. Chóng ta cã thÓ ®Æt chÊt
l−îng h×nh ¶nh ®Ó cã thÓ hiÓn thÞ l¹i video tèt víi tèc ®é 30KBps. M·
Cinepak ®−îc hiÓn thÞ l¹i rÊt nhanh nh−ng khi nÐn mÊt rÊt nhiÒu thêi
gian. Nã kh«ng phï hîp cho viÖc so¹n th¶o video mµ chØ phï hîp cho
viÖc chuyÓn mét ®o¹n video thµnh kÕt qu¶ cuèi cïng.
(cid:190) Intel Indeo 5.10 ®−îc sö dông cho c¸c ®Þnh d¹ng Video ph©n t¸n trªn
m¹ng Internet cho c¸c m¸y tÝnh cã bé xö lý MMX or Pentium II. §©y lµ
kiÓu nÐn cã ®Æc tr−ng: lùa chän nÐn nhanh, mÒm dÎo. KiÓu nÐn nµy cho
phÐp ng−êi xö lý video cã thÓ ®iÒu chØnh viÖc hiÓn thÞ video ®èi víi c¸c
b¨ng th«ng kh¸c nhau. VÝ dô cã thÓ ®iÒu chØnh ®Ó video cã thÓ
download víi modem 56KB, 28,8KB hay ®−êng c¸p m¹ng... M· nÐn nµy
®−îc thiÕt kÕ ®Ó lµm viÖc phï hîp víi m· Intel Audio Software.
(cid:190) Intel Indeo Video Raw R1.1: ®−îc sö dông tèt nhÊt cho viÖc thu c¸c
th«ng tin Video ë d¹ng d÷ liÖu kh«ng nÐn. Nã lµm viÖc cïng víi thiÕt bÞ
Intel video-capture cards. M· nÐn nµy cung cÊp c¸c h×nh ¶nh chÊt l−îng
cao. C¸c tÖp video dïng lùa chän nµy cã kÝch cì nhá h¬n c¸c tÖp kh«ng
dïng lùa chän v× ë kiÓu nµy mµu s¾c ®· ®−îc chuyÓn tõ model RGB
thµnh model YUV .
(cid:190) Intel Indeo Video Interactive: ®©y lµ kiÓu nÐn t−¬ng tù nh− ®Þnh d¹ng
5.10 nh−ng nã cã mét sè hç trî cho c¸c ®Æc tÝnh trong suèt, nhiÒu ®èi
t−îng chuyÓn ®éng.. trong video. Nã ®−îc hç trî bëi c¸c phÇn mÒm tiÖn
Ých cña Intel.
1.1.2 Video cho Macintosh th−êng sö dông c¸c kiÓu nÐn.
(cid:190) Component video: §−îc sö dông cho thu video, l−u tr÷ video hay t¹o c¸c
®o¹n video trung gian (t¹m thêi). KiÓu nÐn nµy cã tû lÖ nÐn rÊt thÊp do
Trang 25
®ã chiÕm rÊt nhiÒu kh«ng gian ®Üa
Lý thuyết xử lý Video
(cid:190) Graphics: ®−îc sö dông cho viÖc nÐn c¸c ¶nh chÊt l−îng cao víi ®é s©u
mµu 8 bÝt. M· nÐn (Graphics codec) nµy th−êng sö dông cho c¸c ¶nh tÜnh
nh−ng ®«i khi còng sö dông cho viÖc nÐn video bëi v× m· nÐn nµy kh«ng
®¹t ®−îc tû lÖ nÐn cao. Nã thÝch hîp cho c¸c tÖp video ®−îc ch¹y (l−u
tr÷) trªn ®Üa cøng chø kh«ng phï hîp víi c¸c tÖp video ®Æt trªn CD-ROM
(cid:190) Video: ®−îc sö dông cho viÖc thu vµ nÐn c¸c tÝn hiÖu video cã nguån ë
d¹ng Analog. M· nÐn nµy cho kÕt qu¶ cao khi xem l¹i c¸c tÖp video
®−îc l−u tr÷ trªn æ ®Üa cøng. Cho chÊt l−îng võa ph¶i nÕu xem trªn CD-
ROM. Nã hç trî c¶ hai lo¹i nÐn: nÐn theo kh«ng gian vµ nÐn theo thêi
gian cho video 16 bÝt. D÷ liÖu cã thÓ nÐn l¹i hoÆc dÞch l¹i sau khi nÐn víi
tû lÖ cao h¬n mµ chÊt l−îng kh«ng suy gi¶m.
(cid:190) Animation: §−îc sö dông cho viÖc nÐn c¸c khu«n h×nh cã vïng mµu cã
kÝch cì lín. VÝ dô: c¸c khu«n h×nh cho phim ho¹t h×nh. M· nÐn mµu cho
phÐp thay ®æi tû lÖ nÐn. Víi tû lÖ nÐn lµ 100%, video kh«ng bÞ nÐn. NÕu
tû lÖ d−íi 100% tÖp video bÞ nÐn ë d¹ng mÊt th«ng tin. M· nÐn
Animation dùa trªn lý thuyÕt nÐn cña Apple vµ thuËt to¸n nÐn RLE.
(cid:190) Motion JPEGA and Motion JPEG: ®−îc dïng cho môc ®Ých chuyÓn m·
video vÝ dô nh− chuyÓn c¸c tÖp video trong m¸y tÝnh, c¸c ®o¹n video
trªn b¨ng ra c¸c thiÕt bÞ kh¸c cña mµy tÝnh nh− ®Üa CD ... th«ng qua
thiÕt bÞ thu video (video-capture card). C¸c m· nÐn nµy ®−îc hç trî
nhiÒu trong c¸c chÝp cã trªn c¸c thiÕt bÞ thu video nh− video-capture card
do ®ã tèc ®é xö lý rÊt nhanh.
(cid:190) Photo–JPEG: kiÓu nÐn nµy ®−îc dïng ®Ó nÐn c¸c ¶nh tÜnh cã mµu s¾c
biÕn ®æi dÇn ( c¸c ®−êng biªn kh«ng râ nÐt). §©y lµ kiÓu nÐn mÊt th«ng
tin nh−ng cã thÓ ®Æt ®−îc tham sè nÐn ®Ó ¶nh cã chÊt l−îng r¸t cao. M·
nÐn Photo-JPEG lµ kiÓu nÐn ®èi xøng theo thêi gian nh−ng thêi gian nÐn
rÊt l©u. C¸c ¶nh ®· ®−îc nÐn theo kiÓu nµy th× kh«ng nªn dïng lµm
nguån ®Ó so¹n th¶o v× nã ®· bÞ mÊt th«ng tin. Tuy nhiªn nã cã tû lÖ nÐn
cao vµ chÊt l−îng ¶nh tèt nªn cã thÓ dïng ®Ó l−u tr÷ hoÆc ®Ó di chuyÓn
Trang 26
gi÷a c¸c hÖ thèng m¸y tÝnh.
Lý thuyết xử lý Video
(cid:190) Chó ý: rÊt nhiÒu phÇn cøng nÐn (hardware compression ) sö dông ®Þnh
d¹ng JPEG. Víi phÇn mÒm QuickTime cã thÓ ch−a cã trong danh s¸ch
c¸c m· nÐn v× vËy kh«ng hiÓn thÞ ®−îc c¸c tÖp video. Chóng ta cÇn cÇn
thªm m· nÐn cña phÇn cøng ®ã vµo danh s¸ch m· nÐn cho QuickTime.
(cid:190) H.263: Sö dông t¹o c¸c video cho héi th¶o. M· nÐn nµy cã tû lÖ nÐn thÊp.
Kh«ng nªn sö dông chuÈn nµy cho so¹n th¶o video th«ng th−êng.
(cid:190) DV - PAL and DV – NTSC : Sö dông m· nµy t¹o video sè theo chuÈn
PAL vµ NTSC. M· nÐn nµy dïng ®Ó t¹o c¸c tÖp video víi ®Þnh d¹ng PAL,
NTSC phôc vô in ra b¨ng theo c¸c hÖ trªn hoÆc ng−îc l¹i lÊy tõ b¨ng vµo
m¸y tÝnh th«ng qua digital-video capture card. ChuÈn nÐn nµy rÊt h÷u
dông cho viÖc chuyÓn d÷ liÖu video tõ hÖ thèng m¸y tÝnh nµy sang hÖ
thèng kh¸c hoÆc tõ thiÕt bÞ nµy sang thiÕt bÞ kh¸c.
(cid:190) Cinepak : ®−îc sö dông ®Ó nÐn video 24 bit. C¸c tÖp sö dông kiÓu nÐn
nµy ®Ó dïng cho CD-ROM vµ Web video. M· nÐn nµy cã tû lÖ nÐn cao vµ
tèc ®é gi¶i nÐn nhanh. Cinepak dung thuËt to¸n nÐn kh«ng ®èi xøng c¸c
tÖp video cã kÝch cì nhá nh−ng thêi gian nÐn rÊt l©u. Cho kÕt qu¶ tèt nhÊt
nÕu dïng m· nÐn nµy ®Ó t¹o tÖp video kÕt qu¶.
(cid:190) Sorenson Video : ®−îc sö dông ®Ó nÐn video 24 bit. C¸c tÖp sö dông kiÓu
nÐn nµy ®Ó dïng cho CD-ROM vµ Web video. Nã còng gièng nh− kiÓu
nÐn Cinepak nh−ng ®©y lµ kiÓu nÐn míi thiÓt kÕ ®Ó nÐn víi chÊt l−îng
cao. M· nÐn nµy cho h×nh ¶nh tèt h¬n, kÝch cì tÖp video nhá h¬n so víi
kiÓu Cinepak v× vËy nã phï hîp cho viÖc t¹o c¸c tÖp video cuèi cïng chø
kh«ng phï hîp cho so¹n th¶o.
(cid:190) Planar RGB: m· nÐn nµy ®−îc sö dông hiÖu qu¶ cho c¸c khu«n h×nh cã
vïng mµu ®Æc nh− c¸c tÖp Animation. Nã sö dông thuËt to¸n nÐn RLE
kÕt hîp víi kü thuËt t¹o m· animation (Animation codec).
§èi víi c¸c thiÕt bÞ phÇn cøng hç trî so¹n th¶o Video th−êng cã c¸c kiÓu nÐn
Trang 27
riªng ®−îc viÕt bëi nhµ s¶n xuÊt thiÕt bÞ phÇn cøng.
Lý thuyết xử lý Video
1.2 Depth
Tham sè nµy x¸c ®Þnh ®é s©u mµu hay sè mµu cña video khi hiÓn thÞ.
(cid:138) NÕu ®é s©u mµu cã gi¸ trÞ lµ 8 bit tøc lµ ®o¹n Video ®−îc thÓ hiÖn ë
chÕ ®é 256 mµu
(cid:138) NÕu ®é s©u mµu cã gi¸ trÞ lµ 24 bit tøc lµ ®o¹n Video ®−îc thÓ hiÖn
ë chÕ ®é 16 triÖu mµu.
(cid:138) NÕu ®é s©u mµu cã gi¸ trÞ trªn 24 bit tøc lµ ®o¹n Video ®−îc thÓ hiÖn
ë chÕ ®é trªn 16 triÖu mµu.
1.3 Frame size
Tham sè nµy x¸c ®Þnh kÝch cì cña khung h×nh tÝnh b»ng Pixel. Tham sè
nµy ¶nh h−ëng rÊt lín ®Õn kÝch cì cña tÖp video vµ thêi gian xö lý video khi
so¹n th¶o.
Khi ®Æt kÝch th−íc cho frame chóng ta ph¶i chó ý ®Õn tham sè Aspect. Tham
sè nµy lµ hÖ sè co hay tû lÖ co trong ®å ho¹ m¸y tÝnh. Gi¸ trÞ cña nã lµ trÞ sè
gi÷a kÝch th−íc theo chiÒu ngang vµ kÝch th−íc theo chiÒu däc cña mét khu«n
h×nh. Khi thay ®æi cì h×nh ph¶i duy tr× tû lÖ réng/cao ®Ó tr¸nh mÐo h×nh.
(cid:138) §èi víi chuÈn Video NTSC ng−êi ta th−êng sö dông kÝch cì theo tØ lÖ
720x480
(cid:138) §èi víi chuÈn Video PAL ng−êi ta th−êng sö dông kÝch cì theo tØ lÖ
4:3
1.4 Frame Rate
Tham sè nµy x¸c ®Þnh sè khung h×nh trong mét gi©y khi hiÓn thÞ Video. Tham
sè nµy ¶nh h−ëng lín ®Õn tèc ®é xö lý cña m¸y tÝnh khi hiÓn thÞ. Chóng cã mét
tÖp Video ®−îc so¹n th¶o ë chÕ ®é 24 h×nh trªn gi©y khi ®−îc hiÓn thÞ ë tèc ®é
12 h×nh trªn gi©y th× chóng ta cã c¶m gi¸c nh− c¸c c¶nh video bÞ chËm lai. Vµ
ng−îc l¹i nÕu chóng ta hiÓn thÞ tÖp Video ®ã ë chÕ ®é 48 h×nh trªn gi©y th×
Trang 28
c¶nh video sÏ chuyÓn ®éng nhanh gÊp ®«i.
Lý thuyết xử lý Video
1.5 Time base
Tham sè nµy x¸c ®Þnh sè khung h×nh trong chÕ ®é so¹n th¶o trong 1 gi©y.
(cid:190) Khi so¹n th¶o Video ë chÕ ®é NTSC th× chóng ta cã thÓ ®Æt gi¸ trÞ nµy
b»ng 29,97 h×nh (trªn gi©y). Khi ph¸t l¹i ®o¹n Video nµy theo chuÈn
NTSC th× chóng ta sÏ ®−îc chÊt l−îng tèt nhÊt .
(cid:190) Khi so¹n th¶o Video ë chÕ ®é PAL hay SECAM th× chóng ta cã thÓ ®Æt
gi¸ trÞ nµy b»ng 25 h×nh (trªn gi©y). Khi ph¸t l¹i ®o¹n Video nµy theo
chuÈn PAL th× chóng ta sÏ ®−îc chÊt l−îng tèt nhÊt .
(cid:190) Khi so¹n th¶o Video cho c¸c kiÓu kh¸c th× chóng ta cã thÓ ®Æt gi¸ trÞ
nµy b»ng 30 h×nh (trªn gi©y).
1.6 Quality
Tham sè nµy x¸c ®Þnh chÊt l−îng cña c¸c khung h×nh theo mét chuÈn nÐn
x¸c ®Þnh. Gi¸ trÞ cña tham sè nµy ¶nh h−ëng lín ®Õn chÊt l−îng cña khu«n
h×nh còng nh− kÝch cì cña tÖp Video. NÕu chÊt l−îng thÊp th× kÝch cì tÖp video
nhá. NÕu chÊt l−îng cao th× kÝch cì cña tÖp video lín. Mét sè tr−êng hîp ®Æc
biÖt, trong mét sè chuÈn nÐn kh«ng ®Æt ®−îc tham sè cho chÊt l−îng.
1.7 Data Rate
Tham sè nµy x¸c ®Þnh giíi h¹n cña tèc ®é truyÒn d÷ liÖu cña tÖp Video ra
mµn h×nh hiÓn thÞ. Gi¸ trÞ nµy ®−îc tÝnh b»ng Kilobit / gi©y (Kbps). Mét sè
chuÈn nÐn cho phÐp thay ®æi tham sè nµy. Khi ®Æt tham sè Data rate cÇn ph¶i
chó ý ®Õn tèc ®é truyÒn d÷ liÖu cña hÖ thèng (kh«ng dÆt tham sè nµy cao h¬n
Trang 29
tèc ®é truyÒn d÷ liÖu cña hÖ thèng).
Lý thuyết xử lý Video
2. C¸c tham sè cho Audio
2.1 Rate
Tham sè nµy x¸c ®Þnh d¶i tÇn sè cña Audio. Nã x¸c ®Þnh chÊt l−îng ©m
thanh khi ph¸t l¹i. Th«ng th−êng tham sè nµy cao th× chÊt l−îng ©m thanh sÏ
tèt h¬n nh−ng kÌm theo ®ã lµ kÝch cì cña tÖp Video-Audio còng sÏ t¨ng lªn
®¸ng kÓ. Khi ®Æt tham sè nµy trong chÕ ®é so¹n th¶o Video-Audio chóng ta
còng cÇn ph¶i chó ý ®Õn tÇn sè ®Çu vµo cña c¸c tÖp Video-Audio. C¸ch tèt nhÊt
lµ ®Æt tham sè nµy b»ng víi tÇn sè ®Çu vµo.
§èi víi hÖ thèng Windows hoÆc Macintosh c¸c gi¸ trÞ cã thÓ ®Æt lµ :
5000Hz, 8000Hz, 11025 Hz, 32000Hz, 44100Hz, 48000 Hz
2.2 Format
Sè bÝt ®Ó m· ho¸ ©m thanh cµng cao th× chÊt l−îng ©m thanh cµng cao vµ
kÝch cì tÖp Video-Audio cµng lín. Cã 4 ®Þnh d¹ng chÝnh:
(cid:138) 8 bit – Mono ( ©m thanh ®¬n, 1 kªnh ©m thanh )
(cid:138) 16 bit – Mono
(cid:138) 8 bit – Stereo ( ©m thanh næi, nhiÒu kªnh ©m thanh)
(cid:138) 16 bit – Stereo
2.3 Compressor
Tham sè nµy x¸c ®Þnh c¸c kiÓu nÐn cho audio. Nã quyÕt ®Þnh chÊt l−îng
cóng nh− ®é lín cña tÖp ©m thanh.
2.3.1 §èi víi hÖ thèng Window ng−êi ta th−êng sö dông c¸c kiÓu
nÐn ©m thanh sau
(cid:190) Intel Audio Software codec: KiÓu nÐn nµy sö dông cho nh¹c vµ lêi nãi
trªn Internet. Kh¶ n¨ng nÐn tèi ®a lµ 8:1. M· nÐn nµy ®−îc thiÕt kÕ ®Ó
Trang 30
lµm viÖc víi ch−¬ng tr×nh Intel Video Software .
Lý thuyết xử lý Video
(cid:190) TrueSpeech : KiÓu nÐn nµy sö dông cho nãi chuyÖn trªn m¹ng Internet
víi tèc ®é truyÒn thÊp.
(cid:190) Microsoft GSM 6.10: Sö dông cho telephone trªn Internet ë ch©u ©u.
(cid:190) MS-ADPCM (Microsoft implementation of Adaptive Differential Pulse
Code Modulation ) kiÓu nÐn nµy sö dông ®Ó t¹o c¸c tÖp audio cã chÊt
l−îng cao ghi trªn ®Üa CD-ROM. KiÓu nÐn nµy ®−îc sö dông réng r·i.
(cid:190) Microsoft IMA ADPCM: kiÓu nÐn nµy ®−îc sö dông t¹o c¸c tÖp audio
cho c¸c s¶n phÈm multimedia. KiÓu nÐn nµy dùa trªn m· nÐn ADPCM
®−îc ph¸t triÓn bëi IMA(Interactive Multimedia Association ).
(cid:190) Lucent Technologies SX8300P: kiÓu nÐn nµy sö dông cho giao tiÕp trªn
Internet tèc ®é thÊp
(cid:190) elemedia TM AX2400P: kiÓu nÐn nµy ®−îc sö dông t¹o c¸c tÖp ©m nh¹c
chÊt l−îng cao trªn Internet
(cid:190) Voxware Audio Codecs: kiÓu nÐn nµy sö dông cho c¸c tÖp ©m thanh d¹ng
tiÕng nãi trªn Internet tèc ®é thÊp
2.3.2 §èi víi hÖ thèng Macintosh ng−êi ta th−êng sö dông c¸c kiÓu
nÐn ©m thanh sau
(cid:190) mLaw 2:1 : kiÓu nÐn nµy ®−îc sö dông cho viÖc chuyÓn c¸c tÖp audio ®Ó
sö dung tèt víi c¸c øng dông trªn c¸c m¸y tr¹m. Tai ®ã mLaw lµ ®Þnh
d¹ng audio chuÈn . mLaw ®−îc dö dông cho telephone sè ë B¾c Mü vµ
Japan
(cid:190) 16-bit Big Endian vµ 16-bit Little Endian: kiÓu nÐn nµy ®−îc sö dông cho
c¸c phÇn cøng vµ phÇn mÒm chuyªn dông nh−ng th«ng th−êng nã kh«ng
Trang 31
tèt cho viÖc so¹n th¶o.
Lý thuyết xử lý Video
(cid:190) 24-bit Integer vµ 32-bit Integer: kiÓu nÐn nµy ®−îc sö dông cho audio
24-bit hoÆc 32-bit nguyªn. m· nÐn nµy ®−îc sö dông tèt cho c¸c phÇn
cøng vµ phÇn mÒm chuyªn dông nh−ng th«ng th−êng nã kh«ng tèt cho
viÖc so¹n th¶o.
(cid:190) IMA 4:1: kiÓu nÐn nµy ®−îc sö dông cho c¸c tÖp audio t¹i c¸c tr¹m.
IMA 4:1 ®−îc ph¸t triÓn bëi IMA sö dông m· ADPCM.
(cid:190) 32-bit Floating vµ 64-bit Floating: C¸c kiÓu nÐn nµy ®−îc sö dông trong
c¸c thiÕt bÞ phÇn cøng vµ phÇn mÒm chuyªn dông nh−ng th«ng th−êng
kh«ng sö dông cho so¹n th¶o Video.
(cid:190) ALaw 2:1: gièng mLaw nh−ng ®−îc sö dông cho telephone sè ë Ch©u
©u
(cid:190) QDesign Music Codec: Sö dông ®Ó nÐn c¸c tÖp audio chÊt l−îng cao sö
dông trªn Internet. ChÊt l−îng cña nã t−¬ng ®−¬ng c¸c tÖp ©m thanh trªn
CD-ROM cã ®Þnh d¹ng 16-bit, 44.1 kHz. C¸c tÖp ©m thanh ®−îc nÐn
theo kiÓu nµy cã thÓ nghe trùc tiÕp b»ng ®−êng Internet cã tèc ®é 28.8
Kbps.
(cid:190) Qualcomm PureVoice: §©y lµ kiÓu nÐn ®−îc thiÕt kÕ t¹o c¸c tÖp ©m
thanh tèt nhÊt ë tÇn sè 8 kHz. C¬ së cña kiÓu nÐn nµy dùa trªn thuËt to¸n
nÐn chuÈn cña Telephone CDMA ( Code Division Multiple Access )
(cid:190) MACE 3:1 and MACE 6:1 :kiÓu nÐn nµy ®Ó t¹o c¸c tÖp audio th«ng
th−êng cho hÖ ®iÒu hµnh Macintosh. Nã dùa trªn thuËt to¸n nÐn ©m
thanh MACE (Macintosh Audio Compression and Expansion codec ).
KiÓu nÐn MACE 3:1 cã tû lÖ nÐn thÊp h¬n kiÓu nÐn MACE 6:1 nh−ng
cã chÊt l−îng cao h¬n
2.4 Data Rate
Tham sè nµy x¸c ®Þnh giíi h¹n cña tèc ®é truyÒn d÷ liÖu cña tÖp Audio khi
Trang 32
ph¸t l¹i. Gi¸ trÞ nµy ®−îc tÝnh b»ng Kilobit/gi©y (Kbps).
Lý thuyết xử lý Video
ChuyÓn ®æi d÷ liÖu tõ video, b¨ng, ®Üa CD thµnh c¸c tÖp Video-Audio cho
m¸y tÝnh vµ ng−îc l¹i
3. C¸c cæng chuyÓn ®æi tÝn hiÖu
Chóng ta cã thÓ chuyÓn d÷ liÖu tõ nhiÒu nguån video kh¸c nhau, cã thÓ
lµ b¨ng (tape), tËp hîp c¸c ¶nh liªn tiÕp (t¹o thµnh film) cña mét c¶nh, tõ ¶nh
®éng, ho¹t h×nh, audio,…thµnh c¸c tÖp Video-Audio vµ ®−îc l−u tr÷ trªn m¸y
tÝnh.
Digital media ®©y lµ c¸c ph−¬ng tiÖn sè. C¸c ph−¬ng tiÖn sè cã thÓ lµ c¸c
thiÕt bÞ thu, ph¸t tÝn hiÖu sè nh− m¸y quay sè, m¸y ¶nh sè.... C¸c thiÕt bÞ nµy
l−u c¸c tÝn hiÖu Video-Audio ë d¹ng sè vµ cã ®Þnh d¹ng theo c¸c chuÈn mµ
m¸y tÝnh cã thÓ ®äc vµ xö lý trùc tiÕp ®−îc.
Analog media: ®©y lµ c¸c ph−¬ng tiÖn l−u d÷ liÖu d−íi d¹ng tÝn hiÖu
t−¬ng tù. C¸c thiÕt bÞ nµy th−êng lµ c¸c thiÕt bÞ truyÒn thèng vÝ dô nh− m¸y
quay th−êng, m¸y ¶nh th−êng.... Nh− vËy muèn xö lý c¸c d÷ liÖu nµy b»ng m¸y
tÝnh th× chóng ta ph¶i sè ho¸ c¸c d÷ liÖu nµy. Th«ng th−êng, ng−êi ta sö dông
c¸c thiÕt bÞ phÇn cøng (video capture board) ®Ó thùc hiÖn viÖc sè ho¸ c¸c tÝn
hiÖu Analog.
C¸c cæng kÕt nèi tõ c¸c m¸y ph¸t tÝn hiÖu video vµo m¸y tÝnh:
Cæng vµo ra tÝn hiÖu Video-Audio d¹ng t−¬ng tù th«ng th−êng:
(cid:138) Cæng S-video
Trang 33
(cid:138) Cæng ®a hîp (composite video).
Lý thuyết xử lý Video
NÕu dïng cæng ®a hîp ng−êi ta cã thÓ ®iÒu chØnh ®Ó thu: chØ tÝn hiÖu h×nh
A lµ cæng S-video , B lµ cæng ®a hîp
¶nh hoÆc chØ thu tÝn hiÖu ©m thanh hoÆc c¶ h×nh ¶nh vµ ©m thanh víi ®Çy ®ñ tÝn
hiÖu video (left, right).
C¸c thiÕt bÞ thu tÝn hiÖu t−¬ng tù vµ chuyÓn thµnh d¹ng sè th−êng sö dông
c¸c cæng nµy ®Ó trao ®æi th«ng tin vÝ dô thiÕt bÞ DV500, DC2000, TV Capture
board ®Òu cã s½n c¸c cæng nµy ®Ó trao ®æi tÝn hiÖu Video-Audio d¹ng t−¬ng tù
Cæng vµo ra tÝn hiÖu Video-Audio sè th«ng th−êng:
Cæng IEEE 1394
Th«ng th−êng ®Ó trao ®æi th«ng tin gi÷a c¸c m¸y ph¸t tÝn hiÖu Video-
Audio vµ m¸y tÝnh ng−êi ta sö dông cæng IEEE 1394. C¸c thiÕt bÞ sè nh− m¸y
quay sè, m¸y ¶nh sè, c¸c thiÕt bÞ chuyÓn c¸c d÷ liÖu Video-Audio sè vµo m¸y
tÝnh nh− Card VD500, DC2000... ®Òu cã s½n cæng nµy. C¸c thiÕt bÞ hç trî
viÖc trao ®æi tÝn hiÖu Video-Audio sè qua cæng nµy cã tèc ®é rÊt cao ®¶m b¶o
viÖc thu vµ hiÓn thÞ Video-Audio sè trong thêi gian thùc.
4. Thu tÝn hiÖu tõ c¸c thiÕt bÞ ph¸t Video-Audio vµo m¸y tÝnh
4.1 Thu tÝn hiÖu d¹ng t−¬ng tù
4.1.1 Yªu cÇu phÇn cøng
NhÊt thiÕt cÇn cã thiÕt bÞ giao tiÕp gi÷a m¸y tÝnh vµ m¸y ph¸t tÝn hiÖu
Trang 34
Video-Audio d¹ng t−¬ng tù. ThiÕt bÞ ®ã cã thÓ lµ TV card, hay DV500... cã
Lý thuyết xử lý Video
cæng giao tiÕp lµ S-video hay Composite video. ThiÕt bÞ nµy ®−îc cµi ®Æt trªn
m¸y tÝnh vµ ®−îc hÖ thèng (Windows, Macintosh..) hç trî.
M¸y ph¸t tÝn hiÖu Video-Audio d¹ng t−¬ng tù. Nã cã thÓ lµ Video-
Cassette, m¸y quay video, thiÕt bÞ thu tÝn hiÖu tõ c¸c ®µi ph¸t hay vÖ tinh nh−
Angten...
M¸y tÝnh tèc ®é cao, cã bé nhí (RAM) lín, kh«ng gian ®Üa cøng (HDD)
lín vµ Card video cã bé nhí lín. D©y c¸p nèi c¸c thiÕt bÞ Video-Audio víi m¸y
tÝnh.
4.1.2 Yªu cÇu phÇn mÒm
M¸y tÝnh ph¶i ®−îc cµi ®Æt c¸c phÇn mÒm hç trî thiÕt bÞ giao tiÕp vµ cã
thÓ c¶ c¸c ch−¬ng tr×nh so¹n th¶o Video-Audio. VÝ dô nh− ch−¬ng tr×nh Ulead,
Adobe Premiere...
4.1.3 C¸c tham sè cho c«ng viÖc thu Video-Audio d¹ng t−¬ng tù
KÝch cì cña khu«n h×nh : NÕu c¸c tÝn hiÖu thu ®−îc ®−îc ghi víi ®Þnh
d¹ng Quick time th× chóng ta ®Æt khu«n h×nh theo tû lÖ 4:3. NÕu c¸c tÝn hiÖu thu
®−îc ®−îc ghi víi ®Þnh d¹ng Video cho Windows th× chóng ta cã thÓ ®Æt kÝch
th−íc khu«n h×nh bÊt kú.
Tèc ®é cña khu«n h×nh: chóng ta cÇn ®Æt tèc ®é cña khu«n h×nh phï hîp
víi hÖ cña Video khi ph¸t. NÕu lµ hÖ NTSC th× chóng ta ®Æt tèc ®é lµ 29,97
khu«n h×nh trong 1 gi©y (fps). NÕu lµ hÖ PAL hay SECAM th× chóng ta ®Æt tèc
®é lµ 25 fps.
4.2 Thu tÝn hiÖu d¹ng sè
Trang 35
§Ó thu c¸c tÝn hiÖu Video-Audio sè th× chóng ta cÇn cã c¸c yªu cÇu sau:
Lý thuyết xử lý Video
4.2.1 Yªu cÇu vÒ phÇn cøng
GÇn gièng nh− c¸c yªu cÇu phÇn cøng ®Ó thu c¸c tÝn hiÖu d¹ng t−¬ng tù
nh−ng trªn thiÕt bÞ giao tiÕp (card DC2000, DV300, DV500...) ph¶i cã cæng
giao tiÕp IEEE 1394.
4.2.2 Yªu cÇu phÇn mÒm
Gièng hoµn toµn nh− c¸c yªu cÇu ®Ó thu c¸c tÝn hiÖu d¹ng t−¬ng tù.
4.2.3 §Æt c¸c tham sè cho c«ng viÖc thu Video-Audio d¹ng sè
KÝch cì cña khu«n h×nh : ®Æt kÝch cì cña khu«n phï hîp víi tû lÖ cña
khu«n h×nh trªn c¸c thiÕt bÞ ph¸t. VÝ dô nÕu khu«n h×nh trªn m¸y ph¸t digital
camera lµ 720x480 dpi th× chóng ta cã thÓ ®Æt kÝch cì khu«n h×nh khi thu lµ
720x480 hoÆc 360x240... NÕu ®Æt nh− vËy th× tÖp video thu ®−îc sÏ ®−îc ®¶m
b¶o vÒ chÊt l−îng.
Tèc ®é cña khu«n h×nh: chóng ta cÇn ®Æt tèc ®é cña khu«n h×nh phï hîp
víi hÖ cña Video khi ph¸t.
§Æt d¶i tÇn sè ©m thanh: Chóng ta ph¶i ®Æt d¶i tÇn sè ©m thanh phï hîp
víi hÖ cña Video. Th«ng th−êng DV audio th−êng sö dông kiÓu 16bit Stereo.
§èi víi hÖ c¸c m¸y ph¸t video sè (digital camera) sö dông hÖ NTSC hoÆc PAL
chóng ta ®Æt d¶i tÇn cho audio lµ 32kHz hoÆc 48 kHz. Tuy nhiªn trong mét sè
tr−êng hîp ®Æc biÖt mét sè m¸y ph¸t video sè sö dông d¶i tÇn Audio 44.1kHz
v× vËy khi thu chóng ta ph¶i ®Æt theo gi¸ trÞ nµy.
5. ChuyÓn ®æi d÷ liÖu Video-Audio thµnh c¸c ®Þnh d¹ng kh¸c
nhau
Sau khi chóng ta ®· n¹p ®−îc c¸c d÷ liÖu Video-Audio vµo m¸y tÝnh
chóng ta cã thÓ söa ®æi d÷ liÖu ®ã phï hîp víi môc ®Ých vµ yªu cÇu ®Æt ra. Sau
khi ®· cã ®−¬c c¸c ®o¹n Video-Audio sè phï hîp chóng ta ph¶i chuyÓn chóng
thµnh c¸c tÖp Video-Audio theo c¸c ®Þnh d¹ng kh¸c nhau hoÆc ghi ra b¨ng, ®Üa
Trang 36
CD.
Lý thuyết xử lý Video
5.1 ChuyÓn c¸c ®o¹n Video-Audio sè ®· ®−îc xö lý trªn m¸y tÝnh
ra b¨ng, ®Üa
5.1.1 Yªu cÇu vÒ thiÕt bÞ
Trong tr−êng hîp nµy c¸c yªu cÇu t−¬ng tù nh− yªu cÇu vÒ thiÕt bÞ khi thu
tÝn hiÖu Video-Audio vµo m¸y tÝnh. §ã lµ: thiÕt bÞ giao tiÕp gi÷a m¸y tÝnh vµ
m¸y thu tÝn hiÖu Video-Audio (Cã thÓ thiÕt bÞ lµ card DV300. DV500, TV
Capture board... . ), m¸y tÝnh cã tèc ®é cao, m¸y thu tin hiÖu Video-Audio
(video cassette, Video camera..).
5.1.2 §Æt c¸c tham sè cho ®o¹n Video-Audio khi in ra b¨ng
Tû lÖ khu«n h×nh: Khi in ra b¨ng theo hÖ nµo th× chóng ta ph¶i ®Æt tû sè
gi÷a ®é réng vµ chiÒu cao khu«n h×nh theo ®óng hÖ ®ã. VÝ dô nÕu chóng ta
®Þnh in ra b¨ng theo hÖ NTSC th× ®Æt khu«n h×nh theo tû lÖ 720x480. NÕu
muèn chÊt l−îng h×nh ¶nh trªn b¨ng cao th× chóng ta cã thÓ ghi ë chÕ ®é toµn
mµn h×nh.
Tèc ®é khu«n h×nh (rate): Tèc ®é khu«n h×nh ph¶i ®Æt theo tèc ®é khu«n
h×nh cña hÖ thèng thu. §èi víi hÖ PAL ph¶i ®Æt tèc ®é khu«n h×nh lµ 25 h×nh
trªn gi©y, hÖ NTSC lµ 29,97 h×nh trªn gi©y.
§Æt d¶i tÇn sè cho audio : Gi¸ trÞ nµy ph¶i phï hîp víi d¶i tÇn sè ©m
thanh cña hÖ. HÇu hÕt c¸c DV camera ®Òu sö dông d¶i tÇn 32KHz hoÆc
48KHz.
Lùa chän kiÓu nÐn vµ ®Æt chÊt l−îng Video-Audio: NÕu chóng ta in ra
b¨ng th× nªn lùa chän kiÓu nÐn cã chÊt l−îng cao nhÊt. Th«ng th−êng ng−êi ta
lùa chän kiÓu nÐn theo thiÕt bÞ phÇn cøng (c¸c Card chuyÓn ®æi tÝn hiÖu).
5.1.3 Lùa chän c¸c ®Þnh d¹ng tÖp trung gian tr−íc khi in ra b¨ng
Trong tr−êng hîp chóng ta kh«ng ghi trùc tiÕp ®−îc ra b¨ng th× sau khi ®·
Trang 37
®Æt c¸c th«ng sè cho tÖp Video-Audio kÕt qu¶ chóng ta sÏ ghi kÕt qu¶ ®ã ra ®Üa
Lý thuyết xử lý Video
cøng víi ®Þnh d¹ng AVI vµ MOV. Sau ®ã chóng ta ph¸t l¹i tÖp AVI vµ MOV
trªn m¸y tÝnh ®Ó thùc hiÖn viÖc thu tÝn hiÖu.
5.2 ChuyÓn c¸c ®o¹n Video-Audio sè ®· ®−îc xö lý trªn m¸y tÝnh
®Ó sö dông cho Web hoÆc CD-ROM
5.2.1 Yªu cÇu vÒ phÇn cøng
Trong tr−êng hîp nµy yªu cÇu vÒ phÇn cøng kh«ng ®ßi hái ph¶i cã thiÕt bÞ
giao tiÕp gi÷a m¸y tÝnh vµ m¸y thu ph¸t tÝn hiÖu Video-Audio. Nh−ng yªu cÇu
mét sè phÇn mÒm hç trî hiÓn thÞ.
5.2.2 C¸c ®Þnh d¹ng tÖp Video-Audio
Lùa chän ®Þnh d¹ng cho tÖp Video-Audio kÕt qu¶. V× kÕt qu¶ sö dông
cho c¸c môc ®Ých kh¸c nhau ®o ®ã cÇn x¸c ®Þnh chÝnh x¸c ®Þnh d¹ng tÖp kÕt qu¶.
D−íi ®©y lµ mét sè ®Þnh d¹ng tiªu biÓu:
§Þnh d¹ng video theo chuÈn Quicktime :
Quick time lÊy (down load) vÒ tõ m¹ng
Quick time cho phÐp xem trùc tiÕp trªn m¹ng
Quick time CD-ROM
§Þnh d¹ng audio theo chuÈn Real G2:
Real G2 dïng ®Ó lÊy (down load) vÒ tõ m¹ng
Real G2 cho phÐp xem trùc tiÕp trªn m¹ng
§Þnh d¹ng Video-Audio theo chuÈn Windows
Windows media video
Windows media audio
AVI CD-ROM
§Þnh d¹ng Video-Audio theo chuÈn MPEG
Trang 38
Cho Video dïng MPEG-1, MPEG-2
Lý thuyết xử lý Video
Cho Audio dïng MP3
NÕu kÕt qu¶ dïng cho CD-ROM th× chóng ta ph¶i lùa chän ®Þnh d¹ng
tÖp lµ MPEG-1, MPEG-2 cã sö dông thuËt to¸n nÐn MPEG ( Moition Picture
Experts Group). Sö dông ®Þnh d¹ng MPEG-1 chóng ta cã ®−îc s¶n phÈm
Video-Audio cã chÊt l−îng t−¬ng ®−¬ng VHS. Sö dông ®Þnh d¹ng MPEG-2
chóng ta cã ®−îc s¶n phÈm Video-Audio cã chÊt l−îng t−¬ng ®−¬ng SVHS.
Tuy nhiªn nÕu chóng ta ®Æt tû lÖ nÐn cao vµ chÊt l−îng video thÊp khi th× chÊt
l−îng video sÏ kh«ng ®−îc nh− mong muèn.
NÕu kÕt qu¶ sö dông ®Ó lµm ¶nh ®éng cho Web th× chóng ta sö dông ®Þnh
d¹ng GIF. §Þnh d¹ng GIF sö dông chuÈn nÐn kh«ng mÊt th«ng tin, sö dông tõ
2-256 mµu ®Ó thÓ hiÖn h×nh ¶nh vµ tèc ®é khu«n h×nh thÊp. V× ®Æc tÝnh trªn nªn
®Þnh d¹ng GIF chØ phï hîp cho viÖ t¹o c¸c logo, nót bÊm ®éng trªn WEB. Chó
ý khi sö dông ®Þnh d¹ng nµy kh«ng nªn ®Æt qu¸ nhiÒu khu«n h×nh v× nh− vËy
kÝch cì cña tÖp qu¸ lín ¶nh h−ëng ®Õn viÖc thÓ hiÖn l¹i trªn WEB.
NÕu muèn cã kÕt qu¶ lµ tÖp ©m thanh th× chóng ta sö dông ®Þnh d¹ng
MP3 ( Moition Picture Experts Group 1 layer 3). TØ lÖ nÐn cña ®Þnh d¹ng nµy lµ
kh¸ cao tõ 5 ®Õn 24 lÇn. KÝch cì tÖp nÐn nhá, chÊt l−îng kh¸ cao.
NÕu kÕt qu¶ sö dông trong m«i tr−¬ng Windows dïng ®Þnh d¹ng AVI.
NÕu kÕt qu¶ sö dông trong m«i tr−êng Macintosh th× dïng ®Þnh d¹ng chuÈn
Quick time.
Trong mçi chuÈn ®Þnh d¹ng dïng cho Web th× ng−êi ta ph©n ra lµm
nhiÒu møc chÊt l−îng ®Ó phï hîp víi tèc ®é ®−êng truyÒn. VÝ dô nh− 28,8k,
56k, ISDN, LAN...
Th«ng th−êng c¸c ®Þnh d¹ng trªn ®i kÌm theo c¸c chuÈn nÐn x¸c ®Þnh.
5.3 ChuyÓn c¸c ®o¹n Video-Audio sè ®· ®−îc xö lý trªn m¸y tÝnh
thµnh chuçi c¸c ¶nh
Kh«ng nh÷ng chóng ta cã thÓ chuyÓn kÕt qu¶ Video ®· ®−îc xö lý thµnh
Trang 39
c¸c tÖp Video mµ chóng ta cßn cã thÓ chuyÓn thµnh c¸c khu«n h×nh trong
Lý thuyết xử lý Video
video thµnh c¸c tÖp ¶nh ®Ó sö dông trong c¸c ch−¬ng tr×nh kh¸c. C¸c ®Þnh d¹ng
Trang 40
¶nh kÕt qu¶ th−êng lµ : BMP, GIF, TIFF, Targa
Lý thuyết xử lý Video
VI. Mét sè kü thuËt xö lý Video-Audio trªn m¸y tÝnh
1. Kü thuËt ®¸nh dÊu (Marker) vµ keyframe
§¸nh dÊu (marker) cho biÕt c¸c ®iÓm quan träng trong mét chuçi c¸c
khu«n h×nh hay mét sè thêi ®iÓm nµo ®ã trong mét ®o¹n video. §¸nh dÊu gióp
chóng ta biÕt ®−îc khu vùc Video-Audio cÇn xö lý. Th−êng ng−êi ta dïng
Marker ®Ó, chän, xo¸ hoÆc chuyÓn ®Õn mét ®o¹n Video mét c¸ch dÔ dµng h¬n.
Ng−êi ta chØ dïng Marker trong chÕ ®é so¹n th¶o vµ xö lý Video-Audio.
Marker kh«ng tån t¹i trong c¸c tÖp Video.
Trong c¸c ch−¬ng tr×nh xö lý phim ¶nh kü thuËt keyframe dïng ®Ó ®¸nh
dÊu khu vùc Frame hoÆc c¸c Frame chÞu t¸c ®éng cña mét hiÖu øng nµo ®ã. VÝ
dô chóng ta cã mét ®o¹n video A (5 gi©y). Hai gi©y ®Çu cña video A chóng ta
muèn cã hiÖu øng më dÇn, hai gi©y tiÕp theo cã hiÖu øng râ dÇn vµ gi©y cuèi
cïng cã hiÖu øng sãng. Lóc nµy chóng ta ph¶i sö dông 4 keyframe ®Ó x¸c ®Þnh
Keyframe c¸c ®Þnh c¸c ®o¹n chÞu hiÖu øng
3 ®o¹n chÞu c¸c hiÖu øng trªn.
2. ChuyÓn c¶nh (Transition)
ChuyÓn c¶nh (Transition) cho phÐp chóng ta t¹o mét hiÖu øng chuyÓn gi÷a
c¶nh A vµ c¶nh B. Kü thuËt nµy lµm ®o¹n Video-Audio ®−îc mÒm m¹i h¬n.
VÝ dô: Ta cã c¶nh cuèi cña ®o¹n video A lµ
Trang 41
Ta cã c¶nh ®Çu cña ®o¹n video B lµ
Lý thuyết xử lý Video
KÕt qu¶ sau khi t¹o chuyÓn c¶nh
Líp Mask gi÷a hai Video A vµ B:
( líp Mask lµ mét c¶nh mµu x¸m víi d¶i mµu 256 mµu chuyÓn tõ mµu
tr¾ng sang ®en vµ cã ®é trong suèt theo s¾c ®é s¸ng. T¹i c¸c ®iÓm mµu ®en
h¬n th× c¶nh ë phÝa d−íi líp Mask ®−îc hiÓn thÞ râ h¬n. T¹i c¸c ®iÓm mµu
s¸ng h¬n th× c¶nh ë d−íi líp Mask hiÓn thÞ mê h¬n.
Trong chuyÓn c¶nh trªn ng−êi ta ®· sö dông mét líp Mask ë gi÷a hai
®o¹n video. Líp nµy cã t¸c dông che dÇn c¶nh A vµ hiÖn dÇn c¶nh B. H×nh
d¹ng vµ ®é trong suèt cña líp Mask cã thÓ ®iÒu chØ ®−îc trong c¸c ch−¬ng tr×nh
so¹n th¶o Video-Audio.
3. Kü thuËt trén (mix)
Trén hai kªnh Video
Trong nhiÒu ch−¬ng trinh so¹n th¶o Video-Audio cã hç trî kü thuËt nµy.
Gi¶ thiÕt ta cã hai ®o¹n Video A vµ B ®−îc ®Æt chång lªn nhau. Th«ng th−êng
nÕu ®Æt nh− vËy th× ta chØ cã thÓ nh×n thÊy ®−îc Video ë phÝa trªn. §Ó nh×n
thÊy ®−îc c¶nh ë cña video phÝa d−íi th× chóng ta cÇn ph¶i thay ®æi ®é trong
suèt cña cña c¸c ®iÓm ¶nh ë Video phÝa trªn. Nh− vËy nÕu ta thay ®æi ®é trong
suèt cña c¸c ®iÓm ¶nh mét c¸ch ®¸ng kÓ cña video phÝa trªn th× chóng ta cã
Trang 42
®−îc mét c¶nh mµ cã c¶ h×nh ¶nh Video A vµ c¶ h×nh ¶nh video B.
Lý thuyết xử lý Video
C¶nh video A C¶nh video B
§Æt Video A chång lªn video B vµ thay ®æi ®é trong suèt cña c¶nh A ta
thu ®−îc c¶nh:
Sö dông kü thuËt nµy chóng ta cã thÓ t¹o ®−îc rÊt nhiÒu hiÖu øng cho
Video tõ c¸c ®o¹n video ®¬n lÎ.
Trén 2 kªnh ©m thanh
NÕu cã hai kªnh ©m thanh A vµ B, qu¸ tr×nh trén hai kªnh lµ viÖc ph¸t
cïng mét lóc hai kªnh ©m thanh víi ®é lín kh¸c nhau. KÕt qu¶ , chóng ta sÏ thu
Kªnh A Kªnh B
Trang 43
®−îc mét ©m thanh hçn t¹p cña hai kªnh A vµ B.
Lý thuyết xử lý Video
§−êng gÊp khóc thÓ hiÖn c−êng ®é ©m thanh cña mçi kªnh t¹i c¸c thêi
®iÓm kh¸c nhau.
4. Kü thuËt t¹o ®é trong suèt (Transparence)
Transparence lµ mét kü thuËt ®−îc ¸p dông rÊt nhiÒu trong viÖc xö lý ®å
ho¹. §©y lµ kü thuËt lµm mÊt mét hoÆc nhiÒu mµu x¸c ®Þnh cho mét ®o¹n
Video. VÝ dô chóng ta cã hai ®o¹n Video-Audio A vµ B Video A chång lªn
video B. Video A cã mµu nÒn lµ mµu ®en. Chóng ta cã thÓ dïng kü thuËt nµy
lµm mÊt mµu ®en trªn video A vµ nh− vËy t¹i c¸c ®iÓm cã mµu ®en trªn Video
A sÏ kh«ng xuÊt hiÖn. Thay vµo ®ã lµ c¸c ®iÓm trong suèt. KÕt qu¶ lµ t¹i c¸c
®iÓm cã mµu ®en cña video A ta cã thÓ nh×n thÊy c¸c ®iÓm ¶nh cña Video B.
Cßn t¹i c¸c ®iÓm kh¸c chóng ta nh×n thÊy video A.
C¶nh video A C¶nh video B
§Æt Video A chång lªn video B vµ ®Æt Transparence cho mµu ®en trªn
video A ta thu ®−îc c¶nh:
Trong c¸c tr−¬ng hîp lµm mÊt mét d¶i mµu x¸m tõ tr¾ng ®Õn ®en (256
Trang 44
mµu) th× chóng ta thu ®−îc kÕt qu¶ :
Lý thuyết xử lý Video
Chó ý khi sö dông kü thuËt nµy mµu bÞ mÊt kh«ng trïng víi mµu trong
c¶nh Video. NÕu trïng sÏ g©y ra lçi “thñng h×nh” tøc lµ sÏ cã mét sè vïng
mµu trong ®èi t−îng chÝnh mÊt ®i kh«ng theo ý muèn
4.1 Kü thuËt sö dông kªnh Alpha
Kü thuËt sö dông kªnh Alpha lµ mét kü thuËt tiªn tiÕn th−êng ®−îc sö
dông nhiÒu trong c¸c ch−¬ng tr×nh so¹n th¶o phim vµ t¹o c¸c kü x¶o cho phim
¶nh. Ph−¬ng ph¸p nµy dùa trªn viÖc ®¸nh dÊu ®−êng biªn kÝn cña c¸c ®èi t−îng
trªn mét khu«n h×nh vµ l−u ®−êng biªn d−íi d¹ng mét kªnh Alpha. Khi tiÕn
hµnh ghÐp hai khu«n h×nh cña hai ®o¹n phim víi nhau ng−êi ta sÏ lµm mÊt ®i
khu vùc phÝa ngoµi cña t−îng chøa kªnh Alpha vµ nh− vËy nã sÏ ®¶m b¶o chÊt
cña h×nh ¶nh trong khu vùc ®−îc ®¸nh
dÊu.
Chóng ta cã Video A lµ mét nh©n
vËt nh− c¶nh bªn:
Gi¶ thiÕt chóng ta cã Video B
Trang 45
lµ mét c¶nh nÒn nh− c¶nh bªn:
Lý thuyết xử lý Video
§Æt Video A chång lªn B .
NÕu dïng kü thuËt trén hai kªnh video A vµ B th× ta sÏ cã kÕt qu¶ lµ hai
video ë chÕ ®é kh«ng râ nÐt vµ cã nhiÒu phÇn hoµ trén víi nhau.
NÕu dïng kü thuËt Transparence lµm mÊt mµu tr¾ng th× cã hiÖn t−îng
Mµu tr¾ng t¹i vÞ trÝ nµy bÞ mÊt ®i
Trang 46
phÇn ngoµi cña m¾t gµ còng sÏ bÞ mÊt. KÕt qu¶ ®¹t chÊt l−îng kh«ng cao
Lý thuyết xử lý Video
Trong tr−êng hîp nµy chØ cã thÓ dïng kü thuËt kªnh Alpha. L−u l¹i ®−êng
biªn cña ®èi t−îng d−íi d¹ng kªnh Alpha vµ lµm mÊt phÇn ngoµi cña kªnh
Mµu tr¾ng t¹i vÞ trÝ nµy kh«ng bÞ mÊy ®i
Alpha . Nh− vËy chÊt l−îng ®¹t ®−îc lµ rÊt cao.
Kªnh Alpha dïng cho khung h×nh trªn video A cã d¹ng sau :
Khi sö dông kªnh Alpha chóng ta cÇn lùa chän ®Þnh d¹ng ¶nh hîp lý dÓ
l−u kªnh Alpha. HiÖn nµy cã ®Þnh d¹ng ¶nh TIFF ®©y lµ mét ®Þnh d¹ng theo
chuÈn c«ng nghiÖp cã chøa kªnh Alpha. Khi sö dông ®Þnh d¹ng nµy chóng ta
Trang 47
cã thÓ t¹o ra d−îc nh÷ng kü x¶o chÊt l−îng cao.
Lý thuyết xử lý Video
Tµi liÖu tham kh¶o
1. Adobe Primerie 6.0 uses guide
2. DV300 uses guide
3. Bµi gi¶ng cña chuyªn gia Yichi Kogure
4. http://mpeg.telecomitalialab.com/standards/mpeg-1/mpeg-1.htm
5. http://mpeg.telecomitalialab.com/mpeg_books.htm
6. http://wwwam.hhi.de/mpeg-video/contact.htm
7. http://www.ebu.ch/trev_dolby_frm.html
8. http://www.msstate.edu/movies/
9. http://wwwam.hhi.de/mpeg-video/#MPEG_Video_Group
Trang 48
10. http://mp3.lycos.com/