n video bằằng cng cáách gi ch giảảm m
1,35MHz (giảảm băng t m băng tầầnn--nnéén)n)
: 1,2 1,35MHz (gi entropy trong Video dư thừừa va vàà entropy trong Video ng kê a theo thốống kê
ng nhau: rấất nhi t nhiềều, u,
U VIDEO / AUDIO: IIIIII. N. NÉÉN TN TÍÍN HIN HIỆỆU VIDEO / AUDIO: n thông tíín video b KT tương tựự: N: Néén thông t °° KT tương t đđộộ rrộộng băng t u < 1,2 MHz ng băng tầần mn mààu < 1,2 MHz Trong R601: °° Trong R601: Y: 5,75 MHz Y: 5,75 MHz CCrr/C/Cbb: 1,2 3.1. ĐĐộộ dư th 3.1. a. a. Dư thDư thừừa theo th CCáác gic giáá trtrịị ddữữ liliệệu thông tin gi vvíí ddụụ ccáác vc vùùng cng cóó mmứức gic giốống nhau ( u thông tin giốống nhau: r ng nhau (dư th dư thừừa, la, lặặp lp lạại):i):
a không gian dư thừừa không gian
a 1 chuỗỗi i ảảnh: nh: dư th
dư thừừa tha thờời i n mã hoáá 1 d1 dữữ liliệệu giu giốống ng
nh nhậận dn dạạng cng cáác pixels gi i tương quan dữữ liliệệu (decorrelation), v
p trung hầầu hu hếết năng lư ng nhau gọọi li làà c pixels giốống nhau g u (decorrelation), víí ddụụ ddùùng ng i pixels t năng lượợng cng củủa kha khốối pixels
+ V+ Vùùng ng ảảnh rnh rộộng: ng: dư th (n(nềền n ảảnh đnh đềều)u) ng giữữa 1 chu + V+ Vùùng gi gian (chỉỉ ccầần mã ho gian (ch i mã) nhau vàà llặặp lp lạại toi toààn bn bộộ ởở phphầần gin giảải mã) nhau v QuQuáá trtrìình nh gigiảải tương quan d DCT (tậập trung h DCT (t o 1 sốố íít ht hệệ ssốố).). vvàào 1 s a tâm sinh lý b. b. Dư thDư thừừa tâm sinh lý
MMắắt ti c sample không đềều nhau (ch u nhau (chóói, i,
t tiếếp nhp nhậận cn cáác sample không đ y 1 sai sốố u không nhììn thn thấấy 1 sai s mmààu): Nu): Nếếu không nh
y không cóó ttáác đc độộng lên ch sai sốố nnàày không c
ng thu ng lên chấất lưt lượợng thu nh khôi phụục; c; Do đDo đóó ccóó ththểể loloạại bi bỏỏ mmộột st sốố gigiáá
đo trung bìình nnh nộội dung thông tin/ m i dung thông tin/ mẫẫu nhu nhịị Entropy ( (đo trung b
hơn (gi(giáá trtrịị nhnhịị phân c phân củủa a
entropy, i giáá trtrịị entropy,
ththìì sai s nhnhậận n ảảnh khôi ph trtrịị c.c. Entropy phân) phân) SSựự kikiệện cn cóó xxáác suc suấất nht nhỏỏ hơn sample) sẽẽ cho thông tin nhi sample) s NNếếu nu néén video gi ththìì mmộột st sốố thông tin
u hơn.. cho thông tin nhiềều hơn n video giảảm tm tốốc đc độộ bit dư bit dướới gi thông tin ảảnh bnh bịị mmấấtt t (HVS): c trưng củủa ma mắắt (HVS): ĐĐặặc trưng c
(3.1)
Contrast
I;
cöôøng ñoä
saùng
I max I max
I min I min
Độ nhạy về contrast của HVS
Độ nhạy về contrast của HVS
Tần số kg cao
chrominance
1
100
50
0,1
Tần số kg thấp
luminance
10
0,01
f/ Hz
Tsố k/g [chu kỳ/độ]
0,001
1
50
100
10
50
1
1
5
10
Hình 3.1 Hình 3.2
chu soá kyø
Ñoä
phaân aûnh giaûi
[
ckyø
0 ]/
Goùc
nhìn
2
w d2
w d
arctan
3,57
0 ][
Ñoä
phaân giaûi
(3.2)
soá ñoä
Ñoä
töông phaûn
I max I max
doøng hình roäng aûnh I min I min
g
n
ộ
r
ộ
W = đ
d= khoảng cách
Imax
(sóng)
Imin
chu kỳ
Hình 3.3
3.2. KKỹỹ thuthuậật gi 3.2. u video: (c(cóó 2 nh2 nhóóm): m):
Nén video
Không tổn thất
Tổn thất
NNéén cn cóó ttổổn thn thấất vt vàà NNéén không t t giảảm (nm (néén) dn) dữữ liliệệu video: n không tổổn thn thấấtt
DCT VLC RLC
DPCM
Tách vùng xoá
fsamp thấp (băng con)
Lượng tử hoá, VLC Cho các hệ số DCT
Huffman mã hoá entropy
Dùng cho tín hiệu màu C
JPEG, MPEG-1/2,DV Chỉ các giá trị của sample 0 là được mã hoá theo số chạy (RUN); Còn các giá trị =0 dọc theo dòng quét (tạo lại bằng tách tương quan DCT)
Hình 3.4
+ Mã hoá DPCM
e' e
Video V+
Lấy mẫu
Ra
-
p v'
Dự báo
Hình 3.5
Mã hoá entropy + + e=v-p - sai số dự báo
e’ - sai số lượng tử hoá
v’ = e’+p - tín hiệu khôi phục
+ Giải mã DPCM
+ + e' v'
Ra
Giải mã entropy
+ p
Dự báo
Hình 3.6
+ + Mã hoMã hoáá ddùùng DCT ng DCT CCáác bưc bướớc mã ho
DCT (1 chiềều):u): c mã hoáá DCT (1 chi 8 pixel chói liên tiếp trong 1 dòng 98 92 95 80 75 82 68 50
c pixel theo a chuỗỗi ci cáác pixel theo
1. Biểểu diu diễễn biên đ 1. Bi i gian: ththờời gian:
0
n biên độộ chchóói ci củủa chu Biên độ pixel chói
t i pixel a chuỗỗi pixel
2. L2. Lấấy my mứức DC trung b
t
0
c DC trung bìình cnh củủa chu Mức DC pixel chói
3. T3. Tììm phương sai t m phương sai từừ mmứức trung b c trung bìình cnh cáácc
pixel chóói.i. pixel ch
Phương sai pixel chói
0
t
4. Biểểu diu diễễn phn phổổ ccủủa ca cáác pixel ch 4. Bi c pixel chóói ti từừ
Năng lượng
f
0
6,75 MHz
(6,75 MHz) sample (6,75 MHz) 0Hz0Hz1/2f1/2fsample
DCT c băng tầần vn vớới ci cáác hc hệệ ssốố DCT
Năng lượng
0
f fsample/2
ch thàành cnh cáác băng t 5. T5. Táách th tương ứứng cng củủa ta tíín hin hiệệu chu chóói.i. tương
i băng c trưng cho mỗỗi băng
Năng lượng
Nếu độ dư thừa không gian cao thì, AC 0
f
0 DC
AC
6. Biểểu diu diễễn cn cáác gic giáá trtrịị hhệệ ssốố đ đặặc trưng cho m 6. Bi con. con.
Biên độ pixel
Hàng 1
a. Khối DCT 2 chiều 99 82
92
95
80
75
68
50
99
97
91
94
79
74
81
67
49
50
95
89
92
77
72
79
65
47
l e x i p
0
t (Chiều ngang)
93
87
90
75
70
77
63
45
c á c
Biên độ pixel Biên độ pixel
91
85
88
73
68
75
61
43
8 X 8
89
83
86
71
66
73
59
41
i ố h K
85 85 37
87
81
84
69
64
71
57
39
Hàng cuối
t
0 0
85 79 82 67 62 69 55 37
(Chiều ngang)
cột cuối
Cột 1 Biên độ pixel
Biên độ pixel
99
85
t(chiều đứng)
t (chiều đứng)
0
50 37 0
Hình 3.7
Giá trị hệ số khối 8 X 8 DCT
591
106
-18
28
-34
14
18
50
35
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
3
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
-1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Tách phổ năng lượng theo (hàng, cột)
Biểu diễn các hệ số DCT , hàng cột
FDCT: FDCT: )v,u(F )v,u(F
).k,j(f ).k,j(f
cos cos
cos cos
v)1k2( v)1k2( 16 16 (3.3)
)v(C)u(C )v(C)u(C 4 4 -v) caùc
7 7 7 7 0k 0j 0k 0j heä soá
u)1j2( u)1j2( 16 16 cuûa khoái 8x8 DCt
F(u,
)k,j(f
sample goác
trong khoái
8x8
pixel choùi
:u
0...7
taàn- soá
khoâng gian ngang
:v
0...7
taàn- soá
khoâng gian ñöùng
0 vu, neáu ,
C(u),
C(v)
1,2,3,...,
7
1 2 vu, neáu , 1
IDCT: )k,j(f
)v,u(F).v(C)u(C
cos
cos
u)1j2( 16
7 7 0k 0j
v)1k2( 16 (3.4)
a. Khối DCT 3 chiều
Hệ số DC
500
400
0
200
2
4 v
6
0 -200
0
1
2
3
4
5
6
7
Hình 3.8
u
Điều khiển phản hồi
VLC
DCT
buffer
Dữ liệu vào
Làm tròn trọng số
Ra (nén)
Phân tích
Điều khiển tiến
+ Quá trình giảm dữ liệu nhờ DCT
Hình 3.9
Khối DCT lượng tử hóa
Bảng trọng số
Khối ID (Nhận dạng)
chọn tốc độ bit ra
Huffman
giá trị DCT
+ Quá trình giảm dữ liệu cụ thể
DCT
RLC VLC
buffer
Ra
Quét Zig-zag
Lượng tử hóa
Y CR CB
Tạo macro- block
Khối 8X8 pixel
Hệ số DC, giải mã (DPCM)
Quét Zig-zag
Hệ số thang độ Một số hệ số 0 (sau hệ số DC) được mã hoá =1; số lượng 0 chạy trước 1 hệ số 0
Đặt các từ ngắn cho các mức đều nhau, đặt các từ dài cho các mức xảy ra không đều
Hình 3.10
Bảng Huffman
Bảng trọng số
+ Giải mã DCT
VLC
RLC
IDCT
Tách khối macro-block
đảo Zig-zag
Lượng tử hóa
Y CR CB
Giải mã hệ số DC dùng DPCM
Hình 3.11
t giảảm dm dữữ liliệệu không gian
i gian: u không gian -- ththờời gian: ch = phầần n c frames (chênh lệệch = ph
dư thừừa. Gi
a frame trướớc. c.
a. Giảảm bm bằằng cng cáách: ch: chênh nh IDCT (khôi phụục cc cáác gic giáá trtrịị chênh frame, tổổng hng hợợp p i 8x8 pixel) vàà đ độộ trtrễễ frame, t chênh lệệch vch vớới ci cáác gic giáá trtrịị ccủủa frame trư đi khốối pixel g i pixel dựự bbááo tro trừừ đi kh
i pixel gốốc c khkhốối sai i sai ng thìì khkhốối di dựự u không cóó chuy chuyểển đn độộng th
+ + KKỹỹ thuthuậật gi Dư thừừa gia giữữa ca cáác frames (chênh l Dư th ng); phầần cn cốố đ địịnh lnh làà dư th đđộộng); ph ng quáá trtrìình IDCT (khôi ph ddùùng qu llệệch cch củủa kha khốối 8x8 pixel) v ccáác gic giáá trtrịị chênh l KhKhốối pixel d ssốố ddựự bbááo. No. Nếếu không c o không thoảả mãn. mãn. bbááo không tho
DCT/DPCM: Mã hoMã hoáá DCT/DPCM:
Ra
VLC
Lượng tử hóa
2-D DCT
Khối pixel gốc frame (n+1)
Khối sai số dự báo
+
IDCT
Khối dự báo frame n
+
Hình 3.12
Trễ frame
Giải mã DCT/DPCM:
Khối sai số dự báo +
Khôi phục video
Giải mã VLC
Giải lượng tử hóa
Đảo 2-D IDCT
Trễ frame
Hình 3.13
++ KKỹỹ thuthuậật bt bùù chuy chuyểển đn độộng:ng:
t giữữa 2 frames k
c chi tiếết nt nàày trong frame đang x a 2 frames kềề.. c chi tiếết gi ch chuyểển dn dịịch cch cáác chi ti ng 1 vector chuyểển đn độộng đng đểể chchỉỉ ththịị vvịị trtríí (to(toạạ y trong frame đang xéét. t.
1 macroblock (chỉỉ ddùùng ng chuyểển đn độộng nh
TTáách chuy DDùùng 1 vector chuy đđộộ) m) mớới ci củủa ca cáác chi ti ng chỉỉ ththịị totoạạ đ độộ ccáác khc khốối i ((đã nđã néén) n) Vector chuyểển đn độộng ch Vector chuy i trong frame đang xéét tt tạại i trong frame trướớc sc sẽẽ llặặp lp lạại trong frame đang x trong frame trư chuyểển đn độộng ng mmộột tot toạạ đ độộ mmớới (gi (gọọi li làà ddựự bbááo bo bùù chuy interframe). interframe). ng nhờờ 1 macroblock (ch XXấấp xp xỉỉ chuy cho Y). Vector chuyểển dn dịịch xch xấấp xp xỉỉ cho mcho mỗỗi i cho Y). Vector chuy macroblock. macroblock.
c vector chuyểển đn độộng +ng + đ độộ chênh l
ch mã hoáá chênh lệệch mã ho macroblock chuẩẩn n a macroblock đang xéét vt vàà macroblock chu c truyềền n c vector chuyểển đn độộng)ng) đư đượợc truy phân giảải cao hơn ng nhau hihiệệu quu quảả đ độộ phân gi i cao hơn. C. Cáác kc kỹỹ
CCáác vector chuy DCT củủa macroblock đang x DCT c (x(xáác đc địịnh bnh bằằng cng cáác vector chuy ccùùng nhau thuthuậật xt xáác đc địịnh vector chuy
nh vector chuyểển đn độộng:ng: ng khốối block matching (n i block matching (nếếu chênh l u chênh lệệch ch -- ThThíích ch ứứng kh
chênh lệệch cch củủa kha khốối hi hệệ ssốố DCT, v ng truyềền đn đếến bn bộộ gigiảải i DCT, víí ddụụ::
llàà min)min) Thông tin vector chuy Thông tin vector chuyểển đn độộng truy mã theo độộ chênh l mã theo đ Mã hoMã hoáá DCT d DCT dựự bbááo bo bùù chuy chuyểển đn độộng:ng:
Frame sai số dự báo (chênh lệch giữa frame dự báo và frame đang xét)
DCT
VLC
video frame
Lượng tử hóa
ghép kênh
frame dự báo
+
IDCT +
bù
Trễ cố định
Vector chuyển động
VLC
Xấp xỉ chuyển động
Hình 3.14
u video i frame dữữ liliệệu video intraframe): chỉỉ gigiảảm đm độộ dư th
nh kháác.c. a không dư thừừa không intraframe. Đư Đượợc xc xếếp trong c p trong cáác c n cho ảảnh kh
b) b) Frame P
ng tiếến vn vàà intra (n
n cho cáác frames B v
c) c) Frame B
+ + CCáác loc loạại frame d Frame ((intraframe): ch a) a) Frame gian (néén vn vừừa pha phảải) i) intraframe. gian (n i không cóó chuchuẩẩn cho khkhốối không c Frame P (d(dựự bbááo tio tiếến): ch chuyểển đn độộng ti chuy chuchuẩẩn cho c Frame B (d(dựự bbááo 2 chi c macroblock bùù chuy ccáác macroblock b macroblock loạại intra (n vvàà macroblock lo c macroblock bùù n): chứứa ca cáác macroblock b n cao hơn ). D). Dùùng lng lààm m intra (néén cao hơn c P tương lai.. c frames B vàà ccáác P tương lai i suy 2 hư hướớng): Ch o 2 chiềều, nu, nộội suy 2 ng): Chứứa a ng tiếến, ln, lùùi, i, 2 2 hưhướớng ng chuyểển đn độộng ti i intra (néén cao nh n cao nhấất) t)
: Chuổổi GOP c 2 thông sốố::
d) d) NhNhóóm m ảảnh GOP mm-- ssốố frames t i GOP cóó 2 thông s n frame cuốối i u cho đếến frame cu
B(P)t B
R-601:
nh GOP: Chu frames từừ đ đầầu cho đ p theo c frame titiếếp theo (P)trưrướớc frame a 2 frames P frame B giữữa 2 frames P nn -- ssốố frame B gi
F1 F2 F3 F4 F5 F6 F7 F8 F9 F10
Cấu trúc:
B
I
I
B
B
P
B
B
P
B
BBPBBPBB
Hình 3.15
Cấu trúc:IP
Cấu trúc:IB I B I
Cấu trúc:IBP P B I
I
P
Hình 3.18 Hình 3.16 Hình 3.17
Cấu trúc dòng dữ liệu MPEG
4:2:0
8X8 8X8
CB CR
8X8 8X8
Y Macroblock
Y CB CR
slice
Frame
frame
GOP
Hình 3.19
n video: c tiêu chuẩẩn nn néén video:
++ MMụục đc đíích cch cáác tiêu chu a. Ta. Táách dư th ch dư thừừa va vàà dung sai c a HVS đểể dung sai củủa HVS đ
gigiảảm dm dữữ liliệệu u ảảnh gnh gốốc.c.
n theo 1 b. Biểểu diu diễễn n dòng ddữữ liliệệu đưu đượợc nc néén theo 1 b. Bi địịnh dnh dạạngng đ ++ LLớớp cp cấấu tru trúúc dc dữữ liliệệu:u: JPEG: 6 l6 lớớp p 3.2.1. JPEG: 3.2.1.
i 8x8 sample 1. DU (data unit): gồồm 1 khm 1 khốối 8x8 sample 1. DU (data unit): g 2. MCU (Minimum coded unit): nhóóm nhm nhỏỏ 2. MCU (Minimum coded unit): nh , 1 khốối Ci CRR,, i Y, 1 khốối Ci CBB, 1 kh
nhnhấất, gt, gồồm 2 khm 2 khốối Y, 1 kh u DU. ggồồm nhim nhiềều DU.
coded Segment): gồồmm
trên xuốống dư ng dướớii
3. ESC (Entropy -- coded Segment): g 3. ESC (Entropy u MCU nhinhiềều MCU t (scan): quéét tt từừ trên xu 4. Quéét (scan): qu 4. Qu 5. Frame: 5. Frame: nh PL: 6. L6. Lớớp p ảảnh PL:
: 15/1 (JPEG) NNéén n ảảnh tnh tĩĩnh tnh tốối ưui ưu: 15/1 (JPEG)
3.2.2. MPEGMPEG--1/2:1/2: 6 l6 lớớpp 3.2.2.
ch thướớcc
m 8x8 pixels 1. Block: gồồm 8x8 pixels 1. Block: g 2. Macroblock MB: gồồm 1 nhm 1 nhóóm cm cáác khc khốốii 2. Macroblock MB: g 16x16 pixels. Kíích thư DCT cóó ccửửa sa sốố 16x16 pixels. K DCT c ccủủa ca cửửa sa sổổ phphụụ thuthuộộc cc cấấu tru trúúc lc lấấy my mẫẫu u R.601: R.601:
2
1
5
7
4:2:2 MB
4
3
Y
6 CB
8 CR
2
1
5
6
4:2:0 MB
4
3
CB CR
Y
2
1
5
6
4:1:1 MB
4
3
CB CR
Y
Header của MB chứa thông tin về Y,CB,CR và vector bù chuyển động
c nhiềều MB liên ti
u MB liên tiếếpp 3. Slice: gồồm 1 hom 1 hoặặc nhi 3. Slice: g (I,P,B). i mã hoáá (I,P,B). 4. Picture: cho biếết lot loạại mã ho 4. Picture: cho bi i gian 25 bit, chứứa mã đi 5. GOP: Header cóó ththờời gian 25 bit, ch 5. GOP: Header c a mã điềều u
khikhiểển VTR, thông tin th
i gian. n VTR, thông tin thờời gian. 6. Video Sequence: gồồm 1 hom 1 hoặặc nhi 6. Video Sequence: g u GOP, cóó c nhiềều GOP, c
header vàà mã kmã kếết tht thúúc chu header v c chuỗỗi.i.
Header
Mã đầu
Chuỗi Video1
Chuỗi Video2
Chuỗi Video3
Chỗi Video
GOP0 GOP1 GOP2 GOP3 GOP4 GOP5
Lớp GOP
B
I
P
B
I
B
Lớp frame
MB MB MB MB MB MB MB MB MB MB MB MB MB
Lớp slice
YY
Y CB
CR
Thuộc tính MB
Vector chuyển động
Lớp MB
DCT hệ số
EOB
Hình 3.20
Lớp khối DCT
Dữ liệu R-601
8x8(Y)
+ Tiêu chuẩẩn MPEG + Tiêu chu n MPEG--1 (ISO/IEC 11172) t
o dòng 1 (ISO/IEC 11172) tạạo dòng ng cho trò chơi n (video + audio): 1,5Mb/s, dùùng cho trò chơi
(1,2Mb/s); cóó khkhảả năng th năng thựực c
truytruyềền (video + audio): 1,5Mb/s, d điđiệện tn tửử, xu, xuấất bt bảản đin điệện tn tửử, , đđàào to tạạo, cho, chấất lưt lượợng ng ảảnh nh tương đương VHS (1,2Mb/s); c tương đương VHS hihiệện n ảảnh 4095x4095 pixel v 00Mb/s. nh 4095x4095 pixel vớới 1i 100Mb/s.
+ ĐĐịịnh dnh dạạng chung CSIF (C ommon Source ng chung CSIF (Common Source + Intermediate Format) đư đượợc dc dùùng lng lààm đm địịnh dnh dạạng ng Intermediate Format) o cho bộộ mã homã hoáá nnéén.n. chung đầầu vu vàào cho b chung đ
Định dạng R- 601
Định dạng CSIF
Quá trình biến đổi
Lọc thập phân (LTP)
Y Y
Chỉ có mành lẻ
525/60 - 720x480 625/50 - (720X576)
720x240 (720x288)
Y 360x240 (360x288)
LTP
LTP
Chỉ có mành CR lẻ 360x480 (360x576)
CR 360x240 (360x288) CR 180x240 (180x288) CR 180x120 (180x144)
LTP
LTP
Chỉ có mành CB lẻ 360x480 (360x576)
CB 360x240 (360x288) CB 180x240 (180x288) CB 180x120 (180x144)
Hình 3.21
+ + MEPGMEPG--11: (d: (dùùng theo CSIF l
ng theo CSIF làà chchíính) ch p (syntax), biểểu diu diễễn dòng bit mã ho nh) chỉỉ đ địịnh ngh n dòng bit mã hoáá/ gi nh nghĩĩa a / giảải i
nh P vàà BB
nh nghĩĩa ca cúú phphááp dòng bit mã ho
vvềề ccúú phphááp (syntax), bi 2 mode: mã, cmã, cóó 2 mode: n intraframe, tạạo o ảảnh Inh I + N+ Néén intraframe, t n interframe, tạạo o ảảnh P v + N+ Néén interframe, t + + MPEGMPEG--2: 2: ChChỉỉ đ địịnh ngh i mã (bậậc cao so v p dòng bit mã hoáá/ / i MPEG_1, cóó ththểể ttảải xui xuốống ng c cao so vớới MPEG_1, c
gigiảải mã (b MPEGMPEG--1).1).
p con củủa la lớớp gp gọọi li làà Profiles ( nh I,P,B); Profiles (ảảnh I,P,B);
CCáác tc tậập con c vvàà ccáác Levels (m (80MB/s); chíính (20Mb/s); th (80MB/s); ch c): cao (100MB/s); cao 1440 c Levels (mứức): cao (100MB/s); cao 1440 p(4Mb/s) nh (20Mb/s); thấấp(4Mb/s)
3.3. ĐĐặặc đic điểểm cm củủa ca cáác chu 3.3. n video: c chuẩẩn nn néén video:
150:1 n: 2:1 150:1 TTỉỉ llệệ nnéén: 2:1 ng cao trong hậậu ku kỳỳ, x, xửử lý lý ảảnh; nh; ChChấất lưt lượợng cao trong h y tin, truyềền phn pháát st sóóng.ng. p trong lấấy tin, truy ththấấp trong l KhKhảả năng t i nhiềều lu lầần (in sao, x năng tạạo lo lạại nhi TrTrễễ gigiữữa mã v a mã vàà gigiảải mã (ph
ch thướớc GOP, chu
mã homã hoáá, k, kíích thư ttổổng cng cộộng cho ph
n (in sao, xửử lý)lý) i mã (phụụ thuthuộộc vc vàào bo bộộ i GOP): Trễễ c GOP, chuỗỗi GOP): Tr p <1ms ng cho phéép <1ms nh chíính xnh xáác đc đếến 1 frame (Gop gi DDựựng hng hìình ch m còn n 1 frame (Gop giảảm còn
Toác
chchỉỉ ), ),
(3.5)
Tæ neùn soá
R ñoä R
(döõ lieäu goác) neùn) (ñaõ
+ V+ Vùùng ng ảảnh tnh tíích cch cựực APA (active picture area) c
c APA (active picture area) củủa a )/ 8 bit: 4:2:2: (Y,CBB, C, CRR)/ 8 bit: 4:2:2: (Y,C
frames/s
(3.6)
R422=(720+360+360).512x 29,97x 8=176,77 Mb/s Dòng/ frame
pixels/dòng
bit
4:2:0 (MPEG 4:2:0
2 MP@ML) (MPEG--2 MP@ML) = (720+360)x480x29,97x8=124,29 Mb/s RR420420= (720+360)x480x29,97x8=124,29 Mb/s
4:1:1 4:1:1
(
720
480
).
8x97,29x
58,103
s/Mb
R411
360 2
=25 Mb/s (4:1:1) DVCPRO=25 Mb/s (4:1:1)
360 2 n: 5) DVCPRO (tỉỉ ssốố nnéén: 5) DVCPRO (t RRDVCPRO
Pixel 8
Pixel 711
Pixel 0
Pixel 719
Xoá mành
Dòng 1
Dòng 21
Mành 1
Xoá mành
SPA (704x480)
APA (720x483)
Dòng 261 Dòng 262
Định dạng 720x480
Hình 3.22
MJPEG (JPEG): MJPEG (JPEG): n 1:3,5): chấất lưt lượợng ng ảảnh snh sạạchch R=48Mb/s (néén 1:3,5): ch R=48Mb/s (n R=24Mb/s: giảảm chm chấất lưt lượợng ng íít, dt, dùùng cho ph R=24Mb/s: gi ng cho pháátt
ssóóngng
ng VHS (3MHz băng t MHz băng tầần); n);
MPEGMPEG--1:1: Ngang chấất lưt lượợng VHS (3 Ngang ch 360pixel x180 dòng 360pixel x180 dòng
2 MP@ ML tạại 9Mb/s coi l i 9Mb/s coi làà không m không mééo, o,
MPEGMPEG--2:2: + MPEG--2 MP@ ML t + MPEG ch (truyềền phn pháát st sóóng)ng) ssạạch (truy + MPEG--2 MP@ LL: t + MPEG i < 5Mb/s 2 MP@ LL: tốốt tt tạại < 5Mb/s
2 4:2:2: sảản xun xuấất chương tr
t chương trìình (50Mb/s; ch nh (50Mb/s; chỉỉ Betacam SX c frame I, hậậu ku kỳỳ), v), víí ddụụ Betacam SX
MPEG-2 4:2:2@ ML
IBP
MPEG-2 MP@ ML
IB
G E P M
MPEGMPEG--2 4:2:2: s ddùùng cng cáác frame I, h (18Mb/s), nếếu R<15Mb/s, th (18Mb/s), n u R<15Mb/s, thìì kkéém him hiệệu quu quảả
10 9 8 7 6 5 4 3 2 1 0
Tốc độ bit [Mb/s]
5 10
40
20
30
Hình 3.33
Chất lượng ảnh phụ thuộc vào Profiles, GOP
Chuẩn
R
Phân giải không gian
Phân giải t frames/s
6464--128Kb/s
+ + ỨỨng dng dụụng:ng:
128Kb/s 7,57,5 1,555M 003030
176x144 Videophone H.261H.261 176x144 Videophone 352x288 0,384 Conference H.261H.261 352x288 Conference 352x288 Game MPEGMPEG--11 352x288 Game 720x576 TVTVtruytruyềền phn pháát t MPEGMPEG--22 720x576 720x576 MJPEG/ 720x576 Studio TV
0,384--1,555M 1,554Mb/s 3030 1,554Mb/s 30/25 4..9 Mb/s 30/25 4..9 Mb/s 30/25 50Mb/s 30/25 50Mb/s
Studio TV MJPEG/ 2 422 MPEGMPEG--2 422
1920x1280 100Mb/s 1920x1280 20Mb/s
30/25 100Mb/s 30/25 30/25 20Mb/s 30/25
studio MPEGMPEG--22 1920x1280 HDTVHDTV--studio HDTVHDTVtruytruyềền phn pháát t MPEGMPEG--22 1920x1280
âm thanh (bằằng cng cáác c
i HAS (Human Auditory c ngườời HAS (Human Auditory ch phổổ âm thanh (b phân tíích ph c băng tầần gin giớới hi hạạn, rn, rộộng ng i = cáác băng t . HAS nhạạy: y: băng con. HAS nh /32 băng con ng 25/32
n Audio: 3.4. NNéén Audio: 3.4. HHệệ ththốống th nh giáác ngư ng thíính gi System) giốống bng bộộ phân t System) gi c thông dảải = c mmạạch lch lọọc thông d 100Hz). Hiệện dn dùùng 25 100Hz). Hi gigiảảm m ởở ttầần thn thấấp vp vàà caocao
Mức áp lực âm
cao
thấp
dB 110
nghe
50
Ngưỡng tuyệt đối
khôngnghe
0
Hình 3.24
f
10Hz
5K 10K 20K
500
Mức thu nhận
dB 110 100
80
Che liên tục
Che trước
Che sau
50
Tín hiệu mặt nạ
10 0
t [ms]
250
300
150
200
100
-50
0
50 Hình 3.25
p hơn đồồ ththịị mmặặt nt nạạ) )
Xung quanh 1kHz (t Xung quanh 1kHz (tạại mi mứức thc thấấp hơn đ ssẽẽ không nghe th không nghe thấấy y loloạại bi bỏỏ
dư thừừa ca củủa ta tíín hin hiệệu audio, 2 k
u audio, 2 kỹỹ thuthuậật nt néén:n: vi ng mã hoáá vi i gian: Dùùng mã ho ch giữữa ca cáác c n chênh lệệch gi o miềền thn thờời gian: D khôi phụục phc phầần chênh l
i miềền tn tầần sn sốố: D: Dùùng cng cáác khc khốối ci củủa a
nh), biếến đn đổổi ti từừ
nh 1 sốố ccáác băng t i gian thàành 1 s c nhau c băng tầần khn kháác nhau
LoLoạại bi bỏỏ dư th a. Mã hoáá ddựự bbááo mi a. Mã ho sai DPCM đểể khôi ph sai DPCM đ mmẫẫu ku kềề.. b. Mã hoáá bibiếến đn đổổi mi b. Mã ho c samples audio (PCM tuyếến tn tíính), bi ccáác samples audio (PCM tuy mimiềền thn thờời gian th trong miềền tn tầần sn sốố.. trong mi 2 phương ph CCóó 2
phương phááp np néén dn dữữ liliệệu:u: n không tổổn thn thấấtt
a. Na. Néén không t b. Nb. Néén cn cóó ttổổn thn thấất t
Tín hiệu vào tương tự
12 bit
16 bit
16 bit
ADC 16 bit
Buffer (trễ)
Tạo thang độ
Dòng bit nén
Ghép kênh
3 bit
Tính thang độ
Mô hình HAS
Hình 3.26. Hệ thống mã hoá nén audio
3.4.1. NNéén không t 3.4.1. n không tổổn thn thấất (mã ho t (mã hoáá ddựự bbááo o
i gian): mimiềền thn thờời gian):
CCáác kc kỹỹ thuthuậật:t: n vi sai (DPCM): a. a. ThuThuậật tot toáán vi sai (DPCM): TTíín hin hiệệu audio dư th u audio dư thừừa: ca: cáác âm l c âm c âm lặặp lp lạại, ci, cáác âm
p (tai íít nghe th t nghe thấấy)y)
ch audio thàành 25
băng con nh 25 băng con c băng con bằằng ng c), mã hoáá ccáác băng con b
thanh không thíích hch hợợp (tai thanh không th ng DPCM: Táách audio th DDùùng DPCM: T c âm rờời ri rạạc), mã ho (ch(chứứa ca cáác âm r DPCM vàà ADPCM (th DPCM v ch nghi). ADPCM (thíích nghi).
b. b. LưLượợng tng tửử hohoáá:: entropy (VLC): Mã hoMã hoáá entropy (VLC):
c băng con; C; Cáác c
n theo bậậc tăng t
c tăng tầần sn sốố (c(cáác hc hệệ y truyềền theo b n hơn ởở ttầần sn sốố ththấấp, cp, cáác hc hệệ ssốố ccóó đ độộ cao) ng 0 ởở ttầần sn sốố cao) hơn vàà bbằằng 0
BiBiểểu diu diễễn cn cáác hc hệệ ssốố lư lượợng tng tửử hohoáá ccáác băng con VLC nàày truy hhệệ ssốố VLC n ssốố ccóó đ độộ ddàài li lớớn hơn ddàài nhi nhỏỏ hơn v Lư Lượợng tng tửử hohoáá::
sau ADC đượợc nhc nhóóm thm thàành cnh cáác khc khốối i
i gian (tạại đi đầầu ra ADC) v u ra ADC) vàà ttầần n u trong miềền thn thờời gian (t
nhi phân trong 1 b1 block đư
sample vàà 1 gi1 giáá trtrịị biên đ
lock đượợc tc tạạo thang o thang ng 1 i giáá trtrịị đư đượợc bic biểểu diu diễễn bn bằằng 1 biên độộ; ; Đây lĐây làà ququáá trtrìình nh bit đượợc xc xáác đc địịnh tnh từừ không đềều; Vu; Vịị trtríí bit đư
+ C+ Cáác gic giáá trtrịị sau ADC đư ddữữ liliệệu trong mi u ra FDCT). ssốố (t(tạại đi đầầu ra FDCT). + C+ Cáác gic giáá trtrịị nhi phân trong đđộộ (g(gọọi li làà ssốố mmũũ). M). Mỗỗi gi gigiáá trtrịị sample v lưlượợng tng tửử hohoáá không đ nh HAS. mô hmô hìình HAS.
3.4.2. NNéén cn cóó ttổổn thn thấấtt (t(tỉỉ llệệ nnéén 2:1 3.4.2. n 2:1 20:1) 20:1) bbằằng ng
không tổổn hao ““CCảảm thm thụụ không t
a HAS đểể ttáách cch cáác c
n hao””.. SSửử ddụụng đng đặặc đic điểểm không nh nh phầần phn phổổ ccóó biên đ cao (xoáá bbỏỏ ““dư th dư thừừa a
m không nhạạy cy củủa HAS đ biên độộ cao (xo ththàành ph ththụụ ccảảmm”” nnằằm dưm dướới đi đồồ ththịị ngư ngưỡỡng).ng).
i gian vàà mimiềền tn tầần sn sốố..
CCáác kc kỹỹ thuthuậật:t: a. Che phủủ mimiềền thn thờời gian v a. Che ph b. Che phủủ nhinhiễễu lưu lượợng tng tửử (s(sắắp xp xếếp cp cáác bit đ b. Che ph c bit đểể llààm m
luôn dướới đi đồồ ththịị mmặặt nt nạạ
cho bit nhiễễu lưu lượợng tng tửử luôn dư cho bit nhi che). che). c. Mã hoáá nnốối (joint coding), d c. Mã ho i (joint coding), dùùng cho c ng cho cáác hc hệệ ththốống ng
đa kênh audio.. đa kênh audio
Tách phổ băng con
audio
Dòng nén
Filter bank
Lượng tử hoá
Ghép kênh
Dòng bit nén
Mô hình HAS
Phân bộ bit
(32 băng con trong MPEG
a 36 samples. u 48kHz) chứứa 36 samples. ng DCT cảải biên đ 256 i biên đểể ccóó 256
Hình 3.27. Bộ mã hoá nén cảm thụ audio (tổn thất) i filter bank + 3 loạại filter bank + 3 lo Subband bank (32 Subband bank 2 layer băng con trong MPEG--2 layer i băng con I/II: 1 audio frame (1152 frames gốốc), mc), mỗỗi băng con I/II: 1 audio frame (1152 frames g (750Hz@ lấấy my mẫẫu 48kHz) ch (750Hz@ l Transform bank: D 1024
Transform bank: Dùùng DCT c băng con.. 1024 băng con
ng trong MPEG-- Quasifilter bank: dùùng trong MPEG Quasifilter bank: d layerIII=(MP3) layerIII=(MP3)
băng 256 băng + ĐĐặặc đic điểểm cm củủa filter bank (1 filter bank c +
a filter bank (1 filter bank cóó 256 p tương đương filter bank 32 32
i gian: i theo thờời gian: phân giảải theo th
(3.7) i filter bank x độộ rrộộng 1 mng 1 mẫẫu =u =
s= 2,66ms ((ACAC--3, l3, lấấy my mẫẫu 48kHz) u 48kHz)
i theo tầần sn sốố::
con): cóó đ độộ phphứức tc tạạp tương đương filter bank con): c băng con):): băng con a. . ĐĐộộ phân gi a ĐĐộộ ddàài khi khốối filter bank x đ 128 x 20,83s= 2,66ms 128 x 20,83 phân giảải theo t ng băng tầần cn cựực đc đạại/ t i/ tổổng sng sốố băng con
(3.8)
b b. . ĐĐộộ phân gi băng con== ĐĐộộ rrộộng băng t 24000/ 256 = 93,75 Hz (ACAC--3, l3, lấấy my mẫẫu 48kHz) 24000/ 256 = 93,75 Hz ( u 48kHz)
c c. . ĐĐộộ ddàài frame
i frame: : u trong 1 ng subband (32) x sốố khkhốối mi mẫẫu trong 1
SSốố lư lượợng subband (32) x s block: 32x12 x 20,83 = 8ms (3.9) block: 32x12 x 20,83 = 8ms n audio: Tiêu chuẩẩn nn néén audio:
Layer I: t: tổổng cng cộộng 32
32 băng con 384=32x12 448 kb/s; s; 384=32x12 8ms= , 12 khốối mi mẫẫu u 8ms=
1 audio frame (frame =8ms)
3.4.3. Tiêu chu 3.4.3. a. a. MPEGMPEG--11 u 32; 44,1; 48 kHz TTốốc đc độộ llấấy my mẫẫu 32; 44,1; 48 kHz ng 32448 kb/ + + Layer I băng con, 12 kh sample/ kênh; 32 sample/ kênh; frame frame
GR0 GR1
GR10 GR11
CRC
32 mẫu
header
Hệ số thang độ
Phân bố bit
31
Dữ liệu phụ
0 1
Hình 3.28
CRC- Cyclic Redundancy Check
1152 sample/ k le/ kênh ; 3 ênh ; 32 2 ng 32384 kb/
384 kb/s; s; 1152 samp u (32x36=1152); frame: ; 36 khốối mi mẫẫu (32x36=1152); frame:
320kb/s (xung quanh 64kb/s), 1152 mẫẫu/ u/
ng 32320kb/s (xung quanh 64kb/s), 1152 m 24ms; 3; 32 2 băng con băng con (ho(hoặặc c
1 (384 kb/s, òng bit sơ cấấpp MPEGMPEG--1 (384 kb/s,
+ Layer II: + Layer II: 128kb/s; tổổng 32 128kb/s; t băng con; 36 kh băng con 24ms 384x3x20,83=24ms 384x3x20,83= + Layer III: + Layer III: TTổổng 32 kênh, frame: 384x3x20,83=24ms kênh, frame: 384x3x20,83= băng con)) 192 băng con 192 2 (1994): MPEG –– 2 (1994): b. b. MPEG 1066 kb/s + + 32321066 kb/s + audio frame cóó 2 ph2 phầần: n: + audio frame c 1. D. Dòng bit sơ c 1 layer II) layer II)
u: 16; ng (+ ½½ ttốốc đc độộ llấấy my mẫẫu: 16;
ênh đầầy đy đủủ băng t n +1 băng tầần +1
2. Dòng bit mởở rrộộng (+ 2. Dòng bit m 22.05; 14 kb/s) 22.05; 14 kb/s) + Layer III: 64kb/s/ kênh, 5 k5 kênh đ + Layer III: 64kb/s/ kênh, 320 kb/s (nâng cao f thấấp) p) 320 kb/s phphụụ (nâng cao f th
MPEG-1
MPEG-2
Mono, stereo
Mono, stereo
5 kênh +1
Lấy mẫu f thấp
Đa kênh
32; 44,1; 48 kHz
Layer I Layer II Layer III
32; 44,1; 48 kHz
16; 22,05 ; 24 kHz
Layer I Layer II Layer III Layer I Layer II Layer III
Hình 3.29
n MPEG--2 4.22 P@ ML 2 4.22 P@ ML (1994) (t (1994) (tốốc đc độộ
c. c. ChuChuẩẩn MPEG 50Mb/s) 50Mb/s) nh chấất: t:
TTíính ch MMềềm dm dẻẻo cao, khai th CCóó khkhảả năng gi i mã 15 50Mb/s v 50Mb/s vớới bi bấất kt kỳỳ loloạại i
o cao, khai tháác hc hỗỗn hn hợợpp năng giảải mã 15 phphốối hi hợợp np nàào gio giữữa ca cáác c ảảnh nh ,P,B,P,B
ChChấất lưt lượợng vng vàà đ độộ phân gi phân giảải mi mààu cao hơn MP u cao hơn MP@ @
MLML
XXửử lý hlý hậậu ku kỳỳ sau khi n sau khi néén; nn; néén vn vàà gigiảải ni néén nhi n nhiềều u
llầầnn
c dòng tíích cch cựực,c,
CCóó khkhảả năng bi CCóó khkhảả năng hi năng biểểu thu thịị ttấất ct cảả ccáác dòng t năng hiểển thn thịị thông tin trong kho ng xoáá thông tin trong khoảảng xo
mmàànhnh
18Mb/s, cấấu tru trúúc GOP: c GOP: BB
c GOP: nh 20 Mb/s, cấấu tru trúúc GOP:
+ Lưu tr +
i chương trìình 20 Mb/s, c c GOP: PP 30Mb/s, cấấu tru trúúc GOP: c GOP: 50Mb/s, cấấu tru trúúc GOP:
c sơ đồồ nnéén khn kháácc::
ỨỨng dng dụụngng:: + Tin tứức, thc, thờời si sựự 18Mb/s, c + Tin t + Phân phốối chương tr + Phân ph Lưu trữữ 30Mb/s, c + h+ hậậu ku kỳỳ 50Mb/s, c d. d. CCáác sơ đ 1. Apt –– XX 1. Apt 2. Apt –– QQ 2. Apt 3. JPEG –– 2000 3. JPEG 2000 ((năm 2000) năm 2000)
i A/V cóó nnéénn
Tín hiệu audio, video dữ liệu
Tạo dạng ADC
Tách dạng ADC
Lớp nén
Nén
Dãn
3.5. Phân ph 3.5. + C+ Cấấu tru trúúc phân l Phân phốối A/V c c phân lớớpp
ES
Mở gói
Đóng gói
PS
Lớp hệ thống
Ghép kênh PS
Tách kênh PS
TS
Ghép kênh TS
Tách kênh TS
Hình 3.30
++ ChuChuẩẩn MPEG x nh 3 dòng dữữ liliệệu:u:
Gói đến 8kB
8 bytes
ES (dữ liệu)
n MPEG xáác đc địịnh 3 dòng d 1. PDS (packetized data stream) 1. PDS (packetized data stream) 2. PS ( program stream) 2. PS ( program stream) 3. TS (Transport stream) 3. TS (Transport stream) Dòng cơ bảản đn đóóng gng góói PES trong MPEG i PES trong MPEG--22 + + Dòng cơ b
SC (mã khởi đầu): 3 bytes SI (nhận dạng dòng):1 byte PL (chiều dài gói): 2 bytes BS (kích thước bộ nhớ): 2 bytes
Hình 3.31
+ Dòng PS + Dòng PS
Gói đến 8 KB (max)
Gói dữ liệu PES
ES
header gói
header gói
PES header
Kết thúc gói
Video1 Audio 1 Audio 2 Data Video2 Audio 2 Data
Gói n
Gói n+1
SC mã bắt đầu
SCR Chuẩn đồng hồ
MR Tốc độ ghép kênh
Hình 3.32. Dòng PS trong MPEG-2
n trong néén khn kháác:c:
c chuẩẩn trong n 3.6. CCáác chu 3.6. + MPEGMPEG--3 3 ((đđầầu tiên d + ng cho HDTV) u tiên dùùng cho HDTV)
+ MPEG--4 (1998): truy + MPEG
tương 4 (1998): truyềền hn hìình snh sốố, , đđồồ hohoạạ tương 64kb/s c, multimedia (www) trong web: 564kb/s
ttáác, multimedia (www) trong web: 5 (d(dựựa va vàào co cáách mã ho
ng trong API JAVA) dùùng trong API
ch mã hoáá ddữữ liliệệu)u) J (ngôn ngữữ JAVA) d n chương trìình)nh) 5/6: giốống MPEG ng MPEG--33 2001): Multimedia Content 7 (1996--2001): Multimedia Content + MPEG--J (ngôn ng + MPEG (giao diệện chương tr (giao di + MPEG--5/6: gi + MPEG + MPEG--7 (1996 + MPEG
7, mô tảả nhinhiềều lou loạại i
descrition interface = MPEG--7, mô t descrition interface = MPEG thông tin truyềền thông kh thông tin truy c nhau. n thông kháác nhau.
o tiêu chuẩẩn cung c
cho việệc tc tììm kim kiếếm đm đốối i ng, kíích thư ng nhịịp đp độộ,,……; M; Mứức cao: ng ch thướớc, mc, mààu, vu, vịị trtríí, , c cao: ngữữ
MPEGMPEG--7 d7 dựựa va vàào tiêu chu ch mã hoáá n cung cấấp cp cáách mã ho ddữữ liliệệu (nghe nh u (nghe nhììn) cn) củủa a đđốối tưi tượợngng trong không gian trong không gian i gian, cóó hihiệệu quu quảả cho vi vvàà ththờời gian, c tưtượợng (mng (mứức thc thấấp: hp: hìình dnh dááng, k i, tâm trạạng nh gigiọọng nng nóói, tâm tr a thông tin) nghnghĩĩa ca củủa thông tin)
Phạm vi của MPEGMPEG--7 7
Feature extraction Standard description Search engine
Hình 3.33 + JPEG-2000 (Wavelets)