MULTIMEDIA MULTIMEDIA MULTIMEDIA

1

TTÀÀI LI

I LIỆỆU THAM KH

U THAM KHẢẢOO

365 Course Contents,

Spring

2000,

Website:

• CMPT

http://www.cs.sfu.ca/CourseCentral/365/li/index.html

”, Ken C.PohmanmFourth Edition

• “Principles of Digital Audio

McGraw-Hill.

• “Digital Video processing ”, A. MuratTekalp, University of Rochester,

Prentice Hall PTR.

• “Multimedia processing”, Andrew Calway, COMS72200. • “Fundamentals of Digital Image Processing”., Anil.K.Jan, Prentice Hall,

1996.

Services

and Technologies”,

• MPEG Home Page, http://www.cselt.it/mpeg/ • “Emerging Wireless Multimedia

JohnWileySons, Aug 2005

• “Multimedia Content and the Semantic Web Standards Methods and

Tools”, John Wiley Sons, Jun 2005

• “Introduction To Digital Audio Signal Processing”, DavideRocchesso,

2003

Page 2

I DUNG NNỘỘI DUNG

• TỔNG QUAN • KỸ THUẬT AUDIO • KỸ THUẬT VIDEO

Page 3

NG QUAN TTỔỔNG QUAN

4

NG QUAN TTỔỔNG QUAN

• TỔNG QUAN VỀ MULTIMEDIA • KHÁI NIỆM CHUNG VỀ AUDIO VÀ VIDEO • HỆ THỐNG AUDIO-VIDEO • MỘT SỐ VẤN ðỀ VỀ TÍN HIỆU

Page 5

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Lịch sử phát triển của hệ thống ña môi trường – Báo, tạp chí - môi trường: văn bản, ñồ hoạ và hình ảnh. – Cáp ñồng: môi trường truyền tải tín hiệu ñiện. – 1895, Guglemo Marconi phát minh ra máy radio ở Pontechio – Ý, môi trường chuyển tải tín hiệu audio quảng bá hiện nay.

– Truyền hình, môi trường truyền thông của thế kỷ 20, truyền

hình ảnh và âm thanh ñến mọi nơi.

– Các hệ thống máy tính tích hợp nhiều dạng môi trường số khác nhau, khả năng biểu diễn, tương tác với các dạng thông tin, tiềm năng lớn phục vụ nhu cầu trao ñổi thông tin chất lượng cao.

– Các hệ thống ña môi trường trở nên phong phú, kết hợp các công nghệ khác nhau với khả năng di ñộng, liên lạc từ xa dưới nhiều hình thức.

Page 6

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

ðồ hoạ

Văn bản thường (tuyến tính)

Âm thanh

Siêu văn bản

Siêu văn bản

Hình 1-1 Hypertext, Hypermedia

Page 7

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Siêu môi trường và ña môi trường (hypermedia –

multimedia) – Hypertext: “Siêu văn bản là một tài liệu không tuyến tính, bằng cách kích vào một ñiểm nóng nào ñó trên văn bản, nó có thể chuyển ñến một tài liệu hay một văn bản khác, rồi có thể quay về, thuận tiện cho người ñọc trong việc duyệt văn bản hoặc muốn tổng quan một văn bản từ phần mục lục”. (Ted Nelson ,1965)

– Hypermedia: Bao gồm nhiều môi trường truyền thông khác nhau như ñồ thị, hình ảnh, âm thanh, hoạt hình và ảnh ñộng. (Ted Nelson).

– Multimedia: thông tin máy tính có thể ñược mô tả bằng audio, video hay hoạt hình ngoài những môi trường truyền thống.

Page 8

Video Siêu môi trường

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Ví dụ một số ứng dụng multimedia:

• Hệ thống xây dựng và soạn thảo video số. • Tạp chí ñiện tử. • Trò chơi. • Thương mại ñiện tử. • Truyền hình tương tác iTV. • Truyền hình hội nghị. • Truyền hình theo yêu cầu. • Thực tế ảo. • ...

Page 9

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Các dạng môi trường và tín hiệu:

dạng môi trường

audio

video

animation

liên tục

rời rạc

images

text

graphic

gốc tín hiệu

thu nhận

tổng hợp

Hình 1-2 Dạng môi trường

Page 10

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

Hình 1-3 Thu nhận và tổng hợp

Page 11

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Âm thanh (audio) • Âm thanh: Là dao ñộng sóng âm gây ra áp lực làm dịch chuyển các hạt vật chất trong môi trường ñàn hồi làm tai người cảm nhận ñược các dao ñộng này. Tai người có thể nghe ñược trong khoảng tần số từ 20Hz ñến 20kHz.

• Âm thanh tự nhiên: Là sự kết hợp phức giữa các sóng âm có

tần số và dạng sóng khác nhau.

• Dải ñộng của tai: Giới hạn bởi ngường nghe thấy (0dB) ñến

ngưỡng ñau (120dB) của người.

• Ngưỡng nghe tối thiểu: Mức thấp nhất của biên ñộ mà tai người có thể cảm nhận ñược âm thanh tuỳ thuộc vào từng người, mức áp lực và tần số của âm thanh.

Page 12

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Hiệu ứng che khuất âm thanh: Hiện tượng âm thanh mà tại ñó ngưỡng nghe của một âm tăng lên trong khi có mặt của một âm khác (khó nghe hơn). ðược sử dụng trong kỹ thuật nén. • Hướng âm thanh: Tai và não có thể giúp ta xác ñịnh hướng âm thanh, ñiều này có thể ứng dụng ñể tạo các hiệu ứng âm thanh như stereo, surround.

• Vang và trễ: Vang là hiện tượng kép dài âm thanh sau khi nguồn âm ñã tắt. Trễ là thời gian τ âm thanh phản xạ ñến ñích so với âm thanh trực tiếp. Nếu τ>50ms thì trễ ñó gọi là tiếng vọng. Biên ñộ của âm thanh cứ sau 1 lần phản xạ thì bị suy giảm.

• Âm nhạc: Là âm thanh có chu kỳ ở những tần số mà tai người cảm nhận một cách dễ chịu, êm ái, ñược kết hợp một cách phù hợp. Âm nhạc gồm cao ñộ, âm sắc và nhịp ñiệu.

Page 13

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Video

• Tín hiệu video: Là sự tái tạo ảnh tự nhiên với những

khoảng cách về không gian, thời gian hoặc cả hai.

• Ảnh tự nhiên: ñược tạo nên từ các nguồn sáng mặt trời hay ánh sáng nhân tạo phản xạ lên các vật thể mà ta có thể nhìn thấy ñược.

• Ảnh: Là một ma trận các ñiểm ảnh mang thông tin về ñộ

chói và màu sắc.

• Sự lưu ảnh: Khả năng lưu hình của mắt trong một giây. Mắt có thể lưu ñược 24 hình trong một giây. Chọn số hình trong một giây của ảnh ñộng phù hợp

Page 14

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• ðộ chói: Là biên ñộ của thành phần trong ảnh (pixel).

• Ví dụ tín hiệu chói Y ñược tổng hợp bởi các tín hiệu RGB theo

công thức:

(1-2)

• EY=0,299ER+0,587EG+0,114EB

• Thông tin màu ñược xác ñịnh:

• EB-EY=0,587EG+0,889EB+0,229ER • ER-EY=0,587EG+0,114EB+0,701ER (1-3) • ðộ tương phản: Tỷ số của ñộ chói thành phần sáng nhất

so với ñộ chói của thành phần tối nhất.

Page 15

TTỔỔNG QUAN V

MULTIMEDIA NG QUAN VỀỀ MULTIMEDIA

• Hệ thống audio tương tự

m â

t ấ u X

ý l ử X

n ồ u g N

i ạ ñ h c ế u h K

i ạ ñ h c ế u h k n ề i T

Lưu trữ

Hình 1-4 Hệ thống audio tương tự

Page 16

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống video tương tự

Xử lý tín hiệu

Chuyển ñổi ảnh- tín hiệu

Ống kính

Cảnh tự nhiên

Tạo xung ñồng bộ

Ảnh tái tạo

Xử lý tín hiệu

Chuyển ñổi tín hiệu - ảnh

Lưu trữ hoặc truyền dẫn

Tách xung ñồng bộ

Hình 1-5 Hệ thống Video tương tự

Page 17

Mắt người

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống audio-video số:

Nguồn tín hiệu (Analog)

Chuyển ñổi Analog - Digital

Xử lý, Lưu trữ, Truyền dẫn (Digital)

Chuyển ñổi Digital - Analog

Xuất âm, hiển thị (Analog)

Hình 1-6 Hệ thống audio-video số

Page 18

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Các thành phần của hệ thống:

– Bộ phận thu: Micro và Camera thu và chuyển tín hiệu (âm thanh hoặc ảnh) sang tín hiệu ñiện tương tự. ðối với các hệ thống số phải thực hiện việc chuyển ñổi tương tự sang số. – Lưu trữ: Thiết bị lưu trữ là băng từ hoặc ñĩa từ. Có thể là các thiết bị riêng biệt sử dụng với muc ñích thuận tiện và yêu cầu một chất lượng nào ñó.

– Xử lý tín hiệu: ðiều chỉnh ñặc tuyến tần số, màu sắc, tạo

hiệu ứng..

– Truyền dẫn: Truyền tín hiệu từ vị trí này sang vị trí khác với một khoảng cách không gian nào ñó qua một môi trường truyền dẫn nào ñó.

Page 19

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Phân loại các hệ thống Audio-Video:

Lớp hệ thống

Giá

Chất lượng

Dễ sử dụng

Linh hoạt

Khả năng mở rộng

Yếu tố quan trọng nhất

A-V gia ñình

Giá, dễ sử dụng

Chất lượng, giá

Bán chuyên nghiệp

Cầu hội thảo

Nén video

Phân phối video

Khả năng lưu trữ

Sản xuất studio

Chất lượng, linh họat

Sản xuất chương trình ngoài trời

Cơ ñộng, dễ sử dụng

Sản xuất hậu kỳ

Chất lượng, linh họat

Máy tính cá nhân

Toàn bộ

Page 20

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống Audio – Video dân dụng:

– Xây dựng hoặc tạo lại một số chương trình nhất ñịnh – Ghi, lưu trữ những sự kiện cá nhân. – Hầu hết các chương trình ñược thu và tạo ra tại chỗ. – Hệ thống ñáp ứng nhu cầu giá thành thấp, dễ sử dụng ñể

phổ biến rộng rãi.

– Sử dụng phương pháp sản xuất hậu kỳ với chất lượng giới

hạn nhất ñịnh.

– ða hệ và tương thích với mọi tiêu chuẩn. – Mối quan tâm của các nhà sản xuất.

Page 21

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống Audio-Video dân dụng

VCR, VCD, DVD

Interface card

Camera

PAL, NTSC

Hình 1-7 Hệ thống Audio – Video dân dụng

Page 22

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống Audio – Video bán chuyên dụng

Interface card

Camera

VCR, VCD, DVD

VCR, VCD, DVD

Băng, ñĩa

PAL, NTSC

Băng, ñĩa Tới khách hàng

Hình 1-8 Hệ thống Audio – Video bán chuyên dụng

Page 23

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống phân phối:

– Tập hợp chương trình thành một dòng dữ liệu ñể phát

quảng bá, truyền hình cáp hay vệ tinh.

– Khả năng chuyển tải ñến người xem thông qua máy phát,

mạng hay một phương thức nào ñó.

– Máy chủ phải ñáp ứng khả năng lưu trữ ñối với tín hiệu nhằm tạo ñường truyền thông suốt giữa các chương trình.

– Yêu cầu tự ñộng cao, giảm chi phí nhân công. – Truyền hình tương tác yêu cầu khả năng xử lý và chất lượng ñường truyền khá cao, ñồng thời hệ thống phải có khả năng phát các chương trình khác nhau trong cùng thời ñiểm.

Page 24

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống Audio – Video studio sản xuất chương

trình

Camera1 Camera2 Camera3 Camera4

Cam1 Cam2 Cam3 Cam4 VCR1 VCR2 VCR3 EFF LINE

VCR1

LINE

E F F 2

ðầu ra video

VCR1

VCR2

E F F 1 Bộ tạo kỹ xảo

VCR2

VCR3

VCR3

Page 25

Hình 1-9 Hệ thống Audio – Video studio sản xuất chương trình

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống sản xuất chương trình ngoài trời:

– ðược sử dụng ñể thu các bản tin hay một chương trình nào ñó mà không cần nhiều người thực hiện, thường sử dụng các thiết bị cầm tay.

– Các chương trình truyền trực tiếp thì hệ thống có thể là các hệ thống cố ñịnh nhưng với quy mô nhỏ và chất lượng thấp hơn.

– Yêu cầu tính cơ ñộng cao. – Camera ñược nối với máy ghi riêng mà khôg sử dụng ma

trận chuyển mạch.

– Máy ghi âm ña ñường ñược sử dụng ñể thuận tiện trong hậu kỳ âm thanh nhưng phải yêu cầu ñồng bộ với hình.

Page 26

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống sản xuất hậu kỳ Bộ tạo tiêu ñề Bộ tạo ñồ họa Camera copy

TITL1 GRPH1 Cam1 VCR1 VCR2 VCR3

EFFA

EFFB

E F F B 1

E F F B 2

VCR1

E F F A 1

Kỹ xảo B

VCR2

E F F A 2 Kỹ xảo A

BỘ ðIỀU KHIỂN DỰNG

Page 27

Hình 1-10 Hệ thống Audio – Video sản xuất hậu kỳ

VCR3

HHỆỆ THTHỐỐNG AUDIO

VIDEO NG AUDIO--VIDEO

• Hệ thống cầu hội thảo Monitor

Camera

Bộ xử lý và ñiều khiển số

Micro

Vị trí A

Audio

Vị trí B

Máy chiếu

Monitor

Camera

Micro

Bộ xử lý và ñiều khiển số

Audio

Máy chiếu

Page 28

Hình 1-11 Hệ thống cầu hội thảo

HHỆỆ THTHỐỐNGNG AUDIO

VIDEO AUDIO--VIDEO

• Hệ thống audio video trong PC

– PC dùng ñể trình diễn, lưu trữ, xử lý âm thanh, hình ảnh. – ðiều khiển bằng phần mềm chuyên dụng kết hợp với các

card ñồ họa, xử lý kỷ xảo.

– ða dạng về tiêu chuẩn dẫn ñến khó tương thích. – Có thể yêu cầu nhiều dạng card thích ứng khác nhau và có

thể sử dụng hơn một màn hình ñể hiển thị.

– Dữ liệu có thể yêu cầu nén và giải nén vì phạm vi ứng

dụng khả rộng.

Page 29

MMỘỘT ST SỐỐ VVẤẤN ðN ðỀỀ VVỀỀ TTÍÍN HIN HIỆỆUU

• Tín hiệu và hàm

– Tín hiệu tương tự là hàm theo thời gian. – Biên ñộ âm thanh ñược biểu diễn bằng mức ñộ âm thanh tại

thời ñiểm ñã cho.

– Tín hiệu ñược biểu diễn bằng hàm f(t).

• Tín hiệu có chu kỳ

– Sự lặp lại trong một khoảng thời gian ngắn nhất không ñổi

của tín hiệu gọi là chu kỳ T.

– Tần số là nghịch ñảo của chu kỳ: u=1/T.

Biên ñộ f(t0)

Thời gian t

t0

Page 30

Hình 1-7 Biểu diễn biên ñộ-thời gian

MMỘỘT ST SỐỐ VVẤẤN ðN ðỀỀ VVỀỀ TTÍÍN HIN HIỆỆUU

• Phân tích Fourier

– Trong thực tế, rất ít khi ta có ñược một tín hiệu ñơn tần, mà thông thường là các tín hiệu phức tạp, kết hợp bởi nhiều tần số và các hài của nó.

– Việc phân tích Fourier cho kết quả là tổng của các hàm sin và cosin

của các tần số khác nhau. • Phân tích Fourier một chiều:

F(u)=FR(u)+jFI(u)

j

F u ( )

f

t e ( )

dtπ 2 ut

= ∫

=

+

F u ( )

−∞ ∞

2 F u ( ) R

2 F u ( ) I

f

t ( )

( ) j F u e

duπ 2 ut

= ∫

)

arctan(

=θ )( u

−∞

)( uF I )( uF R

θ j

u )(

=

+

=

uF )(

u )(

euF )(

uF )( R

jF I

Page 31

MMỘỘT ST SỐỐ VVẤẤN ðN ðỀỀ VVỀỀ TTÍÍN HIN HIỆỆUU

• Phổ tần số

– Sự phân bố của |F(u)| gọi là phổ tần của tín hiệu. – Tín hiệu biến thiên chậm thì phổ tần tập trung ở tần số thấp và ngược lại. Từ ñó hình thành tín hiệu tần số thấp và tần số cao.

Biên ñộ phổ |Fu|

Tần số (u)

Page 32

MMỘỘT ST SỐỐ VVẤẤN ðN ðỀỀ VVỀỀ TTÍÍN HIN HIỆỆUU

• Tín hiệu Audio và Video

– Tín hiệu âm thanh thường là tín hiệu một chiều. – Tín hiệu ảnh là tín hiệu hai chiều. – Tín hiệu Video là tín hiệu 3 chiều. – Với các chiều khác nhau, ta sẽ có số biến khác nhau tương

ứng.

• Chuyển ñổi Fourier 2 chiều

+

j

π (2

ux

vy

)

=

),( vuF

,( eyxf )

dxdy

∫ ∫

∞−

∞−

j

π (2

+ ux

) vy

j

π 2

j

π 2

vy

=

− e

− ux e

+

j

π (2

ux

vy

)

=

,( yxf

)

),( evuF

− e dudv

∫ ∫

∞−

∞−

Page 33

MMỘỘT ST SỐỐ VVẤẤN ðN ðỀỀ VVỀỀ TTÍÍN HIN HIỆỆUU

• Mằu sắc

– Việc kết hợp các màu khác nhau tạo nên một màu mới. Thông thường, chọn các màu cơ bản ñể kết hợp, ví dụ RGB

Red

Magenta

Yellow

White

Blue

Green

Hình 1-8 Lý thuyết 3 màu RGB

Page 34

MMỘỘT ST SỐỐ VVẤẤN ðN ðỀỀ VVỀỀ TTÍÍN HIN HIỆỆUU

• Không gian cảm quan màu

3 chiều: – Con người cảm quan màu sắc ở

các khía cạnh sau:

brightness: ñộ sáng như thế nào. hue: màu nào. saturation: sự tinh khiết

– Sự cảm quan này ñối với mỗi người là mỗi khác biệt, do ñó, không thể so ñược giữa người này với người kia.

Hình 1-9 Cảm quan 3 chiều

Page 35

NNÉÉN DN DỮỮ LILIỆỆUU

• ðại lượng ño thông tin

– Lượng thông tin trong tín hiệu có thể không bằng lượng dữ liệu của nó

mà quan hệ mật thiết với xác suất xuất hiện của nó.

• Tự-thông tin (lượng tin)

– Thông tin ñược mang bởi một biến cố A có xác suất xuất hiện P[A] là:

IA

=

= −

log

log

[ P A

]

AI

2

2

1 [ P A

]

– Thông tin không (lượng tin =0): • Mặt trời mọc ñằng ñông.

– Lượng tin ít

P[A]

• Máy ñiện thoại di ñộng trong tương lai ñều có khả năng multimedia

0

1

– Lượng tin nhiều:

• Trường ðKBK ðN ñược xếp hạng nhất trên thế giới về ðTVT

Page 36

NNÉÉN DN DỮỮ LILIỆỆUU

• Entropy

– Lượng tin trung bình của nguồn tin, một cách gần ñúng, là số bit trung bình của

N

H S ( )

log

[ P X

[ P X

]

]

2

i

i

thông tin yêu cầu ñể biểu diễn các ký hiệu của nguồn tin. – Với nguồn N ký hiệu Xi thì entropy ñược ñịnh nghĩa như sau: = −∑

i

= 1

• H(S)≥0; ñối với mã hoá nhị phân, H(S) thể hiện mã hoá với số bít/ký hiệu

tối thiểu.

• Ví dụ: Trong một ảnh phân bố ñều ở thang xám (256 mức): pi=1/256, số bit mã hoá

cho mức xám là log2256=8bits. (cid:1)Entropy của ảnh này là H(S)=Σpilog2(1/pi)=8bits/ký hiệu.

Vậy, trong trường hợp phân bố ñều này, mã hoá ñộ dài cố ñịnh sẽ ñạt ñược số

bit tối thiểu. Trong trường hợp tổng quan thì mã hóa ñộ dài cố ñịnh sẽ không hiệu quả.

Page 37

NNÉÉN DN DỮỮ LILIỆỆUU

• Mã hoá ñộ dài cố ñịnh FLC (Fixed-Length Code)

– ðặc ñiểm:

• Sử dụng số bit cố ñịnh ñể biểu diễn mọi ký hiệu của nguồn. • ðơn giản trong quá trình mã hoá/giải mã.

– Ví dụ

• Mã ASCII (American Standard Code for Information Interchange)

sử dụng 8 bits ñể mã hoá các ký tự.

– Truyền chuỗi: DTVT: 68 84 86 84: 01101000 10000100 10000110

10000100

– Nhược ñiểm:

• Không hiệu quả

Page 38

NNÉÉN DN DỮỮ LILIỆỆUU

• Mã hoá ñộ dài thay ñổi VLC (Variable-Length

Code) – ðặc ñiểm

• Sử dụng số bit khác nhau ñể biểu diễn các ký tự khác nhau. • Các ký tự có xác suất xuất hiện cao ñược phân bố bởi từ mã ngắn

và ngược lại.

• Hiệu quả trong việc biểu diễn hơn, nén tốt hơn.

– Ví dụ:

• Mã Morse. • Shannon-Fano. • Huffman. • Mã hoá loạt dài (RLC).

Page 39

NNÉÉN DN DỮỮ LILIỆỆUU

• Thuật toán Shannon-Fano • Ví dụ mô tả thuật toán:

Ký hiệu A B C D E

• Mã hoá theo thuật toán Shannon-Fano: - Sắp xếp các ký tự theo thứ tự giảm dần của tần suất xuất hiện. - Tính xác suất. - ðệ quy làm hai phần, mỗi phần có tổng xác suất gần bằng nhau. Mã hoá

phần trên bằng bit 0 (hoặc bit 1), phần dưới bằng bit 1 (hoặc bit 0).

- Vẽ sơ ñồ cây. - Tính Entropy, số bits mã hoá trung bình và số bit mã hoá thông thường. - Nhận xét.

Page 40

Số lầ xuất hiện 15 7 6 5 6

NNÉÉN DN DỮỮ LILIỆỆUU

Ký hiệu ðếm Mã Tổng bits

A 15 Pi 15/39 Log2(1/pi) 1.38 0 0 30

B 7 7/39 2.48 0 1 14

C 6 6/39 2.7 1 0 12

E 6 6/39 2.7 1 1 0 18

D 5 5/39 2.96 1 1 1 15

=

+

+

+

+

H S ( )

log

.1.38

.2.48

2.7

2.7

2.96

2

p i

15 39

6 39

6 39

5 39

7 39

=

= i A 2.19.

( ) H s

• Gốc Entropy của nguồn: E 1 ∑ = p i 1 0

+

+

+

(cid:1)

=

b 2.28 its

R

Số bits sử dụng trung bình: + 30 14 12 18 15 39 Số bít mã hoá thông thường: log25=3bits • • Nhận xét: Số bits sử dụng trung bình gần

1 1 0 0 1 0 A B C

H(S) thì bộ mã càng hiệu quả.

Page 41

E D

NNÉÉN DN DỮỮ LILIỆỆUU

• Mã hoá Huffman – Nguyên tắc:

Dựa vào mô hình thống kê của dữ liệu gốc, ký tự có xác suất càng cao

thì mã hoá với từ mã càng ngắn.

– Thuật toán:

- Tính tần suất xuất hiện trong dữ liệu gốc, sắp xếp theo thú tự giảm

dần.

- Xét từ dưới lên trên, bắt ñầu từ hai ký tự có xác suất bé nhất, quy ñinh mỗi nhánh là 0 (hoặc 1) hợp lại với nhau thành nút có xác suất bằng tổng hai xác suất hợp thành.

- Lặp lại cho ñến hết.

Page 42

NNÉÉN DN DỮỮ LILIỆỆUU

– Xét ví dụ trên

Ký hiệu Xác suất Mã Tổng bit

A 15/39 1 15 1

– Số bít trung bình: 87/39=2.23 (<2.28) – Hiệu quả hơn Shannon – Fano.

Page 43

0 B 7/39 000 21 0 1 C 6/39 001 18 13/39 0 0 E 6/39 010 18 24/39 1 1 D 5/39 011 15 11/39

NNÉÉN DN DỮỮ LILIỆỆUU

• Mã hoá loạt dài RLC (Run-Length Coding)

– Nguyên lý

• Mã hoá loạt ký hiệu bằng chiều dài và ký hiệu của loạt ñó.

– ðặc ñiểm

• Mã hoá không tổn hao • Mã hoá liên ký tự. • Hiệu quả với một số nguồn tín hiệu, nhất là sau phép chuyển ñổi. Cần 4 bits mã hoá

Cần 2 bits mã hoá

– Ví dụ

• 0 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 15: (11,13)3 (9,13)15 • mã: (11,3) (9,15)

Bit thô

Run-length Loạt 0 dài

side số bit cần mã hoá

Page 44

NNÉÉN DN DỮỮ LILIỆỆUU

• Mã hoá Lempel-Zip-Welch:

– Nén từ ñiển ñược Jacob Lampel và

0 0

… …

Abraham Ziv ñề xuất năm 1977, phát triển thành họ LZ, LZ77, LZ78.

255 255

– Năm 1984, Terry Welch cải tiến thành

LZW.

256 256 | Clear Code

257 257 | End of Information

258 Chuỗi mới

… …

– Nguyên tắc: Dựa vào việc xây dựng một từ ñiển lưu các chuỗi ký tự có tần suất cao và thay thế bằng một từ mã mới. – LZW tổ chức từ ñiển tốt hơn nên nâng

cao tỷ lệ nén.

– Ví dụ: Xét từ ñiển có ñộ lớn bằng 4096 giá trị từ mã, vậy ñộ dài lớn nhất của từ mã là 12 bits (212=4096).

4095 Chuỗi mới

– Xét chuỗi vào ABCBCABCABCD.

Page 45

256: Mã xoá CC ñể khắc phục tình trạng mẫu lặp lớn hơn 4096, nếu mẫu lặp lớn hơn 4096 thì gởi CC ñể xây dựng từ ñiển cho phần tiếp theo. EoI: Báo hiệu hết một phần nén.

NNÉÉN DN DỮỮ LILIỆỆUU

W

K

Output

Index

Symbol

Nil

A

A

B

65

258

AB

B

C

66

259

BC

C

B

67

260

CB

B

C

A

BC

259

261

BCA

A

B

B

C

258

262

ABC

• Thuật toán: - w = NIL; - trong khi ñọc ñược ký tự thứ k trong chuối - nếu wk ñã tồn tại trong từ ñiển thì w = wk - còn không thì thêm wk vào trong từ ñiển, mã hoá ngõ ra cho w; w = k; - k=k+1;

C

A

67

263

CA

• Chuỗi ra: 65 66 67 259 258 67

A

B

262 68

AB

C

ABC

D

262

264

ABCD

68

• ðầu vào 12ktx8bits=96 bits. • ðầu ra : 5ktx8+3ktx9=67bits. • Tỷ lệ nén: 96/67=1.43

Page 46

NNÉÉN DN DỮỮ LILIỆỆUU

• Lưu ñồ

Start

w=nil

count=0

k=str[count]

Y

k=nil?

N

Output(w)

N

wk in dict?

End

Y

w=wk

index++ Symbol=dict[index]= wk. Output(w). w=k

count++

Page 47