H C VI N CÔNG NGH B U CHÍNH VI N THÔNG Ệ Ư

BÀI GI NG MÔN Ả

X lý âmthanh và hình nh

/0904342557

Gi ng viên: LÊ NH T THĂNG Đi n tho i/ E-mail: thangln@ptit.edu.vn B môn: Chuy n M ch H c kỳ 1: Năm 2010-2011

ả ệ ộ ọ

CH

NG TRÌNH MÔN H C

ƯƠ

• TH I L NG: 60/48LT/6BT/6 th o lu n Ờ ƯỢ ả ậ

i thi u chung

4 LT/ 0 BT/ 0 KT/0 TL

K thu t x lý âm thanh 12

LT/ 02 BT/ 0 KT/02 TL

LT/ 02BT/ 0 KT/02TL

• N I DUNG: Ộ ng 1: Gi Ch ươ ớ ệ ng 2: Ch ỹ ươ ậ ử ng 3: K thu t x lý nh 20 Ch ươ ậ ử ả ỹ ng 4: Các chu n mã hóa âm thanh hình nh trong truy n thông đa Ch ươ

LT/ 02BT/ 0 KT/ 02 TL

ph

ng ti n 12 ệ

ẩ ươ

TÀI LI U THAM KH O

[1] Wai C. Chu, Speech Coding Algorithms- Foundation and Evolution of Standardized Coders, John Wiley & Sons, 2003.

[2] R. C. Gonzalez, R. E. Woods , Digital Image Processing, Prentice Hall, 2nd Edition, 2001.

• [3] Bài gi ng x lý âm thanh và hình nh ử ả ả

Ch

ng 1: Gi

i thi u chung

ươ

ế ơ ở

ả ng ti n

1.1 Các khái ni m lý thuy t c s ệ 1.2 Vai trò c a x lý âm thanh hình nh ủ ử trong truy n thông đa ph ề

ươ

1.1 Các khái ni m lý thuy t c s ệ

ế ơ ở

• M t s ki n th c c b n c n chu n b : h tuy n tính, ma tr n

ẩ ầ ế ị ệ ậ

, s ; Nguyên t c bi n ng t ộ ố ế ơ ư ự ố ươ ế ắ

• C n phân bi ệ

ự ậ

ỹ ệ ồ ệ ệ

• Phân bi ệ ệ ấ ổ

ứ ơ ả và vect , xác su t; l p trình Matlab ấ ậ • Đ c tr ng c b n c a tín hi u: t ơ ả ủ ặ ệ đ i A/D; u đi m c a tín hi u s ; Ư ể ủ ổ ệ ố t gi a khái ni m x lý (processing) tín hi u âm ệ ệ ử ữ ầ thanh và hình nh liên quan đ n r t nhi u lĩnh v c, k thu t và ề ế ấ ả nén (compression). Nén ch là m t ph n c a x lý tín hi u ầ ủ ử ộ t rõ khái ni m nén hay còn g i là mã hóa ngu n và khái ọ ni m mã hóa kênh; khái ni m entropy; mã hóa không có t n th t (lossless) và mã hóa có t n th t (lossy) ấ ổ

Ư ể

u đi m c a tín hi u s ệ ố

• Tín hi u ch nh n hai giá tr 0,1 ỉ ậ • Đ n gi n hóa vi c h p nh t các d ch v vi n thông vào ấ

ụ ễ

m t m ng h p nh t

ơ ộ

ệ ấ

• Các lo i d ch v khác nhau có th s d ng m t ph

ng

ể ử ụ

ươ

ả ạ ạ ị ti n chung nh t

• Giá thành thi

ng

ậ ố

ấ ượ

t ố

ấ t b k thu t s ngày càng gi m , ch t l ế ị ỹ t, giá thành r ẻ ề ị

ị ấ ượ

ng cao

• Nhu c u v d ch v thông tin ngày càng tăng nhanh và đa d ng hóa: ví d Đi n tho i th y hình, h i ngh video t c đ ạ ố ộ ấ th p, nh tĩnh, nh đ ng, âm thanh ch t l ng cao, đa ộ ấ ph ươ

ụ ụ ệ ả ả ng ti n, truy n hình ch t l ề

ấ ượ

Nguyên t c bi n đ i A/D

ế ổ

• Đi u xung mã PCM • Đi u xung mã vi sai DPCM • Đi u ch Delta • Đi u ch Delta thích ng ADM

ề ề ề ề

ế ế

Đi u xung mã PCM

Đi u xung mã PCM đ ề ượ ặ c đ c tr ng b i 3 quá trình : ở ư

L y m u ẫ ấ

L ng t hóa ượ ử

Mã hóa

L y m u

Khái ni m : L y m u là quá trình r i r c hóa tín hi u theo th i gian

ờ ạ

L

ng t

hóa

ượ

hóa đ u: Chia biên đ xung l y m u thành các ử

đ u ∆ ng t c l 1. L ề ượ kho ng đ u nhau, m i kho ng là m t b ỗ ả ng t ề ộ ấ ộ ướ ượ ẫ ử ề ả

L

ng t

hóa

ượ

ng t ượ

ấ ả ề

ớ ng t c l ướ ượ ử

2. L hóa không ử đ u : Chia biên đ ộ ề xung l y m u thành các kho ng không đ u nhau theo nguyên t c ắ khi biên đ xung l y ấ ộ m u càng l n thì đ ộ ẫ dài b càng l n.ớ

Mã hóa

1. Ch c năng: ứ Chuy n đ i biên ể ổ ng t đ xung l ử ượ ộ mã 8 thành m t t ộ ừ bít.

2.Đ c tính b mã ộ hóa A=87,6/13

Đi u xung mã vi sai DPCM

Đi u ch Delta ế

C u trúc h th ng mã hóa tho i ạ

ệ ố

Ti p ế

ạ ỏ

ồ ư ừ ầ

• Mã hóa ngu n: M c đích là l y d li u ngu n và thu nh ữ ệ ỏ ấ chúng b ng cách lo i b nh ng ph n d th a không c n ầ ầ ữ ằ i ph n ngu n v i s thi i trong ngu n, đ l t còn t n t ớ ố ồ ể ạ ồ ồ ạ ế ng bít ít h n, nh ng nhi u tin t c. l ứ ề ư ơ ượ

• Mã hóa kênh: Là tìm ra nh ng mã có th truy n thông nhanh i ể ử ỗ , ẵ ẻ

ể và có th s a l ợ ệ i (Mã kh i tuy n tính: mã ch n l ế ố

chóng ch a đ ng nhi u mã ký h p l ề ứ ho c ít nh t phát hi n l ệ ỗ ấ mã tu n hoàn, Mã k t h p…). ế ợ

1.2 Vai trò c a x lý âm thanh hình nh trong

truy n thông đa ph

ủ ử ề

ươ

ả ng ti n ệ

ướ ụ

ễ ủ ế ủ

ể ạ

ẫ ề ủ ử

ượ

• Xu h ng phát tri n c a vi n thông: các nhu c u v ề d ch v và các h n ch c a công ngh truy n d n, ị chuy n m ch liên quan đ th y đ c vai trò c a x lý ể ấ ạ âm thanh và hình nh; ả

• Các chu n nén âm thanh và hình nh đang đ

ẩ ổ ế

c s ượ ử d ng ph bi n trong truy n thông: G711, G729; JPEG; ụ MPEG; H264…

Ạ Ễ Ệ Ề

• Môi tr

ấ ộ

ng và kh năng phát tri n m ng Vi n ườ t Nam là r t r ng m thông Vi ệ • G m nhi u m ng cung c p d ch v riêng l ề • Các m ng này g n nh đ c l p v i nhau

ở ị ấ ư ộ ậ

ĐÁNH GIÁ V HI N TR NG M NG VI N THÔNG Ạ VI T NAM Ệ

Ạ Ễ Ệ Ề

ĐÁNH GIÁ V HI N TR NG M NG VI N THÔNG Ạ VI T NAM Ệ

 Ch truy n đ c các d ch v đ c l p t ề ượ ỉ ụ ộ ậ ươ ứ ng ng v i t ng m ng. ớ ừ ạ ị

 Thi u m m d o, kém hi u qu trong vi c v n hành, b o d ng ệ ậ ả ưỡ ế ệ ả

cũng nh s d ng tài nguyên trong m ng ạ ề ẻ ư ử ụ

 Ki n trúc t ng đài đ c quy n làm cho các nhà khai thác g n nh ư ề ầ ổ ộ

ph thu c hoàn toàn vào nhà cung c p t ng đài ấ ổ ộ ế ụ

 Các t ng đài chuy n m ch kênh đã khai thác h t năng l c và l c ự ế ạ ạ

ể h u v i nhu c u c a khách hàng ầ ủ ậ ổ ớ

 S bùng n l u l ng thông tin đã b c l ự ộ ộ ự s kém hi u qu c a ệ ả ủ

chuy n m ch kênh TDM. ể ổ ư ượ ạ

ể ủ

ẩ ự

Đ ng l c thúc đ y s phát tri n c a vi n thông

• Công ngh đi n t phát tri n, v i s tích h p cao, giá thành th p ệ ệ ử ớ ự ể ấ ợ

• S phát tri n c a k thu t s ậ ố ể ủ ỹ ự

• S c nh tranh gi a các nhà cung c p d ch v vi n thông toàn c u ụ ễ ự ạ ữ ấ ầ ị

ề ẫ ữ ệ ể ạ

• Công ngh truy n d n quang và chuy n m ch có nh ng ti n b ế ộ v t b c ượ ậ

• M ng Internet phát tri n ể ạ

t ạ ặ ổ ệ

• Nhu c u trao đ i thông tin ngày càng tăng và đa d ng hóa đ c bi là các d ch v đa ph ng ti n. ầ ị ươ ụ ệ

Xu h

ướ

ng phát tri n c a m ng ể ủ

Xu h

ướ

ng phát tri n c a m ng ể ủ

Yêu c u c a khách hàng

ầ ủ

c cung c p các d ch v có t c đ bít thay

ố ộ

ố ượ

ng cao, giá thành th p

ươ

ố ớ

ứ ươ

• Mu n đ đ iổ • D ch v có ch t l ị ấ ượ ụ • D ch v đáp ng tính th i gian th c ự ứ ụ ị ờ • D ch v đa ph ng ti n ụ ị ệ • Đ đáp ng yêu c u c a khách hàng đ i v i các d ch ể ầ ủ ng ti n thì x lý âm thanh và hình nh đóng v đa ph ử ụ m t vai trò r t quan tr ng ấ ộ

Mã hóa tho i t c đ th p

ạ ố ộ ấ

• D ch v tho i hi n chi m m t th ph n l n trong các d ch v ụ ộ ầ ớ ụ ệ ế ạ ị ị

vi n thông. ị ễ

ặ ể ủ ớ ự ệ ề

ề ớ ấ

ủ ề

ộ ọ ườ ộ ọ

ố ế ả ầ ọ

m t m c nh t đ nh. • M c dù v i s phát tri n c a công ngh truy n thông qua cáp quang đã làm cho băng thông không còn là v n đ l n trong giá thành c a các cu c g i truy n th ng. Tuy nhiên, băng thông ộ trong các cu c g i đ , các cu c g i qua v tinh hay các cu c g i di đ ng thì c n ph i duy trì băng ệ thông ở ộ ố ọ ng dài, các cu c g i qu c t ộ ọ ộ ộ ấ ị ứ

• Vì v y vi c gi m băng thông tho i xu ng d ả ậ ệ ướ ố

ệ ể

t, giúp gi m thi u s l ệ ầ ế ề

ấ ượ ả ư ủ ề ộ

i 64kbps là cách ạ t t nh t. Do đó vi c phát tri n các b mã hóa tho i t c đ th p ạ ố ộ ấ ộ ấ ố ng tín hi u c n truy n đi là r t c n thi ể ố ượ ấ ầ ng c a cu c ng truy n nh ng v n đ m b o ch t l trên đ ả ả ẫ ườ g i.ọ

ng 1

H ng d n ôn t p ch ẫ

ướ

ươ

t các lo i tín hi u (liên t c, r i r c).

ạ ệ

1. Phân bi ệ 2. Quá trình s hóa tín hi u t ệ ươ ố i ích và ng d ng c a nén d li u trong truy n 3. Nh ng l ụ ụ ờ ạ ng t ự ủ ữ ệ ữ ề ợ

ứ ng ti n ệ

4. ộ ầ ổ

ậ ươ ệ ố

ơ

ấ ư ể

ầ ờ ạ ệ ố ề

thông đa ph c bi n đ i M t tín hi u hình Sin có biên đ 5V c n đ ế ượ ộ thành d ng s sao cho nh n đ s tín hi u trên t p âm c t ệ ạ ượ ỷ ố ạ hóa không th p h n 25 dB. Yêu c u c n bao nhiêu l ng t ầ ầ ử ượ c l b hóa nh nhau và c n có bao nhiêu bít đ mã ng t ầ ử ướ ượ hóa m i thành ph n r i r c. ỗ ả ử ộ đ u 256 m c, có t ỷ ố

s m t tín hi u có phân b đ u (uniform), đ ố ng t ử ẽ c l ượ ượ s S/N là 18dB. N u mu n tăng t ố ứ ượ ng s ỷ ố s ph i là ả ứ ệ

5. Gi t ế ử ề S/N c a tín hi u thành 30dB thì s m c l ủ bao nhiêu?

Ch

ng 2

ươ

X lý âm thanh

Đ c tính âm thanh

ế ớ ự

ề ả ừ

i t nhiên v b n c t o ra t dao ượ ạ c truy n đi trong ề ấ ị ươ ừ

c truy n đi trong môi tr

ộ ề

ườ

• Âm thanh trong th gi ch t là nh ng sóng âm đ ữ ấ đ ng c a v t th và đ ượ ủ ậ ộ ng truy n âm nh t đ nh. m t môi tr ề ườ ộ • Âm thanh c a ti ng nói, t , là ng t ế ự ủ c t o ra t nh ng sóng âm đ dao đ ng ộ ượ ạ c a các b ph n trong b máy phát âm và ộ ủ ng truy n đ ượ âm.

2.1 Các đ c tr ng v t lý c a âm thanh

ư

• ộ ầ ố ủ

ủ ầ ố ế ị ộ ộ ố

ơ

Ð cao (hauteur /pitch): do t n s dao đ ng c a dây thanh và/ho cặ c a các b ph n khác trong b máy phát âm ậ quy t đ nh. T n s dao đ ng (s chu kì dao đ ng trong m t ộ giây) càng l n thì âm thanh càng cao và ng i. Ð n v đ ị ể đo đ cao c a âm thanh là Hertz (vi ộ ộ ộ c l ượ ạ t là Hz). t t ế ắ ớ ủ ộ

ủ ậ ộ

ộ ộ ử ế ị ạ ớ ấ ộ

ộ ị ố ớ ộ ơ ộ ạ ị

• Ð m nh (intensité/intensity): do biên đ dao đ ng c a v t ộ ạ th quy t đ nh. Biên đ dao đ ng là tr s l n nh t mà dao ộ ể i trong m t n a chu kì. Biên đ dao đ ng càng đ ng đ t t ộ i. Ð n v đo đ m nh c l l n, âm thanh càng vang to và ng ượ ạ ớ c a âm thanh là décibel (vi t là dB). ủ t t ế ắ

Các đ c tr ng v t lý c a âm thanh ậ

ư

- Ð dài (durée/length):

do th i gian dao đ ng c a v t th quy t ủ ậ ể ế ộ ờ

ộ đ nh. ị

- Âm s c (timbre): ắ ộ ạ ụ ộ ộ

ộ tham gia b sung vào các thành ph n k t c u c a âm. ph thu c vào đ cao, đ dài và đ m nh ầ ế ấ ủ ổ

Các đ c đi m c a h th ng thính giác

ủ ệ ố

con ng

iườ

i đ i v i âm

ự ả

ụ ủ

ườ ố ớ

S c m th c a tai ng thanh

ớ ả ả ấ ấ

ứ ế ệ ầ ộ

ườ ệ ệ ự ị

t m c đ n liên quan m t thi t v i công su t âm ế ớ ứ ấ

• Kho ng cách d i âm l n nh t và y u nh t mà tai con ng i có ườ i nghe có th nghe là 120dB, t c là d i 1 tri u l n biên đ . Ng ể ả th phát hi n s thay đ i đ n âm thanh khi tín hi u b thay ổ ộ ồ ể đ i kho ng 1dB (biên đ thay đ i 12%) ả ổ ổ ộ • Nh n bi ậ ộ ồ ế ậ thanh theo b c mũ 1/3. ậ

i nghe nh n đ c r ng ầ ậ ượ ằ

ừ 20Hz đ n 20kHz, đ ộ ế

- N u tăng công su t âm lên 10 l n, ng ấ ế ườ đ n tăng lên t m 2 l n (101/3≈2 l n) ầ ầ ộ ồ ng t ả ườ ạ ả ầ i thông th ườ 1kHz đ n 4kHz. ế ng ngu n âm t ố ồ ướ - D i nghe c a con ng ủ nh y âm l n nh t t ấ ừ ớ - Kh năng xác đ nh h ị t nh ng xác đ nh kho ng ị ư ả

cách đ n ngu n âm kém. ế ồ

Ng

ng nghe

ưỡ

M t n th i gian

ặ ạ ờ

M t n t n s

ặ ạ ầ ố

Chu n nén audio

• MP3 (MPEG 1 layer 3): ra đ i năm 1980 t vi n nghiên c u ờ ừ ệ ứ

Fraunhoufer Institute (Đ c). ứ

• ACC: Ra đ i năm 1997 t ờ ừ

ế ợ ả ạ ộ ố ứ ị ư

Fraunhofer Institue (Đ c) k t h p v i m t s công ty nh AT&T, Sony, Dolby, là đ nh d ng c i ớ ti n c a MP3. ế ủ

• OGG: Là đ nh d ng ngu n m đ ở ượ ạ ồ ị c Xiph.org Foundation đ ề

xu t năm 1993, nén t t và có ch t l ng t c đ bit th p. ấ ố ấ ượ ở ố ộ ấ

Chu n nén audio

• Realaudio: Đ nh d ng

công

c a ủ

ủ ế ạ

ty ạ RealNetworks, ch y u dùng cho phát nh c ạ tr c tuy n, đ nh d ng đ u tiên ra đ i năm 1995, đ n nay đã có RealAudio 10

ế ế

ế

• WMA: Đ nh d ng âm thanh c a Microsoft, ra m t năm 1999, trên lý thuy t có th nén 96 ng c a MP3 128 kbps. kbps v i ch t l ấ ượ ớ i âm thanh WMA cũng ph bi n trong th gi ế ớ ổ ế phát tr c tuy n. ự

ế

Các l p MPEG/audio

Có 3 l p:ớ

MPEG-1

Các gi

i thu t nén âm thanh

Nén không t n th t ấ ổ • Mã hóa Huffman

• Mã hóa Huffman s a đ i ử ổ

• Mã hóa s h c ố ọ

• Gi i thu t Lempel – Ziv – Welch (LZW) ả ậ

Các gi

i thu t nén âm thanh

Nén có t n th t ấ ổ • Các ph ng pháp nén âm thanh đ n gi n: ươ

LCP(Linear Predictive Coding) CELP (Code Excited Linear Predictor)

ả ơ

i ườ

H th ng nghe và phát âm c a con ng ệ ố Che t n sầ ố i h n Băng gi ớ ạ Che nh t th i ờ ấ

• Nén âm thanh dùng mô hình âm – tâm lý (Psychoacoustics):

• Nén âm thanh MPEG

Nén audio MP3

ng audio g n ầ

• MP3 là nhóm MPEG-1 l p 3 cung c p ch t l ấ t c đ bit th p ớ ng CD gi ng v i ch t l ớ ở ố ộ ấ ượ ấ ấ ượ ố

• MP3 h tr các t n s l y m u khác nhau nh : 32kHz; ỗ ợ ẫ

ư 32 đ n ổ ừ ế ể

ầ ố ấ 44,1kHz; 48kHz; t c đ bit có th thay đ i t ố ộ 448kbps

Nén audio MP3

i đ đ t đ c t l • Mã hóa audio c m quan là k thu t l ả ủ i d ng nh ng đ c ữ ặ ậ ợ ụ nén cao v i ườ ể ạ ượ ỉ ệ ớ

ng t t đi m c m quan c a tai ng ả ể ch t l ố ấ ượ

Nén audio MP3

• Hi u ng m t n t n s : ặ ạ ầ ố Hai âm thanh m nh y u khác ệ ứ ế ạ

ớ ầ ố

nhau v i t n s khác nhau x y ra cùng 1 lúc Âm thanh y u h n phát ra ế ơ

c ho c ngay sau âm thanh m nh ệ ứ ngay tr ả • Hi u ng m t n th i gian: ặ ạ ờ ặ ướ ạ

B mã hóa MP3

K t qu so sánh ch t l

ng các file

ấ ượ

ế

MP3

Gi

i thu t ậ

ộ ọ ệ

ng ng v i 32 băng gi 1. Dùng b l c thông đ chia tín hi u âm thanh thành các ớ ạ fi i h n ầ ố ươ ứ ớ

ố ượ

fi ỗ c 1 ng che c a m i band gây b i các band lân ủ ế ủ ướ ể sub-band theo t n s , t l c sub-band. ọ 2. Xác đ nh s l ị ằ

ng che thì 3. N u m c to c a m t băng mà nh h n ng ộ ở mô hình âm - tâm lý. ưỡ ỏ ơ c n b ng các k t q a b ậ ế ủ

4. Ng ứ không mã hóa nó. ị ế ể

ầ ng t hóa này th p h n đ ng ử ở t đ mã hóa sao cho ơ ườ ấ

5. Đ nh d ng dòng d li u bit i, xác đ nh s bit c n thi c l ố ượ ạ nhi u sinh ra b i vi c l ệ ượ ễ cong che. ạ ữ ệ ị

Ví dụ

ư

Sau khi phân tích, 16 band đ u tiên trong s 32 band nh sau: _________________________________________________________

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1

_________________________________________________________

• • • Band • Level(dB) • • N u m c to c a âm th 8 là 60dB, nó s che band th 7

m c 12dB và band

ứ ở ứ

ị ỏ

M c to band 9 là 35 (> 15dB) nên đ

ế ứ m c 15dB. th 9 ứ ở ứ • M c to ở ứ ứ

band 7 là 10dB (<12dB) nên b b qua, không mã hóa. ượ

c ti p t c x lý. ế ụ ử

ộ ọ

ầ ố ư ầ ố

ớ ỉ ử ụ

• Layer I: b l c lo i DCT v i 1 frame và đ r ng t n s nh nhau trên m i sub- band. Mô hình âm-tâm lý ch s d ng hi u qu che t n s (Frequency masking). ệ • Layer II: s d ng 3 frame trong b l c (tr

ử ụ

ộ ọ

ướ

ộ ộ ả c, hi n t ệ ạ ả ệ

ế ế ờ ấ

i và k ti p, t ng c ng 1152 m u). Mô hình âm-tâm lý có s d ng hi u qu che nh t th i (Temporal ử ụ ẫ masking).

• Layer III: dùng b l c băng gi

t h n, mô hình âm-tâm lý có s d ng

ử ụ

hi u qu che nh t th i, và có dùng b mã hoá Huffman.

ộ ọ ờ

i h n t ớ ạ ố ơ ộ

Quá trình t o ra ti ng nói

ế

ơ ế ạ

ể ể ủ

ph i đ ướ ự ề ổ ượ ầ ồ

ể ầ

C ch t o âm thanh: • Ð phát âm, d không khí t ừ thoát qua các c ng minh tr ộ ngoài. Có th th y hai tr ườ ể ấ i s đi u khi n c a h th n kinh, nói chung ệ ầ c đ y qua khí qu n, vào thanh h u r i ẩ ả ng phía trên thanh h u đ thoát ra ườ ng h p. ợ

• Tr ộ

ng h p 1: K ợ ể ạ ớ ấ ị ệ ộ ớ

hông khí thoát ra làm rung dây thanh v i m t ườ t n s nào đó đ t o nên m t âm v i m t thanh đi u nh t đ nh. ộ ầ ố Ta có âm h uữ thanh (sons sonores/voiced sounds).

hông khí thoát ra không làm rung dây thanh

• Tr đ ng h p 2: K ợ c g i là các âm vô thanh (sons sourds/ voiceless sounds). ườ ượ ọ

C u trúc b máy phát âm ộ

ng cho ho t đ ng

ơ

ượ

ạ ộ

• 1. Các c quan t o năng l ả

phát âm là ph i, khí qu n. ổ

ơ

ế

ạ ậ ộ

• 2. Các c quan t o l p, khu ch đ i và phát ra âm thanh là các b ph n trong thanh h u, trong ậ khoang h u, khoang mi ng và khoang mũi. ệ

2.2 Nén tho iạ Yêu c u c a b mã hoá tho i

ầ ủ ộ

 T c đ bit th p. ố ộ ấ

 Ch t l ấ ượ ng tho i cao. ạ

 Nh n d ng ti ng nói / ngôn ng khác nhau ữ ế ậ ạ

 C ng đ m nh trong kênh truy n nhi u ộ ạ ườ ở ễ ề

 Hi u su t cao đ i v i các tín hi u phi tho i ạ ố ớ ệ ệ ấ

 Kích th c b nh th p và đ ph c t p tính toán th p ướ ộ ộ ứ ạ ớ ấ ấ

 Đ tr mã hóa th p ấ ộ ễ

Ki n trúc t ng quát c a b mã hóa và

ế

i mã tho i t c đ th p

gi

ủ ộ ạ ố ộ ấ

Chu n mã hóa tho i c b n

ạ ơ ả

So sánh gi a các chu n

D đoán tuy n tính-LP

ế

ế

t là LP) là m t ộ i thu t mã hóa t t ế ắ t c gi ế ấ ả ả ế ủ ầ ể ậ

- D đoán tuy n tính (Linear prediction, vi ph n không th thi u c a h u h t t tho i hi n đ i ngày nay. ạ ự ầ ạ ệ

ng c b n là m u ti ng nói t ờ

- Ý t đ i th i đi m n có th ể c nó: ưở ượ ấ ể ẫ ướ ế

ế ẫ ơ ả ạ c x p x b i m t t h p tuy n tính M m u tr ỉ ở ộ ổ ợ X(n) =a1X(n - 1) + a2X(n - 2) + ...+ amX(n - M)

ệ ọ

ể i thi u hóa bình ph ượ

ể ợ ệ ọ ượ ạ ộ

- Trong m t khung tín hi u, các tr ng s dùng đ tính toán k t ộ ế ố h p tuy n tính đ c tìm b ng cách t ng ế ợ ươ ằ ố trung bình l i d đoán; các tr ng s t ng h p, ho c các h s ệ ố ố ổ ỗ ự d đoán tuy n tính (LPC) đ c dùng đ i di n cho m t khung ế ự c th . ụ ể

ệ ố

ậ ạ

ế

H th ng nh n d ng d đoán tuy n tính

AR: Autoregressive

D đoán tuy n tính

ế

][ns

c đoán d a vào M m u trong quá

• D đoán tuy n tính th c hi n ế

ệ ướ

ự kh :ứ

M

^

-= (cid:229)

n ][

]

insa [ i

-

s

= 1 c tính b ng công th c:

L i d đoán đ

i ứ

ỗ ự

ượ

=

ne ][

ns ][

^ ns ][

là các

c đoán c a các thông s AR đ

c xem là các h s d đoán tuy n tính (LPC).

ướ

ượ

ệ ố ự

ế

ia

M

là b c d đoán.

ậ ự

-

Ti pế

c phân tích, cách ti p c n c b n là ta

ượ

ế ậ ơ ả

ng trung bình.

• Đ tìm t p các h s d đoán: ai, i = 1, 2, …, M trên khung đ ươ

ể c c ti u hóa sai s bình ph ự ể

ệ ố ự ố

c tìm b ng cách thi

t l p

ố ư

ế ậ

ể ượ ia

i zezo

Thông s LPC t i u có th đ ằ ố đ o hàm riêng ph n c a J khi ti n t ế ớ ầ ủ ạ

•Dùng gi

i thu t Levinson-durbin và Leoux-Gueguen tính LPC

Ti pế

Ti pế

Ti pế

Gi

i thu t Levison-Durbin

• Gi

ả ộ ự

ệ ậ ế

ậ ộ ự

ầ ộ ậ

ế

ế ụ c b d đoán có b c c n tìm.

i thu t Levison-Durbin th c hi n vi c tìm b d đoán b c th M t b d đoán b c th ứ ừ ộ ự M-1. Đây là quá trình l p đ quy cho đ n khi ệ ặ c l n đ u tiên b d đoán b c zero, sau tìm đ ộ ự ượ ầ đó s dùng b b c zero đ tính b d đoán b c ể ẽ 1 và quá trình ti p t c cho đ n khi tính toán đ ậ ầ

ượ ộ ự

Gi

i thu t Levison-Durbin

Phân lo i mã hóa tho i

Mã hoá sóng

• Mã hoá d ng sóng:

i ta chia mã hoá

ườ

ng ạ

ề ề

• Trong mi n th i gian: mã hoá đi u xung mã (PCM), đi u bi n xung mã vi sai (DPCM) và đi u bi n xung mã vi sai thích nghi

d ng sóng ra làm hai lo i chính ờ ế ế

ề (ADPCM).

ề ầ

ế

• Trong mi n t n s : mã hoá băng con SBC (subband coding) và mã hoá bi n đ i thích ổ nghi ATC (Adaptive Transform Coding).

Mã hoá sóng

- T i phía phát: B mã hóa nh n các tín hi u và mã hóa thành tín hi u

ệ ệ

ươ

ộ ng t ự c khi truy n đi ề - T i phía thu: Làm ng

i đ khôi ph c

c l

ượ ạ ể

ti ng nói

ạ ti ng nói t ế s tr ố ướ ạ ế

Ví d : PCM, DPCM, ADPCM..vv

Mã hoá sóng

c tín hi u sóng gi ng nh tín

ư

ụ ượ

• Đ ph c t p, giá thành, đ tr công su t tiêu

ộ ễ

ng cao t

i các

ế

ấ ượ

c ti ng nói ch t l ơ

c ti ng nói ch t l

ng cao t

i

ế

ấ ượ

• Khôi ph c đ hi u g c ố ệ ộ ứ ạ th th p ụ ấ • Ch t o đ ỉ ạ ượ t c đ l n h n 16kbps ố ộ ớ • Không t o đ ạ ượ t c đ nh h n 16kbps ỏ ơ ố ộ

Mã hóa Vocoder

• Mã hoá Vocoder s d ng mô hình t o tín hi u tho i và khai ử ụ ệ

thác các thông s c a mô hình này đ mã hoá tín hi u. ố ủ ạ ệ ạ ể

• Cac vocoder ho t đ ng d a trên mô hình c quan phát âm ạ ộ ự ơ

c g i đ n b gi ượ ử ế ộ ả ồ

• Thông tin đ i mã bao g m: tham s ố c a b l c, tín hi u kích thích V/UV, chu kì pitch ..vv. ủ ộ ọ ệ

ụ ự ự ế

ự ế ằ

• Ví d : LPC,mã hoá d đoán tuy n tính có s kích thích k t ế h p MELP và mã hoá d đoán tuy n tính kích thích b ng tín ợ hi u sau d đoán RELP..vv ệ ự

Mã hóa Vocoder (mã hóa ki u phát âm)

ậ ề ư

ỹ ố ệ ồ

ứ ể ộ

ế ằ

• Có nhi u k thu t mã hoá Vocoder nh : mã hoá formant, mã hoá tham s và mã hoá đ ng hình. Tuy nhiên, hi n nay ch ủ y u t p trung vào nghiên c u và phát tri n các b mã hoá ế ậ tham s nh mã hoá d đoán tuy n tính kích thích b ng hai ự ư ố tr ng thái (mã hoá LPC), ạ

ế ợ

ự ự ế ế ệ ằ

ườ

• Mã hoá d đoán tuy n tính có s kích thích k t h p MELP và ự mã hoá d đoán tuy n tính kích thích b ng tín hi u sau d ự ng dùng cho đoán RELP. Các b mã hoá tham s này th ộ đi n tho i qua v tinh và trong quân đ i. ố ộ ệ ệ ạ

u nh

Ư

ượ

c đi m c aVocoder ủ

ộ ấ ượ ng ph thu c nhi u vào mô hình tho i ạ ề

ả ạ ể

t o ạ ả ớ ỗ ấ

• Ch t l ụ • CácVocoder có th phát âm khá gi • Ch t l i. ấ ượ • Có th cung c p tho i s v i t c đ nh h n 2kbps ể ng kém các vocoder r t nh y c m v i l ạ ố ớ ố ộ ỏ ơ ấ

Mã hóa lai

• S d ng c 2 công ngh mã ho á sóng và mã hoá Vocoder ử ụ ệ ả

c ch t l ng tho i t i c t t ể ạ ượ ấ ượ ạ ố ạ ác t c đ b ố ộ ít 2-

• Có th đ t đ 16kbps.

ổ ế ấ à mã hóa phân tích b ng c ằ

• Mã hóa lai ph bi n nh t l ách t ng ổ h p AbS (Analysis-by-Synthesis), RPE-LTP, CELP, ACELP, CS- ợ CELP…

Mã hóa d đoán tuy n tính LPC

ế

Mô hình LPC t ng h p ti ng nói

ế

M i quan gi a mô hình LPC v i mô ữ hình phát âm

Mã hóa d đoán tuy n tính LPC

ế

• Tín hi u tho i s khi đ a vào mô hình s đ

c chia

ạ ố

ẽ ượ

ư

thành các frames 20ms , mô hình s phân tích và trích tr n và Vector A đ i đi n cho 160 m u tho i đó và nó s đ

ạ c mã hóa và g i t

ẫ i đ u thu:

ệ ử ớ ầ

ẽ ượ

S đ kh i c a b mã hóa LPC

ơ ồ ố ủ ộ

ng h p

Giá tr P trong tr ườ tín hi u là vô thanh

ị ệ

ng h p

ườ

Giá tr P trong tr tín hi u là h u thanh

ị ệ

S đ kh i c a b mã hóa LPC

ơ ồ ố ủ ộ

2.4kbps LPC Vocoder

2.4kbps LPC Vocoder

Nh

ượ

c đi m c a LPC ủ

• Gi

ng h p, m t khung âm thanh không ph i

ộ ố ườ

ch đ

ớ ạ ỉ ượ

i h n 1: Trong m t s tr c phân lo i thành h u thanh và vô thanh ữ

• Gi

chu i xung có chu kỳ t o kích thích không phù h p v i th c t

i h n 2: Vi c s d ng hoàn toàn nhi u ng u nhiên ho c hoàn toàn ớ ạ ỗ

ệ ử ụ ạ

ặ ự ế

i h n 3: Thông tin v pha c a tín hi u nguyên th y không đ

c xem

ớ ạ

ượ

• Gi xét.

• Gi

i h n 4: Ph

ươ

ớ ạ

ệ ổ

ệ ể

vi c phân tích LP vi ph m n n t ng c a mô hình AR.

ng pháp th c hi n vi c t ng h p các khung tho i, ỗ ộ c t ượ ừ ệ

trong khi m t chu i xung dùng đ kích thích b l c t ng h p v i các h ệ s có đ ố

ộ ọ ổ ủ

ề ả

Mã hóa LPC

- D đoán tuy n tính là m t ph n không th ể

i thu t mã hóa

ầ ậ

ộ ả

ế ự thi u c a h u h t các gi ế ế ủ ầ tho i t c đ th p ạ ố ộ ấ ệ ự

ả ế ẫ

ượ

ể ư

i 2kbps mà ch t l

ậ ướ

ấ ượ

ộ ấ

- Vi c phát tri n và c i ti n các b mã hóa ộ c xem d a trên mô hình LPC v n đang đ xét đ đ a ra các thu t toán mã hóa tho i t c ạ ố ng đ th p th m chí d tho i v n đ m b o yêu c u ả

ậ ả

ạ ẫ

Mã hoá phân tích b ng t ng h p AbS ằ

• Mã hóa lai có nhi u ph ề ư ươ

ấ ế ươ ổ ng pháp nh ng ph ằ

ộ ợ ử ụ

ơ ư ố ồ

ủ ử ụ

ư ả ồ

ố ắ ế ọ

ớ ạ ố ố

ạ ậ

i đ ph c t p c a b mã hoá. ng pháp ph ổ bi n nh t là mã hoá phân tích b ng cách t ng h p AbS (Analysis-by-Synthesis). B mã hoá này cũng s d ng mô i gi ng nh mã hoá ngu n. hình c quan phát âm c a ng ườ Tuy nhiên, thay vì s d ng các mô hình tín hi u kích thích ệ đây tín hi u kích thích đ n gi n nh mã hoá ngu n thì ệ ơ ở c d ng sóng ti ng nói tái c ch n sao cho c g ng đ t đ đ ượ ạ ượ ạ t o càng gi ng v i d ng sóng ti ng nói ban đ u càng t t. ầ ạ ế Đây chính là đ c tính phân bi t s khác nhau gi a các b mã ộ ữ ệ ự ặ hoá ki u AbS. Thu t toán tìm ra d ng sóng kích thích này ể quy t đ nh t ế ị ớ ộ ứ ạ ủ ộ

LPC phân tích b ng t ng h p

Mã hoá phân tích AbS (Analysis-by- Synthesis)

Mã hoá phân tích b ng t ng h p AbS ằ (Analysis-by-Synthesis)

Ti p ế

ấ ế

ườ

ự ả

i (tai ng

ể ậ

ượ

ơ

ộ ọ

ộ ằ

• Ngoài vi c khai thác các tính ch t ti ng nói i ta còn khai thác s c m đ mã hoá, ng nh n âm thanh c a tai ng i ủ ườ ườ c nh ng âm thanh b không c m nh n đ ị ữ ượ ả ng che đi b i các âm thanh khác có năng l ở l n h n m t m c nh t đ nh) trong mã hoá ấ ị ớ ti ng nói b ng khái ni m b l c nh n c m ệ ế nh n.ậ

4.8 kbps CELP Coder

4.8 kbps CELP Coder

• CELP D đoán tuy n tính kích thích mã Code-

ế

Excited Linear Prediction.

• Nguyên t c gi ng LPC Vocoder ch có m t s ộ ố

ứ ạ

hóa Vector

ng t

đi m khác : ể – Kích th c Frame là 30 msec (240 m u ) ướ – Mã hóa tr c ti p ự ế – C n nhi u bít mã hóa h n ơ ề – Tính toán ph c t p h n ơ – S d ng thêm b l c d đoán chu kỳ pitch ộ ọ ự ử ụ – S d ng l ử ử ụ

ượ

Nh n xét

H u h t t ầ ề ự

i ta đ a ra các t c các b mã hóa đ u d a trên mô hình LPC, tuỳ ế ấ ả ạ ườ ư

ộ theo cách t o ra tín hi u kích thích mà ng ệ lo i mã hoá lai khác nhau nh : ư ạ

- Mã hoá đa xung MPE-LTP - Mã hoá xung đ u RPE-LTP - Mã hoá kích thích b ng mã CELP,ACELP,CS-ACELP.. - Mã hoá kích thích vect t ng VSELP….vv ơ ổ

ượ ụ ắ

ng đ i ộ ấ ạ ố ộ ấ ụ ị c đi m c a LPC và ủ ng t ố ượ ươ

Các b mã hóa trên đã kh c ph c nh ể cung c p d ch v tho i t c đ th p và chât l t ố t

M t s ph

ng pháp đánh giá ch t

ộ ố ươ

ng tho i

l ượ

• Ph

ươ

ể ế

ng pháp đánh giá theo thang đi m MOS (Mean Opinion Score) d a trên khuy n ngh ị ự ITU-T P.800

• Ph

ươ

ng pháp đánh giá d a trên mô hình giác ự

ế

quan PSQM (Perceptual Speech Quality Measurement) theo khuy n ngh ITU-T P.861 • PESQ (Perceptual Evaluation of Speech Quality)

ế

ươ

theo khuy n ngh ITU-T P.862 ị ự

ng pháp d a trên mô hình đánh giá truy n ẩ

• Ph d n E-model theo tiêu chu n ETR 250 c a ẫ ETSI.

Các y u t

nh h

i ch t l

ng tho i

ế ố ả

ấ ượ

ng t ưở trong VoIP

• Đ n đ nh

ộ ổ

• Băng thông

• Ti ng v ng

ế

t b đ u

ế ị ầ

• Tr : Tr c lý, tr do mã hoá, tr đ m ễ cu i IP, tr gói hoá H.323, tr truy n d n m ng ẫ

ễ ệ ở ề

ễ ử ễ

thi ạ

• Bi n đ ng tr

ế

• T n th t gói

Ph

ng pháp đánh giá ch quan (MOS)

ươ

• Bài ki m tra h i tho i (Conversation Opinion ạ

Test).

• Đánh giá phân lo i tuy t đ i (Absolute Category

ệ ố

Rating (ACR) Test).

ng th c phân lo i theo suy hao (Degradation

• Ph

ươ

ứ Category Rating (DCR)).

• Ph

ng th c phân lo i so sánh (Comparison

ươ

Category Rating (CCR)).

Nh

c đi m MOS

ượ

• Ph

ề ủ ể ể ế ố ế ủ

ươ ộ ư ạ

, ph ươ

ng th c này mang tính ch t ch quan vì k t qu ph ứ ụ ả ấ không th ki m soát c a ch th thu c vào nhi u y u t ủ ể nh : tr ng thái tâm lý, thái đ đ i v i bài ki m tra và trình đ ộ ể văn hóa. Trên th c t ng tho i ấ ượ ạ ự ế ng th c nh t quán. theo thang đi m MOS không ph i là ph ấ ứ ộ ố ớ ng th c đánh giá ch t l ứ ươ ể ả

• Ph i tham gia ứ ấ ố ề ỏ ườ

ươ và thi t l p ph c t p. ng th c này r t t n kém, đòi h i nhi u ng ế ậ ứ ạ

• ng xuyên các tham s ch t l ệ

ng ấ ượ ng này là ườ ố ng pháp đánh giá ch t l ấ ượ

Khi c n th c hi n đo th ầ ự thì vi c s d ng ph ươ ệ ử ụ . không th c t ự ế

Ph

ng th c đánh giá ch t l

ng tho i

ươ

ấ ượ

PSQM

ể ự

c x lý b i m t b ộ ộ ở

ượ ử

ệ ố

ế

c đ a vào h th ng và đ ư ủ

ượ ư ố

ẫ ấ ủ

ệ ử ụ

ệ ạ ấ đánh giá MOS đ

Đ th c hi n phép đo PSQM, m t m u ti ng nói đ mã hóa tho i b t kỳ. Nh ng tính ch t c a tín hi u vào gi ng nh c a các tín hi u s d ng cho phép ữ c đ nh nghĩa trong chu n ITU P.830. ượ ị

ệ ẩ

Ph

ng pháp PESQ

ươ

Mô hình đánh giá truy n d n E-Model

ề ẫ

C u hình tham kh o c a mô hình E

ả ủ

ấ ể ng tho i c a mô hình E-Model

Các tham s dùng đ đánh giá ch t l ượ

ố ạ ủ

• Giá tr truy n d n R

• T l

ỉ ệ

tín hi u trên nhi u ễ

• Tham s suy hao I ố s

ế

• Tham s suy hao liên quan đ n tr I ễ d

• Tham s suy hao thi

ế ị

t b I e

• Tham s tích c c A ố

K t qu đánh giá ch t l

ấ ượ

ế

ng tho i ạ

Các ph

ng pháp c i thi n QoS

ươ trong m ng VoIP ạ

•T c đ truy nh p cam k t ế

ố ộ

• X p hàng trên c s l p ơ ở ớ

ế

• L p d ch v

• Các d ch v phân bi

t ệ

• Quy n u tiên IP

ề ư

• Chuy n m ch nhãn đa giao th c MPLS

• X p hàng theo VC

ế

• Đ nh tuy n theo chính sách

ế

• Các hàng QoS

• Lo i b s m ng u nhiên

ạ ỏ ớ

• Giao th c d tr tài nguyên ứ ữ ữ

• Đ nh hình l u l

ng

ư ượ

• X p hàng h p lý theo tr ng s

ế

Nh n xét

ng tho i m t chi u t ể ấ ượ ề ừ ạ ộ

• S d ng PESQ đ đánh giá ch t l ầ ử ụ đ u cu i đ n đ u cu i. ầ ố ế ố

ể ượ ử ụ nh h ưở c s d ng đ phân tích ể ng đ n ch t ế ế ố ả ấ ị

• Mô hình đánh giá E-Model có th đ h th ng nh m xác đ nh các y u t ệ ố l ượ

ng ằ ng tho i. ạ ế

ươ i vi c đánh giá • Ngoài ra, n u có đi u ki n có th s d ng k t h p ph ệ ể ể ế ợ ệ ủ ạ

ể ử ụ ề pháp đánh giá ch quan đ ki m ch ng l ứ theo PESQ.

ng 2

H ng d n ôn t p ch ẫ

ướ

ươ

i.

• Các tham s đánh giá đ c tr ng cho âm thanh. ố • S đ ch c năng c a tai ng • S c m th c a tai ng ụ ủ

ng nghe, m t n t n s , ặ ạ ầ ố i h n) và ng d ng trong mã hóa âm

ư ườ ườ ố ớ ả

ơ ồ ứ ự ả ặ ạ ờ

i đ i v i âm thanh (Ng ưỡ ứ ầ ớ ạ

m t n th i gian, các d i băng t n t thanh.

ng pháp mã hóa tín hi u tho i (mã hóa d ng sóng, mã

• Quá trình t o ti ng nói và ng d ng trong mã hóa tham s tín hi u tho i. ạ ế • Mô hình chung c a b mã hóa tho i. ủ ộ ạ • Phân lo i các ph ươ

hóa tham s và mã hóa lai).

ng pháp mã hóa PCM, DPCM, ADPCM.

ươ

• Ph • Mã hóa tham s - LPC. • Mã hóa lai – AbS, MPE, RPE và CELP. • Mã hóa âm thanh. • So sánh gi a nén tho i và nén âm thanh.

ng 2

H ng d n ôn t p ch ẫ

ướ

ươ

hóa các xung m u.

ượ

ẽ ng t ử

• Trong các hình v trên : (a) Tín hi u hình âm thanh hình Sin; (b) L y m u tín ẫ

ử ấ

ể ấ

ệ ử ụ ầ

ể ể

ư

ế

ẫ ạ

hi u; (c) L ệ hình v (c) chúng ta có th th y nhi u l xu t hi n do vi c s d ng ng t Ở ẽ ễ ượ các t i mã 4 bit đ bi u di n cho 9 m c giá tr khác nhau. Xung m u đ u tiên t ứ ạ ị th i đi m 0 là chính xác, nh ng m t s các xung m u ti p theo thì không. Tính ộ ố ể ờ i các th i đi m 1/32, 2/32 và 3/32 c a toán sai s (theo %) cho các xung m u t ố chu kỳ l y m u? ấ

Ch

ng 3

ươ

X lý nh ử ả

X lý nh s ố

ử ả

ế

ổ ả

X lý nh s là quá trình bi n đ i nh s ố

ố ượ ạ

ả trên máy tính (PC). c t o ra b i m t s h u h n các nh s đ Ả ạ ộ ố ữ ở i m t v trí đi m nh, m i đi m nh n m t ộ ị ằ ỗ ể ả ể ả nh t đ nh và có 1 giá tr nh t đ nh. M t đi m ể ộ ấ ị ị ấ ị nh trong m t nh còn đ c g i là m t pixel ộ ượ ọ ộ ả ả

T i sao c n x lý nh s ? ố ầ ử ả

• T i sao ph i nén tín hi u? ả

ượ ủ ụ

ạ – – H n ch v không gian l u tr và t c đ đ

ệ c s d ng m i lúc, m i n i ọ ơ ọ ữ

nh đ ạ

ư

ố ộ ườ

ng truy n ề

• Lý do ph i x lý nh

ả i trong quá trình thu nh, truy n d n và hi n th (h i ph c, ề ể ị ỗ

ị ồ

ấ ượ

ng nh, n i suy) ộ nh có th mang các n i dung nh y c m (vd, ch ng l

i copy không h p

ạ ả

ế ề ả ử nh có th b l Ả nâng cao ch t l Ả pháp, gi

ộ ừ ả

• Lý do ph i phân tích nh

– D y máy tính có kh năng “nhìn” đ

c (nh n d ng)

ể m o và l a đ o) ả ạ – T o các b c nh có hi u ng ngh thu t ậ ệ ứ ứ ả ả ả

ượ

ệ ố

Các giai đo n chính trong h th ng x lý nh ử ả

ệ ố

Các giai đo n chính trong h th ng x lý nh ử ả

, s ). ậ ả ươ ự ố

ừ ệ ộ ả ứ

• + Thu nh n nh: - Qua các camera (t ng t - T v tinh qua các b c m ng (Sensors). ả

ng t • + S hóa nh: Bi n đ i nh t - Qua các máy quét nh (Scaners). ế ổ ả ả ự ươ

ả ẫ ố ằ

ng t ặ ử ượ ờ ạ ề ặ

ộ ế thành nh r i r c đ x ờ ạ ể ử lý b ng máy tính: Thông qua quá trình l y m u (r i r c v ờ ạ ề ấ m t không gian) và l hóa(r i r c v m t biên đ ). ố ộ ỏ ạ

ề ụ ả ả

ặ ọ

• + X lý s : là m t ti n trình g m nhi u công đo n nh : Tăng ồ ử c ng nh (Enhancement), khôi ph c nh (Restoration), phát ườ hi n biên (Egde Detection), phân vùng nh (Segmentation), ệ trích ch n các đ c tính (Feature Extraction)... ụ ể ệ

• + H quy t đ nh: Tùy m c đích c a ng d ng mà chuy n ề ủ ứ ậ ế ị ạ ụ ể ạ ớ

sang giai đo n khác là hi n th , nh n d ng, phân l p, truy n ị thông…

ủ ệ ố

Các thành ph n chính c a h th ng ầ x lý nh ử ả

B nh ớ ộ trong

Màn hình hi n thể ị

Máy tính

B nh ớ ộ ngoài

Ph n m m x lý nh

B x lý ộ ử hình nh ả chuyên d ngụ

Thi t b thu ế ị nh n hình nh

ng d ng c a x lý nh

ủ ử ả

v tinh có th đ

 Trong y h c ọ  Trong lĩnh v c đ a ch t, hình nh nh n đ ự

ể ượ

ậ ậ

ả ỹ

ị ề ặ

c t ượ ừ ệ ổ ườ

c phân tích đ xác ng biên (image enhancement) và khôi ng nh v tinh và t o ra

ấ ượ

ả ồ ị

ng h c, nh nh n đ

đ nh c u trúc b m t trái đ t. K thu t làm n i đ ị ph c hình nh (image restoration) cho phép nâng cao ch t l các b n đ đ a hình 3-D v i đ chính xác cao. c t

h th ng v tinh theo dõi th i ti

ượ

c x lý, nâng cao ch t l

ượ ừ ệ ố ể ạ

ờ ế ấ

ề ặ

ớ ộ ọ ả đ ấ ượ ượ vùng r ng l n, qua đó có th th c hi n vi c d báo th i ti ể ự

ượ ử ụ

 Trong ngành khí t ử ộ  X lý nh còn đ ả

t cũng ệ ng và ghép hình đ t o ra nh b m t trái đ t trên m t ả ộ t m t cách chính xác h n. ờ ế ả

ệ ố

ấ ượ ả

ơ ng và s l ố ượ ể ẩ

ư ệ ố ệ

ề ự ộ ự

ệ ệ ố

ế

ả camera quan sát.

c s d ng r ng rãi trong lĩnh v c hình s và các h th ng b o m t ậ

ệ ố

ệ ự ng c s d ng nhi u trong các h th ng qu n lý ch t l ề hàng hóa trong các dây truy n t đ ng, ví d nh h th ng phân tích nh đ phát hi n ệ ụ b t khí bên v t th đúc b ng nh a, phát hi n các linh ki n không đ t tiêu chu n (b bi n ị ế ọ d ng) trong quá trình s n xu t ho c h th ng đ m s n ph m thông qua hình nh nh n ậ ạ c t đ ượ ừ  X lý nh còn đ ả ử ể ặ

ậ ử ụ

ư ả

 Ngoài ra, có th k đ n các ng d ng quan tr ng khác c a k thu t x lý nh tĩnh cũng ủ ỹ đ ng nh n d ng, nh n d ng m c tiêu quân s , máy ạ ậ đ ng, nén nh tĩnh, nh đ ng đ l u ả

ọ ậ ạ ể ự ộ

ể ư

ượ ử ụ ho c ki m soát truy c p ậ ụ ể ể ế nh nh đ ng trong đ i s ng nh t ư ự ộ ờ ố nhìn công nghi p trong các h th ng đi u khi n t ề ệ ố và truy n trong m ng vi n thông v.v. ễ ạ

S hóa nh

.

Ph

ng pháp chung đ s hóa nh là l y m u theo hàng và mã hóa t ng hàng

ươ

ể ố

Nguyên t c s hóa nh ắ ố

fi(m,n)

nh vào

L

ng hóa

u(m,n)

ượ

Máy tính

L y m u ẫ

Ả f(x,y)

. ự Ả

ả ấ ươ ẫ ng t ự nh vào là nh t ế ệ ệ ả

ờ ạ ề ặ ấ ẫ

ụ ề ặ ư

hóa v m t biên đ (đ sáng) ộ ộ ề ặ ượ ế

• • Ti n trình l y m u th c hi n các công vi c sau: Quét nh theo hàng, và l y m u theo hàng. Đ u ra là r i r c v m t không ầ gian, nh ng liên t c v m t biên đ . ộ ng t ng hóa: l ử ượ c r i r c hóa. ừ ượ ờ ạ • Ti n trình l cho dòng nh v a đ ả

L y m u

f

max

x

x

ổ ữ ạ

ầ ỏ ề

c nh y(chu kỳ l y m u)

• Yêu c u tín hi u có d i ph h u h n ả f • c l y nh th a mãn đi u ki n trên, và đ ượ ấ ệ ề i hình ch nh t, v i ớ ộ ướ ẫ ấ ướ

Ả m u đ u trên m t l b ả

ữ ậ ẫ D x, D y sao cho

£

2

f

,

2

f

x

max

y

max

‡ ‡

1 y

1 x luôn t n t

• Th c t

i nhi u ng u nhiên trong c dùng

ự ế ồ ạ nh, nên có m t s k thu t khác đ ộ ố ỹ i không vuông, l

ượ i bát giác.

ả đó là: l

ậ ướ

ướ

D D

L

ng t

hóa

ượ

• L

m t bi n

ượ

ạ ừ ộ

ế

{

}

,...,

, 2 rr 1

Lr

ng hóa nh nh m ánh x t ị ộ ễ ị ớ

ả liên t c ụ u(bi u di n giá tr đ sáng) sang m t ộ ể ế ờ ạ u* v i các giá tr thu c t p h u bi n r i r c ộ ậ ữ h n ạ

• C s lý thuy t c a l

ơ ở

ế ủ ượ

ỏ ng

ờ ạ ề ộ

ắ 2 B

ậ ủ ố

c

ng ch n B=8, m i đi m nh s đ ỗ

ẽ ượ

ườ

ng hóa là chia d i đ ả ộ sáng bi n thiên t ừ Lmin đ n ế Lmax thành m t ộ ế s m c (r i r c và nguyên)- Ph i th a mãn ả ố ứ tiêu chí v đ nh y c a m t. Th ườ Lmin=0, Lmax là s nguyên d ng ạ (Th ể ả ọ mã hóa 8 bít).

nh t

ng t

và nh s hóa

ươ

ự Ả

Các tiêu chu n l y m u

ẩ ấ

ẩ ấ

ẩ ấ

l

ề ể

ươ

• Các tiêu chu n l y m u video thành ph n: có ẫ nhi u tiêu chu n l y m u theo thành ph n, ẫ gi a t n s đi m khác nhau ch y u ủ ế ở ỷ ệ ữ ầ ố l y m u và ph ng pháp l y m u tín hi u ẫ ẫ ấ chói và tín hi u màu (ho c hi u màu):

t ấ ệ

• đó là các tiêu chu n 4:4:4, 4:2:2, 4:2:0, 4:1:1.

Tiêu chu n 4:4:4 ẩ

ẩ c l y m u t

ượ ấ

ẫ ấ

• Tiêu chu n 4:4:4: Tín hi u chói và màu i t t c các đi m l y m u đ ẫ ạ ấ ả ể trên dòng tích c c c a tín hi u video. C u ự ủ trúc l y m u tr c giao ự ẫ

Tiêu chu n ẩ 4:4:4

Đi m l y m u tín ẫ hi u chói

ấ ệ

Đi m l y m u tín hi u Cệ

R

Đi m l y m u tín hi u Cệ

B

Tiêu chu n 4:4:4 ẩ

ượ

ụ i 720x576 (h PAL), 8 bít l ệ ữ ệ ố ồ

• ví d khi s hóa tín hi u video có đ phân ộ gi /đi m ng t ể ử ả c nh, 25 nh/s lu ng d li u s nh n đ ả ậ ượ s có t c đ : 3x720x576x8x25= 249Mbits/s ẽ

ả ố ộ

Tiêu chu n 4:2:2 ẩ

c l y m u t

t c các

ượ ấ

• Tín hi u chói đ ệ ấ

i t ẫ ạ ấ ả ự ủ ỗ c l y m u v i t n s b ng n a t n s ử ầ ố ớ ầ ố ằ

đi m l y m u trên dòng tích c c c a tín ể hi u video. Tín hi u màu trên m i dòng ệ đ ượ ấ l y m u tín hi u chói ẫ ấ

Tiêu chu n ẩ 4:2:2

Đi m l y m u tín ẫ hi u chói

ấ ệ

Đi m l y m u tín ấ hi u Cệ

R

Đi m l y m u tín ấ hi u Cệ

B

Tiêu chu n 4:2:0 ẩ

t c các đi m l y m u trên dòng tích c c c a

ượ ấ

ấ ệ

l y m u tín hi u CB. Nh v y, n u t n

• Tín hi u chói đ ệ ệ ẫ

i t c l y m u t ự ủ ẫ ạ ấ ả tín hi u video. Cách m t đi m l y m u m t tín hi u màu. T i dòng ch n ch ỉ ẫ ấ ể ộ l y m u tín hi u màu CR, t i dòng l ẻ ấ ế ầ ạ ấ s l y m u tín hi u chói là fD, Thì t n s l y m u tín hi u màu s là fD/2. ầ ố ấ ố ấ

ư ậ ẽ

Tiêu chu n ẩ 4:2:0

Đi m l y m u tín ẫ hi u chói

ấ ệ

Đi m l y m u tín ấ hi u Cệ

R

Đi m l y m u tín ấ hi u Cệ

B

Tiêu chu n 4:1:1 ẩ

c l y m u t

ượ ấ

i t ẫ ạ ấ ả

ẫ ượ ấ

ể ỗ

ẫ ầ ố ấ

• Tín hi u chói đ t c các đi m l y m u trên dòng tích ệ c l y m u v i c c c a tín hi u video. Tín hi u màu trên m i dòng đ ớ ẫ ệ ự ủ t n s b ng m t ph n t t n s l y m u tín hi u chói . Nh v y, n u ư ậ ế ệ ầ ư ầ ố ấ ộ ầ ố ằ t n s l y m u tín hi u chói là fD, thì t n s l y m u tín hi u màu CR ệ ầ ố ấ và CB s là fD/4. ẽ

Tiêu chu n ẩ 4:1:1

Đi m l y m u tín ẫ hi u chói

ấ ệ

Đi m l y m u tín ấ hi u Cệ

R

Đi m l y m u tín ấ hi u Cệ

B

Bi u di n tín hi u nh s

ệ ả

)

f

...

f

0,

N

-

( (

) 0,0 )

( (

0,1 )

( (

) 1 )

1,0

1,1

f

...

f

1,

N

1

=

)

( f x y ,

M

-

)

)

M ( f M

1,0

M ( f M

) 1,1 ...

( f M

1,

N

1

f � � f � � � � �

� � � � � � �

- - - -

=

d

¥ ¥

), nmS

(

lnkmlkS

(),(

,

)

¥=

¥=

k

l

- - (cid:229) (cid:229) - -

0

Mkm

,

0,1

Nln ,

1

V i ớ

- £ £ - £ £

Các ph

ng pháp xác đ nh

ị và d đoán biên nh

ươ ự

ng n i các đi m nh n m

ườ

ườ

ể ả

• Đ ng biên là đ ự ả

ổ ộ

ng biên th

ườ

ườ

M c ứ xám

Đ ng biên lý

ằ trong khu v c nh có thay đ i đ t ng t v ộ ề ng ngăn cách hai đ chói, đ vùng nh có các m c xám g n nh không ư đ i. ổ

L2

ườ t

ng

ưở

L1

M c ứ xám

ườ ứ

L2

Đ ng biên có m c xám tăng d nầ

L1

M c ứ xám

L2

Đ ng biên ườ th c tự ế

L1

Ph

ng pháp phát hi n đ

ng biên

ươ

ệ ườ

 1- Ph ươ ệ ườ

ề ự ủ ả ng pháp phát hi n đ ổ ộ

ệ ạ ấ

ạ ấ ươ ạ

ng biên trong nh màu: phân ả

ng biên tr c ti p d a trên các ự ế ự phân tích v s thay đ i đ chói c a nh. K thu t ch y u ủ ế ậ ỹ dùng đ phát hi n biên là dùng đ o hàm. Khi l y đ o hàm ng pháp gradient, khi l y đ o b c nh t c a nh ta có ph ậ hàm b c hai ta có k thu t Laplace. ậ ng pháp phát hi n đ ệ ườ ả ơ ở ự ể ấ ủ ả ậ  2- Ph ươ ơ ắ ả ng biên trên c s s thay đ i màu s c trong các nh đ n ổ ị ả ắ ơ

tích nh màu thành các nh đ n s c (R,G,B) và xác đ nh đ ườ s c nói trên. ắ

ả ư ể

 3- Phân tích nh thành vùng theo các đ c đi m đ c tr ng (thí ặ ặ i gi a các vùng chính là ớ ữ

ng biên c a nh. d k t c u b m t (texture)), ranh gi ụ ế ấ ề ặ đ ủ ả ườ

Ph

ng pháp Gradient

ươ

f(x,y)

G(x,y)

E(x,y)

ng

So sánh ng

ngưỡ

Làm n i đ ổ ườ biên

ườ

ượ

ư ươ

c đ a vào kh i làm n i đ ố ế

ượ Ả ả ng biên đ đ ộ ườ ố ạ

ườ

i kh i so sánh, ng ớ

ượ ả ị

ưỡ ổ ộ

 nh g c f(x,y) đ ng Ả ố đây, b ng ph biên. ng pháp x lý tuy n tính ằ Ở c làm tăng m c chênh ho c phi tuy n nh F(x,y) đ ế ả ặ l ch đ chói gi a các vùng nh. nh G(x,y) là nh ữ ệ ng biên gi a c tăng c g c đã đ ữ ườ ố i ta so các vùng nh. Sau đó, t sánh giá tr các đi m nh G(x,y) v i m c ng ng T ể ả đ xác đ nh v trí các đi m có m uc thay đ i đ chói ể l n. ớ

Nén nh ả

• Nén nh là gì? Ả • M c đích c a nén nh • Các khái ni mệ • Nén nhẢ • Các chu n nh nén hiên nay

ẩ ả

NÉN NH LÀ GÌ?

• Nén là quá trình làm gi m thông tin d th a

ư ừ

trong d li u.

ữ ệ 1600x1200

1600x1200

Nén

5,7MB

406KB

M C ĐÍCH C A VIÊC NÉN NH

• Truy n Thông: ề

100KB/s ~ 1phut

5,7MB=5760KB

3x640x480 x8 x24 = 177MB

Video 24 h/s

Nén nhả

• T i sao l ạ

i c n nén nh? ạ ầ ả

ụ ố

fi D li u ban đ u – 24bits, 5.3M pixels 16M bytes ­Ví d : camera s (4Mpixel) ữ ệ ầ

256M memory card ($30-50) fi 16 pictures

ả Nén JPEG

nh thô (16M bytes) compressed JPEG file (1M bytes)

compression ratio=16 fi 256 pictures

Ví dụ

Ví dụ

t

ữ ế

ư

Nén đ gi m không gian l u tr , ti ể ả ki m băng thông

CÁC KHÁI NI M Ệ

M t s tham s đ c dùng đ đánh giá ch t l ng c a nh nén ộ ố ố ượ ấ ượ ể ủ ả

Peak Signal-to-Noise Ratio(PSNR):

CÁC KHÁI NI M Ệ

ng pháp nén.

• T s nén: Là đ c tr ng c a m i ph ặ

ỷ ố

ư

ươ

. ự

• D th a d li u: ư ừ ữ ệ – S phân b kí t ự ố ự – S l p l . i ký t ự ự ặ ạ – S phân b c a các chu i ký t ự ố ủ – D th a trong pixel (Interpixel Redundancy) ư ừ – D th a tâm lý th giác ư ừ

D TH A D LI U Ư Ừ Ữ Ệ

ơ

• S phân b ký t ự – M t s ký t ự ộ ố h n so v i các ký t ớ ơ ( nh) .Ta có th thay th các ký t ự ả mã nh phân ít bít h n và các ký t nhi u h n b ng t ừ ơ

ơ

– Dùng mã hóa Huffman đ mã hóa lo i d th a

ự (pixel) xu t hi n v i t n su t l n ấ ớ ớ ầ ấ khác trong d li u g c ố ữ ệ này b ng t ừ ằ ế xu t hi n ệ ấ ự mã nh phân có nhi u bit h n. ề ạ ư ừ

ị ể

này.

D TH A D LI U Ư Ừ Ữ Ệ

• S l p l

i các ký t

ự ặ ạ

(bit 1 ho c 0) đ

ượ ặ

– M t chu i các ký t ỗ ề ầ

ỗ ặ ắ

ơ

c l p ộ i nhi u l n. Ta có th mã hóa chu i l p đó l ể ạ b ng ít bit h n. Đây chính là nguyên t c ho t ằ đ ng c a mã hóa RLC ( Run-Length Coding) ộ

D TH A D LI U Ư Ừ Ữ Ệ

(pixel) có t n su t xu t hi n

i c a các chu i ký t ự

: ự ầ

• S l p l ự ặ ạ ủ – M t s chu i ký t ỗ ộ ố ng đ i cao. ố

t ươ

– Có th mã hóa các chu i đó b ng t

mã ít bít

h n .ơ

– Đ x lý lo i d th a này ta s d ng ph

ng

ể ử

ươ

ạ ư ừ pháp mã hóa LWZ (mã hóa ki u t

đi n) .

ử ụ ể ừ ể

Nén t n th t và nén không t n th t

• Nén m t thông tin và không m t thông tin

– Nén m t thông tin:

Nén

ẢNH NÉN

Giải Né

n

Nén nh có t n th t ấ

JPEG decoder compressed JPEG file   (20,407 bytes)

Q Q decompressed image

100 low compression ratio

high quality

high compression ratio

low quality 0 original raw image  (262,144 bytes)

Nén t n th t và nén không t n th t

• Nén m t thông tin và không m t thông tin

– Nén không m t thông tin:

Nén

ẢNH NÉN

Giải Né

n

Nén nh không t n th t ấ

i nén gi ng hoàn toàn v i nh g c ớ ả ố ố

•  Đ nh nghĩa ­  nh sau khi gi ả Ả (zero error)

ệ ố

•  H s nén (Compression ratio) - Ph thu c l n vào ki u nh và n i dung nh ể ả ụ ả ộ

ộ ớ ả ả

nh nhân tạo  >10 nh tự nhiên  1~3

• Ứng dụng -L u tr và truy n các nh y h c ư ọ ề ữ ả

Các k thu t nén nh không ỹ t n th t ph bi n ổ

ả ổ ế

ậ ấ

c phát minh ượ

•  WinZip ­ D a trên thu t toán Lempel-Ziv đ ậ ự cách đây 30 năm

•  GIF (Graphic Interchange Format)

ự ậ ạ ở

-D a trên thu t toán LZ nâng cao, t o ra b i Welch năm 1983

•  PNG (Portable Network Graphics)

S đô khôi hê thông nen anh tiêu biêu

ơ ̀

ng

B mã ộ hóa

Tín hi u ệ nén

Tín hi u ệ g cố

B chuy n ộ đ iổ

B l ộ ượ hóa t ử

 Bô chuyên đôi: th

ng dung phep biên đôi Cosin r i rac đê t p trung năng

ườ

̉ ậ

́ ̣ ́ ́ ̉ ̉

ng tín hi u vao môt sô l

ờ ng nh cac hê sô khai tri n đê th c hiên

́ ượ

̉ ự

̣ ̉ ̉ ̀ ́ ́ ̉ ̣

l ượ phep nen hiêu qua h n la dung tin hiêu nguyên thuy.

̉ ơ

̀ ̣ ́ ̣ ́ ̣

 Bô l

́ ́ ̣ ̀ ̀ ́ ̣ ̉

ớ ̀ ữ

́ ̣ ́ ̣ ̣ ̉ ́ ̃

ng t ̣ ượ ng t

ử ng t ử

vô h ơ

́ ữ

́ ̣

ng ky hiêu gi i han cho anh nen v i hai ky hoa: tao ra môt l ̣ ượ ớ ̣ ượ ng (th c hiên l hoa cho t ng phân d liêu) ng t thuât: l ừ ử ̣ ượ ự ướ ử va l hoa môt lân môt khôi d liêu). Qua ng t (th c hiên l vect ử ̣ ượ ự ̀ ượ trinh nay không thuân nghich.

́ ̣ ̀ ̣ ̣ ́

 Bô ma hoa: gan môt t

ma, môt dong bit nhi phân cho môi ky hiêu.

̣ ừ

̀ ̀ ̣ ̣

̣ ̃ ́ ́ ̃ ̣ ̀ ̣ ̃ ́ ̣

́ ̃ ̣ ̃ ́

Cac ky thuât ma hoa entropy (mã hóa không t n th t) ổ

̃ ́

̃ ượ

ứ

́ ̃ ̉ ̉ ́ ̀ ̣ ́

 Ma hoa lo t dài ch y (RLC-Run Length Coding): cac chuôi điêm anh co cung đô choi c ma hoa băng căp thông tin (m c mau) se đ (đô choi, chiêu dai chuôi).

̀ ̃ ́ ̀ ̣

̣ ́ ̀ ̀ ̃

biêt đ

̣ ượ

̃ ́ ̀ ́ ̣ ̉ ̀ ̣ ́ ̃ ̣

́ ̀ ̀ ́ ́ ̣

̃ ́ ̀ ̃ ́ ̀ ̣ ̃ ́

 Ma hoa băng cac loai bo trung lăp: cac chuôi đăc c thay thê băng c va sô đêm lăp. ờ  Ma hoa dung mâu thay thê: đây la dang ma hoa thông kê ma no thay thê cac mâu hay lăp lai băng môt ma.

́ ̀ ́ ́ ́ ̃ ̣ ̣ ̀

mã) thay đ i (VLC-

ủ ừ

 Mã hóa v i đ dài (c a t ớ ộ Variable-Length Coding)

̣ ̃

́ ̃ ̣ ̃ ́ ̀

Cac ky thuât ma hoa nguôn (mã hóa t n th t ) ổ

̃ ́ ̉ ̉ ̀ ́ ́ ̉ ̉

• Ma hoa chuyên đôi: dung phep biên đôi Fourier hay Cosin đê miên th i gian hay miên không gian sang miên tân ̉ ừ ờ ̀ ̀ ̀ ̀

chuyên t sô. ́

c goi la ma hoa ́ ướ ̃ ́ ̃ ̣ ̀ ̃ ́ ̉

c đoan do chi ̣ ướ ự ̃ ́ ̣ ́ ̣ ̃ ̀ ́ ́

c đoan, ớ ườ ̃ ́ ̀ ̀ ̉ ̣

̃ ̣ ̀ ̀ ̀ ̃ ̀ ́

• Ma hoa sai phân: cung đ ượ ma hoa s khac biêt gi a gia tri mâu th c va gia tri ữ ́ ự ma hoa sai phân th ng dung cho video hinh anh đông. L p ky thuât nay bao gôm: điêu ma xung sai phân, điêu chê delta, điêu ma xung thich nghi. ̀ ̃ ́

• L ng t hoa vect : ma hoa t ng khôi hai chiêu kich th c ử ượ ́ ̃ ́ ̀ ́

ơ ơ ́ ̣ ̣ ̀ ̀ ̉ ̀ ̃ ́ ̃

c. ướ ́ ừ cô đinh (goi la vect ) va tra bang tim ma phu h p nhât. Ky ̀ ợ thuât chi thich h p cho d liêu co câu truc biêt tr ́ ướ ữ ợ ̣ ̉ ́ ̣ ́ ́ ́

Cac tiêu chuân nen anh

́ ̉ ́ ̉

ự

ợ

ở

̀ ́ ̉ ̃

JPEG (The Joint Photographic Expert Group): dung cho nen anh tinh, triên b i s kêt h p gi a ITU-TS (the International phat ữ Telecommunications Union-Telecommunication Sector)

va ISO (International Standards Organization)

́ ̉ ́

• MPEG-1, MPEG-2, MPEG-4, MPEG-7: do Uy ban

̀

́ ợ

ữ

̉

ISO IEC/JTC1/SC29- /WG11 phat triên cho ma hoa kêt h p gi a video va audio.

• H.261: do Nhom nghiên c u XI phat triên va đ

̀ ượ

ứ

c biêt rông rai nh ư

́ ̉ ̃ ́ ̀

́ ́ ̉ ́ ̣ ̃

i

́ ứ

̉ ̃ ́ ́ ̣ ̣ ̀ ́ ̣

tiêu chuân ma hoa video cho cac dich vu nghe nhin tôc đô nx 64Kbps. ITU-TS H.263 cho cac ng dung điên thoai thây hinh tôc đô d ̣ ướ 64Kbps.

̣ ̣ ̣ ́ ̀ ́

́ ̃ ̣ ̃ ́

Cac ky thuât ma hoa entropy (mã hóa không t n th t ) ổ

–Run length Coding (RLC) –Huffman –Lempel Ziv – Wench (LZW)

RUN LENGTH CODING- RLC

ươ

ng pháp này là d a trên s ự

ng c a ph ủ i các bit.

• T t ư ưở l p l ặ ạ

• Thay th các bit đó b i chi u dài chu i và bít ở

ế

• Đ phân bi

khác ta có th thêm 1 c 2 thông tin chi u dài chu i

t v i các ký t ệ ớ t tr ệ ướ

l p .ặ ể mã đ c bi t ặ ừ và bit l p .ặ ụ

• Ví D : Ta có 1 dãy các giá tr m c xám nh ư

ị ứ

sau

– 55 22 22 22 22 22 22 22 22 51 52 52 52 60 … – Ta có th thay đo n mã trên b ng ạ 55 E 8 22 51 E 3 52 60 …

• • V i E là ký t

đ c bi

t , giá tr sau E là chi u dài ký t

l p và ký t

l p .

ự ặ

ự ặ

ự ặ

HUFFMAN

 D a vào mô hình th ng kê tính t n su t xu t ấ ố

hi n các ký t

ự ệ

. ự

 Gán cho các ký t

có t n xu t cao b ng m t có t n xu t th p b ng ấ

ằ ấ

trong d li u g c ố ữ ệ

ấ ả i b ng mã theo th t

ứ ự ầ

t n su t gi m d n ầ

t mã ng n, các ký t ắ ừ mã dài. m t t ộ ừ  Thu t toán: ậ  B c 1: ướ  Tính t n su t xu t hi n các ký t ầ ấ  Xây d ng b ng mã ự  S p x p l ế ạ ả ắ  B c 2: ướ  T o cây huffman ạ

HUFFMAN Bảng tần xuất sắp xếp theo thứ tự giảm dần

Ký t

T n su t Ký tù T n su t xác su t ấ

"1" 152 "0" 1532 0.2770

"2" 323 "6" 602 0.1088

"3" 412 "." 536 0.0969

"4" 226 " "

535 0.0967

"5" 385 "3" 112 0.0746

"6" 602

"5 " 385 0.0696

"7" 92 "2" 323 0.0585

"8" 112 "_" 315 0.0569

"9" 87 "4" 226 0.0409

"0" 1532 "+" 220 0.0396

"." 536 "1" 152 0.0275

"+" 220 "8" 112 0.0203

"_" 315 "7" 92 0.0167

" " 535 "9" 87 0.0158

Mã LZW

• Đ cượ Jacob Braham Ziv đưa ra l n ầ đ uầ tiên năm ậ i thu t

ộ ọ ả

1977, sau đó phát tri n thành m t h gi ể nén t

LZ.

ừ đi n là ể

i thu t LZ ậ

t h

c xác su t phân b c a các

• Năm 1984, Terry Welch c i ti n gi ế i thu t t ậ ố ơn :LZW • Dùng đ gi m d th a trong pixel ư ữ • Không c n bi t tr ướ ế

thành m t gi ộ ể ả ầ

ố ủ

pixel

• Th

ả ả

ngườ được dùng để nén các lo i vạ ăn b n, nh đa m c xám... Và là

đen tr ng, nh màu, nh ả chu n nén cho các d ng nh GIF và TIFF. ạ

ả ả

Mã LZW

ươ

đi n

• Ph ng pháp : • Xây d ng 1 t ự

ừ ể

C u ấ ừ trúc t đi n ể

Mã LZW

cượ xây d ng ự

• T ừ đi n ể đ đ ngồ th i v i quá trình ờ ớ đọc d li u. S có m t c a m t chu i con trong ự ữ ệ ỗ ộ ặ ủ ỗ đó đã t ng xu t r ng chu i đ nhị ừ đi n kh ng t ấ ừ ằ ẳ ể ầ ữ ệ đã đọc. hi n trong ph n d li u ệ • Thu t toán liên t c “tra c u ” và c p nh t t ỗ ầ đ cọ m t kí t

ậ ừ ự ở ữ ệ đ uầ d li u

ụ đi nể sau m i l n vào.

• Do kích th

cướ b nh không ph i vô h n và

ả ể ớ

để ạ i h n ừ đi n ch gi ỉ ớ ạ ế để l uư l n nh t là 4096 ấ ư v y ậ độ dài l n nh t

ộ ả ố độ tìm ki m, t đ mả b o t c ph n t 4096 dùng ầ ử ở giá tr c a các t mã. Nh ừ ị ủ c a mã là 12 bít(4096= ủ

212).

Ví d ụ

Cho ma tr n nh 4x4 8bit ậ ả

LEMPEL ZIV – WENCH (LZW)

Ví dụ:    bảng mã hóa và xây dựng tự điển

Kết quả: input:  16*8=128bit

output : 5*8+5*9=85bit tỷ số nén 128/85=1,5

Mã LZW

đ uầ đã g m 256 kí t ồ

• Ví d cụ ơ ch nén LZW ế Cho chu i ban đ uầ là “ABCBCABCABCD” (Mã ASCII c a A là 65,B là 66, ủ C là 67). T ừ đi n ban ể cơ b n.ả

cướ :12 x 8 = 96

cướ là: 4x8 +3x9 =

Chu i ỗ đ uầ ra s là:ẽ 65 - 66 - 67 - 259 - 258 - 67 – 262 Đ uầ vào có kích th bits. Đ uầ ra có kích th 59 bits T s nén là: 96:59

1,63.

ỉ ố

@

Bài t pậ

• Dùng mã hóa LZ đ mã hóa chu i ỗ nén và hi u

ỉ ệ

%

(cid:0)

) %

ACCBCABCABACD tính t l su t nén ấ 1 • T l nén ỉ ệ rc • Hi u su t nén ấ ệ (1

1 rc

- (cid:0)

Bi n đ i Cosin và chu n JPEG

ế ổ

7

7

(

)

X

0, 0

x m n , )

Trong đó

= �� (

=

=

1 8 m

0

0

n

Bi n đ i Cosin và chu n JPEG

ế ổ

7

7

p

+

+

(2

k

(2

=

X

cos(

) cos(

)

k l ( , )

�� x m n ,

=

=

c k c l 2 ( ) ( ) N

m 2

1) N

n 2

p 1) l N

m

0

0

n

Chu n JPEG

̀ ̉ ̣ ̉

ứ ướ ̀ ́ ̉ ́ ̉ ̀

ứ ̀ ̣ ̀ ́

ờ ự ữ ́ ̣ ́ ̀

́ ợ ̉ ượ ứ ự ̉ ̀ ́ ̣ ̀ ̃

̉ ̀ ̀ ̉ ́ ́ ̉ ̣

́

• JPEG ( Joint Photographic Expert Group ) la tên cua môt tô c đây la ISO) ch c nghiên c u vê cac chuân nen anh (tr ứ c thanh lâp vao năm 1982. Năm 1986, JPEG chinh th c đ ượ c thiêt lâp nh s kêt h p gi a nhom ISO/IEC va ITV. đ ượ c ng dung trong nhiêu linh v c : Tiêu chuân nay co thê đ l u tr anh, Fax mau, truyên anh bao chi, anh cho y hoc, ữ ư camera sô v.v... • Tiêu chuân JPEG đ ơ ̉ ̣ ́ ̉ ̃ ́ ̀

ớ ̀ ̃ ̣ ̣

̉ ̣ ̀ ́ ̉ ̣ ́ ́ ̀ ́

c đinh ra cho nen anh tinh đ n săc va ượ c s dung cho nhiêu ng dung v i mau. Tuy nhiên cung đ ̀ ứ ượ ử ng anh khôi phuc kha tôt va it anh đông b i vi no cho chât l ́ ượ ở tinh toan h n so v i nen MPEG. ơ ớ ́ ́ ́

Chu n JPEG

Các công đoạn Nén ảnh JPEG

8x8

Lượng  tử hóa

Mã  Hóa

ảnh  nén

DCT

P h â n K h ố i

8x8

B ng ả Mã

Bảng  lượng tử

8x8

Chu n JPEG

Chuy n nh thành các MB

ể ả

́ ̉ ́ ́ ̀ ́ ̀ ̃ ̀ ̣ ̣

· 8 pixel đ ̉ ̉ ̣ ̉ ̀ ̀

ướ môt anh man hinh theo chiêu t i. Kich th c MB la 8 · 8 đ • Tât ca cac block co cung kich th c lây t ́ ừ ượ trên xuông d ướ ̉ ừ c va môi block la môt ma trân ̀ ừ c ượ ướ ́ ́ ́ ̀

̣ ́

ng quan suy giam rât điêm anh 8 trai sang phai, t chon b i hai ly do sau: ở ứ ̣ ́ ̀ ̉ ́

ươ t qua 8. • 1. Qua viêc nghiên c u cho thây ham t nhanh khi khoang cach gi a cac pixel v ượ ữ ̉ ́ ́ ́

i cho viêc tinh toan va thiêt kê phân c ng. Noi chung, đô ̣ ợ ̀ ứ ̣ ́ ́ ̀ ́ ́ ́ ̣

ph c tap vê tinh toan se tăng nêu kich th c block tăng. • 2. Tiên l ứ ướ ̣ ̀ ́ ́ ̃ ́ ́

Chuy n m c đi m nh (tr 128)

ể ả

Ví Dụ:

­128

Bi n đ i DCT

ế ổ

Ví Dụ:

Biến đổi DCT và làm tròn các hệ số

DCT

L

ng t

hoa

ượ

ử ́

Ví dụ:

Sử dụng Ma trận lượng tử hóa (Q)

L

ng t

hoa

ượ

ử ́

Ví Dụ  (tt): Chia các phần tử của ma trận DCT với các phần tử tương ứng của ma trận  lượng tử hóa ở trên theo công thức:

AC

DC

Kết Quả

=

G

(0, 0)

round

round

26

(0, 0) (0, 0)

-� � 415 = - � � 16 � �

� T � Q �

� = � �

Mã hóa AC

Sử Dụng Mã hóa Huffman kết thúc sớm chuổi khi các kí tự còn lại là  0 Ký tự đặc biệt là EOB

Kết Quả

Gi

s n u DC c a kh i tr

c là -17

ả ử ế

ố ướ

Mã hóa nh phân

Ví d ụ

Mã hóa DC

Mã hóa DC

Mã hóa DC

B ng mã DC

Mã hóa AC

Mã hóa AC

B ng mã AC

Mã hóa AC

Ví d : DC coefficient of the previous block is 60

ng

ậ ả

ượ

Cho ma tr n nh l : ử t

t r ng h sô DC c a kh i tr

ế ằ

ố ướ

c là 60 . Hãy mã hóa ma tr n nh thành mã nh ị

ậ ả

Bi phân. Tính t s nén

ệ ỉ ố

K t qu ả

ế

• “11011001, 100010, 001, 1111100001,

0110, 0110, 000,1010”.

Khôi ph c nh JPEG ụ ả

Các công đoạn khôi phục ảnh:

Gi

i Mã

Lượng Tử  Hóa

DCT  ngược

nh nen

B ng Mã

Bảng  Lượng tử

Khôi ph c nh JPEG ụ ả

R(u,v)=Fq(u,v)Q(u,v)

Khôi ph c các đi m nh trong khôi 8x8 ể ả

́

Qua trinh biên đôi DCT ng

c (IDCT)

ượ

́ ̀ ́ ̉

7

7

)

+

+

(2

j

(2

k

*

(

)

f

j k ,

F u v

( , )cos

cos

= ��

=

=

( ) ( C u C v 4

p u 1) 16

p 1) v 16

u

0

v

0

Tao lai khôi gia tri cac điêm ban đâu theo biêu th c: ứ ̣ ̣ ́ ́ ̣ ́ ̉ ̀ ̉

e(j,k)=f(j,k)-f*(j,k)

Sai sô gi a cac gia tri khôi phuc va gia tri gôc đ c tính nh sau: ́ ữ ́ ượ ư ́ ́ ̣ ̣ ̀ ́ ̣

Bi n đ i cosin và chu n JPEG

ế ổ

Anh nén và gi

i nén

Ảnh Gốc

Bi n đ i cosin và chu n JPEG

ế ổ

Ảnh sau khi nén và giải nén bằng phép biến  đổi Cosin cho chất lượng không tốt như cũ.

Khắc phục bằng việc làm trơn ảnh sau khi giải nén .

Chu n JPEG

ẩ Chuẩn JPEG cho nhiều tùy chọn khác nhau để nén ảnh,tùy vào  những tùy chọn mà cho hệ số nén và chất lượng ảnh khác nhau

46KB

31KB

60KB

100KB

Ảnh gốc có kích thước 400x300=120KB

Bài t p ậ

Cho ma tr n nh S là 2x2

ậ ả

s

9 1 � � = � � 1 9 � �

t chu i nh phân sau khi s d ng ph

ng pháp nén

ế

ử ụ

ươ

ị i nén , bi

t r ng ma tr n l

ng t

Tính các h s DCT, và vi ệ ố JPEG, tìm nh khôi ph c sau khi gi ả

ế ằ

ậ ượ

Q

3 3 � � = � � 3 5 � �

L i gi

i

ờ ả

• Áp d ng công th c DCT đ tính h s DC và

ệ ố

7

7

AC

p

+

+

((2

k

((2

l

2

= DCT X

c k c l ( ) ( )

c os(

c ) os(

)

= ( , ) k l

m n , )

�� x (

=

=

Trong đó k,l=0,1,….7

2 N

m 2

1) N

n 2

p 1) N

m

0

0

n

-

=

l , & 0 k

= (cid:0)

c k c l ( ), ( )

2

(cid:0) (cid:0)

+

1 2 2 l

1,

k

0

=

=

=

=

=

-+

=

(cid:0) (cid:0) (cid:0)

-

US ,(

)

,10

US ,(

,02/)9119(

H s DCT

ệ ố

=

=

+++ 2/)9119( =

-+

T 1,0 =

=

- - -

US ,(

,02/)9119(

0,0 )

US ,(

+ .82/)9119(

) 1,0 = )

T 0,0 T 0,1

T 1,1

0,1

1,1

11

1

5.9

5.0

Ả gi

i nén

nh khôi ph c sau khi ụ ả

+

+

+

=

- - ø Ø ø Ø ø Ø

U

U

U

U

1 =œ

ˆ ˆ = TS 0,0

0,0

ˆ T 1,0

1,0

ˆ T 0,1

0,1

ˆ T 1,1

1,1

11

1

1

5.0

5.9

9 2

10 2

œ Œ Œ Œ - - ß º ß º ß º

T NG QUAN JPEG 2000

ổ ế

nh s hóa ngày càng ph bi n và yêu c u ch t Ả l ng ngày càng cao, ngoài ra còn có các nhu ượ c u v x lí nh kéo theo ầ

• Nén hình nh không ch làm gi m dung l

ể ắ

t b c ế ị ụ

ề ử ả ả ả ứ

ng ượ ỉ mà còn ph i cho phép tách ghép đ s p x p x ế ử lí và đáp ng các nhu c u trên các thi ầ thể

• Yêu c u v hi u su t nén v i t s nén cao ấ

ớ ỉ ố

ề ệ

S PHÁT TRI N C A JPEG 2000 LÀ T T Y U

Ủ JPEG2000

T NG QUAN JPEG 2000

JPEG2000

U ĐI M C A JPEG2000 SO V I JPEG

Ư

JPEG2000

Chu n JPEG2000 và nén nh màu

ng pháp ế ươ

ử ụ t đ có đ • JPEG2K s d ng phép bi n đ i wavelet và các ph ổ c nh nén t ố ư i u nh t ấ đ c bi ặ ượ ả ệ ể

t nh t khi s d ng nén nh tĩnh ấ

ng t c v i truy n d n và hi n th lũy ti n v ch t ể ử ụ ẫ ả ị ề ế ề ấ ấ ượ ượ

• Cho ch t l • S d ng đ ử ụ l ộ ượ

ạ i m i th i đi m trong khi nh n d ữ ể ậ ọ ờ ố ớ ng, đ phân gi i. ả i nén t ả • Truy c p và gi ậ

• Gi i nén toàn b nh li uệ ả i nén t ng vùng nh mà không gi ả ừ ả ộ ả

CHU N JPEG2K

Các b

c nén nh trong JPEG 2000

ướ

S đ nén và gi

i nén trong jpeg

ơ ồ

2000

JPEG2000

CHU N JPEG2000 VÀ NÉN NH MÀU

• Các b

c th c hi n nén nh theo chu n ả

ướ JPEG2K

Mã hóa

Ảnh  nén

Biến đổi liên  thành phần

Biến đổi riêng  thành phần

Lượng tử  hóa

Xử lý  trước biến  đổi

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

Các b

c nén nh trong JPEG 2000

ướ

JPEG2000

CHU N JPEG2000 VÀ NÉN NH MÀU

• Gi

i nén: Làm ng

i các b

c trên

c l ượ ạ

ướ

Xử lý sau  biến đổi

Ảnh  nén

Gi

i mã

Gải lượng  tử hóa

Biến đổi ngược  riêng thành  phần

Biến đổi  ngược liên  thành phần

Các chu n nén nh hi n nay

nén:

Các đ nh d ng nh và t l ạ

ỉ ệ

1600x1200

5760KB

BMP

5626KB

TGA

5626KB

PGM

5626KB

PBM

5626KB

TIF

5565KB

PNP

4405KB

XPM

3759KB

GIF

1802KB

JPEG

754KB

Ư ể

u đi m c a chu n nén JPEG2k ẩ

JPEG và JPEG2k

JPEG và JPEG2k

Bài t p ậ

Bài t p ậ

Các chu n nén video

MPEG

MPEG

– For compression of 320x240 full-motion video at rates around

1.15Mb/s

– Applications: video storage (VCD) • MPEG-2 ~ 2-80Mbps (mid 90s)

– For higher resolutions – Support interlaced video formats and a number of features for

HDTV

– Address scalable video coding – Also used in DVD

• MPEG-1 ~ 1-1.5Mbps (early 90s)

– For very low bit rate video and audio coding

– Applications: interactive multimedia and video telephony

• MPEG-4 ~ 9-40kbps (later 90s)

• MPEG-21 ~ ongoing

MPEG

Format

SIF

Compressed bit rate 1.2-3 Mbps

MPEG-1

CCIR 601

5-10 Mbps

EDTV

7-15 Mbps

MPEG-2

HDTV

20-40 Mbps

Video Parameters 352x240 at 30Hz 720x486 at 30Hz 960x486 at 30Hz 1920x1080 at 30Hz

MPEG

• Tiêu chuân MPEG la s kêt h p gi a nen

ữ

ợ

̀ ự trong anh va nen liên anh.

̉ ́ ́

ng phap nen co tôn hao d a trên s biên

• Ph

ự

ự

̉ ̀ ́ ̉

ươ đôi DCT

́ ́ ́ ̉ ́

̉

̀ ̉ ̣

• Bu chuyên đông. • MPEG dung biêu diên mau băng YC

rCb.

̀ ̉ ̃ ̀ ̀

Cac ph

ng phap bu chuyên đông

ươ

- Ph

ng phap

ươ

́ ́ ̀ ̉ ̣

ướ

̉ ừ

́ ̀ ̉ ̣ ̉ ́ ̉

c đoan bu chuyên đông : gia thiêt anh c đo, nghia la anh tr ng dich chuyên không cân thiêt phai giông

̣ ̣ ̀ ̣ ́ ́ ̉ ́ ̃ ̀

̀ ướ c đo.

̣ ̣ ̉ ̀ ́ ̉ ́

- Ph

̉ ́

̣ ớ

́ ̣ ̀ ̉ ̣ ̀ ̃ ̣ ̀

̣ ̉ ̉ ̃ ́ ̣ ́ ̣ ̣

̃ ượ

ự

̉ ́ ̉ ́ ́ ̣ ̉ ́ ̣

̀ ử

ơ

̉ ̀ ̉ ̣ ̣ ̉

́ ướ hiên tai la môt phep biên đôi t biên đô va h anh tr ướ ng phap nôi suy bu chuyên đông la ky thuât nhiêu ươ đô phân giai: chi ma hoa môt tin hiêu phu v i đô phân giai thâp (khoang 1/2 đên 1/3 tôc đô khung). Anh co đô phân giai đây đu se đ c xây d ng lai qua nôi suy anh co đô phân giai thâp công thêm thanh phân s a sai. Đ n vi x ly anh ma MPEG s dung la macroblock (MB) ử

̣ ử

́ ̣ ̉ ́ ̣ ̀

16X 16 điêm anh.

́ ̉ ̀ ̣ ̀

̉ ̉

Cac ph

ng phap bu chuyên đông

ươ

PREVIOUS FRAME

CURRENT FRAME

PREDICTED FRAME

PREDICTION ERROR FRAME

́ ́ ̀ ̉ ̣

MPEG-1 Picture Types and Group-of- Pictures

• A Group-of-Picture (GOP) contains 3 types of frames

(I/P/B)

I1 BBB P1 BBB P2 BBB I2 …

• Frame order

I1 P1 BBB P2 BBB I2 BBB …

• Coding order

Cac câu truc anh

 Anh loai I (Intra-picture)

́ ́ ́ ̉

 Anh loai P (Predicted-picture)

̉ ̣

 Anh loai B (Bi-directional predicted picture)

̉ ̣

̉ ̣

Câu truc dong bit MPEG

́ ́ ̀

Ki n trúc dòng d li u MPEG

ữ ệ

ế

B mã hóa MPEG tiêu bi u

B mã hóa MPEG tiêu bi u

ng d ng MPEG trong truy n thông đa

ph

ng ti n

ươ

ng d ng MPEG trong truy n thông đa

ph

ng ti n

ươ

ng d ng MPEG trong truy n thông đa

ph

ng ti n

ươ