TR NG Đ I H C ĐI N L CƯỜ
Khoa Đi n T Vi n Thông
----------
I TP NHÓM MÔN LÝ THUYT THÔNG TIN
Đ TÀI :Lempel-ziv Encoding”
Ging viên b môn: Vũ
Ngc Châm
Nh óm Sinh Viên Thc Hiên:
Nhóm 10
Sinh vi ên lp: Đ5.ĐTVT1
Tr ng Đ i H c Đi n L c Khoa Đi n T Vi n Thôngườ
Nhóm 10
TR NG ĐAI H C ĐI N L CƯỜ
Khoa Đi n T Vi n Thông
n Lý THUYÊT thông tin
LEMPEL-ZIV ENCODING
Danh Sách Các Thành Viên Nhóm S 10
1 : NGUY N QU C QUÂN
2: NGUY N VĂN HÙNG
3: NGUY N VĂN KHOÁI
4: HOÀNG VĂN LÂM
5: NGUY N VĂN TI N LÂM
Hà n i ngày 11 tháng 9 năm 2012
Tr ng Đ i H c Đi n L c Khoa Đi n T Vi n Thôngườ
Nhóm 10
M c L c
1.Danh sách thành viên trong nhóm 10……………………….. 1
2.L i gi i thi u………………………………………………....2
3.T ng quan v nén gi li u …………………………………...4
4. C s m t s ph ng pháp nén………..…………………….5ơ ươ
5. T ng quan v Lempel-ziv coding …………………………...6
6.T đi n mã hóa……………………………………………….7
7. H thu t toán Lempel-Ziv…………………………………..8
+Thu t toán LZ78……………………………………………...8
+Thu t toán LZW ……………………………………………..11
8.K t Lu n……………………………………………………..19ế
9.Tài li u tham kh o……………………………………………21
2.M c l c……………………………………………………….22
Tr ng Đ i H c Đi n L c Khoa Đi n T Vi n Thôngườ
Nhóm 10
Li gii thiu.
Ngày nay thông tin là mt phn gn kết không th thiếu c a con ng ưi trong cuc
sng hin đi. vic trao đi thông tin là công vic th ưng xuyên và đưc coi như là
bình thưng c a mi chúng ta.Có rt nhiu hình thc th hin khác nhau c a thông
tin như âm thanh, hình nh,tiếng nói,ch viết và các loi ký t……. Chính vì vy
mà cũng n y sinh ra rt nhiu vn đ bc thiết xung quanh vic chuyn t i thông tin
t ngưi này ti ngưi khác cũng như đến vn đ lưu tr bn không th b 250
Gigabyte dung lưng nh máy vi tính c a bn ra ch đ l ưu tr và ghi nh mt
thông tin không quan trng lm, hoc trong vic lưu tr nó. Ví d như dung lưng
tp tin mà quá ln nó s nh h ư ng vân đ trao đi thông tin bn không th ch c
ngày đ cp nhp mt l ưng tin quá ln mà không cn thiết lm cho cuc sng c a
bn.Chính vì vy mà ngưi ta mi nghĩ ra mt thut toán mà làm thế nào đó đ có
th gi m dung l ưng thông tin cn trao đi đó xung nhm mc đích đơn gi n và
thun tin hơn trong vic trao đi và l ưu tr thông tin. Đ gii quyết vn đ đó,
các thut toán nén đã được ra đi.
Ban đu vi phương pháp mã hóa lot dài RLC (Run Length Coding), phát hin
mt lot các bít lp li. Đây là phương pháp đơn gin nht. Nguyên tc cơ bn
ca phương pháp này là phát hin mt ký t có s ln xut hin liên tiếp vượt
qua mt ngưỡng c đnh nào đó. Trong trường hp này dãy s được thay thế
bng 3 ký t: Ký t th nht là ký t đc bit,thông báo dãy tiếp là dãy đc bit.
Ký t th hai ch s ln lp. Ký t th ba ch ký t lp.Như vy tư tưởng ca
phương pháp này là thay thế mt dãy bng mt dãy khác ngn hơn tuân theo mt
ngưỡng nào đó, và thông thường ngưỡng có giá tr là 4.Kế đến là phương pháp
Huffman, da vào mô hình thng kê, tính tn sut xut hin ca các ký t, ri gán
cho các ký t có tn sut cao mt t mã ngn, các ký t tn sut thp t mã dài.
Phương pháp này phi lưu gi li bng mã gn kèm cùng vi d liu nén.
Mt phương pháp nén hoàn toàn khác là thut toán nén d liu theo t đin cơ
s: (Dictionary-based compression)
Tr ng Đ i H c Đi n L c Khoa Đi n T Vi n Thôngườ
Nhóm 10
Có 2 loi:
Mã hóa t đin tĩnh (static dictionary coding)
Mã hóa t đin đng (dynamic dictionary coding)
Có rt nhiu thut toán áp dng k thut này như LZ77, LZR, LZSS, LZH…
nhưng trong ni dung bài báo cáo này, chúng ta ch đ cp đến hai thut toán chình
là:
+Thuât Toán LZ78
+ Thuât toán LZW.
Nhìn chung không có phương pháp nén t ng quát nào cho kết qu là tt đi vi
tt c các loi tp tin mà ta cn mã hóa c .N ăm 1983 Sperry np mt bng sáng chế
cho mt thut toán phát tri n b i Terry Welch, mt nhân viên ti Trung tâm nghiên
cu Sperry. Thut toán này là biến th trên mt k thut nén d liu ln đu tiên
đưc đ xut b i Jakob Ziv và Abraham Lempel năm 1978 c a Welch. K thut c a
Welch là c hai đơn gi n h ơn và nhanh hơn. Ông đã xut b n mt bài báo trong vn
đ 1984 c a Tp chí máy tính IEEE mô t k thut. K thut này c a Terry Welch
tr nên rt ph biến và đưc chp nhn rng rãi. Đó chính là thut toán mã hóa mà
ngày nay ngưi ta gi nó vi cái tên là Lempel-Ziv-Welch.
Hà ni ngày 11 tháng 9 năm 2012
Các thành viên nhóm 10
I: T NG QUAN V NÉN GI LI U
I.1:Nén gi li u là gì?.
Nén gi li u đ c đ nh nghĩa đ n gi n nh sau ượ ơ ư : Nén d li u là quá
trình làm gi m l ng thông tin “d th a” trong d li u g c và do ượ ư
v y, thông tin thu đ c sau nén th ng nh h n d li u g c r t ượ ườ ơ
nhi u. Ngoài thu t ng “nén d li u”, do b n ch t c a k thu t
này nó còn có m t s tên g i khác nh : gi m đ d th a, mã hóa ư ư
nh g c…
Tr ng Đ i H c Đi n L c Khoa Đi n T Vi n Thôngườ
Nhóm 10