Giáo trình: Lý thuyết thông tin.
)(log )p,...,p ,H(p H(X) 2
1
M21 i
M
i
ipp
=
==
Qui ước trong cách viết: log(pi)= log2(pi)
Ví d minh ha
Nếu s kin A có xác sut xut hin là 1/2 thì h(A)=h(1/2)= -log(1/2) = 1 (bit)
Xét BNN X có phân phi sau:
X x1 x2 x3
P 1/2 1/4 1/4
H(X) = H(1/2, 1/4, 1/4) = -(1/2log(1/2)+1/4log(1/4)+1/4log(1/4)) =3/2 (bit)
Bài toán v cây tìm kiếm nh phân-Đặt vn đề
Gi s, tìm 1 trong 5 người có tên biết trước s xut hin theo phân phi sau:
X x1 x2 x3 x4 x5
P 0,2 0,3 0,2 0,15 0,15
Trong đó: x1, …x5 ln lượt là tên ca 5 người mà ta cn nhn ra vi cách xác định tên bng câu
hi đúng sai (yes/no).
Sơ đồ dưới đây minh ha cách xác định tên ca mt người:
x1
X=x1/x2?
Yes
X=x3?
No
No
Yes
X=x1?
Yes x2
x3
x4
X=x4?
No
Yes
No
x5
Bài toán v cây tìm kiếm nh phân - Din gii
Theo sơ đồ trên:
Để tìm x1, x2, x3 vi xác sut tương ng là 0.2, 0.3, 0.2 ta ch cn tn 2 câu hi.
Để tìm x4, x5 vi xác sut tương ng 0.15, 0.15 thì ta cn 3 câu hi.
Vy:
S câu hi trung bình là: 2 x (0,2+0,3+0,2) + 3 x (0,15+0,15) = 2.3
Mt khác: Entropy ca X: H(X)= H(0.2, 0.3, 0.2, 0.15, 0.15)=2.27.
Ta luôn có s câu hi trung bình luôn H(X) (theo định lý Shannon s trình bày sau). Vì s câu
hi trung bình trong trường hp này xp s H(X) nên đây là s câu hi trung bình ti ưu để tìm ra
tên chính xác ca mt người. Do đó, sơ đồ tìm kiếm trên là sơ đồ ti ưu.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu. 17
Giáo trình: Lý thuyết thông tin.
Sinh viên t cho thêm 1 hay 2 sơ đồ tìm kiếm khác và t din gii tương t - xem như bài tp.
Bài tp
Tính H(X) vi phân phi sau:
X x1 x2 x3
P 1/3 1/3 1/3
Tính H(Y) vi phân phi sau:
Y x1 x2 x3 x4
P 1/6 2/6 1/6 2/6
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu. 18
Giáo trình: Lý thuyết thông tin.
BÀI 2.2: CÁC TÍNH CHT CA ENTROPY
Mc tiêu:
Sau khi hoàn tt bài hc này bn có th:
- Hiu các tính cht cơ bn ca Entropy,
- Hiu định lý cc đại ca Entropy,
- Vn dng gii mt s bài toán v Entropy,
- Làm cơ s để vn dng gii quyết các bài toán tính dung lượng kênh truyn.
Các tính cht cơ bn ca Entropy
Xét biến ngu nhiên X = {x1, x2, …, xM}. Entropy ca biến ngu nhiên X có các tính cht:
1. Hàm s f(M) = H(
M
1,…,
M
1) đơn điu tăng.
2. Hàm s f(ML) = f(M)+f(L).
3. H(p1, p2, …, pM) = H(p1 + p2 +…+pr, pr+1+ pr+2+…+ pM)
),...,()Hp p (p
11
1
r21 ==
++++ r
ii
r
r
iip
p
p
p
),...,()Hp p (p
11
1
M2r1r +=+=
+
++ ++++ M
ri i
M
M
ri i
r
p
p
p
p
4. H(p, 1-p) là hàm liên tc theo P.
Minh ha tính cht 1 và 2
Minh ha tính cht 1:
Trong trường hp biến ngu nhiên X có phân phi đều
Entropy ca X như sau :
MM
M
MMMMMmMMM
HXH 1
log
11
log
1
,...,
1
log
11
log
11
,,
1
,
1
)( ==
=L
=> H(X) M
M
log
1
log == là hàm đơn điu tăng
Minh ha tính cht 2:
Trong trường hp 2 biến ngu nhiên X, Y độc lp có phân phi đều vi BNN X có M s
kin và BNN Y có L s kin.
Gi f(M), f(L) ln lượt là Entropy ca X, ca Y. Theo tính cht 2 ca Entropy ta có
f(ML)=f(M)+f(L)
Minh ha tính cht 3 và 4
Minh ha tính cht 3:
Xét con xúc sc có 6 mt vi xác sut xut hin các mt được cho trong bng sau:
X x1x2x3x4x5x6
P 10% 20% 25% 25% 15% 5%
Ta có th gom các s kin x1, x2, x3 li thành mt s kin mi là x123 có xác sut xut hin
là 55%, gom s kin x5 và x6 li thành s kin x56 có xác sut 20%.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu. 19
Giáo trình: Lý thuyết thông tin.
Ta được mt nhiến ngu nhiên mi X* có phân phi sau:
X*x123 x4X56
P 55% 25% 20%
Đến đây các bn có th áp dng công thc để tính, so sánh các Entropy và nhn xét tính
cht 3. Phn này xem như bài tp cho sinh viên.
Minh ha tính cht 4:
Để hiu tính cht th 4, ta xét dng đồ th ca hàm s H(p, 1-p ):
Rõ ràng H(p, 1-p) là mt hàm liên tc theo p.
Định lý cc đại ca entropy
Định lý: H(p1, p2, …,pM) log(M)
Trong đó: đẳng thc xy ra khi và ch khi p1=…= pM= 1/M
B đề: cho 2 b {p1, p2, …,pM} và {q1, q2,…,qM} là các b s dương bt k
==
=M
i
i
M
i
iqp
11
Khi đó, ta có H(p1, p2, …,pM)= (*)
i
M
i
i
M
i
ii qppp
==
1
2
1
2loglog
Đẳng thc xy ra khi pi=qi vi i=1,..,M.
Chng minh định lý cc đại ca Entropy
Chng minh b đề:
Theo toán hc ta luôn có th chng minh được ln(x) x-1 vi x>0 và đẳng thc đúng khi x=1.
Đặt x= qi/pi Suy ra ln(qi/pi) qi/pi –1 (và đẳng thc đúng khi qi=pi vi mi i).
011)(ln
11
==
==
ii
M
i
M
ii
i
ipq
p
q
p
(đẳng thc xy ra khi q
i
M
i
i
M
i
ii qppp
==
11
lnln i=pi). (1)
Theo toán hc ta có lnx = log2x / log2e (2)
T (1) và (2), ta có (đẳng thc xy ra khi q
i
M
i
i
M
i
ii qppp
==
11
loglog i=pi.)
Chng minh định lý:
Đặt qii
M
,
1
T b đề, ta có:
===
== M
i
i
M
i
i
M
i
ii MpM
M
ppp
1
22
1
2
1
2loglog
1
loglog
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu. 20
Giáo trình: Lý thuyết thông tin.
đẳng thc ch xy ra khi pi=i
M
,
1 (đpcm).
Bài tp
Bài 1: Cho 2 biến ngu nhiên X, Y độc lp nhau có phân phi sau:
X x1x2
P 1/2 1/2
Y y1y2y3y4
P 1/4 1/4 1/4 1/4
Tính H(X), H(Y).
Bài 2: Kim tra li kết qu ca ca bài 1 bng tính cht 2.
Bài 3: Cho biến ngu nhiên X có phân phi sau:
X x1x2x3x4x5x6
P 10% 20% 25% 25% 15% 5%
Ta có th gom các s kin x1, x2, x3 li thành mt s kin mi là x123 có xác sut xut hin là 55%,
gom s kin x5 và x6 li thành s kin x56 có xác sut 20%.
Ta được mt nhiến ngu nhiên mi X* có phân phi sau:
X*x123 x4x56
P 55% 25% 20%
- Tính entropy ca X, X* và kim tra li tính cht 3.
- Kim tra li định lý cc đại t d liu cho trên.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu. 21