Chương 7<br />
<br />
Ki m ñ nh m t phân ph i và b ng tương liên<br />
<br />
Bi n ng u nhiên liên t c b ng t ng bình phương c a nhi u bi n ng u nhiên ñ c l p, phân ph i<br />
chu n t c là bi n Khi bình phương χ2. Bi n này ñư c kh o sát t m và l p b ng phân ph i<br />
(b ng 4). Bi n χ2 có nhi u ng d ng khác nhau ñây chúng ta ch ñ c p ñ n hai ng d ng<br />
ñ i v i các bi n ñ nh tính.<br />
7.1.<br />
<br />
Ki m ñ nh m t phân ph i<br />
<br />
ð kh o sát m t bi n ñ nh tính X ta l y m u quan sát g m N cá th và căn c vào s th hi n<br />
c a bi n X ñ phân chia thành k l p như b ng sau:<br />
(Li là l p th i, Oi là s l n quan sát th y X thu c l p i).<br />
Bi n X<br />
<br />
L1<br />
<br />
L2<br />
<br />
...<br />
<br />
Lk<br />
<br />
T ng<br />
<br />
T n s Oi<br />
<br />
O1<br />
<br />
O2<br />
<br />
...<br />
<br />
Ok<br />
<br />
N=ΣOi<br />
<br />
T m t lý thuy t nào ñó, có th là m t lý thuy t ñã ñư c xây d ng ch t ch , có gi i thích cơ<br />
ch , cũng có th ch là m t lý thuy t mang tính kinh nghi m, ñúc k t t nh ng quan sát trư c<br />
ñây v bi n X, ngư i ta ñưa ra m t gi thi t H0 th hi n dãy các t n su t lý thuy t f1, f2, . . . ,<br />
fk c a bi n X( có nghĩa là dãy t n su t này ñư c tính t lý thuy t ñã nêu trên). Căn c vào t n<br />
su t lý thuy t fi và t n s th c t mi chúng ta ph i ñưa ra m t trong hai k t lu n:<br />
1) Ch p nh n H0 t c là coi t n s th c t mi phù h p v i lý thuy t ñã nêu th hi n<br />
<br />
t n su t fi.<br />
<br />
2) Bác b H0 t c là dãy t n s th c t mi không phù h p v i lý thuy t ñã nêu.<br />
Vi c ki m ñ nh ñư c th c hi n v i m c ý nghĩa α , t c là n u gi thi t H0 ñúng thì xác su t<br />
ñ bác b m t cách sai l m H0 b ng α.<br />
Các bư c th c hi n:<br />
1) Tính các t n s lý thuy t theo công th c: Ei = N. fi<br />
2) Tính kho ng cách gi a hai s Oi và Ei theo cách tính kho ng cách<br />
χ<br />
<br />
2<br />
<br />
(Oi − Ei )2<br />
=<br />
Ei<br />
<br />
(7.1)<br />
<br />
102 Thi t k thí nghi m<br />
<br />
3) Tính kho ng cách gi a hai dãy t n s th c t mi và t n s lý thuy t ti theo công th c :<br />
k<br />
<br />
TN<br />
<br />
=<br />
<br />
(Oi − Ei )2<br />
<br />
i =1<br />
<br />
χ<br />
<br />
2<br />
<br />
Ei<br />
<br />
∑<br />
<br />
(7.2)<br />
<br />
4) Tìm giá tr t i h n trong b ng 4 (c t α, dòng k-1, ký hi u là χ2(α,k-1))<br />
5) N u χ2tn ≤ χ2(α,k-1) thì ch p nh n H0: “T n s th c t Oi phù h p v i lý thuy t ñã nêu”.<br />
N u χ2tn > χ2(α,k-1) thì bác b H0, t c là “T n s th c t Oi không phù h p v i lý thuy t ñã<br />
nêu”.<br />
ð s d ng phép th χ2, c n tho mãn các ñi u ki n sau:<br />
1) Các Oi là các quan sát ñ c l p<br />
2) T t c các Ei ñ u ph i l n hơn ho c b ng 5<br />
3) Các Oi và Ei không ph i là các t l ph n trăm.<br />
Ví d 7.1: S li u th ng kê năm 1995 cho th y, t l màu lông (fi) tr ng, nâu và ñen tr ng<br />
c a th trong m t qu n th tương ng là 0,36; 0,48 và 0,16. Năm 2005, t 400 con th rút m t<br />
cách ng u nhiên t qu n th nêu trên có 140 con màu lông tr ng, 240 con màu nâu và 20 con<br />
màu ñen tr ng. Câu h i ñ t ra: Sau 10 năm (t 1995 ñ n 2005) t l màu lông c a th trong<br />
qu n th có thay ñ i hay không?<br />
Gi thi t H0: T l màu lông c a th trong qu n th sau 10 năm không thay ñ i<br />
Ta có th tóm t t s li u quan sát thu ñư c năm 2005 như sau:<br />
Màu lông<br />
<br />
Tr ng<br />
<br />
Nâu<br />
<br />
ðen tr ng<br />
<br />
T ng s<br />
<br />
T n s (Oi)<br />
<br />
140<br />
<br />
240<br />
<br />
20<br />
<br />
400<br />
<br />
D a vào t l ban ñ u (năm 1995) ta có các t n su t lý thuy t (ti)<br />
Màu lông<br />
<br />
Tr ng<br />
<br />
Nâu<br />
<br />
ðen tr ng<br />
<br />
T ng s<br />
<br />
fi<br />
<br />
0,36<br />
<br />
0,48<br />
<br />
0,16<br />
<br />
1<br />
<br />
Ei<br />
<br />
400×0,36= 144<br />
<br />
400×0,48= 192<br />
<br />
400×0,16= 64<br />
<br />
400<br />
<br />
χ2TN =<br />
<br />
k<br />
<br />
∑<br />
i =1<br />
<br />
(Oi − Ei )2 = (140 − 144)2 + (240 − 192)2<br />
Ei<br />
<br />
144<br />
<br />
192<br />
<br />
+<br />
<br />
(20 − 64) 2<br />
= 42,361<br />
64<br />
<br />
B c t do df = (3 - 1) = 2; giá tr t i h n χ2(0,05; 2) = 5,991<br />
K t lu n: χ2TN < χ2(0,05, 2) nên bác b gi thi t H0. Ch ng t t l màu lông th trong qu n<br />
th sau 10 năm có s thay ñ i.<br />
<br />
Chương 7 Ki m ñ nh m t phân ph i và b ng tương liên 103<br />
<br />
Ví d 7.2: Gi s chúng ta ñi u tra gi i tính c a m t qu n th cho trư c. Trong m t mùa nh t<br />
ñ nh trong năm ngư i ta th y t l gi i tính lúc sinh ra có xu hư ng con cái cao hơn. ð gi i<br />
ñáp câu h i trên ti n hành ch n ng u nhiên 297 con chim m i sinh thì th y có 167 con cái.<br />
Li u y u t mùa có làm nh hư ng ñ n t l gi i tính hay không?<br />
ð i v i trư ng h p gi i tính, ta luôn th a nh n t l ñ c cái là 1:1 hay 0,5:0,5. N u mùa<br />
không làm nh hư ng ñ n t l gi i tính thì theo ư c tính lý thuy t t 297 con chim quan sát<br />
ta s có s chim ñ c và s chim cái b ng nhau và b ng 297 × 0,5 = 148,5.<br />
Ta có b ng t ng h p sau:<br />
ð c<br />
<br />
Cái<br />
<br />
T ng s<br />
<br />
T n s quan sát (Oi)<br />
<br />
130<br />
<br />
167<br />
<br />
297<br />
<br />
T n s lý thuy t (Ei)<br />
<br />
148,5<br />
<br />
148,5<br />
<br />
297<br />
<br />
χ<br />
<br />
k<br />
<br />
TN<br />
<br />
2<br />
<br />
(Oi − Ei )2<br />
<br />
i =1<br />
<br />
χ<br />
<br />
2<br />
<br />
Ei<br />
<br />
∑<br />
<br />
=<br />
<br />
k<br />
<br />
TN<br />
<br />
=<br />
<br />
∑<br />
<br />
(Oi − Ei )2 = (130 − 148,5)2 + (167 − 148,5)2<br />
148,5<br />
<br />
Ei<br />
<br />
i =1<br />
<br />
148,5<br />
<br />
= 4,61<br />
<br />
B c t do df = (2 - 1) = 1; giá tr t i h n χ2(0,05; 1) = 3,84<br />
K t lu n: χ2TN < χ2(0,05, 1) nên bác b gi thi t H0. Ch ng t t l gi i tính không tuân theo<br />
t l ñ c cái 1:1. ði u ki n khí h u ñã làm thay ñ i t l này.<br />
Hi u ch nh Yate<br />
k<br />
<br />
χ =∑<br />
2<br />
<br />
(O<br />
<br />
i<br />
<br />
− E i − 0,5)<br />
<br />
2<br />
<br />
Ei<br />
<br />
i =1<br />
<br />
H s 0,5 trong công th c nêu trên g i là h s hi u ch nh Yate hay còn g i là hi u ch nh tính<br />
liên t c ñ lo i b s thiên l ch. Hi u ch nh Yate s ñư c trình bày chi ti t ph n ti p theo<br />
Theo ví d trên ta có giá tr χ² hi u ch nh là:<br />
χ<br />
<br />
2<br />
<br />
k<br />
<br />
TN<br />
<br />
=<br />
<br />
∑<br />
i =1<br />
<br />
2<br />
2<br />
(Oi − Ei )2 = (130 − 148,5 − 0,5) + (167 − 148,5 − 0,5)<br />
<br />
Ei<br />
<br />
148,5<br />
<br />
148,5<br />
<br />
= 4,36<br />
<br />
Giá tr χ² hi u ch nh (4,36) bé hơn giá tr χ² trư c khi hi u ch nh (4,61), tuy nhiên giá tr hi u<br />
ch nh v n l n hơn giá tr t i h n (3,84) cho nên ta v n có k t lu n tương t như trên.<br />
<br />
7.2.<br />
<br />
B ng tương liên l × k<br />
<br />
Có 2 bi n ñ nh tính, bi n X chia ra k l p, bi n Y chia ra l l p, qua kh o sát thu ñư c b ng hai<br />
chi u ch a các s quan sát ñư c c a các ô Oij (g i là b ng tương liên):<br />
<br />
104 Thi t k thí nghi m<br />
<br />
B ng các t n s<br />
<br />
Oij<br />
Y<br />
<br />
X<br />
<br />
Y1<br />
<br />
Y2<br />
<br />
...<br />
<br />
Yl<br />
<br />
THi<br />
<br />
X1<br />
X2<br />
...<br />
Xk<br />
<br />
O11<br />
O21<br />
...<br />
Ok1<br />
<br />
O12<br />
O22<br />
...<br />
Ok2<br />
<br />
...<br />
...<br />
...<br />
...<br />
<br />
O1l<br />
O2l<br />
...<br />
Okl<br />
<br />
TH1<br />
TH2<br />
...<br />
THk<br />
<br />
TCj<br />
<br />
TC1<br />
<br />
TC2<br />
<br />
...<br />
<br />
TCl<br />
<br />
N<br />
<br />
Các s Oij thư ng ñư c g i là các t n s th c t . Bài toán ñ t ra<br />
Y(c t) có quan h hay không?<br />
<br />
ñây là bi n X(hàng) và bi n<br />
<br />
Gi thi t H0 : “hàng và c t không quan h ” v i ñ i thuy t H1: “hàng và c t có quan h ”.<br />
<br />
ð ki m tra gi thi t này ph i th c hi n các bư c sau:<br />
1) T gi thi t hàng và c t không quan h suy ra các s<br />
trong ô v lý thuy t ph i b ng t ng<br />
hàng (THi ) nhân v i t ng c t (TCj) chia cho t ng s quan sát N (trong thí d 7.4 chúng ta s<br />
lý gi i v n ñ này). G i t n s lý thuy t là Eij ta có :<br />
<br />
E ij =<br />
<br />
TH i × TC j<br />
N<br />
<br />
(7.3)<br />
<br />
2) Tính kho ng cách gi a 2 t n s Oij và Eij theo cách tính kho ng cách χ2<br />
<br />
( O ij − E ij ) 2<br />
E ij<br />
3) Tính kho ng cách gi a 2 dãy mij và tij b ng χ2tn:<br />
<br />
χ<br />
<br />
2<br />
tn<br />
<br />
k<br />
<br />
l<br />
<br />
(mij − tij )2<br />
<br />
1<br />
<br />
1<br />
<br />
tij<br />
<br />
= ∑∑<br />
<br />
(7.4)<br />
<br />
4) Ch n m c ý nghĩa α và tìm giá tr t i h n trong b ng 4 χ2 (α,(k-1)(l-1)) tương ng v i c t<br />
α và b c t do (k-1)(l-1)<br />
5) K t lu n:<br />
m c ý nghĩa α n u χ2tn ≤ χ2 (α,(k-1)(l-1)) ch p nh n H0, ngư c l i thì bác b H0<br />
<br />
Bài toán v b ng tương liên thư ng th hi n dư i hai d ng:<br />
1) X và Y là hai tính tr ng, gi thi t H0: “Hai bi n X, Y không có quan h ” hay còn phát bi u<br />
m t cách khác là “X và Y ñ c l p”. Thư ng g i bài toán này là bài toán ki m ñ nh tính ñ c<br />
l p c a hai bi n ñ nh tính, hay ki m ñ nh tính ñ c l p c a hai tính tr ng.<br />
2) Hàng X là các ñám ñông, c t Y là các nhóm, vi c phân chia ñám ñông thành các nhóm căn<br />
c vào m t tiêu chu n nào ñó. Bài toán này thư ng ñư c g i là bài toán ki m ñ nh tính thu n<br />
<br />
Chương 7 Ki m ñ nh m t phân ph i và b ng tương liên 105<br />
<br />
nh t c a các ñám ñông (t c là các ñám ñông có cùng t l phân chia), hay còn g i là ki m<br />
ñ nh các t l .<br />
<br />
Ví d 7.3: T m t ñàn trư c khi cho ti p xúc v i ngu n b nh, ch n ra 295 ñ ng vât thí<br />
nghi m (tiêm v c xin) và 55 ñ ng v t ñ i ch ng (không tiêm v c xin). S ñ ng v t này sau<br />
khi cho ti p xúc v i ngu n b nh ta thu ñư c k t qu như trong b ng sau. Li u v c xin có làm<br />
gi m t l ch t hay không?<br />
K t qu<br />
Thu c<br />
<br />
S ng<br />
<br />
Ch t<br />
<br />
T ng hàng<br />
<br />
V c xin<br />
<br />
120<br />
<br />
175<br />
<br />
295<br />
<br />
ð i ch ng<br />
<br />
30<br />
<br />
25<br />
<br />
55<br />
<br />
T ng c t<br />
<br />
150<br />
<br />
200<br />
<br />
350<br />
<br />
ñây có th coi hàng là các l p c a bi n thu c X (có 2 l p A, B), c t là là các l p c a bi n<br />
k t qu Y (có 2 l p: s ng và ch t). Cũng có th coi hàng là các ñám ñông: “nh ng ñ ng v t<br />
tiêm v c xin” và “nh ng ñ ng v t không tiêm v c xin”. C t là s phân chia m i ñám ñông<br />
thành 2 nhóm s ng và ch t.<br />
B ng t n s lý thuy t:<br />
K t qu<br />
Thu c<br />
<br />
S ng<br />
<br />
Ch t<br />
<br />
T ng hàng<br />
<br />
V c xin<br />
<br />
295 × 150<br />
= 126,4<br />
350<br />
<br />
295 × 200<br />
= 168,6<br />
350<br />
<br />
295<br />
<br />
ð i ch ng<br />
<br />
55 × 150<br />
= 23,6<br />
350<br />
<br />
55 × 200<br />
= 31,4<br />
350<br />
<br />
55<br />
<br />
150<br />
<br />
200<br />
<br />
350<br />
<br />
T ng c t<br />
χ2TN =<br />
<br />
(120 − 126,4)2 + (175 − 168,6) 2 + (30 − 23,6) 2 + (25 − 31,4) 2<br />
126,4<br />
<br />
168,6<br />
<br />
23,6<br />
<br />
31,4<br />
<br />
= 3,64<br />
<br />
B c t do df = (2-1)(2-1) = 1. Giá tr t i h n χ2(0,05,1) = 3,84<br />
K t lu n: Vì “χ2TN = 3,64 < χ2(0,05,1) = 3,84, ta chưa có ñ b ng ch ng ñ bác b H0. Hay<br />
nói m t cách khác v c xin ñã không làm gi m ñư c t l ch t.<br />
<br />
Ví d 7.4: Nghiên c u nh hư ng c a vi c thi n ñ n s xu t hi n b nh ti u ñư ng chu t.<br />
T 100 chu t thí nghi m, chia ng u nhiên v 1 trong 2 cách x lý thi n và không thi n. S<br />
chu t 2 lô thí nghi m ñư c theo dõi cho ñ n 140 ngày tu i và ti n hành l y m u nghiên c u<br />
t 42 ngày tu i. B nh ti u ñư ng ñư c xác ñ nh ñ i v i chu t có hàm lư ng ñư ng trong máu<br />
l n hơn 200 mg/ dl. K t qu thí nghi m ñư c ghi l i b ng sau:<br />
<br />