Chương 6<br />
<br />
Tương quan và h i quy<br />
<br />
Trong chương này chúng ta s xem xét m i quan h gi a hai bi n ñ nh lư ng ñư c kh o sát<br />
ñ ng th i trên m t ñám ñông, ñi u này có nghĩa là khi ta l y ng u nhiên m t cá th c a ñám<br />
ñông ra xem xét thì ph i cân ño, phân tích, th nghi m ñ ng th i hai ñ c tính sinh h c ñ nh<br />
lư ng X và Y.<br />
Ví d cân và ño ñư ng kính c a tr ng gà, cân và ño vòng ng c c a bò, cân kh i lư ng bu ng<br />
tr ng và ño chi u dài c a cá, nhi t ñ môi trư ng và lư ng th c ăn thu nh n; hàm lư ng lysin<br />
và protein trong th c ăn, ñ dày m lưng và t l n c l n . . .<br />
Sau khi kh o sát m t m u g m n cá th ta thu ñư c n c p s (xi, yi), m t câu h i r t t nhiên<br />
là hai bi n X và Y có quan h v i nhau hay không ? n u có thì khi X thay ñ i Y s thay ñ i<br />
theo như th nào?<br />
Câu h i ñ u: X và Y có quan h v i nhau hay không ñư c trình b y m c h s tương quan,<br />
câu h i sau khi X thay ñ i Y s thay ñ i theo như th nào ñư c trình b y m c h i quy.<br />
<br />
6.1.<br />
<br />
S p x p s li u<br />
<br />
Khi có ít s li u có th ñ dãy n c p s dưói d ng c t hay hàng, n u nhi u hơn thì có th s p<br />
dư i d ng có t n s , n u nhi u n a thì chia kho ng c X và Y ñ s p thành b ng hai chi u.<br />
1) S p thành hàng<br />
X<br />
x1<br />
Y<br />
y1<br />
2) S p thành hàng có t n s<br />
X<br />
x1<br />
x2<br />
Y<br />
y1<br />
y2<br />
m<br />
m1<br />
m2<br />
3) S p thành c t ho c thành c t có t n s<br />
X<br />
x1<br />
x2<br />
...<br />
xn<br />
<br />
Y<br />
y1<br />
y2<br />
...<br />
yn<br />
<br />
x2<br />
y2<br />
<br />
...<br />
...<br />
<br />
...<br />
...<br />
...<br />
X<br />
x1<br />
x2<br />
...<br />
xk<br />
<br />
xn<br />
yn<br />
<br />
xk<br />
yk<br />
mk<br />
<br />
n<br />
<br />
Y<br />
y1<br />
y2<br />
...<br />
yk<br />
T ng<br />
<br />
m<br />
m1<br />
m2<br />
...<br />
mk<br />
n<br />
<br />
Chương 6 Tương quan và h i quy 89<br />
<br />
4) S p thành b ng, X g m k l p, Y g m l l p v i các ñi m gi a xi và yj<br />
y1<br />
<br />
y2<br />
<br />
...<br />
<br />
yl<br />
<br />
x1<br />
x2<br />
...<br />
<br />
m11<br />
m21<br />
...<br />
<br />
m12<br />
m22<br />
...<br />
<br />
...<br />
...<br />
...<br />
<br />
m1l<br />
m2l<br />
...<br />
<br />
xk<br />
<br />
mk1<br />
<br />
mk2<br />
<br />
...<br />
<br />
mkl<br />
<br />
T d ng b ng có th d dàng chuy n thành d ng c t hay hàng có t n s và ngư c tr l i<br />
chuy n t d ng c t hay hàng có t n s thành b ng.<br />
ph n sau các công th c tính toán ñưa ra ch ñúng khi s li u vi t dư i d ng hai c t không<br />
có t n s , khi có t n s thì ph i thêm t n s vào các công th c.<br />
<br />
6.2.<br />
<br />
H s tương quan.<br />
<br />
Trong toán h c khi có hai dãy s xi và yi ngư i ta có th kh o sát m i quan h gi a X và Y<br />
b ng khái ni m hàm s .<br />
Trong th ng kê xi và yi là các giá tr thu ñư c trong m u quan sát c a hai bi n ng u nhiên X,<br />
Y và ngư i ta mu n ñưa ra m t con s ñ ñánh giá hai bi n ng u nhiên X và Y có quan h v i<br />
nhau hay không.<br />
Có khá nhi u con s ñư c dùng ñ ñánh giá X và Y có quan h hay không nhưng không có<br />
con s nào tho mãn ñư c m i mong mu n c a chúng ta. Trong th c t , các nhà nghiên c u<br />
thư ng quan tâm ñ n m i quan h tuy n tính gi a 2 tính tr ng. M c ñ quan h này ñư c th<br />
hi n b ng h s tương quan. H s tương quan ñư c ñánh giá là ñơn gi n, d dùng và có<br />
nhi u ưu ñi m, nhưng ch th hi n ñư c m i quan h tuy n tính gi a X và Y ch không th<br />
dùng ñ ñánh giá m i quan h nói chung c a hai bi n.<br />
6.2.1.<br />
<br />
Tính h s tương quan<br />
<br />
D a trên lý thuy t xác su t v h s tương quan chúng ta có công th c sau ñ tính h s tương<br />
quan m u rXY gi a hai bi n ng u nhiên X và Y<br />
n<br />
<br />
∑(x<br />
<br />
rXY =<br />
<br />
i<br />
<br />
− x )( yi − y )<br />
<br />
1<br />
n<br />
<br />
∑<br />
<br />
( xi − x )<br />
<br />
1<br />
<br />
n<br />
<br />
2<br />
<br />
∑<br />
<br />
(6.1)<br />
<br />
( yi − y )<br />
<br />
2<br />
<br />
1<br />
<br />
Khai tri n công th c này ñư c công th c (6.2) thu n ti n hơn v m t tính toán<br />
n<br />
<br />
n<br />
<br />
∑ xi yi −<br />
<br />
rXY =<br />
<br />
n<br />
<br />
1<br />
<br />
1<br />
<br />
∑ xi ∑ yi<br />
n<br />
<br />
1<br />
n<br />
<br />
(x −<br />
<br />
(∑ xi )<br />
<br />
n<br />
<br />
=<br />
<br />
n<br />
<br />
( ∑ yi )<br />
<br />
2<br />
<br />
2<br />
<br />
_ _<br />
<br />
∑ xi yi − n x y<br />
1<br />
_<br />
<br />
_<br />
<br />
(6.2)<br />
<br />
( x − n( x) )( y − n( y ) )<br />
2<br />
i<br />
<br />
2<br />
<br />
2<br />
1<br />
<br />
2<br />
<br />
)( y − 1<br />
)<br />
n<br />
n<br />
N u tính tu n t các tham s thì có th l n lư t tính phương sai m u c a bi n X, phương sai<br />
m u c a bi n Y, hi p phương sai m u c a X và Y.<br />
2<br />
i<br />
<br />
1<br />
<br />
2<br />
1<br />
<br />
90 Thi t k thí nghi m<br />
<br />
rXY =<br />
<br />
Cov XY<br />
s X sY<br />
<br />
(6.3)<br />
<br />
n<br />
<br />
Trong ñó: s =<br />
2<br />
x<br />
<br />
6.2.2.<br />
<br />
1<br />
<br />
(n − 1)<br />
<br />
n<br />
<br />
n<br />
<br />
∑ ( xi − x )2<br />
;<br />
<br />
s =<br />
2<br />
y<br />
<br />
∑ ( yi − y )2<br />
1<br />
<br />
(n − 1)<br />
<br />
; cov XY =<br />
<br />
∑ ( x − x )( y<br />
i<br />
<br />
i<br />
<br />
− y)<br />
<br />
1<br />
<br />
(n − 1)<br />
<br />
Tính ch t c a h s tương quan m u<br />
<br />
1) Là m t s n m gi a -1 và + 1, nói cách khác rXY ≤ 1<br />
2) N u Y và X có quan h tuy n tính Y = a + bX thì rXY= 1 và ngư c l i n u rXY= 1 thì<br />
Y và X có quan h tuy n tính Y = a + bX<br />
3) N u X và Y ñ c l p v xác su t thì rXY = 0 nhưng ngư c l i không ñúng, n u rXY = 0 (g i<br />
là không tương quan) thì chưa th k t lu n X và Y ñ c l p v xác suât. (Như v y ñ c l p v<br />
xác su t suy ra không tương quan nhưng không tương quan không suy ra ñ c l p v xác su t).<br />
4) N u th c hi n hai phép bi n ñ i tuy n tính<br />
U= aX + b;<br />
<br />
V = cY + d<br />
<br />
thì rUV = rXY<br />
<br />
Tính ch t này ñư c phát bi u dư i d ng: H s tương quan b t bi n ñ i v i phép bi n ñ i<br />
tuy n tính.<br />
Trong th ng kê thư ng dùng cách ch n g c ño m i và ñơn vi ño m i. N u g i xo là g c m i,<br />
h là ñơn v m i, s ño x c a bi n X bây gi là u:<br />
u=<br />
<br />
(x − xo<br />
)<br />
hay x= xo + hu<br />
h<br />
<br />
như v y ta ñã th c hi n phép bi n ñ i tuy n tính X = xo + hU. Tương t ñ i v i Y ta bi n ñ i<br />
Y = yo + kV<br />
B n tính ch t này có th ch ng minh ch t ch nh các b t ñ ng th c toán h c ñ i v i 2 dãy s<br />
nhưng ñây chúng ta th a nh n không ch ng minh.<br />
H s tương quan ñư c coi là m t s ño m i quan h hay liên h tuy n tính gi a X và Y vì<br />
khi rXY g n v phía 1 (thư ng g i là tương quan m nh) thì có th k t lu n X và Y có quan<br />
h g n v i quan h tuy n tính, còn n u rXYg n v phía 0 ( thư ng g i là tương quan y u)<br />
thì không k t lu n ñư c gì vì có th X và Y ñ c l p ho c có th có quan h , nhưng n u có thì<br />
quan h này không th là quan h tuy n tính.<br />
V d u thì n u rXY > 0 ta có tương quan dương, n u < 0 thì tương quan âm<br />
<br />
H6 r = 1<br />
<br />
H 7 r > 0 m nh<br />
<br />
Chương 6 Tương quan và h i quy 91<br />
<br />
H8 r0y u<br />
<br />
Ví d 6.1: Nghiên c u m i quan h tuy n tính gi a ñư ng kính l n x (mm) và kh i lư ng y<br />
(gram) c a m t lo i tr ng gà. Ti n hàn ño ñư ng kính l n và cân kh i lư ng c a 10 qu<br />
tr ng. S li u thu th p ñư c như sau:<br />
Qu tr ng<br />
<br />
1<br />
<br />
2<br />
<br />
3<br />
<br />
4<br />
<br />
5<br />
<br />
6<br />
<br />
7<br />
<br />
8<br />
<br />
9<br />
<br />
10<br />
<br />
ðư ng kính l n (x)<br />
<br />
57<br />
<br />
54<br />
<br />
55<br />
<br />
52<br />
<br />
55<br />
<br />
60<br />
<br />
56<br />
<br />
56<br />
<br />
57<br />
<br />
58<br />
<br />
Kh i lư ng (y)<br />
<br />
61<br />
<br />
59<br />
<br />
58<br />
<br />
56<br />
<br />
57<br />
<br />
59<br />
<br />
56<br />
<br />
58<br />
<br />
56<br />
<br />
60<br />
<br />
D a vào công th c 6.1 ta có th tính ñư c h s tương quan như sau:<br />
_<br />
<br />
_<br />
<br />
_<br />
<br />
_<br />
<br />
_<br />
<br />
_<br />
<br />
x<br />
<br />
y<br />
<br />
(x- x )<br />
<br />
(y- y )<br />
<br />
(x- x )²<br />
<br />
(y- y )²<br />
<br />
(x- x )(y- y )<br />
<br />
57<br />
<br />
61<br />
<br />
1<br />
<br />
3<br />
<br />
1<br />
<br />
9<br />
<br />
3<br />
<br />
54<br />
<br />
59<br />
<br />
-2<br />
<br />
1<br />
<br />
4<br />
<br />
1<br />
<br />
-2<br />
<br />
55<br />
<br />
58<br />
<br />
-1<br />
<br />
0<br />
<br />
1<br />
<br />
0<br />
<br />
0<br />
<br />
52<br />
55<br />
60<br />
56<br />
56<br />
57<br />
58<br />
560<br />
<br />
56<br />
57<br />
59<br />
56<br />
58<br />
56<br />
60<br />
580<br />
<br />
-4<br />
-1<br />
4<br />
0<br />
0<br />
1<br />
2<br />
0<br />
<br />
-2<br />
-1<br />
1<br />
-2<br />
0<br />
-2<br />
2<br />
0<br />
<br />
16<br />
1<br />
16<br />
0<br />
0<br />
1<br />
4<br />
44<br />
<br />
4<br />
1<br />
1<br />
4<br />
0<br />
4<br />
4<br />
28<br />
<br />
8<br />
1<br />
4<br />
0<br />
0<br />
-2<br />
4<br />
16<br />
<br />
_<br />
<br />
_<br />
<br />
Ta có: n = 10; Σxi = 560; Σyi = 580 ; x = 56; y = 58.<br />
N u tính theo (6.1)<br />
<br />
rXY =<br />
<br />
16<br />
44 × 28<br />
<br />
= 0,4558<br />
<br />
N u tính theo (6.2) thì<br />
_<br />
<br />
_<br />
<br />
Σxi2 = 31404; Σyi2 = 33668; ( x )2 = 3136; Σxi2- n( x )2= 44<br />
_<br />
<br />
_<br />
<br />
_<br />
<br />
Σxiyi = 32496; Σxiyi - n× x × y = 16; Σyi2 - n( y )2 = 28<br />
rXY =<br />
<br />
16<br />
= 0,4558<br />
44 × 28<br />
<br />
92 Thi t k thí nghi m<br />
<br />
N u tính tu n t theo (8.3) thì:<br />
2<br />
sX =<br />
<br />
44<br />
28<br />
16<br />
2<br />
= 1,7778<br />
= 4,8889 ; sY =<br />
= 3,1111 ; cov XY =<br />
9<br />
9<br />
9<br />
<br />
rXY =<br />
<br />
6.3.<br />
<br />
1,7778<br />
= 0,4558<br />
4,8889 × 3,1111<br />
<br />
H i quy tuy n tính<br />
<br />
V các ñi m quan sát Mi(xi,yi) trên h to ñ vuông góc, các ñi m này h p thành m t ñám<br />
mây quan sát nhìn chung có d ng m t elíp (tr m t vài ñi m tách ra xa g i là ñi m ngo i lai),<br />
n u rXY g n b ng 1 thì elíp r t d t, n u rXYv a ph i thì elíp b u bĩnh, n urXY g n<br />
b ng không thì có 2 kh năng: ho c ñám mây quan sát t n m n trên m t ph m vi r ng (không<br />
quan h ), ho c ñám mây quan sát không còn d ng elíp mà t p trung thành m t hình cong (phi<br />
tuy n).<br />
Trư ng h p rXY g n 1 elíp ñám mây quan sát khá d t. ð gi i thích s thay ñ i c a Y khi<br />
cho X thay ñ i ngư i ta thư ng ñưa ra mô hình h i quy tuy n tính Y = a + bX.<br />
Có th tìm hi u mô hình h i quy tuy n tính theo hai cách sau ñây:<br />
<br />
6.3.1.<br />
<br />
ðư ng trung bình c a bi n ng u nhiên Y theo X trong phân ph i chu n 2 chi u<br />
<br />
Kh o sát ñ ng th i 2 bi n ng u nhiên ñ nh lư ng (như ñã làm t ñ u chương này). C p bi n<br />
X,Y thư ng tuân theo lu t chu n hai chi u, khi y n u theo dõi bi n X trư c thì ng v i m i<br />
giá tr x c a bi n ng u nhiên X có vô s giá tr c a bi n Y, các giá tr này có giá tr trung bình<br />
lý thuy t là kỳ v ng M(Y/ x).<br />
Khi x thay ñ i kỳ v ng M(Y/x) thay ñ i theo và các ñi m P(x,M(Y/ x)) ch y trên m t ñư ng<br />
th ng g i là ñư ng h i quy tuy n tính Y theo X.<br />
N u theo dõi bi n Y trư c thì ng v i m t giá tr y c a Y có vô s giá tr c a bi n X có trung<br />
bình là kỳ v ng M(X/ y). ði m Q(y, M(X/ y) ch y trên m t ñư ng th ng g i là ñư ng h i quy<br />
tuy n tính X theo Y.<br />
Như v y, v m t lý thuy t, khi có phân ph i chu n hai chi u các ñư ng h i quy tuy n tính Y<br />
theo X và h i quy tuy n tính X theo Y chính là các ñư ng kỳ v ng có ñi u ki n M(Y/x) và<br />
M(X/y).<br />
Trong trư ng h p t ng quát c a phân ph i hai chi u các ñư ng kỳ v ng có ñi u ki n có th là<br />
ñư ng th ng ho c ñư ng cong và ñư c g i là h i quy Y theo X (hay X theo Y). Trong th c<br />
nghi m chúng ta kh o sát 2 bi n ñ nh lư ng b ng cách l y m u v i dung lư ng n khá l n.<br />
Thay cho ñư ng h i quy tuy n tính lý thuy t có ñư ng h i quy th c nghi m. G i (x, y) là to<br />
_<br />
<br />
_<br />
<br />
ñ c a m t ñi m ch y trên ñư ng th ng h i quy, x và y là trung bình c ng c a X và Y, sx và<br />
sy là ñ l ch chu n c a X và Y, phương trình h i quy tuy n tính th c nghi m có d ng:<br />
s<br />
y − y = rXY Y ( x − x )<br />
(6.4)<br />
sX<br />
<br />