Chng 7<br />
<br />
TNG QUAN VÀ H I QUI TUY N TÍNH<br />
<br />
160<br />
<br />
Chương 7<br />
<br />
Tương quan và<br />
H i qui tuy n tính<br />
1. H S<br />
<br />
TƯƠNG QUAN M U<br />
<br />
nh nghĩa và các tính ch t c a H s tương quan ρ c a hai bi n ng u<br />
nhiên X và Y ã ư c<br />
c p n trong o n 2.7. Trong th c t , chúng ta không<br />
bi t ρ mà ch d a vào m u suy oán v ρ.<br />
1.1. nh nghĩa. Gi s (X1, Y1); (X 2, Y2); . . .; (Xn, Yn) là m u ư c<br />
thành l p t vectơ ng u nhiên (X, Y). Bi n ng u nhiên<br />
n<br />
<br />
∑ ( X i − X ).( Yi − Y )<br />
R=<br />
<br />
i =1<br />
<br />
( n − 1) S X SY<br />
<br />
ư c g i là H s tương quan m u c a X và Y.<br />
V i m u c th , giá tr h s tương quan m u ư c tính b i:<br />
r =<br />
<br />
∑ xi yi<br />
<br />
− n x. y<br />
=<br />
(n − 1) s X .sY<br />
<br />
∑ xi yi<br />
<br />
− n x. y<br />
<br />
( ∑ xi2 − n.x 2 ) ( ∑ yi2 − n. y 2 )<br />
<br />
n<br />
<br />
trong ó, ký hi u Σ ch<br />
<br />
∑<br />
i =1<br />
<br />
2. KI M<br />
<br />
NH GI THI T V H S<br />
<br />
TƯƠNG QUAN<br />
<br />
Gi s (X1, Y1); (X2, Y2); . . .; (Xn, Yn) là m u ư c thành l p t t ng th<br />
(X,Y) có phân ph i chu n hai chi u. Chúng ta mu n ki m nh các gi thi t liên<br />
<br />
Chng 7<br />
<br />
TNG QUAN VÀ H I QUI TUY N TÍNH<br />
<br />
161<br />
<br />
quan n các giá tr khác nhau c a h s tương quan t ng th , ký hi u ρ, d a trên<br />
phân ph i m u c a h s tương quan m u R.<br />
2.1. Ki m<br />
<br />
nh gi thi t:<br />
<br />
H0: ρ = 0<br />
<br />
i v i H1: ρ ≠ 0 (ho c ρ > 0 ho c ρ < 0)<br />
<br />
Ngư i ta ch ng minh ư c r ng v i gi thi t H0, phân ph i m u c a R<br />
x ng; t ó, th ng kê<br />
n−2<br />
<br />
T= R<br />
<br />
i<br />
<br />
~ Student (n − 2)<br />
<br />
1 − R2<br />
<br />
Tr c nghi m t ư c dùng trong trư ng h p này.<br />
2.2. Ki m<br />
<br />
nh gi thi t:<br />
H0: ρ = ρo ≠ 0<br />
<br />
i v i H1: ρ ≠ ρo<br />
<br />
V i gi thi t H0, phân ph i m u c a R b l ch nên không th dùng tr c ti p<br />
R. Trong trư ng h p này, Fisher ã ngh m t phép bi n i ưa n th ng kê<br />
1+ R<br />
Z = 1 ln<br />
<br />
( )<br />
<br />
2<br />
<br />
1− R<br />
<br />
có phân ph i ti m c n chu n v i kỳ v ng và phương sai l n lư t là<br />
1 + ρo <br />
ρo<br />
2<br />
1<br />
µ Z = 1 ln <br />
+ 2(n − 1) và σ Z = n − 3<br />
2 1 − ρo <br />
<br />
<br />
Tr c nghi m U ư c dùng v i U = Z*, bi n chu n hóa c a Z.<br />
Phép bi n i trên ư c g i là phép bi n i Fisher; nó cũng ư c dùng<br />
tìm kho ng tin c y cho h s tương quan t ng th .<br />
<br />
2.3. Thí d . D a vào m u ng u nhiên c 18 ư c ch n t t ng th (X,Y)<br />
có phân ph i chu n 2 chi u, ngư i ta tính ư c giá tr h s tương quan m u r =<br />
0,32. m c ý nghĩa 5%, có s tương quan tuy n tính gi a X và Y không?<br />
Gi i.<br />
Chúng ta ph i có quy t<br />
<br />
nh gi a hai gi thi t:<br />
H0 : ρ = 0<br />
<br />
và<br />
<br />
H1: ρ ≠ 0.<br />
<br />
N u H0 úng thì BNN<br />
<br />
T= R<br />
<br />
18 − 2<br />
1 − R2<br />
<br />
V i m c α = 5% , giá tr t i h n là:<br />
v i m u c th , chúng ta có:<br />
<br />
~ t(16)<br />
(16)<br />
t0,975 = 2,1199 ;<br />
<br />
Chng 7<br />
<br />
TNG QUAN VÀ H I QUI TUY N TÍNH<br />
<br />
162<br />
<br />
t=<br />
<br />
0,32. 16<br />
1 − (0,32)2<br />
<br />
= 1,35<br />
<br />
m c ý nghĩa α = 5%.<br />
Vì |t| < 2,12 nên gi thi t H0 không th b bác b<br />
Nói cách khác, chúng ta ch p nh n r ng X và Y không tương quan m c ý nghĩa<br />
5%.<br />
<br />
2.4. Thí d . H s tương quan ư c tính trên m u c 24, ch n t t ng th<br />
có phân ph i chu n 2 chi u, là r = 0,75. m c ý nghĩa α = 5%, hãy cho nh n xét<br />
v tài li u cho r ng h s tương quan t ng th b ng 0,65.<br />
Gi i.<br />
Ki m<br />
<br />
nh gi thi t H0: ρ = 0,65<br />
<br />
i v i H1: ρ ≠ 0,65.<br />
<br />
Tr c nghi m U 2 uôi ư c s d ng, v i<br />
<br />
U =<br />
<br />
Z − µZ<br />
~ N (0,1) .<br />
σZ<br />
<br />
V i m c α = 5% , gtth = u0,975 = 1, 96 ;<br />
v i m u c th , chúng ta có :<br />
<br />
(<br />
<br />
)<br />
<br />
1 + 0,75<br />
z = 1 ln<br />
= 0,9730 ,<br />
2<br />
<br />
(<br />
<br />
)<br />
<br />
1 + 0,65<br />
µ Z = 1 ln<br />
+<br />
2<br />
<br />
và<br />
<br />
1 − 0,65<br />
<br />
u=<br />
<br />
1 − 0,75<br />
<br />
0,65<br />
= 0,7894;<br />
2(24 −1)<br />
<br />
σZ = 1 ,<br />
21<br />
<br />
z − µZ<br />
= 0,8414<br />
σZ<br />
<br />
Vì u < gtth nên m c ý nghĩa α = 5%, gi thi t H0 ư c ch p nh n,<br />
i.e.tài li u ư c ch p nh n. .<br />
<br />
3. PHÂN TÍCH H I QUI<br />
Phân tích tương quan ph n trên giúp chúng ta bi t m c<br />
ph thu c<br />
tuy n tính gi a các bi n ng u nhiên. Bài toán Phân tích h i qui ư c trình bày<br />
trong ph n này s giúp chúng ta thi t l p c u trúc c a m i liên h ph thu c c a<br />
m t bi n (g i là bi n ph thu c) v i m t hay nhi u bi n khác (g i là bi n c<br />
l p); chúng ta mu n th hi n m i liên h ph thu c gi a các bi n dư i d ng toán<br />
h c b ng m t phương trình n i các bi n ó. Phương trình ó cho phép chúng ta<br />
d oán v m t bi n ph thu c trên cơ s ã bi t v các bi n c l p. Giáo trình<br />
này ch trình bày trư ng h p có m t bi n c l p duy nh t (h i qui ơn).<br />
<br />
Chng 7<br />
<br />
TNG QUAN VÀ H I QUI TUY N TÍNH<br />
<br />
163<br />
<br />
3.1.<br />
nh nghĩa. Cho hai BNN X và Y trên cùng m t không gian xác su t<br />
có h.m. . ng th i f . Kỳ v ng i u ki n c a Y khi bi t X l y giá tr x, ký hi u<br />
E(Y/x) ư c xác nh b i:<br />
<br />
E (Y / x) = ∑ y. f ( y / x) n u X và Y r i r c,<br />
y<br />
+∞<br />
<br />
E (Y / x) =<br />
<br />
ho c<br />
<br />
∫<br />
<br />
y. f ( y / x) dy<br />
<br />
n u X và Y liên t c<br />
<br />
−∞<br />
<br />
ϕ(x) = E(Y/x) là m t hàm c a x. ϕ ư c g i là hàm h i qui c a Y theo X.<br />
th c a hàm ϕ ư c g i là ư ng h i qui c a Y theo X.<br />
nh nghĩa tương t cho khái ni m kỳ v ng i u ki n c a X khi bi t Y l y<br />
giá tr y, ký hi u E(X/y). ψ(y) = E(X/y) là m t hàm c a y. ψ ư c g i là hàm h i<br />
qui c a X theo Y.<br />
th c a hàm ψ ư c g i là ư ng h i qui c a X theo Y.<br />
<br />
3.2.<br />
<br />
nh nghĩa. Cho hai BNN X và Y trên cùng m t không gian xác su t.<br />
<br />
(a) N u ϕ(x) = E(Y/x) = a + bx thì ngư i ta nói r ng ϕ là hàm h i qui<br />
tuy n tính c a Y theo X. b ư c g i là h s h i qui tuy n tính Y theo X.<br />
(b) N u ψ(y) = E(X/y) = c + dx thì ngư i ta nói r ng ψ là hàm h i qui<br />
tuy n tính c a X theo Y. d ư c g i là h s h i qui tuy n tính X theo Y.<br />
Chúng ta công nh n<br />
<br />
3.3.<br />
<br />
nh lý sau:<br />
<br />
nh lý. Cho hai BNN X và Y tuân theo lu t phân ph i chu n hai<br />
<br />
2<br />
chi u v i các kỳ v ng µ1 và µ 2 , các phương sai dương σ1 và σ 2 , và h s<br />
2<br />
tương quan ρ. Khi ó, hàm h i qui c a Y theo X và hàm h i qui c a X theo Y là<br />
các hàm tuy n tính. C th :<br />
<br />
(a) ϕ(x) = E(Y/x) = a + bx, v i:<br />
<br />
b= ρ<br />
<br />
σ2<br />
σ1<br />
<br />
và<br />
<br />
a =µ 2 − bµ1<br />
<br />
(b) ψ(y) = E(X/y) = c + dx, v i:<br />
<br />
d= ρ<br />
<br />
σ1<br />
σ2<br />
<br />
và<br />
<br />
c =µ1 − dµ 2<br />
<br />
3.4. Bài toán. Gi s X là bi n ng u nhiên c l p và Y là bi n ng u<br />
nhiên ph thu c vào X. N u chúng ta mu n ư c lư ng giá tr c a Y b ng giá tr<br />
c a bi n ng u nhiên θoX, v i θ là m t hàm th c nào ó, thì chúng ta m c m t sai<br />
s<br />
S(θ) = E[(Y − θoX)2],<br />
g i là<br />
sai d báo. V n<br />
t ra là ch n θ như th nào<br />
t t nh t, theo nghĩa S(θ) t giá tr nh nh t.<br />
<br />
3.5.<br />
nh lý. Bi u th c S(θ) = E[(Y − θ oX)2]<br />
E(Y/x) v i m i x.<br />
<br />
cho s ư c lư ng là<br />
t c c ti u khi θ(x) =<br />
<br />
Chng 7<br />
<br />
TNG QUAN VÀ H I QUI TUY N TÍNH<br />
<br />
164<br />
<br />
3.6. Chú ý. Khi dùng hàm h i qui c a Y theo X<br />
sai d báo là:<br />
<br />
tính x p x Y thì<br />
<br />
2<br />
σY . X = σ2 ( 1 − ρ2 )<br />
2<br />
<br />
càng g n 1. Do ó,<br />
Chúng ta nh n th y r ng sai s càng nh khi ρ<br />
chúng ta ch nên dùng hàm h i qui x p x Y trên cơ s bi t X khi ρ<br />
g n<br />
b ng 1.<br />
Chúng ta có th tìm kho ng tin c y cho trung bình c a Y khi X l y giá tr<br />
x0. Tuy nhiên, trong giáo trình này chúng ta t m hài lòng v i d báo c a Y b ng<br />
cách thay giá tr x0 vào phương trình ư ng th ng h i qui c a Y theo X.<br />
<br />
4. HÀM H I QUI TUY N TÍNH M U<br />
Trong th c t , chúng ta không kh o sát h t t ng th , chưa bi t phân ph i<br />
c a vectơ ng u nhiên (X,Y) nên khó có th xác nh ư c d ng toán h c c a hàm<br />
h i qui t ng th . Chúng ta ph i d a trên m u<br />
xây d ng hàm h i qui m u sao<br />
cho nó là ư c lư ng t t nh t hàm h i qui t ng th .<br />
Gi s (x1, y1), (x2, y2), . . ., (xn, yn) là n c p quan sát ư c trên m u ư c<br />
thành l p t vectơ ng u nhiên (X,Y).<br />
có m t hình nh tr c quan v m i tương<br />
quan gi a X và Y, ngư i ta bi u di n m i c p s (xi, yi) b ng i m Mi có to<br />
(xi, yi), (i = 1, 2, . . ., n) trên m t ph ng to<br />
Oxy. T p h p các i m Mi (i = 1,<br />
phân<br />
2, . . ., n) t o nên m t “ ám mây th ng kê” và thư ng ư c g i là Bi u<br />
tán. Bi u<br />
phân tán cho chúng ta cái nhìn khái quát v m c<br />
cũng như c u<br />
trúc c a s tương quan gi a Y và X. T bi u<br />
phân tán, ngư i ta thư ng nh n<br />
th y có m t ư ng (cong ho c th ng) x p x d li u (các i m (xi, yi) t t p g n<br />
ư ng ó). N u ư ng nói trên là ư ng th ng thì Y có h i qui tuy n tính theo X.<br />
H i qui tuy n tính<br />
<br />
y<br />
30<br />
<br />
20<br />
<br />
10<br />
2<br />
<br />
y<br />
<br />
4<br />
<br />
6<br />
<br />
H i qui phi tuy n<br />
<br />
8<br />
<br />
x<br />
<br />