Bài 8: Tương quan h
i quy
187
BÀI 8: TƯƠNG QUAN VÀ HI QUY
Ni dung Mc tiêu
H s tương quan mu
Đường hi quy trung bình tuyến
tính thc nghim
Thi lượng
4 tiết
Gii thiu h s tương quan mu và đường hi
quy bình phương trung bình tuyến tính thc
nghim ca hai biến ngu nhiên.
Kiến thc nn quan trng cho sinh viên tiếp thu
kiến thc môn hc Kinh tế lượng sau này.
Hướng dn hc
Trong chương này các bn cn nm vng nhng kiến thc sau:
Các khái nim v h s tương quan gia hai biến định lượng và ý nghĩa, các tính cht ca h s
tương quan, cách dùng h s tương quan để đánh giá mi quan h gia hai đại lượng.
Phương trình hi quy tuyến tính đơn, đường hi quy thc nghim, ý nghĩa ca phương
trình hi quy và các h s hi quy, tính cht ca đường hi quy thc nghim.
Phương pháp sai s bình phương bé nht, cách tính các h s hi quy, cách dùng phương
trình hi quy để d báo giá tr ca biến ph thuc theo giá tr mi ca biến gii thích.
Cn xem k các ví d trong mi bài hc và làm các bài tp ca các phn tương ng.
Bài 8: Tương quan h
i quy
188
TÌNH HUNG KHI ĐỘNG BÀI
Tình hung
Siêu th ABC mun m 01 siêu th ti khu dân cư Vn Phúc. Để xác định được quy mô siêu
th, doanh nghip cn biết được chi phí nhu yếu phm ca người dân trong vùng. Biết chi phí
nhu yếu phm ca 01 cá nhân ph thuc chính vào mc thu nhp ca cá nhân đó. Siêu th tiến
hành điu tra mc thu nhp (X) và chi tiêu (Y) cho nhng nhu cu yếu phm ca cá nhân. Kết
qu cho bng s liu sau (đơn v triu đồng):
X\Y 0,5 0,8 1,0
1,5 4 3 0
2,0 6 2 1
2,5 2 5 2
3,0 1 1 4
Câu hi
1. Tính h s tương quan mu
2. Viết phương trình hi quy tuyến tính mu
3. Ước lượng sai s hi quy
4. D báo giá tr ca Y khi mc thu nhp X là 4,0 triu đồng
Bài 8: Tương quan h
i quy
189
8.1. H s tương quan mu
Trong bài trước chúng ta đã đưa ra khái nim h s
tương quan mu và cách tính giá tr ca h s tương
quan mu ng vi mu c th. Trong phn xác sut
ta đã biết h s tương quan ca hai biến ngu nhiên
X, Y.
Cov(X, Y) E(XY) (EX)E(Y) .
XY XY
ρ= =
σσ σσ
Ý nghĩa ca h s tương quan là đo mc độ ph thuc tuyến tính gia hai biến ngu
nhiên X và Y. Trong thc tế nhiu khi ta chưa biết v phân phi ca X và Y, do đó h
s tương quan lý thuyết ρ gia X và Y cũng chưa biết. Vy ta cn da vào mu quan
sát v véc tơ ngu nhiên (X, Y) để tìm cách ước lượng cho h s tương quan ρ.
Gi s ta có mu ngu nhiên (X1, Y1), (X2, Y2), …, (Xn, Yn) rút ra t véc tơ ngu nhiên
(X, Y) vi giá tr mu (x1, y1), (x2, y2), …, (xn, yn). H s tương quan mu được định
nghĩa qua công thc:
XY (X)(Y)
RSS
XY
=.
trong đó thng kê
n
kk
k1
1
XY X Y
n=
=. Lúc đó R ước lượng ca h s tương quan
lý thuyếtρ. Vi mu c th, giá tr ca R là:
xy (x)(y)
rss
XY
=.
8.2. Đường hi quy trung bình tuyến tính thc nghim
Ta có th kim tra thy rng h s tương quan
ρước lượng r ca nó đều là các đại lượng
có giá tr tuyt đối nh hơn hoc bng 1. Khi
||ρ càng gn 1 thì mc độ ph thuc tuyến
tính gia X và Y càng cht ch, tc là ta có
th tính xp x Y theo X qua biu thc dng
f(X) = aX + b . Thông thường khi ||0,8
ρ
>
thì cách tính xp x đó được gi là cht ch.
Lúc đó ta có th biu din giá tr ca Y qua giá tr ca X bng phương trình dng
YaXb=++ε
,
trong đóε là sai s ca phép ly xp x.
Phương trình Y = aX + b được gi là phương trình hi quy tuyến tính ca Y theo X,
ε là sai s hi quy. H s a được gi là độ dc (slope), cho biết khi biến X tăng mt
Bài 8: Tương quan h
i quy
190
đơn v thì giá tr ca biến Y s tăng hay gim bao nhiêu đơn v. H s b được gi là
hng s hi quy (intercept), cho biết phương trình hi quy có đi qua gc ta độ hay
không và đim xut phát ca Y khi X bng 0 s là bao nhiêu. Các h s a và b cũng
được gi là h s hi quy.
Trong phương trình trên biến Y được gi là biến được gii thích hay biến ph thuc,
biến X được gi là biến gii thích hoc là biến độc lp, phương trình hi quy được gi
là phương trình hi quy tuyến tính đơn. Nếu biến Y được biu din qua mt phương
trình dng tuyến tính vi nhiu hơn mt biến gii thích thì phương trình được gi là
hi quy tuyến tính bi.
Vi mu ngu nhiên (x1, y1), (x2, y2), …, (xn, yn) ta xây dng hàm hi quy mu (hàm
hi quy thc nghim) có dng:
ˆ
ˆ
ˆ
yaxb.=+
Xét ti quan sát th i ta có
ˆ
yaxb
ii
ˆ
ˆ
ˆ
yy a.xb
iii i i
=+
=+ε= ++ε
)
)
trong đó i
ε là giá tr caε ti quan sát th i, a,b
)
)
là các ước lượng ca a và b. Ta cn
xác định các h s a,b
)
sao cho tng sai s bình phương trung bình đạt giá tr nh nht.
nn n
22 2
ˆ
ˆ
ˆ
L(yy)(ya.xb)min
iii ii
i1 i1 i1
= = −−
∑∑
== =
Điu kin cn để hàm L đạt min là:
n
Lˆ
ˆ
2(ya.xb)0
ˆii
bi1
n
Lˆ
ˆ
2(ya.xb)x0
ii i
ˆ
ai1
=− =
=
=− =
⎩=
Bài 8: Tương quan h
i quy
191
Gii h phương trình, ta có:
nn
ˆˆ
n.b a x y
ii
i1 i1
nnn
2
ˆˆ
b
xa x xy
iiii
i1 i1 i1
+=
∑∑
==
+=
∑∑
⎩= = =
T đó ta có nghim
()()
()
n
ii y
i1
n2
2x
i
i1
ˆˆ
bya.x
xy x y S
ˆ
ar.
1S
xx
n
=
=
=−
==
Do đó, ta có:
()
yy
ii
xx
y
ii
x
SS
ˆ
yrxyrx
SS
S
ˆ
yyr xx.
S
=+
⇒−=
Vy phương trình hi quy mu (đường
hi quy trung bình tuyến tính thc nghim) có dng:
ss
yy
ˆ
ˆ
ˆ
yr xyr xaxb.
ss
xx
=+−=+
Phương pháp ước lượng cho h s a, b như trên còn được gi là phương pháp bình
phương nh nht. Phương trình hi quy xác định như trên có mt s tính cht sau:
Hàm hi quy mu đi qua đim (x,y).
Các ước lượng ˆ
ˆ
a, b được xác định duy nht.
Giá tr trung bình các sai s bng 0:
n
10
i
ni1
ε
=
=
.
Giá tr trung bình ca i
ˆ
y bng giá tr trung bình ca các quan sát i
y:
ˆ
yy.=
Sai s ˆ
yy
iii
ε= cũng được gi là phn dư (residual) nó biu th s sai khác gia
quan sát yi và giá tr i
ˆ
y tính được t phương trình hi quy ˆ
ˆ
ˆ
yaxb
=
+.
Đặt:
n2
RSS .
i
i1
=