Chương trình Ging dy Kinh t Fulbright
Niên khóa 2010-2012
Các phương pháp ñnh lưng
Bài ñc
Kinh t lưng cơ s - 3
rd
ed.
Ch 5: Hi qui hai bin:
ưc lưng khong và kim ñnh gi thit
Damodar N. Gujarati 1 Biên dch: X. Thành
Hiu ñính: Cao Hào Thi
CHƯƠNG 5
HI QUY HAI BIN:
ƯC LƯNG KHONG
VÀ KIM ðNH GI THIT
Hãy cn thn khi kim ñnh quá nhiu gi thit; càng un nn s liu thì chúng càng d
cho kt qu, nhưng kt qu thu ñưc bng cách ép buc ñiu không th chp nhn
trong khoa hc.
1
Như ñã ñ cp trong Chương 4, ưc lưng kim ñnh gi thit hai chuyên
ngành ln ca thng c ñin. Lý thuyt ưc lưng bao gm hai phn: ưc lưng ñim
ưc lưng khong. Chúng ta ñã tho lun v ưc lưng ñim mt cách k lưng trong
hai chương trưc, khi trình y c phương pháp OLS ML ca ưc lưng ñim.
Trong chương y, trưc ht chúng ta xem xét ưc lưng khong sau ñó chuyn sang
ni dung kim ñnh gi thit, mt ch ñ liên quan mt thit ti ưc lưng khong.
5.1 CÁC ðIU KIN THNG KÊ TIÊN QUYT
Trưc khi minh ha các cơ ch thc s ñ thit lp khong tin cy kim ñnh các gi
thit thng kê, ngưi ñưc ñc xem là ñã quen thuc vi các khái nim cơ bn v xác
sut thng . Mc không phi thay th cho mt khóa hc cơ bn v thng kê,
Ph lc A cung cp c ni dung then cht ca thng ngưi ñc phi thu hiu
hoàn toàn. Các khái nim then cht như xác sut, phân phi xác sut, sai lm Loi I và
Loi II, mc ý nghĩa, năng lc ca kim ñnh thng , khong tin c y rt quan
trng ñ hiu các lý thuyt trình bày trong chương này và các chương sau.
5.2 ƯC LƯNG KHONG: M!T S KHÁI NIM CƠ BN
ð làm khái nim, ta phân tích ví d gi thit v tiêu dùng - thu nhp trong Chương 3.
Phương trình (3.6.2) cho thy xu hưng tiêu dùng biên t ưc lưng (MPC) -
β
2
0,5091. ðó là mt ưc lưng ñơn (ưc lưng ñim) ca bin MPC -
β
2
ca tng th chưa
bit. Ưc lưng này ñ tin như th nào? Như ñã lưu ý trong Chương 3, do các dao
ñng ca vic ly m"u, mt ưc lưng ñơn nhiu kh năng khác vi giá tr ñúng, mc
trong vic ly m"u lp li, giá tr trung bình ca s$ bng vi giá tr ñúng. (Lưu ý:
ββ
=)
ˆ
(
2
E). Trong thng kê, ñ tin cy ca mt ưc lưng ñim ñưc ño bng sai s
chun ca nó. Do vy, thay ch% da vào ưc lưng ñim, ta th xây dng mt
khong xung quanh giá tr ưc lưng ñim, d trong phm vi hai hay ba ln sai s
chun & hai phía ca giá tr ưc lưng ñim, ñ xác sut mà giá tr ñúng ca tham s nm
trong khong này là, ví d, 95%. ðó là sơ b ý tư&ng ñng sau ư"c lưng khong.
ð c th hơn, gi thit rng ta mun tìm xem )
ˆ
(
2
β
“gn” vi
β
2
như th nào. ð
thc hin mc ñích này, ta tìm hai s dương
δ
α
, s th' hai nm trong khong t( 0 ñn
1
Stephen M. Stigler, Testing Hypothesis or Fitting Models? Another Look at Mass Extinctions” (Kim
ñnh gi thit hay các hình thích hp: mt cách nhìn n)a v s tuyt chng), trong Neutral Models in
Biology (Các hình trung lp trong sinh hc), Matthew H. Nitecki & Antoni Hoffman hiu ñính, Oxford
University Press, Oxford, 1987, trang 148.
Chương trình Ging dy Kinh t Fulbright
Các phương pháp ñnh lưng
Bài ñc
Kinh t lưng cơ s - 3
rd
ed.
Ch 5: Hi qui hai bin:
ưc lưng khong và kim ñnh gi thit
Damodar N. Gujarati 2 Biên dch: X. Thành
Hiu ñính: Cao Hào Thi
1, ñ xác sut khong ng"u nhiên (
2
ˆ
β
δ
,
2
ˆ
β
+
δ
) ch'a giá tr ñúng ca
β
2
là 1
α
.
V công th'c ta có:
Pr(
2
ˆ
β
δ
β
2
2
ˆ
β
+
δ
) = 1
α
(5.2.1)
Khong này, nu tn ti, ñưc gi khong tin c y; 1
α
ñưc gi h# s tin c y;
α
(0 <
α
< 1) ñưc gi mc ý nghĩa.
2
c ñim ñu cui ca khong tin cy ñưc
gi là các gi"i hn tin c y (cũng ñưc gi là giá tr ti hn - critical value),
2
ˆ
β
δ
ñưc
gi gii hn tin c y dư"i
2
ˆ
β
+
δ
gii hn tin c y trên. Lưu ý rng
α
1
α
thưng ñưc biu din dưi dng phn trăm, 100
α
và 100(1
α
) phn trăm.
Phương trình (5.2.1) cho thy mt ưc lưng khong, trái vi ưc lưng ñim,
mt khong ñưc thit lp ñ xác sut ch'a giá tr ñúng ca tham s trong khong
gii hn ca 1
α
. d, nu
α
= 0,05, hay 5%, (5.2.1) s$ ñưc phát biu là: Xác
sut mà khong (ng"u nhiên) ch% ra & trên ch'a giá tr ñúng ca
β
2
0,95 hay 95%. Như
vy, ưc lưng khong cho bit mt khong các giá tr trong ñó th có giá tr ñúng
ca
β
2
.
Ngưi ñc cn phi bit các khía cnh sau ñây v ưc lưng khong:
1. Phương trình (5.2.1) không nói rng xác sut
β
2
nm gi)a các gii hn 1
α
.
Do
β
2
, mc chưa bit, ñưc gi thit mt s c ñnh, th nm & trong hay
ngoài khong. ðiu (5.2.1) din ñt bng cách s+ dng phương pháp trình bày
trong chương này, xác sut ca vic xây dng mt khong ch'a
β
2
là 1
α
.
2. Khong (5.2.1) mt khong ng$u nhiên, t'c thay ñi theo cách chn m"u do
ñưc da vào
2
ˆ
β
, vn là mt giá tr ng"u nhiên. (Ti sao?).
3. Do khong tin cy mang tính ng"u nhiên, các phát biu v xác sut gn vi phi
ñưc hiu theo nghĩa i hn, t'c vic ly m"u lp li. C th hơn, (5.2.1) mang ý
nghĩa là: nu trong vic ly m"u lp li, các khong tin cy ging như ñưc thit
lp s ln trên cơ s& xác sut 1
α
, thì trong thi gian i hn, tính trung bình, có
1
α
ln trong tng s các trưng hp nh)ng khong này s$ ch'a giá tr ñúng ca
tham s.
4. Như ñã nêu & ý th' 2, khong (5.2.1) ng"u nhiên khi
2
ˆ
β
không bit. Nhưng khi ta
mt m"u c th khi ta tìm ñưc giá tr s hc c th ca
2
ˆ
β
tkhong (5.2.1)
không còn ng"u nhiên n)a; ñưc c ñnh. Trong trưng hp này, ta không th
ñưa ra phát biu thng (5.2.1); t'c ta không th nói rng xác sut mt
khong c ñnh c th ch'a giá tr ñúng ca
β
2
1
α
. Trong trưng hp này,
β
2
hoc nm trong khong c ñnh hay nm ngoài nó. Do vy, xác sut 1 hoc 0.
Như th, trong d gi thit v tiêu dùng - thu nhp, nu khong tin cy 95% nh
ñưc là (0,4268
β
2
0,5941), [ñưc gii mt cách ngn gn trong (5.3.9)}, ta không
th nói rng xác sut khong này ch'a giá tr ñúng ca
β
2
95%. Xác sut ñó là
1 hoc 0.
2
Cũng ñưc gi xác sut m%c sai lm Loi I. Sai lm Loi I bác b- gi thit ñúng, trái li sai lm
Loi II là chp nhn gi thit sai. (Ni dung này ñưc tho lun toàn din hơn trong Ph lc A). Ký hiu
α
ñưc gi là ch thư"c ca kim ñnh (thng kê).
Chương trình Ging dy Kinh t Fulbright
Các phương pháp ñnh lưng
Bài ñc
Kinh t lưng cơ s - 3
rd
ed.
Ch 5: Hi qui hai bin:
ưc lưng khong và kim ñnh gi thit
Damodar N. Gujarati 3 Biên dch: X. Thành
Hiu ñính: Cao Hào Thi
Các khong tin cy ñưc xây dng như th nào? T( tho lun & trên ta th
ñoán rng nu vic ly m$u hay phân phi xác sut ca các ưc lưng ñưc bit trưc,
ta có th ñưa ra các phát biu v khong tin cy như (5.2.1). Trong Chương 4 ta ñã thy
vi gi thit phân phi chun ca yu t nhiu (hay ng"u nhiên) u
i
, bn thân các ưc
lưng OLS ca
1
ˆ
β
2
ˆ
β
phân phi chun và ưc lưng OLS ca
2
ˆ
σ
liên quan
phân phi
χ
2
(phân phi Chi-bình phương). T( ñó cho thy công vic thit lp các
khong tin cy có v. là mt công vic ñơn gin. Và s tht là nó ñơn gin!
5.3 CÁC KHONG TIN C&Y CHO CÁC H S HI QUY
β
ββ
β
1
β
ββ
β
2
Khong tin c y cho
β
ββ
β
2
Mc 4.3 trong Chương 4 ñã ch% ra rng vi gi thit phân phi chun ñi vi u
i
, các ưc
lưng OLS ca
1
ˆ
β
2
ˆ
β
t chúng phân phi chun vi các giá tr trung bình
phương sai tính ñưc. Do ñó, ví d ta có bin s

)
ˆ
(
ˆ
2
22
β
ββ
se
Z
=
σ
ββ
=
2
22
)
ˆ
(
i
x (5.3.1)
như ñã trình bày trong (4.3.5) mt bin chun ñã ñưc chun hóa. Do vy, có v. như
ta th s+ dng phân phi chun ñ thc hin phát biu xác sut v
β
2
vi ñiu kin
bit phương sai tng th
σ
2
. Nu
σ
2
ñưc bit trưc, mt tính cht quan trng ca bin có
phân phi chun vi giá tr trung bình
µ
phương sai
σ
2
din tích & dưi ñưng cong
chun trong khong
µ
±
σ
bng gn ñúng 68%, trong khong
µ
± 2
σ
bng gn ñúng 95%,
và trong khong
µ
± 3
σ
bng gn ñúng 99,7%.
Nhưng
σ
2
ít khi ñưc bit trưc, và trong thc t ñưc xác ñnh b&i ưc lưng
không thiên lch
2
ˆ
σ
. Nu ta thay th
σ
bng
σ
ˆ
, (5.3.1) có th ñưc vit dưi dng sau:


=
=)
ˆ
(
ˆ
2
22
β
ββ
se
t
σ
ββ
ˆ
)
ˆ
(
2
22
=
i
x
(5.3.2)
vi se(
2
ˆ
β
) y gi biu th sai s chun ưc lưng ñưc. th ch% ra rng (xem Ph
lc 5A, Mc 5A.1) bin t ñnh nghĩa & trên tuân theo phân phi t vi n 2 bc t do.
[Lưu ý s khác nhau gi)a (5.3.1) và 5.3.2)]. Do vy, thay vì s+ dng phân phi chun, ta
có th s+ dng phân phi t ñ thit lp mt khong tin cy cho
2
ˆ
β
như sau:
Pr(t
α
/2
t t
α
/2
) = 1
α
(5.3.3)
vi giá tr t nm gi)a bt ñ/ng th'c kép này giá tr t tính ñưc t( (5.3.2) vi t
α
/2
giá tr ca bin t thu ñưc t( phân phi t vi m'c ý nghĩa
α
/2 n 2 bc t do;
thưng ñưc gi là giá tr t"i hn ca t ti m'c ý nghĩa
α
/2. Thay (5.3.2) vào (5.3.3) ta
có:
Chương trình Ging dy Kinh t Fulbright
Các phương pháp ñnh lưng
Bài ñc
Kinh t lưng cơ s - 3
rd
ed.
Ch 5: Hi qui hai bin:
ưc lưng khong và kim ñnh gi thit
Damodar N. Gujarati 4 Biên dch: X. Thành
Hiu ñính: Cao Hào Thi
α
β
ββ
αα
=
1
)
ˆ
(
ˆ
Pr
2/
2
22
2/
t
se
t
(5.3.4)
Sp xp li (5.3.4) ta có:
Pr[
2
ˆ
β
t
α
/2
se(
2
ˆ
β
)
β
2
2
ˆ
β
+ t
α
/2
se(
2
ˆ
β
)] = 1
α
(5.3.5)
3
Phương trình (5.3.5) cho bit khong tin c y 100(1
α
)% ca
β
2
. Ta có th vit
ngn gn như sau:
Khong tin cy 100(1
α
)% ca
β
2
:
2
ˆ
β
± t
α
/2
se(
2
ˆ
β
) (5.3.6)
Lp lun mt cách tương t và s+ dng (4.3.1) và (4.3.2), ta có th vit:
Pr[
1
ˆ
β
t
α
/2
se(
1
ˆ
β
)
β
1
1
ˆ
β
+ t
α
/2
se(
1
ˆ
β
)] = 1
α
(5.3.7)
hay mt cách ngn gn hơn,
Khong tin cy 100(1
α
)% ca
β
1
:
1
ˆ
β
± t
α
/2
se(
1
ˆ
β
) (5.3.8)
Lưu ý mt ñc ñim quan trng ca các khong tin cy trình y trong (5.3.6)
(5.3.8): Trong c hai trưng hp chiu rng ca khong tin cy t l thun vi sai s
chun ca ưc lưng. T'c là, sai s chun ng ln, tchiu rng ca khong tin cy
càng ln. Nói mt cách khác, sai s chun ca ưc lưng ng ln thì s không chc
chn trong ưc lưng giá tr ñúng ca tham s chưa bit càng ln. vy, sai s chun
ca mt ưc lưng thưng ñưctñi lưng ño s chính xác ca ưc lưng, nghĩa
là m'c ñ chính xác mà ưc lưng tính giá tr ñúng ca tng th.
Tr& li d tiêu dùng - thu nhp trong Chương 3 (Mc 3.6), ta ñã tìm ra
2
ˆ
β
=
0,509, se(
2
ˆ
β
) = 0,0357, và s bc t do = 8. Nu chúng ta gi thit
α
= 5%, t'c h s
tin cy là 95%, bng t cho bit vi s bc t do 8, giá tr ti hn t
α
/2
= t
0,025
= 2,306.
Thay nh)ng giá tr này o (5.3.5), ngưi ñc phi tính ñưc khong tin cy 95% ca
β
2
là:
0,4268
β
2
0,5914 (5.3.9)
Hay, s+ dng (5.3.6), khong tin cy là:
0,5091 ± 2,306(0,0357)
t'c là:
0,5091 ± 0,0823 (5.3.10)
S gii thích v' khong tin c y này : vi h s tin cy là 95%, trong thi gian
dài hn, 95 trong s 100 trưng hp các khong như (0,4268, 0,5914) s$ ch'a giá tr ñúng
3
M
t s
tác gi
thích vi
t (5.3.5) v
i s
b
c t
do
ñư
c ch
%
rõ nh
ư
sau:
Pr[
2
ˆ
β
t
(n-2),
α
/2
se(
2
ˆ
β
)
β
2
2
ˆ
β
+
t
(n-2),
α
/2
se(
2
ˆ
β
)] = 1
α
Nh
ư
ng
ñ
ñơ
n gi
n ta s
$
gi
)
nguyên ký hi
u c
a mình; ng
)
c
nh s
$
làm rõ s
b
c t
do thích h
p s
+
d
ng.
Chương trình Ging dy Kinh t Fulbright
Các phương pháp ñnh lưng
Bài ñc
Kinh t lưng cơ s - 3
rd
ed.
Ch 5: Hi qui hai bin:
ưc lưng khong và kim ñnh gi thit
Damodar N. Gujarati 5 Biên dch: X. Thành
Hiu ñính: Cao Hào Thi
ca
β
2
. Nhưng, như ñã cnh giác & phn trên, phi cý rng ta không th nói rng c
sut khong c th (0,4268, 0,5914) ch'a giá tr ñúng ca
β
2
95% do khong này ñã
ñưc c ñnh không còn ng"u nhiên n)a; do vy,
β
2
hoc nm trong khong hoc
không: do vy, xác sut mà khong tin cy c th ch'a giá tr ñúng ca
β
2
là 1 hoc 0.
Khong tin c y ñi v"i
β
ββ
β
1
Tương t như (5.3.7), ngưi ñc th d dàng ch'ng minh ñưc rng khong tin cy
95% ca
β
1
trong ví d tiêu dùng - thu nhp ca chúng ta là
9,6643
β
1
39,2448 (5.3.11)
Hay, s+ dng (5.3.8), ta
24,4545 ± 2,306(6,4138)
t'c là
24,4545 ± 14,7902 (5.3.12)
Cũng như trưc, ngưi ñc phi cn thn khi gii thích khong tin cy này. Trong thi
gian i hn, 95 trong s 100 trưng hp như (5.3.11) s$ ch'a giá tr ñúng ca
β
1
; xác
sut mà mt khong c ñnh cá bit ch'a giá tr ñúng ca
β
1
là 1 hoc 0.
Khong tin c y ñ(ng th)i cho
β
ββ
β
1
β
ββ
β
2
nh)ng trưng hp mà ta cn phi thit lp mt khong tin cy ñng thi cho
β
1
β
2
ñ vi h s tin cy (1
α
), d, 95%, c
β
1
β
2
cùng nm ñng thi trong khong ñó.
Do ni dung này cũng liên quan, ngưi ñc có th mun xem các tài liu tham kho.
4
(Xem ñng thi Mc 8.4 và Chương 10).
5.4 KHONG TIN C&Y ðI VI
σ
σσ
σ
2
Như ñã ch% ra trong Chương 4, Mc 4.3, vi gi thit v phân phi chun, bin
χ
2
= (n 2)
2
2
ˆ
σ
σ
(5.4.1)
tuân theo phân phi
χ
2
vi n 2 bc t do.
5
Do vy, ta th s+ dng phân phi
χ
2
ñ
thit lp khong tin cy cho
σ
2
Pr(
χ
α
2
2
/
χ
2
χ
α
/
2
) = 1
α
(5.4.2)
vi giá tr
χ
2
nm gi)a bt ñ/ng th'c p này ñưc tính theo (5.4.1) vi
22/1
α
χ
2
2/
α
χ
là hai giá tr ca
χ
2
(các giá tr t"i hn ca
χ
2
) tính ñưc t( bng Chi-bình phương
vi n 2 bc t do sao cho chúng ct ra 100(
α
/2) phn trăm din tích ñuôi ca phân phi
χ
2
, như minh ha trong Hình 5.1.
Thay th
χ
2
t( (5.4.1) vào (5.4.2) và sp xp li các s hng, ta có
4
Xem John Neter, William Wasserman, Michael H. Kutner,
Applied Linear Regression Models
(Các
mô hình h
i quy tuy
n tính
'
ng d
ng), Richard D. Irwin, Homewood, Ill., 1983, Ch
ươ
ng 5.
5
V
ph
n ch
'
ng minh, xem Robert V. Hogg & Allen T. Craig,
Introduction to Mathematical Statistics
(Gi
i thi
u th
ng kê toán), xu
t b
n l
n th
'
2, Macmillan, New York, 1965, trang 144.