L I M Đ U Ờ Ở Ầ
Trong mô hình phân tích h i quy b i, chúng ta gi
thi
t gi a các bi n gi
ồ
ộ
ả
ế
ữ
ế
ả i
thích c a mô hình đ c l p tuy n tính v i nhau, t c là các h s h i quy
ệ ố ồ
ộ ậ
ứ
ủ
ế
ớ
đ i v i m t bi n c th là s đo tác đ ng riêng ph n c a bi n t ố ớ
ế ụ ể
ầ ủ
ế ươ ng
ộ
ố
ộ
ngkhi t
t c các bi n khác trong mô hình đ
c gi
c đ nh. Tuy nhiên
ứ
ấ ả
ế
ượ
ữ ố ị
khi gi
thi
i thích có t
ng quan thì
ả
ế
t đó b vi ph m t c là các bi n gi ứ
ế
ạ
ị
ả
ươ
chúng ta không th tách bi
t s nh h
ng riêng bi
t c a m t bi n nào
ể
ệ ự ả
ưở
ệ ủ
ế
ộ
đó.
Hi n t
ng trên đ
c g i là đa công tuy n.V
ệ ượ
ượ ọ
ế
ậy ph i làm nh th
ư ế
ả
nào đ nh n bi
t và kh c ph c hi n t
ng này.Chúng ta đi nghiên c u đ
ể
ậ
ế
ệ ượ
ụ
ắ
ứ ề
ệ tài: “Các cách phát hi n đa c ng tuy n. Các bi n pháp kh c ph c hi n ế
ụ
ộ
ệ
ệ
ắ
t
ượ
ọ ” ng đa c ng tuy n. Ví d minh h a
ụ
ộ
ế
A. LÍ THUY TẾ
I. GI
I THI U V ĐA C NG TUY N
Ớ
Ộ
Ệ
Ề
Ế
ườ ắ ng các bi n đ c l p không có m i quan h tuy n tính, n u quy t c ố ộ ậ ế ệ ế ế
Thông th
này b vi ph m s có hi n t ệ ượ ẽ ạ ị ệ ng đa c ng tuy n. Nh v y, đa c ng tuy n là hi n ư ậ ế ế ộ ộ
ng các bi n đ c l p trong mô hình ph thu c l n nhau và th hi n đ t ượ ể ệ ộ ẫ ộ ậ ụ ế ượ ướ c d i
d ng hàm s . ố ạ
II. CÁC CÁCH PHÁT HI N HI NG ĐA C NG TUY N Ệ NỆ T ƯỢ Ộ Ế
1.R cao nh ng t s t th p ấ ỉ ố ư
Trong tr ng h p Rcao (th ườ ợ ườ ệ ủ ng R> 0,8) mà t s t th p thì đó chính là d u hi u c a ỉ ố ấ ấ
hi n t ng đa c ng tuy n . ệ ượ ế ộ
2.T i thích cao ươ ng quan c p gi a các bi n gi ữ ế ặ ả
N u h s t i thích cao (v t 0,8) thì có kh năng có ệ ố ươ ế ng quan c p gi a các bi n gi ữ ế ặ ả ượ ả
i đa c ng tuy n. Tuy nhiên tiêu chu n này th t n t ồ ạ ế ẩ ộ ườ ữ ng không chính xác. Có nh ng
tr ng h p t ng quan c p không cao nh ng v n có đa c ng tuy n. Thí d , ta có 3 ườ ợ ươ ư ụ ế ặ ẫ ộ
i thích X, X, X nh sau bi n gi ế ả ư
X = (1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0, 0,0,0,0,0)
X= (0,0,0,0,0, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
X = (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
Rõ ràng X = X + Xnghĩa là ta có đa c ng tuy n hoàn h o, tuy nhiên t ế ả ộ ươ ặ ng quan c p
là:
r = -1/3 ; r = r =0,59
c cu t Nh v y đa c ng tuy n x y ra mà không có s b o tr ả ư ậ ự ả ế ộ ướ ả ươ ặ ng quan c p
nh ng d u sao nó cũng cung c p cho ta nh ng ki m tra tiên nghi m có ích. ữ ữ ể ệ ẫ ấ
3.Xem xét t ng quan riêng ươ
ng quan b c không. Farrar và Glauber đã đ Vì v n đ đ ấ ề ượ ề ậ c đ c p đ n d a vào t ế ự ươ ậ ề
ngh s d ng h s t ị ử ụ ệ ố ươ ng quan riêng. Trong h i quy c a Y đ i v i các bi n X, X ,X. ủ ố ớ ế ồ
N u ta nh n th y răng r cao trong khi đó r; r; r t ế ậ ấ ươ ể ợ ng đ i th p thì đi u đó có th g i ý ề ấ ố
ng quan cao và ít nh t m t trong các bi n này là th a. r ng các bi n X, X và Xcó t ằ ế ươ ừ ế ấ ộ
Dù t ng quan riêng r t có ích nh ng nó cũng không đ m b o r ng s cung c p cho ươ ả ằ ư ẽ ấ ả ấ
ta h ng d n chính xác trong vi c phát hi n ra hi n t ướ ệ ượ ệ ệ ẫ ng đa c ng tuy n. ộ ế
4.H i quy ph ồ ụ
M t cách có th tin c y đ c đ đánh giá m c đ c a đa c ng tuy n là h i quy ể ậ ộ ượ ể ứ ộ ủ ế ộ ồ
i thích X theo các bi n gi i thích còn ph . H i quy ph là h i quy m i m t bi n gi ồ ụ ụ ế ỗ ồ ộ ả ế ả
i. R đ c tính t h i quy này ta ký hi n R l ạ ượ ừ ồ ệ
M i liên h gi a F và R: ệ ữ ố
F=
F tuân theo phân ph i F v i k – 2 và n-k +1 b c t ậ ự ố ớ ố ế do. Trong đó n là , k là s bi n
gi ả ế i thích k c h s ch n trong mô hình. R là h s xác đ nh trong h i quy c a bi n ể ả ệ ố ặ ệ ố ủ ồ ị
X theo các bi n X khác. N u F tính đ c v i h n F(k-2,n-k+1) m c ý ế ế ượ ượ t đi m t ể ớ ạ ở ứ
nghĩa đã cho thì có nghĩa là X có liên h tuy n tính v i các bi n X khác. N u F có ý ệ ế ế ế ớ
ỏ nghĩa v m t th ng kê chúng ta v n ph i quy n đ nh li u bi n X nào s b lo i kh i ẽ ị ạ ề ặ ế ệ ế ẫ ả ố ị
mô hình. M t tr ng i c a k thu t h i quy ph là gánh n ng tính toán. Nh ng ngày ạ ủ ỹ ộ ở ậ ồ ụ ư ặ
nay nhi u ch ng trình máy tính đã có th đ m đ ng đ c công vi c tính toán này. ề ươ ể ả ươ ượ ệ
5.Nhân t phóng đ i ph ng sai ử ạ ươ
M t th c đo khác c a hi n t ng đa c ng tuy n là nhân t phóng đ i ph ộ ướ ệ ượ ủ ế ộ ử ạ ươ ng
sai g n v i bi n X, ký hi u là VIF(X). ế ệ ắ ớ
VIF(X) đ c thi ượ ế ậ ớ t l p trên c s c a h s xác đ nh R trong h i quy c a bi n X v i ơ ở ủ ệ ố ủ ế ồ ị
các bi n khác nhau nh sau: ư ế
VIF(X) = (5.15)
i thích VIF(X) b ng t s chung c a ph ng sai Nhìn vào công th c (5.15) có th gi ứ ể ả ằ ỷ ố ủ ươ
ng sai c a th c c a β trong h i quy g c c a Y đ i v i các bi n X và ph ố ủ ự ủ ố ớ ế ồ ươ ủ ướ ượ c l ng
đó Xtr c giao v i các bi n khác. Ta coi tình hu ng lý t ng là β trong h i quy mà ồ ở ự ế ớ ố ưở
tình hu ng mà trong đó các bi n đ c l p không t ng quan v i nhau, và VIF so sánh ộ ậ ế ố ươ ớ
tình huông th c và tình hu ng lý t ng. S so sánh này không có ích nhi u và nó ự ố ưở ự ề
không cung c p cho ta bi t ph i làm gì v i tình hu ng đó. Nó ch cho bi t r ng các ấ ế ả ớ ố ỉ ế ằ
tình hu ng là không lý t ng. ố ưở
Đ th c a m i liên h c a R và VIF là ồ ị ủ ệ ủ ố
Nh hình v ch ra khi R tăng t 0,9 đ n 1 thì VIF tăng r t m nh. Khi ẽ ỉ ư ừ ế ấ ạ
R =1 thì VIF là vô h n.ạ
Có nhi u ch ng trình máy tính có th cho bi t VIF đ i v i các bi n đ c l p trong ề ươ ể ế ố ớ ộ ậ ế
h i quy. ồ
6. Đ đo Theil ộ
Khía c nh ch y u c a VIF ch xem xét đ n t ng quan qua l i gi a các bi n gi ủ ế ủ ế ươ ạ ỉ ạ ữ ế ả i
thích. M t đ đo mà xem xét t c gi i thích ộ ộ ươ ng quan c a bi n gi ủ ế ả i thích v i bi n đ ớ ế ượ ả
là đ đo Theil. Đ đo Theil đ c đ nh nghĩa nh sau ộ ộ ượ ị ư
m = R-( R- R)
Trong đó Rlà h s xác đ nh b i trong h i quy c a Y đ i v i các bi n X , X… X ồ ố ớ ệ ố ủ ế ộ ị
trong mô hình h i quy: ồ
Y = β + βX + β X+ ……. + β X+ U
R là h s xác đ nh b i trong mô hình h i quy c a bi n Y đ i v i các biên X , X, ồ ố ớ ệ ố ủ ế ộ ị
… ,X, X, … ,X
Đ i l ng R - Rđ ạ ượ ượ ế c g i là “đóng góp tăng thêm vào” vào h s xác đ nh b i. N u ệ ố ọ ộ ị
X , X… X không t ươ ộ ng quan v i nhau thì m = 0 vì nh ng đóng góp tăng thêm đó c ng ữ ớ
i b ng R. Trong các tr ng h p khác m có th nh n giá tr âm ho c d l ạ ằ ườ ặ ươ ể ậ ợ ị ng l n. ớ
c đ đo này có ý nghĩa, chúng ta xét tr ng h p mô hình có 2 bi n gi Đ th y đ ể ấ ượ ộ ườ ế ợ ả i
thích X và X. Theo ký hi u đã s d ng ch ng tr c ta có: ử ụ ở ươ ệ ướ
m = R- ( R- r) – (R– r)
T s t liên h v i t ng quan riêng r, r ệ ớ ươ ỷ ố
Trong ph n h i quy b i ta đã bi t: ầ ồ ộ ế
R = r + (1- r) r
R = r + (1- r) r
Thay 2 công th c này vào bi u th c xác đ nh m ta đ c: ứ ứ ể ị ượ
m = R- (r + (1- r) r - r) - ( r + (1- r) r- r )
= R- ((1- r) r + (1- r) r)
Đ t 1- r = w; 1- r = wvà g i là các tr ng s . Công th c (5.16) đ c vi t l ứ ặ ọ ọ ố ượ ế ạ ướ i d i
d ngạ
m = R- (w r + w r)
Nh vây đ đo Theil b ng hi u gi a h s xác đ nh b i và t ng có tr ng s c a các ữ ệ ố ố ủ ư ệ ằ ộ ọ ộ ổ ị
ng quan riêng. h s t ệ ố ươ
Nh v y chúng ta đã bi t m t s đ đo đa c ng tuy n nh ng t t c đ u có ý nghĩa ư ậ ế ộ ố ộ ư ế ộ ấ ả ề
s d ng h n ch . Chúng ch cho ta nh ng thông báo r ng s vi c không ph i là lý ử ụ ự ệ ữ ế ạ ằ ả ỉ
ng. t ưở
Còn m t s đ đo n a nh ng liên quan đ n giá tr riêng ho c th ng kê Bayes chúng ế ộ ố ộ ữ ư ặ ố ị
ta không trình bày đây. ở
II. Bi n pháp kh c ph c ụ ệ ắ
1. S dung thông tin tiên nghiêm ử ̣ ̣
Môt trong cac cach tiêp cân đê giai quyêt vân đê đa công tuyên la phai tân dung ̣ ́ ́ ́ ̣ ̉ ̉ ́ ́ ̀ ̣ ́ ̀ ̉ ̣ ̣
thông tin tiên nghiêm hoăc thông tin t nguôn khac đê ng cac hê sô riêng. ừ c l ̉ ướ ượ ̣ ̣ ̀ ́ ́ ̣ ́
Thi du : ta muôn ng ham san xuât cua 1 qua trinh san xuât nao đo co dang : c l ́ ướ ượ ́ ̣ ̀ ̉ ́ ̉ ́ ̀ ̉ ́ ̀ ́ ́ ̣
Qt =AL
Trong đo Qt la l ng san phâm đ c san xuât th i ky t ; Lt lao đông th i ky t ; Kt vôn ̀ ượ ượ ờ ờ ́ ̉ ̉ ̉ ́ ̀ ̣ ̀ ́
a th i ky t ; Ut la nhiêu ;A , , β la cac tham sô ma chung ta cân ng .Lây ln ca 2 vê ờ c l ̀ ướ ượ ́ ̀ ̀ ̃ ̀ ́ ́ ̀ ́ ́ ̉
(5.17) ta đ c : ượ
LnQt = LnA + a lnLt + βKt Ut
Đăt LnQt = Q*t ; LnA = A* ; LnLt = L*t ̣
Ta đ Q*t = A* + a L*t + βK*t + Ut (5.18) c ượ
Gia s L|K va L co t ng quan rât cao di nhiên điêu nay se dân đên ph ng sai ̉ ử ́ ươ ươ ̀ ́ ̃ ̀ ̀ ̃ ̃ ́
cua cac ng cua cac hê sô co gian cua ham san xuât l n . c l ́ ướ ượ ́ ớ ̉ ̉ ́ ̣ ́ ̃ ̉ ̀ ̉
Gia s t 1 nguôn thông tin co l i theo quy mô nao đo ma ta biêt đ c răng ̉ ử ừ ́ ớ ́ ượ ̀ ̀ ́ ̀ ̀
nganh công nghiêp nay thuôc nganh cso l i t c theo quy mô không đôi nghia la a + β =1 ợ ứ ̀ ̣ ̀ ̣ ̀ ̉ ̃ ̀
β = 1 - a vao (5.18) va thu đ c : .V i thông tin nay ,cach x ly cua chung ta se la thay ử ớ ượ ̀ ́ ́ ̉ ́ ̃ ̀ ̀ ̀
Q*t = A* + a L*t + ( 1 - a )K*t + Ut (5.19)
T đo ta đ c Q*t – K*t = A* + a (L*t – K*t ) + Ut ừ ượ ́
Q*t – K*t = Y*t va L*t – K*t = Z*t ta đ c Đăt ̣ ượ ̀
Y*t = A* + a Z*t + Ut
Thông tin tiên nghiêm đa giup chung ta giam sô biên đôc lâp trong mô hinh xuông ̣ ̃ ́ ́ ̉ ́ ́ ̣ ̣ ̀ ́
con 1 biên Z*t ̀ ́
a Sau khi thu đ c l c ng cua thi tinh đ điêu kiên = 1 – ượ ướ ượ c t ượ ừ ̉ ̀ ́ ̀ ̣
2. Thu thâp sô liêu hoăc lây thêm mâu m i ớ ̣ ́ ̣ ̣ ́ ̃
Vi đa công tuyên la đăc tr ng cua mâu nên co thê co mâu khac liên quan đên cung ư ̀ ̣ ́ ̀ ̣ ̉ ̃ ́ ̉ ́ ̃ ́ ́ ̀
cac biên trong mâu ban đâu ma đa công tuyên co thê không nghiêm trong n a. Điêu nay ữ ́ ́ ̃ ̀ ̀ ̣ ́ ́ ̉ ̣ ̀ ̀
co thê lam đ c khi chi phi cho viêc lây mâu khac co thê châp nhân đ c trong th c tê . ượ ̣ ượ ự ́ ̉ ̀ ́ ̣ ́ ̃ ́ ́ ̉ ́ ́
Đôi khi chi cân thu thâp th êm sô liêu , tăng c mâu co thê lam giam tinh nghiêm ỡ ̉ ̀ ̣ ́ ̣ ̃ ́ ̉ ̀ ̉ ́
trong cua đa công tuyên . ̣ ̉ ̣ ́
3. Bo biên ̉ ́
Khi co hiên t ng đa công tuyên nghiêm trong thi cach “ đ n gian nhât “la bo biên ̣ ượ ơ ́ ̣ ́ ̣ ̀ ́ ̉ ́ ̀ ̉ ́
công tuyên ra khoi ph ng trinh. Khi phai s dung biên phap nay thi cach th c tiên hanh ươ ̉ ử ứ ̣ ́ ̉ ̀ ̣ ̣ ́ ̀ ̀ ́ ́ ̀
nh sau : ư
Gia s trong mô hinh hôi quy cua ta co Y la biên đ c giai thich con X2 .X3 …Xk ̉ ử ượ ̀ ̀ ̉ ́ ̀ ́ ̉ ́ ̀
la cac biên giai thich . Chung ta thây răng X2 t ươ ng quan chăt che v i X3 .Khi đo nhiêu ̃ ớ ̀ ́ ́ ̉ ́ ́ ́ ̀ ̣ ́ ̀
thông tin vê Y ch a X2 thi cung ch a X3 .Vây nêu ta bo 1 trong 2 biên X2 hoăc X3 ứ ở ứ ở ̀ ̀ ̃ ̣ ́ ̉ ́ ̣
khoi mô hinh hôi quy , ta se giai quyêt đ c vân đê đa công tuyên nh ng se mât đi 1 ́ ượ ư ̉ ̀ ̀ ̃ ̉ ́ ̀ ̣ ́ ̃ ́
phân thông tin vê Y . ̀ ̀
2 va trong cac phep hôi quy khac nhau ma co va không co 1
Băng phep so sanh R ̀ ́ ́ ̀ ́ ́ ̀ ́ ̀ ́ ̀ ́
trong 2 biên chung ta co thê quyêt đinh nên bo biên nao trong biên X2 va X3 khoi mô ́ ́ ́ ̉ ́ ̣ ̉ ́ ̀ ́ ̀ ̉
2
hinh . ̀
2 đôi v i hôi quy cua Y đôi v i tât ca cac biên X1X2X3 …Xk la 0.94; R
Thi du R ́ ớ ́ ớ ́ ̣ ̀ ̉ ́ ̉ ́ ́ ̀
2 khi loai biên X3 la 0.92 ;nh vây trong tr
khi loai biên X2 la 0.87 va R ng h p nay ta ư ̣ ườ ợ ̣ ́ ̀ ̀ ̣ ́ ̀ ̀
loai X3 ̣
Chung ta l u y 1 han chê cua biên phap nay la trong cac mô hinh kinh tê co nh ng ư ữ ́ ́ ̣ ́ ̉ ̣ ́ ̀ ̀ ́ ̀ ́ ́
tr ng h p đoi hoi nhât đinh phai co biên nay hoăc biên khac trong mô hinh .Trong ườ ́ ở ợ ̀ ̉ ́ ̣ ̉ ́ ́ ̀ ̣ ́ ̀
tr ng h p nh vây viêc loai bo 1 biên phai đ c cân nhăc cân thân gi a sai lêch khi bo ườ ư ̣ ̉ ượ ợ ữ ̉ ̣ ̣ ̉ ́ ́ ̉ ̣ ̣
1 biên công tuyên v i viêc tăng ph ng sai cua cac ng hê sô khi biên đo trong ớ ươ c l ́ ướ ượ ́ ở ́ ̣ ́ ̣ ̉ ̣ ́ ́
mô hinh . ̀
4. S dung sai phân câp 1 ử ̣ ́
Thu tuc đ c trinh bay trong ch ng 7 – t ng quan .Măc du biên phap nay co ̣ ượ ươ t ự ươ ́ ̉ ̀ ̀ ̣ ̀ ̣ ́ ̀
thê giam t ng quan qua lai gi a cac biên nh ng chung cung co thê đ c s dung nh ươ ̉ ượ ử ữ ư ư ̉ ̉ ̣ ́ ́ ́ ̃ ́ ̣
1 giai phap cho vân đê đa công tuyên . ̉ ́ ́ ̀ ̣ ́
Thi du Chung ta co sô liêu chuôi th i gian biêu thi liên hê gi a cac biên Y va cac biên ̣ ữ ờ ́ ̣ ́ ́ ́ ̣ ̃ ̉ ̣ ́ ́ ̀ ́ ́
phu thuôc X2 va X3 theo mô hinh sau : ̣ ̣ ̀ ̀
Yt = β 1 + β 2 X 2t + β 3X 3t+ U t (5.20)
Trong đo t la th i gian . Ph ng trinh trên đung v i t thi cung đung v i t-1 nghia la : ̀ ờ ươ ớ ớ ́ ̀ ́ ̀ ̃ ́ ̃ ̀
Yt-1 = β 2 + β 2 X 2t-1 + β 3X 3t-1 + U t-1 (5.21)
T (5.20) va (5.21) ta đ c : ừ ượ ̀
Yt – Yt-1 = β 2 (X 2t - X 2t-1 ) + β 3 (X 3t - X 3t-1) + U t - U t-1 (5.22)
Đ t yặ t = Yt – Yt-1
x2t = X 2t - X 2t-1 x3t = X 3t - X 3t-1 Vt = U t - U t-1
t = β 2 x2t + β 3 x3t + Vt (5.23)
Ta đ c : y ượ
Mô hinh hôi quy dang (5.23) th ng lam giam tinh nghiêm trong cua đa công tuyên vi ườ ̀ ̀ ̀ ̣ ̀ ̉ ́ ̣ ̉ ̣ ́
du X2 va X3 co thê t ng quan cao nh ng không co ly do tiên nghiêm nao chăc chăn ̉ ươ ư ̀ ̀ ́ ́ ́ ̣ ̀ ́ ́
răng sai phân cua chúng cung t ng quan cao. ươ ̀ ̉ ̃
Tuy nhiên biên đôi sai phân bâc nhât sinh ra 1 sô bân đê chăng han nh sô hang sai ư ́ ́ ̉ ̣ ́ ́ ́ ̀ ̉ ̣ ̣
sô Vt trong (5.23) co thê không thoa man gia thiêt cua mô hinh hôi quy tuyên tinh cô điên ́ ́ ̉ ̉ ̃ ̉ ́ ̉ ̀ ̀ ́ ́ ̉ ̉
la cac nhiêu không t ươ ̣ ơ ng quan .Vây thi biên phap s a ch a nay co thê lai con tôi tê h n ́ ử ữ ̀ ́ ̃ ̣ ̀ ̣ ̀ ́ ̉ ̣ ̀ ̀
căn bênh . ̣
5.Giam t ̉ ươ ứ ng quan trong hôi quy đa th c ̀
́ Net khac nhau cua hôi quy đa th c la cac biên giai thich xuât hiên v i luy th a khac ừ ứ ớ ́ ́ ̉ ̀ ̀ ́ ́ ̉ ́ ́ ̣ ̃
nhau trong mô hinh hôi quy .Trong th c hanh đê giam t ự ươ ng quan trong hôi quy đa th c ứ ̀ ̀ ̀ ̉ ̉ ̀
ng i ta th ườ ườ ng s dung dang đô lêch .Nêu viêc s dung dang đô lêch ma vân không ̣ ử ử ̣ ̣ ̣ ̣ ́ ̣ ̣ ̣ ̣ ̀ ̃
giam đa công tuyên thu ng i ta co thê phai xem xet đên ky thuât “ đa th c tr c giao “. ̀ ườ ự ứ ̉ ̣ ́ ́ ̉ ̉ ́ ́ ̃ ̣
6. Môt sô biên phap khac ̣ ́ ̣ ́ ́
Ngoai cac biên phap đa kê trên ng ườ i ta con s dung 1 sô biên phap khac n a đê c u ̉ ứ ́ ữ ̀ ử ̀ ́ ̣ ́ ̃ ̉ ̣ ́ ̣ ́
ch a căn bênh nay nh sau : ữ ư ̣ ̀
- Hôi quy thanh phân chinh ̀ ̀ ̀ ́
- S dung cac ng t bên ngoai c l ́ ướ ượ ử ừ ̣ ̀
Nh ng tât ca cac biên phap đa trinh bay trên co thê lam giai phap cho vân đê đa ̀ ở ư ́ ̉ ́ ́ ̃ ̀ ́ ̉ ̀ ̉ ́ ́ ̀
công tuyên nh thê nao con phu thuôc vao ban chât cua tâp sô liêu va tinh nghiêm trong ư ̣ ́ ́ ̀ ̀ ̣ ̣ ̀ ̉ ́ ̉ ̣ ́ ̣ ̀ ́ ̣
cua vân đê đa công tuyên. ̉ ́ ̀ ̣ ́
B. VÍ D MINH H A
Ọ
Ụ
Cho b ng s li u sau: ố ệ ả
Y 130771 150033 177983 217434 253686 298543 358629 493300 589746 632326 770211 827032 X 321853 342607 382137 445221 511221 584793 675916 809862 1091876 1206819 1446901 1794466
năm Z 435319 474855 527055 603688 701906 822432 951456 1108752 1436955 1580461 1898664 2415204 ổ ụ ố ừ http://gso.gov.vn/default.aspx?tabid=715( t ng c c th ng kê t 2000 -2011)
Trong đó: Y là tích lũy tài s n qu c gia theo giá th c t ( t đ ng) ự ế ỉ ồ ả ố ự ế ỉ ồ ố X là tiêu dùng cu i cùng qu c gia theo giá th c t ( t đ ng) Z là t ng thu nh p qu c gia theo giá th c t ( t đ ng) ổ ố ự ế ỉ ồ ớ ng đa c ng tuy n và tìm bi n pháp kh c ph c. V i α ệ ụ ế ắ ộ ệ ầ
ố ậ Yêu c u: Hãy phát hi n hi n t ệ ượ = 5%. 1. ậ ồ ộ ủ ả L p mô hình hàm h i quy ồ ố ố Ta có mô hình hàm h i quy tuy n tính th hi n s ph thu c c a tích lũy tài s n qu c ể ệ ự ụ gia vào tiêu dùng cu i cùng và t ng thu nh p qu c gia: ố ậ ế ổ
Mô hình ng c a hàm h i quy: c l ướ ượ ủ ồ
= + Xi + Zi T b ng s li u s d ng ph n m m eviews ta k t qu sau: ề ầ ố ệ ử ụ ừ ả ế ả
Dependent Method: Date: Sample: 1 12 Included
Variable
Coefficient Std. Error
t-Statistic
Prob.
C X Z
15390.94 1.035505 -0.404423
30957.40 0.497165 1.379448 0.750666 0.572356 -0.706593
0.6310 0.2011 0.4977
408307.8 246478.9 24.46212 24.58334 24.41723 1.004286
R-squared Adjusted R- S.E. of Sum squared Log F-statistic Prob(F-statistic)
0.973185 Mean 0.967227 S.D. 44621.06 Akaike 1.79E+10 Schwarz -143.7727 Hannan- 163.3196 Durbin- 0.000000
T k t qu ng thu đ ừ ế ượ ẫ ồ c l c hàm h i quy m u sau: ả ướ ượ i = 15390.94 + 1.035505Xi – 0.404423Yi
ng đa c ng tuy n ộ
ế
ệ ố
ư
ị
I. Phát hi n hi n t ệ ượ ệ ộ Cách 1: H s xác đ nh b i cao nh ng t th p ấ
V i α = 0.05 ta có: = = 2.262 ớ
Nh n xét: ậ
T b ng k t qu eviews ta có: ừ ả ế ả
R2 = 0.973185 > 0.8
Th ng kê t c a h s t ủ ệ ố ươ ứ ng ng v i bi n X ớ ế ố
T = 1.379448 < 2.262
Th ng kê t c a h s t ủ ệ ố ươ ứ ng ng v i bi n Z ớ ế ố
T = 0.706593 < 2.262
V y ậ R2 cao nh ng t th p. ấ Suy ra có hi n t ệ ượ ư ng đa c ng tuy n. ộ ế
Cách 2: H s t ng quan gi a các bi n gi i thích cao ệ ố ươ ữ ế ả
X 1.000000 0.999305
Z 0.999305 1.000000
X Z
K t qu t eviews ta th y đ c t i thích: ả ừ ế ấ ượ ươ ng quan gi a các bi n gi ữ ế ả
Ta có: r12 = 0.999305 > 0.8
Nh v y càng có c s k t lu n hi n t ng đa c ng tuy n trong mô hình trên ơ ở ế ư ậ ệ ượ ậ ế ộ
Cách 3: H i quy ph ồ ụ
Dependent Method: Least Date: 03/28/14 Sample: 1 12 Included
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C Z
-21542.70 0.761934
11120.44 0.008990
-1.937217 84.75422
0.0815 0.0000
801139.3 480684.5 22.67181 22.75263 22.64189 1.116681
R-squared Adjusted R- S.E. of Sum squared Log likelihood F-statistic Prob(F-statistic)
0.998610 Mean 0.998471 S.D. 18797.19 Akaike info 3.53E+09 Schwarz -134.0309 Hannan- 7183.278 Durbin- 0.000000
Ta h i quy bi n X theo bi n Z đ c k t qu nh sau : ế ế ồ ượ ế ả ư
Ta có ta đi ki m đ nh gi thi ể ị ả t ế
: X không có hi n t ng đa c ng tuy n v i Z ệ ượ ế ộ ớ
: X có hi n t ng đa c ng tuy n v i Z ệ ượ ế ộ ớ
Nh n xét: ậ
Ta th y giá tr p-value c a th ng kê F là 0.000000 < =0.05 ủ ấ ố ị
=> bác b gi thi t ch p nh n gi thi t ỏ ả ế ấ ậ ả ế
V y càng có c s kh ng đ nh mô hình trên có hi n t ơ ở ệ ượ ậ ẳ ị ng đa c ng tuy n ế ộ
Cách 4: : Đ đo Theil ộ
Y 1.000000 0.985747 0.983624
X 0.985747 1.000000 0.999305
Z 0.983624 0.999305 1.000000
Y X Z
Ta có các h s t ng quan gi a các bi n Y và X,Z nh ệ ố ươ ữ ế ư sau:
c đ đo Theil ta ph i tính đ c ,. Theo công th c đã bi t ng hai ta ượ ộ ả ượ ứ ch ế ở ươ
Đ tính đ ể có = = 0.05257
Ta có: = 0.96752 Trong ph n h i quy b i ta đã bi t: ầ ồ ộ ế
R = r + (1- r) r
R = r + (1- r) r
V y R = 0.96752 + (1 – 0.96752) 0.05257 0.96581 ậ
M t khác ta có: ặ
m = R- (r + (1- r) r - r) - ( r + (1- r) r- r ) = R- ((1- r) r + (1- r) r)
Suy ra: m = 0.96581 – ((1 - ) 0.05257) + (1 - 0.05257)
= 0.96261
có hi n t ứ ỏ ệ ượ ộ ng đa c ng tuy n s y ra. Và m c đ đa c ng ứ ộ ế ả ộ V y m khác 0 nên ch ng t tuy n là 0.98654 ậ ế
II. Bi n pháp kh c ph c ụ ệ ắ
Cách 1: B bi n ỏ ế
B c 1: H i quy Y theo X => ướ ồ
B c 2: H i quy Y theo Z => ướ ồ
B c 3: So sánh và trong các h i quy trên ướ ồ
B c 4: K t lu n. ướ ế ậ
Dependent Variable: Y Method: Least Squares Date: 03/29/14 Time: 09:16 Sample: 2000 2011 Included observations: 12
Variable C X
Coefficient 3365.264 0.505458
Std. Error 25203.61 0.027279
t-Statistic 0.133523 18.52920
Prob. 0.8964 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.971698 Mean dependent var 0.968868 S.D. dependent var 43489.57 Akaike info criterion 1.89E+10 Schwarz criterion -144.0966 F-statistic 1.148020 Prob(F-statistic)
408307.8 246478.9 24.34944 24.43026 343.3314 0.000000
* B c 1 ướ : H i quy Y theo X ồ
Dependent Variable: Y Method: Least Squares Date: 03/29/14 Time: 09:18 Sample: 2000 2011 Included observations: 12
Variable C Z
Coefficient -6916.624 0.384564
Std. Error 27563.81 0.022283
t-Statistic -0.250931 17.25817
Prob. 0.8069 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.967516 Mean dependent var 0.964268 S.D. dependent var 46591.90 Akaike info criterion 2.17E+10 Schwarz criterion -144.9235 F-statistic 1.252724 Prob(F-statistic)
408307.8 246478.9 24.48725 24.56807 297.8446 0.000000
* B c 2: H i quy Y theo Z. ồ ướ
trên ta có:
ở
ả ồ
ng h p này lo i bi n Z
* B c 3 : ướ T k t qu h i quy ừ ế = 0.973185 = 0.967227 = 0.971698 = 0.967516 = 0.968868 = 0.964268 * B c 4: ướ Ta ti n hành so sánh. Và k t lu n trong tr ế
ế
ậ
ườ
ế
ạ
ợ
Cách 2: Thu th p thêm s li u đ tang kích th ố ệ ể ậ ướ c m u ẫ
Ta thu th p thêm m t s m u đ tăng kích th c b ng s li u sau: c đ ộ ố ẫ ể ậ ướ ượ ả ố ệ
Y 130771 150033 177983 217434 253686 298543 358629 493300 589746 632326 770211 827032 892837 942822 992838 1023847 1092733 1123883 1200389 X 321853 342607 382137 445221 511221 584793 675916 809862 1091876 1206819 1446901 1794466 1811238 1899678 1915089 1997283 2001838 2078934 2121838 Z 435319 474855 527055 603688 701906 822432 951456 1108752 1436955 1580461 1898664 2415204 2523146 2600198 2822899 3016754 3199767 3202984 3300484
Dependent Variable: Y Method: Least Squares Date: 03/29/14 Time: 08:31
Sample: 1 19 Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5556.839
20959.22
0.265126
0.7943
X
0.242395
0.112216
2.160078
0.0463
Z
0.189806
0.073213
2.592498
0.0196
0.989332
640475.9
0.987999
372159.5
40770.30
24.21323
R-squared Adjusted R- squared S.E. of regression Sum squared resid
2.66E+10
24.36236
Log likelihood
-227.0257
24.23847
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan- Quinn criter. Durbin- Watson stat
F-statistic
741.9164
1.096358
Prob(F-statistic)
0.000000
T b ng s li u, s d ng ph n m m eview ta đ c k t qu sau: ố ệ ử ụ ừ ả ề ầ ượ ế ả
Ta có mô hình h i quy m i: ớ ồ i = 5556.839 + 0.242395Xi + 0.189806Zi
2 khá g n m t, các t
c m u có R s t cũng khá cao ẫ ầ ộ ỷ ố t1 =0.265126 t2 = 2.160078 t3 = 2.592498 R2 = 0.989332 Mô hình sau khi đã tăng kích th nên mô hình c l ướ ượ ướ ng là phù h p ợ