Bài 4. ĐA CNG tuyến
1. Bn cht ca đa cng tuyến ( Multicolinearity)
1.1. Hin tượng :
Xét MH: Yi =
β
1 +
β
2 X2i +
β
3X3i + … +
β
kXki + ui
Gt 10: Các biến gii thích không có quan h cng tuyến.
Nếu gi thiết b vi phm hin tượng đa cng tuyến.
Có hai dng đa cng tuyến:
i. Đa cng tuyến hoàn ho( Perfect Multicolinearity) :
λ
j 0 (j 1) sao cho:
λ
2 X2i + … +
λ
kXki = 0 i
Ma trn X là suy biến, không có li gii duy nht.
ii. Đa cng tuyến không hoàn ho ( Imperfect Multicolinearity) :
λ
j 0 (j 1) sao cho:
λ
2 X2i + … +
λ
kXki + vi = 0
vi vi là SSNN có phương sai dương vn có li gii.
1.2. Nguyên nhân
Đa cng tuyến hoàn ho gn như không bao gi xy ra
Đa cng tuyến không hoàn ho thường xuyên xy ra, do các nguyên
nhân:
- Bn cht các biến gii thích có quan h tươngquan vi
nhau(Khách quan).
- Do s liu mu không ngu nhiên.
- Do kích thước mu không đủ.
- Do quá trình làm trơn s liu.
2. Hu qu
2.1. Đa cng tuyến hoàn ho : không gii được
V× lóc ®ã =j
ˆ
β
0
0 j vµ
Var( ) = j(Ph-¬ng sai)
j
ˆ
β
2.2. Đa cng tuyến không hoàn ho:
- Các ước lượng có phương sai ln, là ước lượng không hiu qu.
- Khong tin cy rng không còn ý nghĩa.
- Các kim định T có th sai.
- Các kim định T và kim định F có th cho kết lun mâu thun
nhau.
- Các ước lượng có th sai v du.
- Mô hình tr nên nhy cm vi mi s thay đổi ca s biến gii
thích và ca tp s liu.
3. Phát hin đa cng tuyến.
3.1. S mâu thun gia kim định T và F
Có mâu thun: Kim định F có ý nghĩa, tt c các kim định T v
các h s góc không có ý nghĩa.
Đa cng tuyến.
Điu ngược li chưa chc đúng.
3.2. Hi qui ph
Nghi ng biến gii thích Xj ph thuc tuyến tính vào các biến gii
thích khác, hi qui mô hình hi qui ph:
Xj =
α
1 +
α
2X2 + … +
α
j-1Xj -1 +
α
j+1Xj+1 + … + vi (*)
=
0:H
0:H
2
*1
2
*0
R
R Mô hình ban đầu không có Đa cng tuyến
Mô hình ban đầu có Đa cng tuyến
Fqs = 11 *
*
2
*
2
*
×
k
kn
R
R ; Fqs > F
α
(k*1, n – k*) thì bác b H0.
3.3. Độ đo Theil
Dùng để so sánh mc độ đa cng tuyến không hoàn ho gia các mô
hình.
B-íc 1: Håi quy m« h×nh ban ®Çu t×m ®-îc R2
B-íc 2: B biến Xj ra khi mô hình, hi qui thu được R2
– j (j=2,k)
m = R2 được gi là độ đo Theil
)( 2
2
2
j
k
j
RR
=
Ví d: S dng tp s liu ch5bt4 v Tiêu dùng Y, Thu nhp X2 và Tài sn có kh
năng chuyn đổi cao X3 ca 25 h gia đình M để kim định hin tượng đa cng
tuyến gia các biến gii thích.
Kết qu hi quy Y theo X2 và X3 như sau:
Dependent Variable: Y
Method: Least Squares
Date: 11/19/08 Time: 10:12
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 33.87971 19.11513 1.772403 0.0902
X2 -
26.00263
34.95897 -0.743804 0.4649
X3 6.709261 8.740550 0.767602 0.4509
R-squared 0.741695 Mean dependent
var
169.368
0
Adjusted R-
squared
0.718213 S.D. dependent var 79.0585
7
S.E. of regression 41.96716 Akaike info
criterion
10.4238
2
Sum squared resid 38747.34 Schwarz criterion 10.5700
8
Log likelihood -
127.2977
F-statistic 31.5853
2
Durbin-Watson
stat
2.785912 Prob(F-statistic) 0.00000
0
Håi quy phô cña X2 theo X3 cã kÕt qu¶ sau:
Dependent Variable: X2
Method: Least Squares
Date: 11/19/08 Time: 10:17
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C - 0.111892 -0.938303 0.3578
0.104988
X3 0.250022 0.000157 1594.459 0.0000
R-squared 0.999991 Mean dependent
var
159.448
0
Adjusted R-
squared
0.999991 S.D. dependent var 81.4698
0
S.E. of regression 0.250315 Akaike info
criterion
0.14442
6
Sum squared resid 1.441126 Schwarz criterion 0.24193
6
Log likelihood 0.194678 F-statistic 2542299
.
Durbin-Watson
stat
2.245068 Prob(F-statistic) 0.00000
0
Håi quy phô ca X3 theo X2 có kết qu sau:
Dependent Variable: X3
Method: Least Squares
Date: 11/19/08 Time: 10:19
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 0.425686 0.447288 0.951703 0.3511
X2 3.999613 0.002508 1594.459 0.0000
R-squared 0.999991 Mean dependent
var
638.156
0
Adjusted R-
squared
0.999991 S.D. dependent var 325.849
2
S.E. of regression 1.001168 Akaike info
criterion
2.91683
0
Sum squared resid 23.05376 Schwarz criterion 3.01434
0
Log likelihood -
34.46038
F-statistic 2542299
.
Durbin-Watson
stat
2.245125 Prob(F-statistic) 0.00000
0
Để tính độ đo Theil ta hi quy Y ln lượt vi X2 và X3. Kết qu như sau:
Dependent Variable: Y
Method: Least Squares
Date: 11/19/08 Time: 10:23
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 36.73575 18.58133 1.977025 0.0601
X2 0.831821 0.104206 7.982448 0.0000
R-squared 0.734777 Mean dependent
var
169.368
0
Adjusted R-
squared
0.723246 S.D. dependent var 79.0585
7
S.E. of regression 41.59070 Akaike info
criterion
10.3702
5
Sum squared resid 39785.09 Schwarz criterion 10.4677
6
Log likelihood -
127.6281
F-statistic 63.7194
8
Durbin-Watson
stat
2.919889 Prob(F-statistic) 0.00000
0
Dependent Variable: Y
Method: Least Squares
Date: 11/19/08 Time: 10:24
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 36.60968 18.57637 1.970766 0.0609
X3 0.208034 0.026033 7.991106 0.0000