
B. VÍ D MINH H AỤ Ọ
Bài toán: Cho b ng s li u sau.ả ố ệ
Trong đó:
Y: s n l ng d u thô (đ n v : nghìn t n)ả ượ ầ ơ ị ấ
X: kim ng ch xu t kh u d u thô (đ n v : nghìn t n)ạ ấ ẩ ầ ơ ị ấ
Z: v n đ u t khai thác (đ n v trăm tri u đ ng)ố ầ ư ơ ị ệ ồ
Yêu c u: Hãy phát hi n hi n t ng đa c ng tuy n và tìm bi n pháp kh c ph c.ầ ệ ệ ượ ộ ế ệ ắ ụ
Cho α = 5%.
2.9975 13.0394 26.444
3.2615 13.2836 71.3427
3.9534 13.6048 129.8
5.3669 13.937 230.7305
6.0973 14.3781 341.7524
7.2072 14.5893 481.4634
7.8243 15.2548 601.2952
8.1796 15.7597 696.9732
9.5359 15.9621 863.8135
10.7118 16.1865 1003.6598
11.9966 16.8256 1144.594
13.9931 17.6121 1287.8756
15.9544 18.2776 1420.5488
17.1974 18.8364 1569.5317
18.4503 18.8881 1814.2707
Ti n hành c l ng hàm h i quy m u ta đ cế ướ ượ ồ ẫ ượ
Dependent Variable: Y
Method: Least Squares
Date: 05/06/10 Time: 19:25
Sample: 1 15
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 12.47549 0.301090 41.43445 0.0000
X 0.228322 0.105322 2.167852 0.0510
Z 0.001431 0.000924 1.547751 0.1476
R-squared 0.990379 Mean dependent var 15.76234
Adjusted R-squared 0.988776 S.D. dependent var 1.989505
S.E. of regression 0.210776 Akaike info criterion -0.099186
Sum squared resid 0.533118 Schwarz criterion 0.042424
Log likelihood 3.743892 F-statistic 617.6576

Durbin-Watson stat 1.650553 Prob(F-statistic) 0.000000
I/ Phát hi n hi n t ng đa c ng tuy nệ ệ ượ ộ ế
Ta có hàm h i quy m u:ồ ẫ
ˆ12.47549+0.228322X 0.001431Z
i i i
Y= +
( ) 12
/2 0.025
2.179
n k
t t
α
−
= =
Cách 1: H s xác đ nh b i ệ ố ị ộ
2
R
cao nh ng t th p.ư ấ
Nh n xét:ậ
2
0.990379 > 0.8R=
Th ng kê t c a h s ng v i bi n Xố ủ ệ ố ứ ớ ế
T = 2.167852 < 2.179
Th ng kê t c a h s ng v i bi n Zố ủ ệ ố ứ ớ ế
T = 1.547751 < 2.179
V y ậ
2
R
cao nh ng t th p. Suy ra có hi n t ng đa c ng tuy n.ư ấ ệ ượ ộ ế
Cách 2: H s t ng quan c p gi a các bi n gi i thích cao ệ ố ươ ặ ữ ế ả
Ta có.
12
0.994412 0.8r= >
=> Nh v y ta càng có c s k t lu n có hi n t ng đa c ng tuy n trong môư ậ ơ ở ế ậ ệ ượ ộ ế
hình trên
Cách 3: H i quy phồ ụ
X Z
X 1.00000
0
0.994412
Z0.994412 1000000

Ta h i quy bi n X theo bi n Z đ c k t qu nh sau:ồ ế ế ượ ế ả ư
Dependent Variable: X
Method: Least Squares
Date: 05/06/10 Time: 21:05
Sample: 1 15
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 2.717476 0.246174 11.03884 0.0000
Z 0.008727 0.000257 33.96160 0.0000
R-squared 0.988854 Mean dependent var 9.515147
Adjusted R-squared 0.987997 S.D. dependent var 5.066274
S.E. of regression 0.555048 Akaike info criterion 1.784043
Sum squared resid 4.005022 Schwarz criterion 1.878449
Log likelihood -11.38032 F-statistic 1153.390
Durbin-Watson stat 0.703053 Prob(F-statistic) 0.000000
Ta có
0.05
α
=
ta đi ki m đ nh gi thi tể ị ả ế
0
H
: X không có hi n t ng đa c ng tuy n v i Zệ ượ ộ ế ớ
1
H
: X có hi n t ng đa c ng tuy n v i Zệ ượ ộ ế ớ
Nh n xét: ậ
Ta th y giá tr p-value c a th ng kê F là ấ ị ủ ố 0.000000 <
α
=0.05
=> bác b gi thi t ỏ ả ế
0
H
ch p nh n gi thi t ấ ậ ả ế
1
H
V y càng có c s kh ng đ nh mô hình trên có hi n t ng đa c ng tuy nậ ơ ở ẳ ị ệ ượ ộ ế
Cách 4: Đ đo Theilộ
Ta có các h s t ng quan gi a các bi n Y và X,Z nhệ ố ươ ữ ế ư
Y X Z
Y 1.000000 0.994213 0.993283
X 0.994213 1.000000 0.994412
Z 0.993283 0.994412 1.000000
Đ tính đ c đ đo Theil ta ph i tính đ c ể ượ ộ ả ượ
2
R
,
2 2
12,3 13,2
à,rr v
. Theo công th c đã bi tứ ế
ch ng hai ta cóở ươ
2 2
13,2 12,3
r r=
=
22
13 12 23
2 2 2 2
12 23
( ) (0.993283 0.994213 0.994412) 0.16636
(1 )(1 ) (1 0.994213 )(1 0.994412 )
r r r
r r
−− ×
= ≈
− − − −
2 2
13
(0.993283) 0.98661r= ≈

2 2 2 2 2 2
12 12 13,2
(1 ) (0.994213) (1 0.994213 )0.16636 0.99038R r r r= + − = + − ≈
V y m = ậ
]
2 2 2 2 2
12 13,2 13 12,3
(1 ) (1 )R r r r r
− − + −
= 0.99038 – 2(1-0.98846)0.16636=0.98654
m khác 0 nên ch ng t có hi n t ng đa c ng tuy n s y ra. Và m c đ đa c ngứ ỏ ệ ượ ộ ế ả ứ ộ ộ
tuy n là 0.98654 ế
II/ Kh c ph c hi n t ng đa c ng tuy nắ ụ ệ ượ ộ ế
Cách 1: B bi nỏ ế
B c 1: h i quy Y theo X =>ướ ồ
2 2
1 1
,R R
B c 2: h i quy Y theo Z =>ướ ồ
2 2
2 2
,R R
B c 3: so sánh ướ
2
R
và
2
R
trong các h i quy trênồ
B c 4: k t lu n.ướ ế ậ
* B c 1 : H i quy Y theo Xướ ồ
Dependent Variable: Y
Method: Least Squares
Date: 05/06/10 Time: 22:42
Sample: 1 15
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 12.04740 0.125199 96.22580 0.0000
X 0.390423 0.011701 33.36762 0.0000
R-squared 0.988459 Mean dependent var 15.76234
Adjusted R-squared 0.987571 S.D. dependent var 1.989505
S.E. of regression 0.221801 Akaike info criterion -0.050508
Sum squared resid 0.639543 Schwarz criterion 0.043899
Log likelihood 2.378807 F-statistic 1113.398
Durbin-Watson stat 1.323845 Prob(F-statistic) 0.000000
* B c 2 H i quy Y theo Zướ ồ

* B c 3 :ướ
T k t qu h i quy trên ta có:ừ ế ả ồ ở
2
R
= 0.990379
R
= 0.988776
2
1
R
= 0.988459
2
1
R
= 0.987571
2
2
R
= 0.986612
2
2
R
= 0.985582
* B c 4:ướ
Ta ti n hành so sánh. Và k t lu n trong tr ng h p này lo i bi n Zế ế ậ ườ ợ ạ ế
Cách 2: S d ng sai phân c p 1ử ụ ấ
Dependent Variable: Y
Method: Least Squares
Date: 05/06/10 Time: 22:44
Sample: 1 15
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 13.09595 0.105953 123.6014 0.0000
Z 0.003423 0.000111 30.95139 0.0000
R-squared 0.986612 Mean dependent var 15.76234
Adjusted R-squared 0.985582 S.D. dependent var 1.989505
S.E. of regression 0.238892 Akaike info criterion 0.097958
Sum squared resid 0.741904 Schwarz criterion 0.192365
Log likelihood 1.265315 F-statistic 957.9883
Durbin-Watson stat 1.580353 Prob(F-statistic) 0.000000