8.1. Tự tương quan (tương quan chuỗi)
CHƯƠNG VIII
8.1.1. Bản chất và nguyên nhân của tự tương quan Trong mô hình hồi quy tuyến tính cổ điển chúng ta giả định không có tương quan giữa các phần dư hay
Cov(uiuj) = 0 với mọi i, j. ⇒ Cov(ui,uj) ≠ 0: tự tương quan
TỰ TƯƠNG QUAN – CHỌN MÔ HÌNH – THẨM ĐỊNH VIỆC CHỌN MÔ HÌNH
1
2
* Nguyên nhân khách quan:
ui
ui
• Chuỗi có tính chất quán tính theo chu kỳ • Hiện tượng mạng nhện: dãy số cung về café năm nay phụ thuộc vào giá năm trước => ui không còn ngẫu nhiên nữa.
a) b)
t
t
• Dãy số có tính chất trễ: tiêu dùng ở thời kỳ này chẳng những phụ thuộc vào thu nhập kỳ này mà còn phụ thuộc vào tiêu dùng của kỳ trước nữa.
Cho thấy có một xu hướng tuyến tính xãy ra ở 2 mô hình trên
4
1
8.1.2. Hậu quả của tự tương quan
* Nguyên nhân chủ quan
• Nếu vẫn áp dụng OLS khi mô hình có hiện tượng tự
• Chọn dạng mô hình sai (thường xảy ra ở mô hình
tương quan thì sẽ có các hậu quả sau:
với chi phí biên)
• Đưa thiếu biến giải thích vào mô hình • Việc xử lý số liệu.(số liệu tháng = số liệu quý/3)
• - Các ước lượng không chệch nhưng đó là không phải là các hiệu quả vì đó không phải là các ước lượng có phương sai nhỏ nhất.
• Phương sai của các ước lượng là các ước lượng chệch
là ước lượng chệch của δ2
vì vậy các kiểm định t và F không còn hiệu quả. 2ˆδ • • R2 của mẫu là ước lượng chệch (dưới) của R2 tổng thể • Các dự báo về Y không chính xác
5
6
b. Dùng kiểm định d của Durbin – Watson
8.1.3. Cách phát hiện tự tương quan
2
(
1 )
i
∑
d
=
Thống kê d của Durbin – Watson được định nghĩa như sau: e −− i 2 e i
a. Đồ thị Chúng ta có thể phát hiện hiện tượng tự tương quan bằng cách quan sát đồ thị phần dư của mô hình trên dữ liệu chuỗi thời gian.
Khi n đủ lớn thì
d ≈ 2(1-ρ)
et
1
ρ
=
trong đó:
e ∑ ∑ − ee i i ∑ 2 e i
t
7
8
do -1 ≤ ρ ≤ 1, nên khi: ρ = -1 => d = 4: tự tương quan hoàn hảo âm ρ = 0 => d = 2: không có tự tương quan ρ = 1 => d = 0: tự tương quan hoàn hảo dương
Phần dư phân bố một cách ngẫu nhiên xung quanh giá trị trung bình của nó.
2
b. Dùng kiểm định d của Durbin – Watson (tt)
* Chú ý:
Quyết định Bác bỏ
Nếu 0 < d < dL
• Trong thực tế khi tiến hành kiểm định Durbin – Watson, người ta thường áp dụng quy tắc kiểm định đơn giản sau:
dL ≤ d ≤ dU
• Nếu 1 < d < 3 thì kết luận mô hình không có tự
tương quan.
Giả thiết H0 Không có tự tương quan dương Không có tự tương quan dương Không có tự tương quan âm Không có tự tương quan âm
• Nếu 0 < d < 1 thì kết luận mô hình có tự tương
4-dL < d < 4 4-dU ≤ d ≤ 4-dL
quan dương.
Không quyết định Bác bỏ Không quyết định Không bác bỏ
dU < d < 4-dL
• Nếu 3 < d < 4 thì kết luận mô hình có tự tương
Không có tự tương quan âm hoặc dương
quan âm.
9
10
Trong đó dU và dL là các giá trị tra bảng giá trị d.
(cid:153)Nếu d thuộc vùng chưa quyết định, chúng ta sẽ sử dụng quy tắc kiểm định cải biên như sau: i) H0: ρ = 0; H1: ρ > 0. Nếu d < dU thì bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa α), nghĩa là có tự tương quan dương.
ii) H0: ρ = 0; H1: ρ < 0. Nếu d > 4 - dU thì bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa α), nghĩa là có tự tương quan âm.
Dependent Variable: RWAGES Method: Least Squares Date: 05/23/11 Time: 21:27 Sample: 1959 2002 Included observations: 44 Variable Coefficient Std. Error t-Statistic Prob. PRODUCT 0.700589 0.017122 40.91818 0.0000 C 29.57497 1.460515 20.24968 0.0000 R-squared 0.975529 Mean dependent var 87.70000 Adjusted R-squared 0.974946 S.D. dependent var 14.22579 S.E. of regression 2.251719 Akaike info criterion 4.505654 Sum squared resid 212.9500 Schwarz criterion 4.586754 Log likelihood -97.12439 F-statistic 1674.298
iii) H0: ρ = 0; H1: ρ ≠ 0. Nếu d
3
Durbin-Watson stat 0.213684 Prob(F-statistic) 0.000000
4
3
Phân tích kết quả
2
1
0
I
-1
D S E R
-2
(cid:132) Kết quả hồi hồi qui cho thấy các hệ số hồi qui của biến tiền lương thực tế (RWAGES) và biến năng suất lao động (PRODUCT) có ý nghĩa thống kê
-3
(cid:132) R2 = 0.975529 rất lớn, nên mô hình rất phù
-4
hợp
-5 1940
1960
1980
2000
2020
NAM
(cid:132) Nhưng do dự liệu trên là dữ liệu chuỗi, nên có khả năng xảy ra hiện tượng tự tương quan. Ta cần kiểm định hiện tượng này
13
Nhìn vào đồ thị chúng ta nhận thấy phần dư phân bố có vẻ không ngẫu nhiên. Các phần dư nhận giá trị âm sau đó tăng dần rồi giảm và nhận giá trị âm trở lại
4
3
2
1
(cid:132) Từ kết quả hồi qui RWAGES theo PRODUCT
0
T E
-1
ta có giá trị thống kê Durbin-Watson d = 0.213684
-2
-3
-4
(cid:132) Với n = 45, α = 5%, k’ = 1( do có 1 biến độc lập). Tra bảng ta có được dL = 1.475, du = 1.566
-5
-5 -4
-3 -2
-1
0
1
2
3
4
ETTRE
(cid:132) Do d = 0.213684 < dL = 1.475 → bác bỏ H0, chấp nhận H1. Tức là có tương quan bậc nhất trong các phần dư.
16
Nhìn vào đồ thị, ta nhận thấy có khả năng xảy ra tương quan dương giữa ei và ei-1 khá rõ
4
c. Dùng kiểm định Breusch – Godfrey (BG) (tt)
c. Dùng kiểm định Breusch – Godfrey (BG)
Xét mô hình:
(8.1)
α(p): Bác bỏ H0, nghĩa là có tự
α(p): Chấp nhận H0, nghĩa là
Yt = β1 + β2Xt + ut ut = ρ1ut-1 + ρ2ut-2 + … + ρput-p + vt ta cần kiểm định giả thiết H0: ρ1 = ρ2 = … = ρρ = 0, có nghĩa là không tồn tại tự tương quan ở bất kỳ bậc nào trong số từ bậc 1 đến bậc p. Bước 1: Ước lượng (8.1) bằng OLS, tìm phần dư et Bước 2: Dùng OLS để ước lượng mô hình
Bước 3: với n đủ lớn, (n-p)R2 có phân phối xấp xỉ χ2(p). - Nếu (n-p)R2 > χ2 tương quan ít nhất ở một bậc nào đó. -Nếu (n-p)R2 ≤ χ2 không có tự tương quan. -Lệnh : [equation] view/redual test/resdual correlation LM test
et = β1 + β2Xt + ρ1et-1 + ρ2et-2 + ..+ ρpet-p + εt từ đây ta thu được R2.
Bài tập chương 8 : kiểm định BG
17
18
Breusch-Godfrey Serial Correlation LM Test:
Dependent Variable: TIEUDUNG
F-statistic
10.67142
Probability
0.000385
Method: Least Squares
Obs*R-squared
13.68617
Probability
0.001067
Date: 05/27/11 Time: 14:32
Sample: 1958 1988
Test Equation:
Included observations: 31
Dependent Variable: RESID
Variable
Coefficient
Std. Error
t-Statistic
Prob.
Method: Least Squares
Date: 05/27/11 Time: 14:35
THUNHAP
0.684186
0.008848
77.32386
0.0000
Presample missing value lagged residuals set to zero.
C
-161.5118
22.37920
-7.217049
0.0000
Variable
Coefficient
Std. Error
t-Statistic
Prob.
THUNHAP
0.000515
0.006855
0.075095
0.9407
R-squared
0.995173
Mean dependent var
1512.061
C
-0.717916
17.33445
-0.041416
0.9673
RESID(-1)
0.782273
0.192423
4.065390
0.0004
Adjusted R-squared
0.995007
S.D. dependent var
448.3518
RESID(-2)
-0.186092
0.193062
-0.963896
0.3437
S.E. of regression
31.68220
Akaike info criterion
9.811728
R-squared
0.441489
Mean dependent var
-3.30E-13
Sum squared resid
29109.09
Schwarz criterion
9.904243
Adjusted R-squared
0.379433
S.D. dependent var
31.14969
S.E. of regression
24.53851
Akaike info criterion
9.358279
Log likelihood
-150.0818
F-statistic
5978.979
Sum squared resid
16257.74
Schwarz criterion
9.543309
Log likelihood
-141.0533
F-statistic
7.114283
Durbin-Watson stat
0.683880
Prob(F-statistic)
0.000000
Durbin-Watson stat
1.895118
Prob(F-statistic)
0.001134
5
Theo kết quả kiểm định
8.1.4. Cách khắc phục
(cid:132)Ta có nR2 = 13,68617 có xác suất
(p-value) = 0,001067 rất nhỏ → bác bỏ giả thuết H0, có nghĩa tồn tại tương quan bậc 2
X
X ρ
−
=
* t
t
t
*
X ρˆ 1 − và ước lượng phương trình ban đầu
Y −= t
Y ρ t
Y t
1 −
21
22
Phương pháp Durbin – Watson 2 bước để ước lượng ρ Ước lượng mô hình Yt = β1 + β2Xt + ut Phương trình sai phân dạng tổng quát Yt = β1(1-ρ)+ β2Xt - ρβ2Xt-1 + ρYt-1 + ut- ρut-1 (cid:131)Bước 1: Coi đây là phương trình hồi quy bội, hồi quy Yt theo Xt, Xt-1 và Yt-1, và coi giá trị ước lượng được đối )ˆ ( ρ= là ước lượng của ρ. Mặc với hệ số hồi quy của Yt-1 dù là ước lượng chệch nhưng ta có ước lượng vững của ρ. (cid:131)Bước 2: Sau khi có , hãy biến đổi và theo các biến đã được biến đổi ở trên.
Dependent Variable: ET Dependent Variable: RWAGES Method: Least Squares Method: Least Squares Date: 05/24/11 Time: 15:47 Date: 05/23/11 Time: 21:27 Sample(adjusted): 1960 2002 Sample: 1959 2002 Included observations: 43 after adjusting endpoints Included observations: 44 Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob. ETTRE 0.870811 0.071932 12.10595 0.0000 0.0000 PRODUCT 0.700589 0.017122 40.91818 0.0000 C 29.57497 1.460515 20.24968 C 0.027566 0.154792 0.178083 0.8595 87.70000 R-squared 0.975529 Mean dependent var R-squared 0.781396 Mean dependent var 0.102875 14.22579 Adjusted R-squared 0.974946 S.D. dependent var Adjusted R-squared 0.776065 S.D. dependent var 2.143243 4.505654 S.E. of regression 2.251719 Akaike info criterion S.E. of regression 1.014221 Akaike info criterion 2.911515 4.586754 Sum squared resid 212.9500 Schwarz criterion Sum squared resid 42.17445 Schwarz criterion 2.993431 1674.298 Log likelihood -97.12439 F-statistic Log likelihood -60.59757 F-statistic 146.5541 0.000000 Durbin-Watson stat 0.213684 Prob(F-statistic)
ρˆ
Ta tính được giá trị ước lượng của p là = 0.870811
6
Durbin-Watson stat 1.509948 Prob(F-statistic) 0.000000
(cid:132) Theo công thức ta có
.0
d
1(2
1ˆ
.0
89316
≈
1 −=
)ˆ ρρ
−=⇒−
=
213684 2
d 2 (cid:131)Dựa vào hồi qui phần dư. Ta tính được giá trị ước lượng của p là
= 0.870811
ρˆ (cid:131)Dựa vào phương pháp Durbin-Watson 2 = 0.829531 bước ước lượng của p là
ρˆ
26
ρˆ
Dependent Variable: RWAGES Method: Least Squares Date: 05/24/11 Time: 15:58 Sample(adjusted): 1960 2002 Included observations: 43 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. PRODUCT 0.421166 0.123316 3.415330 0.0015 PRODUCT(-1) -0.312189 0.150227 -2.078109 0.0443 RWAGES(-1) 0.829531 0.070515 11.76395 0.0000 C 6.426753 2.141585 3.000933 0.0047 R-squared 0.995699 Mean dependent var 88.36279 Adjusted R-squared 0.995369 S.D. dependent var 13.68950 S.E. of regression 0.931627 Akaike info criterion 2.784640 Sum squared resid 33.84923 Schwarz criterion 2.948472 Log likelihood -55.86975 F-statistic 3009.867 Prob(F-statistic) 1.613401 0.000000
Durbin-Watson stat Dựa vào kết quả trên HSHQ của RWAGES(-1) chính là ước lượng của p. vậy ta có = 0.829531
8.2. Chọn mô hình và kiểm định việc chọn mô
8.2. Chọn mô hình và kiểm định việc chọn mô
hình
hình (tt)
8.2.3. Kiểm định việc chọn mô hình a. Kiểm định sai lầm khi đưa các biến không cần thiết vào mô hình (kiểm định Wald) Xét mô hình:
Yi = β1 + β2X2i + β3X3i + β4X4i + ui
Tiến hành kiểm định giả thiết H0: β4 = 0. Khi đó ta dùng kiểm định Wald.
8.2.1. Chọn mô hình - Tiết kiệm - Tính đồng nhất - Tính thích hợp (R2) - Tính bền vững về mặt lý thuyết - Khả năng dự báo cao 8.2.2. Các sai lầm khi chọn mô hình - Bỏ sót biến thích hợp - Đưa vào mô hình những biến không phù hợp - Lựa chọn mô hình không chính xác
27
28
7
Wald Test: Equation: Untitled Test Statistic Value df Probability
F-statistic 2.176832 (2, 16) 0.1458 Chi-square 4.353665 2 0.1134
Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err.
a. Kiểm định 2 HSHQ (Kiểm định Wald). (cid:153)Xét các mô hình: (U) Yi = β1 + β2X2i + …+ βmXmi + βm+1X(m+1)i + … + βkXki + ui (R) Yi = β1 + β2X2i + …+ βmXmi + vi (U) là mô hình không giới hạn và (R) là mô hình giới hạn. Kiểm định giả thiết H0: βm+1 = … = βk = 0 (cid:131)Bước 1: Ước lượng (U) và (R), từ đó tính được RSSU và
RSS
RSS
(
m
)
−
RSSR thay vào công thức: F
=
C
− R RSS
( k
k )
U n
(
) −
U
[equation] view/coeffecient test/ wald coeffecient restriction
29
Bài tập kiểm định WALD
(cid:131)Bước 2: Với mức ý nghĩa α, tìm Fα(k-m,n-k) (cid:131)Bước 3: Nếu FC > Fα(k-m,n-k): Bác bỏ H0, tức là (U) không thừa biến. Khi sử dụng phần mềm ta căn cứ vào giá trị p-value. Nếu p-value>0.05→chấp nhận H0
C(2) 0.075807 0.276487 C(3) -0.096308 0.046829 Restrictions are linear in coefficients.
Theo kết quả trên
b. Kiểm định việc bỏ sót biến giải thích trong mô hình (kiểm định Reset của Ramsey)
Để kiểm định các biến bỏ sót, ta dùng kiểm định Reset của Ramsey, gồm các bước: (cid:131)Bước 1: Dùng OLS để ước lượng mô hình
Ta thấy P(F > 2.176832) = 0.1458 > 0.05 → chấp nhận giả thiết H0, HSHQ các biến Z và T = 0 có ý nghĩa, hay HSHQ các biến Z và T khác 0 không có ý nghĩa.
Yi = β1 + β2X2i + ui Từ đó ta tính
và R2
iYˆ
old
Biến Z và T không ảnh hưởng đến biến phụ thuộc Y. Vì vậy không nên đưa 2 biến này vào mô hình
2
X
+
=
+
... ++
(cid:131)Bước 2: dùng OLS để ước lượng mô hình ˆ 3 Y β 4
ββ + 2
ˆ Y β 3
2
1
Y i
i
v i
new
31
32
• Tính R2 • Kiểm định giả thiết H0: β3 = β4 =… = βk = 0
8
Ramsey RESET Test:
284.4035
Probability
0.000001
F-statistic
b. Kiểm định việc bỏ sót biến giải thích trong
45.62275
Probability
0.000000
Log likelihood ratio
mô hình (tt)
Test Equation:
Dependent Variable: Y
(cid:131)Bước 3: Tính
Method: Least Squares
F
=
Date: 05/17/11 Time: 11:10
m k
( 1(
2 new R
)
2 ) R old () n −
− 2 new
Sample: 1 10
Included observations: 10
Variable
Coefficient
Std. Error
t-Statistic
Prob.
X
476.5521
33.39086
14.27193
0.0000
C
2140.215
131.9893
16.21507
0.0000
FITTED^2
-0.091865
0.006192
-14.83680
0.0000
FITTED^3
0.000119
7.46E-06
15.89677
0.0000
R − n: số quan sát, k: số tham số trong mô hình mới; m: số biến đưa thêm vào. (cid:131)Bước 4: Nếu F > Fα(m,n-k): Bác bỏ H0, tức các hệ số β3,β4,…βk không đồng thời bằng 0, mô hình cũ đã bỏ sót biến.
R-squared
0.998339
Mean dependent var
276.1000
Adjusted R-squared
0.997509
S.D. dependent var
65.81363
[Equation] View/Stabilitry test/Ramsey reset test
S.E. of regression
3.284911
Akaike info criterion
5.505730
Sum squared resid
64.74382
Schwarz criterion
5.626764
Bài tập kiểm định Ramsey
33
Log likelihood
-23.52865
F-statistic
1202.220
Durbin-Watson stat
2.700212
Prob(F-statistic)
0.000000
8.3. Kiểm định giả thiết phân phối chuẩn của ui
Phân tích kết quả
(Kiểm định Jarque-Bera)
2
2
(cid:132) Ta nhận thấy F = 284.4035 và giá trị p tương ứng rất nhỏ (0.0000001) → bác bỏ giả thiết H0, tức là mô hình chọn ban đầu đã bỏ sót biến.
(
Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm định χ2, hay kiểm định Jarque-Bera: Kiểm định giả thiết H0: ui có phân phối chuẩn )3
K
n
JB
+
=
− 24
4
3
u
)
)
=
và
⎤ ⎥ ⎦ K ∑ − ( i SEn .
u 4 u
u 3 u
35
36
⎡ S ⎢ 6 ⎣ S ∑ − ( u i = SEn . Nếu JB > χ2 (2), Bác bỏ H0, ngược lại, chấp nhận H0 Bài tập kiểm định JB
9
Y X Mean 111.0000 170.0000
Phân tích kết quả
= 5,99
(cid:132) Theo kết quả, ta có JB = 0.624487 2χ )2( (cid:132) Với α = 5% thì (cid:132) Vì JB < 5.99 nên chưa có cơ sở bác bỏ H0 (cid:132) Hay chưa có kết luận về bộ dữ liệu
Median 112.5000 170.0000 Maximum 155.0000 260.0000 Minimum 65.00000 80.00000 Std. Dev. 31.42893 60.55301 Skewness -0.037462 0.000000 Kurtosis 1.814310 1.775758
Jarque-Bera 0.588115 0.624487 Probability 0.745234 0.731803
Sum 1110.000 1700.000 Sum Sq. Dev. 8890.000 33000.00
38
[Group] View/Description star/common sample
10
Observations 10 10