8.1. Tự tương quan (tương quan chuỗi)

CHƯƠNG VIII

8.1.1. Bản chất và nguyên nhân của tự tương quan Trong mô hình hồi quy tuyến tính cổ điển chúng ta giả định không có tương quan giữa các phần dư hay

Cov(uiuj) = 0 với mọi i, j. ⇒ Cov(ui,uj) ≠ 0: tự tương quan

TỰ TƯƠNG QUAN – CHỌN MÔ HÌNH – THẨM ĐỊNH VIỆC CHỌN MÔ HÌNH

1

2

* Nguyên nhân khách quan:

ui

ui

• Chuỗi có tính chất quán tính theo chu kỳ • Hiện tượng mạng nhện: dãy số cung về café năm nay phụ thuộc vào giá năm trước => ui không còn ngẫu nhiên nữa.

a) b)

t

t

• Dãy số có tính chất trễ: tiêu dùng ở thời kỳ này chẳng những phụ thuộc vào thu nhập kỳ này mà còn phụ thuộc vào tiêu dùng của kỳ trước nữa.

Cho thấy có một xu hướng tuyến tính xãy ra ở 2 mô hình trên

4

1

8.1.2. Hậu quả của tự tương quan

* Nguyên nhân chủ quan

• Nếu vẫn áp dụng OLS khi mô hình có hiện tượng tự

• Chọn dạng mô hình sai (thường xảy ra ở mô hình

tương quan thì sẽ có các hậu quả sau:

với chi phí biên)

• Đưa thiếu biến giải thích vào mô hình • Việc xử lý số liệu.(số liệu tháng = số liệu quý/3)

• - Các ước lượng không chệch nhưng đó là không phải là các hiệu quả vì đó không phải là các ước lượng có phương sai nhỏ nhất.

• Phương sai của các ước lượng là các ước lượng chệch

là ước lượng chệch của δ2

vì vậy các kiểm định t và F không còn hiệu quả. 2ˆδ • • R2 của mẫu là ước lượng chệch (dưới) của R2 tổng thể • Các dự báo về Y không chính xác

5

6

b. Dùng kiểm định d của Durbin – Watson

8.1.3. Cách phát hiện tự tương quan

2

(

1 )

i

d

=

Thống kê d của Durbin – Watson được định nghĩa như sau: e −− i 2 e i

a. Đồ thị Chúng ta có thể phát hiện hiện tượng tự tương quan bằng cách quan sát đồ thị phần dư của mô hình trên dữ liệu chuỗi thời gian.

Khi n đủ lớn thì

d ≈ 2(1-ρ)

et

1

ρ

=

trong đó:

e ∑ ∑ − ee i i ∑ 2 e i

t

7

8

do -1 ≤ ρ ≤ 1, nên khi: ρ = -1 => d = 4: tự tương quan hoàn hảo âm ρ = 0 => d = 2: không có tự tương quan ρ = 1 => d = 0: tự tương quan hoàn hảo dương

Phần dư phân bố một cách ngẫu nhiên xung quanh giá trị trung bình của nó.

2

b. Dùng kiểm định d của Durbin – Watson (tt)

* Chú ý:

Quyết định Bác bỏ

Nếu 0 < d < dL

• Trong thực tế khi tiến hành kiểm định Durbin – Watson, người ta thường áp dụng quy tắc kiểm định đơn giản sau:

dL ≤ d ≤ dU

• Nếu 1 < d < 3 thì kết luận mô hình không có tự

tương quan.

Giả thiết H0 Không có tự tương quan dương Không có tự tương quan dương Không có tự tương quan âm Không có tự tương quan âm

• Nếu 0 < d < 1 thì kết luận mô hình có tự tương

4-dL < d < 4 4-dU ≤ d ≤ 4-dL

quan dương.

Không quyết định Bác bỏ Không quyết định Không bác bỏ

dU < d < 4-dL

• Nếu 3 < d < 4 thì kết luận mô hình có tự tương

Không có tự tương quan âm hoặc dương

quan âm.

9

10

Trong đó dU và dL là các giá trị tra bảng giá trị d.

(cid:153)Nếu d thuộc vùng chưa quyết định, chúng ta sẽ sử dụng quy tắc kiểm định cải biên như sau: i) H0: ρ = 0; H1: ρ > 0. Nếu d < dU thì bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa α), nghĩa là có tự tương quan dương.

ii) H0: ρ = 0; H1: ρ < 0. Nếu d > 4 - dU thì bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa α), nghĩa là có tự tương quan âm.

Dependent Variable: RWAGES Method: Least Squares Date: 05/23/11 Time: 21:27 Sample: 1959 2002 Included observations: 44 Variable Coefficient Std. Error t-Statistic Prob. PRODUCT 0.700589 0.017122 40.91818 0.0000 C 29.57497 1.460515 20.24968 0.0000 R-squared 0.975529 Mean dependent var 87.70000 Adjusted R-squared 0.974946 S.D. dependent var 14.22579 S.E. of regression 2.251719 Akaike info criterion 4.505654 Sum squared resid 212.9500 Schwarz criterion 4.586754 Log likelihood -97.12439 F-statistic 1674.298

iii) H0: ρ = 0; H1: ρ ≠ 0. Nếu d 4 - dU thì bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa 2α), nghĩa là có tự tương quan (âm hoặc dương). Bài tập ước lượng bằng phương pháp Durbin Watson

3

Durbin-Watson stat 0.213684 Prob(F-statistic) 0.000000

4

3

Phân tích kết quả

2

1

0

I

-1

D S E R

-2

(cid:132) Kết quả hồi hồi qui cho thấy các hệ số hồi qui của biến tiền lương thực tế (RWAGES) và biến năng suất lao động (PRODUCT) có ý nghĩa thống kê

-3

(cid:132) R2 = 0.975529 rất lớn, nên mô hình rất phù

-4

hợp

-5 1940

1960

1980

2000

2020

NAM

(cid:132) Nhưng do dự liệu trên là dữ liệu chuỗi, nên có khả năng xảy ra hiện tượng tự tương quan. Ta cần kiểm định hiện tượng này

13

Nhìn vào đồ thị chúng ta nhận thấy phần dư phân bố có vẻ không ngẫu nhiên. Các phần dư nhận giá trị âm sau đó tăng dần rồi giảm và nhận giá trị âm trở lại

4

3

2

1

(cid:132) Từ kết quả hồi qui RWAGES theo PRODUCT

0

T E

-1

ta có giá trị thống kê Durbin-Watson d = 0.213684

-2

-3

-4

(cid:132) Với n = 45, α = 5%, k’ = 1( do có 1 biến độc lập). Tra bảng ta có được dL = 1.475, du = 1.566

-5

-5 -4

-3 -2

-1

0

1

2

3

4

ETTRE

(cid:132) Do d = 0.213684 < dL = 1.475 → bác bỏ H0, chấp nhận H1. Tức là có tương quan bậc nhất trong các phần dư.

16

Nhìn vào đồ thị, ta nhận thấy có khả năng xảy ra tương quan dương giữa ei và ei-1 khá rõ

4

c. Dùng kiểm định Breusch – Godfrey (BG) (tt)

c. Dùng kiểm định Breusch – Godfrey (BG)

Xét mô hình:

(8.1)

α(p): Bác bỏ H0, nghĩa là có tự

α(p): Chấp nhận H0, nghĩa là

Yt = β1 + β2Xt + ut ut = ρ1ut-1 + ρ2ut-2 + … + ρput-p + vt ta cần kiểm định giả thiết H0: ρ1 = ρ2 = … = ρρ = 0, có nghĩa là không tồn tại tự tương quan ở bất kỳ bậc nào trong số từ bậc 1 đến bậc p. Bước 1: Ước lượng (8.1) bằng OLS, tìm phần dư et Bước 2: Dùng OLS để ước lượng mô hình

Bước 3: với n đủ lớn, (n-p)R2 có phân phối xấp xỉ χ2(p). - Nếu (n-p)R2 > χ2 tương quan ít nhất ở một bậc nào đó. -Nếu (n-p)R2 ≤ χ2 không có tự tương quan. -Lệnh : [equation] view/redual test/resdual correlation LM test

et = β1 + β2Xt + ρ1et-1 + ρ2et-2 + ..+ ρpet-p + εt từ đây ta thu được R2.

Bài tập chương 8 : kiểm định BG

17

18

Breusch-Godfrey Serial Correlation LM Test:

Dependent Variable: TIEUDUNG

F-statistic

10.67142

Probability

0.000385

Method: Least Squares

Obs*R-squared

13.68617

Probability

0.001067

Date: 05/27/11 Time: 14:32

Sample: 1958 1988

Test Equation:

Included observations: 31

Dependent Variable: RESID

Variable

Coefficient

Std. Error

t-Statistic

Prob.

Method: Least Squares

Date: 05/27/11 Time: 14:35

THUNHAP

0.684186

0.008848

77.32386

0.0000

Presample missing value lagged residuals set to zero.

C

-161.5118

22.37920

-7.217049

0.0000

Variable

Coefficient

Std. Error

t-Statistic

Prob.

THUNHAP

0.000515

0.006855

0.075095

0.9407

R-squared

0.995173

Mean dependent var

1512.061

C

-0.717916

17.33445

-0.041416

0.9673

RESID(-1)

0.782273

0.192423

4.065390

0.0004

Adjusted R-squared

0.995007

S.D. dependent var

448.3518

RESID(-2)

-0.186092

0.193062

-0.963896

0.3437

S.E. of regression

31.68220

Akaike info criterion

9.811728

R-squared

0.441489

Mean dependent var

-3.30E-13

Sum squared resid

29109.09

Schwarz criterion

9.904243

Adjusted R-squared

0.379433

S.D. dependent var

31.14969

S.E. of regression

24.53851

Akaike info criterion

9.358279

Log likelihood

-150.0818

F-statistic

5978.979

Sum squared resid

16257.74

Schwarz criterion

9.543309

Log likelihood

-141.0533

F-statistic

7.114283

Durbin-Watson stat

0.683880

Prob(F-statistic)

0.000000

Durbin-Watson stat

1.895118

Prob(F-statistic)

0.001134

5

Theo kết quả kiểm định

8.1.4. Cách khắc phục

(cid:132)Ta có nR2 = 13,68617 có xác suất

(p-value) = 0,001067 rất nhỏ → bác bỏ giả thuết H0, có nghĩa tồn tại tương quan bậc 2

X

X ρ

=

* t

t

t

*

X ρˆ 1 − và ước lượng phương trình ban đầu

Y −= t

Y ρ t

Y t

1 −

21

22

Phương pháp Durbin – Watson 2 bước để ước lượng ρ Ước lượng mô hình Yt = β1 + β2Xt + ut Phương trình sai phân dạng tổng quát Yt = β1(1-ρ)+ β2Xt - ρβ2Xt-1 + ρYt-1 + ut- ρut-1 (cid:131)Bước 1: Coi đây là phương trình hồi quy bội, hồi quy Yt theo Xt, Xt-1 và Yt-1, và coi giá trị ước lượng được đối )ˆ ( ρ= là ước lượng của ρ. Mặc với hệ số hồi quy của Yt-1 dù là ước lượng chệch nhưng ta có ước lượng vững của ρ. (cid:131)Bước 2: Sau khi có , hãy biến đổi và theo các biến đã được biến đổi ở trên.

Dependent Variable: ET Dependent Variable: RWAGES Method: Least Squares Method: Least Squares Date: 05/24/11 Time: 15:47 Date: 05/23/11 Time: 21:27 Sample(adjusted): 1960 2002 Sample: 1959 2002 Included observations: 43 after adjusting endpoints Included observations: 44 Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob. ETTRE 0.870811 0.071932 12.10595 0.0000 0.0000 PRODUCT 0.700589 0.017122 40.91818 0.0000 C 29.57497 1.460515 20.24968 C 0.027566 0.154792 0.178083 0.8595 87.70000 R-squared 0.975529 Mean dependent var R-squared 0.781396 Mean dependent var 0.102875 14.22579 Adjusted R-squared 0.974946 S.D. dependent var Adjusted R-squared 0.776065 S.D. dependent var 2.143243 4.505654 S.E. of regression 2.251719 Akaike info criterion S.E. of regression 1.014221 Akaike info criterion 2.911515 4.586754 Sum squared resid 212.9500 Schwarz criterion Sum squared resid 42.17445 Schwarz criterion 2.993431 1674.298 Log likelihood -97.12439 F-statistic Log likelihood -60.59757 F-statistic 146.5541 0.000000 Durbin-Watson stat 0.213684 Prob(F-statistic)

ρˆ

Ta tính được giá trị ước lượng của p là = 0.870811

6

Durbin-Watson stat 1.509948 Prob(F-statistic) 0.000000

(cid:132) Theo công thức ta có

.0

d

1(2

.0

89316

1 −=

)ˆ ρρ

−=⇒−

=

213684 2

d 2 (cid:131)Dựa vào hồi qui phần dư. Ta tính được giá trị ước lượng của p là

= 0.870811

ρˆ (cid:131)Dựa vào phương pháp Durbin-Watson 2 = 0.829531 bước ước lượng của p là

ρˆ

26

ρˆ

Dependent Variable: RWAGES Method: Least Squares Date: 05/24/11 Time: 15:58 Sample(adjusted): 1960 2002 Included observations: 43 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. PRODUCT 0.421166 0.123316 3.415330 0.0015 PRODUCT(-1) -0.312189 0.150227 -2.078109 0.0443 RWAGES(-1) 0.829531 0.070515 11.76395 0.0000 C 6.426753 2.141585 3.000933 0.0047 R-squared 0.995699 Mean dependent var 88.36279 Adjusted R-squared 0.995369 S.D. dependent var 13.68950 S.E. of regression 0.931627 Akaike info criterion 2.784640 Sum squared resid 33.84923 Schwarz criterion 2.948472 Log likelihood -55.86975 F-statistic 3009.867 Prob(F-statistic) 1.613401 0.000000

Durbin-Watson stat Dựa vào kết quả trên HSHQ của RWAGES(-1) chính là ước lượng của p. vậy ta có = 0.829531

8.2. Chọn mô hình và kiểm định việc chọn mô

8.2. Chọn mô hình và kiểm định việc chọn mô

hình

hình (tt)

8.2.3. Kiểm định việc chọn mô hình a. Kiểm định sai lầm khi đưa các biến không cần thiết vào mô hình (kiểm định Wald) Xét mô hình:

Yi = β1 + β2X2i + β3X3i + β4X4i + ui

Tiến hành kiểm định giả thiết H0: β4 = 0. Khi đó ta dùng kiểm định Wald.

8.2.1. Chọn mô hình - Tiết kiệm - Tính đồng nhất - Tính thích hợp (R2) - Tính bền vững về mặt lý thuyết - Khả năng dự báo cao 8.2.2. Các sai lầm khi chọn mô hình - Bỏ sót biến thích hợp - Đưa vào mô hình những biến không phù hợp - Lựa chọn mô hình không chính xác

27

28

7

Wald Test: Equation: Untitled Test Statistic Value df Probability

F-statistic 2.176832 (2, 16) 0.1458 Chi-square 4.353665 2 0.1134

Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err.

a. Kiểm định 2 HSHQ (Kiểm định Wald). (cid:153)Xét các mô hình: (U) Yi = β1 + β2X2i + …+ βmXmi + βm+1X(m+1)i + … + βkXki + ui (R) Yi = β1 + β2X2i + …+ βmXmi + vi (U) là mô hình không giới hạn và (R) là mô hình giới hạn. Kiểm định giả thiết H0: βm+1 = … = βk = 0 (cid:131)Bước 1: Ước lượng (U) và (R), từ đó tính được RSSU và

RSS

RSS

(

m

)

RSSR thay vào công thức: F

=

C

− R RSS

( k

k )

U n

(

) −

U

[equation] view/coeffecient test/ wald coeffecient restriction

29

Bài tập kiểm định WALD

(cid:131)Bước 2: Với mức ý nghĩa α, tìm Fα(k-m,n-k) (cid:131)Bước 3: Nếu FC > Fα(k-m,n-k): Bác bỏ H0, tức là (U) không thừa biến. Khi sử dụng phần mềm ta căn cứ vào giá trị p-value. Nếu p-value>0.05→chấp nhận H0

C(2) 0.075807 0.276487 C(3) -0.096308 0.046829 Restrictions are linear in coefficients.

Theo kết quả trên

b. Kiểm định việc bỏ sót biến giải thích trong mô hình (kiểm định Reset của Ramsey)

Để kiểm định các biến bỏ sót, ta dùng kiểm định Reset của Ramsey, gồm các bước: (cid:131)Bước 1: Dùng OLS để ước lượng mô hình

Ta thấy P(F > 2.176832) = 0.1458 > 0.05 → chấp nhận giả thiết H0, HSHQ các biến Z và T = 0 có ý nghĩa, hay HSHQ các biến Z và T khác 0 không có ý nghĩa.

Yi = β1 + β2X2i + ui Từ đó ta tính

và R2

iYˆ

old

Biến Z và T không ảnh hưởng đến biến phụ thuộc Y. Vì vậy không nên đưa 2 biến này vào mô hình

2

X

+

=

+

... ++

(cid:131)Bước 2: dùng OLS để ước lượng mô hình ˆ 3 Y β 4

ββ + 2

ˆ Y β 3

2

1

Y i

i

v i

new

31

32

• Tính R2 • Kiểm định giả thiết H0: β3 = β4 =… = βk = 0

8

Ramsey RESET Test:

284.4035

Probability

0.000001

F-statistic

b. Kiểm định việc bỏ sót biến giải thích trong

45.62275

Probability

0.000000

Log likelihood ratio

mô hình (tt)

Test Equation:

Dependent Variable: Y

(cid:131)Bước 3: Tính

Method: Least Squares

F

=

Date: 05/17/11 Time: 11:10

m k

( 1(

2 new R

)

2 ) R old () n −

− 2 new

Sample: 1 10

Included observations: 10

Variable

Coefficient

Std. Error

t-Statistic

Prob.

X

476.5521

33.39086

14.27193

0.0000

C

2140.215

131.9893

16.21507

0.0000

FITTED^2

-0.091865

0.006192

-14.83680

0.0000

FITTED^3

0.000119

7.46E-06

15.89677

0.0000

R − n: số quan sát, k: số tham số trong mô hình mới; m: số biến đưa thêm vào. (cid:131)Bước 4: Nếu F > Fα(m,n-k): Bác bỏ H0, tức các hệ số β3,β4,…βk không đồng thời bằng 0, mô hình cũ đã bỏ sót biến.

R-squared

0.998339

Mean dependent var

276.1000

Adjusted R-squared

0.997509

S.D. dependent var

65.81363

[Equation] View/Stabilitry test/Ramsey reset test

S.E. of regression

3.284911

Akaike info criterion

5.505730

Sum squared resid

64.74382

Schwarz criterion

5.626764

Bài tập kiểm định Ramsey

33

Log likelihood

-23.52865

F-statistic

1202.220

Durbin-Watson stat

2.700212

Prob(F-statistic)

0.000000

8.3. Kiểm định giả thiết phân phối chuẩn của ui

Phân tích kết quả

(Kiểm định Jarque-Bera)

2

2

(cid:132) Ta nhận thấy F = 284.4035 và giá trị p tương ứng rất nhỏ (0.0000001) → bác bỏ giả thiết H0, tức là mô hình chọn ban đầu đã bỏ sót biến.

(

Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm định χ2, hay kiểm định Jarque-Bera: Kiểm định giả thiết H0: ui có phân phối chuẩn )3

K

n

JB

+

=

− 24

4

3

u

)

)

=

⎤ ⎥ ⎦ K ∑ − ( i SEn .

u 4 u

u 3 u

35

36

⎡ S ⎢ 6 ⎣ S ∑ − ( u i = SEn . Nếu JB > χ2 (2), Bác bỏ H0, ngược lại, chấp nhận H0 Bài tập kiểm định JB

9

Y X Mean 111.0000 170.0000

Phân tích kết quả

= 5,99

(cid:132) Theo kết quả, ta có JB = 0.624487 2χ )2( (cid:132) Với α = 5% thì (cid:132) Vì JB < 5.99 nên chưa có cơ sở bác bỏ H0 (cid:132) Hay chưa có kết luận về bộ dữ liệu

Median 112.5000 170.0000 Maximum 155.0000 260.0000 Minimum 65.00000 80.00000 Std. Dev. 31.42893 60.55301 Skewness -0.037462 0.000000 Kurtosis 1.814310 1.775758

Jarque-Bera 0.588115 0.624487 Probability 0.745234 0.731803

Sum 1110.000 1700.000 Sum Sq. Dev. 8890.000 33000.00

38

[Group] View/Description star/common sample

10

Observations 10 10