9/20/2013

CHƢƠNG 5

KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH

1

CHƢƠNG 5: KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH

 Khi giả thiết 1 → 4 thỏa mãn thì các ước lượng OLS là các

Chương 1, 2, 3 cho thấy:

 Khi giả thiết 5 thỏa mãn thì các suy diễn thống kê là có giá trị.

ước lượng BLUE.

 Nếu một trong các giả thiết không được thỏa mãn?

 Khi đó thì làm thế nào để thu được ước lượng tốt nhất, và các

Vậy:

suy diến thống kê đáng tin cây?

2

=> Nội dung chương 5.

1

9/20/2013

NỘI DUNG CHƢƠNG 5

I. Kỳ vọng của sai số ngẫu nhiên khác không

II. Phương sai sai số thay đổi

III. Sai số ngẫu nhiên không tuân theo quy luật chuẩn

IV. Vấn đề đa cộng tuyến

V. Mô hình chứa biến không thích hợp

3

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

 Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên với điều kiện X

bằng 0.

E(ui| Xi) = 0

 Phụ lục 1.2 (trang 77) cho thấy rằng nếu giả thiết 2 thỏa mãn

thì sẽ có:

 E(u) = 0

(5.1)

 cov(X, u) = 0

(5.2)

 => Nếu (5.1) hoặc (5.2) không thỏa mãn thì giả thiết 2 sẽ

4

không còn thỏa mãn.

2

9/20/2013

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

Minh họa giả thiết 2:

Y

• •

u1: E(u1|X1) =0

ui: E(ui|Xi) =0

X

Xi

Xn

X1

Trung bình sai số ngẫu nhiên tại mỗi giá trị Xi: E(u/X=Xi)=0 5

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

1. Nguyên nhân của kỳ vọng sai số ngẫu nhiên khác

không

 Mô hình thiếu biến quan trọng

 Dạng hàm sai

 Tính tác động đồng thời của số liệu

 Sai số đo lường của các biến độc lập

6

3

9/20/2013

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

2. Hậu quả của kỳ vọng sai số ngẫu nhiên khác không

 Ước lượng OLS sẽ là ước lượng chệch

 Các suy diễn thống kê không còn đáng tin cậy

 Lượng chệch của các ước lượng OLS:

𝐸 𝛽 𝑗 − 𝛽𝑗

𝑐𝑜𝑣(𝑋𝑗,𝑢) 𝑣𝑎𝑟(𝑋𝑗)

𝐸 𝛽 𝑗 − 𝛽𝑗 = Và lim 𝑛→∞

=> Lượng chệch không mất đi kể cả khi kích thước mẫu lớn vô 7 cùng

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

 Lượng chệch khi mô hình thiếu biến:

• Mô hình phù hợp: Y = β1 + β2X2 + β3X3 + u1

• Mô hình sử dụng: Y = α1 + α2X2 + u2

• ⇒ 𝑬 𝜶 𝟐 = 𝜷𝟐 + 𝜷𝟑𝒃

𝟐 với 𝑏 2 là hệ số góc ước lượng của mô

• => Lượng chệch 𝜷𝟑𝒃

𝟐 => Chiều của lượng chệch khi mô hình

hình: X3 = b1 + b2X2 + v

thiếu biến:

r23 > 0 + r23<0 -

8

- +

4

9/20/2013

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

3. Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên

 Xét mô hình gốc:

a) Mô hình bỏ sót biến quan trọng

 Liệu mô hình (5.3) có bỏ sót biến Z hay không? (có số liệu về

(5.3)

 => Ước lượng mô hình:

biến Z)

 => Kiểm định cặp giả thuyết:

(5.4)

H0: αk+1 = 0

H1: αk+1 ≠ 0

9

=> Thực hiện bằng kiểm định T hoặc kiểm định F

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

b) Mô hình có dạng hàm sai

 Kiểm định Ramsey:

 Xét mô hình gốc: Yi = β1 + β2 Xi + β3 X3i + ui

 Tư tưởng của kiểm định Ramsey: sử dụng dạng mũ của

giá trị ước lượng của biến phụ thuộc,

,

để thay thế cho tổ hợp của các biến dạng mũ của các

biến độc lập.

10

5

9/20/2013

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

 Các bước thực hiện kiểm định Ramsey:

 B1: Ước lượng mô hình gốc =>

 B2: Ước lượng mô hình hồi quy phụ:

Việc đưa thành phần dạng lũy thừa của vào mô hình hồi quy

mới không bị hạn chế, nhưng thông thường dừng ở lũy thừa

bậc 2 hoặc bậc 3.

11

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

 B3: Kiểm định cặp giả thuyết:

Hay:

H0: Mô hình gốc có dạng hàm đúng - không thiếu biến

H1: Mô hình gốc có dạng hàm sai - thiếu biến

=> Thực hiện bằng kiểm định F.

12

6

9/20/2013

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

 Một số kiểm định khác

 Kiểm định Davidson – Mac Kinnon (kiểm định J)

 Kiểm định sử dụng hàm gộp

(Giáo trình trang 212 – 214)

13

I. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

4. Một số biện pháp khắc phục

 Thêm biến Z bị thiếu vào mô hình (nếu có số liệu của Z)

 Xem xét các mô hình thay thế; hoặc thêm các biến dạng

bình phương, lập phương của các biến độc lập đã có trong

mô hình.

 Thiếu biến không quan sát được: sử dụng biến đại diện;

hoặc sử dụng phương pháp biến công cụ.

14

7

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

 Giả thiết 3: Phương sai của sai số ngẫu nhiên là bằng nhau

= 𝜎2

𝑉𝑎𝑟 𝑢 𝑋𝑖

tại mọi giá trị Xi

 Minh họa:

Phân phối của u tại X2

Phân phối của u tại Xn

f(u|X)

Phân phối của u tại X1

Y

15

X

X1

X2

Xn

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

 Giả thiết 3 bị vi phạm, tức là sai số ngẫu nhiên u có phương

sai thay đổi:

2

𝑉𝑎𝑟 𝑢 𝑋𝑖

= 𝜎𝑖

 Minh họa:

Phân phối của u tại X2

f(u|X)

Phân phối của u tại Xn

Phân phối của u tại X1

Y

16

X

X1

X2

Xn

8

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

1. Nguyên nhân của phƣơng sai sai số (PSSS) thay đổi

 Do bản chất của số liệu

 Do mô hình thiếu biến quan trọng hoặc dạng hàm sai

17

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

2. Hậu quả của phƣơng sai sai số thay đổi

 Các ước lượng OLS cho các hệ số vẫn là các ƣớc lƣợng

không chệch:

 Các ước lượng hệ số không còn là ước lượng tốt nhất nữa

bị ước lượng chệch, do đó các khoảng tin cậy và

kết luận kiểm định về các giả thuyết thống kê đối với hệ số

hồi quy là không còn giá trị (không chính xác).

18

9

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

3. Phát hiện PSSS thay đổi

 Xét mô hình:

Yi = β1 + β2 X2i + β3 X3i + … + βk Xki + ui

 Do giả thiết 2:

E(u/X2i,…,Xki) = 0

19

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

Các biện pháp phát hiện PSSS thay đổi:

 Sử dụng đồ thị phần dư

 Kiểm định Breusch – Pagan (giáo trình)

 Kiểm định White

 Kiểm định dựa trên biến phụ thuộc

 Một số kiểm định khác: Park, Glejer (giáo trình)

20

10

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

 Kiểm định White

 Với n đủ lớn thì phương sai của các hệ số ước lượng là tiệm cận

với phương sai đúng nếu giả thiết 3’ được thỏa mãn.

 Giả thiết 3': không tương quan với các biến độc lập, bình

phương của các biến độc lập, và tích chéo của các biến độc

lập.

 => Xét xem liệu có tương quan với các biến độc lập và

tích các biến độc hay không nhằm đánh giá mô hình gốc có

21

PSSS thay đổi hay đồng đều.

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

Các bƣớc thực hiện kiểm định White:

(5.5) Xét mô hình gốc: Yi = β1 + β2 X2i + β3 X3i + ui

Bƣớc 1: Ước lượng mô hình hồi quy gốc => phần dư ei

(**)

Bƣớc 2: Ước lượng mô hình hồi quy phụ:

Bƣớc 3: Xét cặp giả thuyết:

hay H0 : Mô hình gốc có PSSS đồng đều

22

H1 : Mô hình gốc có PSSS thay đổi

11

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

Có 2 cách kiểm định có thể thực hiện:

 Kiểm định F:

Tính

Nếu Fqs > Fα (k(**) -1; n – k(**) ) thì bác bỏ H0; chấp nhận H1

 Kiểm định X2 :

Tính:

23

Nếu

thì bác bỏ H0 ; chấp nhận H1

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

 Kiểm định trên được gọi là kiểm định White có tích chéo do

Lưu ý:

trong mô hình (**) có chứa thành phần tích chéo giữa các biến

 Trong nhiều trường hợp có thể bỏ đi số hạng chứa tích chéo

=> Kiểm định White không tích chéo.

 Mô hình (**) nhất định phải có hệ số chặn.

 Dạng thu gọn của kiểm định White là có thể hồi quy

độc lập ( X2i * X3i )

theo

từng thành phần X2i ; X3i ; riêng biệt mà không cần kết 24

hợp trong một phương trình.

12

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

 Kiểm định dựa trên biến phụ thuộc

Thay vì xét hàm hồi quy phụ (**) ta xét hàm hồi quy phụ sau:

(***)

và kiểm định cặp giả thuyết:

H0:

H1:

25

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

4. Khắc phục phƣơng sai sai số thay đổi

 PSSS thay đổi có thể do mô hình thiếu biến hoặc dạng

hàm sai => xem xét xem liệu mô hình có gặp phải hai

vấn đề này không?

 Phương pháp bình phương bé nhất tổng quát (GLS –

generalized least squares)

 Ước lượng sai số chuẩn vững (robut standard error)

26

13

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

a) Phương pháp bình phương bé nhất tổng quát

 Bước 1: Nhận biết được dạng thay đổi của phương sai sai số

 Bước 2: Biến đổi tương đương để đưa mô hình gốc về một mô

Các bước thực hiện:

hình mới mà sai số ngẫu nhiên trong mô hình mới này có phương

(Tổng quát: nếu

thì chia cả hai vế của mô hình gốc cho Ki)

 Bước 3: Sử dụng phương pháp OLS để ước lượng mô hình mới.

 Bước 4: Từ các hệ số ước lượng của mô hình mới suy ra các hệ số

sai sai số không đổi

27

ước lượng của mô hình gốc

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

 Giả sử:

 => Chia cả hai vế của (5.6) cho X2i:

Ví dụ: Xét mô hình: (5.6)

(5.7)

hay:

(5.8)

 Phương sai sai số ngẫu nhiên của mô hình mới:

với:

28

14

9/20/2013

II. PHƢƠNG SAI SAI SỐ THAY ĐỔI

b) Ước lượng sai số chuẩn

 Tư tưởng: vẫn sử dụng các hệ số ước lượng từ phương pháp OLS, tuy

nhiên phương sai các hệ số ước lượng thì được tính toán lại mà không

sử dụng đến giả thiết phương sai sai số không đổi.

 Ví dụ: với mô hình hồi quy hai biến, ta có:

(5.9)

=> Thay công thức (5.9) bởi công thức sau:

(5.10)

29

=> Sai số chuẩn vững bằng căn bậc hai của (5.10). Khi n đủ lớn thì

(5.10) tiệm cận về giá trị đúng (5.9)

III. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN (*)

1. Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật

 Các ước lượng OLS vẫn là các ước lượng BLUE

 Các thống kê T và F không tuân theo quy luật Student và quy luật

chuẩn

 Nếu kích thước mẫu nhỏ thì các suy diễn thống kê không

Fisher tương ứng. Khi đó:

 Với mẫu kích thước lớn thì các suy diễn thống kê vẫn có giá

đáng tin cậy.

30

trị.

15

9/20/2013

III. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN (*)

2. Phát hiện sai số ngẫu nhiên không tuân theo quy

luật chuẩn

(1) Xem xét đồ thị phần dư

(2) Kiểm định Jacque – Bera (JB)

31

III. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN (*)

Kiểm định Jacque – Bera (JB):

Kiểm định:

H0: u tuân theo phân phối chuẩn

H1: u không tuân theo phân phối chuẩn

 B1: Ước lượng mô hình gốc => ei

 B2: Tính thống kê kiểm định: 𝐽𝐵 = 𝑛(

+

)

𝑆2 6

𝐾−3 2 24

Với S là hệ số bất đối xứng (Skewness); K là hệ số nhọn (Kurtosis) của chuỗi phần dư:

32

 B3: Nếu JB > χ2

α(2) thì bác bỏ H0; chấp nhận H1

Ngược lại, chưa đủ cơ sở bác bỏ H0

16

9/20/2013

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

1. Khái niệm đa cộng tuyến trong mô hình hồi quy

 Khi giữa các biến độc lập không có quan hệ đa cộng

tuyến hoàn hảo nhưng có mối liên hệ tuyến tính khá chặt,

ta nói rằng mô hình có hiện tượng đa cộng tuyến

(multicollinearity).

 Hiện tượng đa cộng tuyến trong mô hình hồi quy thể hiện

mối quan hệ tuyến tính giữa các biến độc lập trong mô

hình hồi quy chứ không quan tâm đến biến phụ thuộc

33

trong mô hình.

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

 Xét mô hình hồi quy bội:

(5.11)

 Hồi quy biến độc lập Xj theo các biến độc lập còn lại:

(*)

 Nếu

: Có ĐCT hoàn hảo giữa các biến X2 ; X3 ; …;

Xk

 Nếu

: Có ĐCT cao (ĐCT không hoàn hảo) giữa các

34

biến X2 ; X3 ; …; Xk

17

9/20/2013

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

2. Nguyên nhân của đa cộng tuyến

 Do bản chất mối quan hệ giữa các biến số

 Do mô hình có dạng đa thức

 Do mẫu không mang tính đại diện

35

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

3. Hậu quả của đa cộng tuyến

 ĐCT hoàn hảo: không ước lượng được mô hình

 ĐCT cao (ĐCT không hoàn hảo): không vi phạm giả thiết

nào của định lý Gauss – Markov nên không ảnh hưởng gì

đến tính “tốt nhất” của các ước lượng OLS.

=> Nhƣ vậy mô hình có ĐCT cao thì các ƣớc lƣợng thu

đƣợc vẫn là các ƣớc lƣợng tuyến tính, không chệch và tốt

nhất (có phƣơng sai nhỏ nhất).

36

18

9/20/2013

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

Hậu quả của ĐCT cao trong mô hình hồi quy:

 Khoảng tin cậy của βj rộng, nghĩa là ước lượng trở nên

kém chính xác.

 Hệ số ước lượng dễ mất ý nghĩa thống kê.

 Dấu của hệ số ước lượng của Xj có thể ngược so với kỳ

vọng.

 Một sự thay đổi dù bé trong mẫu cũng có thể gây ra một sự

thay đổi khá lớn trong kết quả ước lượng (do

lớn)

37

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

4. Phát hiện đa cộng tuyến

(1) Xem xét hệ số xác định của các mô hình hồi quy phụ

.

(j = 2,3,.., k) là hệ số xác định của mô hình hồi quy

phụ Xj theo các biến độc lập còn lại.

 Nếu lớn thì có thể mô hình gốc có hiện tượng đa

cộng tuyến cao.

38

19

9/20/2013

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

(2) Xem xét hệ số phóng đại phƣơng sai (VIF- variance

inflation factor):

 Quy tắc chung: nếu VIF > = 10 thì đó là dấu hiệu có

ĐCT cao

39

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

(3) Tính hệ số tƣơng quan cặp giữa các biến độc lập Xj

 Nếu hệ số tương quan cặp giữa hai biến độc lập nào đó

lớn (có trị tuyệt đối lớn hơn 0.8) thì có thể xem như mô

hình có ĐCT cao.

 Tuy nhiên, hệ số tương quan cặp giữa các biến độc lập

không cao không có nghĩa là không có ĐCT.

40

20

9/20/2013

IV. VẤN ĐỀ ĐA CỘNG TUYẾN

5. Một số biện pháp khắc phục

 Gia tăng kích thước mẫu (tăng n)

 Sử dụng thông tin tiên nghiệm

 Sử dụng kỹ thuật phân tích nhân tố để tách lọc thông tin

từ các biến độc lập.

 Bỏ bớt biến

Lưu ý: Trong mô hình hồi quy luôn luôn xảy ra ĐCT, điều đáng

quan tâm là ĐCT ở mức cao hay thấp. Nếu hậu quả của ĐCT đối

với mô hình hồi quy là không quá nghiêm trọng thì ta chưa

41

cần quan tâm tới vấn đề khắc phục.

V. MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP

1. Hậu quả của việc chứa biến không thích hợp

 Các ước lượng OLS vẫn là các ước lượng không chệch

 Phương sai các hệ số ước lượng sẽ lớn. Do đó:

 Khoảng tin cậy cho các hệ số hồi quy sẽ trở nên rộng hơn

 Các tỷ số t trở nên bé hơn và dẫn đến làm mất ý nghĩa thống

kê của các hệ số ước lượng.

42

21

9/20/2013

V. MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP

2. Phát hiện biến không thích hợp

 Để phát hiện một biến là có thích hợp hay không: sử

dụng kiểm định t để kiểm định về sự bằng 0 của hệ số

của biến này.

 Để phát hiện hai hay nhiều biến là có thích hợp hay

không: sử dụng kiểm định F – kiểm định nhiều ràng

buộc

43

22