CƠ SỞ ĐÁNH GIÁ MÔ HÌNH

CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OLS

GIẢ THIẾT

NỘI DUNG

KHUYẾT TẬT

MỤC

5.1 và 5.5

(

,

,...,

X

XXUE / 3 i

i 2

i

ki 0)

Mô hình đinh dạng đúng

Mô hình định dạng sai (chỉ định sai)

cov(

ji UX ,

i 0)

5.2

Phương sai sai số đồng đều

Phương sai sai số thay đổi

var(

/

,

,...,

X

XXU 2 i

i

i 3

2 ki )

Đa cộng tuyến

5.4

 ...

 0

X 33 i

 k

X ki

Các biến độc lập không có tương quan tuyến tính

 X  22 i 1

5.3

Sai số ngẫu nhiên phân phối chuẩn

Sai số ngẫu nhiên không phân phối chuẩn

)

2NUi ,0(~

1

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

5.1.1. NGUYÊN NHÂN

5.1.2. HẬU QUẢ

5.1.3. PHÁT HIỆN

5.1.4. KHẮC PHỤC

2

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

NGUYÊN NHÂN

3

Nguyên nhân 1: Mô hình thiếu biến quan trọng

X

... 

X

... 

X

 . Z

-Biến Z có tác động đến Y

1

2

i

Y i

 3

3

i

 m

mi

 k

ki

u i

i

X

X

... 

X

... 

X

Mô hình đúng:    X 2

Y i

1

2

i

 3

3

i

 m

mi

 k

ki

v i

Mô hình sai:    2

cov(

 0)



cov(

 0),

ZX , 2

vX 2

- Biến Z có tương quan với ít nhất một biến độc lập

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

NGUYÊN NHÂN

4

X

... 

1

  2

u i

ki

 X 2 3 i XXUE /

 (

3

... 

,..., X

,

... 

 Y X ...  3 i k i , ,..., nếu thỏa mãn: thì sẽ có: i i 2   X 1 22 i

X  mi m X ki 0) X 33 i

i ,..., ) X ki

/( XXYE 3 i

 X m

mi

mi

2 i

 k

X ki

Nguyên nhân 2: Dạng hàm sai

...

/( XYE i 2 i

,..., ) X ki

 X  22 i 1

X 33 i

 X ki

k

2  uX 2 i i

)

)

... 

/( XYE 2 i i

,..., ) X ki

 . log( X  2 2 i 1

 . log( X 3 3 i

 . log( ) X ki k

u i

nhưng các phương trình sau lại không thỏa mãn:

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

NGUYÊN NHÂN

5

Nguyên nhân 3: Tính tác động đồng thời của số liệu

Nguyên nhân 4: Sai số do đo lường số liệu

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

HẬU QUẢ

6

- Ước lượng OLS sẽ là ước lượng chệch

- Các suy diễn thống kê không còn đáng tin cậy

* Xem thêm giáo trình (trang 205  209)

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

PHÁT HIỆN

7

-

,ˆ Y

RSS

)

Kiểm định Ramsey

1 R (

2 1

X

Y i

1   2

i

u i

RSS

)

-

Bước 1: Hồi quy mô hình ban đầu thu được

2 R (

2 2

2

v i

ˆ X Y 1 2 i 1 i i

 Y i Mở rộng:

2

m

1

... 

Y i

1

i

ˆ Y im

v i

ˆ  Y X 2 1 i i

Bước 2: Hồi quy mô hình phụ thu được

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

PHÁT HIỆN

8

-

0

 : ...  m

1

0

2  : ...  m

2 1

Kiểm định Ramsey

Bước 3: Kiểm định cặp giả thiết sau: H  H0: MH (1) không thiếu biến 0  H1: MH (1) thiếu biến H  1

2

2

1

F

F

2

RSS ( RSS

 RSS m /) 2 /(  n ) mk

2

2

( 

R R

2  R m /) 1 /()  mkn

)

1(

+ Tiêu chuẩn KĐ



,

:

+ Miền bác bỏ với mức ý nghĩa α

mknmFFFW 

5.2. PHƯƠƯƠNG SAI C 5.2. PH

A SAI SỐỐ THAY Đ

THAY ĐỔỔII

NG SAI CỦỦA SAI S (HETEROSCEDASTICITY) (HETEROSCEDASTICITY)

5.2.1. Bản chất của hiện tượng PSSS thay đổi

5.2.2. Hậu quả của hiện tượng PSSS thay đổi

5.2.3. Phương pháp phát hiện PSSS thay đổi

5.2.4. Khắc phục hiện tượng PSSS thay đổi

9

BBảản n chchấấtt ccủủaa PSSS

PSSS thay

thay đđổổii

 Xét mô hình hồi quy 2 biến:

X

U

(1)

Y i

   2

1

2

i

i

 Giả thiết: Phương sai của sai số ngẫu nhiên đồng

đều, không thay đổi hay thuần nhất

Var U (

)

2  ( i

)

i

 Trong thực tế PSSS có thể thay đổi  Var U (

Var U i )( (

)

j

)

i

j

)

Var U (

)(

 i

)

Var Y ( i

i

 Ta có:

10

5.2.1. Nguyên nhânnhân ccủủaa hihiệệnn ttượượngng 5.2.1. Nguyên

 Do bản chất của các hiện tượng kinh tế:

- Số liệu theo không gian có quy mô khác nhau

Như quan sát các doanh nghiệp có quy mô quá lớn - quá nhỏ

- Số liệu theo thời gian qua các giai đoạn có mức biến động khác nhau

Như giai đoạn kinh tế ổn định - giai đoạn khủng hoảng

- Mối quan hệ sẵn có hiện tượng PSSS thay đổi

Như mối quan hệ của thu nhập – chi tiêu, chỉ số thị trường

chứng khoán

11

Nguyên nhânnhân ccủủaa hihiệệnn ttượượngng Nguyên

tượng kinh tế

 Do số liệu không phản ảnh đúng bản chất của hiện

hoàn thiện nên sai số ngày càng ít

 Do kỹ thuật thu thập, xử lý dữ liệu ngày càng được

 Do hành vi của con người có sự tiếp thu từ quá khứ

12

 Do định dạng không đúng dạng hàm của mô hình.

5.2.2. HHậậuu ququảả ccủủaa hihiệệnn ttượượngng PSSS 5.2.2.

PSSS thay

thay đđổổii

 Các ước lượng OLS là các ước lượng tuyến tính không

chệch và vững song không còn hiệu quả nhất

Var

)

ˆ(  2

 Các ước lượng của phương sai bị chệch 2  i n

2 x i

i

 1

Var U (

)

2   

(

  i )

Var

)

i

2 i

ˆ  ( 2

2  n

2 x i

i

 1

13

II. II. HHậậuu ququảả ccủủaa hihiệệnn ttượượngng PSSS

PSSS thay

thay đđổổii

)

...

)

)

)

Cov

ˆ( ) 

2 

(

T X X

)

... ...

ˆ ˆ   Cov , ( 1 k ˆ ˆ   Cov , ( 2 k ...

)

...

)

ˆ  Var ) ( 1 ˆ ˆ   Cov ) , ( 2 1 ... ˆ ˆ   Cov ) , ( k 1

ˆ ˆ   ( Cov , 2 1 ˆ  Var ( 2 ... ˆ ˆ   ( Cov , k 2

ˆ  Var ( k

      

      

 Khoảng tin cậy của các hệ số hồi quy sẽ rộng hơn, các kiểm định T, F mất hiệu lực và các dự báo sẽ không còn chính xác.

14

55..22..33.Ph.Phươương ng pháppháp phátphát hihiệệnn PSSS

PSSS thay

thay đđổổii

Nhóm phương pháp phân tích định tính  Cách chuẩn đoán dựa vào thông tin tiên nghiệm về hiện tượng kinh tế (xem xét mối quan hệ các biến)

 Các số liệu chéo thường chứa đựng hiện tượng

PSSS thay đổi

 Dựa vào thông tin trên mẫu (sử dụng phần dư

ei

15

Quan sát đồ thị của các phần dư

ˆ iY

- Bước 1: Hồi quy mô hình (1) tìm được các phần dư ei - Bước 2: Vẽ đồ thị của các phân dư ei theo Xi, Yi, hoặc theo các quan sát - Bước 3: Căn cứ vào các đồ thị để chuẩn đoán về hiện tượng PSSS thay đổi

16

Nhóm phương pháp phân tích định lượng • Ý tưởng chung:

Var U (

)

)

i

2 i2  ( i

Ui  ei : |ei| e2

i

• Xem xét mối liên hệ của Ui với các biến trong mô hình: phương sai sai số thay đổi do yếu tố nào gây ra

17

(3)

U

X

X

   2

 3

Y i

i 3

1

2

i

i

 Kiểm định White - Xét mô hình:  - Thủ tục kiểm định: + Bước 1: Hồi quy mô hình (3) tìm được các phần dư ei

X

X

X

X

(4)

e i

   2

1

2

i

 3

3

i

 4

2 i 2

 5

2 i 3

 6

X X 2 i

3

i

v i

+ Bước 2: Hồi quy mô hình sau

Trong đó: vi là SSNN thoả mãn mọi giả thiết của OLS

0

+ Bước 3: Kiểm định cặp giả thiết   ...

:

 6 

j

0(

2,...,6)

H 0 H 1

 : 2   j

  

18

PSSS trong MH (3) đồng đều PSSS trong MH (3) thay đổi

 Kiểm định White

2

:

m (

W 

* Tiêu chuẩn kiểm định:

 2 2    

 )

Miền bác bỏ mức ý nghĩa α:

(cid:0)

F

F k (

1,

 n k

)

)

2  1) R k /( 2  n k  )/( R (1 Miền bác bỏ mức ý nghĩa α:

 F F F k (

:

1,

 n k

 )

W 

* Tiêu chuẩn kiểm định:

19

Với m là số hệ số góc của MH (4),k=m+1 Sử dụng phương pháp mức xác suất p-value

X

X

U

(3)

   2

 3

i 3

1

2

i

i

 Kiểm định White - Xét mô hình:   Y i Hàm hồi quy phụ của kiểm định có các dạng: * Dạng đầy đủ có tích chéo (cross):

X

X

X

(4)

   2

 4

 5

 3

1

2

i

2 i 3

2 i 2

X X 2 i

3

i

v i

 X e i 3 i 6 * Dạng đầy đủ không có tích chéo (no cross):

.

.

.

.

2 ie

1

  2

 3

 4

 5

2

i

2 2

i

3 i

2 3 i

i

X

X

X

v

X * Dạng rút gọn:

i

3 i

i

e

.   . X 3 1 2

2  vX 3 i

i

i

e

  .  .  X 1 2 3 i 2

2  vX 2 i

20

- Trong mô hình hồi quy phụ bắt buộc phải có hệ số chặn và có thể không có các số hạng chéo nhưng cũng có thể có bậc cao hơn.

5.2.4. KhKhắắcc phphụụcc PSSS 5.2.4.

PSSS thay

thay đđổổii

2

 X U

(6)

1. Trường hợp đã biết Var(Ui) = σi  Xét mô hình: Y i

   2

1

i

i

 Khắc phục

*

i

(6)

X

(7)

 1

 2

  Y i

   2

* 1

* i

v i

Y i  i

1  i

X U i    i

i

i

)

Var

Var U (

)

  1( i

)

Var v ( i

i

U 1  ( ) 2   i

i

2  i 2  i

21

Trong đó: vi là yếu tố ngẫu nhiên thoả mãn mọi giả thết của OLS.

2

 X U

2. Trường hợp chưa biết Var(Ui) = σi  Xét mô hình:  Y (8) i

   2

1

i

i

2

 Có thể đưa ra các giả thiết về σi

GT

1:

X

  

2 i

GT

2 :

2 i

i

2

GT

3 :

)

2 i

E Y ( i

2 i    X    

least squares – GLS)

22

 Phương pháp bình phương nhỏ nhất tổng quát (General

2

2 i

iX

Giả thiết 1:    Kiểm tra giả thiết

 Nếu giả thiết 1 đúng thì chia 2 vế của MH cho Xi

*

i

(

X

  

0)

X

(9)

 1

 2

i

Y i

 1

1

i

 2

v i

Y i X

1 X

U X

i

i

i

i

)

Var

(

)

Var U (

)

   (

i

)

Var v ( i

i

U X

1 X

i

2 i

2  X i 2 X i

23

 

2 i

iX

Giả thiết 2:  Kiểm tra giả thiết

iX

 Nếu giả thiết 2 đúng thì chia 2 vế của MH cho

*

X

(

X

  

0)

X

X

(10)

 1

 2

i

i

Y i

 1

1

i

 2

2

i

v i

Y i X

1 X

U i X

i

i

i

i

)

Var

(

)

Var U (

)

   (

i

)

Var v ( i

i

1 X

 X X

U i X

i

i

i

24

)

2 i

iE Y (

2

 Giả thiết 3:    Kiểm tra giả thiết 2ˆ iY thay thế Sử dụng

ˆ iY

 Nếu giả thiết 3 đúng thì chia 2 vế của MH cho

*

i

i

  

0)

X

X

(11)

 1

 2

ˆ( Y i

Y i

 1

i 1

 2

2

i

v i

Y i ˆ Y i

1 ˆ Y i

X U  ˆ ˆ Y Y i i

2

i

)

Var

(

)

Var U (

)

   (

i

)

Var v ( i

i

U ˆ Y i

1 ˆ 2 Y i

ˆ  Y i ˆ 2 Y i

25

 Ngoài 3 giả thiết nêu trên, nếu nguyên nhân do

mô hình có dạng hàm sai:

 Đổi dạng hàm:

ln

ln

 X U

1

i

i

ln

 X U i

Y i Y i 

   2    2 ln

i  X U

Y i

1    2

1

i

i

26

5.3. 5.3. KiKiểểmm đđịịnhnh gigiảả thithiếếtt vvềề phânphân phphốốii xácxác susuấấtt ccủủaa saisai ssốố ngngẫẫuu nhiên nhiên

 Trong các mô hình hồi quy ta luôn giả thiết các sai số ngẫu nhiên có phân phối chuẩn. Tuy nhiên trong thực tế giả thiết này có thể bị vi phạm.

 Khi giả thiết này bị vi phạm thì các ước lượng điểm thu được từ phương pháp OLS vẫn là các ước lượng tuyến tính, không chệch, tốt nhất. Tuy nhiên các suy diễn thống kê sẽ mất chính xác.

27

 Kiểm định cặp giả thiết H0: Các sai số ngẫu nhiên có phân phối chuẩn H1: Các sai số ngẫu nhiên không phân phối chuẩn + Bước 1: Hồi quy mô hình đã cho tìm được ei + Bước 2: Tìm hệ số bất đối xứng S (Skewness) và hệ

số nhọn K (Kurtoris) của các phần dư:

n

n

n

n

3

4

(

3 ) /

n

/

n

(

4 ) /

n

/

n

e i

e i

e i

e i

e i

e i

i

 1

i

 1

i

 1

i

 1

S

,

K

S

S

S

S

3 e

3 e

4 e

4 e

2

2

+ Tiêu chuẩn kiểm định

2 

( K 3) (cid:0)  JB n  (2)

2

+ Miền bác bỏ mức ý nghĩa :

JB JB :

W 



S 6  24      

 (2)

28

5.4. ĐA CỘNG TUYẾN (MULTICOLLINEARITY)

5.4.1. Bản chất của hiện tượng đa cộng tuyến

5.4.2. Hậu quả của hiện tượng đa cộng tuyến

5.4.3. Phát hiện đa cộng tuyến

5.4.4. Khắc phục hiện tượng đa cộng tuyến

29

I. Bản chất của đa cộng tuyến

Xét mô hình hồi quy k biến:

X

X

  ...

Y i

   2

1

2

i

 3

i 3

 k

 X U ki

i

Đa cộng tuyến là hiện tượng xảy ra đối với mô hình

hồi quy bội khi các biến độc lập có quan hệ cộng

tuyến với nhau:

- Đa cộng tuyến hoàn hảo (Perfect Multi)

- Đa cộng tuyến không hoàn hảo (Inperfect Multi)

30

Đa cộng tuyến hoàn hảo

 Là hiện tượng mà giữa các biến độc lập của mô hình có

  ...

X

X

X

0(1)

quan hệ thoả mãn điều kiện sau:    k 3

i 3

i 2

ki

 2 trong đó:

  ...

0

2    3

2 2

2  k

 Giả sử: λ2 ≠0:

X

  ...

 

X

X

X

i 2

i 3

ki

4

i

 3  2

 k  2

 4  2 tức là X2i phụ thuộc hàm số vào các biến độc lập còn lại

31

Đa cộng tuyến không hoàn hảo

 Là hiện tượng mà giữa các biến độc lập của mô hình có

X

  ...

X

0(2)

 2

i 3

2

i

V i

ki

  ...

quan hệ thoả mãn điều kiện sau:   X k 3 Trong đó: Vi là sai số ngẫu nhiên 2    0 3

2  k

2 2  Giả sử: λ2 ≠0:

X

 

X

X

  ...

X

i 2

i 3

4

i

ki

V i

 3  2

 4  2

 k  2

1  2

32

tức là X2i phụ thuộc tương quan với các biến độc lập còn lại.

Nguyên nhân của đa cộng tuyến

 Do bản chất các biến độc lập đã có sẵn quan hệ cộng

tuyến với nhau

 Do số liệu mẫu không ngẫu nhiên hoặc kích thước mẫu

không đủ lớn nên không đại diện tốt nhất cho tổng thế

 Do quá trình xử lý số liệu đã được làm trơn

 Do chỉ định mô hình sai

33

II. Hậu quả của hiện tượng đa cộng tuyến

Xét mô hình hồi quy 3 biến:

Y i

    1 2

X 2 i

 3

 X U i 3 i

Hậu quả của đa cộng tuyến: -Hoàn hảo:

X

  0)

1

i

i 3

i 2

  x 2

  x ( 3 i

r 23

r = 32

0)

 X - Không hoàn hảo:  x V   (  3 i i

x 2 i

    r 1 23

r 32

34

n

n

n

n

(

)(

)

(

)(

)

x y 2 i

i

2 x 3 i

x y 3 i

i

x x 2 i 3

i

i

 1

i

 1

i

 1

i

 1

ˆ  2

n

n

n

0 0

2

x

)(

x

)

(

)

(

2 i 2

2 i 3

x x 2 i

3

i

i

 1

i

 1

i

 1

n

n

n

n

(

)(

x

)

(

)(

)

x y 3 i

i

2 2

i

x y 2 i

i

x x 2 i 3

i

i

 1

i

 1

i

 1

i

 1

ˆ  3

n

n

n

2

0 0

x

)(

)

(

)

(

2 i 2

2 x 3 i

x x 2 3 i

i

i

 1

i

 1

i

 1

2

 

Var

)

ˆ(  2

n

x

(1

)

2 2

i

2 r 23

i

 1

2 

Var

)

 

ˆ(  3

n

x

(1

)

2 i 3

2 r 2 3

35

i

 1

+ Phương sai và hiệp phương sai của các hệ số hồi quy ước

lượng tăng lên.

+ Các khoảng tin cậy sẽ rộng hơn và kiểm định T có thể mất

ý nghĩa.

+ Hệ số R2 có thể khá cao + các giá trị giá trị thống kê của

kiểm định T khá nhỏ  Kiểm định T và F có thể cho kết luận

mâu thuẫn.

+ Mô hình trở lên nhạy cảm với sự thay đổi của số liệu.

+ Dấu của các hệ số hồi quy ước lượng được có thể không phù

hợp với lý thuyết kinh tế.

36

Chú ý:

- Trong thực tế đa cộng tuyến hoàn hảo gần như không

bao giờ xảy ra vì nó chỉ tồn tại về mặt lý thuyết  trong các

mô hình hồi quy bội chỉ xem xét hiện tượng đa cộng tuyến

không hoàn hảo.

- Đối với mô hình hồi quy bội bao giờ cũng có đa cộng

tuyến  xem xét mức độ nghiêm trọng của đa cộng tuyến.

- Nói chung khi có đa cộng tuyến không hoàn hảo các

ước lượng nhận được vẫn có tính chất không chệch nên vẫn có

thể dùng để dự báo.

37

III. Phát hiện đa cộng tuyến (không hoàn hảo)

1. Căn cứ các lý thuyết kinh tế

Căn cứ vào nội dung kinh tế của các biến độc lập có trong mô hình để xem xét khả năng có tồn tại hiện tượng đa cộng tuyến

2. Căn cứ vào các kết luận của kiểm định T và F

Nếu các kết luận mâu thuẫn với nhau thì đó có thể là dấu hiệu của đa cộng tuyến.

3. Căn cứ vào hệ số tương quan của các biến độc lập

38

4. Dùng hồi quy phụ

- Bước 1: Hồi quy mô hình phụ sau

  ...

  ...

X ji

    X 1 2 2 i

  1 j

X j

 1 i

  X  1 j j

 1 i

 k

X V R j i

2      k 2 ) ( j

ki

Mô hình hồi quy phụ giữa các biến độc lập trong mô

hình hồi quy gốc.

- Bước 2: Kiểm định cặp giả thiết

mô hình không có đa cộng tuyến

mô hình có đa cộng tuyến

39

IV. Khắc phục đa cộng tuyến

1. Tăng kích thước mẫu hoặc lấy mẫu mới

2. Bỏ bớt biến độc lập ra khỏi mô hình nếu có thể

3. Giảm đa cộng tuyến bằng hồi quy đa thức

4. Đổi dạng hàm

40

• Đổi sang dạng hàm mũ (Hàm Cobb – Douglass)

2

3

iU

K L e

ln

ln

ln

K

ln

Q i

 i i

1

Q i

   2

1

i

 3

 K U i

i

• Đổi sang dạng hàm sai phân bậc 1:

X

X

U

Y t

   2

1

2

t

 3

t 3

t

(

X

X

)

(

X

X

)

)

 Y Y t t

 1

 2

2

t

 2 1 t

 3

t 3

 U U ( t

t

 1

 3 1 t

X

X

*   Y t

 2

* t 2

 3

* t 3

V t

41

Các thuộc tính tốt của một mô hình

 Tính tiết kiệm: Mô hình chứa một lượng tối thiểu các biến số

 Tính thống nhất: Với cùng một bộ số liệu ta chỉ có một kết quả

vẫn phản ánh được bản chất quan hệ kinh tế.

 Tính thiết thực: Biến độc lập phải giải thích được sự thay đổi cơ

duy nhất.

 Tính vững về mặt lý thuyết: Các kết quả ước lượng được phải

bản của biến phụ thuộc.

 Khả năng dự báo cao: Thông qua mô hình có thể dự báo tương

phù hợp với lý thuyết và thực tiễn kinh tế.

42

đối chính xác về biến phụ thuộc.