Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Dữ liệu bảng (Panel Data)

1

Các loại dữ liệu

Time – series Cross – sections Panel

2

Nguyen Trong Hoai 1

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Dữ liệu bảng và dữ liệu chéo gộp chung

Dữ liệu bảng là dữ liệu mà các quan sát của dữ liệu này bao gồm quan sát chéo và các quan sát chéo này lại được quan sát theo thời gian Cần phân biệt dữ liệu bảng và dữ liệu chéo gộp chung

3

Ưu điểm của dữ liệu bảng

Nghiên cứu được sự khác biệt giữa các đơn vị chéo mà trước đây chúng ta hay sử dụng dummy Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến Chứa đựng nhiều thông tin hơn các dữ liệu khác

4

Nguyen Trong Hoai 2

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Ưu điểm của dữ liệu bảng (tt)

Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian

5

Tổ chức dữ liệu bảng

Unstacked: Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo từng biến (ví dụ trong tài liệu đọc của Gujarati, đây là cách thông thường khi mô tả dữ liệu bảng-ví dụ bằng Eviews) Stacked: Các đơn vị chéo được sắp xếp theo thời gian và các đơn vị chéo này được nhóm lại với nhau theo từng biến

6

Nguyen Trong Hoai 3

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Ví dụ về dữ liệu bảng stacked

1,1

1,1

1,1

X X

2,1

Z Z

2,1

Y Y

2,1

X

M ,1

T

Z

M ,1

T

Y

M T,1

2

1,

2

1,

2

1,

X X

2

2,

Z Z

Y Y

2

2,

2

2,

X

Y

M 2

,

T

Z

M 2

T,

M 2

,

T

M

M

M

Y

N,1

N,1

N,1

Y

X X

N,2

Z Z

N,2

N,2

M

M

M

Y

N,

T

                   

                   

X

Z

N,

T

N,

T

                   

                   

                   

                   

7

Ví dụ về dữ liệu bảng Unstacked

Quan saùt

I

Quan saùt

I

F–1

C–1

F–1

C–1

US

GE

1935

33,1

1170,6

97,8

209,9

1362,4

53,8

1935

1936

45,0

2015,8

104,4

355,3

1807,1

50,5

1936

1937

77,2

2803,3

118,0

469,9

2673,3

118,1

1937

1938

44,6

2039,7

156,2

262,3

1801,9

260,2

1938

1939

48,1

2256,2

172,6

230,4

1957,3

312,7

1939

1940

74,4

2132,2

186,6

361,6

2202,9

254,2

1940

8

Nguyen Trong Hoai 4

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Các loại dữ liệu bảng

Dữ liệu bảng cân bằng (balanced): khi các đơn vị chéo có cùng số quan sát theo thời gian, phần lớn các dữ liệu bảng sẽ được trình bày theo kiểu này Dữ liệu bảng không cân bằng (unbalance): khi cac đơn vị chéo không có cùng số quan sát theo thời gian

9

Ý tưởng cơ bản về dữ liệu bảng

Dữ liệu bảng không thể thực hiện hồi qui bằng OLS thông thường Các trường hợp có thể xảy ra cho các đơn vị chéo (một ví dụ đơn giản)

(cid:190)Các đơn vị chéo có điều kiện đặc thù giống

nhau

(cid:190)Các đơn vị chéo có điều kiện đặc thù khác

nhau

10

Nguyen Trong Hoai 5

Ý tưởng cơ bản về dữ liệu bảng (tt)

(cid:190)Các đơn vị chéo có sự khác biệt về tác động

biên của các nhân tố ảnh hưởng

(cid:190)Các đơn vị chéo vừa khác biệt về điều kiện đặc thù và vừa khác biệt về tác động biên của các nhân tố ảnh hưởng

(cid:190)Các đơn vị chéo không có sự khác biệt về điều kiện đặc thù và tác động biên của các nhân tố đang xét

11

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Dummy và dữ liệu bảng

Dummy có giải quyết các vấn đề của dữ liệu bảng? Câu trả lời là được nhưng rất phức tạp và không hiệu quả

12

Nguyen Trong Hoai 6

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Dạng tổng quát mô hình

Yit = β1it + β2itX2it + β3itX3it + uit

Các tiếp cận ước lượng mô hình tổng quát

13

Tiếp cận tác động cố định

Tất cả các hệ số đều không đổi theo thời gian và các đơn vị chéo Hệ số độ dốc không đổi theo thời gian và các đơn vị chéo nhưng hệ số trục tung khác nhau giữa các đơn vị chéo Hệ số độ dốc không đổi theo thời gian và các đơn vị chéo nhưng hệ số trục tung biến đổi giữa các đơn vị chéo và thời gian

14

Nguyen Trong Hoai 7

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Tiếp cận tác động cố định (tt)

Tất cả các hệ số biến đổi theo các đơn vị chéo Tất cả các hệ số biến đổi theo các đơn vị chéo và theo thời gian

15

Tất cả các hệ số không đổi

OLS- Pooled (hồi qui kết hợp tất cả các quan sát) Yit = β1 + β2X2it + β3X3it + uit Nhược điểm

(cid:190) Nhận dạng sai thể hiện ở DW (cid:190)Ràng buộc quá chặt về các đơn vị chéo,

điều này khó xảy ra trong thực tế

16

Nguyen Trong Hoai 8

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Tất cả các hệ số không đổi (tt)

Y^ se t

= –63,3041 +0,1101X2 + 0,3034X3 (0,0493) (6,1545)

(29,6124) (0,0137) (–2,1376) (8,0188)

Durbin–Watson = 0,2187

R2 = 0,7565 n = 80

df = 77 Phương trình 16.3.1 trong bài đọc

17

Hệ số trục tung biến đổi theo chéo

Phương pháp FEM – LSDV Yit = β1it + β2X2it + β3X3it + uit FEM: mặc dù có sự khác biệt các đơn vị chéo về hệ số trục tung nhưng lại không khác biệt theo thời gian Giải pháp dummy?

18

Nguyen Trong Hoai 9

Intercept biến đổi theo đơn vị chéo (tt)

Yit = α1 + α2D2i + α3D3i + α4D4i + β2X2it + β3X3it + uit

19

Intercept biến đổi theo đơn vị chéo (tt)

Hãy xem kết quả mô hình ước lượng 16.3.4 Mô hình này tốt hơn mô hình đầu tiên ở các hệ số xác định, ý nghĩa thống kê t và DW . . . Sự sai lầm về nhận dạng được cải thiện Thoả mãn kiểm định Wald

20

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Nguyen Trong Hoai 10

Intercept biến đổi theo thời gian

Tiếp tục sử dụng biến dummy cho thời gian Tốn kém thời gian Không có ý nghĩa thống kê Time effect: điều này có nghĩa là các yếu tố đặc thù của ngành không thay đổi theo thời gian (cid:190)Yit = λ0 + λ1 Dum35 + λ2 Dum36+ . . . + λ19

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

(16.3.6)

Dum53 + β2X2it + β3X3it + uit

21

Intercept biến đổi theo đơn vị chéo và theo thời gian

Sử dụng dummy một lần nữa cho cả đơn vị chéo và thời gian Kết quả

(cid:190)Các hệ số của dummy ít có ý nghĩa thống kê (cid:190)Mô hình tốt là mô hình có các biến giả theo

các đơn vị chéo

22

Nguyen Trong Hoai 11

Tất cả các hệ số biến đổi theo đơn vị chéo

Sử dụng dummy theo các đơn vị chéo cho intercept và slope Kết quả hồi qui ở 16.3.8

(cid:190) Các hàm đầu tư của các đơn vị chéo khác

nhau

(cid:190)Không thể sử dụng dữ liệu pooled để hồi qui hàm đầu tư cho tất cả các đơn vị chéo mà không tính đến đặc thù của chúng

23

Trục trặc khi sử dụng FEM (LSDV)

Giảm bậc tự do của dữ liệu đi rất nhiều Nguy cơ đa cộng tuyến vì có quá nhiều biến Giả định cổ điển về uit ~ N (0, σ2) rất khó thực hiện

(cid:190)Cần thiết có một phương pháp khác

24

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Nguyen Trong Hoai 12

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Tiếp cận REM (ECM)

Ý tưởng của tiếp cận này cho rằng sự khác biệt về các điều kiện đặc thù của các đơn vị chéo được chứa đựng trong phần sai số ngẫu nhiên (cid:190) β1i = β1 + εi (cid:190)Yit = β1 + β2X2it + β3X3it + εi + uit = β1 + β2X2it + β3X3it + wit

(cid:190) wit = εi + uit

25

Giả định REM

Giả định thông thường

~

N

ε

σ

i

u

~

N

2 ε σ

( ,0 ( ,0

) )2

it

u

26

Nguyen Trong Hoai 13

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Sự khác biệt giữa FEM và ECM

FEM có riêng từng Intercept cho từng đơn vị chéo và chúng ta quan sát được ECM chỉ có một intercept duy nhất cho tất cả các đơn vị chéo, giá trị này là gái trị trung bình của tất cả các đơn vị chéo. Sự khác biệt của các đơn vị chéo nằm trong thành phần ngẫu nhiên iε

27

GLS là phương pháp ước lượng ECM

Do cấu trúc sai số của tiếp cận ECM có tương quan với nhau (AR) Nếu ước lượng bằng OLS thì các hệ số ước lượng sẽ không hiệu quả (chệch và phương sai không nhỏ nhất)

corr

(

)

=

it ww ,

is

2 σ ε 2 2 + σσ u ε

28

Nguyen Trong Hoai 14

Lựa chọn mô hình cho dữ liệu bảng

Ý tưởng kinh tế lượng

(cid:190)FEM khi εi và các biến độc lập được giả

thiết có mối quan hệ chặt chẽ

(cid:190) ECM khi εi và các biến độc lập được giả thiết không có mối quan hệ chặt chẽ Căn cứ vào n và t: Judge

29

Lựa chọn mô hình cho dữ liệu bảng

Căn cứ vào N và T: Judge

(cid:190)ECM và FEM không phân biệt khi T lớn và N

nhỏ

(cid:190)ECM và FEM sẽ khá khác biệt về kết quả khi

N lớn và T nhỏ

(cid:57)ECM thích hợp khi các đơn vị chéo ngẫu nhiên (cid:57)FEM sẽ thích hợp khi các đơn vị chéo không

được lựa chọn ngẫu nhiên

30

Analytical Methods Lecture note Fulbright Economics Teaching Program 2005 - 2006

Nguyen Trong Hoai 15