TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 25 - Thaùng 12/2014<br />
<br />
<br />
MÔ HÌNH PHÂN TÍCH SỐ LIỆU MẢNG -<br />
THỰC HIỆN TRÊN PHẦN MỀM STATA (KỲ 2)<br />
<br />
PHAN TẤT HIỂN(*)<br />
LÊ KHẮC PHONG(**)<br />
PHAN HUY BẰNG(***)<br />
<br />
TÓM TẮT<br />
Trong bài báo này chúng tôi trình bày về số liệu mảng, tầm quan trọng và các đặc<br />
trưng ưu việt của nó trong việc phân tích và dự báo kinh tế. Chúng tôi cũng trình bày hai<br />
mô hình cơ bản và các phương pháp ước lượng để phân tích số liệu mảng. Cuối cùng<br />
chúng tôi trình bày các kiểm định cho số liệu và mô hình đã trình bày ở trên.<br />
Từ khóa: số liệu mảng, mô hình tác động ngẫu nhiên, mô hình tác động cố định, Stata<br />
<br />
ABSTRACTS<br />
In this paper we present the Panel data, and the importance of its unique adVantages<br />
in Vietnam economic analysis and forecasting. We also present two basic models and<br />
estimation methods to analyze array data. Finally we present the testing for data and<br />
model presented above.<br />
Keywords: panel data, random effects models, fixed effects models, Stata<br />
<br />
<br />
3. MÔ HÌNH TÁC ĐỘNG CỐ ĐỊNH VÀ được ci với sai số ngẫu nhiên uit mà xem<br />
ƯỚC LƯỢNG(*)(**)(***) xét nó như một thành phần của mô hình có<br />
Phần này sẽ xem xét mô hình tác động thể ước lượng được, và do đó chúng ta sẽ<br />
cố định, dùng để giải quyết các bài toán làm việc với mô hình có dạng (5.1)<br />
trong đó yếu tố không quan sát được có Chúng ta sẽ xem xét các giả thiết của<br />
dạng ci và có tương quan với biến giải mô hình<br />
thích trong mô hình. Giả thiết FE1. E (uit | X i , ci ) 0 với<br />
3.1. Mô hình – các giả thiết mọi t = 1,.., T.<br />
Viết lại mô hình tác động cá thể Giả thiết FE2: rank(E(X’X)) = k<br />
yit 1 2 X 2it .. k X kit ci uit Giả thiết FE3: var(uit | X it ) u ,<br />
2<br />
<br />
thành dạng như<br />
cov(ui, uj) = 0 với i ≠ j<br />
sau: yit 1 2 X 2it .. k X kit ci uit<br />
3.2. Các phương pháp ước lượng mô<br />
(5.1) hình tác động cố định<br />
Mô hình tác động cố định chủ trương Có nhiều phương pháp để ước lượng<br />
không gộp thành phần không quan sát mô hình này, trong khuôn khổ của bài báo<br />
chúng tôi xin được giới thiệu hai phương<br />
(*)<br />
ThS, Trường Đại học Sài Gòn pháp sau:<br />
(**)<br />
ThS, Trường Đại học Vinh Phương pháp ước lượng nội bộ (within<br />
(***)<br />
ThS, Trường Cao đẳng nghề Công nghệ cao<br />
Đồng An, Bình Dương estimator)<br />
<br />
115<br />
Ý tưởng của phương pháp này là ước sau<br />
lượng các hệ số dựa trên quan sát về sự y1t 1 c1 2 X 21t .. k X k1t u1t<br />
thay đổi trong nội bộ mỗi cá thể. Phương <br />
.... (5.5)<br />
pháp này được thực hiện như sau : y c X .. X u<br />
nt 1 n 2 2 nt k knt nt<br />
Từ mô hình (5.1), lấy trung bình cho mỗi<br />
(5.5) cho thấy rằng chúng ta có thể ước<br />
cá thể dọc theo thời gian, ta có :<br />
lượng các ci bằng cách sử dụng biến giả<br />
yi 1 2 X 2i .. k X ki ci ui (5.2)<br />
như sau :<br />
Từ (5.1) và (5.2) ta dni = 1 nếu n =i, dni = 0 nếu n i<br />
có : Khi đó (5.5) có thể viết gọn lại dưới<br />
yit yi 2 ( X 2it X 2i ) .. k ( X kit X ki ) (uit ui ) (5.3) dạng :<br />
Phương pháp OLS gộp áp dụng cho mô yit 1 c1d1i .. cndni 2 X 2it .. k X kit uit (5.6)<br />
hình (5.3) được gọi là phương pháp ước Phương pháp ước lượng với biến giả là<br />
lượng nội bộ. phương pháp OLS gộp cho bài toán<br />
Từ (5.2) ta thấy rằng ci có thể được (5.6).Để tránh hiện tượng đa cộng tuyến<br />
ước lượng theo công thức hoàn hảo trong mô hình (5.5), Stata sẽ tự<br />
sau ci yi ˆ2 X 2i .. ˆk X ki (5.4) động bỏ bớt một biến giả.<br />
Thực hiện trên STATA Kết quả ước lượng với số liệu trong<br />
Lệnh khai báo số liệu : xtset id time panel2.dta cho mô hình (5.6) cho trong<br />
Lệnh ước lượng: xtreg y x1 x2...xk, fe bảng 62.<br />
Trong đó fe ngụ ý chúng ta đang ước Lệnh thực hiện trong phần mềm Stata<br />
lượng mô hình tác động cố định. xi: reg Va vondautu i.id<br />
Với số liệu trong ví dụ panel.dta chúng Vậy về thực chất, ước lượng với biến<br />
ta sẽ viết lệnh giả chính là phương pháp ước lượng gộp<br />
xtset id year tiến hành cho số liệu mảng với n-1 biến giả<br />
xtreg Va vondautu, fe thể hiện cho n cá thể. Với phương pháp này,<br />
Trong đó: xtset id year là lệnh khai báo chúng ta một mặt có được các giá trị ước<br />
sử dụng số liệu mảng, fe: ngụ ý mô hình lượng của các ci, mặt khác có thể đưa ra các<br />
tác động cố định suy diễn thống kê về sự khác biệt giữa các<br />
Với tập số liệu nói trên, kết quả thu cá thể. Trong bảng 6 nói trên, ngành sản<br />
được cho trong bảng sau1. xuất sợi và dệt vải (tương ứng với biến giả<br />
Ở đây hệ số ước lượng của vốn đầu tư id_1) được chọn làm ngành để so sánh. Và<br />
là 2.325042, đã phù hợp với kỳ vọng của hệ số (5373001) thể hiện sự khác biệt trong<br />
chúng ta về mối quan hệ giữa giá trị gia giá trị gia tăng giữa ngành sản xuất sợi và<br />
tăng Va và vốn đầu tư. dệt vải với ngành may trang phục do tác<br />
Phương pháp ước lượng sử dụng biến động của yếu tố không quan sát được ci. Do<br />
giả kết quả ước lượng có báo cáo về giá trị sai<br />
Một cách tiếp cận khác với phương số chuẩn của hệ số ước lượng này nên ta<br />
pháp trên đây là xem xét ci như là các tham hoàn toàn có thể đưa ra các suy diễn thống<br />
kê như: sự khác biệt này là có thực sự khác<br />
số có thể ước lượng cùng với các hệ số j .<br />
0 không, sự khác biệt này có thể nằm trong<br />
Khi đó ta có thể viết lại mô hình (5.1) như khoảng giá trị nào.<br />
<br />
116<br />
4. VẤN ĐỀ LỰA CHỌN MÔ HÌNH Trong Stata thực hiện các bước như<br />
Chúng ta có thể dựa vào bản chất của sau:<br />
số liệu và mục đích nghiên cứu, cũng có Bước 1: ước lượng mô hình tác động<br />
thể dựa vào các kiểm định thống kê để lựa cố định: quietly xtreg Va vondautu, fe<br />
chọn mô hình. Trong phần này chúng tôi Bước 2: lưu giữ kết quả vừa ước lượng<br />
giới thiệu cách dùng kiểm định thống kê để với một tên nào đó, chẳng hạn là fixed:<br />
lựa chọn giữa mô hình tác động cố định và estimates store fixed<br />
mô hình tác động ngẫu nhiên. Bước 3: ước lượng mô hình tác động<br />
Sự lựa chọn giữa mô hình tác động cố ngẫu nhiên: quietly xtreg Va vondautu, re<br />
định và mô hình tác động ngẫu nhiên được Bước 4: lưu giữ kết quả vừa ước lượng<br />
dựa vào kiểm định Hausman. Ý tưởng của với một tên nào đó, chẳng hạn là random<br />
kiểm định Hausman là như sau: estimates store random<br />
Chúng ta biết rằng nếu ci là không Bước 5: hausman fixed random<br />
tương quan với các biến giải thích trong Thực hiện với số liệu panel2.dta cho<br />
mô hình thì cả hai phương pháp ước lượng kết quả như sau3:<br />
đều cho ra ước lượng vững, do đó chúng ta Trong bảng 7, giá trị xác suất P tương<br />
kỳ vọng là các hệ số ước lượng thu được từ ứng với thống kê quan sát Chi-bình-<br />
hai phương pháp là khá gần nhau. Còn nếu phương (18.31) là 0.0000, do đó chúng ta<br />
ci là có tương quan với biến giải thích thì bác bỏ giả thuyết H0 , trong đó H0 được<br />
ước lượng từ mô hình tác động cố định là hiểu là “mô hình tác động ngẫu nhiên là<br />
ước lượng vững nhưng ước lượng từ mô phù hợp” (do “sự khác biệt trong các hệ số<br />
hình tác động ngẫu nhiên lại là không là không mang tính hệ thống”)<br />
vững, do đó các ước lượng từ hai phương Khi giả thiết H0 trong giả thiết trên bị<br />
pháp sẽ là rất khác nhau. Kiểm định bác bỏ (như trong trường hợp trên) thì<br />
Hausman dựa trên sự khác biệt giữa các hệ chúng ta sẽ lựa chọn mô hình tác động cố<br />
số ước lượng bởi hai phương pháp để đưa định. Và điều này cũng mặc định là có tồn<br />
ra sự lựa chọn mô hình. tại yếu tố không quan sát được ci. Do đó<br />
Kiểm định Hausman: Kiểm định này chúng ta không nhất thiết phải kiểm định<br />
được thực hiện như sau để lựa chọn mô hình tác động cố định hay<br />
H0 : ci không tương quan với uit mô hình OLS gộp.<br />
H1 : ci có tương quan với uit 5. KẾT LUẬN<br />
Thống kê kiểm định là Như vậy, số liệu mảng là một trong<br />
2 qs (ˆFE ˆRE )'(VFE VRE )1 (ˆFE ˆRE ) những số liệu có nhiều ứng dụng nhất trong<br />
Khi giả thiết H0 là đúng thì thống kê phân tích kinh tế xã hội. Nó có những tính<br />
này tuân theo quy luật Khi bình phương ưu việt hơn hẳn các số liệu khác. Đặc biệt,<br />
với số bậc tự do bằng số hệ số trong mô với số liệu mảng rất phù hợp với bối cảnh<br />
hình trừ đi 1. Do đó nếu thống kê quan sát của các nước đang phát triển trong đó có<br />
lớn hơn giá trị tới hạn thì giả thiết H0 bị Việt Nam.<br />
bác bỏ và mô hình tác động cố định được Phân tích số liệu mảng có nhiều ứng<br />
lựa chọn. dụng và khắc phục được nhiều khuyết điểm<br />
của số liệu và biến số, đặc biệt là khuyết<br />
điểm về biến nội sinh.<br />
<br />
117<br />
Hy vọng bài báo này sẽ giúp cho bạn và ứng dụng của số liệu mảng.<br />
đọc có một số kiến thức, kỉ năng phân tích<br />
<br />
6. BẢNG PHỤ LỤC<br />
Bảng 6: Kết quả chạy với phương pháp tác động cố định<br />
Fixed-effects (within) regression Number of obs = 99<br />
Group Variable: id Number of groups = 9<br />
R-sq: within = 0.6005 Obs per group: min = 11<br />
between = 0.9580 avg = 11.0<br />
overall = 0.7846 max = 11<br />
F(1,89) = 133.79<br />
corr(u_i, Xb) = 0.6187 Prob > F = 0.0000<br />
------------------------------------------------------------------------------<br />
Va | Coef. Std. Err. t P>|t| [95% Conf. InterVal]<br />
-------------+----------------------------------------------------------------<br />
vondautu | 2.325042 .2010121 11.57 0.000 1.925635 2.724449<br />
_cons | 1387131 422746.5 3.28 0.001 547143.2 2227120<br />
-------------+----------------------------------------------------------------<br />
sigma_u | 2813098.8<br />
sigma_e | 3451080.9<br />
rho | .3991995 (fraction of Variance due to u_i)<br />
------------------------------------------------------------------------------<br />
F test that all u_i=0: F(8, 89) = 4.51 Prob > F = 0.0001<br />
<br />
Bảng 7: Ước lượng với biến giả<br />
i.id _Iid_1-9 (naturally coded; _Iid_1 omitted)<br />
Source | SS df MS Number of obs = 99<br />
-------------+------------------------------ F( 9, 89) = 54.63<br />
Model | 5.8555e+15 9 6.5061e+14 Prob > F = 0.0000<br />
Residual | 1.0600e+15 89 1.1910e+13 R-squared = 0.8467<br />
-------------+------------------------------ Adj R-squared = 0.8312<br />
Total | 6.9155e+15 98 7.0566e+13 Root MSE = 3.5e+06<br />
------------------------------------------------------------------------------<br />
Va | Coef. Std. Err. t P>|t| [95% Conf. InterVal]<br />
-------------+----------------------------------------------------------------<br />
vondautu | 2.325042 .2010121 11.57 0.000 1.925635 2.724449<br />
_Iid_2 | -3088354 1704009 -1.81 0.073 -6474184 297476.9<br />
_Iid_3 | -3003355 1694827 -1.77 0.080 -6370939 364229.8<br />
_Iid_4 | -3057401 1731784 -1.77 0.081 -6498419 383616.1<br />
_Iid_5 | -2740366 1726771 -1.59 0.116 -6171424 690690.6<br />
_Iid_6 | -2895822 1680662 -1.72 0.088 -6235262 443617.2<br />
_Iid_7 | -2518805 1709622 -1.47 0.144 -5915789 878177.9<br />
_Iid_8 | 5373001 1471949 3.65 0.000 2448269 8297733<br />
_Iid_9 | -3023819 1733673 -1.74 0.085 -6468590 420952<br />
<br />
<br />
118<br />
_cons | 3048789 1392242 2.19 0.031 282434.8 5815144<br />
<br />
Bảng 8: Kiểm định Hausman<br />
---- Coefficients ----<br />
| (b) (B) (b-B) sqrt(diag(V_b-V_B))<br />
| fixed random Difference S.E.<br />
-------------+----------------------------------------------------------------<br />
vondautu | 2.325042 2.750478 -.4254356 .099427<br />
------------------------------------------------------------------------------<br />
b = consistent under Ho and Ha; obtained from xtreg<br />
B = inconsistent under Ha, efficient under Ho; obtained from xtreg<br />
Test: Ho: difference in coefficients not systematic<br />
chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B)<br />
= 18.31<br />
Prob>chi2 = 0.0000<br />
<br />
Chú thích:<br />
1<br />
Bảng kết quả chạy với mô hình tác động cố định (Bảng 6)<br />
2<br />
Xem bảng kết quả hồi quy theo phương pháp biến giả (Bảng 7)<br />
3<br />
Xem bảng kết quả Kiểm định Hausman (Bảng 8)<br />
<br />
TÀI LIỆU THAM KHẢO<br />
<br />
<br />
1. Arthur S.Goldberger, Econometric Theory, John Wiley & Sons,Inc<br />
2. Brown, M. B., and A. B. Forsythe. (1974). Robust test for the equality of Variances.<br />
Journal of the American Statistical Association 69: 364-367.<br />
3. Damodar N. Gujarati (1995), Basic Econometric, MacGraw-Hill Inc, Third Ed.<br />
4. Nguyễn Khắc Minh (2002), Các phương pháp phân tích và dự báo trong kinh tế, Nxb<br />
Khoa học và Kỹ thuật Hà Nội.<br />
5. Nguyễn Quang Dong (2008), Bài giảng kinh tế lượng, Nxb Giao thông vận tải Hà<br />
Nội.<br />
6. Jeffrey M. Wooldridge (2002), Econometric Analysis of Cross Section and Panel<br />
Data, The MIT Press Cambridge, Massachusetts London, England<br />
7. Madala, G.S-macmillan (1992), Introduction of Econometrics. 2d ed., New York.<br />
8. Greene, W. (2000). Econometric Analysis. Upper Saddle River, NJ: Prentice–Hall.<br />
<br />
<br />
*Ngày nhận bài: 30/6/2014. Biên tập xong: 1/12/2014. Duyệt đăng: 6/12/2014<br />
<br />
<br />
<br />
119<br />