TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 22 - Thaùng 8/2014<br />
<br />
<br />
MÔ HÌNH PHÂN TÍCH SỐ LIỆU MẢNG<br />
- THỰC HIỆN TRÊN PHẦM MỀM STATA (KỲ 1)<br />
<br />
PHAN TẤT HIỂN(*)<br />
LÊ KHẮC PHONG(**)<br />
PHAN HUY BẰNG(***)<br />
<br />
TÓM TẮT<br />
Trong bài báo này chúng tôi trình bày về số liệu mảng, tầm quan trọng và các đặc<br />
trưng ưu việt của nó trong việc phân tích và dự báo kinh tế. Chúng tôi cũng trình bày hai<br />
mô hình cơ bản và các phương pháp ước lượng để phân tích số liệu mảng. Cuối cùng<br />
chúng tôi trình bày các kiểm định cho số liệu và mô hình đã trình bày ở trên.<br />
Từ khóa: số liệu mảng, mô hình tác động ngẫu nhiên, mô hình tác động cố định,<br />
Stata;<br />
<br />
ABSTRACTS<br />
In this paper we present the Panel data, and the importance of its unique adVantages<br />
in Vietnam economic analysis and forecasting. We also present two basic models and<br />
estimation methods to analyze array data. Finally we present the testing for data and<br />
model presented above.<br />
Keywords: panel data, random effects models, fixed effects models, Stata;<br />
<br />
1. SỐ LIỆU MẢNG VÀ TÍNH ƯU VIỆT lớn. Nhằm đáp ứng các yêu cầu ngày càng<br />
CỦA NÓ(*)(**)(***) tăng này của xã hội, chúng tôi giới thiệu về<br />
Quá trình hội nhập và phát triển đang số liệu mảng và các mô hình phân tích số<br />
làm cho nền kinh tế Việt Nam ngày càng liệu mảng cho các giảng viên và đặc biệt là<br />
tuân theo các quy luật kinh tế. Sự vận động các em sinh viên có nhu cầu tìm hiểu,<br />
của các quy luật này ẩn dấu sau các hiện nghiên cứu và vận dụng. Bài báo được chia<br />
tượng kinh tế chính là điều kiện nền tảng thành 3 phần ngoài các phần tóm tắt và<br />
cho việc áp dụng các mô hình kinh tế giới thiệu bao gồm: Thứ nhất, số liệu mảng<br />
lượng trong việc đưa ra các quyết định một và tính ưu việt của nó; Thứ hai, các mô<br />
cách khoa học và phù hợp với xu hướng hình phân tích số liệu mảng và câu lệnh<br />
phát triển. Ngày nay, việc sử dụng các mô trong phầm mềm Stata; thứ ba, kết luận.<br />
hình kinh tế lượng hiện đại trong phân tích Ngoài ra còn bổ sung phần bảng phụ lục và<br />
- dự báo đã trở thành nhu cầu thực tế tất tài liệu tham khảo.<br />
yếu của các cơ quan nghiên cứu hoạch định Trong phần này chúng tôi muốn làm rõ<br />
chính sách cũng như nhiều doanh nghiệp câu hỏi tại sao lại sử dụng mô hình phân<br />
tích số liệu mảng trong phân tích hồi quy?<br />
(*)<br />
ThS, Trường Đại học Sài Gòn Như chúng ta đã biết một vấn đề khá<br />
(**)<br />
ThS, Trường Đại học Vinh phổ biến trong phân tích hồi quy là biến<br />
(***)<br />
ThS, Trường Cao đẳng nghề Đồng An, nội sinh. Khi mô hình có hiện tượng này,<br />
Bình Dương<br />
<br />
84<br />
các ước lượng OLS( phương pháp bình Khi phân loại số liệu theo đặc trưng<br />
phương nhỏ nhất) cũng như các biến thể chiều của thông tin, chúng ta có thể phân ra<br />
của nó như GLS(Phương pháp ước lượng làm ba loại: số liệu chéo, số liệu theo chuỗi<br />
tác động ngẫu nhiên) hay phương sai thời gian và số liệu hỗn hợp, trong đó số<br />
mạnh đều là các ước lượng chệch và không liệu hỗn hợp được hiểu là số liệu kết hợp<br />
vững. Một nguyên nhân chính cho hiện cả chiều ngang của số liệu chéo và chiều<br />
tượng nội sinh của mô hình hồi quy là do dọc của chuỗi thời gian. Một dạng đặc biệt<br />
thiếu biến quan sát, một hiện tượng thường của số liệu hỗn hợp nhận được sự quan tâm<br />
gặp khi phân tích kinh tế. Đối với mô hình lớn của các nhà kinh tế lượng, đó là số liệu<br />
số liệu chéo, việc khắc phục hiện tượng mảng.<br />
thường được nhờ vào phương pháp biến Số liệu mảng: là tập số liệu thu thập được<br />
công cụ1, tuy nhiên phương pháp này là rất trên cùng một tập hợp các cá thể (hộ gia đình,<br />
khó thực hiện trong thực tế. Với số liệu doanh nghiệp, tỉnh, v.v) dọc theo thời gian tại<br />
mảng thì chúng ta sẽ có một phương pháp các mốc thời điểm cách đều nhau.<br />
khá hữu hiệu để giải quyết – do đó các mô Ví dụ điển hình về số liệu mảng trên thế<br />
hình phân tích số liệu mảng đặc biệt thích giới bao gồm bộ số liệu mảng điều tra quốc<br />
hợp cho các bài toán mà trong đó chúng ta gia về thanh niên (NLSY – national<br />
nghi ngờ có vấn đề về thiếu biến không longitudinal survey of youth) do Bộ lao động<br />
quan sát được. Mỹ thực hiện; số liệu điều tra hộ gia đình của<br />
Một số phương pháp cũng được sử Anh (BHPS- British household panel<br />
dụng để giải quyết vấn đề nội sinh trong survey), v.v. Ở Việt Nam có bộ số liệu về<br />
các tình huống tương ứng. Chẳng hạn nếu điều tra doanh nghiệp, bộ số liệu về điều tra<br />
nguyên nhân gây ra vấn đề nội sinh là sự mức sống hộ gia đình3- VHLSS (VLSS trước<br />
tác động đồng thời giữa các biến, chúng ta năm 2004) đều do Tổng cục Thống kê thực<br />
có thể dùng phương pháp hệ phương trình hiện điều tra. Gần đây có bộ số liệu về chỉ số<br />
đồng thời2. Khi số liệu là số liệu một chiều năng lực cạnh tranh cấp tỉnh (CPI –<br />
thì danh sách trên đây đã vét hết các biện competitiveness provincial index) thực hiện<br />
pháp hiện có trong việc xử lý vấn đề về cho 64 tỉnh thành trong cả nước4.<br />
biến nội sinh. Ngoài ra, trên website của Tổng cục<br />
Tuy nhiên khi chúng ta có số liệu Thống kê cũng cung cấp các số liệu vĩ mô<br />
mảng thì chúng ta có thêm một phương và vi mô cho cả nước, các tỉnh thành, hoặc<br />
pháp rất hữu hiệu, đó là các phương pháp phân theo khu vực địa lí kinh tế, thành<br />
phân tích số liệu mảng. Phương pháp này phần kinh tế, v.v- đều là các nguồn số liệu<br />
được sử dụng rất rộng rãi trong các nghiên mảng phong phú cho việc nghiên cứu kinh<br />
cứu kinh tế xã hội, giải quyết được vấn đề tế xã hội.<br />
về biến nội sinh do thiếu biến không quan Như vậy số liệu mảng chứa thông tin<br />
sát được gây ra. theo chiều ngang giữa các đối tượng tại<br />
Trước khi đi vào nghiên cứu các cùng một thời điểm– đặc trưng của số liệu<br />
phương pháp phân tích số liệu mảng, chéo, và thông tin dọc theo thời gian của<br />
chúng tôi xin được giới thiệu cơ bản về số từng đối tượng – đặc trưng của số liệu<br />
liệu mảng. chuỗi thời gian.<br />
Vậy số liệu mảng là gì?<br />
<br />
85<br />
Trong các phần mềm thống kê và kinh Nam, nơi mà hệ thống thu thập và quản lý<br />
tế lượng như STATA hay EVIEWS, số liệu số liệu còn hạn chế. Thêm vào đó là tính ổn<br />
mảng thường được sắp xếp dưới dạng định trong cấu trúc của nền kinh tế thường<br />
chiều dọc5. Số liệu mảng có hai loại, số chưa cao nên việc sử dụng chuỗi số dọc<br />
liệu mảng cân xứng và số liệu mảng không theo một khoảng thời gian dài thường là<br />
cân xứng. không thích hợp. Khi đó số liệu mảng đảm<br />
Số liệu mảng dạng cân xứng (balanced bảo được tính ổn định trong quan hệ giữa<br />
panel): nếu trong tập số liệu mảng mọi đơn các biến số, đồng thời đảm bảo được số<br />
vị được quan sát đều có mặt trong tất cả bậc tự do của mô hình là đủ lớn. Chẳng<br />
các thời kỳ quan sát thì tập số liệu được hạn với 64 tỉnh thành với các quan sát<br />
gọi là cân xứng. Ngược lại, nếu có đơn vị trong 5 năm thì chúng ta đã có đến 320<br />
mất quan sát tại một (hay nhiều) thời kỳ quan sát.<br />
nào đó thì tập số liệu được gọi là không Vậy số liệu mảng có những đặc trưng<br />
cân xứng. gì?<br />
Tuy nhiên trong phần này, chúng ta sẽ Số liệu mảng chứa thông tin theo hai<br />
chỉ quan tâm tới tập số liệu dạng cân xứng. chiều: chiều ngang theo các đơn vị quan<br />
Kích cỡ của số liệu: tuỳ thuộc vào N sát, và chiều dọc theo thời gian.<br />
và T mà tập số liệu mảng có thể thuộc một Thông tin theo chiều dọc cho biết điều<br />
trong các trường hợp sau đây gì? Để làm rõ điều này chúng ta quay lại số<br />
- N lớn và T nhỏ - là dạng số liệu liệu ở bảng 36. Trong bảng này ta còn có<br />
mảng truyền thống (zhang li – lecture thêm các cột như lao động, tài sản,…Ta<br />
notes). Đây là trường hợp N đủ lớn để có thấy rằng thông tin về sự thay đổi giá trị<br />
thể áp dụng luật số lớn và định lý giới hạn gia tăng Va còn ảnh hưởng của nhiều yếu<br />
trung tâm (n >30), và khi đó các suy diễn tố khác như lực lượng lao động, tài sản cố<br />
thống kê có thể áp dụng theo chiều ngang định của mỗi doanh nghiệp. Tương tự ta có<br />
của số liệu. thông tin về chiều ngang - cung cấp quan<br />
- N nhỏ và T lớn – (thông thường T sát về sự khác nhau giữa các cá thể trong<br />
>30). Trường hợp này cần quan tâm đến cùng một thời kỳ.<br />
vấn đề về tự tương quan. Nếu N quá nhỏ so Tóm lại, sự thay đổi trong giá trị của<br />
với T thì thực chất đây là bài toán hồi quy các biến trong bộ số liệu mảng được tạo ra<br />
chuỗi thời gian. từ hai nguồn: sự thay đổi trong nội bộ<br />
- N nhỏ và T nhỏ : trường hợp này ít chính bản thân mỗi cá thể dọc theo thời<br />
được quan tâm vì ứng dụng không rộng rãi, và gian và sự thay đổi giữa các cá thể trong<br />
việc suy diễn thống kê thường gặp khó khăn. cùng thời kỳ. Các biến số trong tập số liệu<br />
- N lớn và T lớn : số liệu dạng này mảng có thể gồm các nhóm như sau:<br />
vẫn đang được quan tâm nghiên cứu Nhóm 1: Các biến số thay đổi theo cả<br />
Trong tài liệu này chúng ta sẽ nói đến hai chiều như: sản lượng của doanh nghiệp,<br />
số liệu panel đặc trưng bởi N lớn và T nhỏ, tiêu dùng cá nhân, v.v.<br />
với T 2. Nhóm 2: Các biến số thay đổi theo<br />
Phân tích số liệu dạng mảng đặc biệt chiều ngang nhưng không thay đổi theo<br />
thích hợp với các nước đang phát triển và chiều dọc như: vị trí địa lý của doanh<br />
chuyển đổi nền kinh tế trong đó có Việt nghiệp, giới tính của chủ hộ, tôn giáo,.v.v<br />
<br />
86<br />
Nhóm 3: Các biến số thay đổi theo Một ví dụ kinh điển là về tỷ lệ tham<br />
chiều dọc nhưng không thay đổi theo chiều gia lao động của phụ nữ. Giả sử số liệu<br />
ngang như: tỷ giá, lãi suất cơ bản, môi quan sát trong năm 2009 thấy có 20% số<br />
trường kinh tế vĩ mô chung của cả phụ nữ ở một địa phương là không tham<br />
nước,.v.v gia lao động. Khi đó chúng ta không biết<br />
Do số liệu mảng chứa đựng thông tin được liệu có phải 20% phụ nữ ở vùng này<br />
hai chiều về sự biến đổi của các biến số, hoàn toàn không bao giờ tham gia vào lực<br />
nên nó có những ưu việt sau đây: lượng lao động hay hàng năm có 20% phụ<br />
Thứ nhất, Giải quyết vấn đề về thiếu nữ thay phiên nhau nghỉ việc. Nếu có số<br />
biến không quan sát được: liệu chẳng hạn cho hai năm liên tiếp thì<br />
Để minh hoạ, chúng ta quan tâm đến chúng ta hoàn toàn có thể phân biệt được<br />
việc đánh giá tác động của vốn đầu tư lên số liệu của chúng ta thuộc vào tình huống<br />
giá trị gia tăng Va trong bảng 3. Bây giờ nào.<br />
chúng ta hãy nhìn vào số liệu vốn đầu tư và Thứ 3, làm giảm nhẹ vấn đề về đa cộng<br />
giá trị gia tăng Va của mỗi ngành, và thấy tuyến trong bài toán có trễ phân phối<br />
rằng tại mỗi ngành, vốn đầu tư tăng kèm Bài toán có trễ phân phối thường có<br />
theo giá rị gia tăng Va tăng. Hãy đưa ra dạng sau : yt 0 xt 1xt 1 .. t k xt k ut<br />
một giả thiết rất thông thường rằng trong Thông thường, các giá trị nối tiếp nhau<br />
mười một năm 2000-2010 thì lực lượng lao của biến số xt thường có quan hệ tương<br />
động không đổi. Do đó khi xem xét sự thay quan rất chặt với nhau. Chẳng hạn trong<br />
đổi trong nội bộ mỗi ngành thì Va không bài toán thu nhập – chi tiêu thì một người<br />
còn chịu tác động của yếu tố lao động nữa có thu nhập kỳ trước lớn thì thu nhập kỳ<br />
mà chỉ còn chịu tác động của vốn đầu tư sau cũng thường lớn, do đó các giá trị của<br />
mà thôi. Nói một cách tổng quát, việc xem biến thu nhập có tự tương quan lớn. Và<br />
xét sự thay đổi trong nội bộ mỗi cá thể cho như vậy, trong các bài toán có trễ phân<br />
phép chúng ta bỏ qua tác động của các yếu phối thì đa công tuyến thường là một vấn<br />
tố không quan sát được, miễn là các yếu tố đề khá nghiêm trọng, làm giảm đáng kể<br />
này không thay đổi theo thời gian, mà tính chính xác của các suy diễn thống kê.<br />
không làm ảnh hưởng tới việc đánh giá tác Tuy nhiên khi có số liệu mảng thì sự thay<br />
động của các biến giải thích khác trong mô đổi theo cả chiều ngang của các biến số<br />
hình. Điều này là không thể thực hiện thường giúp làm giảm bậc của đa cộng<br />
được nếu chúng ta chỉ có số liệu chéo. Một tuyến nói trên, do đó làm tăng độ chính xác<br />
cách hoàn toàn tương tự, chúng ta cũng có của các suy diễn thống kê.<br />
thể xem xét vấn đề về yếu tố không quan Thứ tư, tăng bậc tự do, do đó làm tăng<br />
sát được mà nó chỉ thay đổi theo thời gian, độ chính xác của các suy diễn thống kê:<br />
ct. Trong nghiên cứu này chúng ta sẽ chỉ Một vấn đề thực nghiệm khi phân tích<br />
quan tâm đến loại hình thứ nhất : khi yếu kinh tế là vấn đề về kích thước mẫu. Khi số<br />
tố không quan sát được là không thay đổi quan sát của một mẫu là quá nhỏ khó có<br />
theo thời gian mà chỉ khác nhau giữa các thể đảm bảo được tính đại diện cho tổng<br />
cá thể. thể của mẫu này. Và do đó việc sử dụng<br />
Thứ hai, Đưa ra các phân tích mang các thông tin từ mẫu để đưa ra các suy diễn<br />
tính động, tinh tế :<br />
<br />
87<br />
thống kê về tổng thể là thiếu chính xác. 2.1. Mô hình và các giả thiết7<br />
Với số liệu mảng chúng ta thường không Xét mô hình với số liệu dạng mảng:<br />
phải lo lắng nhiều về kích thước mẫu. Do yit 1 2 X 2it .. k X kit vit (4.1)<br />
tính hai chiều của số liệu, chỉ cần một<br />
khoảng thời gian không dài cho một tập Trong đó vit = ci + uit được gọi là sai số<br />
vừa phải cá thể thì chúng ta đã có một số tổng hợp. Trước hết chúng ta sẽ giới thiệu<br />
quan sát khá lớn. Chẳng hạn với số liệu các giả thiết của mô hình.<br />
cho 64 tỉnh thành và 5 năm thì đã tạo nên Giả thiết RE1 : E(X’v) = 0<br />
một bộ số liệu với 320 quan sát. Do đó Giả thiết RE2: rankE ( X ' 1 X ) k<br />
kích thước mẫu lớn thường là một ưu điểm<br />
Trong đó Ω là ma trận hiệp phương<br />
đáng kể của số liệu mảng.<br />
sai :<br />
Thứ năm, đặc biệt thích hợp cho các<br />
Ω = cov (vi, vj).<br />
nước đang phát triển:<br />
Giả thiết RE3:<br />
Đối với các nước đang phát triển trong<br />
(a) cov(uit, ujs|Xi ) = 0 với t ≠ s hoặc i≠ j<br />
đó có Việt Nam thì số liệu thường là một<br />
vấn đề khá nghiêm trọng đối với các nhà (b) Var(uit|Xi) = u2 ;Var(ci|Xi ) = c ,<br />
2<br />
<br />
<br />
phân tích. Thông thường chúng ta không cov( ci, uit) = 0 với mọi i, t<br />
có số liệu quá dài trong quá khứ để có thể Mô hình (4.1) với các giả thiết RE1-<br />
đủ số quan sát, đảm bảo độ tin cậy của các RE3 được gọi là mô hình tác động ngẫu<br />
suy diễn thống kê trong các bài toán phân nhiên.<br />
tích động. Chẳng hạn khi số liệu về đầu tư Ma trận hiệp phương sai của sai số<br />
nước ngoài chỉ có một cách tương đối hệ ngẫu nhiên tổng hợp có dạng sau :<br />
thống từ cuối những năm 1990. Kể cả khi c2 u2 c2 . c2 <br />
<br />
chúng ta có số liệu đủ dài thì việc sử dụng 2 c2 u2 . . <br />
cov(vi , vi ) : c<br />
các mô hình chuỗi thời gian thường phải . . . . <br />
<br />
thận trọng do cấu trúc kinh tế thay đổi khá c<br />
2<br />
. . c u2 TxT<br />
2<br />
<br />
<br />
nhanh. Tuy nhiên với số liệu mảng, chúng<br />
ta không cần đến một lượng thời gian quá và :<br />
dài, do đó vẫn đảm bảo được tính ổn định<br />
0 . 0 <br />
về cấu trúc đồng thời vẫn đảm bảo một số 0 . .0 <br />
quan sát đủ lớn. cov(vit , v js ) (4.2)<br />
2. MÔ HÌNH TÁC ĐỘNG NGẪU NHIÊN . . . .<br />
VÀ ƯỚC LƯỢNG <br />
0 .0 . nTxnT<br />
Phần này chúng ta sẽ xem xét một mô<br />
hình rất thông dụng trong phân tích sử (4.2) được xem là ma trận hiệp phương<br />
dụng số liệu mảng - mô hình tác động ngẫu sai đặc trưng cho mô hình tác động ngẫu<br />
nhiên (random effect model). Mô hình này nhiên.<br />
được dùng cho các bài toán có vấn đề về 2.2. Các phương pháp ước lượng mô<br />
thiếu biến không quan sát được dạng ci, với hình tác động ngẫu nhiên<br />
điều kiện biến này là không tương quan với Có nhiều phương pháp để ước lượng<br />
các biến giải thích khác trong mô hình. mô hình này, trong khuôn khổ của bài báo<br />
<br />
<br />
88<br />
chúng tôi xin được giới thiệu hai phương Báo cáo từ Stata cũng cho biết các giá<br />
pháp sau: trị ước lượng của u và c . Trong bảng 4<br />
Phương pháp ước lượng tác động<br />
các giá trị này tương ứng là 1114680.5 và<br />
ngẫu nhiên (GLS)<br />
3451080.9. Các con số này cho thấy yếu tố<br />
Phương pháp GLS về thực chất là<br />
không quan sát được ci gây nên sự khác<br />
phương pháp bình phương bé nhất tổng<br />
biệt giữa các cá thể mạnh hơn nhiều so với<br />
quát áp dụng cho (4.1) với cấu trúc ma trận<br />
yếu tố ngẫu nhiên.<br />
hiệp phương sai dạng (4.2).<br />
Phương pháp ước lượng phương sai<br />
Do đó công thức cho các ước lượng là :<br />
mạnh cho mô hình tác động ngẫu nhiên:<br />
ˆRE ( X ' <br />
ˆ 1 X )1 ( X ' <br />
ˆ 1 y) (4.3)<br />
Khi giả thiết RE3 bị vi phạm thì chúng<br />
Trong đó ˆ là ước lượng của ta có thể sử dụng phương pháp ước lượng<br />
Phương pháp GLS xem tài liệu [2] phương sai mạnh [2], và kết quả thu được<br />
Phương pháp ước lượng hiệu ứng cho trong bảng 5 bằng cách gõ lệnh:<br />
ngẫu nhiên hợp lý cực đại (MLE) xtreg Y X2 Xk, re robust<br />
Phương pháp này là một sự mở rộng Trong đó xtreg: khai báohồi quy tuyến<br />
trực tiếp của phương pháp ước lượng hợp tính với số liệu mảng,<br />
lý cực đại đã được trình bày trong các tài Y: biến phụ thuộc, Xi: biến độc lập<br />
liệu về mô hình hồi quy thông thường cho Re robust: chạy quá trình hiệu chỉnh<br />
mô hình dạng số liệu gộp (4.1), trong đó Ta thu được kết quả như sau8<br />
các tham số ước lượng cần tìm để cực đại Chúng ta thấy tất cả thông số trong<br />
hàm hợp lý bao gồm thêm cả u2 ; c2 . Khi bảng 4 và bảng 5 đều như nhau, ngoại trừ<br />
số quan sát là lớn (>200) thì ước lượng thu sai số chuẩn (và các giá trị liên quan, bao<br />
được từ hai phương pháp là rất gần nhau. gồm các cột từ cột S.E trở đi) là khác nhau.<br />
Phương pháp MLE xem tài liệu [2] Có sự khác biệt này là do khi tính phương<br />
2.3. Ước lượng trong stata sai của các hệ số ước lượng, phương pháp<br />
Lệnh khai báo: xtset id time phương sai mạnh không sử dụng ma trận<br />
Trong đó biến id là biến chỉ cá thể, (4.2). Khi phương sai sai số là không đồng<br />
time là biến chỉ thời gian trong tệp số liệu đều thì ước lượng phương sai mạnh là hợp<br />
Câu lệnh thực hiện: xtreg Y X2 Xk, re lý. Tuy nhiên khi phương sai sai số là đồng<br />
Trong đó xtreg: khai báo số liệu mảng, đều thì ước lượng phương sai mạnh là<br />
Y: biến phụ thuộc, Xi: biến độc lập không hiệu quả bằng ước lượng GLS.<br />
re ngụ ý mô hình tác động ngẫu nhiên.<br />
Nhận xét:<br />
Ta thấy hệ số ước lượng của biến đầu<br />
tư là dương và có ý nghĩa thống kê.<br />
<br />
<br />
<br />
<br />
89<br />
3. BẢNG PHỤ LỤC<br />
Bảng 1. Bảng mã ngành tương ứng<br />
Ký hiệu Mã ngành Ngành<br />
id = 1 1711 Sản xuất sợi và dệt vải<br />
id = 2 1712 Hoàn thiện các sản phẩm dệt<br />
id =3 1721 Sản xuất các sản phẩm dệt may sẵn có<br />
id = 4 1722 Sản xuất thảm và chăn đệm<br />
id = 5 1723 Sản xuất dây bện và lưới<br />
id = 6 1729 Sản xuất các hàng dệt khác<br />
id = 7 1730 Sản xuất hàng đan móc<br />
id = 8 1810 May trang phục trừ quần áo da lông thú<br />
Thuộc và nhuộm da lông thú, sản xuất các sản phẩm từ lông<br />
id = 9 1820<br />
thú<br />
year Thời gian từ 2000 tới 2010<br />
<br />
<br />
Bảng 2. Cách sắp xếp số liệu mảng trong phần mềm Stata<br />
Cá thể Năm Y X2 X3<br />
1 2007 y1 X2,11 X3,11<br />
1 2008 y12 X2,12 X3,12<br />
1 2009 y13 X2,13 X3,13<br />
--<br />
I T yit X2,it X3,it<br />
--<br />
5 2007 y51 X2,51 X3,51<br />
5 2008 y52 X2,52 X3,52<br />
5 2009 y53 X2,53 X3,53<br />
<br />
Bảng 3. Trích số liệu mảng về ngành Dệt may (panel.dta)<br />
<br />
Id year Vondautu laodong Taisan Va<br />
1 2000 653543 79156 15359870 6526556<br />
1 2001 2525746 80050 17386609 7010251<br />
1 2002 2401084 85312 20833236 7676141<br />
1 2003 1578353 89877 21538049 9133104<br />
1 2004 1868260 84554 30050558 10189547<br />
1 2005 2374215 91235 35836248 11253494<br />
1 2006 3252080 68558 31112316 10731196<br />
1 2007 3661273 91388 46034361 16894620<br />
1 2008 10417284 85996 57124484 18284551<br />
<br />
90<br />
1 2009 5634574 89696 60161835 22640679<br />
1 2010 16252088 88527 80257565 30886679<br />
2 2000 10782 1220 163732 68053<br />
2 2001 194674 4313 682804 289112<br />
2 2002 267787 4973 1051643 339149<br />
2 2003 291252 7260 1510472 469237<br />
2 2004 167359 9680 1583210 389836<br />
2 2005 229313 10027 1839169 546273<br />
2 2006 311907 10216 3204596 851622<br />
2 2007 380374 11091 2754669 814837<br />
2 2008 437893 12148 3020878 996739<br />
2 2009 382229 14721 4069367 1373503<br />
2 2010 927621 18051 5706000 1799354<br />
<br />
Bảng 4. Kết quả ước lượng mô hình tác động ngẫu nhiên<br />
Random-effects GLS regression Number of obs = 99<br />
Group Variable: id Number of groups = 9<br />
R-sq: within = 0.6005 Obs per group: min = 11<br />
between = 0.9580 avg = 11.0<br />
overall = 0.7846 max = 11<br />
Random effects u_i ~ Gaussian Wald chi2(1) = 247.87<br />
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000<br />
------------------------------------------------------------------------------<br />
Va | Coef. Std. Err. z P>|z| [95% Conf. InterVal]<br />
-------------+----------------------------------------------------------------<br />
vondautu | 2.750478 .1747001 15.74 0.000 2.408072 3.092883<br />
_cons | 875611.6 579529.5 1.51 0.131 -260245.4 2011469<br />
-------------+----------------------------------------------------------------<br />
sigma_u | 1114680.5<br />
sigma_e | 3451080.9<br />
rho | .0944699 (fraction of Variance due to u_i)<br />
------------------------------------------------------------------------------<br />
<br />
<br />
Bảng 5. Mô hình tác động ngẫu nhiên với ma trận phương sai mạnh<br />
Random-effects GLS regression Number of obs = 99<br />
Group Variable: id Number of groups = 9<br />
R-sq: within = 0.6005 Obs per group: min = 11<br />
between = 0.9580 avg = 11.0<br />
overall = 0.7846 max = 11<br />
Random effects u_i ~ Gaussian Wald chi2(1) = 9.15<br />
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0025<br />
(Std. Err. adjusted for 9 clusters in id)<br />
------------------------------------------------------------------------------<br />
| Robust<br />
Va | Coef. Std. Err. z P>|z| [95% Conf. InterVal]<br />
-------------+----------------------------------------------------------------<br />
vondautu | 2.750478 .909056 3.03 0.002 .9687605 4.532195<br />
<br />
91<br />
_cons | 875611.6 891421.5 0.98 0.326 -871542.5 2622766<br />
-------------+----------------------------------------------------------------<br />
sigma_u | 1114680.5<br />
sigma_e | 3451080.9<br />
rho | .0944699 (fraction of Variance due to u_i)<br />
------------------------------------------------------------------------------<br />
sigma_u 30.506116<br />
sigma_e 4.8388767<br />
rho .97545723 (fraction of Variance due to u_i)<br />
<br />
<br />
Chú thích:<br />
1<br />
Xem tai liệu[7]<br />
2<br />
Xem tài liệu [2]<br />
3<br />
Tuy các bộ số liệu này về thực chất không phải là bộ số liệu mảng, nhưng có thể tách lọc<br />
ra để có được bộ số liệu mảng<br />
4<br />
website: www.pcivietnam.org.vn<br />
5<br />
Xem phần phụ lục về cách sắp xếp số liệu mảng<br />
6<br />
Xem phụ lục bảng 3<br />
7<br />
Xem chi tiết tài liệu [2]<br />
8<br />
Xem phụ lục kết quả theo phương pháp hồi quy mạnh<br />
<br />
<br />
TÀI LIỆU THAM KHẢO<br />
<br />
1. Arthur S.Goldberger, Econometric Theory, John Wiley & Sons,Inc<br />
2. Brown, M. B., and A. B. Forsythe. 1974. Robust test for the equality of Variances.<br />
Journal of the American Statistical Association 69: 364-367.<br />
3. Damodar N. Gujarati (1995), Basic Econometric, MacGraw-Hill Inc, Third Ed.<br />
4. Nguyễn Khắc Minh (2002), Các phương pháp phân tích và dự báo trong kinh tế, NXB<br />
Khoa học và Kỹ thuật Hà Nội.<br />
5. Nguyễn Quang Dong (2008), Bài giảng kinh tế lượng, NXB Giao thông vận tải Hà<br />
Nội.<br />
6. Jeffrey M. Wooldridge (2002), Econometric Analysis of Cross Section and Panel<br />
Data, The MIT Press Cambridge, Massachusetts London, England<br />
7. Madala, G.S-macmillan (19920), Introduction of Econometrics. 2d ed., New York.<br />
8. Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice–Hall.<br />
<br />
<br />
* Ngày nhận bài: 30/6/2014. Biên tập xong: 30/7/2014. Duyệt đăng: 05/8/2014<br />
<br />
<br />
<br />
<br />
92<br />