intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Mô hình phân tích số liệu mảng - thực hiện trên phần mềm Stata

Chia sẻ: ViMante2711 ViMante2711 | Ngày: | Loại File: PDF | Số trang:9

137
lượt xem
7
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết trình bày về số liệu mảng, tầm quan trọng và các đặc trưng ưu việt của nó trong việc phân tích và dự báo kinh tế. Bài viết cũng trình bày hai mô hình cơ bản và các phương pháp ước lượng để phân tích số liệu mảng. Cuối cùng chúng tôi trình bày các kiểm định cho số liệu và mô hình đã trình bày ở trên.

Chủ đề:
Lưu

Nội dung Text: Mô hình phân tích số liệu mảng - thực hiện trên phần mềm Stata

TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 22 - Thaùng 8/2014<br /> <br /> <br /> MÔ HÌNH PHÂN TÍCH SỐ LIỆU MẢNG<br /> - THỰC HIỆN TRÊN PHẦM MỀM STATA (KỲ 1)<br /> <br /> PHAN TẤT HIỂN(*)<br /> LÊ KHẮC PHONG(**)<br /> PHAN HUY BẰNG(***)<br /> <br /> TÓM TẮT<br /> Trong bài báo này chúng tôi trình bày về số liệu mảng, tầm quan trọng và các đặc<br /> trưng ưu việt của nó trong việc phân tích và dự báo kinh tế. Chúng tôi cũng trình bày hai<br /> mô hình cơ bản và các phương pháp ước lượng để phân tích số liệu mảng. Cuối cùng<br /> chúng tôi trình bày các kiểm định cho số liệu và mô hình đã trình bày ở trên.<br /> Từ khóa: số liệu mảng, mô hình tác động ngẫu nhiên, mô hình tác động cố định,<br /> Stata;<br /> <br /> ABSTRACTS<br /> In this paper we present the Panel data, and the importance of its unique adVantages<br /> in Vietnam economic analysis and forecasting. We also present two basic models and<br /> estimation methods to analyze array data. Finally we present the testing for data and<br /> model presented above.<br /> Keywords: panel data, random effects models, fixed effects models, Stata;<br /> <br /> 1. SỐ LIỆU MẢNG VÀ TÍNH ƯU VIỆT lớn. Nhằm đáp ứng các yêu cầu ngày càng<br /> CỦA NÓ(*)(**)(***) tăng này của xã hội, chúng tôi giới thiệu về<br /> Quá trình hội nhập và phát triển đang số liệu mảng và các mô hình phân tích số<br /> làm cho nền kinh tế Việt Nam ngày càng liệu mảng cho các giảng viên và đặc biệt là<br /> tuân theo các quy luật kinh tế. Sự vận động các em sinh viên có nhu cầu tìm hiểu,<br /> của các quy luật này ẩn dấu sau các hiện nghiên cứu và vận dụng. Bài báo được chia<br /> tượng kinh tế chính là điều kiện nền tảng thành 3 phần ngoài các phần tóm tắt và<br /> cho việc áp dụng các mô hình kinh tế giới thiệu bao gồm: Thứ nhất, số liệu mảng<br /> lượng trong việc đưa ra các quyết định một và tính ưu việt của nó; Thứ hai, các mô<br /> cách khoa học và phù hợp với xu hướng hình phân tích số liệu mảng và câu lệnh<br /> phát triển. Ngày nay, việc sử dụng các mô trong phầm mềm Stata; thứ ba, kết luận.<br /> hình kinh tế lượng hiện đại trong phân tích Ngoài ra còn bổ sung phần bảng phụ lục và<br /> - dự báo đã trở thành nhu cầu thực tế tất tài liệu tham khảo.<br /> yếu của các cơ quan nghiên cứu hoạch định Trong phần này chúng tôi muốn làm rõ<br /> chính sách cũng như nhiều doanh nghiệp câu hỏi tại sao lại sử dụng mô hình phân<br /> tích số liệu mảng trong phân tích hồi quy?<br /> (*)<br /> ThS, Trường Đại học Sài Gòn Như chúng ta đã biết một vấn đề khá<br /> (**)<br /> ThS, Trường Đại học Vinh phổ biến trong phân tích hồi quy là biến<br /> (***)<br /> ThS, Trường Cao đẳng nghề Đồng An, nội sinh. Khi mô hình có hiện tượng này,<br /> Bình Dương<br /> <br /> 84<br /> các ước lượng OLS( phương pháp bình Khi phân loại số liệu theo đặc trưng<br /> phương nhỏ nhất) cũng như các biến thể chiều của thông tin, chúng ta có thể phân ra<br /> của nó như GLS(Phương pháp ước lượng làm ba loại: số liệu chéo, số liệu theo chuỗi<br /> tác động ngẫu nhiên) hay phương sai thời gian và số liệu hỗn hợp, trong đó số<br /> mạnh đều là các ước lượng chệch và không liệu hỗn hợp được hiểu là số liệu kết hợp<br /> vững. Một nguyên nhân chính cho hiện cả chiều ngang của số liệu chéo và chiều<br /> tượng nội sinh của mô hình hồi quy là do dọc của chuỗi thời gian. Một dạng đặc biệt<br /> thiếu biến quan sát, một hiện tượng thường của số liệu hỗn hợp nhận được sự quan tâm<br /> gặp khi phân tích kinh tế. Đối với mô hình lớn của các nhà kinh tế lượng, đó là số liệu<br /> số liệu chéo, việc khắc phục hiện tượng mảng.<br /> thường được nhờ vào phương pháp biến Số liệu mảng: là tập số liệu thu thập được<br /> công cụ1, tuy nhiên phương pháp này là rất trên cùng một tập hợp các cá thể (hộ gia đình,<br /> khó thực hiện trong thực tế. Với số liệu doanh nghiệp, tỉnh, v.v) dọc theo thời gian tại<br /> mảng thì chúng ta sẽ có một phương pháp các mốc thời điểm cách đều nhau.<br /> khá hữu hiệu để giải quyết – do đó các mô Ví dụ điển hình về số liệu mảng trên thế<br /> hình phân tích số liệu mảng đặc biệt thích giới bao gồm bộ số liệu mảng điều tra quốc<br /> hợp cho các bài toán mà trong đó chúng ta gia về thanh niên (NLSY – national<br /> nghi ngờ có vấn đề về thiếu biến không longitudinal survey of youth) do Bộ lao động<br /> quan sát được. Mỹ thực hiện; số liệu điều tra hộ gia đình của<br /> Một số phương pháp cũng được sử Anh (BHPS- British household panel<br /> dụng để giải quyết vấn đề nội sinh trong survey), v.v. Ở Việt Nam có bộ số liệu về<br /> các tình huống tương ứng. Chẳng hạn nếu điều tra doanh nghiệp, bộ số liệu về điều tra<br /> nguyên nhân gây ra vấn đề nội sinh là sự mức sống hộ gia đình3- VHLSS (VLSS trước<br /> tác động đồng thời giữa các biến, chúng ta năm 2004) đều do Tổng cục Thống kê thực<br /> có thể dùng phương pháp hệ phương trình hiện điều tra. Gần đây có bộ số liệu về chỉ số<br /> đồng thời2. Khi số liệu là số liệu một chiều năng lực cạnh tranh cấp tỉnh (CPI –<br /> thì danh sách trên đây đã vét hết các biện competitiveness provincial index) thực hiện<br /> pháp hiện có trong việc xử lý vấn đề về cho 64 tỉnh thành trong cả nước4.<br /> biến nội sinh. Ngoài ra, trên website của Tổng cục<br /> Tuy nhiên khi chúng ta có số liệu Thống kê cũng cung cấp các số liệu vĩ mô<br /> mảng thì chúng ta có thêm một phương và vi mô cho cả nước, các tỉnh thành, hoặc<br /> pháp rất hữu hiệu, đó là các phương pháp phân theo khu vực địa lí kinh tế, thành<br /> phân tích số liệu mảng. Phương pháp này phần kinh tế, v.v- đều là các nguồn số liệu<br /> được sử dụng rất rộng rãi trong các nghiên mảng phong phú cho việc nghiên cứu kinh<br /> cứu kinh tế xã hội, giải quyết được vấn đề tế xã hội.<br /> về biến nội sinh do thiếu biến không quan Như vậy số liệu mảng chứa thông tin<br /> sát được gây ra. theo chiều ngang giữa các đối tượng tại<br /> Trước khi đi vào nghiên cứu các cùng một thời điểm– đặc trưng của số liệu<br /> phương pháp phân tích số liệu mảng, chéo, và thông tin dọc theo thời gian của<br /> chúng tôi xin được giới thiệu cơ bản về số từng đối tượng – đặc trưng của số liệu<br /> liệu mảng. chuỗi thời gian.<br /> Vậy số liệu mảng là gì?<br /> <br /> 85<br /> Trong các phần mềm thống kê và kinh Nam, nơi mà hệ thống thu thập và quản lý<br /> tế lượng như STATA hay EVIEWS, số liệu số liệu còn hạn chế. Thêm vào đó là tính ổn<br /> mảng thường được sắp xếp dưới dạng định trong cấu trúc của nền kinh tế thường<br /> chiều dọc5. Số liệu mảng có hai loại, số chưa cao nên việc sử dụng chuỗi số dọc<br /> liệu mảng cân xứng và số liệu mảng không theo một khoảng thời gian dài thường là<br /> cân xứng. không thích hợp. Khi đó số liệu mảng đảm<br /> Số liệu mảng dạng cân xứng (balanced bảo được tính ổn định trong quan hệ giữa<br /> panel): nếu trong tập số liệu mảng mọi đơn các biến số, đồng thời đảm bảo được số<br /> vị được quan sát đều có mặt trong tất cả bậc tự do của mô hình là đủ lớn. Chẳng<br /> các thời kỳ quan sát thì tập số liệu được hạn với 64 tỉnh thành với các quan sát<br /> gọi là cân xứng. Ngược lại, nếu có đơn vị trong 5 năm thì chúng ta đã có đến 320<br /> mất quan sát tại một (hay nhiều) thời kỳ quan sát.<br /> nào đó thì tập số liệu được gọi là không Vậy số liệu mảng có những đặc trưng<br /> cân xứng. gì?<br /> Tuy nhiên trong phần này, chúng ta sẽ Số liệu mảng chứa thông tin theo hai<br /> chỉ quan tâm tới tập số liệu dạng cân xứng. chiều: chiều ngang theo các đơn vị quan<br /> Kích cỡ của số liệu: tuỳ thuộc vào N sát, và chiều dọc theo thời gian.<br /> và T mà tập số liệu mảng có thể thuộc một Thông tin theo chiều dọc cho biết điều<br /> trong các trường hợp sau đây gì? Để làm rõ điều này chúng ta quay lại số<br /> - N lớn và T nhỏ - là dạng số liệu liệu ở bảng 36. Trong bảng này ta còn có<br /> mảng truyền thống (zhang li – lecture thêm các cột như lao động, tài sản,…Ta<br /> notes). Đây là trường hợp N đủ lớn để có thấy rằng thông tin về sự thay đổi giá trị<br /> thể áp dụng luật số lớn và định lý giới hạn gia tăng Va còn ảnh hưởng của nhiều yếu<br /> trung tâm (n >30), và khi đó các suy diễn tố khác như lực lượng lao động, tài sản cố<br /> thống kê có thể áp dụng theo chiều ngang định của mỗi doanh nghiệp. Tương tự ta có<br /> của số liệu. thông tin về chiều ngang - cung cấp quan<br /> - N nhỏ và T lớn – (thông thường T sát về sự khác nhau giữa các cá thể trong<br /> >30). Trường hợp này cần quan tâm đến cùng một thời kỳ.<br /> vấn đề về tự tương quan. Nếu N quá nhỏ so Tóm lại, sự thay đổi trong giá trị của<br /> với T thì thực chất đây là bài toán hồi quy các biến trong bộ số liệu mảng được tạo ra<br /> chuỗi thời gian. từ hai nguồn: sự thay đổi trong nội bộ<br /> - N nhỏ và T nhỏ : trường hợp này ít chính bản thân mỗi cá thể dọc theo thời<br /> được quan tâm vì ứng dụng không rộng rãi, và gian và sự thay đổi giữa các cá thể trong<br /> việc suy diễn thống kê thường gặp khó khăn. cùng thời kỳ. Các biến số trong tập số liệu<br /> - N lớn và T lớn : số liệu dạng này mảng có thể gồm các nhóm như sau:<br /> vẫn đang được quan tâm nghiên cứu Nhóm 1: Các biến số thay đổi theo cả<br /> Trong tài liệu này chúng ta sẽ nói đến hai chiều như: sản lượng của doanh nghiệp,<br /> số liệu panel đặc trưng bởi N lớn và T nhỏ, tiêu dùng cá nhân, v.v.<br /> với T  2. Nhóm 2: Các biến số thay đổi theo<br /> Phân tích số liệu dạng mảng đặc biệt chiều ngang nhưng không thay đổi theo<br /> thích hợp với các nước đang phát triển và chiều dọc như: vị trí địa lý của doanh<br /> chuyển đổi nền kinh tế trong đó có Việt nghiệp, giới tính của chủ hộ, tôn giáo,.v.v<br /> <br /> 86<br /> Nhóm 3: Các biến số thay đổi theo Một ví dụ kinh điển là về tỷ lệ tham<br /> chiều dọc nhưng không thay đổi theo chiều gia lao động của phụ nữ. Giả sử số liệu<br /> ngang như: tỷ giá, lãi suất cơ bản, môi quan sát trong năm 2009 thấy có 20% số<br /> trường kinh tế vĩ mô chung của cả phụ nữ ở một địa phương là không tham<br /> nước,.v.v gia lao động. Khi đó chúng ta không biết<br /> Do số liệu mảng chứa đựng thông tin được liệu có phải 20% phụ nữ ở vùng này<br /> hai chiều về sự biến đổi của các biến số, hoàn toàn không bao giờ tham gia vào lực<br /> nên nó có những ưu việt sau đây: lượng lao động hay hàng năm có 20% phụ<br /> Thứ nhất, Giải quyết vấn đề về thiếu nữ thay phiên nhau nghỉ việc. Nếu có số<br /> biến không quan sát được: liệu chẳng hạn cho hai năm liên tiếp thì<br /> Để minh hoạ, chúng ta quan tâm đến chúng ta hoàn toàn có thể phân biệt được<br /> việc đánh giá tác động của vốn đầu tư lên số liệu của chúng ta thuộc vào tình huống<br /> giá trị gia tăng Va trong bảng 3. Bây giờ nào.<br /> chúng ta hãy nhìn vào số liệu vốn đầu tư và Thứ 3, làm giảm nhẹ vấn đề về đa cộng<br /> giá trị gia tăng Va của mỗi ngành, và thấy tuyến trong bài toán có trễ phân phối<br /> rằng tại mỗi ngành, vốn đầu tư tăng kèm Bài toán có trễ phân phối thường có<br /> theo giá rị gia tăng Va tăng. Hãy đưa ra dạng sau : yt    0 xt  1xt 1  ..  t k xt k  ut<br /> một giả thiết rất thông thường rằng trong Thông thường, các giá trị nối tiếp nhau<br /> mười một năm 2000-2010 thì lực lượng lao của biến số xt thường có quan hệ tương<br /> động không đổi. Do đó khi xem xét sự thay quan rất chặt với nhau. Chẳng hạn trong<br /> đổi trong nội bộ mỗi ngành thì Va không bài toán thu nhập – chi tiêu thì một người<br /> còn chịu tác động của yếu tố lao động nữa có thu nhập kỳ trước lớn thì thu nhập kỳ<br /> mà chỉ còn chịu tác động của vốn đầu tư sau cũng thường lớn, do đó các giá trị của<br /> mà thôi. Nói một cách tổng quát, việc xem biến thu nhập có tự tương quan lớn. Và<br /> xét sự thay đổi trong nội bộ mỗi cá thể cho như vậy, trong các bài toán có trễ phân<br /> phép chúng ta bỏ qua tác động của các yếu phối thì đa công tuyến thường là một vấn<br /> tố không quan sát được, miễn là các yếu tố đề khá nghiêm trọng, làm giảm đáng kể<br /> này không thay đổi theo thời gian, mà tính chính xác của các suy diễn thống kê.<br /> không làm ảnh hưởng tới việc đánh giá tác Tuy nhiên khi có số liệu mảng thì sự thay<br /> động của các biến giải thích khác trong mô đổi theo cả chiều ngang của các biến số<br /> hình. Điều này là không thể thực hiện thường giúp làm giảm bậc của đa cộng<br /> được nếu chúng ta chỉ có số liệu chéo. Một tuyến nói trên, do đó làm tăng độ chính xác<br /> cách hoàn toàn tương tự, chúng ta cũng có của các suy diễn thống kê.<br /> thể xem xét vấn đề về yếu tố không quan Thứ tư, tăng bậc tự do, do đó làm tăng<br /> sát được mà nó chỉ thay đổi theo thời gian, độ chính xác của các suy diễn thống kê:<br /> ct. Trong nghiên cứu này chúng ta sẽ chỉ Một vấn đề thực nghiệm khi phân tích<br /> quan tâm đến loại hình thứ nhất : khi yếu kinh tế là vấn đề về kích thước mẫu. Khi số<br /> tố không quan sát được là không thay đổi quan sát của một mẫu là quá nhỏ khó có<br /> theo thời gian mà chỉ khác nhau giữa các thể đảm bảo được tính đại diện cho tổng<br /> cá thể. thể của mẫu này. Và do đó việc sử dụng<br /> Thứ hai, Đưa ra các phân tích mang các thông tin từ mẫu để đưa ra các suy diễn<br /> tính động, tinh tế :<br /> <br /> 87<br /> thống kê về tổng thể là thiếu chính xác. 2.1. Mô hình và các giả thiết7<br /> Với số liệu mảng chúng ta thường không Xét mô hình với số liệu dạng mảng:<br /> phải lo lắng nhiều về kích thước mẫu. Do yit  1  2 X 2it  ..  k X kit  vit (4.1)<br /> tính hai chiều của số liệu, chỉ cần một<br /> khoảng thời gian không dài cho một tập Trong đó vit = ci + uit được gọi là sai số<br /> vừa phải cá thể thì chúng ta đã có một số tổng hợp. Trước hết chúng ta sẽ giới thiệu<br /> quan sát khá lớn. Chẳng hạn với số liệu các giả thiết của mô hình.<br /> cho 64 tỉnh thành và 5 năm thì đã tạo nên Giả thiết RE1 : E(X’v) = 0<br /> một bộ số liệu với 320 quan sát. Do đó Giả thiết RE2: rankE ( X ' 1 X )  k<br /> kích thước mẫu lớn thường là một ưu điểm<br /> Trong đó Ω là ma trận hiệp phương<br /> đáng kể của số liệu mảng.<br /> sai :<br /> Thứ năm, đặc biệt thích hợp cho các<br /> Ω = cov (vi, vj).<br /> nước đang phát triển:<br /> Giả thiết RE3:<br /> Đối với các nước đang phát triển trong<br /> (a) cov(uit, ujs|Xi ) = 0 với t ≠ s hoặc i≠ j<br /> đó có Việt Nam thì số liệu thường là một<br /> vấn đề khá nghiêm trọng đối với các nhà (b) Var(uit|Xi) =  u2 ;Var(ci|Xi ) =  c ,<br /> 2<br /> <br /> <br /> phân tích. Thông thường chúng ta không cov( ci, uit) = 0 với mọi i, t<br /> có số liệu quá dài trong quá khứ để có thể Mô hình (4.1) với các giả thiết RE1-<br /> đủ số quan sát, đảm bảo độ tin cậy của các RE3 được gọi là mô hình tác động ngẫu<br /> suy diễn thống kê trong các bài toán phân nhiên.<br /> tích động. Chẳng hạn khi số liệu về đầu tư Ma trận hiệp phương sai của sai số<br /> nước ngoài chỉ có một cách tương đối hệ ngẫu nhiên tổng hợp có dạng sau :<br /> thống từ cuối những năm 1990. Kể cả khi   c2   u2  c2 .  c2 <br />  <br /> chúng ta có số liệu đủ dài thì việc sử dụng 2  c2   u2 . . <br /> cov(vi , vi ) :    c<br /> các mô hình chuỗi thời gian thường phải  . . . . <br />  <br /> thận trọng do cấu trúc kinh tế thay đổi khá  c<br /> 2<br /> . .  c   u2 TxT<br /> 2<br /> <br /> <br /> nhanh. Tuy nhiên với số liệu mảng, chúng<br /> ta không cần đến một lượng thời gian quá và :<br /> dài, do đó vẫn đảm bảo được tính ổn định<br />  0 . 0 <br /> về cấu trúc đồng thời vẫn đảm bảo một số  0  . .0 <br /> quan sát đủ lớn. cov(vit , v js )    (4.2)<br /> 2. MÔ HÌNH TÁC ĐỘNG NGẪU NHIÊN . . . .<br /> VÀ ƯỚC LƯỢNG  <br />  0 .0 .  nTxnT<br /> Phần này chúng ta sẽ xem xét một mô<br /> hình rất thông dụng trong phân tích sử (4.2) được xem là ma trận hiệp phương<br /> dụng số liệu mảng - mô hình tác động ngẫu sai đặc trưng cho mô hình tác động ngẫu<br /> nhiên (random effect model). Mô hình này nhiên.<br /> được dùng cho các bài toán có vấn đề về 2.2. Các phương pháp ước lượng mô<br /> thiếu biến không quan sát được dạng ci, với hình tác động ngẫu nhiên<br /> điều kiện biến này là không tương quan với Có nhiều phương pháp để ước lượng<br /> các biến giải thích khác trong mô hình. mô hình này, trong khuôn khổ của bài báo<br /> <br /> <br /> 88<br /> chúng tôi xin được giới thiệu hai phương Báo cáo từ Stata cũng cho biết các giá<br /> pháp sau: trị ước lượng của  u và  c . Trong bảng 4<br /> Phương pháp ước lượng tác động<br /> các giá trị này tương ứng là 1114680.5 và<br /> ngẫu nhiên (GLS)<br /> 3451080.9. Các con số này cho thấy yếu tố<br /> Phương pháp GLS về thực chất là<br /> không quan sát được ci gây nên sự khác<br /> phương pháp bình phương bé nhất tổng<br /> biệt giữa các cá thể mạnh hơn nhiều so với<br /> quát áp dụng cho (4.1) với cấu trúc ma trận<br /> yếu tố ngẫu nhiên.<br /> hiệp phương sai dạng (4.2).<br /> Phương pháp ước lượng phương sai<br /> Do đó công thức cho các ước lượng là :<br /> mạnh cho mô hình tác động ngẫu nhiên:<br /> ˆRE  ( X ' <br /> ˆ 1 X )1 ( X ' <br /> ˆ 1 y) (4.3)<br /> Khi giả thiết RE3 bị vi phạm thì chúng<br /> Trong đó  ˆ là ước lượng của  ta có thể sử dụng phương pháp ước lượng<br /> Phương pháp GLS xem tài liệu [2] phương sai mạnh [2], và kết quả thu được<br /> Phương pháp ước lượng hiệu ứng cho trong bảng 5 bằng cách gõ lệnh:<br /> ngẫu nhiên hợp lý cực đại (MLE) xtreg Y X2 Xk, re robust<br /> Phương pháp này là một sự mở rộng Trong đó xtreg: khai báohồi quy tuyến<br /> trực tiếp của phương pháp ước lượng hợp tính với số liệu mảng,<br /> lý cực đại đã được trình bày trong các tài Y: biến phụ thuộc, Xi: biến độc lập<br /> liệu về mô hình hồi quy thông thường cho Re robust: chạy quá trình hiệu chỉnh<br /> mô hình dạng số liệu gộp (4.1), trong đó Ta thu được kết quả như sau8<br /> các tham số ước lượng cần tìm để cực đại Chúng ta thấy tất cả thông số trong<br /> hàm hợp lý bao gồm thêm cả  u2 ; c2 . Khi bảng 4 và bảng 5 đều như nhau, ngoại trừ<br /> số quan sát là lớn (>200) thì ước lượng thu sai số chuẩn (và các giá trị liên quan, bao<br /> được từ hai phương pháp là rất gần nhau. gồm các cột từ cột S.E trở đi) là khác nhau.<br /> Phương pháp MLE xem tài liệu [2] Có sự khác biệt này là do khi tính phương<br /> 2.3. Ước lượng trong stata sai của các hệ số ước lượng, phương pháp<br /> Lệnh khai báo: xtset id time phương sai mạnh không sử dụng ma trận<br /> Trong đó biến id là biến chỉ cá thể, (4.2). Khi phương sai sai số là không đồng<br /> time là biến chỉ thời gian trong tệp số liệu đều thì ước lượng phương sai mạnh là hợp<br /> Câu lệnh thực hiện: xtreg Y X2 Xk, re lý. Tuy nhiên khi phương sai sai số là đồng<br /> Trong đó xtreg: khai báo số liệu mảng, đều thì ước lượng phương sai mạnh là<br /> Y: biến phụ thuộc, Xi: biến độc lập không hiệu quả bằng ước lượng GLS.<br /> re ngụ ý mô hình tác động ngẫu nhiên.<br /> Nhận xét:<br /> Ta thấy hệ số ước lượng của biến đầu<br /> tư là dương và có ý nghĩa thống kê.<br /> <br /> <br /> <br /> <br /> 89<br /> 3. BẢNG PHỤ LỤC<br /> Bảng 1. Bảng mã ngành tương ứng<br /> Ký hiệu Mã ngành Ngành<br /> id = 1 1711 Sản xuất sợi và dệt vải<br /> id = 2 1712 Hoàn thiện các sản phẩm dệt<br /> id =3 1721 Sản xuất các sản phẩm dệt may sẵn có<br /> id = 4 1722 Sản xuất thảm và chăn đệm<br /> id = 5 1723 Sản xuất dây bện và lưới<br /> id = 6 1729 Sản xuất các hàng dệt khác<br /> id = 7 1730 Sản xuất hàng đan móc<br /> id = 8 1810 May trang phục trừ quần áo da lông thú<br /> Thuộc và nhuộm da lông thú, sản xuất các sản phẩm từ lông<br /> id = 9 1820<br /> thú<br /> year Thời gian từ 2000 tới 2010<br /> <br /> <br /> Bảng 2. Cách sắp xếp số liệu mảng trong phần mềm Stata<br /> Cá thể Năm Y X2 X3<br /> 1 2007 y1 X2,11 X3,11<br /> 1 2008 y12 X2,12 X3,12<br /> 1 2009 y13 X2,13 X3,13<br /> --<br /> I T yit X2,it X3,it<br /> --<br /> 5 2007 y51 X2,51 X3,51<br /> 5 2008 y52 X2,52 X3,52<br /> 5 2009 y53 X2,53 X3,53<br /> <br /> Bảng 3. Trích số liệu mảng về ngành Dệt may (panel.dta)<br /> <br /> Id year Vondautu laodong Taisan Va<br /> 1 2000 653543 79156 15359870 6526556<br /> 1 2001 2525746 80050 17386609 7010251<br /> 1 2002 2401084 85312 20833236 7676141<br /> 1 2003 1578353 89877 21538049 9133104<br /> 1 2004 1868260 84554 30050558 10189547<br /> 1 2005 2374215 91235 35836248 11253494<br /> 1 2006 3252080 68558 31112316 10731196<br /> 1 2007 3661273 91388 46034361 16894620<br /> 1 2008 10417284 85996 57124484 18284551<br /> <br /> 90<br /> 1 2009 5634574 89696 60161835 22640679<br /> 1 2010 16252088 88527 80257565 30886679<br /> 2 2000 10782 1220 163732 68053<br /> 2 2001 194674 4313 682804 289112<br /> 2 2002 267787 4973 1051643 339149<br /> 2 2003 291252 7260 1510472 469237<br /> 2 2004 167359 9680 1583210 389836<br /> 2 2005 229313 10027 1839169 546273<br /> 2 2006 311907 10216 3204596 851622<br /> 2 2007 380374 11091 2754669 814837<br /> 2 2008 437893 12148 3020878 996739<br /> 2 2009 382229 14721 4069367 1373503<br /> 2 2010 927621 18051 5706000 1799354<br /> <br /> Bảng 4. Kết quả ước lượng mô hình tác động ngẫu nhiên<br /> Random-effects GLS regression Number of obs = 99<br /> Group Variable: id Number of groups = 9<br /> R-sq: within = 0.6005 Obs per group: min = 11<br /> between = 0.9580 avg = 11.0<br /> overall = 0.7846 max = 11<br /> Random effects u_i ~ Gaussian Wald chi2(1) = 247.87<br /> corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000<br /> ------------------------------------------------------------------------------<br /> Va | Coef. Std. Err. z P>|z| [95% Conf. InterVal]<br /> -------------+----------------------------------------------------------------<br /> vondautu | 2.750478 .1747001 15.74 0.000 2.408072 3.092883<br /> _cons | 875611.6 579529.5 1.51 0.131 -260245.4 2011469<br /> -------------+----------------------------------------------------------------<br /> sigma_u | 1114680.5<br /> sigma_e | 3451080.9<br /> rho | .0944699 (fraction of Variance due to u_i)<br /> ------------------------------------------------------------------------------<br /> <br /> <br /> Bảng 5. Mô hình tác động ngẫu nhiên với ma trận phương sai mạnh<br /> Random-effects GLS regression Number of obs = 99<br /> Group Variable: id Number of groups = 9<br /> R-sq: within = 0.6005 Obs per group: min = 11<br /> between = 0.9580 avg = 11.0<br /> overall = 0.7846 max = 11<br /> Random effects u_i ~ Gaussian Wald chi2(1) = 9.15<br /> corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0025<br /> (Std. Err. adjusted for 9 clusters in id)<br /> ------------------------------------------------------------------------------<br /> | Robust<br /> Va | Coef. Std. Err. z P>|z| [95% Conf. InterVal]<br /> -------------+----------------------------------------------------------------<br /> vondautu | 2.750478 .909056 3.03 0.002 .9687605 4.532195<br /> <br /> 91<br /> _cons | 875611.6 891421.5 0.98 0.326 -871542.5 2622766<br /> -------------+----------------------------------------------------------------<br /> sigma_u | 1114680.5<br /> sigma_e | 3451080.9<br /> rho | .0944699 (fraction of Variance due to u_i)<br /> ------------------------------------------------------------------------------<br /> sigma_u 30.506116<br /> sigma_e 4.8388767<br /> rho .97545723 (fraction of Variance due to u_i)<br /> <br /> <br /> Chú thích:<br /> 1<br /> Xem tai liệu[7]<br /> 2<br /> Xem tài liệu [2]<br /> 3<br /> Tuy các bộ số liệu này về thực chất không phải là bộ số liệu mảng, nhưng có thể tách lọc<br /> ra để có được bộ số liệu mảng<br /> 4<br /> website: www.pcivietnam.org.vn<br /> 5<br /> Xem phần phụ lục về cách sắp xếp số liệu mảng<br /> 6<br /> Xem phụ lục bảng 3<br /> 7<br /> Xem chi tiết tài liệu [2]<br /> 8<br /> Xem phụ lục kết quả theo phương pháp hồi quy mạnh<br /> <br /> <br /> TÀI LIỆU THAM KHẢO<br /> <br /> 1. Arthur S.Goldberger, Econometric Theory, John Wiley & Sons,Inc<br /> 2. Brown, M. B., and A. B. Forsythe. 1974. Robust test for the equality of Variances.<br /> Journal of the American Statistical Association 69: 364-367.<br /> 3. Damodar N. Gujarati (1995), Basic Econometric, MacGraw-Hill Inc, Third Ed.<br /> 4. Nguyễn Khắc Minh (2002), Các phương pháp phân tích và dự báo trong kinh tế, NXB<br /> Khoa học và Kỹ thuật Hà Nội.<br /> 5. Nguyễn Quang Dong (2008), Bài giảng kinh tế lượng, NXB Giao thông vận tải Hà<br /> Nội.<br /> 6. Jeffrey M. Wooldridge (2002), Econometric Analysis of Cross Section and Panel<br /> Data, The MIT Press Cambridge, Massachusetts London, England<br /> 7. Madala, G.S-macmillan (19920), Introduction of Econometrics. 2d ed., New York.<br /> 8. Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice–Hall.<br /> <br /> <br /> * Ngày nhận bài: 30/6/2014. Biên tập xong: 30/7/2014. Duyệt đăng: 05/8/2014<br /> <br /> <br /> <br /> <br /> 92<br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
5=>2