Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
09.12.2017<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
Phân tích hồi quy bội với biến<br />
định tính<br />
<br />
7.1 Mô tả thông tin định tính<br />
<br />
Ví dụ: giới tính, chủng tộc, công nghiệp, khu vực, đánh giá cấp độ, ...<br />
<br />
Chương 7<br />
<br />
Một cách để kết hợp thông tin định tính là sử dụng biến giả<br />
<br />
Chúng có thể xuất hiện như là biến phụ thuộc hay biến độc lập<br />
<br />
7.2 Trường hợp đơn giản: Có một biến độc lập là biến giả<br />
<br />
Wooldridge: Introductory Econometrics:<br />
A Modern Approach, 5e<br />
<br />
7.1<br />
= mức lương thu được/mất đi nếu<br />
người này là nữ chứ không phải là<br />
nam (các yếu tố khác giữ cố định)<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
PHÂN TÍCH HỒI QUY BỘI:<br />
BIẾN ĐỊNH TÍNH<br />
<br />
Biến giả:<br />
=1 nếu là nữ<br />
=0 nếu là nam<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
Đồ thị minh họa<br />
Cách giải thích khác của hệ số:<br />
<br />
7.2<br />
<br />
nghĩa là, sự khác biệt về mức lương trung<br />
<br />
bình giữa nam và nữ có cùng một trình độ<br />
giáo dục (nữ so với nam).<br />
<br />
female=0 : nhóm cơ sở (tham chiếu)<br />
Cùng hệ số góc, khác tung độ gốc<br />
<br />
3<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
1<br />
<br />
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
Bẫy biến giả<br />
<br />
09.12.2017<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
Mô hình này không thể ước lượng được (đa cộng<br />
tuyến hoàn hảo do Male + female = 1)<br />
<br />
VD 7.1: Ước lượng phương trình tiền lương với sự khác biệt về hệ số chặn<br />
<br />
7.4<br />
<br />
Khi sử dụng biến giả, một thuộc tính luôn luôn phải được loại bỏ:<br />
<br />
Cố định các biến giáo dục, kinh<br />
nghiệm, và thâm niên chức vụ, tiền<br />
lương trung bình của nữ ít hơn nam<br />
là 1,81 USD/giờ<br />
<br />
Nhóm cơ sở là nam<br />
Nhóm cơ sở là nữ<br />
Nhược điểm:<br />
<br />
Ngoài ra, có thể bỏ qua tung độ gốc:<br />
<br />
1) Khó khăn hơn để kiểm định sự<br />
khác biệt giữa các tham số<br />
<br />
2) Công thức R2 chỉ có ý nghĩa<br />
nếu hồi quy có tung độ gốc<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
So sánh trung bình của các tổng thể con được mô tả bằng biến giả<br />
<br />
7.5<br />
<br />
Thảo luận<br />
<br />
Điều đó có nghĩa rằng có sự phân biệt đối xử với nữ giới?<br />
<br />
Không hẳn vậy. Bởi vì yếu tố giới tính nữ có thể tương quan với các đặc điểm<br />
lao động khác chưa được kiểm soát.<br />
<br />
H0: βfemale = 0 ; H1: βfemale ≠ 0 Xét xem yếu tố giới tính có ảnh hưởng đến lương không<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
Ví dụ 7.3: Ảnh hưởng của trợ cấp đào tạo lên số giờ đào tạo<br />
Giờ đào tạo mỗi nhân viên<br />
<br />
Biến giả biểu thị công ty có nhận trợ cấp đào tạo nghề hay không<br />
<br />
Trong điều kiện không kiểm soát các yếu tố khác,<br />
tiền lương trung bình của nữ ít hơn nam là 2,51<br />
USD/giờ; nghĩa là, sự khác biệt giữa mức lương<br />
trung bình của nam và nữ là 2,51 USD/giờ.<br />
<br />
Có thể dễ dàng kiểm định sự chênh lệch trung bình giữa hai tổng thể con có ý nghĩa thống kê hay<br />
không (|t|= 9.65).<br />
<br />
Sự khác biệt về mức lương giữa nam và nữ sẽ lớn hơn nếu không kiểm soát các yếu tố khác; nghĩa<br />
<br />
là một phần của sự khác biệt là do sự khác nhau trong giáo dục, kinh nghiệm và thâm niên chức vụ<br />
giữa nam và nữ. Số 1.81 trong (7.4) nhỏ hơn 2.51 trong (7.5).<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
7.7<br />
<br />
Đây là một ví dụ về đánh giá chương trình<br />
<br />
nhóm tác động (= có nhận trợ cấp) so với nhóm đối chứng (= không có nhận trợ<br />
cấp). Nhóm đối chứng còn gọi là nhóm kiểm soát.<br />
<br />
Liệu có phải tác động của chương trình đến biến phụ thuộc là quan hệ nhân quả?<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
2<br />
<br />
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
09.12.2017<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
Sử dụng biến độc lập là biến giả trong phương trình log(y)<br />
<br />
7.3 Sử dụng biến giả cho trường hợp biến định tính có nhiều lựa chọn<br />
<br />
VD 7.4: Hàm hồi quy giá nhà<br />
<br />
7.8<br />
Biến giả biểu thị ngôi<br />
nhà kiểu colonial<br />
colonial = 1 nếu ngôi<br />
nhà có phong cách<br />
thuộc địa<br />
Khi biến giả colonial thay đổi<br />
từ 0 đến 1, giá nhà trung bình<br />
tăng 5,4 (%)<br />
<br />
1) Xác định thành phần trong mỗi nhóm bằng một biến giả<br />
2) Bỏ ra một nhóm (nhóm này sẽ trở thành nhóm cơ sở)<br />
<br />
Câu hỏi: Nên dùng<br />
bao nhiêu biến giả?<br />
<br />
VD 7.6: Phương trình log tiền lương theo giờ<br />
<br />
7.11<br />
<br />
Giữ những yếu tố khác cố định, tiền lương<br />
trung bình của nữ đã kết hôn ít hơn nam<br />
độc thân (= nhóm cơ sở) là 19,8%<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
PHÂN TÍCH HỒI QUY BỘI:<br />
BIẾN ĐỊNH TÍNH<br />
<br />
Giữ những yếu tố khác cố định, tiền lương trung bình của nam đã kết hôn nhiều hơn nam độc thân là 21,3%<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
PHÂN TÍCH HỒI QUY BỘI:<br />
BIẾN ĐỊNH TÍNH<br />
<br />
Dùng bao nhiêu biến giả là đủ?<br />
<br />
B) Tương tác giữa các biến giả<br />
<br />
1) Giới tính (nữ, nam), dùng 2-1 = 1 biến giả<br />
<br />
Giới tính (nữ, nam)<br />
<br />
1) Các biến giả có 2 thuộc tính<br />
<br />
A) Biến định tính có nhiều thuộc tính<br />
<br />
Tình trạng hôn nhân (có gia đình, độc thân)<br />
<br />
nu (nu=1: nữ)<br />
<br />
Kết hợp giới tính và tình trạng hôn nhân: 2*2 = 4 trường hợp,<br />
<br />
Nhóm cơ sở là: nam<br />
<br />
dùng 4-1 = 3 biến giả<br />
<br />
2) Giới tính (nữ, nam, hifi), dùng 3-1 = 2 biến giả<br />
<br />
nu*cogd: nữ và có gia đình<br />
<br />
nu (nu=1: nữ)<br />
<br />
nu*docthan: nữ và độc thân<br />
<br />
nam (nam=1: nam)<br />
<br />
Nhóm cơ sở là: hifi<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
nam*cogd: nam và có gia đình<br />
11<br />
<br />
Nhóm cơ sở là: nam*docthan<br />
<br />
12<br />
<br />
3<br />
<br />
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
09.12.2017<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
PHÂN TÍCH HỒI QUY BỘI:<br />
BIẾN ĐỊNH TÍNH<br />
<br />
B) Tương tác giữa các biến giả<br />
<br />
Sử dụng biến giả cho trường hợp biến thứ bậc<br />
<br />
2) Các biến giả có 2, 3 thuộc tính<br />
<br />
Ví dụ: Xếp hạng tín dụng của thành phố và lãi suất trái phiếu đô thị<br />
<br />
Giới tính (nữ, nam)<br />
<br />
Chủng tộc (da trắng, da vàng, da đen)<br />
<br />
Lãi suất trái phiếu đô thị<br />
<br />
Kết hợp Giới tính và Chủng tộc: 2*3 = 6 trường hợp,<br />
<br />
Xếp hạng tín dụng từ 0-4 (0=tệ, 4=rất tốt)<br />
<br />
dùng 6-1 = 5 biến giả<br />
<br />
Nu*datrang: nữ và da trắng<br />
<br />
Mô tả này có lẽ không phù hợp nếu như xếp hạng tín dụng chỉ chứa thông tin thứ bậc.<br />
Một cách tốt hơn để đưa thông tin thứ bậc này vào hồi quy là sử dụng nhiều biến giả:<br />
<br />
Nu*davang: nữ và da vàng<br />
Nu*daden: nữ và da đen<br />
<br />
7.12<br />
<br />
Nam*datrang: nam và da trắng<br />
<br />
Nam*davang : nam và da vàng<br />
Nhóm cơ sở là: nam*daden<br />
<br />
13<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
7.4 Thành phần tương tác có biến giả<br />
<br />
Cho phép hệ số góc khác nhau giữa các nhóm<br />
<br />
= hệ số chặn của nam<br />
= hệ số chặn của nữ<br />
<br />
Thành phần tương tác<br />
<br />
Đồ thị minh họa<br />
<br />
7.17<br />
<br />
= hệ số góc của nam<br />
= hệ số góc của nữ<br />
<br />
Tiền lương là như nhau giữa nam và nữ, có cùng mức học<br />
vấn. Hay yếu tố giới tính không tác động đến tiền lương<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
Giả thuyết quan tâm<br />
<br />
Tác động của học vấn là như nhau giữa nam<br />
và nữ. Mức chênh lệch tiền lương giữa nữ và<br />
nam là như nhau ở mọi mức học vấn.<br />
<br />
Các biến giả được đặt tương ứng với các mức xếp hạng tín dụng. Nghĩa là, CR1 = 1 nếu CR = 1<br />
và CR1 = 0 cho các trường hợp khác.<br />
Tất cả các tác động được so sánh với mức xếp hạng tệ nhất (= nhóm cơ sở).<br />
<br />
Việc sử dụng vừa biến giả vừa biến<br />
tương tác cho phép hai phương trình<br />
tiền lương hoàn toàn khác nhau giữa<br />
nam và nữ<br />
<br />
Khác hệ số góc,<br />
khác tung độ gốc<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
4<br />
<br />
Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
09.12.2017<br />
<br />
Phân tích hồi quy bội:<br />
Biến định tính<br />
<br />
PHÂN TÍCH HỒI QUY BỘI: BIẾN<br />
ĐỊNH TÍNH<br />
• Tập tin wage1.wf1<br />
<br />
Dependent Variable: WAGE (khác tung độ gốc)<br />
Included observations: 526<br />
Variable<br />
<br />
C<br />
FEMALE<br />
EDUC<br />
<br />
Coefficient<br />
0.622817<br />
-2.273362<br />
0.506452<br />
<br />
Ước lượng phương trình lương với thành phần tương tác<br />
VD 7.10: phương trình log tiền lương theo giờ<br />
<br />
Std. Error<br />
<br />
0.672533<br />
0.279044<br />
0.050391<br />
<br />
7.18<br />
<br />
Dependent Variable: WAGE (khác hệ số góc)<br />
Included observations: 526<br />
Variable<br />
<br />
C<br />
EDUC<br />
FEMALE*EDUC<br />
<br />
Coefficient<br />
-0.285264<br />
0.575483<br />
-0.177639<br />
<br />
Std. Error<br />
0.650415<br />
0.050389<br />
0.021828<br />
<br />
khác hệ số góc<br />
<br />
Dependent Variable: WAGE (khác hệ số góc và khác tung độ gốc)<br />
Included observations: 526<br />
Variable<br />
<br />
Coefficient<br />
<br />
Std. Error<br />
<br />
C<br />
FEMALE<br />
EDUC<br />
FEMALE*EDUC<br />
<br />
0.200496<br />
-1.198523<br />
0.539476<br />
-0.085999<br />
<br />
0.843562<br />
1.325040<br />
0.064223<br />
0.103639<br />
<br />
17<br />
<br />
PHÂN TÍCH HỒI QUY BỘI:<br />
BIẾN ĐỊNH TÍNH<br />
<br />
Coefficient<br />
<br />
Std. Error<br />
<br />
t-Statistic<br />
<br />
C<br />
FEMALE<br />
EDUC<br />
FEMALE*EDUC<br />
EXPER<br />
EXPER^2<br />
TENURE<br />
TENURE^2<br />
<br />
0.388806<br />
-0.226789<br />
0.082369<br />
-0.005565<br />
0.029337<br />
-0.000580<br />
0.031897<br />
-0.000590<br />
<br />
0.118687<br />
0.167539<br />
0.008470<br />
0.013062<br />
0.004984<br />
0.000108<br />
0.006864<br />
0.000235<br />
<br />
3.275892<br />
-1.353643<br />
9.724919<br />
-0.426013<br />
5.885973<br />
-5.397767<br />
4.646956<br />
-2.508901<br />
<br />
Variable<br />
<br />
Prob.<br />
0.0011<br />
0.1764<br />
0.0000<br />
0.6703<br />
0.0000<br />
0.0000<br />
0.0000<br />
0.0124<br />
<br />
0.440964<br />
<br />
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Dependent Variable: LOG(WAGE)<br />
Method: Least Squares<br />
Included observations: 526<br />
<br />
(EQ01)<br />
<br />
Variable<br />
<br />
R-squared<br />
<br />
Liệu điều này có hàm ý rằng khi có cùng trình độ học vấn, số<br />
năm kinh nghiệm, và thâm niên chức vụ, thì không có bằng<br />
chứng thống kê cho thấy tiền lương của nữ sẽ thấp hơn nam<br />
(|t|= 1.35)? Không: đây chỉ là tác động khi educ= 0. Để<br />
trả lời câu hỏi này, người ta phải quy tâm thành phần tương<br />
tác, ví dụ xét educ = 12,5 (= mức học vấn trung bình).<br />
<br />
PHÂN TÍCH HỒI QUY BỘI:<br />
BIẾN ĐỊNH TÍNH<br />
<br />
• Tập tin wage1.wf1<br />
<br />
Dependent Variable: LOG(WAGE)<br />
Method: Least Squares<br />
Included observations: 526<br />
<br />
Không có bằng chứng thống kê<br />
chống lại giả thuyết rằng tác động<br />
học vấn là như nhau cho nam và nữ<br />
(thống kê |t|= 0.43)<br />
<br />
Mean dependent var<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
1.623268<br />
<br />
Coefficient Std. Error<br />
<br />
C<br />
0.388806<br />
-0.296345<br />
FEMALE<br />
EDUC<br />
0.082369<br />
FEMALE*(EDUC-12.5) -0.005565<br />
EXPER<br />
0.029337<br />
EXPER^2<br />
-0.000580<br />
TENURE<br />
0.031897<br />
TENURE^2<br />
-0.000590<br />
19<br />
<br />
R-squared<br />
<br />
0.440964<br />
<br />
0.118687<br />
0.035836<br />
0.008470<br />
0.013062<br />
0.004984<br />
0.000108<br />
0.006864<br />
0.000235<br />
<br />
t-Statistic<br />
<br />
3.275892<br />
-8.269516<br />
9.724919<br />
-0.426013<br />
5.885973<br />
-5.397767<br />
4.646956<br />
-2.508901<br />
<br />
Prob.<br />
<br />
0.0011<br />
0.0000<br />
0.0000<br />
0.6703<br />
0.0000<br />
0.0000<br />
0.0000<br />
0.0124<br />
<br />
Mean dependent var 1.623268<br />
<br />
20<br />
<br />
5<br />
<br />