Chương 4: PHÂN TÍCH HỒI QUY VỚI BIẾN ĐỊNH TÍNH

Th.S NGUYỄN PHƯƠNG

Bộ môn Toán kinh tế Trường Đại học Ngân hàng TPHCM Blog: https://nguyenphuongblog.wordpress.com Email: nguyenphuong0122@gmail.com

1

Ngày 18 tháng 9 năm 2016

NỘI DUNG

1 Khái niệm biến giả

2 Mô hình có chứa biến độc lập là biến giả

3 Mô hình có chứa biến định lượng và biến giả

4 Ứng dụng của biến giả

2

Khái niệm biến giả

- Thu nhập, giá cả, chi tiêu cho một loại hàng, . . . −→ giá trị quan sát của các biến đó là những con số −→ biến định lượng. - Giá trị quan sát của biến không phải là số −→ biến định tính

Biến định tính biểu thị các mức độ, các phạm trù khác nhau của một tiêu thức, một thuộc tính nào đó.

(cid:51) Giới tính (nam, nữ); (cid:51) Vùng miền (Bắc, Trung, Nam); (cid:51) Khu vực sống (thành thị, nông thôn);. . .

3

- Để lượng hóa những biến định tính, trong phân tích hồi quy người ta sử dụng biến giả (dummy variable). - Biến giả chỉ nhận hai giá trị là 0 và 1. Các con số này chỉ dùng để phản ánh hai nhóm quan sát mang tính chất khác nhau.

Khái niệm biến giả

D = 1 nếu là phạm trù A; 0 nếu không phải là phạm trù A   

Ví dụ 1.1

(cid:51) Giới tính (nam, nữ) −→ D =   1 nếu là nam;  0 nếu là nữ

(cid:51) Khu vực sống (thành thị, nông thôn) −→ D =   0 nếu là thành thị;  1 nếu là nông thôn

(cid:51) Vùng miền (Bắc, Trung, Nam) −→ ?

4

(cid:43) Để phân biệt 2 mức độ (2 phạm trù) −→ dùng 1 biến giả. (cid:43) Để phân biệt 3 mức độ (3 phạm trù) −→ dùng 2 biến giả. (cid:43) Tổng quát, để phân biệt m mức độ (m phạm trù) −→ dùng m − 1 biến giả. (cid:43) Trạng thái cơ sở là trạng thái ứng với trường hợp mà tất cả các biến giả nhận giá trị 0 −→ Trạng thái cơ cở dùng để so sánh với các trạng thái khác.

Mô hình có chứa biến độc lập là biến giả

Ví dụ 2.1

Hồi quy thu nhập của công chức (Y) phụ thuộc vào giới tính (D)

Di =   0 nếu công chức i là nữ;  1 nếu công chức i là nam

Mô hình hồi quy tổng thể: Yi = β1 + β2Di + Ui

(cid:228) E(Yi|Di = 0) = β1 ←− Thu nhập trung bình của công chức nữ (cid:228) E(Yi|Di = 1) = β1 + β2 ←− Thu nhập trung bình của công chức nam (cid:228) β2 = E(Yi|Di = 1) − E(Yi|Di = 0) −→ mức chênh lệch về thu nhập trung bình giữa nam và nữ (cid:40) (cid:228) Có sự phân biệt giới tính trong thu nhập? −→ Kđgt H0 : β2 = 0 H1 : β2 (cid:44) 0 (cid:40) (cid:228) Thu nhập trung bình của nam có cao hơn nữ? −→ Kđgt H0 : β2 = 0 H1 : β2 > 0

5

Hệ số của các biến giả được dùng để so sánh trạng thái đang xét với trạng thái cơ sở.

Mô hình có chứa biến độc lập là biến giả

Ví dụ 2.2

Giả sử hàm hồi quy tổng thể thu nhập của công chức (Y) theo giới tính như sau: Yi = 5, 4 + 1, 2Di + Ui

Hãy giải thích ý nghĩa các hệ số.

Ví dụ 2.3

Hồi quy thu nhập của công chức (Y) phụ thuộc vào khu vực làm việc (nông thôn; thành thị và miền núi).

D2i =

D3i =   1 nếu công chức i làm việc ở nông thôn;  0 nếu công chức i làm việc ở khu vực khác;   1 nếu công chức i làm việc ở thành thị;  0 nếu công chức i làm việc ở khu vực khác

6

Mô hình hồi quy tổng thể: Yi = β1 + β2D2i + β3D3i + Ui

Mô hình có chứa biến độc lập là biến giả

Nông thôn Thành thị Miền núi D2 D3 0 1 1 0 0 0

(cid:228) E(Yi|D2i = D3i = 0) = β1 ←− Thu nhập trung bình của công chức làm việc ở miền núi

(cid:228) E(Yi|D2i = 1, D3i = 0) = β1 + β2 ←− Thu nhập trung bình của công chức làm việc ở nông thôn

(cid:228) E(Yi|D2i = 0, D3i = 1) = β1 + β3 ←− Thu nhập trung bình của công chức làm việc ở thành thị

7

(cid:228) β2 ? (cid:228) β3 ? (cid:228) Có sự khác biệt về thu nhập giữa công chức làm việc ở các khu vực khác (cid:40) nhau? −→ Kđgt H0 : β2 = β3 = 0 H1 : β2 (cid:44) 0 ∨ β3 (cid:44) 0 (cid:40) (cid:228) Kđgt ←− ? H0 : βj = 0 H1 : βj (cid:44) 0

Mô hình có chứa biến định lượng và biến giả

Mô hình ban đầu, chỉ có biến định lượng:

E(Y|Xi) = β1 + β2Xi

(cid:228) Đưa thêm biến giả (có 2 phạm trù) vào mô hình −→

(cid:228) Chỉ tác động lên hệ số chặn ? (cid:228) Chỉ tác động lên hệ số góc ? (cid:228) Tác động đến cả hai hệ số ?

8

(cid:228) Chỉ tác động lên hệ số chặn: E(Y|Xi) = β1 + β2Xi + β3Di (cid:228) Chỉ tác động lên lên hệ số góc: E(Y|Xi) = β1 + β2Xi + β4DiXi (cid:228) Tác động lên cả hai hệ số: E(Y|Xi) = β1 + β2Xi + β3Di + β4DiXi

Mô hình có chứa biến định lượng và biến giả

(a) Chỉ tác động lên hệ số chặn

(b) Chỉ tác động lên lên hệ số góc

(c) Tác động lên cả hai hệ số 9

Mô hình có chứa biến định lượng và biến giả

Ví dụ 3.1

W = 4, 35 + 1, 76D + 0, 88KN + u

với

(cid:228) Di =   1 nếu là lao động trong ngành ngân hàng;  0 nếu là lao động trong các ngành khác

(cid:228) KN: số năm kinh nghiệm (năm) (cid:228) W: mức lương (triệu đồng/tháng) Hãy giải thích ý nghĩa các hệ số.

Ví dụ 3.2

W = 4, 13 − 0, 65D + 0, 91KN + 0, 54D ∗ KN + u

10

Hãy giải thích ý nghĩa các hệ số.

Ứng dụng của biến giả

(cid:43) So sánh hai hồi quy − tính ổn định cấu trúc của các mô hình hồi quy

(Chow break point test) (cid:43) Phân tích yếu tố mùa vụ (cid:43) Hồi quy tuyến tính từng khúc

Ví dụ 4.1

Dữ liệu trong file ch5vd1bis.wf1 cho biết số liệu tiết kiệm và thu nhập cá nhân (triệu pound) ở nước Anh từ năm 1946 đến 1963. Số liệu được chia làm hai giai đoạn, 1946-1954 (thời kỳ tái thiết) và 1955-1963 (thời kỳ hậu tái thiết). Câu hỏi: mối quan hệ giữa tiết kiệm và thu nhập có thay đổi giữa hai thời kỳ hay không?

11

Yi = β1 + β2Di + β3Xi + β4DiXi + ui

Ứng dụng của biến giả

Ví dụ 4.2

Dữ liệu trong file ch5vd2bis.wf1 cho biết số liệu về tổng chi phí($) và tổng sản lượng (tấn). Biết rằng tổng sản lượng làm thay đổi độ dốc là X∗ = 5500 (tấn).

Yi = β1 + β2Xi + β3(X − X∗)Di + ui

12

Di =  1 nếu Xi > X∗;   0 nếu Xi ≤ X∗