
Kinh tÕ l−îng n©ng cao
BÀI 1
HỒI QUY VỚI BIẾN GIẢ
1. ĐẶT VẤN ĐỀ
Trong nhiều tình huống, cùng với các biến định lượng còn có những biến định tính . Ví dụ khi
nghiên cứu tiêu dùng của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có thể định lượng
được, nhưng giới tính của chủ hộ, cấu trúc thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách
của chính phủ là các biến không định lượng được.
Trong nhiều trường hợp, chính mức giá trị của các biến định lượng cũng làm thay đổi quan hệ
của chúng một cách cơ bản. Có thể dễ dàng nhận ra rằng, khi tiền lương tăng đến một mức nào đó
thì lượng cung lao động không còn tăng mà có thể giảm, điều này đã được mô tả trong nhiều
nghiên cứu về thị trường lao động. Cũng như vậy, thu nhập ở những mức khác nhau có thể tương
ứng với những tỷ lệ tiết kiệm khác nhau.
Nói tóm lại, trong hầu hết các quan hệ định lượng có sự can thiệp của các biến không định
lượng mà ở đây ta gọi là các biến định tính. Cần có một kỹ thuật đưa các biến như vậy vào trong
các mô hình, không chỉ với tư cách các biến giải thích mà còn với tư cách là các biến phụ thuộc.
2. KỸ THUẬT BIẾN GIẢ
2.1. Hồi quy với biến giải thích là biến định tính (mô hình ANOVA)
a. Biến định tính có hai phạm trù.
Lúc đó dùng một biến giả để thay thế cho nó.
VD: Thu nhập có phụ thuộc giới tính ?
Yi : thu nhập
Di =
⎩
⎨
⎧
0
1Nếu quan sát là Nam
Nếu quan sát là Nữ
Mô hình : Yi =
β
1 +
β
2Di + ui
Thu nhập trung bình của nam E(Y/Di = 1) =
β
1 +
β
2
Thu nhập trung bình của nữ E(Y/Di = 0) =
β
1
Nếu
β
2 ≠ 0 thì TN trung bình có phụ thuộc giới tính
Biến D dùng như trên gọi là biến giả (Dummy variable).

Bμi 1: håi quy víi biÕn gi¶
Ví dụ: Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm.
ST
T
Lương (Y:
nghìn $)
GiớiD
1 22 m 1
2 19 f 0
3 18 f 0
4 21,7 m 1
5 18,5 f 0
6 21 m 1
7 20,5 m 1
8 17 f 0
9 17,5 f 0
10 21,2 m 1
Biến giới: m = nam; f = nữ.
Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei
Giá trị T 3,54 4,265
Dễ dàng thấy rằng, β2 khác không, hơn thế nữa, hệ số này dương có ý nghĩa. Kết luận đầu tiên
của chúng ta là: lương khởi điểm trung bình của nam cao hơn nữ. Ước lượng cụ thể về các mức
này như sau:
¾ Lương khởi điểm trung bình của nữ E(Y/D=0) = β1 , ước lượng được là 18,00 (nghìn $).
¾ Lương khởi điểm trung bình của nam E(Y/D=1)= β1 + β2 , ước lượng được là 21,28 (nghìn $).
→ Qui tắc đặt biến giả
- Biến giả chỉ nhận giá trị 0 và 1
- Cá thể nào cũng phải có giá trị
- Biến giả chia tổng thể thành những thành phần riêng biệt
b. Biến định tính có k phạm trù.
Lúc đó dùng k-1 biến giả để thay thế cho chúng.
Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn?
Yi: Chi phí cho văn hoá phẩm.
D2i =
⎩
⎨
⎧
khacdotrinhconeu
hoctieudotrinhconeu
.............0
..................1

Kinh tÕ l−îng n©ng cao
D3i =
⎩
⎨
⎧
khacdotrinhconeu
hoctrungdotrinhconeu
.............0
..................1
D4i =
⎩
⎨
⎧
khacdotrinhconeu
hocdaidotrinhconeu
.............0
.................1
Mô hình có dạng:
Yi =
β
1 +
β
2D2i +
β
3D3i +
β
4D4i + ui
c. Mô hình có hai biến định tính
VD : Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, gữa nam và nữ ?
D2 =
⎩
⎨
⎧
0
1Nếu là nam
Nếu là nữ D3 =
⎩
⎨
⎧
0
1Nếu làm việc ở thành thị
Nếu làm việc ở nông thôn
E(Y/D2i, D3i) =
β
1 +
β
2D2i +
β
3D3i + ui
Các chú ý:
• Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n1, n2, . . . nk thì
phải dùng tổng cộng n1 + n2 + . . . + nk – k biến giả.
• Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùnh để so sánh với các phạm trù khác.
• Các hệ số góc riêng phần được gọi là các hệ số chênh lệch.
• Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như thông lệ.
•
2.2. Sự tương tác giữa các biến giả
Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng. Để tính đến
điều đó ta thêm vào mô hình biến tương tác.
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Mô hình 1:
Yi =
β
1 +
β
2D2i +
β
3D3i +
β
5Xi + ui
Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác.
Mô hình 2:
Yi =
β
1 +
β
2D2i +
β
3D3i +
β
4D2i*D3i +
β
5Xi + ui

Bμi 1: håi quy víi biÕn gi¶
Kiểm định H0:
β
4 = 0 (không có tương tác)
H1:
β
4 ≠ 0 (có tương tác)
Lúc đó mức độ tương tác bằng
β
4.
2.3. Đánh giá sự tác động đối với biến định lượng
Xét mô hình:
E(Y/Xi) =
β
1 +
β
2Xi
và biến định tính có hai phạm trù là A1 và A2.
D =
⎩
⎨
⎧
∉
∈
1
1
A sát quan 0
A sát quan 1
a. Biến định tính tác động đến hệ số chặn
E(Y/Xi, Di) =
β
1 +
β
2Di +
β
3Xi
b. Biến định tính tác động đến hệ số góc
E(Y/Xi, Di) =
β
1 +
β
2Xi +
β
3DiXi
c. Tác động đến cả hai hệ số
E(Y/Xi, Di) =
β
1 +
β
2Xi +
β
3Di +
β
4Di Xi
Như vậy việc sử dụng biến giả có thể cho phép đánh giá chính sách.
Ví dụ: Tệp số liệu ch4bt1 chứa các số liệu mức tiêu dùng thực tế theo đầu người(CS) và
thu nhập thực tế theo đầu người của Mỹ(Y) giai đoạn 1929-1970.
Trong giai đoạn này đã xảy ra thế chiến II(1941-1946) và từ 1960 Mỹ đã tham chiến tại
Việt nam. Vậy chiến tranh có ảnh hưởng đến tiêu dùng của người Mỹ hay không?

Kinh tÕ l−îng n©ng cao
Hồi quy CS theo Y cho kết quả sau:
Dependent Variable: CS
Method: Least Squares
Date: 11/21/08 Time: 09:13
Sample: 1929 1970
Included observations: 42
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 58.09624 49.97286 1.162556 0.2519
Y 0.872195 0.029209 29.86016 0.0000
R-squared 0.957064 Mean dependent
var
1498.54
8
Adjusted R-
squared
0.955991 S.D. dependent var 403.024
3
S.E. of regression 84.54767 Akaike info
criterion
11.7589
6
Sum squared resid 285932.3 Schwarz criterion 11.8417
0
Log likelihood -
244.9381
F-statistic 891.628
9
Durbin-Watson
stat
0.337500 Prob(F-statistic) 0.00000
0
Thêm biến giả D1=1trong thời kỳ 1941-1946 và hồi quy thu được kết quả sau:
Dependent Variable: CS
Method: Least Squares
Date: 11/21/08 Time: 09:21
Sample: 1929 1970
Included observations: 42
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 101.5147 25.45745 3.987621 0.0003
D1 -
204.9233
18.78558 -10.90854 0.0000
Y 0.863631 0.014718 58.67883 0.0000
R-squared 0.989402 Mean dependent
var
1498.54
8

