
Trường hợp mô hình hồi quy không có hiệu lực nội tại do
thiếu biến quan trọng
▶Ví dụ mô hình hồi quy tỷ suất thu nhập của đi học với hai biến
giải thích số năm đi học (educ) và tố chất cá nhân (Ability):
log(incomei) = β0+β1educi+β2Abilityi+ui
thỏa các điều kiện CLRM. iđại diện cho quan sát thứ itrong
mẫu gồm có Nquan sát.
▶Tuy nhiên không quan sát được Ability, do đó chúng ta sẽ
ước lượng mô hình sau trên thực tế:
log(incomei) = β0+β1educi+β2Abilityi+ui
|{z }
vi
Trong đó vilà sai số gộp của cả sai số ngẫu nhiên uivà biến
không quan sát được Abilityi,vi=ui+β2Abilityi
3 / 59

Đánh giá hướng chệch trong mô hình thiếu biến quan trọng
Các đặc tính của ước lượng của ˆ
β1:
ˆ
β1=β1+β2σ21
σ21 là hệ số góc của hồi quy biến Ability lên educ:
σ21 =cov(educ,Ability )
var (educ)
▶Nếu β2=0 (biến Ability không phải là biến quan trọng) thì
ˆ
β1không chệch.
▶Nếu σ21 =0 (educ và Ability không tương quan) thì ˆ
β1cũng
không chệch.
▶Nếu không phải 2 trường hợp trên thì β1chệch, với hướng và
mức độ chệch tùy thuộc vào giá trị của β2và tương quan
giữa biến educ và biến không quan sát được Ability thông
qua hệ số σ21.
4 / 59

Ước lượng bị thiên lệch do thiếu biến quan trọng - Omitted
variables bias
▶Tố chất cá nhân Ability được kỳ vọng có tác động đến tiền
lương.
▶Tố chất cá nhân tương quan với trình độ học vấn.
▶Tố chất cá nhân không quan sát được.
▶Kỳ vọng β2>0 và σ21 >0⇒Ước lượng tỷ suất thu nhập
của đi học có khả năng bị chệch lên.
5 / 59