Hồi quy với Dữ liệu Bảng
(Regression with Panel Data)
Việt Phú
Trường Chính sách Công Quản Fulbright
14-24/2/2023
1 / 59
Nhận diện các loại cấu trúc dữ liệu
Dữ liệu chéo (cross-sectional data)
Dữ liệu chuỗi thời gian (time series data)
Dữ liệu gộp (pooled cross-sectional data)
Dữ liệu bảng (longitudinal/panel data)
2 / 59
Trường hợp hình hồi quy không hiệu lực nội tại do
thiếu biến quan trọng
dụ hình hồi quy t suất thu nhập của đi học với hai biến
giải thích số năm đi học (educ) tố chất nhân (Ability):
log(incomei) = β0+β1educi+β2Abilityi+ui
thỏa các điều kiện CLRM. iđại diện cho quan sát thứ itrong
mẫu gồm Nquan sát.
Tuy nhiên không quan sát được Ability, do đó chúng ta sẽ
ước lượng hình sau trên thực tế:
log(incomei) = β0+β1educi+β2Abilityi+ui
|{z }
vi
Trong đó vi sai số gộp của cả sai số ngẫu nhiên ui biến
không quan sát được Abilityi,vi=ui+β2Abilityi
3 / 59
Đánh giá hướng chệch trong hình thiếu biến quan trọng
Các đặc tính của ước lượng của ˆ
β1:
ˆ
β1=β1+β2σ21
σ21 hệ số c của hồi quy biến Ability lên educ:
σ21 =cov(educ,Ability )
var (educ)
Nếu β2=0 (biến Ability không phải biến quan trọng) thì
ˆ
β1không chệch.
Nếu σ21 =0 (educ Ability không tương quan) thì ˆ
β1cũng
không chệch.
Nếu không phải 2 trường hợp trên thì β1chệch, với hướng
mức độ chệch tùy thuộc vào giá trị của β2 tương quan
giữa biến educ biến không quan sát được Ability thông
qua hệ số σ21.
4 / 59
Ước lượng bị thiên lệch do thiếu biến quan trọng - Omitted
variables bias
T chất nhân Ability được kỳ vọng tác động đến tiền
lương.
T chất nhân tương quan với trình độ học vấn.
T chất nhân không quan sát được.
Kỳ vọng β2>0 σ21 >0Ước lượng t suất thu nhập
của đi học khả năng bị chệch lên.
5 / 59