09/09/2014<br />
<br />
Đa cộng tuyến<br />
<br />
CHƯƠNG 5<br />
CỘ<br />
HIỆN TƯỢNG ĐA CỘNG TUYẾN<br />
(MULTICOLLINE<br />
(MULTICOLLINEARITY)<br />
<br />
1. Hi ể u b ả n ch ấ v à h ậ u<br />
t<br />
quả của đa cộng tuyến<br />
MỤ C<br />
TIÊU<br />
<br />
2. Bi ế t cách phát hiệ n đa<br />
cộng tuyến và biện pháp<br />
khắc phục<br />
<br />
2<br />
<br />
NỘI DUNG<br />
<br />
5.1 Bản chất của đa cộng tuyến<br />
Đa cộng tuyến<br />
<br />
1<br />
<br />
Bản chất, nguyên nhân của đa cộng tuyến<br />
<br />
2<br />
<br />
Ước lượng các tham số<br />
<br />
ˆ<br />
Yi = βˆ1 + βˆ2 X2i + βˆ3 X 3i + ... + βˆk Xki<br />
<br />
3<br />
<br />
Hậu quả<br />
<br />
4<br />
<br />
Phát hiện đa cộng tuyến<br />
<br />
Có sự phụ thuộc tuyến tính cao giữa các<br />
biến giải thích<br />
<br />
5<br />
<br />
Khắc phục đa cộng tuyến<br />
<br />
Trong mô hình hồi quy bội<br />
<br />
3<br />
<br />
4<br />
<br />
5.1 Bản chất của đa cộng tuyến<br />
<br />
6.1 Bản chất của đa cộng tuyến<br />
VD<br />
<br />
a. Đa cộng tuyến hoàn hảo<br />
Tồn tại λ2, λ3,… λk không đồng thời bằng 0<br />
sao cho<br />
λ2X2 + λ3X3 + …+ λkXk = 0<br />
b. Đa cộng tuyến không hoàn hảo<br />
λ2X2 + λ3X3 + …+ λkXk + vi= 0<br />
với vi là sai số ngẫu nhiên.<br />
<br />
5<br />
<br />
X2<br />
<br />
10<br />
<br />
15<br />
<br />
18<br />
<br />
24<br />
<br />
30<br />
<br />
X3<br />
<br />
50<br />
<br />
75<br />
<br />
90<br />
<br />
120<br />
<br />
150<br />
<br />
X4<br />
V<br />
<br />
52<br />
2<br />
<br />
75<br />
0<br />
<br />
97<br />
7<br />
<br />
129<br />
9<br />
<br />
152<br />
2<br />
<br />
X3i = 5X2i, có cộng tuyến hoàn hảo giữa X2 và<br />
X3 ; r23 = 1<br />
X2 và X4 có cộng tuyến không hoàn hảo<br />
<br />
6<br />
<br />
1<br />
<br />
09/09/2014<br />
<br />
6.1 Bản chất của đa cộng tuyến<br />
<br />
6.1 Bản chất của đa cộng tuyến<br />
Không có đa cộng tuyến<br />
<br />
Đa cộng tuyến thấp<br />
<br />
Y<br />
<br />
Y<br />
X3<br />
<br />
X2<br />
<br />
Đa cộng tuyến cao<br />
<br />
Đa cộng tuyến hoàn hảo<br />
<br />
Y<br />
X3<br />
<br />
X2<br />
<br />
Y<br />
X3<br />
<br />
X2<br />
<br />
X2<br />
X3<br />
<br />
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến<br />
<br />
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến<br />
7<br />
<br />
8<br />
<br />
6.1 Nguyên nhân của đa cộng tuyến<br />
<br />
6.2 Ước lượng khi có đa cộng tuyến<br />
<br />
- Chọn các biến độc lập có mối quan có<br />
quan hệ nhân quả hay có tương quan cao<br />
vì đồng phụ thuộc vào một điều kiện khác.<br />
- Số quan sát nhỏ hơn số biến độc lập.<br />
- Cách thu thập mẫu: mẫu không đặc trưng<br />
cho tổng thể<br />
- Chọn biến Xi có độ biến thiên nhỏ.<br />
<br />
1. Trường hợp có đa cộng tuyến hoàn hảo<br />
Xét mô hình hồi qui 3 biến dưới dạng sau:<br />
Yi = β2 X2i + β3 X3i + ei<br />
giả sử X3i = λX2i, mô hình được biến đổi<br />
thành:<br />
Yi = (β2+ λβ3)X2i + ei = β0 X2i + ei<br />
Phương pháp OLS<br />
∑ x 2i y i<br />
βˆo = (βˆ2 + λβˆ3 ) =<br />
<br />
∑x<br />
<br />
2<br />
2i<br />
<br />
ˆ ˆ<br />
� Không thể tìm được lời giải duy nhất cho β 2 , β 3<br />
10<br />
<br />
9<br />
<br />
6.2 Ước lượng khi có đa cộng tuyến<br />
<br />
βˆ 2 =<br />
<br />
∑yx ∑x −∑yx ∑x<br />
∑ x ∑ x − (∑ x<br />
i2<br />
<br />
3<br />
<br />
i<br />
<br />
2<br />
2i<br />
<br />
2<br />
i<br />
<br />
3<br />
<br />
2<br />
3i<br />
<br />
i<br />
<br />
2<br />
i<br />
<br />
x3<br />
<br />
6.2 Ước lượng khi có đa cộng tuyến<br />
<br />
i<br />
<br />
i<br />
<br />
x )2<br />
<br />
2 i 3i<br />
<br />
2<br />
ˆ λ ∑ yi x3i∑ x3i − λ ∑ yi x3i∑ x3i x3i = 0<br />
β2 =<br />
2<br />
2<br />
2<br />
2<br />
0<br />
λ2 ∑ x3i∑ x3i − λ 2 ∑ x3i∑ x3i<br />
<br />
� Các hệ số ước lượng không xác định<br />
� Phương sai và sai số chuẩn của β2 và β3<br />
là vô hạn<br />
11<br />
<br />
2. Trường hợp có đa cộng tuyến không<br />
hoàn hảo<br />
Đa cộng tuyến hoàn hảo thường không<br />
�<br />
xảy ra trong thực tế.<br />
� Xét mô hình hồi qui 3 biến dưới dạng sau:<br />
yi = β2 x2i + β3 x3i + ei<br />
Giả sử x3i = λ x2i + vi<br />
Với λ ≠ 0 và vi là sai số ngẫu nhiên<br />
12<br />
<br />
2<br />
<br />
09/09/2014<br />
<br />
6.3 Hậu quả của đa cộng tuyến<br />
<br />
6.2 Ước lượng khi có đa cộng tuyến<br />
<br />
v<br />
y<br />
yv<br />
(∑ y x )(λ ∑x + ∑ ) −(λ ∑ x + ∑ )(λ<br />
(∑ x )(λ ∑ x +∑ v )− ∑ x )<br />
(λ<br />
2<br />
<br />
ˆ<br />
β2 =<br />
<br />
i 2i<br />
<br />
2<br />
2i<br />
<br />
2<br />
2i<br />
<br />
2<br />
<br />
2<br />
<br />
i<br />
<br />
i 2i<br />
<br />
2<br />
2i<br />
<br />
2<br />
<br />
2<br />
<br />
i i<br />
<br />
2<br />
2i<br />
<br />
i<br />
<br />
x 2∑<br />
)<br />
<br />
Nếu có cộng tuyến gần hoàn hảo<br />
2i<br />
<br />
2<br />
<br />
2<br />
<br />
� Có thể ước lượng được các hệ số hồi<br />
quy nhưng sai số chuẩn rất lớn.<br />
<br />
� Phương sai và hiệp phương sai của các<br />
ước lượng OLS lớn.<br />
� Khoảng tin cậy rộng hơn.<br />
� Tỉ số t "không có ý nghĩa"<br />
� R2 cao nhưng tỉ số t ít có ý nghĩa<br />
<br />
13<br />
<br />
14<br />
<br />
6.3 Hậu quả của đa cộng tuyến<br />
<br />
6.3 Hậu quả của đa cộng tuyến<br />
<br />
5. Các ước lượng OLS và sai số chuẩn của<br />
chúng trở nên rất nhạy với những thay<br />
đổi nhỏ trong dữ liệu.<br />
6. Dấu của các ước lượng của các hệ số hồi<br />
qui có thể sai<br />
7. Thêm vào hay bớt đi các biến cộng tuyến<br />
với các biến khác, mô hình sẽ thay đổi<br />
về dấu hoặc thay đổi về độ lớn của các<br />
ước lượng.<br />
<br />
Đa cộng tuyến là một hiện tượng theo<br />
mẫu, nghĩa là cho dù các biến độc lập<br />
Xi không tương quan tuyến tính trong<br />
tổng thể nhưng chúng có thể tương<br />
quan tuyến tính trong một mẫu cụ thể<br />
nào đó. Do đó cỡ mẫu lớn thì hiện<br />
tượng đa cộng tuyến ít nghiêm trọng<br />
hơn cỡ mẫu nhỏ<br />
<br />
15<br />
<br />
16<br />
<br />
6.4 Cách phát hiện đa cộng tuyến<br />
<br />
6.4 Cách phát hiện đa cộng tuyến<br />
<br />
lớn nhưng tỷ số t nhỏ<br />
1.<br />
2. Tương quan cặp giữa các biến giải thích<br />
cao<br />
R2<br />
<br />
1. Hệ số R2 lớn nhưng tỷ số t nhỏ<br />
2. Tương quan cặp giữa các biến giải<br />
thích cao<br />
3. Sử dụng mô hình hồi qui phụ<br />
4. Sử dụng yếu tố phóng đại phương sai<br />
(VIF)<br />
<br />
17<br />
<br />
rXZ =<br />
<br />
∑(X − X )( Z −Z )<br />
∑ ( X − X ) (Z − Z )<br />
i<br />
<br />
i<br />
<br />
2<br />
<br />
i<br />
<br />
2<br />
<br />
i<br />
<br />
Trong đó X, Z là 2 biến giải thích trong mô<br />
hình<br />
<br />
18<br />
<br />
3<br />
<br />
09/09/2014<br />
<br />
6.4 Cách phát hiện đa cộng tuyến<br />
3. Sử dụng mô hình hồi quy phụ<br />
Hồi qui một biến giải thích X theo các biến còn lại<br />
<br />
ˆ<br />
ˆ<br />
ˆ<br />
X 2i = β1 + βˆ3 X 3i + ... + β k X mi<br />
Tính<br />
<br />
R2<br />
<br />
VIF =<br />
<br />
và F cho mỗi mô hình<br />
<br />
F =<br />
<br />
6.4 Cách phát hiện đa cộng tuyến<br />
4. Sử dụng nhân tử phóng đại phương sai (VIF)<br />
Đối với hàm hồi quy 2 biến giải thích<br />
<br />
1<br />
(1 − r2 )<br />
23<br />
<br />
Đối với trường hợp tổng quát, có (k-1) biến giải thích<br />
<br />
R 2 (n − m)<br />
(1 − R 2 )( m − 1 )<br />
<br />
VIF =<br />
<br />
Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến<br />
Nếu F > Fα(m-1,n-k): bác bỏ H0 hay có đa cộng tuyến<br />
Nếu F < Fα(m-1,n-k): chấp nhận H0 hay không có đa<br />
cộng tuyến<br />
<br />
1<br />
(1 − R2j )<br />
<br />
�R2j: là giá trị R2 trong hàm hồi quy của Xj theo (k-2)<br />
biến giải thích còn lại.<br />
�Thông thường khi VIF > 10, thì biến này được coi là<br />
có cộng tuyến cao<br />
20<br />
<br />
19<br />
<br />
6.5 Cách khắc phục<br />
<br />
6.5 Cách khắc phục<br />
<br />
1. Dùng thông tin tiên nghiệm<br />
Ví dụ mô hình sản xuất Cobb-Douglas<br />
Ln(Yi)=β1 + β2ln(Ki)+ β3ln(Li) + ui Có<br />
thể xảy ra đa cộng tuyến do K và L cùng tăng<br />
theo quy mô sản xuất. Nếu biết hiệu suất<br />
không đổi theo quy mô tức là β2+β3=1 thì<br />
Ln(Yi)=β1 + β2ln(Ki)+ (1-β2)ln(Li) + ui<br />
Ln(Yi) – Ln(Li) = β1 + β2[ln(Ki) - ln(Li)] + ui<br />
Ln(Yi /Li ) = β1 + β2ln(Ki /Li) + ui<br />
=> mất đa cộng tuyến (vì đây là mô hình hồi<br />
quy đơn)<br />
<br />
2. Loại trừ một biến giải thích ra khỏi mô<br />
hình<br />
B1: Xem cặp biến giải thích nào có quan hệ<br />
chặt chẽ. Giả sử X2, X3…Xk là các biến độc<br />
lập, Y là biến phụ thuộc và X2, X3 có tương<br />
quan chặt chẽ với nhau.<br />
B2: Tính R2 đối với các hàm hồi quy: có mặt<br />
cả 2 biến; không có mặt một trong 2 biến<br />
B3: Loại biến mà giá trị R2 tính được khi<br />
không có mặt biến đó là lớn hơn.<br />
<br />
21<br />
<br />
6.5 Cách khắc phục<br />
<br />
6.5 Cách khắc phục<br />
<br />
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới<br />
<br />
var(βˆ2 ) =<br />
<br />
22<br />
<br />
σ 2<br />
2<br />
∑ x22i (1− r23 )<br />
<br />
23<br />
<br />
4. Dùng sai phân cấp 1<br />
Có hàm hồi qui: yt = α1 + β1x1t + β2x2t + ut<br />
suy ra<br />
yt-1 = α1 + β1x1,t-1 + β2x2,t-1 + ut-1<br />
Trừ hai vế cho nhau, được:<br />
yt – yt – 1 = β1(x1,t – x1,t – 1) + β2(x2,t – x2,t – 1) +<br />
(ut – ut – 1)<br />
Hay:<br />
∆yt = β1 ∆ x1,t + β2 ∆ x2,t + et,<br />
24<br />
<br />
4<br />
<br />