Chương V: Các sai l m cơ b n trong<br />
quá trình xây d ng mô hình h i qui đa<br />
bi n<br />
<br />
Đa c ng tuy n<br />
TS Nguy n Minh Đ c<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
Khái ni m Đa c ng tuy n:<br />
l Là hi n tư ng các bi n đ c l p có tương quan v i nhau<br />
l Mô hình lý tư ng khi các bi n đ c l p không tương quan<br />
l Có th có nhi u m c đ tương quan:<br />
l<br />
<br />
Tương quan hoàn toàn (đa c ng tuy n hoàn h o) r223 =1<br />
<br />
λ2X2 + λ3X3 =0<br />
X2 = λX3<br />
l<br />
<br />
tương quan không hoàn toàn (đa c ng tuy n không hoàn h o)<br />
<br />
λ2X2 + λ3X3 + v =0<br />
v: sai s ng u nhiên<br />
X2 = λX3 + u<br />
<br />
Prepared by NMDUC 2009<br />
<br />
1<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
<br />
Nguyên nhân:<br />
l Phương pháp thu th p s li u: m u không<br />
đ c trưng<br />
l B n ch t c a các bi n có m i tương quan<br />
l Mô hình: bi n có s mũ cao<br />
l Kích c m u nh<br />
<br />
Prepared by NMDUC 2009<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
Các h s ư c lư ng:<br />
<br />
Yi = β1 + β2 X2i + β3 X3i + ei<br />
l Trư ng h p đa c ng tuy n hoàn h o:<br />
<br />
Không th tách nh hư ng c a<br />
t ng bi n đ c l p lên bi n ph<br />
thu c<br />
l Không th có giá tr duy nh t c a<br />
t ng h s h i quy, m c dù có đáp<br />
s duy nh t cho t h p tuy n tính.<br />
l<br />
<br />
Prepared by NMDUC 2009<br />
<br />
2<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
^<br />
<br />
^<br />
<br />
^<br />
<br />
β1 = Y − β 2 X 2 − β 3 X 3<br />
n<br />
<br />
n<br />
n 2 n<br />
∑ yi x2,i ∑ x3i − ∑ yi x3,i ∑x2,i x3,i <br />
i=1<br />
<br />
i=1 i=1<br />
ˆ<br />
β2 = i=1<br />
2<br />
<br />
n 2 n 2 n<br />
∑ x2i ∑ x3i − ∑x2,i x3,i <br />
<br />
i=1 i=1 i=1<br />
<br />
n 2 n<br />
n<br />
<br />
n<br />
∑ yi x3,i ∑ x2i − ∑ yi x2,i ∑ x2,i x3,i <br />
i =1 i =1<br />
<br />
i =1<br />
ˆ<br />
β3 = i =1<br />
2<br />
n<br />
n<br />
n<br />
<br />
<br />
2 <br />
2 <br />
∑ x2i ∑ x3i − ∑ x2,i x3,i <br />
<br />
i =1 i =1 i =1<br />
l X2 = λX3<br />
^<br />
l βˆ 1 , βˆ 2 , β 3<br />
không xác đ nh<br />
<br />
Prepared by NMDUC 2009<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
<br />
l<br />
<br />
Trư ng h p đa c ng tuy n không hoàn h o:<br />
l Có th xác đ nh đư c giá tr c a các h s<br />
h i quy<br />
<br />
Prepared by NMDUC 2009<br />
<br />
3<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
<br />
H u qu c a đa c ng tuy n<br />
l<br />
<br />
Phương sai, hi p phương sai và sai s chu n là<br />
vô h n<br />
<br />
^ <br />
var β 2 =<br />
<br />
<br />
∑x<br />
<br />
^<br />
<br />
β , β^<br />
cov 2 3<br />
<br />
<br />
<br />
δ2<br />
<br />
2<br />
2i<br />
<br />
2<br />
(1 − r23 )<br />
<br />
^ <br />
var β 3 =<br />
<br />
<br />
∑x<br />
<br />
<br />
− r23 δ 2<br />
=<br />
<br />
2<br />
2<br />
(1 − r23 ) ∑ x 2 i ∑ x 32i<br />
<br />
<br />
δ2<br />
<br />
2<br />
3i<br />
<br />
2<br />
(1 − r23 )<br />
<br />
^<br />
<br />
se( β i ) =<br />
<br />
δ<br />
2<br />
(1 − r23 ) ∑ xi2<br />
<br />
Prepared by NMDUC 2009<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
<br />
H u qu c a đa c ng tuy n<br />
l<br />
l<br />
l<br />
l<br />
l<br />
l<br />
<br />
Kho ng tin c y r ng hơn<br />
Xác su t ch p nh n gi thuy t H0 -tăng (tăng sai l m lo i<br />
II)<br />
R2 cao, nhưng nhi u giá tr t th p<br />
H s ư c lư ng và sai s chu n r t nh y c m v i<br />
nh ng thay đ i trong s li u<br />
D u c a các h s ư c lư ng có th sai<br />
Thêm hay b t bi n c ng tuy n, s có thay đ i v đ l n<br />
và d u c a các h s ư c lư ng.<br />
<br />
Prepared by NMDUC 2009<br />
<br />
4<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
Cách phát hi n đa c ng tuy n:<br />
l Do đa c ng tuy n hoàn h o r t hi m khi x y ra, trong<br />
khi đa c ng tuy n không hoàn h o x y ra r t thư ng<br />
xuyên cho nên ta thư ng xác đ nh m c đ tương quan<br />
ch không xác đ nh lo i c ng tuy n.<br />
l Các cách xác đ nh đa c ng tuy n ph bi n:<br />
1/ D a vào R2 và t<br />
2/ Xác đ nh h s tương quan c p gi a các bi n đ c l p<br />
(>0.8)<br />
3/ H i quy ph : h i quy m t bi n X theo các bi n X còn l i<br />
l<br />
<br />
Prepared by NMDUC 2009<br />
<br />
Đa c ng tuy n<br />
(Multicollinearity)<br />
Cách kh c ph c:<br />
l Không có bi n pháp hoàn h o. Ph thu c vào tính nghiêm tr ng c a<br />
đa c ng tuy n và b n ch t c a s li u m u. Đôi khi áp d ng bi n<br />
pháp kh c ph c không phù h p s d n đ n sai l m nghiêm tr ng<br />
hơn.<br />
1/ S d ng thông tin đã bi t<br />
2/ Tăng c m u, ho c l y thêm m u m i: có th m u m i có các bi n<br />
đ c l p ít tương quan<br />
3/ B b t bi n: d a vào R2 đ quy t đ nh bi n nên b . Tuy nhiên trong<br />
nh ng trư ng h p không th b bi n đư c thì nên cân nh c gi a<br />
sai l ch khi b bi n và vi c tăng phương sai c a các h s ư c<br />
lư ng.<br />
4/ S d ng bi n tr .<br />
5/ Gi m tương quan trong h i quy đa th c: các bi n đ c l p có b c lũy<br />
th a khác nhau<br />
6/ Khác: h i quy thành ph n chính, s d ng các ư c lư ng t bên<br />
ngoài.<br />
Prepared by NMDUC 2009<br />
<br />
5<br />
<br />