
Bài 5: Đa cộng tuyến
65
BÀI 5. ĐA CỘNG TUYẾN
Mục tiêu
Sau khi kết thúc bài, học viên sẽ hiểu
được những vấn đề sau đây:
• Hiện tượng đa cộng tuyến (ĐCT) xảy
ra khi nào?
• Phân biệt ĐCT hoàn hảo và không
hoàn hảo.
• Hậu quả của ĐCT.
• Phát hiện ĐCT.
• Các biện pháp khắc phục ĐCT.
Nội dung Hướng dẫn học
• ĐCT là gì?
• Phân biệt ĐCT hoàn hảo và không hoàn hảo.
• Hậu quả của ĐCT.
• Phát hiện ĐCT.
• Khắc phục ĐCT.
Thời lượng
• 6 tiết
• Đọc tài liệu để có được những ý
tưởng chính.
• Nghe thật kỹ bài giảng của giảng viên
để nắm được bản chất của hiện tượng.
• Tập trung vào phần khái niệm, các
biện pháp phát hiện và khắc phục.

Bài 5: Đa cộng tuyến
66
TÌNH HUỐNG DẪN NHẬP
Tình huống
Các nhà quản lí siêu thị BigC, muốn xem xét việc giảm giá mặt
hàng thịt gà để kích thích tiêu dùng. Để thực hiện điều này, các
nghiên cứu viên muốn dùng phương pháp Kinh tế lượng trong
đó biến phụ thuộc được chọn chính là tiêu dùng của mặt hàng
thịt gà của dân chúng, các biến độc lập sẽ là thu nhập của người
tiêu dùng, giá của thịt gà và giá của thịt lợn là mặt hàng cạnh
tranh với thịt gà tại các thời điểm quan sát.
Vấn đề đặt ra trong nghiên cứu là chọn các biến độc lập vào trong mô hình. Vì lạm phát là tình
trạng chung của cả nền kinh tế nên các mặt hàng thường có tình trạng cùng tăng giá hoặc cùng
giảm giá, nhất là những mặt hàng thiết yếu như thịt gà và thịt lợn. Nếu như các nhà nghiên cứu
chọn cả giá thịt gà và giá thịt lợn làm biến độc lập trong mô hình, chúng sẽ có quan hệ cùng
tăng hoặc cùng giảm. Vì thế khi tiến hành phân tích bằng mô hình kinh tế lượng, sẽ khó để
phân tách ảnh hưởng của từng biến này lên tiêu dùng về thị gà hoặc sẽ gây ra các hậu quả về
mặt kỹ thuật trong quá trình phân tích.
Câu hỏi
• Vậy trong tình huống như thế này thì các nhà nghiên cứu cần có biện pháp gì?
• Trong bài học sau đây, học viên sẽ được xem xét một khuyết tật của mô hình kinh tế lượng
trong tình huống nêu trên, đó là đa cộng tuyến. Làm thế nào để phát hiện và khắc phục hiện
tượng này khi xem xét một mô hình với nhiều biến độc lập?

Bài 5: Đa cộng tuyến
67
Trong bài trước chúng ta xét mô hình hồi quy bội với giả thiết
các biến giải thích i
X độc lập tuyến tính với nhau. Tiếp theo đây
chúng ta sẽ xét bài toán hồi quy bội khi giả thiết về tính độc lập
tuyến tính đó bị phá vỡ và sẽ đưa ra cách thức phát hiện và biện
pháp khắc phục hiện tượng giả thiết đó bị vi phạm.
Trong mô hình hồi quy ở bài trước thì các hệ số hồi quy đối với
một biến cụ thể là số đo tác động riêng phần của biến tương ứng
khi tất cả các biến khác trong mô hình được giữ cố định. Nếu tính
độc lập bị phá vỡ, tức là các biến giải thích có tương quan thì chúng ta không thể chỉ cho một
biến thay đổi và giữ các biến còn lại cố định. Do vậy chúng ta không thể tách biệt sự ảnh hưởng
riêng phần của một biến nào đó.
5.1. Khái niệm đa cộng tuyến
5.1.1. Đa cộng tuyến hoàn hảo
Bài toán
Các biến 23 k
X , X ,..., X gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng
tuyến chính xác nếu tồn tại 2k
,...,
λ
λ không đồng thời bằng không sao cho:
22 33 kk
X X ... X 0λ+λ++λ= (5.1)
5.1.2. Đa cộng tuyến không hoàn hảo (gần đa cộng tuyến)
Bài toán
Các biến23 k
X , X ,..., X gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại 2k
,...,λλ
không đồng thời bằng không sao cho:
22 33 kk
X X ... X v 0λ+λ++λ+= (5.2)
trong đó v là sai số ngẫu nhiên.
Trong (5.2) giả sử i0∃λ ≠ khi đó ta biểu diễn:
3
2k
i23 k
ii ii
v
X X X ... X
λ
λλ
=− − − − −
λλ λλ
(5.3)
Từ (5.3) ta thấy hiện tượng đa cộng tuyến xảy ra khi
một biến là tổ hợp tuyến tính của các biến còn lại và
một sai số ngẫu nhiên, hay nói cách khác là có một
biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại.
Một số nguyên nhân gây ra hiện tượng đa cộng tuyến:
• Các biến độc lập trong mô hình có tương quan cao;
• Số quan sát nhỏ hơn số biến độc lập;
• Phương pháp thu thập số liệu.
5.2. Ước lượng khi có đa cộng tuyến hoàn hảo
Chúng ta sẽ thấy rằng khi có hiện tượng đa cộng tuyến hoàn hảo thì các hệ số hồi quy
có thể không xác định và sai số tiêu chuẩn của chúng có thể bằng vô cùng. Để đơn
giản chúng ta xét mô hình hồi quy 3 biến

Bài 5: Đa cộng tuyến
68
i122i33ii
ˆˆ ˆ
YXXu=β +β +β + ,
(
)
i1,n=. (5.4)
Đặt: i i 2i 2i 2 3i 3i 3
yYY,x X X,x X X=− = − = −, ta có
i22i33ii
ˆˆ
yx xu=β +β + (5.5)
Trong phần hồi quy bội ta đã có các ước lượng 23
ˆˆ
,
β
β là:
nnnn
2
i2i 3i i3i 2i3i
i1 i1 i1 i1
22
nn n
22
2i 3i 2i 3i
i1 i1 i1
yx x yx x x
ˆ
xx xx
====
== =
−
β= ⎛⎞
−⎜⎟
⎝⎠
∑∑∑∑
∑∑ ∑
(5.6)
nn nn
2
i 3i 2i i 2i 2i 3i
i1 i1 i1 i1
32
nn n
22
2i 3i 2i 3i
i1 i1 i1
yx x yx x x
ˆ
xx xx
== ==
== =
−
β= ⎛⎞
−⎜⎟
⎝⎠
∑∑∑∑
∑∑ ∑
(5.7)
Nếu có hiện tượng đa cộng tuyến hoàn hảo thì ta có:
3i 2i 3i 2i
XXxx.=λ ⇒ =λ
Thay vào biểu thức (5.6) và (5.7), ta có:
23
0
ˆˆ
0
β
=β = (5.8)
Rõ ràng (5.8) là không xác định.Vậy trường hợp đa cộng tuyến hoàn hảo chúng ta
không ước lượng được các hệ số hồi quy riêng 23
ˆˆ
,
β
βcho mô hình (5.4).
5.3. Ước lượng khi có đa cộng tuyến không hoàn hảo
Trong thực tế hiếm khi xảy ra trường hợp đa cộng
tuyến hoàn hảo vì các biến độc lập hiếm khi có quan
hệ thực sự tuyến tính với nhau. Vì vậy nếu có hiện
tượng đa cộng tuyến thì thường chỉ xảy ra hiện tượng
đa cộng tuyến không hoàn hảo. Để đơn giản, ta cũng
xét mô hình hồi quy 3 biến với đa cộng tuyến không
hoàn hảo
i122i33ii
ˆˆ ˆ
YXXu=β +β +β + ,
(
)
i1,n= (5.9)
với i
u là các nhiễu ngẫu nhiên không tương quan với các biến độc lập. Khi đó giữa
hai biến độc lập 23
X , X có sự đa cộng tuyến không hoàn hảo, nghĩa là
3i 2i i
XXv=λ + (5.10)
với0λ≠ , i
v là các nhiễu ngẫu nhiên không tương quan với 2i
X và 3i
X, tức là
n
2i i
i1
Xv 0
=
=
∑,
n
3i i
i1
Xv 0.
=
=
∑

Bài 5: Đa cộng tuyến
69
Từ (5.10) ta cũng có: 3i 2i i
xxv=λ + (5.11)
và
n
2i i
i1
xv 0
=
=
∑,
n
3i i
i1
xv 0.
=
=
∑
Ta có ước lượng cho 2
ˆ
β
là:
nnnnnn
22 2 2
i2i 2i i i2i ii 2i
i1 i1 i1 i1 i1 i1
22
nnn n
22 2 2 2
2i 2i i 2i
i1 i1 i1 i1
yx x v yx yv x
ˆ
xxv x
======
=== =
⎛⎞⎛ ⎞
λ
+−λ + λ
⎜⎟⎜ ⎟
⎝⎠⎝ ⎠
β= ⎛⎞⎛⎞
λ+−λ
⎜⎟⎜⎟
⎝⎠⎝⎠
∑∑∑∑∑∑
∑∑∑ ∑
(5.12)
Tương tự ta cũng có biểu thức của 3
ˆ
β
.
5.4. Hậu quả của hiện tượng đa cộng tuyến
Ta xét trường hợp mô hình có hiện tượng đa cộng
tuyến không hoàn hảo, tức là biến độc lậpi
X có thể
xấp xỉ tuyến tính theo các biến23 k
X , X ,..., X . Đối với
mô hình hồi quy 3 biến thì 3
Xcó thể xấp xỉ theo 2
X,
nghĩa là hệ số tương quan riêng 23
r có giá trị tuyệt đối
xấp xỉ 1.
Trong chương mô hình hồi quy bội ta đã có biểu thức:
()
()
2
2n
22
2i 23
i1
ˆ
Var
x1r
=
σ
β=
−
∑ (5.13)
()
()
2
3n
22
3i 23
i1
ˆ
Var
x1r
=
σ
β=
−
∑ (5.14)
đồng thời với độ tin cậy 95% ta có khoảng ước lượng cho 23
,
β
β là :
(
)
(
)
()
ii ii i
ˆˆˆˆ
1.96Se ; 1.96Se
β
∈
β
−
ββ
+
β
(5.15)
với
() ()
ii
ˆˆ
Se Varβ= β,
(
)
i2,3=.
Ta thấy rằng khi 23
r xấp xỉ 1 thì:
• Phương sai
()
2
ˆ
Var ,β
(
)
3
ˆ
Var
β
gần với
∞
;
• Khoảng ước lượng của 23
,
β
β lớn, hay nói cách khác là khoảng ước lượng tiến tới
()
,−∞ +∞ . Vì vậy ước lượng hệ số trở lên khó có hiệu lực, tức là không có ý nghĩa,
vì khoảng ước lượng quá lớn.
Để kiểm định giả thuyết0i
H: 0
β
=, i2,3
=
, ta dùng các tiêu chuẩn thống kê
i
i
i
ˆ
tˆ
se( )
β
=β, i2,3=.