
12/5/2019
1
LOG
O
Chương 6:
KIỂM ĐỊNH GIẢ
THIẾT MÔ HÌNH
GV. Phan Trung Hiếu
§1. Hiện đa cộng tuyến
§2. Hiện tượng phương sai thay đổi
§3. Hiện tượng tự tương quan
2
§1. Hiện đa cộng tuyến
3
I. Khái niệm đa cộng tuyến:
-Là hiện tượng các biến độc lập có quan hệ tương
quan tuyến tính với nhau.
-Về mặt hình vẽ: xét mô hình 3 biến
1 2 2 3 3
Y X X U
Không có ĐCT
:ĐCT thấp
:ĐCT vừa
:ĐCT cao
4
-Về mặt số liệu:
Ví dụ 6.1. Xét bảng số liệu sau
X2:thu nhập 85 6 3 4
X3: của cải tích lũy 16 10 12 6 8
Y: chi tiêu 5 3 4 2 3
Ta thấy: ……….......
Đây là trường hợp
giữa X2và X3.
Đơn vị của các biến đều là triệu đồng.
5
X2:Tổng doanh thu 52 75 97 129 152
X3: Doanh thu bán vé 50 70 90 120 150
V: Phụ thu hành lý 2 5 7 9 2
Ta thấy: ……….…….
Đây là trường hợp
giữa X2và X3.
Ví dụ 6.2. Xét bảng số liệu sau
6
Đa cộng tuyến hoàn hảo:Nếu có ít nhất một
hệ số c2,c3,…, ckkhác 0 sao cho
Xét hàm hồi quy kbiến:
1 2 2 3 3 ...
i i i k ki i
Y X X X U
2 2 3 3
... 0.
i i k ki
c X c X c X
Đa cộng tuyến không hoàn hảo:Nếu có ít
nhất một hệ số c2,c3,…, ckkhác 0 sao cho
2 2 3 3
... 0.
i i k ki
c X c X c X
i
V
:
i
V
Sai số ngẫu nhiên.

12/5/2019
2
II. Nguyên nhân của đa cộng tuyến:
7
Do bản chất các biến độc lập đã có sẵn quan
hệ cộng tuyến với nhau.
Phương pháp thu thập số liệu:mẫu không đặc
trưng cho tổng thể.
Mô hình xác định quá mức:biến độc lập nhiều
hơn cỡ mẫu.
Chọn biến độc lập có độ biến thiên nhỏ.
III. Hậu quả của đa cộng tuyến:
8
Khi có hiện tượng đa cộng tuyến sẽ dẫn tới các hậu
quả sau:
Phương sai và sai số chuẩn ( ) của ước lượng
sẽ lớn.
Khoảng tin cậy của các hệ số hồi quy rộng hơn (do
sai số chuẩn lớn).
.Hậu quả là dễ chấp nhận
giả thiết H,nghĩa là tỉ số tkkhông có ý nghĩa.
Hệ số R2lớn như tỉ số tkkhông có ý nghĩa.
Dấu của các hệ số ước lượng có thể sai.
0
( )
( )
kk
kk
k
se t se
( )
k
se
k
IV. Ước lượng khi có đa cộng tuyến:
9
Trường hợp có đa cộng tuyến hoàn hảo:
Xét mô hình
1 2 2 3 3
i i i i
Y X X U
Giả sử:
2 3 2 3 23 32
( 0) = 1
i i i i
X X x x r r
Khi đó:
10
2
2 3 3 2 3
1 1 1 1
2
2 2 2
2 3 2 3
1 1 1
2
3 3 3 3 3
1 1 1 1
2 2 2 2 2 2
3 3 3 3
1 1 1 1
( )( ) ( )( )
ˆ
( )( ) ( )
( )( ) ( )( )
0
0
( )( ) ( )( )
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
n n n n
i i i i i i i
i i i i
n n n n
i i i i
i i i i
x y x x y x x
x x x x
x y x x y x x
x x x x
2
2
2 2
2 23
1
ˆ
( )
(1 )
n
i
i
Var
x r
Nếu có đa cộng tuyến hoàn hảo thì lúc đó không thể
ước lượng được các hệ số hồi quy và phương sai của
chúng là vô hạn.
11
Trường hợp có đa cộng tuyến không hoàn hảo:
-Nếu có đa cộng tuyến không hoàn hảo thì lúc
đó có thể ước lượng được hệ số hồi quy tuy
nhiên sẽ dẫn đến một số hậu quả nhất định.
-Giả sử
Khi đó, phương sai của các hệ số hồi
quy ước lượng sẽ cao. Điều này, dẫn đến một số
hậu quả như đã nêu trong Mục III.
2 3 23 32
( 0) 1
i i i
x x V r r
12
Chú ý:
-Trong thực tế đa cộng tuyến hoàn hảo gần như
không bao giờ xảy ra vì sự phụ thuộc hàm số giữa
các biến độc lập chỉ tồn tại về mặt lý thuyết. Do đó
trong các mô hình hồi quy bội khi nói đến vấn đề đa
cộng tuyến thì chúng ta hiểu đó là hiện tượng đa
cộng tuyến không hoàn hảo.
-Trong thực tế, thường các biến có đa cộng tuyến với
nhau, do đó, ta quan tâm đến mức độ của đa cộng
tuyến là cao hay thấp, chứ không phải chỉ là chú ý
đến có đa cộng tuyến hay không?

12/5/2019
3
V. Các cách phát hiện đa cộng tuyến:
13
Dựa vào hệ số xác định và tỉ số tk :
2
R
2
R
cao nhưng tồn tại một hay một vài giá trị tk
thấp tương đương với p-value tương ứng cao.
Hạn chế của cách này là nó chỉ thể hiện rõ khi có đa
cộng tuyến cao.
14
Ví dụ 6.3: Giả sử, ta có mẫu thống kê như sau
trong đó
Y: chi tiêu của một hộ gia đình (triệu đồng/tháng).
X2: thu nhập của hộ gia đình (triệu đồng/tháng).
X3: số thành viên trong hộ (người).
X4: giá trị tài sản (nhà, xe,…)
Với số liệu trên, chạy phần mềm Eviews, ta có kết
quả sau
15
16
Với mức ý nghĩa , ta thấy R2 = ……….. rất
lớn và biến độc lập X4 có p-value = …………
nên xảy ra hiện tượng đa cộng tuyến ở mức độ cao
giữa biến X4 và các biến X2, X3.
0,05
Dựa vào hệ số tương quan: Hệ số tương quan r
giữa các biến độc lập cao. Thực tế, nếu r > 0,8 thì
có khả năng xảy ra đa cộng tuyến cao. Tuy nhiên,
cách này không chắc lắm vì có thể rnhỏ nhưng vẫn
có đa cộng tuyến.
>
17
Ví dụ 6.4: Ta có ma trận hệ số tương quan ởví dụ
6.3 như sau
r23 =…………. nên có đa cộng tuyến cao giữa
X2và X3.
r24 =…………. nên có đa cộng tuyến cao giữa
X2và X4.
r34 = ………… nên có đa cộng tuyến cao giữa
X3và X4.
18
Ta thấy, mô hình xảy ra hiện tượng đa cộng tuyến
hoàn hảo vì …………….., nhưng hệ số tương quan
cặp tương ứng là r12 = -0,333, r13 = r23 = 0,59 không
cao.
Ví dụ 6.5: Xét mô hình hồi quy với 3biến độc lập
X1, X2, X3với số liệu mẫu như sau

12/5/2019
4
19
Sử dụng hồi quy phụ:
Xét hàm hồi quy 3 biến
Ta thực hiện 2hồi quy phụ:
1 2 2 3 3
.
i i i i
Y X X U
2
2 1 2 3 2 2
i i i
X a a X U R
2
3 1 2 2 3 3
i i i
X b b X U R
Dùng kiểm định F,kiểm định giả thiết
Dùng kiểm định F,kiểm định giả thiết
2
2
: 0
: 0
H b
H b
Nếu tất cả kết quả kiểm định trên đều là chấp nhận H
thì không có đa cộng tuyến.
2
2
: 0
: 0
H a
H a
20
Xét hàm hồi quy 4 biến
1 2 2 3 3 4 4
i i i i i
Y X X X U
Ta thực hiện 3hồi quy phụ:
2
2 1 2 3 3 4 2 2
i i i i
X a a X a X U R
Dùng kiểm định F,kiểm định
2 3
: 0
: coù ít nhaát moät heä soá 0 ( 2,3)
i
H a a
H a i
2
3 1 2 2 3 4 3 3
i i i i
X b b X b X U R
Dùng kiểm định F,kiểm định
2 3
: 0
: coù ít nhaát moät heä soá 0 ( 2,3)
i
H b b
H b i
2
4 1 2 2 3 3 4 4
i i i i
X c c X c X U R
Dùng kiểm định F,kiểm định
2 3
: 0
: coù ít nhaát moät heä soá 0 ( 2,3)
i
H c c
H c i
21
Nếu tất cả kết quả kiểm định trên đều là chấp nhận H
thì không có đa cộng tuyến.
Chú ý 1: Cặp giả thiết Hvà ởtrên tương đương
với
H
2
2
: 0 (khoâng coù ña coäng tuyeán)
: 0 (coù ña coäng tuyeán)
j
j
H R
H R
22
Chú ý 2: Trong các kiểm định Fởtrên, giá trị kiểm
định được Ftính theo công thức
trong đó là hệ số xác định trong hồi quy phụ của Xj.
Giá trị tới hạn .
-Nếu thì ta chấp nhận H.
-Nếu thì ta bác bỏ H.
klà số biến trong hồi quy phụ của Xj.
0
( )
(1 )( 1)
n k
Fk
2
2
j
j
R
R
2
j
R
( 1, )
C F n
k k
0
C F
0
C F
23
Trên nguyên tắc, ta cần kiểm định giá trị của tất cả
các hồi quy phụ, tuy nhiên, ta có thể áp dụng quy tắc
của Klien: “Hiện tượng cộng tuyến trở nên nghiêm
trọng chỉ khi của từ một hàm hồi quy phụ nào đó
có giá trị lớn hơn của hàm hồi quy chính-hàm hồi
quy của biến phụ thuộc Y.”
2
j
R
2
j
R
2
R
24
Ví dụ 6.6: Ta có kết quả chạy phần mềm Eviews
trong ví dụ 6.3 như sau

12/5/2019
5
25
Sử dụng hệ số phóng đại VIF:
2
1
1
j
j
VIF
R
với là hệ số xác định trong hàm hồi quy phụ
của Xj.
VIFj> 10 thì biến Xj được coi là
có cộng tuyến cao.
2
j
R
2
0,9
j
R
26
Chú ý: Với mô hình 3 biến
thì
trong đó r23 là hệ số tương quan giữa biến X2và
biến X3.
2
2 3
3
1
i
i i
XY
X
2
23
1
1
j
VIF
r
27
Ví dụ 6.7: Từ bảng kết quả Eviews trong ví dụ
6.6, ta có
2
4
R
2
4
1
1
j
VIF R
Vậy, …………………………………………....
………..
VI. Biện pháp khắc phục đa cộng tuyến:
Sử dụng thông tin tiên nghiệm:
28
Ví dụ 6.8: Xét mô hình hồi quy giữa chi tiêu
(Y) theo thu nhập (X2) và sự giàu có (X3). Mô
hình được đề nghị như sau
1 2 2 3 3
.
i i i i
Y X X U
Nhận xét: Thu nhập cao giàu có và ngược
lại Cộng tuyến cao.
Khắc phục:Giả sử thông tin có từ các cuộc
khảo sát trước cho thấy
2 3
10 .
29
Mô hình hồi quy có thể được biến đổi như sau
1 2 2 3 3
i i i i
Y X X U
1 2 2 3
( 0,1 )
i i i
X X U
1 2
2 3
( 0,1 )
i i
i i i
X U
X X X
Từ đó, tính được ta sẽ tính được .
2
3
30
Thu thập thêm số liệu hoặc lấy thêm mẫu mới
2
2
2
22 2
2 23
1
( ) 1
i
i
n x var
x r
(r23 không đổi)
Khi việc ước lượng cũng như kiểm
định các giả thuyết liên quan đến sẽ chính
xác hơn.
2
( )
var
2

