12/5/2019
1
LOG
O
Chương 6:
KIỂM ĐỊNH GIẢ
THIẾT MÔ HÌNH
GV. Phan Trung Hiếu
§1. Hiện đa cộng tuyến
§2. Hiện tượng phương sai thay đổi
§3. Hiện tượng tự tương quan
2
§1. Hiện đa cộng tuyến
3
I. Khái niệm đa cộng tuyến:
-Là hiện ợng các biến độc lập có quan hệ tương
quan tuyến tính với nhau.
-V mặt hình v: xét hình 3 biến
1 2 2 3 3
Y X X U
Kng ĐCT
:ĐCT thấp
:ĐCT vừa
:ĐCT cao
4
-Về mặt số liệu:
dụ 6.1. Xét bảng số liệu sau
X2:thu nhập 85 6 3 4
X3: của cải tích lũy 16 10 12 6 8
Y: chi tiêu 5 3 4 2 3
Ta thấy: ……….......
Đây trường hợp
giữa X2và X3.
Đơn vị của các biến đều triệu đồng.
5
X2:Tổng doanh thu 52 75 97 129 152
X3: Doanh thu bán 50 70 90 120 150
V: Ph thu hành 2 5 7 9 2
Ta thấy: ……….…….
Đây trường hợp
giữa X2và X3.
dụ 6.2. Xét bảng số liệu sau
6
Đa cộng tuyến hoàn hảo:Nếu có ít nhất một
hệ số c2,c3,…, ckkhác 0 sao cho
Xét hàm hồi quy kbiến:
1 2 2 3 3 ...
i i i k ki i
Y X X X U
2 2 3 3
... 0.
i i k ki
c X c X c X
Đa cộng tuyến không hoàn hảo:Nếu có ít
nhất một hệ số c2,c3,…, ckkhác 0 sao cho
2 2 3 3
... 0.
i i k ki
c X c X c X
i
V
:
i
V
Sai số ngẫu nhiên.
12/5/2019
2
II. Nguyên nhân của đa cộng tuyến:
7
Do bản chất các biến độc lập đã có sẵn quan
hệ cộng tuyến với nhau.
Phương pháp thu thập s liệu:mẫu không đặc
trưng cho tổng thể.
hình xác định quá mức:biến độc lập nhiều
hơn cỡ mẫu.
Chọn biến độc lập độ biến thiên nh.
III. Hậu quả của đa cộng tuyến:
8
Khi có hiện tượng đa cng tuyến sẽ dẫn tới các hậu
quả sau:
Phương sai và sai số chun ( ) của ước ợng
sẽ lớn.
Khoảng tin cậy của các hệ số hồi quy rộng hơn (do
sai số chuẩn lớn).
.Hậu quả dễ chấp nhận
giả thiết H,nghĩa tỉ số tkkhông ý nghĩa.
H số R2lớn như tỉ số tkkhông ý nghĩa.
Dấu của các hệ số ước lượng thể sai.
0
( )
( )
kk
kk
k
se t se

( )
k
se
k
IV. Ước lượng khi có đa cộng tuyến:
9
Trường hợp có đa cộng tuyến hoàn hảo:
Xét mô hình
1 2 2 3 3
i i i i
Y X X U
Giả sử:
2 3 2 3 23 32
( 0) = 1
i i i i
X X x x r r
Khi đó:
10
2
2 3 3 2 3
1 1 1 1
2
2 2 2
2 3 2 3
1 1 1
2
3 3 3 3 3
1 1 1 1
2 2 2 2 2 2
3 3 3 3
1 1 1 1
( )( ) ( )( )
ˆ
( )( ) ( )
( )( ) ( )( )
0
0
( )( ) ( )( )
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
n n n n
i i i i i i i
i i i i
n n n n
i i i i
i i i i
x y x x y x x
x x x x
x y x x y x x
x x x x
2
2
2 2
2 23
1
ˆ
( )
(1 )
n
i
i
Var
x r
Nếu có đa cộng tuyến hoàn hảo thì lúc đó không thể
ước lượng được các hệ số hồi quy và phương sai của
chúng vô hạn.
11
Trường hợp có đa cộng tuyến không hoàn hảo:
-Nếu có đa cộng tuyến không hoàn hảo thì lúc
đó thể ước lượng được hệ số hồi quy tuy
nhiên s dẫn đến một s hậu quả nhất định.
-Giả sử
Khi đó, phương sai của các hệ s hồi
quy ước lượng sẽ cao. Điều này, dẫn đến một số
hậu quả như đã nêu trong Mục III.
2 3 23 32
( 0) 1
i i i
x x V r r
12
Chú ý:
-Trong thực tế đa cộng tuyến hoàn hảo gần như
không bao giờ xảy ra sự phụ thuộc hàm số giữa
các biến độc lập chỉ tồn tại về mặt thuyết. Do đó
trong các hình hồi quy bội khi nói đến vấn đ đa
cộng tuyến thì chúng ta hiểu đó hiện ợng đa
cộng tuyến không hoàn hảo.
-Trong thực tế, thường các biến đa cộng tuyến với
nhau, do đó, ta quan tâm đến mức đ của đa cộng
tuyến cao hay thấp, chứ không phải chỉ chú ý
đến đa cộng tuyến hay không?
12/5/2019
3
V. Các cách phát hiện đa cộng tuyến:
13
Dựa vào hệ số xác định tỉ số tk :
2
R
2
R
cao nhưng tồn tại một hay một vài giá trị tk
thấp tương đương vi p-value tương ứng cao.
Hạn chế của cách này là nó chỉ thể hiện rõ khi có đa
cộng tuyến cao.
14
Ví dụ 6.3: Giả sử, ta có mẫu thống kê như sau
trong đó
Y: chi tiêu của một hộ gia đình (triệu đồng/tháng).
X2: thu nhập của hộ gia đình (triệu đồng/tháng).
X3: số thành viên trong hộ (người).
X4: giá trị tài sản (nhà, xe,…)
Với số liệu trên, chạy phần mềm Eviews, ta có kết
quả sau
15
16
Với mức ý nghĩa , ta thấy R2 = ……….. rất
lớn và biến độc lập X4 p-value = …………
nên xảy ra hiện tượng đa cộng tuyến ở mức độ cao
giữa biến X4 và các biến X2, X3.
0,05
Dựa vào hệ số tương quan: Hệ số tương quan r
giữa các biến độc lập cao. Thực tế, nếu r > 0,8 thì
kh năng xảy ra đa cộng tuyến cao. Tuy nhiên,
cách này không chắc lắm thể rnhỏ nhưng vẫn
đa cộng tuyến.
>
17
dụ 6.4: Ta ma trận hệ số tương quan dụ
6.3 như sau
r23 =…………. nên có đa cộng tuyến cao giữa
X2và X3.
r24 =…………. nên có đa cộng tuyến cao giữa
X2và X4.
r34 = ………… nên có đa cộng tuyến cao giữa
X3và X4.
18
Ta thấy, mô hình xảy ra hiện tượng đa cộng tuyến
hoàn hảo vì …………….., nhưng hệ số ơng quan
cặp tương ứng r12 = -0,333, r13 = r23 = 0,59 không
cao.
dụ 6.5: Xét hình hồi quy với 3biến độc lập
X1, X2, X3với số liệu mẫu như sau
12/5/2019
4
19
Sử dụng hồi quy phụ:
Xét hàm hồi quy 3 biến
Ta thực hiện 2hồi quy phụ:
1 2 2 3 3
.
i i i i
Y X X U
2
2 1 2 3 2 2
i i i
X a a X U R
2
3 1 2 2 3 3
i i i
X b b X U R
Dùng kiểm định F,kiểm định giả thiết
Dùng kiểm định F,kiểm định giả thiết
2
2
: 0
: 0
H b
H b
Nếu tt cả kết quả kiểm định trên đều chấp nhận H
thì không đa cộng tuyến.
2
2
: 0
: 0
H a
H a
20
Xét hàm hồi quy 4 biến
1 2 2 3 3 4 4
i i i i i
Y X X X U
Ta thực hiện 3hồi quy phụ:
2
2 1 2 3 3 4 2 2
i i i i
X a a X a X U R
Dùng kiểm định F,kiểm định
2 3
: 0
: coù ít nhaát moät heä soá 0 ( 2,3)
i
H a a
H a i
2
3 1 2 2 3 4 3 3
i i i i
X b b X b X U R
Dùng kiểm định F,kiểm định
2 3
: 0
: cít nhaát moät heä soá 0 ( 2,3)
i
H b b
H b i
2
4 1 2 2 3 3 4 4
i i i i
X c c X c X U R
Dùng kiểm định F,kiểm định
2 3
: 0
: cít nhaát moät heä soá 0 ( 2,3)
i
H c c
H c i
21
Nếu tt cả kết quả kiểm định trên đều chấp nhận H
thì không đa cộng tuyến.
Chú ý 1: Cặp giả thiết Hvà trên ơng đương
vi
H
2
2
: 0 (khoâng coù ña coäng tuyeán)
: 0 (coù ña coäng tuyeán)
j
j
H R
H R
22
Chú ý 2: Trong các kiểm định Ftrên, giá trị kiểm
định được Ftính theo công thức
trong đó h số xác định trong hồi quy phụ của Xj.
G trị tới hạn .
-Nếu thì ta chấp nhận H.
-Nếu thì ta bác bỏ H.
k số biến trong hồi quy phụ của Xj.
0
( )
(1 )( 1)
n k
Fk
2
2
j
j
R
R
2
j
R
( 1, )
C F n
k k
0
C F
0
C F
23
Trên nguyên tắc, ta cần kiểm định giá trị của tất cả
các hồi quy phụ, tuy nhiên, ta có thể áp dụng quy tắc
của Klien: Hiện tượng cộng tuyến trở nên nghiêm
trọng chỉ khi của từ một hàm hồi quy pho đó
có giá trị lớn hơn của hàm hồi quy chính-m hồi
quy của biến phụ thuộc Y.”
2
j
R
2
j
R
2
R
24
dụ 6.6: Ta kết quả chạy phần mềm Eviews
trong ví dụ 6.3 như sau
12/5/2019
5
25
Sử dụng h số phóng đại VIF:
2
1
1
j
j
VIF
R
với là hệ số xác định trong hàm hồi quy phụ
của Xj.
VIFj> 10 thì biến Xj được coi
có cộng tuyến cao.
2
j
R
2
0,9
j
R
26
Chú ý: Với hình 3 biến
thì
trong đó r23 hệ số tương quan giữa biến X2và
biến X3.
2
2 3
3
1
i
i i
XY
X
2
23
1
1
j
VIF
r
27
dụ 6.7: Từ bảng kết quả Eviews trong dụ
6.6, ta
2
4
R
2
4
1
1
j
VIF R
Vậy, …………………………………………....
………..
VI. Biện pháp khắc phục đa cộng tuyến:
Sử dụng thông tin tiên nghiệm:
28
dụ 6.8: t hình hồi quy giữa chi tiêu
(Y) theo thu nhập (X2) sự giàu (X3).
hình được đề ngh như sau
1 2 2 3 3
.
i i i i
Y X X U
Nhn xét: Thu nhập cao giàu ngược
lại Cộng tuyến cao.
Khắc phục:Giả sử thông tin từ các cuộc
khảo sát trước cho thấy
2 3
10 .
29
hình hồi quy có thể được biến đổi như sau
1 2 2 3 3
i i i i
Y X X U
1 2 2 3
( 0,1 )
i i i
X X U
1 2
2 3
( 0,1 )
i i
i i i
X U
X X X
Từ đó, nh được ta sẽ tính được .
2
3
30
Thu thập thêm số liệu hoặc lấy thêm mẫu mới
2
2
2
22 2
2 23
1
( ) 1
i
i
n x var
x r
 
(r23 không đổi)
Khi việc ước lượng cũng n kiểm
định các giả thuyết liên quan đến sẽ chính
xác hơn.
2
( )
var
2