Bài giảng Kinh tế lượng Chương 6: ThS. Trần Quang Cảnh (tốt nhất)

CHƯƠNG 6

HIỆN TƯỢNG ĐA CỘNG TUYẾN

(MULTICOLLINEARITY)

1. Hiểu bản chất và hậu quảcủa

đa cộng tuyến

2. Biết cách phát hiện đa cộng

tuyến và biện pháp khắc phục

MỤC

TIÊU

ĐA CỘNG TUYẾN

NỘI DUNG

Bản chất, nguyên nhân của đa cộng tuyến

Ước lượng các tham số

Phát hiện đa cộng tuyến4

Khắc phục đa cộng tuyến

Hậu quả

Thu nhập Sự giàu có Chi tiêu

80 810 70

100 1009 65

120 1273 90

140 1425 95

160 1633 110

180 1876 115

200 2052 120

220 2201 140

240 2435 155

260 2686 150

Nguồn: Ramu Ramanathan

Khi lập mô hình hồi quy bội

Có sự phụ thuộc tuyến tính cao giữa các biến

giải thích gọi là đa cộng tuyến.

a. Đa cộng tuyến hoàn hảo

Tồn tại 

, 

,… 

không đồng thời bằng 0

sao cho



+ 

+ …+ 

= 0

Nói cách khác là xảy ra trường hợp một biến

giải thích nào đó được biểu diễn dưới dạng một

tổ hợp tuyến tính của các biến còn lại.

kikiii

XXXY



...

ˆˆˆ

33221



6.1 Bản chất của đa cộng tuyến

b. Đa cộng tuyến không hoàn hảo



+ 

+ …+ 

+ v

= 0

Với v

là sai số ngẫu nhiên thì ta có hiện tượng đa

cộng tuyến không hoàn hảo giữa các biến giải

thích.

Nói cách khác là một biến giải thích nào đó có

tương quan với một số biến giải thích khác.

6.1 Bản chất của đa cộng tuyến

= 5X

, vì vậy có cộng tuyến hoàn hảo giữa

và X

; r

= 1

và X

* không có cộng tuyến hoàn hảo,

nhưng hai biến này có tương quan chặt

chẽ.

10 15 18 24 30

50 75 90 120 150

129

152

6.1 Bản chất của đa cộng tuyến

Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến

6.1 Bản chất của đa cộng tuyến

Một số nguyên nhân gây ra hiện tượng

đa cộng tuyến

- Khi chọn các biến độc lập mối quan có

quan hệ nhân quả hay có tương quan

cao vì đồng phụ thuộc vào một điều kiện

khác.

- Khi số quan sát nhỏ hơn số biến độc lập.

- Cách thu thập mẫu: mẫu không đặc

trưng cho tổng thể

- Chọn biến X

có độ biến thiên nhỏ.

6.1 Nguyên nhân của đa cộng tuyến

6.2 Ước lượng khi có đa cộng tuyến

1. Trường hợp có đa cộng tuyến hoàn hảo

Xét mô hình hồi qui 3 biến dưới dạng sau:

= 

+ 

+ e

giả sử X

= X

, mô hình được biến đổi thành:

= (

+ 

+ e

= 

+ e

Phương pháp OLS





)

ˆˆ

(



Không thể tìm được lời giải duy nhất cho



6.2 Ước lượng khi có đa cộng tuyến

Các hệ số ước lượng không xác định

Phương sai và sai số chuẩn của 

và 

là vô hạn

323

)(

 

   





iiii

iiiiiii

xxxx

xxxyxxy



333







 

   

iiii

iiiiiii

xxxx

xxxyxxy





6.2 Ước lượng các tham số khi có đa cộng tuyến

Các hệ số ước lượng không xác định: chúng ta không

tách rời tác động của từng biến X

lên Y do không thể

giả định X

thay đổi trong khi X

không đổi.

323

)(

 

   





iiii

iiiiiii

xxxx

xxxyxxy



333







 

   

iiii

iiiiiii

xxxx

xxxyxxy





6.2 Ước lượng các tham số khi có đa cộng tuyến

2. Trường hợp có đa cộng tuyến không hoàn hảo

•Đa cộng tuyến hoàn hảo thường không xảy ra trong

thực tế.

•Xét mô hình hồi qui 3 biến dưới dạng sau:

= 

+ 

+ e

Giả định x

= x

+ v

Với   0 và v

là sai số ngẫu nhiên.

•Trong trường hợp này, các hệ số hồi qui 

và



có thể ước lượng được:

Ta có thể ước lượng được các này nhưng s.e.

sẽ rất lớn.

6.2 Ước lượng các tham số khi có đa cộng tuyến



6.3 Hậu quả của đa cộng tuyến

Nếu cócộng tuyến gần hoàn hảo:

•Các ước lượng vẫn BLUE, nhưng:

1. Phương sai vàhiệp phương sai của các ước

lượng OLS lớn.

là hệ số tương

quan giữa X

và

Khi r

1, các giá

trị trên  

6.3 Hậu quả của đa cộng tuyến

Nếu cócộng tuyến gần hoàn hảo:

2. Khoảng tin cậy rộng hơn.

•Khoảng tin cậy của 

và

(với độ tin cậy 1 –)

là:



= t

/2

se ( );



= t

/2

se ( );

trong đó:

se ( ) = se ( ) =







)1(









)1(



Giá trị của r23 Khoảng tin cậy 95% của B2

0.5

0.95

0.995

0.999

A*96.1





A*33.1*96.1





A*26.10*96.1





A*100*96.1





A*500*96.1











6.3 Hậu quả của đa cộng tuyến

Nếu cócộng tuyến gần hoàn hảo:

3. Tỉ số t "không cóý nghĩa".

Khi kiểm định giả thuyết H0: 

= 0, chúng ta sử

dụng tỷ số t.

vàso sánh giátrị ước lượng của t với giátrị tra bảng

(tới hạn) của t.

Trong trường hợp cộng tuyến cao thìsai số chuẩn

sẽ rất lớn vàdo đólàm cho giátrị t sẽ nhỏ đi, kết

quả làsẽ làm tăng chấp nhận giả thuyết H0.

)

(



t

6.3 Hậu quả của đa cộng tuyến

Nếu cócộng tuyến gần hoàn hảo:

4. R

cao nhưng tỉ số t ít cóý nghĩa.

•Đa cộng tuyến cao:

•- một hoặc một số tham số tương quan (hệ

số góc riêng) không cóý nghĩa về mặt thống

kê

•- R

trong những trường hợp này lại rất cao

(trên 0,9).

•- kiểm định F thìcóthể bác bỏ giả thuyết cho

rằng 

= 

= …= 

= 0.

6.3 Hậu quả của đa cộng tuyến

Nếu cócộng tuyến gần hoàn hảo:

5. Các ước lượng OLS vàsai số chuẩn của chúng

trở nên rất nhạy với những thay đổi nhỏ trong

dữ liệu.

6. Dấu của các ước lượng của các hệ số hồi qui có

thể sai

7. Thêm vào hay bớt đi các biến cộng tuyến với các

biến khác, mô hình sẽ thay đổi về dấu hoặc

thay đổi về độ lớn của các ước lượng.

Ví dụ: Bảng 2 do nhập sai số liệu nên

xảy ra đa cộng tuyến

Bảng 1

YX2 X3

1 2 4

2 0 2

3 4 12

46 0

5 8 16

Bảng 2

YX2 X3

1 2 4

2 0 2

3 4 0

46 12

5 8 16

00868.0)

cov(;5523.0;81.0

003.0446.0193.1

3223







XXY

iii

Se (0.7736) (0.1848) (0.0850)

t (1.543) (2.415) (0.0358)

0282.0)

cov(;8285.0;81.0

027.0401.0210.1

3223







XXY

iii

Se (0.7480) (0.2720) (0.1252)

t (1.618) (1.4752) (0.2152)

Đa cộng tuyến là một hiện tượng theo

mẫu, nghĩa là cho dù các biến độc lập

không tương quan tuyến tính trong

tổng thể nhưng chúng có thể tương

quan tuyến tính trong một mẫu cụ thể

nào đó. Do đó cỡ mẫu lớn thì hiện

tượng đa cộng tuyến ít nghiêm trọng

hơn cỡ mẫu nhỏ

1. Hệ số R

lớn nhưng tỷ số t nhỏ

2. Tương quan cặp giữa các biến giải thích cao

3. Sử dụng mô hình hồi qui phụ

4. Sử dụng yếu tố phóng đại phương sai (VIF)

6.4 Cách phát hiện đa cộng tuyến

1. R

lớn nhưng tỷ số t nhỏ

Nếu R

cao, chẳng hạn, >0,8 và F test bác bỏ giả

thuyết 

= 

= … = 

= 0, nhưng t test cho

từng 

lại chấp nhận H

2. Tương quan cặp giữa các biến giải thích cao

Trong đó X, Z là 2 biến giải thích trong mô hình







)()(

))((

ZZXX

6.4 Cách phát hiện đa cộng tuyến

3. Sử dụng mô hình hồi quy phụ

Hồi qui một biến giải thích X nào đó theo các biến

còn lại.

Tính R

và F cho mỗi mô hình theo công thức:

Lập giả thiết H

: R

= 0 ~ H

không có đa cộng tuyến

Nếu F > F



(m-1,n-m): bác bỏ H

=> có đa cộng tuyến

Nếu F < F



(m-1,n-m): chấp nhận H

=> không có đa

cộng tuyến

mikii

XXX



...

ˆˆ

3312



)1)(1(

)(





mR

mnR

6.4 Cách phát hiện đa cộng tuyến

VD: Cho doanh số bán (Y), chi phí chào hàng (X

)

và chi phí quảng cáo (X

) trong năm 2001 ở 12

khu vực bán hàng của 1 công ty. Có hiện tượng

đa cộng tuyến không?

Hồi quy biến chi phí chào hàng với chi phí quảng

cáo, ta có kết quả

=42,012 + 0,387 *X

= 0,22922 F= 2,9738

Với mức ý nghĩa α=5%, tra bảng F

0.05

(1,10)=

4,96. Ta thấy F < F

0.05

(1,10) nên chấp nhận Ho

hay không có đa cộng tuyến.

6.4 Cách phát hiện đa cộng tuyến

Bài giảng Kinh tế lượng: Chương 6 - ThS. Trần Quang Cảnh

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi