Đa Cộng Tuyến: Bài 5 - Tổng quan và ứng dụng

Bài 5: Đa cộng tuyến

BÀI 5. ĐA CỘNG TUYẾN

Mục tiêu

Sau khi kết thúc bài, học viên sẽ hiểu

được những vấn đề sau đây:

• Hiện tượng đa cộng tuyến (ĐCT) xảy

ra khi nào?

• Phân biệt ĐCT hoàn hảo và không

hoàn hảo.

• Hậu quả của ĐCT.

• Phát hiện ĐCT.

• Các biện pháp khắc phục ĐCT.

Nội dung Hướng dẫn học

• ĐCT là gì?

• Phân biệt ĐCT hoàn hảo và không hoàn hảo.

• Hậu quả của ĐCT.

• Phát hiện ĐCT.

• Khắc phục ĐCT.

Thời lượng

• 6 tiết

• Đọc tài liệu để có được những ý

tưởng chính.

• Nghe thật kỹ bài giảng của giảng viên

để nắm được bản chất của hiện tượng.

• Tập trung vào phần khái niệm, các

biện pháp phát hiện và khắc phục.

Bài 5: Đa cộng tuyến

TÌNH HUỐNG DẪN NHẬP

Tình huống

Các nhà quản lí siêu thị BigC, muốn xem xét việc giảm giá mặt

hàng thịt gà để kích thích tiêu dùng. Để thực hiện điều này, các

nghiên cứu viên muốn dùng phương pháp Kinh tế lượng trong

đó biến phụ thuộc được chọn chính là tiêu dùng của mặt hàng

thịt gà của dân chúng, các biến độc lập sẽ là thu nhập của người

tiêu dùng, giá của thịt gà và giá của thịt lợn là mặt hàng cạnh

tranh với thịt gà tại các thời điểm quan sát.

Vấn đề đặt ra trong nghiên cứu là chọn các biến độc lập vào trong mô hình. Vì lạm phát là tình

trạng chung của cả nền kinh tế nên các mặt hàng thường có tình trạng cùng tăng giá hoặc cùng

giảm giá, nhất là những mặt hàng thiết yếu như thịt gà và thịt lợn. Nếu như các nhà nghiên cứu

chọn cả giá thịt gà và giá thịt lợn làm biến độc lập trong mô hình, chúng sẽ có quan hệ cùng

tăng hoặc cùng giảm. Vì thế khi tiến hành phân tích bằng mô hình kinh tế lượng, sẽ khó để

phân tách ảnh hưởng của từng biến này lên tiêu dùng về thị gà hoặc sẽ gây ra các hậu quả về

mặt kỹ thuật trong quá trình phân tích.

Câu hỏi

• Vậy trong tình huống như thế này thì các nhà nghiên cứu cần có biện pháp gì?

• Trong bài học sau đây, học viên sẽ được xem xét một khuyết tật của mô hình kinh tế lượng

trong tình huống nêu trên, đó là đa cộng tuyến. Làm thế nào để phát hiện và khắc phục hiện

tượng này khi xem xét một mô hình với nhiều biến độc lập?

Bài 5: Đa cộng tuyến

Trong bài trước chúng ta xét mô hình hồi quy bội với giả thiết

các biến giải thích i

X độc lập tuyến tính với nhau. Tiếp theo đây

chúng ta sẽ xét bài toán hồi quy bội khi giả thiết về tính độc lập

tuyến tính đó bị phá vỡ và sẽ đưa ra cách thức phát hiện và biện

pháp khắc phục hiện tượng giả thiết đó bị vi phạm.

Trong mô hình hồi quy ở bài trước thì các hệ số hồi quy đối với

một biến cụ thể là số đo tác động riêng phần của biến tương ứng

khi tất cả các biến khác trong mô hình được giữ cố định. Nếu tính

độc lập bị phá vỡ, tức là các biến giải thích có tương quan thì chúng ta không thể chỉ cho một

biến thay đổi và giữ các biến còn lại cố định. Do vậy chúng ta không thể tách biệt sự ảnh hưởng

riêng phần của một biến nào đó.

5.1. Khái niệm đa cộng tuyến

5.1.1. Đa cộng tuyến hoàn hảo

Bài toán

Các biến 23 k

X , X ,..., X gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng

tuyến chính xác nếu tồn tại 2k

,...,

λ không đồng thời bằng không sao cho:

22 33 kk

X X ... X 0λ+λ++λ= (5.1)

5.1.2. Đa cộng tuyến không hoàn hảo (gần đa cộng tuyến)

Bài toán

Các biến23 k

X , X ,..., X gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại 2k

,...,λλ

không đồng thời bằng không sao cho:

22 33 kk

X X ... X v 0λ+λ++λ+= (5.2)

trong đó v là sai số ngẫu nhiên.

Trong (5.2) giả sử i0∃λ ≠ khi đó ta biểu diễn:

i23 k

ii ii

X X X ... X

λλ

=− − − − −

λλ λλ

(5.3)

Từ (5.3) ta thấy hiện tượng đa cộng tuyến xảy ra khi

một biến là tổ hợp tuyến tính của các biến còn lại và

một sai số ngẫu nhiên, hay nói cách khác là có một

biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại.

Một số nguyên nhân gây ra hiện tượng đa cộng tuyến:

• Các biến độc lập trong mô hình có tương quan cao;

• Số quan sát nhỏ hơn số biến độc lập;

• Phương pháp thu thập số liệu.

5.2. Ước lượng khi có đa cộng tuyến hoàn hảo

Chúng ta sẽ thấy rằng khi có hiện tượng đa cộng tuyến hoàn hảo thì các hệ số hồi quy

có thể không xác định và sai số tiêu chuẩn của chúng có thể bằng vô cùng. Để đơn

giản chúng ta xét mô hình hồi quy 3 biến

Bài 5: Đa cộng tuyến

i122i33ii

ˆˆ ˆ

YXXu=β +β +β + ,

(

)

i1,n=. (5.4)

Đặt: i i 2i 2i 2 3i 3i 3

yYY,x X X,x X X=− = − = −, ta có

i22i33ii

ˆˆ

yx xu=β +β + (5.5)

Trong phần hồi quy bội ta đã có các ước lượng 23

ˆˆ

β là:

nnnn

i2i 3i i3i 2i3i

i1 i1 i1 i1

nn n

2i 3i 2i 3i

i1 i1 i1

yx x yx x x

xx xx

====

== =

−

β= ⎛⎞

−⎜⎟

⎝⎠

∑∑∑∑

∑∑ ∑

(5.6)

nn nn

i 3i 2i i 2i 2i 3i

i1 i1 i1 i1

nn n

2i 3i 2i 3i

i1 i1 i1

yx x yx x x

xx xx

== ==

== =

−

β= ⎛⎞

−⎜⎟

⎝⎠

∑∑∑∑

∑∑ ∑

(5.7)

Nếu có hiện tượng đa cộng tuyến hoàn hảo thì ta có:

3i 2i 3i 2i

XXxx.=λ ⇒ =λ

Thay vào biểu thức (5.6) và (5.7), ta có:

ˆˆ

=β = (5.8)

Rõ ràng (5.8) là không xác định.Vậy trường hợp đa cộng tuyến hoàn hảo chúng ta

không ước lượng được các hệ số hồi quy riêng 23

ˆˆ

βcho mô hình (5.4).

5.3. Ước lượng khi có đa cộng tuyến không hoàn hảo

Trong thực tế hiếm khi xảy ra trường hợp đa cộng

tuyến hoàn hảo vì các biến độc lập hiếm khi có quan

hệ thực sự tuyến tính với nhau. Vì vậy nếu có hiện

tượng đa cộng tuyến thì thường chỉ xảy ra hiện tượng

đa cộng tuyến không hoàn hảo. Để đơn giản, ta cũng

xét mô hình hồi quy 3 biến với đa cộng tuyến không

hoàn hảo

i122i33ii

ˆˆ ˆ

YXXu=β +β +β + ,

(

)

i1,n= (5.9)

với i

u là các nhiễu ngẫu nhiên không tương quan với các biến độc lập. Khi đó giữa

hai biến độc lập 23

X , X có sự đa cộng tuyến không hoàn hảo, nghĩa là

3i 2i i

XXv=λ + (5.10)

với0λ≠ , i

v là các nhiễu ngẫu nhiên không tương quan với 2i

X và 3i

X, tức là

2i i

Xv 0

∑,

3i i

Xv 0.

∑

Bài 5: Đa cộng tuyến

Từ (5.10) ta cũng có: 3i 2i i

xxv=λ + (5.11)

và

2i i

xv 0

∑,

3i i

xv 0.

∑

Ta có ước lượng cho 2

là:

nnnnnn

22 2 2

i2i 2i i i2i ii 2i

i1 i1 i1 i1 i1 i1

nnn n

22 2 2 2

2i 2i i 2i

i1 i1 i1 i1

yx x v yx yv x

xxv x

======

=== =

⎛⎞⎛ ⎞

+−λ + λ

⎜⎟⎜ ⎟

⎝⎠⎝ ⎠

β= ⎛⎞⎛⎞

λ+−λ

⎜⎟⎜⎟

⎝⎠⎝⎠

∑∑∑∑∑∑

∑∑∑ ∑

(5.12)

Tương tự ta cũng có biểu thức của 3

5.4. Hậu quả của hiện tượng đa cộng tuyến

Ta xét trường hợp mô hình có hiện tượng đa cộng

tuyến không hoàn hảo, tức là biến độc lậpi

X có thể

xấp xỉ tuyến tính theo các biến23 k

X , X ,..., X . Đối với

mô hình hồi quy 3 biến thì 3

Xcó thể xấp xỉ theo 2

nghĩa là hệ số tương quan riêng 23

r có giá trị tuyệt đối

xấp xỉ 1.

Trong chương mô hình hồi quy bội ta đã có biểu thức:

()

2i 23

Var

x1r

β=

−

∑ (5.13)

()

3i 23

Var

x1r

β=

−

∑ (5.14)

đồng thời với độ tin cậy 95% ta có khoảng ước lượng cho 23

β là :

(

)

(

)

()

ii ii i

ˆˆˆˆ

1.96Se ; 1.96Se

∈

−

ββ

(5.15)

với

() ()

ˆˆ

Se Varβ= β,

(

)

i2,3=.

Ta thấy rằng khi 23

r xấp xỉ 1 thì:

• Phương sai

()

Var ,β

(

)

Var

gần với

∞

;

• Khoảng ước lượng của 23

β lớn, hay nói cách khác là khoảng ước lượng tiến tới

()

,−∞ +∞ . Vì vậy ước lượng hệ số trở lên khó có hiệu lực, tức là không có ý nghĩa,

vì khoảng ước lượng quá lớn.

Để kiểm định giả thuyết0i

H: 0

=, i2,3

, ta dùng các tiêu chuẩn thống kê

tˆ

se( )

=β, i2,3=.

BÀI 5: ĐA CỘNG TUYẾN

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi