22/8/2015

Khái niệm đa cộng tuyến

 Xét mô hình hồi quy bội:

Đa cộng tuyến

Y = β1 + β2X1 + … + βkXk-1 + u  Mô hình lý tưởng là các biến độc lập không có tương quan với nhau. Khi đó ta nói không có hiện tượng đa cộng tuyến.

Lê Minh Tiến

 Nếu ∃ ít nhất 2 biến độc lập cùng chứa đựng một số thông tin chung về Y thì ta nói có hiện tượng đa cộng tuyến (multicollinearity).

Mục tiêu của chương

Ghi chú

Bài giảng Kinh tế lượng © Tien M. Le 4

Sau khi học xong chương này, bạn có thể:  Hiểu được các nguyên nhân gây ra đa cộng

tuyến

 Biết được hậu quả của đa cộng tuyến  Thực hiện được các phương pháp phát hiện đa

cộng tuyến

 Thực hiện được các biện pháp khắc phục đa

 Mô hình lý tưởng là các biến độc lập không có tương quan với nhau, mỗi biến chứa đựng một số thông tin riêng về Y và thông tin đó không có trong biến độc lập khác, khi đó hệ số hồi quy riêng cho biết ảnh hưởng của từng biến độc lập đối với biến phụ thuộc khi giả định các biến độc lập còn lại không đổi. Trong trường hợp này ta nói không có hiện tượng đa cộng tuyến.

cộng tuyến

Nội dung

Các loại đa cộng tuyến

 Nếu tồn tại các số thực λ1,…, λk-1 không đồng

thời bằng 0 sao cho:

 Nguyên nhân gây ra đa cộng tuyến  Hậu quả của đa cộng tuyến  Các phương pháp phát hiện đa cộng tuyến  Các biện pháp khắc phục đa cộng tuyến

tuyến

hoàn

cộng

hảo

đa

λ1X1 +…+ λk-1Xk-1 = 0 thì ta nói giữa các biến Xj (j = 1,…, k-1) xảy ra hiện (perfect tượng multicollinearity).  Nói cách khác: Xj= λ1X1 +…+ λk-1Xk-1

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 2 5

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 3 6

1

22/8/2015

Các loại đa cộng tuyến

Hậu quả của đa cộng tuyến hoàn hảo

 Không xác định được duy nhất các hệ số hồi

 Nếu tồn tại các số λj,…, λk-1 không đồng thời

bằng 0 sao cho:

quy riêng βj^ ứng với mẫu cụ thể.

 Không thể tách riêng ảnh hưởng của từng biến Xj đến biến phụ thuộc Y, chỉ có thể ước lượng ảnh hưởng chung của các biến cộng tuyến đối với biến phụ thuộc.

λ1X1 +…+ λk-1Xk-1 + v = 0 với v là sai số ngẫu nhiên thì ta có đa cộng tuyến không hoàn hảo (imperfect multicollinearity) giữa các biến Xi.  Nói cách khác: Xj= λ1X1 +…+ λk-1Xk-1 + v

Nguyên nhân gây ra đa cộng tuyến

Ghi chú

 Phương pháp thu thập số liệu  Do bản chất của mối quan hệ giữa các biến  Đặc trưng mô hình  Mô hình xác định quá mức

 Điều này là hợp lý vì trong trường hợp có đa cộng tuyến hoàn hảo, khi một biến độc lập thay đổi thì sẽ kéo theo sự thay đổi của những biến có cộng tuyến với nó, nên giả định cố định các biến độc lập còn lại là không hợp lý. Trong thực tế thì trường hợp đa cộng tuyến hoàn hảo hiếm khi xảy ra, mà ta thường gặp đa cộng tuyến không hoàn hảo với các mức độ khác nhau.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 7 10

Ghi chú

Hậu quả của đa cộng tuyến không hoàn hảo

 Các hệ số hồi quy ước lượng có phương sai và

hiệp phương sai của lớn.

 Khoảng tin cậy của các hệ số hồi quy có khuynh

hướng rộng hơn.

 Khả năng mắc sai lầm loại 2 khi kiểm định giả

thuyết H0: βj = βj* sẽ cao.

 Mặc dù tỉ số |tqs| bé, nhưng hệ số xác định R2 có

thể rất cao.

• Phương pháp thu thập số liệu: Mẫu không đặc trưng cho tổng thể. • Do bản chất của các mối quan hệ giữa các biến đã ngầm chứa hiện tượng đa cộng tuyến: Thí dụ như hồi quy lượng điện năng tiêu thụ (Y) theo thu nhập (X1) và diện tích nhà ở (X2). Trong mối quan hệ này ẩn chứa đa cộng tuyến vì thông thường những gia đình có thu nhập cao thì có nhà rộng hơn những gia đình có thu nhập thấp. • Đặc trưng mô hình: Thí dụ khi bổ sung những biến có luỹ thừa bậc cao vào mô hình, đặc biệt khi phạm vi dữ liệu của biến độc lập là nhỏ. • Một mô hình xác định quá mức: xảy ra khi số biến giải thích nhiều hơn cỡ mẫu. Trong trường hợp này ta không xác định được duy nhất các hệ số hồi quy.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 8 11

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 9 12

2

22/8/2015

Ghi chú

Ghi chú

• Như được trình bày ở mục 2.6, các ước lượng OLS có tính chất BLUE khi 5 giả thiết của mô hình hồi quy tuyến tính cổ điển được thoả mãn. Các giả thiết này không đề cập đến sự tương quan giữa các biến độc lập, nên tính chất BLUE của các hệ số ước lượng vẫn được bảo toàn khi xảy ra hiện tượng cộng tuyến.

* Khi hệ số xác định R2 cao, kinh nghiệm cho thấy R2 > 0.8, thì thường giả thiết về các hệ số hồi quy đồng thời bằng 0 bị bác bỏ, nói cách khác thừa nhận có ít nhất một hệ số hồi quy riêng khác 0. * Tuy nhiên tỷ số |t| thấp thì ta có xu hướng chấp nhận giả thiết hệ số hồi quy riêng bằng 0.

• Phương sai và hiệp phương sai của các hệ số hồi quy lớn bất thường, nghĩa là các giá trị ước lượng thay đổi nhiều từ mẫu này sang mẫu khác, điều này làm cho việc xác định giá trị ước lượng chính xác trở nên khó khăn. • Khoảng tin cậy của các hệ số hồi quy có khuynh hướng rộng hơn, điều này dẫn đến độ chính xác của ước lượng khoảng cho tham số hồi quy βj giảm đi. • Khi kiểm định giả thuyết H0: βj = βj* ta có thể sử dụng thống kê tqs=(βj^-βj*)/se(βj^). Trong trường hợp có đa cộng tuyến cao, sai số chuẩn của các ước lượng có xu hướng tăng mạnh, dẫn đến giá trị |tqs| có khuynh hướng nhỏ đi. Do đó ta có xu hướng chấp nhận giả thiết H0.

Hậu quả của đa cộng tuyến không hoàn hảo

Phát hiện đa cộng tuyến

 Hệ số tương quan giữa các cặp biến độc lập

 Các ước lượng OLS của βj và các se(βj^) trở nên rất nhạy với những thay đổi nhỏ trong số liệu.

cao  Mô hình 2 biến độc lập:

 Kinh nghiệm: ĐCT cao ⇔ rXjXs > 0.8

 Mô hình ≥3 biến độc lập:

 Kinh nghiệm: rXjXs > 0.8 ⇒ ĐCT cao  Lưu ý: Với mô hình ≥3 biến độc lập thì rXjXs> 0.8 là điều kiện

đủ chứ không phải là điều kiện cần.

 Dấu của các hệ số ước lượng βj^ có thể sai.  Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về độ lớn của các ước lượng hoặc dấu của chúng.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 13 16

Phát hiện đa cộng tuyến

Ghi chú

 * Trong một số tình huống đặc biệt ta có đa cộng

 Dấu của hệ số hồi quy ngược với kì vọng  Hệ số xác định R2 cao nhưng tồn tại tỉ số |tqs|

tuyến cao giữa các biến độc lập nhưng hệ số tương quan cặp giữa các biến có thể thấp.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 14 17

Thí dụ : Xét mô hình hồi quy có ba biến độc lập

X1, X2, X3, với số liệu mẫu như sau :

thấp  Kinh nghiệm: R2 > 0.8 đồng thời |tqs|<2.  Khi thấy có nghịch lý này, người ta thường nghĩ đến

nguyên nhân là do có đa cộng tuyến.

 Hạn chế của quy tắc này là nó chỉ thể hiện rõ khi có

đa cộng tuyến ở mức độ cao.

   

X1 = (1,0,0,0) X2 = (0,1,0,0) X3 = (1,1,0,0) Nhận thấy ta có đa cộng tuyến hoàn hảo vì X3 =

X1 + X2, nhưng hệ số tương quan cặp tương ứng là : r12 = - 0.333, r13 = r23 = 0.57 không cao.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 15 18

3

22/8/2015

Phát hiện đa cộng tuyến

Phát hiện đa cộng tuyến

 Dùng nhân tử phóng đại phương sai: VIF

 Hồi quy phụ:

 Hồi quy tuyến tính 1 biến độc lập Xj theo các biến độc

2 > 0.9) ⇒ ĐCT cao

2)  VIFj=1/(1-Rj  Kinh nghiệm: VIFj > 10 (tức Rj

lập còn lại: Xj = λ0 + λ1X1 +...+ λj-1Xj-1 + λj+1Xj+1 +...+ λk-1Xk-1 + v

2 (theo mô hình phụ)

2 =0 (không có ĐCT)

 Tính được Rj  Kiểm định giả thuyết H0: Rj  Thống kê quan sát là:

R

2

2 j

F

j

   n k

R

 1

2 j

 k /   /

 1

 Quy tắc bác bỏ H0 là: Fj > Fα;(k–2, n–k+1)

Ghi chú

Ghi chú

2→1 thì VIFj →∞.

2).(1/1-Rj

2)=(1/Σxji

2).VIFj

 * Bởi vì đa cộng tuyến đề cập tới quan hệ tuyến tính giữa các biến độc lập, nghĩa là một biến độc lập có thể được biểu diễn xấp xỉ dưới dạng tổ hợp tuyến tính của các biến độc lập khác, do đó ta có thể đánh giá mức độ đa cộng tuyến bằng cách hồi quy một biến độc lập Xj theo các biến độc lập còn lại dưới dạng mô hình tuyến tính, gọi là hồi quy phụ (auxiliary regression).

2 càng gần 1, nghĩa là mức độ cộng tuyến giữa Xj * Rj với những biến độc lập còn lại càng cao, thì VIFj càng lớn, Rj • Tuy nhiên việc đánh giá mức độ cộng tuyến thông qua giá trị VIF cũng có ý nghĩa tương đối. Tức là giá trị VIF cao thì không có nghĩa là phương sai và sai số của các ước lượng cao. Nhắc lại công thức tính phương sai của các ước lượng trong mô hình hồi quy có hai biến độc lập :  Var(βj^)=(1/Σxji  Phương sai của βj^ phụ thuộc vào 3 thành phần

2 và VIFj. Như vậy một giá trị VIF cao chưa đủ

σ2,Σxji để xác định phương sai của ước lượng là cao.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 19 22

Phát hiện đa cộng tuyến

Vài điều về đa cộng tuyến

2 của

 Trên nguyên tắc ta cần kiểm định giá trị Rj

tất cả các hồi quy phụ.

 Trong thực tế hầu như các biến độc lập đều có đa cộng tuyến với nhau, chỉ là với mức độ cao hay thấp mà thôi

 Ta có thể áp dụng “Rule of Thumb” của Klein: Đa cộng tuyến trở thành vấn đề nghiêm trọng nếu như ∃ R2

phụ > R2.

 Khi có đa cộng tuyến thì các ước lượng thu được vẫn có tính chất BLUE: là ước lượng tuyến tính, không chệch, có phương sai bé nhất trong lớp các ước lượng tuyến tính không chệch

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 20 23

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 21 24

4

22/8/2015

Vài điều về đa cộng tuyến

 Bỏ bớt biến độc lập

 Trong thực nghiệm, người ta quan tâm đến mức độ ảnh hưởng của đa cộng tuyến đối với kết quả ước lượng hơn là việc xác định đa cộng tuyến có tồn tại hay không.

 Bỏ bớt một trong các biến có cộng tuyến với nhau có thể làm cho hệ số hồi quy của những biến còn lại trong mô hình từ kết quả ban đầu là ≠ 0 không có ý nghĩa chuyển thành ≠ 0 có ý nghĩa về mặt thống kê.

 Nên bỏ cùng lúc hay bỏ lần lượt?

 Nên bỏ lần lượt vì nếu bỏ cùng lúc thì mô hình bị thiếu biến quan trọng -> ước lượng bị chệch-> không tốt

 Khi ảnh hưởng của đa cộng tuyến được xem là nghiêm trọng, người ta có thể dùng nhiều công cụ khác nhau để tìm cách hạn chế ảnh hưởng của nó, và mỗi công cụ tỏ ra thích hợp trong những hoàn cảnh cụ thể.

 Nếu bỏ lần lượt thì bỏ biến nào trước?  Bỏ biến có p-value lớn nhất hoặc có R2

f lớn nhất

Vài điều về đa cộng tuyến

 Bỏ bớt biến độc lập

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 25 28

!  Việc bỏ bớt biến có thể dẫn đến hậu quả là ước

lượng của các hệ số trong mô hình bị chệch

 Trong một số tình huống, việc bỏ bớt biến nhằm tránh vấn đề đa cộng tuyến lại gây ra hậu quả nghiêm trọng hơn. (Tại sao?)

 Khi vấn đề đa cộng tuyến được đánh giá là ảnh hưởng không nghiêm trọng đến kết quả nghiên cứu, đôi khi người ta có thể bỏ qua, bởi vì việc khắc phục đa cộng tuyến có thể gây ra những hậu quả khác nghiêm trọng hơn.  Có thể bỏ qua đa cộng tuyến khi:

 ∀ |tstat|>2  R2 > ∀R2

phụ

 bởi vì, đa cộng tuyến có thể làm cho sai số của các ước lượng lớn nhưng vẫn là ước lượng không chệch, trong khi đó bỏ bớt biến có thể dẫn đến ước lượng chệch nhiều so với giá trị tham số thực.

Khắc phục đa cộng tuyến

 Hồi quy sai phân cấp 1

 Dưới góc độ thời gian, các biến số kinh tế thường chịu tác động ảnh hưởng của xu hướng và do đó dễ tương quan (cộng tuyến) với nhau  Sử dụng sai phân cấp 1 có thể làm giảm những

hậu quả nghiêm trọng của đa cộng tuyến

 Bỏ bớt biến độc lập  Sử dụng sai phân cấp 1  Thay đổi dạng hàm  Hồi quy độ lệch (khi hàm hồi quy đa thức)  Kết hợp số liệu chéo và số liệu chuỗi thời gian  Thu thập thêm số liệu hoặc lấy thêm mẫu mới  Sử dụng thông tin tiên nghiệm

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 26 29

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 27 30

5

22/8/2015

 Hồi quy sai phân cấp 1

 Hồi quy theo độ lệch

 Thí dụ, ta có mô hình hồi quy đa thức ban đầu

như sau:

Y = β1 + β2X + β3X2 + β4X3 + u = β1 + β2Z1 + β3Z2 + β4Z3 + u

!  Trong một số trường hợp thì ut không có tự tương quan nhưng vt = ut – ut-1 có thể có tự tương quan. Điều này vi phạm giả thiết tự tương quan. Vậy ta có thể làm giảm bớt vi phạm này nhưng lại mắc phải vi phạm khác.

1

2

1

1

3

2

2

4

3

3

 Ta có thể chuyển về dạng: 

 Y = β +β Z -Z +β Z -Z +β Z -Z + v

 Bậc tự do bị giảm đi 1 do bị mất một quan sát trong quá trình biến đổi số liệu, điều này có thể ảnh hưởng đến kết quả ước lượng khi cỡ mẫu nhỏ.

 Hồi quy sai phân cấp 1

 Kết hợp số liệu chéo và số liệu chuỗi thời gian

 Kết hợp giữ liệu chéo và giữ liệu chuỗi thời gian

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 31 34

!  Việc sử dụng sai phân cấp 1 có thể không thích hợp

đối với số liệu chéo.

 Khi sử dụng sai phân cấp 1 ta có hồi quy qua gốc tọa

độ. Đây cũng là điều mà ta nên cân nhắc.

 Lưu ý: lệnh hồi quy qua gốc toạ độ không có hệ số chặn C

ta được dữ liệu hỗn hợp (Panel data).  Kỹ thuật này được áp dụng nhiều, vì khắc phục được những khó khăn khi ta chỉ sử dụng một loại dữ liệu thuần chuỗi thời gian hay chéo. Tuy nhiên, việc diễn giải kết quả với dữ liệu hỗn hợp sẽ khó khăn hơn.  Đối với dữ liệu chuỗi thời gian, thường gặp phải vấn đề đa cộng tuyến giữa các biến, trong khi với dữ liệu chéo thường các biến không thay đổi nhiều về giá trị khi xét tại một thời điểm (thí dụ như yếu tố giá).

 Hồi quy theo độ lệch

 Thu thập thêm số liệu hoặc lấy thêm mẫu mới

 Đối với hồi quy đa thức, nếu biến độc lập tương ứng với các bậc lũy thừa khác nhau có khuynh hướng cộng tuyến cao thì ta có thể giảm ảnh hưởng của đa cộng tuyến bằng cách sử dụng hàm hồi quy độ lệch theo giá trị trung bình.

 Đa cộng tuyến đặc biệt là một hiện tượng mẫu theo nghĩa cho dù các biến độc lập Xj không tương quan tuyến tính trong tổng thể, chúng cũng có thể tương quan tuyến tính trong một mẫu cụ thể nào đó. Do đó:  với cỡ mẫu lớn thì vấn đề đa cộng tuyến ít nghiêm

trọng hơn với cỡ mẫu nhỏ.

 có thể trong mẫu khác thì đa cộng tuyến ít nghiêm

trọng hơn với mẫu đã có

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 32 35

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 33 36

6

22/8/2015

 Sử dụng thông tin tiên nghiệm

 Thu thập thêm số liệu hoặc lấy thêm mẫu mới !  Việc thu thập thêm số liệu hay lấy mẫu mới không phải lúc nào cũng thực hiện được vì thông thường đòi hỏi chi phí cao, hoặc là các quan sát mới bổ sung không có cùng quan hệ cấu trúc kinh tế (economic structure) như các quan sát đã có

 Giả sử rằng nghiên cứu thực nghiệm trước đây cho ta biết quan hệ giữa các hệ số hồi quy riêng là β3 = 0.1β2, nghĩa là mức độ ảnh hưởng của thu nhập đối với chi tiêu gấp 10 lần mức độ ảnh hưởng của sự giàu có đối với chi tiêu. Như vậy ta có thể sử dụng mô hình hồi quy thay thế là:

Yi = β1 + β2X1i + β3X2i + ui

= β1 + β2(X1i + 0.1X2i) + ui = β1 + β2Xi + ui

 Sử dụng thông tin tiên nghiệm

 Sử dụng thông tin tiên nghiệm

 trong đó Xi = X1i + 0.1X2i  Khi ước lượng được β2^, ta dễ dàng ước lượng

được β3^=0.1β2^

 Thông tin tiên nghiệm có thể có từ các nghiên cứu thực nghiệm trước đây, mà trong đó hiện tượng cộng tuyến có thể xảy ra nhưng ít nghiêm trọng hơn (và như vậy kết quả nghiên cứu thực nghiệm này có thể tin cậy để sử dụng như là những thông tin tiên nghiệm), hoặc từ các lý thuyết liên quan đến lĩnh vực nghiên cứu.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 37 40

 Sử dụng thông tin tiên nghiệm

 c6-td62: data

 Thí dụ như khảo sát mô hình hồi quy giữa chi tiêu tiêu dùng Y theo thu nhập X1 và sự giàu có X2:

 Y: chi tiêu cho tiêu dùng ($)  X1 : thu nhập ($)  X2 : sự giàu có ($)

 Nguồn: Ramanathan

Yi = β1 + β2X1i + β3X2i + ui  Thu nhập và giàu có là hai biến có khuynh

hướng cộng tuyến cao.

 Lý thuyết?  Mô hình hồi quy ? Dấu kì vọng?

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 38 41

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 39 42

7

22/8/2015

 c6-td62: kết quả hồi quy

 c6-td62: Nhận dạng đa cộng tuyến

 Phát hiện ĐCT:

Dấu hiệu

Kết luận:

Dấu hệ số ngược kì vọng R2 >0.8 & ∃ |tqs|<2 rXjXs > 0.8 Hồi quy phụ

VIFj

 Kết luận chung: có ĐCT

 c6-td62: Phân tích kết quả hồi quy

 c6-td62: Khắc phục đa cộng tuyến

 Đổi dạng hàm: vẫn còn ĐCT  Hồi quy sai phân: vẫn còn ĐCT  Bỏ biến: Dùng các kiểm định bỏ bớt biến.

 Ý nghĩa của các hệ số hồi quy?  Dấu của các hệ số hồi quy có phù hợp với lý thuyết kinh tế không? (Dấu kì vọng và dấu thực tế?)

 Chấp nhận H0: c(3)=0, nghĩa là có thể bỏ X2. (1)  Chấp nhận H0: c(2)=0, nghĩa là có thể bỏ X1. (2)  Bác bỏ H0: c(2)=c(3)=0, nghĩa là không thể bỏ cùng

lúc cả X1 và X2. (3)

 Ý nghĩa thống kê của các hệ số? Có mâu thuẫn gì với lí thuyết kinh tế hay không? Nếu có mâu thuẫn bạn nghĩ đến điều gì?

 Từ (1), (2), (3)  không thể xảy ra c(2)0 & c(3)0,

và do đó chỉ có thể xảy ra (1) hoặc (2).

 So sánh kết quả trước và sau khi bỏ X2; X1 đi tới kết

luận: nên bỏ X2.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 43 46

Ghi chú

Ghi chú

 Hồi quy Y theo X1, X2:

p-value (X1) = 0.2902, p-value (X2) = 0.6151.

 Dựa vào kết quả hồi quy, dễ dàng nhận thấy dấu của hệ số hồi quy của biến X2 không phù hợp với lý thuyết kinh tế (- 0.042435 < 0).

 Ngoài ra ta thấy p-value (X1) = 0.2902 và

 Hồi quy Y theo X1: R2 = 0.962062.  Hồi quy Y theo X2: R2 = 0.956679.  Nhận thấy X2 ít ý nghĩa thống kê hơn X1 (p-value (X2) > p-value (X1)), và mô hình hồi quy Y theo X1 có mức độ phù hợp cao hơn mô hình hồi quy Y theo X2, vậy ta có thể bỏ bớt biến X2.

p- value (X2) = 0.6151 nên X1 và X2 không có ý nghĩa thống kê, tuy nhiên R2 = 0.963504 lớn. Điều này làm ta nghĩ đến việc có thể xảy ra hiện tượng cộng tuyến cao giữa hai biến thu nhập (X1) và sự giàu có (X2). Điều này hoàn toàn có lý vì thông thường người có thu nhập cao thì được xem là giàu có.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 44 47

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 45 48

8

22/8/2015

 c6-td62: Khắc phục đa cộng tuyến

 c6-td61: phân tích kết quả hồi quy

Phương pháp

Bỏ bớt biến độc lập

Sử dụng sai phân cấp 1

Đổi dạng hàm

Kết quả   

Hồi quy độ lệch

 Ý nghĩa của các hệ số hồi quy?  Cầu thịt gà có co giãn theo giá không? Tại sao?  Dấu của các hệ số hồi quy có phù hợp với lý thuyết kinh tế không? (Dấu kì vọng và dấu thực tế?)

Khuyến nghị     

Kết hợp số liệu chéo và số liệu chuỗi thời gian

Thu thập thêm số liệu

 Ý nghĩa thống kê của các hệ số? Có mâu thuẫn gì với lí thuyết kinh tế hay không? Nếu có mâu thuẫn bạn nghĩ đến điều gì?

Sử dụng thông tin tiên nghiệm

 

 c6-td61: data

Ghi chú

 Y: lượng tiêu dùng thịt gà tính theo đầu người

(pounds)

Lý thuyết vĩ mô: Y = f(X1,X2,X3,X4)  Mô hình hồi quy ? Dấu kì vọng? • hệ số co giãn của cầu thịt gà theo giá thịt gà có giá trị tuyệt

đối < 1, điều này chứng tỏ rằng thịt gà là mặt hàng không co giãn theo giá

• Hệ số hồi quy của cầu thịt gà theo giá thịt heo hay thịt bò > 0 chứng tỏ giá của các mặt hàng thay thế cho thịt gà có tác động đồng biến đối với lượng cầu của thịt gà.

 X1: thu nhập khả dụng thực theo đầu người ($)  X2: giá bán lẻ thực của thịt gà (cents/pound)  X3: giá bán lẻ thực của thịt heo (cents/pound)  X4: giá bán lẻ thực của thịt bò (cents/pound)

• Nếu xem xét ở mức độ ý nghĩa thống kê của các giá trị ước lượng, thì nhận thấy hệ số hồi quy theo giá thịt heo, thịt bò không có ý nghĩa thống kê (dựa trên giá trị p-value (Prob.) > 0.05). Điều này dường như đưa đến nhận định rằng giá của thịt heo, thịt bò không ảnh hưởng đến lượng cầu về thịt gà, và như vậy mâu thuẫn với lý thuyết kinh tế.

 Thời kì: 1960-1982  Địa điểm: Mỹ  Nguồn: Gujarati

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 49 52

 c6-td61: kết quả hồi quy

 c6-td61: Nhận dạng đa cộng tuyến

 Phát hiện ĐCT:

Dấu hiệu

Kết luận:

R2 >0.8 & ∃ |tqs|<2 rlog(Xj),log(Xs)> 0.8 Hồi quy phụ

VIFj

 Kết luận chung: Có ĐCT

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 50 53

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 51 54

9

22/8/2015

 c6-td61: Khắc phục đa cộng tuyến

 c6-td64: kết quả hồi quy

Kết quả

Phương pháp

Bỏ bớt biến độc lập

Sử dụng sai phân cấp 1

Đổi dạng hàm

 

Hồi quy độ lệch

Khuyến nghị     

Kết hợp số liệu chéo và số liệu chuỗi thời gian

Thu thập thêm số liệu

Sử dụng thông tin tiên nghiệm

 

Ghi chú

 c6-td64: Phân tích kết quả hồi quy

 Ý nghĩa của các hệ số hồi quy?  Dấu của các hệ số hồi quy có phù hợp với lý thuyết kinh tế không? (Dấu kì vọng và dấu thực tế?)

 Ý nghĩa thống kê của các hệ số? Có mâu thuẫn gì với lí thuyết kinh tế hay không? Nếu có mâu thuẫn bạn nghĩ đến điều gì?

 Do khi mô hình hóa hàm cầu về thịt gà được xây dựng dựa vào cơ sở lý thuyết kinh tế nên mô hình hồi quy là tương thích, mặc dù kết quả ước lượng lại không như mong đợi khi chúng ta sử dụng số liệu của mẫu cụ thể đã cho. Việc bỏ bớt biến độc lập ra khỏi mô hình nhằm hạn chế tác động của vấn đề cộng tuyến trong trường hợp này không phải là cách giải quyết tốt vì làm như vậy ta sẽ phạm phải sai số đặc trưng trong việc chỉ định mô hình.

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 55 58

 c6-td64: data

 c6-td64: Nhận dạng đa cộng tuyến

 Phát hiện ĐCT:

 HOUSING (nghìn): số căn hộ xây mới  GNP (tỷ USD năm 1982): tổng sản phẩm quốc

Dấu hiệu

Kết luận:

gia

Nghi ngờ có

 INTRATE (%): lãi suất cầm cố (tỷ lệ thế chấp

R2 >0.8 & ∃ |tqs|<2 rXjXs> 0.8 Hồi quy phụ

nhà mới)

VIFj

 POP (triệu): dân số của Mỹ

 Kết luận chung: có ĐCT

 Thời gian: 1963-1985  Địa điểm: Mỹ  Nguồn: Ramanathan

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 56 59

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 57 60

10

22/8/2015

 c6-td64: Khắc phục đa cộng tuyến

 c6-td64: Khắc phục- bỏ bớt biến

Phương pháp

Bỏ bớt biến độc lập

Sử dụng sai phân cấp 1

Đổi dạng hàm

Kết quả   

Hồi quy độ lệch

Khuyến nghị     

Kết hợp số liệu chéo và số liệu chuỗi thời gian

Thu thập thêm số liệu

Sử dụng thông tin tiên nghiệm

 

 c6-td64: Khắc phục- bỏ bớt biến

 c6-td64: Khắc phục- bỏ bớt biến

 Trong 2 biến không có ý nghĩa thống kê, biến

nào ít ảnh hưởng tới biến phụ thuộc hơn?

 Trong 3 biến độc lập thì biến nào bị ảnh hưởng bởi (phụ thuộc vào) những biến còn lại nhiều nhất?

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 61 64

Ghi chú

 c6-td64: Khắc phục- bỏ bớt biến

 POP có p-value lớn nhất => POP ít ảnh hưởng

tới biến phụ thuộc hơn GNP

• RPOP

2=0.9886: cao nhất trong các Rf

2=>POP bị ảnh hưởng bởi (phụ thuộc vào) những biến còn lại nhiều nhất

• Kết luận: Nên bỏ POP trước

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 62 65

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 63 66

11

22/8/2015

 c6-td64: Khắc phục - bỏ bớt biến

 c6-td64: Khắc phục - bỏ bớt biến

 Có thể bỏ 2 biến cùng lúc không?  Nếu phải bỏ từng biến thì bỏ biến nào trước?

Có thể bỏ POP

 c6-td64: Khắc phục- bỏ bớt biến

 c6-td64: Khắc phục- bỏ bớt biến

không thể bỏ 2 biến POP và GNP cùng lúc

Nên bỏ POP trước và chỉ được bỏ POP mà thôi!

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 67 70

 c6-td64: Khắc phục - bỏ bớt biến

 c6-td64: Khắc phục- dùng sai phân

 Dùng sai phân có khử hết đa cộng tuyến?

Có thể bỏ GNP

Dùng sai phân không hết đa cộng tuyến

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 68 71

Bài giảng Kinh tế lượng © Tien M. Le Bài giảng Kinh tế lượng © Tien M. Le 69 72

12

22/8/2015

Review

 Học gì?  Hiểu gì?  Hỏi gì?  Hành gì?  Nhớ gì?

Bài giảng Kinh tế lượng © Tien M. Le 73

13