intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Kinh tế lượng: Chương 6 - ThS. Trần Quang Cảnh

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:7

36
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến" cung cấp cho người học các kiến thức: Bản chất, nguyên nhân của đa cộng tuyến; ước lượng các tham số, hậu quả, phát hiện đa cộng tuyến, khắc phục đa cộng tuyến. Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Kinh tế lượng: Chương 6 - ThS. Trần Quang Cảnh

  1. Thu nhập Sự giàu có Chi tiêu CHƯƠNG 6 80 810 70 100 1009 65 HIỆN TƯỢNG ĐA CỘNG TUYẾN 120 1273 90 (MULTICOLLINEARITY) 140 1425 95 160 1633 110 180 1876 115 200 2052 120 220 2201 140 240 2435 155 260 2686 150 Nguồn: Ramu Ramanathan 4 1 4 ĐA CỘNG TUYẾN 1. Hiểu bản chất và hậu quả của đa cộng tuyến MỤC TIÊU 2. Biết cách phát hiện đa cộng tuyến và biện pháp khắc phục 2 5 2 5 NỘI DUNG 1 Bản chất, nguyên nhân của đa cộng tuyến 2 Ước lượng các tham số 3 Hậu quả 4 Phát hiện đa cộng tuyến 5 Khắc phục đa cộng tuyến 3 6 3 6 1
  2. 6.1 Bản chất của đa cộng tuyến VD X2 10 15 18 24 30 X3 50 75 90 120 150 X*3 52 75 97 129 152 V 2 0 7 9 2 X3i = 5X2i, vì vậy có cộng tuyến hoàn hảo giữa X2 và X3 ; r23 = 1 X2 và X3* không có cộng tuyến hoàn hảo, nhưng hai biến này có tương quan chặt chẽ. 7 10 7 10 6.1 Bản chất của đa cộng tuyến 6.1 Bản chất của đa cộng tuyến Khi lập mô hình hồi quy bội Yˆi  ˆ1  ˆ 2 X 2 i  ˆ3 X 3i  ...  ˆ k X ki Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đa cộng tuyến. a. Đa cộng tuyến hoàn hảo Tồn tại 2, 3,… k không đồng thời bằng 0 sao cho 2X2 + 3X3 + …+ kXk = 0 Nói cách khác là xảy ra trường hợp một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại. Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 8 11 8 11 6.1 Bản chất của đa cộng tuyến 6.1 Bản chất của đa cộng tuyến b. Đa cộng tuyến không hoàn hảo 2X2 + 3X3 + …+ kXk + vi= 0 Với vi là sai số ngẫu nhiên thì ta có hiện tượng đa cộng tuyến không hoàn hảo giữa các biến giải thích. Nói cách khác là một biến giải thích nào đó có tương quan với một số biến giải thích khác. Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 9 12 9 12 2
  3. 6.1 Nguyên nhân của đa cộng tuyến 6.2 Ước lượng các tham số khi có đa cộng tuyến Một số nguyên nhân gây ra hiện tượng 2 đa cộng tuyến ˆ 2   y x x  y x x i 2i 3i i 3i 2i x3 i 2 2 2 - Khi chọn các biến độc lập mối quan có  x  x  ( x x ) 2i 3i 2i 3i quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện   yi x3i  x32i    yi x3i  x3i x3i 0 khác. ˆ2   2  x32i  x32i  2  x32i  x32i 0 - Khi số quan sát nhỏ hơn số biến độc lập. - Cách thu thập mẫu: mẫu không đặc  Các hệ số ước lượng không xác định: chúng ta không trưng cho tổng thể tách rời tác động của từng biến Xi lên Y do không thể giả định X2 thay đổi trong khi X3 không đổi. - Chọn biến Xi có độ biến thiên nhỏ. 13 16 13 16 6.2 Ước lượng khi có đa cộng tuyến 6.2 Ước lượng các tham số khi có đa cộng tuyến 1. Trường hợp có đa cộng tuyến hoàn hảo 2. Trường hợp có đa cộng tuyến không hoàn hảo Xét mô hình hồi qui 3 biến dưới dạng sau: • Đa cộng tuyến hoàn hảo thường không xảy ra trong Yi = 2 X2i + 3 X3i + ei thực tế. • Xét mô hình hồi qui 3 biến dưới dạng sau: giả sử X3i = X2i, mô hình được biến đổi thành: yi = 2 x2i + 3 x3i + ei Yi = (2+ 3)X2i + ei = 0 X2i + ei Giả định x3i =  x2i + vi Phương pháp OLS Với   0 và vi là sai số ngẫu nhiên. ˆo  ( ˆ2  ˆ3 )   x2 i yi • Trong trường hợp này, các hệ số hồi qui 2 và 2 x 2i 3 có thể ước lượng được:  Không thể tìm được lời giải duy nhất cho ˆ2 , ˆ3 14 17 14 17 6.2 Ước lượng khi có đa cộng tuyến 6.2 Ước lượng các tham số khi có đa cộng tuyến 2 ˆ 2   y x x  y x x i 2i 3i i 3i 2i x3 i 2 2 2  x  x  ( x x ) 2i 3i 2i 3i   yi x3i  x32i    yi x3i  x3i x3i 0 Ta có thể ước lượng được các ˆ này nhưng s.e. ˆ2   sẽ rất lớn. 2  x32i  x32i  2  x32i  x32i 0  Các hệ số ước lượng không xác định  Phương sai và sai số chuẩn của 2 và 3 là vô hạn 15 18 15 18 3
  4. 6.3 Hậu quả của đa cộng tuyến 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: Nếu có cộng tuyến gần hoàn hảo: • Các ước lượng vẫn BLUE, nhưng: 3. Tỉ số t "không có ý nghĩa". 1. Phương sai và hiệp phương sai của các ước Khi kiểm định giả thuyết H0: 2 = 0, chúng ta sử lượng OLS lớn. dụng tỷ số t. ˆ 2 r23 là hệ số tương t  se ( ˆ 2 ) quan giữa X2 và và so sánh giá trị ước lượng của t với giá trị tra bảng X3. (tới hạn) của t. Khi r23  1, các giá Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết trị trên   quả là sẽ làm tăng chấp nhận giả thuyết H0. 19 22 19 22 6.3 Hậu quả của đa cộng tuyến 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: Nếu có cộng tuyến gần hoàn hảo: 2. Khoảng tin cậy rộng hơn. 4. R2 cao nhưng tỉ số t ít có ý nghĩa. • Khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – ) • Đa cộng tuyến cao: là: ^ ^ • - một hoặc một số tham số tương quan (hệ 2 =  2  t /2 se (  2); số góc riêng) không có ý nghĩa về mặt thống ^ ^ 3 =  3  t /2 se (  3); kê trong đó:   • - R2 trong những trường hợp này lại rất cao ^ se (  2) = 2 2 ^ se (  3) = 2 2 (trên 0,9). (1 r23)x2i (1 r23)x3i • - kiểm định F thì có thể bác bỏ giả thuyết cho rằng 2 = 3 = … = k = 0. 20 23 20 23 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: Giá trị của r23 Khoảng tin cậy 95% của B2 5. Các ước lượng OLS và sai số chuẩn của chúng ˆ2 1.96* A 0 trở nên rất nhạy với những thay đổi nhỏ trong ˆ2 1.96* 1.33* A dữ liệu. 0.5 ˆ2 1.96* 10.26 * A 6. Dấu của các ước lượng của các hệ số hồi qui có 0.95 thể sai ˆ2 1.96* 100* A 0.995 7. Thêm vào hay bớt đi các biến cộng tuyến với các ˆ2 1.96* 500* A biến khác, mô hình sẽ thay đổi về dấu hoặc 0.999 thay đổi về độ lớn của các ước lượng. 2 A 2 x 2i 21 24 21 24 4
  5. Ví dụ: Bảng 2 do nhập sai số liệu nên 6.4 Cách phát hiện đa cộng tuyến xảy ra đa cộng tuyến Bảng 1 Bảng 2 1. R2 lớn nhưng tỷ số t nhỏ Y X2 X3 Y X2 X3 Nếu R2 cao, chẳng hạn, >0,8 và F test bác bỏ giả 1 2 4 1 2 4 thuyết 2 = 3 = … = k = 0, nhưng t test cho 2 0 2 2 0 2 từng i lại chấp nhận H0. 3 4 12 3 4 0 4 6 0 4 6 12 2. Tương quan cặp giữa các biến giải thích cao 5 8 16 5 8 16 Yˆi  1 .193  0 .446 X 2 i  0.003 X 3i Yˆi  1.210  0.401X 2i  0.027X 3i rXZ   (X i  X )( Z i  Z ) R 2  0.81; r23  0 .5523 ; cov( ˆ2 , ˆ3 )   0 .00868 R2  0.81; r23  0.8285; cov(ˆ2 , ˆ3 )  0.0282  (X i  X )2 (Zi  Z )2 Se (0.7736) (0.1848) (0.0850) Se (0.7480) (0.2720) (0.1252) t (1.543) (2.415) (0.0358) t (1.618) (1.4752) (0.2152) Trong đó X, Z là 2 biến giải thích trong mô hình 25 28 25 28 6.4 Cách phát hiện đa cộng tuyến Đa cộng tuyến là một hiện tượng theo 3. Sử dụng mô hình hồi quy phụ mẫu, nghĩa là cho dù các biến độc lập Hồi qui một biến giải thích X nào đó theo các biến còn lại. Xi không tương quan tuyến tính trong tổng thể nhưng chúng có thể tương Xˆ 2 i  ˆ1  ˆ3 X 3i  ...  ˆk X mi quan tuyến tính trong một mẫu cụ thể Tính R2 và F cho mỗi mô hình theo công thức: nào đó. Do đó cỡ mẫu lớn thì hiện R 2 (n  m ) tượng đa cộng tuyến ít nghiêm trọng F  ( 1  R 2 )( m  1 ) hơn cỡ mẫu nhỏ Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến Nếu F > F(m-1,n-m): bác bỏ H0 => có đa cộng tuyến Nếu F < F(m-1,n-m): chấp nhận H0 => không có đa cộng tuyến 26 29 26 29 6.4 Cách phát hiện đa cộng tuyến 6.4 Cách phát hiện đa cộng tuyến VD: Cho doanh số bán (Y), chi phí chào hàng (X2) 1. Hệ số R2 lớn nhưng tỷ số t nhỏ và chi phí quảng cáo (X3) trong năm 2001 ở 12 2. Tương quan cặp giữa các biến giải thích cao khu vực bán hàng của 1 công ty. Có hiện tượng 3. Sử dụng mô hình hồi qui phụ đa cộng tuyến không? 4. Sử dụng yếu tố phóng đại phương sai (VIF) Hồi quy biến chi phí chào hàng với chi phí quảng cáo, ta có kết quả X2 =42,012 + 0,387 *X3 R2 = 0,22922 F= 2,9738 Với mức ý nghĩa α=5%, tra bảng F0.05 (1,10)= 4,96. Ta thấy F < F0.05 (1,10) nên chấp nhận Ho hay không có đa cộng tuyến. 27 30 27 30 5
  6. 6.4 Cách phát hiện đa cộng tuyến 6.5 Cách khắc phục 4. Sử dụng nhân tử phóng đại phương sai (VIF) 1. Dùng thông tin tiên nghiệm Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau: Ví dụ 1 Yi=1 + 2X2i+ 3X3i + ui VIF  (1  r232 ) Biết 3=0.12 Đối với trường hợp tổng quát, có (k-1) biến giải thích thì: 1 Biến đổi Yi=1 + 2X2i+ 0.12X3i + ui VIF  Yi=1 + 2Xi+ ui (1  R 2j ) R2j: là giá trị R2 trong hàm hồi quy của Xj theo (k-1) biến giải Với Xi=X2i+ 0.1X3i thích còn lại. Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao 2 var( ˆ 2 )  2 .VIF x 2i 31 34 31 34 Giá trị của r23 VIF Var ( ˆ 2 ) Cov ( ˆ 2 , ˆ 3 ) 6.5 Cách khắc phục 0 1 1A 0 2. Loại trừ một biến giải thích ra khỏi mô 0.5 1.33 1.33A 0.67B hình 0.7 1.96 1.96A 1.37B B1: Xem cặp biến giải thích nào có quan hệ 0.8 2.78 2.78A 2.22B chặt chẽ. Giả sử X2, X3…Xk là các biến độc lập, 0.9 5.76 5.76A 4.73B Y là biến phụ thuộc và X2, X3 có tương quan 0.95 10.26 10.26A 9.74B chặt chẽ với nhau. 0.97 16.26 16.92A 16.4B B2: Tính R2 đối với các hàm hồi quy: có mặt cả 0.99 50.25 50.25A 49.75B 2 biến; không có mặt một trong 2 biến 0.995 100 100A 99.5B B3: Loại biến mà giá trị R2 tính được khi không 0.999 500 500A 499.5B có mặt biến đó là lớn hơn. 2  2 A 2 ;B  x 2i x x 2 2i 2 3i 32 35 32 35 6.5 Cách khắc phục 6.5 Cách khắc phục 1. Dùng thông tin tiên nghiệm 3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas Y i  AL i 3 K i 2 e u i Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui Có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu suất không đổi theo quy mô tức là 2+3=1. Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui Ln(Yi /Li ) = 1 + 2ln(Ki /Li) + ui => mất đa cộng tuyến (vì đây là mô hình hồi quy đơn). 33 36 33 36 6
  7. 6.5 Cách khắc phục X2 X3 Y 4. Dùng sai phân cấp 1 80 810 70 Ví dụ từ hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut 100 1009 65 ta suy ra 120 1273 90 yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1 140 1425 95 Trừ hai vế cho nhau, ta được: 160 1633 110 yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) 180 1876 115 Hay: 200 2052 120 yt = 1  x1,t + 2  x2,t + et, 220 2201 140 Mặc dù, x1 và x2 có quan hệ tuyến tính, nhưng 240 2435 155 không có nghĩa sai phân của chúng cũng như 260 2686 150 vậy. Nguồn: Ramu Ramanathan 37 40 37 40 6.5 Cách khắc phục 5. Đổi biến 1. Ước lượng mô hình hồi quy Y= β1 + β2. Ví dụ : yt = 1 + 1x1t + 2x2t + ut X2 + β3.X3 +U Với Y: tiêu dùng Nhận xét ban đầu: Theo lý thuyết kinh tế thì X1: GDP chi tiêu cho tiêu dùng (Y) có xu hướng X2: dân số Vì GDP và dân số theo thời gian có xu hướng tăng theo thu nhập (X2) và sự giàu có tăng nên có thể cộng tuyến. (X3) nên dấu của các hệ số hồi quy riêng Biện pháp: chia các biến cho dân số là dương. Kết quả hồi quy trên Eviews như sau: Yt   u  1  1  2  t X 2 t X 2 t X 2t X 2t 38 41 38 41 Ví dụ 1 Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có, ta có bảng số liệu sau. Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD) X3: sự giàu có (USD) Yêu cầu: 1. Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U 2. Mô hình có xảy ra đa cộng tuyến không? Vì sao? 3. Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc phục. 39 42 39 42 7
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2