intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài thảo luận nhóm: Các cách phát hiện đa cộng tuyến. Các biện pháp khắc phục hiện tượng đa cộng tuyến. Ví dụ minh họa

Chia sẻ: NGUYEN BIEN | Ngày: | Loại File: DOCX | Số trang:19

813
lượt xem
111
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài thảo luận nhóm: Các cách phát hiện đa cộng tuyến. Các biện pháp khắc phục hiện tượng đa cộng tuyến. Ví dụ minh họa, trình bày các nội dung chính: giới thiệu về đa cộng tuyến, các cách phát hiện hiện tượng đa cộng tuyến, biện pháp khắc phục, ví dụ minh họa, lập mô hình hàm hồi quy, bài tập phát hiện hiện tượng đa cộng tuyến, biện pháp khắc phục.

Chủ đề:
Lưu

Nội dung Text: Bài thảo luận nhóm: Các cách phát hiện đa cộng tuyến. Các biện pháp khắc phục hiện tượng đa cộng tuyến. Ví dụ minh họa

  1. LỜI MỞ ĐẦU Trong mô hình phân tích hồi quy bội, chúng ta giả thiết giữa các biến giải thích của mô hình độc lập tuyến tính với nhau, tức là các hệ số hồi quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương ứngkhi tất cả các biến khác trong mô hình được giữ cố định. Tuy nhiên khi giả thiết đó bị vi phạm tức là các biến giải thích có tương quan thì chúng ta không thể tách biệt sự ảnh hưởng riêng biệt của một biến nào đó. Hiện tượng trên được gọi là đa công tuyến.Vậy phải làm như thế nào để nhận biết và khắc phục hiện tượng này.Chúng ta đi nghiên cứu đề tài: “Các cách phát hiện đa cộng tuyến. Các biện pháp khắc phục hiện tượng đa cộng tuyến. Ví dụ minh họa”
  2. A. LÍ THUYẾT I. GIỚI THIỆU VỀ ĐA CỘNG TUYẾN Thông thường các biến độc lập không có mối quan hệ tuyến tính, n ếu quy t ắc này bị vi phạm sẽ có hiện tượng đa cộng tuyến. Như vậy, đa c ộng tuy ến là hi ện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện đ ược d ưới dạng hàm số. II. CÁC CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN 1.R cao nhưng tỉ số t thấp Trong trường hợp Rcao (thường R> 0,8) mà tỉ số t thấp thì đó chính là d ấu hi ệu c ủa hiện tượng đa cộng tuyến . 2.Tương quan cặp giữa các biến giải thích cao Nếu hệ số tương quan cặp giữa các biến giải thích cao (vượt 0,8) thì có khả năng có tồn tại đa cộng tuyến. Tuy nhiên tiêu chuẩn này thường không chính xác. Có nh ững trường hợp tương quan cặp không cao nhưng vẫn có đa cộng tuy ến. Thí d ụ, ta có 3 biến giải thích X, X, X như sau X = (1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0, 0,0,0,0,0) X= (0,0,0,0,0, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0) X = (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0) Rõ ràng X = X + Xnghĩa là ta có đa cộng tuyến hoàn h ảo, tuy nhiên t ương quan c ặp là: r = -1/3 ; r = r =0,59
  3. Như vậy đa cộng tuyến xảy ra mà không có sự bảo tr ước cu ả t ương quan c ặp những dẫu sao nó cũng cung cấp cho ta những kiểm tra tiên nghiệm có ích. 3.Xem xét tương quan riêng Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và Glauber đã đ ề nghị sử dụng hệ số tương quan riêng. Trong hồi quy của Y đối với các biến X, X ,X. Nếu ta nhận thấy răng r cao trong khi đó r; r; r tương đối thấp thì điều đó có thể gợi ý rằng các biến X, X và Xcó tương quan cao và ít nhất một trong các biến này là thừa. Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ cung cấp cho ta hướng dẫn chính xác trong việc phát hiện ra hiện tượng đa cộng tuyến. 4.Hồi quy phụ Một cách có thể tin cậy được để đánh giá m ức đ ộ c ủa đa c ộng tuy ến là h ồi quy phụ. Hồi quy phụ là hồi quy mỗi một biến giải thích X theo các bi ến gi ải thích còn lại. R được tính từ hồi quy này ta ký hiện R Mối liên hệ giữa F và R: F= F tuân theo phân phối F với k – 2 và n-k +1 b ậc t ự do. Trong đó n là , k là s ố bi ến giải thích kể cả hệ số chặn trong mô hình. R là hệ số xác định trong hồi quy c ủa bi ến X theo các biến X khác. Nếu F tính được vượt điểm tới hạn F(k-2,n-k+1) ở m ức ý nghĩa đã cho thì có nghĩa là X có liên hệ tuyến tính v ới các bi ến X khác. N ếu F có ý nghĩa về mặt thống kê chúng ta vẫn phải quyến định liệu biến X nào sẽ bị lo ại khỏi mô hình. Một trở ngại của kỹ thuật hồi quy phụ là gánh nặng tính toán. Nh ưng ngày nay nhiều chương trình máy tính đã có thể đảm đương được công việc tính toán này. 5.Nhân tử phóng đại phương sai Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại ph ương sai gắn với biến X, ký hiệu là VIF(X).
  4. VIF(X) được thiết lập trên cơ sở của hệ số xác định R trong h ồi quy c ủa bi ến X v ới các biến khác nhau như sau: VIF(X) = (5.15) Nhìn vào công thức (5.15) có thể giải thích VIF(X) bằng tỷ s ố chung c ủa ph ương sai thực của β trong hồi quy gốc của Y đối với các biến X và ph ương sai c ủa ước l ượng β trong hồi quy mà ở đó Xtrực giao với các bi ến khác. Ta coi tình hu ống lý t ưởng là tình huống mà trong đó các biến độc lập không tương quan v ới nhau, và VIF so sánh tình huông thực và tình huống lý tưởng. Sự so sánh này không có ích nhi ều và nó không cung cấp cho ta biết phải làm gì với tình huống đó. Nó chỉ cho bi ết rằng các tình huống là không lý tưởng. Đồ thị của mối liên hệ của R và VIF là
  5. Như hình vẽ chỉ ra khi R tăng từ 0,9 đến 1 thì VIF tăng rất mạnh. Khi R =1 thì VIF là vô hạn. Có nhiều chương trình máy tính có thể cho biết VIF đối với các biến độc lập trong hồi quy. 6. Độ đo Theil Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại gi ữa các bi ến gi ải thích. Một độ đo mà xem xét tương quan của biến giải thích với biến đ ược gi ải thích là độ đo Theil. Độ đo Theil được định nghĩa như sau m = R-( R- R)
  6. Trong đó Rlà hệ số xác định bội trong hồi quy của Y đối v ới các bi ến X , X… X trong mô hình hồi quy: Y = β + βX + β X+ ……. + β X+ U R là hệ số xác định bội trong mô hình hồi quy của biến Y đối v ới các biên X , X, … ,X, X, … ,X Đại lượng R - Rđược gọi là “đóng góp tăng thêm vào” vào hệ số xác đ ịnh b ội. N ếu X , X… X không tương quan với nhau thì m = 0 vì những đóng góp tăng thêm đó c ộng lại bằng R. Trong các trường hợp khác m có thể nhận giá trị âm hoặc dương lớn. Để thấy được độ đo này có ý nghĩa, chúng ta xét trường hợp mô hình có 2 bi ến gi ải thích X và X. Theo ký hiệu đã sử dụng ở chương trước ta có: m = R- ( R- r) – (R– r) Tỷ số t liên hệ với tương quan riêng r, r Trong phần hồi quy bội ta đã biết: R = r + (1- r) r R = r + (1- r) r Thay 2 công thức này vào biểu thức xác định m ta được: m = R- (r + (1- r) r - r) - ( r + (1- r) r- r ) = R- ((1- r) r + (1- r) r) Đặt 1- r = w; 1- r = wvà gọi là các tr ọng s ố. Công th ức (5.16) đ ược vi ết l ại d ưới dạng m = R- (w r + w r) Như vây độ đo Theil bằng hiệu giữa hệ số xác định bội và t ổng có tr ọng s ố c ủa các hệ số tương quan riêng.
  7. Như vậy chúng ta đã biết một số độ đo đa cộng tuyến nhưng tất cả đều có ý nghĩa sử dụng hạn chế. Chúng chỉ cho ta những thông báo rằng sự vi ệc không ph ải là lý tưởng. Còn một số độ đo nữa nhưng liên quan đến giá trị riêng ho ặc th ống kê Bayes chúng ta không trình bày ở đây. II. Biện pháp khắc phục 1. Sử dung thông tin tiên nghiêm ̣ ̣ Môt trong cac cach tiêp cân để giai quyêt vân đê ̀ đa công tuyên là phai tân dung ̣ ́ ́ ́ ̣ ̉ ́ ́ ̣ ́ ̉ ̣ ̣ thông tin tiên nghiêm hoăc thông tin từ nguôn khac để ước lượng cac hệ số riêng. ̣ ̣ ̀ ́ ́ Thí dụ : ta muôn ước lượng ham san xuât cua 1 quá trinh san xuât nao đó có dang : ́ ̀ ̉ ́ ̉ ̀ ̉ ́ ̀ ̣ Qt =AL Trong đó Qt là lượng san phâm được san xuât thời kỳ t ; Lt lao đông th ời kỳ t ; Kt vôn ̉ ̉ ̉ ́ ̣ ́ thời kỳ t ; Ut là nhiêu ;A , α, β là cac tham số mà chung ta cân ước lượng .Lây ln cả 2 vế ̃ ́ ́ ̀ ́ (5.17) ta được : LnQt = LnA + αlnLt + βKt Ut ̣ Đăt LnQt = Q*t ; LnA = A* ; LnLt = L*t Ta được Q*t = A* + αL*t + βK*t + Ut (5.18) Giả sử L|K và L có tương quan rât cao dĩ nhiên điêu nay se ̃ dân đên phương sai ́ ̀ ̀ ̃ ́ cua cac ước lượng cua cac hệ số co gian cua ham san xuât lớn . ̉ ́ ̉ ́ ̃ ̉ ̀ ̉ ́ Giả sử từ 1 nguôn thông tin có lới theo quy mô nao đó mà ta biêt được răng ̀ ̀ ́ ̀ nganh công nghiêp nay thuôc nganh cso lợi tức theo quy mô không đôi nghia là α+ β =1 ̀ ̣ ̀ ̣ ̀ ̉ ̃ .Với thông tin nay ,cach xử lý cua chung ta sẽ là thay β = 1 - α vao (5.18) và thu được : ̀ ́ ̉ ́ ̀ Q*t = A* + αL*t + ( 1 - α )K*t + Ut (5.19) Từ đó ta được Q*t – K*t = A* + α(L*t – K*t ) + Ut ̣ Đăt Q*t – K*t = Y*t và L*t – K*t = Z*t ta được
  8. Y*t = A* + α Z*t + Ut Thông tin tiên nghiêm đã giup chung ta giam sô ́ biên đôc lâp trong mô hinh xuông ̣ ́ ́ ̉ ́ ̣ ̣ ̀ ́ ̀ ́ con 1 biên Z*t Sau khi thu được ước lượng cua α thì tinh được từ điêu kiên = 1 – ̉ ́ ̀ ̣ 2. Thu thâp số liêu hoăc lây thêm mâu mới ̣ ̣ ̣ ́ ̃ Vì đa công tuyên là đăc trưng cua mâu nên có thể có mâu khac liên quan đên cung ̣ ́ ̣ ̉ ̃ ̃ ́ ́ ̀ cac biên trong mâu ban đâu mà đa công tuyên có thể không nghiêm trong nữa. Điêu nay ́ ́ ̃ ̀ ̣ ́ ̣ ̀ ̀ có thể lam được khi chi phí cho viêc lây mâu khac có thể châp nhân được trong thực tế . ̀ ̣ ́ ̃ ́ ́ ̣ Đôi khi chỉ cân thu thâp th êm số liêu , tăng cỡ mâu có thể lam giam tinh nghiêm ̀ ̣ ̣ ̃ ̀ ̉ ́ ̣ ̉ ̣ ́ trong cua đa công tuyên . 3. Bỏ biên ́ Khi có hiên tượng đa công tuyên nghiêm trong thi ̀ cach “ đ ơn gian nhât “la ̀ bo ̉ biên ̣ ̣ ́ ̣ ́ ̉ ́ ́ công tuyên ra khoi phương trinh. Khi phai sử dung biên phap nay thì cach thức tiên hanh ̣ ́ ̉ ̀ ̉ ̣ ̣ ́ ̀ ́ ́ ̀ như sau : Giả sử trong mô hinh hôi quy cua ta co ́ Y là biên đ ược giai thich con X2 .X3 …Xk ̀ ̀ ̉ ́ ̉ ́ ̀ là cac biên giai thich . Chung ta thây răng X2 tương quan chăt chẽ với X3 .Khi đó nhiêu ́ ́ ̉ ́ ́ ́ ̀ ̣ ̀ thông tin về Y chứa ở X2 thì cung chứa ở X3 .Vây nêu ta bỏ 1 trong 2 biên X2 hoăc X3 ̃ ̣ ́ ́ ̣ khoi mô hinh hôi quy , ta sẽ giai quyêt được vân đề đa công tuyên nhưng se ̃ mât đi 1 ̉ ̀ ̀ ̉ ́ ́ ̣ ́ ́ phân thông tin về Y . ̀ Băng phep so sanh R 2 và trong cac phep hôi quy khac nhau mà có và không có 1 ̀ ́ ́ ́ ́ ̀ ́ trong 2 biên chung ta có thể quyêt đinh nên bỏ biên nao trong biên X2 và X3 khoi mô ́ ́ ́ ̣ ́ ̀ ́ ̉ ̀ hinh . Thí dụ R2 đôi với hôi quy cua Y đôi với tât cả cac biên X1X2X3 …Xk là 0.94; R 2 ́ ̀ ̉ ́ ́ ́ ́ khi loai biên X2 là 0.87 và R2 khi loai biên X3 là 0.92 ;như vây trong trường hợp nay ta ̣ ́ ̣ ́ ̣ ̀ ̣ loai X3 Chung ta lưu ý 1 han chế cua biên phap nay là trong cac mô hinh kinh tê ́ co ́ nh ững ́ ̣ ̉ ̣ ́ ̀ ́ ̀ trường hợp đoi hoi nhât đinh phai có biên nay hoăc biên khac ở trong mô hinh .Trong ̀ ̉ ́ ̣ ̉ ́ ̀ ̣ ́ ́ ̀
  9. trường hợp như vây viêc loai bỏ 1 biên phai được cân nhăc cân thân giữa sai lêch khi bỏ ̣ ̣ ̣ ́ ̉ ́ ̉ ̣ ̣ 1 biên công tuyên với viêc tăng phương sai cua cac ước lượng hệ sô ́ khi biên đo ́ ở trong ́ ̣ ́ ̣ ̉ ́ ́ ̀ mô hinh . 4. Sử dung sai phân câp 1 ̣ ́ Thủ tuc được trinh bay trong chương 7 – tự tương quan .Măc dù biên phap nay có ̣ ̀ ̀ ̣ ̣ ́ ̀ thể giam tương quan qua lai giữa cac biên nhưng chung cung có thể được sử dung như ̉ ̣ ́ ́ ́ ̃ ̣ 1 giai phap cho vân đề đa công tuyên . ̉ ́ ́ ̣ ́ Thí dụ Chung ta có số liêu chuôi thời gian biêu thị liên hệ giữa cac biên Y và cac biên ́ ̣ ̃ ̉ ́ ́ ́ ́ phụ thuôc X2 và X3 theo mô hinh sau : ̣ ̀ Yt = β 1 + β 2 X 2t + β 3X 3t+ U t (5.20) Trong đó t là thời gian . Phương trinh trên đung với t thì cung đung với t-1 nghia là : ̀ ́ ̃ ́ ̃ Yt-1 = β 2 + β 2 X 2t-1 + β 3X 3t-1 + U t-1 (5.21) Từ (5.20) và (5.21) ta được : Yt – Yt-1 = β 2 (X 2t - X 2t-1 ) + β 3 (X 3t - X 3t-1) + U t - U t-1 (5.22) Đặt yt = Yt – Yt-1 x2t = X 2t - X 2t-1 x3t = X 3t - X 3t-1 Vt = U t - U t-1 Ta được : yt = β 2 x2t + β 3 x3t + Vt (5.23) Mô hinh hôi quy dang (5.23) thường lam giam tinh nghiêm trong cua đa công tuyên vi ̀ ̀ ̀ ̣ ̀ ̉ ́ ̣ ̉ ̣ ́ dù X2 và X3 có thể tương quan cao nhưng không có lý do tiên nghiêm nao chăc chăn ̣ ̀ ́ ́ răng sai phân cua chúng cung tương quan cao. ̀ ̉ ̃ Tuy nhiên biên đôi sai phân bâc nhât sinh ra 1 số bân đề chăng han như sô ́ hang sai ́ ̉ ̣ ́ ́ ̉ ̣ ̣ số Vt trong (5.23) có thể không thoa man giả thiêt cua mô hinh hôi quy tuyên tinh cổ điên ̉ ̃ ́ ̉ ̀ ̀ ́ ́ ̉ là cac nhiêu không tương quan .Vây thì biên phap sửa chữa nay có thể lai con tôi tê ̣ hơn ́ ̃ ̣ ̣ ́ ̀ ̣ ̀ ̀ ̣ căn bênh . 5.Giam tương quan trong hôi quy đa thức ̉ ̀
  10. Net khac nhau cua hôi quy đa thức là cac biên giai thich xuât hiên v ới luy th ừa khac ́ ́ ̉ ̀ ́ ́ ̉ ́ ́ ̣ ̃ ́ nhau trong mô hinh hôi quy .Trong thực hanh đê ̉ giam tương quan trong hôi quy đa th ức ̀ ̀ ̀ ̉ ̀ người ta thường sử dung dang độ lêch .Nêu viêc sử dung dang độ lêch mà vân không ̣ ̣ ̣ ́ ̣ ̣ ̣ ̣ ̃ giam đa công tuyên thù người ta có thể phai xem xet đên kỹ thuât “ đa thức trực giao “. ̉ ̣ ́ ̉ ́ ́ ̣ 6. Môt số biên phap khac ̣ ̣ ́ ́ Ngoai cac biên phap đã kể trên người ta con sử dung 1 số biên phap khac nữa để cứu ̀ ́ ̣ ́ ̀ ̣ ̣ ́ ́ chữa căn bênh nay như sau : ̣ ̀ - ̀ ̀ ̀ ́ Hôi quy thanh phân chinh - Sử dung cac ước lượng từ bên ngoai ̣ ́ ̀ Nhưng tât cả cac biên phap đã trinh bay ở trên có thể lam giai phap cho vân đê ̀ đa ́ ́ ́ ̀ ̀ ̀ ̉ ́ ́ công tuyên như thế nao con phụ thuôc vao ban chât cua tâp số liêu và tinh nghiêm trong ̣ ́ ̀ ̀ ̣ ̀ ̉ ́ ̉ ̣ ̣ ́ ̣ cua vân đề đa công tuyên. ̉ ́ ̣ ́
  11. B. VÍ DỤ MINH HỌA Cho bảng số liệu sau: Y X Z 130771 321853 435319 150033 342607 474855 177983 382137 527055 217434 445221 603688 253686 511221 701906 298543 584793 822432 358629 675916 951456 493300 809862 1108752 589746 1091876 1436955 632326 1206819 1580461 770211 1446901 1898664 827032 1794466 2415204 http://gso.gov.vn/default.aspx?tabid=715( tổng cục thống kê từ năm 2000 -2011) Trong đó: Y là tích lũy tài sản quốc gia theo giá thực tế( tỉ đồng) X là tiêu dùng cuối cùng quốc gia theo giá thực tế( tỉ đồng) Z là tổng thu nhập quốc gia theo giá thực tế( tỉ đồng) Yêu cầu: Hãy phát hiện hiện tượng đa cộng tuyến và tìm biện pháp khắc phục. Với α = 5%. 1. Lập mô hình hàm hồi quy Ta có mô hình hàm hồi quy tuyến tính thể hiện sự phụ thuộc của tích lũy tài sản quốc gia vào tiêu dùng cuối cùng và tổng thu nhập quốc gia: Mô hình ước lượng của hàm hồi quy: = + Xi + Zi Từ bảng số liệu sử dụng phần mềm eviews ta kết quả sau:
  12. Dependent Method: Date: Sample: 1 12 Included Variable Coefficient Std. Error t-Statistic Prob. C 15390.94 30957.40 0.497165 0.6310 X 1.035505 0.750666 1.379448 0.2011 Z -0.404423 0.572356 -0.706593 0.4977 R-squared 0.973185 Mean 408307.8 Adjusted R- 0.967227 S.D. 246478.9 S.E. of 44621.06 Akaike 24.46212 Sum squared 1.79E+10 Schwarz 24.58334 Log -143.7727 Hannan- 24.41723 F-statistic 163.3196 Durbin- 1.004286 Prob(F-statistic) 0.000000 Từ kết quả ước lượng thu được hàm hồi quy mẫu sau: i = 15390.94 + 1.035505Xi – 0.404423Yi I. Phát hiện hiện tượng đa cộng tuyến Cách 1: Hệ số xác định bội cao nhưng t thấp Với α = 0.05 ta có: = = 2.262 Nhận xét: Từ bảng kết quả eviews ta có: R2 = 0.973185 > 0.8 Thống kê t của hệ số tương ứng với biến X T = 1.379448 < 2.262 Thống kê t của hệ số tương ứng với biến Z T = 0.706593 < 2.262 Vậy R2 cao nhưng t thấp. Suy ra có hiện tượng đa cộng tuyến. Cách 2: Hệ số tương quan giữa các biến giải thích cao Kết quả từ eviews ta thấy được tương quan giữa các biến giải thích: X Z X 1.000000 0.999305 Z 0.999305 1.000000
  13. Ta có: r12 = 0.999305 > 0.8  Như vậy càng có cơ sở kết luận hiện tượng đa cộng tuyến trong mô hình trên Cách 3: Hồi quy phụ Ta hồi quy biến X theo biến Z được kết quả như sau: Dependent Method: Least Date: 03/28/14 Sample: 1 12 Included Variable Coefficient Std. Error t-Statistic Prob. C -21542.70 11120.44 -1.937217 0.0815 Z 0.761934 0.008990 84.75422 0.0000 R-squared 0.998610 Mean 801139.3 Adjusted R- 0.998471 S.D. 480684.5 S.E. of 18797.19 Akaike info 22.67181 Sum squared 3.53E+09 Schwarz 22.75263 Log likelihood -134.0309 Hannan- 22.64189 F-statistic 7183.278 Durbin- 1.116681 Prob(F-statistic) 0.000000 Ta có ta đi kiểm định giả thiết : X không có hiện tượng đa cộng tuyến với Z : X có hiện tượng đa cộng tuyến với Z Nhận xét: Ta thấy giá trị p-value của thống kê F là 0.000000 < =0.05 => bác bỏ giả thiết chấp nhận giả thiết Vậy càng có cơ sở khẳng định mô hình trên có hiện tượng đa cộng tuyến Cách 4: : Độ đo Theil Ta có các hệ số tương quan giữa các biến Y và X,Z như sau: Y X Z Y 1.000000 0.985747 0.983624 X 0.985747 1.000000 0.999305 Z 0.983624 0.999305 1.000000 Để tính được độ đo Theil ta phải tính được ,. Theo công thức đã biết ở chương hai ta có = = 0.05257 Ta có: = 0.96752 Trong phần hồi quy bội ta đã biết:
  14. R = r + (1- r) r R = r + (1- r) r Vậy R = 0.96752 + (1 – 0.96752) 0.05257 0.96581 Mặt khác ta có: m = R- (r + (1- r) r - r) - ( r + (1- r) r- r ) = R- ((1- r) r + (1- r) r) Suy ra: m = 0.96581 – ((1 - ) 0.05257) + (1 - 0.05257) = 0.96261 Vậy m khác 0 nên chứng tỏ có hiện tượng đa cộng tuyến sảy ra. Và mức độ đa cộng tuyến là 0.98654
  15. II. Biện pháp khắc phục Cách 1: Bỏ biến Bước 1: Hồi quy Y theo X => Bước 2: Hồi quy Y theo Z => Bước 3: So sánh và trong các hồi quy trên Bước 4: Kết luận. * Bước 1: Hồi quy Y theo X Dependent Variable: Y Method: Least Squares Date: 03/29/14 Time: 09:16 Sample: 2000 2011 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 3365.264 25203.61 0.133523 0.8964 X 0.505458 0.027279 18.52920 0.0000 R-squared 0.971698 Mean dependent var 408307.8 Adjusted R-squared 0.968868 S.D. dependent var 246478.9 S.E. of regression 43489.57 Akaike info criterion 24.34944 Sum squared resid 1.89E+10 Schwarz criterion 24.43026 Log likelihood -144.0966 F-statistic 343.3314 Durbin-Watson stat 1.148020 Prob(F-statistic) 0.000000 * Bước 2: Hồi quy Y theo Z. Dependent Variable: Y Method: Least Squares Date: 03/29/14 Time: 09:18 Sample: 2000 2011 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C -6916.624 27563.81 -0.250931 0.8069 Z 0.384564 0.022283 17.25817 0.0000 R-squared 0.967516 Mean dependent var 408307.8 Adjusted R-squared 0.964268 S.D. dependent var 246478.9 S.E. of regression 46591.90 Akaike info criterion 24.48725 Sum squared resid 2.17E+10 Schwarz criterion 24.56807 Log likelihood -144.9235 F-statistic 297.8446 Durbin-Watson stat 1.252724 Prob(F-statistic) 0.000000
  16. * Bước 3 : Từ kết quả hồi quy ở trên ta có: = 0.973185 = 0.967227 = 0.971698 = 0.967516 = 0.968868 = 0.964268 * Bước 4: Ta tiến hành so sánh. Và kết luận trong trường hợp này loại biến Z
  17. Cách 2: Thu thập thêm số liệu để tang kích thước mẫu Ta thu thập thêm một số mẫu để tăng kích thước được bảng số liệu sau: Y X Z 130771 321853 435319 150033 342607 474855 177983 382137 527055 217434 445221 603688 253686 511221 701906 298543 584793 822432 358629 675916 951456 493300 809862 1108752 589746 1091876 1436955 632326 1206819 1580461 770211 1446901 1898664 827032 1794466 2415204 892837 1811238 2523146 942822 1899678 2600198 992838 1915089 2822899 1023847 1997283 3016754 1092733 2001838 3199767 1123883 2078934 3202984 1200389 2121838 3300484
  18. Từ bảng số liệu, sử dụng phần mềm eview ta được kết quả sau: Dependent Variable: Y Method: Least Squares Date: 03/29/14 Time: 08:31 Sample: 1 19 Included observations: 19 Variable Coefficient Std. Error t-Statistic Prob. C 5556.839 20959.22 0.265126 0.7943 X 0.242395 0.112216 2.160078 0.0463 Z 0.189806 0.073213 2.592498 0.0196 Mean R-squared 0.989332 dependent var 640475.9 Adjusted R- S.D. squared 0.987999 dependent var 372159.5 S.E. of Akaike info regression 40770.30 criterion 24.21323 Sum squared Schwarz resid 2.66E+10 criterion 24.36236 Hannan- Log likelihood -227.0257 Quinn criter. 24.23847 Durbin- F-statistic 741.9164 Watson stat 1.096358 Prob(F-statistic) 0.000000 Ta có mô hình hồi quy mới: i = 5556.839 + 0.242395Xi + 0.189806Zi t1 =0.265126 t2 = 2.160078 t3 = 2.592498 R2 = 0.989332 Mô hình sau khi đã tăng kích thước mẫu có R2 khá gần một, các tỷ số t cũng khá cao nên mô hình ước lượng là phù hợp
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2