Phương sai của sai số thay đổi

Chia sẻ: Nguyen Thai Phuong | Ngày: | Loại File: PPT | Số trang:54

0
864
lượt xem
246
download

Phương sai của sai số thay đổi

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong lý thuyết xác suất và thống kê, phương sai của một biến ngẫu nhiên là một độ đo sự phân tán thống kê của biến đó, nó hàm ý các giá trị của biến đó thường ở cách giá trị kỳ vọng bao xa. Phương sai của biến ngẫu nhiên giá trị thực là moment trung tâm, nó còn là nửa bất biến (cumulant) thứ hai của nó. Phương sai của một biến ngẫu nhiên là bình phương của độ lệch chuẩn.

Chủ đề:
Lưu

Nội dung Text: Phương sai của sai số thay đổi

  1. C3. Phương sai của sai số thay đổi (Heteroscedasticity) • Bản chất của hiện tượng phương sai của sai số thay đổi • Hậu quả của phương sai sai số thay đổi • Cách phát hiện phương sai sai số thay đổi • Cách khắc phục phương sai sai số thay đổi 1
  2. Bản chất hiện tượng PSSS thay đổi • Xét ví dụ mô hình hồi qui 2 biến trong đó biến phụ thuộc Y là chi tiêu của hộ gia đình và biến giải thích X là thu nhập khả dụng của hộ gia đình 2
  3. Bản chất hiện tượng PSSS thay đổi Y Y (a) (b) 0 X 0 X X1 X2 Xn X1 X2 Xn Hình3.1: (a) PS của SS không đổi và (b) PS của SS thay đổi 3
  4. Bản chất hiện tượng PSSS thay đổi f(ui) f(ui) Chi tiêu Chi tiêu Thu nhập Thu nhập a) Phương sai sai số không đổi b) Phương sai sai số thay đổi var(ui|X) = σ 2 var(ui|X) = σ i2 4
  5. • Hình 3.1a chỉ ra rằng khi thu nhập khả dụng tăng lên, giá trị trung bình của chi tiêu cũng tăng lên nhưng phương sai của sai số quanh giá trị trung bình của nó không thay đổi tại mọi mức thu nhập khả dụng. • Đây là trường hợp của phương sai sai số không đổi, hay phương sai bằng nhau. E(ui2) = σ2 • Hình 3.1b, mặc dù giá trị trung bình của chi tiêu cũng tăng lên nhưng phương sai của sai số không bằng nhau tại mỗi mức thu nhập khả dụng – phương sai tăng lên với thu nhập khả dụng. E(ui2) = σi2 5
  6. • Giải thích: – Những người có thu nhập cao, nhìn chung, sẽ chi tiêu nhiều hơn so với người có thu nhập thấp nhưng sự biến động của chi tiêu sẽ cao hơn. – Đối với người có thu nhập thấp, họ chỉ có một ít thu nhập để chi tiêu. • Phương sai sai số của những hộ gia đình có thu nhập cao có thể lớn hơn của những hộ có thu nhập thấp. 6
  7. Nguyên nhân • Do bản chất các mối quan hệ kinh tế; – Ví dụ: thu nhập & chi tiêu • Do kỹ thuật thu thập số liệu được cải tiến làm cho σ 2 ngày càng giảm; • Do quá trình “học hỏi từ công việc”; – Ví dụ: số lỗi đánh máy của một thư ký có thể giảm dần theo thời gian làm việc. • Do có sự hiện diện của các “quan sát dị biệt” (outlier); • Do định dạng sai mô hình. Hiện tượng này thường gặp phải đối với “số liệu theo không gian” (cross-section data). 7
  8. Quan sát dị biệt Y x x x x x x x x x x x x x x x x x x X 8
  9. Hậu quả của phương sai sai số thay đổi Nếu các giả thiết khác vẫn đảm bảo thì… 1. Các ước lượng OLS vẫn tuyến tính. 2. Chúng vẫn là ước lượng không chệch 3. Tuy nhiên, chúng sẽ không còn có phương sai nhỏ nhất nữa, nghĩa là, chúng sẽ không còn hiệu quả nữa. 4. Công thức thông thường để ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ chệch. 9
  10. Hậu quả của phương sai sai số thay đổi 5. Theo đó, các khoảng tin cậy và kiểm định giả thuyết thông thường dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa. Do vậy, nếu chúng ta áp dụng các kỹ thuật kiểm định giả thuyết thông thường sẽ cho ra kết quả sai. 10
  11. Phương pháp phát hiện ra PSSS thay đổi 1. Xem xét đồ thị của phần dư 2. Kiểm định Park 1. Kiểm định Glejser 2. Kiểm định tương quan hạng của Spearman 3. Kiểm định Goldfeld – Quandt 1. Kiểm định Breusch – Pagan 2. Kiểm định White 11
  12. Ví dụ 1 stt Y X (thu nhập) stt Y X (thu nhập) 1 19,9 20,3 11 8,0 8,1 2 31,2 32,3 12 33,1 34,5 3 31,8 33,6 13 33,5 38,0 4 12,1 12,1 14 13,1 14,1 5 40,7 42,3 15 14,8 16,4 6 6,1 6,2 16 21,6 24,1 7 38,6 44,7 17 29,3 30,1 8 25,5 26,1 18 25,0 28,3 9 10,3 10,3 19 17,9 18,2 10 38,8 40,2 20 19,8 20,1 12
  13. Kết quả hồi quy… . reg Y X Source | SS df MS Number of obs = 20 -------------+------------------------------ F( 1, 18) = 1501.41 Model | 2184.59892 1 2184.59892 Prob > F = 0.0000 Residual | 26.1904894 18 1.45502719 R-squared = 0.9882 -------------+------------------------------ Adj R-squared = 0.9875 Total | 2210.78941 19 116.357337 Root MSE = 1.2062 ------------------------------------------------------------------------------ Y| Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- X | .9078664 .02343 38.75 0.000 .8586419 .957091 _cons | .8583391 .644867 1.33 0.200 -.4964761 2.213154 ------------------------------------------------------------------------------ Có nhận xét gì về kết quả này? Liệu có tồn tại hiện tượng phương sai sai số thay đổi? 13
  14. 1. Xem xét đồ thị của sai số 14
  15. Cách 1: Đồ thị của sai số 2 1 0 Residuals -1 -2 -3 10 20 30 40 50 thu nhap Nhận xét gì? 15
  16. 2. Kiểm định Park • Park cho rằng σ i2 là một hàm số nào đó của biến giải thích X. • Park đã đưa ra dạng hàm số giữa σ i2 và X như sau: σi2 = B1 + B2ln|Xi |+ vi trong đó vi là phần sai số. • Park đã đề nghị chúng ta có thể sử dụng ei thay cho ui và chạy mô hình hồi qui sau: lnei2 = B1 + B2 ln|Xi|+ vi (*) 16
  17. 2. Kiểm định Park • ei2 có thể được thu thập từ mô hình hồi qui gốc. Kiểm định Park được tiến hành theo các bước sau đây: 1) Chạy hàm hồi qui gốc bất chấp vấn đề phương sai của sai số thay đổi, nếu có. 2) Từ hàm hồi qui này, tính phần dư ei, sau đó, bình phương chúng và lấy log chúng: lnei2. 3) Chạy hàm hồi qui (*), sử dụng biến giải thích của hàm hồi qui ban đầu. Nếu có nhiều biến giải thích, chúng ta sẽ chạy hồi qui cho từng biến giải thích đó. Hay cách khác, chúng ta có thể chạy hồi qui mô hình với biến giải ∧ Yi thích là , ước lượng của Y. 17
  18. 2. Kiểm định Park 4) Kiểm định giả thuyết H0: B2 = 0, nghĩa là, không có phương sai của sai số thay đổi. Nếu giả thuyết H0 bị bác bỏ, mối quan hệ giữa lnei2 và lnX có ý nghĩa thống kê, có phương sai của sai số thay đổi. 5) Nếu giả thuyết H0 được chấp nhận, B1 trong mô hình (*) có thể được xem là giá trị chung của phương sai của sai số không đổi, σ 2. 18
  19. Cách 2: Kiểm định Park Source | SS df MS Number of obs = 20 -------------+------------------------------ F( 1, 18) = 32.43 Model | 32.7929497 1 32.7929497 Prob > F = 0.0000 Residual | 18.204119 18 1.01133994 R-squared = 0.6430 -------------+------------------------------ Adj R-squared = 0.6232 Total | 50.9970687 19 2.68405625 Root MSE = 1.0057 ------------------------------------------------------------------------------ lne_sq | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnX | 2.301639 .4041993 5.69 0.000 1.452448 3.15083 _cons | -7.728774 1.266995 -6.10 0.000 -10.39063 -5.066917 ------------------------------------------------------------------------------ Nhận xét gì? 19
  20. 3. Kiểm định Glejser • Tương tự như kiểm định Park: Sau khi thu thập được phần dư từ mô hình hồi qui gốc, Glejser đề nghị chạy hồi qui giá trị tuyệt đối của ei, | ei |, theo biến X nào mà có quan hệ chặt chẽ với σ i2. • Glejser đề xuất một số dạng hàm hồi qui sau: |ei| = B1 + B2Xi + vi ei = B1 + B2 X i + vi 1 ei = B1 + B2 + vi Xi 20
Đồng bộ tài khoản