intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Nguyên lý thống kê - Chương 6+7: Mô hình hồi quy hai biến + Lựa chọn mô hình hồi quy hai biến

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:35

13
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Nguyên lý thống kê - Chương 6+7: Mô hình hồi quy hai biến + Lựa chọn mô hình hồi quy hai biến cung cấp cho người đọc những kiến thức như: hệ số tương quan; khái niệm mô hình hồi quy hai biến; phương pháp bình phương nhỏ nhất; các giả thiết của phương pháp osl; phân phối xác suất của các ước lượng; mô hình logartit kép;... Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Nguyên lý thống kê - Chương 6+7: Mô hình hồi quy hai biến + Lựa chọn mô hình hồi quy hai biến

  1. 3/2020 CHƯƠNG 6 : MÔ HÌNH HỒI QUY HAI BIẾN 1 6.1 HỆ SỐ TƯƠNG QUAN 1.1 Hiệp phương sai. Hiệp phương sai của hai biến ngẫu nhiên , định nghĩa bởi ; = − − Cho hai biến ngẫu nhiên , . Hệ số tương quan (tuyến tính) giữa , được tính theo bộ dữ liệu là: 1  n  Cov  X , Y    X iYi  n XY  n  1  i 1   • Nếu hai biến ngẫu nhiên , có ; = 0 thì ta nói , không tương quan với nhau. • Khi , độc lập với nhau nghĩa là , không tương quan • Nhưng , không tương quan chưa chắc đã độc lập với nhau. 2 6.1 HỆ SỐ TƯƠNG QUAN 1.1 Hiệp phương sai. Nhận xét. Khái niệm hiệp phương sai sẽ gặp khó khăn theo ví dụ sau: Ví dụ : Cho hai biến ngẫu nhiên – chỉ chiều cao một người đơn vị là (m), và – chỉ cân nặng một người đơn vị là (kg). Nếu chuyển sang đơn vị là (dm) 10 ; = 1 − 1 − =1 ( ; ) Vậy việc tính hiệp phương sai giữa các biến ngẫu nhiên sẽ phụ thuộc vào đơn vị của các biến ngẫu nhiên, để khắc phục điều này ta xây dựng một chỉ số tương quan mới nhưng không lệ thuộc vào đơn vị của các biến ngẫu 3 nhiên. 1
  2. 3/2020 6.1 HỆ SỐ TƯƠNG QUAN 1.2 Hệ số tương quan. Cho hai biến ngẫu nhiên , . Hệ số tương quan giữa , ký hiệu là r( , ) ;                        ℎ   ; ≠0 , = . 0                                 ℎ   = 0 ℎ   =0 Tính chất. • −1 ≤ ; ≤1 • ; = ±1 khi và chỉ khi tồn tại , ≠ 0 sao cho = + 4 6.1 HỆ SỐ TƯƠNG QUAN 1.2 Hệ số tương quan. Cho hai biến ngẫu nhiên , . Hiệp phương sai giữa , được tính theo bộ dữ liệu là n Cov  X , Y   X Y  nX Y i i S XY r  X ,Y    i 1  VarX .VarY  n 2 2  n 2 2 S XX SYY   X i  nX  .  Yi  nY   i 1   i 1  • Trường hợp ( , )>>0 hay (| ( , )|>1 hay (0,8 < | , |) : tương quan cao. 5 6.1 HỆ SỐ TƯƠNG QUAN 1.2 Hệ số tương quan. Ví dụ 3 : Cân nặng và vòng eo. Khảo sát mối liên hệ giữa vòng eo va cân nặng của 15 người ngẫu nhiên có bảng số liệu sau. Trọng lượng 51 66 47 54 64 75 54 Vòng eo 71 89 64 74 87 93 66 52 53 52 48 46 63 40 90 74 75 72 70 66 81 57 94 • Gọi là biến ngẫu nhiên chỉ trọng lương của một người, đơn vị (kg) • Gọi là biến ngẫu nhiên chỉ vòng eo của một người, đơn vị (cm) 6 2
  3. 3/2020 6.1 HỆ SỐ TƯƠNG QUAN 1.2 Hệ số tương quan. V vs. W 110 ; = = 0.9237 × 100 90 • Dựa vào hệ số tương quan ta thấy trong nhóm đối tượng này mối tương 80 V quan giữa cân nặng và vòng eo là rất 70 cáo. • Và nếu nhóm đối tượng này được 60 khảo sát nhiều lần mà hệ số tương 50 quan vẫn cao như vậy thì ta có thể kết 30 40 50 60 70 80 90 100 luận có thể dựa vào cân nặng để dự W đoán vòng eo và ngược lại. 7 6.1 HỆ SỐ TƯƠNG QUAN 1.2 Hệ số tương quan. 8 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Kinh tế lượng là phương pháp phân tích định lượng các vấn đề kinh tế dựa vào việc vận dụng đồng thời các lý thuyết kinh tế và thực tế dữ liệu liên quan. Kinh tế lượng sử dụng công cụ là mô hình hồi quy, mục tiêu là dự báo cho các biến kinh tế, để đưa ra các nhận định về khả năng phát triển hay diễn biến của các hiện tượng kinh tế. Ví dụ 1. Giả sử ở một địa phương có 51 hộ gia đình. Chúng ta quan tâm ở đây nghiên cứu mối quan hệ giữa : • ($) − chi tiêu tiêu dùng trong một tuần của một hộ gia đình. • ($) − thu nhập khả dụng trong một tuần của một hộ gia đình. 9 3
  4. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) 110 130 150 170 190 210 230 250 270 290 71 80 96 108 50 128 140 162 164 179 77 85 104 114 122 136 150 165 170 182 82 90 105 117 128 138 155 174 188 189 90 100 110 120 134 148 160 194 200 95 105 120 124 140 150 170 205 110 130 145 158 10 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) Đặt giả thiết CHI TIÊU - THU NHẬP Thu thập dữ liệu 200 = ∗ + Thiết lập mô hình 180 160 Ước lượng tham số mô hình 140 Phân tích, kiểm định mô hình 120 100 Đánh giá mô hình 80 60 Sử dụng mô hình để ra quyết 100 120 140 160 180 200 220 240 260 280 300 định 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.1 Phân tích các mối quan hệ trong phân tích hồi quy 1. Quan hệ hồi quy và quan hệ hàm số.  Hàm số hai biến = ( ) hay hàm số nhiều biến = ( ; ;…; ) là mối quan hệ 1 – 1 và các biến không phải ngẫu nhiên.  Hàm hồi quy hai biến : - Chia ra làm hai biến: Các biến giải thích hay biến độc lập là không ngẫu nhiên. Biến được giải thích hay biến phụ thuộc là ngẫu nhiên. - Quan hệ hồi quy không là hàm 1 – 1. - Hàm hồi quy hai biến sẽ tính toán trung bình của biến phụ thuộc theo giá trị biến độc lập thông qua theo cấu trúc của một dạng hàm. 12 4
  5. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.1 Phân tích các mối quan hệ trong phân tích hồi quy 1. Quan hệ thống kê và quan hệ hàm số. Biểu đồ phân tán mức cung cầu hàm số 2.9 2.9 2.7 2.7 y = -2.3653x3 + 9.5221x2 - 12.922x 2.5 + 7.7655 2.5 2.3 2.3 2.1 2.1 1.9 1.9 1.7 1.7 0.7 0.9 1.1 1.3 1.5 1.7 1.9 13 0.7 0.9 1.1 1.3 1.5 1.7 1.9 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.1 Phân tích các mối quan hệ trong phân tích hồi quy 2. Quan hệ hồi quy và quan hệ nhân quả  ; gọi là có quan hệ nhân quả nếu là nguyên nhân gây ra và ngược lại nếu có kết quả thì suy luận là do nguyên nhân .  Quan hệ hồi quy không quan tâm đến biến nào là nguyên nhân hay biến kết quả, mà chỉ quan tâm sự thay đổi biến này phụ thuộc vào biến độc lập thông qua dữ liệu phân tán giữa các biến. 14 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.1 Phân tích các mối quan hệ trong phân tích hồi quy 3. Hồi quy và tương quan.  Tương quan giữa hai biến là đo mức phụ thuộc tuyến tính của 2 biến. Hai biến trong mối quan hệ tương quan mang tính đối xứng, và cả hai biến là đại lượng ngẫu nhiên. Và hệ số tương quan chỉ chỉ ra mức độ mạnh yếu trong quan hệ tuyến tính giữa hai biến ngẫu nhiên.  Quan hệ hồi quy xây dựng hàm để ước lượng mức độ phụ thuộc biến này vào biến kia. Hai biến trong quan hệ hồi quy mang tính không đối xứng, một biến là đại lượng ngẫu nhiên và một biến phi ngẫu nhiên. 15 5
  6. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.1 Phân tích các mối quan hệ trong phân tích hồi quy 3. Hồi quy và tương quan.  Với ; là hai đại lượng ngẫu nhiên, ta có thể đánh giá mức độ tương quan (ảnh hưởng) của biến này so với biến kia là mạnh hay yếu 16 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.1 Phân tích các mối quan hệ trong phân tích hồi quy 3. Hồi quy và tương quan. Mục tiêu của phân tích hồi quy: dùng các công cụ phân tích dữ liệu xây dựng một hàm số đánh giá cho biến phụ thuộc thông qua biến độc lập. 17 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Đối với việc xây dựng mô hình hồi quy giữa các biến kinh tế, thì việc thu thập dữ liệu thường không tốt:  Bỏ sót dữ liệu.  Sai sót trong kỹ thuật thu thập dữ liệu.  Nhầm lẫn khi ghi nhận dữ liệu, quan sát dữ liệu, dữ liệu được cung cấp không chính xác.  Sai số với các công cụ đo lường.  Sai phạm khi chọn mẫu (sai cỡ mẫu, mẫu không có tính đại diện cao)  Các số liệu về kinh tế thường ở mức độ tổng hợp cao, không cho phép đi sâu vào các đơn vị nhỏ. Do chất lượng của mô hình phụ thuộc vào chất lượng dữ liệu, nên các mô hình hồi quy ta có thể tìm chỉ ở mức hàm hồi quy mẫu. 18 6
  7. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. Giả sử ở một địa phương có 51 hộ gia đình. Chúng ta quan tâm ở đây nghiên cứu mối quan hệ giữa : • ($) − chi tiêu tiêu dùng trong một tuần của một hộ gia đình. • ($) − thu nhập khả dụng của một hộ gia đình.  Với các mức thu nhập đặt ra trước và khảo sát các mức chi tiêu của các hộ có cùng mức thu nhập.  Mục tiêu: Dự đoán mức chi tiêu trung bình của một hộ gia đình tại một mức thu nhập bất kỳ. 19 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) 110 130 150 170 190 210 230 250 270 290 71 80 96 108 50 128 140 162 164 179 77 85 104 114 122 136 150 165 170 182 82 90 105 117 128 138 155 174 188 189 90 100 110 120 134 148 160 194 200 95 105 120 124 140 150 170 205 110 130 145 158 Tổng 415 570 535 713 786 853 775 501 716 955 ( | ) 83 95 107 119 120 143 155 167 179 191 20 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) CHI TIÊU - THU NHẬP 200 180 160 140 120 100 80 60 100 120 140 160 180 200 220 240 260 280 300 21 7
  8. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) CHI TIÊU - THU NHẬP 200 180 160 140 120 100 80 60 100 120 140 160 180 200 220 240 260 280 300 TB 22 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) CHI TIÊU - THU NHẬP 200 180 160 140 120 100 80 60 100 120 140 160 180 200 220 240 260 280 300 TB 23 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) CHI TIÊU - THU NHẬP 200 180 160 140 120 100 80 60 100 120 140 160 180 200 220 240 260 280 300 TB Linear (TB) 24 8
  9. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.2 Hàm hồi quy tổng thể (prf – population regression function) Xét trong mối quan hệ giữa hai CHI TIÊU - THU NHẬP 200 biến : biến số phụ thuộc (hay 180 biến được giải thích) và biến 160 140 độc lập. Thì hàm hồi qui tổng 120 thể, giữa và có dạng: 100 80 E Y | X i   f  X i   1  2 X i E Y | X i   f  X i  60 100 120 140 160 180 200 220 240 260 280 300 Linear (TB) Ví dụ 1. (Chi tiêu và thu nhập) Hàm hồi quy tổng thể dạng tuyến tính giữa 25 chi tiêu ( ) và thu nhập ( ) có dạng : 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN X2 Biến phụ thuộc: (chi tiêu) X Biến độc lập: (thu nhập) : vị trí hộ gia đình Y : số thành viên trong gia đình : số thành viên nam (nữ) X4 : độ tuổi của các thành viên trong X3 gia đình các yếu tố khác 26 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.2 Hàm hồi quy tổng thể (prf – population regression function) SAI SỐ NGẪU NHIÊN CHI TIÊU - THU NHẬP Mức chênh lệch giữa (giá 200 180 Ui  Yi  E Y | X i  Yi trị quan sát thứ i) và 160 ( | ), Ký hiệu là , gọi 140 là sai số ngẫu nhiên: 120 E Y | X i  100 U i  Yi  E Y | X i  80 60 Xi 100 120 140 160 180 200 220 240 260 280 300 Khi đó hàm hồi qui tổng thể có thể viết lại thành Linear (TB) Yi  E Y | X i   U i  f  X i   U i 27 9
  10. 3/2020 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN Ví dụ 1. (Chi tiêu và thu nhập) 110 130 150 170 190 210 230 250 270 290 71 80 96 108 50 128 140 162 164 179 Thực tế. (Mẫu) Lý thuyết. (Tổng thể) 28 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.3 Hàm hồi quy mẫu (srf – sample regression function) Việc ước lượng giá trị trung SRF  bình của biến phụ thuộc dựa trên một mẫu, dựa trên hàm hồi quy mẫu (SRF) có dạng : Yi    X i   f PRF  Với là phần dư chênh lệch giữa giá trị quan sát ( ) và giá trị tinh bằng hàm hồi quy , ta có ei  Yi    X i   Yi    X i   ei f f 29 6.2 KHÁI NIỆM MÔ HÌNH HỒI QUY HAI BIẾN 2.3 Hàm hồi quy mẫu (srf – sample regression function) Ví dụ : Nếu hàm PRF là hàm tuyến tính thì việc ước lượng PRF bằng hàm hồi quy mẫu SRF có dạng: PRF SRF E Y | X i   f  X i   1  2 X i Yi    X i   1   2 X i  f ˆ  Yi  1  2 X i  Ui  ˆ Yi   1  2 X i  ei Yi  E Y | X i   U i  Yi  Yi  ei 30 10
  11. 3/2020 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24 Ví dụ 1: Để minh họa, trở lại ví dụ chi tiêu - thu nhập, giả sử lấy mẫu ta được số liệu cho như bảng. CHI TIÊU - THU NHẬP 200 110 130 150 170 190 210 230 250 270 290 180 71 95 71 85 120 108 130 130 150 160 160 140 120 100 80 60 100 120 140 160 160 180 200 220 240 260 280 300 300 31 Linear (Series1) Linear (Series2) (Series1) Linear Linear (Series4) Linear (Series5) 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24 Giả sử hàm PRF là hàm tuyến tính và việc ước lượng PRF bằng hàm hồi quy mẫu SRF có dạng:  ˆ ˆ Yi   1  2 X i  ei  Yi  ei Để tìm hàm = + ta dùng phương pháp bình phương tối thiểu với ý tưởng : tất cả các giá trị quan sát ( ) và giá trị ước lượng ( ) phải có tổng chênh lệch bình phương đạt giá trị nhỏ nhất 32 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24 Giả sử hàm PRF là hàm tuyến tính và việc ước lượng PRF bằng hàm hồi quy mẫu SRF có dạng:  ˆ ˆ Yi   1  2 X i  ei  Yi  ei Ta tìm sao cho càng gần với giá trị thực , với là phần dư thứ . = − = − − n n      Min 2     E 1 ; 1   ei    Yi  1  2 X i 2 i 1 i 1 n  X Y  nX .Y i i    2  i 1 và 1  Y   2 X n 2 2 X i 1 i  nX 33 11
  12. 3/2020 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24 ª Chứng minh công thức hệ số hồi quy n n      Min 2     E 1 ; 1   ei    Yi  1  2 X i 2 i 1 i 1  E  n     n    n   n    X    Y     21 Yi  1  2 X i  0     1  i  2  i  i1    1 i1    i 1    E n  n   n 2    n     X    X    i     i  2  X iYi     2X i  Yi  1  2 X i  0   1 i1   i1  1     i1     n   i 1  X iYi  nX .Y     2  i 1n và  1  Y   2 X 2 2  Xi  nX i 1 34 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24  ˆ ˆ Yi   1  2 X i  ei  Yi  ei Ta có công thức ước lượng cho tham số của hàm hồi qui mẫu : n  X Y  nX .Y i i    2  i 1 Và 1  Y   2 X n 2 2 X i 1 i  nX Các ký hiệu khác cho công thức hệ số hồi quy: n n   X i   X Yi  Y  x y i i S XY   2  i 1 n  i 1 n  Và 1  Y   2 X 2 S XX  X i 1 i X  x i 1 i 2 35 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24 Ví dụ 2: Cho bảng giá trị sau, dùng phương pháp bình phương cực tiểu để tính các giá trị tham số cho hàm tuyến tính. 80 70 Hàm hồi quy mẫu 100 65 160 120 90 140 y = 0.5091x + 24.455 140 95 120 160 110 100 180 115 200 120 80 = 24,4545 + 0,5091 220 140 60 240 155 40 260 150 50 100 150 200 250 36 12
  13. 3/2020 6.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT CH.2/I/tr.24 Với là thu nhập hàng tuần (USD/tuần) và là mức chi tiêu cho tiêu dùng (USD/tuần) = 1110 = 111 = − = 16800 = 1700 = 170 = − = 33000 = 322000 = = 0,5091 = 205500 = − = 24,4545 37 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL 4.1 Các giả thiết phương pháp OSL Trong phân tích hồi qui, mục đích là ước lượng cho giá trị | . Với các giá trị , đã tìm được ta ước lượng trực tiếp được cho , khi có các giả thiết: i. Các biến độc lập là không ngẫu nhiên. ii. Kỳ vọng của sai số ngẫu nhiên bằng 0. Tức là | = Bình quân các đại lượng, yếu tố không có trong mô hình không ảnh hưởng đến việc ước lượng | 38 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/II/tr.28 ii. Kỳ vọng của sai số ngẫu nhiên bằng 0. Tức là | = Bình quân các đại lượng, yếu tố không có trong mô hình không ảnh hưởng đến việc ước lượng | 39 13
  14. 3/2020 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/II/tr.28 iii. Các sai số ngẫu nhiên có phương sai bằng nhau, tức là | = | = Giả thiết nhằm khẳng định các giá trị cá biệt của sẽ xoay quanh giá trị trung binh với mức độ chênh lệch như nhau. 40 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/II/tr.28 iii. Các sai số ngẫu nhiên có phương sai bằng nhau, tức là | = | = 41 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/II/tr.28 iv. Không có sự tương quan giữa các .Tức là ; =   ∀ ; Sai số giữa các lần quan sát không ảnh hưởng tới nhau. v. , không có tương quan với nhau. Tức là ; =    ∀ Các yếu tố còn thiếu trong mô hình không ảnh hưởng dến biến giải thích chinh trong mô hình Và nếu có 5 giả thiết trên thì theo định lý Gauss – Markov ta có thể khẳng định ước lượng bằng phương pháp OSL thì ; sẽ là ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất đối với ; . 42 14
  15. 3/2020 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 4.2 Ba đại lượng sai số Total sum of squares. n 2 TSS   Yi  Y i 1   − RSS Residual sum of squares. TSS n 2 ESS ˆ RSS   Yi  Yi i 1   Explained sum of squares. n 2  ESS   Y i  Y i 1   43 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 4.2 Ba đại lượng sai số n 2 TSS : Là đại lượng hằng số, thể hiện sự biến thiên của TSS   Yi  Y i 1   dữ liệu ( ) do tất cả các yếu tố liên quan n  2 ESS : Dùng để đánh giá biến thiên của biến phụ thuộc ESS   Y i  Y i 1   do chính các yếu tố trong hàm hồi quy. n 2     Yi Y i 1   n 2 RSS : Dùng để đánh giá biến thiên của biến phụ thuộc ˆ RSS   Yi  Yi i 1   do các yếu tố không có trong hàm hồi quy. 44 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 4.2 Ba đại lượng sai số Ví dụ 1: Để minh họa, trở lại ví dụ chi tiêu - thu nhập, : chi tiêu của các hộ gia đình, : chi tiêu của các hộ gia đình giải thích thông qua thu nhập n Biến thiên chi tiêu do nhiều yếu tố như thu nhập (có 2 TSS   Yi  Y i 1   trong mô hình); số thành viên, độ tuổi, hao phí do các thành viên, vị trí hộ gia đình (không có trong mô hình). n 2 ESS   i 1    Y i Y  Biến thiên chi tiêu do trực tiếp thu nhập. n 2 ˆ RSS   Yi  Yi i 1   Biến thiên chi tiêu do các yếu tố khác. 45 15
  16. 3/2020 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 2 2 TSS   Yi  Y      ˆ ˆ Yi  Yi  Yi  Y 2 2   Y  Y    Y  Y   2 Y  Y Y  Y  ˆ ˆ i ˆ ˆ i i i  RSS  ESS  2  Y  Y Y  Y  ˆ ˆ i i  Y  Yˆ Yˆ  Y    e  ˆ  ˆ X  Y   ˆ  e  ˆ  e  X   Y  e i i i 1 2 i 1 i 2 i i i X e 0  Y  Yˆ Yˆ  Y   0 i i i i e  0 i TSS  ESS  RSS 46 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 Lưu ý: n 2  TSS   Yi  Y i 1    SYY n 2 n 2 2 n       2  2  ESS   Y i  Y i 1      1   2 X i  1   2 X i 1   2  X i 1 i X    2 S XX n 2 ˆ  RSS   Yi  Yi i 1    TSS  ESS n 2 2 e i RSS   i 1  n2 n2 47 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL 4.3 Phương sai hệ số hồi quy. Theo trên , ta đã khẳng định là ước lượng không chệch của , vậy thì độ chính xác của , chính là độ phân tán giá trị xung quanh giá trị n trung bình của nó . 2  X i  2 Đặt = thì ta có Var  1    i 1 nS XX  2 Var  2  S XX   Với phương sai của Sai số ngẫu nhiên ước lượng bằng n n 2   2 e i 1 2 i  Y     X  i 1 i 1 2 i    n2 n2 48 16
  17. 3/2020 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 4.3 Hệ số xác định Ta luôn có nếu được xây dựng theo phương pháp OSL thì TSS  ESS  RSS Nếu hàm hồi qui mẫu phù hợp tốt với số liệu thì RSS=0, ngược lại nếu hàm hồi qui mẫu không phù hợp thì RSS sẽ lớn. n 2  2 ESS  Y i 1 i Y  R   n TSS 2  Y  Y  i 1 i 49 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 4.3 Hệ số xác định n 2  ESS  Y i Y  TSS  ESS  RSS R2   i 1 n TSS 2  Y  Y  i 1 i ª Tính chất hệ số xác định ª R 2  0 : Mô hình không phù hợp, 0  R2  1 • R 2  0 : 100% biến không giải thích được cho , ª R 2  1 : Mô hình phù hợp, • R 2  1 : 100% biến giải thích được cho , 50 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL CH.2/IV/tr.30 Khi ≫1 : Các điểm quan sát ( ; ) rất gần với đường hồi quy. Khi ≫ : Các điểm quan sát ( ; ) rất xa với đường hồi quy. 51 17
  18. 3/2020 6.4 CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OSL 4.3 Hệ số xác định • Hệ số tương quan dùng để đánh giá mức quan hệ tuyến tính giữa ; : r  X ,Y   Cov  X , Y     X  X Y  Y  i i  S XY 2 2 VarX VarY S XX SYY   X  X   Y  Y  i i Hệ quả: Mối quan hệ giữa hệ số phù hợp và hệ số tương quan giữa hai đại lượng ; r  X ;Y    R 2 52 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG 5.1 Quy luật phân phối các đại lượng trong mô hình Để xây dựng quy luật phân phối cho các đại lượng ngẫu nhiên trong mô hình hồi quy ta cần Giả thiết thứ 6: vi. Sai số ngẫu nhiên có quy luật phân phối chuẩn Giả thiết ii. E U | X i   0 , vậy ta có E U i   0 Giả thiết iii. Var U | X i    2 Vậy sai số ngẫu nhiên có quy luật phân phối chuẩn U i ~ N  0, 2  53 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG Các tham số trong mô hình hồi quy có quy luật phân phối chuẩn như sau: 2 n  2 ~  2        1 ~ N 1 ,Var  1     2 ~ N  2 ,Var  2  2   n 2    1  1   2  2  n  2 2  ~ Tn  2  ~ Tn 2  2 ~  n 2   2   Var  1   Var  2 n 2  X i 2  1 ˆ2 Trong đó: Var  1    i 1 nS XX  và Var  2  S XX    54 18
  19. 3/2020 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG 5.2 Ược lượng khoảng cho hệ số hồi quy, độ lệch chuẩn sai số. Tn Khi ta sử dụng bất kỳ hàm ước lượng để ước lượng cho tham số T n  ;Tn     thì luôn tồn tại sai số. Nên khoảng tin cậy cho tham số có dạng ( − ; + ), giá trị sai số  gọi là độ chính xác thỏa giá trị độ tin cậy (1 − ) cho trước theo công thức P Tn      Tn    1   55 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG    2  2  1  1   ~ Tn  2 ~ Tn 2  Var     1   Var  2 Khoảng ước lượng cho và với độ tin cậy (1 − ) cho trước : Khoảng ước lượng cho :  t  1 n2  /2    . Var 1 ; 1  t 2 . Var 1 n /2  Khoảng ước lượng cho :  t  2 n2 /2   n . Var 2 ; 2  t 2 /2 . Var    2 56 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG Khoảng ước lượng cho   n  2  2  2 ~ n2 2 Khoảng ước lượng cho với độ tin cậy (1 − ) cho trước :  2 n  2 n  2  2      2,n2 ; 2,n2      /2 1/2     57 19
  20. 3/2020 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG 5.3 Mô hình kiểm định giả thiết so sánh hệ số hồi quy với một số cho trước KIỂM ĐỊNH 2 PHÍA 1 PHÍA TRÁI Gia thiết : : = Giả thiết : : = Đối thiết : : ≠ Đối thiết : : < 58 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG 5.3 Mô hình kiểm định giả thiết so sánh hệ số hồi quy với một số cho trước KIỂM ĐỊNH 2 PHÍA 1 PHÍA PHẢI Gia thiết : : = Giả thiết : : = Đối thiết : : ≠ Đối thiết : : > 59 6.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG    2  2  1  1   ~ Tn  2 ~ Tn 2  Var     1   Var  2 Trị thống kê cho kiểm định giả thiết : H 0 : i  i 0 ; i  1,2 ˆ i  i 0 t Var    i 60 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2