Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
Phân tích hồi quy bội:<br />
Vấn đề suy diễn thống kê<br />
Chương 4<br />
<br />
10.12.2017<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
Suy diễn thống kê trong mô hình hồi quy<br />
Kiểm định giả thuyết về tham số tổng thể<br />
Xây dựng các khoảng tin cậy (đối xứng)<br />
<br />
4.1 Phân phối mẫu của ước lượng OLS<br />
<br />
Wooldridge: Introductory Econometrics:<br />
A Modern Approach, 5e<br />
<br />
Ước lượng OLS là các biến ngẫu nhiên<br />
<br />
Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này<br />
<br />
Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả<br />
thuyết thống kê<br />
<br />
Để suy luận về phân phối, chúng ta cần thêm giả thiết<br />
<br />
Giả thiết về phân phối của sai số: sai số có phân phối chuẩn<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
Giả thiết MLR.6 (Phân phối chuẩn của sai số)<br />
độc lập với các biến<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
PHÂN TÍCH HỒI QUY BỘI<br />
VẤN ĐỀ SUY DIỄN<br />
• Định lý giới hạn trung tâm (CLT)<br />
<br />
• Biến ngẫu nhiên tổng x = x1+…+xk<br />
với x1,..., xk là các biến ngẫu nhiên<br />
<br />
Giả sử rằng phần sai số của hồi quy tổng<br />
thể có phân phối chuẩn.<br />
Dạng phân phối và phương sai không<br />
phụ thuộc vào bất kỳ biến giải thích nào.<br />
Suy ra:<br />
<br />
Nếu các điều kiện sau thỏa:<br />
• Các xi là độc lập<br />
<br />
• Các xi có cùng phân phối xác suất<br />
<br />
• Các xi có cùng kỳ vọng và phương sai (hữu hạn)<br />
• k lớn (thường k 30)<br />
<br />
• thì x sẽ có phân phối xấp xỉ chuẩn<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
1<br />
<br />
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
10.12.2017<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Thảo luận về giả thiết phân phối chuẩn<br />
<br />
Phần sai số được xem là tổng của “nhiều“ yếu tố không quan sát được<br />
<br />
Tổng của các yếu tố độc lập có phân phối xấp xỉ chuẩn (Định lý giới hạn<br />
trung tâm - Central Limit Theorem - CLT)<br />
Các vấn đề nảy sinh:<br />
<br />
Thảo luận về giả thiết phân phối chuẩn (tt)<br />
<br />
Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:<br />
• Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)<br />
• Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)<br />
<br />
• Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1)<br />
<br />
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không?<br />
<br />
Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc<br />
<br />
• Các yếu tố này độc lập với nhau ở mức nào?<br />
<br />
Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt nhất (kể<br />
<br />
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với nhau<br />
<br />
biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage) thay cho wage)<br />
cả ước lượng phi tuyến)<br />
<br />
Phân phối của sai số là một vấn đề thuộc về thực nghiệm<br />
<br />
Ít nhất là phân phối của sai số “xấp xỉ “ với phân phối chuẩn<br />
<br />
Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn<br />
có thể thay thế bằng cỡ mẫu lớn (xem Chương 5)<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
PHÂN TÍCH HỒI QUY BỘI<br />
VẤN ĐỀ SUY DIỄN<br />
<br />
PHÂN TÍCH HỒI QUY BỘI<br />
VẤN ĐỀ SUY DIỄN<br />
<br />
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)<br />
<br />
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)<br />
Tập tin gpa1.wf1<br />
<br />
Dependent Variable: COLGPA<br />
Method: Least Squares<br />
Included observations: 141<br />
Variable<br />
<br />
Coefficient<br />
<br />
Std. Error<br />
<br />
t-Statistic<br />
<br />
Prob.<br />
<br />
C<br />
HSGPA<br />
ACT<br />
SKIPPED<br />
AGE<br />
<br />
0.902058<br />
0.433794<br />
0.014486<br />
-0.080661<br />
0.019904<br />
<br />
0.650366<br />
0.097088<br />
0.010578<br />
0.026173<br />
0.022838<br />
<br />
1.387001<br />
4.468031<br />
1.369538<br />
-3.081854<br />
0.871566<br />
<br />
0.1677<br />
0.0000<br />
0.1731<br />
0.0025<br />
0.3850<br />
<br />
R-squared<br />
<br />
0.237850<br />
<br />
Mean dependent var<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
3.056738<br />
<br />
H0: phần dư có phân phối chuẩn<br />
H1: phần dư không có phân phối chuẩn<br />
p-value = 0,458586 > 0,05 : chấp nhận H0<br />
<br />
2<br />
<br />
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
Một số thuật ngữ<br />
<br />
10.12.2017<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
4.2 Kiểm định giả thuyết về từng tham số tổng thể<br />
<br />
Định lý 4.2 (phân phối t cho các ước lượng chuẩn hóa)<br />
<br />
“các giả thiết Gauss-Markov“<br />
<br />
Các giả thiết của “mô hình hồi quy tuyến tính cổ<br />
điển (CLM - classical linear model )“<br />
<br />
Dưới các giả thiết MLR.1 – MLR.6:<br />
<br />
Định lý 4.1 (Phân phối chuẩn trong mẫu)<br />
Dưới các giả thiết MLR.1 – MLR.6:<br />
<br />
Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn.<br />
<br />
4.1<br />
Các ước lượng OLS có phân phối mẫu với<br />
phương sai như đã thiết lập trong chương trước<br />
<br />
Giả thuyết không (trường hợp giả thuyết tổng quát sẽ đề cập sau)<br />
Ước lượng chuẩn hóa tuân theo phân phối<br />
chuẩn tắc<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
Thống kê t (hay tỷ số t)<br />
4.5<br />
<br />
4.3<br />
<br />
Nếu việc chuẩn hóa được thực hiện bằng dùng độ lệch<br />
chuẩn ước lượng (nghĩa là dùng sai số chuẩn), phân<br />
phối chuẩn tắc sẽ được thay thế bằng phân phối t<br />
<br />
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không<br />
đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả<br />
thuyết không càng ít khả năng đúng. Nhưng khi nào thì<br />
được gọi là “xa“ giá trị 0?<br />
<br />
Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được,<br />
nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo<br />
lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0 bằng<br />
bao nhiêu lần độ lệch chuẩn.<br />
<br />
4.4<br />
<br />
Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát<br />
các biến độc lập khác, xj không tác động đến y<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội :<br />
Vấn đề suy diễn<br />
Kiểm định với giả thuyết đối một phía (lớn hơn 0 – phía phải)<br />
t0,05(28)= 1,701<br />
<br />
Phân phối của thống kê t nếu giả thuyết không là đúng<br />
<br />
Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì<br />
khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
Kiểm định<br />
<br />
với giả thuyết đối<br />
<br />
.<br />
<br />
4.6<br />
<br />
Bác bỏ giả thuyết không và ủng hộ giả thuyết đối<br />
một phía này nếu hệ số hồi quy ước lượng được là<br />
quá lớn (cụ thể là lớn hơn giá trị tới hạn t(n-k-1)).<br />
<br />
Xây dựng giá trị tới hạn sao cho, nếu giả thuyết<br />
không là đúng thì khả năng giả thuyết không bị<br />
bác bỏ, chẳng hạn, là 5% trong tổng số các trường<br />
hợp.<br />
<br />
t t ( n k 1) : bac bo H 0 4.7<br />
<br />
Trong ví dụ đã cho, đây là giá trị của phân phối t<br />
với 28 bậc tự do mà 5% số các trường hợp sẽ lớn<br />
hơn giá trị này.<br />
Bác bỏ H0 nếu thống kê t lớn hơn 1,701<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
3<br />
<br />
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
10.12.2017<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Ví dụ 4.1: Phương trình tiền lương<br />
<br />
Ví dụ 4.1: Phương trình tiền lương (tt)<br />
<br />
Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên chức vụ, những công<br />
<br />
Thống kê t<br />
<br />
nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn hay không<br />
<br />
t0,05 (522) 1, 645<br />
<br />
t0,01 (522) 2, 326<br />
<br />
Sai số chuẩn<br />
<br />
Kiểm định<br />
<br />
với giả thuyết đối<br />
<br />
.<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Giả thuyết không sẽ bị bác bỏ vì thống kê t lớn hơn giá trị tới<br />
hạn t(n-k-1). texper= 2,41 > t0,05(522)= 1,645 : bác bỏ H0<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học<br />
<br />
Kiểm định với giả thuyết đối một phía (nhỏ hơn 0 – phía trái)<br />
Kiểm định<br />
.<br />
<br />
Giá trị tới hạn ứng với mức ý nghĩa 5% và 1% - phân phối t xấp<br />
xỉ chuẩn tắc (Đây là những mức ý nghĩa thường gặp).<br />
<br />
“Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có ý nghĩa<br />
thống kê ở mức 5% (thậm chí có ý nghĩa ở mức 1%).“<br />
<br />
Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lương (USD/giờ)<br />
hoặc không tác động gì cả.<br />
<br />
t0,05(18)= 1,734<br />
<br />
Bậc tự do;<br />
Ở đây, sự xấp xỉ phân<br />
phối chuẩn tắc có thể<br />
được áp dụng<br />
<br />
với giả thuyết đối<br />
<br />
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả học tập<br />
<br />
4.8<br />
<br />
Bác bỏ giả thuyết không với giả thuyết đối một<br />
phía này nếu hệ số ước lượng được là “quá nhỏ“<br />
(nghĩa là, nhỏ hơn so với giá trị tới hạn -t(n-k-1)).<br />
<br />
của sinh viên sẽ tốt hơn hay không<br />
<br />
Phần trăm sinh viên vượt<br />
qua bài kiểm tra môn Toán<br />
<br />
Thu nhập trung bình<br />
Tỷ lệ giáo viên trên<br />
hàng năm của giáo viên 1000 sinh viên<br />
<br />
Lượng sinh viên theo học<br />
(= quy mô trường học)<br />
<br />
Xây dựng giá trị tới hạn sao cho nếu giả thuyết<br />
không là đúng thì giả thuyết này sẽ bị bác bỏ,<br />
chẳng hạn, trong 5% tổng số các trường hợp.<br />
<br />
Trong ví dụ đã cho, đây là điểm giá trị mà tại đó<br />
phân phối t với 18 bậc tự do sẽ có 5% các trường<br />
hợp nhỏ hơn giá trị này.<br />
<br />
t t ( n k 1) : bac bo H 0<br />
<br />
4.9<br />
<br />
Bác bỏ H0 nếu thống kê t nhỏ hơn -1,734<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
Kiểm định<br />
.<br />
<br />
với giả thuyết đối<br />
Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học<br />
không hề có tác động đến kết quả học tập?<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
4<br />
<br />
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M.<br />
Wooldridge<br />
<br />
10.12.2017<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)<br />
Thống kê t<br />
<br />
t0,05 (404) 1, 645<br />
Bảng z:<br />
<br />
t0,15 (404) 1, 04<br />
<br />
Bậc tự do;<br />
Trường hợp này có thể áp<br />
dụng xấp xỉ phân phối<br />
chuẩn tắc<br />
<br />
Giá trị tới hạn với mức ý nghĩa 5% và 15%.<br />
<br />
Giả thuyết không không bị bác bỏ vì thống kê t không nhỏ hơn<br />
<br />
giá trị tới hạn. tenroll= -0,91 > -t0,05(404)= -1,645 : chấp nhận H0<br />
<br />
Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có tác động<br />
đến kết quả học tập của sinh viên (thâm chí là ở mức ý nghĩa 15%).<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
R2 cao hơn một chút<br />
<br />
Kiểm định<br />
<br />
với giả thuyết đối<br />
<br />
Thống kê t<br />
Giá trị tới hạn ở mức ý nghĩa 5%, bác bỏ giả thuyết không<br />
<br />
Kiểm định với giả thuyết đối hai phía<br />
t0,025(25)= 2,06<br />
<br />
Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học tập của<br />
sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác động là ngược chiều<br />
<br />
Ví dụ:<br />
<br />
Nếu số sinh viên tăng lên 10 (%) thì số sinh viên vượt qua bài<br />
kiểm tra sẽ giảm một lượng là 0,0129*10 = 0,129 (%)<br />
<br />
(tác động rất nhỏ)<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
https://sites.google.com/a/ueh.edu.vn/phamtricao/<br />
<br />
Kiểm định<br />
<br />
với<br />
<br />
.<br />
<br />
4.10<br />
<br />
Bác bỏ giả thuyết không với giả thiết đối hai phía<br />
nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.<br />
Xây dựng giá trị tới hạn sao cho nếu giả thuyết<br />
không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%<br />
trong tổng số các trường hợp.<br />
<br />
tlog(enroll)= -1,87 < -t0,05(404)= -1,645 : bác bỏ H0<br />
<br />
Độ lớn của tác động ra sao?<br />
<br />
.<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
Phân tích hồi quy bội<br />
Vấn đề suy diễn<br />
<br />
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)<br />
<br />
t0,05 (404) 1, 645<br />
<br />
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)<br />
<br />
Một dạng hàm khác:<br />
<br />
Trong ví dụ đã cho, những điểm ứng với 5% các<br />
trường hợp này nằm ở hai phía đuôi của hàm<br />
phân phối.<br />
<br />
| t | t / 2 ( n k 1) : bac bo H 0 4.11<br />
<br />
Bác bỏ H0 nếu giá trị tuyệt đối của thống kê lớn<br />
hơn 2,06<br />
<br />
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.<br />
<br />
5<br />
<br />