Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG • Hồi quy đơn (hồi quy 2 biến)

Phân tích hồi quy bội: Vấn đề ước lượng

Chương 3

• y = β0+β1x1+u • β0: hệ số chặn • β1: hệ số góc • Hồi quy bội 3 biến 3.3 • y = β0+β1x1+β2x2+u • Hồi quy bội 4 biến

Wooldridge: Introductory Econometrics: A Modern Approach, 5e

• y = β0+β1x1+β2x2+β3x3+u • β0: hệ số chặn • β1, β2, β3: hệ số góc • y: biến phụ thuộc

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

2

• x1, x2, x3: biến độc lập • u: sai số ngẫu nhiên, nhiễu • β0, β1, β2, β3: hệ số hồi quy

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

3.1 Sự cần thiết nghiên cứu hồi quy bội Sự cần thiết của hồi quy bội Định nghĩa mô hình hồi quy bội (k+1 biến) Đưa thêm nhiều biến giải thích vào mô hình “Giải thích biến theo các biến “

Hệ số chặn

Các hệ số góc

Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là không đổi

Tất cả các yếu tố khác

Biến phụ thuộc Biến được giải thích, Biến phản ứng,…

Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi, trừ các yếu tố trong Cho phép sử dụng dạng hàm đa dạng hơn 3.6 Ví dụ: Phương trình tiền lương

Sai số ngẫu nhiên, Nhiễu, Phần chưa quan sát được,…

Biến độc lập, Biến giải thích, Biến kiểm soát,…

Tiền lương (USD/giờ)

Số năm đi học

Kinh nghiệm lao động

3.1

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

1

3.8

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Các yếu tố khác

Các yếu tố khác

Chi tiêu của hộ

Thu nhập của hộ

Thu nhập của hộ bình phương

Điểm trung bình của bài thi chuẩn hóa

Chi phí trên mỗi sinh viên của trường

Thu nhập trung bình của gia đình các sinh viên trong trường

Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên Ví dụ: Thu nhập và chi tiêu của hộ gia đình 3.4 3.2

Mô hình có hai biến giải thích: thu nhập và thu nhập bình phương Chi tiêu được giải thích bằng hàm bậc hai của thu nhập Chi phí trên mỗi sinh viên có thể tương quanvới thu nhập trung bình của các gia đình do vấn đề tài chính Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy:

Phụ thuộc vào mức chi tiêu cụ thể đang xét

Mức chi tiêu tăng thêm bao nhiêu đơn vị nếu thu nhập tăng thêm một đơn vị?

Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung bình bị chệch.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số có thể đã bao gồm luôn tác động của biến thu nhập trung bình của gia đình

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Log của thu nhập CEO

Log của doanh thu

Hàm bậc hai của số năm thâm niên làm CEO

3.2 Cách thực hiện và diễn giải của phương pháp OLS Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO Ước lượng OLS của mô hình hồi quy bội: 3.7 Mẫu ngẫu nhiên

Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

2

Phần dư Mô hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh thu của doanh nghiệp là hằng số. 3.11’ Mô hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên Cực tiểu tổng bình phương phần dư làm CEO có dạng hàm bậc hai 3.12’ Ý nghĩa của sự “tuyến tính“ trong hồi quy Mô hình phải tuyến tính theo tham số (không phải theo biến số)

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Diễn giải ý nghĩa của mô hình hồi quy bội Ví dụ 3.1: Các yếu tố tác động đến điểm GPA

Cho biết lượng thay đổi của biến phụ thuộc khi biến độc lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc lập khác và sai số không đổi

Kết quả bài kiểm tra thành tích

Điểm GPA trung bình của sinh viên ở đại học

Điểm GPA trung bình khi học phổ thông trung học

3.15

Diễn giải

Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến giải thích khác không đổi, ngay cả khi trong thực tế có thể các biến giải thích này là có tương quan với nhau. Trong điều kiện ACT không đổi, mỗi điểm GPA trung học tăng thêm có thể làm tăng 0,453 điểm GPA đại học Cách diễn giải này được gọi là “Các yếu tố khác không đổi“

Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGAP của sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng sinh viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được u sẽ không thay đổi khi biến giải thích thay đổi.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Trong điều kiện điểm hsGPA như nhau, mỗi 10 điểm ACT cao hơn có thể làm điểm colGAP cao hơn 0,0094*10 = 0,094 điểm

Phân tích hồi quy bội: Vấn đề ước lượng

• Tập tin gpa1.wf1

Dependent Variable: COLGPA Method: Least Squares Included observations: 141

Std. Error

t-Statistic

Prob.

Coefficient

0.902058 0.433794 0.014486 -0.080661 0.019904

0.650366 0.097088 0.010578 0.026173 0.022838

1.387001 4.468031 1.369538 -3.081854 0.871566

0.1677 0.0000 0.1731 0.0025 0.3850

Variable C HSGPA ACT SKIPPED AGE

0.237850 Mean dependent var

3.056738

R-squared

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

12

https://sites.google.com/a/ueh.edu.vn/phamtricao/

3

Cách diễn giải tác động riêng phần trong hồi quy bội: Hệ số hồi quy của biến giải thích trong mô hình hồi quy bội có thể được ước lượng và có thể tính toán được bằng hai bước sau: 1) Hồi quy biến giải thích này theo tất cả các biến giải thích còn lại 2) Hồi quy theo phần dư của hàm hồi quy ở bước 1 Tại sao cách này có thể thực hiện được? Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến giải thích và phần còn lại này không tương quanvới các biến giải thích khác trong mô hình Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt của riêng biến giải thích đó đến biến phụ thuộc

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Dependent Variable: HSGPA Method: Least Squares Included observations: 141

Dependent Variable: COLGPA Method: Least Squares Included observations: 141

Std. Error

t-Statistic

Prob.

Std. Error

t-Statistic

Prob.

Coefficient

Coefficient

0.471721 0.008705 0.022730 0.019407

8.040848 4.432224 -1.914419 -3.148103

0.0000 0.0000 0.0577 0.0020

3.056738 0.433794

0.029654 0.103668

103.0787 4.184439

0.0000 0.0001

Variable C ACT SKIPPED AGE

3.793037 0.038582 -0.043514 -0.061095

R-squared

0.194848 Mean dependent var

3.402128

Variable C VM

0.111875 Mean dependent var

3.056738

R-squared

• HSGPA = β0 + β1 ACT + β2 SKIPPED + β3 AGE + v

• Dùng lệnh Genr: vm=resid

13

14

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Lưu ý rằng R2luôn tăng khi thêm

biến độc lập vào hàm hồi quy

Giá trị ước lượng/Giá trị dự đoán

Phần dư

Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ Mức độ phù hợp của hàm SRF so với mẫu khảo sát Giá trị ước lượng (Fitted values) và phần dư Sự phân rã của tổng mức biến động 3.21 3.20 3.27 R bình phương (R2)

R2 bằng bình phương của hệ số tương quan giữa giá trị thực tế và giá trị ước lượng của biến phụ thuộc

3.28 Tính chất đại số của hồi quy OLS Các biểu diễn khác của R bình phương

Tổng phần dư bằng 0

Tương quan giữa biến độc lập xj và phần dư bằng 0

Trung bình mẫu của biến phụ thuộc và các biến độc lập nằm trên đường hồi quy

= ( r(y,y^)2 ) 3.29

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

4

Tính chất: 0  R2  1

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Số tháng bị giam trong năm 1986

Số quý làm việc trong năm 1986

Số lần bị bắt giữ trong năm 1986

Tỷ lệ số lần bắt giữ có dẫn đến bị buộc tội trước đó (không phải %)

Mức phạt trung bình của các lần phạm tội trước

R2 chỉ tăng nhẹ

Diễn giải:

Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt) Nếu thêm một biến giải thích khác avgsen vào mô hình:

Mức phạt trung bình của các lần phạm tội trước có làm tăng số lần bị bắt giữ (?)

Vai trò của biến giải thích mới thêm vào khá hạn chế khi R2 tăng rất ít

Lưu ý chung về R2

Diễn giải:

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Ngay cả khi R2 khá nhỏ (như trong ví dụ), hàm hồi quy vẫn có thể dùng để phân tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Tỷ lệ số lần bị bắt giữ trước đó tăng 0,5 lần thì dẫn đến số lần bị bắt giữ giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người) Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đó giảm 0,034*12 = 0,408 lần Số quý làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đó giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người)

Phân tích hồi quy bội: Vấn đề ước lượng

y = β0 + β1x1 + β2x2 + u y y

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Khaùi nieäm ña coäng tuyeán Xeùt moâ hình hoài quy boäi: x1

x2

x1 x2

Trong tổng thể, mối liên hệ giữa biến phụ thuộc y và các biến độc lập là tuyến tính theo tham số

3.3 Giá trị kỳ vọng của ước lượng OLS Các giả thiết của mô hình hồi quy bội: Giả thiết MLR.1 (Tuyến tính theo tham số)

Khoâng coù ÑCT ÑCT thaáp

3.31

Mẫu dữ liệu được chọn ngẫu nhiên từ tổng thể

y

x2

x1

Giả thiết MLR.2 (Mẫu ngẫu nhiên)

y x1

x2 x1

x2

Vì vậy, mỗi quan sát đều tuân theo hàm hồi quy tổng thể

ÑCT vöøa ÑCT cao ÑCT hoaøn haûo

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

20

https://sites.google.com/a/ueh.edu.vn/phamtricao/

5

3.32

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Cách tiếp cận đại số của vấn đề đa cộng tuyến:

Xét mô hình hồi quy bội với hai biến độc lập x1, x2:

y = β0+β1x1+ β2x2+u

 Nếu tồn tại các số thực 1, …, k không đồng thời bằng

* Nếu có đa cộng tuyến hoàn hảo, tồn tại ít nhất một i  0

1x1 + 2x2 + … + kxk = c

(i= 1, 2) và c sao cho:

1x1+2x2 = c

0 và “số thực” c sao cho: thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng tuyến hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến tính chính xác.

Giả sử 2 ≠ 0 

 Nếu tồn tại các số thực 1, ..., k không đồng thời bằng

 

' c 

 1  2

x 2

x 1

x  1

c  2

0 + 1x1 + 2x2 + … + k1xk1 + v = c

* Nếu có đa cộng tuyến không hoàn hảo, tồn tại ít nhất một i  0 (i= 1, 2) và c sao cho:

1x1+2x2+v = c (v là sai số ngẫu nhiên)

0 và “số thực” c sao cho: với v là sai số ngẫu nhiên thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng tuyến không hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến tính không chính xác.

Giả sử 2 ≠ 0 

v

 

' v c '  

x 2

x 1

x   1

 c 1 1    2 2 2

21

22

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Xét mô hình hồi quy bội với hai biến độc lập x1, x2:

y = β0+β1x1+ β2x2+u

Ví dụ: Ta có dữ liệu giả định của các biến sau:

Xét hệ số tương quan r = r(x1,x2), ta có: 0  |r|  1

• r = 0: x1, x2 không có đa cộng tuyến • r ≠ 0: x1, x2 có đa cộng tuyến

x1 10 15 18 24 30

x2 50 75 90 120 150

* x2 52 75 97 129 152

v 2 0 7 9 2

– |r| càng gần 1 thì mức độ ĐCT càng cao – |r| càng gần 0 thì mức độ ĐCT càng thấp – |r|=1: ĐCT hoàn hảo

x1, x2 có đa cộng tuyến hoàn hảo? x1, x2* có đa cộng tuyến hoàn hảo?

Lưu ý: Chỉ đúng cho mô hình có 2 biến độc lập.

23

24

https://sites.google.com/a/ueh.edu.vn/phamtricao/

6

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Phân tích hồi quy bội: Vấn đề ước lượng

Các giả thiết của mô hình hồi quy bội: (tt) Giả thiết MLR.3 (Không có cộng tuyến hoàn hảo)

* có đa cộng tuyến không hoàn hảo. * có đa cộng tuyến cao, gần

Ví dụ (tt): Ta có x2 = 5x1 nên x1 và x2 có đa cộng tuyến hoàn hảo. Ta thấy hệ số tương quan r(x1,x2) = 1. *= 5x1+v, nên x1 và x2 Ta có x2 Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2 hoàn hảo.

Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng số và không có phụ thuộc tuyến tính chính xác giữa các biến độc lập

Lưu ý về giả thiết MLR.3

Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn hảo giữa các biến độc lập; các tương quan không hoàn hảo vẫn có thể xảy ra

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

25

Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến độc lập khác thì biến độc lập đó là không cần thiết và sẽ bị loại bỏ ra khỏi hàm hồi quy Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn)

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Giá trị của các biến giải thích không chứa bất kỳ thông tin nào về giá trị trung bình của các yếu tố không quan sát được

Ví dụ về cộng tuyến hoàn hảo: trường hợp mẫu nhỏ Các giả thiết của mô hình hồi quy bội: (tt) Giả thiết MLR.4 (Trung bình có điều kiện bằng 0)

Trong mẫu nhỏ, biến avginc có thể vô tình là bội số của biến expend; khi đó không thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là như nhau

3.36

Hoặc shareA hoặc shareB sẽ bị loại ra khỏi mô hình vì có mối liên hệ tuyến tính chính xác giữa chúng: shareA + shareB = 1

Nếu avginc không được đưa vào mô hình, biến này sẽ nằm trong sai số; khi đó, khó có thể khẳng định rằng biến expend không có tương quan với sai số.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

7

Ví dụ về cộng tuyến hoàn hảo: mối liên hệ giữa các biến độc lập Trong mô hình hồi quy bội, giả thiết trung bình có điều kiện bằng 0 có nhiều khả năng được thỏa mãn hơn vì có ít yếu tố được gộp vào sai số ngẫu nhiênhơn so với hồi quy đơn. Ví dụ: Điểm kiểm tra trung bình

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Thảo luận về giả thiết trung bình có điều kiện bằng 0 Việc thêm biến không liên quan vào mô hình hồi quy

Mô hình đúng (chứa x1 và x2)

Mô hình ước lượng (x2 bị bỏ sót)

3.38 Các biến giải thích có tương quan với sai số được gọi là biến nội sinh; Sự nội sinh là trường hợp vi phạm giả thiết MLR.4 = 0 trong tổng thể Không có vấn đề gì vì Các biến giải thích không tương quan với sai số được gọi là biến ngoại sinh; MLR.4 được thỏa mãn nếu tất cả các biến giải thích là ngoại sinh Tuy nhiên, việc thêm biến không liên quan có thể làm tăng phương sai mẫu. Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả của hồi quy bội, và cho tính không chệch của ước lượng OLS Bỏ sót biến có liên quan: trường hợp đơn giản Định lý 3.1 (Tính không chệch của OLS) 3.40 3.37

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Tính không chệch là tính chất về trung bình của các mẫu; còn khi xét một mẫu cụ thể, ước lượng tính được từ mẫu đó có thể khác xa giá trị đúng.

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Giả sử x1 và x2 có tương quan và mối quan hệ giữa chúng là tuyến tính

Chệch do bỏ sót biến Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương

Cả hai đều có thể mang dấu dương

. t

Phần sai số

Suất sinh lợi giáo dục . . Kết quả hồi sẽ bị ước lượng cao hơn thực tế do quy cho thấy rằng người càng có nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết quả này có thể đúng một phần, nhưng cũng có thể là do người có trình độ học vấn càng cao thì nhìn chung năng lực cũng càng cao.

Đây là hệ số chặn ước lượng được khi y chỉ hồi quy theo x1

Đây là hệ số góc của x1 khi y chỉ hồi quy theo x1

3.42

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

8

Khi nào bỏ sót biến không gây ra sự chệchcho ước lượng? Kết luận: Tất cả các hệ số ước lượng được đều bị chệch Khi biến bỏ sót không liên quan hoặc không tương quan với các biến giải thích trong mô hình.

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Mô hình đúng (gồm x1, x2 và x3)

Mô hình ước lượng (x3 bị bỏ sót)

Giá trị của các biến giải thích không hàm chứa bất kỳ thông tin nào về phương sai của các yếu tố chưa quan sát được.

3.4 Phương sai của ước lượng OLS Tính chệch do bỏ sót biến: trường hợp tổng quát hơn Các giả thiết của mô hình hồi quy bội: (tt) Giả thiết MLR.5 (Phương sai thuần nhất) 3.49

Giả thiết này có thể sẽ khó kiểm chứng trong nhiều trường hợp

Không thể xác định rõ được chiều hướng của phần chệch Ví dụ: phương trình tiền lương

Tất cả các biến giải thích được ký hiệu chung dưới dạng vector

Phân tích như trường hợp đơn giản nếu một biến độc lập không tương quan với các biến độc lập khác Ví dụ: Bỏ sót biến abilitytrong phương trình hồi quy tiền lương Cách ký hiệu ngắn gọn

Nếu exper gần như không tương quan với educ và abil, thì chiều hướng của phần chệch do bỏ sót biến có thể được phân tích như trong trường hợp đơn giản chỉ có hai biến đã xét trước đó.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

với

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến):

1) Phương sai của sai số

Định lý 3.2 (Phương sai mẫu của các hệ số góc ước lượng OLS)

Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì có nhiều

“nhiễu“ hơn trong phương trình

Phương sai của sai số

Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác

Phương sai sai số không giảm khi kích thước mẫu tăng lên

2) Tổng biến động trong mẫu của biến giải thích

Tổng biến động trong mẫu của biến giải thích càng nhiều thì ước lượng thu được

R2 có được khi hồi quy biến độc lập xj theo tất cả các biến độc lập khác (hồi quy có hệ số chặn)

Tổng biến động trong mẫu của biến giải thích xj:

càng chính xác (more precise)

Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng

Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

9

Dưới các giả thiết từ MLR.1 đến MLR.5:

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Các chi phí khác

3) Mối quan hệ tuyến tính giữa các biến độc lập Một ví dụ về đa cộng tuyến

Các chi phí cho nguyên vật liệu dạy học

Chi phí cho giáo viên

Điểm trung bình bài thi chuẩn hóa của trường

R2 của phương trình này càng cao thì xj càng được giải thích nhiều hơn bởi các biến độc lập khác

Hồi quy theo tất cả các biến độc lập khác (có hệ số chặn)

Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực lớn sẽ chi tiêu lớn cho tất cả các khoản chi.

Rất khó để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise), chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể.

Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Phương sai mẫu của sẽ càng lớn khi càng được giải thích nhiều bởi các biến độc lập khác Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi là vấn đề đa cộng tuyến (nghĩa là . với một vài nào đó)

• Tập tin gpa1.wf1

Phân tích hồi quy bội: Vấn đề ước lượng

Dependent Variable: COLGPA Method: Least Squares Included observations: 141

Std. Error

t-Statistic

Prob.

Coefficient

0.902058 0.433794 0.014486 -0.080661 0.019904

0.650366 0.097088 0.010578 0.026173 0.022838

1.387001 4.468031 1.369538 -3.081854 0.871566

0.1677 0.0000 0.1731 0.0025 0.3850

Variable C HSGPA ACT SKIPPED AGE

0.237850 Mean dependent var

3.056738

R-squared Variance Inflation Factors Included observations: 141

Kinh nghiệm: nhân tử phóng đại phương sai không nên lớn hơn 10

VIF NA 1.242002 1.165185 1.045578 1.084732

Coefficient Uncentered Centered VIF Variance 548.3964 0.422975 142.6962 0.009426 85.81015 0.000112 2.074317 0.000685 296.0775 0.000522

Variable C HSGPA ACT SKIPPED AGE

Thảo luận về vấn đề đa cộng tuyến Trong các ví dụ trên, có thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào thành một yếu tố vì không thể tách biệt tác động của từng khoản chi Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm đa cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến) Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị “phóng đại“, ước lượng của các biến giải thích khác có thể không bị ảnh hưởng. Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3 Đa cộng tuyến có thể được phát hiện thông qua “nhân tử phóng đại phương sai“

VIF < 10 : các biến độc lập có đa cộng tuyến thấp

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

40

https://sites.google.com/a/ueh.edu.vn/phamtricao/

10

VIF > 10: có đa cộng tuyến cao ; VIF < 10: có đa cộng tuyến thấp

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG

Phân tích hồi quy bội: Vấn đề ước lượng

• Cách phát hiện đa cộng tuyến:

Phương sai trong mô hình bị định dạng sai

Mô hình đúng của tổng thể

• Dấu của hệ số hồi quy bị sai • Hệ số xác định R2 cao nhưng tỷ số |t| thấp • Hệ số tương quan cặp giữa các biến độc lập cao • Kiểm định sử dụng hồi quy phụ • Nhân tử phóng đại phương sai VIF Việc thêm hay không thêm một biến độc lập nào đó vào mô hình có thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính hiệu quả của ước lượng

Mô hình ước lượng 1

• Cách khắc phục đa cộng tuyến: 3.52

Mô hình ước lượng 2

p 3.53

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

41

• Sử dụng thông tin tiên nghiệm • Thu thập thêm số liệu hoặc lấy thêm mẫu mới • Kết hợp số liệu chéo và số liệu chuỗi thời gian • Bỏ bớt biến độc lập • Dùng sai phân cấp 1 • Thay đổi dạng hàm của biến Sự chệch do bỏ sót biến ở mô hình bị định dạng sai (mô hình 2) được bù đắp bằng phương sai nhỏ của ước lượng thu được

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Phương sai trong mô hình bị định dạng sai (tt.) Ước lượng phương sai của sai số

Xét điều kiện theo x1 và x2 , phương sai trong mô hình 2 luôn nhỏ hơn trong mô hình 1

3.54 3.56

Kết luận: Không thêm biến không liên quan vào mô hình

3.55

Ước lượng không chệch của phương sai sai số có thể tính được dựa trên việc xem xét bậc tự do của mô hình (df). Bậc tự do có được bằng cách lấy số quan sát trừ cho số tham số. Có n sai số bình phương nhưng các thành phần này không hoàn toàn độc lập mà liên quan với nhau thông qua k+1 phương trình xác định bởi điều kiện bậc nhấtcủa bài toán tìm cực tiểu.

Trường hợp 1:

Sự đánh đổi giữa tính chệch và tính hiệu quả Lưu ý: tính chệch không biến mất ngay cả khi xét mẫu lớn

df = n-(k+1) = số quan sát –số tham số cần ước lượng 3.57

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

11

Trường hợp 2: Định lý 3.3 (Ước lượng không chệch của phương sai sai số)

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge

09.12.2017

Phân tích hồi quy bội: Vấn đề ước lượng

Phân tích hồi quy bội: Vấn đề ước lượng

Độ lệch chuẩn đúng của ước lượng của

Thay cho phương sai chưa biết

Độ lệch chuẩn ước lượng của ước lượng của

Ước lượng phương sai mẫu của các ước lượng OLS 3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là không chệch Tuy nhiên, dưới các giả thiết này, cũng có nhiều ước lượng khác là không chệch Ước lượng không chệch nào có phương sai nhỏ nhất? Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc. 3.58

Mặc dù có thể có dạng hàm bất kỳ theo giá trị mẫu của tất cả các biến giải thích; ước lượng OLS luôn có thể đưa về dạng này

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Môøi gheù thaêm trang web:

48

3.60 Lưu ý rằng các công thức này chỉ đúng dưới các giả thiết từ MLR.1 đến MLR.5 (cụ thể là phải có giả thiết phương sai thuần nhất)

Phân tích hồi quy bội: Vấn đề ước lượng

 https://sites.google.com/a/ueh.edu.vn/phamtricao/  https://sites.google.com/site/phamtricao/

Định lý 3.4 (Định lý Gauss-Markov)

Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến tính không chệch tốtnhất (BLUE) của các hệ số hồi quy. “Tốt nhất“ nghĩa là “có phương sai nhỏ nhất“ :

với mọi sao cho.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/

12

OLS chỉ có thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ có ước lượng khác tốt hơn.