Chương 2: MÔ HÌNH HỒI QUY BỘI

Nguyễn Phương

Bộ môn Toán kinh tế Đại học Ngân hàng TPHCM Email: nguyenphuong0122@gmail.com

1

Ngày 13 tháng 12 năm 2022

NỘI DUNG

1 Sự cần thiết của mô hình hồi quy bội

2 Mô hình hồi quy bội và Phương pháp ước lượng OLS

3 Một số dạng của mô hình hồi quy

Mô hình và phương pháp OLS Các giả thiết Độ phù hợp của hàm hồi quy Tính tốt nhất của ước lượng OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận

4 Tính vững của ước lượng OLS

5 Mô hình hồi quy bội sử dụng ngôn ngữ ma trận

Mô hình dạng log-log Mô hình dạng bán loga Mô hình dạng đa thức

2

Mô hình và các giả thiết OLS Ước lượng OLS và ma trận hiệp phương sai

Sự cần thiết của mô hình hồi quy bội

3

➤ Một biến phụ thuộc Y thường chịu tác động của nhiều yếu tố. ➤ Mô hình hồi quy bội thường có chất lượng dự báo tốt hơn. ➤ Mô hình hồi quy bội cho phép sử dụng dạng hàm phong phú hơn. ➤ Mô hình hồi quy bội thực hiện các phân tích phong phú hơn.

Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình và phương pháp OLS

Hàm hồi quy tổng thể-PRF:

E(Y|X) = β1 + β2X2 + · · · + βkXk.

Mô hình hồi quy tổng thể-PRM:

i = 1; N;

hoặc:

Yi = β1 + β2X2i + · · · + βkXki + ui, Y = β1 + β2X2 + + · · · + βkXk + u.

β1 : hệ số chặn/hệ số tự do (intercept). βj, j = 2, k : hệ số hồi quy tương ứng của Xj của X. u : sai số ngẫu nhiên.

Câu hỏi: Ý nghĩa của các hệ số β1, β2, ..., βk.

ˆY = ˆβ1 + ˆβ2X2 + · · · + ˆβkXk.

i = 1; n;

Hàm hồi quy mẫu-SRF: Mô hình hồi quy mẫu-SRM: Yi = ˆβ1 + ˆβ2X2i + · · · + ˆβkXki + ei, hoặc:

Y = ˆβ1 + ˆβ2X2 + · · · + ˆβkXk + e.

trong đó ˆY là ước lượng cho Y; ˆβ1, ˆβ2, ..., ˆβk tương ứng là ước lượng cho β1, β2, ..., ˆβk; ei là phần dư, ước lượng cho ui.

Định nghĩa: Phương pháp OLS nhằm xác định các giá trị ˆβj, j = 1, 2, ..., k sao cho tổng bình phương các phần dư là nhỏ nhất.(Tương tự như mô hình 2 biến)

4

Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình và phương pháp OLS

Ví dụ 2.1

Sử dụng tập số liệu ch2vd5.wf1. Hãy ước lượng hàm hồi quy tuyến tính của CT theo TN và TS, trong đó CT là chi tiêu (triệu đồng/năm), TN là thu nhập từ lao động (triệu đồng/năm) và TS là giá trị tài sản (tỷ đồng) của hộ gia đình.

➤ (cid:98)β1 = 18, 8601 −→ với các hộ không có thu nhập và tài sản thì mức chi tiêu trung bình của họ vào khoảng 18,8601 triệu đồng/năm.

5

➤ (cid:98)β2 = 0, 7912 −→khi thu nhập hộ gia đình tăng 1 triệu đồng/năm và giá trị tài sản không thay đổi thì mức chi tiêu trung bình tăng khoảng 0,7912 triệu đồng/năm. ➤ (cid:98)β3 = 0, 0158 −→khi giá trị tài sản tăng 1 tỷ đồng và thu nhập hộ gia đình không thay đổi thì mức chi tiêu trung bình tăng khoảng 0,0158 triệu đồng/năm.

Mô hình hồi quy bội và Phương pháp ước lượng OLS Các giả thiết

Các giả thiết của mô hình

✓ Giả thiết 1: Mô hình được ước lượng trên cơ sở mẫu ngẫu nhiên kích thước n : {(Xi, Yi), i = 1, 2, ..., n}. ✓ Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i, ..., Xki) bằng 0, tức là E(ui|X2i, ..., Xki) = 0.

✓ Giả thiết 3: Phương sai của sai số ngẫu nhiên tại mỗi giá trị (X2i, ..., Xki) đều bằng nhau, tức là

6

var(u|X2i, ..., Xki) = σ2, ∀i. ✓ Giả thiết 4: Giữa các biến độc lập X2, X3, ..., Xk không có đa cộng tuyến.

Mô hình hồi quy bội và Phương pháp ước lượng OLS Độ phù hợp của hàm hồi quy

ESS = (cid:80)n

RSS = (cid:80)n

i=1(Yi − Y)2,

i=1( ˆYi − Y)2,

i=1 e2 i

TSS = (cid:80)n Nếu hàm hồi quy tuyến tính có chứa hệ số chặn thì:

TSS = ESS + RSS.

Hệ số xác định của mô hình hồi quy (tương ứng với mẫu):

.

R2 =

ESS TSS

= 1 − RSS TSS

Ý nghĩa:

R2 cho biết mức độ giải thích của các biến độc lập trong mô hình với sự biến động (quanh giá trị trung bình) của biến phụ thuộc. 1 − R2 cho biết phần biến động (quanh giá trị trung bình) của biến phụ thuộc gây ra bởi sai số hoặc các yếu tố chưa được đưa vào mô hình. R2 thể hiện tương quan tuyến tính giữa biến phụ thuộc với các biến độc lập.

Khi thêm biến mới vào mô hình sẽ làm gia tăng R2, nhưng có thể làm chất lượng của các ước lượng giảm −→ để xét xem có nên thêm biến mới vào mô hình không người ta dùng R2 2 hiệu chỉnh (adjusted r-square) kí hiệu R

:

2

.

R

= 1 − (1 − R2)

n − 1 n − k

7

Mô hình hồi quy bội và Phương pháp ước lượng OLS Tính tốt nhất của ước lượng OLS

Định lý Gauss - Markov

Khi các giả thiết 1-4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là các ước lượng tuyến tính,không chệch và có phương sai nhỏ nhất (BLUE).

Độ chính xác của ước lượng

ji

var((cid:98)βj) =

σ2 j ) (cid:80) x2 (1 − R2 j là hệ số xác định của mô hình hồi quy Xj theo các biến độc trong đó R2 lập còn lại và xji = Xji − Xj

n(cid:80) i=1 n − k (cid:115)

ji

ji

8

e2 i ˆσ2 = = (cid:115) = se((cid:98)βj) = RSS n − k ˆσ2 j ) (cid:80) x2 (1 − R2 RSS/(n − k) j ) (cid:80) x2 (1 − R2

Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận

i = 1, 2, .., n.

Xét mô hình k biến: Yi = β1 + β2X2i + ... + βkXki + ui, Đặt

· · · Xk1 · · · Xk2

.

, u =

, β =

, X =

Y =

















u1 u2 ... un

β1 β2 ... βn

1 X21 X31 1 X22 X32 ... 1 X2n X3n

Y1 Y2 ... Yn

· · · Xkn

Khi đó mô hình hồi quy tổng thể dưới dạng ma trận như sau:

Y = Xβ + U.

Từ mẫu quan sát ta có ước lượng cho Y và β như sau:

.

, ˆβ =

ˆY =









ˆY1 ˆY2 ... ˆYn

ˆβ1 ˆβ2 ... ˆβn

Ta có hàm hồi quy mẫu

ˆY = Xˆβ.

Véc tơ phần dư e = Y − ˆY = Y − Xˆβ. Phương pháp OLS đi tìm ˆβ sao cho eTe → min. Phương pháp này tìm được kết quả:

ˆβ = (XTX)−1XTY,

var(ˆβ) = σ2(XTX)−1.

9

Một số dạng của mô hình hồi quy Mô hình dạng log-log

Hàm sản xuất Cobb - Douglas: Q = aKβ2 Lβ3 trong đó Q, K, L lần lượt là sản lượng, vốn và lao động. −→ thêm yếu tố ngẫu nhiên: Q = aKβ2Lβ3eu Lấy logarit hai vế, ta được: ln Q = β1 + β2 ln K + β3 ln L + u

β2 2 X

β3 3

βk k

β2 2 X

β3 3

βk k eu.

. ...X ...X Giả sử lý thuyết cho rằng: Y = aX Khi thêm yếu tố ngẫu nhiên vào ta có: Y = aX Lấy logarit hai vế, ta được: ln Y = β1 + β2 ln X2 + β3 ln X3 + ... + βk ln Xk + u.

Ý nghĩa của hệ số βj :

−→ = βj = = βj ∂Y Y ∂Xj Xj ∂ ln Y ∂ ln Xj

10

∂Y/Y ∂Xj/Xj −→ nếu Xj tăng (giảm) 1% (các yếu tố khác trong mô hình không đổi) thì trung bình Y tăng (giảm) βj%. βj: hệ số co giãn của Y theo Xj −→ Sử dụng mô hình log-log dùng để mô tả các mối quan hệ có hệ số co giãn không đổi.

Ví dụ: Hàm cầu về thịt lợn: ln Q = 1, 5 − 0, 6 ln P + u −→ Hệ số co giãn của cầu về thịt lớn theo giá là -0,6 −→ khi giá thịt lớn tăng 1% thì cầu trung bình về thịt lớn giảm 0,6%. −→

Một số dạng của mô hình hồi quy Mô hình dạng bán loga

Mô hình log-lin có dạng

ln Y = β1 + β2X + u.

Ý nghĩa của β2 : Khi X2 tăng một đơn vị thì Y trung bình tăng β2 ∗ 100%.

Ví dụ: Giả sử quan hệ giữa thu nhập (TN) và trình độ học vấn (Ed, số năm học ở trường) như sau: ln TN = 2, 5 + 5, 6Edu + u

Mô hình lin-log có dạng

Y = β1 + β2 ln X + u

Ý nghĩa của β2 : Khi X2 tăng 1% thì Y trung bình tăng β2/100 đơn vị.

Ví dụ: Giả sử quan hệ giữa số giờ mà người lao động muốn làm (L) và mức trả cho một giờ lao động (TL): L = 7 + 0, 6 ln TL + u.

11

Sử dụng mô hình bán loga khi có lý thuyết kinh tế về mối quan hệ giữa các biến số kinh tế phù hợp.

Một số dạng của mô hình hồi quy Mô hình dạng đa thức

Mô hình dạng đa thức bậc 2 (dạng parabol) có dạng:

Y = β1 + β2X + β3X2 + u.

Sử dụng mô hình dạng đa thức bậc 2 khi biết mối quan hệ cận biên của Y theo X : ví dụ quy luật cận biên giảm dần của năng suất lao động theo tuổi, năng suất biên giảm dần theo thời gian của lao động

Cho

= β2 + 2β3X = 0 ∂E(Y|X) ∂X

12

để ước lượng điểm ngưỡng của sự thay đổi Y theo X.

Tính vững của ước lượng OLS

Định lý 4.1

Khi các giả thiết 1-4 thỏa mãn thì các ước lượng OLS không chỉ là các ước lượng không chệch mà còn là ước lượng vững.

Định lý 4.2

13

Khi các giả thiết 1,3,4 thỏa mãn và a) cov(Xj, u) = 0 với j = 2, 3, . . . , k b) E(u) = 0 thì ước lượng OLS vẫn là ước lượng vững.

Mô hình hồi quy bội sử dụng ngôn ngữ ma trận Mô hình và các giả thiết OLS

Xét mô hình k biến:

Y = β1 + β2X2 + · · · + βkXk + u

Khi đó, với mẫu ngẫu nhiên kích cỡ n, có thể biểu diễn:

  Y1 = β1 + β2X21 + · · · + βkXk1 + u1 Y2 = β1 + β2X22 + · · · + βkXk2 + u2 . . . Yn = β1 + β2X2n + · · · + βkXkn + un

Hệ phương trình này có thể biểu diễn dưới dạng ma trận: Y = Xβ + u

       

, β = , u = Y = , X =

14

        β1 β2 ... βk u1 u2 ... un 1 X21 X31 1 X22 X32 ... ... ... 1 X2n X3n . . . Xk1 . . . Xk2 ... . . . . . . Xkn Y1 Y2 ... Yn

Mô hình hồi quy bội sử dụng ngôn ngữ ma trận Mô hình và các giả thiết OLS

Các giả thiết của phương pháp OLS:

Giả thiết 1: Việc ước lượng dựa trên cơ sở mẫu ngẫu nhiên (X, Y).

Giả thiết 2: E (u|X) = 0n×1

Giả thiết 3: E (uu′|X) = σ2In trong đó

   

uu′ = , E (uu′) = u2 1 u2u1 ... E(u2 1) E(u2u1) ... E(u1u2) E(u2 2) ...     . . . E(u1un) . . . E(u2un) . . . . . . u1u2 u2 2 ... unu1 unu2 E(unu1) E(unu2) . . . u1un . . . u2un ... . . . . . . u2 n ... E(u2 n)

 

E (uu′|X) = σ2In =

  . . . 0 . . . 0 ... . . . . . . σ2 σ2 0 ... 0 0 σ2 ... 0

15

Giả thiết này thực chất là giả thiết phương sai của sai số không đổi.

Mô hình hồi quy bội sử dụng ngôn ngữ ma trận Mô hình và các giả thiết OLS

−1

16

Giả thiết 4: Tồn tại ma trận nghịch đảo (X′X) Giả thiết này cho rằng giữa các biến độc lập không có quan hệ đa cộng tuyến hoàn hảo và không có biến nào là hằng số trong tập dữ liệu.

Mô hình hồi quy bội sử dụng ngôn ngữ ma trận Ước lượng OLS và ma trận hiệp phương sai

Phương pháp OLS: Hàm hồi quy mẫu: ˆY = Xˆβ

   

, ˆβ = Y =

    ˆY1 ˆY2 ... ˆYn ˆβ1 ˆβ2 ... ˆβk

i = e′e = e2

(cid:17)′ (cid:16) (cid:16) (cid:17) Y − Xˆβ Y − Xˆβ = Y′Y − 2ˆβX′Y − ˆβ′X′Xˆβ

với phần dư: e = Y − ˆY = Y − Xˆβ Khi đó, n(cid:80) i=1 Từ điều kiện cực tiểu, ta được:

−1X′Y

−1

ˆβ = (X′X)

17

(cid:17) (cid:16)ˆβ = σ2(X′X) var