Chương 2: MÔ HÌNH HỒI QUY BỘI
Th.S NGUYỄN PHƯƠNG
Bộ môn Toán kinh tế Trường Đại học Ngân hàng TPHCM Blog: https://nguyenphuongblog.wordpress.com Email: nguyenphuong0122@gmail.com
1
Ngày 18 tháng 9 năm 2015
NỘI DUNG
1 Sự cần thiết của mô hình hồi quy bội 2 Mô hình hồi quy bội và Phương pháp ước lượng OLS
3 Tính vững của ước lượng OLS 4 Khoảng tin cậy cho hệ số hồi quy
Mô hình và phương pháp OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận Các giả thiết Độ phù hợp của hàm hồi quy Tính tốt nhất của ước lượng OLS
5 Kiểm định giả thuyết về hệ số hồi quy
Quy luật phân phối xác suất của một số thống kê mẫu Khoảng tin cậy cho một hệ số hồi quy Khoảng tin cậy cho biểu thức của hai hệ số hồi quy Khoảng tin cậy cho phương sai sai số ngẫu nhiên
2
6 Dự báo giá trị của biến phụ thuộc
Kiểm định giả thuyết về một hệ số hồi quy Kiểm định về một ràng buộc giữa các hệ số hồi quy Kiểm định về nhiều ràng buộc -kiểm định F Kiểm định sự phù hợp của hàm hồi quy
Sự cần thiết của mô hình hồi quy bội
(cid:228) Một biến phụ thuộc Y thường chịu tác động của nhiều yếu tố. (cid:228) Mô hình hồi quy bội thường có chất lượng dự báo tốt hơn. (cid:228) Mô hình hồi quy bội cho phép sử dụng dạng hàm phong phú hơn. (cid:228) Mô hình hồi quy bội thực hiện các phân tích phong phú hơn.
3
Ví dụ: Ngoài thu nhập, thì có nhiều yếu tố khác cũng tác động lên tiêu dùng, chẳng hạn như độ tuổi, giới tính, nghề nghiệp, địa bàn sinh sống, vật giá, thói quen chi tiêu, . . .
Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình và phương pháp OLS
Hàm hồi quy tổng thể-PRF: E(Y|X) = β1 + β2X2 + · · · + βkXk.
Mô hình hồi quy tổng thể-PRM:
hoặc: Yi = β1 + β2X2i + · · · + βkXki + ui, i = 1; N; Y = β1 + β2X2 + + · · · + βkXk + u.
β1 : hệ số chặn/hệ số tự do (intercept). βj, j = 2, k : hệ số góc hay hệ số hồi quy riêng. u : sai số ngẫu nhiên.
Câu hỏi: Ý nghĩa của các hệ số β1, β2, ..., βk.
∆E(Y|X) = β2∆X2 + · · · + βk∆Xk.
Ví dụ 2.1
Mô hình hồi quy tổng thể về lạm phát:
LP = 0, 02 + 0, 3m − 0, 15gdp + u
4
trong đó LP, m và gdp lần lượt là tỷ lệ lạm phát, mức tăng trưởng cung tiền và mức tăng trưởng GDP (đơn vị %). Hãy giải thích ý nghĩa của các hệ số.
Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình và phương pháp OLS
ˆY = ˆβ1 + ˆβ2X2 + · · · + ˆβkXk.
i = 1; n;
Hàm hồi quy mẫu-SRF: Mô hình hồi quy mẫu-SRM: Yi = ˆβ1 + ˆβ2X2i + · · · + ˆβkXki + ei, hoặc: Y = ˆβ1 + ˆβ2X2 + · · · + ˆβkXk + e.
trong đó ˆY là ước lượng cho E(Y|X); ˆβ1, ˆβ2, ..., βk tương ứng là ước lượng cho β1, β2, ..., ˆβk; ei là phần dư, ước lượng cho ui.
∆ ˆY = ˆβ2∆X2 + · · · + ˆβk∆Xk.
Ví dụ 2.2
Ước lượng hàm hồi quy tuyến tính của doanh số bán hàng (Y, đv: triệu đồng) theo chi phí chào hàng (X2, triệu đồng) và chi phí quảng cáo (X3, triệu đồng), ta được: ˆY = 328, 1383 + 4, 6495X2 + 2, 5602X3 Nêu ý nghĩa của các hệ số hồi quy.
Định nghĩa: Phương pháp OLS nhằm xác định các giá trị ˆβj, j = 1, 2, ..., k sao cho tổng bình phương các phần dư là nhỏ nhất.(Tương tự như mô hình 2 biến) 5
Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận
i = 1, 2, .., n. Xét mô hình k biến: Yi = β1 + β2X2i + ... + βkXki + ui, Đặt
· · · Xk1 · · · Xk2 . , X = , β = , u = Y =
1 X21 X31 1 X22 X32 ... 1 X2n X3n · · · Xkn β1 β2 ... βn u1 u2 ... un Y1 Y2 ... Yn
Khi đó mô hình hồi quy tổng thể dưới dạng ma trận như sau:
Y = Xβ + u.
Từ mẫu quan sát ta có ước lượng cho Y và β như sau:
. ˆY = , ˆβ =
ˆY1 ˆY2 ... ˆYn ˆβ1 ˆβ2 ... ˆβn
Ta có hàm hồi quy mẫu ˆY = Xˆβ.
6
Véc tơ phần dư e = Y − ˆY = Y − Xˆβ.
Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận
Phương pháp OLS đi tìm ˆβ sao cho eTe → min. Áp dụng phương pháp này tìm được kết quả:
= (XTX)−1XTY ˆβ =
ˆβ1 ˆβ2 ... ˆβk
= σ2(XTX)−1. cov(ˆβ) =
. . . . . . . . . . . . var(ˆβ1) cov(ˆβ2, ˆβ1) ... cov(ˆβk, ˆβ1) cov(ˆβ1, ˆβ2) var(ˆβ2) ... cov(ˆβk, ˆβ2) cov(ˆβ1, ˆβk) cov(ˆβ2, ˆβk) ... var(ˆβk)
n
1 + e2 e2
Ước lượng của phương sai sai số ngẫu nhiên σ2
2 + · · · + e2 n − k
7
ˆσ2 =
Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận
Ví dụ 2.3
(a) Kết quả hồi quy
(b) Ma trận hiệp phương sai
8
Sử dụng tập số liệu ch2vd5.wf1. Hãy ước lượng hàm hồi quy tuyến tính của CT theo TN và TS, trong đó CT là chi tiêu (triệu đồng/năm), TN là thu nhập từ lao động (triệu đồng/năm) và TS là giá trị tài sản (tỷ đồng) của hộ gia đình.
Mô hình hồi quy bội và Phương pháp ước lượng OLS Mô hình hồi quy sử dụng ngôn ngữ ma trận
(cid:228) (cid:98)β1 = 18, 8601 −→ với các hộ không có thu nhập và tài sản thì mức chi tiêu trung bình của họ vào khoảng 18,8601 triệu đồng/năm.
(cid:228) (cid:98)β2 = 0, 7912 −→khi thu nhập hộ gia đình tăng 1 triệu đồng/năm và giá trị tài sản không thay đổi thì mức chi tiêu trung bình tăng khoảng 0,7912 triệu đồng/năm.
9
(cid:228) (cid:98)β3 = 0, 0158 −→khi giá trị tài sản tăng 1 tỷ đồng và thu nhập hộ gia đình không thay đổi thì mức chi tiêu trung bình tăng khoảng 0,0158 triệu đồng/năm.
Mô hình hồi quy bội và Phương pháp ước lượng OLS Các giả thiết
Các giả thiết của mô hình
(cid:51) Giả thiết 1: Mô hình được ước lượng trên cơ sở mẫu ngẫu nhiên kích thước n : {(Xi, Yi), i = 1, 2, ..., n}. (cid:51) Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i, ..., Xki) bằng 0, tức là E(ui) = E(u|X2i, ..., Xki) = 0.
(cid:51) Giả thiết 3: Phương sai của sai số ngẫu nhiên tại mỗi giá trị (X2i, ..., Xki) đều bằng nhau, tức là
10
var(u|X2i, ..., Xki) = σ2, ∀i. (cid:51) Giả thiết 4: Giữa các biến độc lập X2, X3, ..., Xk không có đa cộng tuyến.
Mô hình hồi quy bội và Phương pháp ước lượng OLS Độ phù hợp của hàm hồi quy
ESS = (cid:80)n
RSS = (cid:80)n
i=1(Yi − Y)2,
i=1( ˆYi − Y)2,
i=1 e2 i
TSS = (cid:80)n Nếu hàm hồi quy tuyến tính có chứa hệ số chặn thì:
TSS = ESS + RSS.
Hệ số xác định của mô hình hồi quy (tương ứng với mẫu):
.
R2 =
ESS TSS
= 1 − RSS TSS
Ý nghĩa:
R2 cho biết phần trăm sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình. R2 thể hiện tương quan tuyến tính giữa biến phụ thuộc với các biến độc lập.
2
Khi thêm biến mới vào mô hình sẽ làm gia tăng R2, nhưng có thể làm chất lượng của các ước lượng giảm −→ để xét xem có nên thêm biến mới vào mô hình không người ta dùng R2 hiệu chỉnh (adjusted r-square), kí hiệu là R :
2
.
R
= 1 − (1 − R2)
n − 1 n − k
11
Mô hình hồi quy bội và Phương pháp ước lượng OLS Tính tốt nhất của ước lượng OLS
Định lý 2.1 (Định lý Gauss - Markov)
Khi các giả thiết 1-4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là các ước lượng tuyến tính,không chệch và có phương sai nhỏ nhất (BLUE).
Độ chính xác của ước lượng
ji
var((cid:98)βj) =
σ2 j ) (cid:80) x2 (1 − R2 j là hệ số xác định của mô hình hồi quy Xj theo các biến độc trong đó R2 lập còn lại và xji = Xji − Xj
n(cid:80) i=1 n − k (cid:115)
ji
ji
12
e2 i ˆσ2 = = (cid:115) = se((cid:98)βj) = RSS n − k ˆσ2 j ) (cid:80) x2 (1 − R2 RSS/(n − k) j ) (cid:80) x2 (1 − R2
Tính vững của ước lượng OLS
Định lý 3.1
Khi các giả thiết 1-4 thỏa mãn thì các ước lượng OLS không chỉ là các ước lượng vững mà còn là ước lượng vững.
Định lý 3.2
13
Khi các giả thiết 1,3,4 thỏa mãn và a) cov(Xj, u) = 0 với j = 2, 3, . . . , k b) E(u) = 0 thì ước lượng OLS vẫn là ước lượng vững.
Khoảng tin cậy cho hệ số hồi quy Quy luật phân phối xác suất của một số thống kê mẫu
Giả thiết 5: Các sai số ngẫu nhiên có phân phối chuẩn:
ui ∼ N(0, σ2).
Định lý 4.1
Khi các giả thiết 1 - 5 thỏa mãn, ta có:
a) t = ∼ t(n − k)
b) t = ∼ t(n − k) (cid:98)βj − βj se((cid:98)βj) (aˆβj + bˆβs) − (aβj + bβs) se(aˆβj + bˆβs)
14
c) ∼ χ2(n − k) (n − k)ˆσ2 σ2
Khoảng tin cậy cho hệ số hồi quy Khoảng tin cậy cho một hệ số hồi quy
Xét mô hình hồi quy
Y = β1 + β2X2 + ... + βkXk + u
Khoảng tin cậy của βj
Khoảng tin cậy đối xứng
; (cid:17) (cid:16)ˆβj − tα/2(n − k)se(ˆβj); ˆβj + tα/2(n − k)se(ˆβj)
Khoảng tin cậy bên phải (dùng để ước lượng tối thiểu cho βj) (cid:17) ; (cid:16)ˆβj − tα(n − k)se(ˆβj); +∞
Khoảng tin cậy bên trái (dùng để ước lượng tối đa cho βj) (cid:16) (cid:17) ; −∞; ˆβj + tα(n − k)se(ˆβj)
trong đó tα(n) là giá trị tới hạn Student bậc n mức α.
15
Ý nghĩa: Khoảng tin cậy (1 − α) ∗ 100% cho hệ số góc βj (j = 1, 2, ..., k) cho biết khi biến Xj tăng 1 đơn vị và các biến khác trong mô hình không đổi thì giá trị trung bình của biến phụ thuộc thay đổi trong khoảng nào.
Khoảng tin cậy cho hệ số hồi quy Khoảng tin cậy cho một hệ số hồi quy
Ví dụ 4.1
Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1. Ước lượng hàm hồi quy tuyến tính của CT (chi tiêu, triệu đồng/năm) theo TN (thu nhập từ lao động, triệu đồng/năm) và TS (giá trị tài sản, tỷ đồng), ta được:
16
Hãy ước lượng khoảng tin cậy 95% của β2 và β3.
Khoảng tin cậy cho hệ số hồi quy Khoảng tin cậy cho biểu thức của hai hệ số hồi quy
Xét mô hình hồi quy: Y = β1 + β2X2 + ... + βkXk + u.
Khoảng tin cậy cho biểu thức của hai hệ số hồi quy: đánh giá tác động của hai biến độc lập cùng thay đổi
Với a và b là các giá trị bất kỳ (có thể dương hoặc âm), thì khoảng tin cậy của cho mức gia tăng trung bình của biến Y khi X2 tăng a đơn vị và X3 tăng b đơn vị được tính bởi công thức
(cid:16) ; (cid:17) (aˆβ2 + bˆβ3) − tα/2(n − k)se(aˆβ2 + bˆβ3); aˆβ2 + bˆβ3 + tα/2(n − k)se(aˆβ2 + bˆβ3)
trong đó sai số chuẩn
(cid:113) a2var(ˆβ2) + b2var(ˆβ3) + 2abcov(ˆβ2, ˆβ3). se(aˆβ2 + bˆβ3) =
Ví dụ 4.2
17
Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1. Sau khi ước lượng xong, đặt tình huống giá trị tài sản gia tăng thêm 1 tỷ nhưng thu nhập từ lao động giảm 1 triệu, khi đó ảnh hưởng lên mức chi tiêu sẽ có thể nhận giá trị trong khoảng nào? biết rằng cov(ˆβ2, ˆβ3) = 0, 00001.
Khoảng tin cậy cho hệ số hồi quy Khoảng tin cậy cho biểu thức của hai hệ số hồi quy
Ví dụ 4.3
Để đánh giá hiệu quả của đầu tư từ các khu vực kinh tế lên tổng sản phẩm quốc nội, người ta sử dụng mô hình hồi quy sau:
GDP = β1 + β2FDI + β3PI + u
trong đó GDP, FDI và DI lần lượt là tổng sản phẩm quốc nội, đầu tư trực tiếp nước ngoài và đầu tư nội địa (đv; tỷ $). Sử dụng 30 quan sát thu được kết quả ước lượng sau:
(0, 04)
GDP = 80 + 0, 4FDI + 0, 35DI + e (2, 5) (0, 05) se cov(ˆβ2, ˆβ3) = 0, 001
18
Trong khủng hoảng tài chính, nếu FDI giảm đi 1 tỷ $ và chính sách kích thích của chính phủ giúp đầu tư nội địa tăng 1 tỷ $ thì liệu GDP thay đổi trong khoảng nào?
Khoảng tin cậy cho hệ số hồi quy Khoảng tin cậy cho phương sai sai số ngẫu nhiên
Khoảng tin cậy cho phương sai của sai số ngẫu nhiên
≤ σ2 ≤ (n − k)ˆσ2 χ2 α/2(n − k) (n − k)ˆσ2 χ2 1−α/2(n − k)
trong đó ˆσ2 là sai số chuẩn của hồi quy -S.E. of regression.
19
Ví dụ 4.4 Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1. Hãy ước lượng σ2 với độ tin cậy 95%.
Kiểm định giả thuyết về hệ số hồi quy Kiểm định giả thuyết về một hệ số hồi quy
Kiểm định cặp giả thuyết H0 : βj = 0 và H1 : βj (cid:44) 0 với mức ý nghĩa α.
(cid:17)
Cách 1: Dùng khoảng tin cậy đối xứng của βj với độ tin cậy (1 − α) : ;
(cid:16)ˆβj − se(ˆβj)tα/2(n − k); ˆβj + se(ˆβj)tα/2(n − k)
Bước 1: Tính KTC của Bước 2: - Nếu β2 = 0 thuộc KTC thì chấp nhận H0. - Nếu β2 = 0 không thuộc KTC thì không chấp nhận H0.
Bước 1: Tính t =
Cách 2: Dùng thống kê T ˆβj se(ˆβj)
Bước 2: Tra bảng tα/2(n − k) Bước 3: - Nếu |t| ≤ tα/2(n − k) thì chấp nhận H0 - Nếu |t| > tα/2(n − k) thì không chấp nhận H0
Bước 1: Tính t =
;
Cách 3: Dùng p − value ˆβj se(ˆβj)
Bước 2: Tính p − value = P (|T| ≥ |t|) Bước 3: - Nếu p − value ≥ α thì chấp nhận H0 - Nếu p − value < α thì không chấp nhận H0
20
Kiểm định giả thuyết về hệ số hồi quy Kiểm định giả thuyết về một hệ số hồi quy
j với mức ý nghĩa α.
Bài toán: Kiểm định giả thuyết H0 : βj = β∗
t = ˆβj − β∗ se(ˆβj)
Bác bỏ H0
Loại giả thuyết Hai phía Bên trái Bên phải p − value |t| > tα/2(n − k) P (|T| ≥ |t|) P (T < t) t < −tα(n − k) P (T > t) t > tα(n − k) H0 βj = β∗ βj ≥ β∗ βj ≤ β∗ H1 βj (cid:44) β∗ βj < β∗ βj > β∗
Ví dụ 5.1
21
Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1. Hãy kiểm định giả thuyết “ khi thu nhập tăng thêm 1 triệu đồng/năm thì chi tiêu trung bình tăng lên 0,8 triệu đồng/năm” với mức ý nghĩa 5%.
Kiểm định giả thuyết về hệ số hồi quy Kiểm định về một ràng buộc giữa các hệ số hồi quy
Bài toán: Kiểm định giả thuyết H0 : aβj + bβs = a∗ với mức ý nghĩa α, trong đó a, b, a∗ là những hằng số cho trước.
Bước 1: Tính t = ; (aˆβj + bˆβs) − a∗ se(aˆβj + bˆβs)
Bước 2: Tra bảng giá trị tới hạn Student tα/2(n − k) hoặc tα(n − k) tùy thuộc giả thuyết đối H1. Bước 3: Kết luận dựa vào bảng sau
Bác bỏ H0
22
Loại giả thuyết Hai phía Bên trái Bên phải p − value |t| > tα/2(n − k) P (|T| ≥ |t|) P (T < t) t < −tα(n − k) P (T > t) t > tα(n − k) H0 aβj + bβs = a∗ aβj + bβs ≥ a∗ aβj + bβs ≤ a∗ H1 aβj + bβs (cid:44) a∗ aβj + bβs < a∗ aβj + bβs > a∗
Kiểm định giả thuyết về hệ số hồi quy Kiểm định về một ràng buộc giữa các hệ số hồi quy
Ví dụ 5.2
Để xem xét mối quan hệ giữa các yếu tố đầu vào với sản xuất trong các nhà máy dệt kim, người ta chạy mô hình hồi quy với số liệu từ 30 nhà máy và thu được kết quả:
(0, 2)
Q = 150 + 0, 5K + 0, 7L + e se (1, 2) (0, 1) cov(ˆβ2, ˆβ3) = 0, 017
23
trong đó Q (đv:100 chiếc) là số áo sản xuất được, K (máy) là số máy dệt, L (đv:10 người) là số lao động. Giả sử rằng chi phí để thuê 10 lao động cũng bằng chi phí thuê 1 máy dệt. Với mức ý nghĩa 5%, có thể cho rằng tiền chi cho lao động hiệu quả hơn tiền chi cho máy dệt hay không?
Kiểm định giả thuyết về hệ số hồi quy Kiểm định về nhiều ràng buộc -kiểm định F
Xét mô hình hồi quy: Y = β1 + β2X2 + β3X3 + ... + βkXk + u.
Thí dụ: Kiểm định cặp giả thuyết
2 + β2
3
(cid:44) 0. H0 : β2 = 0, β3 = 0; H1 : β2
F = = (R2 U (1 − R2 (RSSR − RSSU) /m RSSU/(n − kU) Bước 1: Thiết lập cặp giả thuyết thống kê Bước 2: - Ước lượng: Y = β1 + β2X2 + β3X3 + ... + βkXk + u (mô hình U) thu được RSSU. - Ước lượng: Y = β1 + β4X4 + ... + βkXk + v (mô hình R) thu được RSSR. Bước 3: Tính giá trị quan sát của thống kê kiểm định R)/m − R2 U)/(n − kU)
24
trong đó m là số ràng buộc trong giả thuyết H0, kU là số hệ số hồi quy trong mô hình không ràng buộc U. Bước 4: - Nếu F > fα(m, n − k) thì bác bỏ H0. - Nếu F < fα(m, n − k) thì chưa có cơ sở để bác bỏ H0.
Kiểm định giả thuyết về hệ số hồi quy Kiểm định về nhiều ràng buộc -kiểm định F
Ví dụ 5.3
Xét mô hình hồi quy về tiền lương như sau:
wage = β1 + β2Edu + β3Medu + β4Ssibs + u
trong đó Wage, Edu, Meduc và Ssibs lần lượt là tiền lương, trình độ học vấn, trình độ học vấn của người mẹ và số anh chị em trong gia đình của người lao động. Với bộ số liệu file ch3vd9.wf1 ta có kết quả hồi quy như sau:
wage = 2404 + 86, 12Edu − 14, 88Medu − 30, 25Ssibs + e se (39, 18) (19, 61) (454) (36, 78) RSS = 3649563; n = 32
25
Hãy kiểm định giả thuyết: các yếu tố “học vấn người mẹ” và “số anh chị em đồng thời trong gia đình” đồng thời không ảnh hưởng đến tiền lương của người lao động.
Kiểm định giả thuyết về hệ số hồi quy Kiểm định về nhiều ràng buộc -kiểm định F
Ví dụ 5.4
Sử dụng số liệu ch2vd5.wf1, ta có hàm hồi quy ước lượng sau:
(0, 035) (0, 193) (2, 191)
CT = 28, 942 + 0, 728TN + 0, 022TS + 5, 125CK − 0, 072TNP + e, (0, 017) (12, 696) se R2 = 0, 999622; n = 33
trong đó CT, TN, TS, CK, TNP lần lượt là chi tiêu, thu nhập từ lao động, giá trị tài sản, thu nhập từ chứng khoán và thu nhập phụ khác trong năm. Hãy kiểm định giả thuyết cho rằng: “các biến TS, CK và TNP đều cùng không tác động đến CT”. Biết rằng ước lượng mô hình tuyến tính CT theo TN, ta được:
(0, 004) (7, 860)
26
CT = 42, 733 + 0, 853TN + e, se R2 = 0, 999306; n = 33
Kiểm định giả thuyết về hệ số hồi quy Kiểm định sự phù hợp của hàm hồi quy
Bài toán: Kiểm định sự phù hợp của hàm hồi quy với mức ý nghĩa α.
Kiểm định cặp giả thuyết
(Hàm hồi quy không phù hợp)
(Hàm hồi quy phù hợp) H0 : R2 = 0 H1 : R2 (cid:44) 0
Tiêu chuẩn thống kê
. = Fqs = ESS/(k − 1) RSS/(n − k) R2/(k − 1) (1 − R2)/(n − k)
Nếu Fqs > fα(k − 1; n − k) thì bác bỏ H0, kết luận hàm hồi quy là phù hợp.
Ví dụ 5.5
27
Tiếp tục ví dụ 5.3. Hãy kiểm định sự phù hợp của mô hình với mức ý nghĩa 5%.
Dự báo giá trị của biến phụ thuộc
Khoảng tin cậy (1 − α) cho giá trị trung bình của biến phụ thuộc Y khi X = X0 là:
; (cid:17) (cid:16) ˆY0 − t(n − k)α/2se( ˆY0); ˆY0 + t(n − k)α/2se( ˆY0)
trong đó
0 (XTX)−1X0.
ˆβ là ước lượng điểm cho E(Y|X0); ˆY0 = XT 0 (cid:113) XT se( ˆY0) = ˆσ
(cid:17) ; Khoảng tin cậy (1 − α) cho giá trị riêng biệt của biến phụ thuộc Y khi X = X0 là: (cid:16) ˆY0 − t(n − k)α/2se(Y0 − ˆY0); ˆY0 + t(n − k)α/2se(Y0 − ˆY0)
trong đó
0 (XTX)−1X0.
28
ˆβ là ước lượng điểm cho Y0; ˆY0 = XT 0 (cid:113) 1 + XT se(Y0 − ˆY0) = ˆσ

