Bài 4: Suy diễn từ mô hình hồi quy
TXTOKT04_Bài 4_v1.0015108207 67
BÀI 4 SUY DIỄN TỪ MÔ HÌNH HỒI QUY
Hướng dẫn học
Đây bài học thứ của môn học, tên gọi của “Suy diễn từ hình hồi quy”, vậy
suy diễn từ hình hồi quy nghĩa như thế nào? Ta xét dụ: chi tiêu (CT) của hộ gia
đình phụ thuộc vào thu nhập (TN) của hộ và số người (SN) trong hộ với mô hình hồi quy
tổng thể sau:
CT = β1 + β2TN + β3SN + u
Trong đó: Biến phụ thuộc CT là chi tiêu của hộ gia đình, biến độc lập TN là thu nhập của
hộ gia đình, biến độc lập SN là số người trong hộ.
Với mẫu:
Wn = {(CT1, TN1, SN1), (CT2, TN2, SN2),…, (CTn, TNn, SNn)}
Ta tìm được mô hình hồi quy mẫu:
eSNTNCT
321
ước lượng của hình hồi quy tổng thể (xem lại bài 3 đã học). Tuy nhiên các hệ số
hồi quy 123
ˆˆˆ
,,

trong hình hồi quy mẫu lần lượt các ước lượng đim ca β1, β2,
β3 trong hình hồi quy tổng thể, tức ta dùng 123
ˆˆˆ
,,

để suy diễn cho β1, β2, β3
theo nghĩa lấy 123
ˆˆˆ
,,

thay cho β1, β2, β3. Tuy nhiên trong thực tế bên cạnh việc dùng
ước lượng điểm ta còn muốn đánh giá được sai số thì cần ước lượng khoảng hay ước
lượng bng khong tin cy. Xuất phát từ các hệ số 123
ˆˆˆ
,,

của hình hồi quy mẫu ta
xây dựng một khoảng chứa các tham số β1, β2, β3 của hình hồi quy tổng thể với một
độ tin cậy cho trước. Đối với bài toán kiểm định giả thuyết, ta chưa tổng thể nên ta
chưa biết β1, β2, β3 tuy nhiên ta thể giả định các tham số này thể nhận một gtrị
cho trước hay không? Để trả lời câu hỏi này ta cần đến kiến thức nội dung thứ 2 của
bài này. Nội dung thứ 3 của bài này là kiểm định sự phù hợp của hàm hồi quy. Ta xét mô
hình hồi quy 3 biến.
CT = β1 + β2TN + β3SN + u
N
ếu cả hai biến độc lập trong hình TN SN không giải thích được cho sự biến
động của biến phụ thuộc CT, khi ấy ta nói hình hồi quy không phù hợp. Ngược lại
nếu ít nhất một biến độc lập TN hay SN giải thích cho sự biến động của biến phụ
thuộc CT, khi ấy ta nói mô hình hồi quy phù hợp.
Bài này trình bày thuyết áp dụng thuyết thực hành làm bài tập tương ứng với ba
nội dung bản của bài toán suy diễn thống kê: Đó là (1) Bài toán xây dựng khoảng tin
cậy cho các hệ số hồi quy và (2) Bài toán kiểm định giả thuyết thống kê về các hệ số hồi
quy và (3) Bài toán kiểm định sự phù hợp của mô hình hồi quy.
Bài 4: Suy diễn từ mô hình hồi quy
68 TXTOKT04_Bài 4_v1.0015108207
Để học tốt bài này sinh viên cần thực hiện:
Học đúng lịch trình của môn học theo tuần, đọc kĩ các khái niệm.
Theo dõi các ví dụ và tính toán lại các kết quả.
Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế
lượng, NXB Đại học Kinh tế quốc dân.
Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên.
Tham khảo các thông tin từ trang Web của môn học.
Nội dung:
Quy luật phân phối xác suất của một số thống kê mẫu;
Xây dựng khoảng tin cậy cho các hệ số hồi quy;
Kiểm định giả thuyết về các hệ số hồi quy;
Kiểm định sự phù hợp của hàm hồi quy.
Mục tiêu
Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:
Hiểu rõ ý nghĩa của công thức ước lượng.
Vận dụng công thức ước lượng làm được bài tập với tình huống cụ thể.
Biết kết luận hoặc biết trả lời câu hỏi từ kết quả ước lượng.
Hiểu rõ ý nghĩa của từng cặp giả thuyết.
Tính được giá trị quan sát của tiêu chuẩn kiểm định xác định được miềnc bỏ giả
thuyết H0 tương ứng với từng cặp giả thuyết.
Biết so sánh giá trị quan sát của tiêu chuẩn kiểm định với giá trtới hạn để xác định
giá trị đó có thuộc miền bác bỏ giả thuyết H0 hay không.
Biết kết luận và trả lời câu hỏi.
Bài 4: Suy diễn từ mô hình hồi quy
TXTOKT04_Bài 4_v1.0015108207 69
Tình huống dẫn nhập
nh huống 1: Giả sử ta có số liệu của 100 hộ gia đình
STT CT TN SN STT CT TN SN STT CT TN SN
1 97 107 2 41 172 149 4 81 273 285 5
2 100 118 2 42 156 162 4 82 276 290 5
3 100 119 2 43 165 164 4 83 281 312 5
4 114 148 2 44 155 166 4 84 277 325 5
5 126 155 2 45 173 183 4 85 294 340 5
6 177 193 2 46 189 203 4 86 294 360 5
7 171 217 2 47 232 228 4 87 333 385 5
8 175 250 2 48 210 239 4 88 337 392 5
9 205 294 2 49 207 254 4 89 161 113 6
10 205 294 2 50 210 258 4 90 213 154 6
11 218 309 2 51 235 267 4 91 243 203 6
12 241 333 2 52 274 298 4 92 229 227 6
13 233 347 2 53 282 325 4 93 288 271 6
14 242 362 2 54 275 334 4 94 264 272 6
15 266 375 2 55 289 344 4 95 308 358 6
16 280 385 2 56 296 349 4 96 334 362 6
17 108 107 3 57 298 351 4 97 337 380 6
18 142 117 3 58 304 361 4 98 336 392 6
19 130 143 3 59 281 364 4 99 345 394 6
20 157 148 3 60 293 370 4 100 360 398 6
21 132 154 3 61 302 372 4
22 140 160 3 62 303 374 4
23 158 163 3 63 318 378 4
24 148 173 3 64 297 396 4
25 182 183 3 65 161 112 5
26 178 184 3 66 201 159 5
27 188 186 3 67 185 179 5
28 171 211 3 68 190 193 5
29 185 215 3 69 211 195 5
30 213 229 3 70 211 202 5
31 182 236 3 71 226 220 5
32 207 252 3 72 208 224 5
33 212 274 3 73 245 225 5
34 246 276 3 74 230 227 5
35 228 306 3 75 249 239 5
36 252 346 3 76 246 240 5
37 292 394 3 77 261 259 5
Bài 4: Suy diễn từ mô hình hồi quy
70 TXTOKT04_Bài 4_v1.0015108207
38 278 396 3 78 236 263 5
39 135 134 4 79 233 265 5
40 169 144 4 80 248 284 5
Ước lượng mô hình:
CT = β1 + β2TN + β3SN + u (1)
bằng phương pháp bình phương nhỏ nhất ta có kết quả ước lượng sau:
Dependent Variable: CT Included observations: 100
Variable Coefficient Std. Error t–Statistic Prob.
C 3.961605 5.071451 0.781158 0.4366
TN 0.612508 0.014314 42.78971 0.0000
SN 18.43248 1.003414 18.36976 0.0000
R – squared 0.962840 F–statistic 1256.673
Prob(F–statistic) 0.0000
Với kết quả ước lượng trên ta có hàm hồi quy mẫu và mô hình hồi quy mẫu tương ứng:
CT = 3,961605 + 0,612508TN + 18,43248SN
CT = 3,961605 + 0,612508TN + 18,43248SN + e
Theo thuyết kinh tế khi thu nhập của hộ gia đình tăng lên một đơn vị (số người trong hkhông
đổi) thì chi tiêu của hộ gia đình tăng lên, đồng thời mức tăng thêm của chi tiêu không tăng bằng
mức tăng thêm của thu nhập (bởi một phần còn để tiết kiệm). Với kết quả ước lượng trên ta thấy
hệ số ước lượng của biến TN là 0,6125 thuộc khoảng (0; 1) nên kết quả ước lượng phù hợp với
thuyết kinh tế, tuy nhiên đấy mới kết quả ước lượng hình da trên s liu ca 100 h gia
đình được khảo sát, vậy nếu xét toàn bộ cho tất cả các hộ trên toàn quốc thì liệu thu nhập tăng lên
có dẫn đến chi tiêu tăng hay không? nếu có tăng thì dự đoán chi tiêu sẽ tăng trong khoảng nào?
Để tìm câu trả lời cho những câu hỏi này ta cần đến kiến thức trong bài 4 này.
nh huống 2:
Khảo sát 52 đại lý có bán các loại kem đánh răng, nhóm khảo sát hỏi các chủ đại lý về số lượng
hộp kem đánh răng nhãn hiệu PS bán được trong một tháng (ký hiệu là biến Q đơn vị hộp), giá
của một hộp kem đánh răng nhãn hiệu PS (ký hiệu biến P – đơn vị nghìn đồng/hộp) và giá của
một hộp kem đánh răng nhãn hiệu COLGATE (ký hiệu là biến PC – đơn vị nghìn đồng/hộp)
Xét mô hình hồi quy tổng thể:
Q = β1 + β2P + β3PC+ u (2)
Với số liệu của 52 đại lý:
STT Q P PC STT Q P PC
1 248 35 29 41 271 38 41
2 252 35 28 42 265 39 42
3 259 34 29 43 273 38 44
Bài 4: Suy diễn từ mô hình hồi quy
TXTOKT04_Bài 4_v1.0015108207 71
4 255 35 30 44 276 38 43
5 254 34 28 45 270 39 45
6 257 34 29 46 267 40 45
7 264 32 29 47 268 41 46
8 262 33 30 48 266 42 46
9 264 32 30 49 270 41 47
10 267 32 30 50 264 42 46
11 267 31 31 51 259 44 47
12 269 32 32 52 260 43 46
13 275 31 32
14 269 31 34
15 274 32 34
16 282 30 35
17 280 31 36
18 279 30 36
19 285 30 36
20 281 29 36
21 283 29 37
22 287 30 38
23 286 29 39
24 292 29 39