22/8/2015<br />
<br />
Mở đầu<br />
Có hai cách để tiến hành dự báo: đó là dự báo<br />
điểm và dự báo khoảng, người ta còn gọi là ước<br />
lượng điểm hay ước lượng khoảng cho giá trị<br />
dự báo.<br />
Dự báo điểm thực chất chỉ cho ta một giá trị của<br />
biến phụ thuộc tương ứng với giá trị cho trước<br />
của biến độc lập.<br />
<br />
Dự báo bằng hồi quy<br />
Lê Minh Tiến<br />
<br />
Nhưng điều này trong thực tế ít có ý nghĩa vì giá trị thực tế<br />
thường sai lệch so với giá trị dự báo điểm một sai số nào đó, mà<br />
với dự báo điểm thì ta không đánh giá được sai số này.<br />
<br />
1<br />
<br />
4<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Mở đầu<br />
<br />
Mở đầu<br />
<br />
Mối quan hệ giữa biến phụ thuộc và biến độc<br />
lập là quan hệ không chính xác theo nghĩa, ứng<br />
với một giá trị của biến độc lập có thể có nhiều<br />
giá trị khác nhau của biến phụ thuộc, mà thuật<br />
ngữ gọi là những giá trị cá biệt.<br />
Tuy nhiên, thực tế ta thường quan tâm đến giá<br />
trị trung bình của những giá trị cá biệt, nghĩa là<br />
ứng với một giá trị của biến độc lập thì giá trị<br />
trung bình của biến phụ thuộc sẽ là bao nhiêu.<br />
<br />
Dự báo khoảng, nghĩa là chỉ ra một khoảng tin<br />
cậy mà giá trị dự báo có thể thuộc vào khoảng<br />
đó với một độ tin cậy cho trước.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
2<br />
<br />
5<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Mở đầu<br />
<br />
Dự báo với mô hình 2 biến<br />
<br />
Thực chất, giá trị đó là kỳ vọng có điều kiện của<br />
biến phụ thuộc ứng với một giá trị xác định của<br />
biến độc lập.<br />
Nội dung của chương này sẽ đề cập đến cả hai<br />
loại dự báo: dự báo giá trị trung bình và dự báo<br />
giá trị cá biệt.<br />
<br />
Xét mô hình hồi quy 2 biến:<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
3<br />
<br />
PRF : E Y/X = β1 + β2 X<br />
<br />
<br />
PRM : Y = β1 + β2 X + u<br />
<br />
<br />
ˆ ˆ ˆ<br />
SRF : Y = β1 + β2 X<br />
<br />
<br />
ˆ ˆ<br />
SRM : Y = β1 + β2 X + e<br />
<br />
<br />
Khi mô hình ước lượng SRF được xác định là<br />
phù hợp tốt, người ta có thể dùng để dự báo giá<br />
trị trung bình E(Y/X) hay giá trị cá biệt Y.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
6<br />
<br />
1<br />
<br />
22/8/2015<br />
<br />
Dự báo khoảng cho trung bình E(Y/X0)<br />
(Mean Prediction)<br />
<br />
Dự báo điểm (Point Prediction)<br />
Giả sử biến độc lập X nhận giá trị X0 cho trước.<br />
Dự báo giá trị trung bình chính là dự báo cho<br />
E(Y/X = X0), dự báo cá biệt ký hiệu là Y0.<br />
Khi thay X0 vào SRF, ta được Y0^= 1^+ 2^X0<br />
Người ta chứng minh được Y0^ là ước lượng<br />
tuyến tính, không chệch tốt nhất của E(Y/X0) và<br />
Y0, do đó người ta sử dụng Y0^ là dự báo điểm<br />
cho cả giá trị trung bình và giá trị cá biệt của<br />
biến phụ thuộc Y.<br />
Nghĩa là: E(Y/X = X0) Y0^, Y0 Y0^<br />
7<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Với tính chất Y0^ có phân phối chuẩn, và sử<br />
dụng σ^2 là ước lượng không chệch cho<br />
phương sai tổng thể σ2, thì lúc đó<br />
t=<br />
<br />
ˆ<br />
Y0 - E Y/X0 <br />
~ t(n - 2)<br />
ˆ<br />
se Y<br />
<br />
<br />
0<br />
<br />
Với độ tin cậy 1–α cho trước, khoảng tin cậy của<br />
giá trị trung bình E(Y/X0) là:<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
ˆ<br />
ˆ ˆ<br />
ˆ<br />
E(Y/X0 ) Y0 - t α/2;n-2 .se Y0 ;Y0 + t α/2;n-2 .se Y0<br />
<br />
10<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Dự báo khoảng cho giá trị cá biệt Y0<br />
(Individual Prediction)<br />
<br />
Dự báo khoảng (Interval Prediction)<br />
Để dự báo khoảng, người ta cũng phải căn cứ<br />
vào dự báo điểm Y0^.<br />
Lưu ý rằng về bản chất, Y0^ cũng là đại lượng<br />
ngẫu nhiên, vì nó phụ thuộc vào các đại lượng<br />
ngẫu nhiên 1^, 2^<br />
<br />
Sai số e0=Y0-Y0^ của dự báo là đại lượng ngẫu<br />
nhiên có phương sai:<br />
<br />
1 X0 - X<br />
ˆ<br />
var e0 = var Y0 - Y0 = σ 2 1+ +<br />
n<br />
xi2<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
2<br />
<br />
<br />
ˆ<br />
= var Y + σ 2<br />
0<br />
<br />
<br />
<br />
<br />
<br />
Lưu ý rằng các phương sai đang xét là phương<br />
sai với điều kiện X=X0.<br />
<br />
8<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Dự báo khoảng cho giá trị cá biệt Y0<br />
(Individual Prediction)<br />
<br />
Dự báo khoảng (Interval Prediction)<br />
Dễ chứng minh được khi hạng nhiễu ui có phân<br />
phối chuẩn thì Y0^ cũng có phân phối chuẩn với<br />
kì vọng là E(Y/X0)=β1+β2X0 và phương sai<br />
<br />
1 X0 - X<br />
ˆ<br />
Var Y0 = σ 2 +<br />
n<br />
xi2<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
2<br />
<br />
Sai số của dự báo thực chất là do hai nguồn:<br />
do tác động của thành phần nhiễu<br />
do sử dụng ước lượng điểm Y0^.<br />
<br />
Khi dùng σ^2 thay thế cho σ2, ta có:<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
t=<br />
<br />
<br />
<br />
ˆ<br />
ˆ<br />
tức là Y0^~N(E(Y/X0); se 2(Y0^)), se Y0 = var Y0<br />
<br />
9<br />
<br />
ˆ<br />
Y0 - Y0<br />
~ t(n - 2)<br />
se e0 <br />
<br />
Với độ tin cậy 1–α cho trước, khoảng tin cậy của<br />
giá trị cá biệt Y0 là:<br />
ˆ<br />
ˆ<br />
Y Y -t<br />
.se e ;Y + t<br />
.se e <br />
0<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
11<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
<br />
<br />
0<br />
<br />
α/2;n-2<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
0<br />
<br />
0<br />
<br />
α/2;n-2<br />
<br />
0<br />
<br />
<br />
<br />
12<br />
<br />
2<br />
<br />
22/8/2015<br />
<br />
Dự báo khoảng cho giá trị cá biệt Y0<br />
(Individual Prediction)<br />
<br />
Dự báo khoảng: cho giá trị trung bình<br />
<br />
!<br />
<br />
Với độ tin cậy 1–α cho trước, ta có<br />
<br />
Với cùng độ tin cậy thì khoảng dự báo của giá trị<br />
cá biệt sẽ rộng hơn và bao hàm khoảng dự báo<br />
của giá trị trung bình vì se(e0)>se(Y0^).<br />
Ta không thể nói dự báo khoảng cho giá trị trung<br />
bình có độ chính xác cao hơn bởi vì mục đích<br />
nghiên cứu của ta là khác nhau, một cái ta<br />
nghiên cứu riêng lẻ từng giá trị cá biệt, còn một<br />
cái ta nghiên cứu trung bình của các giá trị cá<br />
biệt này.<br />
13<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
ˆ<br />
ˆ<br />
ˆ<br />
ˆ<br />
E(Y/X0 ) Y0 - t α/2;n-k .se Y0 ;Y0 + t α/2;n-k .se Y0<br />
trong đó:<br />
<br />
-1<br />
T<br />
T<br />
ˆ<br />
ˆ<br />
ˆ<br />
ˆ<br />
se Y0 = var Y0 ,var Y0 = X0 .cov β X 0 = σ 2 X0 . X T X .X0<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
cov(^) là ma trận hiệp phương sai của các hệ<br />
số hồi quy<br />
<br />
16<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Dự báo với mô hình nhiều biến<br />
<br />
Dự báo khoảng: cho giá trị cá biệt<br />
<br />
Giả sử mô hình hồi quy nhiều biến dạng ma trận<br />
như sau:<br />
PRM: Y = X.β + u<br />
SRM: Y = X.β^ + e<br />
<br />
Với độ tin cậy 1–α cho trước, ta có<br />
<br />
<br />
<br />
ˆ<br />
ˆ<br />
Y0 Y0 - t α/2;n-k .se e0 ;Y0 + t α/2;n-k .se e0 <br />
<br />
<br />
<br />
trong đó<br />
<br />
<br />
<br />
ˆ<br />
se e0 = var e0 ,var e0 = var Y0 + σ 2<br />
<br />
14<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
17<br />
<br />
Dự báo điểm<br />
<br />
Đánh giá độ chính xác của dự báo<br />
<br />
Giả sử các biến độc lập nhận các giá trị là X10,<br />
X20,..., X(k-1)0, ta thiết lập véc tơ X0 như sau:<br />
<br />
Một trong những tiêu chuẩn để đánh giá mô<br />
hình tốt theo tiêu chuẩn của Harvey là mô hình<br />
có khả năng dự báo chính xác.<br />
Tuy nhiên, việc đánh giá mức độ chính xác trong<br />
dự báo của mô hình hồi quy đòi hỏi phải có số<br />
liệu thực tế để đối chiếu với giá trị dự báo từ mô<br />
hình. Điều này có thể thực hiện bằng cách thu<br />
thập thêm số liệu mới, nhưng thực tế việc thu<br />
thập thêm số liệu mới không phải lúc nào cũng<br />
dễ dàng thực hiện được.<br />
<br />
1<br />
<br />
<br />
<br />
X10 <br />
X 0 = X 20 <br />
<br />
<br />
...<br />
<br />
X<br />
<br />
k-10 <br />
<br />
Thay vào SRF ta được Y0^=X0T.β^=β^T.X0<br />
Y0^ là ước lượng điểm BLU của E(Y/X0) và Y0<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
15<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
18<br />
<br />
3<br />
<br />
22/8/2015<br />
<br />
Phân chia mẫu<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
Người ta giải quyết bằng cách phân chia mẫu,<br />
nghĩa là từ mẫu đang có tách thành hai mẫu<br />
con.<br />
<br />
Sai số bình phương trung bình MSE (Mean<br />
Squared Error):<br />
<br />
Mẫu con thứ nhất được sử dụng để ước lượng mô<br />
hình hồi quy và gọi là “mẫu khởi động” (initialization<br />
set).<br />
Mẫu con thứ hai được sử dụng để kiểm tra độ chính<br />
xác của các giá trị dự báo từ mô hình hồi quy tìm<br />
được từ mẫu khởi động. Mẫu con thứ hai được gọi là<br />
“mẫu kiểm tra” (test set).<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
19<br />
<br />
1 m 2<br />
ei<br />
m i=1<br />
Căn bậc hai của sai số bình phương trung bình<br />
RMSE (Root Mean Squared Error):<br />
MSE =<br />
<br />
RMSE = MSE<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
22<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
Giả sử mẫu kiểm tra gồm m quan sát, trong đó<br />
ký hiệu Yi là giá trị thực tế của biến phụ thuộc Y;<br />
Yi^ là giá trị dự báo điểm của mô hình hồi quy;<br />
ei=Yi-Yi^ là sai số của dự báo.<br />
Đánh giá khả năng dự báo của mô hình được<br />
dựa trên các sai số dự báo trong mẫu kiểm tra<br />
mà không dựa trên mẫu khởi động vì thực tế khi<br />
xây dựng mô hình hồi quy, người ta đã tìm cách<br />
cực tiểu các phần dư trong mẫu khởi động để<br />
xác định các tham số ước lượng.<br />
<br />
ME có thể cho chúng ta biết có hay không<br />
khuynh hướng dự báo thấp hơn hay cao hơn<br />
giá trị thực tế, nghĩa là nếu ME > 0, thì khuynh<br />
hướng chung các sai số dự báo ei>0, nên<br />
Yi>Yi^, nói cách khác Yi^ có khuynh hướng dự<br />
báo thấp hơn giá trị thực Yi.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
20<br />
<br />
ei có thể âm hoặc dương nên chúng có thể bù trừ cho<br />
nhau khi tính ME. Điều này dẫn đến hạn chế khi sử<br />
dụng giá trị ME để đánh giá cho năng lực dự báo của<br />
mô hình vì |ME| có thể nhỏ nhưng không có gì bảo<br />
đảm là sai số của dự báo |ei| là nhỏ.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
23<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
Vấn đề ở đây là kết quả ước lượng có còn khớp<br />
(fitted) với các quan sát ngoài mẫu khởi động<br />
hay không?<br />
Sai số trung bình ME (Mean Error):<br />
1 m<br />
ME = ei<br />
m i=1<br />
Sai số tuyệt đối trung bình MAE (Mean Absolute<br />
Error):<br />
1 m<br />
MAE = ei<br />
m i=1<br />
<br />
MAE và MSE hạn chế được ảnh hưởng bù trừ<br />
của giá trị sai số dự báo âm và dương.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
21<br />
<br />
MSE phóng đại các sai số dự báo có giá trị tuyệt đối<br />
lớn, và như vậy chú trọng tới ảnh hưởng của các giá<br />
trị biệt trong mẫu kiểm tra.<br />
Hạn chế của việc so sánh giá trị của MSE với các chỉ<br />
số khác (ME, MAE) là vấn đề đơn vị, do đó thường<br />
người ta sử dụng RMSE thay cho MSE để so sánh.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
24<br />
<br />
4<br />
<br />
22/8/2015<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
Các tiêu chuẩn thống kê của dự báo<br />
<br />
!<br />
Các đo lường thống kê ME, MAE, MSE, RMSE<br />
chỉ có ý nghĩa khi được đối chiếu hay so sánh<br />
giữa các mô hình hồi quy (cùng dạng biến phụ<br />
thuộc và cùng cỡ mẫu), hay nói cách khác, việc<br />
phân tích độc lập các giá trị của những chỉ số<br />
này ít có ý nghĩa.<br />
Các chỉ số trên đều phụ thuộc vào đơn vị đo của<br />
biến, do đó việc đánh giá các chỉ số trên lớn hay<br />
nhỏ không chỉ chú ý thuần túy về mặt giá trị mà<br />
còn phải quan tâm đến đơn vị của biến.<br />
25<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Hệ số TIC có giá trị trong [0;1].<br />
Khi TIC = 0, tức sai lệch giữa giá trị dự báo điểm<br />
với giá trị thực tế bằng 0, khi đó hàm hồi quy dự<br />
báo chính xác hoàn toàn.<br />
Trong thực tế hiếm khi có được giá trị lý tưởng<br />
TIC = 0, mà chỉ kỳ vọng TIC càng gần 0 thì các<br />
tốt - kinh nghiệm là TIC