
DỰ BÁO BẰNG PHÂN TÍCH HỒI QUY
Phùng Thanh Bình
ptbinh@ueh.edu.vn
1
Chúng ta vừa khảo sát một số mô hình dự báo giản đơn thuộc nhóm các mô
hình dự báo chuỗi thời gian. Như chúng tôi đã đề cập ở chương 1, mô hình
dự báo chuỗi thời gian sẽ giúp dự báo các giá trị tương lai về một đối tượng
dự báo nào đó trên nền tảng xu hướng vận động của chính chuỗi dữ liệu đó
trong quá khứ và hiện tại. Tuy nhiên, các biến kinh tế thường có các mối
quan hệ với nhau, và dựa trên các mối quan hệ đó mà chúng ta có thể suy
luận được hành vi của một biến số nào đó khi đã có thông tin từ các biến số
khác có liên quan. Chẳng hạn, các nhà hoạch định chính sách vĩ mô có thể
dự báo được tốc độ tăng trưởng kinh tế trên cơ sở dự đoán được các thông
tin tương lai về cung tiền, lãi suất, hay chi tiêu công. Hoặc các nhà nghiên
cứu có thể dự đoán được mức độ chi tiêu của dân cư cho một nhóm hàng
hóa nào đó trên cơ sở dự đoán xu hướng gia tăng trong thu nhập và trình độ
học vấn. Hoặc giám đốc kinh doanh của một doanh nghiệp có thể dự đoán
được doanh số trong tương lai trên cơ sở dự trù các khoản chi tiêu cho
quảng cáo và chi tiêu cho nghiên cứu thị trường. Để có thể làm được như
vậy, các phương pháp phân tích hồi quy trở thành một trong những công cụ
vô cùng hữu ích. Ngoài ra, phân tích hồi quy còn giúp những người nghiên
cứu kiểm chứng nhiều giả thiết kinh tế quan trọng nhằm có thêm thông tin
chắc chắn cho việc ra quyết định về chính sách hay giải pháp nào đó. Hơn
nữa, chúng ta sẽ tiếp tục tìm hiểu một số mô hình dự báo chuỗi thời gian
phức tạp ở các chương sau, và các mô hình đó sẽ không thể nào thực hiện
được nếu người phân tích không được trang bị một nền tảng tương đối về
phân tích hồi quy.
MỤC TIÊU HỌC TẬP
Chương này giúp chúng ta hiểu được các vấn đề cơ bản nhất về phân tích
hồi quy và các ứng dụng của phân tích hồi quy trong dự báo với các nội
dung sau đây:
Các vấn đề cơ bản về phân tích hồi quy
Giải thích ý nghĩa thống kê của các kết quả hồi quy
Thực hiện các kiểm định giả thiết quan trọng
Giải thích ý nghĩa kinh tế của các kết quả hồi quy
Nhận biết và khắc phục một số vấn đề thường gặp trong phân tích
hồi quy
Một số ứng dụng của phân tích hồi quy trong việc ra quyết định về
chính sách và dự báo

2
MÔ HÌNH HỒI QUY ĐƠN
MỤC ĐÍCH CỦA PHÂN TÍCH HỒI QUY
Theo Gujarati (2003), phân tích hồi quy có thể giúp người phân tích:
Ước lượng giá trị trung bình của biến phụ thuộc khi cho trước giá trị
một hoặc các biến giải thích.
Kiểm định các giả thiết về bản chất của sự phụ thuộc giữa biến độc
lập và biến phụ thuộc.
Dự báo giá trị trung bình của biến phụ thuộc khi cho trước các giá
trị của các biến giải thích.
Dự báo tác động biên hoặc độ co giãn của một biến độc lập lên biến
phụ thuộc thong qua hệ số hồi quy.
MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
Mô hình hồi quy tuyến tính cổ điển là một cách xem xét bản chất và hình
thức của mối quan hệ giữa hai hay nhiều biến số. Trong phần này, chúng ta
chỉ tập trung xem xét trường hợp mô hình hai biến. Trong đó Y là biến phụ
thuộc và X là biến độc lập (hay còn gọi là biến giải thích). Như vậy, chúng
ta muốn giải thích/dự báo giá trị của Y theo các giá trị khác nhau của X.
Giả sử, X và Y có mối quan hệ tuyến tính như sau:
E(Yt) = 1 + 2Xt (7.1)
Trong đó, E(Yt) là giá trị trung bình có điều kiện của Yt theo Xt, và 1, 2 là
các tham số chưa biết của tổng thể (t ký hiệu theo thông lệ dữ liệu chuỗi
thời gian cho quan sát vào thời điểm t của biến quan sát). Phương trình
(7.1) được gọi là phương trình hồi quy tổng thể. Giá trị thực Yt sẽ không
phải luôn luôn bằng giá trị kỳ vọng E(Yt), vì vậy Yt có thể được thể hiện
như sau:
Yt = E(Yt) + ut
Yt = 1 + 2Xt + ut (7.2)
Trong đó, ut được gọi là hạng nhiễu ngẫu nhiên. Và ut luôn tồn tại do các
nguyên nhân như bỏ sót biết giải thích, sai dạng mô hình do bỏ qua các tác
động trễ, sai dạng hàm, lỗi đo lường, hoặc do đơn giản hóa mô hình bằng
cách tổng hợp một số biến khác nhau thành một biến giải thích duy nhất.

3
PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT
Phương pháp được sử dụng phổ biến nhất nhằm ước lượng các hệ số hồi
quy là phương pháp bình phương bé nhất thông thường (OLS)1. Theo
Gujarati (2003), dưới các giả định của mô hình hồi quy tuyến tính cổ điển
(sẽ trình bày ở phần sau), thì phương pháp OLS có nhiều tính chất thống kê
rất hấp dẫn làm cho nó trở thành một phương pháp mạnh và phổ biến nhất
trong phân tích hồi quy. Phương pháp OLS được cho là của nhà toán học
nổi tiếng người Đức Carl Friedrich Gauss.
Nhắc lại hàm hồi quy tổng thể ở phương trình (7.2):
Yt = 1 + 2Xt + ut (7.2)
Do hàm hồi quy tổng thể này không thể quan sát trực tiếp được, nên ta ước
lượng nó từ hàm hồi quy mẫu từ phương trình (7.3):
Yt =
1
ˆ
+
2
ˆ
Xt +
t
u
ˆ
(7.3)
=
t
Y
ˆ
+
t
u
ˆ
Trong đó, Yt là giá trị quan sát thực tế,
t
Y
ˆ
là giá trị ước lượng hay trung
bình có điều kiện của Yt. Ta có
t
u
ˆ
= Yt -
t
Y
ˆ
= Yt –
1
ˆ
-
2
ˆ
Xt (7.4)
Phương trình này cho biết phần dư
t
u
ˆ
là hiệu số của giá trị Y thực tế và giá
trị Y ước lượng vào thời điểm t, giá trị này có từ phương trình (7.3).
Xây dựng các hệ số của hàm hồi quy mẫu với điều kiện bình phương
tổng phần dư
)Y
ˆ
Y(u
ˆttt
là tối thiểu nhất. Nghĩa là, nghĩa là xác
định
1
ˆ
và
2
ˆ
sao cho tổng bình phương phần dư
2
t
u
ˆ
(được gọi là RSS)
là tối thiểu. RSS được định nghĩa như sau:
n
1t
2
t21t
n
1t
2
tt
n
1t
2
t)X
ˆˆ
Y()Y
ˆ
Y(u
ˆ
RSS
(7.5)
Để tối thiểu hóa (7.5), ta lấy đạo hàm bậc một của RSS theo
1
ˆ
và
2
ˆ
và
cho các đạo hàm này bằng không.
0)X
ˆˆ
Y(2
ˆ
RSS
t21t
1
(7.6)
0X)X
ˆˆ
Y(2
ˆ
RSS
tt21t
2
(7.7)
1 Ordinary least squares

4
Hai phương trình (7.6) và (7.7) có thể được viết lại như sau:
t21t X
ˆˆ
nY
(7.8)
2
t2t1tt X
ˆ
X
ˆ
YX
(7.9)
Trong đó n là số quan sát trong mẫu. Hệ hai phương trình (7.8) và (7.9) có
thể được biểu diển dưới hình thức ma trận như sau:
2.2
A
2
tt
t
X X
X n
1,2
B
2
1
ˆ
ˆ
=
1,2
C
tt
t
XY
Y
(7.10)
Có thể giải nhanh hệ phương trình (7.10) theo quy tắc Cramer để có
1
ˆ
và
2
ˆ
như sau:
2
t
2
t
tttt
2
t
1XXn
XYXYX
ˆ
(7.11)
2
t
2
t
tttt
2XXn
YXXYn
ˆ
(7.12)
Tuy nhiên, các công thức ước tính
1
ˆ
và
2
ˆ
như trên có vẻ hơi phức tạp
nên rất dễ làm người đọc (nhất là sinh viên năm 2 và năm 3 các ngành kinh
tế) ngao ngán vì tính phức tạp của nó. Từ phương trình (7.8) ta có:
X
ˆ
Y
ˆ21
(7.13)
Thế
1
ˆ
ở phương trình (7.13) vào phương trình (7.9) để tìm
2
ˆ
như sau:
YtXt = (
X
ˆ
Y2
)Xt +
ˆ
2X2t
YtXt =
t2t XX
ˆ
XY
+
2
ˆ
X2t
Do
XnXt
, nên ta có:
YtXt =
2
2X
ˆ
nXYn
+
ˆ
2X2t
YtXt -
XYn
=
2
2
t2 XnX
ˆ
(7.14)
Ta lại có,
)YXYtXYXYX()YY)(XX( ttttt
=
YXYXXYYX ttt
=
YXnYXnYXnYX tt

5
=
YXnYX tt
(7.15)
Và
2
t)XX(
=
)XXX2X( 2
t
2
t
=
2
t
2
tXXX2X
=
2
2
tXnXXn2X
=
2
2
tXnX
(7.16)
Thế phương trình (7.15) và (7.16) vào phương trình (7.14) ta có:
2
t2tt )XX(
ˆ
)YY)(XX(
2
t
tt
2)XX(
)YY)(XX(
ˆ
(7.17)
=
2
t
tt
x
yx
Trong đó, xt = (Xt -
X
) và yt = (Yt -
Y
). Như vậy, qua một vài bước biến
đối nhỏ ta có công thức ước tính
2
ˆ
cực kỳ đơn giản và rất ý nghĩa. Tưởng
tượng rằng, lấy cả tử và mẫu của (7.17) chia cho (n-1), ta có:
)X(Var
)Y,X(Cov
ˆ
t
tt
2
(7.18)
Ngoài ra,
2
ˆ
ở phương trình (7.17) còn có thể được thể hiện một cách khác
như sau:
2
ˆ
=
2
t
tt
x
yx
=
2
2
t
ttt
2
t
tt
XnX
)xYYx
)XX(
)YY(x
=
2
2
t
tt
2
2
t
ttt
XnX
Yx
XnX
)XX(YYx
=
2
2
t
tt
XnX
Yx
=
2
t
tt
x
Yx
(7.19)
Các công thức ở phương trình (7.17) và (7.19) mách cho chúng ta một điều
rất thú vị rằng,
1
ˆ
là một hàm tuyến tính theo
2
ˆ
,
2
ˆ
là một hàm tuyến tính