Dự báo bằng phân tích hồi quy của Phùng Thanh Bình

DỰ BÁO BẰNG PHÂN TÍCH HỒI QUY

Phùng Thanh Bình

ptbinh@ueh.edu.vn

1

Chúng ta vừa khảo sát một số mô hình dự báo giản đơn thuộc nhóm các mô

hình dự báo chuỗi thời gian. Như chúng tôi đã đề cập ở chương 1, mô hình

dự báo chuỗi thời gian sẽ giúp dự báo các giá trị tương lai về một đối tượng

dự báo nào đó trên nền tảng xu hướng vận động của chính chuỗi dữ liệu đó

trong quá khứ và hiện tại. Tuy nhiên, các biến kinh tế thường có các mối

quan hệ với nhau, và dựa trên các mối quan hệ đó mà chúng ta có thể suy

luận được hành vi của một biến số nào đó khi đã có thông tin từ các biến số

khác có liên quan. Chẳng hạn, các nhà hoạch định chính sách vĩ mô có thể

dự báo được tốc độ tăng trưởng kinh tế trên cơ sở dự đoán được các thông

tin tương lai về cung tiền, lãi suất, hay chi tiêu công. Hoặc các nhà nghiên

cứu có thể dự đoán được mức độ chi tiêu của dân cư cho một nhóm hàng

hóa nào đó trên cơ sở dự đoán xu hướng gia tăng trong thu nhập và trình độ

học vấn. Hoặc giám đốc kinh doanh của một doanh nghiệp có thể dự đoán

được doanh số trong tương lai trên cơ sở dự trù các khoản chi tiêu cho

quảng cáo và chi tiêu cho nghiên cứu thị trường. Để có thể làm được như

vậy, các phương pháp phân tích hồi quy trở thành một trong những công cụ

vô cùng hữu ích. Ngoài ra, phân tích hồi quy còn giúp những người nghiên

cứu kiểm chứng nhiều giả thiết kinh tế quan trọng nhằm có thêm thông tin

chắc chắn cho việc ra quyết định về chính sách hay giải pháp nào đó. Hơn

nữa, chúng ta sẽ tiếp tục tìm hiểu một số mô hình dự báo chuỗi thời gian

phức tạp ở các chương sau, và các mô hình đó sẽ không thể nào thực hiện

được nếu người phân tích không được trang bị một nền tảng tương đối về

phân tích hồi quy.

MỤC TIÊU HỌC TẬP

Chương này giúp chúng ta hiểu được các vấn đề cơ bản nhất về phân tích

hồi quy và các ứng dụng của phân tích hồi quy trong dự báo với các nội

dung sau đây:

Các vấn đề cơ bản về phân tích hồi quy

Giải thích ý nghĩa thống kê của các kết quả hồi quy

Thực hiện các kiểm định giả thiết quan trọng

Giải thích ý nghĩa kinh tế của các kết quả hồi quy

Nhận biết và khắc phục một số vấn đề thường gặp trong phân tích

hồi quy

Một số ứng dụng của phân tích hồi quy trong việc ra quyết định về

chính sách và dự báo

2

MÔ HÌNH HỒI QUY ĐƠN

MỤC ĐÍCH CỦA PHÂN TÍCH HỒI QUY

Theo Gujarati (2003), phân tích hồi quy có thể giúp người phân tích:

Ước lượng giá trị trung bình của biến phụ thuộc khi cho trước giá trị

một hoặc các biến giải thích.

Kiểm định các giả thiết về bản chất của sự phụ thuộc giữa biến độc

lập và biến phụ thuộc.

Dự báo giá trị trung bình của biến phụ thuộc khi cho trước các giá

trị của các biến giải thích.

Dự báo tác động biên hoặc độ co giãn của một biến độc lập lên biến

phụ thuộc thong qua hệ số hồi quy.

MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN

Mô hình hồi quy tuyến tính cổ điển là một cách xem xét bản chất và hình

thức của mối quan hệ giữa hai hay nhiều biến số. Trong phần này, chúng ta

chỉ tập trung xem xét trường hợp mô hình hai biến. Trong đó Y là biến phụ

thuộc và X là biến độc lập (hay còn gọi là biến giải thích). Như vậy, chúng

ta muốn giải thích/dự báo giá trị của Y theo các giá trị khác nhau của X.

Giả sử, X và Y có mối quan hệ tuyến tính như sau:

E(Yt) = 1 + 2Xt (7.1)

Trong đó, E(Yt) là giá trị trung bình có điều kiện của Yt theo Xt, và 1, 2 là

các tham số chưa biết của tổng thể (t ký hiệu theo thông lệ dữ liệu chuỗi

thời gian cho quan sát vào thời điểm t của biến quan sát). Phương trình

(7.1) được gọi là phương trình hồi quy tổng thể. Giá trị thực Yt sẽ không

phải luôn luôn bằng giá trị kỳ vọng E(Yt), vì vậy Yt có thể được thể hiện

như sau:

Yt = E(Yt) + ut

Yt = 1 + 2Xt + ut (7.2)

Trong đó, ut được gọi là hạng nhiễu ngẫu nhiên. Và ut luôn tồn tại do các

nguyên nhân như bỏ sót biết giải thích, sai dạng mô hình do bỏ qua các tác

động trễ, sai dạng hàm, lỗi đo lường, hoặc do đơn giản hóa mô hình bằng

cách tổng hợp một số biến khác nhau thành một biến giải thích duy nhất.

3

PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT

Phương pháp được sử dụng phổ biến nhất nhằm ước lượng các hệ số hồi

quy là phương pháp bình phương bé nhất thông thường (OLS)1. Theo

Gujarati (2003), dưới các giả định của mô hình hồi quy tuyến tính cổ điển

(sẽ trình bày ở phần sau), thì phương pháp OLS có nhiều tính chất thống kê

rất hấp dẫn làm cho nó trở thành một phương pháp mạnh và phổ biến nhất

trong phân tích hồi quy. Phương pháp OLS được cho là của nhà toán học

nổi tiếng người Đức Carl Friedrich Gauss.

Nhắc lại hàm hồi quy tổng thể ở phương trình (7.2):

Yt = 1 + 2Xt + ut (7.2)

Do hàm hồi quy tổng thể này không thể quan sát trực tiếp được, nên ta ước

lượng nó từ hàm hồi quy mẫu từ phương trình (7.3):

Yt =

1

ˆ

+

2

ˆ

Xt +

t

u

ˆ

(7.3)

=

t

Y

ˆ

+

t

u

ˆ

Trong đó, Yt là giá trị quan sát thực tế,

t

Y

ˆ

là giá trị ước lượng hay trung

bình có điều kiện của Yt. Ta có

t

u

ˆ

= Yt -

t

Y

ˆ

= Yt –

1

ˆ

-

2

ˆ

Xt (7.4)

Phương trình này cho biết phần dư

t

u

ˆ

là hiệu số của giá trị Y thực tế và giá

trị Y ước lượng vào thời điểm t, giá trị này có từ phương trình (7.3).

Xây dựng các hệ số của hàm hồi quy mẫu với điều kiện bình phương

tổng phần dư

)Y

ˆ

Y(u

ˆttt

là tối thiểu nhất. Nghĩa là, nghĩa là xác

định

1

ˆ

và

2

ˆ

sao cho tổng bình phương phần dư

2

t

u

ˆ

(được gọi là RSS)

là tối thiểu. RSS được định nghĩa như sau:

n

1t

2

t21t

n

1t

2

tt

n

1t

2

t)X

ˆˆ

Y()Y

ˆ

Y(u

ˆ

RSS

(7.5)

Để tối thiểu hóa (7.5), ta lấy đạo hàm bậc một của RSS theo

1

ˆ

và

2

ˆ

và

cho các đạo hàm này bằng không.

0)X

ˆˆ

Y(2

ˆ

RSS

t21t

1

(7.6)

0X)X

ˆˆ

Y(2

ˆ

RSS

tt21t

2

(7.7)

1 Ordinary least squares

4

Hai phương trình (7.6) và (7.7) có thể được viết lại như sau:

t21t X

ˆˆ

nY

(7.8)

2

t2t1tt X

ˆ

X

ˆ

YX

(7.9)

Trong đó n là số quan sát trong mẫu. Hệ hai phương trình (7.8) và (7.9) có

thể được biểu diển dưới hình thức ma trận như sau:

  

2.2

A

2

tt

t

X X

X n



1,2

B

2

1

ˆ

=



1,2

C

tt

t

XY

Y

(7.10)

Có thể giải nhanh hệ phương trình (7.10) theo quy tắc Cramer để có

1

ˆ

và

2

ˆ

như sau:

2

t

2

t

tttt

2

t

1XXn

XYXYX

ˆ

(7.11)

2

t

2

t

tttt

2XXn

YXXYn

ˆ

(7.12)

Tuy nhiên, các công thức ước tính

1

ˆ

và

2

ˆ

như trên có vẻ hơi phức tạp

nên rất dễ làm người đọc (nhất là sinh viên năm 2 và năm 3 các ngành kinh

tế) ngao ngán vì tính phức tạp của nó. Từ phương trình (7.8) ta có:

X

ˆ

Y

ˆ21

(7.13)

Thế

1

ˆ

ở phương trình (7.13) vào phương trình (7.9) để tìm

2

ˆ

như sau:

YtXt = (

X

ˆ

Y2

)Xt +

ˆ

2X2t

YtXt =

t2t XX

ˆ

XY

+

2

ˆ

X2t

Do

XnXt

, nên ta có:

YtXt =

2

2X

ˆ

nXYn

+

ˆ

2X2t

YtXt -

XYn

=

2

t2 XnX

ˆ

(7.14)

Ta lại có,

)YXYtXYXYX()YY)(XX( ttttt

=

YXYXXYYX ttt

=

YXnYXnYXnYX tt

5

=

YXnYX tt

(7.15)

Và

2

t)XX(

=

)XXX2X( 2

t

2

t

=

2

t

2

tXXX2X

=

2

tXnXXn2X

=

2

tXnX

(7.16)

Thế phương trình (7.15) và (7.16) vào phương trình (7.14) ta có:

2

t2tt )XX(

ˆ

)YY)(XX(

2

t

tt

2)XX(

)YY)(XX(

ˆ

(7.17)

=

2

t

tt

x

yx

Trong đó, xt = (Xt -

X

) và yt = (Yt -

Y

). Như vậy, qua một vài bước biến

đối nhỏ ta có công thức ước tính

2

ˆ

cực kỳ đơn giản và rất ý nghĩa. Tưởng

tượng rằng, lấy cả tử và mẫu của (7.17) chia cho (n-1), ta có:

)X(Var

)Y,X(Cov

ˆ

t

tt

2

(7.18)

Ngoài ra,

2

ˆ

ở phương trình (7.17) còn có thể được thể hiện một cách khác

như sau:

2

ˆ

=

2

t

tt

x

yx

=

2

t

ttt

2

t

tt

XnX

)xYYx

)XX(

)YY(x

=

2

t

tt

2

t

ttt

XnX

Yx

XnX

)XX(YYx

=

2

t

tt

XnX

Yx

=

2

t

tt

x

Yx

(7.19)

Các công thức ở phương trình (7.17) và (7.19) mách cho chúng ta một điều

rất thú vị rằng,

1

ˆ

là một hàm tuyến tính theo

2

ˆ

,

2

ˆ

là một hàm tuyến tính

Dự báo bằng phân tích hồi quy - Phùng Thanh Bình

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi