Dự báo chuỗi thời gian sử dụng mô hình ARMA và ARIMA

Nguyễn Ngọc Anh Trung tâm Nghiên cứu Chính sách và Phát triển

Nguyễn Việt Cường Đại học Kinh tế Quốc dân

Economics 20 - Prof. Anderson

1

Mô hình chuỗi thời gian đơn (Univariate time series models)

Mô hình ARMA cho các dãy số cân bằng Mô hình AR và các tính chất của mô hình Mô hình MA và tính chất của mô hình

Là mô hình mà ta dự đoán giá trị tương lai của mô hình dựa trên các giá trị quá khứ của dãy số Sử dung để dự báo ngắn hạn Không có tính lý thuyết, không giống mô hình cấu trúc (structural models)

Economics 20 - Prof. Anderson

2

Phương pháp Box Jenkins

Box and Jenkins (1970) là những người đầu tiên thực hiện việc ước lượng mô hình ARMA một cách có hệ thống: Gồm 3 1. Xây dựng/xác định mô hình -

Identification

2. Ước lượng Estimation 3. Kiểm định mô hình - Model

diagnostic checking

Economics 20 - Prof. Anderson

3

Phương pháp Box Jenkins

Bước 1: Xây dựng mô

Kiểm định nghiệm đơn vị, xem xem có

cần lấy sai phân số liệu hay Xác định bậc p và q

Economics 20 - Prof. Anderson

4

Phương pháp Box Jenkins

Bước 2: (cid:132) Ước lượng các tham số của mô hình (cid:132) Việc ước lượng có thể được thực hiện bằng phương pháp khả năng cực đại hoặc, bình phương cực tiểu phi tuyến

Bước 3: Kiểm định (cid:132) Kiểm định dựa trên phần dư của mô hình

Economics 20 - Prof. Anderson

5

Dãy số nhiễu trắng

Nếu dãy số thời gian εt là nhiễu trắng ta có vơi mọi t:

=

0)ε(E t

2

=

σ)ε(Var t

ε,ε(Cov

for

s

0

0) =

t

st −

Economics 20 - Prof. Anderson

6

Chỉ xét các dãy số cân bằng

Xem các phần bài giảng trước về định nghĩa của một dãy số cân bằng Hai yếu tố cơ bản để xây dưng mô hình ARMA và để dự báo là: (cid:132) Hàm tự tương quan của mẫu (sample

autocorrelation function - ACF)

(cid:132) Hàm tự tương quan một phần của mẫu (sample

partial autocorrelation function - PACF)

Economics 20 - Prof. Anderson

7

Hàm số tự tương quan của mẫu (SAMPLE AUTOCORRELATION FUNCTION) (còn được gọi là correlogram)

( Y,YvoˆC

)

kt −

k

,...2,1,0

=

=

±±=

( Y,YrroˆC

)

t

r k

kt −

t

t )Y(raˆV)Y(raˆV kt −

Chúng ta muốn ước lượng rk với k=1,2,3,… Có thể làm điều này một cách dễ dàng trong STATA với lệnh AC

Economics 20 - Prof. Anderson

8

Hàm ACF của dãy nhiễu trắng (400 quan sát lấy từ phân phối chuẩn N(0,1) )

1.00

ACF-u

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75

0

10

5 Economics 20 - Prof. Anderson

9

Hàm tự tương quan một phần của mẫu (sample partial autocorrelation function - PAC)

The kth order estimated or sample PAC coefficient, denoted here , is obtained as the parameter estimate of

kkφˆ in the kth order autoregression

ε

φY =

+

+

... ++

+

t

0

2t2

Yφ k

t

1t1 −

kt −

Economics 20 - Prof. Anderson

10

1.00

PACF-u

Hàm PACF của mẫu của một dãy nhiễu trắng

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75

Economics 20 - Prof. Anderson

11

0 5 10

Dãy số tự qui (autoregressive processes) Nếu Y là một dãy số tự qui bậc nhất AR (1), thì sẽ có dạng

1,...,

T

= t, ε + Yφ + φ = Y

1-t

t

t

0

NID(0,

2 )σ

1 ~ ε t

Economics 20 - Prof. Anderson

12

1,...,

T

Dãy số tự qui (autoregressive processes) Nếu Y là một dãy số tự qui bậc p AR (p), thì sẽ có dạng = t, ε + Yφ + ... + Yφ + φ = Y

p-t

1-t

t

t

0

1

p

NID(0,

2 )σ

~ ε t

Economics 20 - Prof. Anderson

13

8 Y2

Y2 an AR(1) series: Y2t = 2 +0.5Y2t-1 + εt

7

6

5

4

3

2

1

0

Economics 20 - Prof. Anderson

14

0 50 100 150 200 250 300 350 400

Dãy số trung bình trượt MA (1) Nếu Y là một dãy số trung bình trượt bậc nhất MA (1), thì Y sẽ có dạng

t

εθ+ε+γ=Y t 1-t1

+... +

+

t

2-t2

t

q-t

Dãy MA (q) Nếu Y là một dãy trung bình trượt bậc q thì Y sẽ có dạng εθ εθ 1-t1 q

εθ

ε

+ + = Y γ

Economics 20 - Prof. Anderson

15

Y1

An MA(2) process

5

4

3

2

1

0

-1

16

0 50 100 300 350 400 250 200 150 Economics 20 - Prof. Anderson

Dãy số ARMA

Y là một dãy số ARMA (p,q) :

ε

εθ

YφαY +=

... ++

+

+

... ++

t

ptp

t

qtq

1t1 −

εθ 1t1 −

Economics 20 - Prof. Anderson

17

Một dãy số/mô hình ARMA(p,q) nếu lựa chọn được bậc p và q phù hợp, có thể mô phỏng (mimic) bất kỳ một dãy số thời gian nào Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể: • Tìm được giá trị phù hợp của p và q (xác định mô hình), và • Ước lượng được các tham số của mô hình ARMA model sử dụng các thong tin trong quá khứ của Yt (ước lượng mô hình)

Thì chúng ta có thể sử dụng mô hình ARMA để dự báo các giá trị trong tương lai của Yt.

Economics 20 - Prof. Anderson

18

Dãy số tự qui và hàm số tự tương quan (ACF)và hàm tương quan một phần (PACF) Với một dãy số AR(p) thuần túy ta có: Hàm số tự tương quan (ACF) có xu hướng giảm dần khi k tăng lên Hàm số tự tương quan một phần (PACF) sẽ có xu hướng Cho ta biết một điểm cắt (a cut off point), điểm cắt này tương ứng với việc hàm số tự tương quan một phần sẽ khác 0 v các k ≤ p, nhưng sẽ bằng 0 (xấp xỉ) với k>p.

Economics 20 - Prof. Anderson

19

ACF-Y2

1.0

Y2, an AR(1) series

0.5

0.0

-0.5

5 10

PACF-Y2

0 1.0

0.5

0.0

-0.5

20

0 5 10 Economics 20 - Prof. Anderson

Dãy số MA và hàm tự tương quan (ACF) và hàm tự tương quan một phần PACF Khi ước lượng các hàm ACF và PACF, thì chúng có các đặc điểm sau để phân biệt đối với dãy số MA (q) thuần túy • Hàm ACF có điểm cắt (cut-off point) là điểm mà hệ số tự tương quan rk

có giá trị xấp xỉ bằng không, với mọi k>q

• Hàm PACF có xu hướng giảm dần khi k tăng lên

Economics 20 - Prof. Anderson

21

1.0

MA(2) series

ACF-Y1

0.5

0.0

-0.5

5 10

PACF-Y1

0 1.0

0.5

0.0

Economics 20 - Prof. Anderson

22

-0.5

0 5 10

Một số điểm lưu ý

1: Với mô hình MA(q), ACFq+1 = ACFq+2 = … = 0. 2: Với mô hình AR(q), PACFp+1 = PACFp+2 = … = 0. 3: Nhiễu trắng, ACF1 = ACF2 = … = PACF1 = PACF2 = … = 0.

Economics 20 - Prof. Anderson

23

Đặc điểm của mô hình ARMA

Mô hình Nhiễu trắng

ACF Tất cả đều bằng 0

PACF Tất cả đều bằng 0

MA(1)

Bằng 0 sau 1 bước trễ

Giảm dần từ bước trễ thứ 1

MA(2)

Bằng 0 sau 2 bước trễ

Giảm dần từ bước trễ thứ 2

MA(q)

Bằng 0 sau q bước trễ

Giảm dần từ bước trễ thứ q

AR(1)

Bằng 0 sau 1 bước trễ

Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ 1

AR(2)

Bằng 0 sau 2 bước trễ

Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ 2

AR(p)

Bằng 0 sau p bước trễ

Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ p

ARMA(1,1)

Giảm từ bước trễ thứ 1

Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ 1

ARMA(p,q)

Giảm từ bước trễ thứ q

Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ p

Economics 20 - Prof. Anderson

24

Kiểm định tự tương quan Để kiểm định giả thuyết dưới dạng

0

0 =

:Hvói

ρ k

≠ρ k

a

:H 0 Chúng ta sử dụng hệ số ước lượng tự tương quan, rk, để làm xấp xỉ thay cho (proxies) hệ số tự tương quan thật (true autocorrelation coefficients) và sử dụng hàm phân phối xấp xỉ nếu giả thuyết trống là đúng là:

)

0, N(~ rk

1 T

Như vậy, khoảng tin cậy 95% có thể được xây dựng như sau

rk ±

2 T

Economics 20 - Prof. Anderson

25

Kiểm định tự tương quan từng phần Để kiểm định xem liệu các hệ số tự tương quan từng phần (PAC) ở một độ trễ nào có có khác 0 về mặt thống kê hay không, chúng ta có thể thực hiện như

là ước lượng

kkφ là hệ số tương quan từng phần ở bậc k và

kkφˆ

sau. Gọi dựa trên mẫu. Chúng ta muốn kiểm định giả thuyết sau

vs

0

0

φ :H kk

a

0 = φ :H kk

Chúng ta sử dụng hệ số ước lượng của hệ số tương quan từng phần dựa trên mẫu để thay thế cho tham só thực và sử dụng hàm phân phối xấp xỉ (với điều kiện là giả thuyết trông đúng)

)

0, N(~ φkk

1 T

Nhu vậy chúng ta có thể xây dựng được khoảng tin cậy 95% để sử dụng cho việc kiểm định như sau

φˆ kk ±

2 T

Economics 20 - Prof. Anderson

26

Các bước tiếp theo của phương pháp BOX JENKINS Có 2 bước tiếp theo cần thực hiện: 1. Ước lượng các tham số của mô hình ARMA cho biến Y 2. Tiến hành dự báo (động – dynamic forecast)đối với Y dựa trên mô

hình ARMA vừa ước lượng được.

Dự báo động có thể được tiến hành theo phương pháp đệ qui (recursively).

δ +

ε+ Yφ + Yφ = Y T

1+T

1-T

εθ + εθ + T1

1-T2

1+T

1

2

Dự báo một kỳ tiếp theo (one step/period ahead forecast) chính là kỳ vọng toán có điều kiện của YT+1 dựa trên số liệu quá khứ Y (conditional upon the past history of Y), và có dạng như sau

δˆ +

1-T

T

1+T

εˆθˆ + εˆθˆ + Yφˆ + Yφˆ = Yˆ 2

1

T1

1-T2

Economics 20 - Prof. Anderson

27

Chúng ta biết một mô hình ARMA(p,q) nếu chọn được bậc p và q thích hợp có thể mô tả bất kỳ dãy số thời gian nào Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể: • Tìm được giá trị phù hợp của p và q (xác định mô hình), và • Ước lượng được các tham số của mô hình ARMA model sử dụng các thong

tin trong quá khứ của Yt (ước lượng mô hình)

Thì sau đó chúng ta có thể sử dụng mô hình ARMA vừa ước lượng để dự báo giá trị của Yt trong tương lai. Mục tiêu của chúng ta là dự báo Y trong k giai đoạn trong tương lai. Gọi T là kỳ hiện tại, và gọi $YT+1 là giá trị dự báo của kỳ kế tiếp, và $YT i+ là giá trị dự báo của kỳ T+i trong tương lai, i có thể nhận giá trị từ 1 tới k (i = 1, ...k).

Economics 20 - Prof. Anderson

28

Giá trị dự báo của kỳ thứ 2, YT+2 , là

δˆ + εˆθˆ + Yφˆ + Yˆφˆ = Yˆ

2+T

1+T1

T2

T2

Trong biểu thức này, ta sử dụng số dự báo của kỳ trước YT+1 làm biến giải thích

Economics 20 - Prof. Anderson

29

Dãy số thời gian không cân bằng: Mô hình ARIMA Nếu dãy số Y không cân bằng, thì ta sẽ xử lý như thế nào? Lời giải: Biến đổi số liệu để dãy số trở nên cân bằng. Phương pháp hay dung là lấy sai phân cho đến khi dãy số cân bằng (Thường thì chỉ cần sai phân 1-2 lần là dãy số cân bằng) Gọi dãy số đã sai phân này là biến Z. Sau đó ước lượng mô hình ARMA và dự báo với biến Z. Cuối cùng, tiến hành tích hợp (integrate – reverse the process) c báo Z để thu được ước lượng của Y

Economics 20 - Prof. Anderson

30