Dự báo chuỗi thời gian sử dụng mô hình ARMA và ARIMA
Nguyễn Ngọc Anh Trung tâm Nghiên cứu Chính sách và Phát triển
Nguyễn Việt Cường Đại học Kinh tế Quốc dân
Economics 20 - Prof. Anderson
1
Mô hình chuỗi thời gian đơn (Univariate time series models)
Mô hình ARMA cho các dãy số cân bằng Mô hình AR và các tính chất của mô hình Mô hình MA và tính chất của mô hình
Là mô hình mà ta dự đoán giá trị tương lai của mô hình dựa trên các giá trị quá khứ của dãy số Sử dung để dự báo ngắn hạn Không có tính lý thuyết, không giống mô hình cấu trúc (structural models)
Economics 20 - Prof. Anderson
2
Phương pháp Box Jenkins
Box and Jenkins (1970) là những người đầu tiên thực hiện việc ước lượng mô hình ARMA một cách có hệ thống: Gồm 3 1. Xây dựng/xác định mô hình -
Identification
2. Ước lượng Estimation 3. Kiểm định mô hình - Model
diagnostic checking
Economics 20 - Prof. Anderson
3
Phương pháp Box Jenkins
Bước 1: Xây dựng mô
Kiểm định nghiệm đơn vị, xem xem có
cần lấy sai phân số liệu hay Xác định bậc p và q
Economics 20 - Prof. Anderson
4
Phương pháp Box Jenkins
Bước 2: (cid:132) Ước lượng các tham số của mô hình (cid:132) Việc ước lượng có thể được thực hiện bằng phương pháp khả năng cực đại hoặc, bình phương cực tiểu phi tuyến
Bước 3: Kiểm định (cid:132) Kiểm định dựa trên phần dư của mô hình
Economics 20 - Prof. Anderson
5
Dãy số nhiễu trắng
Nếu dãy số thời gian εt là nhiễu trắng ta có vơi mọi t:
=
0)ε(E t
2
=
σ)ε(Var t
ε,ε(Cov
for
s
0
0) =
≠
t
st −
Economics 20 - Prof. Anderson
6
Chỉ xét các dãy số cân bằng
Xem các phần bài giảng trước về định nghĩa của một dãy số cân bằng Hai yếu tố cơ bản để xây dưng mô hình ARMA và để dự báo là: (cid:132) Hàm tự tương quan của mẫu (sample
autocorrelation function - ACF)
(cid:132) Hàm tự tương quan một phần của mẫu (sample
partial autocorrelation function - PACF)
Economics 20 - Prof. Anderson
7
Hàm số tự tương quan của mẫu (SAMPLE AUTOCORRELATION FUNCTION) (còn được gọi là correlogram)
( Y,YvoˆC
)
kt −
k
,...2,1,0
=
=
±±=
( Y,YrroˆC
)
t
r k
kt −
t
t )Y(raˆV)Y(raˆV kt −
Chúng ta muốn ước lượng rk với k=1,2,3,… Có thể làm điều này một cách dễ dàng trong STATA với lệnh AC
Economics 20 - Prof. Anderson
8
Hàm ACF của dãy nhiễu trắng (400 quan sát lấy từ phân phối chuẩn N(0,1) )
1.00
ACF-u
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
0
10
5 Economics 20 - Prof. Anderson
9
Hàm tự tương quan một phần của mẫu (sample partial autocorrelation function - PAC)
The kth order estimated or sample PAC coefficient, denoted here , is obtained as the parameter estimate of
kkφˆ in the kth order autoregression
kφ
Yφ
Yφ
ε
φY =
+
+
... ++
+
t
0
2t2
Yφ k
t
1t1 −
−
kt −
Economics 20 - Prof. Anderson
10
1.00
PACF-u
Hàm PACF của mẫu của một dãy nhiễu trắng
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
Economics 20 - Prof. Anderson
11
0 5 10
Dãy số tự qui (autoregressive processes) Nếu Y là một dãy số tự qui bậc nhất AR (1), thì sẽ có dạng
1,...,
T
= t, ε + Yφ + φ = Y
1-t
t
t
0
NID(0,
2 )σ
1 ~ ε t
Economics 20 - Prof. Anderson
12
1,...,
T
Dãy số tự qui (autoregressive processes) Nếu Y là một dãy số tự qui bậc p AR (p), thì sẽ có dạng = t, ε + Yφ + ... + Yφ + φ = Y
p-t
1-t
t
t
0
1
p
NID(0,
2 )σ
~ ε t
Economics 20 - Prof. Anderson
13
8 Y2
Y2 an AR(1) series: Y2t = 2 +0.5Y2t-1 + εt
7
6
5
4
3
2
1
0
Economics 20 - Prof. Anderson
14
0 50 100 150 200 250 300 350 400
Dãy số trung bình trượt MA (1) Nếu Y là một dãy số trung bình trượt bậc nhất MA (1), thì Y sẽ có dạng
t
εθ+ε+γ=Y t 1-t1
+... +
+
t
2-t2
t
q-t
Dãy MA (q) Nếu Y là một dãy trung bình trượt bậc q thì Y sẽ có dạng εθ εθ 1-t1 q
εθ
ε
+ + = Y γ
Economics 20 - Prof. Anderson
15
Y1
An MA(2) process
5
4
3
2
1
0
-1
16
0 50 100 300 350 400 250 200 150 Economics 20 - Prof. Anderson
Dãy số ARMA
Y là một dãy số ARMA (p,q) :
Yφ
ε
εθ
YφαY +=
... ++
+
+
... ++
t
ptp
t
qtq
1t1 −
−
εθ 1t1 −
−
Economics 20 - Prof. Anderson
17
Một dãy số/mô hình ARMA(p,q) nếu lựa chọn được bậc p và q phù hợp, có thể mô phỏng (mimic) bất kỳ một dãy số thời gian nào Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể: • Tìm được giá trị phù hợp của p và q (xác định mô hình), và • Ước lượng được các tham số của mô hình ARMA model sử dụng các thong tin trong quá khứ của Yt (ước lượng mô hình)
Thì chúng ta có thể sử dụng mô hình ARMA để dự báo các giá trị trong tương lai của Yt.
Economics 20 - Prof. Anderson
18
Dãy số tự qui và hàm số tự tương quan (ACF)và hàm tương quan một phần (PACF) Với một dãy số AR(p) thuần túy ta có: Hàm số tự tương quan (ACF) có xu hướng giảm dần khi k tăng lên Hàm số tự tương quan một phần (PACF) sẽ có xu hướng Cho ta biết một điểm cắt (a cut off point), điểm cắt này tương ứng với việc hàm số tự tương quan một phần sẽ khác 0 v các k ≤ p, nhưng sẽ bằng 0 (xấp xỉ) với k>p.
Economics 20 - Prof. Anderson
19
ACF-Y2
1.0
Y2, an AR(1) series
0.5
0.0
-0.5
5 10
PACF-Y2
0 1.0
0.5
0.0
-0.5
20
0 5 10 Economics 20 - Prof. Anderson
Dãy số MA và hàm tự tương quan (ACF) và hàm tự tương quan một phần PACF Khi ước lượng các hàm ACF và PACF, thì chúng có các đặc điểm sau để phân biệt đối với dãy số MA (q) thuần túy • Hàm ACF có điểm cắt (cut-off point) là điểm mà hệ số tự tương quan rk
có giá trị xấp xỉ bằng không, với mọi k>q
• Hàm PACF có xu hướng giảm dần khi k tăng lên
Economics 20 - Prof. Anderson
21
1.0
MA(2) series
ACF-Y1
0.5
0.0
-0.5
5 10
PACF-Y1
0 1.0
0.5
0.0
Economics 20 - Prof. Anderson
22
-0.5
0 5 10
Một số điểm lưu ý
1: Với mô hình MA(q), ACFq+1 = ACFq+2 = … = 0. 2: Với mô hình AR(q), PACFp+1 = PACFp+2 = … = 0. 3: Nhiễu trắng, ACF1 = ACF2 = … = PACF1 = PACF2 = … = 0.
Economics 20 - Prof. Anderson
23
Đặc điểm của mô hình ARMA
Mô hình Nhiễu trắng
ACF Tất cả đều bằng 0
PACF Tất cả đều bằng 0
MA(1)
Bằng 0 sau 1 bước trễ
Giảm dần từ bước trễ thứ 1
MA(2)
Bằng 0 sau 2 bước trễ
Giảm dần từ bước trễ thứ 2
MA(q)
Bằng 0 sau q bước trễ
Giảm dần từ bước trễ thứ q
AR(1)
Bằng 0 sau 1 bước trễ
Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ 1
AR(2)
Bằng 0 sau 2 bước trễ
Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ 2
AR(p)
Bằng 0 sau p bước trễ
Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ p
ARMA(1,1)
Giảm từ bước trễ thứ 1
Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ 1
ARMA(p,q)
Giảm từ bước trễ thứ q
Giảm theo cấp số nhân (geometric) tình từ bước trễ thứ p
Economics 20 - Prof. Anderson
24
Kiểm định tự tương quan Để kiểm định giả thuyết dưới dạng
0
0 =
:Hvói
ρ k
≠ρ k
a
:H 0 Chúng ta sử dụng hệ số ước lượng tự tương quan, rk, để làm xấp xỉ thay cho (proxies) hệ số tự tương quan thật (true autocorrelation coefficients) và sử dụng hàm phân phối xấp xỉ nếu giả thuyết trống là đúng là:
)
0, N(~ rk
1 T
Như vậy, khoảng tin cậy 95% có thể được xây dựng như sau
rk ±
2 T
Economics 20 - Prof. Anderson
25
Kiểm định tự tương quan từng phần Để kiểm định xem liệu các hệ số tự tương quan từng phần (PAC) ở một độ trễ nào có có khác 0 về mặt thống kê hay không, chúng ta có thể thực hiện như
là ước lượng
kkφ là hệ số tương quan từng phần ở bậc k và
kkφˆ
sau. Gọi dựa trên mẫu. Chúng ta muốn kiểm định giả thuyết sau
vs
0
≠
0
φ :H kk
a
0 = φ :H kk
Chúng ta sử dụng hệ số ước lượng của hệ số tương quan từng phần dựa trên mẫu để thay thế cho tham só thực và sử dụng hàm phân phối xấp xỉ (với điều kiện là giả thuyết trông đúng)
)
0, N(~ φkk
1 T
Nhu vậy chúng ta có thể xây dựng được khoảng tin cậy 95% để sử dụng cho việc kiểm định như sau
φˆ kk ±
2 T
Economics 20 - Prof. Anderson
26
Các bước tiếp theo của phương pháp BOX JENKINS Có 2 bước tiếp theo cần thực hiện: 1. Ước lượng các tham số của mô hình ARMA cho biến Y 2. Tiến hành dự báo (động – dynamic forecast)đối với Y dựa trên mô
hình ARMA vừa ước lượng được.
Dự báo động có thể được tiến hành theo phương pháp đệ qui (recursively).
δ +
ε+ Yφ + Yφ = Y T
1+T
1-T
εθ + εθ + T1
1-T2
1+T
1
2
Dự báo một kỳ tiếp theo (one step/period ahead forecast) chính là kỳ vọng toán có điều kiện của YT+1 dựa trên số liệu quá khứ Y (conditional upon the past history of Y), và có dạng như sau
δˆ +
1-T
T
1+T
εˆθˆ + εˆθˆ + Yφˆ + Yφˆ = Yˆ 2
1
T1
1-T2
Economics 20 - Prof. Anderson
27
Chúng ta biết một mô hình ARMA(p,q) nếu chọn được bậc p và q thích hợp có thể mô tả bất kỳ dãy số thời gian nào Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể: • Tìm được giá trị phù hợp của p và q (xác định mô hình), và • Ước lượng được các tham số của mô hình ARMA model sử dụng các thong
tin trong quá khứ của Yt (ước lượng mô hình)
Thì sau đó chúng ta có thể sử dụng mô hình ARMA vừa ước lượng để dự báo giá trị của Yt trong tương lai. Mục tiêu của chúng ta là dự báo Y trong k giai đoạn trong tương lai. Gọi T là kỳ hiện tại, và gọi $YT+1 là giá trị dự báo của kỳ kế tiếp, và $YT i+ là giá trị dự báo của kỳ T+i trong tương lai, i có thể nhận giá trị từ 1 tới k (i = 1, ...k).
Economics 20 - Prof. Anderson
28
Giá trị dự báo của kỳ thứ 2, YT+2 , là
δˆ + εˆθˆ + Yφˆ + Yˆφˆ = Yˆ
2+T
1+T1
T2
T2
Trong biểu thức này, ta sử dụng số dự báo của kỳ trước YT+1 làm biến giải thích
Economics 20 - Prof. Anderson
29
Dãy số thời gian không cân bằng: Mô hình ARIMA Nếu dãy số Y không cân bằng, thì ta sẽ xử lý như thế nào? Lời giải: Biến đổi số liệu để dãy số trở nên cân bằng. Phương pháp hay dung là lấy sai phân cho đến khi dãy số cân bằng (Thường thì chỉ cần sai phân 1-2 lần là dãy số cân bằng) Gọi dãy số đã sai phân này là biến Z. Sau đó ước lượng mô hình ARMA và dự báo với biến Z. Cuối cùng, tiến hành tích hợp (integrate – reverse the process) c báo Z để thu được ước lượng của Y
Economics 20 - Prof. Anderson
30