intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Kết hợp mạng nơron FIR và mô hình ARIMA theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian

Chia sẻ: ViEngland2711 ViEngland2711 | Ngày: | Loại File: PDF | Số trang:10

65
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nội dung bài viết về một giải pháp để nâng cao hiệu quả dự báo chuỗi thời gian bằng việc kết hợp giữa mạng nơron FIR và mô hình ARIMA, các trọng số sẽ được biến đổi theo thời gian.

Chủ đề:
Lưu

Nội dung Text: Kết hợp mạng nơron FIR và mô hình ARIMA theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian

Công nghệ thông tin<br /> <br /> KẾT HỢP MẠNG NƠRON FIR VÀ MÔ HÌNH ARIMA<br /> THEO HÌNH THỨC ĐỘNG ĐỂ NÂNG CAO HIỆU QUẢ<br /> DỰ BÁO CHUỖI THỜI GIAN<br /> Nguyễn Chí Thành*1, Hà Gia Sơn2<br /> Tóm tắt: Nội dung bài báo viết về một giải pháp để nâng cao hiệu quả dự báo<br /> chuỗi thời gian bằng việc kết hợp giữa mạng nơron FIR và mô hình ARIMA, các<br /> trọng số sẽ được biến đổi theo thời gian. Kết quả dự báo được đánh giá dựa trên<br /> tiêu chí MAE. Phần ứng dụng dựa vào dữ liệu về giá 5 mặt hàng cơ bản bán ra của<br /> thị trường tài chính Forex (Foreign Exchange). Kết quả cho thấy, việc kết hợp này<br /> có hiệu xuất cao hơn việc kết hợp thông thường.<br /> Từ khóa: Mô hình dự báo, ARIMA, Chuỗi thời gian, Mạng nơron FIR.<br /> <br /> 1. ĐẶT VẤN ĐỀ<br /> Dự báo đó chính là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái<br /> nào đó có thể sẽ xảy ra trong tương lai. Dự báo có thể là một dự đoán chủ quan<br /> hoặc trực giác về tương lai. Nhưng để dự báo được hiệu quả hơn, người ta cố loại<br /> trừ những tính chủ quan việc dùng các giải pháp kỹ thuật có độ chính xác cao.<br /> Việc nâng cao hiệu quả dự báo là việc làm cần thiết trong một xã hội hiện đại.<br /> Chính vì vậy, ở nước ngoài , có nhiều công trình nghiên cứu về vấn đề này, đã có<br /> 1 hệ thống lý thuyết gồm nhiều phương pháp, qui trình cũng như nhiều mô hình<br /> để dự báo tương lai như tài liệu [12-13], [15]. Hiện tại, trong lĩnh vực này, đã có<br /> xu hướng kết hợp các lý thuyết hiện đại vào dự báo như ứng dụng các loại mạng<br /> nơron đặc biệt là nơron lai (sự kết hợp của mạng nơron thông thường với các mô<br /> hình khác) như các tài liệu [7-11]. Điều này chứng tỏ sự kết hợp các mô hình, các<br /> công cụ có vai trò rất lớn trong việc dự báo. Trong thời gian gần đây, ở trong<br /> nước, chúng ta đã quan tâm nhiều hơn tới lĩnh vực dự báo, đã có nhiều đề tài các<br /> cấp, với những mục đích và cách tiếp cận khác nhau về dự báo, điển hình là các<br /> công trình [1-4].<br /> Tổng hợp các công trình nghiên cứu cho thấy, ngày càng xuất hiện những mô<br /> hình có hiệu quả cao, tuy nhiên, khi dự báo, có nhiều mô hình được thiết lập và<br /> người ta thường chọn mô hình có hiệu quả cao nhất và bỏ qua các mô hình khác,<br /> điều này gây ra một sự lãng phí, rõ ràng là việc kết hợp các giá trị dự báo cũng<br /> phải được quan tâm. Có một số công trình đã chú ý tới điều này, ví dụ như các<br /> công trình [5-6]. Tuy nhiên, hiệu quả dự báo vẫn chưa được nâng cao do các trọng<br /> số kết hợp giữa các mô hình là một hằng số, không phù hợp với sự biến động của<br /> chuỗi thời gian. Để nâng cao hơn nữa hiệu quả dự báo, tác giả bài viết này sẽ đưa<br /> ra giải pháp kết hợp giữa kết quả dự báo của mạng nơron FIR với mô hình ARIMA<br /> mà các trọng số sẽ thay đổi để thích nghi với sự biến đổi của chuỗi thời gian,<br /> nhằm đạt hiệu quả cao nhất.<br /> Trong bài viết, phần đầu là cơ sở lý thuyết chung và các mô hình về dự báo, ở<br /> mục tiếp theo, tác giả đưa ra giải pháp để phối hợp 2 mô hình FIR và ARIMA theo<br /> hình thức động. Phần sau là một ứng dụng dựa vào dữ liệu của thị trường tài chính<br /> Forex . Kết quả cho thấy, giải pháp phối hợp các mô hình dự báo mà tác giả đưa ra<br /> có hiệu quả cao hơn các mô hình dự báo thông thường mà bài báo [5,6] đã trình bày.<br /> <br /> <br /> 170 N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình … chuỗi thời gian.”<br /> Nghiên cứu khoa học công nghệ<br /> <br /> 2. NỘI DUNG CẦN GIẢI QUYẾT<br /> 2.1. Xây dựng lý thuyết<br /> 2.1.1. Các giá trị thích hợp, dự báo kiểm định và tiên nghiệm<br /> Theo ([15]) trong môi trường dự báo có ba thời đoạn là dùng dữ liệu trong thời<br /> đoạn n1 đến n2 để ước lượng một vài mô hình, các thời đoạn từ n2 + 1 đến n3 để kiểm<br /> định các mô hình, lựa chọn mô hình tốt nhất, hay cũng có thể dùng để kết hợp các<br /> mô hình; và thời đoạn n3 + 1 trở đi được gọi là các giá trị dự báo tiên nghiệm.<br /> 2.1.2. Tiêu chuẩn sai số trung bình để đánh giá mô hình<br /> Theo ([15]), tiêu chuẩn sai số trung bình MAE để đánh giá mô hình dự báo là:<br /> 1 n <br /> Sai số trung bình: MAE   i i<br /> n i1<br /> y  y (2.1)<br /> <br /> <br /> Trong đó, yi là giá trị thực tế và y i là giá trị được dự báo, n là số các quan sát<br /> 2.1.3. Các phương pháp thường sử dụng trong dự báo<br /> Theo ([15]), có hai phương pháp dự báo: dự báo định tính, dự báo định lượng.<br /> -Dự báo định tính: Là dự báo dựa trên phán đoán chủ quan, trực giác của người<br /> ra quyết định. Phương pháp phổ biến là lấy phiếu thăm dò và thu thập ý kiến như<br /> lấy ý kiến các nhà phân phối, người tiêu dùng, chuyên gia… Nhược điểm chung<br /> của phương pháp này là mang tính chủ quan, kinh nghiệm và cảm tính.<br /> -Dự báo định lượng: Các mô hình này sẽ khắc phục được tính chủ quan và cảm<br /> tính trong dự báo bằng cách sử dụng các công cụ toán học. Phương pháp dự báo<br /> định lượng thường dùng phổ biến là dự báo chuỗi thời gian sử dụng các mô hình tự<br /> hồi quy.<br /> Theo [13], [14] và [15] ta có mô hình chuỗi thời gian tự hồi quy hoàn toàn có<br /> cấu trúc như sau:<br /> Yt = α1Yt-1+ α2Yt-2 + … + αpYt-p+ ut (2.2)<br /> Trong đó, Yt là quan sát thứ t đối với biến phụ thuộc và ut là thành phần sai số.<br /> + Mô hình trung bình trượt MA (Moving Average- Trung bình trượt) :<br /> Yt = νt – β1νt-1– β2 νt-2– …– βq νt-q (2.3)<br /> Với νt là chuỗi sai số nhiễu trắng. Do đó, Yt là tổ hợp tuyến tính của các biến<br /> ngẫu nhiên nhiễu trắng.<br /> <br /> <br /> <br /> <br /> Hình 1. Mạng nơron truyền thẳng, hình trái là một tế bào nơron<br /> và bên phải là mạng truyền thẳng.<br /> + Các mô hình ARMA (Auto Regressive Moving Average - Trung bình trượt<br /> kết hợp tự hồi qui), phối hợp giữa các công thức tự hồi quy và trung bình trượt tạo<br /> ra mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát:<br /> Yt = α1Yt-1+ α2Yt-2 + … + αpYt-p+ ut + νt – β1νt-1– β2 νt-2– …– βq νt-q ( 2.4)<br /> <br /> <br /> Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 171<br /> Công nghệ thông tin<br /> <br /> + Mô hình ARIMA: Giả sử rằng, một chuỗi thời gian không dừng có thể được<br /> chuyển thành một chuỗi dừng bằng cách lấy sai phân d sau đó sẽ có thể được mô hình<br /> hoá theo ARMA (p, q). Tích hợp MA và mô hình ARMA được mô hình ARIMA.<br /> + Sử dụng mạng nơron trong dự báo:<br /> - Mạng nơ ron: Mạng nơron nhân tạo, gọi tắt là mạng nơron, là một mô hình xử<br /> lý thông tin phỏng theo cách thức của các hệ nơron sinh học (hình 1).<br /> Xét một tế bào nơron duy nhất được trích từ lớp l của một mạng L lớp . Đầu<br /> vào xil tới nơron sẽ được nhân với 1 hệ số wijl gọi là trọng số đại diện cho các kết<br /> nối khớp thần kinh giữa nơron i trong lớp trước đó và nơron j trong lớp l. Và đầu<br /> ra của nơron , x lj1 , là một hàm sigmoid là tổng trọng số đầu vào của nó:<br /> x lj1  f ( wil xil ) (2.5)<br /> i<br /> <br /> - Mạng nơron FIR (Finite impulse response- mạng đáp ứng xung hữu hạn) :<br /> theo [8-9], trong tế bào nơron của mạng này, khớp tĩnh thay bằng một bộ lọc tuyến<br /> tính FIR. Bộ lọc này có thể được mô hình hóa với một đường trễ phân nhánh như<br /> minh họa trong hình 2. Trong bộ lọc này, đầu ra y(k) sẽ tương ứng với tổng trọng<br /> số giá trị trễ của đầu vào.<br /> T<br /> y ( k )   w(n) x (k  n) (2.6)<br /> n 0<br /> <br /> Điều này tương ứng với các thành phần trung bình trượt của mô hình tự hồi qui<br /> (ARMA-công thức 2.4). Bộ lọc FIR, trên thực tế, là một trong số mạng nơron tốt<br /> nhất có phần tử thích nghi cơ bản để áp dụng vào mô hình ARMA này.<br /> <br /> <br /> <br /> <br /> Hình 2. mô hình bộ lọc FIR.<br /> l 1<br /> Đầu ra x (k ) của lớp l tại thời điểm k bây giờ được tính bằng hàm sigmoid<br /> j<br /> <br /> của tổng của tất cả các kết quả đầu ra l của bộ lọc cung cấp cho nơron (Hình 3):<br /> x lj1 (k )  f ( wil, j .xil (k )) (2.7)<br /> i<br /> <br /> <br /> <br /> <br /> Hình 3. Nơron FIR và mạng nơron FIR.<br /> FIR là một trong những sự lựa chọn tốt nhất trong việc dự báo chuỗi thời gian vì<br /> kích thước nhỏ gọn, lại mang ưu điểm của mạng nơron lai, và đặc biệt đầu ra sẽ<br /> <br /> <br /> 172 N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình … chuỗi thời gian.”<br /> Nghiên cứu khoa học công nghệ<br /> <br /> tương ứng với tổng trọng số giá trị của đầu vào và tương ứng với các thành phần<br /> của mô hình tự hồi quy ARIMA (Theo [8-10]).<br /> 2.1.4. Phối hợp các mô hình dự báo<br /> Giả sử ta đã có kết quả dự báo từ các mô hình FIR và ARIMA, nhiệm vụ<br /> đặt ra là phải kết hợp 2 mô hình này. Theo [6], việc kết hợp được làm như sau:<br /> Đầu tiên, dùng dữ liệu trong thời kỳ mẫu để ước lượng các mô hình, sau đó, dự báo<br /> các giá trị của biến phụ thuộc, dùng các giá trị này để xây dựng tập các trọng số,<br /> tạo các giá trị dự báo ngoài mẫu từ các mô hình riêng biệt và sử dụng các trọng số<br /> đã tìm được. Nếu gọi Yt là giá trị thực tại thời điểm t của biến phụ thuộc, và<br /> f t1 , ft 2 , ......, f tk là các giá trị dự báo được tạo ra bởi k mô hình khác nhau. Phương<br /> pháp đương nhiên là tạo ra giá trị trung bình có trọng số của các giá trị dự báo này.<br /> Do vậy, giá trị dự báo kết hợp sẽ là:<br />    <br /> f t   0   1 f t1   2 f t 2  .....  k f tk (2.8)<br /> Trong đó, ˆ0 , ˆ1 , .. ˆk - Các trọng số cần xác định. Xác định các trọng số bằng<br /> phương pháp Ước lượng tham số của mô hình hồi qui bội, cụ thể như sau:<br /> Theo[15] và [6], trong thực tế chúng ta thường chỉ có dữ liệu từ mẫu. Từ số liệu<br /> mẫu chúng ta ước lượng hồi qui tổng thể. Hàm hồi qui mẫu:<br /> Yi  ˆ1  ˆ2 X 2,i  ˆ3 X 3,i  ...  ˆk X k ,iei (2.9)<br />  ei  Yi  Yˆi  Yi  ˆ1  ˆ2 X 2,i  ˆ3 X 3,i  ...  ˆk X k ,i (2.10)<br /> Hay viết dưới dạng ma trận Y  Xˆ  e trong đó:<br />  ˆ1   e1 <br />    <br />  ˆ  ; e  = Y  Xˆ<br /> ˆ<br />   2  e  2 <br />  ...  ...<br />  <br />  ˆ   .e <br />  . k   k<br /> Với các ˆ m là ước lượng của tham số  m . Chúng ta trông đợi ˆm là ước lượng<br /> không chệch của  m , hơn nữa phải là một ước lượng hiệu quả. Áp dụng phương<br /> pháp bình phương tối thiểu, chọn 1 ,  2 , ...  k sao cho:<br /> n n 2<br /> <br />  e   Y  ˆ<br /> i 1<br /> 2<br /> i<br /> i 1<br /> i 1  ˆ2 X 2,i  ˆ3 X 3,i  ...  ˆk X k ,i  (2.11)<br /> <br /> đạt cực tiểu. Điều kiện cực trị của (2.10) là:<br /> n<br />   ei2 n<br /> i 1<br /> <br />  1<br /> <br />  2 Yi  ˆ1  ˆ 2 X 2,i  ˆ 3 X 3,i  ...  ˆ K X K ,i  0 <br /> i 1<br /> n<br /> (2.12)<br />   ei2 n<br /> <br /> <br />  2<br /> i 1<br /> <br />  2 Yi  ˆ1  ˆ 2 X 2,i  ˆ 3 X 3,i  ...  ˆ K X K ,i X 2,i  0 <br /> i 1<br /> <br /> ...<br /> n<br />   ei2 n<br /> <br /> <br />  k<br /> i 1<br /> <br />  2 Yi  ˆ1  ˆ 2 X 2,i  ˆ 3 X 3,i  ...  ˆ K X K ,i X k ,i  0 <br /> i 1<br /> <br /> Hệ phương trình (2.11) được gọi là hệ phương trình chuẩn của hồi qui mẫu<br /> (2.8). Viết hệ dưới dạng ma trận là:<br /> <br /> <br /> Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 173<br /> Công nghệ thông tin<br /> <br /> X X ˆ<br /> T<br />  X T Y  ˆ  ( X T X ) 1( X T Y ) (2.13)<br />  Yi<br /> <br /> <br /> <br /> n<br /> <br /> X 2i X 3i ... . X ki <br /> <br />  X 2iYi   X 2 i X X 2i X 2 i X 3i ...... X 2 i X ki <br /> T   T <br /> 2i<br />  (2.14)<br /> X Y  .  X X  . <br /> .  . <br />    <br /> . X kiYi   X ki X ki X 2i  X ki X 3i ...... X ki X ki <br /> <br /> Giải thuật hồi qui bội (theo [6]) để xác định các hệ số này là:<br /> Input matran(n,k) // bảng kết quả trên<br /> Ouput mangbeta // mangbeta chứa các giá trị  0 , 1.... n .<br /> Giải thuật:<br /> 1. Xây dựng ma trận XTY //theo công thức (2.14)<br /> 2. Xây dựng ma trận XTX //theo công thức (2.14)<br /> 3. Tính giá trị định thức XTX<br /> 4. Tính ma trận nghịch đảo của (XTX)<br /> 5. Tính tích ˆ  ( X T X ) 1 ( X T Y ) để xác định hệ số 0 , 1.... n<br /> Có 1 ý tưởng mà bài viết đưa ra là kết hợp FIR với 1 mô hình dự báo chuỗi thời<br /> gian khác (đơn giản nhất là ARIMA), tuy nhỉên, sự kết hợp này cần phải “động”.<br /> Cụ thể: thông thường, các hệ số  0 , 1 ...... n ,  n1 khi tìm đuợc luôn là một hằng số,<br /> tuy nhiên, trong trường hợp “động”, các hệ số này sẽ thay đổi theo thời gian.<br /> Theo [15], trong dự báo kinh tế, người ta thường sử dụng 10 hàm thông dụng là:<br /> bậc một, bậc hai, logarit – tuyến tính, nghịch đảo, tương tác, tuyến tính-logarit,<br /> nghịch đảo – logarit, bậc hai – logarit, log-hai lần, logistic. Để đơn giản, ta sẽ sử<br /> dụng hàm bậc nhất trong phần ứng dụng minh họa. Giả định rằng trong mô hình<br /> trên,  i   i 0   i1t với t thể hiện thời gian từ 1 đến n, và i = 0, 1,..., k (k là các mô<br /> hình phối hợp). Điều này dẫn đến mô hình cải biến:<br /> Yt   00   01t  10 f t1  11 (tf t1 )  .....   ko f tk   k1 (tf tk )  ut (2.15)<br /> Nếu đặt : 00  01t  A0 ,10  A1 .....1k  Ak ,11  Ak 1....k1  A2k<br /> Và ft1  F1 ,.... ftk  Fk , (tf t1 )  Fk 1 ,...(tftk )  F2 k ta sẽ có phương trình:<br /> Yt  A0  A1F1  A2 F2  ........ Ak Fk  Ak 1Fk 1  ...... A2 k F2 k<br /> Nếu đặt n  2k ta có phương trình : Yt  A0  A1F1  ..... An Fn . (2.16)<br /> Đây chính là phương trình hồi qui cơ bản (2.8), có thể dùng giải thuật trên để<br /> xác định các hệ số A0 , A1 , .... An này.<br /> 2.2. Ứng dụng: Dự báo giá bán ra của 5 mặt hàng cơ bản trên thị trường tài<br /> chính Forex<br /> - Dữ liệu: Trong ứng dụng này, luận án lấy dữ liệu về giá 5 mặt hàng cơ bản là<br /> dầu thô WTI, khí tự nhiên, vải Cotton Hoa kỳ loại 2, cà phê Luân Đôn, thóc bán ra<br /> ở trang web trang http://www.investing.com của thị trường tài chính Forex. Dữ<br /> liệu bắt đầu từ 17/06/2010 đến 10/05/2017, gồm 1780 trường hợp. Biểu đồ dữ liệu<br /> như hình 4.<br /> - Dự báo bằng việc sử dụng mạng nơron FIR và sử dụng mô hình chuỗi thời<br /> gian (dùng mô hình ARIMA) cho từng biến.<br /> <br /> <br /> 174 N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình … chuỗi thời gian.”<br /> Nghiên cứu khoa học công nghệ<br /> <br /> + Dự báo bằng ARIMA: Sau khi đã thử nghiệm, các thông số về mô hình tối ưu<br /> lựa chọn theo tiêu chuẩn MAE của các biến là: Dầu có mô hình ARIMA(1,1,2),<br /> Khí có mô hình ARIMA(1,1,1), Vải có mô hình ARIMA(1,2,1), Cà phê có mô<br /> hình ARIMA(1,1,2) và Thóc có mô hình ARIMA(2,1,2).<br /> Th ó c<br /> Cà p h ê lu â n đ ô n Dầ u th ô<br /> <br /> <br /> <br /> <br /> 2 0,00<br /> <br /> <br /> 3 ,00 120 1 8 ,00<br /> <br /> <br /> 1 6 ,00<br /> 2 ,5 0 1 00<br /> 1 4 ,00<br /> <br /> <br /> 2 ,00 80<br /> 1 2 ,00<br /> <br /> <br /> 1 0,00 Th ó c<br /> 1 ,5 0 Cà p h ê lu â n đ ô n 60 Dầ u th ô<br /> 8 ,00<br /> <br /> 1 ,00 40<br /> 6 ,00<br /> <br /> <br /> 4 ,00<br /> 0,5 0 20<br /> 2 ,00<br /> <br /> <br /> 0,00 0<br /> 0,00<br /> <br /> 1 187 373 559 745 931 1117 1 3 03 1 4 8 9 1 6 7 5 1 163 325 487 649 811 973 1135 1297 1459 1621 1 163 325 487 649 811 973 1135 1297 1459 1621<br /> <br /> <br /> <br /> <br /> Kh ítựn h iê n Vả ic o to n<br /> <br /> <br /> <br /> <br /> 7 ,000 250<br /> <br /> <br /> <br /> 6 ,000<br /> 2 00<br /> <br /> <br /> 5 ,000<br /> <br /> 150<br /> 4 ,000<br /> <br /> Kh ítựn h iê n Vả ic o to n<br /> <br /> 3 ,000 1 00<br /> <br /> <br /> <br /> 2 ,000<br /> 50<br /> <br /> 1 ,000<br /> <br /> <br /> 0<br /> 0,000<br /> 1 171 341 511 681 851 1 02 1 1 1 9 1 1 3 6 1 1 5 3 1 1 7 01<br /> 1 173 345 517 689 861 1 03 3 1 2 05 1 3 7 7 1 5 4 9 1 7 2 1<br /> <br /> <br /> <br /> <br /> Hình 4. Biểu đồ biến động giá 5 mặt hàng cơ bản.<br /> + Dự báo bằng mạng nơron FIR: Dữ liệu huấn luyện là tập các cặp (Xh, Dh),<br /> Xh trong đó là thông số giá vàng lúc mở, lúc cao nhất và thấp nhất của ngày h, Dh<br /> là thông số giá vàng của ngày h+1. Tức là Dh =Xh1. Quá trình huấn luyện thực<br /> hiện theo giải thuật lan truyền ngược. Do số nơron đầu vào và đầu ra là 1 nên kích<br /> thước của FIR rất nhỏ gọn, tuy nhiên, phải chọn số lớp ẩn là 2, kính thước mạng đã<br /> thử nghiệm là 1x3x4x1, 1x4x5x1, 1x5x6x1 nhận được để dự báo các biến, thông số<br /> mạng nơron sau khi đã thử nghiệm có MAE nhỏ nhất là 1x3x4x1, Áp dụng mạng<br /> nơron FIR để dự báo các biến, thông số mạng nơron sau khi đã thử nghiệm có<br /> MAE nhỏ nhất là 1x3x4x1, Số mẫu trong thời kỳ ước lượng từ 1-1100, kiểm định<br /> là 1101 tới 1400 và tiên nghiệm là 1401-1580.<br /> - Kết hợp giữa dự báo bằng FIR và dự báo bằng mô hình ARIMA:<br /> + Phân bố dữ liệu: Với 580 dữ liệu còn lại, ta sẽ phân bổ như sau:<br />  400 dữ liệu đầu, dùng trong thời kỳ ước lượng dự báo trong mẫu: sử dụng dữ<br /> liệu trong thời đoạn này để ước lượng một hoặc một vài mô hình.<br />  Thời kỳ dự báo kiểm định: từ 401 đến 490, trong đó, giá trị thực tế của Y và<br /> tất cả các X s đều đã biết. Nếu trong thời đoạn này, MAE nhỏ hơn thì mô<br /> hình được đánh giá là tốt hơn và được lựa chọn.<br />  Thời kỳ dự báo tiên nghiệm: thời đoạn 491 tới 580 dùng để chứng minh các<br /> tham số được chọn là đúng.<br /> + Kết hợp tĩnh: nếu sử dụng giải thuật hồi qui bội (ở mục 2.1.4) để xác định các<br /> hệ số  0 , 1 ,  2 , ta sẽ có kết quả cụ thể  0 , 1 ,  2 của dầu tương ứng là -0.93887,<br /> 1.01218 và 0.00588; của mặt hàng khí là :-0.25108, 1.09152, -0.00427; Vải: -<br /> 6.54752, 1.10957, 0.00189; cà phê: -0.33732, 1.15558, 0.01981 và thóc là : -<br /> 1072.73918, 0.87007, 98.31207. Các hệ số này sẽ không thay đổi theo thời gian<br /> nên ta gọi phương pháp này là “Kết hợp tĩnh”. Sai số trung bình MAE của các mặt<br /> hàng này được nêu tại bảng 1.<br /> <br /> <br /> Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 175<br /> Công nghệ thông tin<br /> <br /> + Kết hợp động: Gọi mô hình ARIMA của từng biến là f1 và FIR của từng<br /> biến là f 2 . Nếu kết hợp với nhau, ta sẽ có mô hình mới Yt theo công thức:<br /> Yt   0  1 f1   2 f 2<br /> Nhưng do hệ số 1 thay đổi theo thời gian, còn  2 là hệ số của mô hình FIR<br /> chính xác hơn so với mô hình ARIMA nên giữ nguyên, không đổi. (Tuy nhiên, có<br /> thể mở rộng bằng việc cho  2 thay đổi theo thời gian).<br /> Ta có : 0   00  10t và 1  10  11t .<br /> Phương trình trên sẽ trở thành : Yt   00  10t  (10  11t ) f1   2 f 2<br /> Yt   00  10t  10 f1  11tf1   2 f 2<br /> Đặt A0   00  10t , 10  A1 ,11  A3 , tf1  f3 ,  2  A2 ta sẽ có một phương trình hồi qui<br /> đầy đủ là : Yt  A0  A1 f1  A2 f 2  A3 f3<br /> Để kết hợp các mô hình trong dự báo, phải xác định chính xác các hệ số A0, A1,<br /> A2, A3. Nhưng trước tiên, ta sẽ xác định giá trị f 3  tf1 . Ta có thể tính f 3 bằng tích<br /> giữa biến ARIMA này với thời gian t .<br /> Sử dụng giải thuật kết hợp các mô hình bằng phương pháp hồi qui bội, cụ thể là:<br /> Input: matran(1080,5) // ma trận chứa bảng số liệu<br /> Output:MAEFIR, MAEARIMA, MAEkethop, R2, giá trị kết hợp.<br /> Thuật toán<br /> 1. Tinh tf1<br /> 2. Matran(i,5)=matran(i,4)*matran(i,1)<br /> 3. Xây dựng ma trận XTX<br /> 4. Xây dựng ma trận XTY<br /> 5. Tính định thức D x t x bằng phương pháp Gaus<br /> 6. Tính ma trận nghịch đảo của (XTX)<br /> 7. Tính tích 2 ma trận để xác định hệ số A0,A1….A3<br /> 8. Tính độ lệch trung bình Ytb<br /> 9. Xác định các giá trị MAE Và R2: duyệt toàn bộ miền kiểm định tính giá trị<br /> kết hợp<br /> Ta sẽ xác định được các hệ số A0, A1, A2, A3 tương ứng của từng biến. Kết quả<br /> khi sử dụng giải thuật này được đánh giá bằng tiêu chuẩn MAE cho tại bảng 1.<br /> Bảng 1. Các tham số MAE tại miền kiểm định và tiên nghiệm.<br /> Tên mô hình<br /> TT Dầu Khí Vải Cà phê Thóc<br /> dự báo<br /> Miền kiểm định<br /> 1. ARIMA 7.4069 0.1416 30.7849 0.1416 3.6665<br /> 2. FIR 0.8161 0.0415 1.0935 0.0415 4.9045<br /> 3. Kết hợp tĩnh 0.8231 0.0774 0.1488 0.0246 1.9294<br /> 4. Kết hợp động 0.8059 0.0246 0.1684 0.0240 1.3259<br /> 5. MAE nhỏ nhất 0.8059 0.0246 0.1684 0.0246 1.3259<br /> 6. Mô hình có Kết hợp Kết hợp Kết hợp Kết hợp Kết hợp<br /> MAE nhỏ nhất động động động động động<br /> Miền tiên nghệm<br /> <br /> <br /> 176 N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình … chuỗi thời gian.”<br /> Nghiên cứu khoa học công nghệ<br /> <br /> 7. ARIMA 12.0432 0.0470 36.3148 0.0470 3.9577<br /> 8. FIR 0.6002 0.0767 1.5961 0.0767 4.5863<br /> 9. Kết hợp tĩnh 0.6122 0.0609 0.1735 0.0295 3.4323<br /> 10. Kết hợp động 0.5944 0.0250 0.1222 0.0250 3.5458<br /> 11. MAE nhỏ nhất 0.5944 0.0250 0.1222 0.0250 3.5458<br /> 12. Mô hình có MAE Kết hợp Kết hợp Kết hợp Kết hợp Kết hợp<br /> nhỏ nhất động động động động động<br /> Đồ thị giữa kết quả, dự báo của FIR và dự báo ARIMA và kết hợp cả hai mô<br /> hình theo hình thức tĩnh và động tại miền kiểm định và miền tiên nghiệm của từng<br /> biến sẽ như sau:<br /> 60 60<br /> <br /> <br /> 50 50<br /> <br /> <br /> 40 ket qua 40 ketqua<br /> ket hop dong kethop dong<br /> 30 arima 30 arima<br /> Fir fir<br /> 20 ket hop tinh 20 ket hop tinh<br /> <br /> <br /> 10 10<br /> <br /> <br /> 0 0<br /> 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88<br /> <br /> <br /> <br /> <br /> Hình 5. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động<br /> của mặt hàng “dầu” trong miền kiểm định (trái) và tiên nghiệm (phải).<br /> 4,5 4,5<br /> <br /> 4 4<br /> <br /> 3,5 3,5<br /> <br /> 3 3 ketqua<br /> ketqua<br /> ket hop dong 2,5 ket hop dong<br /> 2,5<br /> arima arima<br /> 2 2<br /> Fir Fir<br /> <br /> 1,5 ket hop tinh 1,5 ket hop tinh<br /> <br /> 1 1<br /> <br /> 0,5 0,5<br /> <br /> 0 0<br /> 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88<br /> <br /> <br /> <br /> <br /> Hình 6. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động<br /> của mặt hàng “khí” trong miền kiểm định (trái) và tiên nghiệm (phải).<br /> 2,5 2,5<br /> <br /> <br /> <br /> 2 2<br /> <br /> ketqua ketqua<br /> 1,5 ket hop dong 1,5 ket hop dong<br /> arima arima<br /> <br /> 1 Fir 1 Fir<br /> ket hop tinh ket hop tinh<br /> <br /> 0,5 0,5<br /> <br /> <br /> <br /> 0 0<br /> 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88<br /> <br /> <br /> <br /> <br /> Hình 7. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động<br /> của mặt hàng “cà phê” trong miền kiểm định (trái) và tiên nghiệm (phải).<br /> 90 90<br /> <br /> 80 80<br /> <br /> 70 70<br /> <br /> 60 ketqua 60 ketqua<br /> <br /> 50 ket hop dong 50 ket hop dong<br /> arima arima<br /> 40 40<br /> Fir Fir<br /> 30 ket hop tinh 30 ket hop tinh<br /> <br /> 20 20<br /> <br /> 10 10<br /> <br /> 0 0<br /> 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88<br /> <br /> <br /> <br /> <br /> Hình 8. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động<br /> của mặt hàng “vải” trong miền kiểm định (trái) và tiên nghiệm (phải).<br /> <br /> <br /> <br /> Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 177<br /> Công nghệ thông tin<br /> 25 25<br /> <br /> <br /> <br /> 20 20<br /> <br /> ketqua ketqua<br /> 15 ket hop dong 15 ket hop dong<br /> fir fir<br /> <br /> 10 arima 10 arima<br /> ket hop tinh ket hop tinh<br /> <br /> 5 5<br /> <br /> <br /> <br /> 0 0<br /> 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88<br /> <br /> <br /> <br /> <br /> Hình 9. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động<br /> của mặt hàng “thóc” trong miền kiểm định (trái) và tiên nghiệm (phải).<br /> Nhận xét: Trong 5 trường hợp của cả 2 miền, ta thấy rằng:<br /> +Phương pháp kết hợp bình thường (kết hợp tĩnh) chưa mang lại hiệu quả cao (ở<br /> miền kiểm định, mặt hàng dàu và khí có MAE thậm chí còn thấp hơn so với FIR).<br /> +Sự kết hợp giữa FIR và ARIMA theo hình thức động đều mang lại hiệu quả tốt<br /> nhất (MAE nhỏ nhất) tại cả 2 miền kiểm định và tiên nghiệm.<br /> +Do trong khuôn khổ một bài báo, chỉ sử dụng 5 ví dụ ứng dụng, khi mở rộng<br /> các ứng dụng dự báo, ta còn giai đoạn kiểm định mô hình, nếu việc kết hợp theo<br /> hình thức “động” không mạng lại kết quả tốt hơn, thì vẫn có quyền lựa chọn lại<br /> kết quả mà FIR, ARIMA hoặc kết hợp tĩnh có MAE bé nhất làm kết quả dự báo.<br /> 3. KẾT LUẬN<br /> Trong nghiên cứu thực tế, quy trình phổ biến được các nhà phân tích chấp nhận<br /> là ước lượng một số các mô hình, và cuối cùng chọn lấy mô hình nào là “tốt nhất”<br /> theo mục tiêu. Tuy nhiên, các mô hình bị bỏ đi vẫn chứa những thông tin về các<br /> động thái rõ nét của biến phụ thuộc và lập luận rằng việc kết hợp dự báo từ nhiều<br /> mô hình sẽ tốt hơn là từ một mô hình duy nhất. Bài báo này đã tổng hợp được các<br /> tài liệu để có cái nhìn tổng quan về dự báo, đưa ra giải pháp xây dựng một mô hình<br /> kết hợp giữa mạng nơron FIR và ARIMA để nâng cao hiệu quả dự báo dựa vào<br /> việc giải thuật hồi qui bội để tìm ra được các trọng số kết hợp thay đổi theo thời<br /> gian. Bài báo này là một hướng nghiên cứu mở, có thể tiếp tục phát triển bằng việc<br /> sử dụng các hàm khác ngoài hàm bậc 1 đã nêu để nâng cao hiệu quả dự báo.<br /> Lời cảm ơn: Tác giả xin chân thành cám ơn tập thể cán bộ, nhân viên Viện CNTT, và<br /> đặc biệt là 02 TS Ngô Trọng Mại và Tôn Thiện Chiến đã giúp đỡ tận tình về mặt ý tưởng<br /> cũng như khi thực hiện chi tiết bài báo.<br /> TÀI LIỆU THAM KHẢO<br /> [1]. Đỗ Quang Giám, Vũ Thị Hân (2012), “Xây dựng mô hình Arima cho dự báo<br /> khách du lịch quốc tế đến Việt Nam”, Tạp chí Khoa học và Phát triển : Tập<br /> 10, số 2: 364 - 370 , Trường ĐH Nông Nghiệp Hà Nội<br /> [2]. Vũ Thị Gương ( 2012 ), “Kỹ thuật khai phá dữ liệu chuỗi thời gian áp dụng<br /> trong dự báo chứng khoán”, luận án Thạc sĩ khoa học CNTT, Học viện Bưu<br /> chính Viễn Thông, Hà nội<br /> [3]. Nguyễn Khắc Hiếu, 2014. "Mô hình ARIMA và dự báo lạm phát 6 tháng cuối<br /> năm 2014" . Tạp chí Kinh Tế và Dự Báo số 16, tháng 8-2014 .<br /> [4]. Phạm Văn Khánh (2008) , “Phân tích thống kê dự báo và mô phỏng một số<br /> chuỗi thời gian ”, Luận án Tiến sỹ Toán ứng dụng , ĐH QG Hà Nội, Hà Nội.<br /> [5]. Hà Gia Sơn, Một giải pháp phối hợp mô hình trong dự báo, Tạp chí Nghiên<br /> cứu Khoa học và Công nghệ quân sự số 39 tháng 10 năm 2015, tr 82-89.<br /> <br /> <br /> 178 N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình … chuỗi thời gian.”<br /> Nghiên cứu khoa học công nghệ<br /> <br /> [6]. Hà Gia Sơn, Đỗ Văn Đỉnh, “Ứng dụng phương pháp hồi qui bội để kết hợp<br /> các mô hình dự báo”, Tạp chí Khoa học và Công nghệ số 13 tháng 8 năm<br /> 2017, tr 69-Trường ĐH Sao Đỏ (ISSN-2354-0575).<br /> [7]. C. Lee Giles, Steve Lawrence, A. C. Tsoi (2001)- “Noisy Time Series<br /> Prediction using a Recurrent Neural Network and Grammatical Inference” -<br /> Machine Learning, Volume 44, Number 1/2, July/August, pp. 161–183,<br /> [8]. Eric A Wan ( 2003), “Finite Impulse Response Neural Networks for<br /> Autoregressive Time Series Prediction”, Proceedings of the NATO Advanced<br /> Workshop on Time Series Prediction and Analysis, Sante Fe, NM.<br /> [9]. Eric A Wan (2004), “Finite Impulse Response Neural Networks With<br /> Application In Time Series Prediction” - a dissertation submitted to the<br /> department of electrical engineering and the committee on graduate studies of<br /> stanford university in partial fulfillment of the requirements for the degree of<br /> doctor of philosophy.<br /> [10]. Ho Joon Kim(2005), “Time Series Prediction Using an Interval Arithmetic<br /> FIR Network”, Neural Information Processing - Letters and Reviews Vol.8,<br /> No.3, September<br /> [11]. Luis Aburto, Richard Weber (2012), “Demand Forecast in a Supermarket<br /> using a Hybrid Intelligent System”, Department of Industrial Engineering,<br /> University of Chile, pp 143-151.<br /> [12]. Michael Falk , Frank Marohn (2012), “A First Course on Time Series Analysis<br /> - Examples with SAS”, by Chair of Statistics, University of Wurzburg.<br /> [13]. Michael K. Evans (2002), “Practical Bususiness Forecasting”, Blackwell<br /> Publishers Ltd, a Blackwell Publishing company. Bodmin, Cornwall.<br /> [14]. Marek Hlav’acek (2009), “Seasonal Time Series Modeling Via Neural<br /> Networks With Swithching Units”, PHD Czech Technical University Prague<br /> [15]. N.Gujarati (2004), “Basic Econometrics”, Fourth Edition-The McGraw−Hill<br /> Companies.<br /> ABSTRACT<br /> FIRST ARRIVAL AND ARIMA MODEL COMPLETES TO IMPROVE<br /> TIME EFFICIENCY FOR TIME.<br /> The article is about a solution to improve the efficiency of time series<br /> forecasting by combining FIR neural networks and ARIMA models, the<br /> weights will be varied over time. The results are based on the MAE criteria.<br /> The application is based on data on prices of five basic commodities sold in<br /> the Forex market (Foreign Exchange). The results show that this<br /> combination is more effective than conventional combination.<br /> Keywords: Model of forecast, ARIMA method, Combined method, Time series.<br /> Nhận bài ngày 16 tháng 8 năm 2017<br /> Hoàn thiện ngày 26 tháng 11 năm 2017<br /> Chấp nhận đăng ngày 28 tháng 11 năm 2017<br /> Địa chỉ: 1 Viện CNTT- Viện KH&CN Quân sự;<br /> 2<br /> Trường Đại học Công nghiệp Việt-Hung.<br /> *<br /> Email : Thanhnc80@gmail.com.<br /> <br /> <br /> <br /> Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 179<br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
18=>0