![](images/graphics/blank.gif)
Luận án Tiến sĩ Máy tính: Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ
lượt xem 5
download
![](https://tailieu.vn/static/b2013az/templates/version1/default/images/down16x21.png)
Luận án Tiến sĩ Máy tính "Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ" trình bày các nội dung chính sau: Xây dựng các mô hình dự báo chuỗi thời gian mờ với NQHM_PTTG và ứng dụng; Nâng cao hiệu quả của mô hình dự báo sử dụng các kỹ thuật tính toán mềm.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận án Tiến sĩ Máy tính: Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ
- BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ----------------------------- NGHIÊM VĂN TÍNH MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ BÁO TRONG MÔ HÌNH CHUỖI THỜI GIAN MỜ LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH HÀ NỘI – 2022
- BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ----------------------------- NGHIÊM VĂN TÍNH MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ BÁO TRONG MÔ HÌNH CHUỖI THỜI GIAN MỜ LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Chuyên ngành: Khoa học máy tính Mã số: 9 48 01 01 Người hướng dẫn khoa học: 1. TS. Nguyễn Công Điều 2. TS. Nguyễn Minh Tuấn Hà Nội – 2022
- 1 LỜI CAM ĐOAN Tác giả xin cam đoan luận án “Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ” là công trình nghiên cứu của bản thân tác giả. Ngoại trừ các trích dẫn từ tài liệu tham khảo được ghi rõ trong luận án, các kết quả nghiên cứu và các kết luận nêu trong luận án là hoàn toàn trung thực, chưa từng được công bố trong các công trình nào khác. Những đóng góp của luận án đã được công bố trên các tạp chí khoa học chuyên ngành và các hội thảo với sự đồng ý của các đồng tác giả trước khi đưa vào luận án. Những số liệu trong các bảng biểu và hình vẽ phục vụ cho việc phân tích, so sánh, đánh giá do chính tác giả thu thập từ các thử nghiệm. Tác giả của luận án Nghiêm Văn Tính
- 2 LỜI CẢM ƠN Luận án của tác giả được thực hiện tại Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, dưới sự hướng dẫn tận tình của thầy TS. Nguyễn Công Điều và TS. Nguyễn Minh Tuấn. Lời đầu tiên cho phép tôi được bày tỏ lòng kính trọng và biết ơn sâu sắc đến hai Thầy về định hướng khoa học, người đã động viên, trao đổi nhiều kiến thức và hướng dẫn tôi vượt qua những khó khăn để hoàn thành luận án. Tôi cũng xin gửi lời cảm ơn chân thành đến các nhà khoa học, tác giả của các công trình công bố đã được trích dẫn trong luận án, đây là những tư liệu quý báu, kiến thức liên quan làm nền tảng giúp tôi hoàn thành luận án. Tôi xin chân thành gửi lời cảm ơn đến các thầy PGS. TSKH. Nguyễn Cát Hồ, TS. Vũ Như Lân, TS. Trần Thái Sơn và các thầy cô trong nhóm Đại số gia tử đã có nhiều ý kiến góp ý về nội dung liên quan đến luận án thông qua các buổi seminar và học thuật chuyên môn. Tôi xin chân thành cảm ơn đến Ban lãnh đạo Học viện Khoa học và Công nghệ, Viện Công nghệ Thông tin, Khoa “Công nghệ thông tin và Viễn thông”, Phòng “Đào tạo sau đại học” đã tạo điều kiện thuận lợi trong quá trình học tập, nghiên cứu và hoàn thành luận án. Xin trân thành cảm ơn Ban giám hiệu trường Đại học Kỹ thuật công nghiệp – ĐH Thái Nguyên, Khoa Điện tử, Bộ môn Tin học Công nghiệp và các đồng nghiệp đã giúp đỡ và tạo điều kiện thuận lợi để tôi có thể thực hiện kế hoạch nghiên cứu, hoàn thành luận án. Tôi xin được bày tỏ tình cảm và lòng biết ơn vô hạn tới những người thân trong Gia đình, những người luôn dành cho tôi sự động viên, khích lệ, sẻ chia, giúp đỡ trong những lúc khó khăn.
- 3 MỤC LỤC LỜI CAM ĐOAN .......................................................................................................1 LỜI CẢM ƠN .............................................................................................................2 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .................................................6 DANH MỤC CÁC BẢNG..........................................................................................7 DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ .............................................................10 MỞ ĐẦU ...................................................................................................................12 CHƯƠNG 1. NHỮNG KIẾN THỨC LIÊN QUAN ................................................20 1.1. Các khái niêm về chuỗi thời gian .......................................................................21 1.1.1. Chuỗi thời gian ...........................................................................................21 1.1.2. Bài toán dự báo chuỗi thời gian ..................................................................22 1.2. Chuỗi thời gian mờ và các mô hình dự báo chuỗi thời gian mờ ........................22 1.2.1. Một số khái niệm về tập mờ .......................................................................22 1.2.2. Chuỗi thời gian mờ và các định nghĩa liên quan ........................................24 1.2.3. Các thành phần của mô hình dự báo FTS ...................................................26 1.2.3.1 Giai đoạn huấn luyện (Xây dựng mô hình dự báo) ..............................27 1.2.3.2 Giai đoạn kiểm thử (Giai đoạn dự báo) ................................................30 1.2.4. Một số mô hình chuỗi thời gian mờ cơ bản ................................................30 1.2.4.1 Mô hình dự báo của Song và Chissom [8,9] ........................................31 1.2.4.2. Mô hình dự báo của Chen [10] ............................................................31 1.2.4.3 Mô hình dự báo của Yu [13] ................................................................34 1.2.5. Tiêu chuẩn đánh giá độ chính xác của các mô hình dự báo .......................36 1.3. Một số phương pháp liên quan đến phân khoảng tập nền..................................36 1.3.1. Thuật toán phân cụm K-means ...................................................................37 1.3.2. Thuật toán phân cụm mờ Fuzzy C-means ..................................................38 1.3.3. Thuật toán tối ưu bầy đàn (PSO) ................................................................39 1.3.4. Đại số gia tử ................................................................................................42 1.4. Kết luận Chương 1 .............................................................................................44 CHƯƠNG 2. XÂY DỰNG CÁC MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ VỚI NHÓM QUAN HỆ MỜ PHỤ THUỘC THỜI GIAN .......................................45 2.1. Nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG) ..................................45 2.1.1. Các định nghĩa về nhóm quan hệ mờ phụ thuộc thời gian .........................45
- 4 2.1.2. Thuật toán tạo NQHM-PTTG bậc m ..........................................................48 2.2. Các mô hình chuỗi thời gian mờ một nhân tố và hai nhân tố đề xuất ...............49 2.2.1. Mô hình dự báo chuỗi thời gian mờ một nhân tố (FTS-1NT) ....................49 2.2.2. Mô hình dự báo chuỗi thời gian mờ hai nhân tố (FTS-2NT) .....................56 2.3. Các phương pháp phân khoảng dữ liệu trong tập nền........................................62 2.3.1. Phân khoảng dữ liệu ...................................................................................62 2.3.2. Các phương pháp phân khoảng dữ liệu ......................................................63 2.3.2.1 Phân khoảng với độ dài bằng nhau ......................................................63 2.3.2.2. Phân khoảng với độ dài khác nhau ......................................................64 2.3.3. Các phương pháp phân khoảng đề xuất ......................................................67 2.3.3.1 Phân khoảng sử dụng phân cụm K-means ...........................................68 2.3.3.2 Phân khoảng sử dụng Đại số gia tử ......................................................69 2.4. Tổ chức thực nghiệm và so sánh đánh giá cho các mô hình FTS đề xuất và các phương pháp phân khoảng ........................................................................................72 2.4.1. Mô tả dữ liệu ...............................................................................................72 2.4.2. Kết quả thực nghiệm của mô hình FTS một nhân tố (FTS-1NT)...............73 2.4.2.1 Kết quả thực nghiệm của mô hình FTS-1NT trên tập dữ liệu tuyển sinh ..........................................................................................................................73 2.4.2.2 Kết quả thực nghiệm của mô hình FTS-1NT trên tập dữ liệu thị trường chứng khoán (TAIFEX) ...................................................................................76 2.4.3. Kết quả thử nghiệm của mô hình FTS hai nhân tố (FTS-2NT) ..................78 2.4.4. Kết quả thực nghiệm trên mô hình FTS-1NT sử dụng hai phương pháp phân khoảng HA và K-means ............................................................................................79 2.4.4.1 So sánh đánh giá giữa hai phương pháp phân khoảng HA và K-means với các phương pháp phân khoảng khác trên cùng mô hình FTS-1NT ...........80 2.4.4.2 So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means với các mô hình dự báo khác dựa trên QHM bậc 1...............82 2.4.4.3 So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means với các mô hình dự báo khác dựa trên QHM bậc cao ...........84 2.5. Kết luận Chương 2 .............................................................................................85 CHƯƠNG 3. NÂNG CAO HIỆU QUẢ CỦA MÔ HÌNH DỰ BÁO SỬ DỤNG CÁC KỸ THUẬT TÍNH TOÁN MỀM .............................................................................86 3.1. Các mô hình dự báo chuỗi thời gian mờ đề xuất ...............................................86
- 5 3.1.1. Mô hình chuỗi thời gian mờ một nhân tố (FTS-1NT) kết hợp giữa FCM và PSO .......................................................................................................................87 3.1.2. Mô hình chuỗi thời gian mờ hai nhân tố (FTS-2NT) sử dụng FCM và PSO .............................................................................................................................100 3.2. Tổ chức thực nghiệm và đánh giá hiệu quả của các mô hình dự báo được đề xuất .................................................................................................................................105 3.2.1. Đánh giá hiệu quả của mô hình FTS một nhân tố FTS1NT-CMPSO ......106 3.2.1.1 Mô tả các chuỗi dữ liệu thời gian .......................................................106 3.2.1.2 Thiết lập các tham số của mô hình FTS1NT-CMPSO cho các tập dữ liệu ........................................................................................................................106 3.2.1.3 Áp dụng dự báo tuyển sinh đại học của trường đại học Alabama .....107 3.2.1.4 Áp dụng dự báo thị trường chứng khoán Đài Loan TAIFEX ............112 3.2.1.5 Áp dụng dự báo tai nạn ô tô tại Bỉ .....................................................113 3.2.2. Đánh giá hiệu quả của mô hình FTS hai nhân tố FTS2NT-CMPSO .......114 3.2.2.1 Áp dụng dự báo trên tập dữ liệu nhiệt độ ...........................................115 3.2.2.2 Áp dụng dự báo trên tập dữ liệu thị trường chứng khoán. .................119 3.3. Kết luận Chương 3 ...........................................................................................121 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ..............................................................122 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN ...............................................................................................................123 TÀI LIỆU THAM KHẢO .......................................................................................124
- 6 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu: 𝒜𝒳 Đại số tuyến tính μ(h) Độ đo tính mờ của gia tử h fm(x) Độ đo tính mờ của từ ngôn ngữ H+ Tập các gia tử dương H- Tập các gia tử âm ̃ A Biến ngôn ngữ Các chữ viết tắt: TS Time series Chuỗi thời gian mờ FTS Fuzzy time series Chuỗi thời gian mờ Taiwan capitalization TAIEX weighted stock index Chỉ số chứng khoán Đài Loan TAIFEX Taiwan Stock Index Futures PSO Particle Swam Optimization Tối ưu bầy đàn KM K-means clustering Phân cụm mờ HA Hegde Algeras Đại số gia tử Autoregressive Quá trình trung bình trượt tích ARIMA integrated moving average hợp tự hồi quy FCM Fuzzy C-Means Clustering Phân cụm mờ Mean Absolute Percentage Sai số trung bình phần trăm tuyệt MAPE Error đối MSE Mean square error Sai số bình phương trung bình FTS-1NT Chuỗi thời gian mờ một nhân tố FTS-2NT Chuỗi thời gian mờ hai nhân tố Phân cụm Kmeans kết hợp với KM-FTS-1NT chuỗi thời gian mờ một nhân tố Đại số gia tử kết hợp với chuỗi HA-FTS-1NT thời gian mờ một nhân tố FTS1NT- Chuỗi thời gian mờ một nhân tố CMPSO kết hợp giữa FCM và PSO FTS2NT- Chuỗi thời gian mờ hai nhân tố CMPSO kết hợp giữa FCM và PSO QHM Quan hệ mờ NQHM Nhóm quan hệ mờ Nhóm quan hệ mờ phụ thuộc thời NQHM-PTTG gian
- 7 DANH MỤC CÁC BẢNG Bảng 1.1: Các nhóm quan hệ mờ từ tập dữ liệu tuyển sinh ......................................33 Bảng 1.2: Một số hạn chế của các mô hình dự báo sử dụng quan hệ mờ .................35 Bảng 2.1: Sự khác nhau giữa nhóm quan hệ mờ đề xuất và nhóm quan hệ trong mô hình [10, 13] ..............................................................................................................47 Bảng 2.2: Dữ liệu tuyển sinh thực tế của trường đại học Alabama ..........................49 Bảng 2.3: Kết quả mờ hóa dữ liệu tuyển sinh thành các tập mờ ..............................51 Bảng 2.4: Biểu diễn mối quan hệ mờ bậc 1 và bậc 3 trên tập dữ liệu tuyển sinh .....52 Bảng 2.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 3................53 Bảng 2.6: Kết quả dự báo tuyển sinh dựa trên quan hệ mờ bậc 1 và bậc 3 ..............55 Bảng 2.7: Dữ liệu lịch sử về nhiệt độ trung bình hàng ngày và mật độ của mây từ 01/06/1996 đến 30/09/1996 tại Đài Bắc, Đài Loan ..................................................57 Bảng 2.8: Kết quả mờ hóa của nhân tố chính “nhiệt độ trung bình hàng ngày” và nhân tố thứ hai “mật độ của mây” .............................................................................59 Bảng 2.9: Kết quả biểu diễn mối quan hệ mờ bậc 3 hai nhân tố ..............................60 Bảng 2.10: Kết quả tính toán giá trị cho mỗi NQHM-PTTG bậc 3 ..........................61 Bảng 2.11: Kết quả dự báo nhiệt độ trung bình hàng ngày trong tháng 6 năm 1996 tại Đài Bắc Đài Loan dựa vào chuỗi thời gian mờ hai nhân tố bậc 3. ......................61 Bảng 2.12: Ánh xạ cơ sở ...........................................................................................65 Bảng 2.13: Các mô hình FTS sử dụng PSO để phân khoảng kết hợp với các phương pháp khác...................................................................................................................66 Bảng 2.14: Các mô hình FTS sử dụng FCM để phân khoảng kết hợp với các phương pháp khác .....................................................................................................67 Bảng 2.15: Ưu và nhược điểm chính của các phương pháp phân khoảng................67 Bảng 2.16: Kết quả phân cụm trên tập dữ liệu tuyển sinh sử dụng K-means ...........68 Bảng 2.17: Giá trị của các khoảng từ tập dữ liệu tuyển sinh sử dụng K-means .......69 Bảng 2.18: Số lượng hạng từ ngôn ngữ ....................................................................70 Bảng 2.19: So sánh sai số dự báo MSE giữa mô hình FTS-1NT với các mô hình khác trên cùng 7 khoảng. ..........................................................................................73 Bảng 2.20: Kết quả và sai số dự báo giữa mô hình FTS-1NT với các mô hình khác trên cùng 14 khoảng ..................................................................................................74 Bảng 2.21: Kết quả và sai dự báo MSE giữa mô hình FTS -1NT với các mô hình khác dựa trên QHM bậc cao khác nhau với số khoảng chia bằng 14. ......................74 Bảng 2.22: So sánh sai số dự báo MSE của mô hình đề xuất so với các mô hình khác dựa trên QHM bậc cao với số khoảng chia bằng 14. ................................................75 Bảng 2.23: Kết quả và sai số dự báo của mô hình FTS-1NT với các mô hình khác dựa vào số bậc khác nhau với cùng số khoảng là 16. ...............................................76
- 8 Bảng 2.24: So sánh kết quả và sai số dự báo trong pha kiểm thử giữa mô hình đề xuất FTS-1NT với các mô hình khác dựa trên QHM bậc 5 với 16 khoảng ..............77 Bảng 2.25: So sánh sai số dự báo MAPE trong tháng 6 của mô hình đề xuất với các mô hình trước ............................................................................................................78 Bảng 2.26: So sánh sai số dự báo MAPE trong tháng 7 của mô hình đề xuất với các mô hình trước ............................................................................................................78 Bảng 2.27: So sánh sai số dự báo MAPE trong tháng 8 của mô hình đề xuất với các mô hình trước ............................................................................................................79 Bảng 2.28: So sánh sai số dự báo MAPE trong tháng 9 của mô hình đề xuất với các mô hình trước. ...........................................................................................................79 Bảng 2.29: Kết quả và sai số dự báo của mô hình FTS-1NT sử dụng các phương pháp phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia. ...................80 Bảng 2.30: Sai số dự báo MSE của mô hình FTS-1NT sử dụng các phương pháp phân khoảng khác nhau dựa trên QHM cao với 7 khoảng chia. ...............................80 Bảng 2.31: Kết quả dự báo của mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia ..........................81 Bảng 2.32: So sánh sai số dự báo MSE giữa mô hình đề xuất với các mô hình khác sử dụng 7 khoảng chia ...............................................................................................82 Bảng 2.33: So sánh sai số dự báo giữa mô hình đề xuất sử dụng K-means với các mô hình khác dựa trên QHM bậc 1 với 14 khoảng chia ...........................................83 Bảng 3.1: Các cụm và tâm của nó đạt được trên tập dữ liệu tuyển sinh [8] .............88 Bảng 3.2: Các khoảng và điểm giữa của mỗi khoảng ...............................................88 Bảng 3.3: Kết quả mờ hóa chuỗi dữ liệu tuyển sinh với 7 khoảng chia tập nền ......89 Bảng 3.4: Kết quả biểu thị quan hệ mờ bậc 1 và bậc 2 .............................................90 Bảng 3.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 2................91 Bảng 3.6: Kết quả dự báo của mô hình đề xuất với 7 khoảng chia ..........................94 Bảng 3.7: Khởi tạo vị trí của các cá thể ....................................................................98 Bảng 3.8: Khởi tạo vận tốc của các cá thể. ...............................................................98 Bảng 3.9: Khởi tạo vị trí tốt nhất 𝑃𝑏𝑒𝑠𝑡_𝑖𝑑 của các cá thể id ..................................98 Bảng 3.10: Cập nhật vận tốc của các cá thể ..............................................................99 Bảng 3.11: Cập nhật vị trí thứ hai của các cá thể......................................................99 Bảng 3.12: Vị trí pbest cuối cùng được chọn làm 𝐺𝑏𝑒𝑠𝑡 .......................................100 Bảng 3.13: Kết quả phân cụm trên chuỗi dữ liệu hai nhân tố sử dụng FCM..........102 Bảng 3.14: Các khoảng đạt được từ phân cụm FCM ..............................................102 Bảng 3.15: Các tham số của mô hình FTS1NT-CMPSO cho mỗi tập dữ liệu .......106 Bảng 3.16: So sánh kết quả và sai số dự báo giữa mô hình đề xuất FTS1NT- CMPSO với các mô hình khác dựa trên QHM bậc 1 với 14 khoảng ......................107 Bảng 3.17: Điểm khác biệt giữa mô hình FTS1NT-CMPSO với các mô hình so sánh trên Bảng 3.16 .........................................................................................................108
- 9 Bảng 3.18: So sánh sai số dự báo MSE giữa mô hình đề xuất FTS1NT-CMPSO với các mô hình khác dựa trên QHM bậc 1 và các khoảng chia khác nhau..................108 Bảng 3.19: So sánh kết quả và sai số dự báo MSE giữa mô hình FTS1NT-CMPSO với các mô hình khác dựa trên QHM bậc cao .........................................................109 Bảng 3.20: So sánh sai số dự báo MSE giữa mô hình FTS1NT-CMPSO với các mô hình khác dựa trên QHM bậc cao khác nhau với 7 khoảng ....................................111 Bảng 3.21: So sánh kết quả và sai số dự báo MSE của mô hình đề xuất với các mô hình khác dựa trên QHM bậc cao khác nhau với 16 khoảng chia ..........................112 Bảng 3.22: So sánh kết quả dự báo trong giai đoạn kiểm thử dựa trên QHM bậc 5 với 16 khoảng và sử dụng wh = 3. ..........................................................................113 Bảng 3.23: So sánh kết quả và sai số dự báo RMSE giữa mô hình FTS1NT-CMPSO và các mô hình trước đây với số khoảng chia và bậc khác nhau. ...........................113 Bảng 3.24: Các tham số của mô hình FTS2NT-CMPSO được thiết lập cho dự báo nhiệt độ ....................................................................................................................115 Bảng 3.25: Các tham số của mô hình FTS2NT-CMPSO được thiết lập cho dự báo thị trường chứng khoán ...........................................................................................115 Bảng 3.26: Kết quả dự báo nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan theo từng tháng từ ngày 01/06/1996 đến 30/09/1996. ............................................116 Bảng 3.27: Sai số dự báo MAPE (%) trên từng bậc của mô hình FTS2NT-CMPSO .................................................................................................................................117 Bảng 3.28: So sánh sai số dự báo MAPE (%) trong tháng 6 giữa mô hình FTS2NT- CMPSO và các mô hình khác dựa trên các bậc khác nhau .....................................118 Bảng 3.29: So sánh sai số dự báo MAPE(%) trong tháng 7 giữa mô hình FTS2NT- CMPSO và các mô hình khác dựa trên các bậc khác nhau .....................................118 Bảng 3.30: So sánh sai số dự báo MAPE(%) trong tháng 8 giữa mô hình FTS2NT- CMPSO và các mô hình khác dựa trên các bậc khác nhau. ....................................118 Bảng 3.31: So sánh sai số dự báo MAPE(%) trong tháng 9 giữa mô hình FTS2NT- CMPSO và các mô hình khác dựa trên các bậc khác nhau .....................................119 Bảng 3.32: So sánh kết quả và sai số dự báo MSE giữa mô hình FTS2NT-CMPSO với các mô hình khác dựa trên QHM bậc cao với 16 khoảng chia cho mỗi nhân tố .................................................................................................................................120
- 10 DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.1: Cấu trúc tổng quan của luận án .................................................................20 Hình 1.2: Chuỗi tỷ giá hối đoái BP / USD hàng tuần [53] .......................................21 Hình 1.3: Đồ thị của 3 hàm thuộc phổ biến:(a) tam giác, (b) hình thang, (c) Gauss 23 Hình 1.4: Mô hình dự báo FTS tổng quát .................................................................26 Hình 1.5: Các thành phần trong giai đoạn huấn luyện. .............................................27 Hình 1.6: Ví dụ phân khoảng tập nền sử dụng các hàm thuộc khác nhau. ...............28 Hình 1.7: Các thành phần trong giai đoạn kiểm thử .................................................30 Hình 1.8: Tóm tắt các bước thực hiện mô hình dự báo của Chen [10] trên tập dữ liệu tuyển sinh của trường Đại học Alabama ...................................................................34 Hình 1.9: Sơ đồ thuật toán phân cụm k-means .........................................................38 Hình 1.10: Sơ đồ thuật toán phân cụm bằng FCM ...................................................39 Hình 1.11: Đồ thị minh họa một điểm tìm kiếm bằng PSO ......................................40 Hình 1.12: Biểu diễn sự sắp xếp của các phần tử 𝑥 ∈ 𝑋, ℎ𝑗 ∈ 𝐻, 𝑐 ∈ 𝐺 ...................44 Hình 2.1. Minh họa chuỗi thời gian được mờ hóa bới các tập mờ ...........................46 Hình 2.2: Các bước của mô hình dự báo...................................................................49 Hình 2.3: Biểu diễn dữ liệu tuyển sinh được mờ hóa bởi các tập mờ 𝐴𝑖 ..................51 Hình 2.4: Các bước của mô hình FTS-2NT ..............................................................56 Hình 2.5: Minh hoạ các phương pháp phân khoảng khác nhau trên cùng tập mẫu. .63 Hình 2.6: Các phương pháp phân khoảng .................................................................63 Hình 2.7: Minh hoạ các khoảng chia liên tiếp có độ dài bằng nhau là 1000 ............64 Hình 2.8: Độ thị phân bổ giá trị chênh lệch của chuỗi dữ liệu tuyển sinh ................65 Hình 2.9: Các phương pháp phân khoảng khác nhau kết hợp với mô hình FTS-1NT ...................................................................................................................................68 Hình 2.10: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng K-means ......69 Hình 2.11: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng HA...............72 Hình 2.12: Biểu diễn sai số dự báo MSE giữa hình FTS-1NT với các mô hình so sánh dựa trên các bậc khác nhau với 14 khoảng chia ...............................................75 Hình 2.13: Đồ thị biểu diễn sai số dự báo trong Bảng 2.30 của mô hình FTS-1NT dựa trên các phương pháp phân khoảng khác nhau. .................................................81 Hình 2.14: Đường cong mô tả kết quả dự báo của mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means so với dữ liệu thực tế. .........................82 Hình 2.15: Đường cong biểu diễn giữa giá trị dự báo của mô hình KM-FTS-1NT và các mô hình khác so với dữ liệu thực tế ....................................................................84 Hình 2.16: So sánh sai số dự báo MSE giữa mô hình đề xuất sử dụng phân khoảng K-means và HA với các mô hình khác dựa trên QHM bậc cao với 7 khoảng chia. .84 Hình 3.1: Cấu trúc và các giai đoạn của mô hình dự báo đề xuất (FTS1NT-CMPSO) ...................................................................................................................................87
- 11 Hình 3.2: Cấu trúc khoảng của một cá thể trong PSO ..............................................95 Hình 3.3: Sơ đồ thuật toán biểu diễn mô hình FTS1NT-CMPSO ............................97 Hình 3.4: Cấu trúc và các giai đoạn của mô hình đề xuất FTS2NT- CMPSO .......101 Hình 3.5: Biểu diễn các khoảng và bậc của mô hình theo cá thể i trong PSO........103 Hình 3.6: Biểu diễn giá trị thực của các chuỗi dữ liệu thời gian ............................106 Hình 3.7: Đồ thị biểu diễn sai số dự báo MSE giữa mô hình FTS1NT-CMPSO và các mô hình so sánh trong Bảng 3.18 với số lượng khoảng khác nhau. .................109 Hình 3.8: Đồ thị biểu diễn sai số dự báo giữa mô hình đề xuất FTS1NT-CMPSO với các mô hình khác trong Bảng 3.20 ...................................................................111 Hình 3.9: Đường cong biểu diễn giữa giá trị thực tế và giá trị dự báo nhiệt độ trung bình hàng ngày trong tháng 6, dựa trên mô hình FTS2NT-CMPSO bậc 7.............117 Hình 3.10: Đồ thị thể hiện thời gian tính toán và tốc độ hội tụ của mô hình FTS2NT-CMPSO với 150 lần lặp ...........................................................................120
- 12 MỞ ĐẦU Những thành tựu đạt được trong các hoạt động của con người được đặc trưng bởi các quá trình ra quyết định hiệu quả của họ. Để giúp quá trình ra quyết định được chính xác, tiết kiệm được thời gian và giảm các chi phí không cần thiết thì bài toán dự báo đóng vai trò rất quan trọng. Dự báo là một công cụ trợ giúp cần thiết cho việc ra quyết định và lập kế hoạch để quản lý hiệu quả các tổ chức hiện đại. Ví dụ, dự báo bán hàng luôn đóng một vai trò nổi bật trong hoạt động kinh doanh. Nó cung cấp cho các doanh nghiệp những chỉ dẫn đáng tin cậy về chi phí công việc và phân bổ ngân sách cho một khoảng thời gian sắp tới. Các nhà khoa học cũng phải đối mặt với thách thức quan trọng trong việc dự báo các sự kiện xảy ra trong tương lai như nhiệt độ, lượng mưa, tăng trưởng nền kinh tế, ... Để dự báo các sự kiện này với độ chính xác 100% là không thể, nhưng rất nhiều lợi ích có thể thu được từ kết quả dự báo cũng như một bức tranh về tương lai đó. Một trong các hướng nghiên cứu nâng cao độ chính xác của các bài toán dự báo là nghiên cứu dữ liệu chuỗi thời gian. Chuỗi thời gian (TS – time series) là một chuỗi các giá trị số hoặc chuỗi các từ trong ngôn ngữ tự nhiên được ghi lại tại các thời điểm liên tiếp trong một khoảng thời gian, thường được đo cách nhau tại các thời điểm thống nhất: hàng ngày, hàng tuần, hàng tháng, hàng quý hoặc hàng năm. Nói một cách đơn giản, một chuỗi thời gian là một chuỗi dữ liệu lịch sử được thu thập một cách đều đặn. Phân tích chuỗi thời gian để xây dựng các mô hình dự báo chuỗi thời gian hiệu quả là một trong các khâu quan trọng trong việc tạo ra các công cụ dự báo tốt nhằm giải quyết các bài toán thực tế. Một loạt các phương pháp đã được đề xuất để giải quyết những bài toán này, thông dụng hơn cả là mô hình tự hồi quy (autoregression model - AR), trung bình trượt (moving average - MA) và kết hợp của chúng thành mô hình ARMA và ARIMA do Box và Jenkins [1] phát triển năm 1976. Các mô hình dự báo nêu trên được xây dựng cho chuỗi thời gian tuyến tính và dừng. Bên cạnh các mô hình chuỗi thời gian dừng thì các mô hình ARCH [2] (Autoregressive Conditionally Hestoroscedastic) và GARCH [3] (Generalize Autoregressive Conditionally Hestoroscedastic) được xây dựng để giải quyết các chuỗi thời gian không dừng hay chuỗi thời gian có phương sai thay đổi. Để áp dụng các mô hình dự báo chuỗi thời gian trên với độ chính xác khả quan đòi hỏi một số ràng buộc chặt chẽ như: chuỗi thời gian phải là tuyến tính hay cần một số lượng dữ liệu lớn. Trong thực tế, việc đòi hỏi các chuỗi thời gian là dừng và tuyến tính không phải lúc nào cũng đáp ứng được, thậm chí chúng còn mang tính không chắc chắn và biến thiên mạnh. Việc áp dụng các mô hình nêu trên đối với chuỗi dữ liệu thời gian ngắn hay phi tuyến là không phù hợp và kết quả dự báo đạt được chưa cao. Để khắc phục các hạn chế đó, một số tác giả đã sử dụng mạng nơron để xây dựng mô hình dự báo chuỗi
- 13 thời gian dựa trên tính phi tuyến và linh hoạt của chúng. Donaldson và công sự [4] đã đề xuất mô hình chuỗi thời gian sử dụng mạng nơron nhân tạo (Artificial Neural Network – ANN) để dự báo sự biến động của thị trường chứng khoán Mỹ, Canada, Nhật Bản và Anh. Hansen và Nelson [5] cũng sử dụng mạng nơron để xây dựng mô hình dự báo doanh thu từ thuế. Quan sát thấy rằng, phương pháp sử dụng mạng nơron đạt được độ chính xác cao hơn so với các mô hình truyền thống. Mặt khác, một số nghiên cứu đã sử dụng suy luận mờ dựa trên mạng nơron [6] (Adaptive Neuro-Fuzzy Inference System-ANFIS) để nâng cao độ chính xác dự báo của mô hình chuỗi thời gian. Khác so với mạng ANN, hệ này có khả năng thích nghi với môi trường cao hơn trong quá trình huấn luyện. Do đó, đã có nhiều công trình áp dụng hệ ANFIS trong sự báo TS và thu được những kết quả nhất định. Tuy nhiên, các mô hình tiên tiến sử dụng mạng nơron đơn lẻ vẫn phải đối mặt với một số vấn đề như cần giả định một số lượng dữ liệu lớn trong quá trình huấn luyện mạng, phụ thuộc vào kinh nghiệm trong việc chọn nút mạng và không có phương pháp rõ ràng để phân tích mối quan hệ giữa đầu vào và đầu ra trong mạng. Hơn nữa, trong cuộc sống hàng ngày, con người thường quan sát, phân tích các sự vật, hiện tượng và các sự kiện xảy ra trong thế giới thực và đưa ra các quyết định của mình dưới dạng ngôn ngữ tự nhiên. Với bài toán dự báo chuỗi thời gian, dữ liệu có thể được biểu diễn dưới dạng các từ trong ngôn ngữ tự nhiên và dễ dàng mô tả cách con người thực hiện quá trình dự báo dưới dạng ngôn ngữ trong thực tế. Thật vậy, khi con người quan sát dữ liệu chuỗi thời gian, họ nhanh chóng chuyển các biến động của chuỗi thời gian sang dạng ngôn ngữ và lập luận trong suy nghĩ theo một cách nào đó dựa trên quan hệ giữa các hạng từ trong chuỗi thời gian để ước lượng kết quả dự báo dưới dạng ngôn ngữ. Trong ngữ cảnh như vậy, các phương pháp thống kê nêu trên chỉ được sử dụng để giải quyết chuỗi thời gian số (Numerical time series - NTS) mà không thể sử dụng để giải quyết một cách hiệu quả các bài toán ra quyết định như vậy. Vì vậy, chuỗi thời gian mờ ra đời nhằm giải quyết các bài toán dự báo với chuỗi số liệu được biểu diễn dưới dạng ngôn ngữ. Chuỗi thời gian mờ (Fuzzy time series - FTS) được Song và Chissom giới thiệu lần đầu tiên vào năm 1993, dựa trên lý thuyết tập mờ của Zadeh [7], trong đó các tập mờ được xem như là ngữ nghĩa của các hạng từ ngôn ngữ. Theo cách tiếp cận này, Song và Chissom đã đề xuất hai mô hình FTS [8, 9] để dự báo số lượng sinh viên nhập học của trường Đại học Alabama. Tuy nhiên, mô hình của Song và Chissom còn tồn tại một số hạn chế như mất nhiều thời gian tính toán do thực hiện phép hợp thành max – min phức tạp đối với ma trận quan hệ mờ 𝑅(𝑡 − 1, 𝑡) lớn và thiếu sự thuyết phục trong việc xác định độ dài của khoảng chia tập nền. Để khắc phục hạn chế trên, Chen [10] đã đề xuất nhóm quan hệ mờ và sử dụng các phép toán số học đơn giản trong quá trình giải mờ.
- 14 Mặc dù các mô hình này đã chứng tỏ những ưu việt khi áp dụng cho chuỗi dữ liệu thời gian tổng quát nhưng độ chính xác dự báo còn khá thấp. Đây là cơ sở để mở ra một hướng nghiên cứu mới và thu hút được nhiều công bố cả về cải tiến phương pháp luận lẫn nghiên cứu ứng dụng. Vì điểm trên, nhiều nghiên cứu đã cải tiến mô hình của Chen nhằm nâng cao độ chính xác của kết quả dự báo theo các hướng sau: 1) xác định tập nền và tìm độ dài khoảng phù hợp [11- 28]; 2) xây dựng các mối quan hệ mờ và nhóm quan hệ mờ trên cơ sở dữ liệu được mờ hóa [18, 24, 29-31] và 3) cải tiến các quy tắc giải mờ cho dự báo đầu ra [13, 18, 32-33]. Trước hết, việc phân khoảng tập nền: làm thế nào để phân tập nền chứa dữ liệu lịch sử thành các khoảng với độ dài thích hợp và bao nhiêu khoảng là phù hợp? Bắt đầu từ công trình nền tảng [11], Huarng đã xác định rằng độ dài của khoảng chia tập nền là một yếu tố quan trọng và ảnh hưởng đáng kể đến độ chính xác dự báo của mô hình. Từ quan điểm này, Huarng đã đưa ra hai phương pháp chọn độ dài khoảng tập nền theo phân bố và độ dài trung bình. Các phương pháp của Huarng đã đạt được độ chính xác tốt hơn so với một số mô hình dự báo trước đó. Yolcu và cộng sự [22] đưa ra một cách tiếp cận mới dựa trên việc tối ưu tỷ lệ để xác định độ dài của các khoảng chia bằng hàm “fminbnd” trong MATLAB. Trong những năm gần đây, các kỹ thuật tính toán mềm và các phương pháp tối ưu tiến hóa được sử dụng rộng rãi để xác định phân khoảng tối ưu trong mô hình FTS. Chen & Chung đưa ra hai mô hình chuỗi thời gian mờ bậc nhất [15] và bậc cao [16] dựa trên thuật toán di truyền để phân tập nền thành các khoảng có độ dài phù hợp và áp dụng cho dự báo tuyển sinh tại trường Đại học Alabama. Lee và cộng sự [34] áp dụng thuật toán tôi luyện (Simulated Annealing - SA) để xác định độ dài khoảng thích hợp trong mô hình FTS bậc cao cho dự báo thị trường chứng khoán Đài Loan (TAIFEX). Eren Bas và cộng sự [35] đã đề xuất một thuật toán di truyền cải tiến (MGA) để tránh những phán đoán chủ quan trong việc xác định độ dài của mỗi khoảng tập nền trong mô hình FTS để dự báo tai nạn xe hơi ở Bỉ và tuyển sinh vào trường Đại học Alabama. Bên cạnh đó, nhiều thuật toán tối ưu được lấy cảm hứng từ các loài sinh vật học cũng được sử dụng cho mục đích phân khoảng nhằm nâng cao độ chính xác dự báo của mô hình FTS như: tối ưu bầy đàn (Particle Swarm Optimization - PSO) [14, 18, 30 - 33, 35], tối ưu đàn kiến (Ant Colony Optimization - ACO) [36] và tối ưu dựa trên sự di chuyển của đàn ngỗng( Geese Movement Based Optimization- GMBO) [37]. Cùng mục đích sử dụng PSO để hiệu chỉnh độ dài khoảng tập nền, một số tác giả khác đã đề xuất các mô hình FTS dựa trên quan hệ mờ bậc cao [35, 38] và quan hệ mờ hai nhân tố [39-41] để áp dụng dự báo các bài toán khác nhau. Ngoài ra, Chen và cộng sự [42] đã áp dụng PSO để tối ưu đồng thời các khoảng chia và các trọng số trên mỗi nhóm quan hệ mờ cho dự báo TAIFEX và tỷ giá NTD / USD. Song song với kỹ thuật tối ưu, thì các phương
- 15 pháp phân cụm như: phân cụm mờ C-mean [28, 43], phân cụm tự động [17] cũng được sử dụng cho mục đích phân khoảng nhằm giảm thiểu sai số dự báo trong mô hình chuỗi thời gian mờ. Thứ hai, việc thiết lập các quan hệ logic mờ hay có thể gọi tắt là quan hệ mờ (QHM) và nhóm quan hệ mờ (NQHM) có tác động lớn đến độ chính xác của kết quả dự báo. Do đó, làm cách nào để thiết lập nhóm quan hệ mờ phù hợp là một trong những yếu tố quan trọng trong mô hình FTS. Nhận thấy tầm quan trọng này, nhiều nghiên cứu đã đề xuất các mô hình FTS khác nhau theo hướng tiếp cận NQHM. Khái niệm nhóm quan hệ mờ đầu tiên do Chen [10] đề xuất bằng cách gộp các thành phần bên vế phải của các quan hệ mờ khi chúng có cùng vế trái. Theo cách này, các nhóm quan hệ mờ được thiết lập giúp cho giai đoạn giải mờ và tính toán giá trị dự báo rõ một cách dễ dàng hơn. Vì ưu điểm này, nhiều mô hình dự báo đã được đề xuất dựa trên NQHM của Chen [10] để giải quyết các bài toán khác nhau [15-19, 40, 44]. Tuy nhiên, các mô hình sử dụng nhóm quan hệ này gặp phải hạn chế do không để ý đến tính lặp và vị trí của các quan hệ khi tham gia vào NQHM. Tình trạng này dẫn đến thiếu thông tin để dự báo và giảm khả năng giải thích của mô hình. Yu [13] đã chỉ ra tầm quan trọng của sự lặp lại các thành phần trong NQHM và gán các trọng số khác nhau theo vị trí xuất hiện của chúng trong NQHM. Đây được xem như một đề xuất thứ 2 về NQHM và đã được các nghiên cứu khác đề xuất sử dụng [45, 46]. Thứ ba, thiết lập quy tắc giải mờ để nhận kết quả dự báo rõ là một bước quan trọng và ảnh hưởng trực tiếp đến kết quả dự báo của mô hình. Một quy tắc giải mờ có thể cho kết quả tốt đối với mô hình chuỗi thời gian mờ bậc nhất nhưng hạn chế đối với mô hình chuỗi thời gian mờ bậc cao và ngược lại; hoặc có thể phù hợp với một bài toán dự báo nhất định nhưng lại không phù hợp cho các bài toán dự báo khác và ngược lại. Thông thường giá trị dự báo lấy trung bình điểm giữa của các khoảng liên quan đến từng tập mờ bên vế phải của NQHM [15-18]. Tuy nhiên, do có sự đóng góp khác nhau của các thành phần trong vế phải của NQHM nên nhiều tác giả đã sử dụng trọng số để gán cho từng giá trị điểm giữa [13, 46, 47]. Ngoài điểm giữa của khoảng dự báo, một số kỹ thuật khác được sử dụng để nâng cao độ chính xác dự báo bằng cách chia khoảng này thành các đoạn con để lấy thêm thông tin dự báo [32]. Bên cạnh đó, để tính giá trị dự báo khi vế phải của quan hệ mờ chưa được xác định, nhiều tác giả đã sử dụng phương pháp phiếu bầu (voting) [18, 33] để gán một trọng số ưu tiên cho thành phần có đóng góp gần nhất về tương lai. Vấn đề về bậc của mô hình và nhân tố ảnh hưởng của chuỗi thời gian cũng được nhiều tác giả xem xét và giới thiệu đối với từng bài toán dự báo cụ thể. Đối với vấn đề thứ nhất, đã có một số lượng lớn các nghiên cứu [14, 16, 17, 35, 39, 48] được công bố dựa trên QHM bậc cao nhằm cải thiện hiệu quả dự báo của mô hình bậc nhất.
- 16 Tuy nhiên, các mô hình bậc cao đã công bố trước đây thường chọn bậc với độ chính xác tốt nhất bằng trực giác hay thử nghiệm một số lần chạy trên mỗi bậc cho trước. Vậy, có giải pháp hiệu quả nào để xác định bậc của mô hình với độ chính xác dự báo tốt nhất một cách tự động? Câu hỏi này, đã được đáp ứng trong luận án bằng việc sử dụng PSO để tối ưu đồng thời độ dài khoảng và bậc của mô hình. Đối với vấn đề thứ hai, thực tế cho thấy đôi khi chuỗi thời gian chính (hay gọi là nhân tố dự báo) lại bị ảnh hưởng bởi một hay nhiều nhân tố khác, ví dụ: chỉ số chứng khoán của Nhật bị ảnh hưởng bởi chuỗi chỉ số chứng khoán New-York. Do đó, để nâng cao hiệu quả dự báo, một số nghiên cứu đã xét thêm các nhân tố phụ để tăng khả năng dự báo cho nhân tố chính trên từng bài toán mà các nhân tố này có mối quan hệ tiềm năng. Điển hình có thể thấy trong các công trình [34, 35, 40] đã đề xuất kết hợp các kỹ thuật khác nhau với mô hình FTS bậc cao hai nhân tố để giải quyết dự báo các bài toán khác nhau: như dự báo nhiệt độ trung bình tại Đài Bắc, Đài Loan [34, 40] với nhân tố thứ hai là độ che phủ của mây; dự báo thị trường chứng khoán Đài Loan TAIFEX [35, 40] nhận chỉ số TAIEX là nhân tố thứ hai. Như đã phân tích ở trên, dự báo chuỗi thời gian mờ đã thu hút được nhiều sự quan tâm của các nhà nghiên cứu quốc tế và họ đã có được các thành quả đáng kể. Tại Việt Nam, lĩnh vực này cũng nhận được sự quan tâm của các nhóm nghiên cứu tại Viện Công nghệ Thông tin (CNTT) và tại các trường Đại học phía nam. Điển hình như, nhóm tác giả tại Đại học Cần Thơ đã xây dựng mô hình chuỗi thời gian mờ với các tập mờ có cấp độ thuộc là một hàm liên tục có chứa tham số [49]. Các tác giả này đã xây dựng thuật toán để xác định các tham số phù hợp nhất trên mỗi tập dữ liệu tương ứng, sau đó thực hiện nội suy dữ liệu để có được kết quả dự báo. Các công trình [19, 20] đã đề xuất phương pháp phân khoảng dựa trên các ánh xạ ngữ nghĩa của đại số gia tử [50], từ đó xây dựng mô hình dự báo tương tự như mô hình chuỗi thời gian mờ. Một số tác giả khác đã cố gắng xây dựng mô hình dự báo bằng chuỗi ngôn ngữ của đại số gia tử thay vì các tập mờ như trong các nghiên cứu [51, 52]. Tuy nhiên, các nghiên cứu này mới chỉ tập trung vào việc xây dựng mô hình bậc nhất, chưa sử dụng thêm nhân tố phụ vào dự báo nên kết quả dự báo thu được chưa thực sự tốt cũng như việc sử dụng tập dữ liệu chưa được phong phú. Mặt khác, để phát triển mô hình dự báo chuỗi thời gian dựa trên lý thuyết đại số gia tử rất cần có những mở rộng mới. Qua phân tích ưu điểm và hạn chế của các công trình nghiên cứu trong và ngoài nước cho thấy mô hình chuỗi thời gian mờ vẫn cần có những cải tiến khác nhau để chúng có thể đạt được độ chính xác dự báo tốt hơn cũng như cần các bước tính toán hợp lý hơn để có thể ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Tính cấp thiết của đề tài luận án:
- 17 Khái niệm quan hệ mờ và nhóm quan hệ mờ do Chen đề xuất đóng vai trò quyết định trong việc phát triển mô hình dự báo chuỗi thời gian mờ. Nhờ những khái niệm này, việc tính toán dự báo đã đơn giản hơn rất nhiều so với mô hình của Song và Chissom. Những công trình nghiên cứu về chuỗi thời gian mờ đa số sử dụng mô hình của Chen để thực hiện dự báo. Tuy nhiên, cấu trúc nhóm quan hệ mờ của Chen và Yu là cố định đối với từng thời điểm dự báo và có sự bất hợp lý. Khi lập nhóm quan hệ mờ ở một thời điểm t nào đó thì sẽ xuất hiện những thành phần không xem xét đến lịch sử xuất hiện của các tập mờ bên vế phải của quan hệ mờ. Điều này dẫn đến việc có thành phần xuất hiện sau thời điểm t mà vẫn được tham gia dự báo cùng với các thành phần tại thời điểm t hoặc thời điểm trước đó. Vấn đề này được xem là không phù hợp với tính thực tiễn. Để khắc phục điểm này, nghiên cứu trong luận án đưa ra khái niệm nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG). Với cách tiếp cận này, tác giả đã chỉ ra rằng việc sử dụng nhóm NQHM-PTTG có thể cải thiện đáng kể kết quả dự báo và đã được chứng minh là phù hợp hơn trong thực tế. Đóng góp này của luận án đã được công bố trong công trình [P1] và đề xuất mở rộng cũng như được ứng dụng trong các công trình [P2-P8]. Bên cạnh đó, các mô hình dự báo chuỗi thời gian mờ bao gồm mô hình bậc một, mô hình bậc cao và mô hình hai hay nhiều nhân tố đã được xem xét trong một loạt công trình nghiên cứu. Do vậy, một vấn đề đặt ra là cần kiểm nghiệm liệu khái niệm nhóm quan hệ mờ phụ thuộc thời gian mới có thực sự tạo được những lợi thế hay không trong các mô hình trên. Đồng thời trong một số bước của mô hình dự báo chuỗi thời gian mờ vẫn tồn tại một số vấn đề cần được cải tiến như tìm các phương pháp phân khoảng mới dựa trên các kỹ thuật như phân cụm, tối ưu tiến hóa hay sử dụng đại số gia tử. Trong bước giải mờ cũng cần một số tinh chỉnh nhằm nâng cao hiệu quả của mô hình dự báo. Nhìn chung còn khá nhiều vấn đề có thể giải quyết được để cải tiến mô hình dự báo. Đây là những nội dung sẽ được trình bày trong suốt luận án mà tập trung vào đề xuất khái niệm nhóm quan hệ mờ mới để kết hợp với các kỹ thuật khác nhau như tối ưu độ dài khoảng chia và kỹ thuật tối ưu bậc của mô hình nhằm nâng cao hiệu quả dự báo. Thông qua đó, luận án xây dựng các mô hình dự báo một và hai nhân tố cũng như những mô hình bậc cao dựa trên cơ sở các đề xuất mới. Hiệu quả của các mô hình đề xuất được đánh giá trên các chuỗi dữ liệu khác nhau và so sánh với các mô hình dự báo hiện có trên cùng tiêu chí và cùng tập dữ liệu mẫu. Mục tiêu nghiên cứu của luận án: - Mở rộng khái niệm nhóm quan hệ mờ trên cơ sở khắc phục các nhược điểm của khái niệm nhóm quan hệ mờ hiện có nhằm xây dựng các mô hình dự
- 18 báo chuỗi thời gian mờ hiệu quả trong việc giải quyết các bài toán dự báo thực tế. - Nghiên cứu xây dựng các mô hình dự báo chuỗi thời gian mờ hiệu quả trên cơ sở áp dụng các kỹ thuật tính toán mềm và các luật giải mờ mới. Đối tượng và giới hạn phạm vi nghiên cứu: Đối tượng nghiên cứu của luận án là chuỗi thời gian mờ, nhóm quan hệ mờ và các kỹ thuật tính toán mềm. Giới hạn: Tập trung vào việc xây dựng mô hình và kiểm chứng mô hình dự báo dựa trên lý thuyết then chốt là chuỗi thời gian mờ và nhóm quan hệ mờ phụ thuộc thời gian. Thêm nữa, luận án còn đề cập đến các kỹ thuật phân khoảng dựa trên Đại số gia tử và các phương pháp tính toán mềm như: phương pháp phân cụm, thuật toán tối ưu trong việc lựa chọn khoảng chia và bậc nhằm nâng cao hiệu quả dự báo của mô hình được đề xuất. Với mục tiêu và phạm vi nghiên cứu đặt ra, những đóng góp của luận án là: ✓ Đề xuất khái niệm NQHM-PTTG dựa trên lý thuyết về chuỗi thời gian mờ và xây dựng thuật toán nhóm các quan hệ mờ. Đây là một khái niệm mới làm nền tảng để kết hợp các kỹ thuật khác nhau nhằm nâng cao hiệu quả dự báo của mô hình. Đóng góp này của luận án đã được công bố ở Kỷ yếu Hội nghị Quốc gia lần thứ VI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR’9) năm 2016 (công trình [P1]) và tạp chí ứng dụng toán học (công trình [P2]) ✓ Xây dựng mô hình dự báo chuỗi thời gian mờ bậc cao để giải quyết bài toán dự báo khác nhau dựa vào NQHM-PTTG. Kết quả này được công bố trên tạp chí International Journal of Computational Intelligence and Applications- ESCI/Scopus Q3 năm 2018 (công trình [ P4]) ✓ Đề xuất các phương pháp phân khoảng dựa trên phân cụm K-means và đại số gia tử. Các đóng góp này được công bố trên các tạp chí tạp chí khoa học và công nghệ Đà Nẵng năm 2017 trong công trình [P3] và Advances in Science Technology and Engineering Systems Journal năm 2021 (công trình [ P8]) ✓ Xây dựng mô hình chuỗi thời gian mờ bậc cao hai nhân tố sử dụng phân cụm FCM và PSO để xác định độ dài khoảng và bậc tối ưu một cách đồng thời. Các đóng góp này trong luận án đã được công bố trong công trình [P5] ✓ Đề xuất, sử dụng kỹ thuật phân cụm FCM với tối ưu PSO trong việc xác định khoảng chia tập nền và các quy tắc giả mờ mới nhằm tăng độ chính xác dự báo của mô hình FTS bậc 1 và bậc cao. Các đóng góp này được công bố trên tạp chí Tin học và Điều khiển năm 2019, đưa ra trong công trình [P7].
![](images/graphics/blank.gif)
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Luận án Tiến sĩ Máy tính: Một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin trên mạng xã hội
107 p |
36 |
8
-
Luận án Tiến sĩ Máy tính: Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng
350 p |
27 |
8
-
Luận án Tiến sĩ Máy tính: Nghiên cứu, phát triển phương pháp phát hiện và xử lý tấn công hố đen vào giao thức định tuyến RPL
117 p |
19 |
7
-
Luận án Tiến sĩ Máy tính: Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định
143 p |
71 |
7
-
Luận án Tiến sĩ Máy tính: Nghiên cứu xây dựng hệ thống V-Sandbox trong phân tích và phát hiện mã độc IoT Botnet
139 p |
11 |
6
-
Luận án Tiến sĩ Máy tính: Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt
124 p |
15 |
6
-
Luận án Tiến sĩ Máy tính: Phương pháp gia tăng rút gọn thuộc tính trong bảng quyết định thay đổi theo tiếp cận tập thô mờ
133 p |
43 |
5
-
Luận án Tiến sĩ Máy tính: Nghiên cứu xây dựng hệ thống VSandbox trong phân tích và phát hiện mã độc IoT Botnet
139 p |
26 |
5
-
Luận án Tiến sĩ Máy tính và Công nghệ thông tin: Một số phương pháp lai gép trong rút gọn thuộc tính theo tiếp cận tập thô mờ
117 p |
21 |
4
-
Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ
139 p |
21 |
4
-
Luận án Tiến sĩ Máy tính: Tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử
148 p |
29 |
4
-
Tóm tắt Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ
24 p |
12 |
2
-
Tóm tắt Luận án Tiến sĩ Máy tính: Nghiên cứu một số kỹ thuật phát hiện va chạm trong vật thể biến dạng và cánh tay cobot
27 p |
4 |
2
-
Tóm tắt luận án Tiến sĩ Máy tính: Khai phá luật quyết định trên mô hình dữ liệu dạng khối
25 p |
21 |
2
-
Tóm tắt luận án Tiến sĩ Máy tính: Khai phá mẫu dãy có trọng số trong cơ sở dữ liệu dãy
26 p |
18 |
2
-
Tóm tắt Luận án Tiến sĩ Máy tính: Phương pháp gia tăng rút gọn thuộc tính trong bảng quyết định thay đổi theo tiếp cận tập thô mờ
27 p |
22 |
2
-
Luận án Tiến sĩ Máy tính: Nghiên cứu một số kỹ thuật phát hiện va chạm trong vật thể biến dạng và cánh tay cobot
114 p |
2 |
2
![](images/icons/closefanbox.gif)
![](images/icons/closefanbox.gif)
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
![](https://tailieu.vn/static/b2013az/templates/version1/default/js/fancybox2/source/ajax_loader.gif)