Nghiên cứu mô hình chuỗi thời gian mờ và ứng dụng vào dự báo dữ liệu tuyển sinh
lượt xem 4
download
Qua phân tích các nhân tố ảnh hưởng đến kết quả dự báo như kỹ thuật chia khoảng tập nền, các luật dự báo và kỹ thuật giải mờ, đề tài đề xuất một phương pháp nâng cao độ chính xác của mô hình dự báo chuỗi thời gian mờ trên cơ sở kết hợp tối ưu các khoảng chia tập nền bằng thuật toán tối ưu bầy đàn và kỹ thuật giải mờ mới hiệu quả. Mô hình dự báo được đề xuất được ứng dụng để dự báo số sinh viên nhập học của Trường Đại học Alabama từ năm 1971 đến năm 1992 và cho độ chính xác dự báo tốt đối với cả chuỗi thời gian mờ bậc nhất và chuỗi thời gian mờ bậc cao.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Nghiên cứu mô hình chuỗi thời gian mờ và ứng dụng vào dự báo dữ liệu tuyển sinh
- TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI NGHIÊN CỨU MÔ HÌNH CHUỖI THỜI GIAN MỜ VÀ ỨNG DỤNG VÀO DỰ BÁO DỮ LIỆU TUYỂN SINH Giảng viên hướng dẫn: TS. Phạm Đình Phong Sinh viên thực hiện: Nguyễn Văn Khánh Lớp: CNTT2-K59 Tóm tắt: Đề tài nghiên cứu các mô hình dự báo chuỗi thời gian mờ được để xuất bởi Song và Chissom năm 1993, Chen đề xuất năm 1996 và các nghiên cứu cải tiến đã được công bố trong những năm gần đây. Qua phân tích các nhân tố ảnh hưởng đến kết quả dự báo như kỹ thuật chia khoảng tập nền, các luật dự báo và kỹ thuật giải mờ, đề tài đề xuất một phương pháp nâng cao độ chính xác của mô hình dự báo chuỗi thời gian mờ trên cơ sở kết hợp tối ưu các khoảng chia tập nền bằng thuật toán tối ưu bầy đàn và kỹ thuật giải mờ mới hiệu quả. Mô hình dự báo được đề xuất được ứng dụng để dự báo số sinh viên nhập học của Trường Đại học Alabama từ năm 1971 đến năm 1992 và cho độ chính xác dự báo tốt đối với cả chuỗi thời gian mờ bậc nhất và chuỗi thời gian mờ bậc cao. Từ khóa: dự báo, chuỗi thời gian mờ, giải mờ, quan hệ logic mờ. 1. ĐẶT VẤN ĐỀ Dự báo được những sự việc, hiện tượng xảy ra trong tương lai giúp chúng ta hoạch định và ra quyết định tốt hơn, giúp nâng cao hiệu quả công việc, tiết kiệm công sức, thời gian và chi phí. Có nhiều mô hình dự báo được đề xuất như ARMA, ARIMA, MA [9], chuỗi thời gian mờ [1], trong đó mô hình dự báo chuỗi thời gian mờ dựa trên lý thuyết tập mờ của Zadeh [10] đã và đang thu hút cộng đồng các nhà khoa học nghiên cứu trong những năm gần đây do có thể dự báo tốt đối với các mẫu dữ liệu có độ biến thiên lớn, dữ liệu được ghi nhận dưới dạng nhãn ngôn ngữ (như “low”, “medium”, “high”, “very high”, …) và số mẫu quan sát ít. Mô hình dự báo chuỗi thời gian mờ được Song và Chissom [1] đề xuất năm 1993 và được áp dụng để dự báo số lượng sinh viên nhập học của trường Đại học Alabama [2, 3]. Tuy nhiên, mô hình dự báo của Song và Chissom sử dụng các phép tính kết hợp max-min phức tạp trong xử lý các quan hệ logic mờ và sẽ tốn nhiều thời gian tính toán khi số lượng các quan hệ logic mờ lớn. Nhằm khắc phục nhược điểm này, Chen [4] đã đề xuất phương pháp hiệu quả hơn trong dự báo số lượng sinh viên nhập học bằng việc sử dụng các nhóm Kỷ yếu nghiên cứu khoa học sinh viên năm 2021 21
- TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI quan hệ logic mờ và giải mờ bằng phép tính số học đơn giản. Để giải quyết tình trạng lặp lại của các quan hệ logic mờ và phản ánh được tầm quan trọng của thứ tự xuất hiện của chúng, Yu đã gán cho chúng các trọng số theo thứ xuất hiện trong nhóm quan hệ logic mờ [11]. Các nghiên cứu trên đặt nền móng cho lĩnh vực nghiên cứu dự báo chuỗi thời gian mờ với các đề xuất cải tiến cả về phương pháp luận và nghiên cứu ứng dụng. Các cải tiến về phương pháp luận chủ yếu tập chung cải tiến mô hình dự báo chuỗi thời gian mờ được đề xuất bởi Chen dựa trên ba yếu tố chính ảnh hưởng đến kết quả dự báo. Thứ nhất, tối ưu độ dài các khoảng chia tập nền bằng các các thuật toán tối ưu như thuật toán di truyền [12, 14], thuật toán tối ưu bầy đàn [7], tìm kiếm Tabu, phân cụm, … Thứ hai, sử dụng các mô hình chuỗi thời gian mờ bậc cao [14], mô hình chuỗi thời gian mờ đa nhân tố (thường là hai nhân tố) [15] thay vì mô hình chuỗi thời gian mờ bậc nhất, áp dụng mô hình dự báo chuỗi thời gian mờ phụ thuộc thời gian [8, 20]. Thứ ba, áp dụng các phương pháp giải mờ hiệu quả nhằm tăng độ chính xác của kết quả dự báo [11, 7]. Các nghiên cứu ứng dụng chuỗi thời gian mờ trong giải quyết các bài toán dự báo trong thực tế bao gồm bài toán dự báo số sinh viên nhập học (the enrollment forecasting) [2-8], dự báo nhiệt độ (temperature forecasting) [15], dự báo chỉ số chứng khoán (stock index forecasting) [7], dự báo nhu cầu du lịch, dự báo tai nạn xe hơi (car road accident forecasting), ... Trên cơ sở các phân tích trên, chúng tôi thấy rằng đây là hướng nghiên cứu vẫn đang được quan tâm và thu hút nhiều nhà khoa học quan tâm nghiên cứu. Do vậy, đề tài có tính khoa học và ứng dụng thực tiễn. Đề tài đề xuất áp dụng mô hình chuỗi thời gian mờ không phụ thuộc thời gian có sử dụng thuật toán tối ưu bầy đàn PSO để chia các khoảng dữ liệu hợp lý hơn và sử dụng các quan hệ logic mờ bậc nhất, quan hệ logic mờ bậc cao cộng thêm kĩ thuật giải mờ được đề xuất. Các kết quả thực nghiệm cho số liệu sinh viên nhập học của trường đại học Alabama trên mô hình được đề xuất cho kết quả khá tốt so với những phương pháp khác khi sử dụng mô hình dự báo chuỗi thời gian mờ dừng kết hợp với tối ưu bầy đàn hay giải thuật di truyền. 2. CÁC NỘI DUNG CHÍNH 2.1. Tiếp cận nghiên cứu 2.1.1. Lý do lựa chọn đề tài Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tích số liệu trong kinh tế, xã hội cũng như trong nghiên cứu khoa học. Chính do tầm quan trọng của Kỷ yếu nghiên cứu khoa học sinh viên năm 2021 22
- TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI các lĩnh vực này, đặc biệt đối với bài toán dữ liệu tuyển sinh chúng tôi đề xuất một thuật toán mới đem lại kết quả cao cho việc dự báo. 2.1.2. Phương pháp nghiên cứu Các phương pháp chính được sử trọng trong quá trình thực hiện đề tài nghiên cứu bao gồm: - Phương pháp phân tích và tổng hơp lý thuyết: nghiên cứu các lý thuyết trong các báo cáo về mô hình chuỗi thời gian mờ đã công bố, đặc biệt quan tâm đến kĩ thuật giải mờ và chia khoảng tập mờ. - Sử dụng phương pháp thực nghiệm: dùng bộ số liệu sinh viên nhập học của trường đại học Alabama để đánh giá các mô hình chuỗi thời gian mờ. Cơ sở là các thuật toán với chuỗi thời gian mờ đã công bố và nghiên cứu đề xuất thuật toán mới, so sánh các kết quả thực nghiệm. 2.1.3. Phạm vi nghiên cứu Phạm vi nghiên cứu là tập trung nghiên cứu mô hình dự báo chuỗi thời gian mờ và áp dụng dự báo số lượng sinh viên nhập học của Đại học Alabama. Cài đặt phần mềm mô phỏng trên máy tính và đánh giá các kết quả thu được. 2.2. Nội dung nghiên cứu và kết quả Đề tài tập trung khảo sát, phân tích các mô hình dự báo chuỗi thời gian mờ đã được công bố để tìm ra những ưu và nhược điểm của các mô hình đó. Từ đó, tìm ra được các biện pháp, kỹ thuật cải tiến nâng cao độ chính xác của mô hình dự báo. 2.2.1. Về cơ sở lý thuyết - Đề tài hệ thống lại dưới dạng cô động một số lý thuyết nền tảng như Chuỗi thời gian mờ, Quan hệ logic mờ bậc nhất và bậc cao, Nhóm quan hệ logic mờ bậc nhất và bậc cao. - Trình bày một số mô hình dự báo chuỗi thời gian mờ đã được công bố bao gồm: Mô hình dự báo chuỗi thời gian mờ của Chen, Huarng, Nguyễn Công Điều, Yu. - Trình bày tóm tắt thuật toán tối ưu bầy đàn PSO. 2.2.1. Mô hình dự báo chuỗi thời gian mờ được đề xuất - Mô hình dự báo chuỗi thời gian mờ được đề xuất dựa trên mô hình dự báo của Yu. Điểm khác đem lại tính hiệu quả của mô hình được đề xuất là việc áp dụng thuật toán tối ưu bầy đàn PSO để tối ưu các khoảng chia kết hợp với kỹ thuật giải mờ mới nhằm nâng cao độ chính xác của kết quả dự báo. Kỹ thuật giải mờ mới thể hiện ở Luật 2 trong Bước 5 như sau: Kỷ yếu nghiên cứu khoa học sinh viên năm 2021 23
- TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI Luật 2: Nếu xuất hiện nhóm quan hệ logic mờ có dạng Ai1, Ai2, …, Ai → Aj1, Aj2, ..., Ajk (, k ≥ 1), thì giá trị dự báo mờ là Aj1, Aj2, ..., Ajk. Mỗi khoảng ujl (1 ≤ l ≤ k) được chia thành p khoảng con bằng nhau và submjl là điểm giữa của một trong p khoảng con đó mà dữ liệu thực của năm dự báo có độ thuộc vào tập mờ Ajl là lớn nhất. Qua một số thực nghiệm, chúng tôi chọn p = 4. Giá trị dự báo rõ được tính toán theo công thức dưới đây: 1 subm j1 + 2 subm j 2 + ... + k subm jk forecast = 1 + 2 + ... + k Kết quả thực nghiệm đối với mô hình bậc nhất: Kết quả thực nghiệm của mô hình bậc nhất được đề xuất (được ký hiệu là WFTS) đối với bài toán dự báo số sinh viên nhập học của Đại học Alabama được so sánh với các mô hình dự báo đã được công bố: CCO6 của Chen và Chung [16], HPSO [17], Uslu [18], Chen&Zou [7]. Số lượng khoảng chia tập nền là 14 và sử dụng quan hệ logic mờ bậc 1. Mô hình đề xuất WFTS có giá trị MSE là 10735, nhỏ hơn rất nhiều so với giá trị MSE của các mô hình CCO6, HPSO, Uslu và Chen&Zou có giá trị lần lượt là 35324, 22965, 422500 và 23710. Như vậy, mô hình dự báo được đề xuất WFTS có giá trị MSE nhỏ nhất, tức là tốt hơn các mô hình được đối sánh. Kết quả thực nghiệm đối với mô hình bậc cao: Kết quả thực nghiệm của mô hình bậc cao được đề xuất được so sánh với các mô hình dự báo đã được công bố: CCO6, HPSO, AFPSO [19] và VGPSO [20] (Bảng 4.3 và Hình 2). Số lượng khoảng chia tập nền cố định là 7 nhưng sử dụng các quan hệ logic mờ bậc cao, từ bậc 2 đến bậc 9. Kết quả so sánh cho thấy, mô hình dự báo mới được đề xuất WFTS có hiệu quả vượt hơn hẳn các mô hình còn lại đặc biệt là từ bậc 3 trở lên. Bảng 4.3. So sánh hiệu quả các mô hình khác nhau theo bậc. Bậc CCO6 HPSO AFPSO VGPSO WFTS 2 67834 67123 19594 19868 16614 3 31123 31644 31189 31307 716 4 32009 23271 20155 23288 450 5 24948 23534 20366 23552 512 6 26980 23671 22276 23684 524 7 26969 20651 18482 20669 545 8 22387 17106 14778 17116 279 9 18734 17971 15251 17987 307 Kỷ yếu nghiên cứu khoa học sinh viên năm 2021 24
- TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI 80000 70000 60000 CCO6 50000 HPSO 40000 AFPSO 30000 VGPSO 20000 WFTS 10000 0 2 3 4 5 6 7 8 9 Hình 2. Biểu đồ so sánh hiệu quả các mô hình khác nhau theo bậc. 3. KẾT LUẬN Đề tài một mô hình dự báo chuỗi thời gian mờ mới dựa trên khái niệm nhóm quan hệ mờ không phụ thuộc thời gian bậc cao và tối ưu bày đàn kết hợp với kỹ thuật giải mờ mới để nâng cao độ chính xác của kết quả dự báo. Qua những thực nghiệm tính toán và so sánh các kết quả thực nghiệm với các mô hình đã có cho thấy mô hình được đề xuất cho kết quả vượt trội hơn hẳn đối với cả mô hình bậc nhất và các mô hình bậc cao. Tài liệu tham khảo [1]. Song Q., Chissom B. S. - Fuzzy Time Series and its Mode, Fuzzy set and systems, vol. 54, pp. 269-277, 1993. [2]. Song Q., Chissom B.S. - Forecasting Enrollments with Fuzzy Time Series – Part I, Fuzzy set and systems, vol. 54, pp. 1-9, 1993. [3]. Song Q., Chissom B. S. - Forecasting Enrollments with Fuzzy Time Series – Part II, Fuzzy set and systems, vol. 62, pp. 1-8, 1994. [4]. Chen S. M. - Forecasting Enrollments based on Fuzzy Time Series, Fuzzy set and systems, vol. 81, pp. 311-319, 1996. [5]. Chen S. M. - Forecasting Enrollments based on high-order Fuzzy Time Series, Int. Journal: Cybernetic and Systems, 33, pp. 1-16, 2002. [6]. Huarng K. - Heuristic models of fuzzy time series forecasting, Fuzzy set and systems, vol. 123, pp. 369-386, 2001. [7]. S.-M. Chen, X.-Y. Zou and G.C. Gunawan, Fuzzy time series forecasting based on proportions of intervals and particle swarm optimization techniques, Information Sciences, vol. 500, pp. 127–139, 2019. Kỷ yếu nghiên cứu khoa học sinh viên năm 2021 25
- TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI [8]. Nguyễn Công Điều, Một thuật toán mới cho mô hình chuỗi thời gian mờ heurictic trong dự báo chứng khoán, Tạp chí Khoa học và Công nghệ, Tập 49, Số 4, trang 11-25, 2011. [9]. G. E. P. Box, G. Jenkins, “Time Series Analysis, Forecasting and Control”, Holden- Day, San Francisco, CA, 1970. [10]. L. A. Zadeh, Fuzzy Sets, Inf. Control, vol. 8, pp. 338–353, 1965. [11]. H. K. Yu, Weighted fuzzy time series models for TAIEX forecasting. Phys. A Stat. Mech. its Appl., vol. 349, pp. 609–624, 2005. [12]. K. Huarng, T. H. K. Yu, Ratio-based lengths of intervals to improve fuzzy time series forecasting, IEEE Trans. Syst. Man, Cybern. Part B Cybern., vol. 36, pp. 328–340, 2006. [13]. S. M. Chen, N. Y. Chung, “Forecasting enrolments of students by using fuzzy time series and genetic algorithms”, International journal of information and management sciences, 17 (2006) 1–18. [14]. S. M. Chen, N. Y. Chung, “Forecasting enrollments using high-order fuzzy time series and genetic algorithms”, International of Intelligent Systems, 21 (2006b) 485-501. [15]. N. Y Wang, S. M. Chen, “Temperature prediction and TAIFEX forecasting based on automatic clustering techniques and two-factors high-order fuzzy time series”, Expert Systems with Applications, vol. 36, pp. 2143-2154, 2009. [16]. S. M. Chen, N. Y. Chung, Forecasting enrollments of students by using fuzzy time series and genetic algorithms, International Journal of Information and Management Sciences, vol. 17, pp. 1–17, 2006. [17]. I. H. Kuo, et al, An improved method for forecasting enrollments based on fuzzy time series and particle swarm optimization, Expert systems with applications, vol. 36, pp. 6108–6117, 2009. [18]. V. R. Uslu, E. Bas, U. Yolcu, E. Egrioglu, A fuzzy times series approach based on weights determined by the number of recurrences of fuzzy relations, Swarm and Evolutionary Computation, vol. 15, pp. 19–26, 2014. [19]. Y. L. Huang, S. J. Horng, M. He, P. Fan, T. W. Kao, M. K. Khan, A hybrid forecasting model for enrollments based on aggregated fuzzy time series and particle swarm optimization, Expert Systems with Applications, vol. 38, pp. 8014 – 8023, 2011. [20]. Nguyễn Công Điều, Nghiêm Văn Tính, Dự báo chuỗi thời gian mờ dựa trên nhóm quan hệ mờ phụ thuộc thời gian và tối ưu bầy đàn, Hội nghị FAIR 2016. Kỷ yếu nghiên cứu khoa học sinh viên năm 2021 26
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Phát triển các liên kết chiến lược trong các chuỗi cung ứng ngành hàng thịt - kinh nghiệm thế giới và định hướng giải pháp cho Việt Nam
18 p | 51 | 5
-
Nghiên cứu xác định thời gian tắt dần sau động đất trong chuỗi tọa độ GNSS liên tục
12 p | 8 | 5
-
Mô hình hóa ứng xử kết cấu bản mặt cầu thép - bê tông nhựa chịu uốn 5 điểm
10 p | 55 | 4
-
Mô hình nghiên cứu thực nghiệm về truyền dữ liệu thời gian thực sử dụng ánh sáng đèn LED
6 p | 25 | 4
-
Nghiên cứu chuỗi cung ứng thực phẩm an toàn tại thị trường thành phố Hà Nội
11 p | 38 | 3
-
Nghiên cứu ứng dụng các mô hình chuỗi thời gian có xét tính mùa vụ trong dự báo sản lượng điện năng hàng tháng
10 p | 14 | 2
-
Mô phỏng và đánh giá một số thuật toán phân bố vị trí của chuỗi chức năng mạng ảo hóa trong mô hình điện toán biên
9 p | 49 | 1
-
Một phương pháp dự đoán thời gian sử dụng hữu ích còn lại của máy điện quay dựa trên học sâu để hỗ trợ ra quyết định bảo trì
8 p | 1 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn