intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Nghiên cứu ứng dụng các mô hình chuỗi thời gian có xét tính mùa vụ trong dự báo sản lượng điện năng hàng tháng

Chia sẻ: Lệ Minh Vũ | Ngày: | Loại File: PDF | Số trang:10

1
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nghiên cứu "Nghiên cứu ứng dụng các mô hình chuỗi thời gian có xét tính mùa vụ trong dự báo sản lượng điện năng hàng tháng" sử dụng bốn mô hình chuỗi thời gian có tính mùa vụ cho dự báo sản lượng điện năng hàng tháng của bốn quốc gia bao gồm Việt Nam, Thái Lan, Tây Ban Nha và Hàn Quốc; Các mô hình được sử dụng là Holt-Winters, SARIMA, PROPHET và mô hình NBEATS, với số liệu là sản lượng điện năng thực tế trong giai đoạn từ tháng 1 năm 2010 đến tháng 12 năm 2022. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Nghiên cứu ứng dụng các mô hình chuỗi thời gian có xét tính mùa vụ trong dự báo sản lượng điện năng hàng tháng

  1. NGHIÊN CỨU ỨNG DỤNG CÁC MÔ HÌNH CHUỖI THỜI GIAN CÓ XÉT TÍNH MÙA VỤ TRONG DỰ BÁO SẢN LƯỢNG ĐIỆN NĂNG HÀNG THÁNG Hoàng Trung Thông1,*, Hoàng Mạnh Hùng1, Trần Anh Hải1, Trần Nam Anh2 1 Viện Kỹ thuật, Trường Đại học Công nghệ Thành phố Hồ Chí Minh. 2 Trường Cao đẳng Lý Tự Trọng Thành phố Hồ Chí Minh. * Tác giả liên hệ, Email: hoangthong.ac@gmail.com. TÓM TẮT Nghiên cứu này sử dụng bốn mô hình chuỗi thời gian có tính mùa vụ cho dự báo sản lượng điện năng hàng tháng của bốn quốc gia bao gồm Việt Nam, Thái Lan, Tây Ban Nha và Hàn Quốc; Các mô hình được sử dụng là Holt-Winters, SARIMA, PROPHET và mô hình N- BEATS, với số liệu là sản lượng điện năng thực tế trong giai đoạn từ tháng 1 năm 2010 đến tháng 12 năm 2022. Kết quả được đánh giá bằng hệ số MAPE và RMSE với sự hỗ trợ của ngôn ngữ Python trong môi trường Google Colab. Nghiên cứu đã cho thấy rằng với mỗi bộ dữ liệu sẽ có kết quả và mô hình phù hợp khác nhau, Với Việt Nam thì mô hình thống kê cổ điển Holt-winters cho kết quả tốt nhất với MAPE=3.6%; Thái Lan phù hợp với mô hình SARIMA và NBEATS với MAPE=2.8%; Tây Ban Nha phù hợp với 2 mô hình Holt-winters với MAPE=4.7% và NBEATS với MAPE=4.6%; Riêng Hàn Quốc thì mô hình học sâu N- BEATS cho kết quả xuất sắc với MAPE=1.7%. Từ khóa: Machine Learning; Dự báo sản lượng điện năng; Holt-Winters; SARIMA; PROPHET; N-BEATS 1. Đặt vấn đề Quy hoạch Điện VIII của Việt Nam, được thông qua vào ngày 15/05/2023 theo Quyết định số 500/QĐ-TTg, là một bước tiến quan trọng trong việc phát triển ngành điện của quốc gia, với mục tiêu chuyển dịch sang năng lượng tái tạo và cải thiện hệ thống truyền tải điện. Mục tiêu là cung cấp đủ điện cho phát triển kinh tế với tốc độ tăng trưởng GDP khoảng 7%/năm từ 2021-2030 và 6.5-7.5%/năm từ 2031-2050. Quy hoạch cũng hướng đến việc xuất khẩu điện, với mục tiêu đạt 5,000-10,000MW công suất xuất khẩu vào năm 2030. Ưu tiên phát triển các nguồn năng lượng tái tạo như thủy điện, điện gió, điện mặt trời, sinh khối, cũng như năng lượng mới và sạch như hydro và amoniac xanh. Đặc biệt, khuyến khích việc sử dụng điện mặt trời mái nhà tự sản xuất, tự tiêu thụ. Theo nhiều nghiên cứu khác nhau, dự báo điện năng được chia thành bốn loại tương ứng với từng khung thời gian (Berk, 2015; Cầu, 2022; Singh et al., 2013): Điều độ (Real-Time Operation): Dự báo mỗi chu kỳ điều độ (nửa giờ hoặc một giờ) cho các ứng dụng vận hành theo thời gian thực. Mục đích để quản lý vận hành hệ thống điện linh hoạt và hiệu quả (Khải et al., 2023); Ngắn hạn (STLF): Dự báo cho mỗi chu kỳ giao dịch từ vài ngày cho đến vài tuần. Điều này quan trọng cho các ứng dụng như thị trường giao ngay, điều độ kinh tế, quản lý phụ tải, và lập kế hoạch cam kết tổ máy (Khải et al., 2023; Tuấn & Ngọc, 2022; Vững, 2019; Zhang et al., 2023); Trung hạn (MTLF): Dự báo điện năng tiêu thụ cho chu kỳ tuần hoặc tháng, từ vài tháng tới cho đến vài năm. Điều này hỗ trợ trong việc lập kế hoạch vận hành trung hạn, kế hoạch cung ứng nhiên liệu và bảo trì sửa chữa. Có thể cần dự báo cho từng chu kỳ giao dịch (Liễu, 2016; Nhân, 2022); Dài hạn (LTLF): Dự báo tổng điện năng tiêu thụ, công suất cực đại và cực tiểu cho mỗi năm, từ 5 đến 25 năm tới. Điều này giúp hỗ trợ trong 67
  2. lập quy hoạch công suất nguồn, lưới điện, đầu tư và kế hoạch tài chính cho hệ thống điện và các công ty, nhà đầu tư điện lực (Minh, 2023; Trị, 2009). Với đặc trưng mùa vụ thể hiện khá rõ của thị trường điện Việt nam như Hình 1, cũng như sự biến động liên tục của giá điện và giá nhiên liệu, cùng với nhu cầu sử dụng thay đổi thường xuyên của khách Hình 1. Đồ thị sản lượng điện năng các Quốc Gia hàng và tính không ổn định trong sản xuất năng lượng mặt trời, gió hoặc thủy điện đặt ra khá nhiều rủi ro cho các công ty sản xuất điện, việc nghiên cứu và áp dụng các mô hình dự báo chuỗi thời gian có tính mùa vụ là cần thiết, không chỉ để đáp ứng nhu cầu tiêu thụ trong nước mà còn phục vụ cho các hoạt động phát triển kinh tế - xã hội. Đặc biệt, việc dự báo sản lượng điện năng hàng tháng đóng vai trò quan trọng trong việc đảm bảo cung ứng điện ổn định, giúp cho các đơn vị sản xuất điện có thể quản lý và phân phối năng lượng một cách kịp thời và hiểu quả. Trong những năm gần đây, đã có nhiều phương pháp dự báo điện năng có xét tới yếu tố mùa vụ được phát triển. Các phương pháp dự báo thường được chia thành hai nhóm: các phương pháp thống kê truyền thống và kỹ thuật dựa trên trí tuệ nhân tạo (AI) (Sun et al., 2019). Nhóm đầu tiên bao gồm các phương pháp giản đơn, san bằng theo hàm mũ - ETS, hồi quy tuyến tính hoặc logistic, các phương pháp dựa trên chuỗi thời gian, v.v. Nhóm dựa trên AI bao gồm các mô hình mạng nơ-ron nhân tạo (ANN), máy vectơ hỗ trợ (SVM) - Tuyến tính, Mạng Lưới Đàn Hồi, LSTM, TCN, N-Beats v.v. Trong một số trường hợp, các phương pháp lai (Hybrid) được phát triển bằng cách kết hợp nhiều phương pháp lại với nhau (Ünlü, 2019; Zhang et al., 2023). Quá trình tìm hiểu cho thấy dự báo trung hạn và dài hạn ít công trình nghiên cứu hơn so với dự báo ngắn hạn. Theo (Xia et al., 2010), dự báo trung hạn đặc biệt khó khăn do yếu tố tiêu dùng, quyết sách chính trị và kinh tế, cũng như quản lý ngành năng lượng. Trong (Khuntia et al., 2016) cho thấy MTLF và LTLF yêu cầu xem xét nhiều yếu tố phức tạp, đòi hỏi dữ liệu chính xác và kinh nghiệm sâu rộng về ngành, bao gồm cả sự phụ thuộc vào công nghệ mới và tích hợp các nguồn năng lượng. Trong khi đó, dữ liệu STLF chi tiết hơn, phản ánh rõ các thay đổi ngắn hạn như thói quen tiêu dùng và thời tiết. Ngược lại, LTLF tập trung vào dự báo nhu cầu năng lượng dài hạn, ít chi tiết và chủ yếu phân tích xu hướng kinh tế, dân số, chính sách năng lượng và phát triển hạ tầng (Krstve et al., 2023). Như vậy, cho thấy rằng việc ứng dụng các mô hình và phương pháp khác nhau trong dự báo MTLF đang còn hạn chế. Cho nên việc sử dụng các mô hình chuỗi thời gian có tính thời vụ cho dự báo sản lượng điện năng hàng tháng sẽ góp phần mang lại góc nhìn chi tiết hơn về khoảng trống này. Nghiên cứu này tập trung vào việc phân tích và áp dụng bốn mô hình dự báo chuỗi thời gian phổ biến là Holt-Winters, SARIMA, Prophet và N-BEATS để dự báo sản lượng điện năng hàng tháng ở Việt Nam cũng như so sánh với các quốc gia khác như Thái Lan, Tây Ban Nha và Hàn Quốc, với dữ liệu là sản lượng điện năng hàng tháng từ năm 2010 đến 2022. Theo (Liễu, 2016) mô hình Holt-Winters là tốt nhất, mô hình SARIMA cũng đã được chứng minh là công cụ hiệu quả trong việc dự báo dài hạn (Krstve et al., 2023; Sun et al., 2019). Trong khi đó, Prophet và N-BEATS là những mô hình học sâu mới hơn, cũng đã ghi nhận được những thành công nhất định (Nhân, 2022; Oreshkin et al., 2021; Tuấn & Ngọc, 2022; Zhang et al., 2023). 68
  3. 2. Dữ liệu và phương pháp nghiên cứu 2.1 Dữ liệu nghiên cứu Trong nghiên cứu này, dữ liệu được sử dụng là sản lượng điện năng hàng tháng từ tháng 01 năm 2010 đến tháng 12 năm 2022 của 4 quốc gia bao gồm Việt Nam, Thái Lan, Tây Ban Nha và Hàn Quốc. Dữ liệu được thu thập từ Tổng cục thống kê (GSO), EVN và Trading Economics. Đồ thị sản lượng của các quốc gia được thể hiện như Hình 1. Xử lý dữ liệu: Đầu tiên, dữ liệu được khám phá để tìm kiếm các giá trị ngoại lai. Hình 2. Biểu đồ khám phá giá trị ngoại lai. Phương pháp phát hiện giá trị ngoại lai là Phạm vị tứ phân vị (IQR), IQR được tính bằng cách lấy hiệu số giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1) của tập dữ liệu. Q1 là giá trị mà 25% dữ liệu nằm dưới nó, và Q3 là giá trị mà 75% dữ liệu nằm dưới nó. Sau khi loại bỏ các giá trị ngoại lai, các giá trị còn thiếu được điền bằng Phương pháp tương ứng, lấy giá trị tương ứng của tháng liền kề trước. Hình 2 cho thấy dữ liệu các giá trị ngoại lai được phát hiện và trình bày bằng biểu đồ boxplot. Xử lý ngoại lai sẽ được áp dụng cho mô hình Holt-winters và SARIMA vì tính nhạy cảm với biến động lớn làm sai lệch ước lượng mô hình, mô hình PROPHET được thiết kế để tự phát hiện và xử lý ngoại lai, mô hình N- BEATS là mô hình học sâu nên có khả năng tự học từ dữ liệu có độ phức tạp cao. Từ biểu đồ Hình 3. Biểu đồ thể hiện xu hướng và mùa vụ cho thấy dữ liệu của Việt Nam và Thái Lan không có ngoại lai, của Tây Ban nha có 2 giá trị và Hàn Quốc có 1 giá trị ngoại lai. Khi phân rã dữ liệu của các quốc gia, cho thấy sự tồn tại của xu hướng và mùa vụ trong chuỗi thời gian khá rõ ràng, như thể hiện của Hình 3. Trong hình thể hiện được tính mùa vụ của Việt Nam và Thái Lan khá rõ ràng, của Tây Ban Nha không rõ bằng nhưng cũng có sự chênh lệch rõ giữa các tháng, riêng Hàn Quốc biểu hiện này không được rõ. 2.2 Phương pháp nghiên cứu a) Mô hình Holt-Winters Mô hình san bằng mũ Holt-Winters được phổ biến từ những năm 60 của thế kỷ trước bởi Winters. Mô hình Holt-Winters được mở rộng từ mô hình Exponential Smoothing đơn giản bằng cách thêm vào các thành phần xu hướng và mùa vụ. Mô hình bao gồm ba thành phần chính: • Thành phần Cấp độ (Level component): Đại diện cho giá trị trung bình của chuỗi thời gian. Lt    Yt  St m   1      Lt 1  Tt 1  (1) Trong đó: 69
  4. o Lt là ước lượng cấp độ tại thời điểm t. o Yt là giá trị thực tế của chuỗi thời gian tại thời điểm t. o St-m là thành phần mùa vụ của chuỗi thời gian tại thời điểm t-m, với m là độ dài chu kỳ mùa vụ. o α là hệ số làm mịn cho cấp độ, nằm trong khoảng [0,1]. • Thành phần Xu hướng (Trend component): Mô tả xu hướng tăng hoặc giảm của chuỗi thời gian. Tt     Lt  Lt 1   1     Tt 1 (2) Trong đó: o Tt là ước lượng xu hướng tại thời điểm t. o  là hệ số làm mịn cho xu hướng. • Thành phần Mùa vụ (Seasonal component): Mô tả các mẫu lặp lại theo mùa. St    Yt  Lt   1     St m (3) Trong đó: o St là ước lượng mùa vụ tại thời điểm t. o  là hệ số làm mịn cho mùa vụ. Mô hình Holt-Winters có hai biến thể chính dựa trên cách xử lý xu hướng và mùa vụ: (i) Additive: Sử dụng khi các biến động mùa vụ là cố định và không thay đổi theo thời gian. (ii) Multiplicative: Phù hợp khi các biến động mùa vụ thay đổi và tương quan với mức của chuỗi thời gian. b) Mô hình SARIMA Mô hình SARIMA (Seasonal Autoregressive Integrated Moving Average) là một sự mở rộng của mô hình ARIMA (Autoregressive Integrated Moving Average), tích hợp thêm các thành phần mùa vụ. Mô hình SARIMA được biểu diễn qua ký hiệu SARIMA( p, d , q)( P, D, Q)m , với:  p: Số lần trễ (lags) của mô hình tự hồi quy (AR).  d: Số lần sai phân cần thiết để làm cho chuỗi thời gian trở nên dừng.  q: Số lần trễ của mô hình trung bình trượt (MA).  P: Số lần trễ của mô hình tự hồi quy mùa vụ.  D: Số lần sai phân mùa vụ cần thiết.  Q: Số lần trễ của mô hình trung bình trượt mùa vụ.  m: Chu kỳ mùa vụ. SARIMA kết hợp các phần tự hồi quy (AR), sai phân (I) và trung bình trượt (MA), cả trong phiên bản thông thường và phiên bản mùa vụ: • Tự hồi quy (AR): Phần tự hồi quy mô tả sự phụ thuộc của giá trị hiện tại vào các giá trị trước đó: AR : Yt  1Yt 1  2Yt 2    pYt  p  • Sai phân (I): Sử dụng để làm cho chuỗi thời gian trở nên dừng, thường qua việc lấy sai phân của chuỗi I : 1    Yt ; Trong đó B là toán tử sai phân. d • Trung bình trượt (MA): Mô hình MA tích hợp thông tin về lỗi trong quá khứ: MA : 1 t 1  2 t 2    p t  p  • Thành phần Mùa vụ: Tương tự như trên, nhưng áp dụng cho dữ liệu có chu kỳ mùa vụ: SAR : 1Yt m    pYt  pm ; SMA : 1 t m   Q t Qm a) Mô hình PROPHET Mô hình Prophet dựa trên ba thành phần chính: • Thành phần Xu hướng (Trend component): Mô hình này linh hoạt trong việc bắt các xu hướng tăng, giảm hoặc thay đổi không đều trong chuỗi thời gian. Xu hướng có thể được mô hình hóa bằng các hàm khác nhau, như hàm tuyến tính hoặc hàm logistic. • Thành phần Mùa vụ (Seasonal component): Prophet có khả năng mô hình hóa các yếu tố mùa 70
  5. vụ theo chu kỳ hàng ngày, hàng tuần, hàng tháng hoặc hàng năm. Mùa vụ được mô hình hóa bằng cách sử dụng Fourier series để linh hoạt bắt lấy các mẫu mùa vụ phức tạp. • Ngày lễ và Sự kiện (Holiday and events component): Prophet cho phép người dùng tùy chỉnh các ngày lễ và sự kiện đặc biệt, giúp mô hình dự báo chính xác hơn trong các khoảng thời gian này. Phương trình mô hình: Mô hình Prophet được biểu diễn qua phương trình sau: y  t   g  t   s  t   h  t    t (4) Trong đó:  y(t): Giá trị dự báo tại thời điểm t.  g(t): Thành phần xu hướng.  s(t): Thành phần mùa vụ.  h(t): Thành phần ngày lễ và sự kiện.  εt: Lỗi của mô hình. Điều chỉnh tham số: Prophet cung cấp khả năng tinh chỉnh nhiều tham số để phù hợp với đặc điểm cụ thể của dữ liệu:  Chỉnh sửa Xu hướng: Các tham số như “changepoint_prior_scale” cho phép điều chỉnh độ nhạy của mô hình đối với sự thay đổi trong xu hướng.  Chỉnh sửa Mùa vụ: Các tham số như “seasonality_prior_scale” cung cấp khả năng điều chỉnh độ nhạy của mô hình đối với mùa vụ.  Thêm Ngày lễ và Sự kiện: Có thể thêm các ngày lễ cụ thể và điều chỉnh ảnh hưởng của chúng đến dự báo. c) Mô hình N-BEATS N-BEATS (Neural Basis Expansion Analysis for Time Series) là một mô hình dự báo chuỗi thời gian sử dụng mạng nơ-ron sâu. N-BEATS được giới thiệu như một cách tiếp cận mới trong việc dự báo chuỗi thời gian. Khác biệt lớn nhất của N-BEATS so với các mô hình dự báo chuỗi thời gian truyền thống là việc không sử dụng các cấu trúc dựa trên thời gian (như RNN hoặc LSTM)(Oreshkin et al., 2019), thay vào đó, tập trung vào việc học một bộ hàm cơ sở để biểu diễn dữ liệu. Khối N-BEATS (N-BEATS Block): • Cấu trúc Cơ bản: Mỗi khối trong N-BEATS là một mạng nơ-ron sâu đầy đủ kết nối (fully connected deep neural network). • Đầu vào và Đầu ra: Đầu vào của mỗi khối là dữ liệu quá khứ, X∈RT, với T là độ dài của chuỗi thời gian quan sát; Đầu ra gồm hai phần: dự đoán cho tương lai (Ŷ) và một vector gốc (backcast, B), dùng để tái cấu trúc đầu vào. • Chức năng: Thực hiện tính toán Ŷ, B=ƒ(X;θ), với ƒ là mạng neural và θ là các tham số mạng. Mở rộng cơ sở (Basis Expansion): N-BEATS sử dụng ý tưởng mở rộng cơ sở để dự báo. Nó học một tập hợp các hàm cơ sở (như đa thức, lượng giác) và kết hợp chúng để tạo ra dự đoán cho chuỗi thời gian. Mục đích của phần này là để biểu diễn dự đoán (Ŷ) như là tổ hợp tuyến tính của các hàm cơ sở. Công thức: Ŷ ∑ ( ), với là các hệ số tối ưu hóa và là các hàm cơ sở, được học qua quá trình huấn luyện. Dự báo đa bước: Mô hình được thiết kế để thực hiện dự đoán hồi quy đa bước. Có nghĩa là nó có khả năng dự đoán nhiều điểm dữ liệu trong tương lai cùng một lúc. Kiến trúc xếp chồng: Mô hình N-BEATS bao gồm việc xếp chồng nhiều khối N- BEATS lên nhau. Mỗi khối học một phần của dự đoán, và dự đoán cuối cùng, Ŷ , là kết quả của việc kết hợp đầu ra từ tất cả các khối: Ŷ ∑ Ŷ . Phương pháp này giúp tăng cường khả năng biểu diễn của mô hình và khả năng dự đoán chính xác hơn. Khối xu hướng và mùa vụ: Có hai loại khối chính: khối xu hướng (học các xu hướng dài hạn trong dữ liệu) và khối mùa vụ (học các mẫu lặp lại theo chu kỳ). Học sâu và học chuyển giao: Mô hình tận dụng các kỹ thuật học sâu và có khả năng học chuyển giao, nghĩa là được huấn luyện trên một tập dữ liệu và sau đó được áp dụng cho 71
  6. tập dữ liệu khác. 3. Kết quả và thảo luận 3.1 Phương pháp đánh giá kết quả Trong nghiên cứu dự báo, luôn tồn tại sai số giữa giá trị đầu ra của mô hình và giá trị thực tế. Thông thường có hai nguyên nhân. Nguyên nhân đầu tiên là lỗi mẫu, có thể giảm bớt thông qua xử lý ngoại lai. Nguyên nhân thứ hai là lỗi mô hình, bị hạn chế bởi khả năng tổng quát hóa của mô hình. Trong nghiên cứu dự báo, độ chính xác dự báo được sử dụng để đo lường mức độ phù hợp của mô hình với giá trị. Trong việc lựa chọn chỉ số, sai số tuyệt đối trung bình (MAE), sai số tương đối trung bình và sai số bình phương trung bình (RMSE) thường được sử dụng làm hàm đánh giá, trong khi MAE có thể dẫn đến lệch trong việc đánh giá mô hình dự báo chuỗi thời gian đa biến, và MAPE khắc phục được hạn chế này. Công thức tính cụ thể được trình bày trong (5) và (6).   y i   y i   n ' 2 1 n y i   y i  ' RMSE  i 1 (5) MAPE  100   (6) n n i 1 yi Trong đó, y(i) đại diện cho giá trị thực tế của tháng thứ i, y′(i) đại diện cho giá trị dự đoán của tháng thứ i, và n đại diện cho độ dài của chuỗi thời gian. 3.2 Mô hình Holt-winters Mô hình được xây dựng với các bước: (i) đọc và chuẩn bị dữ liệu; (ii) tách dữ liệu bằng phương pháp Time series Cross-Validation (TSCV) thành 5 phần (n_splits = 5) để thực hiện kiểm định chéo, phương pháp này tối ưu hơn cách chia truyền thống (train/test split); (iii) Tìm tham số tốt nhất bằng phương pháp Gridsearch cho các siêu tham số: xu hướng (trend), mùa vụ (seasonal) và chu kỳ mùa vụ (seasonal_periods); (iv) đánh giá hiệu suất mô hình bằng MAPE và RMSE; (v) dự báo kết quả cho split cuối của dữ liệu; (vi) trực quan hóa kết quả. 3.3 Mô hình SARIMA Mô hình được xây dựng với các bước: (i) đọc và chuẩn bị dữ liệu; (ii) tách dữ liệu bằng phương pháp Time series Cross-Validation (TSCV) thành 5 phần để thực hiện kiểm định chéo; (iii) Tìm tham số tốt nhất bằng phương pháp Auto-arima cho việc tìm các siêu tham số: bao gồm các tham số như p, d, q cho phần không mùa vụ và P, D, Q, m cho phần mùa vụ, Lựa chọn mô hình dựa trên tiêu chí thông tin AIC (Akaike Information Criterion); (iv) huấn luyện mô hình với tham số tốt nhất và đánh giá hiệu suất mô hình bằng MAPE và RMSE; (v) dự báo kết quả cho split cuối của dữ liệu; (vi) trực quan hóa kết quả. 3.4 Mô hình PROPHET Mô hình được xây dựng với các bước: (i) đọc và chuẩn bị dữ liệu; (ii) tách dữ liệu bằng phương pháp Time series Cross-Validation (TSCV) thành 5 phần để thực hiện kiểm định chéo, (iii) Gán tham số cho mô hình với một số tham số cố định như yearly_seasonality, weekly_seasonality, daily_seasonality, seasonality_mode='multiplicative', changepoint_prior_scale=0.01, seasonality_prior_scale=10 và thành phần holidays của quốc gia tương ứng, Lựa chọn mô hình dựa trên tiêu chí thông tin tham số tốt nhất; (iv) huấn luyện mô hình với tham số tốt nhất và đánh giá hiệu suất mô hình bằng MAPE và RMSE; (v) dự báo kết quả cho split cuối của dữ liệu; (vi) trực quan hóa kết quả. 3.5. Mô hình N-BEATS Mô hình được xây dựng với các bước: (i) đọc và chuẩn hóa dữ liệu bằng MinMaxScaler; (ii) định nghĩa mô hình với 2 lớp là Lớp NBeatsBlock: Đây là lớp cơ bản tạo nên khối xây dựng cho mô hình N-BEATS. Mỗi NBeatsBlock là một mô-đun chịu trách nhiệm cho việc dự báo một phần của chuỗi thời gian, xử lý backcast và forecast thông qua các hàm trend hoặc seasonality tùy thuộc vào block_type, Lớp NBeatsNet: tạo mô hình N- BEATS tổng thể bằng cách kết hợp nhiều NbeatsBlock; (iii) tách dữ liệu bằng prediction- window=12, tạo tệp train/valid; (iv) khởi tạo với các tham số cụ thể như input_size, theta_size, layer_sizes, EPOCHS, và horizon, lựa chọn thuật toán tối ưu là adam, với early- 72
  7. stopping nhằm tránh quá khớp (overfitting); (v) huấn luyện mô hình với tham số tốt nhất và đánh giá hiệu suất mô hình bằng MAPE và RMSE; (vi) dự báo kết quả cho 24 điểm cuối của dữ liệu; (vii) trực quan hóa kết quả. 3.6 Thảo luận kết quả Sau đây là kết quả của 4 mô hình cho 4 quốc gia với 2 phương pháp tính hiệu suất là MAPE và RMSE. Mục tiêu của dự báo là tối thiểu hóa sai số. Tùy theo loại dự báo và đầu ra là hệ thống hay phân loại khách hàng, các dự báo phụ tải ngắn hạn có yêu cầu sai số MAPE thường dưới 5%. Các dự báo trung dài hạn có sai số cao hơn và thường có mục tiêu sai số 10% (Cầu, 2022). Như vậy, tất cả các dự báo cho thấy cả 4 mô hình đều phù hợp để tiến hàng dự báo cho dữ liệu điện năng hàng tháng của cả 4 quốc gia. Việt Nam: • Holt-Winter: MAPE là 3.6% và RMSE là 918.2(GWh), cho thấy mô hình này có hiệu suất tốt nhất. • SARIMA: Với MAPE là 4.2% và RMSE là 1055.2(GWh), SARIMA kém hiệu quả hơn Holt-Winter nhưng cũng hoạt động rất tốt. • PROPHET: MAPE là 4.7% và RMSE là 1238.3(GWh), cho thấy mô hình này phù hợp với dữ liệu của Việt Nam. • NBEATS: Có MAPE là 4.7% và RMSE là 1236.2(GWh), cho thấy mô hình này có hiệu suất tương đương PROPHET. Hình 4. Biểu đồ hiệu suất Việt Nam Thái Lan: • Holt-Winter: MAPE là 3.4% và RMSE là 738.0(GWh), cho thấy mô hình này có hiệu suất tốt với số liệu của Thái Lan. • SARIMA: Mô hình rất tốt với MAPE là 2.8% và RMSE thấp nhất là 600.2(GWh). • PROPHET: MAPE là 3.2% và RMSE là 662.7(GWh), có hiệu suất rất tốt. • NBEATS: MAPE là 2.8% và RMSE là 690.7(GWh), cho thấy hiệu suất tương đương SARIMA. Hình 5. Biểu đồ hiệu suất Thái Lan 73
  8. Tây Ban Nha: • Holt-Winter: MAPE là 4.7% và RMSE là 1328.0(GWh), có hiệu suất rất tốt chỉ đứng sau NBEATS. • SARIMA: Hiệu suất kém nhất trong 4 mô hình với MAPE là 8.5% và RMSE là 2396.1(GWh). • PROPHET: MAPE là 5.1% và RMSE là 1507.0(GWh), cho thấy hiệu suất khá tốt. • NBEATS: Cho hiệu suất tốt nhất và phù hợp nhất với dữ liệu, có MAPE là 4.6% và RMSE là 1299.4(GWh). Hình 6. Biểu đồ hiệu suất Tây Ban Nha Hàn Quốc: • Holt-Winter: MAPE là 5.9% và RMSE là 1524.7(GWh), cho thấy mô hình này khá hiệu quả ở Hàn Quốc. • SARIMA: Cho ra hiệu xuất khá kém với MAPE là 8.9% và RMSE là 2264.4(GWh). • PROPHET: Có hiệu suất rất tốt với MAPE là 3.3% và RMSE là 948.8(GWh). • NBEATS: Đạt hiệu suất tốt nhất với MAPE thấp nhất là 1.7% và RMSE thấp nhất là 458.0(GWh). So Sánh Tổng Quan: • Hiệu suất theo Quốc gia: Mỗi quốc gia có một mô hình phù hợp nhất, chẳng hạn Hình 7. Biểu đồ hiệu suất Hàn Quốc Việt Nam phù hợp với mô hình thống kê truyền thống, với mô hình học sâu như NBEATS xuất sắc ở Hàn Quốc, trong khi SARIMA lại rất tốt ở Thái Lan. Điều này cho thấy tính đa dạng của dữ liệu và phải tùy chỉnh cho từng mô hình dựa trên từng trường hợp cụ thể. • Sự đa dạng của Mô hình: Không có một mô hình nào vượt trội trong mọi trường hợp. Mỗi mô hình có những ưu điểm và hạn chế riêng, phụ thuộc vào đặc trưng của dữ liệu. • Lựa chọn Mô hình: Việc lựa chọn mô hình phải cân nhắc đến đặc tính cụ thể của dữ liệu. Ví dụ, mô hình NBEATS có thể phù hợp với dữ liệu có tính mùa vụ không rõ ràng như ở Hàn Quốc, trong khi đó Holt-winters và SARIMA có thể tốt hơn với dữ liệu có xu hướng và tính chu kỳ ổn định như Việt Nam và Thái Lan. 4. Kết luận Qua kết quả nghiên cứu có được cho thấy, khi so sánh kết quả hiệu suất của từng mô hình với 4 phương pháp dự báo trên mỗi bộ dữ liệu khác nhau sẽ cho ra kết quả khác nhau, một phân tích chi tiết với số lượng mô hình và quốc gia đủ lớn để tạo sự tin cậy trong xây dựng phương pháp dự báo. Phân tích này có thể hữu ích cho công tác phân tích và cải thiện các phương pháp dự báo chuỗi thời gian khác cho các mục đích ngắn hạn và dài hạn, đồng thời cung cấp một sự hỗ trợ khá tốt cho các đơn vị vận hành cũng như công ty mua bán điện để có kế hoạch hoạt động trong thị trường điện cạnh tranh. Hiệu quả của các mô hình được công khai về hiệu suất cụ thể, có thể ứng dụng trong hoạt động thực tế, do đó nghiên cứu này có tính đại diện đóng góp cho giới nghiên cứu và cộng đồng năng lượng. Từ kết quả nghiên cứu, có thể kết luận rằng các mô hình thống kê cổ 74
  9. điển vẫn có thể hoạt động tốt và có tính cạnh tranh với các mô hình học máy hiện đại, mặc dù kết quả không được tốt bằng. So với các công trình nghiên cứu khác, mặc dù chưa thực hiện được cách kết hợp các mô hình để cho ra kết quả tốt hơn, nhưng với nhiều bộ dữ liệu khác nhau cũng như cách xây dựng mô hình khác nhau nên chưa thể đưa ra kết luận và so sánh cuối cùng, cần phải có chung một nguồn số liệu để có thể so sánh một cách chính xác nhất. Công việc trong tương lai sẽ là kết hợp sử dụng chung một thuật toán để chọn ra một mô hình phù hợp cho dự báo sản lượng điện năng hàng tháng trên nhiều bộ dữ liệu khác nhau, tích hợp thêm nhân tố ngoại sinh cũng như cải thiện được chất lượng dữ liệu và tốc độ thực thi. TÀI LIỆU THAM KHẢO 1. Berk, K. (2015). Modeling and Forecasting Electricity Demand: A Risk Management Perspective (p. 115). Springer Spectrum. https://doi.org/10.1007/978-3-658-08669-5. 2. Cầu, T. D. H. (2022). Thị trường điện—Các vấn đề cơ bản và chuyên đề kinh tế, thương mại, quản lý chiến lược. Nhà xuất bản Khoa học và Kỹ thuật. 3. Khải N. P., Long T. K., Cường H. P., Huy N. M., & Hưng H. C. (2023). Dự báo ngắn hạn sản lượng điện năng điện mặt trời mái nhà sử dụng mạng neuron nhân tạo. Tạp chí Khoa học Đại học cần Thơ, 59, 251–260. https://doi.org/10.22144/ctu.jvn.2023.051 4. Khuntia, S. R., Rueda, J. L., & Meijden, M. A. M. M. van der. (2016). Forecasting the load of electrical power systems in mid- and long-term horizons: A review. IET Generation, Transmission & Distribution, 10(16), 3971–3977. https://doi.org/10.1049/iet-gtd.2016.0340. 5. Krstve, S., Forcan, J., & Krneta, D. (2023). An Overview of Forecasting Methods for Monthly Electricity Consumption. Tehnicki Vjesnik - Technical Gazette, 30(3), 993– 1001. https://doi.org/10.17559/TV-20220430111309. 6. Liễu, H. T. (2016). Dự báo nhu cầu tiêu thụ điện năng trên địa bàn huyện Phú Vang, Tỉnh Thừa Thiên Huế. Hội thảo quốc tế dành cho các nhà khoa học trẻ khối kinh tế và kinh doanh, Hue University. 7. Minh Đ. T. (2023). Dự báo nhu cầu điện năng tỉnh Phú Thọ giai đoạn 2020-2030. Tạp chí Công Thương. https://tapchicongthuong.vn/bai-viet/du-bao-nhu-cau-dien-nang-tinh- phu-tho-giai-doan-2020-2030-102607.htm. 8. Nhân N. T. (2022). Ứng dụng chuỗi thời gian trong dự báo nhu cầu phụ tải điện ở công ty điện lực Tây Ninh. Học Viện Công nghệ Bưu chính Viễn Thông. 9. Oreshkin, B. N., Carpov, D., Chapados, N., & Bengio, Y. (2019, September 23). N- BEATS: Neural basis expansion analysis for interpretable time series forecasting. International Conference on Learning Representations. https://openreview.net/forum?id=r1ecqn4YwB. 10. Oreshkin, B. N., Dudek, G., Pełka, P., & Turkina, E. (2021). N-BEATS neural network for mid-term electricity load forecasting. Applied Energy, 293, 116918. https://doi.org/10.1016/j.apenergy.2021.116918 11. Singh, A. K., Ibraheem, S. K., & Muazzam, M. (2013). An Overview of Electricity Demand Forecasting Techniques. Network and Complex Systems, 3(3), 38–48. 12. Sun, T., Zhang, T., Teng, Y., Chen, Z., & Fang, J. (2019). Monthly Electricity Consumption Forecasting Method Based on X12 and STL Decomposition Model in an Integrated Energy System. Mathematical Problems in Engineering, 2019, e9012543. https://doi.org/10.1155/2019/9012543 13. Trị, T. M. (2009). Áp dụng mô hình toán kinh tế để phân tích các yếu tố ảnh hưởng và dự báo sản lượng điện trong tương lai. 14. Tuấn, N. A., & Ngọc, L. A. (2022). Ứng dụng mô hình N-BEATS cho dự báo phụ tải điện ngắn hạn ở Việt Nam. Tạp Chí Khoa Học và Công Nghệ Năng Lượng - Trường 75
  10. Đại Học Điện Lực, 28, 2–37. 15. Ünlü, R. (2019). A Comparative Study of Machine Learning and Deep Learning for Time Series Forecasting: A Case Study of Choosing the Best Prediction Model for Turkey Electricity Production. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 23(2), 635–646. https://doi.org/10.19113/sdufenbed.494396. 16. Vững, Đ. V. (2019). Dự báo nhu cầu phụ tải điện năng dùng mạng Neural. Đại Học Sư Phạm Kỹ Thuật TPHCM. https://thuvienso.hcmute.edu.vn/doc/du-bao-nhu-cau-phu-tai- dien-nang-dung-mang-neural-507205.html. 17. Xia, C., Wang, J., & McMenemy, K. (2010). Short, medium and long term load forecasting model and virtual load forecaster based on radial basis function neural networks. International Journal of Electrical Power & Energy Systems, 32(7), 743–750. https://doi.org/10.1016/j.ijepes.2010.01.009. 18. Zhang, B., Song, C., Jiang, X., & Li, Y. (2023). Electricity price forecast based on the STL-TCN-NBEATS model. Heliyon, 9(1), e13029. https://doi.org/10.1016/j.heliyon.2023.e13029. 76
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2