intTypePromotion=1
ADSENSE

Ứng dụng phân cụm chuỗi thời gian dự báo phụ tải điện trong Smart Grid

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:5

7
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết đề xuất phương pháp dự báo phụ tải tháng tiếp theo của các trạm bằng mô hình Long Short Term Memory đồng thời phân cụm các trạm theo dữ liệu chuỗi thời gian tải dựa trên biến đổi Fourier rời rạc nhằm cải thiện độ hiệu quả của mô hình, khắc phục các bất lợi về số lượng các mô hình cần huấn luyện khi số lượng trạm quá lớn và khắc phục nhược điểm về số lượng điểm dữ liệu tại mỗi trạm.

Chủ đề:
Lưu

Nội dung Text: Ứng dụng phân cụm chuỗi thời gian dự báo phụ tải điện trong Smart Grid

  1. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) Ứng Dụng Phân Cụm Chuỗi Thời Gian Dự Báo Phụ Tải Điện Trong Smart Grid Đặng Tiến Đạt1, Nguyễn Tiến Dũng1, Nguyễn Khánh Tùng2, Lê Anh Ngọc3 1 Trường Đại học Bách Khoa Hà Nội 2 Trường Đại học Điện Lực 3 Swinburne VietNam, Đại học FPT Email: ngocla2@fe.edu.vn Tóm tắt nội dung—Trong hệ thống lưới điện thông minh AR, ARMA, ARIMA [1] [2]; (ii) Mô hình học máy (smart grid), các trạm điện đóng một vai trò quan trọng như ANN, RNN, LSTM [2] [3] trong việc phân phối điện đến các điểm tiêu thụ. Chính vì Bằng cách phân tích sâu các thành phần của chuỗi vai trò quan trọng của các trạm điện này mà việc thu thời gian, các mô hình thống kê thường hoạt động tốt thập các dữ liệu liên quan của chúng là rất quan trọng. đối với các dự báo dài hạn trong trường hợp bộ dữ liệu Nhằm nâng cao hiệu quả hoạt động cho các trạm điện này cũng như lưới điện nói chung, chúng tôi đã tích hợp đủ lớn còn nếu với bộ dữ liệu nhỏ, thì việc sử dụng các được vào hệ thống quản lí lưới điện các tính năng thu mô hình thống kê cổ điển không đem lại hiệu quả. thập dữ liệu, phân tích và dự báo phụ tải dài hạn. Do Ngoài ra, các mô hình cổ điển gặp phải bất lợi là chỉ xử lượng năng lượng được phân phối tại mỗi một trạm rất lý được số ít các thông tin đầu vào, cụ thể là hầu hết chỉ lớn nên việc có một mô hình dự báo chính xác là rất cần sử dụng thông tin của chuỗi thời gian phụ tải. Mô hình thiết. Bài báo đề xuất phương pháp dự báo phụ tải tháng LSTM hoạt động rất tốt với dữ liệu dạng chuỗi, đặc tiếp theo của các trạm bằng mô hình Long Short Term biệt là dữ liệu có nhiều chuỗi thời gian thành phần. Sự Memory đồng thời phân cụm các trạm theo dữ liệu chuỗi so sánh giữa LSTM và các mô hình thống kê cổ điển thời gian tải dựa trên biến đổi Fourier rời rạc nhằm cải được thực hiện trong các bài báo [2] và kết quả thu thiện độ hiệu quả của mô hình, khắc phục các bất lợi về số lượng các mô hình cần huấn luyện khi số lượng trạm được là sai số của mô hình LSTM giảm đi rõ rệt. Do quá lớn và khắc phục nhược điểm về số lượng điểm dữ LSTM là một mô hình học sâu, do đó việc huấn luyện liệu tại mỗi trạm. Tại mỗi cụm thì các trạm sẽ được sắp các tham số là điều cần thiết, một bất lợi của LSTM xếp nối với nhau theo các thứ tự cố định, do đó thu được cho bài toán dự báo tại nhiều đối tượng là nếu xây một chuỗi dài hơn và mô hình Long Short Term Memory dựng cho mỗi đối tượng một mô hình thì tổng lượng được sử dụng để dự báo phụ tải các tháng tiếp theo của thời gian huấn luyện sẽ vô cùng lâu, đối với bài toán dự các trạm. Mô hình đề xuất được áp dụng tại một tỉnh ở báo phụ tải của các trạm điện với số lượng trạm điện Việt Nam và dự báo phụ tải 4 tháng tới cho hơn 1300 lên tới hàng nghìn thì việc huấn luyện hàng nghìn mô trạm điện. hình trở nên không khả thi. Bài toán phân cụm chuỗi Từ khóa – Dự báo, biến đổi Fourier rời rạc, LSTM, thời gian đóng vai trò quan trọng trong bài báo này. phân cụm chuỗi thời gian. Saeed Aghabozorgi và các cộng sự [4] đã tổng hợp các kết quả nổi bật về phân cụm chuỗi thời gian trong 10 I. GIỚI THIỆU năm qua, bài báo tổng hợp là có 3 loại phân cụm chuỗi thời gian là: phân cụm chuỗi thời gian toàn bộ, phân Về nguyên tắc hệ thống điện thông minh là sự nâng cụm chuỗi con và phân cụm điểm. Với mỗi loại phân cấp và cập nhật hệ thống điện hiện có bằng công nghệ cụm chuỗi thời gian thì các bước cần thực hiện là biểu đo lường, điều khiển và bảo vệ kỹ thuật số với hệ thống diễn chuỗi thời gian, xác định metric đo lường khoảng truyền thông hiện đại nhằm đáp ứng nhu cầu về độ tin cách hoặc độ tương tự, nguyên mẫu phân cụm và các cậy, an toàn, chất lượng điện, tiết kiệm năng lượng. thuật toán phân cụm. Biến đổi Fourier rời rạc [5] là một Các trạm điện đóng vai trò rất quan trọng trong hệ phương pháp phổ biến để biểu diễn chuỗi thời gian thống điện nói chung và trong hệ thống lưới điện nói trong khi đó K-Means là một trong những thuật toán riêng khi thực hiện chức năng biến đổi từ lượng điện phân cụm đơn giản nhất. cao áp nhận ở đầu nguồn thành điện tiêu dùng và Bài báo đề xuất phương pháp dự báo phụ tải tháng chuyển đến tay người dân. Bài toán dự báo phụ tải điện tiếp theo của các trạm bằng mô hình Long Short Term tại các trạm có ảnh hưởng trực tiếp đến việc bảo trì, Memory 2 đồng thời phân cụm các trạm theo dữ liệu nâng cấp cơ sở hạ tầng của hệ thống lưới điện. Đối với chuỗi thời gian tải dựa trên biến đổi Fourier rời rạc bài toán dự báo phụ tải hiện nay, các mô hình chính có nhằm cải thiện độ hiệu quả của mô hình, khắc phục các thể kể tới: i) Mô hình phân tích thống kê cổ điển như ISBN 978-604-80-5958-3 409
  2. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) bất lợi về số lượng các mô hình cần huấn luyện khi số lượng trạm quá lớn và khắc phục nhược điểm về số lượng điểm dữ liệu tại mỗi trạm. Cấu trúc của bài báo được trình bày trong 4 phần: Phần 1 là giới thiệu tổng quan về dự báo phụ tải điện dựa trên các phương pháp truyền thống, học sâu và phân cụm chuỗi thời gian. Hình 2. Khối phân cụm chuỗi thời gian Phần 2 là Phương pháp đề xuất kết hợp LSTM và phân cụm chuỗi thời gian trong dự báo. Phần 3 là áp dụng Trong bài báo này, chúng tôi đề xuất sử dụng biến đổi phương pháp đề xuất vào dự báo phụ tải điện cho một Fourier rời rạc để biểu diễn chuỗi thời gian của các hệ thống lưới điện tại một tỉnh ở Việt Nam. Phần 4 là trạm qua tập các hệ số của chuỗi Fourier. Sau đó metric kết luận. được chọn để đo độ tương tự giữa các tập hệ số là Euclid và cuối cùng, nguyên mẫu trung bình được chọn II. MÔ HÌNH ĐỀ XUẤT với thuật toán phân cụm rất phổ biến Kmeans. III. THÍ NGHIỆM VÀ KẾT QUẢ A. Bộ dữ liệu Bộ dữ liệu phụ tải theo tháng của 1364 trạm điện được sử dụng trong bài báo này được thu thập từ hệ thống lưới điện của tỉnh Phú Thọ từ tháng 1/2011 đến tháng 11/2016. Mỗi bản ghi bao gồm các thông tin mã trạm, công suất của trạm, lượng điền đầu nguồn và số lượng Hình 1. Mô hình đề xuất khách hàng. Bộ dữ liệu được chia làm 2 tập: tập huấn luyện từ 1/2011 đến 7/2016 và tập kiểm định từ 8/2016 Hình 1 thể hiện tổng quan cho mô hình đề xuất của bài đến tháng 11/2016. Bộ dữ liệu được minh họa qua hình báo với đầu vào là chuỗi thời gian tại N trạm điện và 3 và hình 4 dưới đây. đầu ra là k mô hình được dự báo tương ứng với k cụm. Cụ thể, do dữ liệu của mỗi trạm trong bài toán của chúng tôi là theo tháng nên chuỗi thời gian khá ngắn, điều này gây ra hai vấn đề: chất lượng mô hình và thời gian huấn luyện. Hướng giải quyết bài toàn thường thấy là tạo cho mỗi trạm một mô hình thì việc này dẫn tới một bất lợi quá lớn đó chính là thời gian huấn luyện khi với bộ dữ liệu tại mỗi trạm chỉ có vài chục bản ghi, Hình 3. Dữ liệu phụ tải tại một trạm qua 71 tháng. việc sử dụng các mô hình thống kê truyền thống không đem lại hiệu quả tốt trong khi các mô hình học sâu thì cần huấn luyện rất lâu - do đó có thể dẫn tới quá khớp (overfitting), hơn nữa, với số lượng trạm lên tới hàng nghìn thì có thể thấy hướng giải quyết này là không khả thi. Một hướng giải quyết khác là với đối tượng là các trạm thì sẽ có sự ảnh hưởng lần nhau khi điện được truyền qua từng trạm thì có thẻ ghép tất cả các trạm Hình 4. Dữ liệu phụ tải của 1364 trạm qua 71 tháng thành một chuỗi thời gian, khi đó vấn đề về thời gian huấn luyện sẽ được giải quyết vì chỉ cần huấn luyện duy nhất một mô hình. Tuy nhiên, điều này lại ảnh B. Thí nghiệm hưởng tới chất lượng mô hình khi có quá nhiều trạm, Trước khi sử dụng mô hình LSTM để dự báo, chúng tại mỗi thời điểm có tới hàng nghìn trạm. tôi tạo ra các features mới (bao gồm các features về Do đó, bài báo đề xuất kết hợp hai hướng giải quyết thời gian và features về các giá trị phụ tải quá khứ) từ trên bằng cách từ chuỗi thời gian tương ứng với các features ban đầu nhằm tăng tính độ chi tiết cho trạm điện, sử dụng các phương pháp phân cụm chuỗi từng bản ghi, LSTM có lợi thế cho việc tiếp nhận thời gian để thu được cụm (chi tiết phương pháp nhiều chuỗi thời gian thành phần. phân cụm chuỗi thời gian sẽ được trình bày phía sau). 1) Mô hình không phân cụm: Tại mỗi cụm, các trạm sẽ được sắp xếp theo một thứ tự Với mô hình không phân cụm, chúng tôi hợp mọi trạm cố định tại mỗi thời điểm, từ đó thu được k chuỗi thời lại thành một chuỗi và sau đó sử dụng mô hình LSTM gian mới. Mô hình LSTM sau đó sẽ được sử dụng để để dự báo trong 2 trường hợp thay đổi số epochs và dự báo cho các chuỗi thời gian mới này. kích thước mỗi lô dùng để huấn luyện các tham số của ISBN 978-604-80-5958-3 410
  3. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) mô hình. Ngoài ra, các siêu tham số khác được chọn là Metric để đánh giá chất lượng dự báo của mô hình ở units là 100 và timestep là 3. trong bài báo này là trung bình phần trăm trị tuyệt đối sai số (Mean Absolute Percentage Error - MAPE) Bảng 1. Hai loại thí nghiệm với số lượng epoches 1 | − | và batch size thay đổi ( , )= Thí nghiệm Epoches Batch size với là tập giá trị thực trong khi là tập 1 100 612 giá trị dự báo từ mô hình, là điểm giá trị thực 2 200 256 thứ trong tập , là giá trị dự báo của điểm thứ trong . 2) Mô hình đề xuất a) Phân cụm chuỗi thời gian phụ tải của các C. Kết quả trạm: Dựa trên kết quả của 2 metric Elbow và Silhouette [6] Như đã trình bày ở phần phương pháp ở trên, chúng tại các hình dưới, số cụm các trạm có thể là 3 hoặc 4. tôi sử dụng tập các tham số của chuỗi Fourier để biểu diễn các chuỗi thời gian của các trạm. Số tham số để biểu diễn cho mỗi trạm ở đây là 14. Với số lượng tham số là 14, với thử nghiệm một trạm bất kì, chúng tôi thu được một chuỗi Fourier xấp xỉ khá tốt từ chuỗi phụ tải ban đầu. Hình 6. Khảo sát giá trị của metric Silhouette Hình 5. Biểu diễn chuỗi Fourier dựa trên 14 hệ số của một chuỗi phụ tải Các metric sử dụng để đánh giá chọn số cụm và chất lượng phân cụm là Elbow và Silhouette với ý nghĩa: Elbow thể hiện cho tổng bình phương khoảng cách từ các điểm đến tâm của cụm mà điểm đó thuộc về còn Silhouette thể hiện chất lượng phân cụm khi thể hiện cả tính tách biệt giữa các cụm và tính gắn kết giữa các điểm trong cùng một cụm. b) Dự báo tại các cụm Hình 7. Khảo sát giá trị metric Elbow Sau khi các trạm được phân thành các cụm, từng cụm Với kết quả phân cụm là 3 hoặc 4 cụm, bài báo đã thí sẽ được xây dựng một mô hình LSTM tương ứng. nghiệm cả 2 trường hợp phân cụm này với việc đánh Nhằm đánh giá một cách công bằng giữa mô hình giá sự ổn định của mô hình bằng cách mỗi trạm chúng phân cụm đề xuất và mô hình không phân cụm, bài tôi đều chạy mô hình dự báo 30 lần. Kết quả của việc báo cũng thực hiện việc dự báo tại các trạm trong 2 chạy 30 lần cho mỗi cụm trong mỗi mô hình được thể trường hợp về số lượng epochs và batch size như trên, hiện ở bảng sau: đồng thời, giữ nguyên các siêu tham số khác là units: 100 và timestep: 3. Ngoài ra, nhằm đánh giá sự ổn Bảng 2. Kết quả trung bình MAPE thu được sau 30 lần chạy định của mô hình, với mỗi trạm chúng tôi đều chạy mô cho mỗi điểm thu hình dự báo 30 lần. Thí nghiệm Không phân cụm 3 cụm 4 cụm 3) Các metrics đánh giá 1 3.09% 3.055% 3.31% 2 3.05% 2.93% 3.043% ISBN 978-604-80-5958-3 411
  4. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) Nhìn từ Bảng 2, dễ thấy rằng mô hình phân thành 3 cụm có giá trị MAPE trung bình là tốt nhất trong cả 2 trường hợp, trường hợp mô hình cho kết quả tốt nhất với = 2.93%, đó chính là với mô hình phân thành 3 cụm và số lượng epoches là 200 cùng với kích thước lô là 256. Ngoài ra, ta cũng thấy được với trường hợp 2, khi tăng số lượng epoches và giảm kích thước lô thì lỗi dự báo của các mô hình đều giảm, trong đó mô hình phân thành 4 cụm có sự cải thiện tốt nhất khi giảm xấp xỉ 0.27%, trong khi đó 2 mô hình phân thành 3 cụm và không phân cụm giảm lần lượt là 0.125% và 0.04% Hình 10. Minh họa kết quả dự báo cho các cụm trong trường hợp số cụm là 3 Minh họa kết quả dự báo trong trường hợp phân cụm Hình 8. Biểu đồ box plot của MAPE của các model trong các trạm thành 4 cụm trong trường hợp số epoches thí nghiệm 1 bằng 200 và kích thước lô là 256 Hình 9. Biểu đồ box plot của MAPE của các model trong thí nghiệm 2 Hình 8 và 9 thể hiện biểu đồ hộp trong 2 trường hợp, ta cũng thấy được sự cải thiện của cả 3 mô hình và đặc biệt là mô hình 3 cụm với trường hợp 2 đem lại kết quả tốt nhất. Tuy mô hình 4 cụm đã có sự cải thiện đáng kể nhưng khoảng phân vị vẫn là khá lớn trong khi với mô hình 3 cụm, tuy có sự phân cụm nhưng vẫn có khoảng phân vị khá gần với mô hình không phân cụm. Minh họa kết quả dự báo trong trường hợp phân cụm các trạm thành 3 cụm trong trường hợp số epoches Hình 11. Minh họa kết quả dự báo cho các cụm trong bằng 200 và kích thước lô là 256 trường hợp số cụm là 4 Từ các hình 10 và 11, ta thấy tất cả các đường dự báo (màu đỏ) đều cho kết quả khá khớp với đường giá trị thực (màu xanh). ISBN 978-604-80-5958-3 412
  5. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) IV. KẾT LUẬN Bài báo này nêu ra mô hình đề xuất mới tích hợp phân cụm chuỗi thời gian cho dự báo phụ tải điện tại các trạm điện và áp dụng mô hình đề xuất vào bộ dữ liệu thực tại một tỉnh tại Việt Nam. Kết quả của mô hình đề xuất cho thấy tốt hơn mô hình thuần LSTM thông thường. Ngoài ra, phương pháp đề xuất có khả năng cân bằng được hai yếu tố là chất lượng dự báo và thời gian huấn luyện để xây dựng mô hình. TÀI LIỆU THAM KHẢO [1] M. M. Eljazzar and E. E. Hemayed, "Enhancing electric load forecasting of ARIMA and ANN using adaptive Fourier series," in 2019 International Conference on Electrical, Computer and Communication Engineering (ECCE), 2017. [2] S. Siami-Namini and N. Tavakoli, "A Comparison of ARIMA and LSTM in Forecasting Time Series," in 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA). [3] M. A. R. A. Z. Hasan-Al-Shaikh, "Electric Load Forecasting with Hourly Precision Using Long Short-Term Memory Networks," in 2017 IEEE 7th Annual Computing and Communication Workshop and Conference (CCWC), 2019. [4] S. Aghabozorgi, A. Shirkhorshidi and T. Wah, "Time-series clustering – A decade review," Information Systems, vol. 53, pp. 16-38, 2015. [5] V. S. S. P. T. A. S. B. O. Charantej Reddy Pochimireddy, "Computing the Discrete Fourier Transform of signals with spectral frequency support," in 2021 IEEE International Symposium on Information Theory (ISIT), 2021. [6] P. J.Rousseeuw, "Silhouettes: A graphical aid to the interpretation and validation of cluster analysis," Journal of Computational and Applied Mathematics, vol. 20, pp. 53-65, 1987. ISBN 978-604-80-5958-3 413
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2