BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM
---------------------------
NGUYỄN TUẤN DŨNG KỸ THUẬT DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN VIỆT NAM
LUẬN ÁN TIẾN SĨ KỸ THUẬT
TP. HỒ CHÍ MINH NĂM 2020
ii
CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM
Cán bộ hướng dẫn khoa học :
PGS.TS. Trần Thu Hà
-
-
PGS.TS. Nguyễn Thanh Phương
Luận án Tiến sĩ đã được bảo vệ tại Trường Đại học Công nghệ TP. HCM
ngày 06 tháng 11 năm 2020
Thành phần Hội đồng đánh giá Luận án gồm:
Họ và tên
TT 1 GS. TSKH. Nguyễn Xuân Quỳnh 2 GS. TS. Lê Kim Hùng PGS. TS. Lê Minh Phương 3 PGS. TS. Quyền Huy Ánh 4 5 GS. TS. Phạm Thị Ngọc Yến PGS. TS. Nguyễn Hùng 6 PGS. TS. Ngô Cao Cường 7 Chức danh Hội đồng Chủ tịch Phản biện 1 Phản biện 2 Phản biện 3 Ủy viên Ủy viên Ủy viên, Thư ký
Xác nhận của Chủ tịch Hội đồng đánh giá Luận án sau khi Luận án đã được báo cáo và sửa
chữa.
GS. TSKH. Nguyễn Xuân Quỳnh
Chủ tịch Hội đồng đánh giá Luận án
iii
CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM
Luận án Tiến sĩ đã được bảo vệ tại Trường Đại học Công nghệ TP. HCM
ngày 06 tháng 11 năm 2020
Thành phần Hội đồng đánh giá Luận án gồm:
Họ và tên
TT 1 GS. TSKH. Nguyễn Xuân Quỳnh 2 GS. TS. Lê Kim Hùng PGS. TS. Lê Minh Phương 3 4 PGS. TS. Quyền Huy Ánh 5 GS. TS. Phạm Thị Ngọc Yến PGS. TS. Nguyễn Hùng 6 PGS. TS. Ngô Cao Cường 7 Chức danh Hội đồng Chủ tịch Phản biện 1 Phản biện 2 Phản biện 3 Ủy viên Ủy viên Ủy viên, Thư ký
Xác nhận của Nghiên cứu sinh, tập thể cán bộ hướng dẫn, Khoa/Viện quản lý chuyên
ngành và Viện Đào tạo Sau đại hộc sau khi Luận án đã được sửa chữa.
Cán bộ hướng dẫn 1 PGS. TS. Trần Thu Hà Cán bộ hướng dẫn 2 PGS. TS. Nguyễn Thanh Phương Nghiên cứu sinh Nguyễn Tuấn Dũng
KHOA QUẢN LÝ CHUYÊN NGÀNH VIỆN ĐÀO TẠO SAU ĐẠI HỌC
PGS. TS. Nguyễn Thanh Phương PGS. TS. Huỳnh Châu Duy
iv
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu,
kết quả nêu trong Luận án là trung thực và chưa từng được ai công bố trong
bất kỳ công trình nào khác.
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận án này
đã được cảm ơn và các thông tin trích dẫn trong Luận án đã được chỉ rõ
nguồn gốc tham khảo.
Tác giả Luận án
Nguyễn Tuấn Dũng
v
LỜI CÁM ƠN
Tôi xin bày tỏ lòng biết ơn chân thành nhất đến PGS.TS Trần Thu Hà và
PGS.TS. Nguyễn Thanh Phương, các Thầy, Cô đã tận tâm chỉ dẫn, truyền đạt
những kiến thức và kinh nghiệm quý báu cho tôi trong suốt quá trình thực
hiện Luận án này.
Và tôi xin được gửi lời cám ơn đến gia đình và bạn bè - những người đã
luôn ủng hộ và động viên chúng tôi trong suốt thời gian vừa qua.
Tác giả Luận án
Nguyễn Tuấn Dũng
vi
TÓM TẮT
Đặc điểm của quá trình sản xuất và tiêu thụ điện năng là phải đảm bảo sự cân
bằng giữa sản xuất và tiêu thụ ở mọi thời điểm, khi có sự mất cân bằng giữa sản
xuất và tiêu thụ đều làm cho chất lượng điện năng thay đổi, nặng nề hơn có thể dẫn
đến sự sụp đỗ điện áp gây tan rã hệ thống.
Tuy nhiên, điện năng là một mặt hàng rất đặc biệt, đó là về mặt kinh tế
không thể lưu trữ và ổn định hệ thống điện đòi hỏi một sự cân bằng liên tục giữa
sản xuất và tiêu dùng. Đồng thời, nhu cầu sử dụng điện còn phụ thuộc vào thời tiết
(nhiệt độ, tốc độ gió, mưa,…); nhu cầu sử dụng của các doanh nghiệp, cũng như các
hoạt động hàng ngày (công suất đỉnh so với giờ cao điểm, các ngày trong tuần so
với ngày cuối tuần, ngày lễ và gần ngày lễ,…); công suất phát của các nguồn năng
lượng tái tạo cũng thay đổi theo điều kiện tự nhiên; Do đó, phải cần đến kỹ thuật dự
báo điện năng để cung cấp thông tin cho quá trình điều khiển HTĐ nhằm đảm bảo
sự cân bằng giữa sản xuất và tiêu thụ. Đặc biệt khi HTĐ được vận hành theo cơ chế
thị trường điện cạnh tranh, kết quả dự báo sẽ cung cấp thông tin cho các nhà quản lý
điều hành giá mua bán diện.
Đã có nhiều phương pháp dự báo được sử dụng, tuy nhiên phần lớn là các
phương pháp dự báo dài hạn và trung hạn dùng để cung cấp thông tin cho việc qui
hoạch phát triển nguồn, lưới điện và lập kế hoạch vận hành HTĐ. Luận án sẽ nghiên
cứu đề xuất một phương pháp dự báo ngắn hạn mới để cung cấp thông tin phụ tải
điện cho các nhà quản lý điều hành thị trường điện cạnh tranh.
Việc nghiên cứu các đặc tính của phụ tải; xây dựng các phương pháp xử lý
dữ liệu thiếu, sai sốt dữ liệu; cũng như đề xuất sử dụng biểu đồ phụ tải chuẩn hóa
đơn vị (SLP) để cung cấp thông tin cho các mô hình dự báo là những nhiệm vụ
quan trọng của luận án. Qua phân tích các mô hình dự báo đang được sử dụng trên
thế giới (Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo, học máy – mô
vii
hình Support Vector Regression; Neural Network, Feedforward Networks; Random
Forest), luận án đã đã xây dựng thành công giải thuật mới đó là sử dụng Biểu đồ
phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng
hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải
quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày
đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có Tết
Dương lịch và Tết Nguyên Đán). Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn
vị (SLP) và Support Vector Regression (SVR) đã hoàn thiện hàm dự báo ngắn hạn,
cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh,
các kết quả dự báo được kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực
thuộc Tập đoàn Điện lực Việt Nam.
Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường
SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức
thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi
nhuận cao nhất. Các module xử lý dữ liệu thiếu, xây dựng Biểu đồ phụ tải chuẩn
hóa đơn vị (SLP), dự báo phụ tải,… được chính tác giả tự lập trình bằng ngôn ngữ
Matlab 2017.
viii
ABSTRACT
The characteristic of the production and consumption of electricity is to
ensure a balance between production and consumption at all times. When there is an
imbalance between production and consumption, the quality of power changes,
which can even lead to voltage collapse, causing the system to fail.
However, electricity is a very special commodity, it is economically
impossible to store. Stabilizing the electrical system requires a constant balance
between production and consumption. In addition, the demand for electricity also
depends on factors such as weather (temperature, wind speed, rain, ...); daily usage
demand (peak capacity, demand on weekdays, weekends, holidays, ...) and variation
in generating capacity of renewable energy sources according to natural conditions.
Therefore, forecast techniques are needed to provide information for the control
process of the power system to ensure a balance between production and
consumption. Especially when the power system is operated under the mechanism
of a competitive electricity market, the forecast results will provide information for
managers to control the buying and selling prices.
Many forecasting methods have been used, but most are long-term and
medium-term forecasting methods used to provide information for power and grid
development planning as well as power system operation planning. The thesis will
study and propose a new short-term forecasting method to provide information
about electricity load to managers operating the competitive electricity market.
The important tasks of the thesis include studying load characteristics,
developing missing and incorrect data processing methods, as well as proposing to
use the Standardized Load Profile (SLP) to provide information for forecasting
models. Through analysis of forecasting models being used in the world (including
Statistical Engineering - SARIMA model; Artificial Intelligence, machine learning -
Support Vector Regression model; Neural Network, Feedforward Networks;
ix
Random Forest), the thesis has successfully built a new algorithm. It is a method of
using the Standardized Load Profile (SLP) as input data sets for the regression
building modules. This method is effective and gives the forecast results with low
error. It solves the difference of negative and positive days, holidays, special days
of the year and the days of January and February (the month of New Year and Lunar
New Year). The combined model of the Standardized Load Profile (SLP) and
Support Vector Regression (SVR) has completed the short-term forecast function
and provided the forecast results for the managers operating the competitive
electricity market. The forecast results are verified with the data set of 05 Electricity
Corporations of Electricity of Vietnam (EVN).
In addition, the thesis also analyzes the impact of SMP market price and
CFD contracts on Qc forecast results to minimize risks and take advantage of the
fluctuations of the market for the highest returns. The modules on processing
missing data , building the Standardized Load Profile (SLP), load forecasting, ... are
programmed by the author using the Matlab 2017.
x
GIẤY XÁC NHẬN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM
xi
xii
CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ
I. CÁC CÔNG TRÌNH THAM DỰ HỘI NGHỊ
1. Nguyen Tuan Dung, Tran Thu Ha, Nguyen Thanh Phuong, 2018: COMPARATIVE STUDY OF SHORT-TERM ELECTRIC LOAD FORECASTING: CASE STUDY EVNHCMC - 2018 4th International Conference on Green Technology and Sustainable Development (GTSD) – IEEE Conference 2018.
2. Nguyen Tuan Dung, Nguyen Thanh Phuong, tháng 7 năm 2018: Comparative Study of Short-Term Electric Load Forecasting: Case Study EVNHCMC – Hội thảo Quốc gia lần thứ XXI – Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông – Thanh Hóa.
3. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2018: DỰ BÁO PHỤ TẢI ĐIỆN NGẮN HẠN BẰNG SUPPORT VECTOR REGRESSION (SVR) – Hội nghị Khoa học công nghệ 2018 – Trường Đại học Công nghệ thành phố Hồ Chí Minh.
(SVR)
4. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: HANDLING MISSING (SLP) AND DATA USING STANDARDIZED LOAD PROFILE SUPPORT VECTOR REGRESSION International - 2019 Conference on System Science and Engineering (ICSSE) – IEEE Conference 2019.
5. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2020: LOAD FORECASTING FOR MONTHS OF THE LUNAR NEW YEAR HOLIDAY USING STANDARDIZED LOAD PROFILE AND SUPPORT REGRESSION VECTOR: CASE STUDY HO CHI MINH CITY - The International Conference On Science, Technology And Society Studies (STS 2020) – Trường Đại học Công nghệ thành phố Hồ Chí Minh.
xiii
II. CÔNG TRÌNH CÔNG BỐ TẠI CÁC TẠP CHÍ KHOA HỌC
• TẠP CHÍ TRONG NƯỚC
6. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2017: DEALING WITH MISSING DATA FOR THE POWER LOAD STUDIES USING SUPPORT VECTOR REGRESSION (SVR) - ISSN 1859-1531 - Tạp chí KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ Số 3(112).2017- Quyển 1; Trang: 28-33.
7. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: XỬ LÝ DỮ LIỆU THIẾU BẰNG BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ (SLP) VÀ SUPPORT VECTOR REGRESSION (SVR) - ISSN 1859-3585 - Tạp chí KHOA HỌC & CÔNG NGHỆ, Số 50.2019, trang 21.
• TẠP CHÍ QUỐC TẾ
8. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: SHORT-TERM ELECTRIC LOAD FORECASTING USING STANDARDIZED LOAD PROFILE (SLP) AND SUPPORT VECTOR REGRESSION (SVR) - Engineering, Technology & Applied Science Research Vol. 9, No. 4, 2019, 4548-4553.
9. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: IMPROVE THE ACCURACY OF SHORT-TERM FORECASTING ALGORITHMS BY STANDARDIZED LOAD PROFILE AND SUPPORT REGRESSION VECTOR: CASE STUDY VIETNAM - Advances in Science, Technology and Engineering Systems Journal Vol. 4, No. 5, 243-249 (2019). ASTESJ ISSN: 2415-6698. https://dx.doi.org/10.25046/aj040530.
xiv
DANH MỤC CÁC HÌNH VẼ
Hình 1.1 – Biến đổi không gian dữ liệu sang 31
Hình 1.2 – Minh họa cho các biến lỏng 33
Hình 1.3 – Thuật toán Rừng ngẫu nhiên Hồi qui 35
Hình 2.1 – Thống kê điện thương phẩm 40
Hình 2.2 – Hệ số tự tương quan của chuỗi thời gian không tĩnh 41
Hình 2.3 – Thống kê hệ số Pmax của tháng 10/2018 41
Hình 2.4 – Hệ số tương quan của Pmax tháng 10/2018 42
Hình 2.5 – Bảng thống kê điện thương phẩm theo từng tháng 42
Hình 2.6 – Hệ số tương quan của 12 tháng của năm 43
Hình 2.7 – Các lỗi thường gặp trong ghi nhận dữ liệu điện 47
Hình 2.8 – Đồ thị biểu diễn tương quan Pmax, Atổng và nhiệt độ 50
Hình 2.9 – Dữ liệu bị thiếu và lỗi 51
Hình 2.10 – Giải thuật xử lý dữ liệu thiếu 52
Hình 2.11 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 55
Hình 2.12 – Kết quả ước lượng dữ liệu thiếu bằng SVR 56
Hình 2.13 – Mô hình mạng Neural Network 57
Hình 2.14 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 58
Hình 2.15 – Kết quả ước lượng các giá trị thiếu, lỗi 59
Hình 2.16 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 60
Hình 2.17 – Kết quả ước lượng các giá trị thiếu, lỗi 60
Hình 3.1 – Tăng trưởng của GRDP và Điện năng qua các năm (triệu kWh) 62
xv
Hình 3.2 – Biểu đồ tương quan giữa GRDP và Điện năng (triệu kWh) 62
Hình 3.3 – 5 thành phần phụ tải sử dụng điện (hộ sử dụng điện) 63
Hình 3.4 – Đồ thị phụ tải của tòa nhà Green Power (EVNHCMC) 64
Hình 3.6 – Phụ tải Nhà máy thép (kWh) 64
Hình 3.6 – Phụ tải Nhà máy Xi măng (kWh) 64
Hình 3.7 – Sự thay đổi theo nhiệt độ trong năm (tháng 5 – mùa hè) 65
Hình 3.8 – Sự thay đổi theo các ngày lễ trong năm 65
Hình 3.9 – Dao động mạnh giữa El Nino và La Nina 65
Hình 3.10 – DR cắt giảm được tải đỉnh 66
Hình 3.11 – Đặc tính tải thay đổi theo ngày 67
Hình 3.12 – Đặc tính tải thay đổi theo giờ - tuần 67
Hình 3.13 – Đồ thị các ngày điển hình tháng1 68
Hình 3.14 – Đồ thị các ngày điển hình tháng 2 68
Hình 3.15 – Đồ thị các ngày điển hình tháng 3 68
Hình 3.16 – Đồ thị các ngày điển hình tháng 4 68
Hình 3.17 – Đồ thị các ngày điển hình tháng 5 69
Hình 3.18 – Đồ thị các ngày điển hình tháng 6 69
Hình 3.19 – Đồ thị các ngày điển hình tháng 7 69
Hình 3.20 – Đồ thị các ngày điển hình tháng 8 69
Hình 3.21 – Đồ thị các ngày điển hình tháng 9 70
Hình 3.22 – Đồ thị các ngày điển hình tháng 10 70
Hình 3.23 – Đồ thị các ngày điển hình tháng 11 70
Hình 3.24 – Đồ thị các ngày điển hình tháng 12 70
xvi
Hình 3.25 – Biểu đồ quan hệ phụ tải và nhiệt độ 71
Hình 3.26 – Đồ thị phụ tải các ngày thứ 6, 7 và chủ nhật 72
Hình 3.27 – Đồ thị phụ tải các ngày thường trong tuần 73
Hình 3.28 – Đồ phụ tải ngày Tết DL, AL và ngày thường 73
Hình 3.29 – Biểu đồ chuẩn hóa đơn vị ngày Tết Dương lịch qua các năm 76
Hình 3.30 – Biểu đồ chuẩn hóa đơn vị ngày Tết Nguyên Đán qua các năm 77
Hình 3.31 – Biểu đồ chuẩn hóa đơn vị ngày thứ 2 trong tuần 77
Hình 3.32 – Biểu đồ chuẩn hóa đơn vị ngày thứ 3 trong tuần 78
Hình 3.33 – Biểu đồ chuẩn hóa đơn vị ngày thứ 6 trong tuần 78
Hình 3.34 – Biểu đồ chuẩn hóa đơn vị ngày thứ 7 trong tuần 78
Hình 3.35 – SLP một số ngày trong năm 80
Hình 3.36 – Giải thuật xử lý dữ liệu thiếu 81
Hình 3.37 – Một số ngày dữ liệu bị lỗi một vài chu kỳ 85
Hình 3.38 – Các hàm hồi qui SVR được xây dựng 86
Hình 3.39 – Các hàm hồi qui được xây dựng lại 86
Hình 3.40 – Đường cong phụ tải được xây dựng lại 87
Hình 3.41 – Dữ liệu được xây dựng lại ngày 08/08/2018 87
Hình 3.42 – Dữ liệu được xây dựng lại ngày 13/08/2018 88
Hình 3.43 – Dữ liệu được xây dựng lại ngày 17/08/2018 88
Hình 3.44 – Dữ liệu được xây dựng lại ngày 25/08/2018 88
Hình 4.1 – Biểu đồ phụ tải tháng 01 qua các năm 92
Hình 4.2 – Biểu đồ phụ tải tháng 02 qua các năm 93
Hình 4.3 – Lưu đồ giải thuật dự báo ngắn hạn 96
xvii
Hình 4.4 – Một số Biểu đồ phụ tải chuẩn hóa đơn vị 99
Hình 4.5 – Phân tích AFC và PAFC 101
Hình 4.6 – Mô hình mạng NN 102
Hình 4.7 – Mô hình Ramdom Forest 103
Hình 4.8 – Kết quả chạy test các mô hình SVR 104
Hình 4.9 – Kết quả chạy test các mô hình học máy 105
Hình 4.10 – Kết quả chạy test các mô hình hồi qui 107
Hình 4.11 – Mô hình được chọn để dùng làm hàm dự báo 108
Hình 4.12 – Kết quả chạy dự báo cho 07 ngày tiếp theo 108
Hình 4.13 – Kết quả dự báo chu kỳ 60 phút/24h/7ngày 109
Hình 4.14 – Kết quả chạy test các mô hình SVR 110
Hình 4.15 – Kết quả chạy test các mô hình học máy 111
Hình 4.16 – Kết quả chạy test các mô hình hồi qui 112
Hình 4.17 – Mô hình được chọn để dùng làm hàm dự báo 113
Hình 4.18 – Kết quả chạy dự báo cho 30 ngày tiếp theo 114
Hình 5.1 – Công suất các nguồn tham gia trực tiếp và gián tiếp VCGM 118
Hình 5.2 – Cơ cấu sản lượng điện năng theo hình thức tham gia thị trường 119
Hình 5.3 – Tăng trưởng công suất đặc các tham gia VCGM 119
Hình 5.4 – Sản lượng Thủy điện qua các năm 120
Hình 5.5 – Sản lượng Nhiệt điện qua các năm 120
Hình 5.6 – Tăng trưởng các nhà máy tham gia thị trường điện 121
Hình 5.7 – Giá SMP và FMP bình quân qua các năm 121
Hình 5.7 – Giá trần thị trường qua các năm 122
xviii
Hình 5.9 – Cấu trúc thị trường Phát điện cạnh tranh Việt Nam 123
Hình 5.10 – Mô hình Thị trường bán buôn điện cạnh tranh 124
Hình 5.11 – Mô hình Thị trường bán buôn điện cạnh tranh năm 2019 125
Hình 5.12 – Vận hành VWEM năm 2019 126
Hình 5.13 – Các biên độ và mục đích dự báo trong vận hành hệ thống điện 128
Hình 5.14 – Điều độ Thị trường điện theo thời gian 129
Hình 5.15 – Đồ thị tương quan của các thành phần 131
Hình 5.16 – Kết quả phân tích ANOVA 132
Hình 5.17 – Định hướng tốc độ tăng trưởng điện năng 133
Hình 5.18 – Lưu đồ giải thuật dự báo 365 ngày – 24 chu kỳ 134
Hình 5.19 – SLP của ngày Tết Dương lịch 01/01/2019 137
Hình 5.20 – SLP của ngày mồng 1 - Tết Nguyên đán Kỷ Hợi 137
Hình 5.21 – SLP của ngày 30/04/2019 138
Hình 5.22 – SLP của ngày 02/09/2019 138
Hình 5.23 – Kết quả dự báo 365 ngày – 24 chu kỳ của năm 2019 139
Hình 5.24 – Sự biến động của giá SMP trên thị trường qua các năm 143
Hình 5.25 – Sự biến động của giá SMP của các tháng năm 2018 143
Hình 5.26 – Sự biến động của giá SMP theo từng giờ, từng ngày 144
Hình 5.27 – Cơ chế thanh toán CFD trên thị trường 145
Hình 5.28 – Biến động giá SMP ngày 18/02/2018 (Tết Âm lịch) 146
Hình 5.29 – Biến động giá SMP ngày 21/02/2018 146
Hình 5.30 – Biến động giá SMP ngày 02/05/2018 147
xix
DANH MỤC CÁC BẢNG BIỂU
Bảng 2.1 – Các giá trị bị lỗi (bằng không, rỗng và cao bất thường) 51
Bảng 2.2 – Kết quả ước lượng theo phương pháp thông thường 53
Bảng 2.3 – Bảng thông số mô hình SVR 54
Bảng 2.4 – Đánh giá kết quả test của mô hình SVR 54
Bảng 2.5 – Kết quả ước lượng dữ liệu thiếu bằng SVR 56
Bảng 2.6 – Đánh giá kết quả test của mô hình NN 57
Bảng 2.7 – Kết quả ước lượng của mô hình NN 59
Bảng 2.8 – Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN 60
Bảng 3.1 – Một số thông số mô hình SVR đặc trưng được đề xuất 82
Bảng 3.2 – Kết quả kiểm tra sai số trung bình của các mô hình SVR 86
Bảng 3.3 – Kết quả kiểm tra sai số trung bình của các mô hình hồi qui. 86
Bảng 4.1 – Lịch qui đổi ngày dương lịch và âm lịch năm 2019 100
Bảng 4.2 – Chúng ta còn có một số mô hình như: 102
Bảng 4.3 – Các thông số mô hình SVM Regression: 104
Bảng 4.4 – Kết quả kiểm tra của các mô hình SVR 104
Bảng 4.5 – Sai số của các mô hình SVR (%) 105
Bảng 4.6 – Kết quả kiểm tra của các mô hình học máy 105
Bảng 4.7 – Sai số của các mô hình học máy (%) 106
Bảng 4.8 – Sai số các mô hình (%) 107
Bảng 4.9 – Kết quả kiểm tra của các mô hình SVR 110
Bảng 4.10 – Sai số của các mô hình SVR (%) 111
xx
Bảng 4.11 – Kết quả kiểm tra của các mô hình học máy 111
Bảng 4.12 – Sai số của các mô hình học máy (%) 112
Bảng 4.13 – Sai số các mô hình hồi qui (%) 113
Bảng 5.1 – Bảng thống kê điện thương phẩm theo 5 thành phần 130
Bảng 5.2 – Bảng thống kê điện khách hàng theo 5 thành phần 130
Bảng 5.3 – Bảng thống kê GRDP theo thành phần kinh tế 130
Bảng 5.4 – Các giả thuyết đầu vào dựa trên các chính sách dài hạn 132
Bảng 5.5 – Kết quả dự báo dài hạn (đến năm 2025) 132
Bảng 5.7 – Dữ liệu thống kê theo tháng 135
Bảng 5.8 – Dữ liệu thống kê theo ngày từ 01/01/2014 – 31/12/2019 135
Bảng 5.8 – Lịch qui đổi ngày dương lịch và âm lịch các ngày lễ năm 2019 136
Bảng 5.9 – Kết quả dự báo 12 tháng năm 2019 139
Bảng 5.10 – Kết quả dự báo 365 ngày của năm 2019 139
Bảng 5.11 – Kết quả sai số dự báo năm 2018 140
Bảng 5.12 – Kết quả sai số dự báo năm 2019 141
xxi
DANH MỤC CÁC TỪ VIẾT TẮT
A Sản lượng điện thương phẩm
A0 Trung tâm điều độ Hệ thống điện Quốc gia
ACA Đấu giá hợp đồng tập trung hàng năm
ACF Hàm tự tương quan
AR Mô hình tự hồi quy
ARIMA Trung bình trượt kết hợp tự hồi quy (Autoregressive Integrated Moving Average)
ARMA Mô hình bình quân di động
BOT Nhà máy điện bao tiêu (có cam kết Chính phủ)
CAN Phí công suất
CART Cây phân loại và hồi qui
CfD Hợp đồng sai khác
CSDL Cơ sở dữ liệu
DR Điều chỉnh nhu cầu phụ tải
DSM Quản lý nhu cầu phụ tải
EE Hiệu quả năng lượng
EPTC Công ty mua bán điện
ERAV Cục Điều tiết Điện lực
EVN Tập đoàn Điện lực Việt Nam
EVNCPC Tổng công ty Điện lực Miền Trung
EVNHCMC Tổng công ty Điện lực thành phố Hồ Chí Minh
xxii
EVNHNPC Tổng công ty Điện lực thành phố Hà Nội
EVNNPC Tổng công ty Điện lực Miền Bắc
EVNSPC Tổng công ty Điện lực Miền Nam
Dự báo nhu cầu theo xu hướng (Forecart inchiding trend) FIT
FMP Giá toàn phần
GAs Thuật toán di truyền
GDP Tăng trưởng kinh tế
GRDP Tăng trưởng kinh tế
MA Mô hình trung bình trượt
MAD Sai số trung bình tuyệt đối (Mean Absolute Deviation)
MAPE Sai số phần trăm trung bình tuyệt đối
MAR Thiếu ngẫu nhiên
MOIT Bộ Công Thương
MSE Sai số bình phương trung bình
MSO Đơn vị vận hành hệ thống và thị trường điện
NAMR Thiếu không ngẫu nhiên
NMĐ Nhà máy điện
NMNĐ Nhà máy nhiệt điện
NMTĐ Nhà máy thủy điện
NN Mạng thần kinh (nơ-ron)
PACF Hàm tự tương quan riêng phần
PASA Đánh giá an ninh hệ thống
xxiii
Tổng công ty Điện lực phân phối PC
Giá hợp đồng mua bán điện dạng sai khác Pc
Công suất cực đại Pmax
Công suất cực tiểu Pmin
Qc Sản lượng điện năng thanh toán theo giá hợp đồng trong chu kỳ giao dịch
QCA Đấu giá hợp đồng tập trung hàng quý
Khoản thanh toán sai khác trong chu kỳ giao dịch Rcfd
RF Mô hình Rừng ngẫu nhiên (Random Forest)
RTD Điều độ thời gian thực
SLP Biểu đồ phụ tải chuẩn hóa đơn vị (Standardized Load Profiles)
SMHP Nhà máy thủy điện chiến lược đa mục tiêu
SMP Chi phí biên của hệ thống
SRMC Chi phí biên ngắn hạn
STLF Dự báo phụ tải ngắn hạn
SVM Phương pháp học máy (Support Vector Machine)
SVR Mô hình Bộ hồi quy dựa theo vector hỗ trợ (Support Vector Regression)
TOU Thời gian sử dụng (Time of Use)
TTĐ Thị trường điện
VCGM Thị trường điện phát điện cạnh tranh
VWEM Thị trường bán buôn điện cạnh tranh
xxiv
DANH MỤC CÁC KÝ HIỆU
là hệ số tự tương quan của
ở độ trễ
là trung bình của
Ký hiệu Định nghĩa
là phương sai σ2
là hệ số tự tương quan lấy mẫu ở độ trễ
là trung bình mẫu của
là độ trễ
là kích cỡ mẫu
là đồng phương sai γk
là Sai phân bậc t wt
là véc tơ trọng số
là kí hiệu chuyển vị T
là hằng số
là véc tơ đầu vào
là véc tơ đặc trưng
là hàm ánh xạ từ không gian đầu vào sang không gian đặc trưng
là hằng số chuẩn hóa
ε-insensitive là hàm lỗi
là hằng số chuẩn hóa C
xxv
là biến lỏng
là tham số của hàm nhân Gaussian
là giá trị đo lường tải hệ thống Yt
là vector dữ liệu theo thời gian vt
là vector hệ số hồi quy, αt
là lỗi mô hình tại thời điểm t εt
là điện năng dự báo ở năm thứ t At
là điện năng ở năm chọn làm gốc Ao
là tốc độ phát triển bình quân hàng năm α
là thời gian dự báo t
là hệ số mùa K
là giá trị điện năng quan sát của tháng thứ i yi
là giá trị điện năng trung bình của các tháng trong năm
là khoản thanh toán sai khác trong chu kỳ giao dịch i (đồng); Rcfdi
là sản lượng điện năng thanh toán theo giá hợp đồng trong chu kỳ Qci
giao dịch i (kWh);
Pc là giá hợp đồng mua bán điện dạng sai khác (đồng/kWh). Đối với
các nhà máy thuỷ điện giá hợp đồng này chưa bao gồm thuế tài
nguyên nước và phí môi trường rừng;
là giá điện năng thị trường trong chu kỳ giao dịch i (đồng/kWh); SMPi
là giá công suất thị trường trong chu kỳ giao dịch i (đồng/kWh). CANi
xxvi
MỤC LỤC
LỜI CAM ĐOAN
iv
LỜI CÁM ƠN
v
TÓM TẮT
vi
ABSTRACT
viii
GIẤY XÁC NHẬN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM
x
CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ
xii
DANH MỤC CÁC HÌNH VẼ
xiv
DANH MỤC CÁC BẢNG BIỂU
xix
DANH MỤC CÁC TỪ VIẾT TẮT
xxi
DANH MỤC CÁC KÝ HIỆU
xxiv
CHƯƠNG I: TỔNG QUAN
1
1.1. Tổng quan về vấn đề nghiên cứu
1
1.2. Tổng quan tình hình nghiên cứu trong nước và nước ngoài liên
quan đến đề tài
3
1.3. Các yếu tố tác động đến các mô hình dự báo phụ tải ngắn hạn
8
1.4. Mục tiêu của luận án
9
1.5. Nhiệm vụ và giới hạn của luận án
10
1.6. Phương pháp nghiên cứu
11
1.7. Đóng góp của luận án
12
1.8. Ý nghĩa thực tiễn của luận án
12
1.9. Bố cục của luận án
13
CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ
TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU
16
2.1. CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG
16
2.1.1. Các phương pháp thống kê
16
2.1.2. Phương pháp chuyên gia
26
2.1.3. Trí tuệ nhân tạo, học máy
29
xxvii
2.2. KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU
36
2.2.1 Thu thập, phân tích và xử lý dữ liệu
36
2.2.2 Nhận biết các thành phần của chuỗi thời gian bằng phương pháp
phân tích hệ số tự tương quan
40
2.2.3 Thiếu giá trị trong khai thác dữ liệu
43
a)
Các loại khác nhau của việc thiếu dữ liệu
44
b)
Phần tử ngoại lai
45
2.2.4 Dữ liệu thiếu trong nghiên cứu phụ tải điện
46
2.2.5 Các phương pháp nghiên cứu xử lý dữ liệu thiếu
47
2.2.6 Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện
48
2.3. KẾT QUẢ NGHIÊN CỨU
50
2.3.1. Dữ liệu đầu vào
50
2.3.2. Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu
51
2.3.3. Kết quả xử lý dữ liệu thiếu
52
•
Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời gian cho 4 tuần trước đó của chuổi dữ liệu đang xét, ta có kết quả
52
•
Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR (Support Vector Regression)
53
+
Xét mô hình SVM Regression, với các thông số:
53
•
Phương pháp xây dựng đường cong hồi qui bằng mạng Neural Network
56
+
Xét mô hình Neural Netwok
56
2.4. TỔNG KẾT CHƯƠNG II
61
CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN
HÓA ĐƠN VỊ
62
3.1. CÁC YẾU TỐ TÁC ĐỘNG ĐẾN PHỤ TẢI ĐIỆN
62
3.1.1. Các yếu tố về kinh tế
62
3.1.2. Giá điện
63
3.1.3. Thành phần phụ tải (được kết nối vật lý)
63
3.1.4. Các yếu tố ngoại sinh
64
xxviii
3.1.5. Quản lý nhu cầu phụ tải
66
3.2. ĐẶC TÍNH PHỤ TẢI
66
3.2.1. Đặc tính tải ngày – tuần (week day)
66
3.2.2. Đặc tính tải giờ – ngày (hour day)
67
3.2.3. Đăc tính của thời tiết
71
3.3. BIỂU ĐỒ PHỤ TẢI CHUẨN HÓA ĐƠN VỊ
71
3.3.1. Khái niệm
71
3.3.2. Ứng dụng xử lý dữ liệu thiếu bằng Biểu đồ chuẩn hóa đơn vị
(SLP) và Support Vector Regression (SVR)
79
3.3.3. Kết quả áp dụng SLP vào xử lý dữ liệu thiếu
83
3.4. TỔNG KẾT CHƯƠNG III
89
CHƯƠNG VI: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN
90
4.1. GIỚI THIỆU
90
4.2. MÔ HÌNH ĐỀ XUẤT
91
4.3. KẾT QUẢ NGHIÊN CỨU
98
4.3.1. Dữ liệu đầu vào
98
4.3.2. Xây dựng đồ thị chuẩn hóa đơn vị
98
4.3.3. Xây dựng các mô hình hồi quy cho STLF
100
4.3.4. Đánh giá các mô hình
103
4.3.5. Kết quả dự báo STLF
103
4.3.6. Kiểm chứng bằng bộ dữ
liệu ngày Tết Nguyên Đán
(EVNHCMC)
110
4.3.7. Kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc
Tập đoàn Điện lực Việt Nam (Chi tiết theo Phụ lục đính kèm)
114
4.4. TỔNG KẾT CHƯƠNG IV
115
CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG
ĐIỆN CẠNH TRANH CỦA VIỆT NAM
117
5.1. TỔNG QUAN VỀ THỊ TRƯỜNG ĐIỆN VIỆT NAM HIỆN
NAY
117
5.1.1. Thị trường phát điện cạnh tranh (giai đoạn 2012 - 2018)
122
5.1.2. Thị trường bán buôn điện cạnh tranh (từ 01/01/2019)
123
xxix
5.2. CÁC YÊU CẦU VỀ DỰ BÁO PHỤ TẢI TRONG VWEM
126
5.2.1. Dự báo phục vụ Kế hoạch phát triển lưới điện truyền tải và phân
phối
129
5.2.2. Dự báo phục vụ công tác vận hành thị trường điện cạnh tranh
133
5.2.3. Kết quả áp dụng Kỹ thuật dự báo vào vận hành Thị trường điện
Bán buôn Việt Nam (phạm vi Tổng công ty Điện lực TP.HCM) 140
5.2.4. Giá SMP của thị trường điện tác động đến kết quả dự báo
141
5.3. TỔNG KẾT CHƯƠNG V
149
CHƯƠNG VI – KẾT LUẬN
150
6.1. CÁC KẾT QUẢ ĐẠT ĐƯỢC CỦA LUẬN ÁN
150
6.2. TÓM TẮT CÁC ĐÓNG GÓP CHÍNH CỦA LUẬN ÁN
151
6.3. HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN
152
TÀI LIỆU THAM KHẢO
153
CÁC PHỤ LỤC
163
1.
DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM TỪ 01/01/2014 ĐẾN 31/12/2019 (số liệu công suất – Pmax, điện năng tiêu thụ – Atổng (24 chu kỳ/ngày) và nhiệt độ (t0) theo từng giờ)
163
2.
CÁC SỐ LIỆU THỐNG KÊ CÁC CHỈ TIÊU KINH TẾ, PHỤ TẢI ĐIỆN THEO TỪNG THÀNH PHẦN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM TỪ NĂM 2014 ĐẾN NĂM 2019
163
3.
ĐỒ THỊ PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM
163
4.
BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM
163
5.
DANH SÁCH CÁC NGÀY LỄ TẾT CỦA TP.HCM
163
6.
KẾT QUẢ CHẠY DỰ BÁO CHO 30 NGÀY CỦA THÁNG 02/2018 – THÁNG 02/2019 (24 CHU KỲ) CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM
163
7.
DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC HÀ NỘI
163
8.
DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN BẮC
163
xxx
9.
DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN TRUNG
163
10. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC
MIỀN NAM
163
11. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG
CÔNG TY ĐIỆN LỰC MIỀN NAM
163
12. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG
CÔNG TY ĐIỆN LỰC MIỀN TRUNG
163
13. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG
CÔNG TY ĐIỆN LỰC MIỀN BẮC
164
14. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG
CÔNG TY ĐIỆN LỰC HÀ NỘI
164
15. KẾT QUẢ DỰ BÁO 8760 CHU KỲ NĂM 2018, 2019 VÀ
2020 CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM
164
16. CODE CHƯƠNG TRÌNH
164
1
CHƯƠNG I: TỔNG QUAN
1.1. Tổng quan về vấn đề nghiên cứu
Vấn đề dự báo điện năng đóng một vai trò hết sức quan trọng và có tính
quyết định đối với nền kinh tế và đời sống của chúng ta. Đây là một môn khoa học
quan trọng nhằm nghiên cứu các phương pháp luận khoa học để đưa ra các con số
chính xác nhất sẽ xảy ra trong tương lai, giúp cho chúng ta định hướng được
phương hướng và kế hoạch cho tương lai, chủ động trong công việc và xử lí được
những biến cố. Nếu như không thực hiện công tác dự báo điện năng, ta sẽ gặp phải
hai trường hợp có thể xảy ra, đó là: sẽ thiếu hụt điện năng sử dụng hay dư thừa điện
năng sản xuất.
Trong những năm qua, dự báo tiêu thụ điện năng thu hút một sự quan tâm
lớn từ các Công ty điện lực và các nhà nghiên cứu từ các khu vực khác nhau. Đối
với các Công ty điện lực đây là một vấn đề lớn bởi vì họ cần phải ước lượng điện
cần thiết để đáp ứng khách hàng của họ. Đối với họ, đây không phải là một nhiệm
vụ dễ dàng bởi vì nhu cầu điện ngày càng tăng trong những năm qua và cũng vì mô
hình tiêu thụ điện ngày càng khác nhau với nhiều yếu tố bao gồm cả thời gian. Vì
vậy, một trong những mục tiêu của Công ty điện lực là dự báo phải bám sát với thực
tế để ngăn ngừa sự thiếu hụt hoặc lãng phí điện năng.
Việc tìm kiếm các phương pháp dự báo tốt nhất không phải là một nhiệm vụ
dễ dàng vì có nhiều biến như: nhiệt độ, độ ẩm, gió, nhân khẩu học, số lượng trung
bình của các thiết bị điện trong nước, mùa trong năm, ngày trong tuần, ngày lễ đã
được đưa vào xem xét. Ngoài ra, việc xây dựng các nhà máy và hệ thống điện luôn
cần có thời gian. Do vậy, muốn đáp ứng được yêu cầu sử dụng điện, ngành điện
phải làm tốt công tác dự báo để lập kế hoạch triển khai. Chính sự phát triển nhanh
của nhu cầu sử dụng điện đang gây ra mất cân đối về tài chính để đảm bảo sự phát
triển bền vững của ngành Điện. Giá điện mua cạnh tranh sẽ là công cụ của thị
2
trường để tạo ra sự cân bằng tự nhiên nhu cầu sử dụng điện, lợi nhuận của các
ngành sản xuất và các đơn vị cung cấp điện [1].
Hiện nay, do sự phát triển nhanh về khoa học kĩ thuật, đặc biệt là những công
cụ tính toán, nhiều phương pháp dự báo đã, đang và sẽ được nghiên cứu để đưa vào
sử dụng. Các mô hình dự báo có nhiều loại [10] dựa trên các phương pháp thống
kê như: Phương pháp bình quân di động, Phương pháp bình quân di động có trọng
số, Phương pháp san bằng số mũ, Phương pháp san bằng số mũ có điều chỉnh xu
hướng, Phương pháp dự báo theo đường khuynh hướng, Phương pháp đường thẳng
thống kê; Phương pháp đường thẳng thông thường; Phương pháp theo khuynh
hướng có xét đến biến động thời vụ; Phương pháp đường Parabol thống kê; Phương
pháp đường Logarit; Phương pháp đa hồi qui (Multiple regression method);
Các mô hình đã được ứng dụng để dự báo trên thế giới ứng dụng công nghệ
mạng neuron như mô hình Rừng ngẫu nhiên (Random Forest Regression): RF là
một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman (2001) [63].
Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản được xây dựng
bằng cách sử dụng thuật toán Bagging [64]. Khi xây dựng một cơ sở phân loại, các
nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên ngẫu nhiên.
Trong bộ cây phân loại và hồi quy CART truyền thống, mỗi nút bên trong là
tập con của tập dữ liệu ban đầu và nút gốc chứa tất cả dữ liệu ban đầu. Các rừng
ngẫu nhiên để hồi quy được hình thành bằng cách hình thành cây dựa vào một
vector ngẫu nhiên sao cho cây tiên đoán có các giá trị số cao hơn so với các nhãn
lớp. Tập huấn luyện được rút ra một cách độc lập từ sự phân bố của vector ngẫu
nhiên, các dự đoán rừng ngẫu nhiên được hình thành bằng cách lấy trung bình trên k
của cây. Giải thuật rừng ngẫu nhiên sinh ra mô hình có độ chính xác cao đáp ứng
được yêu cầu thực tiễn cho vấn đề phân loại, hồi qui [65] – [70].
Phương pháp dự báo từ các mô hình chuỗi thời gian (mô hình BOX-
JENKINS) để đưa ra các dự báo ngắn hạn và trung hạn . Các mô hình kinh tế lượng
chủ yếu dựa trên một động thái rõ nét của các đối tượng có liên quan đến hệ thống
3
kinh tế. Tuy nhiên một họ các mô hình thay thế khác được sử dụng rộng rãi, đặc
biệt trong dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian. Chủ yếu, các
mô hình này nối kết một biến phụ thuộc với các giá trị của nó trong quá khứ và với
các sai số ngẫu nhiên mà có thể có tương quan theo chuỗi. Một các tổng quát, các
mô hình chuỗi thời gian không dựa trên bất kỳ một động thái kinh tế rõ nét nào.
Cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến nhất
trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập kỷ gần đây,
các phương pháp chuỗi thời gian đã được sử dụng rất rộng rãi trong kinh tế học đặc
biệt là trong dự báo ngắn hạn, trong đó các mô hình chuỗi thời gian đã chứng tỏ là
thích hợp hơn so với các mô hình kinh tế lượng.
Một phương pháp rất phổ biến trong việc lập mô hình chuỗi thời gian là
phương pháp trung bình trượt kết hợp tự hồi quy (autoregressive integrated
moving average - ARIMA), thường được gọi là phương pháp luận Box-Jenkins.
Trọng tâm của các phương pháp dự báo mới này không phải là xây dựng các mô
hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác
suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế theo triết lý “hãy để dữ
liệu tự nói”.
Tác giả nghiên cứu mô hình thống kê Box-Jenkin (SARIMA), nghiên cứu
các mô hình học máy tiên tiến như: Neural Network, Support Vector Regression,
Random Forest,… để xây dựng mô hình dự báo (dự báo ngắn hạn, trung hạn) theo
yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.
1.2. Tổng quan tình hình nghiên cứu trong nước và nước ngoài liên quan đến
đề tài
Dự báo phụ tải điện với độ chính xác cao là một trong những nhiệm vụ vô
cùng quan trọng trong qui hoạch và vận hành hệ thống điện. Nếu dự báo trung dài
và dài hạn được quan tâm nghiên cứu khá nhiều ở nước ta (chủ yếu để phục vụ qui
hoạch phát triển hệ thống điện) thì dự báo ngắn hạn mặc dù đóng vai trò quan trọng
trong vận hành kinh tế hệ thống điện, lại chưa được quan tâm nghiên cứu đúng mức.
4
Trên thế giới, các nghiên cứu về STLF trong giai đoạn gần đây tập trung vào
a) Ngoài nước
các hướng như sau:
Rất nhiều phương pháp tiếp cận đã được đề xuất trong tài liệu để xét đến xu
hướng biến đổi của phụ tải, hầu hết các nghiên cứu về STLF đều dựa trên phương
án tính sai phân bậc nhất của chuỗi phụ tải để xét xu hướng biến đổi của phụ tải.
Mặt khác, hầu hết các biến động của phụ tải điện chủ yếu chịu sự chi phối của các
yếu tố như điều kiện khí hậu, nhiệt độ hoặc số giờ trời sáng trong ngày. Mặc dù các
biến động có hệ thống này tồn tại trong chuỗi phụ tải, nhưng với STLF thì thời gian
đưa ra dự báo về cơ bản ngắn hơn chiều dài của chu kỳ hàng năm; do đó, có thể
phỏng đoán rằng các phương pháp dự báo ngắn hạn STLF không cần thiết phải mô
hình hóa tính mùa và vẫn đảm bảo độ tin cậy, thay vào đó sẽ tập trung đánh giá theo
dựa theo tính chu kỳ với khoảng thời gian ngắn hạn như chu kỳ theo tuần, chu kỳ
ngày (Weron (2006) và Taylor (2008)).
Gần đây một số tác giả đã đề xuất mô hình chi tiết có xét tới xu hướng và
tính thời vụ hàng năm. Soares and Mederios (2008) đã mô phỏng xu hướng tải như
là một hàm xác định của tổng sản phẩm quốc nội; Dordonnat et al. (2008) đã ước
tính xu hướng tuyến tính cục bộ theo mỗi giờ trong ngày. Dordonnat et al. (2008) và
Soares và Mederios (2008) đã mô hình hóa tính chu chu kỳ hàng năm như là tổ hợp
của các hàm sin và cosin giống trong phân tích chuỗi Fourier.
• Xử lý các mẫu trong-tuần và trong-ngày
Khi lập mô hình phụ tải điện theo giờ (hoặc nửa giờ) cần quan tâm tới hai
yếu tố chính là dạng đồ thị phụ tải điển hình của ngày và tuần trong các mùa. Trong
bài toán STLF tồn tại hai cách tiếp cận chính để xử lý các đồ thị phụ tải ngày: sử
dụng mô hình một phương trình cho tất cả các giờ hoặc sử dụng mô hình đa phương
trình với các phương trình khác nhau cho các giờ khác nhau trong ngày. Cách tiếp
cận đầu tiên cho phép áp dụng các mô hình có khả năng mô hình hóa tính động của
của cả mô hình tuần và ngày, như mô hình ARIMA theo mùa kép hoặc phương
5
pháp làm mịn theo cấp số mũ cho mùa kép (Taylor (2008)). Một cách tiếp cận khác
để nắm bắt mô hình biểu đồ phụ tải ngày là coi mỗi giờ là một chuỗi thời gian riêng
biệt. Một cách đơn giản nhất, phương pháp này sử dụng 24 mô hình độc lập cho 24
giờ trong ngày; các phương pháp phức tạp hơn bao gồm các mô hình vectơ trong đó
các phương trình cho các giờ khác nhau có liên hệ chéo (Ramanathan et al. (1997),
Cottet and Smith (2003), Dordonnat et al. (2008) hoặc Soares and Mederios
(2008)). Nhìn chung phương pháp dùng mô hình riêng biệt cho mỗi giờ được sử
dụng rộng rãi hơn.
• Xử lý ảnh hưởng của các biến thời tiết
Các điều kiện khí tượng có ảnh hưởng đáng kể đến phụ tải tiêu thụ điện. Các
yếu tố như nhiệt độ, bức xạ mặt trời, độ ẩm, tốc độ gió, tình trạng mây mù, hay
lượng mưa đã từng sử dụng như là các biến ngoại sinh để cải tiến dự báo phụ tải
điện. Tuy nhiên, theo Weron (2006) & kết quả khảo sát dự báo phụ tải (Hippert et
al. 2001a) đã cho thấy hầu hết nghiên cứu đều có xét đến ảnh hưởng của nhiệt độ và
chỉ có rất ít nghiên cứu xét thêm ảnh hưởng của các yếu tố thời tiết khác. Việc chỉ
sử dụng biến nhiệt độ cũng một phần do dữ liệu thường có sẵn trong khi các dữ liệu
khác về thời tiết thường không đầy đủ (Soares and Mederios 2008).
Nhiều nghiên cứu đã tìm ra được mối tương quan giữa phụ tải điện và nhiệt
độ ngoài trời (Engle et al. 1986; Sailor and Mu˜ noz 1997; Valor et al. 2001; Pardo
et al. 2002; Moral-Carcedo and Vic’ ens-Otero 2005; Cancelo et al. 2008) và mức
độ tương quan. Mặc dù mối liên hệ này phụ thuộc vào đặc trưng khí hậu của vùng
địa lý đang xem xét, tuy nhiên mối liên hệ này rất đa dạng và phức tạp, ví dụ phụ tải
điện có thể tăng lên dù nhiệt độ có tăng hay giảm. Lý do là khi nhiệt độ giảm thì
việc sử dụng hệ thống sưởi tăng lên, khi nhiệt độ tăng thì việc sử dụng điều hòa lại
tăng; do vậy mối liên hệ này được coi là không tuyến tính. Ngoài ra mối liên hệ
tương quan còn thay đổi tùy theo ngày làm việc hay ngày nghỉ, tùy theo tháng của
năm (Cancelo et al. 2008).
6
Để giải mối quan hệ phi tuyến này S´anchez-Ubeda and Wehenkel (1998) đã
đề xuất mô hình phân đoạn nhiệt độ: vùng lạnh (dưới 15 độ), vùng trung gian (15-
17 độ), vùng nóng (trên 17 độ). Trong trường hợp các dữ liệu thời tiết được cho với
nhiều kịch bản khác nhau thì có thể sử dụng mô hình học máy kết hợp (Taylor và
Buizza 2003), trong đó dự báo phụ tải được tính toán theo nhiều kịch bản và đưa ra
kết quả dự báo theo một khoảng giá trị.
• Xử lý các ngày sự kiện theo lịch
Đồ thị phụ tải phụ thuộc vào loại ngày đang xét là ngày làm việc, ngày cuối
tuần, ngày nghỉ lễ…do đó các mô hình dự báo thường được xây dựng riêng cho
ngày bình thường của tuần, ngày lễ trong tuần (Ramanathan et al. 1997). Mặt hạn
chế của phương pháp này là khó khăn khi xử lý những ngày lễ đặc biệt như ngày
đầu năm mới. Để giải quyết bài toán dự báo cho các ngày lễ đặc biệt này cần mô
hình có sử dụng các biến phụ (Moral-Carcedo and Vicens-Otero 2005).
b) Trong nước
Ở nước ta, đã có một vài nghiên cứu về dự báo phụ tải điện nhưng vẫn còn
nặng về nghiên cứu phương pháp luận và học thuật, chưa đi vào số liệu cụ thể, sai
số dự báo còn cao và nhất là khả năng áp dụng còn nhiều giới hạn. Các đề tài trong
nước nghiên cứu về các vấn đề dự báo ngắn hạn phụ tải điện như sau:
− Đề tài nghiên cứu cấp Bộ Công Thương của Viện Năng Lượng do Trần
Kỳ Phúc làm chủ nhiệm năm 2008. Đề tài “Nghiên cứu ứng dụng mạng Nơron nhân
tạo trong dự báo ngắn hạn phụ tải điện” [71]. Theo đó, đề tài nghiên cứu thiết kế mô
hình, lập phần mềm thử nghiệm dự báo đỉnh – đáy – dạng biểu đồ phụ tải ngày
dùng mạng neuron nhiều lớp thuật toán lan truyền ngược sai số MLP và mạng một
lớp thuật toán học không giám sát Kohonen.
− Mạng Wavelet cho bài toán dự báo phụ tải ngắn hạn trong các ngày đặc
biệt của TS. Nguyễn Hoàng Việt, Trần Anh Dũng và Nguyễn Quang Thi – Tạp chí
phát triển KH&CN, tập 10 số 6 – 2007 [72].
7
− Ứng dụng mạng Neural song tuyến trong bài toán dự báo phụ tải điện
của Trần Thị Hoàng Oanh, Trần Hoàng Lĩnh, Đồng Sĩ Thiên Châu và Nguyễn Kỳ
Tài - Tạp chí phát triển KH&CN, tập 10 số 11 – 2007 [73].
− Mô hình dự báo phụ tải ngắn hạn dựa trên phương pháp xử lý dữ liệu
nhóm của Lê Đình Dương – ISSN 1859-1531 - Tạp Chí Khoa Học và Công Nghệ
Đại Học Đà Nẵng, VOL. 17, NO. 7, 2019 [77]. Theo đó, Thuật toán GMDH có thể
được biểu diễn dưới dạng một tập hợp các nơron trong đó các cặp khác nhau trong
mỗi lớp được kết nối thông qua đa thức bậc hai và do đó tạo ra các nơron mới ở lớp
tiếp theo. GMDH hoạt động bằng cách xây dựng các lớp liên tiếp với các liên kết
(hoặc kết nối) phức tạp là các mục của một đa thức. Lớp ban đầu chỉ đơn giản là lớp
đầu vào. Lớp đầu tiên được thực hiện bằng cách hồi quy của các biến đầu vào và
sau đó chọn các biến tốt nhất. Lớp thứ hai được tạo bằng cách tính hồi quy của các
giá trị trong lớp đầu tiên cùng với các biến đầu vào. Điều này có nghĩa là thuật toán
về cơ bản xây dựng các đa thức của đa thức.
Ngoài ra, còn có một số nghiên cứu liên quan đến công tác dự báo ứng dụng
trong các lĩnh vực kinh tế, thời tiết,... Cụ thể:
− Ứng dụng mô hình ARIMA để dự báo VNINDEX, TS. Võ Thị Thúy
Anh Khoa Tài Chính – Ngân hàng, Trường Đại học Kinh tế Tuyển tập Báo cáo Hội
nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 [74].
Theo đó, đề tài đề xuất sử dụng mô hình ARIMA và phương pháp Box-jenkins để
dự báo chỉ số VnIndex trong ngắn hạn căn cứ vào chuỗi dữ liệu quá khứ.
− Xây dựng mô hình mô phỏng tốc độ gió từng giờ từ tốc độ gió trung bình
hàng tháng. Nguyễn Thế Bảo – Trường Đại học Bách khoa HCM, Trần Hồng Hà –
Trung tâm kiểm định kỹ thuật an toàn khu vực 2; Science & Technology
Development, Vol 9, No.7- 2006 [75]. Bài báo trình bày một phương pháp mô hình
hóa thống kê tuyến tính và quy trình mô phỏng cho phép tạo ra chuỗi số liệu tốc độ
gió từng giờ cho cả năm với số liệu đầu vào là tốc độ gió trung bình hàng tháng. Kết
quả so sánh số liệu mô phỏng từ mô hình với số liệu quan sát thực tế cho thấy mô
8
hình đảm bảo độ tin cậy để tạo ra chuỗi số liệu tốc độ gió đầu vào trong các bài toán
mô phỏng kỹ thuật, nhất là các bài toán về năng lượng gió.
− Một số phương pháp khai phá dữ liệu chuỗi thời gian trong dự báo tài
chính, chứng khoán (mô hình ARIMA) – Nguyễn Ngọc Thiệp – Trường Đại học
Công Nghệ - Đại học Quốc Gia Hà Nội [76]. Đề tài nghiên cứu, thi hành mô hình
ARIMA (từ các nghiên cứu của Box- Jenkins) và ứng dụng vào bài toán khai phá
dữ liệu chuỗi thời gian trong dự báo tài chính, chứng khoán và cách áp dụng vào bài
toán thực tế - dự báo sự lên xuống của thị trường chứng khoán Việt Nam.
1.3. Các yếu tố tác động đến các mô hình dự báo phụ tải ngắn hạn
Dự báo phụ tải ngắn hạn trong vận hành thị trường điện thường là dự báo
phụ tải cho ngày tới, tuần tới với chu kỳ 60/30 phút, nó được chia thành các loại
ngày trong tuần, chẳng hạn như: ngày bình thường (thứ ba đến thứ 6); ngày thứ 2;
ngày thứ 7; ngày chủ nhật, các ngày lễ, Tết (Dương lịch và Nguyên Đán); các kỳ
nghỉ trong năm. Mỗi loại ngày có một đặc điểm hình thái riêng của nó, do đó mô
hình dự báo được thiết lập phải làm sao phản ánh được các đặc tính này.
Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có xu hướng
tương đồng mô hình tải trước đó, tuy nhiên, nó sẽ dẫn đến dự đoán sai giữa các
ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó
tác động. Ngoài ra, sự biến đổi theo mùa, xu thế khí tượng học (như El nino, La
nina) cũng được xem xét cẩn thận.
Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết
có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm),
nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt
độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần
phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải
điện và nhiệt độ ước tính được sử dụng cho đầu vào thay vì số thực. Tuy nhiên,
không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có
thể làm giảm độ chính xác của kết quả dự báo.
9
Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn đề cần
được quan tâm và khó dự đoán nhất đó chính là các ngày lễ, Tết Nguyên Đán
(thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch). Thường kết
quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày
dương lịch và ngày âm lịch.
Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ
của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để
làm dữ liệu đầu vào huấn luyện. Như trình bày trên, do đặc thù là nước sử dụng cả
lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị
ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết
quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02. Quan sát biểu
đồ phụ tải của tháng 01 và tháng 02, chúng ta sẽ thấy có sự biến động rất lớn về
hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu quá khứ để dự báo
cho khoảng thời gian này là hết sức phức tạp. Trên thực tế, các thuật toán khi áp
dụng để dự báo cho Việt Nam đều phải thực hiện qua một khâu trung gian đó là qui
đổi các tháng này thành các tháng thông thường và sau khi chạy kết quả dự báo sẽ
qui đổi ngược lại hoặc là chấp nhận sai số lớn. Các phần mềm thương mại do nước
ngoài cung cấp đều gặp rắc rối này.
Thêm nữa, với sự tác động của biến đổi khí hậu toàn cầu thì các số liệu dự
báo thời tiết gần đây hầu như không chuẩn xác và khoảng thời gian dự báo tin cậy
cũng rất ngắn chỉ từ 05 đến 07 ngày, khó đáp ứng yêu cầu ngày càng cao của các
qui định thị trường điện bán buôn cạnh tranh (các Tổng công ty Điện lực phải công
bố bảng chào Qc tháng N+1 24 chu kỳ trước ngày 20 của tháng N,…).
1.4. Mục tiêu của luận án
− Xây dựng mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) –
Support Vector Regression (SVR) để tối ưu giảm thiểu các yếu tố làm ảnh hưởng
đến kết quả dự báo phụ tải ngắn hạn và đáp ứng các yêu cầu về dự báo ngắn hạn
của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.
10
− Áp dụng giải thuật của mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn
vị (SLP) – Support Vector Regression (SVR) vào thực tế dự báo ngắn hạn của
EVNHCMC, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện
cạnh tranh, đánh giá, hiệu chỉnh kết quả dự báo Qc, hạn chế các rủi ro và tận dụng
được các biến động của thị trường để tính toán chi phí tối ưu nhất cho giá điện.
1.5. Nhiệm vụ và giới hạn của luận án
Nội dung đề tài được thể hiện trong các vấn đề chính như sau:
− Nghiên cứu các phương pháp ứng dụng trong dự báo vận hành thị trường
điện trên thế giới và tại Việt Nam để chọn cơ sở xây dựng mô hình Biểu đò phụ tải.
− Nghiên cứu các yếu tố ảnh hưởng đến phụ tải và ảnh hưởng đến chi phí
gía điện, khảo sát các ảnh hưởng của khi hậu Việt nam đến dự báo: đặc tính, các
thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo
tháng, theo ngày và theo giờ (thành phần xu hướng, thành phần chu kỳ, thành phần
bất qui tắc và thành phần theo mùa).
− Nghiên cứu các mô hình dự báo tiên tiến trên thế giới để xây dựng giải
thuật mới để áp dụng dự báo phụ tải theo từng tháng/năm; dự báo ngày/tháng và dự
báo phụ tải 24 giờ/ngày, có xem xét tác động của yếu tố thời tiết và các yếu tố tác
động khác (nếu có), tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối
và bán lẻ cạnh tranh.
− Nghiên cứu các kỹ thuật ước lượng lại dữ liệu bị lỗi, thiếu và sai sót.
− Thiết kế đề xuất mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị
(SLP) – Support Vector Regression (SVR) để tối ưu giảm thiểu các yếu tố làm ảnh
hưởng đến kết quả dự báo phụ tải ngắn hạn và đáp ứng các yêu cầu về dự báo ngắn
hạn của Cục Điều Tiết Điện lực (ERAV).
− Tiến hành thực nghiệm ứng dụng mô hình vào Chương trình dự báo phụ
tải phục vụ Vận hành Thị trường điện bán buôn cạnh tranh theo qui định của Thông
11
tư 45/2018/TT-BCT ngày 15 tháng 11 năm 2018 của Bộ Công Thương về
Quy định vận hành Thị trường bán buôn điện cạnh tranh.
− Dựa trên kết quả khảo nghiệm đánh giá sự ảnh hưởng của thị trường điện
đến công tác dự báo nhu cầu phụ tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi
nhuận của hoạt động Sản xuất – Kinh doanh các Tổng công ty Điện lực phân phối
trong thị trường điện.
1.6. Phương pháp nghiên cứu
− Thống kê, tổng hợp và xử lý các số liệu điện thương phẩm, công suất cực
đại – cực tiểu (Pmax – Pmin), tốc độ phát triển điện, tốc độ tăng trưởng của nền
kinh tế, số liệu thống kê nhiệt độ thời tiết, giá điện các thành phần,… dữ liệu quá
khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ trong các
năm vừa qua (từ khoảng 4 – 5 năm).
− Phân tích và xử lý các thành phần của chuỗi dữ liệu quá khứ điện năng
ghi nhận theo thời gian (theo năm, theo tháng, theo ngày và theo giờ) để xác định
các thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc, và chuỗi dữ
liệu phụ thuộc theo biến đổi khí hậu và theo mùa.
− Nghiên cứu mô hình thống kê Box-Jenkin (SARIMA), nghiên cứu các
mô hình học máy tiên tiến như: Neural Network, Support Vector Regression,
Random Forest,… để xây dựng mô hình dự báo (dự báo ngắn hạn, trung hạn) theo
yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.
− Nghiên cứu và đánh giá sự ảnh hưởng thị trường điện đến việc dự báo
nhu cầu phụ tải điện. Đồng thời, xác định các mối quan hệ tác động ảnh hưởng đến
các thành phần phụ tải, dự báo xu hướng để xây dựng kế hoạch phát triển dài hạn.
− Thiết kế và mô phỏng các modules về xử lý dữ liệu, về các giải thuật dự
báo sử dụng Matlab; Bộ dữ liệu sử dụng trong luận án là bộ dữ liệu được thu thập
trong quá trình vận hành hệ thống điện của EVNHCM và dữ liệu vận hành Thị
trường điện bán buôn (VWEM) của A0.
12
1.7. Đóng góp của luận án
− Luận án đã nghiên cứu, xây dựng được công cụ tự động ước lượng các
dữ liệu bị lỗi là những dữ liệu thiếu, sai sót, ngoại lai,…(trước đây phải thực hiện
bằng phương pháp thủ công). Đã đề xuất Mô hình kết hợp biểu đồ chuẩn hóa đơn vị
(SLP) và Support Vector Regression (SVR) trong kỹ thuật ước lượng lại dữ liệu bị
lỗi.
− Luận án đã xây dựng thành công giải thuật mới là sử dụng biểu đồ phụ
tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm
hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp nhất giúp dự
báo ước lượng được các tác động về thời gian (như chênh lệch ngày âm và ngày
dương) và các sự kiện truyền thống(như ngày lễ hội, ngày đặc biệt trong năm và các
ngày trong các tháng 01 và 02 là tháng có Tết âm lịch).
− Luận án tiến hành thử nghiệm các mô hình dự báo tiên tiến theo xu
hướng của thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo
(học máy) – mô hình Support Vector Regression (SVR); mạng Neural Network,
Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Trên kết quả thử
nghiệm tác giả đã phân tích đánh giá các giải thuật xây dựng đường cong hồi qui
của từng mô hình, với những bộ trọng số khác nhau, để từ đó lựa chọn được mô
hình có sai số phù hợp làm hàm dự báo STLF.
− Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị
trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế
tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang
về lợi ích tối ưu nhất.
1.8. Ý nghĩa thực tiễn của luận án
Việc dự báo nhu cầu phụ tải điện có ý nghĩa khác nhau đối với các đơn vị có
chức năng khác nhau khi tham gia vào thị trường điện, cụ thể:
13
− Xây dựng được cho ngành điện thêm một công cụ dự báo mang tính ứng
dụng cao giải quyết các vấn đề của thực trạng thị trường điện tại Việt nam và các
vấn đề còn đang nghiên cứu: về sai số dự báo, kết quả và năng lực dự báo thị trường
điện và khả năng áp dụng vào thực tế còn giới hạn;
− Việc áp dụng giải thuật của mô hình tác giả đề xuất vào thực tế để dự báo
ngắn hạn của EVNHCMC đã cung cấp kết quả dự báo cho các nhà quản lý điều
hành thị trường điện cạnh tranh bước đầu rất khả thi.
− Kết quả của luận án sẽ giúp các thành viên tham gia thị trường dự báo
nhu cầu phụ tải trước để lên kế hoạch sản xuất kinh doanh, lập kế hoạch phân bổ
nguồn vốn đầu tư một cách hợp lý để tối ưu hoá lợi nhuận, hạn chế rủi ro.
− Mô hình của Luận án sẽ giúp những đơn vị điều hành thị trường điện dự
báo nhu cầu phụ tải và giá điện để xác định phản ứng của thị trường tại vào các thời
điểm khác nhau từ đó có chiến lược điều tiết thị trường một cách hợp lý.
1.9. Bố cục của luận án
Luận án được xây dựng với bố cục như sau:
CHƯƠNG I: TỔNG QUAN GIỚI THIỆU
Nội dung giới thiệu tổng quan tình hình nghiên cứu liên quan đến dự báo giá
điện trên thế giới, và trong nước, lý do chọn đề tài và mục tiêu nghiên cứu của luận
án, phạm vi và phương pháp nghiên cứu, tổng kết điểm mới của luận án và dự kiến
những giá trị thực tiễn từ luận án nghiên cứu.
CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ
TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU
Nội dung chương 2 nêu tổng quan về các Phương pháp dự báo ngắn hạn. Các
phương pháp thu thập và phân tích dữ liệu và xử lý dữ liệu. Khảo sát phân tích về
các dữ liệu thiếu, sai số trong dự báo do các giá trị còn thiếu. Khảo sát các kỹ thuật
xử lý chuỗi dữ liệu.
14
Trong chương này tác giả đề xuất phương pháp xây dựng đường cong hồi qui
bằng giải thuật huấn luyện SVR (Support Vector Regression), từ đó ước lượng, xử
lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu, dự báo phụ tải điện.
CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA
ĐƠN VỊ
Chương này đề cập đến việc nghiên cứu/phân tích phụ tải để hiểu rõ hơn về
những gì chúng ta đang cố gắng dự báo (xu hướng, tổng nhu cầu, sự khác biệt các
vùng, đặc tính tải,...), kiểm tra bất kỳ biến động đặc thù nào đó và là cách tuyệt vời
để kiểm tra dữ liệu sai. Đồng thời, tác giả đã xây dựng khái niệm Biểu đồ phụ tải
chuẩn hóa đơn vị (Standardized Load Profiles - SLP) và Ứng dụng xử lý dữ liệu
thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR)
theo cấp độ theo 24 chu kỳ/ ngày.
CHƯƠNG IV: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN
Nội dung của chương đề xuất, thiết kế lập trình Module mô hình dự báo phụ
tải ngắn hạn (STLF) ứng dụng thực tế để xây dựng các chiến lược kinh doanh, đảm
bảo tin cậy và an toàn cho hệ thống điện.
Đề xuất giải thuật mới là Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị
(SLP) - Support Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng
với bộ dữ liệu của 05 Tổng công ty Điện lực).
Ngoải ra, trong chương này tác giả còn chạy thử nghiệm được nhiều mô hình
dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình
SARIMA; Trí tuệ nhân tạo (học máy) – mạng Neural Network, Feedforward
Networks; Rừng ngẫu nhiên (Random Forest) để so sánh đánh giá, để từ đó lựa
chọn được mô hình có sai số phù hợp làm hàm dự báo STLF.
CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN
CẠNH TRANH CỦA VIỆT NAM
15
Chương này tác giả tiến hành thực nghiệm và thu thập dữ liệu, cung cấp các
thông tin tổng quan về thị trường điện cạnh tranh Việt Nam và tác giả cũng đã ứng
dụng mô hình thiết kế để áp dụng vào thực tế để đưa ra các kết quả dự báo dài hạn
(5-10 năm), dự báo theo tháng/ năm và kết quả dự báo ngắn hạn 24/48 chu kỳ của
365 ngày/năm theo đúng qui định của thị trường cho Tổng công ty Điện lực
TP.HCM.
Chương này cũng đánh giá việc áp dụng giải thuật này vào thực tế dự báo
ngắn hạn của EVNHCMC trong các năm vừa qua (đánh giá thông qua sai số dự báo
theo chu kỳ/ngày/tuần/tháng/năm), cũng như tác giả đã có những phân tích thật sự
sâu về tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự
báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến
dộng của thị trường để mang về lợi nhuận cao nhất.
CHƯƠNG VI – KẾT LUẬN
Chương này tổng hợp các nội dung đã nghiên cứu và trình bày trong luận án,
tóm lược các điểm mới và hạn chế trong quá trình nghiên cứu và định hướng phát
triển tiếp theo của luận án.
16
CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU
2.1. CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG
2.1.1. Các phương pháp thống kê
(1) Phương pháp bình quân di động
Phương pháp này sử dụng khi các số liệu trong dãy số biến động không lớn
lắm. Các số bình quân di động được tính từ các số liệu của dãy số thời gian có
khoảng cách đều nhau.
Chẳng hạn có dãy số thời gian tính theo tháng gồm các số liệu y1, y2,….., y12,
trong đó các yi biến động không lớn, nếu tính bình quân di động theo từng nhóm 3
thành phần ta có:
yI = (y1 + y2 + y3) / 3
yII = (y2 + y3 + y4) / 3 (2.1)
……
(2) Phương pháp bình quân di động có trọng số
Những số liệu mới xuất hiện trong các thời kỳ cuối có giá trị lớn hơn những
số liệu xuất hiện đã lâu. Để xét đến vấn đề này ta sử dụng các trọng số để nhấn
mạnh giá trị các số liệu gần nhất, vừa xảy ra.
Việc chọn các trọng số phụ thuộc vào kinh nghiệm và sự nhạy cảm của
người làm công tác dự báo. Công thức tính:
(Trọng số thời kỳ n x Nhu cầu thời kỳ n) Số bình quân di = (2.2) động có trọng số Các trọng số
17
(3) Phương pháp san bằng số mũ
Phương pháp này rất tiện lợi khi dùng máy tính. Đây cũng là kỹ thuật tính số
bình quân di động nhưng không đòi hỏi phải có nhiều số liệu quá khứ. Công thức
tính nhu cầu tương lai như sau:
(2.3) Ft =F(t-1) + [A(t-1) - F(t-1)]
trong đó:
Ft – Nhu cầu dự báo thời kỳ t
F(t-1) – Nhu cầu dự báo thời kỳ t -1
A(t-1) – Số liệu nhu cầu dự báo thời kỳ t - 1
– hệ số san bằng 0 ≤ ≤ 1
Hệ số có thể thay đổi để xét đến trọng số lớn hơn của những số liệu ở các
thời gian gần hơn. Lúc này công thức dự báo sẽ là:
Ft = A(t-1) + (1-)A(t-2) + (1-)2A(t-3) +…..+ (1-)n-1A(t-n) (2.4)
Lựa chọn hệ số : Hệ số có ảnh hưởng trực tiếp đến kết quả dự báo. Để
chọn người ta dựa vào độ lệch tuyệt đối bình quân MAD (Mean Absolute
Deviation). MAD càng nhỏ thì trị số càng hợp lý vì nó cho kết quả dự báo ít sai
lệch.
Các sai lệch trong dự toán F.E (2.5) MAD = =
n Số thời kỳ tính toán
Thường người ta lần lượt tính độ lệch tuyệt đối AD (Absolute deviation) và
độ lệch tuyệt đối bình quân MAD theo từng hệ số = 0,1 và 0,5 xem hệ số nào cho
MAD bé hơn sẽ được chọn.
(4) Phương pháp san bằng số mũ có điều chỉnh xu hướng
Phương pháp san bằng số mũ giản đơn không thể hiện rõ xu hương biến
động. Do đó cần phải sử dụng thêm kỹ thuật điều chỉnh xu hướng. Cách làm như
18
sau: đầu tiên tiến hành dự báo theo phương pháp san bằng số mũ giản đơn sau đó sẽ
thêm vào một lượng điều chỉnh (có thể âm hay dương)
Tính toán theo công thức: FITt = Ft + Tt
Lượng điều chỉnh Dự báo nhu cầu theo Dự báo nhu cầu cho (2.6) = + theo xu hướng thời kỳ mới xu hướng
trong đó:
FIT (Forecart inchiding trend) – Dự báo nhu cầu theo xu hướng
Ft (New forecart) – Dự báo nhu cầu cho thời kỳ mới
Tt (Trend correction) – Lượng điều chỉnh theo xu hướng
Để xác định phương trình xu hướng dùng khi điều chỉnh ta sử dụng hệ số san
bằng số mũ . Ý nghĩa và cách sử dụng hệ số này cũng giống như hệ số .
Tt = Tt-1 + (Ft - Ft-1) (2.7)
trong đó:
Tt – Lượng điều chỉnh dự báo theo xu hướng trong thời kỳ t
Tt-1 – Lượng điều chỉnh dự báo theo xu hướng trong thời kỳ t-1
– Hệ số san bằng mà ta lựa chọn
Ft – Lượng dự báo nhu cầu theo phương pháp san bằng số mũ giản đơn Ft ở
thời kỳ t
Ft-1 – Lượng dự báo nhu cầu trong thời kỳ t-1
Phương pháp Winter là một trong một số phương pháp làm mịn hàm mũ giúp
phân tích các chuỗi thời gian theo mùa một cách trực tiếp. Phương pháp này được
dựa trên ba hằng số làm mịn cho tính dừng, xu hướng và mùa. Kết quả phân tích
của Barakat et al. [2] cho thấy rằng mô hình độc đáo của năng lượng và nhu cầu liên
quan đến các khu vực phát triển nhanh rất khó để phân tích và dự đoán bằng cách áp
dụng trực tiếp phương pháp Winter. El-Keib et al. [3] trình bày một cách tiếp cận
19
lai, trong đó làm mịn hàm mũ được tăng cường với phân tích phổ điện và mô hình
tự điều chỉnh tự hồi quy.
(5) Phương pháp dự báo theo đường khuynh hướng
Các phương pháp dự báo theo đường khuynh hướng cũng dựa vào dãy số
thời gian. Dãy số này cho phép ta xác định đường khuynh hướng lý thuyết trên cơ
sở kỹ thuật bình phương cực tiểu, tức là tổng khoảng cách từ các điểm thể hiện nhu
cầu thực tế trong quá khứ đến đường khuynh hướng lấy theo trục tung là nhỏ nhất.
Sau đó dựa vào đường khuynh hướng lý thuyết ta tiến hành dự báo nhu cầu cho các
năm trong tương lai.
Có thể sử dụng được đường khuynh hướng dự báo theo đường khuynh
hướng để dự báo ngắn hạn, trung và dài hạn. Đường khuynh hướng có thể là tuyến
tính hay phi tuyến.
Để xác định được đường khuynh hướng là tuyến tính trước hết ta cần biểu
diễn các nhu cầu thực tế trong quá khứ lên biểu đồ và phân tích xu hướng phát triển
của các số liệu đó. Qua phân tích nếu thấy rằng các số liệu tăng hay giảm tương đối
đều đặn theo một chiều hướng nhất định thì ta có thể vạch ra một đường biểu hiện
chiều hướng đó. Nếu các số liệu biến động theo hướng đặc biệt hơn như tăng giảm
ngày càng nhanh hay ngày càng biến động chậm thì ta có thể sử dụng các đường
cong thích hợp để mô tả biến động đó (đường parabol, hyperbol, logarit,…)
Dưới đây trình bày về một số phương pháp đường thẳng khuynh hướng:
a) Phương pháp đường thẳng thống kê
Sử dụng phương trình đường thẳng sau: Yf = aX + b (2.8)
Các hệ số a và b tính như sau: ;
trong đó:
X – Thứ tự thời gian
20
Y – Số liệu nhu cầu thực tế trong quá khứ
n – Số lượng các số liệu có được trong quá khứ
Yf – Giá trị nhu cầu dự báo ở tương lai
b) Phương pháp đường thẳng thông thường
Phương pháp này còn có thể được gọi là phương pháp đường thẳng bình
phương cực tiểu. Nhưng cách gọi này không thật chính xác vì kỹ thuật bình phương
cực tiểu được sử dụng cả trong phương pháp đường thẳng thống kê và cả trong các
đường phi tuyến khác.
Sử dụng phương trình dự báo: Yf = aX + b (2.9)
Bằng kỹ thuật tính bình phương cực tiểu ta có:
;
trong đó:
X – Thứ tự thời gian (năm) trong dãy số, đánh theo thứ tự tự nhiên
từ 1 trở lên, không phân biệt số lượng số liệu là chẵn hay lẻ.
Y – Giá trị trong quá khứ đã thực hiện
n – Số lượng các số liệu có được trong quá khứ
Yf – Giá trị nhu cầu dự báo trong tương lai
c) Phương pháp theo khuynh hướng có xét đến biến động thời vụ
Đối với những số liệu dự báo có tính chất biến động theo thời vụ trong năm
như thời tiết, địa lý, tập quán của người tiêu dùng,… nên sử dụng phương pháp này.
Để dự báo như cầu cần khảo sát mức độ biến động nhu cầu theo thời vụ bằng cách
tính chỉ số thời vụ trên cơ sở dãy số thời gian điều tra được.
Chỉ số thời vụ tính theo công thức sau: (2.10)
21
trong đó:
– Chỉ số thời vụ Is
yi – Số bình quân của các tháng cùng tên
y0 – Số bình quân chung của tất của các tháng trong dãy số
Nhu cầu dự báo xét đến biến động thời vụ có công thức tính như sau:
Ys = Is x Yf
d) Phương pháp đường Parabol thống kê
Khi phân tích các số liệu trong quá khứ trên đồ thị mà thấy đường xu hướng
biến đổi không tuân thủ theo đường thẳng mà dạng đường cong parabol thì lúc đó
nên dùng phương pháp đường parabol để dự báo.
Phương trình dự báo có dạng:
Yc = aX2 + bX + c (2.11)
Bằng kỹ thuật tính bình phương cực tiểu ta có:
; ;
Các ký hiệu cũng tương tự như cũ. Các thứ tự của X lấy theo phương pháp
thống kê tuỳ theo số lượng số liệu chẵn hay lẻ, mục đích là để X = 0.
e) Phương pháp đường Logarit
Phương trình dự báo có dạng: log Yf = X log a + log b (2.12)
trong đó: ;
Các ký hiệu cũng tương tự như cũ, các thứ tự của X lấy theo phương pháp
thống kê. Kết quả dự báo được log Yf, lấy biến đổi ngược log sẽ được Yf.
(6) Phương pháp đa hồi qui (Multiple regression method)
22
Phân tích đa hồi quy cho dự báo tải sử dụng kỹ thuật ước lượng bình phương
các trọng số tối thiểu. Dựa trên phân tích này, mối quan hệ thống kê giữa tổng tải và
điều kiện thời tiết cũng như ảnh hưởng của kiểu ngày có thể được tính toán. Các hệ
số hồi quy được tính bằng một ước lượng bình phương bằng hoặc ít nhất theo cấp
số mũ theo số học bằng số lượng dữ liệu đã xác định.
(7) Dự báo từ các mô hình chuỗi thời gian (mô hình BOX-JENKINS)
Các mô hình kinh tế lượng chủ yếu dựa trên một động thái rõ nét của các đối
tượng có liên quan đến hệ thống kinh tế. Tuy nhiên một họ các mô hình thay thế
khác được sử dụng rộng rãi, đặc biệt trong dự báo ngắn hạn, được gọi là các mô
hình chuỗi thời gian. Chủ yếu, các mô hình này nối kết một biến phụ thuộc với các
giá trị của nó trong quá khứ và với các sai số ngẫu nhiên mà có thể có tương quan
theo chuỗi. Một các tổng quát, các mô hình chuỗi thời gian không dựa trên bất kỳ
một động thái kinh tế rõ nét nào.
Cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến nhất
trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập kỷ gần đây,
các phương pháp chuỗi thời gian đã được sử dụng rất rộng rãi trong kinh tế học đặc
biệt là trong dự báo ngắn hạn, trong đó các mô hình chuỗi thời gian đã chứng tỏ là
thích hợp hơn so với các mô hình kinh tế lượng.
Một phương pháp rất phổ biến trong việc lập mô hình chuỗi thời gian là
phương pháp trung bình trượt kết hợp tự hồi quy (autoregressive integrated
moving average - ARIMA), thường được gọi là phương pháp luận Box-Jenkins.
Trọng tâm của các phương pháp dự báo mới này không phải là xây dựng các mô
hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác
suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế theo triết lý “hãy để dữ
liệu tự nói”.
Không giống như các mô hình hồi quy trong đó Yt được giải thích bởi k biến
làm hồi quy X1, X2, X3, ..., Xk, trong các mô hình chuỗi thời gian kiểu Box-Jenkins,
Yt có thể được giải thích bởi các giá trị trong quá khứ hay giá trị trễ của bản thân
23
biến Y và các sai số ngẫu nhiên. Vì lý do này, các mô hình ARIMA đôi khi được
gọi là mô hình lý thuyết a bởi vì các mô hình này không thể suy ra được từ bất cứ lý
thuyết kinh tế nào - và các lý thuyết kinh tế thường là cơ sở cho các mô hình
phương trình đồng thời.
Sau đây là một hình theo phương pháp luận Box-Jenkins trong quá trình dự
báo từ mô hình chuỗi thời gian [5] – [9]:
a) Mô hình tự hồi quy (AR):
Mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau:
(2.14)
* là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị
hay
Trong đó Yt
trung bình (μ) của chính nó, và ut là thành phần sai số có trung bình bằng 0 và
phương sai không đổi, và không tương quan với us nếu t ≠ s (khái niệm này gọi là
nhiễu trắng – white noise). Thành phần hằng số được bỏ qua vì Yt được biểu diễn
dạng độ thiên lệch khỏi giá trị trung bình. Nói cách khác, Yt được mô hình hóa chỉ
với quá khứ của nó và không với các biến độc lập khác. Đây là các mô hình tự hồi
qui, AR và mô hình trong phương trình trên được gọi là mô hình AR (p), với p là
bậc tự hồi quy.
- Nếu ta lập mô hình Yt như sau: (Yt - μ) = α1(Yt-1 - μ) + ut
với μ là giá trị trung bình của Y và ut là một số hạng sai số ngẫu nhiên không
tương quan (có giá trị trung bình bằng 0 và phương sai không đổi σ2) thì ta nói rằng
Yt tuân theo quá trình ngẫu nhiên tự hồi quy bậc nhất hay AR(1). Ở đây, giá trị Y
trong thời đoạn t phụ thuộc vào giá trị của nó trong thời đoạn trước và vào một yếu
tố ngẫu nhiên; các giá trị của Y được biểu diễn dưới dạng độ lệch khỏi giá trị trung
bình của nó. Nói một cách khác, mô hình này cho biết giá trị dự báo của Y trong
thời đoạn t chỉ đơn giản là tỷ lệ (α1) của giá trị của nó trong thời đoạn (t - 1) cộng
24
với yếu tố nhiễu ngẫu nhiên trong thời gian t; một lần nữa, các giá trị của Y được
biểu diễn xung quanh giá trị trung bình của nó.
- Nhưng nếu xem xét mô hình sau:
(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + ut
thì ta có thể nói rằng Yt tuân theo quá trình tự hồi quy bậc hai hay AR(2).
Tức là, giá trị của Y trong thời đoạn t phụ thuộc vào giá trị của nó trong hai thời
đoạn trước đó, với các giá trị của Y được biểu diễn xung quanh giá trị trung bình μ.
Nói chung, ta có thể viết mô hình sau:
(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + … + αp(Yt-p - μ) + ut (2.15)
Trong trường hợp này, Yt là quá trình tự hồi quy bậc p hay AR(p).
b) Mô hình trung bình trượt (MA)
Quá trình AR vừa đề cập trên không phải là cơ chế duy nhất có thể tạo ra
chuỗi dữ liệu Y.
- Giả sử ta lập mô hình Y như sau: (2.16)
với μ là hằng số và ut là số hạng sai số nhiễu ngẫu nhiên thuần túy. Ở đây, Y
trong thời gian t bằng một hằng số cộng với trung bình trượt của sai số hiện tại và
quá khứ. Vậy trong trường hợp này, ta nói rằng Y tuân theo quá trình trung bình
trượt bậc nhất hay MA(1).
- Nhưng nếu Y tuân theo biểu thức:
thì đó là một quá trình trung bình trượt bậc hai hay MA(2).
- Tổng quát hơn, ta có mô hình cho quá trình trung bình trượt bậc q hay
MA(q): . (2.17)
c) Các mô hình ARIMA
25
Phối hợp giữa các mô hình tự hồi quy (AR) và trung bình trượt (MA) ta tạo
ra được mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát:
(2.18)
• Sai phân hoá
Hầu hết các chuỗi dữ liệu trong kinh tế luôn có tính không dừng bởi vì
chúng tăng trưởng dần theo thời gian. Chẳng hạn, nếu Yt có xu hướng theo thời gian
dạng tuyến tính hay lũy thừa thì nó sẽ không dừng. Việc ước lượng của quá trình
ARMA đòi hỏi Yt phải là một chuỗi dừng. Hầu hết các chuỗi thời gian không dừng
đều có thể được chuyển thành dạng dừng thông qua quá trình sai phân hóa.
Giả sử, xét một xu hướng tuyến tính có dạng Yt = α + βt. Sai phân bậc nhất
của Yt được định nghĩa là: ΔYt = Yt –Yt-1.
Ta thấy: ΔYt = α + βt – α – β(t–1) = β là hằng số và do đó nó có tính dừng.
Do đó, xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai phân một lần. Nếu
một chuỗi tăng trưởng theo lũy thừa với mức tăng không đổi, ln(Yt) sẽ có xu hướng
tuyến tính và có thể lấy sai phân.
Dễ dàng chứng minh được là xu hướng bậc 2 có thể được loại bỏ bằng cách
lấy sai phân 2 lần. Sai phân bậc hai (ký hiệu là Δ2Y) được định nghĩa là sai phân
bậc nhất của sai phân bậc nhất. Do đó:
Một dạng khác mà trong đó tính không dừng thường xuất hiện đó là tính
mùa. Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể được
loại bỏ bằng cách lấy sai phân thích hợp: Δ4 = Yt – Yt-4 đối với dữ liệu theo quý và
Δ12 = Yt – Yt-12 đối với dữ liệu theo tháng.
• Mô hình ARIMA
Đa số dữ liệu kinh tế theo chuỗi thời gian không có tính dừng mà có tính kết.
Để nhận được dữ liệu có tính dừng, chúng ta phải sử dụng sai phân của dữ liệu.
26
+ Các bậc sai phân
- Sai phân bậc 0 là I(0): chính là dữ liệu gốc Yt.
- Sai phân bậc 1 là I(1): wt = Yt – Yt-1. (2.19)
t = wt – wt-1
- Sai phân bậc 2 là I(2): w2
- Sai phân bậc d ký hiệu I(d).
Mô hình ARMA(p,q) áp dụng cho I(d) được gọi là mô hình ARIMA(p,d,q).
• Mô hình SARIMA
Trong mô hình ARIMA nếu chúng ta tính toán sai phân bậc nhất với độ trễ
lớn hơn 1 để khử tính mùa vụ như sau wt = Yt – Yt-s, với s là số kỳ giữa các mùa thì
mô hình lúc này được gọi là SARIMA hay ARIMA có tính mùa vụ.
2.1.2. Phương pháp chuyên gia
(1) Phương pháp tính hệ số vượt trước (hệ số đàn hồi)
Phương pháp này xác định tỷ số của nhịp độ phát triển năng lượng điện với
nhịp độ phát triển của nền kinh tế quốc dân. Phương pháp này giúp ta thấy được
khuynh hướng phát triển của nhu cầu và sơ bộ cân đối nhu cầu này với nhịp độ phát
triển của nền kinh tế quốc dân nói chung.
Ví dụ, trong giai đoạn 5 năm 1994 - 1999, sản lượng công nghiệp tăng 185%,
còn sản lượng điện năng cũng trong thời gian ấy tăng 194%, như vậy hệ số vượt
trước sẽ là: K = 194 / 185 = 1,05
Như vậy phương pháp này chỉ nói lên xu thế phát triển với một mức độ
chuẩn xác nào đó và trong tương lai xu thế này còn chịu ảnh hưởng của các nhân tố
biến động không lường trước khác như:
- Suất tiêu hao năng lượng với mỗi sản phẩm công nghiệp ngày càng
giảm xuống do tiến bộ về mặt kỹ thuật và về mặt quản lý.
- Điện năng ngày càng được sử dụng rộng rãi trong lĩnh vực kinh tế xã
hội và trong cuộc sống.
27
- Cơ cấu kinh tế không ngừng thay đổi,…
Vì những lý do nêu trên nên hệ số giá trị vượt trước biến động khá nhiều, nên
nếu dùng hệ số vượt trước (hệ số đàn hồi) để xác định nhu cầu điện năng ở năm dự
báo sẽ không hoàn toàn chuẩn xác.
(2) Phương pháp tính trực tiếp
Phương pháp này xác định nhu cầu điện năng của năm dự báo, dựa trên tổng
sản lượng kinh tế của các ngành ở năm đó và suất tiêu hao điện năng đối với từng
loại sản phẩm. Đối với những trường hợp không có suất tiêu hao điện năng thì xác
định nhu cầu điện năng cho từng trường hợp cụ thể (như công suất điện trung bình
cho 1 hộ gia đình, bệnh viện, trường học, ...). Phương pháp tính trực tiếp được sử
dụng phổ biến ở những nước kinh tế phát triển có kế hoạch, ổn định và không bị
khủng hoảng.
Phương pháp này có ưu điểm là tính toán đơn giản, và ngoài việc xác định
tổng điện năng dự báo, chúng ta còn biết được tỷ lệ sử dụng điện năng trong các
ngành kinh tế, chẳng hạn tỷ lệ dùng điện trong công nghiệp, nông nghiệp, dân
dụng,.. cũng như xác định được nhu cầu điện năng ở các khu vực địa lý khác nhau,
như vậy tạo điều kiện thuận lợi cho công tác thiết kế quy hoạch cung cấp điện. Tuy
nhiên mức độ chính xác của phương pháp này bị phụ thuộc vào mức độ chính xác
của tổng sản lượng các ngành kinh tế quốc dân trong tương lai, cũng như phụ thuộc
vào suất tiêu hao điện. Phương pháp này thường được áp dụng để dự báo nhu cầu
điện năng với thời gian ngắn và trung bình.
(3) Phương pháp ngoại suy theo thời gian
Phương pháp ngoại suy theo thời gian nghiên cứu sự diễn biến của nhu cầu
điện năng trong một thời gian quá khứ tương đối ổn định, tìm ra quy luật và áp dụng
quy luật ấy ra để dự đoán cho tương lai. Phương pháp này chỉ cho ta kết quả chính
xác nếu tương lai không có nhiều thay đổi lớn so với quá khứ và sự phát triển ở
tương lai phải tuân theo đúng quy luật ở quá khứ.
28
Giả sử mô hình dự báo có dạng hàm mũ như sau: At = Ao (1+ α)t (2.20)
trong đó:
At – điện năng dự báo ở năm thứ t
Ao – điện năng ở năm chọn làm gốc
α – tốc độ phát triển bình quân hàng năm
t – thời gian dự báo
Để xác định thừa số (1+ α) dựa vào biểu thức trên ta có:
At+1 / At = 1+ α = C
Qua kết quả quan sát được các giá trị điện năng của nhiều năm liên tiếp trong
quá khứ, ta xác định các giá trị Ci tương ứng, và tính được hằng số C bằng cách lấy
trung bình nhân của các Ci trong nhiều năm:
Một cách tổng quát mô hình dự báo điện năng có thể viết như sau:
At = AoCt
Lấy log biểu thức này ta có: logAt = logAo + t logC,
đặt y = logAt ; b = logAo ; a = logC.
Vậy ta có hàm dự báo: Y= b + at, và dùng phương pháp bình phương cực
tiểu để xác định hệ số a, b.
(4) Phương pháp tương quan
Phương pháp này nghiên cứu mối tương quan giữa các thành phần kinh tế
nhằm phát hiện những quan hệ về mặt định lượng của các tham số trong nền kinh tế
quốc dân, dựa vào những phương pháp thống kê toán học. Cụ thể mang mục đích
của chúng ta là dự báo nhu cầu điện năng, cho nên ta cần nghiên cứu sự tương quan
giữa điện năng tiêu thụ với các chỉ tiêu kinh tế khác như tổng giá trị sản lượng công
nghiệp, tổng giá trị sản lượng kinh tế quốc dân (đồng/năm).
29
Ví dụ sau khi ta quan sát thống kê được giá trị của tổng điện năng tiêu thụ,
tổng giá trị sản lượng kinh tế quốc dân từng năm 1991 đến 2000, căn cứ vào đó ta
xây dựng mô hình biểu diễn sự tương quan giữa điện năng tiêu thụ với giá trị sản
lượng quốc dân. Mô hình dự báo này còn gọi là phương trình hồi quy, tuỳ theo mối
liên hệ giữa chúng mà mô tả dưới dạng phương trình tuyến tính, phương trình bậc 2
hay hàm mũ.
(5) Phương pháp đối chiếu so sánh
Phương pháp này so sánh đối chiếu nhu cầu phát triển điện năng của các
nước có hoàn cảnh phát triển kinh tế - xã hội hoàn toàn tương tự. Phương pháp này
chỉ nên dùng kiểm tra, xử lý lại kết quả dự báo mà ta đã dùng phương pháp ngoại
suy và phương pháp tương quan.
(6) Phương pháp chuyên gia
Trong những năm gần đây người ta quan tâm nhiều và đánh giá cao những
kinh nghiệm của các chuyên gia trong lĩnh vực dự báo, qui hoạch trong các ngành
của nền kinh tế quốc dân, để dự báo các chỉ tiêu kinh tế. Chuyên gia ở đây chúng ta
có thể hiểu là cá nhân, hay 1 công trình kết quả tính toán dự báo của 1 viện nghiên
cứu hay công trình nào đó đã thực hiện.
2.1.3. Trí tuệ nhân tạo, học máy
Trí tuệ nhân tạo là một lĩnh vực nghiên cứu tương đối mới. Thuật toán tính
toán thường được sử dụng để chỉ các lĩnh vực của hệ thống mờ, mạng nơ ron nhân
tạo (ANN) và học máy.
(1) Fuzzy logic
Chúng ta biết rằng một hệ thống logic mờ với việc giải mờ có thể xác định
và gần đúng bất kỳ hệ thống động không xác định nào (ở đây là tải) trên thiết lập
nhỏ gọn đến độ chính xác tùy ý. Liu [11] đã quan sát thấy rằng một hệ thống logic
mờ có khả năng tuyệt vời trong việc vẽ các điểm tương đồng từ dữ liệu khổng lồ.
30
Sự tương đồng về dữ liệu đầu vào (L-i-L0) có thể được xác định bằng các khác biệt
thứ nhất khác nhau (Vk) và sự khác biệt bậc hai (Ak), được định nghĩa là:
(2.21)
Trình dự báo dựa trên logic mờ hoạt động theo hai giai đoạn: đào tạo và dự
báo trực tiếp. Trong giai đoạn đào tạo, dữ liệu tải quá khứ được sử dụng để đào tạo
một bộ đếm thời gian dựa trên mô-đun 2m đầu vào, 2n đầu ra để tạo cơ sở dữ liệu
mẫu và cơ sở nguyên tắc mờ bằng cách sử dụng sự khác biệt thứ nhất và thứ hai của
dữ liệu. Sau khi đào tạo đủ, nó sẽ được liên kết với một bộ điều khiển để dự đoán
thay đổi tải trực tuyến. Nếu có thể tìm thấy mô hình phù hợp nhất với khả năng cao
nhất, thì mô hình đầu ra sẽ được tạo ra thông qua một phần mềm giải mờ centroid
[12] – [23], kết hợp ba kỹ thuật logic mờ, mạng nơ-ron và các hệ thống chuyên gia
trong một phương pháp tiếp cận STLF lai tự động cao với cách học không giám sát.
(2) Neural networks
Mạng thần kinh được mô phỏng theo nguyên tắc hoạt động cơ bản của bộ
não con người. Chúng bao gồm một vài nơ-ron, một nơ-ron nhận được thông tin về
các nút đầu vào và tổng hợp thông tin. Sau đó, nó xác định kích hoạt của nó và
truyền phản ứng của nó qua nút đầu ra cho các nơ-ron khác. Mạng thần kinh thường
được áp dụng cho dự báo tải (xem ví dụ Hippert và cộng sự [24] để kiểm tra).
Hình 2.1 – Mạng nơ-ron truyền thẳng
Một mạng nơ-ron truyền thẳng bao gồm một vài lớp kế tiếp các nơ-ron với
một một nơ-ron đầu vào, một số lớp ẩn và một lớp đầu ra, các nơ-ron được kết nối
31
bằng các vectơ trọng số. Phương pháp học cơ bản hoặc điều chỉnh trọng số là sự
truyền ngược trở lại giá trị lỗi và điều chỉnh trọng số cho phù hợp [25] – [36].
(3) Genetic algorithms
Các thuật toán di truyền (GAs) đại diện cho một cách tiếp cận mạnh mẽ và
có hiệu quả cao để phát triển cho các vấn đề tối ưu hoá tổ hợp quy mô lớn. Nói
chung, GA mã hoá vấn đề thành một tập hợp các chuỗi, mỗi chuỗi gồm một vài bit,
sau đó hoạt động trên các chuỗi để mô phỏng quá trình tiến hóa [37] – [42]. Trong
lĩnh vực STLF, có rất ít phương pháp dự báo tải dựa trên GA đã được báo cáo
nhưng kết quả đáng khích lệ đã xuất hiện [43] – [44]. Gần đây, [45] – [50] đã sử
dụng một GA để phát triển cấu trúc mạng thần kinh tối ưu và kết nối trọng lượng
cho một ngày trước vấn đề dự báo tải điện.
(4) Mô hình Bộ hồi quy dựa theo vector hỗ trợ – Support vector
regression (SVR)
Ý tưởng cơ bản của SVR là ánh xạ không gian đầu vào sang một không gian
đặc trưng nhiều chiều mà ở đó, ta có thể áp dụng được hồi quy tuyến tính (mà nếu
ta áp dụng trực tiếp hồi quy tuyến tính thì không hiệu quả).
Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để
xây dựng được hàm hồi quy, ta không cần phải sử dụng hết tất cả các điểm dữ liệu
trong bộ huấn luyện. Những điểm có đóng góp vào việc xây dựng hàm hồi quy
được gọi là những Support Vector. Việc phân lớp cho một điểm dữ liệu mới sẽ chỉ
phụ thuộc vào các support vector.
Hình 2.2 – Biến đổi không gian dữ liệu sang không gian đặc trưng (thủ thuật Kernel)
Hàm hồi quy cần tìm có dạng:
32
(2.22)
Trong đó: là véc tơ trọng số; T là kí hiệu chuyển vị; là hằng
số; là véc tơ đầu vào; là véc tơ đặc trưng; làm hàm ánh xạ từ
không gian đầu vào sang không gian đặc trưng [51] – [55].
Như vậy, mục tiêu của việc huấn luyện SVR là tìm ra được w và b.
Cho tập huấn luyện {(x1, t1), (x2, t2), …, (xN, tN)} . Với bài toán
hồi quy đơn giản, để tìm w và b ta phải tối thiểu hóa hàm lỗi chuẩn hóa:
với là hằng số chuẩn hóa (2.23)
Để có được một giải pháp thưa, ta sẽ thay hàm lỗi trên bằng hàm lỗi ε-
insensitive. Đặc điểm của hàm lỗi này là nếu trị tuyệt đối của sự sai khác giữa giá trị
dự đoán y(x) và giá trị đích nhỏ hơn ε (với ε> 0) thì nó coi như độ lỗi bằng 0.
Như vậy bây giờ, ta phải tối thiểu hóa hàm lỗi chuẩn hóa sau:
(2.24)
Với , C là hằng số chuẩn hóa giống như nhưng được
nhân với hàm lỗi thay vì .
Để cho phép một số điểm nằm ngoài ống ε, ta sẽ đưa thêm các biến lỏng
(slack variable) vào. Đối với mỗi điểm dữ liệu , ta cần hai biến lỏng và
, trong đó ứng với điểm mà (nằm ngoài và phía trên
ống) và ứng với điểm mà (nằm ngoài và phía dưới ống).
33
Hình 2.3 – Minh họa cho các biến lỏng
Điều kiện để một điểm đích nằm trong ống là: với yn =
y(xn). Với việc sử dụng các biến lỏng, ta cho phép các các điểm đích nằm ngoài ống
(ứng với các biến lỏng > 0) và như thế thì điều kiện bây giờ sẽ là:
(2.25)
Như vậy, ta có hàm lỗi cho SVR:
(2.26)
Mục tiêu của ta là tối thiểu hóa hàm lỗi này với các ràng buộc:
(2.27)
Dùng hàm Lagrange và điều kiện Karush-Kuhn-Tucker, ta có bài toán tối ưu
hóa tương đương:
(2.28)
Với k là hàm nhân: . Bất kỳ một hàm nào thỏa điều
kiện Mercer thì đều có thể được dùng làm hàm nhân. Hàm nhân được sử dụng phổ
biến nhất là hàm Gaussian:
Cực đại hóa với các ràng buộc:
34
(2.29)
Từ đây, ta có hàm hồiqui của SVR:
(2.30)
Như vậy, với SVR sử dụng hàm lỗi ε-insensitive và hàm nhân Gaussian ta có
ba tham số cần tìm: hệ số chuẩn hóa C, tham số của hàm nhân Gaussian và độ
rộng của ống ε [56] – [62]. Cả ba tham số này đều ảnh hưởng đến độ chính xác dự
đoán của mô hình và cần phải chọn lựa kỹ càng. Nếu C quá lớn thì sẽ ưu tiên vào
phần độ lỗi huấn luyện, dẫn đến mô hình phức tạp, dễ bị quá khớp. Còn nếu C quá
nhỏ thì lại ưu tiên vào phần độ phức tạp mô hình, dẫn đến mô hình quá đơn giản,
giảm độ chính xác dự đoán. Ý nghĩa của ε cũng tương tự C. Nếu ε quá lớn thì có ít
vectơ hỗ trợ, làm cho mô hình quá đơn giản. Ngược lại, nếu ε quá nhỏ thì có nhiều
vectơ hỗ trợ, dẫn đến mô hình phức tạp, dễ bị quá khớp. Tham số phản ánh mối
tương quan giữa các vectơ hỗ trợ nên cũng ảnh hưởng đến độ chính xác dự đoán
của mô hình.
(5) Mô hình Rừng ngẫu nhiên (Random Forest Regression)
RF là một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman
(2001) [63]. Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản
được xây dựng bằng cách sử dụng thuật toán Bagging [64]. Khi xây dựng một cơ sở
phân loại, các nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên
ngẫu nhiên.
Trong CART truyền thống, mỗi nút bên trong là tập con của tập dữ liệu ban
đầu và nút gốc chứa tất cả dữ liệu ban đầu. Các rừng ngẫu nhiên để hồi quy được
hình thành bằng cách hình thành cây dựa vào một vector ngẫu nhiên sao cho cây
tiên đoán có các giá trị số cao hơn so với các nhãn lớp. Tập huấn luyện được rút ra
35
một cách độc lập từ sự phân bố của vector ngẫu nhiên, các dự đoán rừng ngẫu nhiên
được hình thành bằng cách lấy trung bình trên k của cây. Giải thuật rừng ngẫu nhiên
sinh ra mô hình có độ chính xác cao đáp ứng được yêu cầu thực tiễn cho vấn đề
phân loại, hồi qui [65] – [70].
Giải thuật rừng ngẫu nhiên có thể được trình bày ngắn gọn như sau:
Hình 2.4 – Thuật toán Rừng ngẫu nhiên Hồi qui
• Từ tập dữ liệu học LS có m phần tử và n biến (thuộc tính), xây dựng T
cây quyết định một cách độc lập nhau.
• Mô hình cây quyết định thứ t được xây dựng trên tập mẫu Bootstrap thứ t
(lấy mẫu m phần tử có hoàn lại từ tập học LS).
• Tại nút trong, chọn ngẫu nhiên n’ biến (n’< tốt nhất dựa trên n’ biến này. • Cây được xây dựng đến độ sâu tối đa không cắt nhánh. Kết thúc quá trình xây dựng T mô hình cơ sở, dùng chiến lược bình chọn số đông để phân lớp một phần tử mới đến hoặc giá trị trung bình cho bài toán hồi quy. 36 2.2. KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU 2.2.1 Thu thập, phân tích và xử lý dữ liệu ❖ Thu thập dữ liệu Bước thực hiện thu thập các dữ liệu bao gồm ba nhiệm vụ chính: a) Xác định yêu cầu dữ liệu Điều đầu tiên cần thực hiện khi lập kế hoạch thu thập dữ liệu là phải xác định xem các dữ liệu nào là cần thiết để có thể giải quyết bài toán. Về tổng thể, có thể cần sự trợ giúp của các chuyên gia trong lĩnh vực của bài toán cần giải quyết. Cần biết: i) Các dữ liệu chắc chắn có liên quan đến bài toán; ii) Các dữ liệu nào có thể liên quan; iii) Các dữ liệu nào là phụ trợ. Các dữ liệu có liên quan và có thể liên quan đến bài toán cần phải được xem là các đầu vào cho hệ thống. b) Xác định nguồn dữ liệu Bước kế tiếp là quyết định nơi sẽ lấy dữ liệu, điều này cho phép ta xác định được các ước lượng thực tế về những khó khăn và phí tổn cho việc thu thập dữ liệu. Nếu ứng dụng yêu cầu các dữ liệu thời gian thực, những ước lượng này cần tính đến khả năng chuyển đổi các dữ liệu tương tự thành dạng số. Trong một số trường hợp, ta có thể chọn lựa dữ liệu mô phỏng từ các tình huống thực tế. Tuy nhiên, cần phải quan tâm đến độ chính xác và khả năng thể hiện của dữ liệu đối với các trường hợp cụ thể. c) Xác định lượng dữ liệu Ta cần phải ước đoán số lượng dữ liệu cần thiết để có thể sử dụng trong việc xây dựng giải thuật. Nếu lấy quá ít dữ liệu thì những dữ liệu này sẽ không thể phản ánh toàn bộ các thuộc tính mà giải thuật cần xử lý. Mặt khác, cũng không nên đưa vào quá nhiều dữ liệu đầu vào làm cho giải thuật thêm phức tạp. Việc định lượng gần đúng lượng dữ liệu cần đưa vào xử lý là hết sức cần thiết. Thông thường, dữ liệu thường thiếu hoàn chỉnh (trong một số trường hợp dữ 37 liệu ghi nhận bị đứt quản do thiết bị ghi nhận bị sự cố hoặc nhân viên vận hành quên ghi nhận), do đó nếu muốn giải thuật có khả năng thực hiện được những điều mà ta mong đợi thì nó cần phải được xử lý với lượng dữ liệu lớn hơn. ❖ Chuỗi thời gian Dữ liệu chuỗi thời gian là dữ liệu được thu nhập, lưu trữ và quan sát theo sự tăng dần của thời gian. Ta thường ký kiệu chuỗi thời gian là với là các số tự nhiên. là các biến ngẫu nhiên rút ra từ một phân bố xác suất nào đó. Để tìm ra được những phương pháp dự báo phù hợp cho chuỗi thời gian, chúng ta phải xác định được các thành phần tạo nên chuỗi thời gian đó. Dữ liệu hiện đang được thu nhập, lưu trữ và quan sát là chuỗi dữ liệu theo sự tăng dần của thời gian, do đó để tìm ra được những phương pháp dự báo phù hợp cho chuỗi thời gian, chúng ta phải xác định được các thành phần tạo nên chuỗi thời gian đó. Các nghiên cứu trước đây hầu như chưa thật sự quan tâm đến bản chất của dữ liệu mà chỉ chú trọng vào việc tìm kiếm giải thuật nên chưa khai thác được hết dữ liệu để nâng cao độ chính xác của dự báo. Những thành phần cơ bản của chuỗi thời gian bao gồm: xu hướng, chu kỳ, thành phần mùa và bất qui tắc: − Thành phần xu hướng (trend): Chuỗi dữ liệu quan sát tăng hoặc giảm trong suốt thời đoạn quan sát. Đây là thành phần dài hạn (long term). Những chuỗi thời gian có chứa thành phần xu hướng thường gặp như: sự gia tăng dân số, tốc độ lạm phát, tăng trưởng của sản xuất, tốc độ tăng trưởng phụ tải,... − Thành phần chu kỳ (cyclical): Những giá trị quan sát tăng lên, hoặc giảm xuống trong những khoảng thời gian khác nhau. Thành phần chu kì thường có dao động dạng sóng quanh trục xu hướng. Thường xuất hiện bởi sự gia tăng hoặc thu hẹp trong kinh tế. − Thành phần mùa (seasonal): Những thay đổi lặp lại hằng năm được gọi là tính mùa của chuỗi thời gian. Chu kì của những chuỗi thời gian có thể là 38 tháng, quí, hoặc là 6 tháng,… Ví dụ: nhu cầu mua sắm dụng cụ học tập thường cao trong giai đoạn tháng 8, tháng 9 hằng năm. Tính mùa thường phản ánh điều kiện thời tiết hay những kì nghỉ trong năm. − Thành phần bất qui tắc (irregular): Là thành phần thể hiện sự biến đổi ngẫu nhiên không thể đoán được của chuỗi thời gian. Để nhận dạng ra đặc điểm và các thành phần của chuỗi thời gian, các nhà dự báo thường dùng các công cụ toán học. Đặc biệt, hai công cụ phổ biến và rất quan trọng là hàm tự tương quan (ACF) và hàm tự tương quan riêng phần (PACF) trong lớp mô hình ARIMA. a) Hàm tự tương quan (ACF) Hàm tự tương quan (ACF) ở độ trễ k được ký hiệu là , và được định nghĩa như sau: ❖ Tính chất của ACF (2.31) - Giá trị không có thứ nguyên. - Giá trị của nằm trong khoảng giữa -1 và 1. Trong thực tế chúng ta chỉ có thể có số liệu thực tế là kết quả của quá trình ngẫu nhiên, do đó chúng chỉ có thể tính toán được hàm tự tương quan mẫu (SAC), với và ký hiệu là . (2.32) b) Hàm tự tương quan riêng phần (PACF) Hệ số tự tương quan riêng phần với độ trễ k đo lường tương quan của Yt-k với Yt sau khi loại trừ tác động tương quan của tất các các độ trễ trung gian. Công thức tính PACF như sau: 39 với được tính toán ở phần trên (SAC) (2.33) Bằng cách sử dụng các công cụ hàm tự tương quan (ACF), hàm tự tương quan riêng phần (PACF), và các biểu đồ tương quan, chúng ta sẽ xác định các biến trễ p, q và áp dụng vào trong các mô hình AR, MA, ARMA, ARIMA,… của phương pháp luận Box-Jenkins, và đảm bảo tuân thủ theo qui luật sau: Loại mô hình Dạng tiêu biểu của ACF Dạng tiêu biểu của PACF AR(p) Đỉnh cao đáng kể qua các độ
trễ p. Suy giảm theo số mũ hay với
dạng sóng hình sin tắt dần hay
cả hai. MA(q) Suy giảm theo số mũ Đỉnh cao đáng kể qua các độ
trễ q ARMA(p, q) Suy giảm theo số mũ Suy giảm theo số mũ c) Chuỗi thời gian không tĩnh Chuỗi thời gian không tĩnh rất khó để biểu diễn bằng mô hình toán học và thực hiên dự báo. Tuy nhiên, trong thực tế ta gặp rất nhiều dữ liệu thời gian là chuỗi không tĩnh. Do đó ta cần chuyển đổi chuỗi thời gian không tĩnh thành chuỗi thời gian tĩnh, đồng nghĩa với việc loại bỏ thành phần xu hướng ra khỏi chuỗi thời gian không tĩnh. Một trong những phương pháp phổ biến được sử dụng là phương pháp lấy hiệu (differencing). Đối với một chuỗi thời gian không tĩnh , ta áp dụng toán tử lấy hiệu lên để được một chuỗi thời gian mới với (2.34) 40 Nếu là chuỗi tĩnh thì ta xây dựng mô hình mô tả rồi từ đó suy ra . Nếu vẫn là chuỗi không tĩnh, ta tiếp tục áp dụng toán tử cho chuỗi . 2.2.2 Nhận biết các thành phần của chuỗi thời gian bằng phương pháp phân tích hệ số tự tương quan ❖ Thành phần xu hướng (trend) Là thành phần thể hiện sự tăng hay giảm giá trị của chuỗi thời gian trong một giai đoạn dài hạn nào đó. Nếu một chuỗi thời gian có chứa thành phần xu hướng sẽ có hệ số tự tương quan rất lớn ở những độ trễ đầu tiên và giảm dần về 0 khi độ trễ tăng lên. Dưới đây ta xét đến chuỗi dữ liệu ghi nhận điện năng tiêu thụ của Tổng Công ty Điện lực TP.HCM theo từng tháng từ năm 1997 đến năm 2015, điện năng có biến đổi theo từng năm và có xung hướng biến đổi tăng theo thời gian. Hình 2.1 – Thống kê điện thương phẩm Một chuỗi thời gian có chứa thành phần xu hướng là chuỗi thời gian không tĩnh (nonstationary). Hệ số tự tương quan của chuỗi thời gian không tĩnh thường rất lớn ở những độ trễ đầu tiên và giảm dần theo sự tăng của độ trễ. 41 Hình 2.2 – Hệ số tự tương quan của chuỗi thời gian không tĩnh Quan sát ta thấy hệ số tự tương quan tại độ trễ giảm dần nhưng không về không, điều đó cho thấy đây là chuỗi thời gian không tĩnh (nonstationary) và thay đổi theo một xu hướng nhất định. ❖ Thành phần chu kỳ (cyclical) Là chuỗi biến đổi dạng sóng quanh xu hướng. Trong thực tế thành phần này rất khó xác định bởi vì những dao động dạng sóng quanh xu hướng luôn thay đổi cả về biên độ và khoảng thời gian xuất hiện. Do đó người ta thường xem nó như là một phần của thành phần xu hướng. Ví dụ xét một chuỗi ghi nhận công suất cực đại – Pmax từng ngày trong tháng 10/2018, ta thấy sự lập lại có tính chu kỳ 07 ngày của dữ liệu: Hình 2.3 – Thống kê hệ số Pmax của tháng 10/2018 42 Hình 2.4 – Hệ số tương quan của Pmax tháng 10/2018 Quan sát ta thấy hệ số tự tương quan ở độ trễ là 1, 7, 14 sẽ khác không một cách có ý nghĩa và lập đi lập lập lại theo chu kỳ 7. Do đó, qua phân tích ACF chúng ta thấy tính chu kỳ lặp đi lặp lại (chu kỳ 7 ngày) của dữ liệu. ❖ Thành phần mùa (Seasonal) Đối với chuỗi thời gian có thành phần mùa thì giá trị tại những thời điểm cố định theo từng năm sẽ có sự tương quan lớn với nhau. Xét đến chuỗi dữ liệu ghi nhận điện năng tiêu thụ của Tổng Công ty Điện lực TP.HCM theo từng tháng từ năm 2011 đến năm 2018. Hình 2.5 – Bảng thống kê điện thương phẩm theo từng tháng 43 Hình 2.6 – Hệ số tương quan của 12 tháng của năm Do chuỗi không dừng nên ta tính sai phân bậc 1 và tính Hệ số tự tương quan của chuỗi sai phân. Quan sát ta thấy tại các độ trễ 0; 12; 24 có biên độ lớn thể hiện tính lập đi lặp lại của dữ liệu, thể hiện tính mùa vụ 12 tháng của giá trị điện năng đang xét (theo từng tháng từ năm 2011 đến năm 2018). Như vậy, việc xác định một chuỗi thời gian có thành phần xu hướng hay thành phần mùa rất quan trọng trong bài toán dự báo chuỗi thời gian. Nó không những giúp ta lựa chọn được mô hình dự đoán phù hợp, mà còn giúp cải tiến mô hình đã có chuẩn xác hơn. 2.2.3 Thiếu giá trị trong khai thác dữ liệu Thiếu giá trị và các vấn đề của nó là rất phổ biến trong quá trình điền đầy dữ liệu. Một số phương pháp đã được đề xuất để xử lý dữ liệu bị mất trong bộ dữ liệu và tránh các vấn đề gây ra bởi nó. Mục này thảo luận về các vấn đề khác nhau gây ra bởi các giá trị còn thiếu và những cách khác nhau mà chúng ta có thể giải quyết. Thiếu dữ liệu là một vấn đề quen thuộc và không thể tránh khỏi trong các bộ dữ liệu lớn và được thảo luận rộng rãi trong lĩnh vực khai phá dữ liệu và thống kê. Do đó phân tích tác động của các vấn đề gây ra bởi các giá trị còn thiếu và tìm ra các giải pháp để giải quyết với chúng là một vấn đề quan trọng trong lĩnh vực Điền đầy và Chuẩn bị Dữ liệu. Trong mục này, chúng ta thảo luận về những khiếm khuyết khác nhau mà chúng ta phải đối mặt khi nói đến dữ liệu bị thiếu và xem chúng có thể được giải quyết như thế nào. 44 a) Các loại khác nhau của việc thiếu dữ liệu Vấn đề thiếu dữ liệu nằm ở hầu hết các cuộc điều tra và các thí nghiệm được thiết kế. Một trong những phương pháp phổ biến là bỏ qua các trường hợp thiếu các giá trị, việc bỏ qua các trường hợp thiếu các giá trị đôi khi có thể dẫn đến việc loại bỏ một phần lớn của bộ dữ liệu dẫn đến kết quả không thích hợp. Các loại cơ chế bị thiếu khác được nêu dưới đây: ❖ MCAR – Missing Completely at Random Thuật ngữ “Thiếu hoàn toàn ngẫu nhiên” dùng để chỉ dữ liệu ở đó cơ chế mất dữ liệu không phụ thuộc vào biến số quan tâm, hay bất kỳ biến nào khác, được quan sát trong tập dữ liệu [64]. Ở đây dữ liệu được thu thập và được quan sát một cách tùy tiện và dữ liệu thu thập không phụ thuộc vào bất kỳ biến số khác của tập dữ liệu. Loại dữ liệu bị thiếu này rất hiếm khi được tìm thấy và phương pháp tốt nhất là bỏ qua các trường hợp như vậy. ❖ MAR – Missing at Random Đôi khi dữ liệu có thể không bị mất một cách ngẫu nhiên nhưng có thể được gọi là “Thiếu ở chế độ ngẫu nhiên”. Chúng ta có thể xem xét một tập Xi như mất dữ liệu một cách ngẫu nhiên nếu dữ liệu đáp ứng yêu cầu rằng sự thiếu sót không phụ thuộc vào giá trị của Xi sau khi kiểm soát một biến khác. ❖ NAMR – Not missing at Random Nếu dữ liệu không bị thiếu ở một cách ngẫu nhiên hoặc thiếu thông tin thì nó được gọi là “Không thiếu ở dạng ngẫu nhiên”. Tình huống như vậy xảy ra khi cơ chế mất dữ liệu phụ thuộc vào giá trị thực tế của dữ liệu bị thiếu [78]. Mô hình hóa một điều kiện như vậy là một nhiệm vụ rất khó khăn để đạt được. Điều này có nghĩa là chúng ta cần phải viết một mô hình cho dữ liệu bị thiếu và sau đó tích hợp nó vào một mô hình phức tạp hơn để ước lượng các giá trị còn thiếu. 45 b) Phần tử ngoại lai Phần tử ngoại lai trong cơ sở dữ liệu gồm hai loại: i) loại thứ nhất là các dữ liệu được thu thập hoặc tạo sinh theo một quy luật khác với các dữ liệu khác và được xem là dữ liệu sai hay dữ liệu không hợp lệ; ii) loại thứ hai là dữ liêu hợp lệ nhưng có những đặc điểm khác biệt so với đa số dữ liệu. Cả hai loại đều có đặc tính chung là có dấu hiệu khác biệt so với đa số các dữ liệu khác, vấn đề đặt ra là phát triển các phần mềm để phát hiện tự động các phần tử có dấu hiệu khác biệt trong CSDL cho phép các chuyên gia xác định xem cần loại bỏ nó ra khỏi CSDL hay cần xử lý đặc biệt đối với các phần tử ngoại lai được phát hiện này. Đến nay, ngoài các phương pháp xác định dữ liệu ngoại lai bằng phương pháp thống kê, có nhiều công trình nghiên cứu về phát hiện phần tử ngoại lai. Các phương pháp chính để xác định phần tử ngoại lai bao gồm: ❖ Xác định phần tử ngoại lai theo khoảng cách (Distance-Based): Theo hướng tiếp cận này cần phải xác định một hàm đo khoảng cách (metric) giữa các phần tử trong tập dữ liệu. Các phần tử ngoại lai là những phần tử nằm khá xa với tập các phần tử còn lại. ❖ Xác định theo thống kê (Statistical-Based): Hướng nghiên cứu này dựa trên việc xác định các mô hình phân phối thống kê mà các phần tử phải tuân theo (phân phối chuẩn, phân phối X2...). Phần tử ngoại lai là những phần tử không tuân theo các luật này. ❖ Xác định theo độ khác hiệt (Deviation-Based): Hướng nghiên cứu này dựa trên việc xác định những đặc trưng cơ bản của các phần tử trong một tập các phần tử. Các phần tử có những đặc trưng khác biệt quá lớn so với các phần tử còn lại thì là các phần tử ngoại lai. 46 2.2.4 Dữ liệu thiếu trong nghiên cứu phụ tải điện Nghiên cứu phụ tải là hoạt động phân tích biểu đồ phụ tải hệ thống điện nhằm chia thành biểu đồ của các thành phần phụ tải, phân nhóm phụ tải, các khách hàng sử dụng điện cuối cùng và các công nghệ sử dụng điện, để đưa ra các thông tin quan trọng như: Công suất và thời gian xuất hiện phụ tải đỉnh; Xu hướng tăng trưởng của Phụ tải đỉnh và Hệ số phụ tải; Chênh lệch phụ tải cao/thấp điểm của hệ thống; Lập kế hoạch, thiết kế và triển khai các chương trình DSM; Nâng cao độ chính xác của dự báo phụ tải ngắn hạn;.... Đây là một hoạt động chuyên sâu về phân tích số liệu, trong đó dữ liệu được thu thập thường là rất lớn, thông qua các hình thức thu thập tự động hoặc thủ công. Do đó dữ liệu bị lỗi là rất khó tránh khỏi, bởi có rất nhiều nguyên nhân như: sự cố đường truyền, sự cố thiết bị đo đếm, sự cố thiết bị lưu trữ hay do việc xữ lý dữ liệu thủ công không đúng phương pháp, ... Dữ liệu đo đếm của phụ tải là số liệu công suất, điện năng tiêu thụ của phụ tải theo chu kỳ đo quy định (30 phút hoặc 60 phút), thông số vận hành, biểu đồ phụ tải (load profile). Các Tổng công ty điện lực có trách nhiệm thực hiện cài đặt công tơ để truyền dữ liệu tự động về Kho dữ liệu. Trong quá trình vận hành, thu thập dữ liệu đã xuất hiện nhiều sự cố làm gián đoạn việc ghi nhận các dữ liệu đo đếm như: sự cố truyền dẫn tín hiệu từ công tơ đo đếm về Kho dữ liệu làm mất gói dữ liệu truyền về; lỗi tại thiết bị đo đếm; lỗi do mất nguồn điện; lỗi do cài đặt thiết bị đo đếm không đúng; lỗi do xử lý dữ liệu bằng phương pháp thủ công; hoặc do việc thu thập dữ liệu bằng thủ công,... dẫn đến dữ liệu ghi nhận được không phù hợp như: dữ liệu có có giá trị bằng 0 (Fasse Zero); trùng lặp dữ liệu (Inconsistent/Duplicate); thiếu chuỗi dữ liệu (Missing Data); dữ liệu thiếu chính xác; hoặc một số dữ liệu ngoại lai không logic cao quá hoặc thấp bất thường (Too High/Too Low). 47 Hình 2.7 – Các lỗi thường gặp trong ghi nhận dữ liệu điện 2.2.5 Các phương pháp nghiên cứu xử lý dữ liệu thiếu Cho đến nay vẫn chưa có một phương pháp nào chuyên dụng được khuyên sử dụng riêng cho việc xử lý dữ liệu thiếu trong các ứng dụng khai thác dữ liệu. Đặc biệt là làm thế nào để có thể xử lý giá trị thiếu trong một CSDL dữ liệu khổng lồ. Một số phương pháp xử lý dữ liệu thiếu đã được nghiên cứu [79] – [82]: a) Phương pháp loại bỏ Nếu xảy ra trường hợp thiếu dữ liệu cho một biến bất kỳ nào đó, giải pháp đơn giản là loại bỏ thuộc tính bị thiếu của dữ liệu ra khỏi qua quá trình phân tích đánh giá của chuỗi dữ liệu. Phương pháp này chỉ được áp dụng khi dữ liệu bị mất là hoàn toàn ngẫu nhiên (MCAR), vốn rất hiếm khi xảy ra trong thực tế. Phương pháp loại bỏ các bộ dữ liệu có chứa giá trị thiếu có ưu điểm là đơn giản, ít tốn thời gian hơn bất kỳ phương pháp nào khác. Nhưng nó lại có có hai điểm hạn chế quan trọng: i) thứ nhất là nếu chúng ta áp dụng vào trong thực tế có thể gây mất mát nhiều dữ liệu. ii) thứ hai là nếu phân bố dữ liệu thiếu trong tập dữ liệu không thuộc trường hợp (MCAR) thì việc loại bỏ tất cả các bộ dữ liệu có giá trị thiếu sẽ làm sai lệch nghiêm trọng kết quả. 48 b) Phương pháp gán ghép Phương pháp này thay thế các giá trị bị thiếu bằng một giá trị dự đoán được xem là hợp lý và sau đó thực hiện các phân tích cho chuỗi dữ liệu đã được bổ sung. Gán ghép trung bình: Tính giá trị trung bình dữ liệu của X bằng cách sử dụng các giá trị không bị mất và sử dụng nó để gán ghép cho giá trị thiếu của X. c) Phương pháp hồi qui tuyến tính Khi hai thuộc tính định lượng nào đó có mối quan hệ tuyến tính với nhau, chúng ta có thể xây dựng một phương trình hồi quy tuyến tính, trong đó thuộc tính có giá trị thiếu là biến phụ thuộc, biến còn lại là biến độc lập và sử dụng phương trình hồi quy cho việc dự đoán các giá trị thiếu của biến phụ thuộc thông qua các giá trị đã biết của biến độc lập. Phương pháp hồi quy tuyến tính thường gặp phải hai vấn đề: i) thứ nhất, mô hình quan hệ giữa các thuộc tính có phải tuyến tính không. Nếu mối quan hệ này là không tuyến tính, các giá trị thiếu ước lượng được có thể bị sai lệch lớn so với các giá trị thực. ii) thứ hai, thường thì trong cùng một bộ dữ liệu, các thuộc tính có quan hệ chặt với thuộc tính có giá trị thiếu cũng có giá trị thiếu. 2.2.6 Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện Một số phương pháp ước lượng số liệu đo đếm của các phụ tải điện bị lỗi trong quá trình thu thập dữ liệu của các Công ty điện lực thường được sử dụng như sau [83]: - Nội suy tuyến tính: nội suy từ đường đặc tính xu thế tiêu thụ điện. - Ngày tương đồng: sử dụng dữ liệu ngày tương đồng của tuần hiện tại hoặc tuần trước. - Tự động ước lượng: sử dụng trong trường hợp dữ liệu bị thiếu không quá bảy (07) ngày. 49 - Kiểm tra trực quan đồ thị: để biết được dữ liệu bị sai và quyết định về dữ liệu được ước lượng. - Hiệu chỉnh ước lượng số liệu thủ công: được sử dụng khi dữ liệu bị thiếu nhiều hơn bảy (07) ngày. - Hiệu chỉnh ước lượng giá trị trung bình các tuần của ngày tham chiếu: dựa vào dữ liệu của bốn (04) tuần gần nhất. Tuy nhiên, các cách làm này đều thực hiện một cách thủ công và phụ thuộc rất nhiều vào năng lực kinh nghiệm của chuyên gia thực hiện ước lượng. Dữ liệu đo đếm của phụ tải gồm: số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0) có mối quan hệ ràng buộc với nhau. Qua quan sát các dữ liệu thống kê chúng ta thấy được mối quan hệ tuyến tính giữa chúng, chẳng hạn như: những ngày nhiệt độ tăng cao thì điện năng sẽ được tiêu thụ nhiều hơn do người dân sử dụng nhiều thiết bị làm mát như máy điều hòa, quạt máy,... dẫn đến công suất Pmax sẽ tăng cao đột biến và sản lượng điện thương phẩm Atổng cũng vì thế tăng theo lên. Ngược lại, những ngày thời tiết có nhiệt thấp (trời mát hay có mưa) thì công suất Pmax và sản lượng điện thương phẩm Atổng sẽ không tăng cao mà hạ xuống thấp, đó là do nhu cầu sử dụng điện để giải nhiệt của người dân không còn nữa. Với phân tích trên, ta thấy mối quan hệ ràng buộc của ba thành phần số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0). Như vậy, việc sử dụng phương trình hồi quy cho việc dự đoán các giá trị thiếu trong quá trình nghiên cứu phụ tải điện là hoàn toàn phù hợp. Luận án xin đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây dựng các xây dựng các mô hình hồi quy tối ưu hóa các thông số tự động thông qua quá trình huấn luyện học máy Support Vector Regression (SVR), từ đó ước lượng lại các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm. 50 2.3. KẾT QUẢ NGHIÊN CỨU 2.3.1. Dữ liệu đầu vào Dữ liệu đo đếm của phụ tải sử dụng trong việc xây dựng thuật toán gồm: số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0) theo từng giờ, từng ngày trong tháng của các phụ tải tại Tổng công ty Điện lực TP.HCM. Để phục vụ nghiên cứu, tác giả đã sử dụng một chuỗi dữ liệu đo đếm tại Tổng công ty Điện lực TP.HCM trong khoảng thời gian từ ngày 01/01/2014 đến 28/02/2016 (dữ liệu hoàn chỉnh không bị lỗi, bị thiếu), theo đó: chủ động thay đổi một số dữ liệu (tăng, giảm, xoá,… hoặc sửa đổi một số số liệu) nhằm tạo ra các kịch bản dữ liệu thiếu hoặc dữ liệu ngoại lai, từ đó đưa vào giải thuật để khôi phục lại và so sánh độ chính xác với dữ liệu gốc. Ta xét dữ liệu đo đếm từ tháng 01/2014 đến tháng 02/2016, ta thấy có 04 số liệu điện năng (ngày 10 13/01/2015) bị lỗi ghi nhận bằng 0 – không đo đếm được; 03 số liệu điện năng (ngày 12 14/02/2015) bị lỗi ghi nhận bằng rỗng – không lưu trữ được và 03 số liệu điện năng (ngày 05 07/03/2015) bị lỗi ghi cao bất thường. Hình 2.8 – Đồ thị biểu diễn tương quan Pmax, Atổng và nhiệt độ 51 Bảng 2.1 – Các giá trị bị lỗi (bằng không, rỗng và cao bất thường) Ngày Atổng (106 x kWh) 10-01-15
11-01-15
12-01-15
13-01-15
12-02-15
13-02-15
14-02-15
05-03-15
06-03-15
07-03-15 0
0
0
0
156,44
157,81
155,21 Hình 2.9 – Dữ liệu bị thiếu và lỗi 2.3.2. Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để xây dựng được hàm hồi qui, ta không cần phải sử dụng hết tất cả các điểm dữ liệu trong bộ huấn luyện, những điểm có đóng góp vào việc xây dựng hàm hồi qui được gọi là những Support Vector (việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ thuộc vào các support vector). 52 Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0), luận án đề xuất giải thuật xây dựng mô hình hồi qui dự đoán các giá trị thiếu cho chuỗi dữ liệu điện năng tiêu thụ (Atổng), trên cơ sở ràng buộc của bộ dữ liệu huấn luyện là thành phần số liệu công suất (Pmax) và nhiệt độ (t0). Yêu cầu đặt ra là thực hiện việc xử lý các dữ liệu điện năng tiêu thụ bị lỗi trong quá trình đo đếm theo từng giờ trong ngày hoặc tổng điện năng tiêu thụ tổng từng ngày theo tháng. Trong đó, dựa trên mối quan hệ ràng buộc giữa sản lượng điện năng tiêu thụ với công suất và nhiệt độ tại thời điểm đo để xây dựng đường cong hồi qui bằng giải thuật huấn luyện SVR (Support Vector Regression), từ đó ước lượng các giá trị dữ liệu đã bị lỗi. Lưu đồ giải thuật như sau: Hình 2.10 – Giải thuật xử lý dữ liệu thiếu 2.3.3. Kết quả xử lý dữ liệu thiếu • Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời gian cho 4 tuần trước đó của chuổi dữ liệu đang xét, ta có kết quả Khi sử dụng phương pháp này sẽ xảy một vấn đề đó là: sẽ có trường hợp dữ liệu của 4 tuần trước đó bị rớt vào vùng dữ liệu bị thiếu. Chẳng hạn như xét việc tính toán cho dữ liệu thay thế cho các ngày 05 07/03/2015, cụ thể như sau: 53 Athay thế (05/03) = (A 26/02 + A 19/02 + A 12/02 + A 05/02) / 4; Athay thế (06/03) = (A 27/02 + A 20/02 + A 13/02 + A 06/02) / 4; Athay thế (07/03) = (A 28/02 + A 21/02 + A 14/02 + A 07/02) / 4; Tuy nhiên, các giá trị A12/02, A13/02 và A14/02 lại là dữ liệu bị thiếu mà ta đang xét, do đó kết quả tính toán chắc chắn sẽ không chính xác do các giá trị này đều bằng 0. Như vậy, có thể kết luận phương pháp sử dụng giá trị trung bình trong cùng thời gian cho 4 tuần trước đó của dữ liệu đang xét là chưa thực sự phù hợp trong trường hợp này. Bảng 2.2 – Kết quả ước lượng theo phương pháp thông thường Ngày
10-01-15
11-01-15
12-01-15
13-01-15
12-02-15
13-02-15
14-02-15
05-03-15
06-03-15
07-03-15 Athay thế
53,71
46,47
55,20
55,58
53,49
52,81
50,79
31,35
32,24
31,99 • Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR (Support Vector Regression) Xây dựng bộ huấn luyện SVR sử dụng hàm lỗi ε-insensitive và hàm nhân Gaussian ta có ba tham số cần tìm: hệ số chuẩn hóa C, tham số của hàm nhân Gaussian và độ rộng của ống ε [96 - 97]. Dùng ngôn ngữ lập trình Matlab version R2015 [98] để xây dựng chương trình ước lượng, với x1, x2 là 02 vector dữ liệu công suất và nhiệt độ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016; Y là vector dữ liệu điện năng tiêu thụ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016 (có chứa các số liệu bị lỗi) cần được mô hình hóa. + Xét mô hình SVM Regression, với các thông số: 54 Bảng 2.3 – Bảng thông số mô hình SVR C - BoxConstraint KernelScale ε - Epsilon 6.9088 0.10 0.4469 ➢ Kiểm tra sai số mô hình: để đánh giá mô hình hồi qui SVR vừa xây dựng, ta có thể đánh giá sai số giữa dữ liệu có được từ mô hình với dữ liệu gốc từ ngày 15/03/2015 đến ngày 15/04/2015, cụ thể: Bảng 2.4 – Đánh giá kết quả test của mô hình SVR Ngày Atổng ASVR Sai số
15-03-15 48,48 48,40 0,18%
16-03-15 57,43 59,07 2,87%
17-03-15 58,61 58,69 0,13%
18-03-15 57,86 58,03 0,29%
19-03-15 58,98 59,76 1,32%
20-03-15 59,01 59,11 0,17%
21-03-15 56,08 55,48 1,08%
22-03-15 47,98 47,76 0,46%
23-03-15 58,19 59,85 2,86%
24-03-15 61,79 61,21 0,95%
25-03-15 60,92 61,84 1,52%
26-03-15 63,99 62,04 3,04%
27-03-15 62,29 59,25 4,88%
28-03-15 60,42 58,04 3,95%
29-03-15 51,90 52,76 1,64%
30-03-15 60,91 61,34 0,70%
31-03-15 62,51 61,27 1,99%
01-04-15 60,95 61,27 0,53%
02-04-15 62,50 61,80 1,11%
03-04-15 63,23 62,93 0,47%
04-04-15 61,05 60,15 1,47%
05-04-15 51,23 51,35 0,22%
06-04-15 60,99 61,96 1,58%
07-04-15 63,34 62,86 0,76%
08-04-15 63,38 63,26 0,20%
09-04-15 63,66 63,51 0,23%
10-04-15 64,20 63,66 0,84% 55 Ngày Atổng ASVR Sai số
11-04-15 61,86 61,20 1,07%
12-04-15 51,32 49,35 3,83%
13-04-15 57,87 58,55 1,18%
14-04-15 60,17 60,57 0,66%
15-04-15 61,25 62,15 1,47% ❖ Sai số phần trăm tuyệt đối trung bình (MAPE) Như vậy, cho thấy độ tin cậy của mô hình hồi qui là rất cao, mô hình có thể được sử dụng để ước lượng các số liệu bị lỗi nêu trên. Hình 2.11 – Mô phỏng lại đường cong tải bị thiếu dữ liệu ❖ Kết quả ước lượng các giá trị thiếu, lỗi 56 Hình 2.12 – Kết quả ước lượng dữ liệu thiếu bằng SVR Bảng 2.5 – Kết quả ước lượng dữ liệu thiếu bằng SVR Ngày
10-01-15
11-01-15
12-01-15
13-01-15
12-02-15
13-02-15
14-02-15
05-03-15
06-03-15
07-03-15 Athay thế
53,71
46,47
55,20
55,58
53,49
52,81
50,79
31,35
32,24
31,99 Aước lượng(SVR)
52,92
44,91
54,96
55,45
49,28
51,11
42,86
56,80
58,04
56,12 Phương pháp xây dựng đường cong hồi qui bằng mạng Neural Network • + Xét mô hình Neural Netwok Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày 01/01/2014 đến ngày 29/02/2016): - Biến độc lập (biến dự báo) Y là vector dữ liệu điện năng tiêu thụ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016 (có chứa các số liệu bị lỗi) cần được mô hình hóa. 57 - Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: 02 vector dữ liệu công suất và nhiệt độ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016 (x1 và x2). Hình 2.13 – Mô hình mạng Neural Network ❖ Kiểm tra sai số mô hình: để đánh giá mô hình hồi qui NN vừa xây dựng, ta có thể đánh giá sai số giữa dữ liệu có được từ mô hình với dữ liệu gốc từ ngày 15/03/2015 đến ngày 15/04/2015, cụ thể: Bảng 2.6 – Đánh giá kết quả test của mô hình NN Ngày Atổng ANN Sai số
15-03-15 48,48 46,81 3,45%
16-03-15 57,43 59,96 4,42%
17-03-15 58,61 59,56 1,62%
18-03-15 57,86 58,84 1,70%
19-03-15 58,98 61,15 3,68%
20-03-15 59,01 59,43 0,70%
21-03-15 56,08 56,23 0,27%
22-03-15 47,98 47,17 1,67%
23-03-15 58,19 60,80 4,49%
24-03-15 61,79 62,11 0,51%
25-03-15 60,92 63,66 4,49%
26-03-15 63,99 63,79 0,31%
27-03-15 62,29 63,64 2,17%
28-03-15 60,42 60,64 0,35%
29-03-15 51,90 51,97 0,13%
30-03-15 60,91 63,21 3,77%
31-03-15 62,51 62,20 0,50%
01-04-15 60,95 62,20 2,06% 58 Ngày Atổng ANN Sai số
02-04-15 62,50 62,72 0,36%
03-04-15 63,23 63,50 0,43%
04-04-15 61,05 61,41 0,60%
05-04-15 51,23 47,62 7,05%
06-04-15 60,99 62,87 3,07%
07-04-15 63,34 64,26 1,45%
08-04-15 63,38 64,47 1,72%
09-04-15 63,66 64,59 1,47%
10-04-15 64,20 64,65 0,69%
11-04-15 61,86 62,10 0,39%
12-04-15 51,32 48,36 5,76%
13-04-15 57,87 59,42 2,68%
14-04-15 60,17 61,69 2,52%
15-04-15 61,25 62,79 2,51% ❖ Sai số phần trăm tuyệt đối trung bình (MAPE) Như vậy, cho thấy độ tin cậy của mô hình hồi qui là khá tốt (nhưng không tốt bằng mô hình SVR 2), mô hình có thể được sử dụng để ước lượng các số liệu bị lỗi nêu trên. Hình 2.14 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 59 Hình 2.15 – Kết quả ước lượng các giá trị thiếu, lỗi Bảng 2.7 – Kết quả ước lượng của mô hình NN Ngày
10-01-15
11-01-15
12-01-15
13-01-15
12-02-15
13-02-15
14-02-15
05-03-15
06-03-15
07-03-15 Athay thế
53,71
46,47
55,20
55,58
53,49
52,81
50,79
31,35
32,24
31,99 Aước lượng(NN)
54,45
42,70
55,05
55,49
50,61
47,10
39,60
57,51
59,72
56,18 ❖ Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN 60 Hình 2.16 – Mô phỏng lại đường cong tải bị thiếu dữ liệu Hình 2.17 – Kết quả ước lượng các giá trị thiếu, lỗi Bảng 2.8 – Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN Athay thế Aước lượng(SVR1) Aước lượng(SVR2) Aước lượng(NN) Ngày
10-01-15 53,71
11-01-15 46,47
12-01-15 55,20
13-01-15 55,58
12-02-15 53,49
13-02-15 52,81
14-02-15 50,79 54,17
42,15
55,26
55,49
49,42
45,97
39,32 52,92
44,91
54,96
55,45
49,28
51,11
42,86 54,45
42,70
55,05
55,49
50,61
47,10
39,60 61 05-03-15 31,35
06-03-15 32,24
07-03-15 31,99 56,80
58,04
56,12 57,51
59,72
56,18 57,06
58,92
55,54 2.4. TỔNG KẾT CHƯƠNG II Qua khảo sát mô hình bộ huấn luyện SVR sử dụng hàm lỗi ε-insensitive và hàm nhân Gaussian đã cho kết quả: giải quyết tốt yêu cầu xử lý các dữ liệu điện năng tiêu thụ bị lỗi trong quá trình đo đếm dựa trên mối quan hệ ràng buộc của các dữ liệu thống kê công suất và nhiệt độ ghi nhận theo ngày tương ứng với lượng điện năng tiêu thụ. Mô hình SVR cho kết quả mô phỏng lại đường cong đặc tuyến tải tốt hơn mô hình mạng Neural Network và các mô hình đều có giá trị MAPE rất tốt (< 2,2%). Qua đó, chúng ta đã xây dựng được công cụ tự động ước lượng các dữ liệu bị lỗi mà trước đây phải thực hiện thực một cách thủ công, nâng cao độ tin cậy trong việc phân tích, xử lý dữ liệu trong quá trình nghiên cứu phụ tải. Việc xây dựng mô hình SVR và NN để mô phỏng lại đường cong đặc tuyến tải đã giải quyết rất tốt nhiệm vụ của luận án đặt ra, đó là xây dựng được một công cụ để ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu, dự báo phụ tải điện. Hướng phát triển tiếp theo là sử dụng mô hình bộ huấn luyện SVR kết hợp mô hình Box-Jenkin, Neural Networks, Random Forest để triển khai công tác dự báo phụ tải điện ngắn hạn theo 24 chu kỳ/ ngày (chu kỳ 60 phút); ngày/tuần trên bộ cơ sở dữ liệu của Tổng công ty Điện lực thành phố Hồ Chí Minh có xét đến các ràng buộc về nhiệt độ, tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối và bán lẻ cạnh tranh sắp tới. 62 3.1.1. Các yếu tố về kinh tế - Thông thường có sự tương quan mạnh mẽ giữa tăng trưởng kinh tế và nhu cầu điện. Qua phân tích biểu đồ tương quan giữa GRDP và Điện năng, thì mức độ tương quan về sự tăng trưởng là rất cao (R2 = 97,67%) - Không nhất thiết là mối quan hệ đơn giản theo tỷ lệ 1 và 1 - Tiêu thụ điện năng thường tăng theo tăng trưởng GRDP (triệu đồng) Hình 3.1 – Tăng trưởng của GRDP và Điện năng qua các năm (triệu kWh) Hình 3.2 – Biểu đồ tương quan giữa GRDP và Điện năng (triệu kWh) 63 3.1.2. Giá điện - Giá điện và nhiên liệu - Cơ cấu giá (giá theo thời điểm): Cơ chế giá điện là giải pháp có tác dụng lớn nhất trong việc điều hòa biểu đồ của hệ thống, cũng như giá phản ánh được giá trị sử dụng và các yếu tố giá điện liên quan đến khách hàng tiêu thụ. Việc thiết kế cơ chế giá phù hợp sẽ mang lại lợi ích không chỉ cho phía nhà cung cấp, khách hàng sử dụng điện mà còn mang lại lợi ích kinh tế cho toàn xã hội. Trong thời gian qua, áp dụng biểu giá TOU (Time of Use: thời gian sử dụng) đã làm thay đổi biểu đồ phụ tải theo hướng tích cực, nhất là các phụ tải công nghiệp, sản xuất. Các nhà quản lý đã dịch chuyển thời gian, dây chuyền sản xuất vào những biểu giá điện thấp điểm để tận dụng nguồn điện giá rẻ, đồng thời sẽ có tác dụng kép là giảm tải đỉnh tại các thời điểm cao điểm của hệ thống. 3.1.3. Thành phần phụ tải (được kết nối vật lý) - Thành phần cơ bản của khách hàng Hình 3.3 – 5 thành phần phụ tải sử dụng điện (hộ sử dụng điện) 64 Hình 3.4 – Đồ thị phụ tải của tòa nhà Green Power (EVNHCMC) - Các thiết bị / công nghệ của các ngành Hình 3.5 – Phụ tải Nhà máy thép (kWh) Hình 3.6 – Phụ tải Nhà máy Xi măng (kWh) Kết nối những máy phát điện quy mô nhỏ (ví dụ như mặt trời áp mái) - 3.1.4. Các yếu tố ngoại sinh - Điều kiện khí hậu và thời tiết (theo mùa): Yếu tố khí hậu có thể ảnh hưởng đến nhu cầu điện trên các khoảng thời gian khác nhau: trong năm có tác động 65 “theo mùa” và dài hạn tác động bởi các chu kỳ khác nhau (La-Nina & El- Nino,…) Hình 3.7 – Sự thay đổi theo nhiệt độ trong năm (tháng 5 – mùa hè) - Thói quen khách hàng (thông thường được tổng hợp) Hình 3.8 – Sự thay đổi theo các ngày lễ trong năm - Sự kiện về thời tiết, các sự kiện bất thường: Hình 3.9 – Dao động mạnh giữa El Nino và La Nina 66 3.1.5. Quản lý nhu cầu phụ tải - Hiệu quả năng lượng (EE): % tổng năng lượng đầu vào cho một máy hoặc thiết bị được tiêu thụ trong công việc hữu ích và không lãng phí như nhiệt vô ích. - Điều chỉnh nhu cầu (DR): khi một khách hàng giảm nhu cầu phụ tải trong một khoảng thời gian ngắn đáp lại được mức giá điện ưu đãi (hay hình thức khác) từ nhà vận hành lưới điện. Ví dụ: giảm sử dụng điều hòa, lò hơi, giảm bớt chiếu sáng… - Quản lý nhu cầu phụ tải (DSM): Các chương trình khuyến khích người dùng sử dụng năng lượng hiệu quả hơn. Các biện pháp DSM có thể bao gồm cải tạo ánh sáng, nâng cấp tự động hóa tòa nhà, cải tiến HVAC, thiết bị biến tần,… Hình 3.10 – DR cắt giảm được tải đỉnh 3.2.1. Đặc tính tải ngày – tuần (week day) Nhu cầu tải thay đổi từ ngày này sang ngày khác trong tuần. Hình dưới cho thấy nhu cầu phụ tải qua các năm trong quá khứ. Qua đó, ta thấy nhu cầu phụ tải vào cuối tuần ít hơn so với ngày thường và phụ tải các tuần trong ngày Tết (tháng 2) sụt giảm rất nhiều so với các tuần thường ngày khác, cũng như các tháng còn lại trong năm. 67 Hình 3.11 – Đặc tính tải thay đổi theo ngày Quan sát đồ thị phụ tải 07 ngày trong một tuần của khu vực thành phố Hồ Chí Minh ta thấy sự biến đổi giữa các ngày thường (từ thứ 2 đến thứ 6) không có nhiều biến động và có cùng một kiểu bổ đồ phụ tải. Đối với đồ thị phụ tải ngày thứ 7 thì có sự biến đổi nhưng không nhiều so với ngày thường, chủ yếu nhu cầu phụ tải suy giảm vào buổi chiều tối. Riêng đối với đồ thị phụ tải ngày Chủ nhật thì hoàn toàn khác với các ngày thường (nhu cầu sử dụng điện xuống thấp). Hình 3.12 – Đặc tính tải thay đổi theo giờ - tuần 3.2.2. Đặc tính tải giờ – ngày (hour day) Tải thay đổi trong ngày từ giờ sang giờ khác. Các hình dưới cho biết đồ thị phụ tải điển hình của tháng 12 trong năm. Có thể nhận thấy rằng tải đỉnh xảy ra hai lần một ngày, một là khoảng 10:00 AM đến 12:00 AM và một là từ khoảng 2:00 PM đến 4:00 PM và bởi vì hành vi nhu cầu phụ tải này, tính năng giờ có thể rất hữu ích trong dự báo tải ngắn hạn. 68 Hình 3.13 – Đồ thị các ngày điển hình tháng1 Hình 3.14 – Đồ thị các ngày điển hình tháng 2 Hình 3.15 – Đồ thị các ngày điển hình tháng 3 Hình 3.16 – Đồ thị các ngày điển hình tháng 4 69 Hình 3.17 – Đồ thị các ngày điển hình tháng 5 Hình 3.18 – Đồ thị các ngày điển hình tháng 6 Hình 3.19 – Đồ thị các ngày điển hình tháng 7 Hình 3.20 – Đồ thị các ngày điển hình tháng 8 70 Hình 3.21 – Đồ thị các ngày điển hình tháng 9 Hình 3.22 – Đồ thị các ngày điển hình tháng 10 Hình 3.23 – Đồ thị các ngày điển hình tháng 11 Hình 3.24 – Đồ thị các ngày điển hình tháng 12 71 3.2.3. Đăc tính của thời tiết Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm), nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải điện, và nhiệt độ ước tính được sử dụng cho đầu vào thay vì thực. Tuy nhiên, không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có thể làm giảm độ chính xác của kết quả dự báo. Hình 3.25 – Biểu đồ quan hệ phụ tải và nhiệt độ 3.3.1. Khái niệm Quan sát đồ thị phụ tải các ngày trong một tuần và một số ngày lễ đặc biệt trong năm của khu vực thành phố Hồ Chí Minh ta thấy: sự biến đổi giữa các ngày thường (từ thứ 3 đến thứ 6) không có nhiều biến động và có cùng một kiểu biểu đồ phụ tải. Đối với đồ thị phụ tải ngày thứ 2 thì có sự biến đổi khác biệt với ngày 72 thường tại khoảng thời từ 0h00 đến 9h00, do có sự chuyển tiếp nhu cầu từ ngày chủ nhật. Xem xét cụ thể các ngày trong năm như sau: Hình 3.26 – Đồ thị phụ tải các ngày thứ 6, 7 và chủ nhật - Khi quan sát biểu đồ phụ tải ngày thứ 7 thì có sự biến đổi nhưng không nhiều so với ngày thường (ngày thứ 6), chủ yếu nhu cầu phụ tải suy giảm vào buổi chiều tối, do bắt đầu cho ngày nghỉ cuối tuần. Riêng đối với đồ thị phụ tải ngày Chủ nhật thì hoàn toàn khác với các ngày thường (nhu cầu sử dụng điện xuống thấp). 73 Hình 3.27 – Đồ thị phụ tải các ngày thường trong tuần - Khi quan sát biểu đồ phụ tải các ngày thường trong tuần thì đối với thời gian đầu buổi sáng thứ hai phụ tải có sự suy giảm do mới bắt đầu một tuần mới và chuyển tiếp từ ngày chủ nhật sang, còn các ngày khác thì đồ thị phụ tải gần như giống nhau hoàn toàn. Hình 3.28 – Đồ phụ tải ngày Tết DL, AL và ngày thường - Khi quan sát biểu đồ phụ tải các ngày Tết Dương lịch và Tết Âm lịch thì chúng ta thấy sự khác biệt hoàn toàn, đồ thị gần như bằng phẳng và nhu cầu phụ tải xuống khá thấp do đây là các ngày nghỉ. Riêng ngày Tết Âm lịch thì 74 nhu cầu phụ tải xuống thấp nhất, do đây là kỳ nghỉ kéo dài nhất trong năm (có thể từ 6 – 9 ngày). Trên cơ sở nghiên cứu các đặc tính của phụ tải như trên (phần 3.2 và 3.3), chúng ta thấy các ngày trong tuần/ trong tháng/ trong năm đều có thể được biểu thị một số hình dáng tải đặc trưng hay nói cách khác chúng ta có thể xây dựng được đồ thị điển hình của các ngày trong năm. Tuy các đồ thị có thể khác nhau về độ lớn qua các năm nhưng xét về hình dạng đồ thị thì đặc tính tải này không thay đổi hoặc thay đổi rất ít do một số tác động bên ngoài. Như vậy, để giải quyết bài toán khác biệt về đọ lớn của các đồ thị phụ tải, tác giả đề xuất giải pháp qui về một hệ tương đối hay nói cách khác là chuẩn hóa đơn vị các đồ thị phụ tải này, từ đó xây dựng được mô hình đồ thị phụ tải điển hình theo dạng chuẩn hóa đơn vị để xử lý các dữ liệu trước khi đưa vào các bộ huấn luyện trong các nghiên cứu sau này. Biểu đồ phụ tải chuẩn hóa đơn vị (Standardized Load Profiles - SLP) được xây dựng bằng cách lấy giá trị công suất thu thập theo chu kỳ 60/30 phút chia cho công suất cực đại của nó. Chẳng hạn như: - Để xây dựng biểu đồ chuẩn hoá đơn vị của một ngày: chúng ta lấy công suất theo chu kỳ chia cho cực đại của ngày hôm đó và kết quả chúng ta có được SLP theo từng chu kỳ của một ngày. - Để xây dựng biểu đồ chuẩn hoá đơn vị của một tuần: chúng ta lấy công suất theo chu kỳ của từng ngày trong tuần đó chia cho cực đại của tuần đang xét và kết quả chúng ta có được SLP theo từng chu kỳ của tuần. - Để xây dựng biểu đồ chuẩn hoá đơn vị của một tháng: chúng ta lấy công suất theo chu kỳ của từng ngày trong tháng đó chia cho cực đại của tháng đang xét và kết quả chúng ta có được SLP theo từng chu kỳ của tháng. 75 - Để xây dựng biểu đồ chuẩn hoá đơn vị của một năm: chúng ta lấy công suất theo chu kỳ của từng ngày trong năm đó chia cho cực đại của năm đang xét và kết quả chúng ta có được SLP theo từng chu kỳ của năm. Tuy nhiên, việc xây dựng SLP của một năm đòi hỏi phải dựa trên cơ sở bộ dữ liệu phụ tải thu thập theo 24 (hoặc 48) chu kỳ trong quá khứ của ít nhất 03 – 04 năm, đồng thời phải được xác định chuẩn xác đúng thứ tự ngày (thứ hai, ba, tư,…, chủ nhật) + thứ tự tuần/ tháng + loại ngày (ngày thường hay ngày lễ Tết, ngày đặc biệt) và đặc biệt có xét đến lịch Dương/ lịch Âm. Theo đó, chúng ta sẽ có SLP chuẩn hóa theo ngày, theo tuần, theo tháng và theo năm, chúng ta sẽ xem xét các tính năng của chúng trong các quan sát dưới đây: ❖ Quan sát một số ngày đặc biệt trong năm: - Ngày Tết Dương lịch qua các năm (01/01): 76 Hình 3.29 – Biểu đồ chuẩn hóa đơn vị ngày Tết Dương lịch qua các năm Quan sát Đồ thị phụ tải và Biểu đồ chuẩn hóa đơn vị của các ngày Tết Dương lịch thì chúng đều có chung hình dạng qua các năm. Chúng chỉ khác nhau về mặt độ lớn của biểu đồ phụ tải, nhưng hình dáng và độ lớn tương tự nhau về Biểu đồ chuẩn hóa đơn vị qua các năm. Đồng thời, Biểu đồ chuẩn hóa đơn vị của các năm gần như có cùng hình dáng, cũng như độ lớn đơn vị qua các năm. Ngày Tết Nguyên Đán qua các năm (Mồng 01/1 âm lịch): 77 Hình 3.30 – Biểu đồ chuẩn hóa đơn vị ngày Tết Nguyên Đán qua các năm Quan sát Đồ thị phụ tải và Biểu đồ chuẩn hóa đơn vị của các ngày Tết Dương lịch thì chúng đều có chung hình dạng qua các năm và gần như trùng khớp nhau. Đồng thời, Biểu đồ chuẩn hóa đơn vị của các năm gần như có cùng hình dáng, cũng như độ lớn đơn vị, đây là một đặc tính đặc biệt cần khai thác trong kỹ thuật dự báo. ❖ Quan sát một số ngày thông thường trong năm: - Ngày thứ 2 trong tuần: Hình 3.31 – Biểu đồ chuẩn hóa đơn vị ngày thứ 2 trong tuần 78 - Ngày thứ 3 trong tuần: Hình 3.32 – Biểu đồ chuẩn hóa đơn vị ngày thứ 3 trong tuần - Ngày thứ 6 trong tuần: Hình 3.33 – Biểu đồ chuẩn hóa đơn vị ngày thứ 6 trong tuần - Ngày thứ 7 trong tuần: Hình 3.34 – Biểu đồ chuẩn hóa đơn vị ngày thứ 7 trong tuần 79 Quan sát hình trên, ta thấy Biểu đồ phụ tải đơn vị riêng từng dạng ngày trong tuần đều có hình dáng và độ lớn hoàn toàn tương tự nhau và gần như không thay đổi qua các năm, đây là một đặc tính đặc biệt cần khai thác trong kỹ thuật dự báo. 3.3.2. Ứng dụng xử lý dữ liệu thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) Tiếp theo việc Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu bằng giải thuật SVR, luận án tiếp tục đề xuất giải thuật xử lý dữ liệu thiếu bằng việc kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR). Ở Chương II, luận án đề xuất kỹ thuật xử lý dữ liệu thiếu ở cấp độ theo ngày, còn ở Chương này, luận án sẽ đề xuất giải thuật xử lý dữ liệu thiếu theo cấp độ theo 24 chu kỳ/ ngày. ❖ Một số SLP điển hình năm 2018: 80 Hình 3.35 – SLP một số ngày trong năm Qua quan sát, biểu đồ phụ tải chuẩn hóa đơn vị thể hiện được hết tất cả các đặc tính tải theo từng thời điểm, mùa vụ và các ngày lễ, Tết (Dương lịch, Nguyên Đán),… chúng ta thấy mức độ tương đồng của SLP về mặt hình dáng, độ lớn từng chu kỳ. Do đó, Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) chính là một điểm đặc biệt và cũng là bộ thông số đầu vào quan trọng của quá trình huấn luyện của các thuật toán học máy SVR (NN) để xây dựng lại đường đặc tuyến phụ tải từ đó ước lượng các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm. 81 ❖ Giải thuật: Hình 3.36 – Giải thuật xử lý dữ liệu thiếu 82 Luận án đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây dựng Biểu đồ chuẩn hóa đơn vị (SLP) trên cơ sở bộ dữ liệu phụ tải điện quá khứ chu kỳ 60 phút/lần của 03 năm trước đó. Đồng thời, kết hợp các giải thuật SVR (NN, RF) để xây dựng lại hàm hồi qui (đường đặc tuyến phụ tải) từ đó ước lượng các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm. Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta có thể xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và chuẩn xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc, ngày nghỉ,…), từng tuần, từng tháng. Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây dựng hàm hồi qui theo giải thuật SVR (Support Vector Regression), NN (Neural Network), RF (Ramdom Forest) để xây dựng các hàm hồi qui. Sau đó sử dụng bộ dữ liệu nêu trên để kiểm tra, đánh giá sai số của các hàm hồi qui. Trên cơ sở đánh giá sai số của các mô hình, mô hình được chọn là mô hình có sai số nhỏ nhất, từ đó mô hình được lựa chọn sẽ là hàm hồi qui để ước lượng dữ liệu thiếu với dữ liệu đầu vào là bộ dữ liệu SLP đã được xây dựng nêu trên. Cụ thể các thông số mô hình như sau: • Mô hình SVR Cần phải lựa chọn chuẩn xác các thông số đầu vào để chạy các mô hình SVR: hệ số chuẩn hóa C, độ rộng của ống ε và hàm nhân Gaussian. Thuật toán sử dụng chung bộ dữ liệu đầu vào của các mô hình. Bảng 3.1 – Một số thông số mô hình SVR đặc trưng được đề xuất Model C - BoxConstraint ε - Epsilon KernelFunction
SVR 1
SVR 2
SVR 3
SVR 4 Polynomial
Gaussian
Linear
Linear 93.42
500.32
1
100 32.5
0.01
50.03
0.01 83 • Mô hình RF Một tập hợp các cây hồi quy với mỗi bộ quy tắc khác nhau để thực hiện hồi quy phi tuyến tính. Thuật toán xây dựng tổng cộng 20 cây, với kích thước lá tối thiểu là 20. Kích thước của lá nhỏ hơn hoặc bằng kích thước cây nhằm kiểm soát hiện tượng overfitting và mang lại hiệu suất cao [14], [15]. Thuật toán sử dụng chung bộ dữ liệu đầu vào của các mô hình. • Mô hình Mạng Neural Sử dụng mô hình mạng Neural truyền thẳng (Feedforward Neural Network) với các biến đầu vào như trên và bộ dữ liệu huấn luyện nêu trên. Kiến trúc mạng 01 lớp ẩn với kích thước lớp là 10 và Hàm kích hoạt Sigmoid. Đồng thời, sử dụng mạng Neural thông thường với kiến trúc mạng 03 lớp ẩn, trong đó: lớp ẩn thứ nhất có kích thước là 10; lớp ẩn thứ hai là 8 và lớp ẩn thứ ba là 5. 3.3.3. Kết quả áp dụng SLP vào xử lý dữ liệu thiếu a) Dữ liệu đầu vào: Dữ liệu đo đếm của phụ tải sử dụng trong việc xây dựng thuật toán gồm: số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0) theo từng giờ, từng ngày trong tháng của các phụ tải tại Tổng công ty Điện lực TP.HCM. Để phục vụ nghiên cứu, tác giả đã sử dụng một chuỗi dữ liệu đo đếm tại Tổng công ty Điện lực TP.HCM trong khoảng thời gian từ ngày 01/01/2014 đến 17/12/2018 (dữ liệu hoàn chỉnh không bị lỗi, bị thiếu), theo đó: chủ động thay đổi một số dữ liệu (tăng, giảm, xoá,… hoặc sửa đổi một số số liệu) nhằm tạo ra các kịch bản dữ liệu thiếu hoặc dữ liệu ngoại lai, từ đó đưa vào giải thuật để khôi phục lại và so sánh đọ chính xác với dữ liệu gốc. 84 85 Hình 3.37 – Một số ngày dữ liệu bị lỗi một vài chu kỳ Trong đó có một số chu kỳ dữ liệu điện năng tiêu thụ (Atổng) bị thiếu do gián đoạn đo đếm (lỗi giá trị = 0) và lỗi ghi nhận vượt quá (lớn bất thường), để phục vụ nghiên cứu thì cần phải hiệu chỉnh. b) Kết quả xử lý dữ liệu thiếu Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để xây dựng được hàm hồi qui, ta không cần phải sử dụng hết tất cả các điểm dữ liệu trong bộ huấn luyện, những điểm có đóng góp vào việc xây dựng hàm hồi qui được gọi là những Support Vector (việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ thuộc vào các support vector). Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0), cùng với bộ SLP – SVR (NN) luận án đã xây dựng lại đường cong phụ tải các ngày bị lỗi. • Bước 1: Xây dựng lại đường cong hồi qui từ dữ liệu trước thời điểm xuất hiện việc thiếu dữ liệu: Các dữ liệu quá khứ trước thời điểm xuất hiện việc thiếu dữ liệu (Điện thương phẩm, công suất, nhiệt độ ghi nhận theo 24 chu kỳ - 60 phút) đã được xử lý và Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây dựng hàm hồi qui theo giải thuật SVR (có so sánh với các giải thuật học máy Neural Network, Ramdom Forest) để xây dựng lại các hàm hồi qui. 86 - Xây dựng các hàm hồi qui bằng mô hình SVR: Hình 3.38 – Các hàm hồi qui SVR được xây dựng Bảng 3.2 – Kết quả kiểm tra sai số trung bình của các mô hình SVR Date MAPE (%) 2.43 YSVR1 YSVR2 YSVR3 YSVR4
1.75 1.90 2.06 - Xây dựng các hàm hồi qui bằng các mô hình học máy: Hình 3.39 – Các hàm hồi qui được xây dựng lại Bảng 3.3 – Kết quả kiểm tra sai số trung bình của các mô hình hồi qui. Date YSVR4 YNN YRF
MAPE (%) 1.75 1.83 4.16 87 Qua đó, mô hình SLP – SVR (mô hình YSVR4) có giá trị sai số ước lượng thấp nhất nên được chọn làm mô hình hồi qui để ước lượng các dữ liệu bị thiếu nêu trên. • Bước 2: Trên cơ sở bộ dữ liệu SLP 24 chu kỳ của giai đoạn dự kiến (đã bao gồm các ngày lễ, ngày nghỉ,…), cùng với nhiệt độ 24 chu kỳ của khoảng thời gian dữ liệu bị thiếu tương ứng sẽ là đầu vào cho hàm hồi qui được chọn để ước lượng lại các giá trị bị thiếu. Hình 3.40 – Đường cong phụ tải được xây dựng lại Trên cơ sở SLP của từng chu kỳ của năm 2018 đã xây dựng, chương trình sẽ xây dựng lại Biểu đồ phụ tải theo từng chu kỳ của các ngày bị lỗi để xuất ra Kết quả Hình 3.41 – Dữ liệu được xây dựng lại ngày 08/08/2018 88 Hình 3.42 – Dữ liệu được xây dựng lại ngày 13/08/2018 Hình 3.43 – Dữ liệu được xây dựng lại ngày 17/08/2018 Hình 3.44 – Dữ liệu được xây dựng lại ngày 25/08/2018 89 Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0), cùng với bộ SLP – SVR (NN), luận án đã xây dựng được công cụ tự động ước lượng các dữ liệu bị lỗi mà trước đây phải thực hiện thực một cách thủ công. Biểu đồ chuẩn hóa đơn vị (SLP) đã góp một phần không nhỏ trong kỹ thuật ước lượng lại dữ liệu bị lỗi. Tuy dữ liệu ước lượng chưa hoàn toàn trùng khớp nhưng phần nào góp phần tạo công cụ nhằm nâng cao độ tin cậy trong việc phân tích, xử lý dữ liệu trong quá trình nghiên cứu phụ tải điện. Đồng thời, kết quả nghiên cứu kỹ thuật kết hợp: Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm đầu vào cho các modules xây dựng hàm hồi qui theo giải thuật SVR (Support Vector Regression), NN (Neural Network), RF (Random Forecast),… để xây dựng các hàm hồi qui sẽ làm cơ sở để tiếp tục nghiên cứu áp dụng kỹ thuật này vào việc xây dựng giải thuật dự báo ngắn hạn phụ tải điện nhằm giải quyết một số khó khăn, vướng mắc mà các tác giả đi trước gặp phải đã được đặt ra ở Chương I. 90 Dự báo phụ tải ngắn hạn (STLF) đóng một vai trò quan trọng trong việc xây dựng các chiến lược kinh doanh, đảm bảo tin cậy và an toàn cho hệ thống điện. Dự báo nhu cầu điện là một khía cạnh quan trọng trong việc phát triển bất kỳ mô hình nào về quy hoạch điện, đặc biệt là trong tình hình tái cấu trúc hệ thống điện phát triển nhanh như ngày nay. Hiện nay, có rất nhiều phương pháp để dự báo phụ tải ngắn hạn, theo đó có thể được chia thành ba lớp chính: phương pháp thống kê thông thường, mô hình thông minh nhân tạo và kết hợp các phương pháp nêu trên. Đối với phương pháp truyền thống, kết quả đầu ra được thể hiện một cách rõ ràng thông qua các phương trình toán học với yếu tố đầu vào, do đó, nó còn được gọi là mô hình hộp trắng (white-box models), chẳng hạn như: hồi quy tuyến tính, đa hồi quy và mô hình ARIMA, SARIMA. Mô hình hộp xám dự đoán (Gray prediction) là một trong những mô hình thuộc lớp này. Các thuật toán này có thể làm việc với một số bộ dữ liệu và thực hiện đơn giản, nhưng độ chính xác dự báo của họ là thường thấp so với thuật toán học máy mới với việc tính toán phức tạp hơn, nhưng có thể cung cấp độ chính xác cao hơn. Lớp thứ hai của các thuật toán là mô hình hộp đen (black-box), trong đó đa số là phương pháp trí tuệ nhân tạo. Những phương pháp này là tốt cho các dữ liệu với các ràng buộc không rõ ràng (ví dụ: tuyến tính hoặc phi tuyến). Và lớp thứ ba là phương pháp kết hợp (hybrid) các thuật toán thông minh nhân tạo và tối ưu hóa các thuật toán với nhau, nhằm mang lại hiệu quả cao và độ chính xác lớn trong nhiều nghiên cứu. 91 Dự báo phụ tải ngắn hạn thường là dự báo phụ tải cho ngày tới, tuần tới với chu kỳ 60/30 phút, nó được chia thành các loại ngày trong tuần, chẳng hạn như: ngày bình thường (thứ ba đến thứ 6); ngày thứ 2; ngày thứ 7; ngày chủ nhật, các ngày lễ, Tết (Dương lịch và Nguyên Đán); các kỳ nghỉ trong năm. Mỗi loại ngày có một đặc điểm hình thái riêng của nó, do đó mô hình dự báo được thiết lập phải làm sao phản ánh được các đặc tính này. Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có xu hướng tương đồng mô hình tải trước đó, tuy nhiên, nó sẽ dẫn đến dự đoán sai giữa các ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó tác động. Ngoài ra, sự biến đổi theo mùa, xu thế khí tượng học (như El Nino, La Nina) cũng được xem xét cẩn thận. Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm), nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải điện và nhiệt độ ước tính được sử dụng cho đầu vào thay vì số thực. Tuy nhiên, không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có thể làm giảm độ chính xác của kết quả dự báo. Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn đề cần được quan tâm và khó dự đoán nhất đó chính là các ngày lễ, Tết Nguyên Đán (thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch). Thường kết quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày dương lịch và ngày âm lịch. Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để làm dữ liệu đầu vào huấn luyện. Như trình bày trên, do đặc thù là nước sử dụng cả 92 lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02, cụ thể: - Tháng 01: Biểu đồ phụ tải tháng 01 qua các năm hoàn toàn không giống nhau, nên rất khó khăn trong việc sử dụng bộ dữ liệu tương tự để dự báo Hình 4.1 – Biểu đồ phụ tải tháng 01 qua các năm - Tháng 02: Biểu đồ phụ tải tháng 02 (thường có ngày Tết Nguyên Đán) qua các năm hoàn toàn không giống nhau, nên rất khó khăn trong việc sử dụng bộ dữ liệu tương tự để dự báo cho tháng tiếp theo, cũng như cho tháng 02 của năm tiếp theo. 93 Hình 4.2 – Biểu đồ phụ tải tháng 02 qua các năm Quan sát biểu đồ phụ tải của tháng 01 và tháng 02, chúng ta thấy có sự biến động rất lớn về hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu quá khứ để dự báo cho khoảng thời gian này là hết sức phức tạp. Trên thực tế, các thuật toán khi áp dụng để thực hiện dự báo cho thị trường điện Việt Nam đều phải qua một khâu trung gian đó là qui đổi các tháng này thành các tháng thông thường và sau khi chạy kết quả dự báo sẽ qui đổi ngược lại hoặc là chấp nhận sai số lớn, các phần mềm thương mại do nước ngoài cung cấp đều gặp rắc rối này. Ngoài ra, một nguyên nhân nữa làm ảnh hưởng rất lớn đến việc áp dụng các luận án nghiên cứu vào thực tiễn đó chính là việc thiếu dữ liệu đầu vào cho các hàm dự báo, chẳng hạn như: các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để làm dữ liệu đầu vào khi dự báo. Tuy nhiên, nếu như yêu cầu độ dài chuỗi giá trị cần dự báo nhiều hơn 01 tuần (> 07 ngày hoặc đến 30 ngày và lên tới 356 ngày như yêu cầu của vận hành của thị trường điện) thì chắc chắn dữ liệu quá khứ để làm đầu vào sẽ bị thiếu và bắt buộc phải sử dụng giá trị vừa được dự báo làm dữ liệu quá khứ. Điều đó sẽ dẫn đến việc chuyền tiếp các sai số dự báo từ quá khứ sang cho đến tương lai và thường sẽ xuất hiện hiện tượng “Quan hệ cận huyết” trong bộ dữ liệu đầu vào của hàm dự báo, làm cho sai số dự báo sẽ rất lớn, đôi khi sẽ không thể dự báo được nếu biên độ dự báo yêu cầu quá lớn. Thêm nữa, trên thực tế kết quả dự báo thời tiết chỉ có hiệu quả trong vòng 07 ngày, nếu yêu cầu biên độ lớn hơn thì không khả thi do kết quả dự báo của các ngày 94 sau không chính xác, nó sẽ kéo theo sai số chồng lấp cho toàn bộ kết quả dự báo phụ tải điện. Theo nghiên cứu tại Chương III, Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) đã thể hiện được hết tất cả các đặc tính tải theo từng thời điểm, mùa vụ và các ngày lễ, Tết (Dương lịch, Nguyên Đán),… của 365 ngày trong năm. Chúng ta cũng thấy được mức độ tương đồng của SLP về mặt hình dáng, độ lớn từng chu kỳ của các ngày của các năm trong quá khứ và cũng sẽ là SLP trong tương lai. Quá trình kết hợp biến đổi lịch Dương và lịch Âm trong quá trình xây dựng SLP, chúng ta đã có được bộ số liệu chuẩn hóa đơn vị chi tiết theo từng chu kỳ/ ngày/ tuần/ tháng/ năm. Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta có thể xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và cần chuẩn xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc, ngày nghỉ,…), từng tuần, từng tháng. Do đó, Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) chính là một điểm đặc biệt và cũng là bộ thông số đầu vào quan trọng của quá trình huấn luyện của các thuật toán học máy SVR, NN, RFR trong quá trình nghiên cứu giải thuật dự báo. Câu hỏi đặt ra là SLP có thể giải quyết được các vướng mắc đã đề cập nêu trên như thế nào: (1) Ảnh hưởng của Lịch Âm, Dương Lịch và các ngày lễ trong năm: Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) đã thể hiện được hết tất cả các đặc tính tải theo từng thời điểm, mùa vụ và các ngày lễ trong năm. Do đó, khi đưa các SLP làm bộ huấn luyện cho các giải thuật học máy thì các SLP trong quá khứ sẽ phục dựng đường cong hồi qui phụ tải và các SLP trong tương lai sẽ định hướng đặc tính tải trong chu kỳ dự báo. (2) Ảnh hưởng của các đặc tính tải theo ngày: Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) được xây dựng dựa trên tất cả các đặc tính tải chi tiết theo từng thời điểm, theo từng ngày trong năm nên các SLP 95 trong quá khứ hay trong chu kỳ dự báo đều đóng góp vào việc xây dựng đường cong hồi qui và dự báo phụ tải. Như vậy, việc biến đổi theo từng chu kỳ, từng ngày của SLP sẽ giải quyết được đặc tính biến đổi của tải theo thời gian. (3) Ảnh hưởng của giới hạn số lượng bộ dữ liệu đầu vào, tránh tình trạng “Quan hệ cận huyết” trong dữ liệu: Để giải quyết vấn đề dữ liệu quá khứ được sử dụng làm đầu vào không đủ về mặt số lượng và bắt buộc phải sử dụng các giá trị vừa được dự báo làm bộ số cho dữ liệu quá khứ trong quá trình dự báo phụ tải, SLP với các tính năng đề cập như trong chương III, thì bộ dữ liệu đầu vào sẽ được xây dựng bằng các SLP của quá khứ và bổ sung thêm các SLP trong tương lai để đảm bảo đủ số lượng dữ liệu cho các giải thuật dự báo và số lượng dữ liệu có thể lên đến hàng trăm ngày (24 chu kỳ/ngày). Như vậy, tình trạng “Quan hệ cận huyết” sẽ không xảy ra và các SLP cũng sẽ góp phần định hướng đường cong hồi qui cho các giá trị dự báo sắp tới. (4) Ảnh hưởng của dữ liệu thời tiết: Các modules xây dựng hàm hồi qui thì số lượng đầu vào gồm: 24 chu kỳ của Biểu đồ phụ tải chuẩn hóa đơn vị (SLP); 01 bộ đầu vào nhiệt độ (thời tiết); 01 bộ đầu vào các ngày lễ, Tết,…; 01 bộ đầu vào công suất. Như vậy, bộ đầu vào thời tiết chỉ chiếm 01 phần nhỏ trong tất cả các đầu vào Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây dựng hàm hồi qui theo giải thuật SVR (Support Vector Regression), NN (Neural Network), RF (Ramdom Forest) để xây dựng các hàm hồi qui. Sau đó sử dụng bộ dữ liệu nêu trên để kiểm tra, đánh giá sai số của các hàm hồi qui, từ đó lựa chọn ra được hàm hồi qui có sai số thấp nhất để làm hàm dự báo và cũng là điểm mới của luận án. 96 • Giải thuật: Hình 4.3 – Lưu đồ giải thuật dự báo ngắn hạn 97 Trong các nghiên cứu trước đây, các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,…và nhiệt độ, độ ẩm trong quá khứ để làm dữ liệu đầu vào huấn luyện; và các biến nhiệt độ thường được các phần mềm thương mại sử dụng. Tuy nhiên, với sự tác động của biến đổi khí hậu toàn cầu thì các số liệu dự báo thời tiết gần đây hầu như không chuẩn xác và khoảng thời gian dự báo tin cậy cũng rất ngắn chỉ từ 05 đến 07 ngày, khó đáp ứng yêu cầu ngày càng cao của các qui định thị trường điện bán buôn cạnh tranh (các Tổng công ty Điện lực phải công bố bảng chào Qc tháng N+1 24 chu kỳ trước ngày 20 của tháng N,…). Từ đó, luận án đề xuất sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) để giải quyết các vấn đề vướng mắc nêu trên. Trên cơ sở bộ dữ liệu phụ tải thu thập theo 24 (hoặc 48) chu kỳ trong quá khứ của ít nhất 03 – 04 năm, chúng ta sẽ kiểm tra, xử lý sơ bộ các dữ liệu sai khác bằng công cụ đã trình bày ở Chương II và phân tích các đặc tính tải ở Chương III. Dữ liệu sau xử lý sẽ được phân tách theo định dạng ngày thường, ngày nghỉ, ngày lễ,… (có xét đến việc ảnh hưởng của sự chênh lệch ngày âm và ngày dương). Tiếp theo, dữ liệu được chuyển sang module xây dựng bộ Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) để làm đầu vào cho khâu huấn luyện của NN, SVR, RFR. Các dữ liệu quá khứ (Điện thương phẩm, công suất, nhiệt độ ghi nhận theo 24 chu kỳ - 60/30 phút) đã được xử lý và Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây dựng hàm hồi qui theo giải thuật SARIMA, Neural Network, Support Vector Regression, Ramdom Forest để xây dựng các hàm hồi qui. Sau đó sử dụng bộ dữ liệu nêu trên để kiểm tra, đánh giá sai số của các hàm hồi qui, từ đó lựa chọn ra được hàm hồi qui có sai số thấp nhât để làm hàm hồi qui cho khâu dự báo tiếp theo. Trên cơ sở bộ dữ liệu SLP 24 chu kỳ của giai đoạn dự kiến (đã bao gồm các ngày lễ, ngày nghỉ,…), cùng với kết quả dự báo nhiệt độ 24 chu kỳ của giai đoạn tương ứng sẽ là đầu vào cho hàm hồi qui được chọn để xuất kết quả dự báo theo định dạng 24 chu kỳ cho khoảng thời gian từ 7 – 30 ngày. 98 4.3.1. Dữ liệu đầu vào Bộ dữ liệu mới nhất của các phụ tải tại Tổng công ty Điện lực TP.HCM (từ tháng 01/2015 cho đến tháng 12/2019 – Phụ lục đính kèm), được sử dụng trong việc xây dựng thuật toán dự báo phụ tải ngắn hạn gồm: - Ngày/ tuần/ tháng/ năm. - Danh sách các ngày lễ trong năm. - Công suất (Pmax, Pmin). - Điện năng tiêu thụ (A). - Công suất theo chu kỳ 30 phút. - Nhiệt độ (0C) theo chu kỳ 30 phút. Phân tích dữ liệu theo định dạng ngày thường (thứ 2, thứ 3, thứ 4, thứ 5 và thứ 6); ngày thứ 7; ngày Chủ nhật và ngày lễ nhằm phù hợp với các đồ thị phụ tải đặc trưng được xây dựng. 4.3.2. Xây dựng đồ thị chuẩn hóa đơn vị Trên cơ sở dữ liệu đã có nêu trên, xây dựng các dạng đồ thị phụ tải chuẩn hóa. Theo đó, lấy Công suất theo chu kỳ 30 phút của 24h (48 chu kỳ) chia cho Pmax của ngày đó để có giá trị % đơn vị công suất, từ đó xây dựng đồ thị chuẩn hóa đơn vị 24h (48 chu kỳ). Dữ liệu sau khi được thu thập sẽ được chuẩn hóa sang hệ đơn vị tương đối bằng cách: chia công suất thu thập theo chu kỳ 30 phút cho công suất max của ngày đó; Các đồ thị chuẩn hóa gồm: • Biểu đồ phụ tải 24h ✓ Biểu đồ ngày có sản lượng cao nhất. ✓ Biểu đồ ngày có công suất cao nhất. 99 ✓ Biểu đồ ngày làm việc bình thường. ✓ Biểu đồ ngày nghỉ cuối tuần. ✓ Biểu đồ ngày nghỉ lễ, Tết. • Một số biểu đồ phụ tải chuẩn hóa đơn vị: Hình 4.4 – Một số Biểu đồ phụ tải chuẩn hóa đơn vị Quan sát biểu đồ phụ tải điển hình của 07 ngày trong một tuần của khu vực thành phố Hồ Chí Minh ta thấy sự biến đổi giữa các ngày thường (từ thứ 2 đến thứ 6) không có nhiều biến động và có cùng một kiểu biểu đồ phụ tải. Đối với đồ thị phụ tải ngày thứ 7 thì có sự biến đổi nhưng không nhiều so với ngày thường, chủ yếu nhu cầu phụ tải suy giảm vào buổi chiều tối. Đối với đồ thị phụ tải ngày Chủ nhật thì hoàn toàn khác với các ngày thường (nhu cầu sử dụng điện xuống thấp). 100 Riêng đối với đồ thị phụ tải ngày Tết âm lịch thì đồ thị khá bằng phẳng, mức độ chênh lệch cao thấp điểm không nhiều như các ngày bình thường khác trong năm. Bảng 4.1 – Lịch qui đổi ngày dương lịch và âm lịch năm 2019 1-1-19
2-1-19
1-2-19
2-2-19
3-2-19
4-2-19
5-2-19
6-2-19
7-2-19
8-2-19
9-2-19
10-2-19
11-2-19
12-2-19
14-4-19
30-4-19
1-5-19
2-9-19 1
1
2
2
2
2
2
2
2
2
2
2
2
2
4
4
5
9 1
2
1
2
3
4
5
6
7
8
9
10
11
12
14
30
1
2 4.3.3. Xây dựng các mô hình hồi quy cho STLF Dữ liệu đầu vào được tách thành 2 phần: một phần dùng để huấn luyện cho các giải thuật học máy và một phần để kiểm tra các kết quả dự báo của các giải thuật dự báo được xây dựng. a) Xây dựng hàm hồi qui bằng SARIMA Để xây dựng hàm hồi qui bằng phương pháp SARIMA, trước tiên chúng ta xác định tính dừng của bộ dữ liệu, tính mùa vụ và chu kỳ dữ liệu để tính toán các biến trễ bậc p của phần autoregressive và q của phần moving average. Theo đó, khi phân tích các Đồ thị tự tương quan – AC) và Đồ thị tự tương quan riêng phần – PACF (đối với dữ liệu đã tính sai phân bậc 1 – do dữ liệu phân tích ở chương 1 là các dữ liệu không dừng) ta có được: - Tính chu kỳ lặp đi lặp lại 7 bậc liên tục. 101 - Từ đồ thị biểu diễn ACF ta xác định được biến trễ q tại các bậc 2 và 7 là thông số cho mô hình MA(q). - Từ đồ thị biểu diễn PACF ta xác định được biến trễ p tại các bậc 7 và 9 là thông số cho mô hình AR(p). (Các thông số này được tính toán tự động bằng chương trình) Hình 4.5 – Phân tích AFC và PAFC Theo đó, ta xây dựng được các mô hình SARIMA như: - SARIMA([7 9], 1, [2 7])7: là mô hình với tính mùa vụ là 7, tại các độ trễ p = [7 9] và q = [2 7], với sai phân bậc 1 của chuỗi dữ liệu. - SARIMA(7, 1, 2)7: là mô hình với tính mùa vụ là 7, tại các độ trễ p = 7 và q = 2, với sai phân bậc 1 của chuỗi dữ liệu. - Và có thể xây dựng được rất nhiều mô hình khác như: + SARIMA(7, 1, 7)7 + SARIMA(9, 1, 2)7 + SARIMA(7, 1, 7)7 + SARIMA(9, 1, 7)7 + SARIMA(7, 1, 0)7 102 + SARIMA(9, 1, 0)7 … b) Xây dựng hàm hồi qui bằng SVR Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày 01/01/2015 đến ngày 31/12/2019): - Biến độc lập (biến dự báo) là dữ liệu công suất ngày thứ i (y1). - Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: nhiệt độ trung bình của ngày thứ i; 24/48 biến công suất chu kỳ 60/30 phút của ngày thứ i. Bảng 4.2 – một số mô hình SVR C - BoxConstraint KernelFunction ε - Epsilon 93.421
6.9088
1
100 polynomial
gaussian
linear
linear 32.502
0.01
50.28
0.01 c) Xây dựng hàm hồi qui bằng Neural Network Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày 1/1/2015 đến ngày 31/12/2019): - Biến độc lập (biến dự báo) là dữ liệu công suất ngày thứ i (y1). - Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: nhiệt độ trung bình của ngày thứ i; 24/48 biến công suất chu kỳ 60/30 phút của ngày thứ i (xtemp1 – chuỗi giá trị huấn luyện và xtemp2 – chuỗi giá trị biến phụ thuộc phục vụ dự báo). Hình 4.6 – Mô hình mạng NN 103 Sử dụng mô hình mạng Neural truyền thẳng (Feedforward neural network) với các biến đầu vào như trên và bộ dữ liệu huấn luyên sẵn có. Trong đó, tín hiệu đầu ra y(t) được đưa lại vòng lặp nhiều lần để tối ưu mô hình huấn luyện. d) Xây dựng hàm hồi qui bằng Ramdom Forest Chức năng TreeBagger được sử dụng để xây dựng mô hình, là một tập hợp các cây hồi quy với mỗi bộ quy tắc khác nhau để thực hiện hồi quy phi tuyến tính. Chúng tôi xây dựng tổng cộng 20 cây như vậy, với kích thước lá tối thiểu là 20. Kích thước của lá nhỏ hơn kích thước cây nhằm kiểm soát hiện tượng overfitting và mang lại hiệu suất cao. Hình 4.7 – Mô hình Ramdom Forest 4.3.4. Đánh giá các mô hình Để có thể đánh giá một mối quan hệ mô tả những giá trị quan sát có tốt hơn một mối quan hệ khác hay không, cần phải có một giá trị đo lường toán học độ thích hợp. Sai số phần trăm tuyệt đối trung bình (MAPE) được sử dụng để đánh giá các mô hình: 4.3.5. Kết quả dự báo STLF a) Các mô hình SVR (Suport Vector Regression) 104 Bảng 4.3 – Các thông số mô hình SVM Regression C - BoxConstraint KernelScale ε - Epsilon 93.42
500.32
1
100 1.82
1.83
1.89
1.72 32.5
0.01
50.03
0.01 • Kết quả chạy test các mô hình SVR: Hình 4.8 – Kết quả chạy test các mô hình SVR Bảng 4.4 – Kết quả kiểm tra của các mô hình SVR 07-12-19 3,463.90 3,014.66 2,958.02 3,343.13 3,355.00 08-12-19 2,471.36 2,379.76 2,395.66 2,356.70 2,759.00 09-12-19 3,636.76 3,272.26 3,165.11 3,390.92 3,662.00 10-12-19 3,864.48 3,627.33 3,255.44 3,659.95 3,720.00 11-12-19 3,661.32 3,620.76 3,246.36 3,478.78 3,719.00 12-12-19 3,698.35 3,607.63 3,274.22 3,509.21 3,721.00 13-12-19 3,853.97 3,614.00 3,393.69 3,627.94 3,850.00 105 Bảng 4.5 – Sai số của các mô hình SVR (%) 07-12-19 3.25 10.14 11.83 0.35 08-12-19 10.43 13.75 13.17 14.58 09-12-19 0.69 10.64 13.57 7.40 10-12-19 3.88 2.49 12.49 1.61 11-12-19 1.55 2.64 12.71 6.46 12-12-19 0.61 3.05 12.01 5.69 13-12-19 0.10 6.13 11.85 5.77 2.93 6.98 12.52 5.98 b) Các mô hình học máy (Neural Network, Ramdom Forest) • Kết quả chạy test các mô hình học máy: Hình 4.9 – Kết quả chạy test các mô hình học máy Bảng 4.6 – Kết quả kiểm tra của các mô hình học máy 07-12-19 3,455.92 3,346.89 2,977.06 3,355.00 08-12-19 2,568.00 2,488.68 2,328.49 2,759.00 106 09-12-19 3,663.84 3,641.23 3,405.14 3,662.00 10-12-19 3,731.99 3,734.23 3,521.39 3,720.00 11-12-19 3,673.16 3,722.47 3,494.33 3,719.00 12-12-19 3,735.83 3,744.98 3,494.33 3,721.00 13-12-19 3,867.50 3,814.27 3,660.89 3,850.00 Bảng 4.7 – Sai số của các mô hình học máy (%) 07-12-19 3.01 0.24 11.26 08-12-19 6.92 9.80 15.60 09-12-19 0.05 0.57 7.01 10-12-19 0.32 0.38 5.34 11-12-19 1.23 0.09 6.04 12-12-19 0.40 0.64 6.09 13-12-19 0.45 0.93 4.91 1.77 1.81 8.04 Trong đó: - Ytr: kết quả test bằng mô hình SARIMA(14,1,7)7. - Yts1: kết quả test bằng mô hình SVR1. - Yts2: kết quả test bằng mô hình SVR2. - Yts3: kết quả test bằng mô hình SVR3. - Yts3: kết quả test bằng mô hình SVR4. - YtNN: kết quả test bằng mô hình Neural Network (10 layer in; 10 Hidden layer; 05 layer out). - Ytfeed: kết quả test bằng mô hình Feedforward Networks. - YtRF: kết quả test bằng mô hình Random Forest (20, 20). 107 • Kết quả chạy test các mô hình hồi qui: Hình 4.10 – Kết quả chạy test các mô hình hồi qui Bảng 4.8 – Sai số các mô hình (%) 07-12-19 6.10 3.25 10.14 11.83 0.35 3.01 0.24 11.26 6.10 08-12-19 7.18 10.43 13.75 13.17 14.58 6.92 9.80 15.60 7.18 09-12-19 5.57 0.69 10.64 13.57 7.40 0.05 0.57 7.01 5.57 10-12-19 5.13 3.88 2.49 12.49 1.61 0.32 0.38 5.34 5.13 11-12-19 5.10 1.55 2.64 12.71 6.46 1.23 0.09 6.04 5.10 12-12-19 4.68 0.61 3.05 12.01 5.69 0.40 0.64 6.09 4.68 13-12-19 4.49 0.10 6.13 11.85 5.77 0.45 0.93 4.91 4.49 5.46 1.77 6.98 12.52 5.98 2.93 1.81 8.04 5.46 Qua đánh giá sai số phần trăm tuyệt đối trung bình (MAPE) kết quả chạy các mô hình, ta thấy mô hình Yts1 có giá trị sai số thấp nhất trong các mô hình được xét nêu trên (sai số 1,77%). Do đó, mô hình Yts1 sẽ được chọn làm mô hình dự báo cho 07 ngày kế tiếp, với đầu vào là kết quả dự báo nhiệt độ cực đại (Tmax) của các 108 cơ quan khí tượng thủy văn và 24 đầu vào của công suất 24h trong ngày từ đồ thị phụ tải điển hình (tương ứng thời điểm đang xét). Hình 4.11 – Mô hình được chọn để dùng làm hàm dự báo Hình 4.12 – Kết quả chạy dự báo cho 07 ngày tiếp theo 109 Hình 4.13 – Kết quả dự báo chu kỳ 60 phút/24h/7ngày Từ biểu đồ phụ tải dự báo nêu trên ta thấy, đồ thị ngày 15/12/2019 sẽ là đồ thị của ngày Chủ nhật (màu đỏ); đồ thị ngày thứ 2 – ngày 16/12/2019 (màu vàng); tương tự các ngày còn lại đều tương đồng với các đồ thị chuẩn hóa đơn vị đã được xây dựng ở phần trên. 110 4.3.6. Kiểm chứng bằng bộ dữ liệu ngày Tết Nguyên Đán (EVNHCMC) Chạy thêm chương trình với bộ dữ liệu đầu vào khác (từ ngày 1/1/2015 đến ngày 28/02/2018) để chúng ta kiểm chứng giải thuật dự báo cho 30 ngày của tháng 02 (tháng có Tết âm lịch), với chu kỳ là 60’/24h/ngày. • Kết quả chạy test các mô hình SVR: Hình 4.14 – Kết quả chạy test các mô hình SVR Bảng 4.9 – Kết quả kiểm tra của các mô hình SVR 23-01-19 3,739.45 3,738.50 3,414.78 3,611.61 3,737.92 24-01-19 3,589.46 3,552.43 3,325.68 3,410.23 3,668.61 25-01-19 3,605.57 3,622.95 3,294.82 3,507.31 3,603.75 26-01-19 3,416.50 3,471.17 3,119.51 3,368.62 3,404.72 27-01-19 2,600.15 2,596.72 2,589.39 2,596.70 2,718.54 28-01-19 3,567.07 3,854.81 3,215.30 3,455.74 3,590.06 29-01-19 3,491.93 3,639.00 3,166.54 3,368.90 3,466.71 111 Bảng 4.10 – Sai số của các mô hình SVR (%) 23-01-19 0.04 0.02 8.64 3.38 24-01-19 2.16 3.17 9.35 7.04 25-01-19 0.05 0.53 8.57 2.68 26-01-19 0.35 1.95 8.38 1.06 27-01-19 4.35 4.48 4.75 4.48 28-01-19 0.64 7.37 10.44 3.74 29-01-19 0.73 4.97 8.66 2.82 • Kết quả chạy test các mô hình học máy: Hình 4.15 – Kết quả chạy test các mô hình học máy Bảng 4.11 – Kết quả kiểm tra của các mô hình học máy 23-01-19 3,716.65 3,671.66 3,633.09 3,737.92 24-01-19 3,562.02 3,488.92 3,600.07 3,668.61 25-01-19 3,588.26 3,547.24 3,597.67 3,603.75 26-01-19 3,301.47 3,245.65 3,383.32 3,404.72 112 27-01-19 2,695.60 2,627.07 2,508.15 2,718.54 28-01-19 3,686.51 3,627.17 3,562.48 3,590.06 29-01-19 3,519.98 3,362.29 3,466.72 3,466.71 Bảng 4.12 – Sai số của các mô hình học máy (%) 23/1/18 0.57 1.77 2.80 24/1/18 2.91 4.90 1.87 25/1/18 0.43 1.57 0.17 26/1/18 3.03 4.67 0.63 27/1/18 0.84 3.36 7.74 28/1/18 2.69 1.03 0.77 29/1/18 1.54 3.01 0.00 1.71 2.90 2.00 • Kết quả chạy test các mô hình hồi qui: Hình 4.16 – Kết quả chạy test các mô hình hồi qui 113 Bảng 4.13 – Sai số các mô hình hồi qui (%) 23/1/18 4.50 0.04 0.02 8.64 3.38 0.57 1.77 2.80 4.50 24/1/18 2.25 2.16 3.17 9.35 7.04 2.91 4.90 1.87 2.25 25/1/18 2.72 0.05 0.53 8.57 2.68 0.43 1.57 0.17 2.72 26/1/18 18.88 0.35 1.95 8.38 1.06 3.03 4.67 0.63 18.88 27/1/18 51.92 4.35 4.48 4.75 4.48 0.84 3.36 7.74 51.92 28/1/18 16.77 0.64 7.37 10.44 3.74 2.69 1.03 0.77 16.77 29/1/18 24.39 0.73 4.97 8.66 2.82 1.54 3.01 0.00 24.39 17.35 1.19 3.21 8.40 3.60 1.71 2.90 2.00 17.35 Hình 4.17 – Mô hình được chọn để dùng làm hàm dự báo 114 Hình 4.18 – Kết quả chạy dự báo cho 30 ngày tiếp theo Qua quan sát kết quả dự báo cho tháng 02/2018 (Chi tiết theo phụ lục đính kèm), chúng ta thấy kết quả dự báo khá bám sát giá trị thực tế của tháng 02/2018 (tháng có Tết âm lịch), tháng mà có sự sai biệt không tuân theo qui luật và mỗi năm sẽ có sư khác nhau giữa lịch dương và lịch âm. Như vậy, việc sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nằm trong giới hạn cho phép. 4.3.7. Kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc Tập đoàn Điện lực Việt Nam (Chi tiết theo Phụ lục đính kèm) 115 Qua quan sát kết quả dự báo tại các bộ dữ liệu thử nghiệm, chúng ta thấy kết quả dự báo bám khá sát giá trị thực tế, nhất là kết quả dự báo của tháng 02/2018 (tháng có Tết âm lịch), tháng mà có sự sai biệt không tuân theo qui luật và mỗi năm sẽ có sự khác nhau giữa lịch dương và lịch âm. Như vậy, việc sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, nhất là trong các tháng 01 và 02 (tháng có Tết âm lịch). Qua kết quả chạy các bộ dữ liệu, cũng như chạy các mô hình dự báo khác nhau, chúng ta thấy tương ứng với từng bộ dữ liệu (theo các thời điểm khác nhau) thì sai số phần trăm tuyệt đối trung bình (MAPE) bé nhất của cả 02 kết quả dự báo đều rơi vào mô hình SVR (Support Vector Regression) – đã kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc Tập đoàn Điện lực Việt Nam (theo Phụ lục đính kèm). Như vậy, một lần nữa khẳng định tính vượt trội của mô hình SVR trong công tác dự báo ngắn hạn (STLF). Tuy nhiên, trong một vài trường hợp mô hình Random Forest cũng có giá trị sai số phần trăm tuyệt đối trung bình (MAPE) thấp hơn cả mô hình SVR, do đó cần có một nghiên cứu chi tiết hơn về việc ứng dụng mô hình này vào bài toán dự báo. Ngoài ra, luận án cũng đã thử nghiệm được nhiều mô hình dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo (học máy) – mô hình Support Vector Regression (SVR); mạng Neural Network, Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Qua đó, luận án đã đánh giá kết quả xây dựng đường cong hồi qui của từng mô hình, với những bộ trọng số khác nhau, để từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự báo STLF. 116 Hiện nay luận án đang chạy các mô hình trên bộ cơ sở dữ liệu là nhiệt độ, công suất, sản lượng của toàn hệ thống điện thành phố Hồ Chí Minh, mà chưa tiến hành chạy mô hình đến từng nút, từng thanh cái hoặc từng máy biến áp và thậm chí đến từng vị trí tải. Do hạn chế về mặt thu thập dữ liệu trong quá trình vận hành (thu thập dữ liệu đo đếm chu kỳ 60 phút/ 30 phút như yêu cầu) đối với các vị trí nêu trên nên hướng phát triển sắp tới là sử dụng mô hình các bộ huấn luyện đã trình bày trên để chạy dự báo STLF cho một số nút là các TBA 220kV hoặc TBA 110kV trên địa bàn thành phố (có bộ dữ liệu được thu thập theo đúng yêu cầu). 117 CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN CẠNH TRANH CỦA VIỆT NAM Thị trường điện phát điện cạnh tranh (VCGM) chính thức vận hành từ 1/7/2012 là thị trường toàn phần, điều độ tập trung chào giá ngày tới theo chi phí (day ahead mandatory cost-based pool), sử dụng cơ chế thanh toán sau vận hành (ex-post), sử dụng thị trường năng lượng ngày tới có kèm theo hợp đồng khống chế CfD (CfD vesting) kết hợp cơ chế trả phí công suất CAN (Capacity Add oN). Việc thanh toán chia làm hai phần, chi phí năng lượng sẽ được trả bằng chi phí biên của hệ thống (SMP) được xác lập bằng chi phí biên ngắn hạn (SRMC) của tổ máy đắt nhất trong lịch phát cho tất cả các tổ máy trong giờ đó kèm theo khoản thanh toán bổ sung để bù chi phí công suất là CAN. Tất cả các nhà máy điện (NMĐ) có công suất đặt từ 30MW trở lên đều phải tham gia TTĐ. Vào trước ngày giao dịch (ngày D-1), các NMĐ tham gia TTĐ phải gửi cho Đơn vị vận hành hệ thống và thị trường điện (MSO- A0) bản chào giá điện năng cho từng tổ máy cho 24 chu kỳ giao dịch giờ của ngày giao dịch (ngày tới, còn gọi là ngày D). Giá điện năng (SMP) trả cho các NMĐ trực tiếp tham gia TTĐ thông qua thị trường giao ngay, được tính toán hàng giờ trên cơ sở giá chào của các đơn vị phát điện trên VCGM từ ngày D-1, dự báo phụ tải và sản lượng các NMĐ gián tiếp công bố từng giờ. Giá SMP là giá biên hệ thống, là giá chào của tổ máy biên được xác định bằng phương pháp lập lịch không ràng buộc với phụ tải thực tế đo đếm (ex- post pricing). Tính đến cuối tháng 12/2019, tổng số nhà máy điện (NMĐ) đang vận hành trong hệ thống là 217 NMĐ (không kể các nhà máy thủy điện nhỏ) với tổng công suất đặt là 51.137 MW (chưa bao gồm nguồn nhập khẩu), với tổng số nhà máy điện tham gia trực tiếp chào giá trên thị trường điện lên đến 98 nhà máy. 118 Chi tiết cơ cấu các nguồn tham gia trực tiếp và gián tiếp VCGM nêu tại các hình dưới đây. Hình 5.1 – Công suất các nguồn tham gia trực tiếp và gián tiếp VCGM Cơ cấu công suất đặt theo loại hình tham gia VCGM như sau: - 98 NMĐ trực tiếp tham gia VCGM với tổng công suất đặt là 25.852 MW chiếm 46% tổng công suất đặt toàn hệ thống. - 111 NMĐ gián tiếp tham gia với tổng công suất 15.666 MW chiếm 28% tổng công suất đặt toàn hệ thống (các NMĐ chạy dầu, NMĐ Cà Mau 1&2 theo yêu cầu khai thác tối đa khí PM3, các NMĐ thuộc khu công nghiệp, các nhà máy BOT đã ký hợp đồng nguyên tắc, các NMĐ năng lượng tái tạo); - 14 NMTĐ chiến lược đa mục tiêu (SMHP) và các NMĐ phối hợp vận hành với SMHP với tổng công suất 8.701 MW chiếm 16% tổng công suất đặt toàn hệ thống. 119 Trong năm 2019, sản lượng nhiệt điện than chiếm tỉ trọng lớn nhất với hơn 118.2 tỉ kWh. Sản lượng thủy điện, tuabin khí và các loại hình khác đóng góp phần còn lại nhu cầu hệ thống, cụ thể: Hình 5.2 – Cơ cấu sản lượng điện năng theo hình thức tham gia thị trường Sau 8 năm vận hành, mặc dù tổng công suất đặt nguồn điện tham gia VCGM có tăng hàng năm nhưng với tỷ lệ không đáng kể, chi tiết: Hình 5.3 – Tăng trưởng công suất đặc các tham gia VCGM Thời điểm bắt đầu chính thức vận hành VCGM (1/7/2012), mới chỉ có 31 NMĐ trực tiếp tham gia chào giá với tổng công suất 9.212 MW chiếm 38% tổng 120 công suất đặt hệ thống. Sau 8 năm vận hành, số lượng nhà máy thủy điện, nhiệt điện tăng cao dẫn đến sự thay đổi lớn diễn biến giá điện năng thị trường so với các năm trước, cụ thể năm 2019: Tổng công suất nguồn thủy điện đưa vào vận hành năm 2019 là 110.6 MW và Tổng sản lượng thủy điện khai thác đạt 68.1 tỷ kWh; Tổng sản lượng nguồn nhiệt điện than khai thác đạt 119.14 tỷ kWh. Hình 5.4 – Sản lượng Thủy điện qua các năm Hình 5.5 – Sản lượng Nhiệt điện qua các năm 121 Hình 5.6 – Tăng trưởng các nhà máy tham gia thị trường điện Giá VCGM nhìn chung phản ánh cân bằng cung cầu, tăng trưởng của phụ tải, có diễn biến phụ thuộc mùa thủy văn và tình hình hệ thống điện. Giá biên của hệ thống (SMP) và giá toàn phần (FMP) thể hiện Hình 5.7 – Giá SMP và FMP bình quân qua các năm 122 Hình 5.8 – Giá trần thị trường qua các năm 5.1.1. Thị trường phát điện cạnh tranh (giai đoạn 2012 - 2018) Hình thành và phát triển thị trường điện cạnh tranh là chiến lược phát triển dài hạn của ngành điện Việt Nam đã được quy định trong Luật Điện lực và được cụ thể hóa trong Quyết định số 63/2013/QĐ-TTg ngày 08 tháng 11 năm 2013 của Thủ tướng Chính phủ quy định về lộ trình, các điều kiện và cơ cấu ngành điện để hình thành và phát triển các cấp độ thị trường điện lực tại Việt Nam (thay thế Quyết định số 26/2006/QĐ-TTg). Đối tượng tham gia Thị trường phát điện cạnh tranh bao gồm: Bên bán điện là các đơn vị phát điện đủ điều kiện tham gia thị trường; bên mua điện là đơn vị mua buôn duy nhất (Công ty Mua bán điện đại diện EVN mua toàn bộ điện năng từ các đơn vị phát điện và bán buôn cho các TCTĐL); và các đơn vị cung cấp dịch vụ (Trung tâm Điều độ hệ thống điện quốc gia có chức năng điều độ hệ thống điện và điều hành giao dịch thị trường điện, Tổng công ty Truyền tải điện quốc gia có chức năng vận hành lưới truyền tải điện). Thị trường phát điện cạnh tranh áp dụng mô hình thị trường điện tập trung toàn phần. Toàn bộ điện năng phát của các nhà máy điện được chào bán cho Đơn vị mua buôn duy nhất trên thị trường giao ngay. 123 Hình 5.9 – Cấu trúc thị trường Phát điện cạnh tranh Việt Nam Thị trường điện giao ngay có chu kỳ giao dịch là 01 (một) giờ. Chu kỳ thanh toán trong thị trường là 01 (một) tháng. Đơn vị vận hành hệ thống điện và thị trường điện chịu trách nhiệm tính toán và công bố các khoản thanh toán trong thị trường điện giao ngay. Căn cứ số liệu thanh toán do Đơn vị vận hành hệ thống điện và thị trường điện công bố và hợp đồng mua bán điện đã ký với EVN/EPTC, đơn vị phát điện tính toán và phát hành hoá đơn cho chu kỳ thanh toán. 5.1.2. Thị trường bán buôn điện cạnh tranh (từ 01/01/2019) Mô hình thiết kế tổng thể và thiết kế chi tiết thị trường bán buôn điện cạnh tranh hoàn chỉnh đã được Bộ Công Thương tiếp thu, chọn lọc các cơ chế, mô hình thị trường điện tiên tiến trên thế giới (Úc, Ireland, Singapore…) kết hợp với các điều chỉnh phù hợp với điều kiện đặc thù của ngành điện Việt Nam. Theo đó, từ năm 2018 thị trường điện Việt Nam đã chuyển từ Thị trường phát điện cạnh tranh sang Thị trường bán buôn điện cạnh tranh (VWEM) và từ năm 2019 vận hành Thị trường bán buôn điện cạnh tranh hoàn chỉnh. Tham chiếu theo bối cảnh ngành điện thực tế, kinh nghiệm vận hành trong giai đoạn Thị trường bán 124 buôn điện cạnh tranh thí điểm, cũng như các điều kiện khác để xây dựng Thị trường bán buôn điện cạnh tranh hoàn chỉnh, Bộ Công Thương đã ban hành phương án vận hành Thị trường bán buôn điện cạnh tranh năm 2019 (Quyết định số 3038/QĐ-BCT ngày 24 tháng 8 năm 2018). Bên cạnh đó Bộ Công Thương cũng đã ban hành quy định vận hành thị trường bán buôn điện cạnh tranh năm 2019 (Thông tư số 45/2018/TT-BCT ngày 15 tháng 11 năm 2018) tạo cơ sở pháp lý để các đơn vị triển khai thực hiện. Thị trường bán buôn điện cạnh tranh là một thị trường mới, phức tạp với sự tham gia của nhiều người bán và nhiều người mua nên yêu cầu hệ thống hạ tầng công nghệ thông tin đủ mạnh tại Trung tâm Điều độ hệ thống điện Quốc gia và tại các đơn vị phát điện, các công ty điện lực. Các cơ chế hợp đồng trong Thị trường bán buôn điện cạnh tranh bao gồm: Hợp đồng song phương (ký dưới dạng hợp đồng CfD), hợp đồng vesting (phân bổ hợp đồng từ các hợp đồng hiện hữu ký với EVN cho các TCTĐL), sàn giao dịch hợp đồng (quản lý rủi ro cho bên bán và bên mua trước biến động giá của thị trường). Theo Thiết kế chi tiết được phê duyệt tại Quyết định 8266/QĐ-BCT ngày 10 tháng 8 năm 2015 của Bộ Công Thương, mô hình Thị trường bán buôn điện cạnh tranh được minh họa trong hình vẽ sau: Hình 5.10 – Mô hình Thị trường bán buôn điện cạnh tranh 125 Trong năm 2019, Các Tổng công ty Điện lực mua một phần sản lượng điện năng đầu nguồn trên thị trường điện (theo giá thị trường giao ngay và hợp đồng). Phần sản lượng điện còn lại được mua từ Tập đoàn Điện lực Việt Nam theo cơ chế giá bán buôn điện nội bộ (BST). Các Tổng công ty được phân bổ hợp đồng của nhà máy điện Phú Mỹ 1 và Phú Mỹ 4; và trực tiếp ký kết hợp đồng với 04 nhà máy điện mới (Thái Bình 1, Vĩnh Tân 4, Duyên Hải 3 mở rộng, Vĩnh Tân 4 mở rộng). Thị trường điện giao ngay vận hành theo mô hình chào giá theo chi phí biến đổi, có chu kỳ giao dịch là 01 giờ (khi điều kiện về hạ tầng công nghệ thông tin đáp ứng sẽ áp dụng chu kỳ giao dịch là 30 phút) và chu kỳ thanh toán là 01 tháng. Giá thị trường được xác định căn cứ trên bản chào giá hàng ngày của các nhà máy điện và nhu cầu phụ tải thực tế trong từng chu kỳ giao dịch, trên nguyên tắc tối thiểu hóa chi phí mua điện toàn hệ thống. Mô hình vận hành thị trường bán buôn điện cạnh tranh năm 2019 (tuân thủ theo Quyết định 8266/QĐ-BCT ngày 10/8/2015 của Bộ Công Thương.) như hình bên dưới: Hình 5.11 – Mô hình Thị trường bán buôn điện cạnh tranh năm 2019 126 Giá thị trường các Tổng công ty Điện lực thanh toán trung bình năm khoảng 1230.1/kWh, trong đó trung bình tháng cao nhất là 1348.3 đ/kWh, trung bình tháng thấp nhất là 1017.3 đ/kWh, cụ thể: Hình 5.12 – Vận hành VWEM năm 2019 Theo qui định tại Quyết định số 4804/QĐ-BCT ngày 26 tháng 12 năm 2017 của Bộ trưởng Bộ Công Thương về việc Phê duyệt phương án vận hành Thị trường bán buôn điện cạnh tranh thí điểm năm 2018 và qui định tại Quyết định số 07/QĐ-ĐTĐL ngày 14 tháng 03 năm 2013 của Cục trưởng Cục Điều tiết điện lực về việc phê duyệt Quy trình dự báo nhu cầu phụ tải điện Hệ thống điện quốc gia, có rất nhiều số liệu dự báo phụ tải cho nhiều mục đích được thực hiện bởi nhiều tổ chức khác nhau: - Tổng sơ đồ phát triển điện lực (giám sát bởi MOIT/ERAV): + 5 đến 20 năm. + Năng lượng và phụ tải cực đại (phân chia ra từng điểm ranh giới). - Kế hoạch phát triển lưới điện truyền tải và phân phối: + Cập nhật hàng năm. 127 + Từ 2 đến 5 năm. + Năng lượng và phụ tải cực đại (phân chia ra từng điểm ranh giới). - Dự báo trước 1 năm (SMO theo quy định của VWEM): + Cập nhật chu kỳ 3 tháng. + 0 đến 2 năm. + Biểu đồ phụ tải hàng tuần theo 30 phút. + Bộ số liệu phụ tải 30 phút cho mô phỏng. + Mô phỏng cho các nút và các khu vực. - Dự báo trước 1 tháng (SMO theo quy định của VWEM): + Cập nhật hàng tuần. + Cập nhật dự báo đối với những tháng tiếp theo. + Bộ số liệu phụ tải 30 phút cho mô phỏng MAP từ 0-1 tháng. + Dự báo nút cho mô phỏng. - Dự báo trước 1 tuần (SMO theo quy định của VWEM): + Cập nhật hàng ngày. + Dự báo chu kỳ 30 phút cho 0 - 7 ngày tới. + Dự báo các nút. - Dự báo trước 1 ngày (SMO theo quy định của VWEM): + Cập nhật hàng tuần. + Dự báo chu kỳ 30 phút cho 0-24 giờ tới. + Dự báo các nút. 128 Hình 5.13 – Các biên độ và mục đích dự báo trong vận hành hệ thống điện 129 Hình 5.14 – Điều độ Thị trường điện theo thời gian 5.2.1. Dự báo phục vụ Kế hoạch phát triển lưới điện truyền tải và phân phối Đây là một công tác hết sức quan trọng, nhằm định hướng cho sự phát triển lưới điện, cũng như đề xuất khối lượng đầu tư cho lưới điện trong thời gian từ 3 – 5 năm tới, nó góp phần quan trọng trong việc xây dựng các Kế hoạch Sản xuất kinh doanh, Đầu tư xây dựng của các Tổng công ty điện lực. Với số liệu đầu vào là sản lượng điện thương phẩm, công suất cực đại, thời tiết (nhiệt độ, độ ẩm), dân số qua các năm của cả khu vực, của từng ngành – từng thành phần kinh tế trong đóng góp GRDP của tỉnh, khối lượng khách hàng qua các năm,… các chính sách phát triển kinh tế của tỉnh, các chính sách phát triển nguồn năng lượng tái tạo, khuyến khích tiết kiệm điện,… Trên cơ sở số liệu quá khứ nêu trên, chúng ta sẽ đánh giá mức độ tương quan của các thành phần và từ đó xây dựng hàm tương quan, hồi qui để dự báo cho 3 – 5 năm sắp tới dựa trên các giả định chính sách đã được phê chuẩn. • Dữ liệu đầu vào (khu vực TP.HCM): 130 Bảng 5.1 – Bảng thống kê điện thương phẩm theo 5 thành phần 2014 7,557.37 2,378.57 7,452.13 61.81 1,158.48 18,608 19,405 2015 8,094.02 2,622.86 8,132.45 67.13 1,265.39 20,182 21,192 2016 8,701.96 2,943.47 8,803.81 73.78 1,365.06 21,888 22,791 2017 9,030.14 3,172.26 9,135.88 80.31 1,474.20 22,893 23,886 Bảng 5.2 – Bảng thống kê điện khách hàng theo 5 thành phần 2014 58,172 77,926 1,857,176 7,505 39,597 2,040,376 2015 60,045 71,048 1,935,441 8,713 42,130 2,117,377 2016 61,465 71,342 2,028,682 10,634 41,793 2,213,916 2017 65,203 74,008 2,136,676 11,393 43,832 2,331,112 Bảng 5.3 – Bảng thống kê GRDP theo thành phần kinh tế 2014 852,523 7,557.37 61.81 9,830.70 8,072 2015 957,358 8,081.40 67.09 10,710.98 8,248 2016 1,023,926 8,426 8,701.96 73.78 11,747.28 2017 1,060,618 8,611 • Đánh giá mức độ tương quan của các biến: Qua phân tích đồ thị tương quan giữa thành phần Sản lương điện nhận với các thành phần GRDP (kinh tế), Khách hàng (phụ tải tiêu thụ điện) và Dân số thì chúng ta thấy các thành phần này quan hệ rất chặt chẻ với nhau (giá trị R2 có giá trị rất cao > 96%). Điều đó chứng tỏ rằng: thành phần kinh tế (GRDP) và thành phần phụ tải sử dụng điện tác động rất lớn đến Sản lượng điện tiêu thụ, sự tăng giảm của các thành phần này sẽ quyết định đến tốc độ tăng trưởng của ngành điện. Trên thực tế, Sản lượng điện tiêu thụ còn phụ thuộc vào nhiều yêu tố khác như: thời tiết; cơ chế chính sách đối với giá điện; công nghệ sản xuất; các cơ chế chính sách tiết kiệm điện; sự phát triển của các nguồn năng lượng mặt trời (Solar Rootop);… Tuy nhiên, 131 để xây dựng được các đường cong hồi qui thì chúng ta cần có số liệu thống kê đầy đủ của các yếu tố này. Hình 5.15 – Đồ thị tương quan của các thành phần 132 • Xây dựng mô hình dự báo dài hạn: Trên cơ sở bộ số liệu thống kê nêu trên, chạy phân tích ANOVA để xác định các hệ số trong hàm hồi qui. Sau đó dùng các giả định về tình hình phát triển kinh tế - xã hội, tăng trưởng dân số, cũng như định hướng phát triển ngành trong các năm tới để dự báo Sản lượng điện tiêu thụ, cũng như Công suất cực đại của hệ thống để chuẩn bị các kịch bản cho chiến lược Sản xuất kinh doanh, các Kế hoạch đầu tư,… Hình 5.16 – Kết quả phân tích ANOVA Bảng 5.4 – Các giả thuyết đầu vào dựa trên các chính sách dài hạn 4.0% Bảng 5.5 – Kết quả dự báo dài hạn (đến năm 2025) 1,156,074 2,447,668 8,955 25,295.33 4,246.46 9,314
1,260,120 2,570,051
9,686
1,373,531 2,698,554
1,497,149 2,833,481 10,074 26,570.89
27,949.16
29,438.07 4,460.60
4,691.98
4,941.93 1,631,892 2,975,155 10,477
1,778,763 3,123,913 10,896
1,938,851 3,280,109 11,331
2,113,348 3,444,114 11,785 31,046.16
32,782.67
34,657.53
36,681.48 5,211.89
5,503.40
5,818.15
6,157.92 133 Hình 5.17 – Định hướng tốc độ tăng trưởng điện năng 5.2.2. Dự báo phục vụ công tác vận hành thị trường điện cạnh tranh Khoản 3 – Điều 28 của Thông tư số 45/2018/TT-BCT của Bộ Công Thương ngày 15 tháng 11 năm 2018 có qui định “Trước ngày 10 tháng 11 hàng năm, đơn Do đó, bằng các kỹ thuật đã nghiên cứu ở các Chương trên, chúng ta sẽ áp dụng vào để chạy kết quả dự báo theo yêu cầu của Cục Điều tiết điện lực (ERAV) – Bộ Công Thương là: Dự báo chu kỳ 60 phút cho 365 ngày và sẽ cập nhật hiệu chỉnh hàng tháng trên trang web của Thị trường điện Việt Nam. 134 • Lưu đồ giải thuật: Hình 5.18 – Lưu đồ giải thuật dự báo 365 ngày – 24 chu kỳ • Xây dựng Biểu đồ chuẩn hóa đơn vị (SLP) cho năm 2019: 135 Bảng 5.6 – Dữ liệu thống kê theo tháng 1 34 27.68 21 1,700.61 3,510.20 2017 2 35 27.49 21 1,607.96 3,487.70 3 37 28.45 22 2,028.50 3,644.00 4 37 29.54 21 2,052.00 3,867.88 5 35 28.87 25 2,117.58 3,808.50 6 36 28.64 24 2,053.37 3,844.80 7 34 27.91 24 2,040.59 3,783.20 8 35 28.08 23 2,097.69 3,734.50 9 35 28.49 22 2,055.06 3,853.20 10 34 27.58 23 2,054.23 3,771.10 11 34 27.60 22 2,022.96 3,615.29 12 34 26.90 20 2,055.08 3,611.43 1 34.33 27.44 20.00 2,042.03 3,709.64 2018 2 35.33 27.41 19.33 1,472.25 3,611.63 3 37.33 28.73 22.33 2,208.19 3,988.82 4 37.67 30.08 23.67 2,194.87 4,239.53 5 36.67 29.98 24.33 2,296.81 4,376.34 6 36.00 28.64 24.00 2,151.94 4,076.06 7 35.00 28.28 23.67 2,166.21 4,024.67 8 35.00 28.33 23.33 2,195.56 4,035.40 9 35.00 28.23 22.33 2,076.88 3,946.70 10 34.33 27.74 23.33 2,244.22 4,021.03 11 34.67 28.13 22.67 2,135.90 3,949.87 12 34.33 27.35 21.33 2,233.97 4,070.30 (Chi tiết thống kê từ năm 2015 – 2019 theo phụ lục đính kèm) Bảng 5.7 – Dữ liệu thống kê theo ngày từ 01/01/2014 – 31/12/2019 (Bao gồm các dữ liệu: Công suất, Sản lượng, Nhiệt độ chu kỳ 60’) Chi tiết theo phụ lục đính kèm 136 Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta có thể xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và cần chuẩn xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc, ngày nghỉ,…), từng tuần, từng tháng. SLP cần được phối hợp tính toán với việc chuyển đổi giữa ngày Dương lịch (Sun Calenda) và ngày Âm lịch (Luna Calenda). Bảng 5.8 – Lịch qui đổi ngày dương lịch và âm lịch các ngày lễ năm 2019 1/1/19 1 1 2019 26/11/2018 AL 11 1 2/1/19 2 1 2019 27/11/2018 AL 11 2 1/2/19 1 2 2019 27/12/2018 AL 12 3 2/2/19 2 2 2019 28/12/2018 AL 12 4 3/2/19 3 2 2019 29/12/2018 AL 12 5 4/2/19 4 2 2019 30/12/2018 AL 12 6 5/2/19 5 2 2019 01/01/2019 AL 01 7 6/2/19 6 2 2019 02/01/2019 AL 01 8 7/2/19 7 2 2019 03/01/2019 AL 01 9 8/2/19 8 2 2019 04/01/2019 AL 01 10 9/2/19 9 2 2019 05/01/2019 AL 01 11 10/2/19 10 2 2019 06/01/2019 AL 01 12 11/2/19 11 2 2019 07/01/2019 AL 01 13 12/2/19 12 2 2019 08/01/2019 AL 01 14 14/4/19 14 4 2019 10/03/2019 AL 03 15 30/4/19 30 4 2019 26/03/2019 AL 03 16 1/5/19 1 5 2019 27/03/2019 AL 03 17 2/9/19 2 9 2019 04/08/2019 AL 08 18 137 ❖ Biểu đồ chuẩn hóa đơn vị (SLP) cho một số ngày đặc trưng năm 2019 Hình 5.19 – SLP của ngày Tết Dương lịch 01/01/2019 Hình 5.20 – SLP của ngày mồng 1 - Tết Nguyên đán Kỷ Hợi 138 Hình 5.21 – SLP của ngày 30/04/2019 Hình 5.22 – SLP của ngày 02/09/2019 (Chi tiết SLP của các ngày trong năm 2019 theo phụ lục đính kèm) 139 Bảng 5.9 – Kết quả dự báo 12 tháng năm 2019 2,033,951 1 3650 1,513,645 2 3727 2,204,906 3 3836 2,093,040 4 4056 2,237,731 5 4118 2,169,530 6 3971 2,168,096 7 3942 2,212,236 8 4069 2,080,567 9 4083 2,184,142 10 4033 2,135,895 11 4099 2,152,105 12 3953 Bảng 5.10 – Kết quả dự báo 365 ngày của năm 2019 (Chi tiết 8760 chu kỳ của năm 2019 theo phụ lục đính kèm) Hình 5.23 – Kết quả dự báo 365 ngày – 24 chu kỳ của năm 2019 140 5.2.3. Kết quả áp dụng Kỹ thuật dự báo vào vận hành Thị trường điện Bán buôn Việt Nam (phạm vi Tổng công ty Điện lực TP.HCM) Trong giai đoạn vận hành thử nghiệm Thị trường bán buôn cạnh tranh (năm 2018) và đi vào vận hành chính thức năm 2019, Kỹ thuật dự báo nêu trên đã được áp dụng vào công tác dự báo 8760 chu kỳ/năm của Tổng công ty Điện lực TP.HCM nhằm thay thế cho phương pháp dự báo thủ công trước đây (theo nhận định của chuyên gia và không có phân ra được 24 chu kỳ/ngày). Theo đó, kết quả sai số dự báo thực hiện phù hợp với qui định tại Quyết định số 07/QĐ-ĐTĐL ngày 14 tháng 03 năm 2013 của Cục trưởng Cục Điều tiết điện lực về việc phê duyệt Quy trình dự báo nhu cầu phụ tải điện Hệ thống điện quốc gia, sai số lũy kế cho phép là ± 3%, cụ thể: ❖ Bảng 5.11 – Kết quả sai số dự báo năm 2018 5.12 1 3650 3709.9 2,033,951 2,043,090 -9,138 2.48 -0.45 -0.45 2 3727 3614.1 1,513,645 1,472,247 41,398 9.67 0.08 2.81 0.92 3 3836 3990.5 2,204,906 2,208,187 -3,281 4.26 1.27 -0.15 0.51 4 4056 4154.4 2,093,040 2,183,190 -90,150 5.26 4.54 -4.13 -0.77 5 4118 4269 2,237,731 2,296,296 -58,566 4.88 3.72 -2.55 -1.17 6 3971 4081.3 2,169,530 2,151,946 17,584 6.08 3.50 0.82 -0.83 7 3942 4093.6 2,168,096 2,204,384 -36,288 5.00 2.49 -1.65 -0.95 8 4069 4039.5 2,212,236 2,195,559 16,677 6.23 3.97 0.76 -0.73 9 4083 3953 2,080,567 2,076,880 3,687 6.93 3.29 0.18 -0.63 10 4033 4034.6 2,184,142 2,244,411 -60,269 5.45 3.42 -2.69 -0.85 11 4099 4047.1 2,135,895 2,167,521 -31,626 6.51 4.26 -1.46 -0.90 12 3953 4070.3 2,152,105 2,233,973 -81,868 6.92 5.55 -3.66 -1.15 141 ❖ Bảng 5.12 – Kết quả sai số dự báo năm 2019 4299.7 3957.0 2,192,536 2,148,140 36,150 4.38 1.68 5.05 1.68 1 3599.4 3991.5 1,625,906 1,652,468 -32,958 3.90 3.36 -1.99 0.08 2 4187.1 4291.6 2,329,397 2,376,993 -57,190 3.30 2.96 -2.40 -0.87 3 4356.4 4651.1 2,347,738 2,407,442 -72,487 5.97 5.31 -3.00 -1.47 4 4432.9 4593.8 2,459,649 2,454,928 -5,999 6.38 4.90 -0.24 -1.19 5 4198.4 4497.6 2,217,722 2,318,390 -110,306 5.58 4.99 -4.74 -1.81 6 4127.2 4390.6 2,311,943 2,346,544 -26,101 4.75 4.10 -1.12 -1.71 7 4127.9 4314.3 2,340,680 2,304,150 37,079 4.52 3.75 1.61 -1.28 8 3989.5 4211.6 2,204,950 2,156,097 47,632 4.71 3.68 2.21 -0.91 9 4228.6 4232.8 2,361,861 2,379,153 -12,608 2.90 1.81 -0.53 -0.87 10 4036.2 4242.8 2,353,440 2,232,869 110,343 5.97 5.24 4.92 -0.35 11 4036.2 3951.5 2,327,546 2,212,118 115,422 6.92 6.30 1.77 -1.45 12 Ngoài ra, trong quá trình điều hành sản lượng điện hàng ngày, hàng tuần vào mùa khô (tháng 3, 4 và 5), công tác dự báo sản lượng, công suất phụ tải là một khâu vô cùng quan trọng. Tính đến thời điểm hiện nay, sai số dự báo khi áp dụng kỹ thuật này vẫn nằm trong giới hạn cho phép, góp phần không nhỏ trong quá trình ra quyết định điều hành của Tổng công ty. 5.2.4. Giá SMP của thị trường điện tác động đến kết quả dự báo a) Hợp đồng CFD Theo thiết kế thị trường phát điện cạnh tranh Việt Nam gồm hai thành phần chính là Hợp đồng mua bán điện dạng sai khác và thị trường điện giao ngay. Giữa hai thành phần này có sự liên hệ với nhau thể hiện qua kết quả tính toán các khoản thanh toán trên thị trường điện và giao ngay và khoản thanh toán theo hợp đồng dạng sai khác. 142 Đơn vị phát điện trực tiếp giao dịch và Đơn vị mua buôn có trách nhiệm ký hợp đồng mua bán điện dạng sai khác (CfD) theo mẫu do Bộ Công Thương ban hành (Thông tư số 45/2018/TT-BCT ngày 15/11/2018). Không phụ thuộc vào sản lượng điện được huy động thực tế do hành vi chào giá của Đơn vị phát điện, khoản thanh toán theo hợp đồng dạng sai khác giữa bên mua và bên bán tại từng chu kỳ giao dịch như sau: (5.1) Rcfdi = (Pc – SMPi – CANi) x Qci Trong đó: - Rcfdi: Khoản thanh toán sai khác trong chu kỳ giao dịch i (đồng). - Qci: Sản lượng điện năng thanh toán theo giá hợp đồng trong chu kỳ giao dịch i (kWh). - Pc: Giá hợp đồng mua bán điện dạng sai khác (đồng/kWh). Đối với các nhà máy thuỷ điện giá hợp đồng này chưa bao gồm thuế tài nguyên nước và phí môi trường rừng. - SMPi: Giá điện năng thị trường trong chu kỳ giao dịch i (đồng/kWh). - CANi: Giá công suất thị trường trong chu kỳ giao dịch i (đồng/kWh). Hợp đồng CfD là hợp đồng tài chính được ký giữa EVN, các Công ty bán buôn và đơn vị phát điện, nhằm mục đích: - Hạn chế rủi ro tài chính do biến động của giá thị trường điện. - Giảm khả năng lũng đoạn thị trường của các đơn vị phát điện lớn. - Tăng khả năng sẵn sàng và cạnh tranh. Vào các tháng mùa lũ giá thị trường xuống thấp thì khoảng chênh lệch giữa giá hợp đồng của từng nhà máy điện với giá thị trường toàn phần lớn nên khoản thanh toán theo hợp đồng dạng sai khác chiếm tỷ lệ cao (khoảng 25%). Ngược lại vào mùa khô thì giá thị trường tăng cao và khoảng chênh lệch giữ giá hợp đồng của 143 từng nhà máy điện với giá thị trường toàn phần nhỏ hơn so với mùa khô nên khoản thanh toán theo hợp đồng CfD chiếm tỷ lệ thấp (khoảng 10%). b) Tác động của CFD đến kết quả dự báo Qua các phân tích số liệu thống kê thị trường và phân tích xu hướng giá điện năng thị trường trong thời gian vừa qua có thể thấy rằng giá thị trường phản ánh tương đối sát với tình huống hệ thống điện, phù hợp mức dự phòng năng lượng của từng giai đoạn. Hình 5.24 – Sự biến động của giá SMP trên thị trường qua các năm Vào các tháng mùa lũ (tháng 7,8,9) giá thị trường có nhiều giờ đạt dưới 50% so với giá trần thị trường, ít giờ đạt giá trần thị trường. Vào các tháng mùa khô giá điện năng thị trường thường xuyên ở mức cao bằng hoặc xấp xỉ giá trần thị trường. Hình 5.25 – Sự biến động của giá SMP của các tháng năm 2018 144 Hình 5.26 – Sự biến động của giá SMP theo từng giờ, từng ngày Trong thời gian qua, giá thị trường điện biến động rất lớn, từ năm này sang năm khác, từ tháng này qua tháng khác, giữa các ngày trong tháng và giữa các giờ trong ngày. Giá thị trường cũng đã phản ánh đúng tương quan giữa nguồn và tải trong hệ thống điện Việt Nam. Việc giá thị trường biến động mạnh có thể gây rủi ro cho các đơn vị phát điện và cả bên mua điện là EVN/EPTC. Tuy nhiên với cơ chế hợp đồng CfD sẽ làm giảm rủi ro tài chính và các đơn vị phát điện yên tâm hơn khi tham gia thị trường điện. 145 Hình 5.27 – Cơ chế thanh toán CFD trên thị trường Khi giá thị trường vượt quá giá hợp đồng thì bên bán điện (Nhà máy phát điện) sẽ trả lại cho bên mua (Công ty bán buôn điện) một khoản tiền bằng khoảng chệnh lệch giữa giá Pc và Giá thị trường nhân với sản lượng điện hợp đồng của giờ tương ứng (Công thức 5.1). Với xu hướng và tương quan giữa giá thị trường toàn phần với giá hợp đồng của nhà máy thủy điện như đang diễn ra hiện nay thì mức độ cao rủi ro của Bên mua điện sẽ tăng nếu tỷ lệ sản lượng thanh toán theo giá hợp đồng (Qc giảm). Với giá than và khí như trong giai đoạn vận hành thị trường điện vừa qua thì các nhà máy nhiệt điện đều có giá hợp đồng cao hơn hoặc xấp xỉ giá trần thị trường. Đây cũng là vấn đề cần xem xét để đảm bảo tính cạnh tranh cho nhà máy nhiệt điện tham gia thị trường điện. Nhà máy nhiệt điện đang có tính cạnh tranh thấp trên thị trường điện giao ngay và đang được hạn chế rủi ro nhờ cơ chế hợp đồng CfD. Từ tương quan thể hiện ở trên cho thấy giá thị trường toàn phần thường thấp hơn giá mua điện bình quân của nhiệt điện. Điều này được lý giải là nhờ cơ chế hợp đồng CfD được áp dụng thì ngoài khoản doanh thu trên thị trường giao ngay theo giá thị trường toàn phần, các nhà máy nhiệt điện sẽ nhận thêm một khoản thanh toán bằng khoảng chệnh lệch giữa 146 giá Pc và Giá thị trường nhân với sản lượng điện hợp đồng của giờ tương ứng (Công thức 5.1). Cơ chế hợp đồng CfD trong trường hợp này đã bảo vệ rủi ro cho nhà máy nhiệt điện có tính cạnh tranh thấp trên thị trường. Mức độ rủi ro của nhà máy nhiệt điện càng tăng khi tỷ lệ mua điện qua hợp đồng giảm và giá trần thị trường còn thấp giá hợp đồng. Đối với vai trò là bên mua, các Tổng công ty Điện lực phân phối (PC) cần có những phân tích thật sự sâu về tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến dộng của thị trường để mang về lợi nhuận cao nhất. Hình 5.28 – Biến động giá SMP ngày 18/02/2018 (Tết Âm lịch) Hình 5.29 – Biến động giá SMP ngày 21/02/2018 147 Hình 5.30 – Biến động giá SMP ngày 02/05/2018 Quan sát sự biến động giá SMP trên thị trường hàng ngày, chúng ta thấy giá thị trường sẽ tăng mạnh vào các khoảng giờ cao điểm tương ứng với thời điểm nhu cầu sử dụng điện tăng cao (cao điểm sáng từ 9h – 11h và cao điểm chiều 13h – 16h). Do đó, để hạn chế rui ro khi ký các hợp đồng CFD thì chúng ta cần lưu ý: - Cần đàm phán giá hợp đồng Pc ở mức làm sao cho phần đường màu xanh lá cây trong Hình 5.27 dâng lên cao, làm tăng khả năng Nhà máy hoàn trả lại tiền cho PC. Điều đó đồng nghĩa là khi đàm phán các hợp đồng PPA thì cần phải ép giá Pc với nhà máy xuống thấp nhất có thể. Ngoài ra, theo qui định của thị trường giá Pc sẽ được đàm phán một giá cố định cho cả năm nên việc chênh lệch giá giữa mùa khô (tháng 3 – thán 5) và mùa mưa (tháng 7 – tháng 9) cũng sẽ làm tăng mức độ rủi ro trong kinh doanh của các PC. - Do khối lượng thanh toán CFD là phần chênh lệch của giá thị trường với giá Pc nhân cho sản lượng điện hợp đồng Qc. Do đó, công tác dự báo Qc trong quá trình ký hợp đồng là rất quan trọng, chẳng hạn như: i) trường hợp giá trị dự báo Qc lớn hơn nhu cầu sản lượng điện tiêu thụ, cùng với giá thị trường thấp hơn nhiều so với giá Pc thì các PC 148 sẽ phải trả cho Nhà máy một khoản tiền khá lớn → gây thiệt hại cho các PC. ii) trường hợp giá trị dự báo Qc nhỏ hơn nhu cầu sản lượng điện tiêu thụ, cùng với giá thị trường đang cao hơn so với giá Pc thì các PC sẽ được nhận từ Nhà máy một khoản tiền không lớn → làm giảm lợi nhuận thu được từ thị trường của các PC. iii) trường hợp giá trị dự báo Qc nhỏ hơn nhu cầu sản lượng điện tiêu thụ, cùng với giá thị trường thấp hơn nhiều so với giá Pc thì các PC sẽ phải trả cho Nhà máy một khoản tiền không lớn lắm → giảm bớt thiệt hại cho các PC. iv) trường hợp giá trị dự báo Qc lớn hơn nhu cầu sản lượng điện tiêu thụ, cùng với giá thị trường đang cao hơn so với giá Pc thì các PC sẽ được nhận từ Nhà máy một khoản tiền khá lớn → làm gia tăng lợi nhuận thu được từ thị trường của các PC. Như vậy, sau khi tiến hành chạy kết quả dự báo 24 chu kỳ cho 365 ngày, các PC cần phải xem xét điều chỉnh một số kết quả theo phương pháp chuyên gia để làm sao hạn chế tới mức thấp nhất các rủi ro, chẳng hạn như: - Trong các tháng đầu năm (mùa khô), lượng nước về các hồ thủy điện thấp nên hệ thống sẽ huy động nhiều các nhà máy nhiệt điện nên giá thị trường sẽ rất cao (các nhà máy nhiệt điện đều có giá hợp đồng cao hơn hoặc xấp xỉ giá trần thị trường). Do đó, chúng ta cần đẩy giá trị dự báo Qc tháng có xu hướng tăng cho hơn so với nhu cầu sử dụng điện thực, đồng thời hiệu chỉnh Biểu đồ phụ tải Qc ngày giảm tại các giờ thấp điểm và tăng cao tại các giờ cao điểm, nhằm gia tăng lợi nhuận thu được từ thị trường của các PC. - Trong các tháng cuối năm (mùa mưa), lượng nước về các hồ thủy điện rất nhiều (tùy thuộc vào tình hình thời tiết hằng năm) nên hệ thống sẽ 149 huy động nhiều các nhà máy thủy điện nên giá thị trường sẽ rất thấp (giá thị trường có nhiều giờ đạt dưới 50% so với giá trần thị trường). Do đó, chúng ta cần đẩy giá trị dự báo Qc tháng có xu hướng giảm cho hơn so với nhu cầu sử dụng điện thực, đồng thời hiệu chỉnh Biểu đồ phụ tải Qc ngày giảm tại các giờ thấp điểm và tăng cao tại các giờ cao điểm, nhằm giảm bớt thiệt hại từ thị trường của các PC. Với số liệu đầu vào là sản lượng điện thương phẩm, công suất cực đại, thời tiết (nhiệt độ, độ ẩm), dân số qua các năm của cả khu vực, của từng ngành – từng thành phần kinh tế trong đóng góp GRDP của tỉnh, khối lượng khách hàng qua các năm,… các chính sách phát triển kinh tế của tỉnh, các chính sách phát triển nguồn năng lượng tái tạo, khuyến khích tiết kiệm điện,… Trên cơ sở số liệu quá khứ nêu trên, chúng ta sẽ đánh giá mức độ tương quan của các thành phần và từ đó xây dựng hàm tương quan, hồi qui để dự báo cho 3 – 5 năm sắp tới dựa trên các giả định chính sách đã được phê chuẩn, nó góp phần quan trọng trong việc xây dựng các Kế hoạch Sản xuất kinh doanh, Đầu tư xây dựng của các Tổng công ty điện lực Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta đã xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và cần chuẩn xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc, ngày nghỉ,…), từng tuần, từng tháng, bằng các kỹ thuật đã nghiên cứu ở các Chương trên, chúng ta đã áp dụng vào để chạy kết quả dự báo theo yêu cầu của Cục Điều tiết điện lực (ERAV) – Bộ Công Thương là: Dự báo chu kỳ 24 chu kỳ (60 phút/chu kỳ) cho 365 ngày và sẽ cập nhật hiệu chỉnh hàng tháng trên trang web của Thị trường điện Việt Nam. Ngoài ra, chúng ta cũng đã có những phân tích thật sự sâu về tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến dộng của thị trường để mang về lợi nhuận cao nhất. 150 CHƯƠNG VI – KẾT LUẬN Luận án đã xác định hướng nghiên cứu rõ ràng, xây dựng cụ thể các mục tiêu nghiên cứu, nội dung và phương pháp nghiên cứu mới. Trên cơ sở các nội dung đã xác định, luận án đã giải quyết được các vấn đề nghiên cứu đã đặt ra: − Nghiên cứu các đặc tính, các thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ (thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc và thành phần theo mùa). − Nghiên cứu qui trình Nghiên cứu phụ tải điện, đề xuất xây dựng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP). − Đã đề xuất phương pháp xây dựng đường cong hồi qui bằng giải thuật huấn luyện SVR (Support Vector Regression) kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP), từ đó ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu, dự báo phụ tải điện. − Đã xây dựng giải thuật mới là Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) - Support Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực). − Nghiên cứu và thử nghiệm các kỹ thuật dự báo tiên tiến hiện nay như: mô hình SARIMA, Neural Network, Support Vector Regression, Ramdom Forest để xây dựng các giải thuật để dự báo phụ tải theo từng tháng/năm; dự báo ngày/tháng và dự báo phụ tải 24 (48) giờ/ngày, có xem xét tác động của yếu tố thời tiết và các yếu tố tác động khác. − Chạy các kết quả dự báo dài hạn (5-10 năm), dự báo theo tháng/ năm và kết quả dự báo ngắn hạn 24/48 chu kỳ của 365 ngày/ năm theo đúng qui định của thị trường cho Tổng công ty Điện lực TP.HCM. Theo đó, kết quả sai số dự báo thực hiện phù hợp với qui định tại Quyết định số 07/QĐ-ĐTĐL ngày 14 151 tháng 03 năm 2013 của Cục trưởng Cục Điều tiết điện lực về việc phê duyệt Quy trình dự báo nhu cầu phụ tải điện Hệ thống điện quốc gia, sai số lũy kế cho phép là ± 3%. Đánh giá sự ảnh hưởng giữa giá thị trường điện đến công tác dự báo nhu cầu phụ tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi nhuận của hoạt động Sản xuất – Kinh doanh các Tổng công ty Điện lực phân phối trong môi trường thị trường điện. Luận án đã có các đóng góp cho khoa học như sau: − Luận án đã nghiên cứu và xây dựng thành công công cụ tự động ước lượng các dữ liệu bị lỗi mà trước đây phải thực hiện thực một cách thủ công. Mô hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) đã góp một phần không nhỏ trong kỹ thuật ước lượng lại dữ liệu bị lỗi, bị mất trong quá trình đo đếm, thu thập dữ liệu. Kết quả được thể hiện ở Chương II, III. − Luận án đã xây dựng thành công giải thuật mới là sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có Tết âm lịch). Mô hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực) và đã giải quyết được các khó khăn, vướng mắc mà luận án đề ra ở Chương I. − Luận án cũng đã thử nghiệm được nhiều mô hình dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo (học máy) – mạng Neural Network, Feedforward Networks; Rừng ngẫu 152 nhiên (Random Forest); Qua đó, đã đánh giá kết quả các giải thuật xây dựng đường cong hồi qui của từng mô hình, với những bộ trọng số khác nhau, để từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự báo STLF. Kết quả được thể hiện ở Chương IV, V. Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất. Kết quả được thể hiện ở Chương V. Hiện nay luận án đang chạy các mô hình trên bộ cơ sở dữ liệu là nhiệt độ, công suất, sản lượng của toàn hệ thống điện thành phố Hồ Chí Minh, mà chưa tiến hành chạy mô hình đến từng nút, từng thanh cái hoặc từng máy biến áp và thậm chí đến từng vị trí tải. Do hạn chế về mặt thu thập dữ liệu trong quá trình vận hành (thu thập dữ liệu đo đếm chu kỳ 60 phút/ 30 phút như yêu cầu) đối với các vị trí nêu trên nên hướng phát triển sắp tới là sử dụng mô hình các bộ huấn luyện đã trình bày trên để chạy dự báo STLF cho một số nút là các TBA 220kV hoặc TBA 110kV trên địa bàn thành phố (có bộ dữ liệu được thu thập theo đúng yêu cầu). Ngoài ra, việc kiểm chứng trên bộ dữ liệu của 04 Tổng công ty Điện lực còn lại cũng đã cho thấy mức độ sai số của mô hình cũng khác nhau, có những bộ dữ liệu cho sai số kết quả thấp (< 2%) nhưng có những bộ dữ liệu cho sai số dữ liệu cao (~ 4%). Điều đó cho thấy chất lượng các bộ dữ liệu không đồng đều hoặc do số lượng dữ liệu chưa đầy đủ, chưa thể hiện được hết bản chất tải (đối với các Tổng công ty Điện lực Miền Trung, Tổng công ty Điện lực Miền Bắc có biến động thời tiết rất bất thường). Trong thời gian tới, luận án sẽ cập nhật thêm dữ liệu và hoàn thiện các bộ huấn luyện để cho kết quả chính xác hơn, tạo điều kiện phát triển mô hình cho tất cả các Tổng công ty Điện lực trong Tập đoàn điện lực Việt Nam. 153 TÀI LIỆU THAM KHẢO [1] Đề án “Thiết kế tổng thể thị trường phân phối điện cạnh tranh” của Cục Điều tiết Điện lực Việt Nam – Bộ Công Thương – năm 2014. [2] Barakat, E. H., Qayyum, M. A., Hamed, M. N., and Al-Rashed, S. A., “Short-term peak demand forecasting in fast developing utility with inherent dynamic load characteristics”, IEEE Transactions on Power Systems, 5, 1990, pp. 813-824. [3] El-Keib, A. A., MA, X., and MA, H., “Advancement of statistical based modeling for short-term load forecasting”, Electric Power Systems Research, 35, 1995, pp. 51-58. [4] Juberias, G., Yunta, R., Garcia Morino, J., And Mendivil, C., 1999, A new ARIMA model for hourly load forecasting. IEEE Transmission and Distribution Conference Proceedings, 1, 314±319. [5] Luis A. Dı´az-Robles, Juan C. Ortega, Joshua S. Fu, Gregory D. Reed, Judith C. Chow, John G. Watson, Juan A. Moncada-Herrera. A hybrid ARIMA and artificial neural networks model to forecast particulate matter in urban areas: The case of Temuco, Chile. Atmospheric Environment 42 (2008) 8331– 8340. [6] Jan Sterba, Katarina Hilovska. The implementation of hybrid ARIMA- Neural network prediction model for aggregate water consumption prediction, 2010. [7] Mehdi Khashei, Mehdi Bijari – Department of Industrial Engineering, Isfahan University of Technology, Isfahan, Iran. A novel hybridization of artificial neural networks and ARIMA models for time series forecasting. Applied Soft Computing 11 (2011) 2664–2675. [8] Xiping Wang – Department of Economy and Management, North China 154 Electric Power University, Baoding 071003, China. A Hybrid Neural Network and ARIMA Model for Energy Consumption Forecasting. Journal Of Computers, VOL. 7, NO. 5, May 2012. [9] Lintao Yang College and Honggeng Yang of Electrical Engineering and Information Technology, Sichuan University Chengdu, China. A Combined ARIMA-PPR Model for Short-Term Load Forecasting. 2019 IEEE PES Innovative Smart Grid Technologies Asia. 978-1-7281-3520-5/19/$31.00 ©2019 IEEE. [10] Quyết định số 07/QĐ-ĐTĐL ngày 14/03/2013, của Cục trưởng Cục Điều tiết Điện lực về ban hành Quy trình này với quy định nguyên tắc, trình tự, thủ tục và phương pháp dự báo nhu cầu phụ tải điện hệ thống điện quốc gia làm cơ sở để lập kế hoạch đầu tư phát triển hệ thống điện quốc gia, kế hoạch và phương thức vận hành hệ thống điện và vận hành thị trường điện. [11] K. Liu, S. Subbarayan, R. R.Shoults, M. T. Manry, C. Kwan, F. L. LEWIS and J. NACCARINO, “Comparison Of Very Short-Term Load Forecasting," IEEE Transactions on Power Systems, Vol.11,pp. 877-882, 1996. [12] Y. Y. Hsu, “Fuzzy Expert Systems: An Application to Short-Term Load Forecasting”, IEEE Proceedings,” D C, Vol. 139, pp. 471-477, 1992, [13] R. H. Liang and Y. Y. HSU, “Fuzzy linear programming: an application to hydroelectric generation scheduling," IEE Proceedings: Generation, Transmission and Distribution, Vol.141, pp.568-574, 1994. [14] P. K. Dash, A. C. Liew and S. Rahman, “Comparison of Fuzzy Neural Networks for the Generation of Daily Average and Peak Load Profiles," International Journal of System Science, Vol.26, pp.2091-2106, 1995. [15] H. Mori and H. Kobayashi, “Optimal Fuzzy Inference For Short- Term Load Forecasting," IEEE Transaction on Power System, Vol.11, pp.390-396, 1996. [16] P. K. Dash, A. C. Liew and S. Rahman, “Fuzzy Neural Network and Fuzzy 155 Expert System for Load Forecasting," IEE Proceedings: Generation, Transmission, and Distribution, Vol.143,1996, pp.106-114. [17] I. J. Ramirez-Rosado and J. A. Dominguez-Navarro, “Distribution Planning of Electric Energy Using Fuzzy Models," International Journal of Power and Energy Systems, Vol.16, 1996, pp.49-55. [18] M. Chow and H. TRAM, “Application of Fuzzy Logic Technology for Spatial Load Forecasting," IEEE Transactions on Power System, Vol.12, 1997, pp. 1360-1366. [19] M. Chow, J. Zhu and H. Tram, “Application of Fuzzy Multiobjective Decision Making in Spatial Load Forecasting," IEEE Transactions on Power Systems, Vol.13, 1998 pp. 1185-1190. [20] T. Senjyu, S. Higa and K. Uezato, “Future Load Curve Shaping Based on Similarity Using Fuzzy Logic Approach," IEE Proceedings: Generation, Transaction and Distribution, Vol. 145, 1998, pp. 375-380. [21] H. Mori, Y. Sone, D. Moridera and T. Kondo, “Fuzzy Inference Models For Short-Term Load Forecasting With Tabu Search," IEEE Systems, Man and Cybernetics Conference Proceedings, Vol.6, 1999, pp. 551-556. [22] H.-C. Wu and C. Lu, “Automatic Fuzzy Model Identification for Short-Term Load Forecast," Generation Transmission And Distribution, IEE Proceedings, Vol.146, 1999, pp.477-482,. [23] Shruthi Mathew, Siraparapu. Satyanarayana – Department of Electrical Engineering, ITM University, Raipur, India. An Overview of Short Term Load Forecasting in Electrical Power System using Fuzzy Controller. 2016 5th International Conference on Reliability, Infocom Technologies and Optimization (ICRITO) (Trends and Future Directions), Sep. 7-9, 2016, AIIT, Amity University Uttar Pradesh, Noida, India. 978-1-5090-1489- 7/16/$31.00 ©2016 IEEE. 156 [24] Hippert, H.S., Pedreira, C.E., Souza, R.C.,. Neural networks for short-term load forecasting: A review and evaluation. IEEE Transactions on Power Systems 16 (1), 2001,pp 44-55. [25] Bishop, C.M., 1995. Neural Networks for Pattern Recognition. Oxford University Press. [26] Becalli, M., Cellura, M., Lo Brano, V., Marvuglia, A.,. Forecasting daily urban electric load profiles using artificial neural networks. Energy Conversion and Management 45, 2004,pp 2879-2900. [27] Hippert, H.S., Bunn, D.W., Souza, R.C.,. Large neural networks for electricity load forecasting: Are they over fitted. International Journal of Forecasting 21, 2005,pp 425-434. [28] Senjyu, T., Mandal, P., Uezato, K., Funabashi, T.,. Next day load curve forecasting using recurrent neural network structure. IEE Proceedings of Generation, Transmission and Distribution 151 (3), 2004,pp 388-394. [29] Tran, C.N., Park, D.-C., Choi, W.-S.,. Short-term load forecasting using multiscale bilinear recurrent neural network with an adaptive learning algorithm. In: King, I. et al. (Eds.), Thirteenth International Conference on Neural Information Processing (ICONIP 2006), LNCS, vol. 4233. Springer, 2006, pp. 964-973. [30] Gonzalez-Romera, E., Jaramillo-Moran, M.A.,Carmona Fernandez, D.,. Monthly electric energy demand forecasting based on trend extraction. IEEE Transactions on Power Systems 21 (4), 2006,pp 1946-1953 [31] Ringwood, J.V., Bofelli, D., Murray, F.T.,. Forecasting electricity demand on short, medium, and long time scales using neural networks. Journal of Intelligent and Robotic Systems 31, 2001, pp 129-147. [32] Fidalgo, J., Matos, M.A.,. Forecasting portugal global load with artificial neural networks. In: Marques de Sa, J. et al. (Eds.), ICANN 2007, Part II, 157 vol. 4669. Springer, 2007, pp. 728-737. [33] N.-H. Liao, Z.-H. Hu, Y.-Y. Ma, and W.-Y Lu, “Review of the shortterm load forecasting methods of electric power system,” Dianli Xitong Baohuyu Kongzhi/Power System Protection and Control, vol. 39, no. 1, pp. 147-152, 2011. [34] A. Lahouar and J. Ben Hadj Slama, “Day-ahead load forecast using random forest and expert input selection,” Energy Conversion and Management, vol. 103, pp. 1040-1051, 2015. [35] Madan Mohan Malaviya University of Technology, Gorakhpur, India. Short- Term Demand Forecasting by Using ANN Algorithms. Astha Singh; Kishan Bhushan Sahay – Department of Electrical Engineering. 2018 International Electrical Engineering Congress (iEECON), Krabi, Thailand. [36] Changhai Li, Yunlong Teng, Lulu An, Qiuge Dan – School of Mechanical and Electrical Engineering University of Electronic Science and Technology of China. Interval Prediction Method Based on Neural Networks for Short- Term Load Forecasting. 2020 Asia Energy and Electrical Engineering Symposium. 978-1-7281-6782-4/20/$31.00 ©2020 IEEE. [37] K. Sastry and D. Goldberg, Genetic Algorithms. 1975 [38] DeJong KA. An analysis of the behaviour of a class of genetic adaptive systems. Doctoral Dissertation, University of Michigan 1975. [39] Heine S, Neumann I. Optimal load forecast models using an evolutionary algorithm. In: Proceedings of the 2nd European Congress on Intelligent Techniques and Soft Computing. Germany: Aachen; 1994. p. 1690-4. [40] D. Floreano and F. Mondada. Evolution of homing navigation in a real mobile robot. IEEE Trans. on Systems, Man, and Cybernetics - Part B: Cybernetics, 26(3):396–407, 1996. 11. [41] D. A. Goldberg. Genetic Algorithms in Search, Optimization, and Machine 158 Learning. Addison-Wesley Publishing Company, Inc., 1989. [42] Goldberg, D.E. 1989. Genetic Algorithms in Search, Optimization and Machine. Learning, Addison-Wesley, Reading, Massachusetts. [43] Reeves CR. Modern heuristic techniques for combinatorial problems. Oxford, United Kingdom: Blackwell Scientific; 1996. [44] M. Melanie, An Introduction to Genetic Algorithms. Massachusetts Institute of Technology, 1999 [45] M. G. R. Cheng, Genetic Algorithms & Engineering Optimization, Hamid R. P. JOHN WILEY & SOBS, INC, 2000. [46] Z. Honghui and L. Yongqiang, “Application of an Adaptive Network-Based Fuzzy Inference System Using Genetic Algorithm for Short Term Load Forecasting,” 2012 Int. Conf. Comput. Sci. Electron. Eng., pp. 314-317, 2012. [47] B. Islam, z. Baharudin, Q. Raza, and p. Nallagownden, “Hybrid and Integrated Intelligent System for Load Demand Prediction,” in B. Islam, z. Baharudin, Q. Raza el at., 2013, no. June, pp. 178-183 [48] F. Yu and X. Xu, “A short-term load forecasting model of natural gas based on optimized genetic algorithm and improved BP neural network,” Appl. Energy, vol. 134, pp. 102-113, 2014. [49] S. Yu, K. Wang, and Y. Wei, “A hybrid self-adaptive Particle Swarm Optimization - Genetic Algorithm - Radial Basis Function model for annual electricity demand prediction,” Energy Convers. Manag., vol. 91, pp. 176- 185, 2015. [50] Mamunu Mustapha, Sani Salisu, Abdullahi Abdu Ibrahim and Muhammad Dikko Almustapha – Department of Electrical Enginerring Kano University of Science and Technology Wudil Kano, Nigeria. Pattern-based Short-Term Load Forecasting using Optimized ANFIS with Cuckoo Search Algorithm. 159 2020 International Congress on Human-Computer Interaction, Optimization and Robotic Applications (HORA). 978-1-7281-9352-6/20/$31.00 ©2020 IEEE. [51] V.Vapnik, 1995, “The nature of statistical learning theory,” Springer, NY. [52] S.R. Gunn, 1998: Support Vector Machines for Classification and Regression, Technical Report, Image Speech and Intelligent Systems Research Group, University of Southampton. [53] V. Cherkassky, Y. Ma, 2002: Selection of Meta-parameters for Support Vector Regression, International Conference on Artificial Neural Networks, Madrid, Spain, Aug. pp. 687 – 693. [54] D. Basak, S. Pal, D.C. Patranabis, Oct. 2007: Support Vector Regression, Neural Information Processing – Letters and Reviews, Vol. 11, No. 10, pp. 203 – 224. [55] A.J. Smola, B. Schölkopf, Aug. 2004: A Tutorial on Support Vector Regression, Statistics and Computing, Vol. 14, No. 3, pp. 199 – 222. [56] C.-C. Chang and C.-J. Lin, "LIBSVM: A library for support vector machines," ACM Transactions on Intelligent Systems and Technology, vol. 2, pp. 27:1-27:27, 2011, software available at http://www.csie.ntu. edu.tw/~cjlin/libsvm. [57] Juan Huo,Tingting Shi and Jing Chang, Comparison of Random Forest and SVM for Electrical Short-term Load Forecast with Different Data Sources, 978-1-4673-9904-3/16/$31.00 ©2016 IEEE; [58] Understanding Support Vector Machine Regression and Support Vector Machine Regression, http://www.mathworks.com. [59] Karthika S Department, Vijaya Margaret and Dr. K. Balaraman of Electrical & Electronics Engineering Christ University Faculty of Engineering, Bangalore, India. Hybrid Short Term Load Forecasting using ARIMA-SVM. 160 International Conference on Innovations in Power and Advanced Computing Technologies [i-PACT2017]. 978-1-5090-5682-8 /17/$31.00 ©2017 IEEE. [60] Justin Jose, Vijaya Margaret and K Uma Rao – Department of Electrical & Electronics Engineering. Impact of demand response contracts on ShortTerm Load Forecasting in Smart Grid using SVR optimized by GA. Christ University Faculty of Engineering. Bangalore, India. International Conference on Innovations in Power and Advanced Computing Technologies [i-PACT2017]. 978-1-5090-5682-8 /17/$31.00 ©2017 IEEE. [61] Jianhua Ye Tianjin, Li Yang –Tianjin University of Technology and Education Tianjin, China. Short-Term Load Forecasting Using Ensemble Empirical Mode Decomposition and Harmony Search Optimized Support Vector Regression. 2019 14th IEEE Conference on Industrial Electronics and Applications (ICIEA). 978-1-5386-9490-9/19/$31.00 c 2019 IEEE. [62] Arghavan Zare-Noghabi; Morteza Shabanzadeh – Department of Power System Operation and Planning Niroo Research Institute (NRI) Tehran, Iran. Medium-Term Load Forecasting Using Support Vector Regression, Feature Selection, and Symbiotic Organism Search Optimization. 978-1-7281-1981- 6/19/$31.00 ©2019 IEEE. [63] Breiman, L., Random Forests, Mach. Learn., vol. 45(1), p.p. 5-32, 2001. [64] Breiman, L., Bagging predictors, Machine Learning, vol. 24 (2), p.p. 123140, 1996. [65] Yali Li and Shengjin Wang and Xiaoqing Ding, Person-independent head pose estimation based on random forest regression, Image Processing (ICIP), 2010 17th IEEE International Conference on, p.p. 1521 -1524, 2010. [66] X. Wu, J. He, P. Zhang, and J. Hu, "Power system short-term load forecasting based on improved random forest with grey relation projection," Dianli Xitong Zidonghualautomation of Electric Power Systems, vol. 39, no. 161 12, pp. 50-55, 2015. [67] Z. Y-w. M. B.-h. J. Huan, "Research of medium and long term precipitation forecasting model based on random forest," Water Resources and Power, vol. 33, no. 6, pp. 6-10, 2015. [68] Juan Huo,Tingting Shi and Jing Chang, Comparison of Random Forest and SVM for Electrical Short-term Load Forecast with Different Data Sources, 978-1-4673-9904-3/16/$31.00 ©2016 IEEE; [69] Xiaoyu WU, Jinghan HE, Tony YIP and Jian lu, Ning Lu, A Two-Stage Random Forest Method for Short-term Load Forecasting, 978-1-5090-4168- 8/16/$31.00 ©2016 IEEE [70] Xiaoyu WU, Jinghan HE, Tony YIP and Jian lu, Ning Lu, A Two-Stage Random Forest Method for Short-term Load Forecasting, 978-1-5090-4168- 8/16/$31.00 ©2016 IEEE. [71] Đề tài nghiên cứu cấp Bộ Công Thương của Viện Năng Lượng do Trần Kỳ Phúc làm chủ nhiệm năm 2008. Đề tài “Nghiên cứu ứng dụng mạng Nơron nhân tạo trong dự báo ngắn hạn phụ tải điện”. [72] Mạng Wavelet cho bài toán dự báo phụ tải ngắn hạn trong các ngày đặc biệt của TS. Nguyễn Hoàng Việt, Trần Anh Dũng và Nguyễn Quang Thi – Tạp chí phát triển KH&CN, tập 10 số 6 – 2007; [73] Ứng dụng mạng Neural song tuyến trong bài toán dự báo phụ tải điện của Trần Thị Hoàng Oanh, Trần Hoàng Lĩnh, Đồng Sĩ Thiên Châu và Nguyễn Kỳ Tài - Tạp chí phát triển KH&CN, tập 10 số 11 – 2007. [74] Ứng dụng mô hình ARIMA để dự báo VNINDEX, TS. Võ Thị Thúy Anh Khoa Tài Chính – Ngân hàng, Trường Đại học Kinh tế Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010. [75] Xây dựng mô hình mô phỏng tốc độ gió từng giờ từ tốc độ gió trung bình 162 hàng tháng. Nguyễn Thế Bảo – Trường Đại học Bách khoa HCM, Trần Hồng Hà – Trung tâm kiểm định kỹ thuật an toàn khu vực 2; Science & Technology Development, Vol 9, No.7- 2006. [76] Một số phương pháp khai phá dữ liệu chuỗi thời gian trong dự báo tài chính, chứng khoán (mô hình ARIMA) – Nguyễn Ngọc Thiệp – Trường Đại học Công Nghệ - Đại học Quốc Gia Hà Nội. [77] Mô hình dự báo phụ tải ngắn hạn dựa trên phương pháp xử lý dữ liệu nhóm của Lê Đình Dương – ISSN 1859-1531 - Tạp Chí Khoa Học và Công Nghệ Đại Học Đà Nẵng, VOL. 17, NO. 7, 2019. [78] Judi Scheffer, 2002. Dealing with Missing Data, Res. Lett.Inf. Math.Sci (2002). Quad A, Massey University, P.O. Box 102904N.S.M.C, Auckland, 1310. [79] Popova, V. 2006. Missing Values in Monotone Data Sets. In Proceedings of the Sixth international Conference on intelligent Systems Design and Applications (Isda'06) - Volume 01 (October 16 - 18, 2006). ISDA. IEEE Computer Society, Washington, DC, 627-632. [80] SAS Institute, 2005. Multiple Imputation for Missing Data: Concepts and New Approaches. [81] Yuan Yang C., 2011. Multiple imputation for Missing Data: Concepts and New Development (SAS Version 9.0). SAS Institute Inc., Rockville, MA) [82] Nakai M and Weiming Ke., 2011. Review of Methods for Handling Missing Data in Longitudinal Data Analysis. Int. Journal of Math. Analysis. Vol. 5, no.1, 1 -13. [83] Thông tư số 33/2011/TT-BCT ngày 06/09/2011 của Bộ Công Thương về Quy định nội dung, phương pháp, trình tự và thủ tục nghiên cứu phụ tải điện. 163 CÁC PHỤ LỤC 1. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM TỪ 01/01/2014 ĐẾN 31/12/2019 (số liệu công suất – Pmax, điện năng tiêu thụ – Atổng (24 chu kỳ/ngày) và nhiệt độ (t0) theo từng giờ) 2. CÁC SỐ LIỆU THỐNG KÊ CÁC CHỈ TIÊU KINH TẾ, PHỤ TẢI ĐIỆN THEO TỪNG THÀNH PHẦN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM TỪ NĂM 2014 ĐẾN NĂM 2019 ĐỒ THỊ PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM 3. BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ CỦA TỔNG CÔNG TY ĐIỆN LỰC 4. TP.HCM 5. DANH SÁCH CÁC NGÀY LỄ TẾT CỦA TP.HCM 6. KẾT QUẢ CHẠY DỰ BÁO CHO 30 NGÀY CỦA THÁNG 02/2018 – THÁNG 02/2019 (24 CHU KỲ) CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM 7. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC HÀ NỘI 8. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN BẮC 9. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN TRUNG 10. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN NAM 11. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN NAM 12. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN TRUNG 164 13. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN BẮC 14. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG CÔNG TY ĐIỆN LỰC HÀ NỘI 15. KẾT QUẢ DỰ BÁO 8760 CHU KỲ NĂM 2018, 2019 VÀ 2020 CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM 16. CODE CHƯƠNG TRÌNHCHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA
ĐƠN VỊ
3.1. CÁC YẾU TỐ TÁC ĐỘNG ĐẾN PHỤ TẢI ĐIỆN
3.2. ĐẶC TÍNH PHỤ TẢI
3.3. BIỂU ĐỒ PHỤ TẢI CHUẨN HÓA ĐƠN VỊ
-
3.4. TỔNG KẾT CHƯƠNG III
CHƯƠNG VI: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN
4.1. GIỚI THIỆU
4.2. MÔ HÌNH ĐỀ XUẤT
4.3. KẾT QUẢ NGHIÊN CỨU
Dương lịch Thứ
tháng Năm
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
2019
Âm lịch
26/11/2018 AL
27/11/2018 AL
27/12/2018 AL
28/12/2018 AL
29/12/2018 AL
30/12/2018 AL
01/01/2019 AL
02/01/2019 AL
03/01/2019 AL
04/01/2019 AL
05/01/2019 AL
06/01/2019 AL
07/01/2019 AL
08/01/2019 AL
10/03/2019 AL
26/03/2019 AL
27/03/2019 AL
04/08/2019 AL
Ngày lễ
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Date
YFs1
YFs2
YFs3
YFs3
Yreal
Date
Yts1 Yts2 Yts3 Yts4
MAPE
Date
YtNN
YtFeed
YtRF
Yreal
Date
YtNN
YtFeed
YtRF
Yreal
Date
YtNN YtFeed YtRF
MAPE
c)
Đánh giá kết quả test các mô hình hồi qui:
Date
Ytr Yts1 Yts2 Yts3 Yts4 YtNN Ytfeed YtRF Ytr
MAPE
Date
YFs1
YFs2
YFs3
YFs3
Yreal
Date
Yts1 Yts2 Yts3 Yts4
MAPE
1.19 3.21 8.40 3.60
Date
YtNN
YtFeed
YtRF
Yreal
Date
YtNN
YtFeed
YtRF
Yreal
Date YtNN YtFeed YtRF
MAPE
Date
Ytr Yts1 Yts2 Yts3 Yts4 YtNN Ytfeed YtRF Ytr
MAPE
4.4. TỔNG KẾT CHƯƠNG IV
5.1. TỔNG QUAN VỀ THỊ TRƯỜNG ĐIỆN VIỆT NAM HIỆN NAY
5.2. CÁC YÊU CẦU VỀ DỰ BÁO PHỤ TẢI TRONG VWEM
Điện thương phẩm hàng năm theo nhóm khách hàng (GWh)
SL điện
nhận
Năm Công nghiệp Thương mại
Nông nghiệp Khác
Tổng
Dân dụng sinh
hoạt
Số lượng khách hàng hàng năm (triệu người)
Năm Công nghiệp Thương mại Dân dụng sinh hoạt Nông nghiệp Khác
Tổng
EVNHCMC (Ho Chi Minh City)
Năm
GRDP công nghiệp
GRDP Nông nghiệp
GRDP Dịch vụ Dân số
(Tổng) GRDP
Tỷ đồng
GDP KH Dân số LF
68%
9.0% 5.0%
Năm
GDP
KH
Dân số
Pmax (MW)
Sản lượng
(tr.kWh)
2018
2019
2020
2021
2022
2023
2024
2025
vị mua buôn điện có trách nhiệm cập nhật và cung cấp số liệu phụ tải dự báo
năm tới cho Đơn vị vận hành hệ thống điện và thị trường điện để phục vụ
công tác tính toán phân bổ sản lượng hợp đồng cho đơn vị mua buôn điện”.
Year Month Tmax Ttb Tmin Atong
Pmax
Dương lịch Thứ tháng Năm
Âm lịch
tháng Ngày lễ
Tháng
Athang
(triệu kWh)
Pmax
(MW)
4118
Tổng
25,185,844
Pmax (MW)
A (MWh)
Sai số (%)
Tháng
Dự báo - A0
(MWh)
Số dự báo
Số A0
Ngày Tháng
Chu
kỳ
Dự
báo
Thực
tế
Tích
lũy
TỔNG
4118
4269
25,185,844 25,477,684
-291,840
6.03
3.21
-1.01
-1.15
Pmax (MW)
A (MWh)
Sai số (%)
Tháng
Dự báo - A0
(MWh)
Số dự báo
Số A0
Ngày Tháng
Dự
báo
Thực
tế
Chu
kỳ
Tích
lũy
TỔNG 4432.9
4651.1
27,073,369 26,989,290
28,978
5.00
4.23
-0.15
-0.87
5.3. TỔNG KẾT CHƯƠNG V
6.1. CÁC KẾT QUẢ ĐẠT ĐƯỢC CỦA LUẬN ÁN
−
6.2. TÓM TẮT CÁC ĐÓNG GÓP CHÍNH CỦA LUẬN ÁN
−
6.3. HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN