Luận án Tiến sĩ Kỹ thuật: Kỹ thuật dự báo trong vận hành thị trường điện Việt Nam

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM

---------------------------

NGUYỄN TUẤN DŨNG KỸ THUẬT DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN VIỆT NAM

LUẬN ÁN TIẾN SĨ KỸ THUẬT

TP. HỒ CHÍ MINH NĂM 2020

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM

Cán bộ hướng dẫn khoa học :

PGS.TS. Trần Thu Hà

-

PGS.TS. Nguyễn Thanh Phương

Luận án Tiến sĩ đã được bảo vệ tại Trường Đại học Công nghệ TP. HCM

ngày 06 tháng 11 năm 2020

Thành phần Hội đồng đánh giá Luận án gồm:

Họ và tên

TT 1 GS. TSKH. Nguyễn Xuân Quỳnh 2 GS. TS. Lê Kim Hùng PGS. TS. Lê Minh Phương 3 PGS. TS. Quyền Huy Ánh 4 5 GS. TS. Phạm Thị Ngọc Yến PGS. TS. Nguyễn Hùng 6 PGS. TS. Ngô Cao Cường 7 Chức danh Hội đồng Chủ tịch Phản biện 1 Phản biện 2 Phản biện 3 Ủy viên Ủy viên Ủy viên, Thư ký

Xác nhận của Chủ tịch Hội đồng đánh giá Luận án sau khi Luận án đã được báo cáo và sửa

chữa.

GS. TSKH. Nguyễn Xuân Quỳnh

Chủ tịch Hội đồng đánh giá Luận án

iii

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM

Luận án Tiến sĩ đã được bảo vệ tại Trường Đại học Công nghệ TP. HCM

ngày 06 tháng 11 năm 2020

Thành phần Hội đồng đánh giá Luận án gồm:

Họ và tên

TT 1 GS. TSKH. Nguyễn Xuân Quỳnh 2 GS. TS. Lê Kim Hùng PGS. TS. Lê Minh Phương 3 4 PGS. TS. Quyền Huy Ánh 5 GS. TS. Phạm Thị Ngọc Yến PGS. TS. Nguyễn Hùng 6 PGS. TS. Ngô Cao Cường 7 Chức danh Hội đồng Chủ tịch Phản biện 1 Phản biện 2 Phản biện 3 Ủy viên Ủy viên Ủy viên, Thư ký

Xác nhận của Nghiên cứu sinh, tập thể cán bộ hướng dẫn, Khoa/Viện quản lý chuyên

ngành và Viện Đào tạo Sau đại hộc sau khi Luận án đã được sửa chữa.

Cán bộ hướng dẫn 1 PGS. TS. Trần Thu Hà Cán bộ hướng dẫn 2 PGS. TS. Nguyễn Thanh Phương Nghiên cứu sinh Nguyễn Tuấn Dũng

KHOA QUẢN LÝ CHUYÊN NGÀNH VIỆN ĐÀO TẠO SAU ĐẠI HỌC

PGS. TS. Nguyễn Thanh Phương PGS. TS. Huỳnh Châu Duy

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu,

kết quả nêu trong Luận án là trung thực và chưa từng được ai công bố trong

bất kỳ công trình nào khác.

Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận án này

đã được cảm ơn và các thông tin trích dẫn trong Luận án đã được chỉ rõ

nguồn gốc tham khảo.

Tác giả Luận án

Nguyễn Tuấn Dũng

LỜI CÁM ƠN

Tôi xin bày tỏ lòng biết ơn chân thành nhất đến PGS.TS Trần Thu Hà và

PGS.TS. Nguyễn Thanh Phương, các Thầy, Cô đã tận tâm chỉ dẫn, truyền đạt

những kiến thức và kinh nghiệm quý báu cho tôi trong suốt quá trình thực

hiện Luận án này.

Và tôi xin được gửi lời cám ơn đến gia đình và bạn bè - những người đã

luôn ủng hộ và động viên chúng tôi trong suốt thời gian vừa qua.

Tác giả Luận án

Nguyễn Tuấn Dũng

TÓM TẮT

Đặc điểm của quá trình sản xuất và tiêu thụ điện năng là phải đảm bảo sự cân

bằng giữa sản xuất và tiêu thụ ở mọi thời điểm, khi có sự mất cân bằng giữa sản

xuất và tiêu thụ đều làm cho chất lượng điện năng thay đổi, nặng nề hơn có thể dẫn

đến sự sụp đỗ điện áp gây tan rã hệ thống.

Tuy nhiên, điện năng là một mặt hàng rất đặc biệt, đó là về mặt kinh tế

không thể lưu trữ và ổn định hệ thống điện đòi hỏi một sự cân bằng liên tục giữa

sản xuất và tiêu dùng. Đồng thời, nhu cầu sử dụng điện còn phụ thuộc vào thời tiết

(nhiệt độ, tốc độ gió, mưa,…); nhu cầu sử dụng của các doanh nghiệp, cũng như các

hoạt động hàng ngày (công suất đỉnh so với giờ cao điểm, các ngày trong tuần so

với ngày cuối tuần, ngày lễ và gần ngày lễ,…); công suất phát của các nguồn năng

lượng tái tạo cũng thay đổi theo điều kiện tự nhiên; Do đó, phải cần đến kỹ thuật dự

báo điện năng để cung cấp thông tin cho quá trình điều khiển HTĐ nhằm đảm bảo

sự cân bằng giữa sản xuất và tiêu thụ. Đặc biệt khi HTĐ được vận hành theo cơ chế

thị trường điện cạnh tranh, kết quả dự báo sẽ cung cấp thông tin cho các nhà quản lý

điều hành giá mua bán diện.

Đã có nhiều phương pháp dự báo được sử dụng, tuy nhiên phần lớn là các

phương pháp dự báo dài hạn và trung hạn dùng để cung cấp thông tin cho việc qui

hoạch phát triển nguồn, lưới điện và lập kế hoạch vận hành HTĐ. Luận án sẽ nghiên

cứu đề xuất một phương pháp dự báo ngắn hạn mới để cung cấp thông tin phụ tải

điện cho các nhà quản lý điều hành thị trường điện cạnh tranh.

Việc nghiên cứu các đặc tính của phụ tải; xây dựng các phương pháp xử lý

dữ liệu thiếu, sai sốt dữ liệu; cũng như đề xuất sử dụng biểu đồ phụ tải chuẩn hóa

đơn vị (SLP) để cung cấp thông tin cho các mô hình dự báo là những nhiệm vụ

quan trọng của luận án. Qua phân tích các mô hình dự báo đang được sử dụng trên

thế giới (Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo, học máy – mô

vii

hình Support Vector Regression; Neural Network, Feedforward Networks; Random

Forest), luận án đã đã xây dựng thành công giải thuật mới đó là sử dụng Biểu đồ

phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng

hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải

quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày

đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có Tết

Dương lịch và Tết Nguyên Đán). Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn

vị (SLP) và Support Vector Regression (SVR) đã hoàn thiện hàm dự báo ngắn hạn,

cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh,

các kết quả dự báo được kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực

thuộc Tập đoàn Điện lực Việt Nam.

Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường

SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức

thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi

nhuận cao nhất. Các module xử lý dữ liệu thiếu, xây dựng Biểu đồ phụ tải chuẩn

hóa đơn vị (SLP), dự báo phụ tải,… được chính tác giả tự lập trình bằng ngôn ngữ

Matlab 2017.

viii

ABSTRACT

The characteristic of the production and consumption of electricity is to

ensure a balance between production and consumption at all times. When there is an

imbalance between production and consumption, the quality of power changes,

which can even lead to voltage collapse, causing the system to fail.

However, electricity is a very special commodity, it is economically

impossible to store. Stabilizing the electrical system requires a constant balance

between production and consumption. In addition, the demand for electricity also

depends on factors such as weather (temperature, wind speed, rain, ...); daily usage

demand (peak capacity, demand on weekdays, weekends, holidays, ...) and variation

in generating capacity of renewable energy sources according to natural conditions.

Therefore, forecast techniques are needed to provide information for the control

process of the power system to ensure a balance between production and

consumption. Especially when the power system is operated under the mechanism

of a competitive electricity market, the forecast results will provide information for

managers to control the buying and selling prices.

Many forecasting methods have been used, but most are long-term and

medium-term forecasting methods used to provide information for power and grid

development planning as well as power system operation planning. The thesis will

study and propose a new short-term forecasting method to provide information

about electricity load to managers operating the competitive electricity market.

The important tasks of the thesis include studying load characteristics,

developing missing and incorrect data processing methods, as well as proposing to

use the Standardized Load Profile (SLP) to provide information for forecasting

models. Through analysis of forecasting models being used in the world (including

Statistical Engineering - SARIMA model; Artificial Intelligence, machine learning -

Support Vector Regression model; Neural Network, Feedforward Networks;

Random Forest), the thesis has successfully built a new algorithm. It is a method of

using the Standardized Load Profile (SLP) as input data sets for the regression

building modules. This method is effective and gives the forecast results with low

error. It solves the difference of negative and positive days, holidays, special days

of the year and the days of January and February (the month of New Year and Lunar

New Year). The combined model of the Standardized Load Profile (SLP) and

Support Vector Regression (SVR) has completed the short-term forecast function

and provided the forecast results for the managers operating the competitive

electricity market. The forecast results are verified with the data set of 05 Electricity

Corporations of Electricity of Vietnam (EVN).

In addition, the thesis also analyzes the impact of SMP market price and

CFD contracts on Qc forecast results to minimize risks and take advantage of the

fluctuations of the market for the highest returns. The modules on processing

missing data , building the Standardized Load Profile (SLP), load forecasting, ... are

programmed by the author using the Matlab 2017.

GIẤY XÁC NHẬN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM

xii

CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ

I. CÁC CÔNG TRÌNH THAM DỰ HỘI NGHỊ

1. Nguyen Tuan Dung, Tran Thu Ha, Nguyen Thanh Phuong, 2018: COMPARATIVE STUDY OF SHORT-TERM ELECTRIC LOAD FORECASTING: CASE STUDY EVNHCMC - 2018 4th International Conference on Green Technology and Sustainable Development (GTSD) – IEEE Conference 2018.

2. Nguyen Tuan Dung, Nguyen Thanh Phuong, tháng 7 năm 2018: Comparative Study of Short-Term Electric Load Forecasting: Case Study EVNHCMC – Hội thảo Quốc gia lần thứ XXI – Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông – Thanh Hóa.

3. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2018: DỰ BÁO PHỤ TẢI ĐIỆN NGẮN HẠN BẰNG SUPPORT VECTOR REGRESSION (SVR) – Hội nghị Khoa học công nghệ 2018 – Trường Đại học Công nghệ thành phố Hồ Chí Minh.

(SVR)

4. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: HANDLING MISSING (SLP) AND DATA USING STANDARDIZED LOAD PROFILE SUPPORT VECTOR REGRESSION International - 2019 Conference on System Science and Engineering (ICSSE) – IEEE Conference 2019.

5. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2020: LOAD FORECASTING FOR MONTHS OF THE LUNAR NEW YEAR HOLIDAY USING STANDARDIZED LOAD PROFILE AND SUPPORT REGRESSION VECTOR: CASE STUDY HO CHI MINH CITY - The International Conference On Science, Technology And Society Studies (STS 2020) – Trường Đại học Công nghệ thành phố Hồ Chí Minh.

xiii

II. CÔNG TRÌNH CÔNG BỐ TẠI CÁC TẠP CHÍ KHOA HỌC

• TẠP CHÍ TRONG NƯỚC

6. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2017: DEALING WITH MISSING DATA FOR THE POWER LOAD STUDIES USING SUPPORT VECTOR REGRESSION (SVR) - ISSN 1859-1531 - Tạp chí KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ Số 3(112).2017- Quyển 1; Trang: 28-33.

7. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: XỬ LÝ DỮ LIỆU THIẾU BẰNG BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ (SLP) VÀ SUPPORT VECTOR REGRESSION (SVR) - ISSN 1859-3585 - Tạp chí KHOA HỌC & CÔNG NGHỆ, Số 50.2019, trang 21.

• TẠP CHÍ QUỐC TẾ

8. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: SHORT-TERM ELECTRIC LOAD FORECASTING USING STANDARDIZED LOAD PROFILE (SLP) AND SUPPORT VECTOR REGRESSION (SVR) - Engineering, Technology & Applied Science Research Vol. 9, No. 4, 2019, 4548-4553.

9. Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: IMPROVE THE ACCURACY OF SHORT-TERM FORECASTING ALGORITHMS BY STANDARDIZED LOAD PROFILE AND SUPPORT REGRESSION VECTOR: CASE STUDY VIETNAM - Advances in Science, Technology and Engineering Systems Journal Vol. 4, No. 5, 243-249 (2019). ASTESJ ISSN: 2415-6698. https://dx.doi.org/10.25046/aj040530.

xiv

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 – Biến đổi không gian dữ liệu sang 31

Hình 1.2 – Minh họa cho các biến lỏng 33

Hình 1.3 – Thuật toán Rừng ngẫu nhiên Hồi qui 35

Hình 2.1 – Thống kê điện thương phẩm 40

Hình 2.2 – Hệ số tự tương quan của chuỗi thời gian không tĩnh 41

Hình 2.3 – Thống kê hệ số Pmax của tháng 10/2018 41

Hình 2.4 – Hệ số tương quan của Pmax tháng 10/2018 42

Hình 2.5 – Bảng thống kê điện thương phẩm theo từng tháng 42

Hình 2.6 – Hệ số tương quan của 12 tháng của năm 43

Hình 2.7 – Các lỗi thường gặp trong ghi nhận dữ liệu điện 47

Hình 2.8 – Đồ thị biểu diễn tương quan Pmax, Atổng và nhiệt độ 50

Hình 2.9 – Dữ liệu bị thiếu và lỗi 51

Hình 2.10 – Giải thuật xử lý dữ liệu thiếu 52

Hình 2.11 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 55

Hình 2.12 – Kết quả ước lượng dữ liệu thiếu bằng SVR 56

Hình 2.13 – Mô hình mạng Neural Network 57

Hình 2.14 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 58

Hình 2.15 – Kết quả ước lượng các giá trị thiếu, lỗi 59

Hình 2.16 – Mô phỏng lại đường cong tải bị thiếu dữ liệu 60

Hình 2.17 – Kết quả ước lượng các giá trị thiếu, lỗi 60

Hình 3.1 – Tăng trưởng của GRDP và Điện năng qua các năm (triệu kWh) 62

Hình 3.2 – Biểu đồ tương quan giữa GRDP và Điện năng (triệu kWh) 62

Hình 3.3 – 5 thành phần phụ tải sử dụng điện (hộ sử dụng điện) 63

Hình 3.4 – Đồ thị phụ tải của tòa nhà Green Power (EVNHCMC) 64

Hình 3.6 – Phụ tải Nhà máy thép (kWh) 64

Hình 3.6 – Phụ tải Nhà máy Xi măng (kWh) 64

Hình 3.7 – Sự thay đổi theo nhiệt độ trong năm (tháng 5 – mùa hè) 65

Hình 3.8 – Sự thay đổi theo các ngày lễ trong năm 65

Hình 3.9 – Dao động mạnh giữa El Nino và La Nina 65

Hình 3.10 – DR cắt giảm được tải đỉnh 66

Hình 3.11 – Đặc tính tải thay đổi theo ngày 67

Hình 3.12 – Đặc tính tải thay đổi theo giờ - tuần 67

Hình 3.13 – Đồ thị các ngày điển hình tháng1 68

Hình 3.14 – Đồ thị các ngày điển hình tháng 2 68

Hình 3.15 – Đồ thị các ngày điển hình tháng 3 68

Hình 3.16 – Đồ thị các ngày điển hình tháng 4 68

Hình 3.17 – Đồ thị các ngày điển hình tháng 5 69

Hình 3.18 – Đồ thị các ngày điển hình tháng 6 69

Hình 3.19 – Đồ thị các ngày điển hình tháng 7 69

Hình 3.20 – Đồ thị các ngày điển hình tháng 8 69

Hình 3.21 – Đồ thị các ngày điển hình tháng 9 70

Hình 3.22 – Đồ thị các ngày điển hình tháng 10 70

Hình 3.23 – Đồ thị các ngày điển hình tháng 11 70

Hình 3.24 – Đồ thị các ngày điển hình tháng 12 70

xvi

Hình 3.25 – Biểu đồ quan hệ phụ tải và nhiệt độ 71

Hình 3.26 – Đồ thị phụ tải các ngày thứ 6, 7 và chủ nhật 72

Hình 3.27 – Đồ thị phụ tải các ngày thường trong tuần 73

Hình 3.28 – Đồ phụ tải ngày Tết DL, AL và ngày thường 73

Hình 3.29 – Biểu đồ chuẩn hóa đơn vị ngày Tết Dương lịch qua các năm 76

Hình 3.30 – Biểu đồ chuẩn hóa đơn vị ngày Tết Nguyên Đán qua các năm 77

Hình 3.31 – Biểu đồ chuẩn hóa đơn vị ngày thứ 2 trong tuần 77

Hình 3.32 – Biểu đồ chuẩn hóa đơn vị ngày thứ 3 trong tuần 78

Hình 3.33 – Biểu đồ chuẩn hóa đơn vị ngày thứ 6 trong tuần 78

Hình 3.34 – Biểu đồ chuẩn hóa đơn vị ngày thứ 7 trong tuần 78

Hình 3.35 – SLP một số ngày trong năm 80

Hình 3.36 – Giải thuật xử lý dữ liệu thiếu 81

Hình 3.37 – Một số ngày dữ liệu bị lỗi một vài chu kỳ 85

Hình 3.38 – Các hàm hồi qui SVR được xây dựng 86

Hình 3.39 – Các hàm hồi qui được xây dựng lại 86

Hình 3.40 – Đường cong phụ tải được xây dựng lại 87

Hình 3.41 – Dữ liệu được xây dựng lại ngày 08/08/2018 87

Hình 3.42 – Dữ liệu được xây dựng lại ngày 13/08/2018 88

Hình 3.43 – Dữ liệu được xây dựng lại ngày 17/08/2018 88

Hình 3.44 – Dữ liệu được xây dựng lại ngày 25/08/2018 88

Hình 4.1 – Biểu đồ phụ tải tháng 01 qua các năm 92

Hình 4.2 – Biểu đồ phụ tải tháng 02 qua các năm 93

Hình 4.3 – Lưu đồ giải thuật dự báo ngắn hạn 96

xvii

Hình 4.4 – Một số Biểu đồ phụ tải chuẩn hóa đơn vị 99

Hình 4.5 – Phân tích AFC và PAFC 101

Hình 4.6 – Mô hình mạng NN 102

Hình 4.7 – Mô hình Ramdom Forest 103

Hình 4.8 – Kết quả chạy test các mô hình SVR 104

Hình 4.9 – Kết quả chạy test các mô hình học máy 105

Hình 4.10 – Kết quả chạy test các mô hình hồi qui 107

Hình 4.11 – Mô hình được chọn để dùng làm hàm dự báo 108

Hình 4.12 – Kết quả chạy dự báo cho 07 ngày tiếp theo 108

Hình 4.13 – Kết quả dự báo chu kỳ 60 phút/24h/7ngày 109

Hình 4.14 – Kết quả chạy test các mô hình SVR 110

Hình 4.15 – Kết quả chạy test các mô hình học máy 111

Hình 4.16 – Kết quả chạy test các mô hình hồi qui 112

Hình 4.17 – Mô hình được chọn để dùng làm hàm dự báo 113

Hình 4.18 – Kết quả chạy dự báo cho 30 ngày tiếp theo 114

Hình 5.1 – Công suất các nguồn tham gia trực tiếp và gián tiếp VCGM 118

Hình 5.2 – Cơ cấu sản lượng điện năng theo hình thức tham gia thị trường 119

Hình 5.3 – Tăng trưởng công suất đặc các tham gia VCGM 119

Hình 5.4 – Sản lượng Thủy điện qua các năm 120

Hình 5.5 – Sản lượng Nhiệt điện qua các năm 120

Hình 5.6 – Tăng trưởng các nhà máy tham gia thị trường điện 121

Hình 5.7 – Giá SMP và FMP bình quân qua các năm 121

Hình 5.7 – Giá trần thị trường qua các năm 122

xviii

Hình 5.9 – Cấu trúc thị trường Phát điện cạnh tranh Việt Nam 123

Hình 5.10 – Mô hình Thị trường bán buôn điện cạnh tranh 124

Hình 5.11 – Mô hình Thị trường bán buôn điện cạnh tranh năm 2019 125

Hình 5.12 – Vận hành VWEM năm 2019 126

Hình 5.13 – Các biên độ và mục đích dự báo trong vận hành hệ thống điện 128

Hình 5.14 – Điều độ Thị trường điện theo thời gian 129

Hình 5.15 – Đồ thị tương quan của các thành phần 131

Hình 5.16 – Kết quả phân tích ANOVA 132

Hình 5.17 – Định hướng tốc độ tăng trưởng điện năng 133

Hình 5.18 – Lưu đồ giải thuật dự báo 365 ngày – 24 chu kỳ 134

Hình 5.19 – SLP của ngày Tết Dương lịch 01/01/2019 137

Hình 5.20 – SLP của ngày mồng 1 - Tết Nguyên đán Kỷ Hợi 137

Hình 5.21 – SLP của ngày 30/04/2019 138

Hình 5.22 – SLP của ngày 02/09/2019 138

Hình 5.23 – Kết quả dự báo 365 ngày – 24 chu kỳ của năm 2019 139

Hình 5.24 – Sự biến động của giá SMP trên thị trường qua các năm 143

Hình 5.25 – Sự biến động của giá SMP của các tháng năm 2018 143

Hình 5.26 – Sự biến động của giá SMP theo từng giờ, từng ngày 144

Hình 5.27 – Cơ chế thanh toán CFD trên thị trường 145

Hình 5.28 – Biến động giá SMP ngày 18/02/2018 (Tết Âm lịch) 146

Hình 5.29 – Biến động giá SMP ngày 21/02/2018 146

Hình 5.30 – Biến động giá SMP ngày 02/05/2018 147

xix

DANH MỤC CÁC BẢNG BIỂU

Bảng 2.1 – Các giá trị bị lỗi (bằng không, rỗng và cao bất thường) 51

Bảng 2.2 – Kết quả ước lượng theo phương pháp thông thường 53

Bảng 2.3 – Bảng thông số mô hình SVR 54

Bảng 2.4 – Đánh giá kết quả test của mô hình SVR 54

Bảng 2.5 – Kết quả ước lượng dữ liệu thiếu bằng SVR 56

Bảng 2.6 – Đánh giá kết quả test của mô hình NN 57

Bảng 2.7 – Kết quả ước lượng của mô hình NN 59

Bảng 2.8 – Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN 60

Bảng 3.1 – Một số thông số mô hình SVR đặc trưng được đề xuất 82

Bảng 3.2 – Kết quả kiểm tra sai số trung bình của các mô hình SVR 86

Bảng 3.3 – Kết quả kiểm tra sai số trung bình của các mô hình hồi qui. 86

Bảng 4.1 – Lịch qui đổi ngày dương lịch và âm lịch năm 2019 100

Bảng 4.2 – Chúng ta còn có một số mô hình như: 102

Bảng 4.3 – Các thông số mô hình SVM Regression: 104

Bảng 4.4 – Kết quả kiểm tra của các mô hình SVR 104

Bảng 4.5 – Sai số của các mô hình SVR (%) 105

Bảng 4.6 – Kết quả kiểm tra của các mô hình học máy 105

Bảng 4.7 – Sai số của các mô hình học máy (%) 106

Bảng 4.8 – Sai số các mô hình (%) 107

Bảng 4.9 – Kết quả kiểm tra của các mô hình SVR 110

Bảng 4.10 – Sai số của các mô hình SVR (%) 111

Bảng 4.11 – Kết quả kiểm tra của các mô hình học máy 111

Bảng 4.12 – Sai số của các mô hình học máy (%) 112

Bảng 4.13 – Sai số các mô hình hồi qui (%) 113

Bảng 5.1 – Bảng thống kê điện thương phẩm theo 5 thành phần 130

Bảng 5.2 – Bảng thống kê điện khách hàng theo 5 thành phần 130

Bảng 5.3 – Bảng thống kê GRDP theo thành phần kinh tế 130

Bảng 5.4 – Các giả thuyết đầu vào dựa trên các chính sách dài hạn 132

Bảng 5.5 – Kết quả dự báo dài hạn (đến năm 2025) 132

Bảng 5.7 – Dữ liệu thống kê theo tháng 135

Bảng 5.8 – Dữ liệu thống kê theo ngày từ 01/01/2014 – 31/12/2019 135

Bảng 5.8 – Lịch qui đổi ngày dương lịch và âm lịch các ngày lễ năm 2019 136

Bảng 5.9 – Kết quả dự báo 12 tháng năm 2019 139

Bảng 5.10 – Kết quả dự báo 365 ngày của năm 2019 139

Bảng 5.11 – Kết quả sai số dự báo năm 2018 140

Bảng 5.12 – Kết quả sai số dự báo năm 2019 141

xxi

DANH MỤC CÁC TỪ VIẾT TẮT

A Sản lượng điện thương phẩm

A0 Trung tâm điều độ Hệ thống điện Quốc gia

ACA Đấu giá hợp đồng tập trung hàng năm

ACF Hàm tự tương quan

AR Mô hình tự hồi quy

ARIMA Trung bình trượt kết hợp tự hồi quy (Autoregressive Integrated Moving Average)

ARMA Mô hình bình quân di động

BOT Nhà máy điện bao tiêu (có cam kết Chính phủ)

CAN Phí công suất

CART Cây phân loại và hồi qui

CfD Hợp đồng sai khác

CSDL Cơ sở dữ liệu

DR Điều chỉnh nhu cầu phụ tải

DSM Quản lý nhu cầu phụ tải

EE Hiệu quả năng lượng

EPTC Công ty mua bán điện

ERAV Cục Điều tiết Điện lực

EVN Tập đoàn Điện lực Việt Nam

EVNCPC Tổng công ty Điện lực Miền Trung

EVNHCMC Tổng công ty Điện lực thành phố Hồ Chí Minh

xxii

EVNHNPC Tổng công ty Điện lực thành phố Hà Nội

EVNNPC Tổng công ty Điện lực Miền Bắc

EVNSPC Tổng công ty Điện lực Miền Nam

Dự báo nhu cầu theo xu hướng (Forecart inchiding trend) FIT

FMP Giá toàn phần

GAs Thuật toán di truyền

GDP Tăng trưởng kinh tế

GRDP Tăng trưởng kinh tế

MA Mô hình trung bình trượt

MAD Sai số trung bình tuyệt đối (Mean Absolute Deviation)

MAPE Sai số phần trăm trung bình tuyệt đối

MAR Thiếu ngẫu nhiên

MOIT Bộ Công Thương

MSE Sai số bình phương trung bình

MSO Đơn vị vận hành hệ thống và thị trường điện

NAMR Thiếu không ngẫu nhiên

NMĐ Nhà máy điện

NMNĐ Nhà máy nhiệt điện

NMTĐ Nhà máy thủy điện

NN Mạng thần kinh (nơ-ron)

PACF Hàm tự tương quan riêng phần

PASA Đánh giá an ninh hệ thống

xxiii

Tổng công ty Điện lực phân phối PC

Giá hợp đồng mua bán điện dạng sai khác Pc

Công suất cực đại Pmax

Công suất cực tiểu Pmin

Qc Sản lượng điện năng thanh toán theo giá hợp đồng trong chu kỳ giao dịch

QCA Đấu giá hợp đồng tập trung hàng quý

Khoản thanh toán sai khác trong chu kỳ giao dịch Rcfd

RF Mô hình Rừng ngẫu nhiên (Random Forest)

RTD Điều độ thời gian thực

SLP Biểu đồ phụ tải chuẩn hóa đơn vị (Standardized Load Profiles)

SMHP Nhà máy thủy điện chiến lược đa mục tiêu

SMP Chi phí biên của hệ thống

SRMC Chi phí biên ngắn hạn

STLF Dự báo phụ tải ngắn hạn

SVM Phương pháp học máy (Support Vector Machine)

SVR Mô hình Bộ hồi quy dựa theo vector hỗ trợ (Support Vector Regression)

TOU Thời gian sử dụng (Time of Use)

TTĐ Thị trường điện

VCGM Thị trường điện phát điện cạnh tranh

VWEM Thị trường bán buôn điện cạnh tranh

xxiv

DANH MỤC CÁC KÝ HIỆU

là hệ số tự tương quan của

ở độ trễ

là trung bình của

Ký hiệu Định nghĩa

là phương sai σ2

là hệ số tự tương quan lấy mẫu ở độ trễ

là trung bình mẫu của

là độ trễ

là kích cỡ mẫu

là đồng phương sai γk

là Sai phân bậc t wt

là véc tơ trọng số

là kí hiệu chuyển vị T

là hằng số

là véc tơ đầu vào

là véc tơ đặc trưng

 là hàm ánh xạ từ không gian đầu vào sang không gian đặc trưng

là hằng số chuẩn hóa 

ε-insensitive là hàm lỗi

là hằng số chuẩn hóa C

xxv

là biến lỏng

là tham số của hàm nhân Gaussian 

là giá trị đo lường tải hệ thống Yt

là vector dữ liệu theo thời gian vt

là vector hệ số hồi quy, αt

là lỗi mô hình tại thời điểm t εt

là điện năng dự báo ở năm thứ t At

là điện năng ở năm chọn làm gốc Ao

là tốc độ phát triển bình quân hàng năm α

là thời gian dự báo t

là hệ số mùa K

là giá trị điện năng quan sát của tháng thứ i yi

là giá trị điện năng trung bình của các tháng trong năm

là khoản thanh toán sai khác trong chu kỳ giao dịch i (đồng); Rcfdi

là sản lượng điện năng thanh toán theo giá hợp đồng trong chu kỳ Qci

giao dịch i (kWh);

Pc là giá hợp đồng mua bán điện dạng sai khác (đồng/kWh). Đối với

các nhà máy thuỷ điện giá hợp đồng này chưa bao gồm thuế tài

nguyên nước và phí môi trường rừng;

là giá điện năng thị trường trong chu kỳ giao dịch i (đồng/kWh); SMPi

là giá công suất thị trường trong chu kỳ giao dịch i (đồng/kWh). CANi

xxvi

MỤC LỤC

LỜI CAM ĐOAN

iv

LỜI CÁM ƠN

v

TÓM TẮT

vi

ABSTRACT

viii

GIẤY XÁC NHẬN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM

x

CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ

xii

DANH MỤC CÁC HÌNH VẼ

xiv

DANH MỤC CÁC BẢNG BIỂU

xix

DANH MỤC CÁC TỪ VIẾT TẮT

xxi

DANH MỤC CÁC KÝ HIỆU

xxiv

CHƯƠNG I: TỔNG QUAN

1 1.1. Tổng quan về vấn đề nghiên cứu

1 1.2. Tổng quan tình hình nghiên cứu trong nước và nước ngoài liên

quan đến đề tài

3 1.3. Các yếu tố tác động đến các mô hình dự báo phụ tải ngắn hạn

8 1.4. Mục tiêu của luận án

9 1.5. Nhiệm vụ và giới hạn của luận án

10 1.6. Phương pháp nghiên cứu

11 1.7. Đóng góp của luận án

12 1.8. Ý nghĩa thực tiễn của luận án

12 1.9. Bố cục của luận án

13 CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ

TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU

16 2.1. CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG

16 2.1.1. Các phương pháp thống kê

16 2.1.2. Phương pháp chuyên gia

26 2.1.3. Trí tuệ nhân tạo, học máy

29

xxvii

2.2. KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU

36 2.2.1 Thu thập, phân tích và xử lý dữ liệu

36 2.2.2 Nhận biết các thành phần của chuỗi thời gian bằng phương pháp

phân tích hệ số tự tương quan

40 2.2.3 Thiếu giá trị trong khai thác dữ liệu

43 a)

Các loại khác nhau của việc thiếu dữ liệu

44 b)

Phần tử ngoại lai

45 2.2.4 Dữ liệu thiếu trong nghiên cứu phụ tải điện

46 2.2.5 Các phương pháp nghiên cứu xử lý dữ liệu thiếu

47 2.2.6 Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện

48 2.3. KẾT QUẢ NGHIÊN CỨU

50 2.3.1. Dữ liệu đầu vào

50 2.3.2. Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu

51 2.3.3. Kết quả xử lý dữ liệu thiếu

52

• Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời gian cho 4 tuần trước đó của chuổi dữ liệu đang xét, ta có kết quả

52

• Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR (Support Vector Regression)

53 +

Xét mô hình SVM Regression, với các thông số:

53

• Phương pháp xây dựng đường cong hồi qui bằng mạng Neural Network

56 +

Xét mô hình Neural Netwok

56 2.4. TỔNG KẾT CHƯƠNG II

61 CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN

HÓA ĐƠN VỊ

62 3.1. CÁC YẾU TỐ TÁC ĐỘNG ĐẾN PHỤ TẢI ĐIỆN

62 3.1.1. Các yếu tố về kinh tế

62 3.1.2. Giá điện

63 3.1.3. Thành phần phụ tải (được kết nối vật lý)

63 3.1.4. Các yếu tố ngoại sinh

64

xxviii

3.1.5. Quản lý nhu cầu phụ tải

66 3.2. ĐẶC TÍNH PHỤ TẢI

66 3.2.1. Đặc tính tải ngày – tuần (week day)

66 3.2.2. Đặc tính tải giờ – ngày (hour day)

67 3.2.3. Đăc tính của thời tiết

71 3.3. BIỂU ĐỒ PHỤ TẢI CHUẨN HÓA ĐƠN VỊ

71 3.3.1. Khái niệm

71 3.3.2. Ứng dụng xử lý dữ liệu thiếu bằng Biểu đồ chuẩn hóa đơn vị

(SLP) và Support Vector Regression (SVR)

79 3.3.3. Kết quả áp dụng SLP vào xử lý dữ liệu thiếu

83 3.4. TỔNG KẾT CHƯƠNG III

89 CHƯƠNG VI: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN

90 4.1. GIỚI THIỆU

90 4.2. MÔ HÌNH ĐỀ XUẤT

91 4.3. KẾT QUẢ NGHIÊN CỨU

98 4.3.1. Dữ liệu đầu vào

98 4.3.2. Xây dựng đồ thị chuẩn hóa đơn vị

98 4.3.3. Xây dựng các mô hình hồi quy cho STLF

100 4.3.4. Đánh giá các mô hình

103 4.3.5. Kết quả dự báo STLF

103 4.3.6. Kiểm chứng bằng bộ dữ

liệu ngày Tết Nguyên Đán

(EVNHCMC)

110 4.3.7. Kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc

Tập đoàn Điện lực Việt Nam (Chi tiết theo Phụ lục đính kèm)

114 4.4. TỔNG KẾT CHƯƠNG IV

115 CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG

ĐIỆN CẠNH TRANH CỦA VIỆT NAM

117 5.1. TỔNG QUAN VỀ THỊ TRƯỜNG ĐIỆN VIỆT NAM HIỆN

NAY

117 5.1.1. Thị trường phát điện cạnh tranh (giai đoạn 2012 - 2018)

122 5.1.2. Thị trường bán buôn điện cạnh tranh (từ 01/01/2019)

123

xxix

5.2. CÁC YÊU CẦU VỀ DỰ BÁO PHỤ TẢI TRONG VWEM

126 5.2.1. Dự báo phục vụ Kế hoạch phát triển lưới điện truyền tải và phân

phối

129 5.2.2. Dự báo phục vụ công tác vận hành thị trường điện cạnh tranh

133 5.2.3. Kết quả áp dụng Kỹ thuật dự báo vào vận hành Thị trường điện

Bán buôn Việt Nam (phạm vi Tổng công ty Điện lực TP.HCM) 140

5.2.4. Giá SMP của thị trường điện tác động đến kết quả dự báo

141 5.3. TỔNG KẾT CHƯƠNG V

149 CHƯƠNG VI – KẾT LUẬN

150 6.1. CÁC KẾT QUẢ ĐẠT ĐƯỢC CỦA LUẬN ÁN

150 6.2. TÓM TẮT CÁC ĐÓNG GÓP CHÍNH CỦA LUẬN ÁN

151 6.3. HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN

152 TÀI LIỆU THAM KHẢO

153 CÁC PHỤ LỤC

163

1. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM TỪ 01/01/2014 ĐẾN 31/12/2019 (số liệu công suất – Pmax, điện năng tiêu thụ – Atổng (24 chu kỳ/ngày) và nhiệt độ (t0) theo từng giờ)

163

2. CÁC SỐ LIỆU THỐNG KÊ CÁC CHỈ TIÊU KINH TẾ, PHỤ TẢI ĐIỆN THEO TỪNG THÀNH PHẦN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM TỪ NĂM 2014 ĐẾN NĂM 2019

163

3. ĐỒ THỊ PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM

163

4. BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM

163

5. DANH SÁCH CÁC NGÀY LỄ TẾT CỦA TP.HCM

163

6. KẾT QUẢ CHẠY DỰ BÁO CHO 30 NGÀY CỦA THÁNG 02/2018 – THÁNG 02/2019 (24 CHU KỲ) CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM

163

7. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC HÀ NỘI

163

8. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN BẮC

163

xxx

9. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC MIỀN TRUNG

163 10. DỮ LIỆU PHỤ TẢI CỦA TỔNG CÔNG TY ĐIỆN LỰC

MIỀN NAM

163 11. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG

CÔNG TY ĐIỆN LỰC MIỀN NAM

163 12. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG

CÔNG TY ĐIỆN LỰC MIỀN TRUNG

163 13. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG

CÔNG TY ĐIỆN LỰC MIỀN BẮC

164 14. KẾT QUẢ KIỂM CHỨNG BẰNG BỘ DỮ LIỆU CỦA TỔNG

CÔNG TY ĐIỆN LỰC HÀ NỘI

164 15. KẾT QUẢ DỰ BÁO 8760 CHU KỲ NĂM 2018, 2019 VÀ

2020 CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM

164 16. CODE CHƯƠNG TRÌNH

164

CHƯƠNG I: TỔNG QUAN

1.1. Tổng quan về vấn đề nghiên cứu

Vấn đề dự báo điện năng đóng một vai trò hết sức quan trọng và có tính

quyết định đối với nền kinh tế và đời sống của chúng ta. Đây là một môn khoa học

quan trọng nhằm nghiên cứu các phương pháp luận khoa học để đưa ra các con số

chính xác nhất sẽ xảy ra trong tương lai, giúp cho chúng ta định hướng được

phương hướng và kế hoạch cho tương lai, chủ động trong công việc và xử lí được

những biến cố. Nếu như không thực hiện công tác dự báo điện năng, ta sẽ gặp phải

hai trường hợp có thể xảy ra, đó là: sẽ thiếu hụt điện năng sử dụng hay dư thừa điện

năng sản xuất.

Trong những năm qua, dự báo tiêu thụ điện năng thu hút một sự quan tâm

lớn từ các Công ty điện lực và các nhà nghiên cứu từ các khu vực khác nhau. Đối

với các Công ty điện lực đây là một vấn đề lớn bởi vì họ cần phải ước lượng điện

cần thiết để đáp ứng khách hàng của họ. Đối với họ, đây không phải là một nhiệm

vụ dễ dàng bởi vì nhu cầu điện ngày càng tăng trong những năm qua và cũng vì mô

hình tiêu thụ điện ngày càng khác nhau với nhiều yếu tố bao gồm cả thời gian. Vì

vậy, một trong những mục tiêu của Công ty điện lực là dự báo phải bám sát với thực

tế để ngăn ngừa sự thiếu hụt hoặc lãng phí điện năng.

Việc tìm kiếm các phương pháp dự báo tốt nhất không phải là một nhiệm vụ

dễ dàng vì có nhiều biến như: nhiệt độ, độ ẩm, gió, nhân khẩu học, số lượng trung

bình của các thiết bị điện trong nước, mùa trong năm, ngày trong tuần, ngày lễ đã

được đưa vào xem xét. Ngoài ra, việc xây dựng các nhà máy và hệ thống điện luôn

cần có thời gian. Do vậy, muốn đáp ứng được yêu cầu sử dụng điện, ngành điện

phải làm tốt công tác dự báo để lập kế hoạch triển khai. Chính sự phát triển nhanh

của nhu cầu sử dụng điện đang gây ra mất cân đối về tài chính để đảm bảo sự phát

triển bền vững của ngành Điện. Giá điện mua cạnh tranh sẽ là công cụ của thị

trường để tạo ra sự cân bằng tự nhiên nhu cầu sử dụng điện, lợi nhuận của các

ngành sản xuất và các đơn vị cung cấp điện [1].

Hiện nay, do sự phát triển nhanh về khoa học kĩ thuật, đặc biệt là những công

cụ tính toán, nhiều phương pháp dự báo đã, đang và sẽ được nghiên cứu để đưa vào

sử dụng. Các mô hình dự báo có nhiều loại [10] dựa trên các phương pháp thống

kê như: Phương pháp bình quân di động, Phương pháp bình quân di động có trọng

số, Phương pháp san bằng số mũ, Phương pháp san bằng số mũ có điều chỉnh xu

hướng, Phương pháp dự báo theo đường khuynh hướng, Phương pháp đường thẳng

thống kê; Phương pháp đường thẳng thông thường; Phương pháp theo khuynh

hướng có xét đến biến động thời vụ; Phương pháp đường Parabol thống kê; Phương

pháp đường Logarit; Phương pháp đa hồi qui (Multiple regression method);

Các mô hình đã được ứng dụng để dự báo trên thế giới ứng dụng công nghệ

mạng neuron như mô hình Rừng ngẫu nhiên (Random Forest Regression): RF là

một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman (2001) [63].

Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản được xây dựng

bằng cách sử dụng thuật toán Bagging [64]. Khi xây dựng một cơ sở phân loại, các

nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên ngẫu nhiên.

Trong bộ cây phân loại và hồi quy CART truyền thống, mỗi nút bên trong là

tập con của tập dữ liệu ban đầu và nút gốc chứa tất cả dữ liệu ban đầu. Các rừng

ngẫu nhiên để hồi quy được hình thành bằng cách hình thành cây dựa vào một

vector ngẫu nhiên sao cho cây tiên đoán có các giá trị số cao hơn so với các nhãn

lớp. Tập huấn luyện được rút ra một cách độc lập từ sự phân bố của vector ngẫu

nhiên, các dự đoán rừng ngẫu nhiên được hình thành bằng cách lấy trung bình trên k

của cây. Giải thuật rừng ngẫu nhiên sinh ra mô hình có độ chính xác cao đáp ứng

được yêu cầu thực tiễn cho vấn đề phân loại, hồi qui [65] – [70].

Phương pháp dự báo từ các mô hình chuỗi thời gian (mô hình BOX-

JENKINS) để đưa ra các dự báo ngắn hạn và trung hạn . Các mô hình kinh tế lượng

chủ yếu dựa trên một động thái rõ nét của các đối tượng có liên quan đến hệ thống

kinh tế. Tuy nhiên một họ các mô hình thay thế khác được sử dụng rộng rãi, đặc

biệt trong dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian. Chủ yếu, các

mô hình này nối kết một biến phụ thuộc với các giá trị của nó trong quá khứ và với

các sai số ngẫu nhiên mà có thể có tương quan theo chuỗi. Một các tổng quát, các

mô hình chuỗi thời gian không dựa trên bất kỳ một động thái kinh tế rõ nét nào.

Cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến nhất

trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập kỷ gần đây,

các phương pháp chuỗi thời gian đã được sử dụng rất rộng rãi trong kinh tế học đặc

biệt là trong dự báo ngắn hạn, trong đó các mô hình chuỗi thời gian đã chứng tỏ là

thích hợp hơn so với các mô hình kinh tế lượng.

Một phương pháp rất phổ biến trong việc lập mô hình chuỗi thời gian là

phương pháp trung bình trượt kết hợp tự hồi quy (autoregressive integrated

moving average - ARIMA), thường được gọi là phương pháp luận Box-Jenkins.

Trọng tâm của các phương pháp dự báo mới này không phải là xây dựng các mô

hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác

suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế theo triết lý “hãy để dữ

liệu tự nói”.

Tác giả nghiên cứu mô hình thống kê Box-Jenkin (SARIMA), nghiên cứu

các mô hình học máy tiên tiến như: Neural Network, Support Vector Regression,

Random Forest,… để xây dựng mô hình dự báo (dự báo ngắn hạn, trung hạn) theo

yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.

1.2. Tổng quan tình hình nghiên cứu trong nước và nước ngoài liên quan đến

đề tài

Dự báo phụ tải điện với độ chính xác cao là một trong những nhiệm vụ vô

cùng quan trọng trong qui hoạch và vận hành hệ thống điện. Nếu dự báo trung dài

và dài hạn được quan tâm nghiên cứu khá nhiều ở nước ta (chủ yếu để phục vụ qui

hoạch phát triển hệ thống điện) thì dự báo ngắn hạn mặc dù đóng vai trò quan trọng

trong vận hành kinh tế hệ thống điện, lại chưa được quan tâm nghiên cứu đúng mức.

Trên thế giới, các nghiên cứu về STLF trong giai đoạn gần đây tập trung vào

a) Ngoài nước

các hướng như sau:

Rất nhiều phương pháp tiếp cận đã được đề xuất trong tài liệu để xét đến xu

hướng biến đổi của phụ tải, hầu hết các nghiên cứu về STLF đều dựa trên phương

án tính sai phân bậc nhất của chuỗi phụ tải để xét xu hướng biến đổi của phụ tải.

Mặt khác, hầu hết các biến động của phụ tải điện chủ yếu chịu sự chi phối của các

yếu tố như điều kiện khí hậu, nhiệt độ hoặc số giờ trời sáng trong ngày. Mặc dù các

biến động có hệ thống này tồn tại trong chuỗi phụ tải, nhưng với STLF thì thời gian

đưa ra dự báo về cơ bản ngắn hơn chiều dài của chu kỳ hàng năm; do đó, có thể

phỏng đoán rằng các phương pháp dự báo ngắn hạn STLF không cần thiết phải mô

hình hóa tính mùa và vẫn đảm bảo độ tin cậy, thay vào đó sẽ tập trung đánh giá theo

dựa theo tính chu kỳ với khoảng thời gian ngắn hạn như chu kỳ theo tuần, chu kỳ

ngày (Weron (2006) và Taylor (2008)).

Gần đây một số tác giả đã đề xuất mô hình chi tiết có xét tới xu hướng và

tính thời vụ hàng năm. Soares and Mederios (2008) đã mô phỏng xu hướng tải như

là một hàm xác định của tổng sản phẩm quốc nội; Dordonnat et al. (2008) đã ước

tính xu hướng tuyến tính cục bộ theo mỗi giờ trong ngày. Dordonnat et al. (2008) và

Soares và Mederios (2008) đã mô hình hóa tính chu chu kỳ hàng năm như là tổ hợp

của các hàm sin và cosin giống trong phân tích chuỗi Fourier.

• Xử lý các mẫu trong-tuần và trong-ngày

Khi lập mô hình phụ tải điện theo giờ (hoặc nửa giờ) cần quan tâm tới hai

yếu tố chính là dạng đồ thị phụ tải điển hình của ngày và tuần trong các mùa. Trong

bài toán STLF tồn tại hai cách tiếp cận chính để xử lý các đồ thị phụ tải ngày: sử

dụng mô hình một phương trình cho tất cả các giờ hoặc sử dụng mô hình đa phương

trình với các phương trình khác nhau cho các giờ khác nhau trong ngày. Cách tiếp

cận đầu tiên cho phép áp dụng các mô hình có khả năng mô hình hóa tính động của

của cả mô hình tuần và ngày, như mô hình ARIMA theo mùa kép hoặc phương

pháp làm mịn theo cấp số mũ cho mùa kép (Taylor (2008)). Một cách tiếp cận khác

để nắm bắt mô hình biểu đồ phụ tải ngày là coi mỗi giờ là một chuỗi thời gian riêng

biệt. Một cách đơn giản nhất, phương pháp này sử dụng 24 mô hình độc lập cho 24

giờ trong ngày; các phương pháp phức tạp hơn bao gồm các mô hình vectơ trong đó

các phương trình cho các giờ khác nhau có liên hệ chéo (Ramanathan et al. (1997),

Cottet and Smith (2003), Dordonnat et al. (2008) hoặc Soares and Mederios

(2008)). Nhìn chung phương pháp dùng mô hình riêng biệt cho mỗi giờ được sử

dụng rộng rãi hơn.

• Xử lý ảnh hưởng của các biến thời tiết

Các điều kiện khí tượng có ảnh hưởng đáng kể đến phụ tải tiêu thụ điện. Các

yếu tố như nhiệt độ, bức xạ mặt trời, độ ẩm, tốc độ gió, tình trạng mây mù, hay

lượng mưa đã từng sử dụng như là các biến ngoại sinh để cải tiến dự báo phụ tải

điện. Tuy nhiên, theo Weron (2006) & kết quả khảo sát dự báo phụ tải (Hippert et

al. 2001a) đã cho thấy hầu hết nghiên cứu đều có xét đến ảnh hưởng của nhiệt độ và

chỉ có rất ít nghiên cứu xét thêm ảnh hưởng của các yếu tố thời tiết khác. Việc chỉ

sử dụng biến nhiệt độ cũng một phần do dữ liệu thường có sẵn trong khi các dữ liệu

khác về thời tiết thường không đầy đủ (Soares and Mederios 2008).

Nhiều nghiên cứu đã tìm ra được mối tương quan giữa phụ tải điện và nhiệt

độ ngoài trời (Engle et al. 1986; Sailor and Mu˜ noz 1997; Valor et al. 2001; Pardo

et al. 2002; Moral-Carcedo and Vic’ ens-Otero 2005; Cancelo et al. 2008) và mức

độ tương quan. Mặc dù mối liên hệ này phụ thuộc vào đặc trưng khí hậu của vùng

địa lý đang xem xét, tuy nhiên mối liên hệ này rất đa dạng và phức tạp, ví dụ phụ tải

điện có thể tăng lên dù nhiệt độ có tăng hay giảm. Lý do là khi nhiệt độ giảm thì

việc sử dụng hệ thống sưởi tăng lên, khi nhiệt độ tăng thì việc sử dụng điều hòa lại

tăng; do vậy mối liên hệ này được coi là không tuyến tính. Ngoài ra mối liên hệ

tương quan còn thay đổi tùy theo ngày làm việc hay ngày nghỉ, tùy theo tháng của

năm (Cancelo et al. 2008).

Để giải mối quan hệ phi tuyến này S´anchez-Ubeda and Wehenkel (1998) đã

đề xuất mô hình phân đoạn nhiệt độ: vùng lạnh (dưới 15 độ), vùng trung gian (15-

17 độ), vùng nóng (trên 17 độ). Trong trường hợp các dữ liệu thời tiết được cho với

nhiều kịch bản khác nhau thì có thể sử dụng mô hình học máy kết hợp (Taylor và

Buizza 2003), trong đó dự báo phụ tải được tính toán theo nhiều kịch bản và đưa ra

kết quả dự báo theo một khoảng giá trị.

• Xử lý các ngày sự kiện theo lịch

Đồ thị phụ tải phụ thuộc vào loại ngày đang xét là ngày làm việc, ngày cuối

tuần, ngày nghỉ lễ…do đó các mô hình dự báo thường được xây dựng riêng cho

ngày bình thường của tuần, ngày lễ trong tuần (Ramanathan et al. 1997). Mặt hạn

chế của phương pháp này là khó khăn khi xử lý những ngày lễ đặc biệt như ngày

đầu năm mới. Để giải quyết bài toán dự báo cho các ngày lễ đặc biệt này cần mô

hình có sử dụng các biến phụ (Moral-Carcedo and Vicens-Otero 2005).

b) Trong nước

Ở nước ta, đã có một vài nghiên cứu về dự báo phụ tải điện nhưng vẫn còn

nặng về nghiên cứu phương pháp luận và học thuật, chưa đi vào số liệu cụ thể, sai

số dự báo còn cao và nhất là khả năng áp dụng còn nhiều giới hạn. Các đề tài trong

nước nghiên cứu về các vấn đề dự báo ngắn hạn phụ tải điện như sau:

− Đề tài nghiên cứu cấp Bộ Công Thương của Viện Năng Lượng do Trần

Kỳ Phúc làm chủ nhiệm năm 2008. Đề tài “Nghiên cứu ứng dụng mạng Nơron nhân

tạo trong dự báo ngắn hạn phụ tải điện” [71]. Theo đó, đề tài nghiên cứu thiết kế mô

hình, lập phần mềm thử nghiệm dự báo đỉnh – đáy – dạng biểu đồ phụ tải ngày

dùng mạng neuron nhiều lớp thuật toán lan truyền ngược sai số MLP và mạng một

lớp thuật toán học không giám sát Kohonen.

− Mạng Wavelet cho bài toán dự báo phụ tải ngắn hạn trong các ngày đặc

biệt của TS. Nguyễn Hoàng Việt, Trần Anh Dũng và Nguyễn Quang Thi – Tạp chí

phát triển KH&CN, tập 10 số 6 – 2007 [72].

− Ứng dụng mạng Neural song tuyến trong bài toán dự báo phụ tải điện

của Trần Thị Hoàng Oanh, Trần Hoàng Lĩnh, Đồng Sĩ Thiên Châu và Nguyễn Kỳ

Tài - Tạp chí phát triển KH&CN, tập 10 số 11 – 2007 [73].

− Mô hình dự báo phụ tải ngắn hạn dựa trên phương pháp xử lý dữ liệu

nhóm của Lê Đình Dương – ISSN 1859-1531 - Tạp Chí Khoa Học và Công Nghệ

Đại Học Đà Nẵng, VOL. 17, NO. 7, 2019 [77]. Theo đó, Thuật toán GMDH có thể

được biểu diễn dưới dạng một tập hợp các nơron trong đó các cặp khác nhau trong

mỗi lớp được kết nối thông qua đa thức bậc hai và do đó tạo ra các nơron mới ở lớp

tiếp theo. GMDH hoạt động bằng cách xây dựng các lớp liên tiếp với các liên kết

(hoặc kết nối) phức tạp là các mục của một đa thức. Lớp ban đầu chỉ đơn giản là lớp

đầu vào. Lớp đầu tiên được thực hiện bằng cách hồi quy của các biến đầu vào và

sau đó chọn các biến tốt nhất. Lớp thứ hai được tạo bằng cách tính hồi quy của các

giá trị trong lớp đầu tiên cùng với các biến đầu vào. Điều này có nghĩa là thuật toán

về cơ bản xây dựng các đa thức của đa thức.

Ngoài ra, còn có một số nghiên cứu liên quan đến công tác dự báo ứng dụng

trong các lĩnh vực kinh tế, thời tiết,... Cụ thể:

− Ứng dụng mô hình ARIMA để dự báo VNINDEX, TS. Võ Thị Thúy

Anh Khoa Tài Chính – Ngân hàng, Trường Đại học Kinh tế Tuyển tập Báo cáo Hội

nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 [74].

Theo đó, đề tài đề xuất sử dụng mô hình ARIMA và phương pháp Box-jenkins để

dự báo chỉ số VnIndex trong ngắn hạn căn cứ vào chuỗi dữ liệu quá khứ.

− Xây dựng mô hình mô phỏng tốc độ gió từng giờ từ tốc độ gió trung bình

hàng tháng. Nguyễn Thế Bảo – Trường Đại học Bách khoa HCM, Trần Hồng Hà –

Trung tâm kiểm định kỹ thuật an toàn khu vực 2; Science & Technology

Development, Vol 9, No.7- 2006 [75]. Bài báo trình bày một phương pháp mô hình

hóa thống kê tuyến tính và quy trình mô phỏng cho phép tạo ra chuỗi số liệu tốc độ

gió từng giờ cho cả năm với số liệu đầu vào là tốc độ gió trung bình hàng tháng. Kết

quả so sánh số liệu mô phỏng từ mô hình với số liệu quan sát thực tế cho thấy mô

hình đảm bảo độ tin cậy để tạo ra chuỗi số liệu tốc độ gió đầu vào trong các bài toán

mô phỏng kỹ thuật, nhất là các bài toán về năng lượng gió.

− Một số phương pháp khai phá dữ liệu chuỗi thời gian trong dự báo tài

chính, chứng khoán (mô hình ARIMA) – Nguyễn Ngọc Thiệp – Trường Đại học

Công Nghệ - Đại học Quốc Gia Hà Nội [76]. Đề tài nghiên cứu, thi hành mô hình

ARIMA (từ các nghiên cứu của Box- Jenkins) và ứng dụng vào bài toán khai phá

dữ liệu chuỗi thời gian trong dự báo tài chính, chứng khoán và cách áp dụng vào bài

toán thực tế - dự báo sự lên xuống của thị trường chứng khoán Việt Nam.

1.3. Các yếu tố tác động đến các mô hình dự báo phụ tải ngắn hạn

Dự báo phụ tải ngắn hạn trong vận hành thị trường điện thường là dự báo

phụ tải cho ngày tới, tuần tới với chu kỳ 60/30 phút, nó được chia thành các loại

ngày trong tuần, chẳng hạn như: ngày bình thường (thứ ba đến thứ 6); ngày thứ 2;

ngày thứ 7; ngày chủ nhật, các ngày lễ, Tết (Dương lịch và Nguyên Đán); các kỳ

nghỉ trong năm. Mỗi loại ngày có một đặc điểm hình thái riêng của nó, do đó mô

hình dự báo được thiết lập phải làm sao phản ánh được các đặc tính này.

Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có xu hướng

tương đồng mô hình tải trước đó, tuy nhiên, nó sẽ dẫn đến dự đoán sai giữa các

ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó

tác động. Ngoài ra, sự biến đổi theo mùa, xu thế khí tượng học (như El nino, La

nina) cũng được xem xét cẩn thận.

Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết

có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm),

nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt

độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần

phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải

điện và nhiệt độ ước tính được sử dụng cho đầu vào thay vì số thực. Tuy nhiên,

không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có

thể làm giảm độ chính xác của kết quả dự báo.

Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn đề cần

được quan tâm và khó dự đoán nhất đó chính là các ngày lễ, Tết Nguyên Đán

(thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch). Thường kết

quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày

dương lịch và ngày âm lịch.

Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ

của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để

làm dữ liệu đầu vào huấn luyện. Như trình bày trên, do đặc thù là nước sử dụng cả

lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị

ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết

quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02. Quan sát biểu

đồ phụ tải của tháng 01 và tháng 02, chúng ta sẽ thấy có sự biến động rất lớn về

hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu quá khứ để dự báo

cho khoảng thời gian này là hết sức phức tạp. Trên thực tế, các thuật toán khi áp

dụng để dự báo cho Việt Nam đều phải thực hiện qua một khâu trung gian đó là qui

đổi các tháng này thành các tháng thông thường và sau khi chạy kết quả dự báo sẽ

qui đổi ngược lại hoặc là chấp nhận sai số lớn. Các phần mềm thương mại do nước

ngoài cung cấp đều gặp rắc rối này.

Thêm nữa, với sự tác động của biến đổi khí hậu toàn cầu thì các số liệu dự

báo thời tiết gần đây hầu như không chuẩn xác và khoảng thời gian dự báo tin cậy

cũng rất ngắn chỉ từ 05 đến 07 ngày, khó đáp ứng yêu cầu ngày càng cao của các

qui định thị trường điện bán buôn cạnh tranh (các Tổng công ty Điện lực phải công

bố bảng chào Qc tháng N+1 24 chu kỳ trước ngày 20 của tháng N,…).

1.4. Mục tiêu của luận án

− Xây dựng mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) –

Support Vector Regression (SVR) để tối ưu giảm thiểu các yếu tố làm ảnh hưởng

đến kết quả dự báo phụ tải ngắn hạn và đáp ứng các yêu cầu về dự báo ngắn hạn

của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.

− Áp dụng giải thuật của mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn

vị (SLP) – Support Vector Regression (SVR) vào thực tế dự báo ngắn hạn của

EVNHCMC, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện

cạnh tranh, đánh giá, hiệu chỉnh kết quả dự báo Qc, hạn chế các rủi ro và tận dụng

được các biến động của thị trường để tính toán chi phí tối ưu nhất cho giá điện.

1.5. Nhiệm vụ và giới hạn của luận án

Nội dung đề tài được thể hiện trong các vấn đề chính như sau:

− Nghiên cứu các phương pháp ứng dụng trong dự báo vận hành thị trường

điện trên thế giới và tại Việt Nam để chọn cơ sở xây dựng mô hình Biểu đò phụ tải.

− Nghiên cứu các yếu tố ảnh hưởng đến phụ tải và ảnh hưởng đến chi phí

gía điện, khảo sát các ảnh hưởng của khi hậu Việt nam đến dự báo: đặc tính, các

thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo

tháng, theo ngày và theo giờ (thành phần xu hướng, thành phần chu kỳ, thành phần

bất qui tắc và thành phần theo mùa).

− Nghiên cứu các mô hình dự báo tiên tiến trên thế giới để xây dựng giải

thuật mới để áp dụng dự báo phụ tải theo từng tháng/năm; dự báo ngày/tháng và dự

báo phụ tải 24 giờ/ngày, có xem xét tác động của yếu tố thời tiết và các yếu tố tác

động khác (nếu có), tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối

và bán lẻ cạnh tranh.

− Nghiên cứu các kỹ thuật ước lượng lại dữ liệu bị lỗi, thiếu và sai sót.

− Thiết kế đề xuất mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị

(SLP) – Support Vector Regression (SVR) để tối ưu giảm thiểu các yếu tố làm ảnh

hưởng đến kết quả dự báo phụ tải ngắn hạn và đáp ứng các yêu cầu về dự báo ngắn

hạn của Cục Điều Tiết Điện lực (ERAV).

− Tiến hành thực nghiệm ứng dụng mô hình vào Chương trình dự báo phụ

tải phục vụ Vận hành Thị trường điện bán buôn cạnh tranh theo qui định của Thông

tư 45/2018/TT-BCT ngày 15 tháng 11 năm 2018 của Bộ Công Thương về

Quy định vận hành Thị trường bán buôn điện cạnh tranh.

− Dựa trên kết quả khảo nghiệm đánh giá sự ảnh hưởng của thị trường điện

đến công tác dự báo nhu cầu phụ tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi

nhuận của hoạt động Sản xuất – Kinh doanh các Tổng công ty Điện lực phân phối

trong thị trường điện.

1.6. Phương pháp nghiên cứu

− Thống kê, tổng hợp và xử lý các số liệu điện thương phẩm, công suất cực

đại – cực tiểu (Pmax – Pmin), tốc độ phát triển điện, tốc độ tăng trưởng của nền

kinh tế, số liệu thống kê nhiệt độ thời tiết, giá điện các thành phần,… dữ liệu quá

khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ trong các

năm vừa qua (từ khoảng 4 – 5 năm).

− Phân tích và xử lý các thành phần của chuỗi dữ liệu quá khứ điện năng

ghi nhận theo thời gian (theo năm, theo tháng, theo ngày và theo giờ) để xác định

các thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc, và chuỗi dữ

liệu phụ thuộc theo biến đổi khí hậu và theo mùa.

− Nghiên cứu mô hình thống kê Box-Jenkin (SARIMA), nghiên cứu các

mô hình học máy tiên tiến như: Neural Network, Support Vector Regression,

Random Forest,… để xây dựng mô hình dự báo (dự báo ngắn hạn, trung hạn) theo

yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.

− Nghiên cứu và đánh giá sự ảnh hưởng thị trường điện đến việc dự báo

nhu cầu phụ tải điện. Đồng thời, xác định các mối quan hệ tác động ảnh hưởng đến

các thành phần phụ tải, dự báo xu hướng để xây dựng kế hoạch phát triển dài hạn.

− Thiết kế và mô phỏng các modules về xử lý dữ liệu, về các giải thuật dự

báo sử dụng Matlab; Bộ dữ liệu sử dụng trong luận án là bộ dữ liệu được thu thập

trong quá trình vận hành hệ thống điện của EVNHCM và dữ liệu vận hành Thị

trường điện bán buôn (VWEM) của A0.

1.7. Đóng góp của luận án

− Luận án đã nghiên cứu, xây dựng được công cụ tự động ước lượng các

dữ liệu bị lỗi là những dữ liệu thiếu, sai sót, ngoại lai,…(trước đây phải thực hiện

bằng phương pháp thủ công). Đã đề xuất Mô hình kết hợp biểu đồ chuẩn hóa đơn vị

(SLP) và Support Vector Regression (SVR) trong kỹ thuật ước lượng lại dữ liệu bị

lỗi.

− Luận án đã xây dựng thành công giải thuật mới là sử dụng biểu đồ phụ

tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm

hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp nhất giúp dự

báo ước lượng được các tác động về thời gian (như chênh lệch ngày âm và ngày

dương) và các sự kiện truyền thống(như ngày lễ hội, ngày đặc biệt trong năm và các

ngày trong các tháng 01 và 02 là tháng có Tết âm lịch).

− Luận án tiến hành thử nghiệm các mô hình dự báo tiên tiến theo xu

hướng của thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo

(học máy) – mô hình Support Vector Regression (SVR); mạng Neural Network,

Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Trên kết quả thử

nghiệm tác giả đã phân tích đánh giá các giải thuật xây dựng đường cong hồi qui

của từng mô hình, với những bộ trọng số khác nhau, để từ đó lựa chọn được mô

hình có sai số phù hợp làm hàm dự báo STLF.

− Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị

trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế

tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang

về lợi ích tối ưu nhất.

1.8. Ý nghĩa thực tiễn của luận án

Việc dự báo nhu cầu phụ tải điện có ý nghĩa khác nhau đối với các đơn vị có

chức năng khác nhau khi tham gia vào thị trường điện, cụ thể:

− Xây dựng được cho ngành điện thêm một công cụ dự báo mang tính ứng

dụng cao giải quyết các vấn đề của thực trạng thị trường điện tại Việt nam và các

vấn đề còn đang nghiên cứu: về sai số dự báo, kết quả và năng lực dự báo thị trường

điện và khả năng áp dụng vào thực tế còn giới hạn;

− Việc áp dụng giải thuật của mô hình tác giả đề xuất vào thực tế để dự báo

ngắn hạn của EVNHCMC đã cung cấp kết quả dự báo cho các nhà quản lý điều

hành thị trường điện cạnh tranh bước đầu rất khả thi.

− Kết quả của luận án sẽ giúp các thành viên tham gia thị trường dự báo

nhu cầu phụ tải trước để lên kế hoạch sản xuất kinh doanh, lập kế hoạch phân bổ

nguồn vốn đầu tư một cách hợp lý để tối ưu hoá lợi nhuận, hạn chế rủi ro.

− Mô hình của Luận án sẽ giúp những đơn vị điều hành thị trường điện dự

báo nhu cầu phụ tải và giá điện để xác định phản ứng của thị trường tại vào các thời

điểm khác nhau từ đó có chiến lược điều tiết thị trường một cách hợp lý.

1.9. Bố cục của luận án

Luận án được xây dựng với bố cục như sau:

CHƯƠNG I: TỔNG QUAN GIỚI THIỆU

Nội dung giới thiệu tổng quan tình hình nghiên cứu liên quan đến dự báo giá

điện trên thế giới, và trong nước, lý do chọn đề tài và mục tiêu nghiên cứu của luận

án, phạm vi và phương pháp nghiên cứu, tổng kết điểm mới của luận án và dự kiến

những giá trị thực tiễn từ luận án nghiên cứu.

CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ

TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU

Nội dung chương 2 nêu tổng quan về các Phương pháp dự báo ngắn hạn. Các

phương pháp thu thập và phân tích dữ liệu và xử lý dữ liệu. Khảo sát phân tích về

các dữ liệu thiếu, sai số trong dự báo do các giá trị còn thiếu. Khảo sát các kỹ thuật

xử lý chuỗi dữ liệu.

Trong chương này tác giả đề xuất phương pháp xây dựng đường cong hồi qui

bằng giải thuật huấn luyện SVR (Support Vector Regression), từ đó ước lượng, xử

lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu, dự báo phụ tải điện.

CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA

ĐƠN VỊ

Chương này đề cập đến việc nghiên cứu/phân tích phụ tải để hiểu rõ hơn về

những gì chúng ta đang cố gắng dự báo (xu hướng, tổng nhu cầu, sự khác biệt các

vùng, đặc tính tải,...), kiểm tra bất kỳ biến động đặc thù nào đó và là cách tuyệt vời

để kiểm tra dữ liệu sai. Đồng thời, tác giả đã xây dựng khái niệm Biểu đồ phụ tải

chuẩn hóa đơn vị (Standardized Load Profiles - SLP) và Ứng dụng xử lý dữ liệu

thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR)

theo cấp độ theo 24 chu kỳ/ ngày.

CHƯƠNG IV: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN

Nội dung của chương đề xuất, thiết kế lập trình Module mô hình dự báo phụ

tải ngắn hạn (STLF) ứng dụng thực tế để xây dựng các chiến lược kinh doanh, đảm

bảo tin cậy và an toàn cho hệ thống điện.

Đề xuất giải thuật mới là Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị

(SLP) - Support Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng

với bộ dữ liệu của 05 Tổng công ty Điện lực).

Ngoải ra, trong chương này tác giả còn chạy thử nghiệm được nhiều mô hình

dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình

SARIMA; Trí tuệ nhân tạo (học máy) – mạng Neural Network, Feedforward

Networks; Rừng ngẫu nhiên (Random Forest) để so sánh đánh giá, để từ đó lựa

chọn được mô hình có sai số phù hợp làm hàm dự báo STLF.

CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN

CẠNH TRANH CỦA VIỆT NAM

Chương này tác giả tiến hành thực nghiệm và thu thập dữ liệu, cung cấp các

thông tin tổng quan về thị trường điện cạnh tranh Việt Nam và tác giả cũng đã ứng

dụng mô hình thiết kế để áp dụng vào thực tế để đưa ra các kết quả dự báo dài hạn

(5-10 năm), dự báo theo tháng/ năm và kết quả dự báo ngắn hạn 24/48 chu kỳ của

365 ngày/năm theo đúng qui định của thị trường cho Tổng công ty Điện lực

TP.HCM.

Chương này cũng đánh giá việc áp dụng giải thuật này vào thực tế dự báo

ngắn hạn của EVNHCMC trong các năm vừa qua (đánh giá thông qua sai số dự báo

theo chu kỳ/ngày/tuần/tháng/năm), cũng như tác giả đã có những phân tích thật sự

sâu về tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự

báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến

dộng của thị trường để mang về lợi nhuận cao nhất.

CHƯƠNG VI – KẾT LUẬN

Chương này tổng hợp các nội dung đã nghiên cứu và trình bày trong luận án,

tóm lược các điểm mới và hạn chế trong quá trình nghiên cứu và định hướng phát

triển tiếp theo của luận án.

CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU

2.1. CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG

2.1.1. Các phương pháp thống kê

(1) Phương pháp bình quân di động

Phương pháp này sử dụng khi các số liệu trong dãy số biến động không lớn

lắm. Các số bình quân di động được tính từ các số liệu của dãy số thời gian có

khoảng cách đều nhau.

Chẳng hạn có dãy số thời gian tính theo tháng gồm các số liệu y1, y2,….., y12,

trong đó các yi biến động không lớn, nếu tính bình quân di động theo từng nhóm 3

thành phần ta có:

yI = (y1 + y2 + y3) / 3

yII = (y2 + y3 + y4) / 3 (2.1)

……

(2) Phương pháp bình quân di động có trọng số

Những số liệu mới xuất hiện trong các thời kỳ cuối có giá trị lớn hơn những

số liệu xuất hiện đã lâu. Để xét đến vấn đề này ta sử dụng các trọng số để nhấn

mạnh giá trị các số liệu gần nhất, vừa xảy ra.

Việc chọn các trọng số phụ thuộc vào kinh nghiệm và sự nhạy cảm của

người làm công tác dự báo. Công thức tính:

(Trọng số thời kỳ n x Nhu cầu thời kỳ n) Số bình quân di = (2.2) động có trọng số  Các trọng số

(3) Phương pháp san bằng số mũ

Phương pháp này rất tiện lợi khi dùng máy tính. Đây cũng là kỹ thuật tính số

bình quân di động nhưng không đòi hỏi phải có nhiều số liệu quá khứ. Công thức

tính nhu cầu tương lai như sau:

(2.3) Ft =F(t-1) + [A(t-1) - F(t-1)]

trong đó:

Ft – Nhu cầu dự báo thời kỳ t

F(t-1) – Nhu cầu dự báo thời kỳ t -1

A(t-1) – Số liệu nhu cầu dự báo thời kỳ t - 1

 – hệ số san bằng 0 ≤  ≤ 1

Hệ số  có thể thay đổi để xét đến trọng số lớn hơn của những số liệu ở các

thời gian gần hơn. Lúc này công thức dự báo sẽ là:

Ft = A(t-1) + (1-)A(t-2) + (1-)2A(t-3) +…..+ (1-)n-1A(t-n) (2.4)

Lựa chọn hệ số : Hệ số  có ảnh hưởng trực tiếp đến kết quả dự báo. Để

chọn  người ta dựa vào độ lệch tuyệt đối bình quân MAD (Mean Absolute

Deviation). MAD càng nhỏ thì trị số  càng hợp lý vì nó cho kết quả dự báo ít sai

lệch.

 Các sai lệch trong dự toán F.E (2.5) MAD = =

 n  Số thời kỳ tính toán

Thường người ta lần lượt tính độ lệch tuyệt đối AD (Absolute deviation) và

độ lệch tuyệt đối bình quân MAD theo từng hệ số = 0,1 và 0,5 xem hệ số nào cho

MAD bé hơn sẽ được chọn.

(4) Phương pháp san bằng số mũ có điều chỉnh xu hướng

Phương pháp san bằng số mũ giản đơn không thể hiện rõ xu hương biến

động. Do đó cần phải sử dụng thêm kỹ thuật điều chỉnh xu hướng. Cách làm như

sau: đầu tiên tiến hành dự báo theo phương pháp san bằng số mũ giản đơn sau đó sẽ

thêm vào một lượng điều chỉnh (có thể âm hay dương)

Tính toán theo công thức: FITt = Ft + Tt

Lượng điều chỉnh Dự báo nhu cầu theo Dự báo nhu cầu cho (2.6) = + theo xu hướng thời kỳ mới xu hướng

trong đó:

FIT (Forecart inchiding trend) – Dự báo nhu cầu theo xu hướng

Ft (New forecart) – Dự báo nhu cầu cho thời kỳ mới

Tt (Trend correction) – Lượng điều chỉnh theo xu hướng

Để xác định phương trình xu hướng dùng khi điều chỉnh ta sử dụng hệ số san

bằng số mũ . Ý nghĩa và cách sử dụng hệ số này cũng giống như hệ số .

Tt = Tt-1 + (Ft - Ft-1) (2.7)

trong đó:

Tt – Lượng điều chỉnh dự báo theo xu hướng trong thời kỳ t

Tt-1 – Lượng điều chỉnh dự báo theo xu hướng trong thời kỳ t-1

 – Hệ số san bằng mà ta lựa chọn

Ft – Lượng dự báo nhu cầu theo phương pháp san bằng số mũ giản đơn Ft ở

thời kỳ t

Ft-1 – Lượng dự báo nhu cầu trong thời kỳ t-1

Phương pháp Winter là một trong một số phương pháp làm mịn hàm mũ giúp

phân tích các chuỗi thời gian theo mùa một cách trực tiếp. Phương pháp này được

dựa trên ba hằng số làm mịn cho tính dừng, xu hướng và mùa. Kết quả phân tích

của Barakat et al. [2] cho thấy rằng mô hình độc đáo của năng lượng và nhu cầu liên

quan đến các khu vực phát triển nhanh rất khó để phân tích và dự đoán bằng cách áp

dụng trực tiếp phương pháp Winter. El-Keib et al. [3] trình bày một cách tiếp cận

lai, trong đó làm mịn hàm mũ được tăng cường với phân tích phổ điện và mô hình

tự điều chỉnh tự hồi quy.

(5) Phương pháp dự báo theo đường khuynh hướng

Các phương pháp dự báo theo đường khuynh hướng cũng dựa vào dãy số

thời gian. Dãy số này cho phép ta xác định đường khuynh hướng lý thuyết trên cơ

sở kỹ thuật bình phương cực tiểu, tức là tổng khoảng cách từ các điểm thể hiện nhu

cầu thực tế trong quá khứ đến đường khuynh hướng lấy theo trục tung là nhỏ nhất.

Sau đó dựa vào đường khuynh hướng lý thuyết ta tiến hành dự báo nhu cầu cho các

năm trong tương lai.

Có thể sử dụng được đường khuynh hướng dự báo theo đường khuynh

hướng để dự báo ngắn hạn, trung và dài hạn. Đường khuynh hướng có thể là tuyến

tính hay phi tuyến.

Để xác định được đường khuynh hướng là tuyến tính trước hết ta cần biểu

diễn các nhu cầu thực tế trong quá khứ lên biểu đồ và phân tích xu hướng phát triển

của các số liệu đó. Qua phân tích nếu thấy rằng các số liệu tăng hay giảm tương đối

đều đặn theo một chiều hướng nhất định thì ta có thể vạch ra một đường biểu hiện

chiều hướng đó. Nếu các số liệu biến động theo hướng đặc biệt hơn như tăng giảm

ngày càng nhanh hay ngày càng biến động chậm thì ta có thể sử dụng các đường

cong thích hợp để mô tả biến động đó (đường parabol, hyperbol, logarit,…)

Dưới đây trình bày về một số phương pháp đường thẳng khuynh hướng:

a) Phương pháp đường thẳng thống kê

Sử dụng phương trình đường thẳng sau: Yf = aX + b (2.8)

Các hệ số a và b tính như sau: ;

trong đó:

X – Thứ tự thời gian

Y – Số liệu nhu cầu thực tế trong quá khứ

n – Số lượng các số liệu có được trong quá khứ

Yf – Giá trị nhu cầu dự báo ở tương lai

b) Phương pháp đường thẳng thông thường

Phương pháp này còn có thể được gọi là phương pháp đường thẳng bình

phương cực tiểu. Nhưng cách gọi này không thật chính xác vì kỹ thuật bình phương

cực tiểu được sử dụng cả trong phương pháp đường thẳng thống kê và cả trong các

đường phi tuyến khác.

Sử dụng phương trình dự báo: Yf = aX + b (2.9)

Bằng kỹ thuật tính bình phương cực tiểu ta có:

;

trong đó:

X – Thứ tự thời gian (năm) trong dãy số, đánh theo thứ tự tự nhiên

từ 1 trở lên, không phân biệt số lượng số liệu là chẵn hay lẻ.

Y – Giá trị trong quá khứ đã thực hiện

n – Số lượng các số liệu có được trong quá khứ

Yf – Giá trị nhu cầu dự báo trong tương lai

c) Phương pháp theo khuynh hướng có xét đến biến động thời vụ

Đối với những số liệu dự báo có tính chất biến động theo thời vụ trong năm

như thời tiết, địa lý, tập quán của người tiêu dùng,… nên sử dụng phương pháp này.

Để dự báo như cầu cần khảo sát mức độ biến động nhu cầu theo thời vụ bằng cách

tính chỉ số thời vụ trên cơ sở dãy số thời gian điều tra được.

Chỉ số thời vụ tính theo công thức sau: (2.10)

trong đó:

– Chỉ số thời vụ Is

yi – Số bình quân của các tháng cùng tên

y0 – Số bình quân chung của tất của các tháng trong dãy số

Nhu cầu dự báo xét đến biến động thời vụ có công thức tính như sau:

Ys = Is x Yf

d) Phương pháp đường Parabol thống kê

Khi phân tích các số liệu trong quá khứ trên đồ thị mà thấy đường xu hướng

biến đổi không tuân thủ theo đường thẳng mà dạng đường cong parabol thì lúc đó

nên dùng phương pháp đường parabol để dự báo.

Phương trình dự báo có dạng:

Yc = aX2 + bX + c (2.11)

Bằng kỹ thuật tính bình phương cực tiểu ta có:

; ;

Các ký hiệu cũng tương tự như cũ. Các thứ tự của X lấy theo phương pháp

thống kê tuỳ theo số lượng số liệu chẵn hay lẻ, mục đích là để X = 0.

e) Phương pháp đường Logarit

Phương trình dự báo có dạng: log Yf = X log a + log b (2.12)

trong đó: ;

Các ký hiệu cũng tương tự như cũ, các thứ tự của X lấy theo phương pháp

thống kê. Kết quả dự báo được log Yf, lấy biến đổi ngược log sẽ được Yf.

(6) Phương pháp đa hồi qui (Multiple regression method)

Phân tích đa hồi quy cho dự báo tải sử dụng kỹ thuật ước lượng bình phương

các trọng số tối thiểu. Dựa trên phân tích này, mối quan hệ thống kê giữa tổng tải và

điều kiện thời tiết cũng như ảnh hưởng của kiểu ngày có thể được tính toán. Các hệ

số hồi quy được tính bằng một ước lượng bình phương bằng hoặc ít nhất theo cấp

số mũ theo số học bằng số lượng dữ liệu đã xác định.

(7) Dự báo từ các mô hình chuỗi thời gian (mô hình BOX-JENKINS)

Các mô hình kinh tế lượng chủ yếu dựa trên một động thái rõ nét của các đối

tượng có liên quan đến hệ thống kinh tế. Tuy nhiên một họ các mô hình thay thế

khác được sử dụng rộng rãi, đặc biệt trong dự báo ngắn hạn, được gọi là các mô

hình chuỗi thời gian. Chủ yếu, các mô hình này nối kết một biến phụ thuộc với các

giá trị của nó trong quá khứ và với các sai số ngẫu nhiên mà có thể có tương quan

theo chuỗi. Một các tổng quát, các mô hình chuỗi thời gian không dựa trên bất kỳ

một động thái kinh tế rõ nét nào.

Cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến nhất

trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập kỷ gần đây,

các phương pháp chuỗi thời gian đã được sử dụng rất rộng rãi trong kinh tế học đặc

biệt là trong dự báo ngắn hạn, trong đó các mô hình chuỗi thời gian đã chứng tỏ là

thích hợp hơn so với các mô hình kinh tế lượng.

Một phương pháp rất phổ biến trong việc lập mô hình chuỗi thời gian là

phương pháp trung bình trượt kết hợp tự hồi quy (autoregressive integrated

moving average - ARIMA), thường được gọi là phương pháp luận Box-Jenkins.

Trọng tâm của các phương pháp dự báo mới này không phải là xây dựng các mô

hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác

suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế theo triết lý “hãy để dữ

liệu tự nói”.

Không giống như các mô hình hồi quy trong đó Yt được giải thích bởi k biến

làm hồi quy X1, X2, X3, ..., Xk, trong các mô hình chuỗi thời gian kiểu Box-Jenkins,

Yt có thể được giải thích bởi các giá trị trong quá khứ hay giá trị trễ của bản thân

biến Y và các sai số ngẫu nhiên. Vì lý do này, các mô hình ARIMA đôi khi được

gọi là mô hình lý thuyết a bởi vì các mô hình này không thể suy ra được từ bất cứ lý

thuyết kinh tế nào - và các lý thuyết kinh tế thường là cơ sở cho các mô hình

phương trình đồng thời.

Sau đây là một hình theo phương pháp luận Box-Jenkins trong quá trình dự

báo từ mô hình chuỗi thời gian [5] – [9]:

a) Mô hình tự hồi quy (AR):

Mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau:

(2.14)

* là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị

hay

Trong đó Yt

trung bình (μ) của chính nó, và ut là thành phần sai số có trung bình bằng 0 và

phương sai không đổi, và không tương quan với us nếu t ≠ s (khái niệm này gọi là

nhiễu trắng – white noise). Thành phần hằng số được bỏ qua vì Yt được biểu diễn

dạng độ thiên lệch khỏi giá trị trung bình. Nói cách khác, Yt được mô hình hóa chỉ

với quá khứ của nó và không với các biến độc lập khác. Đây là các mô hình tự hồi

qui, AR và mô hình trong phương trình trên được gọi là mô hình AR (p), với p là

bậc tự hồi quy.

- Nếu ta lập mô hình Yt như sau: (Yt - μ) = α1(Yt-1 - μ) + ut

với μ là giá trị trung bình của Y và ut là một số hạng sai số ngẫu nhiên không

tương quan (có giá trị trung bình bằng 0 và phương sai không đổi σ2) thì ta nói rằng

Yt tuân theo quá trình ngẫu nhiên tự hồi quy bậc nhất hay AR(1). Ở đây, giá trị Y

trong thời đoạn t phụ thuộc vào giá trị của nó trong thời đoạn trước và vào một yếu

tố ngẫu nhiên; các giá trị của Y được biểu diễn dưới dạng độ lệch khỏi giá trị trung

bình của nó. Nói một cách khác, mô hình này cho biết giá trị dự báo của Y trong

thời đoạn t chỉ đơn giản là tỷ lệ (α1) của giá trị của nó trong thời đoạn (t - 1) cộng

với yếu tố nhiễu ngẫu nhiên trong thời gian t; một lần nữa, các giá trị của Y được

biểu diễn xung quanh giá trị trung bình của nó.

- Nhưng nếu xem xét mô hình sau:

(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + ut

thì ta có thể nói rằng Yt tuân theo quá trình tự hồi quy bậc hai hay AR(2).

Tức là, giá trị của Y trong thời đoạn t phụ thuộc vào giá trị của nó trong hai thời

đoạn trước đó, với các giá trị của Y được biểu diễn xung quanh giá trị trung bình μ.

Nói chung, ta có thể viết mô hình sau:

(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + … + αp(Yt-p - μ) + ut (2.15)

Trong trường hợp này, Yt là quá trình tự hồi quy bậc p hay AR(p).

b) Mô hình trung bình trượt (MA)

Quá trình AR vừa đề cập trên không phải là cơ chế duy nhất có thể tạo ra

chuỗi dữ liệu Y.

- Giả sử ta lập mô hình Y như sau: (2.16)

với μ là hằng số và ut là số hạng sai số nhiễu ngẫu nhiên thuần túy. Ở đây, Y

trong thời gian t bằng một hằng số cộng với trung bình trượt của sai số hiện tại và

quá khứ. Vậy trong trường hợp này, ta nói rằng Y tuân theo quá trình trung bình

trượt bậc nhất hay MA(1).

- Nhưng nếu Y tuân theo biểu thức:

thì đó là một quá trình trung bình trượt bậc hai hay MA(2).

- Tổng quát hơn, ta có mô hình cho quá trình trung bình trượt bậc q hay

MA(q): . (2.17)

c) Các mô hình ARIMA

Phối hợp giữa các mô hình tự hồi quy (AR) và trung bình trượt (MA) ta tạo

ra được mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát:

(2.18)

• Sai phân hoá

Hầu hết các chuỗi dữ liệu trong kinh tế luôn có tính không dừng bởi vì

chúng tăng trưởng dần theo thời gian. Chẳng hạn, nếu Yt có xu hướng theo thời gian

dạng tuyến tính hay lũy thừa thì nó sẽ không dừng. Việc ước lượng của quá trình

ARMA đòi hỏi Yt phải là một chuỗi dừng. Hầu hết các chuỗi thời gian không dừng

đều có thể được chuyển thành dạng dừng thông qua quá trình sai phân hóa.

Giả sử, xét một xu hướng tuyến tính có dạng Yt = α + βt. Sai phân bậc nhất

của Yt được định nghĩa là: ΔYt = Yt –Yt-1.

Ta thấy: ΔYt = α + βt – α – β(t–1) = β là hằng số và do đó nó có tính dừng.

Do đó, xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai phân một lần. Nếu

một chuỗi tăng trưởng theo lũy thừa với mức tăng không đổi, ln(Yt) sẽ có xu hướng

tuyến tính và có thể lấy sai phân.

Dễ dàng chứng minh được là xu hướng bậc 2 có thể được loại bỏ bằng cách

lấy sai phân 2 lần. Sai phân bậc hai (ký hiệu là Δ2Y) được định nghĩa là sai phân

bậc nhất của sai phân bậc nhất. Do đó:

Một dạng khác mà trong đó tính không dừng thường xuất hiện đó là tính

mùa. Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể được

loại bỏ bằng cách lấy sai phân thích hợp: Δ4 = Yt – Yt-4 đối với dữ liệu theo quý và

Δ12 = Yt – Yt-12 đối với dữ liệu theo tháng.

• Mô hình ARIMA

Đa số dữ liệu kinh tế theo chuỗi thời gian không có tính dừng mà có tính kết.

Để nhận được dữ liệu có tính dừng, chúng ta phải sử dụng sai phân của dữ liệu.

+ Các bậc sai phân

- Sai phân bậc 0 là I(0): chính là dữ liệu gốc Yt.

- Sai phân bậc 1 là I(1): wt = Yt – Yt-1. (2.19)

t = wt – wt-1

- Sai phân bậc 2 là I(2): w2

- Sai phân bậc d ký hiệu I(d).

Mô hình ARMA(p,q) áp dụng cho I(d) được gọi là mô hình ARIMA(p,d,q).

• Mô hình SARIMA

Trong mô hình ARIMA nếu chúng ta tính toán sai phân bậc nhất với độ trễ

lớn hơn 1 để khử tính mùa vụ như sau wt = Yt – Yt-s, với s là số kỳ giữa các mùa thì

mô hình lúc này được gọi là SARIMA hay ARIMA có tính mùa vụ.

2.1.2. Phương pháp chuyên gia

(1) Phương pháp tính hệ số vượt trước (hệ số đàn hồi)

Phương pháp này xác định tỷ số của nhịp độ phát triển năng lượng điện với

nhịp độ phát triển của nền kinh tế quốc dân. Phương pháp này giúp ta thấy được

khuynh hướng phát triển của nhu cầu và sơ bộ cân đối nhu cầu này với nhịp độ phát

triển của nền kinh tế quốc dân nói chung.

Ví dụ, trong giai đoạn 5 năm 1994 - 1999, sản lượng công nghiệp tăng 185%,

còn sản lượng điện năng cũng trong thời gian ấy tăng 194%, như vậy hệ số vượt

trước sẽ là: K = 194 / 185 = 1,05

Như vậy phương pháp này chỉ nói lên xu thế phát triển với một mức độ

chuẩn xác nào đó và trong tương lai xu thế này còn chịu ảnh hưởng của các nhân tố

biến động không lường trước khác như:

- Suất tiêu hao năng lượng với mỗi sản phẩm công nghiệp ngày càng

giảm xuống do tiến bộ về mặt kỹ thuật và về mặt quản lý.

- Điện năng ngày càng được sử dụng rộng rãi trong lĩnh vực kinh tế xã

hội và trong cuộc sống.

- Cơ cấu kinh tế không ngừng thay đổi,…

Vì những lý do nêu trên nên hệ số giá trị vượt trước biến động khá nhiều, nên

nếu dùng hệ số vượt trước (hệ số đàn hồi) để xác định nhu cầu điện năng ở năm dự

báo sẽ không hoàn toàn chuẩn xác.

(2) Phương pháp tính trực tiếp

Phương pháp này xác định nhu cầu điện năng của năm dự báo, dựa trên tổng

sản lượng kinh tế của các ngành ở năm đó và suất tiêu hao điện năng đối với từng

loại sản phẩm. Đối với những trường hợp không có suất tiêu hao điện năng thì xác

định nhu cầu điện năng cho từng trường hợp cụ thể (như công suất điện trung bình

cho 1 hộ gia đình, bệnh viện, trường học, ...). Phương pháp tính trực tiếp được sử

dụng phổ biến ở những nước kinh tế phát triển có kế hoạch, ổn định và không bị

khủng hoảng.

Phương pháp này có ưu điểm là tính toán đơn giản, và ngoài việc xác định

tổng điện năng dự báo, chúng ta còn biết được tỷ lệ sử dụng điện năng trong các

ngành kinh tế, chẳng hạn tỷ lệ dùng điện trong công nghiệp, nông nghiệp, dân

dụng,.. cũng như xác định được nhu cầu điện năng ở các khu vực địa lý khác nhau,

như vậy tạo điều kiện thuận lợi cho công tác thiết kế quy hoạch cung cấp điện. Tuy

nhiên mức độ chính xác của phương pháp này bị phụ thuộc vào mức độ chính xác

của tổng sản lượng các ngành kinh tế quốc dân trong tương lai, cũng như phụ thuộc

vào suất tiêu hao điện. Phương pháp này thường được áp dụng để dự báo nhu cầu

điện năng với thời gian ngắn và trung bình.

(3) Phương pháp ngoại suy theo thời gian

Phương pháp ngoại suy theo thời gian nghiên cứu sự diễn biến của nhu cầu

điện năng trong một thời gian quá khứ tương đối ổn định, tìm ra quy luật và áp dụng

quy luật ấy ra để dự đoán cho tương lai. Phương pháp này chỉ cho ta kết quả chính

xác nếu tương lai không có nhiều thay đổi lớn so với quá khứ và sự phát triển ở

tương lai phải tuân theo đúng quy luật ở quá khứ.

Giả sử mô hình dự báo có dạng hàm mũ như sau: At = Ao (1+ α)t (2.20)

trong đó:

At – điện năng dự báo ở năm thứ t

Ao – điện năng ở năm chọn làm gốc

α – tốc độ phát triển bình quân hàng năm

t – thời gian dự báo

Để xác định thừa số (1+ α) dựa vào biểu thức trên ta có:

At+1 / At = 1+ α = C

Qua kết quả quan sát được các giá trị điện năng của nhiều năm liên tiếp trong

quá khứ, ta xác định các giá trị Ci tương ứng, và tính được hằng số C bằng cách lấy

trung bình nhân của các Ci trong nhiều năm:

Một cách tổng quát mô hình dự báo điện năng có thể viết như sau:

At = AoCt

Lấy log biểu thức này ta có: logAt = logAo + t logC,

đặt y = logAt ; b = logAo ; a = logC.

Vậy ta có hàm dự báo: Y= b + at, và dùng phương pháp bình phương cực

tiểu để xác định hệ số a, b.

(4) Phương pháp tương quan

Phương pháp này nghiên cứu mối tương quan giữa các thành phần kinh tế

nhằm phát hiện những quan hệ về mặt định lượng của các tham số trong nền kinh tế

quốc dân, dựa vào những phương pháp thống kê toán học. Cụ thể mang mục đích

của chúng ta là dự báo nhu cầu điện năng, cho nên ta cần nghiên cứu sự tương quan

giữa điện năng tiêu thụ với các chỉ tiêu kinh tế khác như tổng giá trị sản lượng công

nghiệp, tổng giá trị sản lượng kinh tế quốc dân (đồng/năm).

Ví dụ sau khi ta quan sát thống kê được giá trị của tổng điện năng tiêu thụ,

tổng giá trị sản lượng kinh tế quốc dân từng năm 1991 đến 2000, căn cứ vào đó ta

xây dựng mô hình biểu diễn sự tương quan giữa điện năng tiêu thụ với giá trị sản

lượng quốc dân. Mô hình dự báo này còn gọi là phương trình hồi quy, tuỳ theo mối

liên hệ giữa chúng mà mô tả dưới dạng phương trình tuyến tính, phương trình bậc 2

hay hàm mũ.

(5) Phương pháp đối chiếu so sánh

Phương pháp này so sánh đối chiếu nhu cầu phát triển điện năng của các

nước có hoàn cảnh phát triển kinh tế - xã hội hoàn toàn tương tự. Phương pháp này

chỉ nên dùng kiểm tra, xử lý lại kết quả dự báo mà ta đã dùng phương pháp ngoại

suy và phương pháp tương quan.

(6) Phương pháp chuyên gia

Trong những năm gần đây người ta quan tâm nhiều và đánh giá cao những

kinh nghiệm của các chuyên gia trong lĩnh vực dự báo, qui hoạch trong các ngành

của nền kinh tế quốc dân, để dự báo các chỉ tiêu kinh tế. Chuyên gia ở đây chúng ta

có thể hiểu là cá nhân, hay 1 công trình kết quả tính toán dự báo của 1 viện nghiên

cứu hay công trình nào đó đã thực hiện.

2.1.3. Trí tuệ nhân tạo, học máy

Trí tuệ nhân tạo là một lĩnh vực nghiên cứu tương đối mới. Thuật toán tính

toán thường được sử dụng để chỉ các lĩnh vực của hệ thống mờ, mạng nơ ron nhân

tạo (ANN) và học máy.

(1) Fuzzy logic

Chúng ta biết rằng một hệ thống logic mờ với việc giải mờ có thể xác định

và gần đúng bất kỳ hệ thống động không xác định nào (ở đây là tải) trên thiết lập

nhỏ gọn đến độ chính xác tùy ý. Liu [11] đã quan sát thấy rằng một hệ thống logic

mờ có khả năng tuyệt vời trong việc vẽ các điểm tương đồng từ dữ liệu khổng lồ.

Sự tương đồng về dữ liệu đầu vào (L-i-L0) có thể được xác định bằng các khác biệt

thứ nhất khác nhau (Vk) và sự khác biệt bậc hai (Ak), được định nghĩa là:

(2.21)

Trình dự báo dựa trên logic mờ hoạt động theo hai giai đoạn: đào tạo và dự

báo trực tiếp. Trong giai đoạn đào tạo, dữ liệu tải quá khứ được sử dụng để đào tạo

một bộ đếm thời gian dựa trên mô-đun 2m đầu vào, 2n đầu ra để tạo cơ sở dữ liệu

mẫu và cơ sở nguyên tắc mờ bằng cách sử dụng sự khác biệt thứ nhất và thứ hai của

dữ liệu. Sau khi đào tạo đủ, nó sẽ được liên kết với một bộ điều khiển để dự đoán

thay đổi tải trực tuyến. Nếu có thể tìm thấy mô hình phù hợp nhất với khả năng cao

nhất, thì mô hình đầu ra sẽ được tạo ra thông qua một phần mềm giải mờ centroid

[12] – [23], kết hợp ba kỹ thuật logic mờ, mạng nơ-ron và các hệ thống chuyên gia

trong một phương pháp tiếp cận STLF lai tự động cao với cách học không giám sát.

(2) Neural networks

Mạng thần kinh được mô phỏng theo nguyên tắc hoạt động cơ bản của bộ

não con người. Chúng bao gồm một vài nơ-ron, một nơ-ron nhận được thông tin về

các nút đầu vào và tổng hợp thông tin. Sau đó, nó xác định kích hoạt của nó và

truyền phản ứng của nó qua nút đầu ra cho các nơ-ron khác. Mạng thần kinh thường

được áp dụng cho dự báo tải (xem ví dụ Hippert và cộng sự [24] để kiểm tra).

Hình 2.1 – Mạng nơ-ron truyền thẳng

Một mạng nơ-ron truyền thẳng bao gồm một vài lớp kế tiếp các nơ-ron với

một một nơ-ron đầu vào, một số lớp ẩn và một lớp đầu ra, các nơ-ron được kết nối

bằng các vectơ trọng số. Phương pháp học cơ bản hoặc điều chỉnh trọng số là sự

truyền ngược trở lại giá trị lỗi và điều chỉnh trọng số cho phù hợp [25] – [36].

(3) Genetic algorithms

Các thuật toán di truyền (GAs) đại diện cho một cách tiếp cận mạnh mẽ và

có hiệu quả cao để phát triển cho các vấn đề tối ưu hoá tổ hợp quy mô lớn. Nói

chung, GA mã hoá vấn đề thành một tập hợp các chuỗi, mỗi chuỗi gồm một vài bit,

sau đó hoạt động trên các chuỗi để mô phỏng quá trình tiến hóa [37] – [42]. Trong

lĩnh vực STLF, có rất ít phương pháp dự báo tải dựa trên GA đã được báo cáo

nhưng kết quả đáng khích lệ đã xuất hiện [43] – [44]. Gần đây, [45] – [50] đã sử

dụng một GA để phát triển cấu trúc mạng thần kinh tối ưu và kết nối trọng lượng

cho một ngày trước vấn đề dự báo tải điện.

(4) Mô hình Bộ hồi quy dựa theo vector hỗ trợ – Support vector

regression (SVR)

Ý tưởng cơ bản của SVR là ánh xạ không gian đầu vào sang một không gian

đặc trưng nhiều chiều mà ở đó, ta có thể áp dụng được hồi quy tuyến tính (mà nếu

ta áp dụng trực tiếp hồi quy tuyến tính thì không hiệu quả).

Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để

xây dựng được hàm hồi quy, ta không cần phải sử dụng hết tất cả các điểm dữ liệu

trong bộ huấn luyện. Những điểm có đóng góp vào việc xây dựng hàm hồi quy

được gọi là những Support Vector. Việc phân lớp cho một điểm dữ liệu mới sẽ chỉ

phụ thuộc vào các support vector.

Hình 2.2 – Biến đổi không gian dữ liệu sang không gian đặc trưng (thủ thuật Kernel)

Hàm hồi quy cần tìm có dạng:

(2.22)

Trong đó: là véc tơ trọng số; T là kí hiệu chuyển vị; là hằng

số; là véc tơ đầu vào; là véc tơ đặc trưng;  làm hàm ánh xạ từ

không gian đầu vào sang không gian đặc trưng [51] – [55].

Như vậy, mục tiêu của việc huấn luyện SVR là tìm ra được w và b.

Cho tập huấn luyện {(x1, t1), (x2, t2), …, (xN, tN)} . Với bài toán

hồi quy đơn giản, để tìm w và b ta phải tối thiểu hóa hàm lỗi chuẩn hóa:

với  là hằng số chuẩn hóa (2.23)

Để có được một giải pháp thưa, ta sẽ thay hàm lỗi trên bằng hàm lỗi ε-

insensitive. Đặc điểm của hàm lỗi này là nếu trị tuyệt đối của sự sai khác giữa giá trị

dự đoán y(x) và giá trị đích nhỏ hơn ε (với ε> 0) thì nó coi như độ lỗi bằng 0.

Như vậy bây giờ, ta phải tối thiểu hóa hàm lỗi chuẩn hóa sau:

(2.24)

Với , C là hằng số chuẩn hóa giống như  nhưng được

nhân với hàm lỗi thay vì .

Để cho phép một số điểm nằm ngoài ống ε, ta sẽ đưa thêm các biến lỏng

(slack variable) vào. Đối với mỗi điểm dữ liệu , ta cần hai biến lỏng và

, trong đó ứng với điểm mà (nằm ngoài và phía trên

ống) và ứng với điểm mà (nằm ngoài và phía dưới ống).

Hình 2.3 – Minh họa cho các biến lỏng

Điều kiện để một điểm đích nằm trong ống là: với yn =

y(xn). Với việc sử dụng các biến lỏng, ta cho phép các các điểm đích nằm ngoài ống

(ứng với các biến lỏng > 0) và như thế thì điều kiện bây giờ sẽ là:

(2.25)

Như vậy, ta có hàm lỗi cho SVR:

(2.26)

Mục tiêu của ta là tối thiểu hóa hàm lỗi này với các ràng buộc:

(2.27)

Dùng hàm Lagrange và điều kiện Karush-Kuhn-Tucker, ta có bài toán tối ưu

hóa tương đương:

(2.28)

Với k là hàm nhân: . Bất kỳ một hàm nào thỏa điều

kiện Mercer thì đều có thể được dùng làm hàm nhân. Hàm nhân được sử dụng phổ

biến nhất là hàm Gaussian:

Cực đại hóa với các ràng buộc:

(2.29)

Từ đây, ta có hàm hồiqui của SVR:

(2.30)

Như vậy, với SVR sử dụng hàm lỗi ε-insensitive và hàm nhân Gaussian ta có

ba tham số cần tìm: hệ số chuẩn hóa C, tham số  của hàm nhân Gaussian và độ

rộng của ống ε [56] – [62]. Cả ba tham số này đều ảnh hưởng đến độ chính xác dự

đoán của mô hình và cần phải chọn lựa kỹ càng. Nếu C quá lớn thì sẽ ưu tiên vào

phần độ lỗi huấn luyện, dẫn đến mô hình phức tạp, dễ bị quá khớp. Còn nếu C quá

nhỏ thì lại ưu tiên vào phần độ phức tạp mô hình, dẫn đến mô hình quá đơn giản,

giảm độ chính xác dự đoán. Ý nghĩa của ε cũng tương tự C. Nếu ε quá lớn thì có ít

vectơ hỗ trợ, làm cho mô hình quá đơn giản. Ngược lại, nếu ε quá nhỏ thì có nhiều

vectơ hỗ trợ, dẫn đến mô hình phức tạp, dễ bị quá khớp. Tham số  phản ánh mối

tương quan giữa các vectơ hỗ trợ nên cũng ảnh hưởng đến độ chính xác dự đoán

của mô hình.

(5) Mô hình Rừng ngẫu nhiên (Random Forest Regression)

RF là một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman

(2001) [63]. Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản

được xây dựng bằng cách sử dụng thuật toán Bagging [64]. Khi xây dựng một cơ sở

phân loại, các nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên

ngẫu nhiên.

Trong CART truyền thống, mỗi nút bên trong là tập con của tập dữ liệu ban

đầu và nút gốc chứa tất cả dữ liệu ban đầu. Các rừng ngẫu nhiên để hồi quy được

hình thành bằng cách hình thành cây dựa vào một vector ngẫu nhiên sao cho cây

tiên đoán có các giá trị số cao hơn so với các nhãn lớp. Tập huấn luyện được rút ra

một cách độc lập từ sự phân bố của vector ngẫu nhiên, các dự đoán rừng ngẫu nhiên

được hình thành bằng cách lấy trung bình trên k của cây. Giải thuật rừng ngẫu nhiên

sinh ra mô hình có độ chính xác cao đáp ứng được yêu cầu thực tiễn cho vấn đề

phân loại, hồi qui [65] – [70].

Giải thuật rừng ngẫu nhiên có thể được trình bày ngắn gọn như sau:

Hình 2.4 – Thuật toán Rừng ngẫu nhiên Hồi qui

• Từ tập dữ liệu học LS có m phần tử và n biến (thuộc tính), xây dựng T

cây quyết định một cách độc lập nhau.

• Mô hình cây quyết định thứ t được xây dựng trên tập mẫu Bootstrap thứ t

(lấy mẫu m phần tử có hoàn lại từ tập học LS).

• Tại nút trong, chọn ngẫu nhiên n’ biến (n’<

tốt nhất dựa trên n’ biến này.

• Cây được xây dựng đến độ sâu tối đa không cắt nhánh.

Kết thúc quá trình xây dựng T mô hình cơ sở, dùng chiến lược bình chọn số

đông để phân lớp một phần tử mới đến hoặc giá trị trung bình cho bài toán hồi quy.

2.2. KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU

2.2.1 Thu thập, phân tích và xử lý dữ liệu

❖ Thu thập dữ liệu

Bước thực hiện thu thập các dữ liệu bao gồm ba nhiệm vụ chính:

a) Xác định yêu cầu dữ liệu

Điều đầu tiên cần thực hiện khi lập kế hoạch thu thập dữ liệu là phải xác định

xem các dữ liệu nào là cần thiết để có thể giải quyết bài toán. Về tổng thể, có thể

cần sự trợ giúp của các chuyên gia trong lĩnh vực của bài toán cần giải quyết. Cần

biết: i) Các dữ liệu chắc chắn có liên quan đến bài toán; ii) Các dữ liệu nào có thể

liên quan; iii) Các dữ liệu nào là phụ trợ. Các dữ liệu có liên quan và có thể liên

quan đến bài toán cần phải được xem là các đầu vào cho hệ thống.

b) Xác định nguồn dữ liệu

Bước kế tiếp là quyết định nơi sẽ lấy dữ liệu, điều này cho phép ta xác định

được các ước lượng thực tế về những khó khăn và phí tổn cho việc thu thập dữ liệu.

Nếu ứng dụng yêu cầu các dữ liệu thời gian thực, những ước lượng này cần tính đến

khả năng chuyển đổi các dữ liệu tương tự thành dạng số. Trong một số trường hợp,

ta có thể chọn lựa dữ liệu mô phỏng từ các tình huống thực tế. Tuy nhiên, cần phải

quan tâm đến độ chính xác và khả năng thể hiện của dữ liệu đối với các trường hợp

cụ thể.

c) Xác định lượng dữ liệu

Ta cần phải ước đoán số lượng dữ liệu cần thiết để có thể sử dụng trong việc

xây dựng giải thuật. Nếu lấy quá ít dữ liệu thì những dữ liệu này sẽ không thể phản

ánh toàn bộ các thuộc tính mà giải thuật cần xử lý. Mặt khác, cũng không nên đưa

vào quá nhiều dữ liệu đầu vào làm cho giải thuật thêm phức tạp.

Việc định lượng gần đúng lượng dữ liệu cần đưa vào xử lý là hết sức cần

thiết. Thông thường, dữ liệu thường thiếu hoàn chỉnh (trong một số trường hợp dữ

liệu ghi nhận bị đứt quản do thiết bị ghi nhận bị sự cố hoặc nhân viên vận hành

quên ghi nhận), do đó nếu muốn giải thuật có khả năng thực hiện được những điều

mà ta mong đợi thì nó cần phải được xử lý với lượng dữ liệu lớn hơn.

❖ Chuỗi thời gian

Dữ liệu chuỗi thời gian là dữ liệu được thu nhập, lưu trữ và quan sát theo sự

tăng dần của thời gian. Ta thường ký kiệu chuỗi thời gian là với là các số tự

nhiên. là các biến ngẫu nhiên rút ra từ một phân bố xác suất nào đó. Để tìm ra

được những phương pháp dự báo phù hợp cho chuỗi thời gian, chúng ta phải xác

định được các thành phần tạo nên chuỗi thời gian đó.

Dữ liệu hiện đang được thu nhập, lưu trữ và quan sát là chuỗi dữ liệu theo sự

tăng dần của thời gian, do đó để tìm ra được những phương pháp dự báo phù hợp

cho chuỗi thời gian, chúng ta phải xác định được các thành phần tạo nên chuỗi thời

gian đó. Các nghiên cứu trước đây hầu như chưa thật sự quan tâm đến bản chất của

dữ liệu mà chỉ chú trọng vào việc tìm kiếm giải thuật nên chưa khai thác được hết

dữ liệu để nâng cao độ chính xác của dự báo.

Những thành phần cơ bản của chuỗi thời gian bao gồm: xu hướng, chu kỳ,

thành phần mùa và bất qui tắc:

− Thành phần xu hướng (trend): Chuỗi dữ liệu quan sát tăng hoặc giảm trong

suốt thời đoạn quan sát. Đây là thành phần dài hạn (long term). Những chuỗi

thời gian có chứa thành phần xu hướng thường gặp như: sự gia tăng dân số,

tốc độ lạm phát, tăng trưởng của sản xuất, tốc độ tăng trưởng phụ tải,...

− Thành phần chu kỳ (cyclical): Những giá trị quan sát tăng lên, hoặc giảm

xuống trong những khoảng thời gian khác nhau. Thành phần chu kì thường

có dao động dạng sóng quanh trục xu hướng. Thường xuất hiện bởi sự gia

tăng hoặc thu hẹp trong kinh tế.

− Thành phần mùa (seasonal): Những thay đổi lặp lại hằng năm được gọi là

tính mùa của chuỗi thời gian. Chu kì của những chuỗi thời gian có thể là

tháng, quí, hoặc là 6 tháng,… Ví dụ: nhu cầu mua sắm dụng cụ học tập

thường cao trong giai đoạn tháng 8, tháng 9 hằng năm. Tính mùa thường

phản ánh điều kiện thời tiết hay những kì nghỉ trong năm.

− Thành phần bất qui tắc (irregular): Là thành phần thể hiện sự biến đổi ngẫu

nhiên không thể đoán được của chuỗi thời gian.

Để nhận dạng ra đặc điểm và các thành phần của chuỗi thời gian, các nhà dự

báo thường dùng các công cụ toán học. Đặc biệt, hai công cụ phổ biến và rất quan

trọng là hàm tự tương quan (ACF) và hàm tự tương quan riêng phần (PACF) trong

lớp mô hình ARIMA.

a) Hàm tự tương quan (ACF)

Hàm tự tương quan (ACF) ở độ trễ k được ký hiệu là , và được định nghĩa

như sau:

❖ Tính chất của ACF

(2.31)

- Giá trị không có thứ nguyên.

- Giá trị của nằm trong khoảng giữa -1 và 1.

Trong thực tế chúng ta chỉ có thể có số liệu thực tế là kết quả của quá trình

ngẫu nhiên, do đó chúng chỉ có thể tính toán được hàm tự tương quan mẫu (SAC),

với

và

ký hiệu là .

(2.32)

b) Hàm tự tương quan riêng phần (PACF)

Hệ số tự tương quan riêng phần với độ trễ k đo lường tương quan của Yt-k

với Yt sau khi loại trừ tác động tương quan của tất các các độ trễ trung gian. Công

thức tính PACF như sau:

với

được tính toán ở phần trên (SAC)

(2.33)

Bằng cách sử dụng các công cụ hàm tự tương quan (ACF), hàm tự tương

quan riêng phần (PACF), và các biểu đồ tương quan, chúng ta sẽ xác định các biến

trễ p, q và áp dụng vào trong các mô hình AR, MA, ARMA, ARIMA,… của

phương pháp luận Box-Jenkins, và đảm bảo tuân thủ theo qui luật sau:

Loại mô hình Dạng tiêu biểu của ACF Dạng tiêu biểu của PACF

AR(p) Đỉnh cao đáng kể qua các độ trễ p. Suy giảm theo số mũ hay với dạng sóng hình sin tắt dần hay cả hai.

MA(q) Suy giảm theo số mũ Đỉnh cao đáng kể qua các độ trễ q

ARMA(p, q) Suy giảm theo số mũ Suy giảm theo số mũ

c) Chuỗi thời gian không tĩnh

Chuỗi thời gian không tĩnh rất khó để biểu diễn bằng mô hình toán học và

thực hiên dự báo. Tuy nhiên, trong thực tế ta gặp rất nhiều dữ liệu thời gian là chuỗi

không tĩnh. Do đó ta cần chuyển đổi chuỗi thời gian không tĩnh thành chuỗi thời

gian tĩnh, đồng nghĩa với việc loại bỏ thành phần xu hướng ra khỏi chuỗi thời gian

không tĩnh. Một trong những phương pháp phổ biến được sử dụng là phương pháp

lấy hiệu (differencing).

Đối với một chuỗi thời gian không tĩnh , ta áp dụng toán tử lấy hiệu lên

để được một chuỗi thời gian mới với

(2.34)

Nếu là chuỗi tĩnh thì ta xây dựng mô hình mô tả rồi từ đó suy ra .

Nếu vẫn là chuỗi không tĩnh, ta tiếp tục áp dụng toán tử cho chuỗi .

2.2.2 Nhận biết các thành phần của chuỗi thời gian bằng phương pháp phân

tích hệ số tự tương quan

❖ Thành phần xu hướng (trend)

Là thành phần thể hiện sự tăng hay giảm giá trị của chuỗi thời gian trong một

giai đoạn dài hạn nào đó. Nếu một chuỗi thời gian có chứa thành phần xu hướng sẽ

có hệ số tự tương quan rất lớn ở những độ trễ đầu tiên và giảm dần về 0 khi độ trễ

tăng lên. Dưới đây ta xét đến chuỗi dữ liệu ghi nhận điện năng tiêu thụ của Tổng

Công ty Điện lực TP.HCM theo từng tháng từ năm 1997 đến năm 2015, điện năng

có biến đổi theo từng năm và có xung hướng biến đổi tăng theo thời gian.

Hình 2.1 – Thống kê điện thương phẩm

Một chuỗi thời gian có chứa thành phần xu hướng là chuỗi thời gian không

tĩnh (nonstationary). Hệ số tự tương quan của chuỗi thời gian không tĩnh thường rất

lớn ở những độ trễ đầu tiên và giảm dần theo sự tăng của độ trễ.

Hình 2.2 – Hệ số tự tương quan của chuỗi thời gian không tĩnh

Quan sát ta thấy hệ số tự tương quan tại độ trễ giảm dần nhưng không về

không, điều đó cho thấy đây là chuỗi thời gian không tĩnh (nonstationary) và thay

đổi theo một xu hướng nhất định.

❖ Thành phần chu kỳ (cyclical)

Là chuỗi biến đổi dạng sóng quanh xu hướng. Trong thực tế thành phần này

rất khó xác định bởi vì những dao động dạng sóng quanh xu hướng luôn thay đổi cả

về biên độ và khoảng thời gian xuất hiện. Do đó người ta thường xem nó như là một

phần của thành phần xu hướng.

Ví dụ xét một chuỗi ghi nhận công suất cực đại – Pmax từng ngày trong

tháng 10/2018, ta thấy sự lập lại có tính chu kỳ 07 ngày của dữ liệu:

Hình 2.3 – Thống kê hệ số Pmax của tháng 10/2018

Hình 2.4 – Hệ số tương quan của Pmax tháng 10/2018

Quan sát ta thấy hệ số tự tương quan ở độ trễ là 1, 7, 14 sẽ khác không một

cách có ý nghĩa và lập đi lập lập lại theo chu kỳ 7. Do đó, qua phân tích ACF chúng

ta thấy tính chu kỳ lặp đi lặp lại (chu kỳ 7 ngày) của dữ liệu.

❖ Thành phần mùa (Seasonal)

Đối với chuỗi thời gian có thành phần mùa thì giá trị tại những thời điểm cố

định theo từng năm sẽ có sự tương quan lớn với nhau. Xét đến chuỗi dữ liệu ghi

nhận điện năng tiêu thụ của Tổng Công ty Điện lực TP.HCM theo từng tháng từ

năm 2011 đến năm 2018.

Hình 2.5 – Bảng thống kê điện thương phẩm theo từng tháng

Hình 2.6 – Hệ số tương quan của 12 tháng của năm

Do chuỗi không dừng nên ta tính sai phân bậc 1 và tính Hệ số tự tương quan

của chuỗi sai phân. Quan sát ta thấy tại các độ trễ 0; 12; 24 có biên độ lớn thể hiện

tính lập đi lặp lại của dữ liệu, thể hiện tính mùa vụ 12 tháng của giá trị điện năng

đang xét (theo từng tháng từ năm 2011 đến năm 2018).

Như vậy, việc xác định một chuỗi thời gian có thành phần xu hướng hay

thành phần mùa rất quan trọng trong bài toán dự báo chuỗi thời gian. Nó không

những giúp ta lựa chọn được mô hình dự đoán phù hợp, mà còn giúp cải tiến mô

hình đã có chuẩn xác hơn.

2.2.3 Thiếu giá trị trong khai thác dữ liệu

Thiếu giá trị và các vấn đề của nó là rất phổ biến trong quá trình điền đầy dữ

liệu. Một số phương pháp đã được đề xuất để xử lý dữ liệu bị mất trong bộ dữ liệu

và tránh các vấn đề gây ra bởi nó. Mục này thảo luận về các vấn đề khác nhau gây

ra bởi các giá trị còn thiếu và những cách khác nhau mà chúng ta có thể giải quyết.

Thiếu dữ liệu là một vấn đề quen thuộc và không thể tránh khỏi trong các bộ

dữ liệu lớn và được thảo luận rộng rãi trong lĩnh vực khai phá dữ liệu và thống kê.

Do đó phân tích tác động của các vấn đề gây ra bởi các giá trị còn thiếu và tìm ra

các giải pháp để giải quyết với chúng là một vấn đề quan trọng trong lĩnh vực Điền

đầy và Chuẩn bị Dữ liệu. Trong mục này, chúng ta thảo luận về những khiếm

khuyết khác nhau mà chúng ta phải đối mặt khi nói đến dữ liệu bị thiếu và xem

chúng có thể được giải quyết như thế nào.

a) Các loại khác nhau của việc thiếu dữ liệu

Vấn đề thiếu dữ liệu nằm ở hầu hết các cuộc điều tra và các thí nghiệm được

thiết kế. Một trong những phương pháp phổ biến là bỏ qua các trường hợp thiếu các

giá trị, việc bỏ qua các trường hợp thiếu các giá trị đôi khi có thể dẫn đến việc loại

bỏ một phần lớn của bộ dữ liệu dẫn đến kết quả không thích hợp.

Các loại cơ chế bị thiếu khác được nêu dưới đây:

❖ MCAR – Missing Completely at Random

Thuật ngữ “Thiếu hoàn toàn ngẫu nhiên” dùng để chỉ dữ liệu ở đó cơ chế mất

dữ liệu không phụ thuộc vào biến số quan tâm, hay bất kỳ biến nào khác, được quan

sát trong tập dữ liệu [64]. Ở đây dữ liệu được thu thập và được quan sát một cách

tùy tiện và dữ liệu thu thập không phụ thuộc vào bất kỳ biến số khác của tập dữ liệu.

Loại dữ liệu bị thiếu này rất hiếm khi được tìm thấy và phương pháp tốt nhất là bỏ

qua các trường hợp như vậy.

❖ MAR – Missing at Random

Đôi khi dữ liệu có thể không bị mất một cách ngẫu nhiên nhưng có thể được

gọi là “Thiếu ở chế độ ngẫu nhiên”. Chúng ta có thể xem xét một tập Xi như mất dữ

liệu một cách ngẫu nhiên nếu dữ liệu đáp ứng yêu cầu rằng sự thiếu sót không phụ

thuộc vào giá trị của Xi sau khi kiểm soát một biến khác.

❖ NAMR – Not missing at Random

Nếu dữ liệu không bị thiếu ở một cách ngẫu nhiên hoặc thiếu thông tin thì nó

được gọi là “Không thiếu ở dạng ngẫu nhiên”. Tình huống như vậy xảy ra khi cơ

chế mất dữ liệu phụ thuộc vào giá trị thực tế của dữ liệu bị thiếu [78]. Mô hình hóa

một điều kiện như vậy là một nhiệm vụ rất khó khăn để đạt được. Điều này có nghĩa

là chúng ta cần phải viết một mô hình cho dữ liệu bị thiếu và sau đó tích hợp nó vào

một mô hình phức tạp hơn để ước lượng các giá trị còn thiếu.

b) Phần tử ngoại lai

Phần tử ngoại lai trong cơ sở dữ liệu gồm hai loại: i) loại thứ nhất là các dữ

liệu được thu thập hoặc tạo sinh theo một quy luật khác với các dữ liệu khác và

được xem là dữ liệu sai hay dữ liệu không hợp lệ; ii) loại thứ hai là dữ liêu hợp lệ

nhưng có những đặc điểm khác biệt so với đa số dữ liệu.

Cả hai loại đều có đặc tính chung là có dấu hiệu khác biệt so với đa số các dữ

liệu khác, vấn đề đặt ra là phát triển các phần mềm để phát hiện tự động các phần tử

có dấu hiệu khác biệt trong CSDL cho phép các chuyên gia xác định xem cần loại

bỏ nó ra khỏi CSDL hay cần xử lý đặc biệt đối với các phần tử ngoại lai được phát

hiện này. Đến nay, ngoài các phương pháp xác định dữ liệu ngoại lai bằng phương

pháp thống kê, có nhiều công trình nghiên cứu về phát hiện phần tử ngoại lai. Các

phương pháp chính để xác định phần tử ngoại lai bao gồm:

❖ Xác định phần tử ngoại lai theo khoảng cách (Distance-Based):

Theo hướng tiếp cận này cần phải xác định một hàm đo khoảng cách (metric)

giữa các phần tử trong tập dữ liệu. Các phần tử ngoại lai là những phần tử nằm khá

xa với tập các phần tử còn lại.

❖ Xác định theo thống kê (Statistical-Based):

Hướng nghiên cứu này dựa trên việc xác định các mô hình phân phối thống

kê mà các phần tử phải tuân theo (phân phối chuẩn, phân phối X2...). Phần tử ngoại

lai là những phần tử không tuân theo các luật này.

❖ Xác định theo độ khác hiệt (Deviation-Based):

Hướng nghiên cứu này dựa trên việc xác định những đặc trưng cơ bản của

các phần tử trong một tập các phần tử. Các phần tử có những đặc trưng khác biệt

quá lớn so với các phần tử còn lại thì là các phần tử ngoại lai.

2.2.4 Dữ liệu thiếu trong nghiên cứu phụ tải điện

Nghiên cứu phụ tải là hoạt động phân tích biểu đồ phụ tải hệ thống điện

nhằm chia thành biểu đồ của các thành phần phụ tải, phân nhóm phụ tải, các khách

hàng sử dụng điện cuối cùng và các công nghệ sử dụng điện, để đưa ra các thông tin

quan trọng như: Công suất và thời gian xuất hiện phụ tải đỉnh; Xu hướng tăng

trưởng của Phụ tải đỉnh và Hệ số phụ tải; Chênh lệch phụ tải cao/thấp điểm của hệ

thống; Lập kế hoạch, thiết kế và triển khai các chương trình DSM; Nâng cao độ

chính xác của dự báo phụ tải ngắn hạn;....

Đây là một hoạt động chuyên sâu về phân tích số liệu, trong đó dữ liệu được

thu thập thường là rất lớn, thông qua các hình thức thu thập tự động hoặc thủ công.

Do đó dữ liệu bị lỗi là rất khó tránh khỏi, bởi có rất nhiều nguyên nhân như: sự cố

đường truyền, sự cố thiết bị đo đếm, sự cố thiết bị lưu trữ hay do việc xữ lý dữ liệu

thủ công không đúng phương pháp, ...

Dữ liệu đo đếm của phụ tải là số liệu công suất, điện năng tiêu thụ của phụ tải

theo chu kỳ đo quy định (30 phút hoặc 60 phút), thông số vận hành, biểu đồ phụ tải

(load profile). Các Tổng công ty điện lực có trách nhiệm thực hiện cài đặt công tơ để

truyền dữ liệu tự động về Kho dữ liệu.

Trong quá trình vận hành, thu thập dữ liệu đã xuất hiện nhiều sự cố làm gián

đoạn việc ghi nhận các dữ liệu đo đếm như: sự cố truyền dẫn tín hiệu từ công tơ đo

đếm về Kho dữ liệu làm mất gói dữ liệu truyền về; lỗi tại thiết bị đo đếm; lỗi do mất

nguồn điện; lỗi do cài đặt thiết bị đo đếm không đúng; lỗi do xử lý dữ liệu bằng

phương pháp thủ công; hoặc do việc thu thập dữ liệu bằng thủ công,... dẫn đến dữ

liệu ghi nhận được không phù hợp như: dữ liệu có có giá trị bằng 0 (Fasse Zero);

trùng lặp dữ liệu (Inconsistent/Duplicate); thiếu chuỗi dữ liệu (Missing Data); dữ

liệu thiếu chính xác; hoặc một số dữ liệu ngoại lai không logic cao quá hoặc thấp

bất thường (Too High/Too Low).

Hình 2.7 – Các lỗi thường gặp trong ghi nhận dữ liệu điện

2.2.5 Các phương pháp nghiên cứu xử lý dữ liệu thiếu

Cho đến nay vẫn chưa có một phương pháp nào chuyên dụng được khuyên

sử dụng riêng cho việc xử lý dữ liệu thiếu trong các ứng dụng khai thác dữ liệu. Đặc

biệt là làm thế nào để có thể xử lý giá trị thiếu trong một CSDL dữ liệu khổng lồ.

Một số phương pháp xử lý dữ liệu thiếu đã được nghiên cứu [79] – [82]:

a) Phương pháp loại bỏ

Nếu xảy ra trường hợp thiếu dữ liệu cho một biến bất kỳ nào đó, giải pháp

đơn giản là loại bỏ thuộc tính bị thiếu của dữ liệu ra khỏi qua quá trình phân tích

đánh giá của chuỗi dữ liệu. Phương pháp này chỉ được áp dụng khi dữ liệu bị mất là

hoàn toàn ngẫu nhiên (MCAR), vốn rất hiếm khi xảy ra trong thực tế.

Phương pháp loại bỏ các bộ dữ liệu có chứa giá trị thiếu có ưu điểm là đơn

giản, ít tốn thời gian hơn bất kỳ phương pháp nào khác. Nhưng nó lại có có hai

điểm hạn chế quan trọng:

i) thứ nhất là nếu chúng ta áp dụng vào trong thực tế có thể gây mất mát

nhiều dữ liệu.

ii) thứ hai là nếu phân bố dữ liệu thiếu trong tập dữ liệu không thuộc trường

hợp (MCAR) thì việc loại bỏ tất cả các bộ dữ liệu có giá trị thiếu sẽ làm

sai lệch nghiêm trọng kết quả.

b) Phương pháp gán ghép

Phương pháp này thay thế các giá trị bị thiếu bằng một giá trị dự đoán được

xem là hợp lý và sau đó thực hiện các phân tích cho chuỗi dữ liệu đã được bổ sung.

Gán ghép trung bình: Tính giá trị trung bình dữ liệu của X bằng cách sử dụng các

giá trị không bị mất và sử dụng nó để gán ghép cho giá trị thiếu của X.

c) Phương pháp hồi qui tuyến tính

Khi hai thuộc tính định lượng nào đó có mối quan hệ tuyến tính với nhau,

chúng ta có thể xây dựng một phương trình hồi quy tuyến tính, trong đó thuộc tính

có giá trị thiếu là biến phụ thuộc, biến còn lại là biến độc lập và sử dụng phương

trình hồi quy cho việc dự đoán các giá trị thiếu của biến phụ thuộc thông qua các

giá trị đã biết của biến độc lập.

Phương pháp hồi quy tuyến tính thường gặp phải hai vấn đề:

i) thứ nhất, mô hình quan hệ giữa các thuộc tính có phải tuyến tính không.

Nếu mối quan hệ này là không tuyến tính, các giá trị thiếu ước lượng

được có thể bị sai lệch lớn so với các giá trị thực.

ii) thứ hai, thường thì trong cùng một bộ dữ liệu, các thuộc tính có quan hệ

chặt với thuộc tính có giá trị thiếu cũng có giá trị thiếu.

2.2.6 Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện

Một số phương pháp ước lượng số liệu đo đếm của các phụ tải điện bị lỗi

trong quá trình thu thập dữ liệu của các Công ty điện lực thường được sử dụng như

sau [83]:

- Nội suy tuyến tính: nội suy từ đường đặc tính xu thế tiêu thụ điện.

- Ngày tương đồng: sử dụng dữ liệu ngày tương đồng của tuần hiện tại

hoặc tuần trước.

- Tự động ước lượng: sử dụng trong trường hợp dữ liệu bị thiếu không quá

bảy (07) ngày.

- Kiểm tra trực quan đồ thị: để biết được dữ liệu bị sai và quyết định về dữ

liệu được ước lượng.

- Hiệu chỉnh ước lượng số liệu thủ công: được sử dụng khi dữ liệu bị thiếu

nhiều hơn bảy (07) ngày.

- Hiệu chỉnh ước lượng giá trị trung bình các tuần của ngày tham chiếu:

dựa vào dữ liệu của bốn (04) tuần gần nhất.

Tuy nhiên, các cách làm này đều thực hiện một cách thủ công và phụ thuộc

rất nhiều vào năng lực kinh nghiệm của chuyên gia thực hiện ước lượng.

Dữ liệu đo đếm của phụ tải gồm: số liệu công suất (Pmax), điện năng tiêu thụ

(Atổng) và nhiệt độ (t0) có mối quan hệ ràng buộc với nhau. Qua quan sát các dữ

liệu thống kê chúng ta thấy được mối quan hệ tuyến tính giữa chúng, chẳng hạn

như: những ngày nhiệt độ tăng cao thì điện năng sẽ được tiêu thụ nhiều hơn do

người dân sử dụng nhiều thiết bị làm mát như máy điều hòa, quạt máy,... dẫn đến

công suất Pmax sẽ tăng cao đột biến và sản lượng điện thương phẩm Atổng cũng vì

thế tăng theo lên.

Ngược lại, những ngày thời tiết có nhiệt thấp (trời mát hay có mưa) thì công

suất Pmax và sản lượng điện thương phẩm Atổng sẽ không tăng cao mà hạ xuống

thấp, đó là do nhu cầu sử dụng điện để giải nhiệt của người dân không còn nữa. Với

phân tích trên, ta thấy mối quan hệ ràng buộc của ba thành phần số liệu công suất

(Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0). Như vậy, việc sử dụng phương

trình hồi quy cho việc dự đoán các giá trị thiếu trong quá trình nghiên cứu phụ tải

điện là hoàn toàn phù hợp.

Luận án xin đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây

dựng các xây dựng các mô hình hồi quy tối ưu hóa các thông số tự động thông qua

quá trình huấn luyện học máy Support Vector Regression (SVR), từ đó ước lượng

lại các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm.

2.3. KẾT QUẢ NGHIÊN CỨU

2.3.1. Dữ liệu đầu vào

Dữ liệu đo đếm của phụ tải sử dụng trong việc xây dựng thuật toán gồm: số

liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0) theo từng giờ,

từng ngày trong tháng của các phụ tải tại Tổng công ty Điện lực TP.HCM.

Để phục vụ nghiên cứu, tác giả đã sử dụng một chuỗi dữ liệu đo đếm tại

Tổng công ty Điện lực TP.HCM trong khoảng thời gian từ ngày 01/01/2014 đến

28/02/2016 (dữ liệu hoàn chỉnh không bị lỗi, bị thiếu), theo đó: chủ động thay đổi

một số dữ liệu (tăng, giảm, xoá,… hoặc sửa đổi một số số liệu) nhằm tạo ra các kịch

bản dữ liệu thiếu hoặc dữ liệu ngoại lai, từ đó đưa vào giải thuật để khôi phục lại và

so sánh độ chính xác với dữ liệu gốc.

Ta xét dữ liệu đo đếm từ tháng 01/2014 đến tháng 02/2016, ta thấy có 04 số

liệu điện năng (ngày 10  13/01/2015) bị lỗi ghi nhận bằng 0 – không đo đếm được;

03 số liệu điện năng (ngày 12  14/02/2015) bị lỗi ghi nhận bằng rỗng – không lưu

trữ được và 03 số liệu điện năng (ngày 05  07/03/2015) bị lỗi ghi cao bất thường.

Hình 2.8 – Đồ thị biểu diễn tương quan Pmax, Atổng và nhiệt độ

Bảng 2.1 – Các giá trị bị lỗi (bằng không, rỗng và cao bất thường)

Ngày Atổng (106 x kWh)

10-01-15 11-01-15 12-01-15 13-01-15 12-02-15 13-02-15 14-02-15 05-03-15 06-03-15 07-03-15 0 0 0 0 156,44 157,81 155,21

Hình 2.9 – Dữ liệu bị thiếu và lỗi

2.3.2. Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu

Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để

xây dựng được hàm hồi qui, ta không cần phải sử dụng hết tất cả các điểm dữ liệu

trong bộ huấn luyện, những điểm có đóng góp vào việc xây dựng hàm hồi qui được

gọi là những Support Vector (việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ

thuộc vào các support vector).

Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax),

điện năng tiêu thụ (Atổng) và nhiệt độ (t0), luận án đề xuất giải thuật xây dựng mô

hình hồi qui dự đoán các giá trị thiếu cho chuỗi dữ liệu điện năng tiêu thụ (Atổng),

trên cơ sở ràng buộc của bộ dữ liệu huấn luyện là thành phần số liệu công suất

(Pmax) và nhiệt độ (t0).

Yêu cầu đặt ra là thực hiện việc xử lý các dữ liệu điện năng tiêu thụ bị lỗi

trong quá trình đo đếm theo từng giờ trong ngày hoặc tổng điện năng tiêu thụ tổng

từng ngày theo tháng. Trong đó, dựa trên mối quan hệ ràng buộc giữa sản lượng

điện năng tiêu thụ với công suất và nhiệt độ tại thời điểm đo để xây dựng đường

cong hồi qui bằng giải thuật huấn luyện SVR (Support Vector Regression), từ đó

ước lượng các giá trị dữ liệu đã bị lỗi. Lưu đồ giải thuật như sau:

Hình 2.10 – Giải thuật xử lý dữ liệu thiếu

2.3.3. Kết quả xử lý dữ liệu thiếu

• Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời

gian cho 4 tuần trước đó của chuổi dữ liệu đang xét, ta có kết quả

Khi sử dụng phương pháp này sẽ xảy một vấn đề đó là: sẽ có trường hợp dữ

liệu của 4 tuần trước đó bị rớt vào vùng dữ liệu bị thiếu. Chẳng hạn như xét việc

tính toán cho dữ liệu thay thế cho các ngày 05  07/03/2015, cụ thể như sau:

Athay thế (05/03) = (A 26/02 + A 19/02 + A 12/02 + A 05/02) / 4;

Athay thế (06/03) = (A 27/02 + A 20/02 + A 13/02 + A 06/02) / 4;

Athay thế (07/03) = (A 28/02 + A 21/02 + A 14/02 + A 07/02) / 4;

Tuy nhiên, các giá trị A12/02, A13/02 và A14/02 lại là dữ liệu bị thiếu mà ta đang

xét, do đó kết quả tính toán chắc chắn sẽ không chính xác do các giá trị này đều bằng

0. Như vậy, có thể kết luận phương pháp sử dụng giá trị trung bình trong cùng thời

gian cho 4 tuần trước đó của dữ liệu đang xét là chưa thực sự phù hợp trong trường

hợp này.

Bảng 2.2 – Kết quả ước lượng theo phương pháp thông thường

Ngày 10-01-15 11-01-15 12-01-15 13-01-15 12-02-15 13-02-15 14-02-15 05-03-15 06-03-15 07-03-15 Athay thế 53,71 46,47 55,20 55,58 53,49 52,81 50,79 31,35 32,24 31,99

• Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR

(Support Vector Regression)

Xây dựng bộ huấn luyện SVR sử dụng hàm lỗi ε-insensitive và hàm nhân

Gaussian ta có ba tham số cần tìm: hệ số chuẩn hóa C, tham số  của hàm nhân

Gaussian và độ rộng của ống ε [96 - 97]. Dùng ngôn ngữ lập trình Matlab version

R2015 [98] để xây dựng chương trình ước lượng, với x1, x2 là 02 vector dữ liệu

công suất và nhiệt độ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016; Y là

vector dữ liệu điện năng tiêu thụ ghi nhận theo ngày từ 01/01/2014 đến ngày

29/02/2016 (có chứa các số liệu bị lỗi) cần được mô hình hóa.

+ Xét mô hình SVM Regression, với các thông số:

Bảng 2.3 – Bảng thông số mô hình SVR

C - BoxConstraint KernelScale ε - Epsilon

6.9088 0.10

0.4469

➢ Kiểm tra sai số mô hình: để đánh giá mô hình hồi qui SVR vừa xây dựng, ta

có thể đánh giá sai số giữa dữ liệu có được từ mô hình với dữ liệu gốc từ

ngày 15/03/2015 đến ngày 15/04/2015, cụ thể:

Bảng 2.4 – Đánh giá kết quả test của mô hình SVR

Ngày

Atổng ASVR Sai số 15-03-15 48,48 48,40 0,18% 16-03-15 57,43 59,07 2,87% 17-03-15 58,61 58,69 0,13% 18-03-15 57,86 58,03 0,29% 19-03-15 58,98 59,76 1,32% 20-03-15 59,01 59,11 0,17% 21-03-15 56,08 55,48 1,08% 22-03-15 47,98 47,76 0,46% 23-03-15 58,19 59,85 2,86% 24-03-15 61,79 61,21 0,95% 25-03-15 60,92 61,84 1,52% 26-03-15 63,99 62,04 3,04% 27-03-15 62,29 59,25 4,88% 28-03-15 60,42 58,04 3,95% 29-03-15 51,90 52,76 1,64% 30-03-15 60,91 61,34 0,70% 31-03-15 62,51 61,27 1,99% 01-04-15 60,95 61,27 0,53% 02-04-15 62,50 61,80 1,11% 03-04-15 63,23 62,93 0,47% 04-04-15 61,05 60,15 1,47% 05-04-15 51,23 51,35 0,22% 06-04-15 60,99 61,96 1,58% 07-04-15 63,34 62,86 0,76% 08-04-15 63,38 63,26 0,20% 09-04-15 63,66 63,51 0,23% 10-04-15 64,20 63,66 0,84%

Ngày

Atổng ASVR Sai số 11-04-15 61,86 61,20 1,07% 12-04-15 51,32 49,35 3,83% 13-04-15 57,87 58,55 1,18% 14-04-15 60,17 60,57 0,66% 15-04-15 61,25 62,15 1,47%

❖ Sai số phần trăm tuyệt đối trung bình (MAPE)

Như vậy, cho thấy độ tin cậy của mô hình hồi qui là rất cao, mô hình có thể

được sử dụng để ước lượng các số liệu bị lỗi nêu trên.

Hình 2.11 – Mô phỏng lại đường cong tải bị thiếu dữ liệu

❖ Kết quả ước lượng các giá trị thiếu, lỗi

Hình 2.12 – Kết quả ước lượng dữ liệu thiếu bằng SVR

Bảng 2.5 – Kết quả ước lượng dữ liệu thiếu bằng SVR

Ngày 10-01-15 11-01-15 12-01-15 13-01-15 12-02-15 13-02-15 14-02-15 05-03-15 06-03-15 07-03-15 Athay thế 53,71 46,47 55,20 55,58 53,49 52,81 50,79 31,35 32,24 31,99 Aước lượng(SVR) 52,92 44,91 54,96 55,45 49,28 51,11 42,86 56,80 58,04 56,12

Phương pháp xây dựng đường cong hồi qui bằng mạng Neural Network •

+ Xét mô hình Neural Netwok

Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày

01/01/2014 đến ngày 29/02/2016):

- Biến độc lập (biến dự báo) Y là vector dữ liệu điện năng tiêu thụ ghi nhận

theo ngày từ 01/01/2014 đến ngày 29/02/2016 (có chứa các số liệu bị lỗi)

cần được mô hình hóa.

- Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: 02 vector dữ liệu công

suất và nhiệt độ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016

(x1 và x2).

Hình 2.13 – Mô hình mạng Neural Network

❖ Kiểm tra sai số mô hình: để đánh giá mô hình hồi qui NN vừa xây dựng, ta

có thể đánh giá sai số giữa dữ liệu có được từ mô hình với dữ liệu gốc từ

ngày 15/03/2015 đến ngày 15/04/2015, cụ thể:

Bảng 2.6 – Đánh giá kết quả test của mô hình NN

Ngày

Atổng ANN Sai số 15-03-15 48,48 46,81 3,45% 16-03-15 57,43 59,96 4,42% 17-03-15 58,61 59,56 1,62% 18-03-15 57,86 58,84 1,70% 19-03-15 58,98 61,15 3,68% 20-03-15 59,01 59,43 0,70% 21-03-15 56,08 56,23 0,27% 22-03-15 47,98 47,17 1,67% 23-03-15 58,19 60,80 4,49% 24-03-15 61,79 62,11 0,51% 25-03-15 60,92 63,66 4,49% 26-03-15 63,99 63,79 0,31% 27-03-15 62,29 63,64 2,17% 28-03-15 60,42 60,64 0,35% 29-03-15 51,90 51,97 0,13% 30-03-15 60,91 63,21 3,77% 31-03-15 62,51 62,20 0,50% 01-04-15 60,95 62,20 2,06%

Ngày

Atổng ANN Sai số 02-04-15 62,50 62,72 0,36% 03-04-15 63,23 63,50 0,43% 04-04-15 61,05 61,41 0,60% 05-04-15 51,23 47,62 7,05% 06-04-15 60,99 62,87 3,07% 07-04-15 63,34 64,26 1,45% 08-04-15 63,38 64,47 1,72% 09-04-15 63,66 64,59 1,47% 10-04-15 64,20 64,65 0,69% 11-04-15 61,86 62,10 0,39% 12-04-15 51,32 48,36 5,76% 13-04-15 57,87 59,42 2,68% 14-04-15 60,17 61,69 2,52% 15-04-15 61,25 62,79 2,51%

❖ Sai số phần trăm tuyệt đối trung bình (MAPE)

Như vậy, cho thấy độ tin cậy của mô hình hồi qui là khá tốt (nhưng không tốt

bằng mô hình SVR 2), mô hình có thể được sử dụng để ước lượng các số liệu bị lỗi

nêu trên.

Hình 2.14 – Mô phỏng lại đường cong tải bị thiếu dữ liệu

Hình 2.15 – Kết quả ước lượng các giá trị thiếu, lỗi

Bảng 2.7 – Kết quả ước lượng của mô hình NN

Ngày 10-01-15 11-01-15 12-01-15 13-01-15 12-02-15 13-02-15 14-02-15 05-03-15 06-03-15 07-03-15 Athay thế 53,71 46,47 55,20 55,58 53,49 52,81 50,79 31,35 32,24 31,99 Aước lượng(NN) 54,45 42,70 55,05 55,49 50,61 47,10 39,60 57,51 59,72 56,18

❖ Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN

Hình 2.16 – Mô phỏng lại đường cong tải bị thiếu dữ liệu

Hình 2.17 – Kết quả ước lượng các giá trị thiếu, lỗi

Bảng 2.8 – Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN

Athay thế Aước lượng(SVR1) Aước lượng(SVR2) Aước lượng(NN)

Ngày 10-01-15 53,71 11-01-15 46,47 12-01-15 55,20 13-01-15 55,58 12-02-15 53,49 13-02-15 52,81 14-02-15 50,79 54,17 42,15 55,26 55,49 49,42 45,97 39,32 52,92 44,91 54,96 55,45 49,28 51,11 42,86 54,45 42,70 55,05 55,49 50,61 47,10 39,60

05-03-15 31,35 06-03-15 32,24 07-03-15 31,99 56,80 58,04 56,12 57,51 59,72 56,18 57,06 58,92 55,54

2.4. TỔNG KẾT CHƯƠNG II

Qua khảo sát mô hình bộ huấn luyện SVR sử dụng hàm lỗi ε-insensitive và

hàm nhân Gaussian đã cho kết quả: giải quyết tốt yêu cầu xử lý các dữ liệu điện

năng tiêu thụ bị lỗi trong quá trình đo đếm dựa trên mối quan hệ ràng buộc của các

dữ liệu thống kê công suất và nhiệt độ ghi nhận theo ngày tương ứng với lượng điện

năng tiêu thụ.

Mô hình SVR cho kết quả mô phỏng lại đường cong đặc tuyến tải tốt hơn mô

hình mạng Neural Network và các mô hình đều có giá trị MAPE rất tốt (< 2,2%).

Qua đó, chúng ta đã xây dựng được công cụ tự động ước lượng các dữ liệu bị lỗi mà

trước đây phải thực hiện thực một cách thủ công, nâng cao độ tin cậy trong việc

phân tích, xử lý dữ liệu trong quá trình nghiên cứu phụ tải.

Việc xây dựng mô hình SVR và NN để mô phỏng lại đường cong đặc tuyến

tải đã giải quyết rất tốt nhiệm vụ của luận án đặt ra, đó là xây dựng được một công

cụ để ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu,

dự báo phụ tải điện.

Hướng phát triển tiếp theo là sử dụng mô hình bộ huấn luyện SVR kết hợp

mô hình Box-Jenkin, Neural Networks, Random Forest để triển khai công tác dự

báo phụ tải điện ngắn hạn theo 24 chu kỳ/ ngày (chu kỳ 60 phút); ngày/tuần trên bộ

cơ sở dữ liệu của Tổng công ty Điện lực thành phố Hồ Chí Minh có xét đến các

ràng buộc về nhiệt độ, tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối

và bán lẻ cạnh tranh sắp tới.

CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA

ĐƠN VỊ

3.1. CÁC YẾU TỐ TÁC ĐỘNG ĐẾN PHỤ TẢI ĐIỆN

3.1.1. Các yếu tố về kinh tế

- Thông thường có sự tương quan mạnh mẽ giữa tăng trưởng kinh tế và nhu

cầu điện. Qua phân tích biểu đồ tương quan giữa GRDP và Điện năng, thì

mức độ tương quan về sự tăng trưởng là rất cao (R2 = 97,67%)

- Không nhất thiết là mối quan hệ đơn giản theo tỷ lệ 1 và 1

- Tiêu thụ điện năng thường tăng theo tăng trưởng GRDP (triệu đồng)

Hình 3.1 – Tăng trưởng của GRDP và Điện năng qua các năm (triệu kWh)

Hình 3.2 – Biểu đồ tương quan giữa GRDP và Điện năng (triệu kWh)

3.1.2. Giá điện

- Giá điện và nhiên liệu

- Cơ cấu giá (giá theo thời điểm):

Cơ chế giá điện là giải pháp có tác dụng lớn nhất trong việc điều hòa biểu đồ

của hệ thống, cũng như giá phản ánh được giá trị sử dụng và các yếu tố giá điện liên

quan đến khách hàng tiêu thụ. Việc thiết kế cơ chế giá phù hợp sẽ mang lại lợi ích

không chỉ cho phía nhà cung cấp, khách hàng sử dụng điện mà còn mang lại lợi ích

kinh tế cho toàn xã hội.

Trong thời gian qua, áp dụng biểu giá TOU (Time of Use: thời gian sử dụng)

đã làm thay đổi biểu đồ phụ tải theo hướng tích cực, nhất là các phụ tải công

nghiệp, sản xuất. Các nhà quản lý đã dịch chuyển thời gian, dây chuyền sản xuất

vào những biểu giá điện thấp điểm để tận dụng nguồn điện giá rẻ, đồng thời sẽ có

tác dụng kép là giảm tải đỉnh tại các thời điểm cao điểm của hệ thống.

3.1.3. Thành phần phụ tải (được kết nối vật lý)

- Thành phần cơ bản của khách hàng

Hình 3.3 – 5 thành phần phụ tải sử dụng điện (hộ sử dụng điện)

Hình 3.4 – Đồ thị phụ tải của tòa nhà Green Power (EVNHCMC)

- Các thiết bị / công nghệ của các ngành

Hình 3.5 – Phụ tải Nhà máy thép (kWh)

Hình 3.6 – Phụ tải Nhà máy Xi măng (kWh)

Kết nối những máy phát điện quy mô nhỏ (ví dụ như mặt trời áp mái) -

3.1.4. Các yếu tố ngoại sinh

- Điều kiện khí hậu và thời tiết (theo mùa): Yếu tố khí hậu có thể ảnh hưởng

đến nhu cầu điện trên các khoảng thời gian khác nhau: trong năm có tác động

“theo mùa” và dài hạn tác động bởi các chu kỳ khác nhau (La-Nina & El-

Nino,…)

Hình 3.7 – Sự thay đổi theo nhiệt độ trong năm (tháng 5 – mùa hè)

- Thói quen khách hàng (thông thường được tổng hợp)

Hình 3.8 – Sự thay đổi theo các ngày lễ trong năm

- Sự kiện về thời tiết, các sự kiện bất thường:

Hình 3.9 – Dao động mạnh giữa El Nino và La Nina

3.1.5. Quản lý nhu cầu phụ tải

- Hiệu quả năng lượng (EE): % tổng năng lượng đầu vào cho một máy hoặc

thiết bị được tiêu thụ trong công việc hữu ích và không lãng phí như nhiệt vô

ích.

- Điều chỉnh nhu cầu (DR): khi một khách hàng giảm nhu cầu phụ tải trong

một khoảng thời gian ngắn đáp lại được mức giá điện ưu đãi (hay hình thức

khác) từ nhà vận hành lưới điện. Ví dụ: giảm sử dụng điều hòa, lò hơi, giảm

bớt chiếu sáng…

- Quản lý nhu cầu phụ tải (DSM): Các chương trình khuyến khích người dùng

sử dụng năng lượng hiệu quả hơn. Các biện pháp DSM có thể bao gồm cải

tạo ánh sáng, nâng cấp tự động hóa tòa nhà, cải tiến HVAC, thiết bị biến

tần,…

Hình 3.10 – DR cắt giảm được tải đỉnh

3.2. ĐẶC TÍNH PHỤ TẢI

3.2.1. Đặc tính tải ngày – tuần (week day)

Nhu cầu tải thay đổi từ ngày này sang ngày khác trong tuần. Hình dưới cho

thấy nhu cầu phụ tải qua các năm trong quá khứ. Qua đó, ta thấy nhu cầu phụ tải

vào cuối tuần ít hơn so với ngày thường và phụ tải các tuần trong ngày Tết (tháng 2)

sụt giảm rất nhiều so với các tuần thường ngày khác, cũng như các tháng còn lại

trong năm.

Hình 3.11 – Đặc tính tải thay đổi theo ngày

Quan sát đồ thị phụ tải 07 ngày trong một tuần của khu vực thành phố Hồ

Chí Minh ta thấy sự biến đổi giữa các ngày thường (từ thứ 2 đến thứ 6) không có

nhiều biến động và có cùng một kiểu bổ đồ phụ tải. Đối với đồ thị phụ tải ngày thứ

7 thì có sự biến đổi nhưng không nhiều so với ngày thường, chủ yếu nhu cầu phụ tải

suy giảm vào buổi chiều tối. Riêng đối với đồ thị phụ tải ngày Chủ nhật thì hoàn

toàn khác với các ngày thường (nhu cầu sử dụng điện xuống thấp).

Hình 3.12 – Đặc tính tải thay đổi theo giờ - tuần

3.2.2. Đặc tính tải giờ – ngày (hour day)

Tải thay đổi trong ngày từ giờ sang giờ khác. Các hình dưới cho biết đồ thị

phụ tải điển hình của tháng 12 trong năm. Có thể nhận thấy rằng tải đỉnh xảy ra hai

lần một ngày, một là khoảng 10:00 AM đến 12:00 AM và một là từ khoảng 2:00

PM đến 4:00 PM và bởi vì hành vi nhu cầu phụ tải này, tính năng giờ có thể rất hữu

ích trong dự báo tải ngắn hạn.

Hình 3.13 – Đồ thị các ngày điển hình tháng1

Hình 3.14 – Đồ thị các ngày điển hình tháng 2

Hình 3.15 – Đồ thị các ngày điển hình tháng 3

Hình 3.16 – Đồ thị các ngày điển hình tháng 4

Hình 3.17 – Đồ thị các ngày điển hình tháng 5

Hình 3.18 – Đồ thị các ngày điển hình tháng 6

Hình 3.19 – Đồ thị các ngày điển hình tháng 7

Hình 3.20 – Đồ thị các ngày điển hình tháng 8

Hình 3.21 – Đồ thị các ngày điển hình tháng 9

Hình 3.22 – Đồ thị các ngày điển hình tháng 10

Hình 3.23 – Đồ thị các ngày điển hình tháng 11

Hình 3.24 – Đồ thị các ngày điển hình tháng 12

3.2.3. Đăc tính của thời tiết

Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết

có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm),

nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt

độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần

phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải

điện, và nhiệt độ ước tính được sử dụng cho đầu vào thay vì thực. Tuy nhiên, không

phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có thể làm

giảm độ chính xác của kết quả dự báo.

Hình 3.25 – Biểu đồ quan hệ phụ tải và nhiệt độ

3.3. BIỂU ĐỒ PHỤ TẢI CHUẨN HÓA ĐƠN VỊ

3.3.1. Khái niệm

Quan sát đồ thị phụ tải các ngày trong một tuần và một số ngày lễ đặc biệt

trong năm của khu vực thành phố Hồ Chí Minh ta thấy: sự biến đổi giữa các ngày

thường (từ thứ 3 đến thứ 6) không có nhiều biến động và có cùng một kiểu biểu đồ

phụ tải. Đối với đồ thị phụ tải ngày thứ 2 thì có sự biến đổi khác biệt với ngày

thường tại khoảng thời từ 0h00 đến 9h00, do có sự chuyển tiếp nhu cầu từ ngày chủ

nhật. Xem xét cụ thể các ngày trong năm như sau:

Hình 3.26 – Đồ thị phụ tải các ngày thứ 6, 7 và chủ nhật

- Khi quan sát biểu đồ phụ tải ngày thứ 7 thì có sự biến đổi nhưng không nhiều

so với ngày thường (ngày thứ 6), chủ yếu nhu cầu phụ tải suy giảm vào buổi

chiều tối, do bắt đầu cho ngày nghỉ cuối tuần. Riêng đối với đồ thị phụ tải

ngày Chủ nhật thì hoàn toàn khác với các ngày thường (nhu cầu sử dụng điện

xuống thấp).

Hình 3.27 – Đồ thị phụ tải các ngày thường trong tuần

- Khi quan sát biểu đồ phụ tải các ngày thường trong tuần thì đối với thời gian

đầu buổi sáng thứ hai phụ tải có sự suy giảm do mới bắt đầu một tuần mới và

chuyển tiếp từ ngày chủ nhật sang, còn các ngày khác thì đồ thị phụ tải gần

như giống nhau hoàn toàn.

Hình 3.28 – Đồ phụ tải ngày Tết DL, AL và ngày thường

- Khi quan sát biểu đồ phụ tải các ngày Tết Dương lịch và Tết Âm lịch thì

chúng ta thấy sự khác biệt hoàn toàn, đồ thị gần như bằng phẳng và nhu cầu

phụ tải xuống khá thấp do đây là các ngày nghỉ. Riêng ngày Tết Âm lịch thì

nhu cầu phụ tải xuống thấp nhất, do đây là kỳ nghỉ kéo dài nhất trong năm

(có thể từ 6 – 9 ngày).

Trên cơ sở nghiên cứu các đặc tính của phụ tải như trên (phần 3.2 và 3.3),

chúng ta thấy các ngày trong tuần/ trong tháng/ trong năm đều có thể được biểu thị

một số hình dáng tải đặc trưng hay nói cách khác chúng ta có thể xây dựng được đồ

thị điển hình của các ngày trong năm. Tuy các đồ thị có thể khác nhau về độ lớn qua

các năm nhưng xét về hình dạng đồ thị thì đặc tính tải này không thay đổi hoặc thay

đổi rất ít do một số tác động bên ngoài.

Như vậy, để giải quyết bài toán khác biệt về đọ lớn của các đồ thị phụ tải, tác

giả đề xuất giải pháp qui về một hệ tương đối hay nói cách khác là chuẩn hóa đơn vị

các đồ thị phụ tải này, từ đó xây dựng được mô hình đồ thị phụ tải điển hình theo

dạng chuẩn hóa đơn vị để xử lý các dữ liệu trước khi đưa vào các bộ huấn luyện

trong các nghiên cứu sau này.

Biểu đồ phụ tải chuẩn hóa đơn vị (Standardized Load Profiles - SLP) được

xây dựng bằng cách lấy giá trị công suất thu thập theo chu kỳ 60/30 phút chia cho

công suất cực đại của nó. Chẳng hạn như:

- Để xây dựng biểu đồ chuẩn hoá đơn vị của một ngày: chúng ta lấy công suất

theo chu kỳ chia cho cực đại của ngày hôm đó và kết quả chúng ta có được

SLP theo từng chu kỳ của một ngày.

- Để xây dựng biểu đồ chuẩn hoá đơn vị của một tuần: chúng ta lấy công suất

theo chu kỳ của từng ngày trong tuần đó chia cho cực đại của tuần đang xét

và kết quả chúng ta có được SLP theo từng chu kỳ của tuần.

- Để xây dựng biểu đồ chuẩn hoá đơn vị của một tháng: chúng ta lấy công suất

theo chu kỳ của từng ngày trong tháng đó chia cho cực đại của tháng đang

xét và kết quả chúng ta có được SLP theo từng chu kỳ của tháng.

- Để xây dựng biểu đồ chuẩn hoá đơn vị của một năm: chúng ta lấy công suất

theo chu kỳ của từng ngày trong năm đó chia cho cực đại của năm đang xét

và kết quả chúng ta có được SLP theo từng chu kỳ của năm.

Tuy nhiên, việc xây dựng SLP của một năm đòi hỏi phải dựa trên cơ sở bộ

dữ liệu phụ tải thu thập theo 24 (hoặc 48) chu kỳ trong quá khứ của ít nhất 03 – 04

năm, đồng thời phải được xác định chuẩn xác đúng thứ tự ngày (thứ hai, ba, tư,…,

chủ nhật) + thứ tự tuần/ tháng + loại ngày (ngày thường hay ngày lễ Tết, ngày đặc

biệt) và đặc biệt có xét đến lịch Dương/ lịch Âm.

Theo đó, chúng ta sẽ có SLP chuẩn hóa theo ngày, theo tuần, theo tháng và

theo năm, chúng ta sẽ xem xét các tính năng của chúng trong các quan sát dưới đây:

❖ Quan sát một số ngày đặc biệt trong năm:

- Ngày Tết Dương lịch qua các năm (01/01):

Hình 3.29 – Biểu đồ chuẩn hóa đơn vị ngày Tết Dương lịch qua các năm

Quan sát Đồ thị phụ tải và Biểu đồ chuẩn hóa đơn vị của các ngày Tết

Dương lịch thì chúng đều có chung hình dạng qua các năm. Chúng chỉ khác nhau về

mặt độ lớn của biểu đồ phụ tải, nhưng hình dáng và độ lớn tương tự nhau về Biểu

đồ chuẩn hóa đơn vị qua các năm. Đồng thời, Biểu đồ chuẩn hóa đơn vị của các

năm gần như có cùng hình dáng, cũng như độ lớn đơn vị qua các năm.

-

Ngày Tết Nguyên Đán qua các năm (Mồng 01/1 âm lịch):

Hình 3.30 – Biểu đồ chuẩn hóa đơn vị ngày Tết Nguyên Đán qua các năm

Quan sát Đồ thị phụ tải và Biểu đồ chuẩn hóa đơn vị của các ngày Tết

Dương lịch thì chúng đều có chung hình dạng qua các năm và gần như trùng khớp

nhau. Đồng thời, Biểu đồ chuẩn hóa đơn vị của các năm gần như có cùng hình

dáng, cũng như độ lớn đơn vị, đây là một đặc tính đặc biệt cần khai thác trong kỹ

thuật dự báo.

❖ Quan sát một số ngày thông thường trong năm:

- Ngày thứ 2 trong tuần:

Hình 3.31 – Biểu đồ chuẩn hóa đơn vị ngày thứ 2 trong tuần

- Ngày thứ 3 trong tuần:

Hình 3.32 – Biểu đồ chuẩn hóa đơn vị ngày thứ 3 trong tuần

- Ngày thứ 6 trong tuần:

Hình 3.33 – Biểu đồ chuẩn hóa đơn vị ngày thứ 6 trong tuần

- Ngày thứ 7 trong tuần:

Hình 3.34 – Biểu đồ chuẩn hóa đơn vị ngày thứ 7 trong tuần

Quan sát hình trên, ta thấy Biểu đồ phụ tải đơn vị riêng từng dạng ngày trong

tuần đều có hình dáng và độ lớn hoàn toàn tương tự nhau và gần như không thay đổi

qua các năm, đây là một đặc tính đặc biệt cần khai thác trong kỹ thuật dự báo.

3.3.2. Ứng dụng xử lý dữ liệu thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và

Support Vector Regression (SVR)

Tiếp theo việc Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu

bằng giải thuật SVR, luận án tiếp tục đề xuất giải thuật xử lý dữ liệu thiếu bằng việc

kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR). Ở

Chương II, luận án đề xuất kỹ thuật xử lý dữ liệu thiếu ở cấp độ theo ngày, còn ở

Chương này, luận án sẽ đề xuất giải thuật xử lý dữ liệu thiếu theo cấp độ theo 24

chu kỳ/ ngày.

❖ Một số SLP điển hình năm 2018:

Hình 3.35 – SLP một số ngày trong năm

Qua quan sát, biểu đồ phụ tải chuẩn hóa đơn vị thể hiện được hết tất cả các

đặc tính tải theo từng thời điểm, mùa vụ và các ngày lễ, Tết (Dương lịch, Nguyên

Đán),… chúng ta thấy mức độ tương đồng của SLP về mặt hình dáng, độ lớn từng

chu kỳ. Do đó, Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) chính là một điểm đặc biệt

và cũng là bộ thông số đầu vào quan trọng của quá trình huấn luyện của các thuật

toán học máy SVR (NN) để xây dựng lại đường đặc tuyến phụ tải từ đó ước lượng

các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm.

❖ Giải thuật:

Hình 3.36 – Giải thuật xử lý dữ liệu thiếu

Luận án đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây dựng

Biểu đồ chuẩn hóa đơn vị (SLP) trên cơ sở bộ dữ liệu phụ tải điện quá khứ chu kỳ

60 phút/lần của 03 năm trước đó. Đồng thời, kết hợp các giải thuật SVR (NN, RF)

để xây dựng lại hàm hồi qui (đường đặc tuyến phụ tải) từ đó ước lượng các dữ liệu

đã mất hoặc không ghi nhận được trong quá trình đo đếm.

Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta có

thể xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và chuẩn

xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc, ngày

nghỉ,…), từng tuần, từng tháng.

Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây

dựng hàm hồi qui theo giải thuật SVR (Support Vector Regression), NN (Neural

Network), RF (Ramdom Forest) để xây dựng các hàm hồi qui. Sau đó sử dụng bộ

dữ liệu nêu trên để kiểm tra, đánh giá sai số của các hàm hồi qui.

Trên cơ sở đánh giá sai số của các mô hình, mô hình được chọn là mô hình

có sai số nhỏ nhất, từ đó mô hình được lựa chọn sẽ là hàm hồi qui để ước lượng dữ

liệu thiếu với dữ liệu đầu vào là bộ dữ liệu SLP đã được xây dựng nêu trên.

Cụ thể các thông số mô hình như sau:

• Mô hình SVR

Cần phải lựa chọn chuẩn xác các thông số đầu vào để chạy các mô hình

SVR: hệ số chuẩn hóa C, độ rộng của ống ε và hàm nhân Gaussian. Thuật toán sử

dụng chung bộ dữ liệu đầu vào của các mô hình.

Bảng 3.1 – Một số thông số mô hình SVR đặc trưng được đề xuất

Model C - BoxConstraint ε - Epsilon KernelFunction SVR 1 SVR 2 SVR 3 SVR 4 Polynomial Gaussian Linear Linear 93.42 500.32 1 100 32.5 0.01 50.03 0.01

• Mô hình RF

Một tập hợp các cây hồi quy với mỗi bộ quy tắc khác nhau để thực hiện hồi

quy phi tuyến tính. Thuật toán xây dựng tổng cộng 20 cây, với kích thước lá tối

thiểu là 20. Kích thước của lá nhỏ hơn hoặc bằng kích thước cây nhằm kiểm soát

hiện tượng overfitting và mang lại hiệu suất cao [14], [15]. Thuật toán sử dụng

chung bộ dữ liệu đầu vào của các mô hình.

• Mô hình Mạng Neural

Sử dụng mô hình mạng Neural truyền thẳng (Feedforward Neural Network)

với các biến đầu vào như trên và bộ dữ liệu huấn luyện nêu trên. Kiến trúc mạng 01

lớp ẩn với kích thước lớp là 10 và Hàm kích hoạt Sigmoid. Đồng thời, sử dụng

mạng Neural thông thường với kiến trúc mạng 03 lớp ẩn, trong đó: lớp ẩn thứ nhất

có kích thước là 10; lớp ẩn thứ hai là 8 và lớp ẩn thứ ba là 5.

3.3.3. Kết quả áp dụng SLP vào xử lý dữ liệu thiếu

a) Dữ liệu đầu vào:

Dữ liệu đo đếm của phụ tải sử dụng trong việc xây dựng thuật toán gồm: số

liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0) theo từng giờ,

từng ngày trong tháng của các phụ tải tại Tổng công ty Điện lực TP.HCM.

Để phục vụ nghiên cứu, tác giả đã sử dụng một chuỗi dữ liệu đo đếm tại

Tổng công ty Điện lực TP.HCM trong khoảng thời gian từ ngày 01/01/2014 đến

17/12/2018 (dữ liệu hoàn chỉnh không bị lỗi, bị thiếu), theo đó: chủ động thay đổi

một số dữ liệu (tăng, giảm, xoá,… hoặc sửa đổi một số số liệu) nhằm tạo ra các kịch

bản dữ liệu thiếu hoặc dữ liệu ngoại lai, từ đó đưa vào giải thuật để khôi phục lại và

so sánh đọ chính xác với dữ liệu gốc.

Hình 3.37 – Một số ngày dữ liệu bị lỗi một vài chu kỳ

Trong đó có một số chu kỳ dữ liệu điện năng tiêu thụ (Atổng) bị thiếu do

gián đoạn đo đếm (lỗi giá trị = 0) và lỗi ghi nhận vượt quá (lớn bất thường), để phục

vụ nghiên cứu thì cần phải hiệu chỉnh.

b) Kết quả xử lý dữ liệu thiếu

Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để

xây dựng được hàm hồi qui, ta không cần phải sử dụng hết tất cả các điểm dữ liệu

trong bộ huấn luyện, những điểm có đóng góp vào việc xây dựng hàm hồi qui được

gọi là những Support Vector (việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ

thuộc vào các support vector). Dựa trên mối quan hệ tuyến tính của ba thành phần

số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0), cùng với bộ

SLP – SVR (NN) luận án đã xây dựng lại đường cong phụ tải các ngày bị lỗi.

• Bước 1: Xây dựng lại đường cong hồi qui từ dữ liệu trước thời điểm

xuất hiện việc thiếu dữ liệu:

Các dữ liệu quá khứ trước thời điểm xuất hiện việc thiếu dữ liệu (Điện

thương phẩm, công suất, nhiệt độ ghi nhận theo 24 chu kỳ - 60 phút) đã được xử lý

và Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây dựng

hàm hồi qui theo giải thuật SVR (có so sánh với các giải thuật học máy Neural

Network, Ramdom Forest) để xây dựng lại các hàm hồi qui.

- Xây dựng các hàm hồi qui bằng mô hình SVR:

Hình 3.38 – Các hàm hồi qui SVR được xây dựng

Bảng 3.2 – Kết quả kiểm tra sai số trung bình của các mô hình SVR

Date

MAPE (%) 2.43 YSVR1 YSVR2 YSVR3 YSVR4 1.75 1.90 2.06

- Xây dựng các hàm hồi qui bằng các mô hình học máy:

Hình 3.39 – Các hàm hồi qui được xây dựng lại

Bảng 3.3 – Kết quả kiểm tra sai số trung bình của các mô hình hồi qui.

Date

YSVR4 YNN YRF MAPE (%) 1.75 1.83 4.16

Qua đó, mô hình SLP – SVR (mô hình YSVR4) có giá trị sai số ước lượng thấp

nhất nên được chọn làm mô hình hồi qui để ước lượng các dữ liệu bị thiếu nêu trên.

• Bước 2: Trên cơ sở bộ dữ liệu SLP 24 chu kỳ của giai đoạn dự kiến (đã

bao gồm các ngày lễ, ngày nghỉ,…), cùng với nhiệt độ 24 chu kỳ của

khoảng thời gian dữ liệu bị thiếu tương ứng sẽ là đầu vào cho hàm hồi

qui được chọn để ước lượng lại các giá trị bị thiếu.

Hình 3.40 – Đường cong phụ tải được xây dựng lại

Trên cơ sở SLP của từng chu kỳ của năm 2018 đã xây dựng, chương trình sẽ

xây dựng lại Biểu đồ phụ tải theo từng chu kỳ của các ngày bị lỗi để xuất ra Kết quả

Hình 3.41 – Dữ liệu được xây dựng lại ngày 08/08/2018

Hình 3.42 – Dữ liệu được xây dựng lại ngày 13/08/2018

Hình 3.43 – Dữ liệu được xây dựng lại ngày 17/08/2018

Hình 3.44 – Dữ liệu được xây dựng lại ngày 25/08/2018

3.4. TỔNG KẾT CHƯƠNG III

Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax),

điện năng tiêu thụ (Atổng) và nhiệt độ (t0), cùng với bộ SLP – SVR (NN), luận án

đã xây dựng được công cụ tự động ước lượng các dữ liệu bị lỗi mà trước đây phải

thực hiện thực một cách thủ công. Biểu đồ chuẩn hóa đơn vị (SLP) đã góp một phần

không nhỏ trong kỹ thuật ước lượng lại dữ liệu bị lỗi. Tuy dữ liệu ước lượng chưa

hoàn toàn trùng khớp nhưng phần nào góp phần tạo công cụ nhằm nâng cao độ tin

cậy trong việc phân tích, xử lý dữ liệu trong quá trình nghiên cứu phụ tải điện.

Đồng thời, kết quả nghiên cứu kỹ thuật kết hợp: Biểu đồ phụ tải chuẩn hóa

đơn vị (SLP) làm đầu vào cho các modules xây dựng hàm hồi qui theo giải thuật

SVR (Support Vector Regression), NN (Neural Network), RF (Random

Forecast),… để xây dựng các hàm hồi qui sẽ làm cơ sở để tiếp tục nghiên cứu áp

dụng kỹ thuật này vào việc xây dựng giải thuật dự báo ngắn hạn phụ tải điện nhằm

giải quyết một số khó khăn, vướng mắc mà các tác giả đi trước gặp phải đã được đặt

ra ở Chương I.

CHƯƠNG VI: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN

4.1. GIỚI THIỆU

Dự báo phụ tải ngắn hạn (STLF) đóng một vai trò quan trọng trong việc xây

dựng các chiến lược kinh doanh, đảm bảo tin cậy và an toàn cho hệ thống điện. Dự

báo nhu cầu điện là một khía cạnh quan trọng trong việc phát triển bất kỳ mô hình

nào về quy hoạch điện, đặc biệt là trong tình hình tái cấu trúc hệ thống điện phát

triển nhanh như ngày nay.

Hiện nay, có rất nhiều phương pháp để dự báo phụ tải ngắn hạn, theo đó có

thể được chia thành ba lớp chính: phương pháp thống kê thông thường, mô hình

thông minh nhân tạo và kết hợp các phương pháp nêu trên. Đối với phương pháp

truyền thống, kết quả đầu ra được thể hiện một cách rõ ràng thông qua các phương

trình toán học với yếu tố đầu vào, do đó, nó còn được gọi là mô hình hộp trắng

(white-box models), chẳng hạn như: hồi quy tuyến tính, đa hồi quy và mô hình

ARIMA, SARIMA. Mô hình hộp xám dự đoán (Gray prediction) là một trong

những mô hình thuộc lớp này. Các thuật toán này có thể làm việc với một số bộ dữ

liệu và thực hiện đơn giản, nhưng độ chính xác dự báo của họ là thường thấp so với

thuật toán học máy mới với việc tính toán phức tạp hơn, nhưng có thể cung cấp độ

chính xác cao hơn.

Lớp thứ hai của các thuật toán là mô hình hộp đen (black-box), trong đó đa

số là phương pháp trí tuệ nhân tạo. Những phương pháp này là tốt cho các dữ liệu

với các ràng buộc không rõ ràng (ví dụ: tuyến tính hoặc phi tuyến). Và lớp thứ ba là

phương pháp kết hợp (hybrid) các thuật toán thông minh nhân tạo và tối ưu hóa các

thuật toán với nhau, nhằm mang lại hiệu quả cao và độ chính xác lớn trong nhiều

nghiên cứu.

4.2. MÔ HÌNH ĐỀ XUẤT

Dự báo phụ tải ngắn hạn thường là dự báo phụ tải cho ngày tới, tuần tới với

chu kỳ 60/30 phút, nó được chia thành các loại ngày trong tuần, chẳng hạn như:

ngày bình thường (thứ ba đến thứ 6); ngày thứ 2; ngày thứ 7; ngày chủ nhật, các

ngày lễ, Tết (Dương lịch và Nguyên Đán); các kỳ nghỉ trong năm. Mỗi loại ngày có

một đặc điểm hình thái riêng của nó, do đó mô hình dự báo được thiết lập phải làm

sao phản ánh được các đặc tính này.

Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có xu hướng

tương đồng mô hình tải trước đó, tuy nhiên, nó sẽ dẫn đến dự đoán sai giữa các

ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó

tác động. Ngoài ra, sự biến đổi theo mùa, xu thế khí tượng học (như El Nino, La

Nina) cũng được xem xét cẩn thận.

Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết

có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm),

nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt

độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần

phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải

điện và nhiệt độ ước tính được sử dụng cho đầu vào thay vì số thực. Tuy nhiên,

không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có

thể làm giảm độ chính xác của kết quả dự báo.

Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn đề cần

được quan tâm và khó dự đoán nhất đó chính là các ngày lễ, Tết Nguyên Đán

(thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch). Thường kết

quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày

dương lịch và ngày âm lịch.

Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ

của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để

làm dữ liệu đầu vào huấn luyện. Như trình bày trên, do đặc thù là nước sử dụng cả

lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị

ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết

quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02, cụ thể:

- Tháng 01: Biểu đồ phụ tải tháng 01 qua các năm hoàn toàn không giống

nhau, nên rất khó khăn trong việc sử dụng bộ dữ liệu tương tự để dự báo

Hình 4.1 – Biểu đồ phụ tải tháng 01 qua các năm

- Tháng 02: Biểu đồ phụ tải tháng 02 (thường có ngày Tết Nguyên Đán) qua

các năm hoàn toàn không giống nhau, nên rất khó khăn trong việc sử dụng

bộ dữ liệu tương tự để dự báo cho tháng tiếp theo, cũng như cho tháng 02 của

năm tiếp theo.

Hình 4.2 – Biểu đồ phụ tải tháng 02 qua các năm

Quan sát biểu đồ phụ tải của tháng 01 và tháng 02, chúng ta thấy có sự biến

động rất lớn về hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu

quá khứ để dự báo cho khoảng thời gian này là hết sức phức tạp. Trên thực tế, các

thuật toán khi áp dụng để thực hiện dự báo cho thị trường điện Việt Nam đều phải

qua một khâu trung gian đó là qui đổi các tháng này thành các tháng thông thường

và sau khi chạy kết quả dự báo sẽ qui đổi ngược lại hoặc là chấp nhận sai số lớn,

các phần mềm thương mại do nước ngoài cung cấp đều gặp rắc rối này.

Ngoài ra, một nguyên nhân nữa làm ảnh hưởng rất lớn đến việc áp dụng các

luận án nghiên cứu vào thực tiễn đó chính là việc thiếu dữ liệu đầu vào cho các hàm

dự báo, chẳng hạn như: các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như:

phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để làm dữ liệu đầu vào

khi dự báo. Tuy nhiên, nếu như yêu cầu độ dài chuỗi giá trị cần dự báo nhiều hơn

01 tuần (> 07 ngày hoặc đến 30 ngày và lên tới 356 ngày như yêu cầu của vận hành

của thị trường điện) thì chắc chắn dữ liệu quá khứ để làm đầu vào sẽ bị thiếu và bắt

buộc phải sử dụng giá trị vừa được dự báo làm dữ liệu quá khứ. Điều đó sẽ dẫn đến

việc chuyền tiếp các sai số dự báo từ quá khứ sang cho đến tương lai và thường sẽ

xuất hiện hiện tượng “Quan hệ cận huyết” trong bộ dữ liệu đầu vào của hàm dự

báo, làm cho sai số dự báo sẽ rất lớn, đôi khi sẽ không thể dự báo được nếu biên độ

dự báo yêu cầu quá lớn.

Thêm nữa, trên thực tế kết quả dự báo thời tiết chỉ có hiệu quả trong vòng 07

ngày, nếu yêu cầu biên độ lớn hơn thì không khả thi do kết quả dự báo của các ngày

sau không chính xác, nó sẽ kéo theo sai số chồng lấp cho toàn bộ kết quả dự báo

phụ tải điện.

Theo nghiên cứu tại Chương III, Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) đã

thể hiện được hết tất cả các đặc tính tải theo từng thời điểm, mùa vụ và các ngày lễ,

Tết (Dương lịch, Nguyên Đán),… của 365 ngày trong năm. Chúng ta cũng thấy

được mức độ tương đồng của SLP về mặt hình dáng, độ lớn từng chu kỳ của các

ngày của các năm trong quá khứ và cũng sẽ là SLP trong tương lai. Quá trình kết

hợp biến đổi lịch Dương và lịch Âm trong quá trình xây dựng SLP, chúng ta đã có

được bộ số liệu chuẩn hóa đơn vị chi tiết theo từng chu kỳ/ ngày/ tuần/ tháng/ năm.

Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta có

thể xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và cần

chuẩn xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc,

ngày nghỉ,…), từng tuần, từng tháng. Do đó, Biểu đồ phụ tải chuẩn hóa đơn vị

(SLP) chính là một điểm đặc biệt và cũng là bộ thông số đầu vào quan trọng của

quá trình huấn luyện của các thuật toán học máy SVR, NN, RFR trong quá trình

nghiên cứu giải thuật dự báo.

Câu hỏi đặt ra là SLP có thể giải quyết được các vướng mắc đã đề cập nêu

trên như thế nào:

(1) Ảnh hưởng của Lịch Âm, Dương Lịch và các ngày lễ trong năm:

Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) đã thể hiện được hết tất cả các đặc

tính tải theo từng thời điểm, mùa vụ và các ngày lễ trong năm. Do đó, khi đưa các

SLP làm bộ huấn luyện cho các giải thuật học máy thì các SLP trong quá khứ sẽ

phục dựng đường cong hồi qui phụ tải và các SLP trong tương lai sẽ định hướng

đặc tính tải trong chu kỳ dự báo.

(2) Ảnh hưởng của các đặc tính tải theo ngày:

Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) được xây dựng dựa trên tất cả các

đặc tính tải chi tiết theo từng thời điểm, theo từng ngày trong năm nên các SLP

trong quá khứ hay trong chu kỳ dự báo đều đóng góp vào việc xây dựng đường

cong hồi qui và dự báo phụ tải. Như vậy, việc biến đổi theo từng chu kỳ, từng ngày

của SLP sẽ giải quyết được đặc tính biến đổi của tải theo thời gian.

(3) Ảnh hưởng của giới hạn số lượng bộ dữ liệu đầu vào, tránh tình trạng

“Quan hệ cận huyết” trong dữ liệu:

Để giải quyết vấn đề dữ liệu quá khứ được sử dụng làm đầu vào không đủ về

mặt số lượng và bắt buộc phải sử dụng các giá trị vừa được dự báo làm bộ số cho

dữ liệu quá khứ trong quá trình dự báo phụ tải, SLP với các tính năng đề cập như

trong chương III, thì bộ dữ liệu đầu vào sẽ được xây dựng bằng các SLP của quá

khứ và bổ sung thêm các SLP trong tương lai để đảm bảo đủ số lượng dữ liệu cho

các giải thuật dự báo và số lượng dữ liệu có thể lên đến hàng trăm ngày (24 chu

kỳ/ngày). Như vậy, tình trạng “Quan hệ cận huyết” sẽ không xảy ra và các SLP

cũng sẽ góp phần định hướng đường cong hồi qui cho các giá trị dự báo sắp tới.

(4) Ảnh hưởng của dữ liệu thời tiết:

Các modules xây dựng hàm hồi qui thì số lượng đầu vào gồm: 24 chu kỳ của

Biểu đồ phụ tải chuẩn hóa đơn vị (SLP); 01 bộ đầu vào nhiệt độ (thời tiết); 01 bộ

đầu vào các ngày lễ, Tết,…; 01 bộ đầu vào công suất. Như vậy, bộ đầu vào thời tiết

chỉ chiếm 01 phần nhỏ trong tất cả các đầu vào

Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ được đưa vào các modules xây

dựng hàm hồi qui theo giải thuật SVR (Support Vector Regression), NN (Neural

Network), RF (Ramdom Forest) để xây dựng các hàm hồi qui. Sau đó sử dụng bộ

dữ liệu nêu trên để kiểm tra, đánh giá sai số của các hàm hồi qui, từ đó lựa chọn ra

được hàm hồi qui có sai số thấp nhất để làm hàm dự báo và cũng là điểm mới của

luận án.

• Giải thuật:

Hình 4.3 – Lưu đồ giải thuật dự báo ngắn hạn

Trong các nghiên cứu trước đây, các tác giả thường lấy giá trị quá khứ của

bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,…và nhiệt

độ, độ ẩm trong quá khứ để làm dữ liệu đầu vào huấn luyện; và các biến nhiệt độ

thường được các phần mềm thương mại sử dụng. Tuy nhiên, với sự tác động của

biến đổi khí hậu toàn cầu thì các số liệu dự báo thời tiết gần đây hầu như không

chuẩn xác và khoảng thời gian dự báo tin cậy cũng rất ngắn chỉ từ 05 đến 07 ngày,

khó đáp ứng yêu cầu ngày càng cao của các qui định thị trường điện bán buôn cạnh

tranh (các Tổng công ty Điện lực phải công bố bảng chào Qc tháng N+1 24 chu kỳ

trước ngày 20 của tháng N,…). Từ đó, luận án đề xuất sử dụng Biểu đồ phụ tải

chuẩn hóa đơn vị (SLP) để giải quyết các vấn đề vướng mắc nêu trên.

Trên cơ sở bộ dữ liệu phụ tải thu thập theo 24 (hoặc 48) chu kỳ trong quá

khứ của ít nhất 03 – 04 năm, chúng ta sẽ kiểm tra, xử lý sơ bộ các dữ liệu sai khác

bằng công cụ đã trình bày ở Chương II và phân tích các đặc tính tải ở Chương III.

Dữ liệu sau xử lý sẽ được phân tách theo định dạng ngày thường, ngày nghỉ, ngày

lễ,… (có xét đến việc ảnh hưởng của sự chênh lệch ngày âm và ngày dương). Tiếp

theo, dữ liệu được chuyển sang module xây dựng bộ Biểu đồ phụ tải chuẩn hóa đơn

vị (SLP) để làm đầu vào cho khâu huấn luyện của NN, SVR, RFR.

Các dữ liệu quá khứ (Điện thương phẩm, công suất, nhiệt độ ghi nhận theo

24 chu kỳ - 60/30 phút) đã được xử lý và Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) sẽ

được đưa vào các modules xây dựng hàm hồi qui theo giải thuật SARIMA, Neural

Network, Support Vector Regression, Ramdom Forest để xây dựng các hàm hồi qui.

Sau đó sử dụng bộ dữ liệu nêu trên để kiểm tra, đánh giá sai số của các hàm hồi qui,

từ đó lựa chọn ra được hàm hồi qui có sai số thấp nhât để làm hàm hồi qui cho khâu

dự báo tiếp theo. Trên cơ sở bộ dữ liệu SLP 24 chu kỳ của giai đoạn dự kiến (đã bao

gồm các ngày lễ, ngày nghỉ,…), cùng với kết quả dự báo nhiệt độ 24 chu kỳ của

giai đoạn tương ứng sẽ là đầu vào cho hàm hồi qui được chọn để xuất kết quả dự

báo theo định dạng 24 chu kỳ cho khoảng thời gian từ 7 – 30 ngày.

4.3. KẾT QUẢ NGHIÊN CỨU

4.3.1. Dữ liệu đầu vào

Bộ dữ liệu mới nhất của các phụ tải tại Tổng công ty Điện lực TP.HCM (từ

tháng 01/2015 cho đến tháng 12/2019 – Phụ lục đính kèm), được sử dụng trong việc

xây dựng thuật toán dự báo phụ tải ngắn hạn gồm:

- Ngày/ tuần/ tháng/ năm.

- Danh sách các ngày lễ trong năm.

- Công suất (Pmax, Pmin).

- Điện năng tiêu thụ (A).

- Công suất theo chu kỳ 30 phút.

- Nhiệt độ (0C) theo chu kỳ 30 phút.

Phân tích dữ liệu theo định dạng ngày thường (thứ 2, thứ 3, thứ 4, thứ 5 và

thứ 6); ngày thứ 7; ngày Chủ nhật và ngày lễ nhằm phù hợp với các đồ thị phụ tải

đặc trưng được xây dựng.

4.3.2. Xây dựng đồ thị chuẩn hóa đơn vị

Trên cơ sở dữ liệu đã có nêu trên, xây dựng các dạng đồ thị phụ tải chuẩn

hóa. Theo đó, lấy Công suất theo chu kỳ 30 phút của 24h (48 chu kỳ) chia cho

Pmax của ngày đó để có giá trị % đơn vị công suất, từ đó xây dựng đồ thị chuẩn hóa

đơn vị 24h (48 chu kỳ). Dữ liệu sau khi được thu thập sẽ được chuẩn hóa sang hệ

đơn vị tương đối bằng cách: chia công suất thu thập theo chu kỳ 30 phút cho công

suất max của ngày đó;

Các đồ thị chuẩn hóa gồm:

• Biểu đồ phụ tải 24h

✓ Biểu đồ ngày có sản lượng cao nhất.

✓ Biểu đồ ngày có công suất cao nhất.

✓ Biểu đồ ngày làm việc bình thường.

✓ Biểu đồ ngày nghỉ cuối tuần.

✓ Biểu đồ ngày nghỉ lễ, Tết.

• Một số biểu đồ phụ tải chuẩn hóa đơn vị:

Hình 4.4 – Một số Biểu đồ phụ tải chuẩn hóa đơn vị

Quan sát biểu đồ phụ tải điển hình của 07 ngày trong một tuần của khu vực

thành phố Hồ Chí Minh ta thấy sự biến đổi giữa các ngày thường (từ thứ 2 đến thứ

6) không có nhiều biến động và có cùng một kiểu biểu đồ phụ tải. Đối với đồ thị

phụ tải ngày thứ 7 thì có sự biến đổi nhưng không nhiều so với ngày thường, chủ

yếu nhu cầu phụ tải suy giảm vào buổi chiều tối. Đối với đồ thị phụ tải ngày Chủ

nhật thì hoàn toàn khác với các ngày thường (nhu cầu sử dụng điện xuống thấp).

100

Riêng đối với đồ thị phụ tải ngày Tết âm lịch thì đồ thị khá bằng phẳng, mức độ

chênh lệch cao thấp điểm không nhiều như các ngày bình thường khác trong năm.

Bảng 4.1 – Lịch qui đổi ngày dương lịch và âm lịch năm 2019

Dương lịch Thứ

1-1-19 2-1-19 1-2-19 2-2-19 3-2-19 4-2-19 5-2-19 6-2-19 7-2-19 8-2-19 9-2-19 10-2-19 11-2-19 12-2-19 14-4-19 30-4-19 1-5-19 2-9-19

tháng Năm 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019

1 1 2 2 2 2 2 2 2 2 2 2 2 2 4 4 5 9

Âm lịch 26/11/2018 AL 27/11/2018 AL 27/12/2018 AL 28/12/2018 AL 29/12/2018 AL 30/12/2018 AL 01/01/2019 AL 02/01/2019 AL 03/01/2019 AL 04/01/2019 AL 05/01/2019 AL 06/01/2019 AL 07/01/2019 AL 08/01/2019 AL 10/03/2019 AL 26/03/2019 AL 27/03/2019 AL 04/08/2019 AL

1 2 1 2 3 4 5 6 7 8 9 10 11 12 14 30 1 2

Ngày lễ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

4.3.3. Xây dựng các mô hình hồi quy cho STLF

Dữ liệu đầu vào được tách thành 2 phần: một phần dùng để huấn luyện cho

các giải thuật học máy và một phần để kiểm tra các kết quả dự báo của các giải

thuật dự báo được xây dựng.

a) Xây dựng hàm hồi qui bằng SARIMA

Để xây dựng hàm hồi qui bằng phương pháp SARIMA, trước tiên chúng ta

xác định tính dừng của bộ dữ liệu, tính mùa vụ và chu kỳ dữ liệu để tính toán các

biến trễ bậc p của phần autoregressive và q của phần moving average. Theo đó, khi

phân tích các Đồ thị tự tương quan – AC) và Đồ thị tự tương quan riêng phần –

PACF (đối với dữ liệu đã tính sai phân bậc 1 – do dữ liệu phân tích ở chương 1 là

các dữ liệu không dừng) ta có được:

- Tính chu kỳ lặp đi lặp lại 7 bậc liên tục.

101

- Từ đồ thị biểu diễn ACF ta xác định được biến trễ q tại các bậc 2 và 7 là

thông số cho mô hình MA(q).

- Từ đồ thị biểu diễn PACF ta xác định được biến trễ p tại các bậc 7 và 9 là

thông số cho mô hình AR(p). (Các thông số này được tính toán tự động

bằng chương trình)

Hình 4.5 – Phân tích AFC và PAFC

Theo đó, ta xây dựng được các mô hình SARIMA như:

- SARIMA([7 9], 1, [2 7])7: là mô hình với tính mùa vụ là 7, tại các độ trễ

p = [7 9] và q = [2 7], với sai phân bậc 1 của chuỗi dữ liệu.

- SARIMA(7, 1, 2)7: là mô hình với tính mùa vụ là 7, tại các độ trễ p = 7 và

q = 2, với sai phân bậc 1 của chuỗi dữ liệu.

- Và có thể xây dựng được rất nhiều mô hình khác như:

+ SARIMA(7, 1, 7)7

+ SARIMA(9, 1, 2)7

+ SARIMA(7, 1, 7)7

+ SARIMA(9, 1, 7)7

+ SARIMA(7, 1, 0)7

102

+ SARIMA(9, 1, 0)7 …

b) Xây dựng hàm hồi qui bằng SVR

Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày

01/01/2015 đến ngày 31/12/2019):

- Biến độc lập (biến dự báo) là dữ liệu công suất ngày thứ i (y1).

- Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: nhiệt độ trung bình

của ngày thứ i; 24/48 biến công suất chu kỳ 60/30 phút của ngày thứ i.

Bảng 4.2 – một số mô hình SVR

C - BoxConstraint KernelFunction ε - Epsilon

93.421 6.9088 1 100 polynomial gaussian linear linear 32.502 0.01 50.28 0.01

c) Xây dựng hàm hồi qui bằng Neural Network

Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày 1/1/2015

đến ngày 31/12/2019):

- Biến độc lập (biến dự báo) là dữ liệu công suất ngày thứ i (y1).

- Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: nhiệt độ trung bình

của ngày thứ i; 24/48 biến công suất chu kỳ 60/30 phút của ngày thứ i

(xtemp1 – chuỗi giá trị huấn luyện và xtemp2 – chuỗi giá trị biến phụ

thuộc phục vụ dự báo).

Hình 4.6 – Mô hình mạng NN

103

Sử dụng mô hình mạng Neural truyền thẳng (Feedforward neural network)

với các biến đầu vào như trên và bộ dữ liệu huấn luyên sẵn có. Trong đó, tín hiệu

đầu ra y(t) được đưa lại vòng lặp nhiều lần để tối ưu mô hình huấn luyện.

d) Xây dựng hàm hồi qui bằng Ramdom Forest

Chức năng TreeBagger được sử dụng để xây dựng mô hình, là một tập hợp

các cây hồi quy với mỗi bộ quy tắc khác nhau để thực hiện hồi quy phi tuyến tính.

Chúng tôi xây dựng tổng cộng 20 cây như vậy, với kích thước lá tối thiểu là 20.

Kích thước của lá nhỏ hơn kích thước cây nhằm kiểm soát hiện tượng overfitting và

mang lại hiệu suất cao.

Hình 4.7 – Mô hình Ramdom Forest

4.3.4. Đánh giá các mô hình

Để có thể đánh giá một mối quan hệ mô tả những giá trị quan sát có tốt hơn

một mối quan hệ khác hay không, cần phải có một giá trị đo lường toán học độ

thích hợp. Sai số phần trăm tuyệt đối trung bình (MAPE) được sử dụng để đánh giá

các mô hình:

4.3.5. Kết quả dự báo STLF

a) Các mô hình SVR (Suport Vector Regression)

104

Bảng 4.3 – Các thông số mô hình SVM Regression

C - BoxConstraint KernelScale ε - Epsilon

93.42 500.32 1 100 1.82 1.83 1.89 1.72 32.5 0.01 50.03 0.01

• Kết quả chạy test các mô hình SVR:

Hình 4.8 – Kết quả chạy test các mô hình SVR

Bảng 4.4 – Kết quả kiểm tra của các mô hình SVR

Date

YFs1

YFs2

YFs3

Yreal

07-12-19

3,463.90 3,014.66 2,958.02 3,343.13 3,355.00

08-12-19

2,471.36 2,379.76 2,395.66 2,356.70 2,759.00

09-12-19

3,636.76 3,272.26 3,165.11 3,390.92 3,662.00

10-12-19

3,864.48 3,627.33 3,255.44 3,659.95 3,720.00

11-12-19

3,661.32 3,620.76 3,246.36 3,478.78 3,719.00

12-12-19

3,698.35 3,607.63 3,274.22 3,509.21 3,721.00

13-12-19

3,853.97 3,614.00 3,393.69 3,627.94 3,850.00

105

Bảng 4.5 – Sai số của các mô hình SVR (%)

Date

Yts1 Yts2 Yts3 Yts4

07-12-19

3.25 10.14 11.83 0.35

08-12-19

10.43 13.75 13.17 14.58

09-12-19

0.69 10.64 13.57 7.40

10-12-19

3.88 2.49 12.49 1.61

11-12-19

1.55 2.64 12.71 6.46

12-12-19

0.61 3.05 12.01 5.69

13-12-19

0.10 6.13 11.85 5.77

MAPE

2.93 6.98 12.52 5.98

b) Các mô hình học máy (Neural Network, Ramdom Forest)

• Kết quả chạy test các mô hình học máy:

Hình 4.9 – Kết quả chạy test các mô hình học máy

Bảng 4.6 – Kết quả kiểm tra của các mô hình học máy

Date

YtNN

YtFeed

YtRF

Yreal

07-12-19

3,455.92 3,346.89 2,977.06 3,355.00

08-12-19

2,568.00 2,488.68 2,328.49 2,759.00

106

Date

YtNN

YtFeed

YtRF

Yreal

09-12-19

3,663.84 3,641.23 3,405.14 3,662.00

10-12-19

3,731.99 3,734.23 3,521.39 3,720.00

11-12-19

3,673.16 3,722.47 3,494.33 3,719.00

12-12-19

3,735.83 3,744.98 3,494.33 3,721.00

13-12-19

3,867.50 3,814.27 3,660.89 3,850.00

Bảng 4.7 – Sai số của các mô hình học máy (%)

Date

YtNN YtFeed YtRF

07-12-19

3.01 0.24 11.26

08-12-19

6.92 9.80 15.60

09-12-19

0.05 0.57 7.01

10-12-19

0.32 0.38 5.34

11-12-19

1.23 0.09 6.04

12-12-19

0.40 0.64 6.09

13-12-19

0.45 0.93 4.91

MAPE

1.77 1.81 8.04

c)

Đánh giá kết quả test các mô hình hồi qui:

Trong đó:

- Ytr: kết quả test bằng mô hình SARIMA(14,1,7)7.

- Yts1: kết quả test bằng mô hình SVR1.

- Yts2: kết quả test bằng mô hình SVR2.

- Yts3: kết quả test bằng mô hình SVR3.

- Yts3: kết quả test bằng mô hình SVR4.

- YtNN: kết quả test bằng mô hình Neural Network (10 layer in; 10

Hidden layer; 05 layer out).

- Ytfeed: kết quả test bằng mô hình Feedforward Networks.

- YtRF: kết quả test bằng mô hình Random Forest (20, 20).

107

• Kết quả chạy test các mô hình hồi qui:

Hình 4.10 – Kết quả chạy test các mô hình hồi qui

Bảng 4.8 – Sai số các mô hình (%)

Date

Ytr Yts1 Yts2 Yts3 Yts4 YtNN Ytfeed YtRF Ytr

07-12-19

6.10 3.25 10.14 11.83 0.35 3.01 0.24

11.26 6.10

08-12-19

7.18 10.43 13.75 13.17 14.58 6.92 9.80

15.60 7.18

09-12-19

5.57 0.69 10.64 13.57 7.40 0.05 0.57

7.01 5.57

10-12-19

5.13 3.88 2.49 12.49 1.61 0.32 0.38

5.34 5.13

11-12-19

5.10 1.55 2.64 12.71 6.46 1.23 0.09

6.04 5.10

12-12-19

4.68 0.61 3.05 12.01 5.69 0.40 0.64

6.09 4.68

13-12-19

4.49 0.10 6.13 11.85 5.77 0.45 0.93

4.91 4.49

MAPE

5.46 1.77 6.98 12.52 5.98 2.93 1.81

8.04 5.46

Qua đánh giá sai số phần trăm tuyệt đối trung bình (MAPE) kết quả chạy

các mô hình, ta thấy mô hình Yts1 có giá trị sai số thấp nhất trong các mô hình được

xét nêu trên (sai số 1,77%). Do đó, mô hình Yts1 sẽ được chọn làm mô hình dự báo

cho 07 ngày kế tiếp, với đầu vào là kết quả dự báo nhiệt độ cực đại (Tmax) của các

108

cơ quan khí tượng thủy văn và 24 đầu vào của công suất 24h trong ngày từ đồ thị

phụ tải điển hình (tương ứng thời điểm đang xét).

Hình 4.11 – Mô hình được chọn để dùng làm hàm dự báo

Hình 4.12 – Kết quả chạy dự báo cho 07 ngày tiếp theo

109

Hình 4.13 – Kết quả dự báo chu kỳ 60 phút/24h/7ngày

Từ biểu đồ phụ tải dự báo nêu trên ta thấy, đồ thị ngày 15/12/2019 sẽ là đồ

thị của ngày Chủ nhật (màu đỏ); đồ thị ngày thứ 2 – ngày 16/12/2019 (màu vàng);

tương tự các ngày còn lại đều tương đồng với các đồ thị chuẩn hóa đơn vị đã được

xây dựng ở phần trên.

110

4.3.6. Kiểm chứng bằng bộ dữ liệu ngày Tết Nguyên Đán (EVNHCMC)

Chạy thêm chương trình với bộ dữ liệu đầu vào khác (từ ngày 1/1/2015 đến

ngày 28/02/2018) để chúng ta kiểm chứng giải thuật dự báo cho 30 ngày của tháng

02 (tháng có Tết âm lịch), với chu kỳ là 60’/24h/ngày.

• Kết quả chạy test các mô hình SVR:

Hình 4.14 – Kết quả chạy test các mô hình SVR

Bảng 4.9 – Kết quả kiểm tra của các mô hình SVR

Date

YFs1

YFs2

YFs3

Yreal

23-01-19

3,739.45 3,738.50 3,414.78 3,611.61 3,737.92

24-01-19

3,589.46 3,552.43 3,325.68 3,410.23 3,668.61

25-01-19

3,605.57 3,622.95 3,294.82 3,507.31 3,603.75

26-01-19

3,416.50 3,471.17 3,119.51 3,368.62 3,404.72

27-01-19

2,600.15 2,596.72 2,589.39 2,596.70 2,718.54

28-01-19

3,567.07 3,854.81 3,215.30 3,455.74 3,590.06

29-01-19

3,491.93 3,639.00 3,166.54 3,368.90 3,466.71

111

Bảng 4.10 – Sai số của các mô hình SVR (%)

Date

Yts1 Yts2 Yts3 Yts4

23-01-19

0.04 0.02 8.64 3.38

24-01-19

2.16 3.17 9.35 7.04

25-01-19

0.05 0.53 8.57 2.68

26-01-19

0.35 1.95 8.38 1.06

27-01-19

4.35 4.48 4.75 4.48

28-01-19

0.64 7.37 10.44 3.74

29-01-19

0.73 4.97 8.66 2.82

MAPE

1.19 3.21 8.40 3.60

• Kết quả chạy test các mô hình học máy:

Hình 4.15 – Kết quả chạy test các mô hình học máy

Bảng 4.11 – Kết quả kiểm tra của các mô hình học máy

Date

YtNN

YtFeed

YtRF

Yreal

23-01-19

3,716.65 3,671.66 3,633.09 3,737.92

24-01-19

3,562.02 3,488.92 3,600.07 3,668.61

25-01-19

3,588.26 3,547.24 3,597.67 3,603.75

26-01-19

3,301.47 3,245.65 3,383.32 3,404.72

112

Date

YtNN

YtFeed

YtRF

Yreal

27-01-19

2,695.60 2,627.07 2,508.15 2,718.54

28-01-19

3,686.51 3,627.17 3,562.48 3,590.06

29-01-19

3,519.98 3,362.29 3,466.72 3,466.71

Bảng 4.12 – Sai số của các mô hình học máy (%)

Date YtNN YtFeed YtRF

23/1/18

0.57

1.77

2.80

24/1/18

2.91

4.90

1.87

25/1/18

0.43

1.57

0.17

26/1/18

3.03

4.67

0.63

27/1/18

0.84

3.36

7.74

28/1/18

2.69

1.03

0.77

29/1/18

1.54

3.01

0.00

MAPE

1.71

2.90

2.00

• Kết quả chạy test các mô hình hồi qui:

Hình 4.16 – Kết quả chạy test các mô hình hồi qui

113

Bảng 4.13 – Sai số các mô hình hồi qui (%)

Date

Ytr Yts1 Yts2 Yts3 Yts4 YtNN Ytfeed YtRF Ytr

23/1/18

4.50 0.04 0.02 8.64 3.38 0.57 1.77

2.80 4.50

24/1/18

2.25 2.16 3.17 9.35 7.04 2.91 4.90

1.87 2.25

25/1/18

2.72 0.05 0.53 8.57 2.68 0.43 1.57

0.17 2.72

26/1/18

18.88 0.35 1.95 8.38 1.06 3.03 4.67

0.63 18.88

27/1/18

51.92 4.35 4.48 4.75 4.48 0.84 3.36

7.74 51.92

28/1/18

16.77 0.64 7.37 10.44 3.74 2.69 1.03

0.77 16.77

29/1/18

24.39 0.73 4.97 8.66 2.82 1.54 3.01

0.00 24.39

MAPE

17.35 1.19 3.21 8.40 3.60 1.71 2.90

2.00 17.35

Hình 4.17 – Mô hình được chọn để dùng làm hàm dự báo

114

Hình 4.18 – Kết quả chạy dự báo cho 30 ngày tiếp theo

Qua quan sát kết quả dự báo cho tháng 02/2018 (Chi tiết theo phụ lục đính

kèm), chúng ta thấy kết quả dự báo khá bám sát giá trị thực tế của tháng 02/2018

(tháng có Tết âm lịch), tháng mà có sự sai biệt không tuân theo qui luật và mỗi năm

sẽ có sư khác nhau giữa lịch dương và lịch âm. Như vậy, việc sử dụng Biểu đồ phụ

tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm

hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nằm trong giới

hạn cho phép.

4.3.7. Kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc Tập đoàn

Điện lực Việt Nam (Chi tiết theo Phụ lục đính kèm)

115

4.4. TỔNG KẾT CHƯƠNG IV

Qua quan sát kết quả dự báo tại các bộ dữ liệu thử nghiệm, chúng ta thấy kết

quả dự báo bám khá sát giá trị thực tế, nhất là kết quả dự báo của tháng 02/2018

(tháng có Tết âm lịch), tháng mà có sự sai biệt không tuân theo qui luật và mỗi năm

sẽ có sự khác nhau giữa lịch dương và lịch âm. Như vậy, việc sử dụng Biểu đồ phụ

tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm

hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết

được câu chuyện chênh lệch ngày âm và ngày dương, nhất là trong các tháng 01 và

02 (tháng có Tết âm lịch).

Qua kết quả chạy các bộ dữ liệu, cũng như chạy các mô hình dự báo khác

nhau, chúng ta thấy tương ứng với từng bộ dữ liệu (theo các thời điểm khác nhau)

thì sai số phần trăm tuyệt đối trung bình (MAPE) bé nhất của cả 02 kết quả dự báo

đều rơi vào mô hình SVR (Support Vector Regression) – đã kiểm chứng với bộ dữ

liệu của 05 Tổng công ty Điện lực thuộc Tập đoàn Điện lực Việt Nam (theo Phụ lục

đính kèm).

Như vậy, một lần nữa khẳng định tính vượt trội của mô hình SVR trong công

tác dự báo ngắn hạn (STLF). Tuy nhiên, trong một vài trường hợp mô hình Random

Forest cũng có giá trị sai số phần trăm tuyệt đối trung bình (MAPE) thấp hơn cả mô

hình SVR, do đó cần có một nghiên cứu chi tiết hơn về việc ứng dụng mô hình này

vào bài toán dự báo.

Ngoài ra, luận án cũng đã thử nghiệm được nhiều mô hình dự báo tiên tiến

theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân

tạo (học máy) – mô hình Support Vector Regression (SVR); mạng Neural Network,

Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Qua đó, luận án đã

đánh giá kết quả xây dựng đường cong hồi qui của từng mô hình, với những bộ

trọng số khác nhau, để từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự

báo STLF.

116

Hiện nay luận án đang chạy các mô hình trên bộ cơ sở dữ liệu là nhiệt độ,

công suất, sản lượng của toàn hệ thống điện thành phố Hồ Chí Minh, mà chưa tiến

hành chạy mô hình đến từng nút, từng thanh cái hoặc từng máy biến áp và thậm chí

đến từng vị trí tải. Do hạn chế về mặt thu thập dữ liệu trong quá trình vận hành (thu

thập dữ liệu đo đếm chu kỳ 60 phút/ 30 phút như yêu cầu) đối với các vị trí nêu trên

nên hướng phát triển sắp tới là sử dụng mô hình các bộ huấn luyện đã trình bày trên

để chạy dự báo STLF cho một số nút là các TBA 220kV hoặc TBA 110kV trên địa

bàn thành phố (có bộ dữ liệu được thu thập theo đúng yêu cầu).

117

CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN CẠNH TRANH CỦA VIỆT NAM

5.1. TỔNG QUAN VỀ THỊ TRƯỜNG ĐIỆN VIỆT NAM HIỆN NAY

Thị trường điện phát điện cạnh tranh (VCGM) chính thức vận hành từ

1/7/2012 là thị trường toàn phần, điều độ tập trung chào giá ngày tới theo chi phí

(day ahead mandatory cost-based pool), sử dụng cơ chế thanh toán sau vận hành

(ex-post), sử dụng thị trường năng lượng ngày tới có kèm theo hợp đồng khống chế

CfD (CfD vesting) kết hợp cơ chế trả phí công suất CAN (Capacity Add oN). Việc

thanh toán chia làm hai phần, chi phí năng lượng sẽ được trả bằng chi phí biên của

hệ thống (SMP) được xác lập bằng chi phí biên ngắn hạn (SRMC) của tổ máy đắt

nhất trong lịch phát cho tất cả các tổ máy trong giờ đó kèm theo khoản thanh toán

bổ sung để bù chi phí công suất là CAN.

Tất cả các nhà máy điện (NMĐ) có công suất đặt từ 30MW trở lên đều phải

tham gia TTĐ. Vào trước ngày giao dịch (ngày D-1), các NMĐ tham gia TTĐ phải

gửi cho Đơn vị vận hành hệ thống và thị trường điện (MSO- A0) bản chào giá điện

năng cho từng tổ máy cho 24 chu kỳ giao dịch giờ của ngày giao dịch (ngày tới, còn

gọi là ngày D).

Giá điện năng (SMP) trả cho các NMĐ trực tiếp tham gia TTĐ thông qua thị

trường giao ngay, được tính toán hàng giờ trên cơ sở giá chào của các đơn vị phát

điện trên VCGM từ ngày D-1, dự báo phụ tải và sản lượng các NMĐ gián tiếp công

bố từng giờ. Giá SMP là giá biên hệ thống, là giá chào của tổ máy biên được xác

định bằng phương pháp lập lịch không ràng buộc với phụ tải thực tế đo đếm (ex-

post pricing).

Tính đến cuối tháng 12/2019, tổng số nhà máy điện (NMĐ) đang vận hành

trong hệ thống là 217 NMĐ (không kể các nhà máy thủy điện nhỏ) với tổng công

suất đặt là 51.137 MW (chưa bao gồm nguồn nhập khẩu), với tổng số nhà máy điện

tham gia trực tiếp chào giá trên thị trường điện lên đến 98 nhà máy.

118

Chi tiết cơ cấu các nguồn tham gia trực tiếp và gián tiếp VCGM nêu tại các

hình dưới đây.

Hình 5.1 – Công suất các nguồn tham gia trực tiếp và gián tiếp VCGM

Cơ cấu công suất đặt theo loại hình tham gia VCGM như sau:

- 98 NMĐ trực tiếp tham gia VCGM với tổng công suất đặt là 25.852 MW

chiếm 46% tổng công suất đặt toàn hệ thống.

- 111 NMĐ gián tiếp tham gia với tổng công suất 15.666 MW chiếm 28%

tổng công suất đặt toàn hệ thống (các NMĐ chạy dầu, NMĐ Cà Mau

1&2 theo yêu cầu khai thác tối đa khí PM3, các NMĐ thuộc khu công

nghiệp, các nhà máy BOT đã ký hợp đồng nguyên tắc, các NMĐ năng

lượng tái tạo);

- 14 NMTĐ chiến lược đa mục tiêu (SMHP) và các NMĐ phối hợp vận

hành với SMHP với tổng công suất 8.701 MW chiếm 16% tổng công

suất đặt toàn hệ thống.

119

Trong năm 2019, sản lượng nhiệt điện than chiếm tỉ trọng lớn nhất với hơn

118.2 tỉ kWh. Sản lượng thủy điện, tuabin khí và các loại hình khác đóng góp phần

còn lại nhu cầu hệ thống, cụ thể:

Hình 5.2 – Cơ cấu sản lượng điện năng theo hình thức tham gia thị trường

Sau 8 năm vận hành, mặc dù tổng công suất đặt nguồn điện tham gia VCGM

có tăng hàng năm nhưng với tỷ lệ không đáng kể, chi tiết:

Hình 5.3 – Tăng trưởng công suất đặc các tham gia VCGM

Thời điểm bắt đầu chính thức vận hành VCGM (1/7/2012), mới chỉ có 31

NMĐ trực tiếp tham gia chào giá với tổng công suất 9.212 MW chiếm 38% tổng

120

công suất đặt hệ thống. Sau 8 năm vận hành, số lượng nhà máy thủy điện, nhiệt điện

tăng cao dẫn đến sự thay đổi lớn diễn biến giá điện năng thị trường so với các năm

trước, cụ thể năm 2019: Tổng công suất nguồn thủy điện đưa vào vận hành năm

2019 là 110.6 MW và Tổng sản lượng thủy điện khai thác đạt 68.1 tỷ kWh; Tổng

sản lượng nguồn nhiệt điện than khai thác đạt 119.14 tỷ kWh.

Hình 5.4 – Sản lượng Thủy điện qua các năm

Hình 5.5 – Sản lượng Nhiệt điện qua các năm

121

Hình 5.6 – Tăng trưởng các nhà máy tham gia thị trường điện

Giá VCGM nhìn chung phản ánh cân bằng cung cầu, tăng trưởng của phụ tải,

có diễn biến phụ thuộc mùa thủy văn và tình hình hệ thống điện. Giá biên của hệ

thống (SMP) và giá toàn phần (FMP) thể hiện

Hình 5.7 – Giá SMP và FMP bình quân qua các năm

122

Hình 5.8 – Giá trần thị trường qua các năm

5.1.1. Thị trường phát điện cạnh tranh (giai đoạn 2012 - 2018)

Hình thành và phát triển thị trường điện cạnh tranh là chiến lược phát triển

dài hạn của ngành điện Việt Nam đã được quy định trong Luật Điện lực và được cụ

thể hóa trong Quyết định số 63/2013/QĐ-TTg ngày 08 tháng 11 năm 2013 của Thủ

tướng Chính phủ quy định về lộ trình, các điều kiện và cơ cấu ngành điện để hình

thành và phát triển các cấp độ thị trường điện lực tại Việt Nam (thay thế Quyết định

số 26/2006/QĐ-TTg).

Đối tượng tham gia Thị trường phát điện cạnh tranh bao gồm: Bên bán điện

là các đơn vị phát điện đủ điều kiện tham gia thị trường; bên mua điện là đơn vị

mua buôn duy nhất (Công ty Mua bán điện đại diện EVN mua toàn bộ điện năng từ

các đơn vị phát điện và bán buôn cho các TCTĐL); và các đơn vị cung cấp dịch vụ

(Trung tâm Điều độ hệ thống điện quốc gia có chức năng điều độ hệ thống điện và

điều hành giao dịch thị trường điện, Tổng công ty Truyền tải điện quốc gia có chức

năng vận hành lưới truyền tải điện).

Thị trường phát điện cạnh tranh áp dụng mô hình thị trường điện tập trung

toàn phần. Toàn bộ điện năng phát của các nhà máy điện được chào bán cho Đơn vị

mua buôn duy nhất trên thị trường giao ngay.

123

Hình 5.9 – Cấu trúc thị trường Phát điện cạnh tranh Việt Nam

Thị trường điện giao ngay có chu kỳ giao dịch là 01 (một) giờ. Chu kỳ thanh

toán trong thị trường là 01 (một) tháng. Đơn vị vận hành hệ thống điện và thị trường

điện chịu trách nhiệm tính toán và công bố các khoản thanh toán trong thị trường

điện giao ngay. Căn cứ số liệu thanh toán do Đơn vị vận hành hệ thống điện và thị

trường điện công bố và hợp đồng mua bán điện đã ký với EVN/EPTC, đơn vị phát

điện tính toán và phát hành hoá đơn cho chu kỳ thanh toán.

5.1.2. Thị trường bán buôn điện cạnh tranh (từ 01/01/2019)

Mô hình thiết kế tổng thể và thiết kế chi tiết thị trường bán buôn điện cạnh

tranh hoàn chỉnh đã được Bộ Công Thương tiếp thu, chọn lọc các cơ chế, mô hình

thị trường điện tiên tiến trên thế giới (Úc, Ireland, Singapore…) kết hợp với các

điều chỉnh phù hợp với điều kiện đặc thù của ngành điện Việt Nam.

Theo đó, từ năm 2018 thị trường điện Việt Nam đã chuyển từ Thị trường

phát điện cạnh tranh sang Thị trường bán buôn điện cạnh tranh (VWEM) và từ năm

2019 vận hành Thị trường bán buôn điện cạnh tranh hoàn chỉnh. Tham chiếu theo

bối cảnh ngành điện thực tế, kinh nghiệm vận hành trong giai đoạn Thị trường bán

124

buôn điện cạnh tranh thí điểm, cũng như các điều kiện khác để xây dựng Thị trường

bán buôn điện cạnh tranh hoàn chỉnh, Bộ Công Thương đã ban hành phương án vận

hành Thị trường bán buôn điện cạnh tranh năm 2019 (Quyết định số 3038/QĐ-BCT

ngày 24 tháng 8 năm 2018). Bên cạnh đó Bộ Công Thương cũng đã ban hành quy

định vận hành thị trường bán buôn điện cạnh tranh năm 2019 (Thông tư số

45/2018/TT-BCT ngày 15 tháng 11 năm 2018) tạo cơ sở pháp lý để các đơn vị triển

khai thực hiện.

Thị trường bán buôn điện cạnh tranh là một thị trường mới, phức tạp với sự

tham gia của nhiều người bán và nhiều người mua nên yêu cầu hệ thống hạ tầng

công nghệ thông tin đủ mạnh tại Trung tâm Điều độ hệ thống điện Quốc gia và tại

các đơn vị phát điện, các công ty điện lực. Các cơ chế hợp đồng trong Thị trường

bán buôn điện cạnh tranh bao gồm: Hợp đồng song phương (ký dưới dạng hợp đồng

CfD), hợp đồng vesting (phân bổ hợp đồng từ các hợp đồng hiện hữu ký với EVN

cho các TCTĐL), sàn giao dịch hợp đồng (quản lý rủi ro cho bên bán và bên mua

trước biến động giá của thị trường).

Theo Thiết kế chi tiết được phê duyệt tại Quyết định 8266/QĐ-BCT ngày 10

tháng 8 năm 2015 của Bộ Công Thương, mô hình Thị trường bán buôn điện cạnh

tranh được minh họa trong hình vẽ sau:

Hình 5.10 – Mô hình Thị trường bán buôn điện cạnh tranh

125

Trong năm 2019, Các Tổng công ty Điện lực mua một phần sản lượng điện

năng đầu nguồn trên thị trường điện (theo giá thị trường giao ngay và hợp đồng).

Phần sản lượng điện còn lại được mua từ Tập đoàn Điện lực Việt Nam theo cơ chế

giá bán buôn điện nội bộ (BST). Các Tổng công ty được phân bổ hợp đồng của nhà

máy điện Phú Mỹ 1 và Phú Mỹ 4; và trực tiếp ký kết hợp đồng với 04 nhà máy điện

mới (Thái Bình 1, Vĩnh Tân 4, Duyên Hải 3 mở rộng, Vĩnh Tân 4 mở rộng).

Thị trường điện giao ngay vận hành theo mô hình chào giá theo chi phí biến

đổi, có chu kỳ giao dịch là 01 giờ (khi điều kiện về hạ tầng công nghệ thông tin đáp

ứng sẽ áp dụng chu kỳ giao dịch là 30 phút) và chu kỳ thanh toán là 01 tháng. Giá

thị trường được xác định căn cứ trên bản chào giá hàng ngày của các nhà máy điện

và nhu cầu phụ tải thực tế trong từng chu kỳ giao dịch, trên nguyên tắc tối thiểu hóa

chi phí mua điện toàn hệ thống.

Mô hình vận hành thị trường bán buôn điện cạnh tranh năm 2019 (tuân thủ

theo Quyết định 8266/QĐ-BCT ngày 10/8/2015 của Bộ Công Thương.) như hình

bên dưới:

Hình 5.11 – Mô hình Thị trường bán buôn điện cạnh tranh năm 2019

126

Giá thị trường các Tổng công ty Điện lực thanh toán trung bình năm khoảng

1230.1/kWh, trong đó trung bình tháng cao nhất là 1348.3 đ/kWh, trung bình tháng

thấp nhất là 1017.3 đ/kWh, cụ thể:

Hình 5.12 – Vận hành VWEM năm 2019

5.2. CÁC YÊU CẦU VỀ DỰ BÁO PHỤ TẢI TRONG VWEM

Theo qui định tại Quyết định số 4804/QĐ-BCT ngày 26 tháng 12 năm 2017

của Bộ trưởng Bộ Công Thương về việc Phê duyệt phương án vận hành Thị

trường bán buôn điện cạnh tranh thí điểm năm 2018 và qui định tại Quyết định số

07/QĐ-ĐTĐL ngày 14 tháng 03 năm 2013 của Cục trưởng Cục Điều tiết điện lực

về việc phê duyệt Quy trình dự báo nhu cầu phụ tải điện Hệ thống điện quốc gia,

có rất nhiều số liệu dự báo phụ tải cho nhiều mục đích được thực hiện bởi nhiều tổ

chức khác nhau:

- Tổng sơ đồ phát triển điện lực (giám sát bởi MOIT/ERAV):

+ 5 đến 20 năm.

+ Năng lượng và phụ tải cực đại (phân chia ra từng điểm ranh giới).

- Kế hoạch phát triển lưới điện truyền tải và phân phối:

+ Cập nhật hàng năm.

127

+ Từ 2 đến 5 năm.

+ Năng lượng và phụ tải cực đại (phân chia ra từng điểm ranh giới).

- Dự báo trước 1 năm (SMO theo quy định của VWEM):

+ Cập nhật chu kỳ 3 tháng.

+ 0 đến 2 năm.

+ Biểu đồ phụ tải hàng tuần theo 30 phút.

+ Bộ số liệu phụ tải 30 phút cho mô phỏng.

+ Mô phỏng cho các nút và các khu vực.

- Dự báo trước 1 tháng (SMO theo quy định của VWEM):

+ Cập nhật hàng tuần.

+ Cập nhật dự báo đối với những tháng tiếp theo.

+ Bộ số liệu phụ tải 30 phút cho mô phỏng MAP từ 0-1 tháng.

+ Dự báo nút cho mô phỏng.

- Dự báo trước 1 tuần (SMO theo quy định của VWEM):

+ Cập nhật hàng ngày.

+ Dự báo chu kỳ 30 phút cho 0 - 7 ngày tới.

+ Dự báo các nút.

- Dự báo trước 1 ngày (SMO theo quy định của VWEM):

+ Cập nhật hàng tuần.

+ Dự báo chu kỳ 30 phút cho 0-24 giờ tới.

+ Dự báo các nút.

128

Hình 5.13 – Các biên độ và mục đích dự báo trong vận hành hệ thống điện

129

Hình 5.14 – Điều độ Thị trường điện theo thời gian

5.2.1. Dự báo phục vụ Kế hoạch phát triển lưới điện truyền tải và phân phối

Đây là một công tác hết sức quan trọng, nhằm định hướng cho sự phát triển

lưới điện, cũng như đề xuất khối lượng đầu tư cho lưới điện trong thời gian từ 3 – 5

năm tới, nó góp phần quan trọng trong việc xây dựng các Kế hoạch Sản xuất kinh

doanh, Đầu tư xây dựng của các Tổng công ty điện lực.

Với số liệu đầu vào là sản lượng điện thương phẩm, công suất cực đại, thời

tiết (nhiệt độ, độ ẩm), dân số qua các năm của cả khu vực, của từng ngành – từng

thành phần kinh tế trong đóng góp GRDP của tỉnh, khối lượng khách hàng qua các

năm,… các chính sách phát triển kinh tế của tỉnh, các chính sách phát triển nguồn

năng lượng tái tạo, khuyến khích tiết kiệm điện,… Trên cơ sở số liệu quá khứ nêu

trên, chúng ta sẽ đánh giá mức độ tương quan của các thành phần và từ đó xây dựng

hàm tương quan, hồi qui để dự báo cho 3 – 5 năm sắp tới dựa trên các giả định

chính sách đã được phê chuẩn.

• Dữ liệu đầu vào (khu vực TP.HCM):

130

Bảng 5.1 – Bảng thống kê điện thương phẩm theo 5 thành phần

Điện thương phẩm hàng năm theo nhóm khách hàng (GWh)

SL điện nhận

Năm Công nghiệp Thương mại

Nông nghiệp Khác

Tổng

Dân dụng sinh hoạt

2014

7,557.37

2,378.57

7,452.13

61.81

1,158.48 18,608

19,405

2015

8,094.02

2,622.86

8,132.45

67.13

1,265.39 20,182

21,192

2016

8,701.96

2,943.47

8,803.81

73.78

1,365.06 21,888

22,791

2017

9,030.14

3,172.26

9,135.88

80.31

1,474.20 22,893

23,886

Bảng 5.2 – Bảng thống kê điện khách hàng theo 5 thành phần

Số lượng khách hàng hàng năm (triệu người)

Năm Công nghiệp Thương mại Dân dụng sinh hoạt Nông nghiệp Khác

Tổng

2014

58,172

77,926

1,857,176

7,505

39,597 2,040,376

2015

60,045

71,048

1,935,441

8,713

42,130 2,117,377

2016

61,465

71,342

2,028,682

10,634

41,793 2,213,916

2017

65,203

74,008

2,136,676

11,393

43,832 2,331,112

Bảng 5.3 – Bảng thống kê GRDP theo thành phần kinh tế

EVNHCMC (Ho Chi Minh City)

Năm

GRDP công nghiệp

GRDP Nông nghiệp

GRDP Dịch vụ Dân số

(Tổng) GRDP Tỷ đồng

2014

852,523

7,557.37

61.81

9,830.70

8,072

2015

957,358

8,081.40

67.09

10,710.98

8,248

2016

1,023,926

8,426

8,701.96

73.78

11,747.28

2017

1,060,618

8,611

• Đánh giá mức độ tương quan của các biến:

Qua phân tích đồ thị tương quan giữa thành phần Sản lương điện nhận với

các thành phần GRDP (kinh tế), Khách hàng (phụ tải tiêu thụ điện) và Dân số thì

chúng ta thấy các thành phần này quan hệ rất chặt chẻ với nhau (giá trị R2 có giá trị

rất cao > 96%). Điều đó chứng tỏ rằng: thành phần kinh tế (GRDP) và thành phần

phụ tải sử dụng điện tác động rất lớn đến Sản lượng điện tiêu thụ, sự tăng giảm của

các thành phần này sẽ quyết định đến tốc độ tăng trưởng của ngành điện. Trên thực

tế, Sản lượng điện tiêu thụ còn phụ thuộc vào nhiều yêu tố khác như: thời tiết; cơ

chế chính sách đối với giá điện; công nghệ sản xuất; các cơ chế chính sách tiết kiệm

điện; sự phát triển của các nguồn năng lượng mặt trời (Solar Rootop);… Tuy nhiên,

131

để xây dựng được các đường cong hồi qui thì chúng ta cần có số liệu thống kê đầy

đủ của các yếu tố này.

Hình 5.15 – Đồ thị tương quan của các thành phần

132

• Xây dựng mô hình dự báo dài hạn:

Trên cơ sở bộ số liệu thống kê nêu trên, chạy phân tích ANOVA để xác định

các hệ số trong hàm hồi qui. Sau đó dùng các giả định về tình hình phát triển kinh tế

- xã hội, tăng trưởng dân số, cũng như định hướng phát triển ngành trong các năm

tới để dự báo Sản lượng điện tiêu thụ, cũng như Công suất cực đại của hệ thống để

chuẩn bị các kịch bản cho chiến lược Sản xuất kinh doanh, các Kế hoạch đầu tư,…

Hình 5.16 – Kết quả phân tích ANOVA

Bảng 5.4 – Các giả thuyết đầu vào dựa trên các chính sách dài hạn

GDP KH Dân số LF 68% 9.0% 5.0%

4.0%

Bảng 5.5 – Kết quả dự báo dài hạn (đến năm 2025)

Năm

GDP

KH

Dân số

Pmax (MW)

Sản lượng (tr.kWh)

1,156,074 2,447,668

8,955

25,295.33

2018

4,246.46

2019 2020 2021

9,314 1,260,120 2,570,051 9,686 1,373,531 2,698,554 1,497,149 2,833,481 10,074

26,570.89 27,949.16 29,438.07

4,460.60 4,691.98 4,941.93

2022 2023 2024 2025

1,631,892 2,975,155 10,477 1,778,763 3,123,913 10,896 1,938,851 3,280,109 11,331 2,113,348 3,444,114 11,785

31,046.16 32,782.67 34,657.53 36,681.48

5,211.89 5,503.40 5,818.15 6,157.92

133

Hình 5.17 – Định hướng tốc độ tăng trưởng điện năng

5.2.2. Dự báo phục vụ công tác vận hành thị trường điện cạnh tranh

Khoản 3 – Điều 28 của Thông tư số 45/2018/TT-BCT của Bộ Công Thương

ngày 15 tháng 11 năm 2018 có qui định “Trước ngày 10 tháng 11 hàng năm, đơn

vị mua buôn điện có trách nhiệm cập nhật và cung cấp số liệu phụ tải dự báo

năm tới cho Đơn vị vận hành hệ thống điện và thị trường điện để phục vụ

công tác tính toán phân bổ sản lượng hợp đồng cho đơn vị mua buôn điện”.

Do đó, bằng các kỹ thuật đã nghiên cứu ở các Chương trên, chúng ta sẽ áp

dụng vào để chạy kết quả dự báo theo yêu cầu của Cục Điều tiết điện lực (ERAV) –

Bộ Công Thương là: Dự báo chu kỳ 60 phút cho 365 ngày và sẽ cập nhật hiệu chỉnh

hàng tháng trên trang web của Thị trường điện Việt Nam.

134

• Lưu đồ giải thuật:

Hình 5.18 – Lưu đồ giải thuật dự báo 365 ngày – 24 chu kỳ

• Xây dựng Biểu đồ chuẩn hóa đơn vị (SLP) cho năm 2019:

135

Bảng 5.6 – Dữ liệu thống kê theo tháng

Year Month Tmax Ttb Tmin Atong

Pmax

27.68

1,700.61 3,510.20

2017

27.49

1,607.96 3,487.70

28.45

2,028.50 3,644.00

29.54

2,052.00 3,867.88

28.87

2,117.58 3,808.50

28.64

2,053.37 3,844.80

27.91

2,040.59 3,783.20

28.08

2,097.69 3,734.50

28.49

2,055.06 3,853.20

27.58

2,054.23 3,771.10

27.60

2,022.96 3,615.29

26.90

2,055.08 3,611.43

34.33 27.44 20.00 2,042.03 3,709.64

2018

35.33 27.41 19.33 1,472.25 3,611.63

37.33 28.73 22.33 2,208.19 3,988.82

37.67 30.08 23.67 2,194.87 4,239.53

36.67 29.98 24.33 2,296.81 4,376.34

36.00 28.64 24.00 2,151.94 4,076.06

35.00 28.28 23.67 2,166.21 4,024.67

35.00 28.33 23.33 2,195.56 4,035.40

35.00 28.23 22.33 2,076.88 3,946.70

34.33 27.74 23.33 2,244.22 4,021.03

34.67 28.13 22.67 2,135.90 3,949.87

34.33 27.35 21.33

2,233.97 4,070.30

(Chi tiết thống kê từ năm 2015 – 2019 theo phụ lục đính kèm)

Bảng 5.7 – Dữ liệu thống kê theo ngày từ 01/01/2014 – 31/12/2019

(Bao gồm các dữ liệu: Công suất, Sản lượng, Nhiệt độ chu kỳ 60’)

Chi tiết theo phụ lục đính kèm

136

Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta có

thể xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và cần

chuẩn xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc,

ngày nghỉ,…), từng tuần, từng tháng. SLP cần được phối hợp tính toán với việc

chuyển đổi giữa ngày Dương lịch (Sun Calenda) và ngày Âm lịch (Luna Calenda).

Bảng 5.8 – Lịch qui đổi ngày dương lịch và âm lịch các ngày lễ năm 2019

Dương lịch Thứ tháng Năm

Âm lịch

tháng Ngày lễ

1/1/19

2019 26/11/2018 AL

2/1/19

2019 27/11/2018 AL

1/2/19

2019 27/12/2018 AL

2/2/19

2019 28/12/2018 AL

3/2/19

2019 29/12/2018 AL

4/2/19

2019 30/12/2018 AL

5/2/19

2019 01/01/2019 AL

6/2/19

2019 02/01/2019 AL

7/2/19

2019 03/01/2019 AL

8/2/19

2019 04/01/2019 AL

9/2/19

2019 05/01/2019 AL

10/2/19

2019 06/01/2019 AL

11/2/19

2019 07/01/2019 AL

12/2/19

2019 08/01/2019 AL

14/4/19

4 2019 10/03/2019 AL

30/4/19

4 2019 26/03/2019 AL

1/5/19

5 2019 27/03/2019 AL

2/9/19

9 2019 04/08/2019 AL

137

❖ Biểu đồ chuẩn hóa đơn vị (SLP) cho một số ngày đặc trưng năm 2019

Hình 5.19 – SLP của ngày Tết Dương lịch 01/01/2019

Hình 5.20 – SLP của ngày mồng 1 - Tết Nguyên đán Kỷ Hợi

138

Hình 5.21 – SLP của ngày 30/04/2019

Hình 5.22 – SLP của ngày 02/09/2019

(Chi tiết SLP của các ngày trong năm 2019 theo phụ lục đính kèm)

139

Bảng 5.9 – Kết quả dự báo 12 tháng năm 2019

Tháng

Athang (triệu kWh)

Pmax (MW)

2,033,951

3650

1,513,645

3727

2,204,906

3836

2,093,040

4056

2,237,731

4118

2,169,530

3971

2,168,096

3942

2,212,236

4069

2,080,567

4083

2,184,142

4033

2,135,895

4099

2,152,105

3953

4118

Tổng

25,185,844

Bảng 5.10 – Kết quả dự báo 365 ngày của năm 2019

(Chi tiết 8760 chu kỳ của năm 2019 theo phụ lục đính kèm)

Hình 5.23 – Kết quả dự báo 365 ngày – 24 chu kỳ của năm 2019

140

5.2.3. Kết quả áp dụng Kỹ thuật dự báo vào vận hành Thị trường điện Bán

buôn Việt Nam (phạm vi Tổng công ty Điện lực TP.HCM)

Trong giai đoạn vận hành thử nghiệm Thị trường bán buôn cạnh tranh (năm

2018) và đi vào vận hành chính thức năm 2019, Kỹ thuật dự báo nêu trên đã được

áp dụng vào công tác dự báo 8760 chu kỳ/năm của Tổng công ty Điện lực TP.HCM

nhằm thay thế cho phương pháp dự báo thủ công trước đây (theo nhận định của

chuyên gia và không có phân ra được 24 chu kỳ/ngày).

Theo đó, kết quả sai số dự báo thực hiện phù hợp với qui định tại Quyết định

số 07/QĐ-ĐTĐL ngày 14 tháng 03 năm 2013 của Cục trưởng Cục Điều tiết điện

lực về việc phê duyệt Quy trình dự báo nhu cầu phụ tải điện Hệ thống điện quốc

gia, sai số lũy kế cho phép là ± 3%, cụ thể:

❖ Bảng 5.11 – Kết quả sai số dự báo năm 2018

Pmax (MW)

A (MWh)

Sai số (%)

Tháng

Dự báo - A0 (MWh)

Số dự báo

Số A0

Ngày Tháng

Chu kỳ

Dự báo

Thực tế

Tích lũy

5.12

3650

3709.9

2,033,951

2,043,090

-9,138

2.48

-0.45

3727

3614.1

1,513,645

1,472,247

41,398

9.67

0.08

2.81

0.92

3836

3990.5

2,204,906

2,208,187

-3,281

4.26

1.27

-0.15

0.51

4056

4154.4

2,093,040

2,183,190

-90,150

5.26

4.54

-4.13

-0.77

4118

4269

2,237,731

2,296,296

-58,566

4.88

3.72

-2.55

-1.17

3971

4081.3

2,169,530

2,151,946

17,584

6.08

3.50

0.82

-0.83

3942

4093.6

2,168,096

2,204,384

-36,288

5.00

2.49

-1.65

-0.95

4069

4039.5

2,212,236

2,195,559

16,677

6.23

3.97

0.76

-0.73

4083

3953

2,080,567

2,076,880

3,687

6.93

3.29

0.18

-0.63

4033

4034.6

2,184,142

2,244,411

-60,269

5.45

3.42

-2.69

-0.85

4099

4047.1

2,135,895

2,167,521

-31,626

6.51

4.26

-1.46

-0.90

3953

4070.3

2,152,105

2,233,973

-81,868

6.92

5.55

-3.66

-1.15

TỔNG

4118

4269

25,185,844 25,477,684

-291,840

6.03

3.21 -1.01

-1.15

141

❖ Bảng 5.12 – Kết quả sai số dự báo năm 2019

Pmax (MW)

A (MWh)

Sai số (%)

Tháng

Dự báo - A0 (MWh)

Số dự báo

Số A0

Ngày Tháng

Dự báo

Thực tế

Chu kỳ

Tích lũy

4299.7

3957.0

2,192,536

2,148,140

36,150

4.38

1.68

5.05

1.68

3599.4

3991.5

1,625,906

1,652,468

-32,958

3.90

3.36

-1.99

0.08

4187.1

4291.6

2,329,397

2,376,993

-57,190

3.30

2.96

-2.40

-0.87

4356.4

4651.1

2,347,738

2,407,442

-72,487

5.97

5.31

-3.00

-1.47

4432.9

4593.8

2,459,649

2,454,928

-5,999

6.38

4.90

-0.24

-1.19

4198.4

4497.6

2,217,722

2,318,390

-110,306

5.58

4.99

-4.74

-1.81

4127.2

4390.6

2,311,943

2,346,544

-26,101

4.75

4.10

-1.12

-1.71

4127.9

4314.3

2,340,680

2,304,150

37,079

4.52

3.75

1.61

-1.28

3989.5

4211.6

2,204,950

2,156,097

47,632

4.71

3.68

2.21

-0.91

4228.6

4232.8

2,361,861

2,379,153

-12,608

2.90

1.81

-0.53

-0.87

4036.2

4242.8

2,353,440

2,232,869

110,343

5.97

5.24

4.92

-0.35

4036.2

3951.5

2,327,546

2,212,118

115,422

6.92

6.30

1.77

-1.45

TỔNG 4432.9

4651.1

27,073,369 26,989,290

28,978

5.00

4.23 -0.15

-0.87

Ngoài ra, trong quá trình điều hành sản lượng điện hàng ngày, hàng tuần vào

mùa khô (tháng 3, 4 và 5), công tác dự báo sản lượng, công suất phụ tải là một khâu

vô cùng quan trọng. Tính đến thời điểm hiện nay, sai số dự báo khi áp dụng kỹ thuật

này vẫn nằm trong giới hạn cho phép, góp phần không nhỏ trong quá trình ra quyết

định điều hành của Tổng công ty.

5.2.4. Giá SMP của thị trường điện tác động đến kết quả dự báo

a) Hợp đồng CFD

Theo thiết kế thị trường phát điện cạnh tranh Việt Nam gồm hai thành phần

chính là Hợp đồng mua bán điện dạng sai khác và thị trường điện giao ngay. Giữa

hai thành phần này có sự liên hệ với nhau thể hiện qua kết quả tính toán các khoản

thanh toán trên thị trường điện và giao ngay và khoản thanh toán theo hợp đồng

dạng sai khác.

142

Đơn vị phát điện trực tiếp giao dịch và Đơn vị mua buôn có trách nhiệm ký

hợp đồng mua bán điện dạng sai khác (CfD) theo mẫu do Bộ Công Thương ban

hành (Thông tư số 45/2018/TT-BCT ngày 15/11/2018). Không phụ thuộc vào sản

lượng điện được huy động thực tế do hành vi chào giá của Đơn vị phát điện, khoản

thanh toán theo hợp đồng dạng sai khác giữa bên mua và bên bán tại từng chu kỳ

giao dịch như sau:

(5.1) Rcfdi = (Pc – SMPi – CANi) x Qci

Trong đó:

- Rcfdi: Khoản thanh toán sai khác trong chu kỳ giao dịch i (đồng).

- Qci: Sản lượng điện năng thanh toán theo giá hợp đồng trong chu kỳ giao

dịch i (kWh).

- Pc: Giá hợp đồng mua bán điện dạng sai khác (đồng/kWh). Đối với các

nhà máy thuỷ điện giá hợp đồng này chưa bao gồm thuế tài nguyên nước

và phí môi trường rừng.

- SMPi: Giá điện năng thị trường trong chu kỳ giao dịch i (đồng/kWh).

- CANi: Giá công suất thị trường trong chu kỳ giao dịch i (đồng/kWh).

Hợp đồng CfD là hợp đồng tài chính được ký giữa EVN, các Công ty bán

buôn và đơn vị phát điện, nhằm mục đích:

- Hạn chế rủi ro tài chính do biến động của giá thị trường điện.

- Giảm khả năng lũng đoạn thị trường của các đơn vị phát điện lớn.

- Tăng khả năng sẵn sàng và cạnh tranh.

Vào các tháng mùa lũ giá thị trường xuống thấp thì khoảng chênh lệch giữa

giá hợp đồng của từng nhà máy điện với giá thị trường toàn phần lớn nên khoản

thanh toán theo hợp đồng dạng sai khác chiếm tỷ lệ cao (khoảng 25%). Ngược lại

vào mùa khô thì giá thị trường tăng cao và khoảng chênh lệch giữ giá hợp đồng của

143

từng nhà máy điện với giá thị trường toàn phần nhỏ hơn so với mùa khô nên khoản

thanh toán theo hợp đồng CfD chiếm tỷ lệ thấp (khoảng 10%).

b) Tác động của CFD đến kết quả dự báo

Qua các phân tích số liệu thống kê thị trường và phân tích xu hướng giá điện

năng thị trường trong thời gian vừa qua có thể thấy rằng giá thị trường phản ánh

tương đối sát với tình huống hệ thống điện, phù hợp mức dự phòng năng lượng của

từng giai đoạn.

Hình 5.24 – Sự biến động của giá SMP trên thị trường qua các năm

Vào các tháng mùa lũ (tháng 7,8,9) giá thị trường có nhiều giờ đạt dưới 50%

so với giá trần thị trường, ít giờ đạt giá trần thị trường. Vào các tháng mùa khô giá

điện năng thị trường thường xuyên ở mức cao bằng hoặc xấp xỉ giá trần thị trường.

Hình 5.25 – Sự biến động của giá SMP của các tháng năm 2018

144

Hình 5.26 – Sự biến động của giá SMP theo từng giờ, từng ngày

Trong thời gian qua, giá thị trường điện biến động rất lớn, từ năm này sang

năm khác, từ tháng này qua tháng khác, giữa các ngày trong tháng và giữa các giờ

trong ngày. Giá thị trường cũng đã phản ánh đúng tương quan giữa nguồn và tải

trong hệ thống điện Việt Nam. Việc giá thị trường biến động mạnh có thể gây rủi ro

cho các đơn vị phát điện và cả bên mua điện là EVN/EPTC. Tuy nhiên với cơ chế

hợp đồng CfD sẽ làm giảm rủi ro tài chính và các đơn vị phát điện yên tâm hơn khi

tham gia thị trường điện.

145

Hình 5.27 – Cơ chế thanh toán CFD trên thị trường

Khi giá thị trường vượt quá giá hợp đồng thì bên bán điện (Nhà máy phát

điện) sẽ trả lại cho bên mua (Công ty bán buôn điện) một khoản tiền bằng khoảng

chệnh lệch giữa giá Pc và Giá thị trường nhân với sản lượng điện hợp đồng của giờ

tương ứng (Công thức 5.1).

Với xu hướng và tương quan giữa giá thị trường toàn phần với giá hợp đồng

của nhà máy thủy điện như đang diễn ra hiện nay thì mức độ cao rủi ro của Bên

mua điện sẽ tăng nếu tỷ lệ sản lượng thanh toán theo giá hợp đồng (Qc giảm). Với

giá than và khí như trong giai đoạn vận hành thị trường điện vừa qua thì các nhà

máy nhiệt điện đều có giá hợp đồng cao hơn hoặc xấp xỉ giá trần thị trường. Đây

cũng là vấn đề cần xem xét để đảm bảo tính cạnh tranh cho nhà máy nhiệt điện

tham gia thị trường điện. Nhà máy nhiệt điện đang có tính cạnh tranh thấp trên thị

trường điện giao ngay và đang được hạn chế rủi ro nhờ cơ chế hợp đồng CfD. Từ

tương quan thể hiện ở trên cho thấy giá thị trường toàn phần thường thấp hơn giá

mua điện bình quân của nhiệt điện.

Điều này được lý giải là nhờ cơ chế hợp đồng CfD được áp dụng thì ngoài

khoản doanh thu trên thị trường giao ngay theo giá thị trường toàn phần, các nhà

máy nhiệt điện sẽ nhận thêm một khoản thanh toán bằng khoảng chệnh lệch giữa

146

giá Pc và Giá thị trường nhân với sản lượng điện hợp đồng của giờ tương ứng

(Công thức 5.1). Cơ chế hợp đồng CfD trong trường hợp này đã bảo vệ rủi ro cho

nhà máy nhiệt điện có tính cạnh tranh thấp trên thị trường. Mức độ rủi ro của nhà

máy nhiệt điện càng tăng khi tỷ lệ mua điện qua hợp đồng giảm và giá trần thị

trường còn thấp giá hợp đồng.

Đối với vai trò là bên mua, các Tổng công ty Điện lực phân phối (PC) cần có

những phân tích thật sự sâu về tác động của giá thị trường SMP và các hợp đồng

CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và

tận dụng được các biến dộng của thị trường để mang về lợi nhuận cao nhất.

Hình 5.28 – Biến động giá SMP ngày 18/02/2018 (Tết Âm lịch)

Hình 5.29 – Biến động giá SMP ngày 21/02/2018

147

Hình 5.30 – Biến động giá SMP ngày 02/05/2018

Quan sát sự biến động giá SMP trên thị trường hàng ngày, chúng ta thấy giá

thị trường sẽ tăng mạnh vào các khoảng giờ cao điểm tương ứng với thời điểm nhu

cầu sử dụng điện tăng cao (cao điểm sáng từ 9h – 11h và cao điểm chiều 13h –

16h). Do đó, để hạn chế rui ro khi ký các hợp đồng CFD thì chúng ta cần lưu ý:

- Cần đàm phán giá hợp đồng Pc ở mức làm sao cho phần đường màu

xanh lá cây trong Hình 5.27 dâng lên cao, làm tăng khả năng Nhà máy

hoàn trả lại tiền cho PC. Điều đó đồng nghĩa là khi đàm phán các hợp

đồng PPA thì cần phải ép giá Pc với nhà máy xuống thấp nhất có thể.

Ngoài ra, theo qui định của thị trường giá Pc sẽ được đàm phán một giá

cố định cho cả năm nên việc chênh lệch giá giữa mùa khô (tháng 3 – thán

5) và mùa mưa (tháng 7 – tháng 9) cũng sẽ làm tăng mức độ rủi ro trong

kinh doanh của các PC.

- Do khối lượng thanh toán CFD là phần chênh lệch của giá thị trường với

giá Pc nhân cho sản lượng điện hợp đồng Qc. Do đó, công tác dự báo Qc

trong quá trình ký hợp đồng là rất quan trọng, chẳng hạn như:

i) trường hợp giá trị dự báo Qc lớn hơn nhu cầu sản lượng điện tiêu

thụ, cùng với giá thị trường thấp hơn nhiều so với giá Pc thì các PC

148

sẽ phải trả cho Nhà máy một khoản tiền khá lớn → gây thiệt hại

cho các PC.

ii) trường hợp giá trị dự báo Qc nhỏ hơn nhu cầu sản lượng điện tiêu

thụ, cùng với giá thị trường đang cao hơn so với giá Pc thì các PC

sẽ được nhận từ Nhà máy một khoản tiền không lớn → làm giảm

lợi nhuận thu được từ thị trường của các PC.

iii) trường hợp giá trị dự báo Qc nhỏ hơn nhu cầu sản lượng điện tiêu

thụ, cùng với giá thị trường thấp hơn nhiều so với giá Pc thì các PC

sẽ phải trả cho Nhà máy một khoản tiền không lớn lắm → giảm bớt

thiệt hại cho các PC.

iv) trường hợp giá trị dự báo Qc lớn hơn nhu cầu sản lượng điện tiêu

thụ, cùng với giá thị trường đang cao hơn so với giá Pc thì các PC

sẽ được nhận từ Nhà máy một khoản tiền khá lớn → làm gia tăng

lợi nhuận thu được từ thị trường của các PC.

Như vậy, sau khi tiến hành chạy kết quả dự báo 24 chu kỳ cho 365 ngày, các

PC cần phải xem xét điều chỉnh một số kết quả theo phương pháp chuyên gia để

làm sao hạn chế tới mức thấp nhất các rủi ro, chẳng hạn như:

- Trong các tháng đầu năm (mùa khô), lượng nước về các hồ thủy điện

thấp nên hệ thống sẽ huy động nhiều các nhà máy nhiệt điện nên giá thị

trường sẽ rất cao (các nhà máy nhiệt điện đều có giá hợp đồng cao hơn

hoặc xấp xỉ giá trần thị trường). Do đó, chúng ta cần đẩy giá trị dự báo

Qc tháng có xu hướng tăng cho hơn so với nhu cầu sử dụng điện thực,

đồng thời hiệu chỉnh Biểu đồ phụ tải Qc ngày giảm tại các giờ thấp điểm

và tăng cao tại các giờ cao điểm, nhằm gia tăng lợi nhuận thu được từ thị

trường của các PC.

- Trong các tháng cuối năm (mùa mưa), lượng nước về các hồ thủy điện

rất nhiều (tùy thuộc vào tình hình thời tiết hằng năm) nên hệ thống sẽ

149

huy động nhiều các nhà máy thủy điện nên giá thị trường sẽ rất thấp (giá

thị trường có nhiều giờ đạt dưới 50% so với giá trần thị trường). Do đó,

chúng ta cần đẩy giá trị dự báo Qc tháng có xu hướng giảm cho hơn so

với nhu cầu sử dụng điện thực, đồng thời hiệu chỉnh Biểu đồ phụ tải Qc

ngày giảm tại các giờ thấp điểm và tăng cao tại các giờ cao điểm, nhằm

giảm bớt thiệt hại từ thị trường của các PC.

5.3. TỔNG KẾT CHƯƠNG V

Với số liệu đầu vào là sản lượng điện thương phẩm, công suất cực đại, thời

tiết (nhiệt độ, độ ẩm), dân số qua các năm của cả khu vực, của từng ngành – từng

thành phần kinh tế trong đóng góp GRDP của tỉnh, khối lượng khách hàng qua các

năm,… các chính sách phát triển kinh tế của tỉnh, các chính sách phát triển nguồn

năng lượng tái tạo, khuyến khích tiết kiệm điện,… Trên cơ sở số liệu quá khứ nêu

trên, chúng ta sẽ đánh giá mức độ tương quan của các thành phần và từ đó xây dựng

hàm tương quan, hồi qui để dự báo cho 3 – 5 năm sắp tới dựa trên các giả định

chính sách đã được phê chuẩn, nó góp phần quan trọng trong việc xây dựng các Kế

hoạch Sản xuất kinh doanh, Đầu tư xây dựng của các Tổng công ty điện lực

Trên cơ sở SLP của từng chu kỳ của bộ dữ liệu trong quá khứ, chúng ta đã

xây dựng bộ dữ liệu SLP cho các chu kỳ cần dự báo trong tương lai và cần chuẩn

xác đến từng chu kỳ, từng loại ngày (ngày lễ, ngày thường, ngày làm việc, ngày

nghỉ,…), từng tuần, từng tháng, bằng các kỹ thuật đã nghiên cứu ở các Chương trên,

chúng ta đã áp dụng vào để chạy kết quả dự báo theo yêu cầu của Cục Điều tiết điện

lực (ERAV) – Bộ Công Thương là: Dự báo chu kỳ 24 chu kỳ (60 phút/chu kỳ) cho

365 ngày và sẽ cập nhật hiệu chỉnh hàng tháng trên trang web của Thị trường điện

Việt Nam.

Ngoài ra, chúng ta cũng đã có những phân tích thật sự sâu về tác động của

giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn

chế tới mức thấp nhất các rủi ro và tận dụng được các biến dộng của thị trường để

mang về lợi nhuận cao nhất.

150

CHƯƠNG VI – KẾT LUẬN

6.1. CÁC KẾT QUẢ ĐẠT ĐƯỢC CỦA LUẬN ÁN

Luận án đã xác định hướng nghiên cứu rõ ràng, xây dựng cụ thể các mục tiêu

nghiên cứu, nội dung và phương pháp nghiên cứu mới. Trên cơ sở các nội dung đã

xác định, luận án đã giải quyết được các vấn đề nghiên cứu đã đặt ra:

− Nghiên cứu các đặc tính, các thành phần của chuỗi dữ liệu quá khứ điện năng

ghi nhận được theo năm, theo tháng, theo ngày và theo giờ (thành phần xu

hướng, thành phần chu kỳ, thành phần bất qui tắc và thành phần theo mùa).

− Nghiên cứu qui trình Nghiên cứu phụ tải điện, đề xuất xây dựng Biểu đồ phụ

tải chuẩn hóa đơn vị (SLP).

− Đã đề xuất phương pháp xây dựng đường cong hồi qui bằng giải thuật huấn

luyện SVR (Support Vector Regression) kết hợp Biểu đồ phụ tải chuẩn hóa

đơn vị (SLP), từ đó ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong

quá trình nghiên cứu, dự báo phụ tải điện.

− Đã xây dựng giải thuật mới là Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa

đơn vị (SLP) - Support Vector Regression (SVR) để làm hàm dự báo STLF

(kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực).

− Nghiên cứu và thử nghiệm các kỹ thuật dự báo tiên tiến hiện nay như:

mô hình SARIMA, Neural Network, Support Vector Regression, Ramdom

Forest để xây dựng các giải thuật để dự báo phụ tải theo từng tháng/năm; dự

báo ngày/tháng và dự báo phụ tải 24 (48) giờ/ngày, có xem xét tác động của

yếu tố thời tiết và các yếu tố tác động khác.

− Chạy các kết quả dự báo dài hạn (5-10 năm), dự báo theo tháng/ năm và kết

quả dự báo ngắn hạn 24/48 chu kỳ của 365 ngày/ năm theo đúng qui định của

thị trường cho Tổng công ty Điện lực TP.HCM. Theo đó, kết quả sai số dự

báo thực hiện phù hợp với qui định tại Quyết định số 07/QĐ-ĐTĐL ngày 14

151

tháng 03 năm 2013 của Cục trưởng Cục Điều tiết điện lực về việc phê duyệt

Quy trình dự báo nhu cầu phụ tải điện Hệ thống điện quốc gia, sai số lũy kế

cho phép là ± 3%.

Đánh giá sự ảnh hưởng giữa giá thị trường điện đến công tác dự báo nhu cầu

−

phụ tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi nhuận của hoạt động Sản

xuất – Kinh doanh các Tổng công ty Điện lực phân phối trong môi trường thị

trường điện.

6.2. TÓM TẮT CÁC ĐÓNG GÓP CHÍNH CỦA LUẬN ÁN

Luận án đã có các đóng góp cho khoa học như sau:

− Luận án đã nghiên cứu và xây dựng thành công công cụ tự động ước lượng

các dữ liệu bị lỗi mà trước đây phải thực hiện thực một cách thủ công. Mô

hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression

(SVR) đã góp một phần không nhỏ trong kỹ thuật ước lượng lại dữ liệu bị

lỗi, bị mất trong quá trình đo đếm, thu thập dữ liệu. Kết quả được thể hiện ở

Chương II, III.

− Luận án đã xây dựng thành công giải thuật mới là sử dụng Biểu đồ phụ tải

chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng

hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó

giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ

hội, ngày đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02

(tháng có Tết âm lịch). Mô hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và

Support Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng với

bộ dữ liệu của 05 Tổng công ty Điện lực) và đã giải quyết được các khó

khăn, vướng mắc mà luận án đề ra ở Chương I.

− Luận án cũng đã thử nghiệm được nhiều mô hình dự báo tiên tiến theo xu

hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo

(học máy) – mạng Neural Network, Feedforward Networks; Rừng ngẫu

152

nhiên (Random Forest); Qua đó, đã đánh giá kết quả các giải thuật xây dựng

đường cong hồi qui của từng mô hình, với những bộ trọng số khác nhau, để

từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự báo STLF. Kết

quả được thể hiện ở Chương IV, V.

Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường

−

SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới

mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để

mang về lợi nhuận cao nhất. Kết quả được thể hiện ở Chương V.

6.3. HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN