68<br />
<br />
Lê Xuân Sanh<br />
<br />
PHÂN TÍCH VÀ THẢO LUẬN ỨNG DỤNG KĨ THUẬT DỮ LIỆU LỚN<br />
TRONG LƯỚI ĐIỆN THÔNG MINH<br />
ANALYZING AND DISCUSSING APPLICATION OF BIG DATA TECHNOLOGY<br />
IN SMART GRIDS<br />
Lê Xuân Sanh<br />
Trường Đại học Điện lực; sanhlx@epu.edu.vn<br />
Tóm tắt - Kĩ thuật phân tích dữ liệu theo phương pháp truyền thống<br />
đã không đáp ứng được yêu cầu sự phát triển của lưới điện hiện<br />
đại. Từ năm 2012, đã có một số nghiên cứu về dữ liệu lớn trong<br />
lưới điện thông minh với những kết quả ban đầu thuận lợi. Bài báo<br />
phân tích và ứng dụng dữ liệu lớn trong lưới điện thông minh bao<br />
gồm: khái niệm cơ bản, nguồn sinh ra dữ liệu trong hệ thống điện,<br />
các đặc trưng và đánh giá nghiên cứu về dữ liệu lớn. Bên cạnh đó,<br />
đưa ra kiến trúc tổng thể và các kĩ thuật liên quan của dữ liệu lớn<br />
trong lưới điện thông minh. Cuối cùng đưa ra mô hình ứng dụng kĩ<br />
thuật dữ liệu lớn trong lưới điện phân phối với việc chẩn đoán trạng<br />
thái hoạt động của các thiết bị; đánh giá đường dây cấp điện; phân<br />
tích đặc điểm và hành vi của khách hàng và dự báo phụ tải.<br />
<br />
Abstract - The traditional method of data analysis has not met the<br />
requirements of modern grid development. Since 2012, a number<br />
of researches into big data in smart grids have been conducted<br />
with initial advantageous results. This article analyzes and applies<br />
big data in the smart grids including basic concepts, data sources<br />
in the power system, characteristics and assessment of big data<br />
studies. In addition, the overall architecture and related techniques<br />
of big data in the smart grids are demonstrated. The last section of<br />
the article presents a model for applying the big data technology in<br />
a distribution grid with the diagnosis of equipment operation status,<br />
evaluating electricity lines, analyzing customers’ characteristics<br />
and behavior as well as forecasting supplementary load.<br />
<br />
Từ khóa - dữ liệu lớn; dữ liệu lớn lưới điện thông minh; lưới điện<br />
phân phối; lưới điện thông minh; kĩ thuật dữ liệu lớn.<br />
<br />
Key words - big data; big data in a smart grid; distribution grid;<br />
smart grid; big data technology.<br />
<br />
1. Giới thiệu<br />
Thuật ngữ ‘dữ liệu lớn’ (Big Data) năm 2008, được tạp<br />
chí Nature xuất bản năm 2008 với chuyên đề cùng tên. Năm<br />
2012, tổng thống Mỹ công bố sẽ đầu tư 2 tỉ USD để khởi<br />
động "Kế hoạch nghiên cứu và phát triển dữ liệu lớn", tạo ra<br />
sự bùng nổ về nghiên cứu dữ liệu lớn trên toàn thế giới. Hiện<br />
nay, chưa có định nghĩa thống nhất về dữ liệu lớn, mặc dù<br />
đã có một số đồng thuận trong ngành. Trong định nghĩa của<br />
dữ liệu lớn, một định nghĩa tương đối có tính đại diện là định<br />
nghĩa 3V, tức là tính quy mô (Volume), đa dạng (Variety)<br />
và tốc độ cao (Velocity) [1-3]. Ngoài ra, Công ty Dữ liệu<br />
Quốc tế (International Data Corporation, IDC) cho rằng dữ<br />
liệu lớn nên có tính giá trị (Value); phía IBM cho rằng dữ<br />
liệu lớn là tính chân thực (Veracity) [4]. Chính những đặc<br />
điểm này của dữ liệu lớn quyết định bắt buộc phải nâng cấp<br />
có tính cách mạng trong kĩ thuật xử lý dữ liệu hiện đại.<br />
Đặc điểm chung của hệ thống điện là sự phân bố vị trí<br />
địa lí rộng lớn, phát và tiêu dùng cân bằng với thời gian<br />
thực, tốc độ truyền dẫn nhanh, vận hành thời gian thực, tốc<br />
độ lan rộng sự cố tức thời, v.v. Những đặc điểm trên dẫn<br />
đến, khi vận hành hệ thống điện sẽ sản sinh ra số lượng dữ<br />
liệu cực lớn, tốc độ tăng cực nhanh, chủng loại phong phú,<br />
hoàn toàn phù hợp với tất cả các đặc trưng của dữ liệu lớn<br />
và là một dữ liệu lớn điển hình.<br />
Trong tiến trình xây dựng lưới điện thông minh, là quá<br />
trình số hóa hệ thống điện, thông tin hóa và thông minh<br />
hóa, v.v. sẽ mang lại nhiều hơn nguồn dữ liệu. Ví dụ như,<br />
đồng hồ thông minh thu thập dữ liệu từ hàng trăm triệu ngôi<br />
nhà và doanh nghiệp; hệ thống giám sát trạng thái thiết bị<br />
điện thu được số liệu giám sát từ trăm nghìn các thiết bị.<br />
Trong phát triển và vận hành các nguồn năng lượng tái tạo<br />
cần lượng lớn số liệu lịch sử vận hành, số liệu quan trắc khí<br />
tượng, v.v. Vì vậy, trong xu thế mới tăng trưởng một cách<br />
bùng nổ dữ liệu hệ thống điện, thì kĩ thuật xử lý dữ liệu<br />
<br />
truyền thống gặp phải ‘tắc nghẽn’, không thể đáp ứng được<br />
yêu cầu, cần phải ứng dụng kĩ thuật xử lý dữ liệu lớn trong<br />
ngành điện.<br />
2. Dữ liệu lớn trong lưới điện thông minh<br />
2.1. Nguồn gốc và đặc điểm dữ liệu lớn trong lưới điện<br />
thông minh<br />
Nguồn dữ liệu trong hệ thống điện gồm 2 loại: từ nội bộ<br />
lưới điện và dữ liệu ngoài. Dữ liệu nội bộ lưới điện là: hệ<br />
thống thu thập thông tin khách hàng (collection system<br />
information, CIS); hệ thống tiếp thị; hệ thống giám sát diện<br />
rộng (wide area measurement system, WAMS); hệ thống<br />
quản lý lưới điện phân phối; hệ thống quản lý sản xuất<br />
(production management system, PMS); hệ thống quản lý<br />
năng lượng (energy management system, EMS); hệ thống<br />
kiểm tra và giám sát thiết bị; hệ thống phục vụ khách hàng;<br />
hệ thống quản lý tài chính, v.v. Dữ liệu đến từ ngoài lưới<br />
điện là hệ thống quản lý xạc điện xe hơi; hệ thống thông tin<br />
khí tượng; hệ thống thông tin địa lí (geographic information<br />
system, GIS); dịch vụ công cộng, internet, v.v. Những dữ<br />
liệu này có đặc điểm nằm rải rác phân tán ở những nơi khác<br />
nhau và được quản lý bởi các đơn vị khác nhau.<br />
Quan hệ giữa các dữ liệu trên là mối quan hệ phức tạp,<br />
không hoàn toàn độc lập mà tương hỗ lẫn nhau, ảnh hưởng<br />
nhau. Kết cấu của dữ liệu phức tạp gồm nhiều loại khác<br />
nhau. Ngoài cấu trúc truyền thống còn có lượng lớn dạng<br />
bán cấu trúc, không cấu trúc, như dữ liệu thoại về hệ thống<br />
dịch vụ, dạng sóng của các dữ liệu đo lường kiểm tra, v.v.<br />
Tần suất lấy mẫu và vòng đời của dữ liệu cũng khác nhau,<br />
có thể từ ms đến phút, thậm chí đến năm [5].<br />
Tổng hợp miêu tả về dữ liệu lớn, có thể đưa ra các đặc<br />
điểm dữ liệu lớn lưới điện thông minh: 1) Nguồn gốc từ các<br />
nguồn quản lý phân tán; 2) Lượng dữ liệu lớn, nhiều thứ<br />
nguyên, nhiều loại hình; 3) Có giá trị lớn cho kinh tế xã hội<br />
<br />
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(132).2018, QUYỂN 1<br />
<br />
nói chung và công ty điện lực, khách hàng; 4) Tồn tại quan<br />
hệ phức tạp giữa các dữ liệu mà cần phải phân tích, một lượng<br />
lớn dữ liệu yêu cầu với thời gian thực. Ví dụ, Công ty Điện<br />
lực Thái Bình Dương (Mỹ) mỗi tháng dữ liệu từ 9 triệu đồng<br />
hồ điện của khách hàng đạt tới 3TB; Hệ thống SCADA từ<br />
một lưới điện có 100000 điểm, với chu kì 4s thì mỗi năm sản<br />
sinh là 1,03TB; Với PMU, tần suất lấy mẫu 0,01s (số lượng<br />
100000 điểm) thì mỗi năm lượng dữ liệu là 495TB [5], vì vậy<br />
trong hệ thống điện với nhiều hệ thống cần thu thập và xử lý<br />
thì lượng dữ liệu có thể lên đến cấp PB và EB.<br />
2.2. Tình hình nghiên cứu trong và ngoài nước<br />
Từ năm 2012, các viện nghiên cứu, trường đại học,<br />
doanh nghiệp IT, công ty điện lực đã bắt đầu nghiên cứu và<br />
ứng dụng dữ liệu lớn lưới điện thông minh. Công ty IBM,<br />
Oracle phát hành sách trắng dữ liệu lớn, IBM và C3-Energy<br />
phát triển một hệ thống phân tích dữ liệu lớn cho lưới điện<br />
thông minh [6]. Các viện nghiên cứu của Mỹ đưa ra các dự<br />
án nghiên cứu dữ liệu lớn, các công ty điện lực như Pacific<br />
Gas Power tại Mỹ và BC Hydro ở Canada tiến hành nghiên<br />
cứu về ứng dụng kĩ thuật dữ liệu lớn dựa trên dữ liệu người<br />
dùng. Tại Trung Quốc, Hội nghị Công trình Cơ điện đã công<br />
bố sách trắng về dữ liệu lớn, Tập đoàn Điện lực Trung Quốc<br />
và Bộ Khoa học Công nghệ đã ban hành nhiều dự án nghiên<br />
cứu về dữ liệu lớn lưới điện thông minh từ năm 2012 [7]. Tại<br />
Việt Nam, cũng đã có nhiều hội thảo, báo cáo đề cập đến dữ<br />
liệu lớn trong cuộc cách mạng công nghiệp 4.0, trên các tạp<br />
chí chuyên ngành nhưng chưa thấy các bài viết chuyên sâu<br />
về dữ liệu lớn trong lưới điện thông minh. Nghiên cứu và<br />
ứng dụng dữ liệu lớn lưới điện thông minh cũng đã đạt được<br />
nhiều thành quả, tuy nhiên nhìn chung kết quả nghiên cứu<br />
còn tương đối thô và chưa có hệ thống, nghiên cứu và ứng<br />
dụng vẫn còn ở giai đoạn đầu và thăm dò.<br />
2.3 Kiến trúc tổng thể nền tảng dữ liệu lớn lưới điện<br />
thông minh<br />
Kiến trúc tổng thể nền tảng dữ liệu lớn trong ngành điện<br />
được thể hiện như Hình 1.<br />
Kho dữ liệu<br />
<br />
Ứng dụng kinh doanh công ty<br />
điện lực (Quety, Analytics,<br />
Reportion, Statistics)<br />
Tầng điều hành dữ liệu lớn<br />
<br />
69<br />
<br />
thương mại, kho dữ liệu truyền thống, khung truy cập, khung<br />
điều phối dữ liệu lớn, lớp mạng, hệ điều hành, máy chủ, sao<br />
lưu và phục hồi, mô-đun quản lý dữ liệu.<br />
Khung lưu trữ và khung xử lý dữ liệu lớn thường được<br />
xây dựng trên một máy chủ, hệ điều hành hoặc máy ảo, để<br />
phần cứng cần thiết của cấu trúc này có đặc điểm chi phí<br />
thấp và khả năng mở rộng cao. Trên khung lưu trữ và khung<br />
xử lý là khung truy cập dữ liệu được kết nối thông qua lớp<br />
mạng, khung truy cập bao gồm ngôn ngữ lập trình song<br />
song Pig, công cụ lưu trữ dữ liệu Hive và mô-đun công cụ<br />
phân phối dữ liệu nguồn như Sqoop.<br />
Khung điều phối bao gồm các mô-đun như: kho dữ liệu<br />
dạng Hbase, định dạng trình tự dữ liệu và công cụ truyền<br />
dẫn Avro, hệ thống thu thập nhật ký Flume, cài đặt khóa<br />
dạng phân phối ZooKeeper, v.v. Khung điều phối thực hiện<br />
việc tổ chức, điều phối và cung cấp các điều kiện cần thiết<br />
cho việc phân tích dữ liệu. Phía trên khung điều phối dữ<br />
liệu lớn là một hệ thống ứng dụng thương mại thông minh<br />
cấp doanh nghiệp có thể thực hiện các ứng dụng nâng cao<br />
như tìm kiếm, phân tích, thống kê và báo cáo [8].<br />
Truyền số liệu trong HTĐ: phát, truyền tải, phân phối, tiêu<br />
dùng và vận hành<br />
Hệ thống điều<br />
khiển phụ tải<br />
<br />
…<br />
<br />
Hệ thống<br />
SCADA<br />
<br />
…<br />
<br />
Hệ thống<br />
MIS<br />
<br />
…<br />
<br />
Hệ thống đo<br />
đếm điện năng …<br />
(TMRS)<br />
<br />
Hệ thống dự báo<br />
công suất của<br />
phát NL tái tạo<br />
Hệ thống giám<br />
sát thiết bị<br />
<br />
Ứng dụng kinh doanh của công ty điện lực<br />
Hệ thống xử lí<br />
dữ liệu lớn<br />
Hệ thống lưu<br />
trữ dữ liệu lớn<br />
Hệ thống thực<br />
thi và phục vụ<br />
<br />
Hệ thống điều phối<br />
dữ liệu lớn<br />
<br />
Kho dữ<br />
liệu lịch sử<br />
<br />
Kiến trúc tổng thể<br />
nền tảng kết nối hệ<br />
thống dữ liệu lớn<br />
<br />
Hình 2. Mô tả sự kết nối của kiến trúc dữ liệu lớn<br />
và luồng dữ liệu của hệ thống điện<br />
<br />
Hình 1. Kiến trúc tổng thể nền tảng dữ liệu lớn<br />
trong hệ thống điện<br />
<br />
Hệ thống điện là một hệ thống phức tạp, mức phi tuyến<br />
tính cao, dữ liệu nội bộ của nó bao gồm các nguồn dữ liệu<br />
khác nhau như: dòng công suất, thông tin, dịch vụ, sự cố<br />
và khí tượng. Hình 2, mô tả các điểm có thể kết hợp giữa<br />
ứng dụng thương mại của doanh nghiệp điện và dữ liệu nội<br />
bộ của hệ thống điện trên nền tảng tổng thể của hệ thống<br />
điện, bao gồm: phát, truyền tải, biến đổi, phân phối, người<br />
dùng và điều độ vận hành, trong hệ thống điều khiển phụ<br />
tải, quản lý thông tin (management information system,<br />
MIS), hệ thống thu thập dữ liệu và điều khiển giám sát<br />
(supervisory control and data acquisition, SCADA), hệ<br />
thống đo đếm, hệ thống dự báo công suất năng lượng gió,<br />
mặt trời, hệ thống giám sát trực tuyến thiết bị điện, v.v.<br />
<br />
Kiến trúc có tính phổ quát và phù hợp với quy hoạch dữ<br />
liệu lớn của công ty điện lực, sử dụng hệ thống xử lý tệp<br />
phân tán (Hadoop distributed file system, HDFS) làm khung<br />
lưu trữ dữ liệu lớn, kĩ thuật tính toán MapReduce làm khung<br />
xử lý dữ liệu lớn, với phương pháp như vậy việc lưu trữ và<br />
tìm kiếm dữ liệu PB và EB trở nên khả thi [8]. Ngoài ra,<br />
trong khung này còn bao gồm các ứng dụng thông minh<br />
<br />
3. Các kĩ thuật dữ liệu lớn trong lưới điện thông minh<br />
3.1. Kĩ thuật tập hợp quản lý dữ liệu lớn<br />
Kĩ thuật tập hợp và quản lý dữ liệu ngành điện là quá<br />
trình kết hợp từ hai hoặc nhiều hệ thống dữ liệu ứng dụng<br />
để tạo ra một ứng dụng với nhiều chức năng hơn. Bao gồm<br />
kĩ thuật kho dữ liệu dạng quan hệ và phi quan hệ, kĩ thuật<br />
<br />
Dữ liệu lớn<br />
(Connectors) Hbase Avro Flume<br />
Tầng truy cập dữ liệu lớn<br />
<br />
Zoo<br />
Keeper<br />
<br />
Hỏi Tính Quản<br />
&<br />
an lý<br />
trả toàn dữ<br />
Lớp mạng<br />
liệu<br />
Tầng lưu trữ dữ liệu Tầng xử lý dữ liệu lời<br />
(HDFS)<br />
(MapReduce)<br />
Hệ điều hành<br />
(Hypervisor/ VMs)<br />
Máy chủ<br />
Pig<br />
<br />
Hive<br />
<br />
L<br />
<br />
Sqoop<br />
<br />
70<br />
<br />
tích hợp dữ liệu và dung hòa, kĩ thuật tách dữ liệu, kĩ thuật<br />
lọc và làm sạch dữ liệu, v.v [7]. Để xử lý dữ liệu lớn, trước<br />
tiên phải trích xuất và tích hợp dữ liệu từ nguồn dữ liệu, từ<br />
đó khai thác các thực thể và các quan hệ, đến công đoạn<br />
kết hợp, một cấu trúc thống nhất được sử dụng để lưu trữ<br />
các dữ liệu này, và tiến hành làm sạch dữ liệu trong quá<br />
trình tích hợp, trích xuất dữ liệu để đảm bảo chất lượng và<br />
độ tin cậy của dữ liệu [4].<br />
Một công nghệ quan trọng trong quản lý lưu trữ dữ liệu<br />
là kĩ thuật kho dữ liệu NoSQL, nó sử dụng phương thức<br />
lưu trữ dữ liệu dạng phân tán. Lưu trữ dữ liệu được đơn<br />
giản hóa và linh hoạt hơn, có khả năng mở rộng tốt và giải<br />
quyết vấn đề khó của lưu trữ dữ liệu lớn, ví dụ như<br />
BigTable của Google, Dynamo của Amazon, v.v.<br />
3.2. Kĩ thuật phân tích dữ liệu lớn trong lưới điện thông minh<br />
Các kĩ thuật chủ chốt được sử dụng để phân tích dữ liệu<br />
lớn như thống kê và khoa học máy tính, bao gồm phân tích<br />
tương quan, học máy, mạng nơron, thuật toán di truyền và<br />
nhiều phương pháp khác [9]. Phương pháp phân tích tương<br />
quan là cốt lõi của dữ liệu lớn, phân tích tất cả dữ liệu, thông<br />
qua việc tìm mối tương quan của hiện tượng tốt, có thể nắm<br />
bắt hiện tại và dự đoán tương lai. Phương pháp tính toán đơn<br />
giản, hiệu quả, kết quả nhanh, chính xác và ít bị ảnh hưởng.<br />
Các thuật toán khai thác dữ liệu và học máy trong môi<br />
trường dữ liệu lớn có thể được bắt đầu từ ba phương diện:<br />
1) Từ quản trị, lấy mẫu và lựa chọn đặc trưng của dữ liệu<br />
lớn [10]; 2) Phát triển nghiên cứu các thuật toán phân cụm<br />
và phân loại cho các dữ liệu lớn. v.v. [11]; 3) Phát triển các<br />
thuật toán song song, ứng dụng khai thác kiến thức của dữ<br />
liệu lớn, như học máy và khai thác kiến thức dựa trên<br />
MapReduce [12].<br />
3.3. Kĩ thuật xử lý dữ liệu trong lưới điện thông minh<br />
Các kĩ thuật xử lý dữ liệu của dữ liệu lớn ngành điện<br />
bao gồm kĩ thuật tính toán dạng phân tán, kĩ thuật tính toán<br />
trong bộ nhớ và kĩ thuật xử lý luồng. Tính toán dạng phân<br />
tán là một phương thức tính toán mới, đòi hỏi sức mạnh<br />
tính toán vào nhiều phần nhỏ, phân phối cho nhiều máy<br />
tính và tổng hợp thành kết quả cuối cùng. Một đại diện điển<br />
hình của tính toán dạng phân tán là mô hình lập trình<br />
MapReduce được Google đề xuất.<br />
Kĩ thuật tính toán trong bộ nhớ là giải quyết vấn đề đọc<br />
dữ liệu hiệu quả và xử lý các phép tính trực tuyến, đưa tất<br />
cả dữ liệu vào lớp bên trong. Kĩ thuật này khắc phục được<br />
hao tổn số lượng lớn thời gian đọc và ghi vào đĩa, tốc độ<br />
tính toán đã tăng lên đáng kể đến vài cấp số lượng. EMC,<br />
Oracle và SAT đều đã giới thiệu các giải pháp cho tính toán<br />
trong bộ nhớ, giảm đơn vị tính thời gian, giải quyết các vấn<br />
đề về phân tích thời gian thực.<br />
Mô hình xử lý luồng là tổ hợp dữ liệu liên tục thành luồng,<br />
khi dữ liệu mới đến thì lập tức xử lý và phản hồi kết quả. Phân<br />
tích dữ liệu mới nhất nhanh nhất có thể và đưa ra kết quả, từ<br />
đó cung cấp căn cứ ngay lập tức cho người ra quyết định và<br />
đáp ứng yêu cầu phân tích với thời gian thực [13].<br />
3.4. Kĩ thuật hiển thị dữ liệu lớn ngành điện<br />
Kĩ thuật hiển thị dữ liệu lớn ngành điện bao gồm trực<br />
quan hóa, hiển thị luồng thông tin không gian, luồng lịch<br />
sử, v.v [7]. Hiển thị dữ liệu có thể giúp người quản lý trực<br />
<br />
Lê Xuân Sanh<br />
<br />
quan hơn, hiểu chính xác hơn ý nghĩa của biểu hiện dữ liệu,<br />
trạng thái vận hành của hệ thống điện.<br />
Kĩ thuật trực quan hóa được sử dụng rộng rãi trong việc<br />
giám sát thời gian thực trạng thái lưới điện, nâng cao mức độ<br />
tự động hóa hệ thống điện. Kĩ thuật hiển thị luồng thông tin<br />
không gian được thể hiện trong sự kết hợp các tham số lưới<br />
điện và hệ thống thông tin địa lí đã có, bao gồm hiển thị ba<br />
chiều trạm biến áp, thực tế ảo và các công nghệ khác. Kết<br />
hợp chặt chẽ giữa quản lý thiết bị phân phối điện và hệ thống<br />
thông tin địa lí tạo điều kiện cho người quản lý lưới điện hiểu<br />
được tình hình thiết bị một cách trực quan, từ đó cung cấp<br />
thông tin địa lí mới nhất cho các quyết định của họ.<br />
Kĩ thuật hiển thị lưu lượng lịch sử được thể hiện trong<br />
việc quản lý và hiển thị dữ liệu lịch sử của lưới điện. Trong<br />
các hệ thống điện, phân tích ứng dụng chuyên sâu thường<br />
dựa trên cơ sở dữ liệu lịch sử. Từ đó, có thể vẽ ra xu hướng<br />
phát triển và dự đoán tương lai; mô phỏng sự phát sinh, diễn<br />
biến và khai thác kiến thức, luật tiềm ẩn của các sự kiện.<br />
4. Ứng dụng kĩ thuật dữ liệu lớn trong lưới điện phân<br />
phối thông minh<br />
Tác giả dựa vào các đặc trưng và mục tiêu chung khi<br />
xây dựng lưới điện phân phối thông minh, kết hợp tham<br />
khảo kết quả nghiên cứu của các học giả và chuyên gia,<br />
trong phần này tiến hành nghiên cứu các mô hình dữ liệu<br />
lớn ứng dụng trong lưới điện phân phối thông minh.<br />
4.1. Chẩn đoán trạng thái hoạt động trong lưới điện phân<br />
phối<br />
Để đánh giá mức độ hoạt động của lưới điện phân phối<br />
đưa ra 5 chỉ tiêu lớn cần chẩn đoán và đánh giá mức độ<br />
mạnh mẽ trong hệ thống, như Bảng 1.<br />
Bảng 1. Sơ đồ cấu trúc chẩn đoán trạng thái hoạt động của<br />
lưới điện phân phối<br />
Mức<br />
độ kết<br />
cấu<br />
của<br />
lưới<br />
Đánh<br />
giá<br />
dữ<br />
liệu Độ tin<br />
lớn<br />
cậy<br />
trạng cấp<br />
thái<br />
điện<br />
vận<br />
hành<br />
lưới<br />
điện<br />
phân<br />
phối Tính<br />
tối ưu<br />
chất<br />
lượng<br />
điện<br />
năng<br />
<br />
Tỉ lệ liên lạc giữa các đường dây<br />
Mức độ<br />
kết cấu Tỉ lệ liên lạc giữa các phân đoạn<br />
của lưới Hệ số phân đoạn bình quân<br />
Mức dự Tỉ lệ các TBA chỉ một dây cấp<br />
phòng Tỉ lệ các TBA chỉ có 1 MBA<br />
Tỉ lệ thông qua TBA chính “N-1”<br />
Mức độ<br />
cung cấp Tỉ lệ thông qua đường dây “N-1”<br />
điện phụ Tỉ lệ thông qua TBA chính “N-2”<br />
tải<br />
Tỉ lệ thông qua đường dây “N-2”<br />
Tỉ lệ lắp đặt thiết bị tự đóng lại<br />
Năng lực<br />
tự hồi Tỉ lệ lắp đặt nguồn cấp điện liên tục<br />
phục khi Tỉ lệ trang bị nguồn dự phòng (nguồn<br />
sự cố phân tán) cho khách hàng<br />
Chất<br />
lượng ổn<br />
định<br />
động<br />
<br />
Tỉ lệ lắp đặt thiết bị tự động điều chỉnh<br />
điện áp VQC<br />
Tỉ lệ lắp đặt thiết bị bù công suất phản<br />
kháng SVC<br />
<br />
Tỉ lệ lắp đặt thiết bị hồi phục ổn định<br />
Chất điện áp động<br />
lượng ổn<br />
định tĩnh Tỉ lệ lắp đặt thiết bị hạn chế dòng sự cố<br />
các tuyến dây<br />
<br />
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(132).2018, QUYỂN 1<br />
<br />
Dung<br />
Tính<br />
lượng<br />
hiệu<br />
quả Mức độ<br />
kinh quản lý<br />
doanh vận hành<br />
<br />
Tỉ lệ mang tải của TBA<br />
<br />
Năng lực<br />
‘giao<br />
Tính<br />
tiếp’<br />
với<br />
tương<br />
tác của khách<br />
hàng<br />
lưới<br />
điện Đáp ứng<br />
nhu cầu<br />
<br />
Tỉ lệ lắp đặt đồng hồ thông minh<br />
<br />
của mỗi thông số thu được bằng cách kết hợp thời gian<br />
đánh giá và phần đánh giá. Cuối cùng, theo điểm số của<br />
mỗi thông số, các phân cụm thiết bị, các cột và các giá trị<br />
điểm tổng thể được tính tuần tự. Phương pháp đánh giá này<br />
kết hợp thời gian và không gian ba chiều, phù hợp với tính<br />
đa chiều của dữ liệu lớn và kết quả đánh giá gần với trạng<br />
thái thực của đường dây truyền tải [15].<br />
4.3. Dự báo phụ tải<br />
Dự báo phụ tải là điều kiện tiên quyết cho việc vận hành<br />
hệ thống điện, giám sát điều khiển dưới thời gian thực, lập<br />
kế hoạch hoạt động và phát triển, đó là một thông tin cơ<br />
bản mà bộ phận vận hành và lập quy hoạch lưới điện phải<br />
có. Mô hình dữ liệu lớn cho dự báo phụ tải như Hình 4.<br />
<br />
Tỉ lệ mang tải của đường dây<br />
Tỉ lệ tự động hóa TBA<br />
Tỉ lệ các tuyến dây hoàn chỉnh (tốt)<br />
Tỉ lệ các thiết bị chính tốt<br />
Tỉ lệ lắp đặt hệ thống thu thập thông tin<br />
khách hàng<br />
Tỉ lệ lắp đặt hệ thống phục vụ khách hàng<br />
Tỉ lệ điều khiển phụ tải<br />
Tỉ lệ áp giá theo thời gian thực<br />
<br />
Một trong những ưu điểm của dữ liệu lớn là thống kê<br />
thông tin toàn diện, đánh giá từ nhiều quan điểm [14]. Ví<br />
dụ, độ tin cậy cấp điện có thể đánh giá gồm: các chỉ tiêu<br />
được lấy ra từ sơ đồ cấu trúc, từ xác suất sự cố, hay các chỉ<br />
tiêu về chất lượng điện áp để đánh giá.<br />
4.2. Đánh giá các đường dây cấp điện<br />
<br />
Tầng<br />
ứng<br />
dụng<br />
<br />
Dây<br />
nối<br />
đất<br />
<br />
Mô hình dự báo<br />
dài/trung/ngắn/rất ngắn<br />
<br />
Thời gian đánh<br />
giá thiết bị<br />
<br />
Ghép và tích hợp dữ liệu<br />
<br />
Thiết Thiết Môi<br />
bị nối bị phụ trường<br />
đất<br />
trợ<br />
kênh<br />
<br />
Đánh giá các<br />
thông số<br />
<br />
Hình 4. Mô hình dữ liệu lớn cho dự báo phụ tải<br />
<br />
Hình 3. Đánh giá đa chiều trạng thái đường dây cấp điện<br />
<br />
Một phương pháp đánh giá đa chiều đường dây truyền<br />
tải trong lưới trung áp như Hình 3. Trước tiên thiết lập một<br />
mô hình nhiều lớp để đánh giá các thiết bị, các phân đoạn<br />
đặc biệt trong một giai đoạn. Phương pháp khấu trừ tích<br />
lũy được sử dụng để đánh giá các tham số cơ bản, điểm số<br />
Dự báo phát<br />
triển kinh tế<br />
<br />
Hiểu hành<br />
vi sử dụng<br />
điện<br />
<br />
phân tích nhân tố ảnh hưởng<br />
hành vi của khách hàng<br />
<br />
Nhận biết<br />
các mô<br />
hình dùng<br />
điện<br />
<br />
Phụ<br />
tải<br />
điện<br />
<br />
Phân tích<br />
đặc trưng<br />
hành vi<br />
dùng điện<br />
Tập hợp<br />
dữ liệu<br />
<br />
Hóa<br />
đơn<br />
điện<br />
<br />
Phân tích tỉ lệ trống<br />
các khu dân cư<br />
<br />
Thông<br />
tin<br />
phí<br />
<br />
Hỗ trợ quyết<br />
định giá điện<br />
<br />
Đánh giá tín dụng<br />
của khách hàng<br />
<br />
phân tích cường độ ảnh hưởng<br />
hành vi của khách hàng<br />
<br />
Thông<br />
tin khách<br />
hàng<br />
<br />
Phân tích đặc điểm, hành vi<br />
tiêu thụ điện của khách hàng<br />
dân sinh<br />
<br />
Thu thập dữ<br />
liệu người<br />
dùng<br />
<br />
Dữ<br />
liệu<br />
ngày<br />
nghỉ<br />
<br />
tích hợp dữ liệu tiêu<br />
thụ điện năng, kinh<br />
tế xã hội và các dữ<br />
liệu nội bộ lưới điện<br />
đưa ra dữ liệu cơ bản<br />
về dự báo phụ tải<br />
<br />
4.4. Phân tích đặc điểm và hành vi của khách hàng<br />
Thực hiện hợp nhất và lưu trữ dữ liệu đa nguồn như dữ<br />
liệu tiêu thụ điện, dịch vụ khách hàng, dân số, v.v. (Hình 5).<br />
Các mô hình thu được dùng cho việc dự báo xu hướng phát<br />
triển kinh tế, phân tích tỉ lệ cư trú, hỗ trợ quyết định giá điện<br />
và đánh giá nhu cầu người dùng. Những dữ liệu này có khối<br />
lượng lớn, từ nhiều nguồn và nhiều định dạng khác nhau.<br />
Việc tích hợp và phân tích các dữ liệu này cần phải sử dụng<br />
các kĩ thuật dữ liệu lớn [16,17].<br />
<br />
Vị trí không gian<br />
thiết bị<br />
<br />
Ứng dụng<br />
tổng hợp<br />
<br />
Dữ<br />
Dữ<br />
Dữ Dữ liệu<br />
liệu<br />
liệu<br />
liệu<br />
nhân<br />
vận khách khí khẩu và<br />
hành hàng tượng kinh tế<br />
địa lí<br />
<br />
ứng dụng kết quả dự<br />
báo phụ tải vào điều<br />
độ và quy hoạch lưới<br />
điện phân phối<br />
phân tích các mối<br />
quan hệ và yếu tố<br />
nhạy cảm ảnh hưởng<br />
đến phụ tải, thông<br />
qua mô hình dự báo<br />
và xử lí số liệu tiến<br />
hành dự báo các loại<br />
phụ tải.<br />
<br />
Phân tích các yếu tố nhay<br />
cảm<br />
<br />
Tầng<br />
tích<br />
hợp<br />
dữ<br />
liệu<br />
<br />
Vật<br />
liệu<br />
dẫn<br />
điện<br />
<br />
Cách<br />
điện<br />
<br />
Kế<br />
hoạch<br />
đại tu<br />
<br />
Xử lí tính toán<br />
<br />
Đánh giá vị trí cột<br />
<br />
Móng Thân<br />
cột<br />
cột<br />
<br />
Kế hoạch<br />
tiết kiệm<br />
năng<br />
lượng<br />
<br />
Kết quả dự báo<br />
<br />
Cột N<br />
<br />
Cột 2<br />
<br />
Quy<br />
hoạch<br />
lưới<br />
điện<br />
<br />
Kế<br />
hoạch<br />
vận<br />
hành<br />
<br />
Tầng<br />
phân<br />
tích<br />
dự<br />
báo<br />
<br />
Đánh giá hệ thống đường dây truyền tải<br />
<br />
Cột 1<br />
<br />
71<br />
<br />
Dữ liệu<br />
ngành tiếp<br />
thị<br />
<br />
Cấu<br />
trúc<br />
lưới<br />
<br />
Chính<br />
sách giá<br />
điện<br />
<br />
….<br />
<br />
Phân tích đặc điểm sử dụng<br />
điện của khách hàng thương<br />
mại<br />
Dữ liệu dịch<br />
vụ khách<br />
hàng<br />
<br />
Dữ liệu<br />
thông tin<br />
địa lý<br />
<br />
….<br />
<br />
Xây dựng mô hình tương<br />
quan hành vi khách hàng<br />
<br />
Thông<br />
tin thời<br />
tiết<br />
<br />
Mô hình<br />
hành vi của<br />
khách hàng<br />
<br />
Phân tích đặc điểm sử dụng<br />
điện của khách hàng công<br />
nghiệp<br />
<br />
Dữ<br />
liệu dân<br />
số<br />
<br />
Dữ<br />
liệu thời<br />
tiết<br />
<br />
dung lượng lớn, đa nguồn, cấu trúc dữ liệu không đồng nhất, quản lý và tài chính.<br />
<br />
Hình 5. Phân tích tiêu thụ điện năng khách hàng dựa trên khai thác dữ liệu lớn<br />
<br />
72<br />
<br />
Lê Xuân Sanh<br />
<br />
5. Kết luận<br />
Trong lưới điện thông minh với số lượng lớn các dữ<br />
liệu đo lường, giám sát, thì phương pháp xử lý và khai thác<br />
giá trị của các dữ liệu là những vấn đề mà các công ty điện<br />
phải đối mặt. Ứng dụng kĩ thuật dữ liệu lớn không chỉ sử<br />
dụng được dữ liệu riêng của lưới điện mà còn tận dụng toàn<br />
bộ dữ liệu bên ngoài, làm tăng mức độ phát triển, vận hành<br />
lưới điện, nâng cao trình độ các công ty điện lực phục vụ<br />
xã hội, phục vụ người dùng và mở rộng các dịch vụ giá trị<br />
gia tăng. Bài báo đã trình bày những khái niệm và phân tích<br />
cơ bản về dữ liệu lớn, nền tảng kết cấu cơ bản, các kĩ thuật<br />
liên quan trong lưới điện thông minh. Đồng thời ứng dụng<br />
dữ liệu lớn trong lưới điện phân phối như chẩn đoán trạng<br />
thái hoạt động của lưới, dự báo phụ tải và hành vi tiêu thụ<br />
điện năng của khách hàng. Với những kết quả ban đầu, hi<br />
vọng nó có ý nghĩa lớn thu hút các kết quả nghiên cứu trong<br />
và ngoài nước để chia sẻ kiến thức và kinh nghiệm nhằm<br />
thúc đẩy nghiên cứu và ứng dụng lĩnh vực dữ liệu lớn lưới<br />
điện thông minh.<br />
Nghiên cứu và ứng dụng kĩ thuật dữ liệu lớn trong lưới<br />
điện thông minh là một lĩnh vực phức tạp đòi hỏi một quá<br />
trình phát triển lâu dài. Cần sự quan tâm của Chính phủ,<br />
tăng cường nguồn nhân lực và tài nguyên vật chất, thúc đẩy<br />
cải tiến công nghệ then chốt cho dữ liệu lớn. Cần xây dựng<br />
hệ thống tiêu chuẩn quốc tế thống nhất, mô hình và các kĩ<br />
thuật về dữ liệu lớn trong lưới điện thông minh. Khuyến<br />
khích các công ty điện lực xây dựng một kiến trúc dữ liệu<br />
lớn phù hợp với sự phát triển của công ty, sử dụng kĩ thuật<br />
dữ liệu lớn để tạo ra doanh thu cho công ty. Từng bước<br />
thâm nhập các kĩ thuật dữ liệu lớn vào mọi khía cạnh của<br />
lưới điện thông minh.<br />
TÀI LIỆU THAM KHẢO<br />
[1] Birney E. The making of Encode: lessons for big-data projects.<br />
Nature, 2012(489): 49-51Irving M R, Luan W P, Danial J S. Supply<br />
restoration in distribution networks using a genetic algorithm.<br />
Electrical Power and Energy Systems 2002, 10: 447-457.<br />
<br />
[2] UN Global Pulse. Big data for development: challenges & opportunities.(0511-2012) http://www.unglobalpulse.org/projects/Bigdata Development<br />
[3] Agrawal D, Bernstein P, Bertino E, et al. Challenges and opportunities<br />
with big data. http://www.cra.org/ccc/resources/ccc-ledwhite-papers<br />
[4] Meng Xiaofeng, Ci Xiang. Big data management: concepts,<br />
techniques and challenges. Journal of Computer Research and<br />
Development, 2013, 50(1): 146-169.<br />
[5] EPRI. The whys, whats and hows of managing data as an asset.<br />
USA: EPRI, 2014.<br />
[6] IBM. Managing big data for smart grids and smart meters. IBM<br />
Software White Paper. http://www.smartgridnews.com/artman/<br />
publish/Business_Strategy/Managing-big-data-for-smart-grids-andsmart-meters-5248.html.<br />
[7] Informatization Committee of the CSEE. White paper of electric<br />
power big data of China. Beijing: China Electric Power Press, 2013.<br />
[8] Zhao Gang. Big data technology and application practice. Beijing:<br />
Publishing House of Electronics Industry, 2013: 56-58.<br />
[9] McKinsey& Company. Big data: the next frontier for innovation,<br />
competition, and productivity. New York: McKinsey Global<br />
Institute, 2011: 1-28.<br />
[10] Wu Xindong, Zhu Xingquan, Wu Gongqing, et al. Data mining with<br />
big data. IEEE Transactions on Knowledge and Data Engineering,<br />
2014, 26(1): 97-107.<br />
[11] Havens T C. Fuzzy c-means algorithms for very large data. IEEE<br />
Transactions on Fuzzy System, 2012, 20(6): 1130-1146.<br />
[12] Shim K. Algorithms for big data analysis. Proceedings of the VLDB<br />
Endowment, 2012, 5(12): 2016-2017.<br />
[13] Kong Yinghui. Study on data stream techniques and its application<br />
in electric power information processing. Heibei: North China<br />
Electric Power University, 2009.<br />
[14] Wang jiye, Ji Zhixiang, Shi Mengjie, et al. Intelligent equipped with<br />
TVU data demand analysis and application. Proceeding of the<br />
CSEE, 2015, 35(8): 1829⁃1836.<br />
[15] Hung Ronghui, Li Xun, LYU Qishen, et al. Research on the defect<br />
analysis of power equipment based on data mining. Electrical<br />
Application, 2015, 34(2): 46⁃50.<br />
[16] Hu Changhua. Based on user behavior analysis of peak load shifting<br />
management system research and design. Modern Computer<br />
(professional edition), 2014(21): 42⁃47.<br />
[17] Quilumba F L, Lee W J, Huang H, et al. Using smart meter data to<br />
improve the accuracy of intraday load forecasting considering<br />
customer behavior similarities. IEEE Transactions on Smart Grid,<br />
2015, 6(2): 911⁃918.<br />
<br />
(BBT nhận bài: 20/8/2018, hoàn tất thủ tục phản biện: 05/9/2018)<br />
<br />