KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - S85 (9/2023)
19
BÀI BÁO KHOA HC
ỨNG DỤNG MÔ HÌNH HỒI QUY VÀ MẠNG NƠ RON NHÂN TẠO
DỰ BÁO SỐ LIỆU QUAN TRẮC THẤM Ở THÂN VÀ NN ĐẬP
Trần Duy Quân1, Nguyễn Thị Kim Ngân2, Hồ Sỹ Tâm1, Tạ Quang Chiểu2
Tóm tắt: Sliệu quan trắc thấm qua thân và nền đập là một trong những thông tin quan trọng góp
phần đánh giá và phát hiện sớm nguy mất an toàn đập. Những năm gần đây, với sự phát triển của
công nghthông tin, nhiều hình ứng dụng trí tunhân tạo đã đang được ứng dụng để thể dự
báo sớm số liệu quan trắc thấm ở thân và nền đập. Trong nghiên cứu này, hai mô hình dựa trên phương
pháp hồi quy tuyến nh (LR) và mạng ron nhân tạo (ANN) được xây dựng để dự đoán sliệu quan
trắc thấm tại 25 đầu đo thấm thân và nền đập Ngàn Trươi tỉnh Hà Tĩnh. Các đặc trưng thống kê R2,
NSE, MAE và RMSE được tính toán để kiểm tra độ tin cậy của hai hình. Kết quả tính toán cho thấy,
chai hình đều cho kết quả dự báo tốt hầu hết các đầu đo quan trắc. Trong đó mô hình LR cho
thấy kết quả dự báo tốt hơn hình ANN. Những kết quả này mở ra triển vọng áp dụng những mô hình
học máy trong dự báo số liệu quan trắc thấm để từ đó phát hiện sớm nguy cơ mất an toàn liên quan đến
dòng thấm ở thân và nền đập.
Từ khoá: Dự báo thấm, học máy, hồi quy tuyến tính, mạng nơ ron nhân tạo.
1. ĐẶT VẤN ĐỀ *
Đập là công trình nhân tạo được y dựng chắn
ngang sông thường là tạo thành c h chứa nước.
Các h chứa nước một mặt vai trò quan trng
trong việc điều tiết nguồn nước, cung cp nước cho
các nhu cầu dùng nước (thủy điện, cấp nước cho
nông nghiệp, công nghiệp, sinh hoạt, nuôi trồng
thy sản…), đồng thời là góp phần cắt cho hạ
lưu. Mặt khác, các đập và h chứa khi xảy ra sự cố,
lượng nước sẽ đổ về phía hạ du, gây ra các thiệt hại
lớn đến các hoạt động kinh tế xã hội, thậm chí cả
tính mạng con người. Do đó, yêu cầu đảm bảo an
toàn đập, phát hiện sớm nguy sự cố đập là một
yêu cầu quan trọng trong quản lý vận hành.
Theo thống kê, trong sc nguyên nhân dn
đến sự cđập, nguyên nhân do ng thấm chiếm
khoảng 25-30% các s cố đập trên thế giới
(Stematiu, 2009; Charles, 2011). S cố đập do
dòng thấm thể phát hiện sớm được trong quá
trình qun lý vận hành thông qua c dấu hiệu bất
thưng của dòng thấm thể nhận biết qua c
biểu hiện bên ngoài của đập (hố sụt trên mặt đập,
1 Khoa Công trình, Trường Đại học Thủy lợi
2 Khoa Công nghệ thông tin, Trường Đại học Thủy lợi
nước thấm đục chảy ra phía hạ lưu đập, s phát
triển bất thường của y cỏ phía hlưu đập so với
khu vực xung quanh...); hoặc thông qua số liu
quan trắc hoặc thông qua tính toán các đặc trưng
ca dòng thấm đập và nền như cột nước thấm,
lưu lượng thấm, áp lực thấm. Một vài ví dthể
k đến như nghiên cứu của Torblaa và Kjoernsli
(1968) cho thấy rằng, scđập Hyttejuvet Áo
đã được phát hiện sớm khi sự tăng lên bất
thưng trong số liệu quan trắc lưu lượng thấm qua
đập; hay nghiên cứu khác của Lach (2018) chỉ ra
rằng 2 tuần trước thời điểm sự cố thấm đập
Pieczyska, sliệu quan trắc cột nước thấm tại các
Piezometers khu vực xuất hiện sự cố s tụt
giảm đột ngột. Như vậy, các scố đập liên quan
đến dòng thấm hoàn toàn th phát hiện sớm
thông qua nhng thay đổi bất thường trong sliệu
quan trắc thấm công trình. Vì vậy, việc phát
triển một công cụ để phân tích, dự báo sớm số liu
quan trắc thấm dưới đập là cần thiết và nhiều ý
nghĩa thực tiễn.
Việt Nam hiện nay, để xác định các đặc
trưng của dòng thấm qua thân và nền đập, một s
phương pháp tính toán dựa trên một số giả thiết để
đơn giản hóa bài toán như các phương pháp gần
KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - S85 (9/2023)
20
đúng như phương pháp thủy lc, phương pháp
phần tử hữu hạn (FEM). Những phương pháp này
hn chế thường giải quyết bài toán phẳng, ít
k đến ảnh hưởng của các yếu tố không gian, thời
gian, thời tiết… đến dòng thấm qua thân, nền đập
Do đó, kết quả tính toán thấm theo những phương
pháp này trong các giai đoạn thiết kế thường có s
sai lệch tương đối lớn so với các gtrị quan trắc
trong thực tế.
Những năm gần đây, với sphát triển của công
ngh thông tin cùng với cuộc cách mạng 4.0 đưa
đến nhiều ứng dụng của công nghệ thông tin, trí
tunhân tạo (AI), trong đó có ứng dụng để dự o
số liệu quan trắc thấm qua thân và nn đập. Tayfur
nnk (2005) đã ứng dụng hình Artificial
Neural Network (ANN) kết hợp, so sánh với kết
qutính toán mô phỏng từ hình FEM để đánh
giá d o số liệu quan trắc thấm tại các
Piezometers của đập Jeziorsko Ba Lan. Nourani
nnk (2012) đã phát triển mô hình ANN tích hợp
s dụng thuật toán FFBP (feed-forward back-
propagation) và RBF (radial basis function) để mô
hình xác định số liệu quan trắc thấm trong một
nhóm các Piezometers của đập Sattarkhan, Iran.
Emami nnk (2019) cũng sdụng mô hình ANN
tích hợp tương tự dùng đề dự báo sliệu quan trắc
thấm trong c Piezometers của đập Boukan
Shahid Kazemi, Iran... Những nghiên cứu y đều
cho thấy năng lực và độ chính xác khi áp dụng các
nh AI trong dbáo sliệu quan trắc thấm
thân nền đập, so nh với các phương pháp
truyn thống.
Trong i báo này, các tác gi đề xuất y
dựng mô hình hồi quy tuyến tính (LR) hình
mạng ron nhân tạo (ANN) để dự o s liu
quan trắc thấm tại c đầu đo và ng dụng cho
đập Ngàn Trươi, tỉnh Hà Tĩnh.
2. PHƯƠNG PHÁP NGHIÊN CỨU VÀ S
LIỆU THU THẬP
2.1. Các mô hình nghiên cu
2.1.1. Mô hình hồi quy tuyến tính
Hồi quy tuyến nh (Linear Regression - LR) là
một thuật toán học giám sát, đó quan hệ giữa
đầu vào đầu ra được tả bởi một hàm tuyến
tính. Phương pháp này được mô tả như sau:
- Đầu vào: Cho tập d liệu huấn luyện gồm N
mẫu. Mỗi mẫu là một cặp ( ). Trong đó, xi
c đặc trưng của mẫu thứ i, yi g trcủa
mẫu thứ i.
- Đầu ra: Một hàm tuyến nh dạng
(1)
- Phương pháp: Tìm h s w của hàm
sao cho trung bình sai sgiữa nh
nht. Nghĩa là, tìm (w,b) để hàm mất mát L(w,b)
đạt giá tr nh nhất.
(2)
Đặt , ,
, y = [y1, y2, yN], hàm mất mát
L(w,b) được viết lại như sau.
(3)
Xét biến , là hàm bậc 2 với hệ số của
biến bậc 2 là một s dương. Vì vy đạt giá
tr cực tiểu khi . Đạo hàm của hàm
theo ta có:
(4)
Giải phương trình , ta
(5)
2.1.2. Mô hình mạng nơ ron nhân tạo
Mạng ron nhân to (Artificial Neural
Network - ANN) một trong những hình
quan trọng trong Machine Learning ng như
Deep Learning. Nó một hình tính toán
phỏng cách thức hoạt động của c tế bào thn
kinh bnão con ngưi. Trong một ANN, mỗi
ron gồm 2 phần: Tổng hợp thông tin đầu vào,
Tính toán thông tin đầu ra (nh 1). Gisử, một
ron n n hiệu đầu vào (x1, x2, …, xn) với
trọng s ơng ứng của các n hiệu là (w1, w2,
…, wn), f hàm kích hot (activation function)
của ron. Khi đó các nh toán ca ron y
được thực hiện như sau.
- Tổng hợp thông tin đầu vào:
(6)
- Tính thông tin đầu ra:
(7)
KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - S85 (9/2023)
21
Hình 1. Cấu tạo của một nơ ron nhân tạo
Hình 2. Sơ đồ mạng nơ ron nhân tạo 2 tầng ẩn
Một mng ron nhân tạo một mạng gồm
nhiều nơ ron nhân tạo nối với nhau và xlý thông
tin bằng cách truyền theo các kết nối vành giá tr
mới tại các nơ ron (xem Hình 2).
2.2. Các tiêu chí đánh giá độ tin cậy của c
mô hình hồi quy
Đ đánh giá mc đ d o chính c của các mô
hình hi quy, bn tiêu chí đánh giá sau đưc sử dụng:
1. Hệ số xác định (R2)
R2 = (8)
2. Hệ số hiệu quả (Nash-Sutcliffe efficiency - NSE)
NSE = 1
(9)
3. Sai s tuyệt đối trung bình (Mean Absolute Error - MAE)
MAE = (10)
4. Lỗi trung bìnhnh phương gốc (Root Mean Square Error - RMSE)
RMSE =
(11)
Trong đó: gtr cột nước áp
lc thấm thực đo và dđoán tại thời điểm i;
giá trtrung bình của cột nước áp lực
thấm thực đo và d đoán. G tr R2 nằm trong
đoạn [0, 1]; R2 càng lớn thì đchính xác của
hình ng cao. G trcủa NSE nằm trong khoảng
t đến 1; và ng gần 1 thì kh năng dự đoán
của mô hình càng tốt. MAE RMSE là hai chs
hiển thị sai số của hình với giá trln không
âm, giá trị càng gần 0 thì mô hình càng tốt.
2.3. Vùng nghn cứu và số liệu thu thập
Trong nghiên cứu này, nm tác giả lựa chọn đập
Ngàn Trươi, tỉnh Hà Tĩnh làm nghiên cu điển hỉnh.
Tại đập Ngàn Tơi có bố t khá đầy đủ hthống
quan trắc công trình theo quy định tại TCVN
8215:2021 Công trình thủy lợi - Thiết bị quan trắc,
trong đó hệ thống thiết bị quan trắc thấm thân và nền
đập được bố trí thành 4 tuyến theo 4 mặt cắt ngang
của đập bao gồm MC3, MC6, MC9 và MC12.
Trong các giếng bố t các đầu đo bao gồm đầu
đo trên cao để đo cột nước ứng với đường bão hòa
trong thân đập và c đầu đo ới sâu để đo cột
nước áp lực thấm dưới nền đập.c đầu đo được th
hiện chi tiết tại Bảng 1.
B dữ liệu dùng cho nghiên cứu gồm 1354
mẫu chứa các thông tin được thu thập của mực
nước hồ và sliệu quan trắc thấm của 25 đầu đo
trên tại 9h sáng mỗi ngày, tny 01/01/2019 đến
ngày 01/12/2022. Chuỗi dữ liệu trên sau đó được
nhóm nghiên cứu chia thành 2 tập dữ liệu phụ vụ
cho việc y dựng và kim định hình, cthể
như sau:
KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - S85 (9/2023)
22
- Tập dữ liệu huấn luyện (training data) có
1085 mẫu (dữ liệu từ ngày 01/01/2019 -
05/03/2022).
- Tập dữ liệu kiểm tra (testing data) 269
mẫu (dữ liệu từ ngày 06/03/2022 - 01/12/2022).
Bảng 1. Bảng tổng hp các đầu đo quan trắc thấm qua thân và nền đập Ngàn Trươi
STT Mặt cắt Tên đầu đo
Cao trình
miệng giếng
(m)
Cao trình
đặt đầu đo
(m)
Ghi c
1 ALT1-1 56,43 20 Đầu đo áp lực thấm
2 ALT2-1 56,56 11 Đầu đo áp lực thấm
3 ALT3 44,57 25 Đầu đo áp lực thấm
4 ALT4 29,80 20 Đầu đo áp lực thấm
5 ALT1-2 56,43 33 Đầu đo mực nước bão hòa
6
MC3
ALT2-2 56,56 31 Đầu đo mực nước bão hòa
1 ALT5-1 56,60 -7,3 Đầu đo áp lực thấm
2 ALT6-1 56,60 -20 Đầu đo áp lực thấm
3 ALT7-1 44,57 -2,5 Đầu đo áp lực thấm
4 ALT8 29,76 8,5 Đầu đo áp lực thấm
5 ALT5-2 56,60 33 Đầu đo mực nước bão hòa
6 ALT6-2 56,60 31 Đầu đo mực nước bão hòa
7
MC6
ALT7-2 44,57 9,5 Đầu đo mực nước bão hòa
1 ALT9-1 56,52 -6 Đầu đo áp lực thấm
2 ALT10-1 56,60 -15 Đầu đo áp lực thấm
3 ALT11-1 44,58 -2,5 Đầu đo áp lực thấm
4 ALT12 29,70 8,5 Đầu đo áp lực thấm
5 ALT9-2 56,52 33 Đầu đo mực nước bão hòa
6 ALT10-2 56,60 31 Đầu đo mực nước bão hòa
7
MC9
ALT11-2 44,58 9,5 Đầu đo mực nước bão hòa
1 ALT13-1 56,36 26,6 Đầu đo áp lực thấm
2 ALT14-1 56,42 15 Đầu đo áp lực thấm
3 ALT15 44,37 35,5 Đầu đo áp lực thấm
4 ALT13-2 56,36 33 Đầu đo mực nước bão hòa
5
MC12
ALT14-2 56,42 31 Đầu đo mực nước bão hòa
tH¦îNG L¦U
h¹ L¦U
Hình 3. Sơ đồ bố trí tuyến quan trắc thấm
tại đập Ngàn Trươi – tỉnh Hà Tĩnh
3. KẾT QUẢ VÀ THẢO LUẬN
3.1. Lựa chọn chuỗi dliu qkhứ và thời
gian dự báo tối ưu
Như đã được đề cập nhng phần trên, trong
nghiên cứu này, nhóm tác giả sử dụng mô hình LR
ANN để dự báo sliệu quan trắc tại c đầu đo
thấm. Gọi sliệu quan trắc thấm được dự
báo tại (x) ny trong tương li từ thời điểm hin
tại (t). Khi đó giá tr s là hàm của nhiều
biến đầu vào khác nhau. Với nghiên cứu này,
nhóm nghiên cứu giả thiết rằng sphthuộc
KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - S85 (9/2023)
23
o các biến bao gồm: Mực nước h(Z) trong k
trong ngày tước đó; mực nước hdự o trong x
ngày tiếp theo và sliệu quan trắc thấm tại đầu đo
đang xem t (H) trong k ngày trong quá khứ. Từ
đó giá trị tại một đầu đo quan trắc thấm và có
thể được biểu diễn dưới dạng 1 hàm số nsau:
(12)
Trong đó: Z H tương ng là mc nước h
s liệu quan trc thấm ti đầu đo đang xem
t o thi điểm 9h sáng; t thi điểm hiện ti
đang xem t; k sngày hoặc đ i chuỗi dữ
liệu ngn hạn trong qua khứ được dùng để d
o; x là độ dài chui d liệu hoặc ngày
trong tương lai đưc dự o. Đxác định đưc
độ dài chui d liu tối ưu trong quá khứ và g
trdự báo trong ơng lai tốt nhất, trong nghiên
cứu này, nm tác gi dùng nhng vòng lặp để
nh tn vi giá trk thay đổi từ 1 đến 11 và g
tr x thay đi từ 1 đến 6. Bằng việc sử dụng
nhng vòng lặp với c biến thời gian k x ti
mỗi giếng sc định đưc cặp g trk, x cho
kết qu d đn của mô hình tốt nhất (NSE và
R2 ln nhất; MAE RMSE nhnhất).
Hình 4. Các tiêu chí đánh giá của mô hình hồi quy
tuyến tính với 6 biến đầu vào
nh 4 th hiện các tiêu chí đánh giá hiệu quả của
mô nh LR dùng để dự báo số liệu quan trắc thm
tại đầu đo ALT1-1, ứng với các tờng hợp biến thời
gian k và x khác nhau. Kết quả phân tích c tiêu chí
đánh giá hiu quả mô hình ti đầu đo này khá tốt, giá
tr NSE trong khoảng 0,97364÷0,99651; giá trị R2
trong khong 0,97815÷0,99662; giá trị MAE trong
khoảng 4,249÷13,682cm; giá tr RMSE trong
khoảng 7,319÷20,685cm. Biến đầu vào thời gian với
k = 2 ngày và x = 1 ngày là cp biến thời gian tối ưu,
cho kết qudự báo tốt nhất (NSE = 0,99652; R2 =
0,99662; MAE = 4,25cm; RMSE = 7,32cm). Nợc
lại, cặp biến thời gian k = 9 ngày x = 6 cho kết
quả dự báom nhất (NSE = 0,97364; R2 = 0,97816;
MAE = 13,20cm; RMSE = 20,67cm). Tương tự với
các đầu đo quan trắc thấm khác, tổng hợp các thông
s đầu vào và các giá trđánh giá độ chính xác mô
nh trong trường hợp tối ưu vi mô hình LR và
ANN cho c đầu đo quan trắc thấm còn li được th
hiện Bảng 2 và Bảng 3.
Kết quả mô hình thể hiện trong Bảng 2 và Bng 3
cho thấy, gần như với tất c các đu đo quan trắc
thm, ứng với chai hình LR và ANN, đ chính
c hình đạt tốt nht khi thời gian do trong
tương lai ngn x = 1 ngày. Ch ứng với 2 đầu đo là
ALT13-1 và ALT13-2 khi sử dụng mô hình ANN cho
kết quả dự o tốt nhất với x = 2 ngày. Ảnh hưởng
của độ dài chui số liệu trong quá khk đến kết quả
của mô hình nhìn chung là không quy lut, thay
đổi tùy vào đầu đo và phương pháp mô hình.
Bảng 2. Bảng tổng hp các thông số mô hình LR cho các đầu đo quan trắc thấm
STT Đầu đo x tối ưu
(ngày)
k tối ưu
(ngày) NSE R2 MAE
(cm)
RMSE
(cm)
1 ALT1-1 1 2 0,99651 0,99662 4,25 7,32
2 ALT2-1 1 1 0,97801 0,97795 11,16 23,69
3 ALT3 1 10 0,33182 0,35444 6,24 13,83
4 ALT4 1 3 0,95038 0,95146 4,63 12,98
5 ALT1-2 1 2 0,99576 0,99590 4,43 7,67
6 ALT2-2 1 2 0,79797 0,80057 53,02 97,64
7 ALT5-1 1 5 0,99697 0,99952 12,80 14,21