
Tuyển tập Hội nghị Khoa học thường niên năm 2024. ISBN: 978-604-82-8175-5
104
ỨNG DỤNG CÁC BIẾN THỂ CỦA MÔ HÌNH HỌC SÂU
TRANSFORMER TRONG DỰ BÁO LƯU LƯỢNG
ĐẾN HỒ TẢ TRẠCH
Nguyễn Đắc Hiếu1, Hoàng Hải Đăng1, Đoàn Anh Hoàng2, Nguyễn Đắc Phương Thảo1
1Trường Đại học Thủy lợi, email: dachieu@tlu.edu.vn
2Trung tâm Công nghệ Phần mềm Thuỷ lợi, email: doananhhoang@cwrs.vn
Tả Trạch là một trong những hồ thủy lợi lớn
nhất Việt Nam, đóng vai trò quan trọng trong
việc kiểm soát lũ lụt và cung cấp nước tưới
tiêu. Trong bối cảnh biến đổi khí hậu và nguy
cơ lũ lụt ngày càng gia tăng, việc áp dụng các
phương pháp dự báo hiện đại trở nên cấp thiết
để bảo đảm an toàn cho người dân và tài sản.
Mục tiêu của nghiên cứu là so sánh và đánh
giá hiệu suất của các biến thể Transformer
như Reformer, Informer, Autoformer, và
PatchTST, nhằm cải thiện độ chính xác và tính
ứng dụng trong dự báo lưu lượng nước.
1. GIỚI THIỆU CHUNG
Hồ thủy lợi Tả Trạch tại thị xã Hương
Thủy (Thừa Thiên - Huế) là một trong 4 hồ
thủy lợi lớn nhất cả nước, với dung tích 646
triệu m³, do Ban Quản lý đầu tư và Xây dựng
Thủy lợi 5 quản lý. Vào năm 2021, mức nước
trong hồ chứa nước Tả Trạch, Thừa Thiên
Huế cao hơn mức bình thường cho phép, gây
úng ngập hàng trăm héc-ta keo, tràm chuối
của người dân đang trồng quanh hồ. Việc
đảm bảo an toàn cho người dân và tài sản
thông qua dự báo lũ lụt là nhiệm vụ thiết yếu
hiện nay, vì lịch sử đã cho thấy lũ lụt gây ảnh
hưởng nghiêm trọng đến tài sản và tính mạng
con người.
2. PHƯƠNG PHÁP NGHIÊN CỨU
Về phương pháp nghiên cứu này áp dụng
những biến thể hiện đại nhất của mạng học máy
Transformer: Reformer, Informer, Autoformer
và PatchTST.
2.1. Reformer
Các mô hình Transformer [1] thường đạt
được kết quả tiên tiến nhất trên một số nhiệm
vụ, nhưng việc huấn luyện những mô hình
này có thể rất tốn kém, đặc biệt là trên các
chuỗi dài. Reformer [5] ra đời để cải thiện
hiệu quả của Transformer.
Hình 1. Kiến trúc Reformer
Hashing attention
Mỗi vector Query và Key được hash thành
nhóm nhất định sử dụng LSH. Hàm băm này
sẽ đảm bảo các vector gần nhau nhất trong
không gian vector và gom chúng thành 1
nhóm. Việc sử dụng hàm băm này sẽ giúp
giảm đáng kể lượng data trong quá trình
training từ đó tăng hiệu quả bởi các nhóm dữ
liệu gần nhau.
Sau đó chúng sẽ được sắp xếp theo nhóm
và thực hiện attention theo nhóm này từ đó
giúp giảm query từ O (L2) O(L log L).
2.2. Informer
Dự đoán với chuỗi thời gian dài hạn là lý
do mà Informer [3] ra đời nhằm mục đích
thay thế những phương pháp cũ. Được xây
dựng trên nền tảng nổi tiếng Transformer,