Ứng dụng mạng Long Short Term Memory (LSTM) để dự báo mực nước tại trạm Quang Phục và Cửa Cấm, Hải Phòng, Việt Nam

Chia sẻ: Tuong Vi | Ngày: | Loại File: PDF | Số trang:8

Thêm vào BST

Báo xấu

81
lượt xem 3
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết trình bày các ứng dụng của mô hình bộ nhớ gần xa (Long Short-Term Memory - LSTM) được sử dụng để dự báo mực nước sông mà không cần các số liệu địa hình và dự báo mưa. Dữ liệu cần thiết cho mô phỏng là mực nước theo giờ tại các trạm thủy văn ở thành phố Hải Phòng,... Để nắm nội dung mời các bạn cùng tham khảo.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Ứng dụng mạng Long Short Term Memory (LSTM) để dự báo mực nước tại trạm Quang Phục và Cửa Cấm, Hải Phòng, Việt Nam

BÀI BÁO KHOA H C ỨNG DỤNG MẠNG LONG SHORT-TERM MEMORY (LSTM) ĐỂ DỰ BÁO MỰC NƯỚC TẠI TRẠM QUANG PHỤC VÀ CỬA CẤM, HẢI PHÒNG, VIỆT NAM Lê Xuân Hiền1, 2; Hồ Việt Hùng1 Tóm tắt: Trong bài báo này, mô hình Bộ nhớ gần xa (Long Short-Term Memory - LSTM) được sử dụng để dự báo mực nước sông mà không cần các số liệu địa hình và dự báo mưa. Dữ liệu cần thiết cho mô phỏng là mực nước theo giờ tại các trạm thủy văn ở thành phố Hải Phòng. Mô hình được thiết lập để dự báo mực nước cho trạm Quang Phục và trạm Cửa Cấm trước 5 giờ (dự báo từ 1 giờ đến 5 giờ). Mặc dù mô hình không yêu cầu các dữ liệu về khí hậu, địa hình nhưng kết quả dự báo có độ chính xác cao. Trong trường hợp dự báo mực nước trước 3 giờ, hệ số NSE (hệ số Nash) cho giá trị trên 97,8% và giá trị RMSE (sai số căn quân phương) nhỏ hơn 0,10 m cho cả 2 trạm. Kết quả này cho thấy rằng, mô hình LSTM mà các tác giả đề xuất dự báo chính xác mực nước theo thời gian thực, có thể áp dụng mô hình này để cảnh báo lũ trên các sông của Việt Nam. Từ khóa: Hải Phòng, dự báo mực nước, LSTM, DNN, Quang Phục, Cửa Cấm. 1. MỞ ĐẦU * Diễn biến mực nước sông là một quá trình phức tạp, biến đổi theo không gian và thời gian. Việc dự báo chính xác mực nước là một trong những yêu cầu cấp bách nhằm giảm thiểu các rủi ro do lũ gây ra và có ý nghĩa quan trọng trong việc xây dựng phương án phòng, chống lũ. Các mô hình truyền thống được sử dụng để dự báo ở Việt Nam cũng như trên thế giới là các mô hình số về thủy lực và thủy văn. Các mô hình này yêu cầu một số lượng lớn các dữ liệu đầu vào như: đặc điểm lưu vực, địa hình, dự báo lượng mưa, quan hệ mưa – dòng chảy, quan hệ lưu lượng - mực nước theo thời gian tại một số vị trí. Một trong những giải pháp hiệu quả cho việc dự báo là sử dụng mô hình Mạng thần kinh nhân tạo (Artificial Neural Network – ANN). Trên thế giới các mô hình ANN đã được sử dụng rộng rãi trong dự báo lũ từ những năm 1990 (Sung, J.Y. và các cộng sự, 2017). Cùng với đó, các nhà nghiên cứu đã áp dụng các thuật toán vào mô hình Mạng thần kinh để làm tăng độ chính xác 1 Khoa Kỹ thuật Tài nguyên nước, Trường Đại học Thủy lợi Dept. of Construction & Disaster Prevention Engineering, Kyungpook National University, Sangju, Korea 2 của kết quả dự báo. Trong những năm gần đây, phương pháp Học sâu (Deep learning) dựa trên nền tảng là các mạng thần kinh nhân tạo đang phát triển rất nhanh và thu hút sự quan tâm của nhiều nhà khoa học. Có thể kể đến nghiên cứu của Chen, J.F. và các cộng sự (2014), ở đây thuật toán Cuckoo Search đã được áp dụng để dự báo dòng chảy đến hồ Hòa Bình, Việt Nam; Nguyễn Thanh Tùng (2016) đã sử dụng phương pháp Random Forest cũng để dự báo dòng chảy đến hồ này; Trương Xuân Nam và các cộng sự (2016) đã sử dụng phương pháp Học sâu để dự báo lưu lượng nước đến hồ Hòa Bình. Các nghiên cứu này đều có một điểm chung, đó là sử dụng dữ liệu của mùa kiệt với bước thời gian quan trắc 10 ngày làm đầu vào và đưa ra dự báo dòng chảy cho 10 ngày sau đó. Các kết quả nghiên cứu đều khẳng định khả năng tiềm ẩn của mô hình mạng thần kinh. Mô hình ANN cũng được áp dụng để dự báo mực nước ở trạm Hirakata, Nhật Bản (Kim, S. và các cộng sự, 2017). Nghiên cứu này chỉ sử dụng dữ liệu mực nước thực đo theo giờ ở các trạm thượng lưu để dự báo mực nước ở hạ lưu trước 3, 6 và 9 giờ. Kết quả đạt được cho thấy mô hình mạng thần kinh có thể áp dụng cho việc cảnh báo lũ trên KHOA HC HC K THUT THY LI VÀ MÔI TRNG - S 62 (9/2018) 9 sông. Wang, Y. và các cộng sự (2017) đã sử dụng mạng thần kinh LSTM để dự báo chất lượng nước cho hồ Taihu, Trung Quốc. Nghiên cứu chỉ ra rằng mô hình LSTM đưa ra dự báo chính xác hơn so với các mô hình mạng thần kinh khác. Trong bài báo này, các tác giả sử dụng mô hình LSTM để dự báo mực nước sông mà không cần các thông tin dự báo lượng mưa, cũng như số liệu địa hình và tình hình sử dụng đất. Mô hình này được áp dụng để dự báo mực nước trước 1h, 2h, 3h, 4h và 5h tại trạm Quang Phục trên sông Văn Úc và trạm Cửa Cấm trên sông Cấm. 2. PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Mô hình LSTM Mô hình đề xuất dựa trên mô hình mạng thần kinh sâu LSTM, đây là một dạng đặc biệt của RNN (Recurrent Neural Network - Mạng thần kinh hồi quy). LSTM được giới thiệu bởi Hochreiter và Schmidhuber (1997) nhằm giải quyết các bài toán về phụ thuộc xa (long-term dependency). thay vì chỉ có 1 tầng mạng thần kinh như RNN chuẩn thì chúng có tới 4 tầng và tương tác với nhau một cách đặc biệt. Cấu trúc của mô hình mạng thần kinh LSTM được thể hiện ở Hình 1. Cốt lõi của LSTM bao gồm trạng thái tế bào (cell state) và cổng (gate). Trạng thái tế bào giống như băng chuyền, chạy xuyên suốt qua tất cả các nút mạng giúp thông tin được truyền đạt dễ dàng, còn cổng là nơi sàng lọc thông tin đi qua nó, chúng được kết hợp bởi một tầng mạng sigmoid. Một LSTM gồm có 3 cổng để duy trì hoạt động trạng thái của tế bào. Bước đầu tiên của mô hình LSTM được gọi là tầng cổng quên (forget gate layer). Bước này sẽ quyết định xem thông tin nào cần bỏ đi từ trạng thái tế bào. Đầu vào cho bước này là ht-1 (giá trị đầu ra tại thời điểm t-1) và xt (dữ liệu đầu vào); đầu ra ft là một số trong khoảng từ 0 đến 1 cho mỗi số trong trạng thái tế bào Ct-1. (1) f t = σ (W f .[ht −1 , xt ] + b f ) Trong đó: σ là hàm sigmoid, Wf và bf lần lượt là trọng số và tham số của tầng cổng quên. Các bước tiếp theo sẽ quyết định thông tin lưu vào trạng thái tế bào và cập nhật giá trị cho trạng thái. Bao gồm một tầng sigmoid hay còn được gọi là cổng vào (input gate layer, it) và một véc tơ giá trị được tạo từ tầng tanh. it = σ (Wi .[ht −1 , xt ] + bi (2) CCt t = tanh(WC .[ht −1 ,xt ] + bC ) (3) Ct = ft * Ct −1 + it * CCt (4) Hình 1. Cấu trúc của mô hình LSTM (Nguồn: Internet) Trong đó: Ct-1 và Ct là trạng thái tế bào lần lượt ở thời điểm t-1 và t; WC và bC lần lượt là trọng số và tham số của trạng thái tế bào. Ở bước cuối cùng, giá trị đầu ra (ht) sẽ được quyết định bởi trạng thái của tế bào muốn xuất ra (output gate, ot). ot = σ (Wo .[ht −1 ,xt ] + bo ) (5) ht = ot * tanh( Ct ) (6) Theo Olah (2015), mọi mạng hồi quy đều có dạng là một chuỗi các mô đun lặp đi lặp lại của một mạng thần kinh, mỗi mô đun này thường có cấu trúc đơn giản được gọi là một tầng “tanh”. LSTM cũng có kiến trúc dạng chuỗi như vậy và 2.2 Thu thập dữ liệu về khu vực nghiên cứu Dữ liệu được thu thập bao gồm: điều kiện tự nhiên, đặc điểm khí tượng, thủy văn, hải văn. Các số liệu lượng mưa và mực nước theo giờ tại các trạm thủy văn có trong 19 ngày, bắt đầu từ 0h ngày 14/7/2011. Khu vực nghiên cứu gồm 10 KHOA HC HC K THUT THY LI VÀ MÔI TRNG - S 62 (9/2018) sông Văn Úc và sông Cấm thuộc địa phận thành phố Hải Phòng (Hình 2). Đây là khu vực chịu ảnh hưởng của thủy triều. Các dữ liệu phục vụ cho bài báo này được thể hiện trong Bảng 1. sông Văn Úc phân ra một nhánh chính là sông Lạch Tray đổ ra cửa Lạch Tray. Sông Cấm là ranh giới giữa hệ thống An Hải và Thuỷ Nguyên, toàn bộ sông Cấm thuộc địa phận Hải Phòng. Đây chính là nhánh của sông Kinh Môn, có chiều dài 23 km, bắt đầu từ ngã ba Hợp Thành đến nhập lưu vào sông Bạch Đằng để đổ ra biển qua cửa Nam Triệu. Sông Cấm có chiều rộng khoảng 200-700m. 2.3 Phương pháp đánh giá Để đánh giá hiệu quả của mô hình dự báo, chúng tôi sử dụng hai trị số, đó là RMSE (Root Mean Squared Error – sai số căn quân phương) và NSE (Nash Sutcliffe Efficiency – hệ số Nash) RMSE = 1 n 2 ∑ ( Oi − Pi ) n i =1 n ∑ (O − P ) i NSE = 1 − 2 i i =1 n ∑ (O − O ) i (7) 2 (8) i i =1 Hình 2. Hệ thống sông khu vực TP. Hải Phòng (Nguồn: Viện Kỹ thuật tài nguyên nước, 2011) Bảng 1. Thống kê các số liệu đã thu thập TT 1 2 3 4 5 6 7 Trạm Chanh Chữ Tiên Tiến Trung Trang Quang Phục* Cao Kênh Cửa Cấm* Hòn Dấu Sông Luộc Mới Văn Úc Văn Úc Kinh Thầy Cấm Biển Đông Yếu tố đo H, X H H H H, X H, X H (Nguồn: Viện Kỹ thuật tài nguyên nước, 2011) Trong Bảng 1: H là mực nước; X là lượng mưa; * là các trạm cần dự báo mực nước. Đoạn sông Văn Úc chảy qua Hải Phòng từ ngã ba Gùa ra đến biển dài 45 km. Đây là sông sâu và rộng nhất trong số các sông ở hạ du sông Thái Bình, với chiều rộng trung bình từ 500 đến 800m. Dưới ngã ba Gùa khoảng 1 km, Trong đó: Oi, O i và Pi lần lượt là giá trị thực đo, giá trị thực đo trung bình và giá trị dự báo của mẫu thứ i tương ứng. Mô hình dự báo cho kết quả tốt nếu RMSE nhỏ và NSE lớn. 3. THIẾT LẬP THÔNG SỐ MÔ HÌNH Mô hình LSTM được đề xuất để dự báo mực nước trong nhiều trường hợp, từ 1 giờ đến 5 giờ tại trạm Quang Phục (sông Văn Úc) và trạm Cửa Cấm (sông Cấm). Mỗi mô hình LSTM được hiệu chỉnh (training) và kiểm định (test) để dự báo mực nước lần lượt cho từng trạm. Các thông số của mô hình được hiệu chỉnh và kiểm định để đảm bảo mô hình cho kết quả tốt nhất, chi tiết về các thông số này được tóm tắt trong Bảng 2. Sau quá trình hiệu chỉnh và kiểm định, các thông số tốt nhất của mô hình cho mỗi trường hợp đã được lựa chọn để phục vụ việc dự báo. Dữ liệu đầu vào của mô hình LSTM dựa trên mực nước thực đo tại các trạm thủy văn trong 3 giờ gần nhất (t-2, t-1, t-0), hoặc trong 6 giờ gần nhất (từ t-5 đến t-0). KHOA HC HC K THUT THY LI VÀ MÔI TRNG - S 62 (9/2018) 11 Bảng 2. Các thông số của mô hình LSTM Đặc trưng Mục tiêu dự báo Dữ liệu đầu vào Cấu trúc mô hình Thông số hiệu chỉnh mô hình Chi tiết Mực nước tại trạm Quang Phục và Cửa Cấm trước 1h, 2h, 3h, 4h, 5h Lượng mưa tại khu vực nghiên cứu. Mực nước thực đo tại các trạm thủy văn trong 3 giờ: t-2, t-1, t-0. Mực nước thực đo tại các trạm thủy văn trong 6 giờ: từ t-5 đến t-0 TensorFlow với BasicLSTMCell Số lượng lớp ẩn: 10, 20; 50 Hệ số học: 0,1; 0,5; 0,01; 0,05; 0,001; 0,005 Số lượng Epoch: 10.000; 20.000; 50.000 Để dự báo mực nước cho trạm Quang Phục, mực nước thực đo tại các trạm Trung Trang, Chanh Chữ, Tiên Tiến, Hòn Dấu và Quang Phục đã được sử dụng. Tương tự như vậy, mực nước thực đo tại các trạm Cao Kênh, Hòn Dấu và Cửa Cấm được dùng để dự báo mực nước cho trạm Cửa Cấm. Các dữ liệu về lượng mưa tại 2 khu vực này đã được đưa vào để kiểm định, tuy nhiên việc đưa thêm các số liệu này không làm các kết quả dự báo tốt hơn. Việc này có thể giải thích như sau: diện tích mặt sông nhỏ và lượng mưa không lớn, ngoài ra còn có tác động của bốc hơi và thấm nên ảnh hưởng của mưa là không đáng kể; mặt khác, lượng mưa ở khu giữa trên mỗi đoạn sông còn được thể hiện trong chính mực nước thực đo của trạm cần dự báo. Vì vậy trong bài báo này, kết quả dự báo chỉ phụ thuộc vào dữ liệu mực nước thực đo tại các trạm. Trong mô hình thủy lực sông, các mực nước này chính là các biên của mô hình. Để hiệu chỉnh và kiểm định mô hình, dữ liệu được sử dụng bao gồm 456 bản ghi là số liệu mực nước theo giờ, từ 0h ngày 14/7/2011 đến 23h ngày 01/8/2011, thời điểm này đang là mùa lũ ở Hải Phòng. Bộ dữ liệu này được chia thành 2 tập: tập dữ liệu hiệu chỉnh gồm 408 bản ghi để hiệu chỉnh mô hình nhằm chọn các thông số tốt nhất; tập dữ liệu kiểm định gồm 48 bản ghi để đánh giá hiệu quả của mô hình với các thông số đã chọn. Các dữ liệu đã thu thập cho thấy, mực 12 nước lớn nhất ở cả 2 trạm Quang Phục (2,26m) và Cửa Cấm (2,09m) đều rơi vào ngày 30/7/2011. Các giá trị này nằm trong tập dữ liệu hiệu chỉnh nhằm đảm bảo đưa ra kết quả chính xác hơn cho quá trình dự báo đỉnh lũ. Một điểm lưu ý nữa là, không có quy tắc nào trong việc lựa chọn cấu trúc mô hình cũng như các thông số mô hình (Kim, S., và các cộng sự, 2017). Việc lựa chọn cấu trúc mô hình và thông số mô hình dựa trên việc đánh giá về kích cỡ dữ liệu và quá trình thử để đảm bảo chọn được các thông số phù hợp nhất cho nghiên cứu này. 4. KẾT QUẢ NGHIÊN CỨU 4.1 Dự báo mực nước trạm Quang Phục Kết quả dự báo mực nước cho trạm Quang Phục trong các trường hợp từ 1 giờ đến 5 giờ được thể hiện tương ứng trong các Hình 3(a), Hình 4 và Hình 5. Có thể thấy rằng mô hình dự báo cho kết quả rất ấn tượng, đặc biệt cho các trường hợp dự báo từ 1-3 giờ với sai số trung bình nhỏ hơn 0,095m và hệ số NSE trên 97,8%. Hình 3 (a) mô tả sự tương quan chặt chẽ giữa kết quả dự báo và giá trị thực đo trong trường hợp dự báo mực nước (MN) trạm Quang Phục trước 1 giờ, hệ số Nash lên tới 99,7% và RMSE chỉ 0,038m. Trong trường hợp dự báo trước 4 giờ và 5 giờ (Hình 5), mặc dù hệ số NSE tương đối tốt (lần lượt là 94% và 92%) nhưng giữa kết quả dự báo và thực đo có chênh lệch nhỏ (1 giờ) về thời gian xuất hiện đỉnh lũ. KHOA HC HC K THUT THY LI VÀ MÔI TRNG - S 62 (9/2018) (a) (b) Hình 3. So sánh MN thực đo với dự báo 1 giờ tại Quang Phục (a) và Cửa Cấm (b) Hình 4. Dự báo MN 2 giờ (trái) và 3 giờ (phải) tại Quang Phục Hình 5. Dự báo MN 4 giờ (trái) và 5 giờ (phải) tại Quang Phục Bảng 3 tổng hợp các kết quả kiểm định tốt nhất và các thông số mô hình đã được lựa chọn để dự báo mực nước trạm Quang Phục. Bảng 3. Kết quả kiểm định dự báo mực nước cho trạm Quang Phục Thời gian dự báo(giờ) 1 2 3 4 5 Chiều dài dữ liệu 6 3 6 6 6 Số trạm đầu vào 5 5 5 5 5 Số lượng lớp ẩn 50 50 50 50 50 KHOA HC HC K THUT THY LI VÀ MÔI TRNG - S 62 (9/2018) Hệ số học 0.01 0.001 0.1 0.1 0.1 Số lượng Epoch 50000 20000 20000 20000 20000 RMSE (m) 0.038 0.064 0.095 0.155 0.177 NSE (%) 99.7% 99.0% 97.8% 94.1% 92.4% 13