intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng học máy trong dự báo biến động chiều rộng khe co giãn bê tông thân đập hồ chứa nước

Chia sẻ: Phó Cửu Vân | Ngày: | Loại File: PDF | Số trang:6

5
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết "Ứng dụng học máy trong dự báo biến động chiều rộng khe co giãn bê tông thân đập hồ chứa nước" nghiên cứu và phân tích dữ liệu thu thập được trong gần 4 năm từ các cảm biến tại khe co giãn giữa 2 khối bê tông thân đập hồ chứa nước. Từ đó, nhóm nghiên cứu đề xuất ra các đặc trưng giúp dự báo sớm sự biến thiên của chiều rộng khe co giãn này bao gồm: nhiệt độ môi trường tại khe co giãn, độ cao mực nước lòng hồ và đặc trưng mùa trong năm. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Ứng dụng học máy trong dự báo biến động chiều rộng khe co giãn bê tông thân đập hồ chứa nước

  1. Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) Ứng dụng học máy trong dự báo biến động chiều rộng khe co giãn bê tông thân đập hồ chứa nước Nguyễn Đình Văn1, Lã Kiều Ngọc Thăng1, Hà Văn Phương2 1 Khoa Kỹ Thuật Truyền Thông, Trường Điện – Điện tử, Đại học Bách Khoa Hà Nội 2 Khoa Điện, Trường Đại học Công Nghiệp Hà Nội Email: van.nguyendinh@hust.edu.vn, thang.lkn213588@sis.hust.edu.vn, phuonghv@haui.edu.vn Abstract— Trong bài báo này, chúng tôi nghiên cứu và thống kê (phân tích tương quan) hoặc các mô hình phân tích dữ liệu thu thập được trong gần 4 năm từ các tuyến tính. Tuy nhiên, các nghiên cứu trên thế giới như cảm biến tại khe co giãn giữa 2 khối bê tông thân đập hồ [3], [4] cho thấy sự thay đổi của các khe co giãn chứa nước. Từ đó, nhóm nghiên cứu đề xuất ra các đặc thường có có đặc trưng phi tuyến. Do đó, ứng dụng các trưng giúp dự báo sớm sự biến thiên của chiều rộng khe co giãn này bao gồm: nhiệt độ môi trường tại khe co mô hình tuyến tính vào dự báo sự biến động của khe co giãn, độ cao mực nước lòng hồ và đặc trưng mùa trong giãn này thường không đem lại kết quả tối ưu. Gần năm. Với các đặc trưng trên, nhóm nghiên cứu đã xây đây, nghiên cứu [5] cho dự báo sự chuyển dịch ngang dựng, tối ưu và so sánh các mô hình học máy như đập thủy điện Hòa Bình đã ứng dụng các mô hình học Artificial Neural Network, Random Forest, Support máy như Mô hình hồi quy bội MTR, mô hình dự báo Vector Regressor nhằm tìm kiếm mô hình học máy giúp SAMIRA hay mô hình Back-Propagation Neural dự báo sớm chiều rộng khe co giãn giữa các khối bê tông Network (BPNN) cho thấy kết quả rất khả quan. Nhóm đập nước. Kết quả thí nghiệm cho thấy, mô hình học tác giả đã dự đoán được chuyển dịch ngang của thân máy mạng neuron nhân tạo đạt kết quả dự báo tốt nhất ở đập trước 9 tháng với sai số tốt nhất đạt được từ mô cả ba khoảng thời gian: dự báo sớm 3 tháng, 6 tháng và 9 tháng với sai số dưới 0.1mm ở mức tin cậy 94%. hình mạng nơ-ron nhân tạo với 2.54cm. Các nghiên cứu trên thế giới trong những năm gần đây Keywords- Phân tích dữ liệu, học máy, dự báo, đập hồ cho thấy việc ứng dụng học máy vào xây dựng các mô nước. hình dự báo chuyển vị thân đập là xu thế tất yếu và đem lại các kết quả khả quan. Nghiên cứu trong [6], [7] I. GIỚI THIỆU cho thấy các phương pháp như BPNN, Random Forest Regression (RFR), Logistic Regression (LR), Support Quan trắc chuyển vị các khối bê tông trong các đập Vector Regression (SVR), ... thường đem lại kết quả tối nước, hồ thủy điện một trong các yếu tố quan trọng ưu hơn so với các mô hình thống kê truyền thống. Sai quyết định đến an toàn, an ninh đập nước, hồ thủy điện. số của các nghiên cứu này thường nằm trong khoảng từ Các sự cố về đập nước, hồ thủy điện trong những năm 1σ đến 2σ tùy thuộc vào bộ dữ liệu. gần đây như: sự cố tràn đập thủy điện Hố Hô (2010) Trong bài báo này, nhóm tác giả sử dụng bộ dữ liệu thu phá hủy hoàn toàn nhà máy thủy điện Hố Hô; sự cố vỡ thập được từ một điểm đo trên một thân đập hồ nước ở đập chắn thủy điện Đakrông 3 (2012) gây tổng thiệt Sơn La trong thời gian gần 4 năm từ 01/01/2019 đến hại khoảng 20 tỷ đồng; sự cố vỡ đập thủy điện La rêl 2 25/09/2020. Sử dụng các kỹ thuật phân tích tương quan (2013) làm ngập gần 70 ngôi nhà, ... cho thấy mức độ và thống kê dữ liệu, nhóm tác giả đề xuất được các đặc ảnh hưởng rộng lớn nếu để xảy ra các sự cố tương tự trưng đóng vai trò then chốt trong dự báo sự biến thiên trong tương lai. của chiều rộng khe co giãn giữa các khối bê tông thân Một trong những yêu cầu cở bản trong đảm bảo an toàn đập. Từ đó, bài báo cũng ứng dụng các thuật toán học thân đập hồ chứa nữa là khả năng giám sát khe co giãn máy như Neural network (NN), SVR hay RFR cùng giữa các tấm bê tông. Tuy nhiên, thực tế cho thấy việc các thuật toán tìm kiếm siêu tham số như grid search chỉ giám sát sự thay đổi của khe co giãn khó có thể nhằm xây dựng các mô hình dự báo với độ chính xác giúp nhà quản lý đưa ra cảnh báo sớm về những sự cố cao biến động chiều rộng khe co giãn cho tương lai ở nếu có hoặc xây dựng kế hoạch chứa, xả nước trong các mốc 3 tháng (1 quý), 6 tháng (nửa năm) và 9 tháng lòng hồ một cách hiệu quả. Vì vậy, việc xây dựng một (3 quý). Các mô hình này cũng sẽ được đánh giá sử mô hình dự báo sớm chiều rộng khe co giãn này đóng dụng phương pháp đánh giá chéo (cross-validation) vai trò quan trọng trong việc lên kế hoạch sản xuất và nhằm đánh giá tính tổng quát khả năng dự báo của mô dự phòng cho các sự cố. Các nghiên cứu trong nước hình khi đem vào ứng dụng trong thực tế. như [1], [2] thường sử dụng các mô hình xác xuất ISBN 978-604-80-8932-0 341
  2. Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) II. PHÂN TÍCH DỮ LIỆU sự biến thiên của các điểm đo này tổng hợp lại sẽ ảnh Nghiên cứu trong [8]–[10] cho thấy, có nhiều yếu tố có hưởng trực tiếp đến an toàn đập. thể ảnh hưởng đến sự giãn nở của khe co giãn giữa các Nhằm tìm hiểu mối quan hệ tương quan giữa các đặc khối bê tông thân đập. Các yếu tố có thể kể đến như: trưng nói trên, ma trận tương quan giữa p đặc trưng với nhiệt độ môi trường, mực nước lòng hồ, vật liệu và kết n dữ liệu cho mỗi đặc trưng được tính toán sử dụng mô cấu bê tông, kết cấu địa chất cũng như các yếu tố ngoại hình trong (1). 2 2 vi khác (thời tiết, mặt trời, động đất, …). Do các yếu tố 𝑠1 ⋯ 𝑠1𝑝 về vật liệu và kết cấu bê tông thường rất khó đo đạc và 𝐶𝑜𝑣(𝑠1 , 𝑠2 , . . , 𝑠 𝑝 ) = ([ ⋮ ⋱ ⋮ ]) (1) kiểm tra, việc dự báo sự giãn nở của các khe co giãn 𝑠 𝑝,1 ⋯ 𝑠 2𝑝 thường dựa vào các yếu tố môi trường. Có 2 yếu tố Với phương sai của đặc trưng j-th được tính theo (2) chính thường được sử dụng ở các nghiên cứu bao gồm: 1 𝑠 2 = ∑ 𝑖=1(𝑥 𝑖,𝑗 − 𝑥̅ 2 )2 𝑖 𝑛 𝑗 (2) nhiệt độ môi trường và chiều cao mực nước lòng hồ 𝑛 Hiệp phương sai của đặc trưng j và k được tính theo (3) [8]. 1 Từ lý do trên, nhóm nghiên cứu đã thu thập dữ liệu về 𝑠 𝑗,𝑘 = ∑ 𝑖=1(𝑥 𝑖,𝑗 − 𝑥̅ 2 )(𝑥 𝑖,𝑘 − 𝑥̅ 𝑘 )2 (3) 𝑛 𝑗 𝑛 nhiệt độ môi trường tại một điểm đo, mực nước lòng Và mean của đặc trưng thứ j được tính theo (4) hồ và chiều rộng của khe co giãn bê tông trong thời 1 𝑛 𝑥̅ 𝑗 = ∑ 𝑖=1 𝑥 𝑖,𝑗 (4) gian từ 01/01/2019 đến 25/09/2022. Việc triển khai đo 𝑛 Kết quả của ma trận tương quan được thể hiện như đạc dữ liệu được thực hiện sử dụng cảm biến đo vết nứt Hình 1 dưới đây. Crackmeter 4420 triển khai và thu thập độc lập bởi đơn vị khai thác thân đập. Dữ liệu cảm biến được cập nhật đều đặn một lần mỗi giờ và lưu trữ về hệ thống máy chủ tập chung của hệ thống giám sát đập. Dữ liệu đầu vào gồm có các trường thông tin như được trình bày trong BẢNG I. sau đây. BẢNG I. MÔ TẢ CÁC TRƯỜNG DỮ LIỆU Dữ liệu Mô tả Đơn vị D Chiều rộng khe co giãn mm Time Thời gian cập nhât Ngày,Giờ Level water Chiều cao cột nước cm T Nhiệt độ môi trường °C BẢNG II. BẢNG THỐNG KÊ DỮ LIỆU Hình 1. Ma trận tương quan giữa các đặc trưng D mm T (°C) Level water (cm) Ma trận tương quan trên cho thấy có mối liên hệ rõ Count 31320 31320 31320 ràng chặt chẽ giữa chiều rộng khe co giãn (D mm) và Mean 0.52 25.77 203.97 nhiệt độ môi trường (T). Đây là mối liên hệ ngược Std 0.57 2.51 10.33 chiều (-0.95) cho thấy chiều rộng khe giãn nở sẽ nhỏ Max 1.97 28.97 217.15 khi nhiệt độ tăng cao và ngược lại. Bên cạnh đó, mối Min -0.27 19.73 175.81 tương quan thuận giữa mực nước lòng hồ và độ rộng khe co giãn bê tông cũng khá rõ ràng (0.61). Điều này Sau khi loại bỏ những dữ liệu lỗi (dữ liệu thiếu giá trị, thể hiện xu hướng các khe giãn nở sẽ mở rộng khi mực dữ liệu bất thường), nhóm nghiên cứu thu được 31320 nước lòng hồ dâng cao. điểm dữ liệu cho hơn 45 tháng. Bộ dữ liệu sau đó được Bên cạnh đó, như thể hiện trong Hình 2, dữ liệu thu chia làm 02 phần: dữ liệu dùng để huấn luyện mô hình thập được thể hiện tính chu kì (theo mùa) rõ rệt. Theo (01/01/2019 – 31/12/2021) gồm 25018 điểm dữ liệu đó, vào giai đoạn mùa mưa (tháng 5 đến tháng 9), khi chiếm 80% dữ liệu gốc và dữ liệu để kiểm thử nhiệt độ tăng cao, mực nước lòng hồ giảm đáng kể kèm (01/01/2022 – 25/09/2022) gồm 6302 điểm dữ liệu theo các khe giãn nở có xu hướng kéo hẹp lại với biên chiếm 20% dữ liệu gốc. Do đặc thù về dữ liệu có tính độ giao động thấp. Tương tự, chiều hướng ngược lại liền mạch về thời gian, dữ liệu sẽ không được trộn diễn ra với các đặc trưng vào mùa khô (tháng 10 đến ngẫu nhiên khi tách cho huấn luyện và kiểm thử. tháng 4 năm sau), khi nhiệt độ xuống thấp, mực nước Thống kê tổng quan về dữ liệu được thể hiện trong lòng hồ thường được điều tiết ở mức cao dẫn đến biên BẢNG II. Có thể nhận thấy mặc dù biên độ giao động độ của các khe giãn nở lớn và biến thiên nhiều hơn. Từ của khe giãn nở là không lớn. Tuy nhiên, do đây chỉ là các nhận xét trên, dữ liệu gốc được phân loại thành hai một điểm đo trên tổng số 300 điểm đo toàn thân đập, nhóm, nhóm dữ liệu mùa mưa (tháng 5 đến tháng 9) và nhóm dữ liệu mùa khô (tháng 10 đến tháng 4 năm sau). Biểu đồ tần suất theo mùa ở Hình 3 thể hiện rõ sự khác ISBN ............ 978-604-80-8932-0 342
  3. Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) biệt giữa hai mùa này. Theo đó, mùa mưa có mức nhiệt III. CÁC MÔ HÌNH HỌC MÁY độ môi trường phổ biến là khá cao (𝜇 = 27.55°C , 𝜎 = Theo như nghiên cứu trong [6], [7], [11], các mô hình 2.0°C) và mực nước lòng hồ giao động ở mức thấp học máy phổ biến thường được sử dụng trong việc dự ( 𝜇 = 196.73cm , 𝜎 = 9.95cm ). Điều này dẫn đến báo độ rộng khe co giãn có thể kể đến như mạng nơ biến động về độ rộng khe co giãn bê tông là thấp (𝜇 = ron nhân tạo (ANN), Máy vector hỗ trợ (SVR), rừng 0.088mm, 𝜎 = 0.179mm). Ngược lại, vào mùa khô quyết định ngẫu nhiên (RFR), ... Trong nghiên cứu khi mực nước lòng hồ được giữ ở mức cao ( 𝜇 = này, nhóm tác giả cũng hướng đến thử nghiệm các mô 209.4cm, 𝜎 = 6.59cm), nhiệt độ biến thiên ở phạm vi hình học máy trên nhằm xây dựng một mô hình tối ưu rộng (𝜇 = 24.43°C, 𝜎 = 1.96°C) dẫn đến độ rộng khe cho bộ dữ liệu đã có. Với mục tiêu này, việc tìm kiếm co giãn cũng thay đổi ở nhiều ở phạm vi rộng hơn (𝜇 = và chọn lựa các siêu tham số (hyper parameters) cho 0.85mm, 𝜎 = 0.54mm). mô hình là vô cùng quan trọng. Vì thế, trong phần này, bài báo sẽ trình bày một số siêu tham số quan trọng của các mô hình và phương án lựa chọn, thử nghiệm được đề ra bởi nhóm nghiên cứu. A. Artificial Neural Network Mô hình mạng neuron nhân tạo với khả năng lan truyền ngược đã chứng minh hiệu quả của mình cho rất nhiều các bài toán khác nhau. Trong mô hình này, các siêu tham số quan trọng cần được lựa chọn có thể kể đến như: - Số neuron ở lớp ẩn (với chỉ 01 lớp ẩn cho mô hình ANN): việc lựa chọn quá nhiều neuron trong lớp ẩn có thể dẫn đến mô hình bị overfitting. Tuy nhiên, nếu số neuron trong lớp ẩn quá ít, mô hình có thể không đạt được mức độ dự báo chính xác như mong muốn. Vì vậy, số neuron trong lớp ẩn thường được lựa chọn tăng dần. Nghiên cứu trong [12] đưa ra gợi ý lựa chọn số lượng neuron lớp ẩn như trong (6) với 𝑛ℎ𝑖𝑑𝑑𝑒𝑛 là số neuron lớp ẩn, 𝑛 𝑖𝑛 là số neuron lớp đầu vào và 𝑛 𝑜𝑢𝑡 là số neuron lớp đầu ra. Với trường hợp của nghiên cứu trong bài báo này, 𝑛 𝑖𝑛 = 3, 𝑛 𝑜𝑢𝑡 = 1, số neuron lớp ẩn Hình 2. Biểu đồ biến thiên của các trường dữ liệu theo để bắt đầu thử nghiệm sẽ là 𝑛ℎ𝑖𝑑𝑑𝑒𝑛 = 2. Từ đó, nhóm thời gian nghiên cứu đề xuất thử nghiệm số neuron lớp ẩn lần lượt [2,4,8,16,32,128] 2 𝑛ℎ𝑖𝑑𝑑𝑒𝑛 = (𝑛 𝑖𝑛 + 𝑛 𝑜𝑢𝑡 ) (6) 3 - Hàm kích hoạt (activation function): là hàm tính toán trọng số đầu ra cho một neuron. Tuy nhiên, với bài toán hồi quy, hàm kích hoạt từ lớp ẩn ra lớp output sẽ là hàm identity. Do đó, hàm kích hoạt được sử dụng trong bài toán sẽ chỉ áp dụng cho các neuron từ lớp input đến lớp ẩn. Các hàm kích hoạt thường được sử dụng bao gồm: identity, sigmoid, tanh, relu. Do đặc Hình 3. Biểu đồ tần suất theo mùa thù dữ liệu của bài toán là phi tuyến với chỉ 01 lớp ẩn, Do có sự khác biệt rõ rệt giữa hai mùa nói trên, nhóm hàm sigmoid, relu và tanh sẽ được lựa chọn thử nghiên cứu đề xuất thêm đặc trưng về mùa vào các đặc nghiệm. trưng dữ liệu đầu vào. Từ đó, bài toán dự báo sớm độ - Thuật toán tối ưu: các thuật toán tối ưu thường sử rộng khe co giãn bê tông được hình thành như (5): dụng bao gồm lbfgs, stochastic gradient descent (sgd) 𝑓(𝑇, 𝐿, 𝑆) → ́𝐷 (5) hay adam (phiên bản mở rộng của sgd). Do tập dữ liệu Với T là nhiệt độ môi trường, L là chiều cao mực nước trong bài toán là tương đối lớn, thuật toán sgd và adam lòng hồ, S là dữ liệu về mùa (mưa hoặc khô), ́𝐷 là độ sẽ được thử nghiệm. rộng khe co giãn bê tông dự báo từ mô hình học máy - Batch_size: là số lượng đầu dữ liệu được đưa vào 𝑓(𝑇, 𝐿, 𝑆). Do mục tiêu dự báo là giá trị liên tục trên mạng neuron trong một chu kì nhằm tính toán và tối tập số thực R, bài toán đặt ra là bài toán hồi quy. ưu hóa các trọng số trong mô hình. Việc huấn luyện theo batch cho phép đẩy nhanh quá trình huấn luyện và giảm thiểu nguy cơ overfitting của mô hình. Với ISBN ............ 978-604-80-8932-0 343
  4. Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) 25018 dữ liệu huấn luyện, nhóm nghiên cứu đề xuất criterion squared_error, absolute_error, thử nghiệm với các batch size [125, 250, 500]. friedman_mse, poisson - Learning rate: tốc độ học đóng vai trò quan trọng min_samples_split [2, 8, 32, 128] trong việc giúp mô hình học máy tìm được cực trị toàn cục. Việc lựa chọn tốc độ học quá thấp có thể dẫn đến C. Mô hình Support Vector Machine thời gian huấn luyện dài và có nguy cơ dừng ở các Mô hình Support Vector Machine (SVM) là một trong điểm cực trị địa phương. Tuy nhiên, việc lựa chọn tốc những mô hình dành được nhiều thành công trong việc độ học cao sẽ dẫn đến mô hình khó hội tụ hoặc không phân loại các bài toán phi tuyến. Không những thế, tìm được cực trị. Một phương án khắc phục tình trạng nguyên lý của SVM có thể được dùng để giải quyết này là sử dụng adaptive learning rate giúp việc lựa bài toán hồi quy với việc sử dụng các lõi tuyến tính và chọn learning rate trở nên linh hoạt hơn [13]. phi tuyến. Các siêu tham số cho thuật toán Support Từ các đánh giá trên, mô hình ANN sẽ được tinh chỉnh Vector Regression (SVR) thường bao gồm: với các tham số như Bảng III. - kernel: lõi được sử dụng cho việc tách các dữ liệu. Do đặc thù của bài toán phi tuyến, trong nghiên cứu BẢNG III. LỰA CHỌN SIÊU THAM SỐ CHO ANN này, nhóm tác giả đề xuất sử dụng các lõi phi tuyến Tham số Lựa chọn như RBF, Sigmoid, Poly. - gamma: trọng số cho các lõi RBF, Poly và Sigmoid. Số neuron lớp ẩn [2,4,8,16,32,128] Tham số này thường được sử dụng với các giá trị: Hàm kích hoạt Tanh, sigmoid, Relu Auto (tỉ lệ nghịch đảo với số đặc trưng), Scale (tỉ lệ Batch size [125,250,500] theo số đặc trưng và mức độ biến thiên của các đặc Learning rate Adaptive, Constant trưng này). Solver lbfgs, sgd, adam - Tollerance: dung sai cho phép áp dụng cho điều kiện B. Random Forest Regressor dừng. Thông thường, dung sai cho phép thường áp dụng khoảng 1e-3. Với đặc điểm sự biến thiên của khe Random forest là một mô hình học máy dựa vào việc giãn nở tương đối nhỏ, nhóm nghiên cứu đề xuất thử xây dựng nhiều các cây quyết định và đưa ra dự báo nghiệm với các dung sai [1e-4, 1e-3] dựa trên tổng hợp các kết quả từ các cây quyết định - C: tham số chính quy hóa giúp giảm overfitting. này. Một đặc trưng của Random Forest là việc xây Nhóm nghiên cứu đề xuất thử nghiệm với các giá trị dựng các cây quyết định con chỉ dựa trên một phần dữ [0.5, 1, 4, 16, 32] và có thể tinh chỉnh thêm khi cần liệu của toàn tập dữ liệu. Bên cạnh đó, một số đặc thiết. trưng sẽ bị loại bỏ ngẫu nhiên trên các cây quyết định Từ các nhận xét trên, bảng tinh chỉnh các siêu tham số con. Vì thế, kết quả dự báo của các cây quyết định con cho mô hình SVR được thể hiện dưới đây. sẽ có sự tách biệt nhất định và giúp giảm khả năng bị overfitting cũng như giúp mô hình vượt qua các dữ BẢNG V. LỰA CHỌN SIÊU THAM SỐ CHO SVR liệu nhiễu. Các siêu tham số của RFR có thể kể đến như: Tham số Lựa chọn - n_estimators: số lượng cây quyết định con. Giúp tách Kernel RBF, Sigmoid, Poly bộ dữ liệu ra thành các phần nhỏ và xây dựng các cây gamma Auto, Sacle quyết định con trên đó. Số cây quyết định thường được Tollerance [1e-4,1e-3] lựa chọn trong khoảng 50 – 100. Với bộ dữ liệu trong C [0.5, 1, 4, 16, 32] đề tài, nhóm nghiên cứu đề xuất thử nghiệm với [50, 100, 150,200] cây quyết định. D. Thuật toán và tiêu chí lựa chọn siêu tham số - criterion: hàm dùng để đưa ra quyết định rẽ nhánh Với bảng các lựa chọn siêu tham số cho 03 mô hình cho cây quyết định. Các hàm thường sử dụng bao như trên, phương pháp lựa chọn tham số grid-search gồm:squared_error, absolute_error, friedman_mse và [14] được sử dụng nhằm tìm kiếm mô hình tối ưu cho poisson. từng thuật toán. Bên cạnh đó, mô hình tối ưu được - min_samples_split: số lượng dữ liệu tối thiểu để tách định nghĩa là mô hình cho phép dự báo độ rộng khe co thêm một nhánh nữa ở các cây quyết định con. Số giãn bê tông với sai số trung bình bình phương lượng này thường được thử nghiệm với tập [2, 8, 32, (RMSE) tối thiểu. Ngoài ra, mô hình cũng được lựa 128] hoặc với tỉ lệ phần trăm trên tổng số dữ liệu thử chọn với R2 Score để đánh giá khả năng dự báo tổng nghiệm. quát của mô hình. Từ các đánh giá trên, mô hình RFR sẽ được tinh chỉnh với các tham số như Bảng IV. IV. KẾT QUẢ & THẢO LUẬN BẢNG IV. LỰA CHỌN SIÊU THAM SỐ CHO RFR A. Cấu hình mô hình học máy tối ưu Sau khi sử dụng thuật toán grid-search trên tập các Tham số Lựa chọn siêu tham số và và áp dụng cross-validation với bộ dữ n_estimators [50,100,150,200] ISBN ............ 978-604-80-8932-0 344
  5. Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) liệu huấn luyện, các tham số tối ưu của các mô hình biến động lớn, hầu hết các mô hình đều đạt sai số trung thu được như dưới đây. Với ANN, các siêu tham số tối ưu được thể hiện ở Bảng VI. Với cấu trúc này, ANN đạt RMSE khoảng 0.062mm và R2 Score là 0.937 trên tập huấn luyện sau khi được đánh giá chéo cross-validation với k = 5. BẢNG VI. SIÊU THAM SỐ CHO ANN Tham số Lựa chọn Số neuron lớp ẩn 128 Hàm kích hoạt Relu Batch size 125 Learning rate Constant Solver adam Với mô hình RFR, cấu hình tối ưu trong Bảng VII cho phép thuật toán dự báo độ rộng khe co giãn bê tôngvới Hình 4. Biểu đồ sai số tích lũy cho 3 mô hình RMSE là 0.079 và R2 score là 0.93 trên tập huấn bình bình phương khoảng 0.1mm. Sai số này cải thiện luyện sau khi được đánh giá chéo cross-validation với rõ rệt vào các tháng sau đó khi biên độ giao động của k = 5. khe giãn nở là không lớn. Biểu đồ sai số tích lũy cho các mô hình ở Hình 4 sẽ làm rõ khả năng dự báo tổng BẢNG VII. SIÊU THAM SỐ CHO RFR quát của từng mô hình. Ở đồ thị này, trục hoành thể hiện sai số của các mô hình khi được sử dụng để dự Tham số Lựa chọn báo biên độ khe giãn nở theo đơn vị milimet. Tương n_estimators 50 ứng với từng sai số, trục tung của đồ thị thể hiện tỷ lệ criterion absolute_error phần trăm tích lũy của các lỗi này trên tổng số lỗi của min_samples_split 2 tất cả các phép đo. Mô hình ANN đạt sai số dự báo biên độ khe giãn nở dưới 0.1mm trong 94% của tổng số Với mô hình SVR, cấu hình tối ưu cho phép thuật toán 6302 điểm dữ liệu kiểm thử. Tương ứng, mô hình RF dự báo độ rộng khe co giãn bê tôngvới RMSE là 0.081 có sai số dưới 0.1mm trong 84% dữ liệu kiểm thử và và R2 score là 0.97 trên tập huấn luyện sau khi được SVR đạt sai số dưới 0.1mm với 88% dữ liệu kiểm thử. đánh giá chéo cross-validation với k = 5. cấu hình tối Từ các kết quả trên, mô hình ANN cho ra kết quả chính ưu cho SVR được thể hiện ở Bảng VIII. xác nhất với khả năng dự báo trên toàn tập kiểm thử đạt sai số tối đa dưới 0.1mm với 94% độ tin cậy. BẢNG VIII. SIÊU THAM SỐ CHO SVR B. Thảo luận Tham số Lựa chọn Kernel RBF Với mô hình tối ưu thu được của ANN, nhóm nghiên gamma Sacle cứu thử nghiệm với việc chỉ sử dụng các đặc trưng đầu Tollerance 1e-3 vào nhiệt độ T, độ cao mực nước L và không bao gồm dữ liệu về mùa S. Kết quả trên cùng tập dữ liệu, cùng C 0.5 cấu hình ANN cho thấy như bảng X dưới đây. Sau đó, các mô hình tối ưu trên được đưa vào kiểm thử với tập dữ liệu kiểm thử từ 01/01/2022 – 25/09/2022. BẢNG X. BẢNG SAI SỐ TRUNG BÌNH BÌNH PHƯƠNG CHO TỪNG MỐC Các mô hình được lần lượt cho dự đoán dữ với dữ liệu THỜI GIAN về chiều rộng khe co giãn sử dụng thông tin nhiệt độ, RMSE độ cao cột nước và mùa trong vòng 03 tháng, 06 tháng 01/01 – 31/03 01/01 – 30/06 01/01 – 25/09 hoặc 09 tháng liên tiếp kể từ 01/01/2022. Với các mốc ANN 0.089 0.07 0.059 Có đặc trưng mùa kiểm thử này, kết quả thu được của các mô hình được ANN 0.18 0.1 0.075 thể hiện ở Bảng IX. Không có đặc trưng mùa BẢNG IX. BẢNG SAI SỐ TRUNG BÌNH BÌNH PHƯƠNG CHO TỪNG Kết quả cho thấy, với đặc trưng mùa, mô hình ANN MỐC THỜI GIAN cho phép dự báo với độ chính xác vượt trội so với chỉ RMSE sử dụng các đặc trưng nhiệt độ và mực nước. Sai số 01/01 – 31/03 01/01 – 30/06 01/01 – 25/09 giữa hai mô hình là đặc biệt lớn khi sử dụng mô hình ANN RFR 0.089 0.105 0.07 0.091 0.059 0.08 dự báo vào mùa khô (01/01 – 31/03) với mô hình SVR 0.1 0.091 0.078 không có dữ liệu theo mùa đạt RMSE khoảng 0.18 và Kết quả này cho thấy trong các tháng đầu tiên (tháng mô hình có dữ liệu theo mùa đạt RMSE 0.089. Một 01/2022 – 03/2022), khi độ rộng khe co giãn bê tông trong các nguyên nhân có thể kể đến do khe co giãn bê tông có biên độ thay đổi lớn vào mùa khô. ISBN ............ 978-604-80-8932-0 345
  6. Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) V. KẾT LUẬN [4] J. Rico, J. Barateiro, J. Mata, A. Antunes, and Trong bài báo này, chúng tôi đã nghiên cứu và phân E. Cardoso, “Applying Advanced Data tích dữ liệu về biến động của độ rộng khe co giãn bê Analytics and Machine Learning to Enhance tôngcủa các tấm bê tông thân đập nước. Dựa trên kết the Safety Control of Dams,” 2019, pp. 315– quả phân tích thống kê và các nhiên cứu tương quan, 350. doi: 10.1007/978-3-030-15628-2_10. chúng tôi đề xuất các đặc trưng giúp dự báo sớm biên [5] B. T. Kieu Trinh, X. Yangxuan, C. Van Doan, độ khe giãn nở. Các đặc trưng đề xuất bao gồm: nhiệt D. Xuan Khanh, T. The Viet, and M. Dinh độ môi trường tại điểm giãn nở, độ cao mực nước lòng Sinh, “Application of Statistic Model and hồ và dữ liệu về mùa (khô hoặc mưa). Từ phân tích Backpropagation Neural Network to này, nhóm nghiên cứu đã thử nghiệm xây dựng các mô Analyzing and Forecasting Hydropower Dam hình học máy ANN, SVR và RFR với bộ dữ liệu tại Displacement,” VNU Journal of Science: một khe giãn nở thân đập nước ở Sơn La thu thập từ Earth and Environmental Sciences, vol. 37, 01/01/2019 – 25/09/2022. Kết quả thử nghiệm cho thấy no. 1, Mar. 2021, doi: 10.25073/2588- mô hình ANN cho kết quả dự báo tốt nhất với sai số 1094/vnuees.4529. dưới 0.1mm ở mức tin cậy 94%. Đây là kết quả rất khả [6] C. Lin, S. Chen, M. A. Hariri-Ardebili, and T. quan và cho thấy mô hình có thể đóng góp lớn vào bảo Li, “An Explainable Probabilistic Model for vệ an ninh, an toàn đập nước. Health Monitoring of Concrete Dam via Optimized Sparse Bayesian Learning and LỜI CẢM ƠN Sensitivity Analysis,” Struct Control Health Nghiên cứu được thực hiện theo đề tài cấp trường mã Monit, vol. 2023, 2023, doi: số 16-2023-RD/HĐ-ĐHCN với sự tài trợ của Trường 10.1155/2023/2979822. Đại học Công nghiệp Hà Nội. Nhóm nghiên cứu xin [7] B. Li, J. Yang, and D. Hu, “Dam monitoring trân trọng cảm ơn. data analysis methods: A literature review,” Structural Control and Health Monitoring, PHỤ LỤC vol. 27, no. 3. John Wiley and Sons Ltd, Mar. Hình ảnh cảm biến đo vết nứt đặt tại điểm đo trong 01, 2020. doi: 10.1002/stc.2501. [8] B. Chen, T. Hu, Z. Huang, and C. Fang, “A nghiên cứu được thể hiện ở Hình 5. spatio-temporal clustering and diagnosis method for concrete arch dams using deformation monitoring data,” Struct Health Monit, vol. 18, no. 5–6, pp. 1355–1371, Nov. 2019, doi: 10.1177/1475921718797949. [9] T. Bùi and A. Kiệt, “Phân tích nhiệt trong đập bê tông trọng lực.”, Tạp chí Khoa Học Trường Đại học Mở Tp.HCM, số 7, 2012 [10] N. M. Việt, “Giải pháp khống chế ứng suất nhiệt của bê tông đầm lăn-trường hợp áp dụng cho đập thủy điện Trung Sơn.”, Tạp chí Khoa Hình 5. Cài đặt cảm biến dây rung đo vết nứt thân đập Học Công Nghệ, 2016 [11] D. Chen, B. Huang, and F. Kang, “A Review of Detection Technologies for Underwater TÀI LIỆU THAM KHẢO Cracks on Concrete Dam Surfaces,” Applied [1] L D. Tinh, “Research the solutions to Increase Sciences (Switzerland), vol. 13, no. 6. MDPI, the Effect of Deformation Monitoring in Mar. 01, 2023. doi: 10.3390/app13063564. Vietnam,” Hanoi University of Mining and [12] J. Heaton, Introduction to Neural Networks for Geology, 2012. Java, 2nd Edition, 2nd ed. Heaton Research, [2] T. Khanh and L.D. Tinh, “Applying a method Inc., 2008. of correlation analysis to estimate the [13] M. D. Zeiler, “ADADELTA: An Adaptive movement of construction,” Journal of Mining Learning Rate Method,” Dec. 2012, [Online]. and Geology, vol. 4, no. 30, 2010. Available: http://arxiv.org/abs/1212.5701 [3] A. Gaagai et al., “Modeling and Risk Analysis [14] S. M. LaValle, M. S. Branicky, and S. R. of Dam-Break Flooding in a Semi-Arid Lindemann, “On the relationship between Montane Watershed: A Case Study of the classical grid search and probabilistic Yabous Dam, Northeastern Algeria,” Water roadmaps,” Int J Rob Res, vol. 23, no. 7–8, pp. (Switzerland), vol. 14, no. 5, Mar. 2022, doi: 673–692, 2004. 10.3390/w14050767. ISBN ............ 978-604-80-8932-0 346
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
7=>1