intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng máy học xây dựng mô hình phân loại đất dựa trên kết quả thí nghiệm cone penetration test (CPT)

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

13
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nghiên cứu này nhằm mục đích xây dựng một mô hình máy học để xác định các loại đất dựa vào các dữ liệu đầu vào của CPT có độ chính xác cao và khả năng thích ứng về việc gia tăng số lượng theo thời gian. Giống kết quả ở bảng 6, các nhóm sẽ có các khoảng giá trị để có thể xác định cách ứng xử của đất từ các dữ liệu từ phương pháp CPT.

Chủ đề:
Lưu

Nội dung Text: Ứng dụng máy học xây dựng mô hình phân loại đất dựa trên kết quả thí nghiệm cone penetration test (CPT)

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 ỨNG DỤNG MÁY HỌC XÂY DỰNG MÔ HÌNH PHÂN LOẠI ĐẤT DỰA TRÊN KẾT QUẢ THÍ NGHIỆM CONE PENETRATION TEST(CPT) Nguyễn Khắc Hiếu1, Nguyễn Trần Gia Khiêm1, Khánh Phạm1, Nguyễn Anh Dũng2 1 Trường Đại học Quốc tế - Đại học Quốc gia TP. HCM, email: nguyenkhachieu528@gmail.com 2 Trường Đại học Thủy lợi 1. GIỚI THIỆU CHUNG Đồ thị của Robertson (2016) để xác định Hiện nay, phương pháp phân tích thành cách ứng xử của đất được thể hiện trong hình 1 phần hạt (Particle size distribution - PSD) và bảng 1. Ngoài ra còn có loại 0, là tập hợp được ứng dụng phổ biến trong phân loại đất. của các dữ liệu nhiễu Phương pháp này gồm có phân tích ray sàn Bảng 1. Các loại ứng xử của đất (sieve analysis) và hydrometers được sử dụng cho từng nhóm kích thước hạt tương ứng, kết Types Soils Behaviour quả phân tích thành phần hạt được tham CCS(1) Clay-like-Contractive-Sensitive chiếu theo các hệ thống phân loại đất phổ biến khác nhau trên thế giới (e.g., USCS và CC(2) Clay-like-Contractive AASHTO) nhằm xác định nhóm đất phù hợp. CD(3) Clay-like-Dilative Tuy nhiên phương pháp truyền thống không thể phân loại được cách ứng xử của đất trong TC(4) Transitional-Contractive tự nhiên. Giải pháp tiềm năng là phân loại TD(5) Transitional-Dilative dựa trên kết quả Cone Penetration Test (CPT) đang trở nên phổ biến nhờ vào những ưu SC(6) Sand-like-Contractive điểm như giữ nguyên tình trạng tự nhiên của SD(7) Sand-like-Dilative đất, chi phí hiệu quả, quá trình thực hiện thí nghiệm nhanh chóng và liên tục. Các hệ Do đó, việc xây dựng một phương pháp thống phân loại đất căn cứ theo kết quả của phân loại đất dựa trên kết quả CPT có độ CPT được đề xuất và cập nhập theo sự gia chính xác cao, có khả năng tự thích ứng với tăng số lượng dữ liệu quan sát. sự gia tăng về số lượng thành phần đất có vai trò rất lớn đến sự phổ biến của phương pháp phân loại này trong lĩnh vực địa kỹ thuật. Nghiên cứu này tập trung khai thác thế mạnh trong máy học và nhận diện dữ liệu của phương pháp máy học nhằm xây dựng một mô hình phân loại đất dựa trên kết quả CPT với độ tin cậy cao. Xa hơn nữa, phương pháp này cho phép xây dựng bảng đồ địa chất 3D giúp nâng cao hiệu quả công tác quản lý và Hình 1. Modified SBTn (Robertson,2016) qui hoạch hạ tầng. 206
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 2. PHƯƠNG PHÁP NGHIÊN CỨU - Bước 3: Để đánh giá sự đóng góp ảnh 2.1. Bộ dữ liệu hưởng đồng đều của các tính chất đầu vào. Sử dụng Min-Max Scaler để đánh giá và Bộ dữ liệu được thu thập bởi Graz chuẩn hóa dữ liệu, giá trị của Min-Max Scaler University of Technology kết hợp với trong khoảng 0 và 1. Premstaller Geotechnik GmbH (Rauter et al. 2021). Bộ dữ liệu được thu thập tại các khu Bảng 4. Đặc điểm của các features vực của nước Áo (Austria) và phía Nam nước Feature Unit Description Đức bao gồm 35 khu vực. Bộ dữ liệu thô sẽ Depth m Depth of data points gồm có 1339 CPT test với 2516978 hàng và 28 cột. Giá trị của các biến từ -100 tới 10000 qc MPa Cone penetration resistance nếu hơn sẽ để trống. fs kPa Friction sleeve Bảng 2. Các loại CPT test Rf % Friction ratio Test type Total number of test  v kPa Effective stresse at level depth CPT 931 u0 kPa Equilibrium pore pressure CPTu 312 v kPa Total stress at level depth SCPT 46 2.2. Thuật toán SCPTu 50 Gaussian-Mixture clustering: là một mô Các bước xử lý bộ dữ liệu thô: hình xác suất giả định rằng tất cả các điểm dữ - Bước 1: Loại bỏ các dữ liệu nhiễu (noise liệu được tạo từ sự kết hợp của các Gaussian data or NAN) và các tính chất không cần distribution với các tham số chưa biết để thiết cho việc xây dựng mô hình. Bộ dữ liệu sẽ gồm 10 cột và 2514262 hàng, các mô tả phân ra các loại ứng xử của đất. Gaussian- thống kê được thể hiện ở bảng 3 Mixture sử dung thuật toán Expectation- Maximization (EM) để có thể xác định loại Bảng 3. Mô tả thống kê covariation phù hợp với các mô hình, từ đó của các thông số dữ liệu có thể sử dụng bayesian information criterion Feature Mean Min Max (BIC) để lựa chọn số lượng loại tối ưu nhất Depth 12.4 0.01 103 cho mô hình. Bayesian Information Criterion (BIC), hoặc qc 5.57 -8.61 122.9 Schwarz information criterion (SIC) là một fs 64.56 -100 47436 tiêu chí cho việc lựa chọn mô hình tối ưu, mô Rf 2.7 -100 30000 hình có BIC thấp hơn thường sẽ tối ưu hơn.  v 235.7 0.09 946.57 Calinski-Harabasz (CH) Index: chỉ số là tỉ lệ của tổng sự phân tán của tâm nhóm so với tất u0 114.9 0 1010.43 cả các nhóm khác. Chỉ số càng cao thể hiện v 120.8 0.19 1957 nhóm dày đặc và sự tách biệt tốt. Davies- - Bước 2: Sử dụng train_test_split của thư Bouldin (DB) Index: Chỉ số thể hiện trung viện scikit-learn để chia bộ dữ liệu thành hai bình 'độ tương đồng' của các nhóm, độ tương bộ dữ liệu phụ, một bộ dùng để huấn luyện tự là sự so sánh khoảng cách giữa các nhóm (training) và thẩm định (validation), một bộ và kích thước của chính nhóm đó. Giá trị gần dùng để kiểm tra (testing) mô hình. Tỉ lệ của về 0 thì thể hiện sự phân vùng tốt. Từ các chỉ bộ dữ liệu huấn luyện và thẩm định là 80% số BIC, CH, DB để tìm ra được số lượng cụm và bộ kiểm tra là 20%. tối ưu cho thuật toán phân cụm (clustering). 207
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 3. KẾT QUẢ NGHIÊN CỨU Bảng 6. Các khoảng dữ liệu của nhóm 0 Feature Mean Min Max Depth 1.35 0.01 22.05 qc 0.01 -0.04 0.21 fs 19.35 -70.8 400.96 Rf 504.3 -100 30000  v 14.94 0.09 273.27 u0 10.71 0 145.68 v 25.66 0.19 418.95 Hình 2. Quan hệ giữa số lượng nhóm dữ liệu và các thuật toán đánh giá Từ số lượng cụm tối ưu bằng 8, bảng 5 cho thấy số lượng dữ liệu tập trung vào cụm 2 là Chỉ số BIC và Davies-Bouldin (DB), thể nhiều nhất với 1179961 (data point). Ngoài ra hiện hình số 2, cho thấy việc lược chọn nhóm số lượng nhóm đất được phân loại dựa theo cluster bằng 8 phù hợp cho việc phân vùng phương pháp đồ thị của Robertson cũng là 8 dữ liệu. Trong khi đó, giá trị của Calinski- loại, tương đối giống với số lượng cụm tối ưu Harabasz của số lượng nhóm bằng 5 và số dành cho mô hình máy học. lượng nhóm bằng 8 lại sấp sỉ bằng nhau. Do đó số lượng nhóm tối ưu cho mô hình máy 4. KẾT LUẬN học sẽ được chọn là 8. Số lượng điểm dữ liệu ở mỗi nhóm được thể hiện ở bảng 5. Từ số Nghiên cứu này nhằm mục đích xây dựng lượng nhóm tối ưu ta có thể phân ra các một mô hình máy học để xác định các loại nhóm dữ liệu thể các cách ứng xử của đất đất dựa vào các dữ liệu đầu vào của CPT có dựa vào các khoảng giá trị của các tính chất độ chính xác cao và khả năng thích ứng về đầu vào của đất như bảng 6. việc gia tăng số lượng theo thời gian. Giống kết quả ở bảng 6, các nhóm sẽ có các khoảng Bảng 5a. Số lượng dữ liệu ở các nhóm giá trị để có thể xác định cách ứng xử của đất Cluster 0 1 từ các dữ liệu từ phương pháp CPT. Data 1578 259927 5. TÀI LIỆU THAM KHẢO Bảng 5b. Số lượng dữ liệu ở các nhóm [1] Robertson PK,2016.Cone penetration test (CPT)-based soil behaviour type (SBT) Cluster 2 3 classification system - An update.Can Data 1179961 209826 Geotech J,53:1910-27. [2] Rauter, S.; Tschuchnigg, F,2021. CPT Data Bảng 5c. Số lượng dữ liệu ở các nhóm Interpretation Employing Different Machine Cluster 4 5 Learning Techniques. Geosciences, 11, 265. Data 11417 80390 Bảng 5d. Số lượng dữ liệu ở các nhóm Cluster 6 7 Data 234798 33512 208
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0