
KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 88 (3/2024)
19
BÀI BÁO KHOA HỌC
NGHIÊN CỨU LỰA CHỌN MÔ HÌNH HỌC MÁY PHÙ HỢP
TRONG XÂY DỰNG BẢN ĐỒ PHÂN VÙNG NGUY CƠ SẠT LỞ ĐẤT
CHO KHU VỰC VÙNG NÚI TỈNH QUẢNG NGÃI
Đoàn Viết Long
1
, Nguyễn Chí Công
1
, Nguyễn Tiến Cường
2
Tóm tắt: Học máy là một phương pháp hiện đại, được ứng dụng rộng rãi trong dự đoán nguy cơ sạt lở
đất với rất nhiều loại mô hình khác nhau. Tuy nhiên, các nghiên cứu trước đây cho thấy rằng không có
một mô hình học máy nào là tốt nhất cho các khu vực. Đối với khu vực vùng núi tỉnh Quảng Ngãi
thường xuyên xảy ra sạt lở đất, nghiên cứu này đã sử dụng 5 thuật toán học máy: Logistic Regression,
Support Vector Machine, Decision Tree, Random Forest và Extreme Gradient Boosting (XGBoost) để
xây dựng mô hình dự đoán. Kết quả kiểm định và so sánh các mô hình thông qua các chỉ số thống kê và
phương pháp ROC cho thấy mô hình XGBoost có hiệu quả dự đoán tốt nhất (ACC= 0.813, kappa =
0.625, AUC = 0.892). Mô hình này được lựa chọn để xây dựng để tính toán chỉ số nguy cơ và xây dựng
bản đồ phân vùng nguy cơ sạt lở đất. Kết quả đánh giá mật độ sạt lở đất và kiểm chứng thực tế cho thấy
khả năng dự đoán rất tốt của bản đồ này.
Từ khóa: Học máy, Logictic Regression, SVM, Random Forest, XGBoost, ROC.
1. GIỚI THIỆU CHUNG
*
Sạt lở đất (SLĐ) là một hiện tượng rất phức tạp
do sự tương tác của nhiều yếu tố tự nhiên (địa
chất, địa mạo, khí tượng, thủy văn...) và yếu tố
con người (Varnes, 1984). SLĐ là một trong
những loại hình thiên tai nguy hiểm nhất, không
chỉ ở mỗi nước mà trên toàn thế giới
(Reichenbach, et al 2018). Ở Việt Nam, SLĐ xảy
ra thường xuyên ở các tỉnh miền núi phía Bắc và
miền Trung – Tây Nguyên (Long, nnk 2020a).
Hiện tượng này thường xảy ra bất ngờ, nhanh,
mạnh dẫn đến khó cảnh báo và dự báo, để lại hậu
quả kinh tế xã hội lớn, lâu dài và khó khắc phục.
Theo thống kê từ Tổng cục phòng chống thiên tai
(2020), thiên tai lũ quét và SLĐ trong giai đoạn từ
2000 đến 2020 đã làm 1,117 người chết và mất
tích, 671 người bị thương, 12,038 nhà bị sập đổ.
Trong nghiên cứu về SLĐ, bản đồ phân vùng
nguy cơ SLĐ là công cụ hữu hiệu để phòng chống
loại hình thiên tai đặc biệt nguy hiểm này. Đến
nay, rất nhiều nghiên cứu liên quan đến xây dựng
1
Khoa Xây dựng Công trình thủy, Trường Đại học Bách
khoa, Đại học Đà Nẵng
2
Khoa Kỹ thuật Ô tô và Năng lượng, Trường Đại học
Phenikaa
loại bản đồ này đã được công bố. Các nghiên cứu
gần đây tập trung chủ yếu vào phát triển các mô
hình nhằm tăng độ chính xác trong dự đoán
(Reichenbach, et al 2018). Ngày nay, với sự phát
triển của công nghệ viễn thám, kỹ thuật GIS cùng
với sự ra đời của các mô hình thống kê hiện đại
như học máy, độ chính xác của mô hình dự đoán
nguy cơ SLĐ ngày càng được nâng cao. Do đó,
xây dựng mô hình dự đoán nguy cơ SLĐ sử dụng
phương pháp học máy đang trở thành xu hướng
chính trong các nghiên cứu hiện nay (Liu, et al
2023). Nghiên cứu của Reichenbach et al (2018)
đã chỉ ra rằng phương pháp học máy có hiệu quả
cao và dần thay thế các phương pháp thống kê
truyền thống trong nghiên cứu lập bản đồ phân
vùng nguy cơ SLĐ. Ngoài ra, nghiên cứu của Liu
et al (2023) cũng cho thấy số lượng các công bố
về xây dựng bản đồ phân vùng nguy cơ SLĐ sử
dụng phương pháp học máy có sự tăng trưởng
vượt bậc trong giai đoạn từ năm 2015 đến 2021.
Bên cạnh đó, các nghiên cứu này cũng đã chỉ ra
rằng không có một mô hình dự đoán nguy cơ SLĐ
nào là tốt nhất cho tất cả các khu vực.
Khu vực vùng núi tỉnh Quảng Ngãi là địa
phương thường xuyên chịu ảnh hưởng của thiên