1
MỞ ĐẦU
1. Giới thiệu chung
Sạt lở đất là mt trong nhng loại hnh thiên tai nguy him, phân b
trên c 5 châu lc, gây nhiều thiệt hại nghiêm trọng. Ở Việt Nam, hiện
tượng sạt lở đất chủ yếu tập trung ở các tỉnh miền núi phía Bắc và các
tỉnh duyên hi miền Trung – Tây Nguyên. Sạt lở đất xy ra ở nhng khu
vực này do nhiều nguyên nhân, trong đó mưa được xem là yếu t kích
thích. Dưới tác đng của biến đổi khí hậu, s lượng đợt mưa lớn, mưa
cực đoan, dị thường được dự đoán sẽ tăng lên v trở thành yếu t chính
gây ra sạt lở đất ở nhiều khu vực.
Trong nghiên cứu về sạt lở đất, bn đồ phân vùng nguy cơ sạt lở đất
là công c hu hiệu đ phòng chng loại hình thiên tai này. Ngày nay, sự
ra đời của các mô hình thng kê hiện đại như học máy giúp nâng cao đ
chính xác của mô hình dự đoán nguy cơ sạt lở đất. Do đó, xây dựng mô
hình dự đoán nguy cơ sạt lở đất sử dng phương pháp học máy đang trở
thnh xu hướng chính trong các nghiên cứu hiện nay. Tuy nhiên, đi với
khu vực nghiên cứu mới th việc xác định mô hnh học máy phù hợp trong
dự đoán nguy cơ sạt lở đất l rất quan trọng.
Trong nghiên cứu xây dựng mô hình dự đoán nguy cơ sạt lở đất bng
phương pháp học máy, d liệu là mt yếu t hết sức quan trọng. Ngy
nay, sự phát trin của công nghệ viễn thám cùng với các kỹ thuật phân
tích hiện đại cho phép khôi phc và làm giàu d liệu thng kê. Ngoài ra,
việc chọn lọc d liệu hợp lý cho mô hình học máy là rất quan trọng, đặc
biệt là các d liệu có giá trị thay đổi theo thời gian như mưa v chỉ s
thực vật (NDVI). Đi với d liệu mưa, rất nhiều nghiên cứu trước đây lại
sử dng d liệu mưa trung bnh nhiều năm (TBNN) trong đánh giá nguy
cơ sạt lở đất. Cách tiếp cận này là không hợp lý đi với mt s khu vực
mà ở đó mưa lớn kéo dài trong nhiều ngày mới là nguyên nhân chính dẫn