
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu nâng cao độ chính xác trong xây dựng bản đồ phân vùng nguy cơ sạt lở đất cho khu vực miền núi tỉnh Quảng Ngãi
lượt xem 1
download

Tóm tắt Luận án Tiến sĩ Kỹ thuật "Nghiên cứu nâng cao độ chính xác trong xây dựng bản đồ phân vùng nguy cơ sạt lở đất cho khu vực miền núi tỉnh Quảng Ngãi" được nghiên cứu với mục tiêu: Xây dựng được bộ dữ liệu đầu vào cho mô hình học máy dự đoán nguy cơ sạt lở đất; Xác định được mô hình dự đoán nguy cơ sạt lở đất phù hợp, có độ chính xác cao cho một khu vực nghiên cứu cụ thể; Xây dựng được bản đồ phân vùng nguy cơ sạt lở đất theo tần suất mưa.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu nâng cao độ chính xác trong xây dựng bản đồ phân vùng nguy cơ sạt lở đất cho khu vực miền núi tỉnh Quảng Ngãi
- i ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐOÀN VIẾT LONG NGHIÊN CỨU NÂNG CAO ĐỘ CHÍNH XÁC TRONG XÂY DỰNG BẢN ĐỒ PHÂN VÙNG NGUY CƠ SẠT LỞ ĐẤT CHO KHU VỰC MIỀN NÚI TỈNH QUẢNG NGÃI Ngành: Kỹ thuật xây dựng công trình thủy Mã số: 9580202 TÓM TẮT LUẬN ÁN TIẾN SỸ Đà Nẵng - Năm 2024
- 1 MỞ ĐẦU 1. Giới thiệu chung Sạt lở đất là một trong những loại hình thiên tai nguy hiểm, phân bố trên cả 5 châu lục, gây nhiều thiệt hại nghiêm trọng. Ở Việt Nam, hiện tượng sạt lở đất chủ yếu tập trung ở các tỉnh miền núi phía Bắc và các tỉnh duyên hải miền Trung – Tây Nguyên. Sạt lở đất xảy ra ở những khu vực này do nhiều nguyên nhân, trong đó mưa được xem là yếu tố kích thích. Dưới tác động của biến đổi khí hậu, số lượng đợt mưa lớn, mưa cực đoan, dị thường được dự đoán sẽ tăng lên và trở thành yếu tố chính gây ra sạt lở đất ở nhiều khu vực. Trong nghiên cứu về sạt lở đất, bản đồ phân vùng nguy cơ sạt lở đất là công cụ hữu hiệu để phòng chống loại hình thiên tai này. Ngày nay, sự ra đời của các mô hình thống kê hiện đại như học máy giúp nâng cao độ chính xác của mô hình dự đoán nguy cơ sạt lở đất. Do đó, xây dựng mô hình dự đoán nguy cơ sạt lở đất sử dụng phương pháp học máy đang trở thành xu hướng chính trong các nghiên cứu hiện nay. Tuy nhiên, đối với khu vực nghiên cứu mới thì việc xác định mô hình học máy phù hợp trong dự đoán nguy cơ sạt lở đất là rất quan trọng. Trong nghiên cứu xây dựng mô hình dự đoán nguy cơ sạt lở đất bằng phương pháp học máy, dữ liệu là một yếu tố hết sức quan trọng. Ngày nay, sự phát triển của công nghệ viễn thám cùng với các kỹ thuật phân tích hiện đại cho phép khôi phục và làm giàu dữ liệu thống kê. Ngoài ra, việc chọn lọc dữ liệu hợp lý cho mô hình học máy là rất quan trọng, đặc biệt là các dữ liệu có giá trị thay đổi theo thời gian như mưa và chỉ số thực vật (NDVI). Đối với dữ liệu mưa, rất nhiều nghiên cứu trước đây lại sử dụng dữ liệu mưa trung bình nhiều năm (TBNN) trong đánh giá nguy cơ sạt lở đất. Cách tiếp cận này là không hợp lý đối với một số khu vực mà ở đó mưa lớn kéo dài trong nhiều ngày mới là nguyên nhân chính dẫn
- 2 đến sạt lở đất. Ngoài yếu tố mưa, NDVI cũng là một yếu tố thường xuyên thay đổi theo thời gian. Trong khi đó, rất nhiều nghiên cứu trước đây chỉ sử dụng một bản đồ NDVI duy nhất cho xây dựng mô hình dự đoán. Như vậy, vẫn còn nhiều vấn đề cần phải cải thiện từ dữ liệu đến mô hình dự đoán trong nghiên cứu xây dựng bản đồ phân vùng nguy cơ sạt lở đất. Vùng núi tỉnh Quảng Ngãi là địa phương thường xuyên xảy ra sạt lở đất nhưng dữ liệu đo đạc lại rất hạn chế. Do đó, luận án lựa chọn khu vực này để nghiên cứu nhằm nâng cao độ chính xác trong xây dựng bản đồ phân vùng nguy cơ sạt lở đất, phục vục vụ tốt công tác phòng chống thiên tai, quy hoạch và thiết kế công trình. 2. Vấn đề nghiên cứu - Đối với các khu vực nghiên cứu mới thì cần nghiên cứu áp dụng nhiều mô hình học máy khác nhau để lựa chọn ra mô hình dự đoán nguy cơ sạt lở đất phù hợp nhất. - Đối với khu vực bị hạn chế dữ liệu đo đạc, nghiên cứu ứng dụng kỹ thuật xử lý ảnh viễn thám có thể thực hiện để khôi phục dữ liệu liên quan đến sạt lở đất, cải thiện dữ liệu đầu vào cho mô hình học máy. - Cần có cách tiếp cận hợp lý hơn trong sử dụng dữ liệu thay đổi theo thời gian như mưa và NDVI trong đánh giá nguy cơ sạt lở đất. - Cần nghiên cứu lựa chọn loại dữ liệu mưa phù hợp trong đánh giá và xây dựng bản đồ phân vùng nguy cơ sạt lở đất cho những khu vực hạn chế dữ liệu. 3. Mục tiêu nghiên cứu 3.1. Mục tiêu tổng quát Nâng cao độ chính xác trong xây dựng bản đồ phân vùng nguy cơ sạt lở đất cho khu vực hạn chế dữ liệu. 3.2. Mục tiêu cụ thể
- 3 - Xây dựng được bộ dữ liệu đầu vào cho mô hình học máy dự đoán nguy cơ sạt lở đất. - Xác định được mô hình dự đoán nguy cơ sạt lở đất phù hợp, có độ chính xác cao cho một khu vực nghiên cứu cụ thể. - Xây dựng được bản đồ phân vùng nguy cơ sạt lở đất theo tần suất mưa. 4. Đối tượng nghiên cứu và phạm vi nghiên cứu 4.1. Đối tượng nghiên cứu - Các vụ sạt lở đất đã xảy ra. - Lượng mưa gây sạt lở đất. - Các yếu tố ảnh hưởng đến sạt lở đất. - Mô hình học máy dự đoán nguy cơ sạt lở đất. - Các phương pháp đánh giá mô hình và đánh giá bản đồ. - Các công trình thủy trong phạm vi khu vực nghiên cứu. 4.2. Phạm vi nghiên cứu Khu vực 5 huyện miền núi tỉnh Quảng Ngãi. 5. Phương pháp nghiên cứu - Phương pháp phân tích, thống kê kết hợp nghiên cứu lý thuyết. - Phương pháp điều tra, khảo sát, phương pháp kế thừa. - Phương pháp phân tích ảnh viễn thám. - Phương pháp tổng hợp, phân tích và xử lý số liệu. - Phương pháp học máy. - Phương pháp kiểm tra, đánh giá và so sánh các mô hình. - Phương pháp xây dựng bản đồ bằng kỹ thuật GIS. 6. Ý nghĩa khoa học và thực tiễn của luận án 6.1. Ý nghĩa khoa học - Bổ sung và làm giàu dữ liệu phục vụ cho việc xây dựng bản đồ phân vùng nguy cơ sạt lở đất cho vùng miền núi Quảng Ngãi.
- 4 - Ứng dụng thành công mô hình học máy trong xây dựng bản đồ phân vùng nguy cơ sạt lở đất theo tần suất mưa cho vùng núi Quảng Ngãi. 6.2. Ý nghĩa thực tiễn Bản đồ phân vùng nguy cơ sạt lở đất là tài liệu hữu hiệu phục vụ công tác phòng chống thiên tai, quy hoạch, thiết kế và quản lý công trình trên địa bàn vùng núi tỉnh Quảng Ngãi. 7. Cấu trúc của luận án Luận án có cấu trúc gồm có phần Mở đầu, 4 chương, Kết luận và kiến nghị. Tổng luận án được trình bày trong 133 trang A4, không kể phụ lục.
- 5 Chương 1: TỔNG QUAN 1.1. Tổng quan về sạt lở đất 1.1.1. Khái niệm Sạt lở đất là sự dịch chuyển của khối đất đá trên sườn dốc dưới tác động của trọng lực. Đây là một hiện tượng rất phức tạp do sự tương tác của nhiều yếu tố tự nhiên (địa chất, địa mạo, khí tượng, thủy văn ...) và yếu tố con người. 1.1.2. Các dạng sạt lở đất Nghiên cứu của L. Highland chia sạt lở đất ra làm các dạng: trượt, rơi, lật, chảy, dòng chảy tràn và dạng hỗn hợp. Trong đó, trượt là loại hình phổ biến nhất trong các loại hình sạt lở đất ở trên thế giới (chiếm 55.2%), tiếp theo là chảy (19.3%), rơi (9.4%), các dạng còn lại chiếm khoảng 13.2%. Ở Việt Nam, sạt lở đất xảy ra hầu hết là do mưa kích thích, các dạng sạt lở đất chủ yếu bao gồm: tai biến trượt lở ở vùng đồi núi, trượt dòng bùn đất đá. 1.1.3. Nguyên nhân và các yếu tố ảnh Nghiên cứu của Crozier và cộng sự phân chia nhóm yếu tố gây sạt lở đất ra làm 2 loại chính: (i) nhóm yếu tố điều kiện (conditioning factors) gồm: độ dốc, hướng phơi sườn, độ cao, đứt gãy, loại nền đá, mật độ sông suối, sử dụng đất và loại đất và (ii) nhóm yếu tố kích thích (triggering factors) gồm: lượng mưa, động đất và hoạt động của con người. 1.1.4. Thiệt hại do sạt lở đất Theo thống kê của Ngân hàng thế giới, khoảng 3.7 triệu km2 bề mặt đất và khoảng 300 triệu người (khoảng 5% dân số thế giới) chịu ảnh hưởng bởi sạt lở đất. Ở Việt Nam, sạt lở đất xảy ra thường xuyên ở các tỉnh miền núi phía Bắc và miền Trung – Tây Nguyên gây nhiều thiệt hại về người và tài sản. Từ năm 2000 đến 2020, thiên tai lũ quét, sạt lở đất
- 6 đã làm 1,117 người chết và mất tích, 671 người bị thương, 12,038 nhà bị sập đổ. 1.2. Mức độ đánh giá sạt lở đất và bản đồ sạt lở đất 1.2.1. Mức độ đánh giá sạt lở đất Các nghiên cứu của D. J. Varnes và F. Guzzetti đã phân chia các phương pháp đánh giá sạt lở đất ra làm các loại sau: (i) phân vùng sạt lở, (ii) đánh giá nguy cơ sạt lở đất theo không gian, (iii) đánh giá nguy cơ sạt lở đất theo không gian – thời gian, (iv) đánh giá tổn thương do sạt lở đất, (v) đánh giá rủi ro sạt lở đất. 1.2.2. Các loại bản đồ sạt lở đất Nghiên cứu của D. J. Varnes và nnk đã phân chia bản đồ sạt lở đất thành các loại: (i) bản đồ hiện trạng sạt lở, (ii) bản đồ phân vùng nguy cơ sạt lở đất, (iii) bản đồ nguy cơ sạt lở đất, và (iv) bản đồ rủi ro sạt lở đất. Trong số đó, bản đồ nguy cơ sạt lở đất và bản đồ rủi ro sạt lở đất rất khó xây dựng vì đòi hỏi nhiều dữ liệu. Đối với khu vực hạn chế về dữ liệu, nghiên cứu này tiếp cận đánh giá nguy cơ sạt lở đất theo không gian (gọi tắc là “đánh giá nguy cơ sạt lở đất”) và xây dựng bản đồ phân vùng nguy cơ sạt lở đất. 1.3. Phương pháp xây dựng mô hình dự đoán nguy cơ sạt lở đất Nghiên cứu của Shano và nnk đã thống kê được có 3 phương pháp cơ bản để xây dựng mô hình dự đoán nguy cơ sạt lở đất, bao gồm: (i) phương pháp định tính, (ii) phương pháp bán định lượng và (iii) phương pháp định lượng. Trong đó, phương pháp định tính và phương pháp bán định lượng phụ thuộc vào ý kiến chủ quan của người lập bản đồ nên độ chính xác không cao. Trong khi đó, phương pháp định lượng mang lại sự đáng giá khách quan và có độ chính xác tốt hơn. Phương pháp này gồm 2 loại: phương pháp tiền định và phương pháp thống kê. Phương pháp tiền định được đánh giá có độ tin cậy cao nhưng chỉ phù hợp cho khu vực
- 7 nghiên cứu hẹp. Trong khi đó phương pháp thống kê thường được sử dụng cho khu vực rộng lớn hơn. Phương pháp thống kê bao gồm: thống kê truyền thống và học máy. Hiện nay, phương pháp học máy với nhiều ưu điểm đã áp dụng phổ biến và thay thế cho phương pháp thống kê truyền thống. Nghiên cứu của Liu và nnk đã thống kê được 3 phương pháp học máy dùng trong dự đoán nguy cơ sạt lở đất, bao gồm: (i) Học máy thông thường, (ii) Phương pháp kết hợp, (iii) Học sâu (deep learning). Các nghiên cứu đã thực hiện chỉ ra rằng, phương pháp kết hợp hiệu quả hơn so với mô hình học máy thông thường, ngoài ra phương pháp học sâu mới được phát triển gần đây cho hiệu quả dự đoán cao hơn các phương pháp học máy khác. Tuy nhiên, phương pháp học sâu chỉ thực sự hiệu quả với dữ liệu lớn nên các phương pháp học máy thông thường vẫn được áp dụng vào nghiên cứu cho các khu vực không có nhiều dữ liệu để huấn luyện một mạng học sâu hoàn hảo. Nghiên cứu tổng quan về các phương pháp xây dựng mô hình dự đoán nguy cơ sạt lở đất cho thấy phương pháp dựa trên thống kê là phù hợp với phạm vi nghiên cứu của luận án. Trong đó, phương pháp học máy với ưu điểm vượt trội so với phương pháp thống kê truyền thống được sử dụng trong nghiên cứu này.
- 8 Chương 2: CƠ SỞ LÝ THUYẾT CÁC PHƯƠNG PHÁP SỬ DỤNG XÂY DỰNG BẢN ĐỒ PHÂN VÙNG NGUY CƠ SẠT LỞ ĐẤT 2.1. Quy trình xây dựng bản đồ phân vùng nguy cơ sạt lở đất bằng phương pháp học máy Sơ đồ minh họa phương pháp được thể hiện trong Hình 2.1 Hình 2.1 Sơ đồ minh họa quy trình xây dựng bản đồ phân vùng nguy cơ sạt lở đất 2.2. Phương pháp khôi phục hiện trạng sạt lở đất bằng kỹ thuật xử lý ảnh viễn thám 2.2.1. Cơ sở dữ liệu ảnh vệ tinh Đối với khu vực vùng núi Việt Nam, nguồn dữ liệu ảnh quang học có thể khai thác sử dụng trong nghiên cứu này gồm có: dữ liệu ảnh có độ phân giải cao Google Earth Pro, dữ liệu ảnh vệ tinh Landsat, Sentinel 2. Trong đó, dữ liệu ảnh Sentinel 2 mới ra đời từ năm 2015 với độ phân giải tốt hơn dữ liệu ảnh Landsat, giúp nhận diện vết sạt lở tốt hơn. Do đó, nghiên cứu này sử dụng kết hợp các nguồn ảnh từ vệ tinh Sentinel 2 và nguồn ảnh Google Earth để khôi phục hiện trạng sạt lở đất đã xảy ra. 2.2.2. Kỹ thuật phân tích Nghiên cứu này đưa ra phương pháp kết hợp nguồn ảnh Google Earth và nguồn ảnh Sentinel 2 trong phân tích nhằm khắc phục hạn chế
- 9 của mỗi phương pháp đơn lẻ, tăng hiệu quả nhận diện vị trí sạt lở và phân loại thời gian (năm) xảy ra sạt lở (Hình 2.3). Hình 2.3 Sơ đồ phương pháp kết hợp hai nguồn ảnh Sentinel 2 và Google Earth để xác định vị trí và thời gian sạt lở đất. 2.3. Phương pháp xây dựng chuỗi dữ liệu mưa và NDVI dùng trong dự đoán nguy cơ sạt lở đất Yếu tố mưa và NDVI là các yếu tố có giá trị biển đổi theo thời gian. Trong khi đó, nghiên cứu trước đây khi chỉ sử dụng duy nhất một bản đồ các yếu tố này để đánh giá cho một tập hợp các điểm sạt lở đất được thu thập trong nhiều năm. Để cải thiện vấn đề này, luận án sử dụng chuỗi dữ liệu mưa và NDVI trong đánh giá. Phương pháp xây dựng các loại dữ liệu này được thể hiện ở Hình 2.4 và Hình 2.5. Hình 2.4 Sơ đồ phương pháp xây dựng chuỗi dữ liệu mưa tích lũy lớn nhất
- 10 Hình 2.5 Sơ đồ phương pháp xây dựng chuỗi dữ liệu NDVI 2.4. Phương pháp phân tích tần suất mưa vùng Trong các nghiên cứu về phân tích tần suất mưa, cách tiếp cận phân tích tần suất mưa vùng (RFA) được đánh giá là có hiệu quả hơn các tiếp cận địa phương. Do đó, nghiên cứu này sử dụng phương pháp RFA để tạo ra bản đồ mưa bình quân lớn nhất. Các bản đồ này được dùng để xây dựng bản đồ phân vùng nguy cơ sạt lở đất theo các kịch bản tần suất mưa. Hình 2.6 Sơ đồ phương pháp nghiên cứu xây dựng cơ sở dữ liệu mưa bằng kỹ thuật phân tích tần suất mưa vùng 2.5. Phương pháp phân tích và chọn lọc dữ liệu yếu tố ảnh hưởng
- 11 Nghiên cứu này sử dụng 2 hình thức đánh giá dữ liệu, bao gồm: phân tích đa cộng tuyến bằng phương pháp ước tính hệ số lạm phát phương sai (VIF) và đánh giá mức độ quan trọng của mỗi yếu tố đến sạt lở đất bằng phương pháp Boruta. Quá trình phân tích đa cộng tuyến sẽ loại bỏ các yếu tố có mối quan hệ phụ thuộc nhau khi áp dụng các mô hình tuyến tính. Trong khi đó, quá trình chọn lọc dữ liệu sẽ loại bỏ các yếu tố không thực sự cần thiết trong mô hình dự đoán nguy cơ sạt lở đất. 2.6. Lý thuyết các mô hình dự đoán nguy cơ sạt lở đất 2.6.1. Mô hình hồi quy Logistic (LR) Trong đánh giá nguy cơ sạt lở đất, LR được sử dụng như một mô hình hồi quy với các biến độc lập là giá trị của các yếu tố ảnh hưởng và biến phụ thuộc mô tả dữ liệu là sạt lở đất (bằng 1) hoặc không sạt lở đất (bằng 0). Nghiên cứu này sử dụng phương pháp SGD để tối ưu hóa hàm mất mát nhằm tìm ra bộ thông số tốt nhất cho mô hình. 2.6.2. Mô hình máy vector hỗ trợ (SVM) Giả sử ta có một tập huấn luyện (Xi, Yi), với Xi ϵ Rn: là vector đầu vào của các yếu tố ảnh hưởng đến sạt lở đất; Yi là giá trị đầu ra (sạt lở đất hoặc không sạt lở đất). Bài toán tối ưu trong SVM là tìm ra một siêu mặt phẳng sao cho lề (margin) đạt giá trị lớn nhất hay xác định các tham số w và b để tối ưu hóa hàm mục tiêu sau: SVM với các hàm kernel cho phép giải quyết bài toán phân loại với dữ liệu đầy vào phi tuyến tính. Một số hàm kernel thông dụng có thể kể đến như PL, sigmoid, RBF. Bộ thông số của mô hình SVM tùy thuộc vào hàm kernel được áp dụng. 2.6.3. Mô hình cây quyết định (DT)
- 12 Đây là mô hình phân loại phi tham số, bao gồm việc phân vùng và phân loại dữ liệu liên tục dựa trên quy tắc quyết định. Mô hình DT có thể triển khai bằng nhiều thuật toán như: ID3, C4.5, CART, CHAID, MARS. Ba tiêu chí phân chia được sử dụng phổ biến trong các thuật toán này là chỉ số Gini, quy tắt Twoing và entropy chéo. Với bài toán phân loại thì chỉ số Gini thường được chọn vì nó mang lại độ chính xác phân loại tổng thể tốt nhất. Bộ thông số chính của mô hình DT bao gồm: complexity parameter (cp), max_depth, minsplit, minbucket. 2.6.4. Mô hình rừng ngẫu nhiên (RF) RF là một thuật toán khai thác dữ liệu sử dụng kỹ thuật Ensemble thuộc nhóm Bagging, có khả năng phân loại chính xác dữ liệu bằng cách sử dụng một tập hợp các cây quyết định (DT). Các thông số của mô hình RF bao gồm: (i) số lượng cây quyết định (ntree) và (ii) số lượng biến ngẫu nhiên tại mỗi lần phân tách (mtry). Nhiệm vụ của nghiên cứu là tìm ra bộ thông số mà mô hình cho khả năng dự đoán tốt nhất. 2.6.5. Mô hình tăng cường độ dốc cấp cao (XGBoost) XGBoost là thuật toán học máy có hiệu suất cao được phát triển bởi Chen vào năm 2016. XGboost sử dụng nhiều cây phân loại và hồi quy (CART) và tích hợp chúng bằng phương pháp Gradient Boosting. Mục tiêu của thuật toán XGboost là cực tiểu hóa hàm mất mát sau: Với ̂𝑖 và 𝑦 𝑖 là các giá trị dự đoán và quan sát; T là số lá của cây 𝑦 quyết định ; w là trọng số của mỗi lá; γ, λ : là các mức độ điều chuẩn. Bộ thông số chính của mô hình XGBoost bao gồm: nrounds, max_depth, eta, gamma, colsample_bytree, min_child_weight, subsample.
- 13 2.7. Phương pháp đánh giá và so sánh mô hình dự đoán nguy cơ sạt lở đất Đối với mô hình phân loại, các phương pháp được sử dụng phổ biến để đánh giá hiệu quả của mô hình bao gồm: phương pháp dựa trên chỉ số thống kê, phương pháp ROC. 2.7.1. Phương pháp dựa trên chỉ số thống kê Các chỉ số thống kê được sử dụng trong đánh giá mô hình bao gồm: độ chính xác (ACC), kappa (k), độ nhạy (SST), độ đặc hiệu (SPF), PPV, NPV. Các chỉ số có giá trị càng cao chứng tỏ mô hình càng đáng tin cậy. 2.7.2. Phương pháp ROC Đường cong ROC được xây dựng bởi các điểm có tọa độ (SST, (1- SPF)) tương ứng với một ngưỡng quyết định cụ thể. Giá trị diện tích dưới đường cong ROC (AUC) dùng để đo hiệu suất của mô hình. AUC có giá trị trong khoảng (0,1), giá trị AUC càng gần 1 thì hiệu suất dự đoán của mô hình càng cao. Mô hình có giá trị AUC từ 0.9 – 1.0 được đánh giá loại “rất tốt”, tiếp theo là “tốt” (0.8 – 0.9), “khá” (0.7 – 0.8), “trung bình” (0.6-0.7) và “không đáng tin cậy” (0.5 – 0.6). 2.8. Phương pháp xây dựng bản đồ phân vùng nguy cơ sạt lở đất theo tần suất mưa Phương pháp xây dựng bản đồ được trình bày như sơ đồ Hình 2.11. Hình 2.11 Phương pháp xây dựng bản đồ phân vùng nguy cơ sạt lở đất theo tần suất mưa
- 14 Chương 3: NGHIÊN CỨU XÁC ĐỊNH MÔ HÌNH DỰ ĐOÁN NGUY CƠ SẠT LỞ ĐẤT PHÙ HỢP CHO KHU VỰC VÙNG NÚI TỈNH QUẢNG NGÃI 3.1. Giới thiệu về khu vực nghiên cứu Khu vực nghiên cứu lựa chọn là 5 huyện miền núi thuộc tỉnh Quảng Ngãi, với tổng diện tích khoảng 3,237 km2. Phía Tây tiếp giáp với dãy Trường Sơn, phía Đông tiếp giáp với đồng bằng ven biển. Độ dốc địa hình có xu hướng giảm dần từ Tây sang Đông. Hàng năm, từ tháng 9 đến tháng 12, khu vực này hứng chịu trung bình từ 3 đến 17 cơn bão nhiệt đới kèm theo lượng mưa lớn. Hơn 70% lượng mưa hàng năm của khu vực là do mưa bão hoặc áp thấp nhiệt đới. Đây được xem là nguyên nhân chính dẫn đến sạt lở đất ở khu vực này. Theo kết quả thống kê trong điều tra của Viện khoa học và Địa chất và khoảng sản, vùng núi tỉnh Quảng Ngãi là một trong những khu vực có mật độ sạt lở đất cao nhất (0.167 điểm/km2). Do đó, khu vực này luôn tiềm ẩn nguy cơ sạt lở đất, đặc biệt vào mùa mưa. 3.2. Trình tự xây dựng xây dựng mô hình dự đoán nguy cơ sạt lở đất phù hợp cho khu vực nghiên cứu Phương pháp nghiên cứu xây dưng mô hình dự đoán nguy cơ sạt lở đất gồm các bước sau: (1) Thu thập và làm giàu dữ liệu thống kê. (2) Phân tích và chọn lọc dữ liệu. (3) Xây dựng mô hình dự đoán, các mô hình được sử dụng bao gồm: LR, SVM, DT, RF, XGBoost. (4) Kiểm định mô hình. (5) So sánh, đánh giá và lựa chọn mô hình dự đoán. 3.3. Xây dựng và phân tích cơ sở dữ liệu dùng trong đánh giá nguy cơ sạt lở đất
- 15 3.3.1. Dữ liệu hiện trạng sạt lở đất Bản đồ hiện trạng sạt lở đất đã được xây dựng dựa trên tổng số 1,279 sự kiện sạt lở đất được xác định bằng viễn thám và khảo sát dự án. Trong đó, dự án do Viện Khoa học Địa chất và Khoáng sản Việt Nam (2020) thực hiện đã xác định có 549 vụ sạt lở đất tại 5 huyện miền núi tỉnh Quảng Ngãi. Ngoài ra, kỹ thuật viễn thám sử dụng hình ảnh Google Earth kết hợp với hình ảnh vệ tinh Sentinel-2 đã xác định được thêm 730 vụ lở đất. Chuỗi dữ liệu hiện trạng sạt lở đất theo thời gian được tạo ra bằng kỹ thuật phát hiện sự thay đổi dựa trên ảnh vệ tinh Sentinel-2 trong giai đoạn 2016-2020 (Bảng 3.2). Dữ liệu này sau đó được chia thành hai nhóm: (i) tập dữ liệu huấn luyện (70% điểm sạt lở đất) và (ii) tập dữ liệu kiểm tra (30% điểm sạt lở đất còn lại). Bảng 3.2 Kết quả khôi phục các điểm sạt lở đất từ 2016-2020 Năm 2016 2017 2018 2019 2020 Tổng Dữ liệu từ dự án khảo sát 113 306 127 3 NA 549 Dữ liệu từ viễn thám 117 204 60 2 347 730 Tổng 230 510 187 5 347 1,279 3.3.2. Dữ liệu mưa kích thích sạt lở đất a. Đề xuất loại mưa sử dụng trong xây dựng mô hình dự đoán nguy cơ sạt lở đất Luận án sử dụng 34 vụ sạt lở đất lớn có ghi nhận thời gian xảy ra trong giai đoạn 2007 đến 2020 để đánh giá mối quan hệ giữa lượng mưa tích lũy và các vụ sạt lở đất đã xảy ra. Kết quả cho thấy dữ liệu mưa tích lũy lớn nhất ở các thi đoạn 1 ngày (1-NLN), 3 ngày (3-NLN), 5 ngày (5- NLN) và 7 ngày (7-NLN) có liên quan mật thiết đến các sự kiện sạt lở này. Do đó, luận án sử dụng loại mưa này vào đánh giá sạt lở đất. b. Xây dựng cơ sở dữ liệu mưa dùng trong xây dựng mô hình dự đoán nguy cơ sạt lở đất
- 16 Bộ cơ sở dữ liệu mưa 1-NLN, 3-NLN, 5-NLN, 7-NLN được xây dựng dựa trên dữ liệu mưa tích lũy lớn nhất và dữ liệu hiện trạng sạt lở từ 2016 đến 2020. Kết quả phân tích cho thấy ảnh hưởng rõ rệt của dữ liệu tích lũy lớn nhất đến số lượng điểm sạt lở đất được ghi nhận theo từng năm (Hình 3.14). Ngoài ra, nghiên cứu này còn so sánh với trường hợp chỉ sử dụng một bản đồ mưa TBNN. Kết quả phân tích chỉ số tương quan cho thấy dữ liệu sự cải thiện của dữ liệu mưa được sử dụng ở nghiên cứu này là tốt hơn so với dữ liệu mưa TBNN. Hình 3.14 Quan hệ giữa lượng mưa tích lũy lớn nhất và số điểm sạt lở đất được ghi nhận từ 2016-2020 trong các trường hợp mưa: (a) 1-NLN, (b) 3-NLN, (c) 5-NLN, (d) 7-NLN. 3.3.3. Dữ liệu NDVI Tương tự yếu tố mưa, NDVI cũng được xem là một yếu tố biến động mạnh theo thời gian. Do đó, nghiên cứu này sử dụng chuỗi dữ liệu NDVI trong đánh giá nguy cơ sạt lở đất. Các bản đồ NDVI được phân tích từ dữ liệu các ảnh vệ tinh Sentinel 2 chụp trong giai đoạn mùa khô của mỗi năm trong giai đoạn 2016-2020. Chuỗi dữ liệu NDVI được xây dựng dựa trên chuỗi dữ liệu các điểm sạt lở đất xảy ra từ năm 2016 đến 2020 và các bản đồ NDVI tương ứng. 3.3.4. Dữ liệu các yếu tố ảnh hưởng khác Ngoài dữ liệu các yếu tố mưa và NDVI, nghiên cứu này còn sử dụng bản đồ NASADEM để trích xuất các yếu tố ảnh hưởng khác (độ cao địa
- 17 hình, độ dốc, hướng phơi sườn, TWI, độ cong địa hình) và thu thập các yếu tố mạng lưới đường giao thông, mạng lưới sông suối, loại đất từ cơ sở dữ liệu có sẵn. Như vậy, tổng cộng 10 yếu tố ảnh hưởng được xét đến trong nghiên cứu này. 3.3.5. Phân tích tần suất các yếu tố ảnh hưởng Nghiên cứu này thực hiện phân tích tần suất các yếu tố ảnh hưởng: độ cao địa hình, độ dốc, hướng phơi sườn, TWI, độ cong địa hình, loại đất, khoảng cách đến đường, khoảng cách đến sông suối. Kết quả cho thấy sạt lở đất xảy ra với tỷ lệ tần suất (FR) cao ở độ dốc từ 20-30 độ, độ cao địa hình từ 400-600m, TWI từ 0-5.6, loại đất xám Feralic đá lẫn nông, khoảng cách đến đường
- 18 Trong mỗi mô hình dự đoán, nghiên cứu này sẽ sử dụng kỹ thuật tinh chỉnh (fine-tuning) để tìm ra bộ thông số tốt nhất cho mô hình. Kết quả kiểm tra cho thấy rằng trong mỗi mô hình, các chỉ số này không có sự chênh lệch đáng kể về chỉ số thống kê và AUC giữa các trường hợp tính toán (TH1 đến TH4). Trong khi đó, hiệu quả dự đoán có sự thay đổi đáng kể khi sử dụng các loại mô hình khác nhau cho mỗi trường hợp. Trong đó, mô hình XGBoost cho thấy hiệu quả dự đoán cao nhất và được kiến nghị sử dụng để xây dựng bản đồ phân vùng nguy cơ sạt lở đất. 3.5. Đánh giá sự cải thiện về độ chính xác của mô hình dự đoán nguy cơ sạt lở đất Kết quả so sánh các mô hình đã cho thấy sự cải thiện đáng kể về độ chính xác trong dự đoán nguy cơ sạt lở đất. Theo đó mô hình XGBoost với nhiều sự cải tiến so với các mô hình trước đây đã cho thấy khả năng dự đoán tốt nhất. Ngoài ra, nghiên cứu này còn thực hiện so sánh trường hợp sử dụng chuỗi dữ liệu mưa tích lũy lớn nhất và trường hợp sử dụng dữ liệu mưa TBNN. Kết quả chỉ ra rằng, trường hợp sử dụng dữ liệu mưa theo cách tiếp cận của nghiên cứu này có sự cải thiện đáng kể cả về chỉ số thống kê và biểu đồ đường cong ROC so với trường hợp sử dụng dữ liệu mưa TBNN được sử dụng rộng rãi trong các nghiên cứu trước đây (Hình 3.32). Hình 3.32 Biểu đồ ROC của mô hình XGBoost cho các trường hợp
- 19 Chương 4: PHÂN VÙNG NGUY CƠ SẠT LỞ ĐẤT THEO TẦN SUẤT MƯA CHO KHU VỰC VÙNG NÚI TỈNH QUẢNG NGÃI Trong chương này, luận án áp dụng phương pháp xây dựng bản đồ phân vùng nguy cơ sạt lở theo tần suất mưa ở Mục 2.8 cho khu vực nghiên cứu điển hình vùng núi tỉnh Quảng Ngãi. Cơ sở dữ liệu bản đồ các yếu tố ảnh hưởng bao gồm: độ dốc, hướng phơi sườn, độ cao địa hình, TWI, độ cong địa hình, loại đất, khoảng cách đến đường, khoảng cách đến sông suối, NDVI và lượng mưa. Đối với bản đồ lượng mưa, luận án sử dụng phương pháp phân tích tần suất mưa vùng ở Mục 2.4 và cơ sở dữ liệu mưa ở khu vực nghiên cứu để xây dựng bản đồ mưa bình quân lớn nhất (1-NLN, 3-NLN, 5- NLN và 7-NLN) theo các kịch bản tần suất mưa. 4.1. Thiết lập cơ sở dữ liệu mưa để xây dựng bản đồ Nghiên cứu này lựa chọn dữ liệu mưa tích lũy lớn nhất tương ứng với các thời đoạn 1 ngày, 3 ngày, 5 ngày và 7 ngày ở 18 trạm đo trong khoảng thời gian từ 26 năm đến 46 năm để làm cở sở đầu vào phương pháp phân tích tần suất mưa vùng (RFA). Qua bước phân tích này, dữ liệu mưa bình quân lớn nhất ở mỗi trạm đo tương ứng với các tần suất mưa khác nhau được tạo ra. Dựa trên cơ sở dữ liệu mưa bình quân lớn nhất của 18 trạm đo trong khu vực, phương pháp nội suy khoảng cách ngược (IDW) được sử dụng để xây dựng bản đồ phân bố không gian của lượng mưa bình quân lớn nhất với các thời đoạn (1-NLN, 3-NLN, 5-NLN và 7-NLN) và tần suất mưa khác nhau (50%, 20%, 10%, 5%, 2%). Như vậy, tổng số 20 bản đồ mưa bình quân lớn nhất được xây dựng phục vụ công tác xây dựng bản đồ phân vùng nguy cơ sạt lở đất. 4.2. Xây dựng bản đồ phân vùng nguy cơ sạt lở đất theo kịch bản tần suất mưa 4.2.1. Lập bản đồ chỉ số nguy cơ sạt lở đất (LSI) Ở bước này, chỉ số LSI của tất cả các điểm ảnh (pixel) bản đồ được tạo ra dựa trên mô hình dự đoán nguy cơ sạt lở đất của 4 trường hợp và tập

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Tóm tắt Luận án Tiến sĩ Kinh tế: Chiến lược Marketing đối với hàng mây tre đan xuất khẩu Việt Nam
27 p |
335 |
18
-
Tóm tắt Luận án Tiến sĩ Kinh tế: Thúc đẩy tăng trưởng bền vững về kinh tế ở vùng Đông Nam Bộ đến năm 2030
27 p |
387 |
17
-
Tóm tắt Luận án Tiến sĩ Luật học: Hợp đồng dịch vụ logistics theo pháp luật Việt Nam hiện nay
27 p |
439 |
17
-
Tóm tắt Luận án Tiến sĩ Y học: Nghiên cứu điều kiện lao động, sức khoẻ và bệnh tật của thuyền viên tàu viễn dương tại 2 công ty vận tải biển Việt Nam năm 2011 - 2012
14 p |
443 |
16
-
Tóm tắt Luận án Tiến sĩ Triết học: Giáo dục Tư tưởng Hồ Chí Minh về đạo đức cho sinh viên trường Đại học Cảnh sát nhân dân hiện nay
26 p |
302 |
12
-
Tóm tắt luận án Tiến sĩ: Nghiên cứu tối ưu các thông số hệ thống treo ô tô khách sử dụng tại Việt Nam
24 p |
308 |
12
-
Tóm tắt luận án Tiến sĩ Kỹ thuật: Nghiên cứu tính toán ứng suất trong nền đất các công trình giao thông
28 p |
370 |
11
-
Tóm tắt Luận án Tiến sĩ Kinh tế Quốc tế: Rào cản phi thuế quan của Hoa Kỳ đối với xuất khẩu hàng thủy sản Việt Nam
28 p |
328 |
9
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển kinh tế biển Kiên Giang trong tiến trình hội nhập kinh tế quốc tế
27 p |
254 |
8
-
Tóm tắt Luận án Tiến sĩ Xã hội học: Vai trò của các tổ chức chính trị xã hội cấp cơ sở trong việc đảm bảo an sinh xã hội cho cư dân nông thôn: Nghiên cứu trường hợp tại 2 xã
28 p |
296 |
8
-
Tóm tắt Luận án Tiến sĩ Luật học: Các tội xâm phạm tình dục trẻ em trên địa bàn miền Tây Nam bộ: Tình hình, nguyên nhân và phòng ngừa
27 p |
362 |
8
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phản ứng của nhà đầu tư với thông báo đăng ký giao dịch cổ phiếu của người nội bộ, người liên quan và cổ đông lớn nước ngoài nghiên cứu trên thị trường chứng khoán Việt Nam
32 p |
323 |
6
-
Tóm tắt Luận án Tiến sĩ Luật học: Quản lý nhà nước đối với giảng viên các trường Đại học công lập ở Việt Nam hiện nay
26 p |
278 |
5
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các yếu tố ảnh hưởng đến xuất khẩu đồ gỗ Việt Nam thông qua mô hình hấp dẫn thương mại
28 p |
161 |
4
-
Tóm tắt Luận án Tiến sĩ Ngôn ngữ học: Phương tiện biểu hiện nghĩa tình thái ở hành động hỏi tiếng Anh và tiếng Việt
27 p |
275 |
4
-
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu cơ sở khoa học và khả năng di chuyển của tôm càng xanh (M. rosenbergii) áp dụng cho đường di cư qua đập Phước Hòa
27 p |
151 |
4
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các nhân tố ảnh hưởng đến cấu trúc kỳ hạn nợ phương pháp tiếp cận hồi quy phân vị và phân rã Oaxaca – Blinder
28 p |
176 |
3
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển sản xuất chè nguyên liệu bền vững trên địa bàn tỉnh Phú Thọ các nhân tố tác động đến việc công bố thông tin kế toán môi trường tại các doanh nghiệp nuôi trồng thủy sản Việt Nam
25 p |
319 |
2


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
