BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
ĐOÀN THỊ NAM PHƯƠNG
LỰA CHỌN MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG
TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ
NGÀNH: KỸ THUẬT TRẮC ĐỊA - BẢN ĐỒ
MÃ SỐ: 9520503
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT
Hà Nội - 2023
Công trình được hoàn thành tại: Bộ môn Đo ảnh và Viễn thám,
Khoa Trắc địa - Bản đồ và Quản lý đất đai,
Trường Đại học Mỏ - Địa chất
Người hướng dẫn khoa học:
1. PGS. TS Nguyễn Văn Trung – Trường Đại học Mỏ - Địa chất
2. GS.TS Bùi Tiến Diệu – Trường Đại học Đông Nam (Na Uy)
Phản biện 1: PGS.TS Trần Vân Anh-Trường Đại học Mỏ - Địa chất
Phản biện 2: PGS.TS Trịnh Lê Hùng - Học viện Kỹ thuật Quân sự
Phản biện 3: PGS.TS Phạm Quang Vinh - Viện Địa lý
Luận án được bảo vệ tại Hội đồng đánh giá luận án cấp Trường
Họp tại Trường Đại học Mỏ - Địa chất vào hồi 8 giờ 30,
ngày tháng năm 2023
Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia
- Thư viện Trường Đại học Mỏ - Địa chất
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Các mô hình dự báo nguy cơ cháy rừng đều có những ưu, nhược điểm
riêng và việc lựa chọn mô hình phù hợp với điều kiện tự nhiên, xã hội, dữ
liệu ở từng khu vực cụ thể là một vấn đề có tính thực tiễn cao. Với những
lý do trên, luận án “Lựa chọn mô hình dự báo nguy cơ cháy rừng từ
dữ liệu viễn thám và hệ thông tin địa lý” được lựa chọn xuất phát từ
nhu cầu thực tế, có ý nghĩa khoa học và thể hiện sự cần thiết phải
nghiên cứu.
2. Mục tiêu nghiên cứu
Lựa chọn được mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn
thám và hệ thông tin địa lý khu vực phía tây tỉnh Nghệ An.
3. Nội dung nghiên cứu
- Tổng quan về vấn đề nghiên cứu:
- Cơ sở khoa học xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ
liệu viễn thám và hệ thông tin địa lý;
- Thu thập, tiền xử lý và chiết tách các lớp thông tin chuyên đề từ dữ
liệu viễn thám và hệ thông tin địa lý;
- Nghiên cứu đề xuất qui trình xây dựng bản đồ dự báo nguy cơ cháy
rừng từ dữ liệu viễn thám và hệ thông tin địa lý trên cơ sở các kỹ thuật
như AHP, Rừng ngẫu nhiên (RF), Máy hỗ trợ vector (SVM), Cây phân
loại và hồi quy (CART);
- Đánh giá và lựa chọn mô hình phù hợp với điều kiện cụ thể khu
vực phía tây tỉnh Nghệ An;
- Phân tích kết quả.
2
4. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu là các mô hình dự báo nguy cơ cháy rừng
trên cơ sở kết hợp dữ liệu viễn thám, hệ thông tin địa lý và các kỹ thuật
học máy.
- Phạm vi khoa học của luận án tập trung vào phân tích, đánh giá,
thử nghiệm nhằm lựa chọn mô hình dự báo cháy rừng phù hợp với
điều kiện cụ thể khu vực nghiên cứu.
- Phạm vi không gian của luận án là khu vực phía tây tỉnh Nghệ An.
5. Phương pháp nghiên cứu
- Phương pháp phân tích, tổng hợp
- Phương pháp viễn thám
- Phương pháp GIS
- Phương pháp học máy, phương pháp mô hình hóa
- Phương pháp thống kê
6. Ý nghĩa khoa học và thực tiễn của đề tài
6.1 Ý nghĩa khoa học
Góp phần hoàn thiện cơ sở khoa học và minh chứng tính hiệu quả
của phương pháp ứng dụng dữ liệu viễn thám, GIS và các kỹ thuật trí
tuệ nhân tạo (học máy) trong xây dựng mô hình dự báo nguy cơ cháy
rừng
6.2 Ý nghĩa thực tiễn
Cung cấp thông tin và công cụ xử lý dữ liệu viễn thám, GIS trên nền
tảng Google Earth Engine để các nhà quản lý đưa ra các biện pháp
trong giám sát và cảnh báo sớm nguy cơ cháy rừng. Bên cạnh đó, kết
quả nhận được trong đề tài cũng có thể sử dụng, tham khảo trong công
tác nghiên cứu khoa học, giảng dạy ở các trường đại học, viện nghiên
cứu.
3
7. Những điểm mới của luận án
- Lựa chọn được 9 lớp thông tin đầu vào cho mô hình dự báo nguy
cơ cháy rừng khu vực phía tây tỉnh Nghệ An từ dữ liệu viễn thám và
GIS là phù hợp với điều kiện khu vực nghiên cứu.
- Lựa chọn được mô hình dự báo nguy cơ cháy rừng khu vực phía
tây tỉnh Nghệ An bằng dữ liệu viễn thám và GIS trên cơ sở thuật toán
Random Forest.
8. Luận điểm bảo vệ
Luận điểm 1: Các lớp thông tin đầu vào chiết xuất từ dữ liệu viễn
thám và GIS (mật độ dân số, lớp phủ thực vật, độ bốc thoát hơi nước,
hướng sườn, độ dốc, tốc độ gió, độ cao, nhiệt độ bề mặt và lượng mưa
trung bình tháng) cho phép xây dựng mô hình dự báo nguy cơ cháy
rừng phù hợp với điều kiện khu vực nghiên cứu ở phía Tây tỉnh Nghệ
An.
Luận điểm 2: Kỹ thuật học máy (thuật toán Random Forest) giúp
dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS với độ chính
xác cao nhất đối với khu vực nghiên cứu.
9. Kết cấu của luận án
Luận án gồm 03 chương chính, phần mở đầu, kết luận - kiến nghị và
tài liệu tham khảo. Nội dung chính của luận án được trình bày trong
03 chương
4
CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU
1. Tổng quan tình hình nghiên cứu trong và ngoài nước
1.1 Đặc điểm tài nguyên rừng Việt Nam
1.2 Hiện trạng cháy rừng ở Việt Nam
1.2.1 Khái niệm cháy rừng
Theo Tổ chức Lương thực và Nông nghiệp Thế giới (FAO): “Cháy
rừng là sự xuất hiện và lan rộng của đám cháy trong các khu rừng
ngoài tầm kiểm soát của con người; gây ra những tổn thất về nhiều
mặt về tài nguyên, tài sản và môi trường' (FAO, 1999).
1.2.2 Quy định về cấp dự báo cháy rừng
Cấp dự báo cháy rừng được quy định tại Điều 46 Nghị định
156/2018/NĐ-CP (ngày 16/11/2018) quy định chi tiết thi hành một số
điều của Luật Lâm nghiệp, trong đó cấp dự báo cháy rừng gồm 5 cấp,
từ cấp Tôi lên cấp V.
1.2.3 Phân tích tình hình cháy rừng ở Việt Nam
1.3 Nguyên nhân cháy rừng ở Việt Nam
- Cháy rừng do biến đổi khí hậu.
- Cháy rừng do hoạt động của con người và sinh học
1.4 Các phương pháp dự báo cháy rừng
1.4.1 Các phương pháp dự báo cháy rừng truyền thống
Các nghiên cứu về cháy rừng đã được các nhà khoa học Mỹ, Liên
Xô (cũ), Canada, Nhật Bản, Trung Quốc... quan tâm từ đầu thế kỷ 20.
Các phương pháp dự báo cháy rừng truyền thống dựa trên mối quan
hệ giữa các yếu tố khí tượng, khí hậu và vật liệu dễ cháy.
1.4.2 Các phương pháp sử dụng dữ liệu viễn thám và GIS
Các phương pháp dự báo nguy cơ cháy rừng sử dụng tư liệu viễn
thám và GIS là quá trình đánh giá mức độ ảnh hưởng của các yếu tố
5
tự nhiên và xã hội trong quá trình hình thành cháy rừng. Các yếu tố
này bao gồm (Phạm Ngọc Hùng, 2004): đặc điểm của rừng, lửa kết
cấu vật liệu, khí hậu và thời tiết, địa hình. Ngoài ra, một số mô hình
dự báo nguy cơ cháy rừng còn sử dụng các lớp đầu vào như khoảng
cách từ khu dân cư đến rừng, khoảng cách từ các tuyến giao thông vào
rừng, số người vào rừng trung bình mỗi ngày… (Gholamreza, 2012) .
1.5 Tổng quan tình hình nghiên cứu trên thế giới và Việt Nam
1.5.1 Trên thế giới
Cháy rừng là một hiện tượng phức tạp, khó mô hình hóa và quản lý.
Có nhiều yếu tố góp phần gây ra cháy rừng và lan rộng, chẳng hạn như
yếu tố con người, các biến đổi địa hình và khí tượng. Xây dựng mô
hình dự báo nguy cơ cháy rừng và phân loại nguy cơ cháy rừng là vấn
đề cấp thiết, cung cấp thông tin kịp thời cho công tác bảo vệ và phát
triển tài nguyên rừng. Công nghệ địa không gian, bao gồm công nghệ
viễn thám và hệ thống thông tin địa lý (GIS) được ứng dụng rộng rãi
và hiệu quả trong xây dựng mô hình dự báo nguy cơ cháy rừng. Viễn
thám và GIS cho phép thu thập dữ liệu về độ che phủ của rừng để phân
tích, quản lý và lập mô hình cảnh báo sớm nguy cơ cháy rừng.
Jaiswal et al. (2002) đã sử dụng phương pháp phân tích thứ bậc
(AHP) để lập bản đồ nguy cơ cháy rừng tại khu vực Subwatershed
Gorna (bang Madhya Pradesh, Ấn Độ) dựa trên cơ sở dữ liệu ảnh vệ
tinh IRS và công nghệ GIS. Kết quả thu được cho thấy, gần 30% diện
tích khu vực nghiên cứu có nguy cơ cháy rừng ở mức “cao” đến “rất
cao”, phù hợp với các địa bàn xảy ra cháy rừng. (Jaiswal và cộng sự,
2002). Trong nghiên cứu (Wimberly et al., 2008), các tác giả đã sử
dụng dữ liệu ảnh vệ tinh Landsat đa thời gian để lập bản đồ mức độ
nghiêm trọng của các vụ cháy rừng ở phía nam Appalachia (Bắc
6
Carolina, Hoa Kỳ). Chỉ số tỷ lệ bỏng được chuẩn hóa (NBR) được tính
toán từ các dải hồng ngoại sóng ngắn và hồng ngoại gần của hình ảnh
Landsat được sử dụng để đánh giá sự thay đổi lớp phủ mặt đất trước
và sau đám cháy.
Nhiều nghiên cứu đã sử dụng các kỹ thuật trí tuệ nhân tạo (mạng nơ-
ron nhân tạo, rừng ngẫu nhiên, máy vector hỗ trợ) kết hợp với phương
pháp phân tích thứ bậc AHP để nâng cao độ chính xác của các mô hình
dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS (Vasilakos et
al., 2009; Oliveira và cộng sự, 2012; Bùi Tiến Diệu và cộng sự, 2016,
2017). Các kỹ thuật hồi quy như hồi quy bội (Oliveira và cộng sự,
2012), hồi quy logistic (Pourghasemi, 2015), hồi quy theo trọng số địa
lý (GWR) (Fernandez và cộng sự, 2012), kỹ thuật khai thác dữ liệu
(Arpaci và cộng sự, 2014) là còn được sử dụng để xây dựng mô hình
dự báo nguy cơ cháy rừng trên cơ sở đánh giá mối quan hệ giữa các
yếu tố tự nhiên - xã hội với khả năng xảy ra cháy rừng.
1.5.2 Trong nước
Ở Việt Nam, một số nghiên cứu đã sử dụng dữ liệu nhiệt độ bề mặt
đất tính toán từ ảnh hồng ngoại nhiệt Landsat và MODIS để cảnh báo
sớm các vùng có nguy cơ cháy rừng cao (Vương Văn Quỳnh, 2005;
Đoàn Hà Phong, 2007; Trần Quang Báo và nnk., 2016). Dữ liệu viễn
thám hồng ngoại nhiệt cũng được sử dụng trong nghiên cứu (Trinh và
Zablotskii, 2017) để phát hiện cháy than dưới bề mặt trong các mỏ
than. Các nghiên cứu (Nguyễn Ngọc Thạch và cộng sự, 2015; Đặng
Ngô Bảo Toàn, 2021; Hoàng và cộng sự, 2020) cũng đã sử dụng dữ
7
liệu viễn thám và GIS để lập bản đồ nguy cơ cháy rừng ở các khu vực
khác nhau ở Việt Nam dựa trên kỹ thuật máy học.
Kết quả thu được cho thấy kỹ thuật máy học cho phép phân loại rủi
ro cháy rừng với độ chính xác cao hơn so với phương pháp truyền
thống sử dụng kỹ thuật phân tích thứ bậc (AHP). Nhìn chung, các
nghiên cứu trên đã chứng minh hiệu quả của công nghệ viễn thám và
GIS trong xây dựng mô hình dự báo nguy cơ cháy rừng phục vụ công
tác giám sát, giảm thiểu thiệt hại do cháy rừng gây ra.
1.6 Thảo luận vấn đề nghiên cứu
Phân tích các nghiên cứu trên thế giới và Việt Nam cho thấy, các mô
hình dự báo nguy cơ cháy rừng phù hợp với điều kiện tự nhiên - xã
hội của từng vùng, không thể áp dụng cho các vùng khác nhau. Vì vậy,
đối với từng khu vực cụ thể, cần nghiên cứu, đánh giá nguyên nhân
cháy rừng, từ đó lựa chọn, xây dựng mô hình dự báo nguy cơ cháy
rừng phù hợp. Với sự phát triển mạnh mẽ của kỹ thuật trí tuệ nhân tạo
trong những năm gần đây, việc sử dụng thuật toán học máy trong xây
dựng mô hình dự báo nguy cơ cháy rừng là hướng tiếp cận phù hợp và
hiệu quả dựa trên dữ liệu viễn thám và dữ liệu GIS.
1.7 Tiểu kết chương 1
Trong chương 1, NCS đã phân tích đặc điểm tài nguyên rừng Việt
Nam, nguyên nhân cháy rừng, các phương pháp dự báo nguy cơ cháy
rừng, đánh giá tổng quan tình hình nghiên cứu trên thế giới và Việt
Nam. Từ những kết quả thu được, nghiên cứu sinh đã luận giải những
8
vấn đề còn tồn tại, đề xuất giải pháp trong luận án nhằm nâng cao hiệu
quả công tác cảnh báo sớm nguy cơ cháy rừng.
CHƯƠNG 2. CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH
DỰ BÁO NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM
VÀ HỆ THÔNG TIN ĐỊA LÝ 2.1 Đặc điểm khu vực nghiên cứu
Khu vực nghiên cứu nằm ở phía Tây tỉnh Nghệ An, thuộc vùng Bắc Trung Bộ Việt Nam, có tọa độ địa lý từ 18º33' đến 20º01'N, 103º52' đến 105º48'E..
Hình 2.1 Vị trí địa lý tỉnh Nghệ An
2.2 Tổng quan về dữ liệu xây dựng mô hình dự báo cháy rừng 09 nhân tố để xây dựng mô hình dự báo nguy cơ cháy rừng, bao
gồm:
+ Mật độ dân số
+ Lớp phủ thực vật (chỉ số NDVI) + Bốc hơi bề mặt + Khía cạnh + Độ dốc + Tốc độ gió
9
+ Độ cao
+ Nhiệt độ bề mặt đất + Lượng mưa trung bình tháng.
2.3 Phương pháp xây dựng cơ sở dữ liệu thành phần 2.3.1 Các lớp dữ liệu đầu vào trích xuất từ ảnh viễn thám a) Lớp phủ thực vật Chỉ số NDVI được sử dụng để thể hiện hệ số che phủ thực vật trong mô hình dự báo nguy cơ cháy rừng. NDVI được tính từ giá trị hệ số phản xạ phổ trong các kênh màu đỏ và cận hồng ngoại của hình ảnh đa phổ theo phương trình (Rouse et al., 1973):
(1)
Trong đó, NIR và RED là phổ phản xạ bề mặt ở kênh cận hồng ngoại
và kênh đỏ. Với ảnh Sentinel 2 MSI tương ứng với kênh 8 và kênh 4.
b) Thông tin độ ẩm bề mặt
Độ bốc thoát hơi nước cũng có thể được sử dụng trong xây dựng lớp
thông tin đầu vào về độ ẩm bề mặt. Độ bốc thoát hơi nước có thể chiết
xuất từ ảnh viễn thám quang học như Landsat, MODIS..., trong đó sản
phẩm độ bốc thoát hơi nước xác định từ ảnh MODIS được sử dụng
một cách rộng rãi và được cung cấp trên nền tảng GEE.
c) Thông tin nhiệt độ bề mặt
Nhiệt độ bề mặt đất được trích xuất từ dữ liệu viễn thám hồng ngoại
nhiệt Landsat 8 bằng mô hình của NASA. Ở bước đầu tiên, dữ liệu
dải TIRS (Qcal) phải được chuyển đổi thành bức xạ quang phổ TOA
(Lλ) bằng cách sử dụng hệ số thay đổi tỷ lệ bức xạ được cung cấp
trong tệp siêu dữ liệu theo phương trình sau
(http://landsat.gsfc.nasa.gov):
(2)
10
Trong đó:
ML, AL – Hệ số chuyển đổi, được lấy trong tệp siêu dữ liệu (metadata
file) ảnh Landsat 8;
Ở bước thứ hai, các dải nhiệt của Landsat 8 có thể được chuyển đổi từ dạng bức xạ quang phổ (Lλ) thành nhiệt độ sáng (TB) bằng phương trình sau (http://landsat.gsfc.nasa.gov):
(3)
Trong đó: K1 và K là các hệ số, được cung cấp trong tệp siêu dữ
liệu ảnh Landsat 8.
Để xác định nhiệt độ bề mặt đất từ dữ liệu Landsat 8, cần có giá trị
phát xạ bề mặt đất. Độ phát xạ bề mặt được xác định bằng phương
pháp dựa trên ảnh NDVI do Valor và Caselles (1996) đề xuất theo
phương trình sau:
(4)
Trong đó: ε – Độ phát xạ bề mặt
εv, εs – Độ phát xạ của lớp phủ thực vật thuần khiết và diện tích đất
thuần khiết tương ứng.
Pv là tỉ lệ thực vật trong từng pixel, được xác định
theo công thức sau (Vlassova et al., 2014):
(5)
Ở bước cuối cùng, nhiệt độ bề mặt đất có thể được tính theo phương
trình sau (6):
(6)
11
2.3.2 Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa
lý
Dữ liệu độ cao (DEM) của Shuttle Radar Topography Mission
(SRTM) với độ phân giải không gian 30m được thu thập và xử lý để
xây dựng các yếu tố địa hình cho mô hình rủi ro cháy rừng, bao gồm
độ cao, hướng và độ dốc
2.3.3 Nhóm các lớp thông tin khác
Các lớp dữ liệu Tốc độ gió, Lượng mưa trung bình tháng được trích
xuất qua cơ sở dữ liệu WorldClim (https://www.worldclim.org/).
Lớp dữ liệu Mật độ dân số được trích xuất qua tập dữ liệu nhân khẩu
học WorldPop (https://data.worldpop.org/).
2.4 Phương pháp xử lý dữ liệu trên nền tảng Google Earth
Engine
Google Earth Engine (GEE) là một nền tảng phân tích không gian
địa lý dựa trên điện toán đám mây cho phép người dùng trực quan hóa
và phân tích hình ảnh vệ tinh Trái đất. Bộ dữ liệu của GEE lưu trữ dữ
liệu viễn thám của các hệ thống vệ tinh trong giai đoạn 40 năm qua,
cùng với các công cụ tính toán cần thiết để phân tích và khai thác kho
dữ liệu khổng lồ đó mà không cần phải tải về máy tính. Không những
thế, dữ liệu từ GEE có thể sử dụng trên các phần mềm khác như QGIS,
GIS, Foris để tối ưu hóa dữ liệu. Nền tảng được sử dụng miễn phí với
mục đích nghiên cứu, giáo dục và mục đích phi lợi nhuận. Danh mục
dữ liệu công khai của GEE bao gồm nhiều bộ dữ liệu raster lên đến 5
triệu gigabyte (5 petabyte).
12
2.5 Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ
dữ liệu viễn thám và hệ thông tin địa lý
2.5.1 Phương pháp phân tích thứ bậc AHP Phương pháp AHP được phát triển bởi Saaty là một trong
những cách tiếp cận phân tích đa chỉ tiêu (MCA) linh hoạt và thuận
lợi nhất, đã được sử dụng rộng rãi trong xây dựng các mô hình dự báo
nguy cơ cháy rừng từ dữ liệu viễn thám và GIS. Trong mô hình dự báo
nguy cơ cháy rừng theo phương pháp AHP, mỗi yếu tố đầu vào có giá
trị trọng số ảnh hưởng riêng, từ đó xây dựng bản đồ phân vùng nguy
cơ cháy rừng.
2.5.2 Phương pháp sử dụng thuật toán Rừng ngẫu nhiên
Hình 2. Sơ đồ thuật toán RF trong phân loại (chỉnh sửa từ nguồn: https://www.section.io/)
13
2.5.3 Phương pháp sử dụng thuật toán Máy hỗ trợ vector
Hình 3. Mô tả các vector hỗ trợ trong thuật toán SVM
2.5.4 Phương pháp sử dụng thuật toán cây phân loại và hồi quy
Hình 4 Mô tả thuật toán Cây Phân loại và hồi quy CART (nguồn: https://www.javatpoint.com/)
14
Hình 5 Sơ đồ quy trình công nghệ lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS
2.6 Tiểu kết chương 2
Trong chương 2, lựa chọn 09 lớp dữ liệu đầu vào của mô hình dự
báo nguy cơ cháy rừng bao gồm: mật độ dân số, lớp phủ thực vật, bốc
thoát hơi nước bề mặt, độ cao. , độ dốc, khía cạnh, tốc độ gió, nhiệt độ
bề mặt đất và lượng mưa trung bình hàng tháng.
04 phương pháp đã được thử nghiệm bao gồm: kỹ thuật AHP và
03 phương pháp học máy (RF, SVM, CART).
15
CHƯƠNG 3. THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY
RỪNG KHU VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU
VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ
3.1 Đặc điểm dữ liệu sử dụng
3.1.1 Dữ liệu viễn thám
65 cảnh Sentinel 2A và Sentinel 2B được chụp từ ngày 15 tháng 11
năm 2021 đến ngày 16 tháng 1 năm 2022, 15 Ảnh đa phổ Landsat 8
OLI_TIRS với đường dẫn/hàng 127/047, 127/046 và 128/046 được chụp
trong khoảng thời gian từ ngày 15 tháng 11 năm 2021 đến ngày 16 tháng
1 năm
2022 Hình 6: Dữ liệu ảnh Sentinel 2 MSI khu vực nghiên cứu
3.1.2 Dữ liệu GIS Dữ liệu độ cao của Shuttle Radar Topography Mission (SRTM) với
độ phân giải không gian 30m (Hình 7) được thu thập và xử lý để xây
dựng các yếu tố địa hình cho mô hình dự báo cháy rừng, bao gồm độ
cao, hướng và độ dốc.
Hình 7: Mô hình SRTM của khu vực nghiên cứu
Dữ liệu mật độ dân số được thu thập từ cơ sở dữ liệu WorldPop
16
(https://data.worldpop.org/). Trong khi đó, tốc độ gió và lượng mưa
trung bình hàng tháng được thu thập từ cơ sở dữ liệu WorldClim
(https://data.worldclim.org/).
3.2 Kết quả xây dựng các lớp thông tin chuyên đề
Hình ảnh Sentinel 2 MSI sau khi thu thập và tiền xử lý được sử dụng
để tính toán chỉ số thực vật NVDI. Trong khi đó, ảnh Landsat 8 được
dùng để tính toán nhiệt độ bề mặt đất theo mô hình của NASA. Kết
quả thành lập bản đồ lớp phủ thực vật (chỉ số NDVI), bốc thoát hơi
nước bề mặt và các tầng nhiệt độ bề mặt đất khu vực phía Tây tỉnh
Nghệ An từ tư liệu viễn thám được trình bày trong Hình 8.
Hình 8: Các lớp dữ liệu NDVI, NMDI và nhiệt độ bề mặt đất cho
mô hình dự báo nguy cơ cháy rừng
Hình 9: Các lớp dữ liệu Độ cao, Độ dốc và hướng sườn cho mô
hình dự báo nguy cơ cháy rừng
17
Hình 10 trình bày tốc độ gió, lượng mưa trung bình tháng và các lớp
đầu vào mật độ dân số của mô hình dự báo nguy cơ cháy rừng ở khu
vực phía Tây tỉnh Nghệ An. Do độ phân giải của dữ liệu được thu thập
từ cơ sở dữ liệu WorldPop và WorldClime là 1000m nên để phù hợp
với các lớp dữ liệu khác của mô hình dự báo rủi ro cháy rừng, các lớp
dữ liệu này được nội suy thành kích thước pixel 10m.
Hình 10: Các lớp dữ liệu về tốc độ gió, lượng mưa trung bình hàng
tháng và mật độ dân số cho mô hình dự báo nguy cơ cháy rừng
3.3 Kết quả lập bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn
thám và GIS
3.3.1 Dự báo nguy cơ cháy rừng bằng kỹ thuật AHP
Từ 9 lớp đầu vào của mô hình dự báo nguy cơ cháy rừng được lựa
chọn trong luận án, đánh giá vai trò của từng nhân tố ảnh hưởng đến
khả năng xảy ra cháy rừng thông qua ma trận so sánh cặp các chỉ tiêu
bằng phương pháp AHP. Kết quả dự báo nguy cơ cháy rừng khu vực
phía Tây tỉnh Nghệ An bằng kỹ thuật AHP được thể hiện trong Hình
11, trong đó nguy cơ cháy rừng được phân thành 5 cấp: rất thấp, thấp,
trung bình, cao và rất cao.
18
Hình 11: Bản đồ vùng nguy cơ cháy rừng sử dụng kỹ thuật AHP
3.3.2 Dự báo nguy cơ cháy rừng bằng thuật toán RF
Để dự báo nguy cơ cháy rừng bằng thuật toán Random Forest, luận án đã thử nghiệm với nhiều giá trị khác nhau của tham số numberOfTrees. Kết quả thu được cho thấy thuật toán RF với tham số numberOfTrees bằng 100 có độ chính xác cao nhất trong dự báo nguy cơ cháy rừng. Bản đồ phân vùng nguy cơ cháy rừng khu vực phía Tây tỉnh Nghệ An thành lập bằng thuật toán RF (100) được trình bày trong Hình 12
19
Hình 12: Bản đồ vùng nguy cơ cháy rừng sử dụng thuật toán RF(100) 3.3.3 Dự báo nguy cơ cháy rừng bằng thuật toán SVM
Để đánh giá nguy cơ cháy rừng bằng thuật toán SVM, nghiên cứu
này đã thử nghiệm với các giá trị khác nhau của tham số chi phí (C).
Hình 13: Bản đồ vùng nguy cơ cháy rừng sử dụng thuật toán SVM(25)
20
Tham số C cho thuật toán SVM biết cách cân bằng hai mục tiêu cạnh tranh nhằm tối đa hóa chênh lệch giữa hai lớp và không cho phép bất kỳ mẫu nào bị phân loại sai. Nếu C = 0 thì thuật toán không cho phép bất kỳ mẫu nào bị phân loại sai. Nếu C > 0 thì thuật toán có thể đánh đổi một số mẫu bị phân loại sai để tìm một lề phân tách tốt hơn các điểm còn lại. Từ việc phân tích phân bố số liệu cháy rừng, tham số C=25 cho phép dự báo nguy cơ cháy rừng tại khu vực nghiên cứu với độ chính xác cao nhất (Hình 13). 3.3.4 Dự báo nguy cơ cháy rừng bằng thuật toán CART
Tương tự như thuật toán học máy RF và SVM, để dự báo nguy cơ cháy rừng khu vực phía Tây tỉnh Nghệ An bằng thuật toán CART, luận án đã thử nghiệm với các giá trị tham số maxNodes khác nhau, tương ứng với số lượng tham số. số nút lá tối đa trên mỗi cây quyết định. Kết quả thu được cho thấy, với giá trị tham số maxNodes là 30, kết quả dự báo nguy cơ cháy rừng có độ chính xác cao nhất khi so sánh với số liệu thực địa (Hình 14).
Hình 14: Bản đồ vùng nguy cơ cháy rừng sử dụng thuật toán CART(30)
21
3.4 Đánh giá độ chính xác của mô hình dự báo nguy cơ cháy
rừng
Dữ liệu thực địa từ cơ sở dữ liệu của Cục Kiểm lâm (Bộ NN&PTNT) gồm 36 điểm cháy và 61 điểm không cháy được sử dụng để so sánh, đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy rừng (Bảng 1). Kết quả thu được cho thấy, mô hình sử dụng thuật toán RF100 có độ chính xác cao nhất, trong đó 31/36 điểm cháy phân bố ở khu vực có mức độ cháy cao và rất cao.b) Đánh giá dựa trên đường cong ROC Bảng 1. So sánh kết quả dự báo nguy cơ cháy rừng giữa các mô hình Cấp độ nguy cơ cháy rừng
Thấp TB Cao Thuật toán Rất thấp Rất cao
Điểm cháy 0 19 8 3 6
RF3 11 2 9 18 21 Điểm không cháy
Điểm cháy 0 23 8 2 3
RF100 14 2 5 25 15 Điểm không cháy
Điểm cháy 2 3 20 2 9
RF200 8 7 12 17 17 Điểm không cháy
Điểm cháy 0 29 4 2 1
CART5 8 30 2 11 10 Điểm không cháy
Điểm cháy 0 24 8 2 2
CART30 10 29 1 19 2 Điểm không cháy
Điểm cháy 0 SVM30 25 6 4 2
22
5 3 38 15 0 Điểm không cháy
Điểm cháy 3 11 18 3 1
SVM25 17 8 28 5 3 Điểm không cháy
Điểm cháy 8 7 15 6 0
AHP 3 5 31 22 0 Điểm không cháy
Ngoài ra, nghiên cứu còn sử dụng đường cong ROC và chỉ số AUC để đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy rừng (Bảng 2), trong đó thuật toán RF100 cũng có giá trị AUC cao nhất
Bảng 2. Giá trị AUC của các mô hình học máy RF (3) CART (30) CART (5) RF (200) SVM (25) SVM (30) RF (100)
0.947 0.938 0.905 0.916 0.756 0.743 AUC 0.951
3.5 Xây dựng công cụ xử lý dữ liệu trên nền tảng GEE
Trong nghiên cứu, nghiên cứu sinh sử dụng ngôn ngữ lập trình
JavaScript trên giao diện Code Editor để xử lý dữ liệu ảnh Landsat 8/9
và Sentinel 2 MSI và GIS (Hình 15).
Hình 15: Công cụ xử lý dữ liệu địa không gian trên nền tảng GEE
23
3.6 Tiểu kết chương 3
Trong chương 3, các mô hình dự báo nguy cơ cháy rừng
khu vực phía Tây tỉnh Nghệ An đã được thử nghiệm để lựa chọn mô
hình phù hợp cho khu vực nghiên cứu. Trên cơ sở so sánh, đánh giá
kết quả dự báo nguy cơ cháy rừng từ mô hình đề xuất và dữ liệu thực
tế từ cơ sở dữ liệu của Cục Lâm nghiệp, phương pháp sử dụng thuật
toán Random Forest với giá trị tham số numberOfTrees 100 (RF100)
có độ chính xác cao nhất. Trong Chương 3, các công cụ phần mềm
cũng được xây dựng trên nền tảng điện toán đám mây GEE để xử lý
dữ liệu viễn thám và GIS.
KẾT LUẬN VÀ KIẾN NGHỊ
Kết luận
Trong nghiên cứu này, 09 yếu tố ảnh hưởng đến nguy cơ
cháy rừng bao gồm lớp phủ thực vật (chỉ số NDVI), bốc thoát hơi nước
bề mặt, độ cao, độ dốc, hướng, tốc độ gió, nhiệt độ bề mặt đất, lượng
mưa trung bình tháng và mật độ dân số được sử dụng để lập bản đồ
nguy cơ cháy rừng. dựa trên kỹ thuật AHP và các thuật toán RF, SVM,
CART. Dữ liệu hình ảnh Sentinel 2 MSI, MODIS và Landsat 8/9 được
sử dụng để tạo lớp dữ liệu lớp phủ thực vật, thoát hơi nước và nhiệt độ
bề mặt đất. Các lớp dữ liệu địa hình bao gồm độ dốc, độ cao và khía
cạnh được xây dựng từ mô hình SRTM với độ phân giải không gian
30m. Mật độ dân số, lượng mưa trung bình hàng tháng và các yếu tố
tốc độ gió được xây dựng từ cơ sở dữ liệu WorldPop và WorldClim.
Kết quả thu được cho thấy thuật toán RF với tham số
numberOfTrees 100 cho phép dự báo nguy cơ cháy rừng với độ chính
xác cao. Qua phân tích 36 điểm từng xảy ra cháy cho thấy, 31/36 điểm
phân bố trên địa bàn có mức độ nguy cơ cháy cao và rất cao. Kết quả
24
thu được có thể được sử dụng hiệu quả cho công tác giám sát, cảnh
báo sớm nguy cơ cháy rừng và góp phần giảm thiểu thiệt hại do cháy
rừng gây ra.
Kiến nghị
Do khả năng chủ động của nguồn dữ liệu viễn thám và GIS, bước
tiếp theo có thể xây dựng phần mềm tự động cập nhật và bóc tách các
lớp đầu vào của mô hình dự báo nguy cơ cháy rừng, từ đó đưa ra kết
quả dự báo kịp thời.
Ngoài dữ liệu tại chỗ từ cơ sở dữ liệu của Cục Kiểm lâm (Bộ Nông
nghiệp và Phát triển nông thôn), cần thu thập các dữ liệu khác về các
khu vực từng xảy ra cháy rừng để giúp tăng độ chính xác của mô hình
học máy trong quá trình học tập và phân loại..
25
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ
[1]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu (2018). Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn,
Nghệ An,, Hội nghị ERSD, trang 71.
[2]. Nguyễn Văn Trung, Đoàn Thị Nam Phương, Bùi Tiến Diệu
(2018). Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và
Landsat-8 thành lập bản đồ mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn,
Nghệ An, Tạp chí Khoa học kỹ thuật Mỏ - Địa chât ISSN 1859-1469
Tâp 59 Kỳ 5, trang 44.
[3]. Doan Thi Nam Phuong, Nguyen Van Trung, Bui Tien Dieu
(2019). Evaluation of forest fire on Na Ngoi commune, Ky Son, Nghe
An using Sentinel 2A and Landsat-8 Operational Land Imager (OLI)
spectral indices, Hội nghị Khoa học Quốc tế Forum, trang 71 (Bài báo
đăng kỷ yếu Hội nghị Quốc tế có phản biện).
[4]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Phạm Thị Thanh
Hòa, Trần Thanh Hà, Lê Thanh Nghị (2019). Quy trình thành lập bản
đồ mức độ cháy rừng bằng dữ liệu ảnh vệ tinh Sentinel-2. Tạp chí Tài
nguyên và Môi trường ISSN 1859-1477 số 19 kì 1 tháng 10, trang 30.
[5]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu, Nguyễn Văn Sơn, Trần Thị Trúc Mai, Ngô Thanh Xuân (2020). Xây dựng và chuẩn hóa các cơ sở dữ liệu thành phần phục vụ dự báo nguy
cơ cháy rừng, Hội nghị ERSD, trang 71. [6]. Doan Thi Nam Phuong, Nguyen Van Trung, Pham Thi Thanh Hoa, Tran Thanh Ha, Le Thi Thu Ha (2022). Forest Fire Risk Assessment and Mapping Using Support Vector Machine Algorithm, A Case Study in Nghe An Province, Viet Nam. European Geographical Studies. 9(1), 3 - 12, DOI: 10.13187/egs.2022.1.3.