BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT

ĐOÀN THỊ NAM PHƯƠNG

LỰA CHỌN MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG

TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ

NGÀNH: KỸ THUẬT TRẮC ĐỊA - BẢN ĐỒ

MÃ SỐ: 9520503

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT

Hà Nội - 2023

Công trình được hoàn thành tại: Bộ môn Đo ảnh và Viễn thám,

Khoa Trắc địa - Bản đồ và Quản lý đất đai,

Trường Đại học Mỏ - Địa chất

Người hướng dẫn khoa học:

1. PGS. TS Nguyễn Văn Trung – Trường Đại học Mỏ - Địa chất

2. GS.TS Bùi Tiến Diệu – Trường Đại học Đông Nam (Na Uy)

Phản biện 1: PGS.TS Trần Vân Anh-Trường Đại học Mỏ - Địa chất

Phản biện 2: PGS.TS Trịnh Lê Hùng - Học viện Kỹ thuật Quân sự

Phản biện 3: PGS.TS Phạm Quang Vinh - Viện Địa lý

Luận án được bảo vệ tại Hội đồng đánh giá luận án cấp Trường

Họp tại Trường Đại học Mỏ - Địa chất vào hồi 8 giờ 30,

ngày tháng năm 2023

Có thể tìm hiểu luận án tại:

- Thư viện Quốc gia

- Thư viện Trường Đại học Mỏ - Địa chất

1

MỞ ĐẦU

1. Tính cấp thiết của đề tài

Các mô hình dự báo nguy cơ cháy rừng đều có những ưu, nhược điểm

riêng và việc lựa chọn mô hình phù hợp với điều kiện tự nhiên, xã hội, dữ

liệu ở từng khu vực cụ thể là một vấn đề có tính thực tiễn cao. Với những

lý do trên, luận án “Lựa chọn mô hình dự báo nguy cơ cháy rừng từ

dữ liệu viễn thám và hệ thông tin địa lý” được lựa chọn xuất phát từ

nhu cầu thực tế, có ý nghĩa khoa học và thể hiện sự cần thiết phải

nghiên cứu.

2. Mục tiêu nghiên cứu

Lựa chọn được mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn

thám và hệ thông tin địa lý khu vực phía tây tỉnh Nghệ An.

3. Nội dung nghiên cứu

- Tổng quan về vấn đề nghiên cứu:

- Cơ sở khoa học xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ

liệu viễn thám và hệ thông tin địa lý;

- Thu thập, tiền xử lý và chiết tách các lớp thông tin chuyên đề từ dữ

liệu viễn thám và hệ thông tin địa lý;

- Nghiên cứu đề xuất qui trình xây dựng bản đồ dự báo nguy cơ cháy

rừng từ dữ liệu viễn thám và hệ thông tin địa lý trên cơ sở các kỹ thuật

như AHP, Rừng ngẫu nhiên (RF), Máy hỗ trợ vector (SVM), Cây phân

loại và hồi quy (CART);

- Đánh giá và lựa chọn mô hình phù hợp với điều kiện cụ thể khu

vực phía tây tỉnh Nghệ An;

- Phân tích kết quả.

2

4. Đối tượng và phạm vi nghiên cứu

- Đối tượng nghiên cứu là các mô hình dự báo nguy cơ cháy rừng

trên cơ sở kết hợp dữ liệu viễn thám, hệ thông tin địa lý và các kỹ thuật

học máy.

- Phạm vi khoa học của luận án tập trung vào phân tích, đánh giá,

thử nghiệm nhằm lựa chọn mô hình dự báo cháy rừng phù hợp với

điều kiện cụ thể khu vực nghiên cứu.

- Phạm vi không gian của luận án là khu vực phía tây tỉnh Nghệ An.

5. Phương pháp nghiên cứu

- Phương pháp phân tích, tổng hợp

- Phương pháp viễn thám

- Phương pháp GIS

- Phương pháp học máy, phương pháp mô hình hóa

- Phương pháp thống kê

6. Ý nghĩa khoa học và thực tiễn của đề tài

6.1 Ý nghĩa khoa học

Góp phần hoàn thiện cơ sở khoa học và minh chứng tính hiệu quả

của phương pháp ứng dụng dữ liệu viễn thám, GIS và các kỹ thuật trí

tuệ nhân tạo (học máy) trong xây dựng mô hình dự báo nguy cơ cháy

rừng

6.2 Ý nghĩa thực tiễn

Cung cấp thông tin và công cụ xử lý dữ liệu viễn thám, GIS trên nền

tảng Google Earth Engine để các nhà quản lý đưa ra các biện pháp

trong giám sát và cảnh báo sớm nguy cơ cháy rừng. Bên cạnh đó, kết

quả nhận được trong đề tài cũng có thể sử dụng, tham khảo trong công

tác nghiên cứu khoa học, giảng dạy ở các trường đại học, viện nghiên

cứu.

3

7. Những điểm mới của luận án

- Lựa chọn được 9 lớp thông tin đầu vào cho mô hình dự báo nguy

cơ cháy rừng khu vực phía tây tỉnh Nghệ An từ dữ liệu viễn thám và

GIS là phù hợp với điều kiện khu vực nghiên cứu.

- Lựa chọn được mô hình dự báo nguy cơ cháy rừng khu vực phía

tây tỉnh Nghệ An bằng dữ liệu viễn thám và GIS trên cơ sở thuật toán

Random Forest.

8. Luận điểm bảo vệ

Luận điểm 1: Các lớp thông tin đầu vào chiết xuất từ dữ liệu viễn

thám và GIS (mật độ dân số, lớp phủ thực vật, độ bốc thoát hơi nước,

hướng sườn, độ dốc, tốc độ gió, độ cao, nhiệt độ bề mặt và lượng mưa

trung bình tháng) cho phép xây dựng mô hình dự báo nguy cơ cháy

rừng phù hợp với điều kiện khu vực nghiên cứu ở phía Tây tỉnh Nghệ

An.

Luận điểm 2: Kỹ thuật học máy (thuật toán Random Forest) giúp

dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS với độ chính

xác cao nhất đối với khu vực nghiên cứu.

9. Kết cấu của luận án

Luận án gồm 03 chương chính, phần mở đầu, kết luận - kiến nghị và

tài liệu tham khảo. Nội dung chính của luận án được trình bày trong

03 chương

4

CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU

1. Tổng quan tình hình nghiên cứu trong và ngoài nước

1.1 Đặc điểm tài nguyên rừng Việt Nam

1.2 Hiện trạng cháy rừng ở Việt Nam

1.2.1 Khái niệm cháy rừng

Theo Tổ chức Lương thực và Nông nghiệp Thế giới (FAO): “Cháy

rừng là sự xuất hiện và lan rộng của đám cháy trong các khu rừng

ngoài tầm kiểm soát của con người; gây ra những tổn thất về nhiều

mặt về tài nguyên, tài sản và môi trường' (FAO, 1999).

1.2.2 Quy định về cấp dự báo cháy rừng

Cấp dự báo cháy rừng được quy định tại Điều 46 Nghị định

156/2018/NĐ-CP (ngày 16/11/2018) quy định chi tiết thi hành một số

điều của Luật Lâm nghiệp, trong đó cấp dự báo cháy rừng gồm 5 cấp,

từ cấp Tôi lên cấp V.

1.2.3 Phân tích tình hình cháy rừng ở Việt Nam

1.3 Nguyên nhân cháy rừng ở Việt Nam

- Cháy rừng do biến đổi khí hậu.

- Cháy rừng do hoạt động của con người và sinh học

1.4 Các phương pháp dự báo cháy rừng

1.4.1 Các phương pháp dự báo cháy rừng truyền thống

Các nghiên cứu về cháy rừng đã được các nhà khoa học Mỹ, Liên

Xô (cũ), Canada, Nhật Bản, Trung Quốc... quan tâm từ đầu thế kỷ 20.

Các phương pháp dự báo cháy rừng truyền thống dựa trên mối quan

hệ giữa các yếu tố khí tượng, khí hậu và vật liệu dễ cháy.

1.4.2 Các phương pháp sử dụng dữ liệu viễn thám và GIS

Các phương pháp dự báo nguy cơ cháy rừng sử dụng tư liệu viễn

thám và GIS là quá trình đánh giá mức độ ảnh hưởng của các yếu tố

5

tự nhiên và xã hội trong quá trình hình thành cháy rừng. Các yếu tố

này bao gồm (Phạm Ngọc Hùng, 2004): đặc điểm của rừng, lửa kết

cấu vật liệu, khí hậu và thời tiết, địa hình. Ngoài ra, một số mô hình

dự báo nguy cơ cháy rừng còn sử dụng các lớp đầu vào như khoảng

cách từ khu dân cư đến rừng, khoảng cách từ các tuyến giao thông vào

rừng, số người vào rừng trung bình mỗi ngày… (Gholamreza, 2012) .

1.5 Tổng quan tình hình nghiên cứu trên thế giới và Việt Nam

1.5.1 Trên thế giới

Cháy rừng là một hiện tượng phức tạp, khó mô hình hóa và quản lý.

Có nhiều yếu tố góp phần gây ra cháy rừng và lan rộng, chẳng hạn như

yếu tố con người, các biến đổi địa hình và khí tượng. Xây dựng mô

hình dự báo nguy cơ cháy rừng và phân loại nguy cơ cháy rừng là vấn

đề cấp thiết, cung cấp thông tin kịp thời cho công tác bảo vệ và phát

triển tài nguyên rừng. Công nghệ địa không gian, bao gồm công nghệ

viễn thám và hệ thống thông tin địa lý (GIS) được ứng dụng rộng rãi

và hiệu quả trong xây dựng mô hình dự báo nguy cơ cháy rừng. Viễn

thám và GIS cho phép thu thập dữ liệu về độ che phủ của rừng để phân

tích, quản lý và lập mô hình cảnh báo sớm nguy cơ cháy rừng.

Jaiswal et al. (2002) đã sử dụng phương pháp phân tích thứ bậc

(AHP) để lập bản đồ nguy cơ cháy rừng tại khu vực Subwatershed

Gorna (bang Madhya Pradesh, Ấn Độ) dựa trên cơ sở dữ liệu ảnh vệ

tinh IRS và công nghệ GIS. Kết quả thu được cho thấy, gần 30% diện

tích khu vực nghiên cứu có nguy cơ cháy rừng ở mức “cao” đến “rất

cao”, phù hợp với các địa bàn xảy ra cháy rừng. (Jaiswal và cộng sự,

2002). Trong nghiên cứu (Wimberly et al., 2008), các tác giả đã sử

dụng dữ liệu ảnh vệ tinh Landsat đa thời gian để lập bản đồ mức độ

nghiêm trọng của các vụ cháy rừng ở phía nam Appalachia (Bắc

6

Carolina, Hoa Kỳ). Chỉ số tỷ lệ bỏng được chuẩn hóa (NBR) được tính

toán từ các dải hồng ngoại sóng ngắn và hồng ngoại gần của hình ảnh

Landsat được sử dụng để đánh giá sự thay đổi lớp phủ mặt đất trước

và sau đám cháy.

Nhiều nghiên cứu đã sử dụng các kỹ thuật trí tuệ nhân tạo (mạng nơ-

ron nhân tạo, rừng ngẫu nhiên, máy vector hỗ trợ) kết hợp với phương

pháp phân tích thứ bậc AHP để nâng cao độ chính xác của các mô hình

dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS (Vasilakos et

al., 2009; Oliveira và cộng sự, 2012; Bùi Tiến Diệu và cộng sự, 2016,

2017). Các kỹ thuật hồi quy như hồi quy bội (Oliveira và cộng sự,

2012), hồi quy logistic (Pourghasemi, 2015), hồi quy theo trọng số địa

lý (GWR) (Fernandez và cộng sự, 2012), kỹ thuật khai thác dữ liệu

(Arpaci và cộng sự, 2014) là còn được sử dụng để xây dựng mô hình

dự báo nguy cơ cháy rừng trên cơ sở đánh giá mối quan hệ giữa các

yếu tố tự nhiên - xã hội với khả năng xảy ra cháy rừng.

1.5.2 Trong nước

Ở Việt Nam, một số nghiên cứu đã sử dụng dữ liệu nhiệt độ bề mặt

đất tính toán từ ảnh hồng ngoại nhiệt Landsat và MODIS để cảnh báo

sớm các vùng có nguy cơ cháy rừng cao (Vương Văn Quỳnh, 2005;

Đoàn Hà Phong, 2007; Trần Quang Báo và nnk., 2016). Dữ liệu viễn

thám hồng ngoại nhiệt cũng được sử dụng trong nghiên cứu (Trinh và

Zablotskii, 2017) để phát hiện cháy than dưới bề mặt trong các mỏ

than. Các nghiên cứu (Nguyễn Ngọc Thạch và cộng sự, 2015; Đặng

Ngô Bảo Toàn, 2021; Hoàng và cộng sự, 2020) cũng đã sử dụng dữ

7

liệu viễn thám và GIS để lập bản đồ nguy cơ cháy rừng ở các khu vực

khác nhau ở Việt Nam dựa trên kỹ thuật máy học.

Kết quả thu được cho thấy kỹ thuật máy học cho phép phân loại rủi

ro cháy rừng với độ chính xác cao hơn so với phương pháp truyền

thống sử dụng kỹ thuật phân tích thứ bậc (AHP). Nhìn chung, các

nghiên cứu trên đã chứng minh hiệu quả của công nghệ viễn thám và

GIS trong xây dựng mô hình dự báo nguy cơ cháy rừng phục vụ công

tác giám sát, giảm thiểu thiệt hại do cháy rừng gây ra.

1.6 Thảo luận vấn đề nghiên cứu

Phân tích các nghiên cứu trên thế giới và Việt Nam cho thấy, các mô

hình dự báo nguy cơ cháy rừng phù hợp với điều kiện tự nhiên - xã

hội của từng vùng, không thể áp dụng cho các vùng khác nhau. Vì vậy,

đối với từng khu vực cụ thể, cần nghiên cứu, đánh giá nguyên nhân

cháy rừng, từ đó lựa chọn, xây dựng mô hình dự báo nguy cơ cháy

rừng phù hợp. Với sự phát triển mạnh mẽ của kỹ thuật trí tuệ nhân tạo

trong những năm gần đây, việc sử dụng thuật toán học máy trong xây

dựng mô hình dự báo nguy cơ cháy rừng là hướng tiếp cận phù hợp và

hiệu quả dựa trên dữ liệu viễn thám và dữ liệu GIS.

1.7 Tiểu kết chương 1

Trong chương 1, NCS đã phân tích đặc điểm tài nguyên rừng Việt

Nam, nguyên nhân cháy rừng, các phương pháp dự báo nguy cơ cháy

rừng, đánh giá tổng quan tình hình nghiên cứu trên thế giới và Việt

Nam. Từ những kết quả thu được, nghiên cứu sinh đã luận giải những

8

vấn đề còn tồn tại, đề xuất giải pháp trong luận án nhằm nâng cao hiệu

quả công tác cảnh báo sớm nguy cơ cháy rừng.

CHƯƠNG 2. CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH

DỰ BÁO NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM

VÀ HỆ THÔNG TIN ĐỊA LÝ 2.1 Đặc điểm khu vực nghiên cứu

Khu vực nghiên cứu nằm ở phía Tây tỉnh Nghệ An, thuộc vùng Bắc Trung Bộ Việt Nam, có tọa độ địa lý từ 18º33' đến 20º01'N, 103º52' đến 105º48'E..

Hình 2.1 Vị trí địa lý tỉnh Nghệ An

2.2 Tổng quan về dữ liệu xây dựng mô hình dự báo cháy rừng 09 nhân tố để xây dựng mô hình dự báo nguy cơ cháy rừng, bao

gồm:

+ Mật độ dân số

+ Lớp phủ thực vật (chỉ số NDVI) + Bốc hơi bề mặt + Khía cạnh + Độ dốc + Tốc độ gió

9

+ Độ cao

+ Nhiệt độ bề mặt đất + Lượng mưa trung bình tháng.

2.3 Phương pháp xây dựng cơ sở dữ liệu thành phần 2.3.1 Các lớp dữ liệu đầu vào trích xuất từ ảnh viễn thám a) Lớp phủ thực vật Chỉ số NDVI được sử dụng để thể hiện hệ số che phủ thực vật trong mô hình dự báo nguy cơ cháy rừng. NDVI được tính từ giá trị hệ số phản xạ phổ trong các kênh màu đỏ và cận hồng ngoại của hình ảnh đa phổ theo phương trình (Rouse et al., 1973):

(1)

Trong đó, NIR và RED là phổ phản xạ bề mặt ở kênh cận hồng ngoại

và kênh đỏ. Với ảnh Sentinel 2 MSI tương ứng với kênh 8 và kênh 4.

b) Thông tin độ ẩm bề mặt

Độ bốc thoát hơi nước cũng có thể được sử dụng trong xây dựng lớp

thông tin đầu vào về độ ẩm bề mặt. Độ bốc thoát hơi nước có thể chiết

xuất từ ảnh viễn thám quang học như Landsat, MODIS..., trong đó sản

phẩm độ bốc thoát hơi nước xác định từ ảnh MODIS được sử dụng

một cách rộng rãi và được cung cấp trên nền tảng GEE.

c) Thông tin nhiệt độ bề mặt

Nhiệt độ bề mặt đất được trích xuất từ dữ liệu viễn thám hồng ngoại

nhiệt Landsat 8 bằng mô hình của NASA. Ở bước đầu tiên, dữ liệu

dải TIRS (Qcal) phải được chuyển đổi thành bức xạ quang phổ TOA

(Lλ) bằng cách sử dụng hệ số thay đổi tỷ lệ bức xạ được cung cấp

trong tệp siêu dữ liệu theo phương trình sau

(http://landsat.gsfc.nasa.gov):

(2)

10

Trong đó:

ML, AL – Hệ số chuyển đổi, được lấy trong tệp siêu dữ liệu (metadata

file) ảnh Landsat 8;

Ở bước thứ hai, các dải nhiệt của Landsat 8 có thể được chuyển đổi từ dạng bức xạ quang phổ (Lλ) thành nhiệt độ sáng (TB) bằng phương trình sau (http://landsat.gsfc.nasa.gov):

(3)

Trong đó: K1 và K là các hệ số, được cung cấp trong tệp siêu dữ

liệu ảnh Landsat 8.

Để xác định nhiệt độ bề mặt đất từ dữ liệu Landsat 8, cần có giá trị

phát xạ bề mặt đất. Độ phát xạ bề mặt được xác định bằng phương

pháp dựa trên ảnh NDVI do Valor và Caselles (1996) đề xuất theo

phương trình sau:

(4)

Trong đó: ε – Độ phát xạ bề mặt

εv, εs – Độ phát xạ của lớp phủ thực vật thuần khiết và diện tích đất

thuần khiết tương ứng.

Pv là tỉ lệ thực vật trong từng pixel, được xác định

theo công thức sau (Vlassova et al., 2014):

(5)

Ở bước cuối cùng, nhiệt độ bề mặt đất có thể được tính theo phương

trình sau (6):

(6)

11

2.3.2 Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa

Dữ liệu độ cao (DEM) của Shuttle Radar Topography Mission

(SRTM) với độ phân giải không gian 30m được thu thập và xử lý để

xây dựng các yếu tố địa hình cho mô hình rủi ro cháy rừng, bao gồm

độ cao, hướng và độ dốc

2.3.3 Nhóm các lớp thông tin khác

Các lớp dữ liệu Tốc độ gió, Lượng mưa trung bình tháng được trích

xuất qua cơ sở dữ liệu WorldClim (https://www.worldclim.org/).

Lớp dữ liệu Mật độ dân số được trích xuất qua tập dữ liệu nhân khẩu

học WorldPop (https://data.worldpop.org/).

2.4 Phương pháp xử lý dữ liệu trên nền tảng Google Earth

Engine

Google Earth Engine (GEE) là một nền tảng phân tích không gian

địa lý dựa trên điện toán đám mây cho phép người dùng trực quan hóa

và phân tích hình ảnh vệ tinh Trái đất. Bộ dữ liệu của GEE lưu trữ dữ

liệu viễn thám của các hệ thống vệ tinh trong giai đoạn 40 năm qua,

cùng với các công cụ tính toán cần thiết để phân tích và khai thác kho

dữ liệu khổng lồ đó mà không cần phải tải về máy tính. Không những

thế, dữ liệu từ GEE có thể sử dụng trên các phần mềm khác như QGIS,

GIS, Foris để tối ưu hóa dữ liệu. Nền tảng được sử dụng miễn phí với

mục đích nghiên cứu, giáo dục và mục đích phi lợi nhuận. Danh mục

dữ liệu công khai của GEE bao gồm nhiều bộ dữ liệu raster lên đến 5

triệu gigabyte (5 petabyte).

12

2.5 Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ

dữ liệu viễn thám và hệ thông tin địa lý

2.5.1 Phương pháp phân tích thứ bậc AHP Phương pháp AHP được phát triển bởi Saaty là một trong

những cách tiếp cận phân tích đa chỉ tiêu (MCA) linh hoạt và thuận

lợi nhất, đã được sử dụng rộng rãi trong xây dựng các mô hình dự báo

nguy cơ cháy rừng từ dữ liệu viễn thám và GIS. Trong mô hình dự báo

nguy cơ cháy rừng theo phương pháp AHP, mỗi yếu tố đầu vào có giá

trị trọng số ảnh hưởng riêng, từ đó xây dựng bản đồ phân vùng nguy

cơ cháy rừng.

2.5.2 Phương pháp sử dụng thuật toán Rừng ngẫu nhiên

Hình 2. Sơ đồ thuật toán RF trong phân loại (chỉnh sửa từ nguồn: https://www.section.io/)

13

2.5.3 Phương pháp sử dụng thuật toán Máy hỗ trợ vector

Hình 3. Mô tả các vector hỗ trợ trong thuật toán SVM

2.5.4 Phương pháp sử dụng thuật toán cây phân loại và hồi quy

Hình 4 Mô tả thuật toán Cây Phân loại và hồi quy CART (nguồn: https://www.javatpoint.com/)

14

Hình 5 Sơ đồ quy trình công nghệ lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS

2.6 Tiểu kết chương 2

Trong chương 2, lựa chọn 09 lớp dữ liệu đầu vào của mô hình dự

báo nguy cơ cháy rừng bao gồm: mật độ dân số, lớp phủ thực vật, bốc

thoát hơi nước bề mặt, độ cao. , độ dốc, khía cạnh, tốc độ gió, nhiệt độ

bề mặt đất và lượng mưa trung bình hàng tháng.

04 phương pháp đã được thử nghiệm bao gồm: kỹ thuật AHP và

03 phương pháp học máy (RF, SVM, CART).

15

CHƯƠNG 3. THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY

RỪNG KHU VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU

VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ

3.1 Đặc điểm dữ liệu sử dụng

3.1.1 Dữ liệu viễn thám

65 cảnh Sentinel 2A và Sentinel 2B được chụp từ ngày 15 tháng 11

năm 2021 đến ngày 16 tháng 1 năm 2022, 15 Ảnh đa phổ Landsat 8

OLI_TIRS với đường dẫn/hàng 127/047, 127/046 và 128/046 được chụp

trong khoảng thời gian từ ngày 15 tháng 11 năm 2021 đến ngày 16 tháng

1 năm

2022 Hình 6: Dữ liệu ảnh Sentinel 2 MSI khu vực nghiên cứu

3.1.2 Dữ liệu GIS Dữ liệu độ cao của Shuttle Radar Topography Mission (SRTM) với

độ phân giải không gian 30m (Hình 7) được thu thập và xử lý để xây

dựng các yếu tố địa hình cho mô hình dự báo cháy rừng, bao gồm độ

cao, hướng và độ dốc.

Hình 7: Mô hình SRTM của khu vực nghiên cứu

Dữ liệu mật độ dân số được thu thập từ cơ sở dữ liệu WorldPop

16

(https://data.worldpop.org/). Trong khi đó, tốc độ gió và lượng mưa

trung bình hàng tháng được thu thập từ cơ sở dữ liệu WorldClim

(https://data.worldclim.org/).

3.2 Kết quả xây dựng các lớp thông tin chuyên đề

Hình ảnh Sentinel 2 MSI sau khi thu thập và tiền xử lý được sử dụng

để tính toán chỉ số thực vật NVDI. Trong khi đó, ảnh Landsat 8 được

dùng để tính toán nhiệt độ bề mặt đất theo mô hình của NASA. Kết

quả thành lập bản đồ lớp phủ thực vật (chỉ số NDVI), bốc thoát hơi

nước bề mặt và các tầng nhiệt độ bề mặt đất khu vực phía Tây tỉnh

Nghệ An từ tư liệu viễn thám được trình bày trong Hình 8.

Hình 8: Các lớp dữ liệu NDVI, NMDI và nhiệt độ bề mặt đất cho

mô hình dự báo nguy cơ cháy rừng

Hình 9: Các lớp dữ liệu Độ cao, Độ dốc và hướng sườn cho mô

hình dự báo nguy cơ cháy rừng

17

Hình 10 trình bày tốc độ gió, lượng mưa trung bình tháng và các lớp

đầu vào mật độ dân số của mô hình dự báo nguy cơ cháy rừng ở khu

vực phía Tây tỉnh Nghệ An. Do độ phân giải của dữ liệu được thu thập

từ cơ sở dữ liệu WorldPop và WorldClime là 1000m nên để phù hợp

với các lớp dữ liệu khác của mô hình dự báo rủi ro cháy rừng, các lớp

dữ liệu này được nội suy thành kích thước pixel 10m.

Hình 10: Các lớp dữ liệu về tốc độ gió, lượng mưa trung bình hàng

tháng và mật độ dân số cho mô hình dự báo nguy cơ cháy rừng

3.3 Kết quả lập bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn

thám và GIS

3.3.1 Dự báo nguy cơ cháy rừng bằng kỹ thuật AHP

Từ 9 lớp đầu vào của mô hình dự báo nguy cơ cháy rừng được lựa

chọn trong luận án, đánh giá vai trò của từng nhân tố ảnh hưởng đến

khả năng xảy ra cháy rừng thông qua ma trận so sánh cặp các chỉ tiêu

bằng phương pháp AHP. Kết quả dự báo nguy cơ cháy rừng khu vực

phía Tây tỉnh Nghệ An bằng kỹ thuật AHP được thể hiện trong Hình

11, trong đó nguy cơ cháy rừng được phân thành 5 cấp: rất thấp, thấp,

trung bình, cao và rất cao.

18

Hình 11: Bản đồ vùng nguy cơ cháy rừng sử dụng kỹ thuật AHP

3.3.2 Dự báo nguy cơ cháy rừng bằng thuật toán RF

Để dự báo nguy cơ cháy rừng bằng thuật toán Random Forest, luận án đã thử nghiệm với nhiều giá trị khác nhau của tham số numberOfTrees. Kết quả thu được cho thấy thuật toán RF với tham số numberOfTrees bằng 100 có độ chính xác cao nhất trong dự báo nguy cơ cháy rừng. Bản đồ phân vùng nguy cơ cháy rừng khu vực phía Tây tỉnh Nghệ An thành lập bằng thuật toán RF (100) được trình bày trong Hình 12

19

Hình 12: Bản đồ vùng nguy cơ cháy rừng sử dụng thuật toán RF(100) 3.3.3 Dự báo nguy cơ cháy rừng bằng thuật toán SVM

Để đánh giá nguy cơ cháy rừng bằng thuật toán SVM, nghiên cứu

này đã thử nghiệm với các giá trị khác nhau của tham số chi phí (C).

Hình 13: Bản đồ vùng nguy cơ cháy rừng sử dụng thuật toán SVM(25)

20

Tham số C cho thuật toán SVM biết cách cân bằng hai mục tiêu cạnh tranh nhằm tối đa hóa chênh lệch giữa hai lớp và không cho phép bất kỳ mẫu nào bị phân loại sai. Nếu C = 0 thì thuật toán không cho phép bất kỳ mẫu nào bị phân loại sai. Nếu C > 0 thì thuật toán có thể đánh đổi một số mẫu bị phân loại sai để tìm một lề phân tách tốt hơn các điểm còn lại. Từ việc phân tích phân bố số liệu cháy rừng, tham số C=25 cho phép dự báo nguy cơ cháy rừng tại khu vực nghiên cứu với độ chính xác cao nhất (Hình 13). 3.3.4 Dự báo nguy cơ cháy rừng bằng thuật toán CART

Tương tự như thuật toán học máy RF và SVM, để dự báo nguy cơ cháy rừng khu vực phía Tây tỉnh Nghệ An bằng thuật toán CART, luận án đã thử nghiệm với các giá trị tham số maxNodes khác nhau, tương ứng với số lượng tham số. số nút lá tối đa trên mỗi cây quyết định. Kết quả thu được cho thấy, với giá trị tham số maxNodes là 30, kết quả dự báo nguy cơ cháy rừng có độ chính xác cao nhất khi so sánh với số liệu thực địa (Hình 14).

Hình 14: Bản đồ vùng nguy cơ cháy rừng sử dụng thuật toán CART(30)

21

3.4 Đánh giá độ chính xác của mô hình dự báo nguy cơ cháy

rừng

Dữ liệu thực địa từ cơ sở dữ liệu của Cục Kiểm lâm (Bộ NN&PTNT) gồm 36 điểm cháy và 61 điểm không cháy được sử dụng để so sánh, đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy rừng (Bảng 1). Kết quả thu được cho thấy, mô hình sử dụng thuật toán RF100 có độ chính xác cao nhất, trong đó 31/36 điểm cháy phân bố ở khu vực có mức độ cháy cao và rất cao.b) Đánh giá dựa trên đường cong ROC Bảng 1. So sánh kết quả dự báo nguy cơ cháy rừng giữa các mô hình Cấp độ nguy cơ cháy rừng

Thấp TB Cao Thuật toán Rất thấp Rất cao

Điểm cháy 0 19 8 3 6

RF3 11 2 9 18 21 Điểm không cháy

Điểm cháy 0 23 8 2 3

RF100 14 2 5 25 15 Điểm không cháy

Điểm cháy 2 3 20 2 9

RF200 8 7 12 17 17 Điểm không cháy

Điểm cháy 0 29 4 2 1

CART5 8 30 2 11 10 Điểm không cháy

Điểm cháy 0 24 8 2 2

CART30 10 29 1 19 2 Điểm không cháy

Điểm cháy 0 SVM30 25 6 4 2

22

5 3 38 15 0 Điểm không cháy

Điểm cháy 3 11 18 3 1

SVM25 17 8 28 5 3 Điểm không cháy

Điểm cháy 8 7 15 6 0

AHP 3 5 31 22 0 Điểm không cháy

Ngoài ra, nghiên cứu còn sử dụng đường cong ROC và chỉ số AUC để đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy rừng (Bảng 2), trong đó thuật toán RF100 cũng có giá trị AUC cao nhất

Bảng 2. Giá trị AUC của các mô hình học máy RF (3) CART (30) CART (5) RF (200) SVM (25) SVM (30) RF (100)

0.947 0.938 0.905 0.916 0.756 0.743 AUC 0.951

3.5 Xây dựng công cụ xử lý dữ liệu trên nền tảng GEE

Trong nghiên cứu, nghiên cứu sinh sử dụng ngôn ngữ lập trình

JavaScript trên giao diện Code Editor để xử lý dữ liệu ảnh Landsat 8/9

và Sentinel 2 MSI và GIS (Hình 15).

Hình 15: Công cụ xử lý dữ liệu địa không gian trên nền tảng GEE

23

3.6 Tiểu kết chương 3

Trong chương 3, các mô hình dự báo nguy cơ cháy rừng

khu vực phía Tây tỉnh Nghệ An đã được thử nghiệm để lựa chọn mô

hình phù hợp cho khu vực nghiên cứu. Trên cơ sở so sánh, đánh giá

kết quả dự báo nguy cơ cháy rừng từ mô hình đề xuất và dữ liệu thực

tế từ cơ sở dữ liệu của Cục Lâm nghiệp, phương pháp sử dụng thuật

toán Random Forest với giá trị tham số numberOfTrees 100 (RF100)

có độ chính xác cao nhất. Trong Chương 3, các công cụ phần mềm

cũng được xây dựng trên nền tảng điện toán đám mây GEE để xử lý

dữ liệu viễn thám và GIS.

KẾT LUẬN VÀ KIẾN NGHỊ

Kết luận

Trong nghiên cứu này, 09 yếu tố ảnh hưởng đến nguy cơ

cháy rừng bao gồm lớp phủ thực vật (chỉ số NDVI), bốc thoát hơi nước

bề mặt, độ cao, độ dốc, hướng, tốc độ gió, nhiệt độ bề mặt đất, lượng

mưa trung bình tháng và mật độ dân số được sử dụng để lập bản đồ

nguy cơ cháy rừng. dựa trên kỹ thuật AHP và các thuật toán RF, SVM,

CART. Dữ liệu hình ảnh Sentinel 2 MSI, MODIS và Landsat 8/9 được

sử dụng để tạo lớp dữ liệu lớp phủ thực vật, thoát hơi nước và nhiệt độ

bề mặt đất. Các lớp dữ liệu địa hình bao gồm độ dốc, độ cao và khía

cạnh được xây dựng từ mô hình SRTM với độ phân giải không gian

30m. Mật độ dân số, lượng mưa trung bình hàng tháng và các yếu tố

tốc độ gió được xây dựng từ cơ sở dữ liệu WorldPop và WorldClim.

Kết quả thu được cho thấy thuật toán RF với tham số

numberOfTrees 100 cho phép dự báo nguy cơ cháy rừng với độ chính

xác cao. Qua phân tích 36 điểm từng xảy ra cháy cho thấy, 31/36 điểm

phân bố trên địa bàn có mức độ nguy cơ cháy cao và rất cao. Kết quả

24

thu được có thể được sử dụng hiệu quả cho công tác giám sát, cảnh

báo sớm nguy cơ cháy rừng và góp phần giảm thiểu thiệt hại do cháy

rừng gây ra.

Kiến nghị

Do khả năng chủ động của nguồn dữ liệu viễn thám và GIS, bước

tiếp theo có thể xây dựng phần mềm tự động cập nhật và bóc tách các

lớp đầu vào của mô hình dự báo nguy cơ cháy rừng, từ đó đưa ra kết

quả dự báo kịp thời.

Ngoài dữ liệu tại chỗ từ cơ sở dữ liệu của Cục Kiểm lâm (Bộ Nông

nghiệp và Phát triển nông thôn), cần thu thập các dữ liệu khác về các

khu vực từng xảy ra cháy rừng để giúp tăng độ chính xác của mô hình

học máy trong quá trình học tập và phân loại..

25

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ

[1]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu (2018). Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn,

Nghệ An,, Hội nghị ERSD, trang 71.

[2]. Nguyễn Văn Trung, Đoàn Thị Nam Phương, Bùi Tiến Diệu

(2018). Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và

Landsat-8 thành lập bản đồ mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn,

Nghệ An, Tạp chí Khoa học kỹ thuật Mỏ - Địa chât ISSN 1859-1469

Tâp 59 Kỳ 5, trang 44.

[3]. Doan Thi Nam Phuong, Nguyen Van Trung, Bui Tien Dieu

(2019). Evaluation of forest fire on Na Ngoi commune, Ky Son, Nghe

An using Sentinel 2A and Landsat-8 Operational Land Imager (OLI)

spectral indices, Hội nghị Khoa học Quốc tế Forum, trang 71 (Bài báo

đăng kỷ yếu Hội nghị Quốc tế có phản biện).

[4]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Phạm Thị Thanh

Hòa, Trần Thanh Hà, Lê Thanh Nghị (2019). Quy trình thành lập bản

đồ mức độ cháy rừng bằng dữ liệu ảnh vệ tinh Sentinel-2. Tạp chí Tài

nguyên và Môi trường ISSN 1859-1477 số 19 kì 1 tháng 10, trang 30.

[5]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu, Nguyễn Văn Sơn, Trần Thị Trúc Mai, Ngô Thanh Xuân (2020). Xây dựng và chuẩn hóa các cơ sở dữ liệu thành phần phục vụ dự báo nguy

cơ cháy rừng, Hội nghị ERSD, trang 71. [6]. Doan Thi Nam Phuong, Nguyen Van Trung, Pham Thi Thanh Hoa, Tran Thanh Ha, Le Thi Thu Ha (2022). Forest Fire Risk Assessment and Mapping Using Support Vector Machine Algorithm, A Case Study in Nghe An Province, Viet Nam. European Geographical Studies. 9(1), 3 - 12, DOI: 10.13187/egs.2022.1.3.