BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT

ĐOÀN THỊ NAM PHƯƠNG

LỰA CHỌN MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG

TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ

LUẬN ÁN TIẾN SĨ KỸ THUẬT

HÀ NỘI - 2023

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT

ĐOÀN THỊ NAM PHƯƠNG

LỰA CHỌN MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG

TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ

Ngành: Kỹ thuật Trắc địa – Bản đồ

Mã số: 9520503

LUẬN ÁN TIẾN SĨ KỸ THUẬT

TIỂU BAN HƯỚNG DẪN

1.PGS. TS. NGUYỄN VĂN TRUNG

2. GS.TS. BÙI TIẾN DIỆU

HÀ NỘI - 2023

i

LỜI CAM ĐOAN

Tôi xin cam đoan luận án này là công trình nghiên cứu khoa học của riêng

tôi. Các số liệu trình bày trong luận án được phản ánh hoàn toàn trung thực.

Các kết quả nghiên cứu trong luận án chưa có ai công bố trong bất kỳ công

trình nghiên cứu nào.

Tác giả luận án

Đoàn Thị Nam Phương

ii

LỜI CẢM ƠN

Em xin chân thành cảm ơn Ban Giám hiệu, phòng đào tạo Sau đại học,

trường Đại học Mỏ - Địa chất đã tạo mọi điều kiện cho NCS trong quá trình

học tập và hoàn thành Luận án này.

Em xin gửi lời tri ân tới Quý Thầy, Quý Cô bộ môn Đo ảnh và viễn thám,

khoa Trắc địa - Bản đồ và Quản lý đất đai đã tận tình giảng dạy, chỉ bảo, góp ý

để em hoàn thiện Luận án tốt nhất.

Em xin bày tỏ lòng biết ơn sâu sắc đến Tiểu ban hướng dẫn khoa học,

Thầy PGS.TS Nguyễn Văn Trung và Thầy GS.TS Bùi Tiến Diệu đã tận tình

giúp đỡ, chỉ bảo em trong suốt quá trình thực hiện Luận án.

Em xin gửi lời cảm ơn chân thành tới các Nhà khoa học công tác tại các

cơ quan, viện nghiên cứu đã nhiệt tình giúp đỡ, hỗ trợ để em hoàn thành luận

án.

Xin gửi lời cảm ơn tới tất cả bạn bè, đồng nghiệp và gia đình những người

luôn ủng hộ, động viên và tạo mọi điều kiện tốt nhất để em hoàn thành luận án.

Do hạn chế về kiến thức, kinh nghiệm trong nghiên cứu khoa học nên

Luận án chắc chắn còn nhiều thiếu sót. Em rất mong sẽ nhận được nhiều ý kiến

góp ý và chỉ bảo của các Nhà khoa học để em dần nâng cao trình độ chuyên

môn hơn nữa.

Em xin chân thành cảm ơn!

iii

MỤC LỤC LỜI CAM ĐOAN ............................................................................................. i

LỜI CẢM ƠN .................................................................................................. ii

MỤC LỤC ....................................................................................................... iii

DANH MỤC CHỮ VIẾT TẮT ..................................................................... vi

DANH MỤC BẢNG BIỂU .......................................................................... viii

DANH MỤC HÌNH VẼ ................................................................................. ix

MỞ ĐẦU .......................................................................................................... 1

1. Tính cấp thiết của đề tài ............................................................................. 1

2. Mục tiêu nghiên cứu .................................................................................. 4

3. Nội dung nghiên cứu ................................................................................. 4

4. Đối tượng và phạm vi nghiên cứu ............................................................. 5

5. Phương pháp nghiên cứu ........................................................................... 5

6. Luận điểm bảo vệ ....................................................................................... 6

7. Những điểm mới của luận án ..................................................................... 6

8. Ý nghĩa khoa học và thực tiễn của luận án ................................................ 6

9. Cơ sở tài liệu thực hiện luận án ................................................................. 6

10. Cấu trúc luận án ....................................................................................... 7

CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU ......................... 8

1.1 Đặc điểm về tài nguyên rừng ở Việt Nam ............................................... 8

1.2 Hiện trạng cháy rừng ở Việt Nam ......................................................... 13

1.2.1 Khái niệm cơ bản về cháy rừng .......................................................... 13

1.2.2 Quy định về cấp dự báo cháy rừng ..................................................... 14

1.3 Nguyên nhân gây cháy rừng ở Việt Nam ............................................. 17

1.4 Các phương pháp dự báo nguy cơ cháy rừng ........................................ 18

1.5 Tổng quan tình hình nghiên cứu trong và ngoài nước .......................... 29

1.5.1 Trên thế giới .................................................................................... 29

iv

1.5.2 Trong nước ...................................................................................... 36

1.6 Luận giải những vấn đề cần nghiên cứu ................................................ 44

1.7 Tiểu kết chương 1 .................................................................................. 46

CHƯƠNG 2. CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH DỰ BÁO

NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG

TIN ĐỊA LÝ ................................................................................................... 48

2.1 Đặc điểm khu vực nghiên cứu ............................................................... 48

2.2 Tổng quan chung về dữ liệu phục vụ xây dựng mô hình dự báo nguy cơ

cháy rừng ..................................................................................................... 53

2.3 Các lớp thông tin thành phần và phương pháp xây dựng cơ sở dữ liệu

thành phần .................................................................................................... 54

2.3 Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa lý .............. 61

2.4 Nhóm các lớp thông tin khác ................................................................. 68

2.5 Phương pháp xử lý dữ liệu trên nền tảng Google Earth Engine ............ 70

2.6 Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn

thám và hệ thông tin địa lý .......................................................................... 72

2.6.1 Phương pháp phân tích thứ bậc AHP ................................................. 72

2.6.2 Phương pháp sử dụng thuật toán Rừng ngẫu nhiên ............................ 75

2.6.3 Phương pháp sử dụng thuật toán Máy hỗ trợ vector .......................... 77

2.6.4 Phương pháp sử dụng thuật toán cây phân loại và hồi quy ................ 79

2.6.5 Sơ đồ mô hình dự báo nguy cơ cháy rừng .......................................... 81

2.7 Tiểu kết chương 2 .................................................................................. 85

CHƯƠNG 3. THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY RỪNG KHU

VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ

THÔNG TIN ĐỊA LÝ ................................................................................... 87

3.1 Đặc điểm dữ liệu sử dụng ...................................................................... 87

3.1.1 Dữ liệu viễn thám ............................................................................ 87

v

3.1.2 Dữ liệu GIS ..................................................................................... 89

3.2 Kết quả xây dựng các lớp thông tin chuyên đề ..................................... 90

3.3 Kết quả xây dựng bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn thám

và GIS ........................................................................................................ 100

3.3.1 Kết quả dự báo nguy cơ cháy rừng bằng kỹ thuật AHP ............... 100

3.3.2 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán Random Forest103

3.3.3 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM ............ 106

3.3.4 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART .......... 107

3.4 Đánh giá độ chính xác và lựa chọn mô hình dự báo nguy cơ cháy rừng

.................................................................................................................... 109

3.5 Xây dựng công cụ xử lý dữ liệu viễn thám và GIS trên nền tảng GEE115

3.6 Tiểu kết chương 3 ................................................................................ 117

KẾT LUẬN VÀ KIẾN NGHỊ .................................................................... 119

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ ............... 122

TÀI LIỆU THAM KHẢO .......................................................................... 123

PHỤ LỤC………………………………………………………………….134

vi

DANH MỤC CHỮ VIẾT TẮT

Tên đầy đủ tiếng anh Tên đầy đủ tiếng việt

Tên viết tắt AB AdaBoost

AHP The Analytic Hierarchy Process

AUC AUC BĐĐH CA Phương pháp phân tích thứ bậc Đường cong AUC Bản đồ địa hình

CART Cây Phân loại và hồi quy Area Under the ROC Curve Under the Curve Topographic Map Cellular Automata Classification and Regression Trees

CMCN Cách mạng công nghệ Technological Revolution

CSDL Cơ sở dữ liệu

DEM

EFFIS Mô hình số độ cao Hệ thống thông tin cháy rừng châu Âu

for Environment ENVI Phần mềm xử lý ảnh ENVI

ETM+ Bộ cảm biến ETM+

Agriculture and FAO

FRI GB Database Digital Elevation Model The European Forest Fire Information System The Visualizing Images Enhanced Thematic Mapper Plus Food Organization Fire risk index Gradient Bo boost

GEE Google Earth Engine Tổ chức lương thực và nông nghiệp Liên hiệp quốc Chỉ số rủi ro cháy Nền tảng điện toán đám mây

Information GIS Hệ thông tin địa lý

GPS Hệ định vị toàn cầu

Weighted GWR Hồi quy trọng số địa lý

IDL Geographical System Global Position Systems Geographically Regression Interactive Data Language Ngôn ngữ lập trình IDL

vii

IPNAS

LDA LST LR LSWI MIR MSI Hệ thống giám sát cháy rừng tích hợp Nhiệt độ bề mặt Hồi quy logistic Chỉ số nước mặt Hồng ngoại trung Thiết bị quét đa phổ

Difference NDDI Chỉ số hạn khác biệt

Difference NDVI Chỉ số khác biệt thực vật

NDWI Chỉ số khác biệt nước

NIR Cận hồng ngoại

Multi- NMDI Chỉ số hạn NMDI

OLI Bộ cảm biến OLI

Operating ROC Đường cong ROC

RF SMI SVM SWIR TIR TM Rừng ngẫu nhiên Chỉ số độ ẩm đất Máy hỗ trợ vector Hồng ngoại sóng ngắn Hồng ngoại nhiệt Bộ cảm biến TM

TVWI Chỉ số ẩm nhiệt độ-thực vật

Vegetation TVDI Chỉ số hạn nhiệt độ thực vật

XGB Integral Forest Fire Monitoring System Linear Discriminant Analysis Land surface temperature Logistic Regression Land Surface Water Index Middle Infrared MultiScanner Instrument Normalized Drought Index Normalized Vegetation Index Normalized Difference Water Index Near Infrared Normalized band Drought Index Operational Land Image Receiver Characteristic Random Forest Soil Moisture Index Support Vector Machine Shortware Infrared Thermal Infrared Thematic Mapper Temperature-vegetation wetness index Temperature Dryness Index eXtreme Gradient Bo boost

viii

DANH MỤC BẢNG BIỂU

Tên bảng Trang Bảng

Diện tích và độ che phủ rừng các tỉnh, thành phố trực thuộc Bảng 1.1 10 trung ương tính đến 31/12/2020

Phân cấp dự báo cháy rừng (theo Nghị định 156/2018/NĐ- Bảng 1.2 15 CP)

Bảng tra cấp dự báo cháy rừng theo chỉ số P (Shetinsky, Bảng 1.3 19 1994)

Bảng 1.4 Bảng tra cấp dự báo cháy rừng theo Bộ NN&PTNT (2000) 20

Bảng phân cấp dự báo cháy rừng có điều chỉnh (Nguyễn Bảng 1.5 21 Phương Văn và cộng sự, 2019)

Cấp dự báo khả năng cháy rừng ở vườn quốc gia U Minh Hạ Bảng 1.6 22 theo chỉ số Pt (Trần Văn Hùng và cộng sự, 2010)

Bảng 2.1 Đặc điểm ảnh hồng ngoại nhiệt Landsat 60

62 Bảng 2.2 Giá trị K1, K2 đối với ảnh hồng ngoại nhiệt LANDSAT

Bảng 2.3 Thang điểm so sánh mức độ quan trọng của các chỉ tiêu 75

Bảng tra giá trị RI theo số lượng chỉ tiêu khác nhau (Saaty, Bảng 2.4 76 2000; Saaty, 2008)

Ma trận so sánh cặp của các yếu tố ảnh hưởng đến nguy cơ Bảng 3.1 103 cháy rừng

Bảng 3.2 Kết quả chuẩn hóa ma trận so sánh cặp 103

So sánh kết quả dự báo nguy cơ cháy rừng giữa các phương Bảng 3.3 111 án

Bảng 3.4 Giá trị AUC của các mô hình học máy 115

Bảng 3.5 Diện tích các khu vực với nguy cơ cháy rừng khác nhau 115

ix

DANH MỤC HÌNH VẼ

Hình Trang

Hình 1.1 10

Tên hình Tỉ lệ che phủ rừng ở Việt Nam giai đoạn 2008 - 2020 – nguồn: http://inforgraphics.vn Hình 1.2 Biển báo cấp dự báo cháy rừng 14

Hình 1.3 25

Hình 1.4 26

Hình 1.5 27

Hình 1.6 28

Hình 1.7 29

Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên tổ hợp màu ảnh Landsat 8, sử dụng các kênh NIR và MIR (nguồn: https://digital-geography.com/) Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên kênh hồng ngoại nhiệt (kênh 10) ảnh Landsat 8 (nguồn: https://digital-geography.com/) Cháy rừng ở California nhìn từ ảnh vệ tinh quang học Sentinel 2 (nguồn: https://wildfiretoday.com/) Hình ảnh cháy rừng U Minh Hạ năm 2002 từ ảnh vệ tinh MODIS Lớp thông tin khoảng cách từ đất nông nghiệp đến rừng trong mô hình dự báo nguy cơ cháy rừng (Hoang et al., 2020)

Hình 1.8 Hệ thống thông tin cháy rừng châu Âu (EFFIS) 31

Hình 1.9 32

Hình 1.10 34

Hình 1.11 39

Hình 1.12 40

Hình 1.13 43

Hình 1.14 44

Hệ thống thông tin giám sát môi trường phục vụ cảnh báo cháy rừng của Croatia (IPNAS) Giao diện mô hình nghiên cứu cháy rừng của Yassemi và cộng sự (2008) Phân loại nguy cơ cháy rừng trên cơ sở phương pháp phân loại cây quyết định (Doãn Hà Phong, 2007) Hệ thống theo dõi cháy rừng FireWatch Việt Nam (nguồn: geoviet.vn) Thuật toán trích xuất điểm dị thường nhiệt từ dữ liệu viễn thám phục vụ phát hiện sớm cháy rừng (Lê Ngọc Hoàn, Trần Quang Bảo, 2018) Giao diện WebGIS cảnh báo nguy cơ cháy rừng tại huyện Thuận Châu, tỉnh Sơn La (Đặng Ngô Bảo Toàn, 2021)

Hình 2.1 Vị trí địa lý tỉnh Nghệ An 49

Hình 2.2 59

Hình 2.3 65 Ví dụ về phân cấp nguy cơ cháy rừng từ chỉ số NMDI (Avetisyan và Nedkov, 2015) Ví dụ về mô hình số độ cao Aster GDEM (nguồn https://lpdaac.usgs.gov/)

x

(nguồn

Hình 2.4 66

Hình 2.5 và (a) (b) SRTM 67

Hình 2.6 68

Hình 2.7 69

Hình 2.8 70

Hình 2.9 71

trong GEE

(nguồn:

Hình 2.10 72

Mô hình DEM SRTM khu vực Nghệ An https://lpdaac.usgs.gov/) So sánh dữ liệu mô hình số độ cao JAXA’s Global ALOS 3D World (nguồn: https://www.satpalda.com/alos-world-3d) So sánh dữ liệu mô hình số độ cao GMTED 2010 và GTOPO30 (Danielson và Gesch, 2011) Ví dụ về kết quả xác định hướng dốc từ DEM (Mokarram và Zarei, 2018) Ví dụ về xác định độ dốc từ DEM (James và Thallak, 2015) Thông tin về tốc độ gió khu vực vườn quốc gia Tam Đảo trích xuất từ CSDL WorldClim (Pham Duc Dat và Le Thai Son, 2022) Thông tin về mật độ dân số toàn cầu năm 2020 trích xuất từ CSDL WorldPop (https://data.worldpop.org/) Giao diện Code Editor https://geohackweek.github.io/ Minh họa về bộ mã lệnh API trong GEE

Hình 2.11 73

(nguồn: https://serc.carleton.edu/)

Hình 2.12 74

Hình 2.13 78 Sơ đồ thuật toán RF trong phân loại (chỉnh sửa từ nguồn: https://www.section.io/)

80 81

Hình 2.16 82

Hình 2.17 85 Hình 2.14 Mô tả các vector hỗ trợ trong thuật toán SVM Hình 2.15 Thuật toán SVM với giá trị tham số C khác nhau (Liu, 2020) Mô tả thuật toán Cây Phân loại và hồi quy CART (nguồn: https://www.javatpoint.com/ Sơ đồ quy trình công nghệ lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS

Hình 3.1 Dữ liệu ảnh Sentinel 2 MSI khu vực nghiên cứu 90

Hình 3.2 91

Hình 3.3 92

Hình 3.4 93

Dữ liệu ảnh Landsat 8 khu vực nghiên cứu, tổ hợp màu tự nhiên Dữ liệu mô hình số độ cao DEM SRTM khu vực nghiên cứu Chỉ số thực vật NDVI xác định từ ảnh vệ tinh Sentinel 2 MSI Độ bốc thoát hơi nước bề mặt khu vực nghiên cứu thu

thập từ CSDL GEE trên cơ sở ảnh vệ tinh MODIS Hình 3.5 94

xi

Hình 3.6 95

Hình 3.7 95 Kết quả xác định nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8 Kết quả phân cấp nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8

Hình 3.8 Lớp thông tin độ cao khu vực nghiên cứu Hình 3.9 Lớp thông tin độ dốc khu vực nghiên cứu Hình 3.10 Lớp thông tin hướng sườn khu vực nghiên cứu Hình 3.11 Kết quả xây dựng lớp thông tin về mật độ dân cư Hình 3.12 Lớp thông tin mật độ dân cư sau khi được phân lớp 96 97 97 98 99

Hình 3.13 100

Hình 3.14 101 Kết quả xây dựng lớp thông tin lượng mưa trung bình tháng Kết quả xây dựng lớp thông tin tốc độ gió trung bình khu vực nghiên cứu

Hình 3.15 Kết quả phân vùng tốc độ gió khu vực nghiên cứu 101

Hình 3.16 104 Kết quả dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng kỹ thuật phân tích thứ bậc (AHP)

106

Hình 3.18 106

Hình 3.19 107

Hình 3.20 108

Hình 3.21 108

Hình 3.22 110

Hình 3.23 110

Hình 3.24 115

Hình 3.25 117

Hình 3.26 118 Hình 3.17 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF 3 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF 100 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF 200 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 25 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 30 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 5 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 30 Ví dụ kết quả xác định đường cong ROC đối với một số phương án xây dựng mô hình dự báo nguy cơ cháy rừng Công cụ xử lý dữ liệu cho mô hình dự báo nguy cơ cháy rừng trên nền tảng GEE Công cụ tổ hợp màu ảnh viễn thám trong module phần mềm

1

MỞ ĐẦU

1. Tính cấp thiết của đề tài

Rừng là một nguồn tài nguyên thiên nhiên quan trọng, đóng vai trò to lớn

trong phát triển kinh tế - xã hội cũng như bảo vệ môi trường. Mặc dù vậy, trong

những năm gần đây, cùng với sự bùng nổ dân số và quá trình đô thị hóa, công

nghiệp hóa, diện tích rừng biến động một cách nhanh chóng cùng với sự suy

giảm của chất lượng rừng. Ngoài các tác động của con người, biến đổi khí hậu

và các hiện tượng thời tiết cực đoan xảy ra nhiều trong những năm gần đây

cũng ảnh hưởng sâu sắc đến thảm phủ rừng và hệ sinh thái rừng. Nhiệt độ tăng

cao và hạn hán khắc nghiệt, kéo dài cũng làm gia tăng nguy cơ cháy rừng. Dưới

tác động của biến đổi khí hậu, các kiểu hệ sinh thái rừng cũng chịu những ảnh

hưởng khác nhau như thay đổi ranh giới; chỉ số tăng trưởng sinh khối giảm;

tăng nguy cơ cháy rừng và tăng mức độ và tần suất của các đợt dịch và sâu bệnh

hại cây rừng.

Cháy rừng là một thảm họa đe dọa đến tính mạng con người, cơ sở hạ

tầng và môi trường. Biến đổi khí hậu đã gây ra các hiện tượng như lượng mưa

ít đi, nhiệt độ tăng lên, mùa khô dài hơn là các nguyên nhân gây ra cháy rừng.

Ngoài ra, ở nhiều nơi trên thế giới các hoạt động của con người cũng làm cho

tần suất cháy rừng tăng lên đến mức báo động. Việc dự báo nguy cơ cháy rừng

là một vấn đề có tính cấp thiết, cung cấp nguồn thông tin kịp thời phục vụ công

tác bảo vệ và phát triển tài nguyên rừng, hỗ trợ chính quyền địa phương trong

quản lý và quy hoạch rừng, phân bổ nguồn lực, xử lý tình huống khẩn cấp và

cảnh báo sớm cháy rừng.

Theo Cục Kiểm lâm, Bộ Nông nghiệp và Phát triển Nông thôn, hàng năm

vào mùa hè, Nghệ An là một trong những tỉnh đứng đầu trên toàn quốc về nguy

cơ cháy rừng ở cấp V, cấp cực kỳ nguy hiểm. Toàn tỉnh Nghệ An có gần

2

942.508 ha rừng, tập trung chủ yếu ở các huyện miền núi: Kỳ Sơn, Tương

Dương, Con Cuông, Quế Phong, Quỳ Châu, Quỳ Hợp, Tân Kỳ và Nghĩa Đàn

thường hay xảy ra cháy rừng. Cụ thể, theo số liệu thống kê các vụ cháy rừng ở

Nghệ An cho thấy năm 1998, toàn tỉnh có 105 vụ cháy rừng với diện tích thiệt

hại 564 ha và 7 tháng đầu năm 2010, toàn tỉnh đã xảy ra 33 vụ cháy với diện

tích rừng bị cháy trên 150 ha, trong đó hơn 62 ha rừng thông, có vụ cháy gây

ra chết người. Kể từ năm 2010 trở lại đây, số điểm cháy tăng nhanh ở khu vực

miền núi phía Tây tỉnh Nghệ An, bao gồm 3 huyện: Kỳ Anh, Tương Dương và

Quế Phong. Ngoài nguyên nhân khách quan do thời tiết khắc nghiệt, nắng nóng

kéo dài, hạn nặng ở nhiều khu vực, thảm thực bì dày đậm, dễ bắt cháy, ... còn

có nguyên nhân chủ quan như người dân đốt rẫy cháy lan vào rừng, một số du

khách hoặc người dân bất cẩn khi dùng lửa trong rừng, ... Mùa cháy rừng ở

Nghệ An thường kéo dài trong 10 tháng, bắt đầu từ tháng 11 năm trước đến

tháng 8 năm sau. Sở dĩ, Nghệ An có mùa cháy rừng kéo dài hơn so với cả nước

là vì tỉnh Nghệ An có vị trí địa lý và địa hình đặc biệt. Nghệ An có khí hậu biến

đổi và phân hóa rõ rệt, vừa phân theo vĩ độ, vừa phân theo vành đai cao, chịu

ảnh hưởng của 3 loại gió mùa chính là gió mùa Đông Bắc, gió mùa Đông Nam

và gió mùa Tây Nam (gió phơn, gió Lào).

Theo dự báo của Trung tâm Khí tượng thủy văn Trung ương và Cục

Kiểm lâm, mùa khô những năm gần đây, tình hình thời tiết sẽ có nhiều diễn

biến phức tạp, nhiệt độ mặt nước biển ấm dần lên, nền nhiệt độ tiếp tục có xu

hướng cao hơn trung bình nhiều năm, dự báo tổng lượng mưa sẽ giảm và thiếu

hụt từ 10-20% so với trung bình nhiều năm, do đó, nguy cơ cháy rừng tại Việt

Nam nói chung, tỉnh Nghệ An nói riêng có khả năng tăng cao. Do vậy, nghiên

cứu, phân tích, lựa chọn và đề xuất các mô hình dự báo nguy cơ cháy rừng là

một nhiệm vụ rất quan trọng, có tính cấp bách trong điều kiện hiện nay.

3

Công nghệ địa không gian, trong đó chủ đạo là công nghệ viễn thám và

hệ thông tin địa lý (GIS) đã được sử dụng rộng rãi và hiệu quả trong xây dựng

các mô hình dự báo nguy cơ cháy rừng trên thế giới. Viễn thám và GIS cho

phép thu thập dữ liệu về thảm phủ rừng và sử dụng chúng để phân tích, quản

lý, mô hình hóa nhằm cảnh báo sớm nguy cơ xảy ra cháy rừng. Ngoài các ảnh

vệ tinh thương mại, nhiều hệ thống viễn thám hiện nay đã và đang cung cấp dữ

liệu ảnh viễn thám hoàn toàn miễn phí với độ phân giải không gian đa dạng.

Do được cập nhật liên tục, nguồn dữ liệu viễn thám miễn phí này đã trở thành

công cụ hết sức hiệu quả trong nghiên cứu, giám sát tài nguyên rừng. Có thể kể

đến các ảnh vệ tinh như Landsat (độ phân giải không gian 30m, chu kỳ cập nhật

16 ngày), bao gồm các vệ tinh từ Landsat 1 đến Landsat 9 với nguồn dữ liệu

được lưu trữ từ những năm cuối thập kỷ 70 đến nay. Landsat 8 và Landsat 9

cách nhau 08 ngày. Gần đây, hệ thống vệ tinh Sentinel của Cơ quan Hàng không

vũ trụ châu Âu (ESA) với nhiều thế hệ vệ tinh khác nhau, từ các vệ tinh radar

(Sentinel 1) đến quang học (Sentinel 2, 3...) cung cấp ảnh viễn thám ở độ phân

giải không gian cao hơn (lên đến 10m), thời gian cập nhật ngắn (5 ngày). Ngoài

ra, có thể kể đến một số loại dữ liệu viễn thám miễn phí khác như ảnh MODIS,

ảnh Aster...Có thể khẳng định, các nguồn dữ liệu địa không gian hiện nay hết

sức đa dạng và dễ dàng tiếp cận, việc khai thác ứng dụng các nguồn dữ liệu này

kết hợp các kỹ thuật học máy phục vụ xây dựng mô hình dự báo nguy cơ cháy

rừng ở các địa phương là hoàn toàn khả thi. Thực tế cho thấy, đã có nhiều mô

hình dự báo nguy cơ cháy rừng sử dụng dữ liệu viễn thám và hệ thông tin địa

lý như mô hình dựa trên kỹ thuật phân tích thứ bậc AHP, mô hình dựa trên thuật

toán Random Forest (RF), mô hình dựa trên thuật toán máy vector hỗ trợ (SVM

– support vector machine), mô hình dựa trên mạng neural nhân tạo…

Các mô hình dự báo nguy cơ cháy rừng đều có những ưu, nhược điểm riêng

và việc lựa chọn mô hình phù hợp với điều kiện tự nhiên, xã hội, dữ liệu ở từng

4

khu vực cụ thể là một vấn đề có tính thực tiễn cao. Với những lý do trên, luận án

“Lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và hệ

thông tin địa lý” được lựa chọn xuất phát từ nhu cầu thực tế, có ý nghĩa khoa

học và thể hiện sự cần thiết phải nghiên cứu. Những kết quả đạt được trong luận

án cũng góp phần chứng minh tính hiệu quả của việc kết hợp dữ liệu viễn thám,

GIS và các kỹ thuật học máy trong xây dựng các mô hình dự báo nguy cơ cháy

rừng.

2. Mục tiêu nghiên cứu

- Lựa chọn được mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và

hệ thông tin địa lý cho khu vực phía tây tỉnh Nghệ An.

3. Nội dung nghiên cứu

Để đạt được mục tiêu trên, trong luận án tiến hành nghiên cứu các nội

dung sau:

 Tổng quan về vấn đề nghiên cứu: tài nguyên rừng ở Việt Nam và tỉnh

Nghệ An, hiện trạng nguy cơ cháy rừng, các phương pháp dự báo nguy

cơ cháy rừng, tổng quan tình hình nghiên cứu trong và ngoài nước;

 Cơ sở khoa học xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu

viễn thám và hệ thông tin địa lý;

 Thu thập, tiền xử lý và chiết tách các lớp thông tin chuyên đề từ dữ liệu

viễn thám và hệ thông tin địa lý;

 Nghiên cứu đề xuất qui trình xây dựng bản đồ dự báo nguy cơ cháy rừng

từ dữ liệu viễn thám và hệ thông tin địa lý trên cơ sở các kỹ thuật như

AHP, Rừng ngẫu nhiên (RF), Máy hỗ trợ vector (SVM), Cây phân loại

và hồi quy (CART);

 Đánh giá và lựa chọn mô hình phù hợp với điều kiện cụ thể khu vực phía

tây tỉnh Nghệ An;

 Phân tích kết quả.

5

- Đối tượng nghiên cứu trong luận án là các mô hình dự báo nguy cơ cháy

4. Đối tượng và phạm vi nghiên cứu

rừng trên cơ sở kết hợp dữ liệu viễn thám, hệ thông tin địa lý và các kỹ thuật

học máy.

- Phạm vi khoa học của luận án tập trung vào phân tích, đánh giá, thử

nghiệm nhằm lựa chọn mô hình dự báo nguy cơ cháy rừng phù hợp với điều

kiện cụ thể khu vực nghiên cứu.

- Phạm vi không gian của luận án là khu vực phía tây tỉnh Nghệ An.

5. Phương pháp nghiên cứu

Phương pháp phân tích, tổng hợp: Tổng hợp, phân tích và đánh giá

các nghiên cứu trong và ngoài nước liên quan đến ứng dụng viễn thám và hệ

thông tin địa lý trong xây dựng mô hình dự báo nguy cơ cháy rừng.

Phương pháp viễn thám: Xử lý dữ liệu ảnh viễn thám quang học

Landsat, Sentinel 2, sử dụng ngôn ngữ lập trình Java trên nền tảng điện toán

đám mây Google Earth Engine nhằm thu thập, tiền xử lý, xử lý dữ liệu, chiết

tách các lớp dữ liệu chuyên đề (nhiệt độ, lớp phủ...) phục vụ xây dựng mô hình

dự báo nguy cơ cháy rừng; Xây dựng công cụ xử lý dữ liệu viễn thám và GIS

trên nền tảng GEE phục vụ xây dựng mô hình

Phương pháp GIS: sử dụng trong xây dựng các lớp dữ liệu chuyên đề

và thành lập bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An;

Phương pháp học máy, phương pháp mô hình hóa: các mô hình học

máy (RF, SVM, CART) được sử dụng để chạy mô hình dự báo nguy cơ cháy

rừng.

Phương pháp thống kê: Sử dụng phương pháp thống kê để đánh giá độ

chính xác của các mô hình dự báo nguy cơ cháy rừng.

Kỹ thuật lập trình: sử dụng để xây dựng công cụ xử lý dữ liệu viễn

thám và GIS trên nền tảng Google Earth Engine.

6

6. Luận điểm bảo vệ

Luận điểm 1: 09 lớp thông tin đầu vào chiết xuất từ dữ liệu viễn thám

và GIS (mật độ dân cư, lớp phủ thực vật, độ bốc thoát hơi nước bề mặt, hướng

sườn, độ dốc, tốc độ gió, độ cao, nhiệt độ bề mặt và lượng mưa trung bình

tháng) cho phép xây dựng mô hình dự báo nguy cơ cháy rừng phù hợp với điều

kiện khu vực nghiên cứu ở phía Tây tỉnh Nghệ An.

Luận điểm 2: Sử dụng kỹ thuật học máy (thuật toán Random Forest)

giúp dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS với độ chính xác

cao nhất đối với z khu vực nghiên cứu.

7. Những điểm mới của luận án

 Lựa chọn được 9 lớp thông tin đầu vào cho mô hình dự báo nguy cơ cháy

rừng khu vực phía tây tỉnh Nghệ An từ dữ liệu viễn thám và GIS phù hợp

với điều kiện khu vực nghiên cứu.

 Lựa chọn được mô hình dự báo nguy cơ cháy rừng khu vực phía tây tỉnh

Nghệ An bằng dữ liệu viễn thám và GIS trên cơ sở thuật toán Random

Forest.

8. Ý nghĩa khoa học và thực tiễn của luận án

a) Ý nghĩa khoa học: góp phần hoàn thiện cơ sở khoa học và minh chứng

tính hiệu quả của phương pháp ứng dụng dữ liệu viễn thám, GIS và các kỹ thuật

trí tuệ nhân tạo (học máy) trong xây dựng mô hình dự báo nguy cơ cháy rừng.

b) Ý nghĩa thực tiễn: Cung cấp thông tin và công cụ xử lý dữ liệu viễn

thám, GIS trên nền tảng Google Earth Engine để các nhà quản lý đưa ra các

biện pháp trong giám sát và cảnh báo sớm nguy cơ cháy rừng. Bên cạnh đó, kết

quả nhận được trong đề tài cũng có thể sử dụng, tham khảo trong công tác

nghiên cứu khoa học, giảng dạy ở các trường đại học, viện nghiên cứu.

9. Cơ sở tài liệu thực hiện luận án

Dữ liệu ảnh viễn thám (ảnh Landsat, ảnh Sentinel 2 MSI);

Các bản đồ chuyên đề khu vực thực nghiệm, bộ dữ liệu về điều kiện tự

7

nhiên (lớp phủ bề mặt, độ bốc thoát hơi nước bề mặt, nhiệt độ bề mặt), khí

tượng - khí hậu (lượng mưa trung bình tháng, tốc độ gió) và dữ liệu về mật độ

dân số khu vực nghiên cứu;

Dữ liệu về các điểm cháy ở khu vực thực nghiệm (khai thác từ cơ sở dữ

liệu Firewatch của Cục Kiểm lâm, Bộ Nông nghiệp và Phát triển nông thôn) và

các CSDL quốc tế;

Các tài liệu, số liệu khác.

10. Cấu trúc luận án

Luận án gồm 03 chương chính, phần mở đầu, kết luận - kiến nghị và tài

liệu tham khảo. Nội dung chính của luận án được trình bày trong 03 chương,

bao gồm:

Chương 1. Tổng quan về vấn đề nghiên cứu

Chương 2. Cơ sở khoa học xây dựng mô hình dự báo nguy cơ cháy rừng

từ dữ liệu viễn thám và hệ thông tin địa lý

Chương 3. Thực nghiệm dự báo nguy cơ cháy rừng khu vực phía tây tỉnh

Nghệ An từ dữ liệu viễn thám và hệ thông tin địa lý

8

CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU

1.1 Đặc điểm về tài nguyên rừng ở Việt Nam

Việt Nam là một quốc gia có ¾ diện tích là khu vực đồi núi với tỉ lệ che

phủ của rừng là trên 42% (theo công bố của Bộ Nông nghiệp và Phát triển nông

thôn năm 2020). Rừng là một nguồn tài nguyên sinh thái quan trọng của nước

ta, có giá trị cho sự phát triển kinh tế xã hội và hạnh phúc của cộng đồng trên

đất nước. Rừng đóng vai trò quan trọng trong việc thích nghi với biến đổi khí

hậu thông qua những chức năng môi trường như chống xói mòn đảm bảo tuần

hoàn nước. Rừng cũng có vai trò xã hội to lớn, góp phần tạo công ăn việc làm

và thu nhập cho người dân. Vai trò của rừng cũng được thể hiện ở vùng sâu

vùng xa, vùng cao nơi 10% dân cư sống bên trong hoặc gần các khu rừng (diện

tích xấp xỉ 12 triệu hecta) là người nghèo hoặc người dân tộc thiểu số

(UNDP/GEF SGP, 2017).

Do đất nước ta trải dài từ bắc xuống nam và điạ hình với nhiều cao độ

khác nhau so với mực nước biển nên rừng phân bố trên khắp các dạng địa hình,

với nét độc đáo của vùng nhiệt đới và rất đa dạng: có nhiều rừng xanh quanh

năm, rừng già nguyên thủy, rừng cây lá rộng, rừng cây lá kim, rừng thứ cấp,

truông cây bụi và đặc biệt là rừng ngập mặn... Rừng Việt Nam có nguồn tài

nguyên sinh vật đa dạng, trong đó nước ta là trung tâm thu nhập các luồng thực

vật và động vật từ phía bắc xuống, phía tây qua, phía nam lên và từ đây phân

bố đến các nơi khác trong vùng. Ðồng thời, nước ta có độ cao ngang từ mực

nước biển đến trên 3.000 m nên có nhiều loại rừng với nhiều loại thực vật và

động vật quý hiếm và độc đáo mà các nước ôn đới khó có thể tìm thấy được

(Chu Thái Thành, 2011):

- Về thực vật, theo số liệu thống kê gần đây thì có khoảng 12.000 loài

thực vật, nhưng chỉ có khoảng 10.500 loài đã được mô tả, trong đó có khoảng

9

10% là loài đặc hữu; 800 loài rêu; 600 loài nấm... Khoảng 2.300 loài cây có

mạch đã được dùng làm lương thực, thực phẩm, làm thức ăn cho gia súc. Về

cây lấy gỗ gồm có 41 loài cho gỗ quí (nhóm 1), 20 loài cho gỗ bền chắc (nhóm

2), 24 loài cho gỗ đồ mộc và xây dựng (nhóm 3).... Ngoài ra rừng Việt Nam

còn có loại rừng tre, trúc chiếm khoảng 1,5 triệu ha gồm khoảng 25 loài đã

được gây trồng có giá trị kinh tế cao. Ngoài những cây làm lương thực, thực

phẩm và những cây lấy gỗ ra, rừng Việt Nam còn có những cây được sử dụng

làm dược liệu gồm khoảng 1500 loài trong đó có khoảng 75% là cây hoang dại.

Những cây có chứa hóa chất quý hiếm như cây Tô hạp (Altingia sp.) có nhựa

thơm phân bố ở vùng núi Tây Bắc và Trung bộ; cây Gió bầu (Aquilaria

agalocha) sinh ra trầm hương, phân bố từ Nghệ tỉnh đến Ninh Thuận, Bình

Thuận; cây Dầu rái (Dipterocarpus) cho gỗ và cho dầu nhựa...

- Về động vật, ngoài các loài động vật đặc hữu Việt Nam còn có những

loài mang tính chất tổng hợp của khu hệ động vật miền nam Trung Hoa, Ấn

Ðộ, Mã Lai, Miến Ðiện, trong đó có khoảng 774 loài chim, 273 loài thú, 180

loài bò sát, 80 loài lưỡng cư, 475 loài cá nước ngọt và 1.650 loài cá ở rừng ngập

mặn và cá biển, trong đó có nhiều loài có giá trị kinh tế cao, có ý nghĩa khoa

học. Nhiều loài quý hiếm có tên trong Sách đỏ của thế giới.

Theo Cục Lâm nghiệp (Bộ Nông nghiệp và Phát triển nông thôn), tỉ lệ

che phủ rừng ở Việt Nam có xu hướng liên tục tăng trong giai đoạn từ 2008

đến nay (tính đến 31/12/2020), trong đó năm 2008, tỉ lệ che phủ rừng đạt 38,7%,

năm 2020 đạt 42,0% (hình 1.1), tương ứng với diện tích rừng tăng từ 13,1 triệu

ha (năm 2008) lên 14,6 triệu ha (năm 2020). Về loại rừng, sự gia tăng diện tích

rừng chủ yếu là rừng trồng, với 2,8 triệu ha năm 2008 lên 4,3 triệu ha năm 2019.

10

Hình 1.1 Tỉ lệ che phủ rừng ở Việt Nam giai đoạn 2008 - 2020 – nguồn: http://inforgraphics.vn

Tỉ lệ che phủ, tổng diện tích rừng, diện tích rừng tự nhiên và diện tích

rừng trồng của các tỉnh, thành phố trực thuộc Trung ương tính đến 31/12/2021

được trình bày trong bảng 1.1. Có thể nhận thấy, địa phương có tỉ lệ che phủ

rừng lớn nhất là Bắc Kạn với 73,40%, trong khi đó một số địa phương không

có rừng hoặc có tỉ lệ che phủ rừng rất thấp như Nam Định (1,81%), Đồng Tháp

(1,69%), Tiền Giang (0,90%)...Về diện tích, địa phương có diện tích rừng lớn

nhất là Nghệ An (1.008.741 ha), tỷ lệ che phủ đạt 58,41%, trong đó có 788.991

Bảng 1.1: Diện tích và độ che phủ rừng các tỉnh, thành phố trực thuộc trung ương tính đến 31/12/2021 (Quyết định 2860/QĐ-BNN-TCLN, 2022)

ha rừng tự nhiên và 219.750 ha rừng trồng.

Vùng

Tỉnh

Diện tích có rừng (ha)

Rừng tự nhiên (ha)

Rừng trồng (ha)

Tỷ lệ che phủ (%)

14.745.201

10.171.757

4.573.444

42,02

Tây Bắc

TOÀN QUỐC Tổng Lai Châu Điện Biên Sơn La

1.808.285 469.567 412.350 659.837

1.584.974 447.005 403.001 593.355

223.310 22.563 9.350 66.482

47,06 51,44 42,96 46,40

11

Vùng

Tỉnh

Diện tích có rừng (ha)

Rừng tự nhiên (ha)

Rừng trồng (ha)

Hoà Bình

266.529

Tỷ lệ che phủ (%) 51,54

141.614

124.915

Đông Bắc

Tổng Lào Cai Yên Bái Hà Giang Tuyên Quang Phú Thọ Vĩnh Phúc Cao Bằng Bắc Kạn Thái Nguyên Quảng Ninh Lạng Sơn Bắc Giang Bắc Ninh

3.970.714 378.036 464.008 472.809 426.042 170.053 33.303 378.421 373.081 187.540 370.213 556.266 160.386 556

2.331.602 267.373 213.880 383.819 233.171 47.409 12.049 357.221 272.790 76.302 121.872 290.223 55.494 -

1.639.112 110.663 250.128 88.990 192.872 122.643 21.254 21.200 100.291 111.238 248.341 266.043 104.892 556

56,34 56,91 63,00 58,27 65,21 40,00 25,00 55,88 73,40 47,47 55,00 63,40 38,00 0,68

83.326

46.326

37.000

6,18

13.831

9.039

4.792

8,46

Sông Hồng

Tổng TP Hải Phòng Hải Dương Hưng Yên TP Hà Nội Hà Nam Nam Định Thái Bình Ninh Bình

8.945 - 19.680 5.636 3.092 4.284 27.858

2.241 - 7.584 4.416 - - 23.046

6.704 - 12.096 1.220 3.092 4.284 4.813

5,26 - 5,65 6,53 1,81 2,49 19,65

Bắc Trung Bộ

Tổng Thanh Hoá Nghệ An Hà Tĩnh Quảng Bình Quảng Trị T.Thiên Huế

3.131.061 648.371 1.008.741 335.485 588.387 245.996 304.081

2.201.435 393.360 788.991 217.367 469.421 126.622 205.674

929.625 255.011 219.750 118.118 118.966 119.374 98.407

57,35 53,50 58,41 52,25 68,59 50,00 57,15

Duyên Hải

Tổng TP Đà Nẵng Quảng Nam

2.451.496 63.361 680.250

1.566.677 43.190 463.357

884.820 20.172 216.893

50,43 47,17 58,61

12

Vùng

Tỉnh

Diện tích có rừng (ha)

Rừng tự nhiên (ha)

Rừng trồng (ha)

Tây Nguyên

Tỷ lệ che phủ (%) 50,72 56,51 45,65 45,70 46,85 43,02 45,94 63,12 40,79 54,60 38,35 38,15

226.748 165.538 120.064 68.739 12.688 53.978 468.604 77.154 168.201 84.083 83.728 55.439

Quảng Ngãi Bình Định Phú Yên Khánh Hoà Ninh Thuận Bình Thuận Tổng Kon Tum Gia Lai Lâm Đồng Đắk Lắk Đăk Nông

333.520 380.122 247.194 245.164 159.342 342.543 2.572.701 624.735 646.992 539.403 509.774 251.797

106.772 214.584 127.130 176.426 146.654 288.564 2.104.097 547.581 478.791 455.321 426.046 196.358

19,42 29,29

222.566 58.248

479.871 182.018

257.304 123.770

13,79

12.085

28.550

16.465

Đông Nam Bộ

15,93 3,03 22,79 16,10

20.049 8.069 103.717 20.398

Tổng Đồng Nai Bà Rịa - V.Tàu TP HCM Bình Dương Bình Phước Tây Ninh

33.557 9.878 159.563 66.304

13.509 1.809 55.847 45.906

Tây Nam Bộ

5,44 3,29 1,69 0,90 1,77 - 4,04 - 1,62 2,53 1,61 3,70 12,00 17,84

168.407 21.161 6.162 2.427 3.186 - 6.571 - 3.776 8.438 2.581 12.745 18.880 82.480

Tổng Long An Đồng Tháp Tiền Giang Bến Tre Vĩnh Long Trà Vinh TP Cần Thơ Hậu Giang Sóc Trăng Bạc Liêu An Giang Kiên Giang Cà Mau

247.748 21.999 6.162 2.427 4.359 - 9.493 - 3.776 10.180 4.502 13.860 76.909 94.081

79.341 838 - - 1.173 - 2.922 - - 1.742 1.921 1.116 58.029 11.601

13

Mặc dù vậy, thời gian qua do sự bùng nổ dân số cũng như tác động của

quá trình phát triển kinh tế - xã hội, tài nguyên rừng ở Việt Nam đang có những

biến động rất sâu sắc. Theo FAO, Việt Nam từng là nước có tỷ lệ đất rừng và

trữ lượng gỗ bình quân đầu người thuộc loại thấp trên toàn cầu. Giai đoạn gần

đây, mặc dù tỉ lệ che phủ của rừng trên toàn quốc có gia tăng đáng kể, tuy nhiên

diện tích rừng tự nhiên cũng như chất lượng rừng có sự suy giảm mạnh. Những

năm 1945, đa số là rừng tự nhiên, còn trong tổng số hơn 14 triệu ha rừng hiện

nay, rừng đặc dụng chỉ có 2,15 triệu ha, rừng phòng hộ là 4,6 triệu ha, còn hơn

nửa là rừng sản xuất. Trong hơn 10 năm qua, trung bình mỗi năm cả nước trồng

được khoảng 230 nghìn ha rừng, nhưng có 215 nghìn ha là rừng sản xuất. Diện

tích rừng trồng mới không thể thay thế được giá trị của hàng chục nghìn ha

rừng nguyên sinh đã bị mất đi dẫn đến hệ sinh thái, đa dạng sinh học bị phá vỡ.

Một số địa phương còn tính diện tích cây công nghiệp dài ngày vào độ che phủ

rừng, trong khi đó diện tích các cây công nghiệp dài ngày này không mang tính

bền vững, không có tính đa dạng sinh học cũng như không hiệu quả trong chống

mưa lũ.

1.2 Hiện trạng cháy rừng ở Việt Nam

1.2.1 Khái niệm cơ bản về cháy rừng

Theo Tổ chức Nông lương thế giới (FAO): ‘cháy rừng là sự xuất hiện và

lan truyền của những đám cháy trong rừng mà không nằm trong sự kiểm soát

của con người; gây nên những tổn thất nhiều mặt về tài nguyên, của cải và môi

trường’ (FAO, 1999).

Cháy rừng được phân loại thành 3 loại, bao gồm (Bế Minh Châu, 2010):

- Cháy dưới tán rừng (cháy trên bề mặt đất rừng): là những đám cháy

mà ngọn lửa cháy lan tràn trên mặt đất làm tiêu hủy một phần hoặc toàn bộ lớp

thảm mục, cành khô, lá rụng, cỏ khô, thảm tươi, cây bụi, cây tái sinh cháy sém

vỏ và một phần nào đó ở gốc cây, rễ cây nổi lên trên mặt đất và ở sát mặt đất.

14

- Cháy tán rừng (cháy trên ngọn): là hình thức cháy được phát triển từ

cháy dưới tán lên đến tán rừng. Cháy tán rừng thường xuất hiện ở kiểu rừng có

mật độ tán dày của những loại cây có dầu, bao gồm cháy ổn định (cháy toàn bộ

tán rừng) và cháy lướt nhanh.

- Cháy ngầm: là loại cháy mà ngọn lửa lan tràn dưới mặt đất làm tiêu hủy

lớp mùn, than bùn và tiêu hủy những vật liệu hữu cơ khác đã được tích lũy dưới

lớp đất mặn trong nhiều năm. Một ví dụ điển hình nhất của loại cháy ngầm là

vụ cháy rừng U Minh Thượng, U Minh Hạ trong mùa khô 2001 – 2002.

1.2.2 Quy định về cấp dự báo cháy rừng

Cấp dự báo cháy rừng được quy định cụ thể trong Điều 46 Nghị định

156/2018/NĐ-CP ngày 16 tháng 11 năm 2018 quy định chi tiết thi hành một số

điều của Luật Lâm nghiệp, trong đó Cấp dự báo cháy rừng gồm 5 cấp, từ cấp I

đến cấp V.

Ký hiệu biển báo cấp cháy rừng là 1/2 hình tròn có đường kính vành

ngoài 2,5 m; vành trong 1,8 m nền trắng, xung quanh viền màu đỏ và có mũi

tên (quay được) chỉ cấp dự báo từ cấp I đến cấp V (Hình 1.2) (nguồn:

https://kiemlam.org.vn). Phân cấp và đặc trưng cháy rừng được trình bày trong

Hình 1.3 Biển báo cấp dự báo cháy rừng (https://kiemlam.org.vn)

bảng 1.2 (Nghị định 156/2018/NĐ-CP)

15

Bảng 1.2 Phân cấp dự báo cháy rừng (theo Nghị định 156/2018/NĐ-CP)

STT Cấp cháy

Đặc trưng cháy rừng

I

1

Cấp thấp: Ít có khả năng cháy rừng Khả năng cháy rừng thấp, trên biển báo mũi tên chỉ số I.

II

2

Cấp trung bình: Có khả năng cháy rừng Khả năng cháy rừng ở mức trung bình, trên biển báo mũi tên chỉ số II.

III

3

Cấp cao: Thời tiết khô hanh kéo dài, dễ xảy ra cháy rừng. Chú trọng phòng cháy các loại rừng thông, khộp, bạch đàn, tre, nứa, tràm... Khả năng cháy lan trên diện rộng, trên biển báo mũi tên chỉ số III.

IV

4

Cấp nguy hiểm: Thời tiết khô hanh, hạn kéo dài có nguy cơ xảy ra cháy rừng lớn, tốc độ lan tràn lửa nhanh. Nguy cơ cháy rừng lớn, trên biển báo mũi tên chỉ số IV.

V

5

Cấp cực kỳ nguy hiểm: Thời tiết khô, hạn, kiệt kéo dài, có khả năng cháy lớn và lan tràn nhanh trên các loại rừng Rất nguy hiểm, thời tiết khô, hạn, kiệt kéo dài có khả năng cháy lớn ở tất cả các loại rừng, tốc độ lửa lan tràn rất nhanh, trên biển báo mũi tên chỉ số V.

1.2.3 Phân tích tình hình cháy rừng ở Việt Nam

Mặc dù tổng diện tích rừng và tỉ lệ che phủ ở Việt Nam tăng liên tục

trong giai đoạn gần đây, tuy nhiên diện tích rừng tự nhiên và chất lượng rừng

có sự suy giảm rõ rệt. Các nguyên nhân gây mất rừng và suy thoái rừng bao

gồm: (1) chuyển và xâm lấn rừng tự nhiên sang sản xuất đất nông nghiệp và

đất khác; (2) chuyển rừng tự nhiên nghèo sang rừng sản xuất, cây công nghiệp;

(3) suy thoái rừng tự nhiên do khai thác; (4) mất rừng do cháy rừng (Nguyễn

Thị Mai Dương và cộng sự, 2016).

Cháy rừng là một trong những nguyên nhân quan trọng gây nên sự suy

giảm diện tích rừng và suy thoái chất lượng rừng ở Việt Nam (Trần Quang Bảo

16

và cộng sự, 2016; Nguyễn Văn Lợi và cộng sự, 2017). Các số liệu của Cục Lâm

nghiệp cho thấy, trong 10 năm của giai đoạn 2009 - 2018, cháy rừng đã thiêu

hủy gần 22 nghìn ha rừng ở nước ta, gây thiệt hại lớn về kinh tế cho đất nước,

trong đó cao điểm nhất là năm 2010 với khoảng 6.723 ha rừng đã bị lửa thiêu

rụi. Thời gian đây, diện tích rừng bị cháy tuy có giảm, nhưng vẫn tồn tại những

diễn biến bất ngờ và phức tạp khó lường, nhất là trong điều kiện ảnh hưởng của

biến đổi khí hậu. Đặc biệt, vào những tháng cao điểm của mùa khô hạn, nắng

nóng, nhiều khu rừng của Việt Nam nằm trong tình trạng cảnh báo có nguy cơ

cháy rừng cấp V (cấp cực kỳ nguy hiểm), nguy cơ xảy ra cháy rừng rất cao.

Cháy rừng thường xảy ra ở các địa phương tập trung nhiều rừng và rừng

trồng các loại cây dễ cháy như: rừng thông, rừng tre nứa, rừng bạch đàn, rừng

khộp, rừng tràm, rừng phi lao…, trong đó Hà Tĩnh, Nghệ An, Hà Giang, Sơn

La, Yên Bái, Quảng Trị, Bình Định, Bình Thuận… là những địa phương

thường xuyên xảy ra cháy rừng với thiệt hại lớn. Chỉ riêng thiệt hại do cháy

rừng của tỉnh Sơn La trong năm 2016 đã lên đến 919 ha, chiếm 27,68% tổng

diện tích rừng thiệt hại trong năm của cả nước, gấp gần 2 lần tổng diện tích

rừng thiệt hại của cả năm 2017. Năm 2020, cả nước xảy ra 179 vụ cháy rừng

với diện tích rừng bị thiệt hại là 645 ha.

Ảnh hưởng của cháy rừng không chỉ gói gọn trong những diện tích rừng

bị cháy mà còn tác động sâu sắc đến nhiều mặt của đời sống, kinh tế - xã hội.

Đặc biệt, khi cháy rừng xảy ra ở những cánh rừng nguyên sinh, có thể mất đi

hàng trăm ha diện tích rừng lâu năm và phải mất rất lâu mới có thể tái tạo, phát

triển lại hệ sinh thái rừng. Cháy rừng cũng thải vào bầu khí quyển khối lượng

khí CO2 khổng lồ (Kolari, 2008), góp phần làm cho trái đất nóng lên, làm

nghiêm trọng hơn ảnh hưởng của biến đổi khí hậu, ảnh hưởng đến môi trường

sống và sức khỏe người dân. Cháy rừng đầu nguồn, rừng phòng hộ, còn dẫn

đến gia tăng nguy cơ, tần suất và cường độ thiên tai như lũ lụt, xói mòn, sạt lở

17

đất, lũ quét… Cháy rừng cũng ảnh hưởng nghiêm trọng đến thảm thực vật,

động vật sống trong rừng, gây mất đa dạng sinh học và mất cân bằng sinh thái.

1.3 Nguyên nhân gây cháy rừng ở Việt Nam

Có rất nhiều nguyên nhân cháy rừng mà các nhà nghiên cứu đã xác định

được. Dưới đây là một trong số những yếu tố chủ yếu gây ra hiện tượng này:

1.3.1 Nguyên nhân do biến đổi khí hậu.

Một trong những nguyên nhân gây cháy rừng chính là sự thay đổi rõ rệt

của thời tiết, khí hậu trong thời gian gần đây. Việt Nam nằm trong khu vực

châu Á - Thái Bình Dương, là khu vực thường xuyên chịu ảnh hưởng khô hạn

và thời tiết ấm dần lên do tác động của hiện tượng El Nino. Nước ta cũng có

lượng bức xạ mặt trời rất lớn với số giờ nắng từ 1.400-3000 giờ/năm, nhiệt bức

xạ trung bình năm tới 100 kcal/cm2. Ngoài ra, nền nhiệt trung bình ở hầu hết

các vùng khí hậu Việt Nam trong nhiều năm trở lại đây đều có xu hướng cao

hơn trung bình các năm trước đó, cứ năm sau nắng nóng lại gay gắt hơn năm

trước khiến khô hạn kéo dài, làm gia tăng nguy cơ cháy rừng. Trong khi đó, do

mục đích phát triển kinh tế, rừng trồng ở Việt Nam thường là các loại cây có

tinh dầu, dễ cháy như bạch đàn, thông, tràm, khộp…. Các yếu tố do địa hình

tạo ra cũng có ảnh hưởng trực tiếp đến điều kiện bốc hơi nước và độ ẩm của

vật liệu cháy hoặc chi phối quy mô, tốc độ lây lan các đám cháy rừng.

1.3.2 Nguyên nhân do hoạt động của con người và sinh vật.

Đây được xem là nguyên nhân chủ yếu gây ra phần lớn các vụ cháy rừng

tại Việt Nam. Cháy rừng do con người gây ra thường do nhận thức, ý thức

không cao và sự bất cẩn trong các hoạt động sản xuất, sinh hoạt. Tại một số địa

phương đặc biệt là tại các khu vực miền núi, nơi đồng bào có dân trí thấp, người

dân vẫn còn giữ thói quen đốt nương làm rẫy, thậm chí đốt rừng làm nương rẫy;

đốt quang thực bì cỏ khô, rơm rạ gần rừng. Nhiều vụ cháy rừng lớn xảy ra do

đốt lửa sưởi ấm, hun khói để lấy mật ong…dẫn đến lửa cháy lan không kiểm

18

soát được. Cháy rừng cũng xảy ra do người dân vào rừng khai thác gỗ, củi để

lại các vật liệu bắt lửa như than củi, tàn thuốc…vào những tầng thực bì dễ cháy.

Hoặc các loài động vật gây hại như là côn trùng cũng góp phần giết chết nhiều

cây cối. Khiến rừng trở nên dễ bị bắt lửa hơn. Khi mùa hè kéo dài hơn do khí

hậu nóng lên, côn trùng sẽ sinh sản nhanh hơn và nhiều hơn. Ngoài ra, các hiện

tượng thiên nhiên như tia sét cũng có thể gây cháy rừng.

1.4 Các phương pháp dự báo nguy cơ cháy rừng

1.4.1 Phương pháp dự báo cháy rừng truyền thống

Các nghiên cứu về cháy rừng đã được các nhà khoa học ở các nước như

Mỹ, Liên Xô (cũ), Canada, Nhật Bản, Trung Quốc...quan tâm từ những năm đầu

thế kỷ XX. Các phương pháp dự báo cháy rừng truyền thống đề dự trên mối quan

hệ giữa các yếu tố khí tượng, khí hậu và vật liệu cháy.

Beals (1914) đã nghiên cứu dự báo khả năng xảy ra cháy rừng thông qua

lớp thảm mục (Beal, 1914). Các nghiên cứu tiếp theo đã đề xuất các mô hình dự

báo cải tiến trên cơ sở kết hợp các yếu tố thời tiết, độ ẩm, vật liệu cháy và địa

hình để dự báo mức độ nguy hiểm của lửa rừng.

Tại Liên Xô (cũ), Nesterov (1949) đã đề xuất phương pháp dự báo cháy

rừng, trong đó cấp độ nguy hiểm của cháy rừng được xác định theo giá trị chỉ số

P bằng tổng các tích số giữa nhiệt độ và độ hụt bão hòa của không khí lúc 13h00

hàng ngày kể tử ngày cuối cùng có lượng mưa lớn hơn 3 mm. Phương pháp này

dựa trên các yếu tố khí tượng, khí hậu để phân cấp mức độ nguy hiểm của cháy

rừng thông qua bảng tra. Cách tính giá trị chỉ số P của Nesterov để sử dụng bảng

tra được thực hiện như sau (Nesterov, 1949):

(1.1)

Trong đó:

- P là chỉ tiêu khí tượng tổng hợp đánh giá mức nguy hiểm cháy rừng.

19

Giá trị P được tính bởi 3 yếu tố thời tiết do trạm dự báo khí tượng thủy văn đặt

ở từng vùng đo, tính và thông báo cấp cháy;

- K là hệ số điều chỉnh theo lượng mưa ngày, trong đó:

+ K=1 khi lượng mưa ngày nhỏ hơn 5 mm;

+ K=0 khi lượng mưa ngày lớn hơn 5 mm, hoặc có đợt mưa phùn kéo

dài 3 đến 5 ngày, lượng mưa mặc dù chưa đạt 5 mm K vẫn bằng 0.

- là nhiệt độ (0C) lúc 13 giờ, giờ cao điểm dễ xảy ra cháy rừng trong

ngày.

- D13 là độ chênh lệch bão hòa (hPa) lúc 13 giờ;

- i=1 là ngày thứ nhất lấy kết quả đo của 3 yếu tố thời tiết.

- n là ngày thứ n lấy kết quả đo của 3 yếu tố thời tiết.

Chỉ số P có giá trị càng cao thể hiện nguy cơ cháy rừng cảng lớn. Nhiều

nghiên cứu về sau đã sử dụng chỉ số P để cải tiến các mô hình dự báo nguy cơ

cháy rừng. Từ kết quả tính chỉ số P, các cấp nguy cơ cháy rừng được phân cấp

như trong bảng 1.3 (Shetinsky, 1994).

Bảng 1.3 Bảng tra cấp dự báo cháy rừng theo chỉ số P (Shetinsky, 1994)

Cấp cháy Giá trị P Đặc trưng của các cấp dự báo cháy rừng

< 300 Cấp thấp: ít có khả năng cháy rừng I

301 - 1000 Cấp trung bình: Có khả năng cháy rừng II

1001 - 4000 Cấp cao: Có khả năng dễ cháy rừng III

4001 - 10000 IV Cấp nguy hiểm: có khả năng cháy rừng lớn

> 10000 V Cấp cực kỳ nguy hiểm: có khả năng cháy rừng lớn và lan tràn lửa nhanh

Phương pháp do Nesterov đề xuất đã được sử dụng trong nhiều nghiên

cứu trên thế giới nhằm dự báo sớm nguy cơ cháy rừng, trong đó một số thông số

trong mô hình dự báo đã được điều chỉnh và bổ sung để phù hợp với điều kiện

20

thực tiễn khu vực thử nghiệm (Shetinsky, 1994; Arpaci et al., 2013; Khan, 2012;

Sokolova and Makogonov, 2013; Venevsky, 2002).

Ban đầu, các nghiên cứu ở Việt Nam đã sử dụng phương pháp dự báo của

Nesterov có điều chỉnh theo lượng mưa ngày để đánh giá cấp độ nguy cơ cháy

rừng. Nghiên cứu của Phạm Ngọc Hưng đã cải tiến phương pháp dự báo nguy

cơ cháy rừng theo số ngày khô hạn liên tục, trong đó đã xây dựng bảng phân cấp

nguy hiểm của cháy rừng căn cứ vào số ngày khô hạn liên tục cho các mùa khí

hậu trong năm (Phạm Ngọc Hưng, 1988). Trên cơ sở phương pháp Nesterov, các

nghiên cứu ở Việt nam đã cải tiến bằng cách sử dụng thêm các yếu tố như kiểu

rừng, sức gió, mức sương mù...để phù hợp với điều kiện Việt Nam (Phạm Ngọc

Hưng, 2004).

Bộ Nông nghiệp và Phát triển Nông thôn đã đưa ra bảng tra cấp dự báo

cháy rừng trên cơ sở giá trị chỉ số P như sau:

Bảng 1.4 Bảng tra cấp dự báo cháy rừng theo Bộ NN&PTNT (2000)

Cấp cháy Giá trị P Đặc trưng của các cấp dự báo cháy rừng

< 5000 Cấp thấp: ít có khả năng cháy rừng I

5001 - 10000 Cấp trung bình: Có khả năng cháy rừng II

10001 - 15000 Cấp cao: Có khả năng dễ cháy rừng III

15001 - 20000 IV Cấp nguy hiểm: có khả năng cháy rừng lớn

> 20000 V Cấp cực kỳ nguy hiểm: có khả năng cháy rừng lớn và lan tràn lửa nhanh

Nguồn: Bộ Nông nghiệp và Phát triển Nông thôn, 2000.

Dự án tăng cường khả năng phòng cháy, chữa cháy rừng ở Việt Nam do

UNDP tài trợ đã đề xuất cái tiến phương pháp Nesterov khi thêm yếu tố sức gió,

trong đó giá trị P được nhân với hệ số 1,0; 1,5; 2,0 và 3,0 nếu tốc độ gió tương

ứng là 0, 4, 5 và 15 m/s (Cooper et al., 1991).

21

Nguyễn Quang Văn và cộng sự (2019) đã nghiên cứu, đề xuất hiệu chỉnh

phân cấp dự báo cháy rừng các vùng sinh thái và tỉnh Quảng Bình dựa trên số

liệu quan trắc khí tượng trong khu vực giai đoạn 2015 – 2017, tương quan giữa

độ ẩm của vật liệu cháy và chỉ số P (Bảng 1.5) (Nguyễn Phương Văn và cộng

sự, 2019). Phân cấp cháy rừng đã được hiệu chỉnh phù hợp với tình hình thực

tiễn cháy rừng ở khu vực nghiên cứu, trong đó khoảng cách giữa các cấp cháy

được xác định trên cơ sở cấp cháy và mức độ nguy hiểm trong mùa cháy. Có thể

nhận thấy, so với quy định của Bộ Nông nghiệp và Phát triển Nông thôn, giá trị

chỉ số P trong phân cấp của Nguyễn Phương Văn và cộng sự đã được điều chỉnh

thấp hơn.

Bảng 1.5 Bảng phân cấp dự báo cháy rừng có điều chỉnh (Nguyễn Phương Văn và cộng sự, 2019)

Cấp cháy Giá trị P Khả năng cháy rừng

< 5000 Ít có khả năng cháy rừng I

5001 - 7500 Có khả năng cháy rừng II

7501 - 10000 Nhiều khả năng cháy rừng III

10001 - 15000 Nguy hiểm IV

> 15000 Cực kỳ nguy hiểm V

Trần Văn Hùng và cộng sự (2000) đã đề xuất giải pháp nâng cao độ chính

xác dự báo cháy rừng, trong đó đưa ra chỉ tiêu tổng hợp Pt trên cơ sở kết hợp giá

trị P theo nhân tố khí tượng thủy văn và P theo vật liệu cháy (Trần Văn Hùng và

cộng sự, 2010). Từ giá trị chỉ tiêu tổng hợp Pt, tác giả đã phân cấp lại thang cấp

độ cháy như sau:

Bảng 1.6 Cấp dự báo khả năng cháy rừng ở vườn quốc gia U Minh Hạ theo chỉ số Pt (Trần Văn Hùng và cộng sự, 2010)

Mức độ cháy Cấp cháy Đặc trưng cấp dự báo cháy rừng Chỉ tiêu tổng hợp Pt

1 - 14000 Thấp Ít có khả năng cháy rừng I

22

Chỉ tiêu tổng hợp Mức độ cháy Cấp cháy Đặc trưng cấp dự báo cháy rừng

Pt 14000 - 40000 Trung bình Có khả năng cháy II

40000 - 100000 Cao Có khả năng dễ cháy III

100000 - 200000 Nguy hiểm Có khả năng cháy lớn IV

> 200000 V Cực kỳ nguy hiểm Có khả năng cháy lớn, lan nhanh

Võ Đình Tiến đề xuất phương pháp dự báo mùa cháy rừng trên cơ sở 6

yếu tố: nhiệt độ không khí trung bình, lượng mưa trung bình, độ ẩm không khí

trung bình, vận tốc gió trung bình, số vụ cháy rừng trung bình, lượng người vào

rừng trung bình (Võ Đình Tiến, 1995).

Vương Văn Quỳnh và cộng sự đã nghiên cứu chi tiết hóa phương pháp dự

báo cháy rừng của Nesterov cho các trạng thái rừng khác nhau, từ đó áp dụng

thử nghiệm trong dự báo cháy rừng tại Tây Nguyên và rừng U Minh (Vương

Văn Quỳnh và cộng sự, 2005).

Có thể nhận thấy, phương pháp dự báo cháy rừng truyền thống trên cơ sở

chỉ số P do Nesterov đề xuất được sử dụng rộng rãi trên thế giới và ở Việt Nam.

Đây cũng là phương pháp đang được Bộ Nông nghiệp và Phát triển Nông thôn

sử dụng trong dự báo nguy cơ cháy rừng, trong đó đã điều chỉnh một số yếu tố

đầu và cho phù hợp với điều kiện thực tế ở Việt Nam.

1.4.2 Phương pháp sử dụng dữ liệu viễn thám và GIS trong nghiên cứu cháy

rừng

Phương pháp dự báo nguy cơ cháy rừng truyền thống trên cơ sở chỉ số P

mặc dù đã được sử dụng phổ biến và mang lại hiệu quả nhất định trên thế giới

cũng như ở Việt Nam, tuy nhiên phương pháp này cũng tồn tại những nhược

điểm cơ bản khi chủ yếu sử dụng dữ liệu khí tượng mặt đất. Trong khi đó, số

lượng các trạm khí tượng ở các địa phương là khá ít, ảnh hưởng đến khả năng áp

23

dụng cho khu vực có diện tích lớn cũng như độ chính xác của mô hình dự báo

nguy cơ cháy rừng. Những hạn chế này của phương pháp dự báo cháy rừng

truyền thống có thể được khắc phục khi sử dụng kết hợp dữ liệu viễn thám và hệ

thông tin địa lý (GIS).

Phương pháp dự báo nguy cơ cháy rừng bằng dữ liệu viễn thám và GIS là

quá trình đánh giá mức độ ảnh hưởng của các yếu tố tự nhiên và xã hội tham gia

vào quá trình hình thành cháy rừng. Các yếu tố này bao gồm (Phạm Ngọc Hưng,

2004):

1) Đặc trưng của rừng:

- Cấu trúc lâm phần.

- Kiểu rừng.

2) Kết cấu vật liệu cháy:

- Kích thước vật liệu.

- Sự sắp xếp và phân bố của vật liệu.

- Độ ẩm của vật liệu.

- Khối lượng vật liệu cháy.

3) Khí hậu và thời tiết:

- Nhiệt độ không khí, đặc biệt là nhiệt độ không khí ngày.

- Độ ẩm tương đối của không khí.

- Tốc độ gió.

- Lượng mưa và thời gian mưa.

4) Địa hình:

- Độ dốc của địa hình.

- Hướng sườn.

- Vị trí tương đối theo sườn dốc.

Ngoài ra, một số mô hình dự báo nguy cơ cháy rừng còn sử dụng các yếu

tố đầu vào như khoảng cách từ các khu dân cư tới rừng, khoảng cách từ các

24

tuyến đường giao thông đến rừng, số người trung bình vào rừng mỗi

ngày...(Gholamreza, 2012).

Có thể nhận thấy, nhiều thông tin đầu vào của mô hình dự báo nguy cơ

cháy rừng như lớp phủ bề mặt, nhiệt độ bề mặt, độ ẩm, kiểu rừng,...có thể chiết

tách từ dữ liệu viễn thám một cách nhanh chóng. Hiện nay, cùng với sự phát

triển vượt bậc của công nghệ vũ trụ, dữ liệu viễn thám đã được ứng dụng rộng

rãi ở nhiều nước trên thế giới và mang lại hiệu quả cao trong quản lý, giám sát

và cảnh báo sớm nguy cơ cháy rừng. Ngoài các ảnh vệ tinh thương mại như

SPOT, WorldView, Ikonos..., nhiều hệ thống viễn thám hiện nay đã và đang

cung cấp dữ liệu ảnh viễn thám hoàn toàn miễn phí với độ phân giải không gian

đa dạng. Do được cập nhật liên tục, nguồn dữ liệu viễn thám miễn phí này đã

trở thành công cụ hết sức hiệu quả trong nghiên cứu, quản lý tài nguyên và

giám sát môi trường, trong đó có đánh giá chất lượng nước mặt. Có thể kể đến

các dữ liệu viễn thám miễn phí như Landsat, Sentinel, MODIS…

Một số loại ảnh vệ tinh cho phép xác định được các điểm có dị thường

nhiệt, các dấu hiệu của cháy rừng (bụi, khói) và sự phát triển của đám cháy theo

thời gian,... Công việc này có thể xác định được thông qua đặc trưng nhiệt độ

của các đối tượng trong dải phổ hồng ngoại nhiệt và cận hồng ngoại. Bên cạnh

bộ cảm quang học, một số hệ thống vệ tinh hiện nay có gắn các bộ cảm để thu

được các tín hiệu nhiệt độ bức xạ của các đối tượng trên mặt đất như Landsat,

Aster, MODIS. Nhiệt độ bề mặt là thông tin hết sức quan trọng trong phát hiện

sớm các khu vực xảy ra cháy rừng. Dữ liệu ảnh hồng ngoại nhiệt từ các hệ

thống vệ tinh này cho phép chiết tách nhanh thông tin nhiệt độ bề mặt, phát

hiện những khu vực có nhiệt độ bất thường để cảnh báo nguy cơ cháy rừng.

Hệ thống vệ tinh Landsat bao gồm các vệ tinh từ Landsat 1 đến Landsat

9, trong đó Landsat 1 là vệ tinh nghiên cứu tài nguyên thiên nhiên đầu tiên trên

thế giới. Landsat được xem là một trong những hệ thống vệ tinh viễn thám lớn

25

nhất trên thế giới với kho dữ liệu khổng lồ từ cuối những năm 70 thế kỷ XX

đến nay. Dữ liệu Landsat được cung cấp hoàn toàn miễn phí, người sử dụng có

thể tạo tài khoản và tải dữ liệu ảnh, bao gồm các ảnh từ các vệ tinh Landsat

đang hoạt động như Landsat 8/9 lẫn dữ liệu ảnh từ các vệ tinh Landsat đã dừng

hoạt động.

Hình 1.3 Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên tổ hợp màu ảnh Landsat 8, sử dụng các kênh NIR và MIR (nguồn: https://digital-geography.com/)

Trên hình 1.4 thể hiện hình ảnh cháy rừng tại khu vực hạt Västmanland

(Thụy Điển) ngày 4/8/2014 trên tổ hợp màu ảnh Landsat 8, sử dụng các kênh

cận hồng ngoại (NIR) và hồng ngoại sóng ngắn (MIR). Có thể nhận thấy, khu

vực xảy ra cháy rừng được phát hiện và phân biệt rõ ràng với các khu vực xung

quanh, giúp các nhà quản lý có thể ứng phó hiệu quả hơn với cháy rừng. Trên tổ

hợp màu này, các điểm cháy được thể hiện bởi màu cam đỏ, các khu vực lửa đã

tắt được thể hiện bởi màu đỏ đậm.

Ngoài các kênh ở dải sóng nhìn thấy và hồng ngoại, trên ảnh Landsat TM,

ETM+ và Landsat 8/9 còn có các kênh hồng ngoại nhiệt với độ phân giải không

gian từ 60 - 120m cho phép chiết tách nhanh thông tin nhiệt độ bề mặt Trái Đất.

26

Dữ liệu nhiệt độ bề mặt Trái Đất có thể sử dụng để phát hiện sớm các khu vực

có dị thường về nhiệt, trong đó có các khu vực xảy ra cháy rừng. Hình 1.5 thể

hiện hình ảnh cháy rừng khu vực hạt Västmanland (Thụy Điển) ngày 4/8/2014

trên kênh hồng ngoại nhiệt (kênh 10) ảnh vệ tinh Landsat 8. Khu vực cháy rừng

được thể hiện bởi các pixel màu trắng sáng, thể hiện bởi nhiệt độ bề mặt cao hơn

rất nhiều so với khu vực xung quanh.

Hình 1.4 Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên kênh hồng ngoại nhiệt (kênh 10) ảnh Landsat 8 (nguồn: https://digital- geography.com/)

Gần đây, hệ thống vệ tinh Sentinel của Cơ quan Hàng không vũ trụ Châu

Âu (ESA) với nhiều thế hệ vệ tinh khác nhau, từ các vệ tinh radar (Sentinel 1)

đến vệ tinh quang học (Sentinel 2 MSI) cung cấp ảnh viễn thám ở độ phân giải

không gian cao hơn (lên đến 10m), thời gian cập nhật ngắn đã được sử dụng

hiệu quả và rộng rãi trên thế giới trong lĩnh vực tài nguyên, môi trường. Đặc

biệt, các thế hệ vệ tinh Sentinel thường bao gồm 01 cặp vệ tinh (Sentinel 2A và

Sentinel 2B)…với đặc điểm hoàn toàn giống nhau giúp rút ngắn thời gian thu

nhận ảnh tại một vị trí trên bề mặt Trái Đất. Điều này giúp nâng cao tần suất

chụp ảnh cũng như khắc phục được phần nào ảnh hưởng của điều kiện thời tiết

27

để chất lượng ảnh chụp, đặc biệt là ảnh quang học. Cũng như dữ liệu ảnh

Landsat, hệ thống vệ tinh Sentinel cho phép người sử dụng được tải ảnh hoàn

toàn miễn phí từ website của ESA. Trên hình 1.6 thể hiện hình ảnh cháy rừng

ở California (Mỹ) nhìn từ ảnh vệ tinh Sentinel 2. Do có độ phân giải không gian

cao, có thể nhận thấy, các khu vực đang xảy ra cháy được phân biệt rất rõ trên

ảnh Sentinel 2 ở tổ hợp màu tự nhiên so với sử dụng ảnh Landsat. Việc phát

hiện sớm các khu vực cháy rừng cho phép đánh giá ảnh hưởng cũng như dự

báo nguy cơ lan tràn của lửa rừng, giúp ứng phó hiệu quả hơn với cháy rừng.

Hình 1.5 Cháy rừng ở California ngày 27/10/2019 nhìn từ ảnh vệ tinh quang học Sentinel 2 (nguồn: https://wildfiretoday.com/)

Ngoài các dữ liệu vệ tinh với độ phân giải trung bình như Landsat,

Sentinel, có thể kể đến một số loại dữ liệu viễn thám miễn phí khác như ảnh

MODIS, ảnh Planet... Ảnh MODIS được thu nhận từ hai hệ thống vệ tinh chính,

bao gồm: MODIS Terra và MODIS Aqua. Ảnh MODIS có 36 kênh phổ, với 3

độ phân giải: 250, 500 và 1000 mét, trong đó có 15 kênh trong dải sóng hồng

ngoại nhiệt (từ 3,660μm – 14,385μm). Mặc dù độ phân giải không gian không

28

cao, nhưng với tầm phủ rộng, chu kỳ cập nhật ngắn, ảnh MODIS là nguồn dữ

liệu giá trị cao trong nghiên cứu tài nguyên, môi trường. Kênh hồng ngoại nhiệt

(kênh 31 và 32) ảnh MODIS thường được sử dụng để xác định nhiệt độ bề mặt

lớp phủ mặt đất, từ đó phát hiện các điểm dị thường về nhiệt độ và đưa ra cảnh

báo sớm về các khu vực có nguy cơ xảy ra cháy rừng. Tại Việt Nam, Tổng cục

Kiểm lâm cũng đã xây dựng hệ thống cảnh báo cháy rừng trên cơ sở nhiệt độ

bề mặt xác định từ ảnh vệ tinh MODIS. Hình 1.6 trình bày hình ảnh vụ cháy

rừng U Minh Hạ năm 2002 trên ảnh MODIS, trong đó có thể phát hiện khói do

ảnh hưởng của cháy rừng.

Hình 1.6 Hình ảnh cháy rừng U Minh Hạ năm 2002 từ ảnh vệ tinh MODIS

Ngoài các lớp thông tin có thể chiết tách từ dữ liệu viễn thám phục vụ xây

dựng mô hình dự báo nguy cơ cháy rừng, nhiều lớp thông tin khác như địa hình,

độ dốc, hướng sườn,…có thể chiết tách từ dữ liệu mô hình số độ cao (DEM) trên

cơ sở ứng dụng công nghệ GIS. Hệ thông tin địa lý có những ưu điểm nổi bật

trong phân tích, xử lý, hiển thị dữ liệu không gian, trong đó có các lớp thông tin

về tự nhiên và xã hội của mô hình dự báo nguy cơ cháy rừng. Các lớp thông tin

29

trong mô hình dự báo nguy cơ cháy rừng như khoảng cách từ các khu dân cư

đến rừng, khoảng cách từ các tuyến đường giao thông đến rừng, khoảng cách

từ khu vực đất nông nghiệp đến rừng...cũng có thể được xây dựng một cách

nhanh trong với sự trợ giúp của GIS trên cơ sở sử dụng các kỹ thuật phân tích

không gian.

cơ cháy rừng (Zhao et al., 2021)

Hình 1.7 Lớp thông tin khoảng cách tới đường giao thông trong mô hình dự báo nguy

Như vậy, có thể nhận thấy việc sử dụng dữ liệu viễn thám và hệ thông tin

địa lý trên cơ sở các kỹ thuật học máy là một tiếp cận phù hợp, hiệu quả trong

nghiên cứu dự báo sớm nguy cơ cháy rừng hiện nay.

1.5 Tổng quan tình hình nghiên cứu trong và ngoài nước

1.5.1 Trên thế giới

Do cháy rừng ảnh hưởng nghiêm trọng đến đời sống, tính mạng và hoạt

động sản xuất, các nghiên cứu về cháy rừng đã được các nhà khoa học trên thế

30

giới quan tâm từ những năm đầu thế kỷ XX. Các nghiên cứu về cháy rừng được

chia thành các hướng chính, bao gồm:

(1): Nghiên cứu bản chất của cháy rừng;

(2): Nghiên cứu phương pháp dự báo nguy cơ cháy rừng;

(3): Nghiên cứu các công trình phòng chống cháy rừng;

(4): Nghiên cứu các phương pháp chữa cháy rừng;

(5): Nghiên cứu phương tiện chữa cháy rừng.

Các phương pháp dự báo nguy cơ cháy rừng đều cho thấy mối quan hệ

chặt chẽ giữa điều kiện thời tiết, độ ẩm của vật liệu cháy và khả năng xuất hiện

cháy rừng. Bên cạnh các yếu tố khí tượng diễn biến hàng ngày như lượng mưa,

nhiệt độ, độ ẩm không khí (Williams, 1993), một số phương pháp dự báo cháy

rừng trên cơ sở chỉ tiêu tổng hợp P còn tính đến ảnh hưởng của các yếu tố khác

như độ ẩm của vật liệu cháy (Chandler, 1983), tốc độ gió, số ngày không mưa,

lượng nước bốc hơi (Dong, 2005). Nhìn chung, với mỗi khu vực khác nhau,

các mô hình dự báo nguy cơ cháy rừng thường khác nhau, điều này cũng gây

nên những hạn chế nhất định trong hiệu quả phòng chống cháy rừng bằng

phương pháp nghiên cứu truyền thống.

Với sự phát triển vượt bậc của công nghệ địa không gian, trong đó có

công nghệ viễn thám và GIS trong thời gian qua, nhiều nghiên cứu đã ứng dụng

dữ liệu viễn thám và GIS nhằm xây dựng các mô hình dự báo nguy cơ cháy

rừng trên cơ sở kết hợp các kỹ thuật truyền thống và các kỹ thuật xử lý dữ liệu

không gian hiện đại.

Những nghiên cứu đầu tiên trong ứng dụng viễn thám và GIS dự báo nguy

cơ cháy rừng có thể kể đến Hệ thống thông tin cháy rừng châu Âu (EFFIS) do

Trung tâm hợp tác nghiên cứu châu Âu xây dựng năm 2000 (Hình 1.8). Hiện

nay, có hàng chục quốc gia đã tham gia vào mạng lưới này và hệ thống EFFIS

cho phép dự báo nguy cơ cháy, phát hiện sớm cháy rừng, lập bản đồ các khu vực

31

cháy cũng như đánh giá thiệt hại do cháy rừng tới độ che phủ đất, lượng khí thải

phát sinh...( https://effis.jrc.ec.europa.eu/apps). Dữ liệu viễn thám sử dụng trong

hệ thống này là ảnh vệ tinh quang học MODIS, VIIRS và Sentinel 2.

Hình 1.8 Hệ thống thông tin cháy rừng châu Âu (EFFIS)

Hình 1.9 Hệ thống thông tin giám sát môi trường phục vụ cảnh báo cháy rừng của Croatia (IPNAS)

32

Một quốc gia ở châu Âu khác là Croatia cũng xây dựng Hệ thống thông

tin giám sát môi trường cho phòng chống cháy rừng (IPNAS – Croatian

Intergral Forest Fire Monitoring System), bao gồm nhiều hợp phần phục vụ dự

báo sớm nguy cơ cháy rừng trên cơ sở kết hợp dữ liệu địa không gian (GIS,

GPS) và các thông tin bổ trợ khác (Stipaničev et al., 2006) – Hình 1.9. Dữ liệu

trong hệ thống IPNAS bao gồm: dữ liệu video thời gian thực, dữ liệu khí tượng

thời gian thực và cơ sở dữ liệu GIS.

Jaiswal và cộng sự (2002) sử dụng phương pháp phân tích thứ bậc (AHP)

để thành lập bản đồ dự báo nguy cơ cháy rừng khu vực Gorna Subwatershed

(bang Madhya Pradesh, Ấn Độ) trên cơ sở dữ liệu ảnh vệ tinh IRS và công nghệ

GIS. Ảnh vệ tinh IRS 1D LISS III được sử dụng để thành lập bản đồ thảm phủ

thực vật, kết hợp các lớp thông ti khác như độ dốc, bản đồ địa hình, khoảng

cách đến khu dân cư...để thành lập bản đồ nguy cơ cháy rừng, trong đó mỗi yếu

tố được xác định trọng số ảnh hưởng đến khả năng cháy. Kết quả nhận được

cho thấy, gần 30% diện tích khu vực nghiên cứu nằm ở nguy cơ cháy rừng

'‘cao'' đến '‘rất cao'’, phù hợp với các địa điểm xảy ra cháy rừng (Jaiswal et al.,

2002).

Nghiên cứu của Wimberly và cộng sự (2008) đã sử dụng dữ liệu ảnh vệ

tinh Landsat đa thời gian nhằm thành lập bản đồ mức độ nghiêm trọng do cháy

rừng ở phía nam Appalachians (Bắc Carolina, Mỹ). Tác giả đã sử dụng chỉ số

cháy NBR (Normalized Burn Ration index) xác định từ kênh cận hồng ngoại

(kênh 4) và kênh hồng ngoại sóng ngắn (kênh 7) ảnh vệ tinh Landsat để đánh

giá sự thay đổi của lớp phủ bề mặt trước và sau khi cháy theo công thức:

(1.2)

Trong đó, NBRpre và NBRpost là chỉ số NBR trước và sau khi xảy ra cháy rừng.

Từ kết quả này, các tác giả đã đánh giá được ảnh hưởng của địa hình và kiểu

rừng đến mức độ nghiêm trọng của đám cháy cũng như mối quan hệ giữa mức

33

độ nghiêm trọng của đám cháy đến độ phong phú của loài (Wimberly et al.,

2008).

Yassemi và cộng sự (2008) tích hợp sử dụng công nghệ GIS, các mô hình

môi trường và các thiết bị di động (cellular automata - CA) nhằm xây dựng một

mô hình dự báo nguy cơ cháy rừng, áp dụng cho khu vực Nordegg Alberta

(Canada). Kết quả nhận được cho thấy sự phù hợp giữa kết quả mô phỏng từ

mô hình đề xuất và dữ liệu cháy tại khu vực nghiên cứu. Việc tích hợp công

nghệ GIS-CA cho phép mô phỏng thực tế các kịch bản cháy rừng (Yassemi et

al., 2008). Nghiên cứu cũng đã xây dựng được module phần mềm mô phỏng

cháy rừng với giao diện đơn giản, dễ sử dụng (hình 1.10).

Hình 1.10 Giao diện mô hình nghiên cứu cháy rừng của Yassemi và cộng sự (2008)

Chowdhury và cộng sự (2013) sử dụng ảnh vệ tinh MODIS nhằm dự báo

nguy cơ cháy rừng khu vực phía bắc Alberta (Canada). Từ ảnh MODIS, các tác

34

giả đã tính toán các thông số đầu vào, bao gồm: nhiệt độ bề mặt (land surface

temperature), chi số hạn (Normalized Multi-band Drought Index – NMDI), chỉ

số độ ẩm thực vật (TVWI – Temperature Vegetation Wetness Index) để xây

dựng bản đồ dự báo nguy cơ cháy rừng (Chowdhury et al., 2013). Kết quả nhận

được cho thấy, 91,63% số vụ cháy rừng xảy ra trong khu vực được phân cấp

mức độ cháy là '‘rất cao'’.

Để nâng cao độ chính xác của các mô hình dự báo nguy cơ cháy rừng từ

dữ liệu viễn thám và GIS, một số nghiên cứu đã sử dụng các kỹ thuật trí tuệ

nhân tạo (mạng neural nhân tạo, random forest, support vector machine,...) kết

hợp phương pháp phân tích thứ bậc AHP để nâng cao độ chính xác (Vasilakos

et al., 2009; Oliveira et al., 2012; Dieu Tien Bui et al., 2016). Các kỹ thuật hồi

quy như hồi quy đa biến (multiple regression) (Oliveira et al., 2012), hồi quy

logistic (Pourghasemi, 2015), hồi quy trọng số địa lý (geographically weighted

regression - GWR) (Fernandez et al., 2012), kỹ thuật khai phá dữ liệu (data

mining) (Arpaci et al., 2014) cũng được sử dụng để xây dựng các mô hình dự

báo nguy cơ cháy rừng trên cơ sở đánh giá mối quan hệ giữa các yếu tố tự

nhiên, xã hội và khả năng xảy ra cháy. Arndt và cộng sự (2013) đã nghiên cứu

mối quan hệ giữa các hoạt động du lịch, cơ sở hạ tầng, nông nghiệp và lâm

nghiệp và sự phân bố không gian của các đám cháy rừng trong khoảng thời

gian từ 1993 - 2009 bằng phương pháp hồi quy logistic. Trong nghiên cứu này,

59 biến số kinh tế - xã hội độc lập đã được được phân tích với các mô hình khác

nhau, kết quả nhận được chỉ ra rằng mật độ đường sắt, đường rừng và đường

mòn cùng với hoạt động nông nghiệp và lâm nghiệp có ảnh hưởng đáng kể đên

nguy cơ cháy rừng (Arndt et al., 2013).

Enoh và cộng sự (2021) sử dụng dữ liệu ảnh vệ tinh Landsat 8 OLI, mô

hình số độ cao DEM xác định từ dữ liệu Aster, ảnh viễn thám độ phân giải cao

Google Earth để xây dựng các lớp thông tin như bản đồ lớp phủ mặt đất, các

35

thông tin địa hình (độ dốc, độ cao, độ dài sườn), mạng lưới đường bộ, khu dân

cư...nhằm thành lập bản đồ nguy cơ cháy rừng khu vực Cross (Niger). Kết quả

nhận được trong nghiên cứu cho thấy sự hiệu quả của công nghệ viễn thám và

GIS trong dự báo sớm nguy cơ cháy rừng, cũng như chứng minh nguồn gốc

chủ yếu của cháy rừng tại khu vực Cross là do các hoạt động của con người gây

ra (Enod et al., 2021).

Nghiên cứu của Ruano và cộng sự (2022) sử dụng chỉ số thực vật NDVI

xác định từ ảnh viễn thám và các dữ liệu khác về địa hình, vật liệu cháy, hạ

tầng giao thông nhằm xây dựng một số mô hình dự báo khả năng cháy rừng do

ảnh hưởng của các yếu tố tự nhiên, xã hội. Các tác giả đã lựa chọn thử nghiệm

với các mô hình như mô hình tuyến tính tổng quát hóa (GLMs – generalized

linear models), mô hình tổng quát GAMs – generalized additive models để đánh

giá nguy cơ phát sinh cháy rừng do con người và các yếu tố tự nhiên gây ra. Độ

chính xác của các mô hình được đánh giá trên cơ sở đường cong AUC, trong

đó đạt 0,84 và 0,89 với các mô hình GLMs, GAMs (Ruano et al., 2022).

Herrera và cộng sự (2022) sử dụng ảnh vệ tinh MODIS giai đoạn 2012 –

2018 và các số liệu về vật liệu cháy để thành lập bản đồ các khu vực xảy ra

cháy rừng, hỗ trợ công tác giám sát, đánh giá sự lan tràn của lửa rừng và lập kế

hoạch dập lửa (Herrera et al., 2022). Tại khu vực thử nghiệm ở Mexico, 24 loại

vật liệu cháy được nghiên cứu để phân tích ảnh hưởng của khoảng cách giữa

vật liệu cháy và khu vực xảy ra cháy, từ đó lập bản đồ chu vi ảnh hưởng của

các đám cháy đang hoạt động.

Iban và Sekertekin (2022) cũng sử dụng dữ liệu các điểm dị thường nhiệt

từ ảnh MODIS và kết quả dự báo với 7 kỹ thuật học sâu (deep learning), bao

gồm: hồi quy logistic độc lập (LR), máy vectơ hỗ trợ (SVM), phân tích phân

biệt tuyến tính (LDA), rừng ngẫu nhiên (RF), Gradient Bo boost (GB), eXtreme

Gradient Bo boost (XGB) và AdaBoost (AB) để lựa chọn phương pháp phù

36

hợp với khu vực Adana và Mersin (Thổ Nhĩ Kỳ). Kết quả nhận được cho thấy,

phương pháp RF cho độ chính xác cao nhất, với giá trị đường cong AUC đạt

0.879. Nghiên cứu cũng chứng minh rằng, các yếu tố bao gồm độ cao, nhiệt độ

và độ dốc có ảnh hưởng lớn nhất đến nguy cơ xảy ra cháy rừng tại khu vực thử

nghiệm (Iban, Sekertekin, 2022).

Các lớp thông tin như cấu trúc rừng, địa hình, môi trường, khí hậu và 16

yếu tố phụ được sử dụng để thành lập bản đồ nguy cơ cháy rừng ở khu vực phía

đông Địa Trung Hải (Thổ Nhĩ Kỳ). So sánh với dữ liệu thực tế cho thấy, 85%

các điểm cháy được phân bố trong các khu vực có nguy cơ cháy rừng cao

(Sivrikaya, Kucuk, 2022). Các yếu tố địa hình như độ cao, độ dốc, hướng sườn,

chỉ số thực vật NDVI, độ che phủ đất, lượng nước bốc hơi được sử dụng trong

nghiên cứu của Nasiri và cộng sự (2022) nhằm đánh giá khả năng xảy ra cháy

rừng ở khu vực Paved (Iran) trên cơ sở kỹ thuật AHP và công nghệ GIS (Nasiri

et al., 2022). Kết quả nhận được cho thấy, 64,7% các điểm cháy trong quá khứ

nằm trong khu vực có mức độ xảy ra cháy rừng «cao» và «rất cao». Nhìn chung,

các nghiên cứu trên thế giới đã minh chứng tính hiệu quả của phương pháp sử

dụng dữ liệu viễn thám và công nghệ GIS trong xây dựng các mô hình dự báo

nguy cơ cháy rừng.

1.5.2 Trong nước

Các nghiên cứu dự báo nguy cơ cháy rừng ở Việt Nam được thực hiện

từ những năm cuối thế kỷ XX trên cơ sở phương pháp dự báo của Nesterov sử

dụng chỉ tiêu tổng hợp P (Phạm Ngọc Hưng, 1988; Võ Đình Tiến, 1995).

Phương pháp truyền thống này tiếp tục được sử dụng trong các nghiên cứu thời

gian sau, trong đó mô hình dự báo được bổ sung thêm các lớp thông tin đầu vào

cũng như điều chỉnh giá trị chỉ tiêu P trong phân cấp nguy cơ cháy rừng (Trần

Quang Bảo và cộng sự, 2019; Lê Sỹ Doanh, Vương Văn Quỳnh, 2014; Trần

Văn Hùng và cộng sự, 2010; Nguyễn Phương Văn, 2019). Trong nghiên cứu

37

(Lê Sỹ Doanh, Vương Văn Quỳnh, 2014), các tác giả đề xuất phương pháp dự

báo nguy cơ cháy rừng theo điều kiện khí hậu ở Việt Nam, trong đó chỉ số khí

hậu phản ánh nguy cơ cháy rừng Qi được xây dựng trên cơ sở phân tích tương

quan hồi quy giữa các giá trị Qi xác định bằng các phương pháp khác nhau và

chỉ số Snc45 (số ngày có nguy cơ cháy rừng cao và rất cao trong tháng theo chỉ

số Nesterov).

Những năm đầu thế kỷ XXI, nhiều nghiên cứu ở Việt Nam đã sử dụng

dữ liệu viễn thám, đặc biệt là các hệ thống viễn thám có bộ cảm biến hồng ngoại

nhiệt như Landsat TM, Landsat ETM+, MODIS để xây dựng các module phần

mềm cảnh báo cháy rừng ở Việt Nam (Vương Văn Quỳnh, 2005; Vương Văn

Quỳnh và cộng sự, 2006; Doãn Hà Phong, 2007; Bế Minh Châu và Vương Văn

Quỳnh, 2009; Trần Quang Bảo và cộng sự 2016).

Đề tài cấp nhà nước của Vương Văn Quỳnh (2005) «Nghiên cứu giải

pháp phòng chống và khắc phục hậu quả cháy rừng cho vùng U Minh và Tây

Nguyên» đã xây dựng được phần mềm tự động phát hiện các khu vực cháy

rừng từ dữ liệu Landsat và MODIS. Trên cơ sở đặc điểm vật liệu cháy (khối

lượng, độ ẩm, phân bố vật liệu cháy) và tần suất xuất hiện cháy ở các trạng thái

rừng khác nhau, Vương Văn Quỳnh đã phân loại thảm phủ rừng theo mức nguy

cơ cháy khác nhau, từ thấp đến cao (Vương Văn Quỳnh, 2005).

Luận án của Doãn Hà Phong (Doãn Hà Phong, 2007) đã nghiên cứu xây

dựng thuật toán chiết tách nhiệt độ bề mặt từ dữ liệu ảnh vệ tinh MODIS nhằm

hỗ trợ thông tin đầu vào cho các mô hình dự báo nguy cơ cháy rừng. Tác giả

đã sử dụng phương pháp hồi quy tuyến tính để hiệu chỉnh các tham số của thuật

toán xác định nhiệt độ bề mặt phù hợp với điều kiện Việt Nam, thử nghiệm xây

dựng công cụ tính toán trên phần mềm xử lý ảnh ENVI trên cơ sở ngôn ngữ

IDL (Interactive Data Language). Sử dụng giá trị nhiệt độ bề mặt và thông tin

lớp phủ (chỉ số thực vật NDVI), Doãn Hà Phong đã đưa ra phân cấp nguy cơ

38

cháy rừng bằng phương pháp phân loại cây quyết định (Decesion Tree – Hình

1.12). Kết quả nhận được cho thấy, các khu vực có chỉ số thực vật NDVI lớn

hơn 0.5 (đại diện cho các khu vực có lớp phủ rừng) và nhiệt độ bề mặt trên

350C có nguy cơ cháy rừng ở mức «cực kỳ nguy hiểm». Trong khi đó, với khu

vực có chỉ số NDVI lớn hơn 0.5 và nhiệt độ bề mặt dưới 30.50C, nguy cơ cháy

Hình 1.11 Phân loại nguy cơ cháy rừng trên cơ sở phương pháp phân loại cây quyết định (Doãn Hà Phong, 2007)

rừng ở mức thấp.

Năm 2007, Tổng cục Kiểm lâm (nay là Cục Kiểm lâm) đã xây dựng Hệ

thống theo dõi cháy rừng trực tuyến (FireWatch Việt Nam) bằng cách sử dụng

dữ liệu viễn thám MODIS nhằm phát hiện sớm các điểm cháy rừng (hotspots)

trên toàn lãnh thổ Việt Nam. Thông tin các điểm cháy phát hiện được truyền

tải một cách nhanh chóng đến các địa phương thông qua trang Web của Cục

39

nhằm hỗ trợ kịp thời công tác phòng cháy chữa cháy rừng trên toàn quốc. Hệ

thống này tiếp tục được hoàn thiện với các phiên bản cập nhật trong giai đoạn

sau đó. Các chức năng chính của FireWatch bao gồm: (1) cập nhật tức thời

thông tin về các điểm cháy phát hiện từ ảnh vệ tinh, (2) cung cấp dữ liệu thống

kê cháy theo thời gian và theo địa phương, (3) cung cấp cơ sở dữ liệu cháy...

(https://kiemlam.org.vn). Mặc dù vậy, hệ thống FireWatch Việt Nam hiện nay

Hình 1.12 Hệ thống theo dõi cháy rừng FireWatch Việt Nam (nguồn: geoviet.vn)

đã dừng hoạt động.

Về hướng xây dựng các phần mềm cảnh báo nguy cơ cháy rừng ở Việt

Nam trên cơ sở dữ liệu ảnh viễn thám hồng ngoại nhiệt như Landsat, MODIS có

Vương Văn Quỳnh, 2009; Trần Quang Bảo và cộng sự, 2016). Điểm chung của các

thể kể đến các nghiên cứu (Vương Văn Quỳnh và cộng sự, 2006; Bế Minh Châu và

nghiên cứu này đều sử dụng thông tin nhiệt độ bề mặt xác định từ ảnh viễn thám

nhằm phát hiện các điểm dị thường về nhiệt, từ đó đưa ra các cảnh báo về nguy

40

cơ xảy ra cháy rừng. Ngoài phát hiện cháy rừng, các điểm dị thường về nhiệt độ

bề mặt xác định từ dữ liệu viễn thám hồng ngoại nhiệt cũng được sử dụng trong

phát hiện sớm cháy ngầm từ các khu vực khai thác than như ở mỏ than Khánh

Hòa, tỉnh Thái Nguyên (Trinh Le Hung, Zablotskii, 2017).

Trần Văn Hùng và cộng sự (2010) sử dụng chỉ số tổng hợp P của

Nesterov với sự trợ giúp của hệ thông tin địa lý (GIS) và dữ liệu viễn thám để

xây dựng bản đồ dự báo khả năng xuất hiện cháy rừng theo thời gian và không

2010). Mặc dù vậy, phương pháp sử dụng trong nghiên cứu này khá đơn giản

gian tại Vườn quốc gia U Minh Hạ, tỉnh Cà Mau (Trần Văn Hùng và cộng sự,

và cũng chưa kiểm chứng được độ chính xác của bản đồ dự báo nguy cơ cháy

rừng.

Nghiên cứu của Võ Thành Minh và Lê Thị Thu Hiền (2015) đã sử dụng

ảnh vệ tinh Landsat 8 và công nghệ GIS để thành lập bản đồ nhạy cảm cháy tại

Vườn quốc gia Tràm Chim. Các lớp thông tin đầu vào, bao gồm chỉ số thực vật

NDVI, chỉ số độ ẩm NDWI, kiểu thảm phủ bề mặt và nhiệt độ bề mặt được

chiết tách từ ảnh vệ tinh Landsat 8 giai đoạn 2013 – 2014, kết hợp với các lớp

thông tin xây dựng bằng công nghệ GIS như khoảng cách đến khu dân cư,

khoảng cách đến nguồn nước...nhằm xây dựng chỉ số nguy cơ cháy rừng FRI

(Fire risk index) (Võ Thành Minh, Lê Thị Thu Hiền, 2015). Trên cơ sở giá trị chỉ

số FRI, nguy cơ cháy rừng được chia thành 3 cấp: thấp, trung bình và cao. Kết

quả nhận được cho thấy, vào mùa khô, diện tích các khu vực có nguy cơ cháy

rừng ở mức ‘’cao’’ lớn gấp hơn 3 lần so với thời điểm mùa mưa.

Trần Quang Bảo (2017) sử dụng công nghệ địa không gian (viễn thám,

GIS, hệ định vị toàn cầu GPS) nhằm phát hiện cháy rừng và giám sát tài nguyên

rừng. Nghiên cứu đã chứng minh, việc phát hiện sớm cháy rừng bằng dữ liệu

viễn thám đa thời gian mang lại hiệu quả cao và phù hợp ở quy mô nghiên cứu

rộng lớn. Sử dụng ảnh MODIS (từ vệ tinh TERRA và AQUA), các tác giả đã

41

phát triển thuật toán ATBD-MOD14 của NASA để xây dựng thuật toán của mô

hình dự báo cháy rừng, trong đó sử dụng 4 kênh phổ (kênh 21, 22, 31 và 32)

ảnh MODIS. Độ chính xác của mô hình được kiểm chứng thông qua thông tin

về các vụ cháy thực tế xảy ra tại các địa phương và các điểm cháy của Cục

Bảo, 2017).

Kiểm lâm với kết quả kiểm chứng thực tế đạt độ chính xác 75% (Trần Quang

Phạm Minh Hải và Vũ Ngọc Phan (2018) sử dụng công nghệ viễn thám

và GIS nghiên cứu vật liệu cháy trong các kiểu rừng phục vụ công tác phòng

chống cháy rừng tại tỉnh Bắc Giang. Trên cơ sở phương pháp chuyên gia và

phân tích các yếu tố ảnh hưởng đến quá trình cháy rừng tại huyện Sơn Động

(Bắc Giang), các tác giả đã lựa chọn và đề xuất các chỉ tiêu đầu vào cho mô

hình phân loại thảm thực vật rừng dễ cháy, bao gồm nhóm các yếu tố tự nhiên

(thảm thực vật, độ dốc, hướng sườn, lượng mưa trung bình tháng, nhiệt độ trung

bình ngày) và nhóm các yếu tố xã hội (khoảng cách từ các khu dân cư đến rừng,

Phan, 2018).

khoảng cách từ đất canh tác nương rẫy đến rừng) (Phạm Minh Hải, Vũ Ngọc

Lê Ngọc Hoàn và Trần Quang Bảo (2018) sử dụng ảnh MODIS giai đoạn

2010 – 2015 để trích xuất các điểm dị thường nhiệt, đồng thời tổng hợp và phân

tích đặc điểm phân bố các điểm dị thường nhiệt theo không gian và thời gian.

Kết quả nhận được được so sánh với kết quả phân vùng trọng điểm cháy rừng

và mùa cháy rừng ở Việt Nam, làm cơ sở để phát hiện sớm và cảnh báo nguy

cơ cháy rừng. Thuật toán trích xuất điểm dị thường nhiệt được trình bày trên

hình 1.13 (Lê Ngọc Hoàn, Trần Quang Bảo, 2018).

42

Hình 1.13 Thuật toán trích xuất điểm dị thường nhiệt từ dữ liệu viễn thám phục vụ

phát hiện sớm cháy rừng (Lê Ngọc Hoàn, Trần Quang Bảo, 2018)

Nguyễn Ngọc Thạch và cộng sự đã xây dựng bản đồ nguy cơ cháy rừng

ở cấp xã phục vụ công tác quản lý phòng chống cháy rừng tại tỉnh Sơn La. Với

sự trợ giúp của công nghệ GIS, nghiên cứu đã xây dựng các lớp thông tin đầu

vào của mô hình, bao gồm các yếu tố tự nhiên và kinh tế - xã hội ảnh hưởng

đến khả năng xảy ra cháy rừng, từ đó thành lập được bản đồ nguy cơ cháy rừng

chi tiết tới cấp xã (Nguyễn Ngọc Thạch và cộng sự, 2015). Giải pháp này tiếp tục

được hoàn thiện với các nghiên cứu của Nguyễn Ngọc Thạch và cộng sự (2017),

Đặng Ngô Bảo Toàn và cộng sự (2017). Phương pháp phân tích thứ bậc AHP

và các kỹ thuật học máy (Random forest, Support vector machine...) cũng được

Thach Nguyen et al., 2019; Đặng Ngô Bảo Toàn, 2021; Hoang V.T. et al., 2020).

kết hợp sử dụng để nâng cao độ chính xác dự báo nguy cơ cháy rừng (Ngoc

Luận án của Đặng Ngô Bảo Toàn (2021) cũng xây dựng được WebGIS hỗ trợ

cảnh báo, giám sát nguy cơ cháy rừng khu vực huyện Thuận Châu, tỉnh Sơn

43

La. Các kỹ thuật học sâu cũng được áp dụng trong nghiên cứu của Lê Văn Hưng

và cộng sự trong xây dựng mô hình dự báo nguy cơ cháy rừng cho khu vực tỉnh

Lâm Đồng (Lê Văn Hưng và cộng sự, 2019).

Hình 1.14 Giao diện WebGIS cảnh báo nguy cơ cháy rừng tại huyện Thuận Châu, tỉnh Sơn La (Đặng Ngô Bảo Toàn, 2021)

Luận án tiến sĩ của Trần Minh Cảnh đã sử dụng ảnh vệ tinh Landsat để

thành lập bản đồ hiện trạng rừng, sau đó xây dựng bản đồ phân cấp nguy cơ

cháy rừng trên cơ sở bản đồ hiện trạng và cấp nguy cơ cháy của chúng. Quá

trình thực hiện được tiến hành trên phần mềm ArcGIS 10.4 trên cơ sở các kỹ

thuật chồng xếp các lớp bản đồ (Trần Minh Cảnh, 2019). Nguyễn Phương Văn

sử dụng dữ liệu ảnh vệ tinh Landsat 7 ETM+ và Landsat 8 nhằm chiết xuất

thông tin nhiệt độ bề mặt, kết hợp cùng các lớp thông tin khác để xây dựng bản

Phương Văn, 2019). Các giải pháp kỹ thuật xử lý ảnh viễn thám cũng như phân

đồ nguy cơ cháy rừng trên cơ sở phương pháp phân tích thứ bậc AHP (Nguyễn

tích không gian trong các nghiên cứu trên còn khá đơn giản và chưa được các

tác giả quan tâm phân tích sâu.

44

Ngoài các nghiên cứu liên quan đến xây dựng mô hình dự báo nguy cơ

cháy rừng, dữ liệu viễn thám và GIS cũng được sử dụng trong nhiều nghiên

cứu phục vụ xây dựng các mô hình tài nguyên - môi trường khác nhau như phát

hiện và giám sát cháy ngầm ở bể than Quảng Ninh (Nguyễn Tiến Thành, 2021),

giám sát hệ thực vật ngập nước (Nguyễn Văn Hùng, 2022), xác định thông tin

bốc thoát hơi nước bề mặt (Lê Hùng Chiến, 2022)...

Nhìn chung, từ phân tích các kết quả nghiên cứu ở Việt Nam cho thấy,

việc sử dụng dữ liệu viễn thám và công nghệ GIS trong xây dựng các mô hình

dự báo nguy cơ cháy rừng là một tiếp cận phù hợp, khả thi, có hiệu quả cao,

tiết kiệm thời gian và công sức khi áp dụng với các khu vực có quy mô rộng.

Nhưng hạn chế của các nghiên cứu phần lớn các mô hình dựa trên chỉ số

Netresov, trong đó dựa chủ yếu vào các yếu tố khí tượng, Một số nghiên cứu

dùng viễn thám và GIS, nhưng đánh giá trọng số của các yếu tố ảnh hưởng,

chưa dùng các kỹ thuật AI trong dự báo. Một số nghiên cứu dùng nhiệt độ bề

mặt, rồi phân ngưỡng để đánh giá nguy cơ cháy rừng. Nhìn chung, chưa có

nghiên cứu nào xử lý dữ liệu trên nền tảng điện toán đám mây GEE, trong đó

kết hợp nhiều kỹ thuật học máy để lựa chọn phương pháp phù hợp với đặc điểm

khu vực nghiên cứu.

1.6 Luận giải những vấn đề cần nghiên cứu

Từ phân tích các nghiên cứu trên thế giới và ở Việt Nam cho thấy, hiện

nay vẫn chưa có phương pháp dự báo cháy rừng chung cho toàn thế giới. Mỗi

quốc gia, khu vực đã áp dụng và phát triển các phương pháp dự báo cháy rừng

riêng, phù hợp với điều kiện cụ thể của địa phương. Ở Việt Nam, phương pháp

dự báo cháy rừng phổ biến nhất là sử dụng chỉ số khí tượng tổng hợp Nesterov,

trong đó có điều chỉnh một số hệ số cho phù hợp với các khu vực khác nhau.

Mặc dù vậy, việc sử dụng các chỉ số tổng hợp có nhiều hạn chế do bỏ qua nhiều

yếu tố đầu vào có ảnh hưởng tới nguy cơ xảy ra cháy rừng như các chỉ số thảm

45

thực vật, khoảng cách đường giao thông, khoảng cách tới khu dân cư, mật độ

Cùng với sự phát triển của khoa học địa không gian và CMCN 4.0, thời

dân cư...

gian gần đây, nhiều nghiên cứu đã sử dụng dữ liệu viễn thám và hệ thông tin

địa lý kết hợp các kỹ thuật trí tuệ nhân tạo để xây dựng các mô hình dự báo

nguy cơ cháy rừng. Tuy nhiên, với mỗi khu vực khác nhau có điều kiện tự

nhiên, kinh tế - xã hội khác nhau, cần thiết phải nghiên cứu, đánh giá và lựa

chọn xây dựng mô hình phù hợp nhằm nâng cao hiệu quả công tác giám sát, dự

báo và cảnh báo nguy cơ cháy rừng.

Các nghiên cứu trong nước mặc dù đã thử nghiệm với nhiều mô hình

khác nhau, trong đó đã áp dụng các kỹ thuật trí tuệ nhân tạo trong xử lý dữ liệu

viễn thám và GIS nhằm nâng cao độ chính xác trong dự báo nguy cơ cháy rừng,

một số nghiên cứu đã xây dựng được WebGIS hỗ trợ cảnh báo cháy rừng, tuy

nhiên các công trình này chưa quan tâm nghiên cứu xử lý các dữ liệu không

gian này trên các nền tảng mở. Đây là một xu hướng phù hợp trong xử lý dữ

liệu lớn nói chung, dữ liệu không gian nói riêng, góp phần khắc phục các hạn

chế về hạ tầng lưu trữ cũng như nâng cao hiệu quả công tác quản lý và cảnh

báo sớm nguy cơ cháy rừng. Với sự phát triển mạnh mẽ của các kỹ thuật trí tuệ

nhân tạo trong thời gian qua, đặc biệt là các thuật toán học máy (machine

learning), học sâu (deep learning), việc kết hợp phương pháp phân tích thứ bậc

và các kỹ thuật xử lý dữ liệu không gian hiện đại là một tiếp cận phù hợp và

hiệu quả trong xây dựng các mô hình dự báo nguy cơ cháy rừng trên cơ sở dữ

liệu viễn thám và hệ thông tin địa lý.

Từ phân tích các kết quả đạt được cũng như những hạn chế trong các

nghiên cứu trước đó, đặc biệt là các nghiên cứu ở Việt Nam, trong luận án này,

nghiên cứu sinh tập trung nghiên cứu, lựa chọn mô hình dự báo nguy cơ cháy

rừng trên cơ sở dữ liệu viễn thám và hệ thông tin địa lý, bao gồm phương pháp

46

phân tích thứ bậc AHP, phương pháp sử dụng các kỹ thuật học máy như random

forest (RF), support vector machine (SVM), classification and regression trees

(CART)...Dữ liệu các điểm cháy trong quá khứ tại khu vực nghiên cứu được

sử dụng cho các mô hình học máy trong dự báo nguy cơ cháy rừng. Ngoài ra,

dữ liệu các điểm cháy cũng được sử dụng trong đánh giá độ chính xác của các

mô hình dự báo nguy cơ cháy rừng trên cơ sở phân tích sự phù hợp giữa các

điểm cháy và phân bố không gian các khu vực có nguy cơ cháy khác nhau (xác

định từ mô hình dự báo). Trên cơ sở kết quả đánh giá độ chính xác của mô hình

dự báo, mô hình có sự phù hợp nhất với dữ liệu các điểm cháy được lựa chọn

để dự báo nguy cơ cháy rừng ở khu vực nghiên cứu.

Để khắc phục được các hạn chế trên, trong luận án tiến hành nghiên cứu

các nội dung sau:

- Nghiên cứu, phân tích cơ sở khoa học các mô hình dự báo nguy cơ

cháy rừng bằng dữ liệu viễn thám và hệ thông tin địa lý;

- Thu thập và xử lý dữ liệu địa không gian khu vực nghiên cứu;

- Thử nghiệm, phân tích, đánh giá độ chính xác của các mô hình dự

báo nguy cơ cháy rừng trên cơ sở kết hợp các phương pháp truyền

thống và phương pháp học máy. Lựa chọn mô hình phù hợp đối với

khu vực nghiên cứu;

- Xây dựng bản đồ phân vùng nguy cơ cháy rừng khu vực nghiên cứu;

- Phân tích và đánh giá kết quả.

1.7 Tiểu kết chương 1

Trong chương 1, đã nghiên cứu tổng quan về đặc điểm tài nguyên rừng,

hiện trạng và nguyên nhân cháy rừng ở Việt Nam. Trong chương 1 cũng trình

bày các phương pháp dự báo nguy cơ cháy rừng, bao gồm các phương pháp

nghiên cứu truyền thống dựa trên mối quan hệ giữa các yếu tố khí tượng và khả

năng xảy ra cháy và phương pháp sử dụng dữ liệu viễn thám và GIS. Từ phân

47

tích tổng quan tình hình nghiên cứu trong và ngoài nước, trong chương 1 nghiên

cứu sinh đã luận giải các vấn đề còn tồn tại, đề xuất hướng giải quyết trong luận

án nhằm nâng cao hiệu quả ứng dụng dữ liệu viễn thám và GIS kết hợp các kỹ

thuật xử lý dữ liệu không gian hiện đại dựa trên trí tuệ nhân tạo nhằm nâng cao

hiệu quả ứng dụng trong cảnh báo sớm nguy cơ cháy rừng ở Việt Nam. Các kết

quả nhận được trong chương 1 cho thấy sự cần thiết phải nghiên cứu ứng dụng

các kỹ thuật học máy nhằm nâng cao độ chính xác của các mô hình dự báo

nguy cơ cháy rừng từ dữ liệu viễn thám và GIS.

48

CHƯƠNG 2. CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH DỰ BÁO

NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG

TIN ĐỊA LÝ

2.1 Đặc điểm khu vực nghiên cứu

Nghệ An nằm ở trung tâm vùng Bắc Trung Bộ, có tọa độ địa lý từ 18º33'

đến 20º01' vĩ độ Bắc, 103º52' đến 105º48’ kinh độ Đông, tiếp giáp với tỉnh Thanh

Hóa ở phía Bắc, tỉnh Hà Tĩnh ở phía Nam, phía Tây giáp nước Cộng hòa dân

chủ nhân dân Lào với đường biên giới dài 419 km; phía Đông giáp biển, trong

đó đường bờ biển dài 82 km. Nghệ An có diện tích 16.490,25 km2, lớn nhất cả

nước. Nghệ An có 21 đơn vị hành chính trực thuộc, bao gồm: 01 thành phố, 3

thị xã và 17 huyện, trong đó, thành phố Vinh là đô thị loại 1, là trung tâm kinh

tế, văn hóa của tỉnh và khu vực Bắc Trung bộ. Vị trí địa lý khu vực nghiên cứu

Hình 2.1 Vị trí địa lý tỉnh Nghệ An

được trình bày trên hình 2.1.

49

Điều kiện tự nhiên

Địa hình, địa mạo. Nghệ An có địa hình đa dạng và phức tạp, bị chia cắt

mạnh bởi các dãy đồi, núi và hệ thống sông suối. Về tổng thể, địa hình tỉnh

Nghệ An nghiêng theo hướng Tây Bắc - Đông Nam, với ba vùng sinh thái rõ

rệt: miền núi, trung du, đồng bằng ven biển, trong đó, miền núi chiếm khoảng

83% diện tích toàn tỉnh. Địa hình có độ dốc lớn với gần 80% diện tích tự nhiên

toàn tỉnh có độ dốc trên 8°, đặc biệt có trên 38% diện tích đất có độ dốc lớn

hơn 25°. Nơi cao nhất là đỉnh Puxailaileng (2.711 m) ở huyện Kỳ Sơn, thấp

nhất là vùng đồng bằng các huyện Quỳnh Lưu, Diễn Châu, Yên Thành, có nơi

chỉ cao 0,2 m so với mặt nước biển (xã Quỳnh Thanh, huyện Quỳnh Lưu).

Khí hậu. Nghệ An nằm trong vùng khí hậu nhiệt đới gió mùa, có mùa

mùa hè nóng ẩm, mưa nhiều (từ tháng 5 đến tháng 10) và mùa đông lạnh, ít

mưa (từ tháng 11 đến tháng 4 năm sau). Đây cũng là khu vực chịu ảnh hưởng

mạnh của gió phơn tây nam khô và nóng trong khoảng thời gian từ tháng 4 đến

tháng 8 hàng năm. Đây là loại gió đặc trưng tại khu vực Bắc Trung Bộ, hoạt

động mạnh nhất ở khu vực phía tây tỉnh Nghệ An, gây ra khí hậu khô và nóng,

ảnh hưởng tiêu cực đến hoạt động sản xuất, đời sống sinh hoạt cũng như làm

gia tăng nguy cơ cháy rừng.

Nhiệt độ trung bình hàng năm ở Nghệ An từ 23 - 24°C. Sự chênh lệch

nhiệt độ giữa các tháng trong năm khá cao, trong đó các tháng nóng nhất (tháng

6 đến tháng 7) nhiệt độ trung bình là 33°C. Nhiệt độ trung bình các tháng

lạnh nhất (tháng 12 năm trước đến tháng 2 năm sau) là 19°C. Số giờ nắng trung

bình/năm trong khoảng từ 1.500 đến 1.700 giờ. Lượng mưa bình quân hàng

năm dao động từ 1.200 - 2.000 mm/năm, với khoảng 123 - 152 ngày mưa trong

năm. Lượng mưa tập trung chủ yếu vào mùa hè (mùa mưa), chiếm từ 80 - 85%

tổng lượng mưa cả năm. Trong khi đó vào mùa khô (từ tháng 11 đến tháng 4

năm sau), lượng mưa chỉ chiếm từ 15 - 20% tổng lượng mưa. Tháng 1 và 2

50

được xem là các tháng khô hạn nhất trong năm, lượng mưa chỉ đạt trung bình

7 - 60 mm/tháng. Độ ẩm không khí trung bình năm dao động trong khoảng từ

80 - 90%, trong đó thấp nhất ở các huyện vùng núi như Kỳ Sơn, Tương Dương

và cao nhất tại khu vực thượng nguồn sông Hiếu.

Thủy văn. Nghệ An có hệ thống sông, suối dày đặc với mật độ lưới sông

trung bình trong khoảng từ 0,6 - 0,7 km/km2. Phần lớn sông ngòi ở Nghệ An

thuộc hệ thống sông Lam (còn gọi là sông Cả). Hệ thống sông Lam là một trong

9 lưu vực sông lớn nhất ở Việt Nam, trong đó có 44 sông nhánh cấp I, trong đó

sông Hiếu là sông nhánh lớn nhất với chiều dài 228 km, diện tích lưu vực đạt

5.340 km2. Các sông còn lại ở Nghệ An có lưu vực nhỏ (2000 - 3000 km2) với

chiều dài trung bình khoảng 60 - 70 km.

Tài nguyên rừng. Nghệ An có diện tích rừng và đất lâm nghiệp lớn nhất

cả nước, chiếm gần 70% diện tích đất tự nhiên toàn tỉnh, trong đó diện tích rừng

khoảng hơn 1 triệu ha (gần 786.550 ha rừng tự nhiên và 214.325 ha rừng trồng).

Mật độ che phủ rừng đạt 58,50% (theo báo cáo hiện trạng rừng Việt Nam năm

2020), trữ lượng gỗ đạt khoảng 91 triệu m3. Do có tiềm năng tài nguyên rừng

lớn, Nghệ An cũng là nơi đặt Khu lập nghiệp ứng dụng công nghệ cao vùng

Bắc Trung Bộ theo quyết định số 509/QĐ-TTg ngày 31/3/2021 của Thủ tướng

Chính phủ. Nghệ An cũng có khu dự trữ sinh quyển lớn nhất khu vực Đông

Nam Á với vườn quốc gia Pù Mát (diện tích 93.523 ha), khu bảo tồn thiên nhiên

Pù Huống (41.127 ha) và khu bảo tồn thiên nhiên Pù Hoạt (34.723 ha).

Mặc dù có diện tích và tiềm năng tài nguyên rừng lớn, hệ sinh thái rừng

ở Nghệ An cũng có những biến động sâu sắc trong thời gian gần đây. Độ che

phủ rừng toàn tỉnh có xu hướng tăng nhưng phần lớn diện tích tăng là rừng

trồng có giá trị đa dạng sinh học không cao. Diện tích rừng tự nhiên có sự suy

giảm rõ rệt cả về chất lượng và diện tích. Rừng nguyên sinh chưa bị tác động

51

chỉ còn là những khu vực nhỏ, rời rạc tại vùng núi phía Tây của Nghệ An, thuộc

các khu bảo tồn thiên nhiên và vườn quốc gia.

Điều kiện kinh tế - xã hội

Nghệ An là một tỉnh có dân số lớn của cả nước, với dân số năm 2020 đạt

3.365.198 người (đứng thứ 4 cả nước), mật độ trung bình 204 người/km2. Dân

số sinh sống tại khu vực miền núi ở tỉnh Nghệ An trên 1,2 triệu người (chiếm

36% dân số toàn tỉnh). Đồng bào dân tộc thiểu số là 491.267 người, chiếm

14,76% dân số toàn tỉnh và chiếm 40,93% dân số trên địa bàn miền núi. Nghệ

An hiện có 47 dân tộc cùng sinh sống, ngoài người Kinh còn có dân tộc Thái

(338.559 người), Thổ (71.420 người), Khơ Mú (43.139 người), Mông (33.957

người) (theo Cổng thông tin điện tử tỉnh Nghệ An).

Nghệ An là một đầu mối giao thông quan trọng của cả nước, có mạng

lưới giao thông phát triển và đa dạng, bao gồm hệ thống đường bộ, đường sắt,

đường sông, sân bay và cảng biển, được hình thành và phân bố khá hợp lý theo

các vùng dân cư và các trung tâm hành chính, kinh tế. Với điều kiện tự nhiên

đa dạng và phong phú, Nghệ An có nhiều lợi thế để phát triển du lịch, bao gồm

du lịch biển ở phía Đông và các khu du lịch gắn liền với các khu bảo tồn thiên

nhiên ở phía Tây. Nhìn chung, khu vực phía tây tỉnh Nghệ An là nơi có đặc

điểm địa hình, thủy văn, giao thông, thực phủ, dân cư...khác so với khu vực

bằng phẳng gần biển ở phía đông của tỉnh. Điều này cũng ảnh hưởng đến đặc

điểm cháy rừng ở Nghệ An.

Đặc điểm cháy rừng ở Nghệ An

Do ảnh hưởng của điều kiện thời tiết và các hoạt động của con người,

Nghệ An là một trong những khu vực có tình trạng cháy rừng diễn ra phức tạp

trong cả nước. Chỉ riêng 6 tháng đầu năm 2020 ở Nghệ An xảy ra 16 vụ cháy,

tổng diện tích rừng bị cháy là 116 ha, trong đó chỉ có 4 vụ cháy rừng xác định

52

được đối tượng gây cháy. 5 tháng đầu năm 2022 cũng xảy ra 2 vụ cháy rừng tại

Nghệ An, tuy nhiên đã được lực lượng kiểm lâm ứng phó kịp thời.

Theo Sở Nông nghiệp và Phát triển nông thôn Nghệ An, các nguyên nhân

gây cháy rừng bao gồm: ảnh hưởng của thời tiết nắng nóng; do mâu thuẫn cá

nhân và tranh chấp đất đai. Nắng nóng gay gắt kéo dài và gió thổi mạnh dẫn

đến nguy cơ cháy rừng vào mùa hè ở Nghệ An luôn cao với cảnh báo cháy rừng

từ cấp IV đến cấp V. Ngoài ra, do đường băng cản lửa hạn chế về chiều ngang

dẫn đến khi gió thổi mạnh, đường băng không cản được lửa dẫn đến lây lan

cháy rừng.

Mối quan hệ giữa các yếu tố tự nhiên, xã hội và cháy rừng

Từ đặc điểm cháy rừng ở Nghệ An cho thấy, nguyên nhân chính của tình

trạng này là do ảnh hưởng của các yếu tố tự nhiên cũng như hoạt động của con

người (yếu tố xã hội).

Chất lượng rừng là một trong những yếu tố tự nhiên có ảnh hưởng đến

tình trạng cháy rừng ở Nghệ An. Trong những năm qua, mặc dù diện tích rừng

ở Nghệ An tăng lên nhưng chất lượng rừng lại có chiều hướng suy giảm. Đặc

điểm này càng thể hiện rõ nét ở khu vực phía tây Nghệ An khi diện tích rừng

nguyên sinh chỉ còn chiếm tỉ lệ rất ít (tập trung ở các khu bảo tồn thiên nhiên,

vườn quốc gia), trong khi rừng thứ sinh nghèo kiệt và rừng trồng chiếm phần

lớn diện tích rừng, và đây là loại rừng rất dễ xảy ra cháy. Ngoài ra, rừng dễ

cháy còn liên quan đến loại hình thực bì có đặc tính bắt lửa hay địa hình của

các cánh rừng tạo nên các khu vực tiểu khí hậu khô hạn, ít mưa ở các tỉnh Trung

Bộ, trong đó có Nghệ An.

Diễn biến thời tiết, khí hậu ngày càng phức tạp và khó lường, đặc biệt tại

các tỉnh miền Trung cũng làm cho nguy cơ tiềm ẩn về cháy rừng ngày càng

nghiêm trọng. Điều kiện thời tiết và các nhân tố khí tượng là các tác nhân cho

sự phát sinh, phát triển của một đám cháy rừng bao gồm nhiệt độ, độ ẩm, gió,

53

trong đó nhiệt độ là yếu tố gây ảnh hưởng trực tiếp đến quá trình cháy rừng;

gió là nhân tố thúc đẩy nhanh quá trình làm khô vật liệu cháy và làm đám cháy

lan rộng.

Bên cạnh yếu tố tự nhiên, cháy rừng còn bắt nguồn từ các hoạt động xã

hội và các hoạt động sản xuất của con người như đốt rừng làm nương rẫy, đốt

quang thực bì, đốt rác trong vườn cạnh khu rừng trồng, hun khói để lấy mật

ong... Nhiều diện tích rừng trồng không được chăm sóc dẫn đến gia tăng nguồn

vật liệu cháy, do vậy về mùa khô rất dễ bốc cháy khi gặp nguồn lửa. Rất nhiều

vụ cháy rừng ở Việt Nam nói chung, khu vực Nghệ An nói riêng có nguyên

nhân trực tiếp là yếu tố con người, bao gồm cả nguyên nhân do mâu thuẫn và

tranh chấp đất đai.

2.2 Tổng quan chung về dữ liệu phục vụ xây dựng mô hình dự báo nguy

cơ cháy rừng

Xây dựng dữ liệu cho mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn

thám và GIS là một nội dung có ý nghĩa rất quan trọng trong phát hiện và cảnh

báo sớm các khu vực có nguy cơ xảy ra cháy rừng cao. Các lớp thông tin đầu

vào của mô hình được xây dựng dựa trên dữ liệu viễn thám (ảnh vệ tinh quang

học Sentinel 2 MSI, Landsat 8/9, MODIS), dữ liệu GIS (trên cơ sở phân tích

mô hình số độ cao DEM) và các số liệu, tài liệu khác.

Trên cơ sở đặc điểm tự nhiên, xã hội và thực trạng dữ liệu ở khu vực

nghiên cứu (phía tây tỉnh Nghệ An), trong luận án này, nghiên cứu sinh tiến

hành thu thập và xây dựng dữ liệu đầu vào của mô hình dự báo nguy cơ cháy

rừng với 09 lớp thông tin, bao gồm:

+ Mật độ dân số;

+ Thông tin về lớp phủ thực vật (chỉ số thực vật NDVI);

+ Thông tin về độ ẩm bề mặt (độ bốc thoát hơi nước);

+ Hướng sườn (Aspect);

54

+ Độ dốc (Slope);

+ Tốc độ gió;

+ Độ cao;

+ Nhiệt độ bề mặt (land surface temperature);

+ Lượng mưa trung bình tháng.

Trong các lớp thông tin này, chỉ số thực vật NDVI, nhiệt độ bề mặt được

chiết xuất từ dữ liệu viễn thám (ảnh Sentinel 2 MSI và Landsat 8/9). Độ dốc,

hướng sườn, độ cao được chiết xuất thông qua dữ liệu GIS trên cơ sở sử dụng

mô hình số độ cao DEM. Độ bốc thoát hơi nước được thu thập từ bộ sản phẩm

ảnh vệ tinh MODIS trên nền tảng GEE. Các lớp thông tin còn lại được thu thập

từ các cơ sở dữ liệu về kinh tế - xã hội, khí tượng, khí hậu, sau đó biên tập và

chuẩn hóa lại theo quy định.

Cấu trúc dữ liệu của các lớp thông tin đầu vào trong mô hình dự báo nguy

cơ cháy rừng được chuẩn hóa và lưu trữ dưới dạng vector và raster để thuận

tiện khi thực hiện các phép phân tích không gian trong môi trường GIS.

2.3 Các lớp thông tin thành phần và phương pháp xây dựng cơ sở dữ liệu

thành phần

a) Thông tin lớp phủ thực vật

Lớp phủ thực vật là một yếu tố đầu vào hết sức qua trọng của các mô

hình dự báo nguy cơ cháy rừng. Lớp thông tin về thực vật có thể được xây dựng

từ các bản đồ địa hình, bản đồ chuyên đề hoặc chiết xuất từ ảnh viễn thám

quang học, trong đó phương pháp chỉ số thực vật (vegetation index) được sử

dụng phổ biến nhất do sự hiệu quả và đơn giản trong tính toán các chỉ số thực

vật. Các chỉ số phổ thực vật được xác định từ các kênh ảnh ở dải sóng cận hồng

ngoại, hồng ngoại và đỏ là các tham số trung gian mà từ đó có thể thấy được

các đặc tính khác nhau của thảm thực vật như sinh khối, chỉ số diện tích lá, khả

năng quang hợp, tổng các sản phẩm sinh khối theo mùa mà thực vật có thể tạo

55

ra. Những đặc tính đó có liên quan và phụ thuộc rất lớn vào dạng thực vật bao

phủ và thời tiết, đặc tính sinh lý, sinh hoá và sâu bệnh…Hiện nay, có hàng chục

2009; Vũ Danh Tuyên và cộng sự, 2020).

chỉ số thực vật khác nhau và chia thành 7 nhóm chính (Cherepanov, Druzhinina,

Trong số các chỉ số thực vật, chỉ số khác biệt thực vật NDVI được sử

dụng phổ biến và hiệu quả trong nghiên cứu thông tin lớp phủ bề mặt. Hiện

nay, rất nhiều mô hình dự báo, cảnh báo thiên tai như các mô hình cảnh báo xói

mòn đất, trượt lở đất, lũ quét...đã sử dụng chỉ số NDVI là đại diện cho lớp phủ

thực vật khu vực thực nghiệm. Chỉ số NDVI được Rousse và cộng sự đề xuất

năm 1974 trên cơ sở phân tích ảnh vệ tinh quang học Landsat và được xác định

theo công thức sau (Rouse et al., 1974):

(2.1)

Trong đó, NIR và RED là phổ phản xạ bề mặt ở kênh cận hồng ngoại và

kênh đỏ. Với ảnh Sentinel 2 MSI, kênh cận hồng ngoại và đỏ tương ứng với

kênh 8 và kênh 4.

Chỉ số NDVI nhận giá trị trong khoảng từ -1 đến +1, trong đó thực vật

có giá trị lớn hơn 0,2. Trong trường hợp chỉ số NDVI > 0,5, bề mặt được coi là

được phủ kín bởi thực vật (sóng điện từ không tới được lớp đất). Đối với đất

trống không có thực vật bao phủ, NDVI < 0,2. Đối với mặt nước và đất ẩm, chỉ

số NDVI nhận giá trị âm (Vũ Danh Tuyên và cộng sự, 2020).

Việc sử dụng chỉ số NDVI chiết xuất từ ảnh viễn thám quang học cho

phép xác định nhanh thông tin lớp phủ thực vật. Hơn nữa, do khả năng chụp

lặp lại và mức độ cập nhật cao của dữ liệu viễn thám, việc sử dụng chỉ số NDVI

cũng cho phép các mô hình dự báo nguy cơ cháy rừng có thông tin về lớp phủ

gần với thời gian thực hơn so với việc xác định từ các bản đồ địa hình, bản đồ

chuyên đề.

56

b) Thông tin độ ẩm bề mặt

Để xây dựng lớp thông tin độ ẩm bề mặt có thể sử dụng các chỉ số độ ẩm

đất (soil moisture index) hoặc độ bốc thoát hơi nước (Evaporation) xác định từ

ảnh viễn thám quang học. Hiện nay, có nhiều chỉ số độ ẩm đất khác nhau được

sử dụng phổ biến trong đánh giá mức độ ẩm bề mặt như chỉ số TVDI

(Temperature Vegetation Dryness Index), NDDI (Normalized Difference

Drought Index), LSWI (Land Surface Water Index), NMDI (Normalized Multi-

band Drought Index), SMI (Soil Moisture Index)...Các chỉ số độ ẩm này được

xây dựng trên cơ sở sử dụng các kênh ở dải sóng hồng ngoại và hồng ngoại

sóng ngắn, một số chỉ số sử dụng thêm thông tin nhiệt độ bề mặt chiết tách từ

các kênh hồng ngoại nhiệt (Wang and Qu, 2007). Ví dụ về phân cấp nguy cơ

cháy rừng từ chỉ số NMDI đối với khu vực Simitli Municipality (Bulgaria)

Hình 2.2 Ví dụ về phân cấp nguy cơ cháy rừng từ chỉ số NMDI (Avetisyan và Nedkov, 2015)

được trình bày trên hình 2.2 (Avetisyan và Nedkov, 2015).

57

Độ bốc thoát hơi nước cũng có thể được sử dụng trong xây dựng lớp

thông tin đầu vào về độ ẩm bề mặt. Bốc thoát hơi nước đóng một vai trò rất

quan trọng trong hệ sinh thái, kết nối các chu trình nước, carbon và năng lượng

toàn cầu. Tỉ lệ bốc thoát hơi nước của lớp phủ thực vật cho phép xác định tình

trạng sinh trưởng cũng như thiếu nước của cây trồng. Độ bốc thoát hơi nước

cao và độ ẩm bề mặt bị giảm sẽ tạo điều kiện thuận lợi cho phát sinh nguy cơ

cháy rừng.

Độ bốc thoát hơi nước có thể chiết xuất từ ảnh viễn thám quang học như

Landsat, MODIS..., trong đó sản phẩm độ bốc thoát hơi nước xác định từ ảnh

MODIS được sử dụng một cách rộng rãi và được cung cấp trên nền tảng GEE.

Do vậy, trong luận án này, đã sử dụng thông tin độ bốc thoát hơi nước để xây

dựng lớp dữ liệu đầu vào về độ ẩm bề mặt cho mô hình dự báo nguy cơ cháy

rừng.

c) Thông tin nhiệt độ bề mặt

Nhiệt độ bề mặt là một lớp thông tin rất quan trọng trong các mô hình

khí hậu, khí tượng nói chung, mô hình dự báo nguy cơ cháy rừng nói riêng.

Nhiệt độ bề mặt có thể được xác định bằng cách sử dụng các kênh hồng ngoại

nhiệt ảnh viễn thám như Landsat, Aster, MODIS...So với các phương pháp

nghiên cứu truyền thống, việc sử dụng dữ liệu viễn thám hồng ngoại nhiệt cho

phép chiết tách nhanh thông tin nhiệt độ bề mặt ở một khu vực rộng lớn, kể cả

thông tin nhiệt độ bề mặt trong quá khứ.

Trong số các dữ liệu ảnh viễn thám hồng ngoại nhiệt, ảnh hồng ngoại

nhiệt Landsat được sử dụng phổ biến và hiệu quả nhất do những ưu điểm nổi

bật như kho dữ liệu đa thời gian, độ phân giải không gian tốt và được cung cấp

miễn phí. Ngoài các kênh ảnh ở dải sóng quang học, bộ cảm biến hồng ngoại

nhiệt được trang bị trên các vệ tinh Landsat 4, Landsat 5, Landsat 7, Landsat 8

và Landsat 9 để thu nhận tín hiệu phản hồi về nhiệt độ của vật thể trên bề mặt

58

Trái đất. Đặc điểm các kênh hồng ngoại nhiệt ảnh vệ tinh Landsat được trình

Bảng 2.1. Đặc điểm ảnh hồng ngoại nhiệt Landsat

bày trong Bảng 2.1.

STT

Vệ tinh

Kênh

Bước sóng (µm)

Độ phân giải không gian (m)

1

Landsat 4/5 TM

6

10.40 – 12.50

120 m

2

Landsat 7 ETM+

6

10.40 – 12.50

60 m

10

10.30 – 11.30

100 m

Landsat 8/9

3

OLI_TIRS

11

11.50 – 12.50

100 m

+ Phương pháp sử dụng kênh đơn (single-channel)

Phương pháp single-channel trong xác định nhiệt độ bề mặt được đề xuất

bởi Cơ quan Hàng không vũ trụ Hoa Kỳ (NASA). Trong phương pháp này, đầu

tiên, giá trị số (DN - digital number) của kênh hồng ngoại nhiệt được chuyển

đổi sang giá trị thực của bức xạ điện từ (spectral radiance, Wm-2µm-1).

Đối với kênh hồng ngoại nhiệt ảnh Landsat 5 TM, giá trị bức xạ phổ được

xác định theo công thức sau:

(2.3)

Trong đó:

Lλ – Giá trị bức xạ phổ [W/(m2.sr.µm)];

DN – Giá trị số của ảnh (digital number);

DNmax – Giá trị số lớn nhất (=255);

DNmin – Giá trị số nhỏ nhất (=1);

Lmaxλ, Lminλ – Giá trị bức xạ phổ ứng với DNmax và DNmin ở từng kênh

phổ.

Giá trị các hệ số Lmaxλ và Lminλ được cung cấp trong tệp siêu dữ liệu

(metadata file) đi kèm theo sản phẩm ảnh vệ tinh Landsat.

59

Đối với ảnh Landsat 8/9 OLI_TIRS, giá trị bức xạ phổ được xác định

theo công thức sau:

(2.4)

Trong đó:

ML, AL – Hệ số chuyển đổi, được lấy trong tệp siêu dữ liệu (metadata

file) ảnh Landsat 8/9;

Qcal – Giá trị số của ảnh.

Ở bước tiếp theo, giá trị bức xạ phổ xác định ở bước trên được sử dụng

để tính nhiệt độ bức xạ (brightness temperature) theo công thức sau:

(2.5)

Trong đó:

TB – Nhiệt độ bức xạ (0K);

K1 – Hằng số chuyển đổi [W/(m2.sr.µm)];

K2 – Hằng số chuyển đổi [K];

Giá trị các hằng số K1, K2 được cung cấp trong tệp siêu dữ liệu ảnh

Landsat (Bảng 2.2).

Bảng 2.2 Giá trị K1, K2 đối với ảnh hồng ngoại nhiệt LANDSAT

10

LANDSAT 8/9

774.89

1321.08

11

LANDSAT 8/9

480.89

1201.14

6

LANDSAT TM

607.66

1260.56

6

LANDSAT ETM+

666.09

1282.71

Kênh Vệ tinh K1 (Watts.m-2.ster-1µm-1) K2 (K)

Cuối cùng, nhiệt độ bề mặt (LST – land surface temperature) được xác

định theo công thức sau:

60

(2.6)

Trong đó:

ℎ.𝑐

𝜆 – giá trị bước sóng trung tâm kênh hồng ngoại nhiệt;

𝜎

, σ – Hằng số Stefan Boltzmann (5.67.10-8 (Wm-2.K-4)); 𝜌 =

h – Hằng số Plank (6.626.10-34J.sec);

c – vận tốc ánh sáng (2.998.108 m/sec).

và Caseless, 1996):

ε – độ phát xạ bề mặt, được xác định theo công thức (2.7) như sau (Valor

(2.7)

Trong đó εv, εs – độ phát xạ bề mặt của thực vật và đất trống, được xác

định trên cơ sở chỉ số NDVI băng cách áp dụng thuật toán do Van de Griend

và Owen đề xuất (Van de Griend và Owen, 1993) theo công thức 2.8:

(2.8)

Pv là tỉ lệ thực vật trong từng pixel, được xác định theo công thức sau:

(2.9)

+ Phương pháp sử dụng 2 kênh hồng ngoại nhiệt (split-window)

Khác với phương pháp single-channel chỉ sử dụng một kênh hồng ngoại

nhiệt, nhiệt độ bề mặt được xác định bằng phương pháp Split-window trên cơ

al., 2006):

sở cả 02 kênh hồng ngoại nhiệt ảnh Landsat 8/9 theo công thức sau (Sobrino et

(2.10)

Trong đó:

61

TB10, TB11– nhiệt độ bức xạ (brightness temperature) xác định từ kênh 10

và 11 ảnh Landsat 8/9;

w – hàm lượng hơi nước trong khí quyển (g/cm2). w xác định theo

phương pháp do Huazhong đề xuất (Huazhong et al., 2004).

ε – giá trị độ phát xạ bề mặt trung bình;

Δε – chênh lệch độ phát xạ bề mặt ở kênh 10 và 11;

C0 đến C6 – Hệ số trong phương pháp SW (Sobrino et al., 2006).

Độ phát xạ bề mặt trung bình được lấy bằng trung bình cộng độ phát xạ

bề mặt đối với kênh 10 và kênh 11 ảnh Landsat 8/9 theo công thức sau:

(2.11)

Trong khi đó, chênh lệch độ phát xạ bề mặt ở kênh 10 và kênh 11 được

xác định như sau:

(2.12)

Trong đó, ε10 và ε11 là độ phát xạ bề mặt tại các kênh 10 và 11 ảnh vệ

tinh Landsat 8/9 xác định theo công thức (2.7). Giá trị độ phát xạ bề mặt của

đất trống và thực vật đối với kênh 10 và 11 ảnh vệ tinh Landsat 9 được tham

khảo theo nghiên cứu của Yu (Yu et al., 2014).

2.3 Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa lý

a) Độ cao (DEM)

DEM (mô hình số độ cao) là một trong những nguồn dữ liệu địa hình

phổ biến nhất trên thế giới, được lưu trữ ở định dạng ô lưới (grid/raster) và là

thông tin đầu vào của rất nhiều các mô hình quản lý tài nguyên, môi trường,

cảnh báo sớm thiên tai. DEM là dữ liệu đầu vào để tính toán các thông tin địa

hình như độ dốc, hướng dốc, độ dài sườn dốc, xác định lưu vực,...DEM có thể

62

được xây dựng trên cơ sở sử dụng phương pháp chụp ảnh lập thể, ảnh viễn thám

radar hoặc xây dựng từ các đường đồng mức trong bản đồ địa hình.

Hiện nay, có nhiều nguồn dữ liệu DEM toàn cầu được cung cấp miễn phí

với độ phân giải không gian cao, hỗ trợ hiệu quả cho các mục đích khác nhau,

từ quản lý tài nguyên, môi trường, phát triển kinh tế - xã hội và đảm bảo quốc

phòng - an ninh. Một số nguồn dữ liệu DEM toàn cầu miễn phí bao gồm:

+ Aster Global Digital Elevation Model (GDEM)

GDEM là sản phẩm mô hình số độ cao toàn cầu trong chương trình hợp

tác giữa NASA và chính phủ Nhật Bản thông qua hệ thống vệ tinh ASTER.

GDEM được xây dựng trên cơ sở phương pháp chụp ảnh lập thể, có độ phân

giải không gian 90m ở phạm vi toàn cầu và 30m ở lãnh thổ Hoa Kỳ. Do được

xây dựng từ dữ liệu viễn thám quang học, Aster GDEM được đánh giá chính

xác hơn SRTM tại các khu vực miền núi. Mặc dù vậy, Aster GDEM cũng có

nhược điểm khi độ chính xác không cao tại các khu vực bị mây che phủ do đặc

điểm thu nhận ảnh viễn thám quang học. Người dùng có thể tải miễn phí dữ

liệu Aster GDEM tại cơ sở dữ liệu Earth Explorer. Ví dụ về Aster GDEM với

https://lpdaac.usgs.gov/).

độ phân giải không gian 30m được trình bày trên hình 2.3 (nguồn:

63

Hình 2.3 Ví dụ về mô hình số độ cao Aster GDEM (nguồn https://lpdaac.usgs.gov/)

+ Space Shuttle Radar Topography Mission (SRTM)

Sứ mệnh địa hình tàu con thoi (SRTM) là dữ liệu DEM toàn cầu với độ

phân giải không gian 30m được thực hiện bởi Cơ quan hàng không vũ trụ Mỹ

(NASA) thông qua kỹ thuật radar giao thoa (InSAR) trên tàu con thoi

Endeavour. Sử dụng các ảnh radar ở băng tần C và X, SRTM bao phủ khoảng

80% diện tích Trái Đất và được lưu trữ trên cơ sở dữ liệu USGS Earth Explorer.

Đây là nguồn dữ liệu DEM với độ phân giải không gian cao, hỗ trợ hiệu quả

cho nhiều ứng dụng cụ thể.

Sản phẩm SRTM bao gồm các mức xử lý khác nhau:

- SRTM Non-void Filled: DEM được xử lý từ ảnh radar băng tần C với

độ phân giải không gian 30m đối với lãnh thổ Hoa Kỳ và 90m đối với

khu vực bên ngoài Hoa Kỳ.

- SRTM Void Filled: là kết quả quá trình xử lý bổ sung để khắc phục

việc thiếu dữ liệu ở một số khu vực trong bộ dữ liệu SRTM Non-void

Filled do quá trình xử lý ban đầu không đảm bảo yêu cầu chất lượng.

Quá trình lấp đầy dữ liệu này được thực hiện bằng các thuật toán nội

64

suy không gian kết hợp sử dụng các nguồn dữ liệu độ cao khác. Độ

phân giải không gian của SRTM Void Filled đạt 30m tại lãnh thổ Hoa

Kỳ và 90m bên ngoài Hoa Kỳ.

- SRTM1 Arc-second Global: dữ liệu DEM trên phạm vi toàn thế giới

với độ phân giải không gian 30m, được lưu trữ trên cơ sở dữ liệu

Hình 2.4 Mô hình DEM SRTM khu vực Nghệ An (nguồn https://lpdaac.usgs.gov/)

EarthExplorer.

+ JAXA’s Global ALOS 3D World

ALOS 3D World là mô hình số bề mặt (DSM – Digital Surface Model)

với độ phân giải không gian 30m do Cơ quan Hàng không vũ trụ Nhật Bản

(JAXA) xây dựng bằng phương pháp chụp ảnh lập thể từ hệ thống vệ tinh

ALOS. Đây được xem là bộ dữ liệu độ cao ở quy mô toàn cầu có độ chính xác

cao nhất hiện nay. So sánh dữ liệu độ cao ALOS 3D World và SRTM được

trình bày trên hình 2.5, trong đó có thể nhận thấy độ phân giải không gian của

dữ liệu ALOS 3D World tốt hơn rất nhiều so với SRTM.

65

b)

a)

Hình 2.5 So sánh dữ liệu mô hình số độ cao JAXA’s Global ALOS 3D World (a) và SRTM (b) (nguồn: https://www.satpalda.com/alos-world-3d)

+ GMTED 2010, GTOPO30

GMTED 2010 là dữ liệu độ cao toàn cầu với 3 độ phân giải không gian:

225m, 450m và 1km. GMTED 2010 là bộ dữ liệu thay thế cho dữ liệu mô hình

số độ cao GTOPO30 (độ phân giải không gian 1km), và được ứng dụng cho

các khu vực có diện tích lớn như ở quy mô quốc gia, châu lục.

Dữ liệu GMTED 2010 và GTOPO30 được thu thập từ nhiều nguồn khác

nhau bằng phương pháp tổng hợp. So sánh hai bộ dữ liệu mô hình số độ cao

2011).

GMTED 2010 và GTOPO30 được trình bày trên hình 2.6 (Danielson và Gesch,

66

Hình 2.6 So sánh dữ liệu mô hình số độ cao GMTED 2010 và GTOPO30 (Danielson và Gesch, 2011)

b) Hướng dốc (Aspect)

Bề mặt thường được định theo một hướng cụ thể. Hướng này được gọi

là hướng của góc dốc (aspect). Hai góc, một là góc đo hướng và một góc chỉ

độ nghiêng của sườn dốc xác định hướng dốc. Phương pháp toán học để xác

định các hướng là tính toán góc của gradient so với hướng Bắc. Phương vị (góc

tạo bởi sự dịch chuyển theo chiều kim đồng hồ từ hướng Bắc tới hướng của góc

dốc cực đại) nằm trong khoảng từ 0o tới 360o, nó tương ứng với những hướng

sau: Bắc, Đông, Nam, Tây hoặc ở vị trí nào đó giữa 4 hướng chính trên. Hiệu

giữa 90o và góc gradient thể hiện độ nghiêng của góc dốc dọc theo một hướng

xác định. Góc lệch này càng nhỏ thì độ dốc càng lớn (Aronoff, 1989).

Ví dụ về kết quả xác định hướng dốc từ DEM được trình bày trên hình

2.7 (Mokarram và Zarei, 2018).

67

Hình 2.7 Ví dụ về kết quả xác định hướng dốc từ DEM (Mokarram và Zarei, 2018)

Hướng dốc là một lớp thông tin về bề mặt địa hình trong nhiều mô hình

dự báo, cảnh báo thiên tai, trong đó có mô hình dự báo nguy cơ cháy rừng.

Hướng dốc có thể được xác định trên cơ sở phân tích mô hình số độ cao (DEM).

Các phần mềm GIS thông dụng hiện nay như ArcGIS, MapInfo, MicroStation

đều có các công cụ để tính toán hướng dốc từ dữ liệu DEM.

c) Độ dốc (Slope)

Độ dốc (góc dốc) là tham số đưa ra độ dốc của địa hình bằng cách tính

toán mức độ thay đổi của độ cao. Độ dốc có thể được xác định theo đơn vị độ

(0 – 900) hoặc phần trăm là hàm tang của góc dốc (độ dốc 45 độ tương ứng với

độ dốc 100%). Độ dốc của địa hình thường được xác định từ mô hình số độ cao

(DEM). Độ dốc là thông số đầu quan trọng vào của nhiều mô hình đánh giá,

phân vùng nguy cơ xói mòn, trượt lở, thoái hóa đất; lũ quét…sử dụng dữ liệu

liệu GIS và viễn thám. Hình 2.8 trình bày ví dụ về kết quả tính độ dốc từ mô

hình số độ cao (DEM) trong cảnh báo nguy cơ trượt lở đất tại khu vực Sikkim

(Ấn Độ) (James và Thallak, 2015).

68

Hình 2.8 Ví dụ về xác định độ dốc từ DEM (James và Thallak, 2015)

2.4 Nhóm các lớp thông tin khác

Các lớp dữ liệu Tốc độ gió, Lượng mưa trung bình tháng được trích xuất

qua cơ sở dữ liệu WorldClim (https://www.worldclim.org/). WorldClim là một

cơ sở dữ liệu về dữ liệu thời tiết và khí hậu toàn cầu có độ phân giải không gian

cao. Những dữ liệu này có thể được sử dụng để lập bản đồ và mô hình hóa

không gian. Trong luận án, lựa chọn sử dụng bộ dữ liệu có độ phân giải không

gian 30s (~1km2) trước khi nội suy về độ phân giải 10m để phù hợp với độ phân

giải của các lớp thông tin khác. Ví dụ về bản đồ lớp thông tin tốc độ gió khu

vực vườn quốc gia Tam Đảo (Việt Nam) trích xuất từ cơ sở dữ liệu WorldClim

được trình bày trên hình 2.9 (Pham Duc Dat và Le Thai Son, 2022).

69

Hình 2.9 Thông tin về tốc độ gió khu vực vườn quốc gia Tam Đảo trích xuất từ

CSDL WorldClim (Pham Duc Dat và Le Thai Son, 2022)

Lớp dữ liệu Mật độ dân số được trích xuất qua tập dữ liệu nhân khẩu học

WorldPop (https://data.worldpop.org/). WorldPop đã phát triển các phương

pháp nhằm xây dựng dữ liệu không gian địa lý mở và có độ phân giải cao về

phân bố dân cư, nhân khẩu học và động lực học, tập trung vào các quốc gia có

thu nhập thấp và trung bình. Trong luận án này, thông tin mật độ dân số của

khu vực nghiên cứu được trích xuất theo ranh giới 6 huyện phía tây tỉnh Nghệ

An từ dữ liệu mật độ dân số WorldPop năm 2020, sau đó nội suy về độ phân

giải 10m. Bản đồ mật độ dân số toàn cầu năm 2020 từ cơ sở dữ liệu WolldPop

được trình bày trên hình 2.10 (https://data.worldpop.org/).

70

Hình 2.10 Thông tin về mật độ dân số toàn cầu năm 2020 trích xuất từ CSDL

WorldPop (https://data.worldpop.org/)

2.5 Phương pháp xử lý dữ liệu trên nền tảng Google Earth Engine

Xử lý dữ liệu viễn thám đa thời gian trên các nền tảng địa không gian mở như

Google Earth Engine (GEE) là một xu hướng công nghệ phổ biến và phù hợp trong

điều kiện hiện nay. Hiện nay có hàng trăm hệ thống vệ tinh viễn thám khác nhau của

nhiều quốc gia trên thế giới đã và đang hoạt động, cung cấp nguồn dữ liệu viễn thám

khổng lồ, đa thời gian, đa chủng loại. Điều này cũng dẫn đến khó khăn về hạ tầng lưu

trữ khi xử lý dữ liệu lớn viễn thám. Việc sử dụng các nền tảng địa không gian mở

trong xử lý trực tuyến dữ liệu viễn thám đa thời gian là một tiếp cận phù hợp và hiệu

quả, giúp giải quyết các khó khăn về cơ sở hạ tầng viễn thám, nhất là với các ứng

dụng đòi hỏi dữ liệu viễn thám lớn.

Google Earth Engine (GEE) là một nền tảng phân tích không gian địa lý

dựa trên điện toán đám mây cho phép người dùng trực quan hóa và phân tích

hình ảnh vệ tinh Trái đất. Bộ dữ liệu của GEE lưu trữ dữ liệu viễn thám của các

hệ thống vệ tinh trong giai đoạn 40 năm qua, cùng với các công cụ tính toán

cần thiết để phân tích và khai thác kho dữ liệu khổng lồ đó mà không cần phải

71

tải về máy tính. Không những thế, dữ liệu từ GEE có thể sử dụng trên các phần

mềm khác như QGIS, GIS, Foris để tối ưu hóa dữ liệu. Nền tảng được sử dụng

miễn phí với mục đích nghiên cứu, giáo dục và mục đích phi lợi nhuận. Danh

mục dữ liệu công khai của GEE bao gồm nhiều bộ dữ liệu raster lên đến 5 triệu

Hình 2.11 Giao diện Code Editor trong GEE (nguồn: https://geohackweek.github.io/)

gigabyte (5 petabyte).

GEE làm việc thông qua giao diện trực tuyến của ứng dụng JavaScript

(API) được gọi là Code Editor (hình 2.11). Trên giao diện này, người dùng có

thể viết và chạy các tập lệnh để xử lý dữ liệu không gian. Code Editor giúp

người dùng thực hiện toàn bộ các chức năng có trong Earth Engine. Bên cạnh

đó, người dùng cũng có thể tạo một tập lệnh khác tùy theo mục đích nghiên cứu

của mình bằng cách truy cập https://code.earthengine.google.com/.

Bằng việc sử dụng và mở rộng ứng dụng với bộ mã lệnh API, người sử

dụng có thể tùy biến công cụ phục vụ các mục đích khác nhau. GEE hỗ trợ xây

dựng chuỗi bản đồ đa thời gian, đặc biệt là các thông tin về thời tiết, khí hậu.

72

Bên cạnh đó, GEE cho phép người sử dụng có thể chủ động xây dựng các công

cụ chạy trên nền tảng GEE, giúp xử lý nhanh dữ liệu viễn thám phục vụ các

mục đích cụ thể, trong đó có dự báo nguy cơ cháy rừng. Minh họa về bộ mã

lệnh API trong GEE được trình bày trên hình 2.12 (nguồn:

Hình 2.12 Minh họa về bộ mã lệnh API trong GEE (nguồn: https://serc.carleton.edu/)

https://serc.carleton.edu).

Như vậy, có thể nhận định, việc sử dụng các nền tảng địa không gian mở

như GEE là một tiếp cận phù hợp và hiệu quả cho các bài toán xử lý dữ liệu

viễn thám đa thời gian, giúp nâng cao hiệu quả sử dụng các nguồn dữ liệu viễn

thám miễn phí, hỗ trợ tốt hơn công tác cảnh báo sớm và dự báo nguy cơ cháy

rừng.

2.6 Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn

thám và hệ thông tin địa lý

2.6.1 Phương pháp phân tích thứ bậc AHP

73

Phương pháp AHP được phát triển bởi Saaty là một trong những cách

tiếp cận phân tích đa chỉ tiêu (MCA) linh hoạt và thuận lợi nhất, đã được sử

dụng rộng rãi trong xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu

viễn thám và GIS. Phương pháp dự báo nguy cơ cháy rừng từ dữ liệu viễn thám

và GIS trên cơ sở phương pháp phân tích thứ bậc AHP bao gồm các bước cơ

bản sau (Saaty, 2000; Saaty, 2008):

Bước 1: Xác định các yếu tố có liên quan đến nguy cơ cháy rừng (lớp

phủ thực vật, độ ẩm bề mặt, nhiệt độ, độ dốc, hướng dốc...), sắp xếp chúng theo

cấu trúc thứ bậc.

Bước 2: Xác định mức độ quan trọng tương đối của các chỉ tiêu bằng

cách so sánh cặp.

Việc so sánh được thực hiện giữa các cặp chỉ tiêu với nhau và tổng hợp

lại thành một ma trận gồm n dòng và n cột (n là số chỉ tiêu). Phần tử aij thể

hiện mức độ quan trọng của chỉ tiêu hàng i so với chỉ tiêu cột j.

𝑛×𝑛

= [ ] (2.13) 𝐴 = (𝑎𝑖𝑗) 1 𝑎21 ⋮

… 𝑎1𝑛 … 𝑎2𝑛 ⋮ ⋮ … 1 𝑎12 1 ⋮ 𝑎𝑛1 𝑎𝑛2

Mức độ quan trọng tương đối của chỉ tiêu i so với j được tính theo tỷ lệ

k (k từ 1 đến 9), ngược lại của chỉ tiêu j so với i là 1/k. Như vậy aij> 0, aij =

1/aji, aii =1 (Saaty, 2000; Saaty, 2008).

Bảng 2.3: Thang điểm so sánh mức độ quan trọng của các chỉ tiêu

Định nghĩa

Giải thích

Mức độ quan trọng 1

Quan trọng bằng nhau

Quan trọng vừa phải

3

Quan trọng mạnh

5

Hai yếu tố có mức quan trọng bằng nhau Kinh nghiệm và nhận định hơi nghiêng về yếu tố này hơn yếu tố kia Kinh nghiệm và nhận định nghiêng mạnh về yếu tố này hơn yếu tố kia

74

7

Quan trọng rất mạnh

9

Quan trọng tuyệt đối

2,4,6,8

Mức trung gian giữa các mức trên

Một yếu tố được ưu tiên rất mạnh hơn yếu tố kia và được biểu lộ trong thực tế Sự quan trọng của yếu tố này hơn yếu tố kia ở mức cao nhất Cần sự thỏa hiệp giữa hai mức độ nhận định

Bước 3: Tính tỷ số nhất quán (CR) của từng ma trận so sánh cặp. Những

ma trận so sánh có tỷ số nhất quán (CR) ≤ 10% thì đưa vào tính toán tổng hợp,

ngược lại thì cần phải thẩm định lại mức độ quan trọng của các chỉ tiêu. Chỉ số

nhất quán được xác định theo công thức (Saaty, 2000; Saaty, 2008):

(2.14)

Trong đó: CI - chỉ số nhất quán, là chỉ số đo lường mức độ chệch hướng nhất

quán, được xác định theo công thức (Saaty, 2000; Saaty, 2008):

(2.15)

Với λmax là giá trị trung bình của vector nhất quán và n là số chỉ tiêu:

(2.16)

RI là chỉ số ngẫu nhiên, hay giá trị trung bình của CI khi nhận định so

sánh ngẫu nhiên, phụ thuộc vào số chỉ tiêu được so sánh.

6 1.24

10 1.49

7 1.34

9 1.45

1 0.00

2 0.00

3 0.52

8 1.40

4 0.89

N RI

Bảng 2.4: Bảng tra giá trị RI theo số lượng chỉ tiêu khác nhau (Saaty, 2000; Saaty, 2008) 5 1.11

Bước 4: Tính toán trọng số (W) cho từng chỉ tiêutheo phương pháp

vector riêng hoặc phương pháp chuẩn hóa ma trận.

Bước 5: Tổng hợp chỉ số thích nghi theo công thức:

(2.17)

75

Trong đó, S là chỉ số thích nghi, Wi là trọng số của chỉ tiêu i, Xi là giá

trị (đã lượng hóa) của chỉ tiêu i, i là chỉ tiêu (i = 1, n).

Bước 6: Chuyển đổi từ chỉ số thích nghi sang mức độ thích nghi (S1, S2,

S3, N).

Trong mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS

trên cơ sở phương pháp phân tích thứ bậc AHP, ứng với mỗi chỉ tiêu (yếu tố

ảnh hưởng đến khả năng xảy ra cháy rừng) sẽ xây dựng một lớp thông tin

chuyên đề GIS, tiến hành tổng hợp và chồng xếp các lớp thông tin, tích hợp các

trọng số đánh giá và phân loại theo cấp độ ảnh hưởng phù hợp để thành lập bản

đồ dự báo nguy cơ cháy rừng.

2.6.2 Phương pháp sử dụng thuật toán Rừng ngẫu nhiên

Rừng ngẫu nhiên là một thuật toán học máy có giám sát được sử dụng

rộng rãi trong các bài toán hồi quy và phân loại, đồng thời tạo ra kết quả phân

loại tốt ngay cả khi không điều chỉnh siêu tham số. Đây là một trong các thuật

toán được sử dụng phổ biến nhất trong các mô hình dự báo thiên tai do ưu điểm

đơn giản và độ chính xác cao của thuật toán. RF hoạt động trên cơ sở xây dựng

nhiều cây quyết định (decision tree) trên các mẫu huấn luyện, mỗi cây quyết

định sẽ khác nhau (có yếu tố random). Sau đó ở bước dự đoán, với một dữ liệu

mới, đối với mỗi cây quyết định sẽ đi từ trên xuống theo các node (nút) điều

kiện để được các dự đoán, sau đó kết quả cuối cùng được tổng hợp từ kết quả

của các cây quyết định (Hình 2.13). Như vậy, Random Forest lấy ngẫu nhiên

dữ liệu và thuộc tính để xây dựng cây quyết định (Breiman, 2001).

Về mặt toán học, khi phân tích một đặc trưng, việc phân chia ngưỡng

khác nhau sẽ dẫn tới việc kết quả phân loại khác nhau, đồng thời có thể xảy ra

trường hợp với cùng ngưỡng phân loại cho đặc trưng đó nhưng có kết quả phân

loại khác nhau. Chính vì vậy, chỉ số Gini được sử dụng để xác định nhiễu trong

76

tập dữ liệu. Giả sử tập dữ liệu được phân loại thành hai lớp A và B, chỉ số Gini

được xác định (Breiman, 2001):

Hình 2.13 Sơ đồ thuật toán RF trong phân loại (chỉnh sửa từ nguồn: https://www.section.io/)

(2.18)

Trong đó, PA là xác suất của dữ liệu thuộc lớp A, PB là xác suất của dữ

liệu thuộc lớp B. Công thức trên sử dụng xác suất để xác định giá trị chỉ số Gini

trên mỗi nhánh đặc trưng, mỗi phân ngưỡng trên mỗi đặc trưng, xác định nhánh

nào có nhiều khả năng xảy ra nhất.

Ngoài ra, chỉ số Entropy cũng được sử dụng để xác định khả năng xảy ra

2001):

trên các nút phân nhánh. Chỉ số Entropy được tính theo công thức (Breiman,

(2.19)

Thuật toán Random Forest tỏ ra hữu ích đối với nhiều loại dữ liệu khác

nhau, bao gồm cả các lớp dữ liệu không gian. Đây là thuật toán dễ sử dụng, quá

77

trình đào tạo nhanh và kết quả phân loại (dự đoán) có độ chính xác cao. Sơ đồ

thuật toán RF được trình bày trên hình 2.13.

2.6.3 Phương pháp sử dụng thuật toán Máy hỗ trợ vector

Máy hỗ trợ vector (SVM) là một thuật toán quan trọng và hiệu quả trong

những thuật toán học máy, được sử dụng trong cả phân lớp và hồi quy. SVM

được sự dụng phổ biến ngay từ khi mới được phát triển vào những năm 1990

và được áp dụng cho nhiều mô hình dự báo thiên tai, thảm họa tự nhiên. Khác

với nhiều thuật toán học máy khác như mạng neural, người sử dụng không phải

thực hiện nhiều tinh chỉnh trong quá trình thực hiện để có được kết quả dự báo

tốt với thuật toán SVM.

Vapnik, 1995; Drucker et al., 1997):

Cơ sở toán học của thuật toán SVM có thể được hiểu như sau (Corters và

Cho vectơ , khi đó độ dài của x được gọi là chuẩn của x,

ký hiệu là , được tính theo công thức:

(2.20)

Tích vô hướng của hai vectơ x và y được tính như sau:

(2.21)

Giả sử, cho tập dữ liệu , . Để phân loại tập

dữ liệu với các nhãn yi cần phải xác định một siêu phẳng F sao cho các dữ liệu

cùng nhãn sẽ được phân loại về một phía của mặt phẳng. F được xác định như

sau:

(2.22)

Với các điểm dữ liệu x đã cho, khoảng cách từ điểm dữ liệu đó tới mặt

phẳng phân loại được xác định như sau:

78

Hình 2.14 Mô tả các vector hỗ trợ trong thuật toán SVM

(2.23)

Mục tiêu của thuật toán SVM là tìm một siêu phẳng trong không gian N

chiều (ứng với N đặc trưng) để phân loại được các điểm dữ liệu, hay nói cách

khác, mục tiêu là tối đa hoá khoảng cách của các điểm dữ liệu tới siêu phẳng

(hình 2.14). Hàm tối ưu có thể viết dưới dạng:

(2.24)

Khi đó, các nhãn được dự đoán sẽ có dạng:

(2.25)

Tuy nhiên để việc tìm một siêu phẳng có thể phân chia chính xác tuyệt

đối các điểm dữ liệu là không thể xảy ra trong thế giới thực. Chính vì vậy, các

thuật toán SVM thường bổ sung các tham số C (tham số phạt) và đại diện cho

mức độ lỗi khi phân loại. Khi đó, hàm tối ưu có thể viết dưới dạng:

79

(2.26)

Tham số C càng lớn có nghĩa là SVM càng bị phạt nặng khi thực hiện

kết quả phân loại sai, từ đó dẫn đến lề (margin) càng hẹp và có ít vector hỗ trợ

Hình 2.15 Thuật toán SVM với giá trị tham số C khác nhau (Liu, 2020)

được sử dụng (hình 2.15).

2.6.4 Phương pháp sử dụng thuật toán cây phân loại và hồi quy

Thuật toán cây phân loại và hồi quy (CART - Classification and

Regression Trees) là một kỹ thuật học máy có giám sát được sử dụng phổ biến

để dự đoán biến mục tiêu định tính (cartegorical target variable), tạo cây phân

loại hoặc biến mục tiêu liên tục (continuous target variable), tạo ra cây hồi quy.

Việc phân loại của CART đòi hỏi một cây nhị phân, là sự kết hợp của một nút

(nodes) gốc ban đầu, các nút quyết định và các nút cuối. Nút gốc và mỗi nút

quyết định đại diện cho một đặc tính và giá trị ngưỡng của đặc tính đó. Do ưu

điểm dễ hiểu và đơn giản, CART là một trong những phương pháp học máy

được sử dụng phổ biến nhất hiện nay (Breiman et al., 1984). Mô tả sở đồ thuật

toán CART được trình bày trên hình 2.16.

80

Hình 2.16 Mô tả thuật toán Cây Phân loại và hồi quy CART (nguồn:

https://www.javatpoint.com/)

Thuật toán Cây Phân loại và hồi quy CART yêu cầu phân loại cây dữ liệu

sao cho phần phân tách là tốt nhất. CART có thể sử dụng chỉ số Gini giống như

thuật toán Random Forest. Trong thuật toán CART, chỉ số Gini dùng để đánh

giá xem việc phân chia ở các nút điều kiện có chính xác hay không. Để tìm

cách phân loại tốt nhất cần tính tổng trọng số của chỉ số Gini cho toàn bộ các

nút con và sau đó lấy phần có chỉ số Gini thấp nhất làm phần có độ chính xác

phân loại tốt nhất.

So với các thuật toán học máy khác như Rừng ngẫu nhiên (Random

Forest), máy hỗ trợ vector (SVM), thuật toán Cây Phân loại và hồi quy (CART)

có ưu điểm đơn giản và tốc độ tính toán nhanh hơn, cho phép người sử dụng

xây dựng các mô hình dự báo một cách nhanh chóng. Random Forest tạo ra

nhiều cây CART dựa trên các mẫu dữ liệu và sau đó kết hợp các dự đoán, do

vậy có hiệu suất làm việc và độ chính xác dự đoán tốt hơn so với một mô hình

CART đơn lẻ. Tuy nhiên, trong một số bài toán, mô hình Random Forest sẽ có

thời gian xử lý lâu hơn do sự ràng buộc của các biến trong mô hình, khi đó việc

sử dụng thuật toán CART là một tiếp cận phù hợp.

81

2.6.5 Sơ đồ mô hình dự báo nguy cơ cháy rừng

Từ việc phân tích tổng quan dữ liệu đầu vào và cơ sở khoa học các

phương pháp xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám

và GIS, trong luận án NCS đề xuất sơ đồ quy trình công nghệ như sau.

Bước 1: Khảo sát khu vực nghiên cứu, thu thập dữ liệu

Trong bước này, sau khi nghiên cứu, khảo sát và phân tích đặc điểm khu

vực thử nghiệm cũng như hiện trạng nguồn dữ liệu, dữ liệu đầu vào bao gồm

ảnh vệ tinh (ảnh Landsat 8/9, Sentinel 2 MSI), mô hình số độ cao (DEM) và

các lớp dữ liệu khác như mật độ dân số, lượng mưa trung bình tháng, tốc độ gió

được thu thập để xây dựng các lớp thông tin đầu vào cho mô hình dự báo nguy

cơ cháy rừng, cụ thể như sau:

Ảnh Landsat 8/9 thu thập từ cơ sở dữ liệu của Cục Khảo sát Địa chất Hoa

Kỳ (USGS) dùng để chiết tách thông tin nhiệt độ bề mặt. Ảnh Sentinel 2 MSI

thu thập từ cơ sở dữ liệu của Cơ quan Hàng không vũ trụ Châu Âu (ESA) dùng

để tính chỉ số thực vật NDVI.

Mô hình số độ cao được sử dụng trong luận án là dữ liệu DEM SRTM

với độ phân giải không gian 30m dùng để xây dựng các lớp thông tin về địa

hình khu vực nghiên cứu (độ dốc, độ cao, hướng dốc).

Các lớp dữ liệu khác bao gồm mật độ dân số được thu thập từ cơ sở dữ

liệu WorldPop, lượng mưa trung bình tháng và tốc độ gió được thu thập từ cơ

sở dữ liệu WorldClim. Các lớp dữ liệu này có thể sử dụng từ nền tảng điện toán

đám mây (GEE). Độ bốc thoát hơi nước cũng được thu thập từ nền tảng GEE

trên cơ sở dữ liệu ảnh vệ tinh quang học MODIS.

Dữ liệu điểm cháy rừng được thu thập tại website của Cục Kiểm lâm (Bộ

Nông nghiệp và Phát triển nông thôn) về quản lý cháy rừng, mất rừng và khai

thác thông tin tại địa chỉ http://watch.pcccr.vn/thongKe/diemChay. Ngoài ra,

dữ liệu các điểm cháy tại các CSDL quốc tế như NASA cũng được sử dụng cho

82

mô hình học máy và đánh giá độ chính xác kết quả dự báo nguy cơ cháy rừng.

Các điểm cháy này được chia thành 2 nhóm: nhóm sử dụng phục vụ các mô

hình học máy và nhóm dùng để đánh giá độ chính xác các mô hình dự báo.

Bước 2: Xây dựng các lớp thông tin đầu của mô hình

9 lớp thông tin đầu vào của mô hình dự báo nguy cơ cháy rừng từ dữ liệu

viễn thám và GIS được trích xuất và xây dựng từ dữ liệu đầu vào, cụ thể:

+ Lớp thông tin về lớp phủ thực vật,được chiết xuất từ ảnh vệ tinh quang

học Sentinel 2 MSI thông qua chỉ số thực vật NDVI (công thức 2.1), trong đó

sử dụng giá trị phản xạ phổ tại kênh 8 (cận hồng ngoại) và kênh 4 (đỏ).

+ Lớp thông tin nhiệt độ bề mặt được chiết xuất từ ảnh vệ tinh Landsat

8/9 trên cơ sở sử dụng các kênh hồng ngoại nhiệt và thông tin về độ phát xạ bề

mặt xác định trên cơ sở chỉ số NDVI. Trong luận án này, phương pháp sử dụng

đơn kênh (single-channel) được lựa chọn do sự đơn giản trong tính toán cũng

như có độ chính xác đảm bảo.

+ Lớp thông tin về độ bốc thoát hơi nước được thu thập từ nền tảng GEE,

sau đó biên tập theo ranh giới khu vực nghiên cứu.

+ Các lớp thông tin về địa hình, bao gồm độ cao, độ dốc (góc dốc), hướng

sường (aspect) được trích xuất từ mô hình số độ cao (DEM) SRTM.

+ Lớp thông tin về mật độ dân số được xây dựng trên cơ sở dữ liệu dân

số tại cơ sở dữ liệu WorldPop, lớp thông tin về tốc độ gió và lượng mưa trung

bình tháng được xây dựng bằng dữ liệu đầu vào thu thập từ cơ sở dữ liệu

WorldClim.

Tất cả các lớp thông tin đầu vào này được trình bày ở cấu trúc dữ liệu

raster, sau đó nội suy về độ phân giải (kích thước pixel) 10m để đồng bộ hóa

các lớp dữ liệu đầu vào của mô hình dự báo nguy cơ cháy rừng.

83

Hình 2.17 Sơ đồ quy trình công nghệ lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS

84

Bước 3: Thử nghiệm lựa chọn mô hình dự báo nguy cơ cháy rừng bằng

phương pháp phân tích thứ bậc AHP và các thuật toán học máy (RF, SVM,

CART)

Để lựa chọn mô hình dự báo nguy cơ cháy rừng phù hợp với đặc điểm

khu vực nghiên cứu tại phía tây tỉnh Nghệ An, trong luận án tiến hành thử

nghiệm với 04 phương pháp: phương pháp phân tích thứ bậc AHP và 03 thuật

toán học máy (RF, SVM, CART).

Đối với phương pháp sử dụng kỹ thuật phân tích thứ bậc AHP, trong luận

án tiến hành tính các trọng số ảnh hưởng đến nguy cơ cháy rừng của từng yếu

tố đầu vào, sau đó xây dựng bản đồ dự báo.

Đối với các mô hình học máy (RF, SVM, CART), trong luận án sử dụng

bộ dữ liệu mẫu các điểm cháy rừng, trích xuất đặc trưng tương ứng trên các lớp

dữ liệu, đồng thời gán nhãn cho mẫu thành lớp “cháy” và “không cháy” phục

vụ quá trình học tập của mô hình. Tại kết quả đầu ra của các mô hình học máy,

kết quả trả về xác suất về khả năng cháy rừng đối với toàn bộ điểm các ảnh tại

khu vực nghiên cứu. Cuối cùng, bản đồ phân vùng nguy cơ cháy rừng được

thành lập bằng cách phân ngưỡng theo các mức độ nguy cơ cháy rừng khác

nhau, từ thấp đến cao.

Bước 4: Đánh giá độ chính xác các mô hình dự báo nguy cơ cháy rừng

Bên cạnh bộ dữ liệu các điểm cháy rừng sử dụng cho mô hình học máy,

một phần dữ liệu này cũng được sử dụng để đánh giá độ chính xác. Vị trí các

điểm cháy và không cháy được kiểm tra trên kết quả dự báo của từng mô hình

để đánh giá mức độ phù hợp của các mô hình dự báo.

Ngoài ra, đường cong ROC cũng được sử dụng để đánh giá, so sánh độ

chính xác của các mô hình dự báo.

Bước 5: Lựa chọn mô hình dự báo phù hợp với khu vực thử nghiệm

Từ kết quả đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy

85

rừng (AHP, RF, SVM, CART), trong luận án lựa chọn mô hình có độ chính xác

cao nhất để tiến hành áp dụng cho khu vực nghiên cứu.

Bước 6: Xây dựng bản đồ dự báo nguy cơ cháy rừng

Tại bước này, bản đồ dự báo nguy cơ cháy rừng khu vực nghiên cứu

được xây dựng trên cơ sở mô hình dự báo được lựa chọn ở bước 5, trong đó

nguy cơ xảy ra cháy rừng được chia thành 5 cấp: rất thấp, thấp, trung bình, cao

và rất cao.

2.7 Tiểu kết chương 2

Trong chương 2, đã nghiên cứu tổng quan về dữ liệu đầu vào cho mô

hình dự báo nguy cơ cháy từng từ dữ liệu viễn thám và GIS. Trên cơ sở đó,

luận án đã lựa chọn 09 lớp thông tin đầu vào để xây dựng mô hình dự báo nguy

cơ cháy rừng, bao gồm: mật độ dân số, lớp phủ thực vật, độ ẩm bề mặt (độ bốc

thoát hơi nước bề mặt), hướng sườn, độ dốc, tốc độ gió, độ cao, nhiệt độ bề mặt

và lượng mưa trung bình tháng.

Các lớp thông tin về lớp phủ thực vật, độ bốc thoát hơi nước bề mặt,

nhiệt độ bề mặt được chiết tách từ dữ liệu viễn thám (ảnh vệ tinh Landsat và

Sentinel 2 MSI, ảnh MODIS). Các lớp thông tin về địa hình như độ dốc, độ

cao, hướng sườn được trích xuất từ mô hình số độ cao DEM SRTM với độ phân

giải 30m. Các lớp thông tin còn lại như tốc độ gió, lượng mưa trung bình tháng

được trích xuất từ CSDL WolrdClim, mật độ dân số được trích xuất từ CSDL

WorldPop.

Để dự báo nguy cơ cháy rừng, 04 phương pháp được thử nghiệm, bao

gồm: phương pháp phân tích thứ bậc AHP và 03 phương pháp học máy (RF,

SVM, CART). Độ chính xác của các mô hình dự báo này được đánh giá, so

sánh trên cơ sở dữ liệu về các điểm cháy rừng của Cục Kiểm lâm (Bộ Nông

nghiệp và Phát triển Nông thôn).

86

Trong chương 2, đề xuất được sơ đồ quy trình công nghệ xây dựng mô

hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS, làm cơ sở để tiến

hành thực nghiệm trong chương 3.

87

CHƯƠNG 3. THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY RỪNG

KHU VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU VIỄN THÁM

VÀ HỆ THÔNG TIN ĐỊA LÝ

3.1 Đặc điểm dữ liệu sử dụng

3.1.1 Dữ liệu viễn thám

Dữ liệu viễn thám sử dụng trong luận án các ảnh vệ tinh quang học

Sentinel 2 MSI và Landsat 8, thu thập từ cơ sở dữ liệu Copernicus của Cơ quan

Hàng không vũ trụ châu Âu (ảnh Sentinel 2 MSI) và Cục Khảo sát Địa chất Mỹ

(USGS, ảnh Landsat 8). Dữ liệu viễn thám được thu thập và xử lý trực tiếp trên

nền tảng điện toán đám mây GEE.

65 cảnh ảnh Sentinel 2 MSI, bao gồm ảnh Sentinel 2A và Sentinel 2B ở các

phiên hiệu T48 QUG, T48 QVG, T48 QWG, T48 QVF và T48 QWF chụp giai

đoạn từ 15/11/2021 đến 16/01/2022 được sử dụng để tạo ảnh không mây khu vực

nghiên cứu (phía tây tỉnh Nghệ An). Những ảnh có độ che phủ của mây lớn hơn

80% không được lựa chọn do chúng có ít giá trị trong việc lọc mây, hơn nữa

các pixels mây trong ảnh có thể tạo ra nhiễu khó kiểm soát trong quá trình tính

toán. Ảnh Sentinel 2 MSI khu vực thực nghiệm được tiến hành lọc mây và lọc

bóng mây bằng cách sử dụng thuật toán Google cloudScore để tạo mặt nạ cho

đám mây và Temporal Dark Outlier Mask (TDOM) cho bóng mây. Quá trình

xử lý nhằm loại bỏ ảnh hưởng của mây đến ảnh vệ tinh Sentinel 2 MSI được

thực hiện trên nền tảng GEE. Kết quả tạo ảnh Sentinel 2 MSI không mây từ bộ

ảnh Sentinel 2 MSI giai đoạn 15/11/2021 đến 16/01/2022 đối với khu vực

nghiên cứu ở phía tây tỉnh Nghệ An được trình bày trên hình 3.1. Ảnh Sentinel

2 MSI nhận được sau quá trình này sẽ được sử dụng để tính các chỉ số khác biệt

thực vật (NDVI).

88

Hình 3.1 Dữ liệu ảnh Sentinel 2 MSI khu vực nghiên cứu

Để xác định nhiệt độ bề mặt khu vực nghiên cứu, trong luận án sử dụng 15

cảnh ảnh vệ tinh quang học Landsat 8 chụp trong giai đoạn từ 15/11/2021 đến

16/01/2022, bao gồm các ảnh có vị trí hàng cột (path/row) là 127/047, 127/046 và

128/046. Tương tự như với bộ dữ liệu ảnh Sentinel 2 MSI, trong luận án cũng tiến

hành lọc mây từ bộ dữ liệu ảnh Landsat 8 để tạo ảnh không mây cho khu vực

nghiên cứu. Kết quả tạo ảnh Landsat 8 không mây khu vực phía tây tỉnh Nghệ An

được trình bày trên hình 3.2 (ở tổ hợp màu tự nhiên, sử dụng các kênh xanh lam -

kênh 2, xanh lục - kênh 3 và đỏ - kênh 4).

89

Hình 3.2 Dữ liệu ảnh Landsat 8 khu vực nghiên cứu, tổ hợp màu tự nhiên

3.1.2 Dữ liệu GIS

Mô hình số độ cao DEM SRTM với độ phân giải không gian 30m được

thu thập và xử lý nhằm xây dựng các lớp thông tin chuyên đề, bao gồm độ cao,

độ dốc, hướng sườn. Quá trình thu thập và xử lý được thực hiện trên nền tảng

Google Earth Engine (GEE). Dữ liệu DEM SRTM khu vực nghiên cứu được

trình bày trên hình 3.3.

Dữ liệu về mật độ dân cư được thu thập từ cơ sở dữ liệu WorldPop. Trong

khi đó, dữ liệu về tốc độ gió và lượng mưa trung bình tháng được thu thập từ

cơ sở dữ liệu WorldClim. Tất cả các dữ liệu này đều được cung cấp trong kho

dữ liệu của nền tảng GEE, cho phép đơn giản hóa quá trình thu thập và xử lý

nhằm tạo các lớp thông tin đầu vào cho mô hình dự báo nguy cơ cháy rừng.

90

Hình 3.3 Dữ liệu mô hình số độ cao DEM SRTM khu vực nghiên cứu

3.2 Kết quả xây dựng các lớp thông tin chuyên đề

Các lớp thông tin xác định từ ảnh vệ tinh

Ảnh Sentinel 2 MSI sau khi thu thập, tiền xử lý và lọc mây được sử dụng

để tính chỉ số thực vật NVDI (công thức 2.1).

Giá trị phản xạ phổ ở kênh cận hồng ngoại (kênh 8) và kênh đỏ (kênh 4)

ảnh Sentinel 2 MSI được sử dụng để tính chỉ số thực vật NDVI. Kết quả xác

định chỉ số thực vật NDVI khu vực phía tây tỉnh Nghệ An từ ảnh Sentinel 2

MSI được trình bày trên hình 3.4, trong đó giá trị chỉ số NDVI đạt được trong

khoảng từ -0.742 đến 0.802, chỉ số NDVI càng cao thể hiện các khu vực có lớp

phủ thực vật càng dày và tươi tốt. Trên hình 3.4, thực vật được thể hiện bởi các

pixel có màu trắng sáng, các khu vực đất trống, mặt nước có màu tối.

91

Hình 3.4 Chỉ số thực vật NDVI xác định từ ảnh vệ tinh Sentinel 2 MSI

Độ bốc thoát hơi nước bề mặt được xác định từ ảnh vệ tinh quang học độ

phân giải thấp MODIS và được khai thác từ bộ sản phẩm ảnh MODIS trên nền

tảng GEE với độ phân giải không gian 1000m. Kết quả xây dựng lớp thông tin

độ bốc thoát hơi nước bề mặt đối với khu vực phía tây tỉnh Nghệ An được trình

bày trên hình 3.5. Độ bốc thoát hơi nước bề mặt khu vực nghiên cứu có giá trị

trong khoảng từ 10 đến 640, trong đó các pixel màu trắng thể hiện các khu vực

có độ độ bốc thoát hơi nước cao, các pixel màu tối thể hiện các khu vực có độ

bốc thoát hơi nước thấp. Để phù hợp với các lớp thông tin đầu vào khác, độ bốc

thoát hơi nước được nội suy về kích thước pixel 10m.

92

Hình 3.5 Độ bốc thoát hơi nước bề mặt khu vực nghiên cứu thu thập từ CSDL

GEE trên cơ sở ảnh vệ tinh MODIS

Để xây dựng lớp thông tin nhiệt độ bề mặt, trong luận án sử dụng ảnh vệ

tinh Landsat 8 sau khi tiền xử lý, lọc mây, ghép và cắt theo ranh giới khu vực

nghiên cứu. Kênh 10 ảnh Landsat 8 được sử dụng để tính nhiệt độ bề mặt theo

phương pháp single-channel.

Kết quả xác định nhiệt độ bề mặt khu vực nghiên cứu được trình bày trên

hình 3.6, trong đó nhiệt độ bề mặt nhận giá trị trong khoảng từ 10.150C đến

35.470C. Các khu vực có nhiệt độ bề mặt thấp tập trung tại vùng núi với lớp

phủ thực vật dày, trong khi các khu vực có nhiệt độ bề mặt cao tập trung tại các

vùng đất ở, đất trống. Để trực quan, trong luận án tiến hành phân vùng nhiệt độ

bề mặt thành 9 khoảng: nhỏ hơn 180C, 18 - 190C, 19 - 200C, 20 - 210C, 21 -

220C, 22 - 230C, 23 - 240C, 24 - 300C và lớn hơn 300C (hình 3.7).

93

Hình 3.6 Kết quả xác định nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8

Hình 3.7 Kết quả phân cấp nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8

94

Nhiệt độ bề mặt xác định từ ảnh Landsat 8 có độ phân giải không gian

30m, để thống nhất với các lớp thông tin đầu vào của mô hình, trong luận án

tiến hành nội suy lại nhiệt độ bề mặt về kích thước pixel 10m.

Các lớp thông tin xác định từ DEM

Từ dữ liệu DEM SRTM với độ phân giải không gian 30m, trong luận án

tiến hành trích xuất các lớp thông tin chuyên đề về độ cao, độ dốc và hướng

sườn phục vụ xây dựng mô hình dự báo nguy cơ cháy rừng. Quá trình tính toán

các lớp thông tin về địa hình được thực hiện trực tiếp trên nền tảng GEE. Kết

quả xây dựng các lớp thông tin chuyên đề về độ cao, độ dốc (ở đơn vị %) và

hướng sườn đối với khu vực phía tây tỉnh Nghệ An được thể hiện trên các hình

3.8, 3.9 và 3.10. Để chuẩn hóa phù hợp với các lớp thông tin đầu vào của mô

hình, trong nghiên cứu cũng tiến hành nội suy lại kích thước pixel đối với các

lớp thông tin này từ 30m về 10m.

Hình 3.8 Lớp thông tin độ cao khu vực nghiên cứu

95

Hình 3.9 Lớp thông tin độ dốc khu vực nghiên cứu

Hình 3.10 Lớp thông tin hướng sườn khu vực nghiên cứu

96

Các lớp thông tin khác

Dữ liệu về mật độ dân số thu thập từ cơ sở dữ liệu WorldPop và dữ liệu

về khí hậu (lượng mưa trung bình tháng, tốc độ gió) thu thập từ cơ sở dữ liệu

WorldClim được sử dụng để xây dựng các lớp thông tin chuyên đề cho mô hình

Hình 3.11 Kết quả xây dựng lớp thông tin về mật độ dân cư

dự báo nguy cơ cháy rừng.

Kết quả xây dựng lớp thông tin về mật độ dân cư khu vực phía tây tỉnh

Nghệ An được trình bày trên hình 3.11. Do độ phân giải của dữ liệu thu thập từ

CSDL WorldPop là 1000m, để thống nhất với các lớp thông tin khác, trong

luận án tiến hành nội suy lại về kích thước pixel 10m. Để trực quan, trong

nghiên cứu cũng tiến hành phân vùng mật độ dân cư thành 9 khoảng như hình

3.12. Có thể nhận thấy, phần lớn khu vực nghiên cứu có mật độ dân cư thấp

97

(dưới 25 người/km2), tập trung tại các khu vực núi cao và có lớp phủ rừng. Các

khu vực có mật độ dân cư trên 100 người/km2 tập trung chủ yếu ở phía đông

Hình 3.12 Lớp thông tin mật độ dân cư sau khi được phân lớp

và một phần phía nam khu vực nghiên cứu.

Kết quả xây dựng lớp thông tin về lượng mưa trung bình tháng khu vực

phía tây tỉnh Nghệ An được thể hiện trên hình 3.13, trong đó lượng mưa ở khu

vực nghiên cứu nằm trong khoảng từ 113 mm/tháng đến 164 mm/tháng. Kết

quả nhận được cho thấy, lượng mưa trung bình tháng ở khu vực nghiên cứu chủ

yếu đạt dưới 130 mm/tháng. Các khu vực có lượng mưa trung bình tháng đạt

trên 130mm/tháng tập trung cục bộ ở phía nam khu vực nghiên cứu (được thể

hiện bởi màu tối trên hình 3.13).

98

Hình 3.13 Kết quả xây dựng lớp thông tin lượng mưa trung bình tháng

Hình 3.14 trình bày kết quả xây dựng lớp thông tin về tốc độ gió khu vực

phía tây tỉnh Nghệ An từ CSDL WorldClim, trong đó tốc độ gió nằm trong

khoảng từ 1,5 đến 2,9 m/s. Để trực quan, trong luận án tiến hành phân vùng tốc

độ gió khu vực nghiên cứu thành 07 khoảng: 1,5 - 1,7 m/s, 1,7 - 1,9 m/s, 1,9 -

2,1 m/s, 2,1 - 2,3 m/s, 2,3 - 2,5 m/s, 2,5 - 2,7 m/s và 2,7 - 2,9 m/s (Hình 3.15).

Có thể nhận thấy, phần lớn khu vực nghiên cứu có tốc độ gió nhỏ hơn 1,9 m/s.

Các khu vực có tốc độ gió trên 2 m/s tập trung chủ yếu ở phần rìa phía nam khu

vực thực nghiệm, cũng là nơi có lượng mưa trung bình tháng cao hơn so với

các khu vực khác (Hình 3.15).

Tương tự như với các lớp thông tin khác, lớp thông tin về lượng mưa

trung bình tháng và tốc độ gió được nội suy về độ phân giải không gian 10m.

99

Hình 3.14 Kết quả xây dựng lớp thông tin tốc độ gió trung bình khu vực nghiên cứu

Hình 3.15 Kết quả phân vùng tốc độ gió khu vực nghiên cứu

100

3.3 Kết quả xây dựng bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn

thám và GIS

3.3.1 Kết quả dự báo nguy cơ cháy rừng bằng kỹ thuật AHP

Từ 9 lớp thông tin của mô hình dự báo nguy cơ cháy rừng lựa chọn trong

luận án, đã đánh giá vai trò của các yếu tố ảnh hưởng đến khả năng xảy ra cháy

rừng thông qua ma trận so sánh cặp của các chỉ tiêu bằng phương pháp phân

tích thứ bậc AHP. Dựa trên phân tích, đánh giá vai trò của các yếu tố ảnh hưởng

đến nguy cơ cháy rừng từ các nghiên cứu trên thế giới (Lamat et al., 2020) và

tham khảo các tài liệu, số liệu về mức độ quan trọng của các yếu tố ảnh hưởng

đến nguy cơ cháy rừng, trong luận án đã đưa ra ma trận so sánh cặp của các chỉ

tiêu như bảng 3.1. Trong nghiên cứu của Lamat và cộng sự (2021), tác giả đã

sử dụng 8 lớp thông tin đầu vào, bao gồm: mật độ dân số, lớp phủ thực vật, độ

cao, nhiệt độ bề mặt, độ dốc, hướng sườn, tốc độ gió và lượng mưa trung bình

tháng để xây dựng mô hình cảnh báo nguy cơ cháy rừng bằng kỹ thuật AHP.

Theo Lamat và cộng sự, mật độ dân số có ảnh hưởng lớn nhất đến nguy cơ xảy

ra cháy rừng. Các yếu tố có mức độ quan trọng tiếp theo bao gồm: lớp phủ thực

vật, độ cao, nhiệt độ bề mặt, độ dốc, hướng sườn, tốc độ gió lượng mưa trung

bình tháng.

Trong luận án này, nghiên cứu sinh bổ sung thêm yếu tố độ ẩm bề mặt

(thông qua độ bốc thoát hơi nước bề mặt) để đánh giá vai trò của từng yếu tố

đến khả năng xảy ra cháy rừng tại khu vực phía tây tỉnh Nghệ An, trong đó mức

độ quan trọng của độ ẩm bề mặt được xem như tương đương với nhiệt độ bề

mặt, từ đó tính toán các trọng số ảnh hưởng.

Trọng số ảnh hưởng của từng yếu tố đến nguy cơ cháy rừng được thể

hiện trong bảng 3.2. Giá trị chỉ số nhất quán CR đạt 0.096 (nhỏ hơn 10%) nên

kết quả tính toán trọng số của các chỉ tiêu (lớp thông tin) ảnh hưởng tới nguy

cơ cháy rừng là chấp nhận được.

101

Yếu tố

Độ cao [3]

Độ dốc [5]

Hường sườn [6]

Tốc độ gió [7]

Độ ẩm bề mặt [9]

Mật độ dân số [1]

Lớp phủ thực vật [2]

Nhiệt độ bề mặt [4]

Bảng 3.1 Ma trận so sánh cặp của các yếu tố ảnh hưởng đến nguy cơ cháy rừng

[1] [2] [3] [4] [5] [6] [7] [8] [9] Tổng

1 0.33 0.33 0.20 0.20 0.17 0.14 0.14 0.20 2.72

3 1 0.33 0.25 0.20 0.20 0.17 0.14 0.25 5.54

3 3 1 0.33 0.33 0.25 0.20 0.20 0.33 8.65

5 4 3 1 0.33 0.33 0.20 0.17 1 15.03

5 5 3 3 1 0.50 0.33 0.14 3 20.98

6 5 4 3 2 1 0.33 0.2 3 24.53

7 6 5 5 3 3 1 0.2 5 35.20

Lượng mưa TB tháng [8] 7 7 5 6 7 5 5 1 6 49.00

5 4 3 1 0.33 0.33 0.20 0.17 1 15.03

Trọng số

Yếu tố

Độ dốc [5]

Hường sườn [6]

Tốc độ gió [7]

Độ ẩm bề mặt [9]

Độ cao [3]

Mật độ dân số [1]

Lớp phủ thực vật [2]

Nhiệt độ bề mặt [4]

[1] [2] [3] [4] [5] [6] [7] [8] [9]

0.37 0.12 0.12 0.07 0.07 0.06 0.05 0.05 0.07

0.54 0.18 0.06 0.05 0.04 0.04 0.03 0.03 0.05

0.35 0.35 0.12 0.04 0.04 0.03 0.02 0.02 0.04

0.33 0.27 0.20 0.07 0.02 0.02 0.01 0.01 0.07

0.24 0.20 0.16 0.12 0.08 0.04 0.01 0.01 0.12

0.20 0.17 0.14 0.14 0.09 0.09 0.03 0.01 0.14

Lượng mưa TB tháng [8] 0.14 0.14 0.10 0.12 0.14 0.10 0.10 0.02 0.12

0.33 0.27 0.20 0.07 0.02 0.02 0.01 0.01 0.07

Bảng 3.2 Kết quả chuẩn hóa ma trận so sánh cặp

0.31 0.22 0.14 0.09 0.06 0.05 0.03 0.02 0.09

0.24 0.24 0.14 0.14 0.05 0.02 0.02 0.01 0.14

102

Có thể nhận thấy, trong số 9 yếu tố được lựa chọn để đưa vào mô hình,

mật độ dân cư có vai trò quan trọng nhất ảnh hưởng đến nguy cơ cháy rừng,

với trọng số ảnh hưởng đạt 0.31. Yếu tố được đánh giá quan trọng thứ 2 là lớp

phủ/sử dụng đất (thông qua chỉ số thực vật NDVI) có trọng số ảnh hưởng đạt

0.22. Yếu tố độ cao có mức độ ảnh hưởng đứng thứ 3 với trọng số đạt 0.14.

Nhiệt độ bề mặt và độ ẩm bề mặt có trọng số ảnh hưởng là 0.09. Các yếu tố

khác như độ dốc, hướng sườn, tốc độ gió và lượng mưa trung bình tháng có

mức độ ảnh hưởng thấp đến nguy cơ cháy rừng, thể hiện qua giá trị các trọng

số đạt lần lượt là 0.06, 0.05, 0.03 và 0.02. Kết quả xây dựng bản đồ phân vùng

nguy cơ cháy rừng trên cơ sở phương pháp phân tích thứ bậc AHP sử dụng 9

Hình 3.16 Kết quả dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng kỹ thuật phân tích thứ bậc (AHP)

lớp thông tin đầu vào được trình bày trên hình 3.16.

103

Trong luận án, nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An được

phân chia thành 05 cấp: rất thấp (0 - 0.4), thấp (0.4 - 0.6), trung bình (0.6 -

0.75), cao (0.75 - 0.9) và rất cao (0.9 - 1). Giá trị ngưỡng để phân vùng mức độ

nguy cơ cháy rừng được tham khảo từ nghiên cứu của Bùi Tiến Diệu và cộng

sự (2017).

Trên hình 3.16, các ký hiệu màu đen thể hiện vị trí các điểm cháy đã diễn

ra trong quá khứ, màu xanh thể hiện các điểm báo cháy nhưng không xảy ra

cháy tại khu vực nghiên cứu. Có thể nhận thấy, kết quả phân vùng nguy cơ cháy

rừng bằng kỹ thuật AHP có độ chính xác không cao, các khu vực có cấp độ

cháy rừng khác nhau được phân bố cục bộ thành mảng lớn. Điều này dẫn đến

mặc dù có nhiều điểm cháy được phân loại vào khu vực có nguy cơ cháy rừng

cao và rất cao, tuy nhiên, rất nhiều các điểm không cháy cũng được phân vùng

vào các khu vực có nguy cơ cháy cao và rất cao.

3.3.2 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán Random Forest

Về bản chất, các mô hình học máy xử lý bài toán dự báo nguy cơ cháy

rừng như một vấn đề nhận dạng (phân loại) nhị phân. Giá trị các tham số của

thuật toán, như số lượng cây (numberOfTrees) đối với thuật toán RF, tham số

phạt (C) đối với thuật toán SVM hay số lượng nút (maxNodes) với thuật toán

CART có ảnh hưởng quan trọng đến độ chính xác kết quả phân loại.

Để dự báo nguy cơ cháy rừng bằng thuật toán Random Forest, nghiên

cứu sinh thử nghiệm với nhiều giá trị khác nhau của tham số numberOfTrees.

Với mỗi giá trị tham số numberOfTrees, người sử dụng xác định số lượng cây

quyết định cần khởi tạo trước khi thuật toán tự học. Dựa trên bộ dữ liệu đầu

vào bao gồm các điểm cháy và 9 lớp thông tin, thuật toán RF tiến hành học tập,

sau đó phân loại cấp độ cháy rừng, trong đó cấp độ cháy rừng cũng được chia

thành 5 cấp, tương tự như với sử dụng kỹ thuật phân tích thứ bậc AHP. Từ kết

quả thử nghiệm cho thấy, với tham số numberOfTrees 100 có độ chính xác cao

104

nhất, thể hiện qua vị trí phân bố dữ liệu các điểm cháy, không cháy và kết quả

đánh giá bằng đường cong ROC. Kết quả dự báo nguy cơ cháy rừng bằng thuật

toán RF với giá trị thông số numberOfTrees bằng 3, 100 và 200 được trình bày

Hình 3.17 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF(3)

trên các hình 3.17 - 3.19.

105

Hình 3.18 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF(100)

Hình 3.19 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF(200)

106

Có thể nhận thấy, kết quả dự báo nguy cơ cháy rừng khu vực phía tây

tỉnh Nghệ An bằng thuật toán RF có độ chính xác và mức độ chi tiết cao hơn

so với sử dụng kỹ thuật AHP (không phân bố thành các mảng lớn có cấp độ dự

báo cháy như nhau), trong cả 3 trường hợp sử dụng giá trị tham số

numberOfTrees là 3, 100 và 200.

3.3.3 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM

Để dự báo nguy cơ cháy rừng bằng thuật toán SVM, trong luận án thử

nghiệm với các giá trị tham số phạt (tham số C) khác nhau. Tham số C đại diện

cho mức độ lỗi (sai số) khi phân loại, trong đó C càng lớn có nghĩa là thuật toán

SVN bị phạt càng nặng khi thực hiện kết quả phân loại sai. Trên cơ sở phân

tích vị trí phân bố dữ liệu điểm cháy, trong luận án lựa chọn 02 giá trị tham số

C cho kết quả dự báo phù hợp nhất để đánh giá, so sánh với các thuật toán khác

Hình 3.20 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 25

(hình 3.20 và 3.21 với 5 cấp độ nguy cơ cháy rừng khác nhau).

107

Hình 3.21 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 30

Nhìn chung, kết quả phân vùng nguy cơ cháy rừng bằng thuật toán SVM

có độ chính xác thấp hơn so với thuật toán RF. Với giá trị tham số C là 30, các

khu vực có cấp độ nguy cơ cháy rừng "cao" tập trung thành các vùng rất lớn,

điều này dẫn đến nhiều điểm không xảy ra cháy rừng được phân bố vào khu

vực có cấp độ cháy rừng "cao"và "rất cao".

3.3.4 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART

Tương tự như với các thuật toán học máy RF và SVM, để dự báo nguy

cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng thuật toán CART trên cơ sở

9 lớp dữ liệu đầu và và dữ liệu các điểm cháy, trong luận án nghiên cứu sinh đã

thử nghiệm với các giá trị tham số maxNodes khác nhau, ứng với số lượng nút

lá tối đa trên mỗi cây quyết định. Kết quả nhận được cho thấy, với giá trị

maxNodes càng thấp, mức độ chi tiết của kết quả phân vùng nguy cơ cháy rừng

càng thấp, trong đó các khu vực có nguy cơ cháy rừng cao chiếm tỉ lệ rất lớn,

108

phân bố cục bộ thành vùng lớn tại phía bắc khu vực nghiên cứu. Có thể nhận

thấy, với giá trị maxNodes bằng 5, hơn một nửa diện tích khu vực nghiên cứu

(ở phía bắc) được phân loại ở cấp độ cháy rừng "rất cao". Như vậy, hầu hết các

điểm cháy và không cháy từ CSDL của Cục Kiểm lâm đều được phân bố trong

các khu vực có nguy cơ cháy "rất cao". (Hình 3.22). Khi thay đổi giá trị

maxNodes cao hơn, mức độ chi tiết trong phân vùng nguy cơ cháy rừng có xu

hướng tăng lên, tuy nhiên so với thuật toán RF và SVM mức độ chi tiết thấp

hơn rất nhiều (vẫn phân bố thành các khu vực lớn cục bộ). Điều này sẽ dẫn đến

những sai số lớn khi dự báo nguy cơ cháy rừng.

Từ thử nghiệm với các giá trị tham số maxNodes khác nhau, trong luận

án nhận thấy, với giá trị tham số maxNodes bằng 30 có mức độ phù hợp cao

nhất giữa kết quả dự báo và vị trí phân bố các điểm cháy, điểm không cháy

Hình 3.22 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 5

(Hình 3.23).

109

Hình 3.23 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 30

3.4 Đánh giá độ chính xác và lựa chọn mô hình dự báo nguy cơ cháy rừng

a) Đánh giá bằng bộ dữ liệu điểm cháy

Để đánh giá độ chính xác kết quả dự báo nguy cơ cháy rừng bằng các mô

hình khác nhau, trong luận án sử dụng bộ dữ liệu cháy rừng khu vực phía tây

tỉnh Nghệ An và lân cận từ CSDL của Cục Kiểm lâm và CSDL quốc tế của

NASA. Ngoài dữ liệu để chạy mô hình, bộ dữ liệu bao gồm 36 điểm cháy và

61 điểm không cháy được sử dụng để đánh giá độ chính xác của mô hình dự

báo. Vị trí các điểm cháy được thể hiện bởi hình tam giác màu đen trên các bản

đồ dự báo nguy cơ cháy rừng, trong khi các điểm không cháy được thể hiện bởi

ký hiệu các hình tam giác màu xanh. So sánh kết quả dự báo nguy cơ cháy rừng

giữa các mô hình khác nhau được trình bày trong bảng 3.3.

110

Bảng 3.3: So sánh kết quả dự báo nguy cơ cháy rừng giữa các phương án

Cấp độ nguy cơ cháy rừng

Thuật

toán

Rất thấp

Thấp

TB

Cao

Rất cao

Điểm cháy

0

3

6

8

19

RF3

Điểm không cháy

11

18

21

9

2

Điểm cháy

0

2

3

8

23

RF100

Điểm không cháy

14

25

15

5

2

Điểm cháy

2

2

9

20

3

RF200

Điểm không cháy

8

17

17

12

7

Điểm cháy

0

2

1

4

29

CART5

Điểm không cháy

8

11

10

2

30

Điểm cháy

0

2

2

8

24

CART30

Điểm không cháy

10

19

2

1

29

Điểm cháy

0

4

2

25

6

SVM30

Điểm không cháy

0

5

3

38

15

Điểm cháy

1

3

11

18

3

SVM25

Điểm không cháy

3

17

8

28

5

Điểm cháy

0

8

7

15

6

AHP

Điểm không cháy

0

3

5

31

22

Phân tích kết quả đạt được từ bảng 3.3 cho thấy:

+ Với thuật toán Rừng ngẫu nhiên (RF): giá trị tham số

numberOfTrees bằng 100 (RF100) cho kết quả dự báo chính xác nhất. Trong

số 36 điểm xảy ra cháy trong quá khứ, có 31 điểm phân bố vào các khu vực có

cấp độ dự báo cháy "cao" và "rất cao" (tương đương 86.11%), trong đó riêng

cấp độ dự báo cháy "rất cao" có 23 điểm (63.89% tổng số điểm cháy). Các điểm

cháy được phân bố vào các khu vực có cấp độ "thấp" và "trung bình" đạt 2 và

3 điểm. Không có điểm cháy nào được phân bố vào khu vực có cấp độ cháy

"rất thấp". Phần lớn các điểm không cháy phân bố vào các khu vực có cấp độ

dự báo "rất thấp" (14/61 điểm), "thấp" (25/61 điểm) và "trung bình" (15/61

111

điểm). Chỉ có 5 điểm không cháy phân bố ở cấp độ "cao" và 2 điểm ở cấp độ

"rất cao".

Với giá trị tham số numberOfTrees bằng 3 (RF3), có 27 điểm cháy phân

bố vào cấp độ dự báo cháy "cao" và "rất cao", thấp hơn so với phương án

RF100. Số lượng điểm cháy phân bố vào khu vực có cấp độ cháy "rất cao" cũng

thấp hơn (19 so với 23). Có 6 điểm cháy phân bố ở khu vực có cấp độ dự báo

"trung bình" và 3 điểm cháy ở khu vực có cấp độ dự báo "thấp". Số lượng các

điểm không cháy phân bố vào các khu vực có cấp độ "rất thấp" và "thấp" cũng

ít hơn đáng kể so với RF100, với 11/61 điểm ở cấp độ "rất thấp", 18/61 điểm ở

cấp độ "thấp". Ngoài ra, có tới 11/61 điểm không cháy phân bố ở khu vực có

cấp độ cháy "cao" và "rất cao", nhiều hơn 4 điểm khi so với với phương án

RF100.

Phương án sử dụng giá trị tham số numberOfTrees bằng 200 (RF200) có

độ chính xác thấp nhất so với các phương án RF3 và RF100, thể hiện ở số lượng

điểm cháy phân bố ở các khu vực có cấp độ cháy rừng "cao" và "rất cao", đạt

23 điểm (20 điểm ở nguy cơ cao, 3 điểm ở nguy cơ rất cao), trong khi có tới 4

điểm cháy được phân bố ở các khu vực có cấp độ cháy "rất thấp", và "thấp".

Ngược lại, số lượng điểm không cháy phân bố vào khu vực có nguy cơ cháy

rừng "cao" và "rất cao", chiếm tới 19/61 điểm, cao hơn đáng kể so với phương

án RF3 (11/61 điểm) và RF100 (7/61 điểm). Nhìn chung, khi giá trị tham số

numberOfTrees cao trên 100, độ chính xác kết quả dự báo nguy cơ cháy rừng

có sự suy giảm.

+ Với thuật toán SVM: với 02 phương án lựa chọn giá thị tham số C có

độ chính xác cao nhất của thuật toán SVM (SVM 25 và SVM30) cho thấy, kết

quả dự báo cháy rừng bằng thuật toán SVM có độ chính xác thấp hơn đáng kể

so với thuật toán RF. Với phương án SVM25, có 18/36 điểm cháy được phân

bố vào khu vực có cấp độ dự báo cháy "cao" 3 điểm vào khu vực có cấp độ «rất

112

cao»; có 4 điểm cháy phân bố ở khu vực có cấp độ dự báo cháy "rất thấp"và

"thấp".. Trong khi đó, có tới 33/61 điểm không cháy được phân bố vào khu vực

có cấp độ dự báo cháy "cao" và "rất cao", với phương án SVM30 là 53/61 điểm.

Như vậy có thể nhận thấy, mức độ sai số của các phương án SVM25 và SVM30

là khá lớn, độ chính xác dự báo cháy rừng bằng thuật toán SVM là không cao

so với khi sử dụng thuật toán RF. Điều này cũng phù hợp với nhiều nghiên cứu

trên thế giới khi sử dụng thuật toán RF và SVM cho các bài toán phân loại nhị

2023; Xu et al., 2023).

phân như với bài toán dự báo nguy cơ cháy rừng (Gao et al., 2022; Tan and Feng,

+ Với thuật toán CART: Với phương án sử dụng tham số maxNodes

bằng 5 (CART5) (Hình 3.23), phần lớn các điểm cháy và không cháy phân bố

ở các khu vực có cấp độ dự báo cháy "cao" và "rất cao", tương ứng với 33/36

điểm cháy và 32/61 điểm không cháy. Tương tự như với phương án CART30,

có 32/36 điểm cháy phân bố ở khu vực có cấp độ dự báo cháy "cao" và "rất

cao", trong khi đó cũng có tới 31/61 điểm không cháy được phân bố trong khu

vực có cấp độ dự báo cháy "cao" và "rất cao". Kết quả nhận được khi sử dụng

thuật toán CART cũng tương tự như với thuật toán SVM, khi kết quả dự báo

nguy cơ cháy rừng phân bố cục bộ thành các mảng lớn dẫn đến phần lớn các

điểm cháy và không cháy phân bố cục bộ ở các khu vực cấp độ dự báo cháy

"cao" và "rất cao"

+ Với phương án sử dụng kỹ thuật AHP: Nhìn chung, kết quả dự báo

nguy cơ cháy rừng bằng kỹ thuật phân tích thứ bậc AHP trên cơ sở 9 lớp dữ

liệu đầu vào có độ chính xác thấp hơn vo với các thuật toán học máy, đặc biệt

là so với phương án sử dụng thuật toán RF. Điều này thể hiện ở chỗ có tới 53/61

điểm không cháy (86.89% tổng số điểm không cháy) được phân bố vào khu

vực có cấp độ dự báo cháy "cao" và "rất cao", trong khi không có điểm nào

phân bố ở khu vực có cấp độ dự báo cháy '‘rất thấp'’. Kết quả dự báo nguy cơ

113

cháy trên hình 3.17 cho thấy, phần lớn khu vực nghiên cứu được dự báo ở cấp

độ cháy "cao" và "rất cao", khu vực có cấp độ nguy cơ cháy «rất thấp» hầu như

chiếm tỉ lệ không đáng kể.

b) Đánh giá dựa trên đường cong ROC

Trong các bài toán phân lớp có hai lớp dữ liệu, các nghiên cứu thường

sử dụng phương pháp đánh giá độ hiệu quả của mô hình qua True, False,

Positive, Negative. Cụ thể hơn, trong hai lớp dữ liệu này có một lớp quan trọng

hơn lớp kia và cần được dự đoán chính xác. Trong những trường hợp này, các

nghiên cứu thường định nghĩa lớp dữ liệu quan trọng hơn cần được xác định

đúng là lớp Positive (P – dương tính), lớp còn lại được gọi là Negative (N – âm

tính). Các nghiên cứu thường quan tâm đến TPR, FNR, FPR, TNR (R – tỷ lệ)

dựa trên ma trận nhầm lẫn như phía dưới. Như vậy, các nghiên cứu có thể chấp

nhận FPR cao để đạt được FNR thấp. Bên cạnh đó, tổng giá trị của các cột luôn

bằng 1.

Positive

Negative

FNR = FN/(TP+FN)

TPR = TP/(TP+FN)

Positive

(tỉ lệ nhầm)

TNR = TN/(FP+TN)

FPR = FP/(FP+TN)

Negative

(tỉ lệ bỏ sót)

ROC (Receiver Operating Characteristic) là biểu đồ thể hiện hiệu suất

của mô hình phân loại ở tất cả các ngưỡng phân loại. Đường cong này biểu diễn

hai tham số: True Positive Rate (TPR), False Positive Rate (FPR).

AUC (Under the Curve) là một kỹ thuật đánh giá hiệu quả của mô hình

hồi quy logistic trong việc phân loại dữ liệu. Giá trị AUC thay đổi từ 0 đến 1,

trong đó giá trị AUC càng lớn thì mô hình phân loại dữ liệu càng tốt. Một mô

114

hình có AUC là 1 có thể phân loại chính xác hoàn toàn các điểm dữ liệu vào

đúng các lớp.

So sánh giá trị AUC của các mô hình dự báo được thể hiện trong bảng

3.4, trong đó mô hình RF(100) đạt giá trị AUC cao nhất, cũng phù hợp với phân

bố các điểm cháy và không cháy khi so sánh, đánh giá độ chính xác. Kết quả

xác định đường cong ROC đối với các phương án CART30, RF(3), RF(100),

SVM(3) được trình bày trên hình 3.24.

Bảng 3.4: Giá trị AUC của các mô hình học máy

RF(3) RF(100) RF(200) CART(5) CART(30) SVM(25) SVM(30)

0.947

0.938

0.905

0.916

0.756

0.743

AUC

0.951

Hình 3.24: Kết quả xác định đường cong ROC đối với một số phương án xây dựng

mô hình dự báo nguy cơ cháy rừng

Nhận xét: Từ kết quả thử nghiệm mô hình dự báo nguy cơ cháy rừng

trên cơ sở phương pháp phân tích thứ bậc AHP và các thuật toán học máy (RF,

SVM và CART) cho thấy, phương án sử dụng thuật toán Random Forest với

giá trị tham số numberOfTrees bằng 100 (RF100) có độ chính xác cao nhất khi

dự báo nguy cơ cháy rừng.

115

Trên cơ sở so sánh, đánh giá độ chính xác dự báo nguy cơ cháy rừng

bằng các mô hình khác nhau, trong luận án đã lựa chọn mô hình RF100 để xây

dựng bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An. Kết quả

dự báo nguy cơ cháy rừng khu vực nghiên cứu được trình bày trong bảng 3.5.

Phân tích các kết quả thu được cho thấy gần một nửa diện tích khu vực

nghiên cứu có mức độ nguy hiểm cháy rừng “trung bình” (43,38%), được thể

hiện bởi màu vàng ở hình 3.18. Diện tích có nguy cơ cháy rừng “rất thấp” và

“thấp” chiếm 5,75% và 23,00% tổng diện tích, chủ yếu ở phía Đông Nam tỉnh

Nghệ An. Diện tích có nguy cơ cháy rừng “cao” chiếm 16,68% tổng diện tích

khu vực nghiên cứu. Trong khi đó, diện tích có nguy cơ cháy rừng “rất cao”

chiếm 4,63% tổng diện tích và nằm chủ yếu ở phía Đông khu vực nghiên cứu

(được thể hiện bằng màu đỏ trong Hình 3.18). Những khu vực có nguy cơ cháy

rừng «cao» và «rất cao» phân bố tập trung ở những vùng có mật độ dân số cao,

Bảng 3.5. Diện tích các khu vực với nguy cơ cháy rừng khác nhau

lớp phủ rừng chủ yếu là rừng thứ sinh và rừng trồng.

Nguy cơ cháy rừng

STT 1 2 3 4 5

Rất thấp Thấp Trung bình Cao Rất cao

Diện tích (ha) 636,65 3271,13 4800,45 1845,96 511,35

Diện tích (%) 5,75 29,56 43,38 16,68 4,63

3.5 Xây dựng công cụ xử lý dữ liệu viễn thám và GIS trên nền tảng GEE

GEE là nền tảng điện toán đám mây để phân tích dữ liệu viễn thám, có

tích hợp sẵn một kho lưu trữ hàng chục petabyte dữ liệu viễn thám miễn phí,

trong đó có ảnh Landsat và Sentinel. Đây là một công cụ rất hiệu quả trong xử

lý dữ liệu viễn thám đa thời gian phục vụ các mô hình nghiên cứu, giám sát tài

nguyên môi trường, trong đó có xây dựng các mô hình dự báo nguy cơ cháy

rừng từ dữ liệu viễn thám và GIS.

116

Trong luận án, nghiên cứu sinh sử dụng ngôn ngữ lập trình JavaScript

trên giao diện Code Editor để đưa dữ liệu ảnh Landsat 8/9 và Sentinel 2 MSI

vào nền tảng và tiến hành các bước xử lý, phân tích, hiển thị và xuất kết quả.

Các lớp thông tin đầu vào như lớp phủ thực vật, độ ẩm bề mặt, độ cao, độ dốc,

hướng sườn, tốc độ gió, lượng mưa trung bình tháng, mật độ dân cư được thu

thập và xử lý trên nền tảng GEE trước khi đưa vào mô hình. Việc sử dụng công

cụ GEE trong luận án cho phép xử lý dữ liệu đầu vào cho mô hình một cách

nhanh chóng, thuận tiện khi nền tảng GEE cung cấp đầy đủ các thông tin đầu

vào này. Hơn nữa, điều này cũng giúp người sử dụng không cần tải dữ liệu về

máy tính cá nhân. Ngoài ra, người dùng có thể cập nhật thường xuyên các dữ

liệu đầu vào (ảnh vệ tinh, tốc độ gió, lượng mưa...) để dự báo nguy cơ cháy

rừng một cách kịp thời hơn.

Mã code module phần mềm mô hình dự báo nguy cơ cháy rừng từ dữ

liệu viễn thám và GIS trên nền tảng GEE được trình bày trong Phụ lục 1. Giao

Hình 3.25 Công cụ xử lý dữ liệu cho mô hình dự báo nguy cơ cháy rừng trên nền tảng GEE

diện công cụ được minh họa trên hình 3.25.

117

Công cụ cho phép lựa chọn các thuật toán trong xây dựng mô hình dự

báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS, bao gồm AHP, RF, SVM,

CART. Với các thuật toán học máy, người sử dụng có thể nhập các tham số

khác nhau để thử nghiệm, chẳng hạn với thuật toán RF (hình 3.25) cho kết quả

khi xây dựng mô hình dự báo với tham số numberOfTrees bằng 100 (RF100).

Để hiển thị, người sử dụng click vào '‘Result image'’ Để thử nghiệm với thuật

toán khác, người sử dụng click vào '‘Remove image'’, sau đó lựa chọn thuật

toán, lựa chọn tham số để hiện thị kết quả.

Hình 3.26 trình bày ví dụ kết quả dự báo nguy cơ cháy rừng khu vực

nghiên cứu bằng thuật toán CART với giá trị maxNodes bằng 30 (CART30).

Hình 3.26 Công cụ tổ hợp màu ảnh viễn thám trong module phần mềm

3.6 Tiểu kết chương 3

Trong chương 3, đã tiến hành thử nghiệm mô hình dự báo nguy cơ cháy

rừng khu vực phía tây tỉnh Nghệ An từ dữ liệu viễn thám và GIS. Với 9 lớp

thông tin đầu vào, bao gồm: mật độ dân cư, lớp phủ thực vật, độ cao, nhiệt độ

bề mặt, độ bốc thoát hơi nước bề mặt, độ dốc, hướng sườn, tốc độ gió và lượng

mưa trung bình tháng, nghiên cứu sinh đã thực nghiệm với các phương pháp

khác nhau, bao gồm sử dụng kỹ thuật phân tích thứ bậc AHP và các kỹ thuật

118

học máy Random Forest, Support Vector Machine, Classification and

Regression Trees để đánh giá, lựa chọn phương án phù hợp nhất với khu vực

nghiên cứu.

Trên cơ sở so sánh, đánh giá kết quả dự báo nguy cơ cháy rừng từ mô

hình đề xuất và dữ liệu các điểm cháy, điểm không cháy từ CSDL của Cục

Kiểm lâm, Bộ Nông nghiệp và Phát triển nông thôn cho thấy, phương án sử

dụng thuật toán Random Forest với giá trị tham số numberOfTrees bằng 100

(RF100) cho độ chính xác cao nhất, thể hiện ở tỉ lệ các điểm cháy phân bố ở

các khu vực có cấp độ dự báo nguy cơ cháy "cao" và "rất cao", đạt cao nhất,

trong khi phần lớn các điểm không cháy nằm ở các khu vực có cấp độ dự báo

cháy "rất thấp", và "thấp". Mức độ chi tiết trong phân vùng nguy cơ cháy rừng

(bao gồm 5 cấp: rất thấp, thấp, trung bình, cao và rất cao) cũng tốt hơn so với

các phương án khác. Từ kết quả này, trong luận án sử dụng phương án RF4 để

thành lập bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An.

Để xử lý dữ liệu viễn thám và GIS phục vụ xây dựng mô hinh dự báo

nguy cơ cháy rừng, trong luận án đã xây dựng công cụ phần mềm trên nền tảng

điện toán đám mây GEE. Công cụ này cho phép xử lý trực tiếp trên nền tảng

GEE và chỉ cần tải kết quả về máy tính. Đây là một cách tiếp cận phù hợp trong

điều kiện dữ liệu viễn thám rất đa dạng với dung lượng khổng lồ như hiện nay.

119

KẾT LUẬN VÀ KIẾN NGHỊ

Kết luận

Qua quá trình nghiên cứu, trong luận án đã lựa chọn được mô hình dự

báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS cho khu vực phía tây tỉnh

Nghệ An. Từ những kết quả đạt được trong luận án, rút ra các kết luận sau:

Dữ liệu viễn thám và GIS có thể sử dụng hiệu quả phục vụ xây dựng các

lớp thông tin đầu vào cho mô hình dự báo nguy cơ cháy rừng. Trong luận án,

ngoài 8 lớp thông tin các mô hình dự báo nguy cơ cháy rừng khác thường áp

dụng (mật độ dân cư, lớp phủ thực vật, độ cao, nhiệt độ bề mặt, độ dốc, hướng

sườn, tốc độ gió, lượng mưa trung bình tháng), đã thử nghiệm thêm với lớp

thông tin độ bốc thoát hơi nước bề mặt để xây dựng mô hình dự báo. Các lớp

thông tin này có thể được chiết xuất nhanh từ dữ liệu viễn thám (ảnh Landsat

8/9, Sentinel 2 MSI, MODIS) cũng như các CSDL về dân cư, khí hậu.

Trong luận án đã thử nghiệm với 04 phương pháp dự báo nguy cơ cháy

rừng, bao gồm phương pháp truyền thống trên cơ sở kỹ thuật phân tích thứ bậc

AHP và 03 phương pháp sử dụng các thuật toán học máy: Random Forest,

Support Vector Machine, Classification and Regression Trees để phân tích,

đánh giá và so sánh kết quả dự báo nguy cơ cháy rừng. Với các thuật toán học

máy, nghiên cứu sinh cũng đã thử nghiệm với các tham số khác nhau của thuật

toán, từ đó lựa chọn phương án tối ưu, phù hợp với điều kiện khu vực thực

nghiệm.

Phân tích kết quả nhận được cho thấy, thuật toán Random Forest với tham

số numberOfTrees bằng 100 (RF100) có độ chính xác cao nhất trong dự báo

nguy cơ cháy rừng ở khu vực phía tây tỉnh Nghệ An. Thông qua so sánh vị trí

phân bố dữ liệu các điểm cháy và không cháy từ CSDL của Cục Kiểm lâm, Bộ

Nông nghiệp và Phát triển nông thôn và CSDL NASA cho thấy, thuật toán

RF100 có số lượng các điểm cháy phân bố vào khu vực có cấp độ dự báo nguy

120

cơ cháy rừng ‘’cao’’ và ‘’rất cao’’ đạt tỉ lệ lớn nhất (31/36 điểm), trong khi các

điểm không cháy phần lớn phân bố ở các khu vực có cấp độ dự báo cháy ‘’rất

thấp’’ và ‘’thấp’’ (39/61 điểm). Giá trị AUC của mô hình RF100 là 0.951 cũng

cao nhất so với các phương án học máy khác, tương ứng với 0.947, 0.938, 0.905,

0.756 và 0.743 khi sử dụng các mô hình RF(3), RF(200), CART(5), CART(30),

SVM(25) và SVM(30).

Mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS trên cơ

sở các kỹ thuật học máy xây dựng trong luận án là một công cụ hiệu quả, giúp

các nhà quản lý đưa ra những biện pháp trong theo dõi, giám sát, đưa ra các

cảnh báo nhằm giảm thiểu thiệt hại do cháy rừng gây ra. Mô hình này có thể áp

dụng cho các khu vực khác có điều kiện tự nhiên, kinh tế - xã hội tương tự.

Các lớp thông tin đầu vào chiết xuất từ dữ liệu viễn thám và GIS (mật độ

dân số, lớp phủ thực vật, độ bốc thoát hơi nước bề mặt, hướng sườn, độ dốc,

tốc độ gió, độ cao, nhiệt độ bề mặt và lượng mưa trung bình tháng) cho phép

xây dựng mô hình dự báo nguy cơ cháy rừng phù hợp với điều kiện khu vực

nghiên cứu ở phía Tây tỉnh Nghệ An.

Kỹ thuật học máy (thuật toán Random Forest) giúp dự báo nguy cơ cháy

rừng từ dữ liệu viễn thám và GIS với độ chính xác cao nhất đối với khu vực

nghiên cứu.

Kiến nghị

Trên cơ sở những kết quả đạt được, đề xuất một số kiến nghị sau:

Do khả năng chủ động trong cung cấp nguồn dữ liệu viễn thám và GIS,

bước tiếp theo có thể xây dựng phần mềm tự động cập nhật và xác định nhanh

các lớp thông tin đầu vào của mô hình dự báo nguy cơ cháy rừng, từ đó đưa ra

kết quả dự báo một cách kịp thời, liên tục.

Ngoài bộ dữ liệu điểm cháy từ CSDL của Cục Kiểm lâm (Bộ Nông

nghiệp và Phát triển nông thôn), cần thu thập thêm các dữ liệu, số liệu khác về

121

các khu vực đã xảy ra cháy trong quá khứ nhằm giúp tăng độ chính xác của các

mô hình học máy trong quá trình học tập, phân loại các khu vực có cấp độ nguy

cơ cháy rừng khác nhau.

Luận án góp phần hoàn thiện cơ sở khoa học và minh chứng tính hiệu

quả của phương pháp ứng dụng dữ liệu viễn thám, GIS và các kỹ thuật trí tuệ

nhân tạo (học máy) trong xây dựng mô hình dự báo nguy cơ cháy rừng. Đề nghị

Sở Nông nghiệp và Phát triển nông thôn tỉnh Nghệ An xem xét được vào thử

nghiệm trong thực tế nhằm nâng cao hiệu quả công tác dự báo sớm nguy cơ

cháy rừng ở khu vực phía tây tỉnh Nghệ An.

122

[1]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu (2018). Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ

mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn, Nghệ An,, Hội nghị ERSD, trang 71. [2]. Nguyễn Văn Trung, Đoàn Thị Nam Phương, Bùi Tiến Diệu (2018). Sử dụng

các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ

mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn, Nghệ An, Tạp chí Khoa học kỹ thuật Mỏ

- Địa chât ISSN 1859-1469 Tâp 59 Kỳ 5, trang 44. [3]. Doan Thi Nam Phuong, Nguyen Van Trung, Bui Tien Dieu (2019).

Evaluation of forest fire on Na Ngoi commune, Ky Son, Nghe An using Sentinel

2A and Landsat-8 Operational Land Imager (OLI) spectral indices, Hội nghị

Khoa học Quốc tế Forum, trang 71 (Bài báo đăng kỷ yếu Hội nghị Quốc tế có

phản biện).

[4]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Phạm Thị Thanh Hòa, Trần

Thanh Hà, Lê Thanh Nghị (2019). Quy trình thành lập bản đồ mức độ cháy rừng

bằng dữ liệu ảnh vệ tinh Sentinel-2. Tạp chí Tài nguyên và Môi trường ISSN 1859-

1477 số 19 kì 1 tháng 10, trang 30. [5]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu, Nguyễn Văn Sơn, Trần Thị Trúc Mai, Ngô Thanh Xuân (2020). Xây dựng và chuẩn hóa các cơ sở dữ liệu thành phần phục vụ dự báo nguy cơ cháy rừng, Hội nghị ERSD, trang 71.

[6]. Doan Thi Nam Phuong, Nguyen Van Trung, Pham Thi Thanh Hoa, Tran

Thanh Ha, Le Thi Thu Ha (2022). Forest Fire Risk Assessment and Mapping Using Support Vector Machine Algorithm, A Case Study in Nghe An Province,

Viet Nam. European Geographical Studies. 9(1), 3

- 12, DOI:

10.13187/egs.2022.1.3.

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ

123

TÀI LIỆU THAM KHẢO

Tiếng Việt

1. Bộ Nông nghiệp và Phát triển Nông thôn (2022). Quyết định công bố hiện

trạng rừng toàn quốc năm 2021, Quyết định số 2860/QĐ-BNN-TCLN.

2. Bộ Nông nghiệp và Phát triển Nông thôn (2000). Quy định về cấp dự báo, báo động và các biện pháp tổ chức thực hiện phòng cháy, chữa cháy rừng, Quyết

định số 127/2000-QĐ-BNN-KL ngày 11/12/2000 của Bộ Nông nghiệp và Phát

triển nông thôn.

3. Trần Quang Bảo, Võ Minh Hoàn, Nguyễn Thị Hoa, Dương Huy Khôi (2019). Nghiên cứu đặc điểm vật liệu cháy và phân vùng nguy cơ cháy rừng tại khu

bảo tồn thiên nhiên văn hóa Đồng Nai, Tạp chí Khoa học và Công nghệ lâm

nghiệp, số 5, trang 38 – 48.

4. Trần Quang Bảo (2017). Nghiên cứu sử dụng công nghệ không gian địa lý (RS, GIS, GPS) trong phát hiện cháy rừng và giám sát tài nguyên rừng, Đề tài

nghiên cứu khoa học cấp Bộ.

5. Trần Quang Bảo, Phùng Nam Thắng, Lê Ngọc Hoàn (2016). Nghiên cứu phát triển phần mềm ứng dụng phát hiện sớm cháy rừng từ ảnh vệ tinh MODIS,

Tạp chí Nông nghiệp và Phát triển Nông thôn, số 21, trang 114 – 120.

6. Trần Minh Cảnh (2019). Nghiên cứu xây dựng các giải pháp quản lý lửa rừng

cho Vườn quốc gia Hoàng Liên, Luận án Tiến sĩ Lâm nghiệp.

7. Bế Minh Châu, Vương Văn Quỳnh (2010). Nghiên cứu hoàn thiện phương pháp và phần mềm cảnh báo nguy cơ cháy rừng ở Việt Nam, Tạp chí Nông

nghiệp và Phát triển Nông thôn, số 10, trang 105 – 111.

8. Lê Hùng Chiến (2022). Nghiên cứu xây dựng mô hình giám sát sự bốc - thoát hơi nước của lớp phủ khu vực Tây Bắc Việt Nam từ dữ liệu ảnh vệ tinh, Luận án tiến sĩ kỹ thuật, Đại học Mỏ Địa chất.

9. Chính phủ nước CHXHCN Việt Nam (2018). Nghị định Quy định chi tiết thi

hành một số điều của Luật Lâm nghiệp, Số 156-2018/NĐ-CP.

10. Lê Sỹ Doanh, Vương Văn Quỳnh (2014). Phương pháp dự báo nguy cơ cháy rừng theo điều kiện khí hậu ở Việt Nam. Tạp chí Khoa học Công nghệ lâm nghiệp, số 1, trang 3-10.

124

11. Nguyễn Thị Mai Dương, Lã Nguyên Khang, Lê Công Trường, Phùng Văn Kiên, Nguyễn Văn Hào (2016). Phân tích nguyên nhân mất rừng, suy thoái

rừng làm cơ sở đề xuất giải pháp quản lý bảo vệ rừng tỉnh Đắk Nông, Tạp chí Khoa học và Công nghệ lâm nghiệp, số 6, trang 39 – 48.

12. Phạm Minh Hải, Vũ Ngọc Phan (2018). Ứng dụng công nghệ viễn thám và GIS nghiên cứu vật liệu cháy trong các kiểu rừng phục vụ công tác phòng

chống cháy rừng tại tỉnh Bắc Giang, Tạp chí Khoa học Đo đạc và Bản đồ, số 35, trang 29 – 37.

13. Lê Ngọc Hoàn, Trần Quang Bảo (2018). Ứng dụng thuật toán trích xuất điểm dị thường nhiệt từ ảnh vệ tinh MODIS để phát hiện cháy rừng ở Việt Nam,

Tạp chí Khoa học và Công nghệ lâm nghiệp, số 1, trang 94 – 102.

14. Nguyễn Văn Hùng (2022). Nghiên cứu ứng dụng dữ liệu viễn thám đa thời gian trong giám sát sự biến động hệ thực vật vùng ven biển (vùng chuyển tiếp

giữa lục địa và biển, bao gồm vùng biển ven bờ và vùng đất ven biển), Báo

cáo tổng hợp đề tài khoa học và công nghệ, Bộ Tài nguyên và Môi trường. 15. Trần Văn Hùng, Võ Quang Minh, Võ Thị Gương (2010). Xây dựng phương pháp cản báo cháy rừng ở khu vực vườn quốc gia U Minh Hạ, Cà Mau dưới

sự hỗ trợ của Hệ thống thông tin địa lý (GIS), Tạp chí Khoa học trường Đại

học Cần Thơ, 14, 97 – 106.

16. Trịnh Lê Hùng (2014). Nghiên cứu phân bố nhiệt độ bề mặt từ dữ liệu ảnh hồng ngoại nhiệt Landsat, Tạp chí Các Khoa học về Trái Đất, số 36(1), trang

82 – 89.

17. Lê Văn Hưng, Nguyễn Thị Thanh, Đặng Hữu Nghị, Hoàng Anh Đức (2019). Xây dựng mô hình học sâu đánh giá nguy cơ cháy rừng tại Lâm Đồng, Hội

nghị Nghiên cứu cơ bản trong Khoa học Trái đất và Môi trường, trang 386 -

389.

18. Phạm Ngọc Hưng (1988). Xây dựng phương pháp dự báo cháy rừng Thông nhựa (Pinus merkusii J.) ở Quảng Ninh, Luận án PTS khoa học Nông nghiệp, Hà Nội.

19. Phạm Ngọc Hưng (2004). Quản lý cháy rừng ở Việt Nam, Nhà xuất bản Nghệ

An, 233 trang.

20. Nguyễn Văn Lợi, Trần Minh Đức, Nguyễn Phương Văn (2017). Thực trạng và giải pháp quản lý cháy rừng ứng phó với biến đổi khí hậu tại tỉnh Quảng Bình, Tạp chí Khoa học Lâm nghiệp, số 4, trang 139 – 150.

125

21. Vũ Thành Minh, Lê Thị Thu Hiền (2015). Ứng dụng GIS và viễn thám để thành lập bản đồ nhạy cảm cháy tại Vườn quốc gia Tràm Chim, Tạp chí Phát

triển Khoa học và Công nghệ, tập 18, số 16, trang 221 – 235.

22. Doãn Hà Phong (2007). Xây dựng thuật toán và phương trình xác định nhiệt độ bề mặt đất trong theo dõi cảnh báo cháy rừng trên cơ sở ảnh vệ tinh MODIS

(TERRA và AQUA) trên lãnh thổ Việt Nam, Luận án Tiến sỹ kỹ thuật, Trường

Đại học Mỏ Địa chất.

23. Vương Văn Quỳnh (2005). Nghiên cứu xây dựng các giải pháp phòng chống và khắc phục hậu quả cháy rừng cho vùng U Minh và Tây Nguyên, Báo cáo

tổng kết đề tài, Đề tài cấp nhà nước KC08.24 thuộc Chương trình bảo vệ môi

trường và phòng tránh thiên tai, Bộ Khoa học và Công nghệ.

24. Vương Văn Quỳnh, Chu Thị Bình, Trần Quang Bảo (2006). Phần mềm phát hiện cháy rừng từ ảnh vệ tinh, Tạp chí Nông nghiệp và Phát triển Nông thôn,

số 3+4, trang 135 – 137.

25. Võ Đình Tiến (1995). Phương pháp dự báo, lập bản đồ, khoanh vùng trọng điểm cháy rừng ở Bình Thuận, Tạp chí Lâm nghiệp, số 10, trang 11 – 14. 26. Nguyễn Ngọc Thạch, Phạm Xuân Cảnh, Đoàn Thu Phương, Hà Thị Bích Phượng, Đặng Ngô Bảo Toàn (2015). Ứng dụng GIS xây dựng bản đồ nguy

cơ cháy rừng cấp xã phục vụ công tác quản lí phòng chống cháy rừng tại tỉnh

Sơn La, Hội thảo GIS toàn quốc, tr.174-180.

27. Nguyễn Ngọc Thạch, Đặng Ngô Bảo Toàn, Phạm Xuân Cảnh (2017). Ứng dụng viễn thám và GIS thành lập bản đồ nguy cơ cháy rừng phục vụ phòng

chống, giảm thiểu thiệt hại do cháy rừng tại tỉnh Sơn La, Việt Nam, Tạp chí

Khoa học ĐHQGHN: Các Khoa học Trái đất và Môi trường, 33(3), 53-66. 28. Chu Thái Thành (2011). Bảo vệ rừng: nhiệm vụ quan trọng cấp thiết của chúng

ta, Tạp chí Cộng sản điện tử, truy cập tháng 12/2022.

29. Nguyễn Tiến Thành (2021). Nghiên cứu cơ sở khoa học ứng dụng ảnh hồng ngoại nhiệt và GIS trong cảnh báo cháy ngầm trên bể than Quảng Ninh, Báo cáo tổng hợp đề tài khoa học và công nghệ, Bộ Tài nguyên và Môi trường. 30. Đặng Ngô Bảo Toàn, Nguyễn Ngọc Thạch, Phạm Xuân Cảnh (2017). Ứng dụng viễn thám và GIS thành lập bản đồ nguy cơ cháy rừng phục vụ phòng chống, giảm thiểu thiệt hại do cháy rừng tại tỉnh Sơn La, Việt Nam, Hội thảo GIS toàn quốc, tr.252-261.

126

31. Đặng Ngô Bảo Toàn (2021). Nghiên cứu nguy cơ và cảnh báo cháy rừng tỉnh Sơn La trên cơ sở ứng dụng công nghệ địa thông tin, Luận án Tiến sĩ Địa lý,

Đại học Quốc gia Hà Nội.

32. Vũ Danh Tuyên, Trịnh Lê Hùng, Nguyễn Tiến Thành (2020). Viễn thám nâng cao, Giáo trình sau đại học, Nhà xuất bản Khoa học và Kỹ thuật, 207 trang. 33. Nguyễn Phương Văn, Nguyễn Văn Lợi, Trần Minh Đức (2019). Nghiên cứu hiệu chỉnh phân cấp dự báo cháy rừng trong bối cảnh biến đổi khí hậu tại tỉnh Quảng Bình, Tạp chí Khoa học Đại học Huế: Nông nghiệp và Phát triển nông

thôn, tập 128, số 3A, trang 179 – 190.

34. Nguyễn Phương Văn (2019). Nghiên cứu thực trạng và đề xuất giải pháp quản lý cháy rừng thích ứng với biến đổi khí hậu tại tỉnh Quảng Bình, Luận án tiến sĩ Lâm nghiệp.

Tiếng Anh

35. Aronoff S. (1989). Geographic Information System, WDL Publication, Ottaw,

19.

36. Arndt N., Vacik H., Koch V., Arpaci A., Gossow H. (2013). Modelling human-caused forest fire ignition for assessing forest fire danger in Austria,

iForest 6: 315-325

37. Arpaci A., Eastaugh C., Vacik H. (2013). Selecting the best performing fire for Austrian ecoregions, Theoretical and Applied

weather

indices

Climatology, 114, 393 – 406.

38. Arpaci A., Malowerschnig B., Sass O., Vacik H. (2014). Using multi variate data mining techniques for estimating fire susceptibility of Tyrolean forests,

Applied Geography, 53, 258 – 270.

39. Avetisyan D., Nedkov R. (2015). Assessment of fire hazard zones in the forest landscapes in Simitli Municipality (Bulgaria), Journal of Environment Protection and Sustainable Development, 1(4), 225 – 233.

40. Beals E.A. (1914). The value of weather forecasts in the problem of protecting

forests from fire, Monthly Weather Review, 42, 111–119.

41. Breiman L.

(2001). Random Forests, Machine Learning 45, 5–32,

https://doi.org/10.1023/A:1010933404324.

127

42. Breiman L., Friedman J., Olshen R., Stone C. (1984). Classification and regression trees, Monterey, CA: Wadsworth & Brooks/Cole Advanced Books

& Software, ISBN 978-0-412-04841-8.

43. Chandler C., Thomas P., Trabaud L., Williams D. (1993). Fire in forestry, Volume I: Forest fire behavior and effects, John Wiley & Sons, New Yok. 44. Cherepanov A., Druzhinina E. (2009). Spectral properties of vegetation and

vegetation indexes, Geomatics, 3, 28-32.

45. Chowdhury H., Hassan K. (2013). Use of remote sensingderived variables in developing a forest fire danger forecasting system, Natural Hazards, 67, 321-

334

46. Cooper S., Neiman K., Roberts D. (1991). Forest habitat types of northern Idaho: A second approximation, General Technical Report, INT 236, Ogden,

UT: U.S. Department of Agriculture, Forest Service, Intermountain Research

Station. 143 p.

47. Cortes C., Vapnik V. (1995). Support-vector networks, Mach Learn 20, 273–

297, https://doi.org/10.1007/BF00994018.

48. Danielson J., Gesch D. (2011). Global multi-resolution terrain elevation data

2010 (GMTED 2010), Open-File Report 2011-1073.

49. Dieu Tien Bui, Quang Thanh Bui, Quoc Phi Nguyen, Pradhan B., Nampak H., Phan Trong Trinh (2017). A hybrid artificial intelligence approach using GIS-

based neural-fuzzy inference system and particle swarm optimization for

forest fire susceptibility modeling at a tropical area, Agricultural and Forest

Meteorology, 233, 32 – 44.

50. Dieu Tien Bui, Kim Thoa Thi Le, Van Cam Nguyen, Hoang Duc Le, Revhaug I. (2016). Tropical Forest Fire Susceptibility Mapping at the Cat Ba National

Park Area, Hai Phong City, Vietnam, Using GIS-Based Kernel Logistic Regression, Remote Sensing, 8, 347, doi:10.3390/rs8040347.

51. Dong X. (2005). Forest fire risk zone mapping from satellite images and GIS for Baihe Forestry Bureau, Jilin, China, Journal of Forestry Research 16(3): 169-174.

52. Drucker H., Burges C., Kaufman L., Smola A., Vapnik V. (1997). Support vector regression machines, in Advances in Neural Information Processing Systems 9, NIPS 1996, 155–161, MIT Press.

128

53. Enoh M., Okeke U., Narinua N. (2021). Identification and modelling of forest fire severity and risk zones in the Cross – Niger transition forest with remotely

sensed satellite data, The Egyptian Journal of Remote Sensing and Space Science, 24(3), 879 – 887.

54. FAO (1999). FAO meeting on public policies affecting forest fires, FAO

Forestry Paper, 02586150, ISBN 92-5-104289-6, 380 pp.

55. Fernandez J., Chuvieco E., Koutsias N. (2012). Modelling long-term fire occurrence factors in Spain by accounting for local variations with

geographically weighted regression, Natural Hazards Earth System Scieces,

12, 1-17.

56. Gao C., Lin H., Hu H. (2023). Forest-fire-risk prediction based on Random Forest and backpropagation neural network of Heihe area in Heilongjiang

province, China, Forests 14(2): 170. https://doi.org/10.3390/f14020170. 57. Herrera C., Nieva D., Reyes J., Vega N., Serrano P., Rivas J., Alvarado E., Perez S., Pelaez E., Salicrup D., Jolly W. (2022). Fuel-specific aggregation of

cctive fire detections for rapid mapping of forest fire perimeters in Mexico,

Remote Sensing, 13(1), 124.

58. Gholamreza J.G., B.G., Osman M.D. (2012). Forest fire risk zone mapping

form Geographic Information System in Northern Forests of Iran (Case study,

Golestan province), International Journal of Agriculture and Crop Science,

Vol.4(12), 818 – 824.

59. Hoang V.T., Chou T., Fang Y., Nguyen N.T., Nguyen Q.H., Pham X.C., Dang

N.B.T., Nguyen X.L., Meadows M. (2020). Mapping forest fire risk and

development of early warning system for NW Vietnam using AHP and

MCA/GIS methods, Applied Sciences, 10(12), 4348.

60. Iban M., Sekertekin A. (2022). Machine learning based wildfire susceptibility mapping using remotely sensed fire data and GIS: A case study of Adana and Mersin provinces, Turkey, Ecological Informatics, 69, 101647.

61. Jaiswal R., Mukherjee S., Raju K., Saxena R. (2002). Forest fire risk zone mapping from satellite imagery and GIS, International Journal of Applied Earth Observation and Geoinformation, 4(1), 1-10.

62. James N., Thallak S. (2015). Macro-level assessment of seismically induced landslide hazard for the State of Sikkim, India based on GIS technique, IOP

129

Conference Series Earth and Environmental Scienc, 26(1):01202, DOI:

10.1088/1755-1315/26/1/012027.

63. Khan V. (2012). Long-range forecasting of forest fire danger based on the SLAV model seasonal ensemble forecasts, Russian Meteorology and

Hydrology, 37, 505 – 513.

64. Kolari D. (2008). Intergrated system for forest fire early detection and

manggement, Perioducum Biologorum, 110(2), 205 – 211.

65. Lamat R., Kumar M., Kundu A., Lai D. (2020). Forest fire risk mapping using analytical hierarchy process (AHP) and earth observation datasets: a case

study in the mountainous terrain of Northeast India, SN Applied Sciences,

3:425, https://doi.org/10.1007/s42452-021-04391-0. (2020). SVM hyperparameter

66. Liu C.

tuning using GridSearchCV,

https://towardsdatascience.com/svm-hyper-parameter-tuning-using-

gridsearchcv-49c0bc55ce29.

67. Mokarram M., Zarei A. (2018). Landslide susceptibility mapping using Fuzzy-

AHP, Geotechnical and Geological Engineering, 36(37), 3931 – 3943.

68. Nasiri V., Sadeghi S., Bagherabadi R., Moradi F., Deljouei A., Borz S. (2022). Modeling wildfire risk in western Iran based on the integration of AHP and

GIS,

Environmental Monitoring

and

Assessment,

194,

644,

https://doi.org/10.1007/s10661-022-10318-y.

69. Nesterov V. (1949) Forest fires and methods of fire risk determination.

Russian. Goslesbumizdat, Moscow.

70. Ngoc Thach Nguyen, Bao Toan Ngo Dang, Xuan Canh Pham, Hong Thi Nguyen, Hang Thi Bui, Nhat Duc Hoang, Dieu Tien Bui (2018). Spatial

pattern asessment of tropical forest fire danger at Thuan Chau area (Vietnam)

using GIS-based advanced machine learning algorithms: A comparative study, Ecological Informatics, vol.46, pp.74-85.

71. Olivera S., Oehler F., Ayanz J., Camia A., Pereira J. (2012). Modeling spatial patterns of fire occurrence in Mediterranean Europe using Multiple Regression and Random Forest, Forest Ecology and Management, 275, 117 – 129.

72. Onderka M., Melichercik I. (2010). Fire-prone areas delineated from a combination of the Nesterov Fire-risk Rating Index with multispectral satellite data, Applied Geomatics, 2, 1 – 7.

130

73. Pham Duc Dat, Le Thai Son (2022). Wildfire risk zone mapping from geographic information system in Tam Dao national park of Vietnam, Journal

of Foresty Science and Technology, 13, 45 – 55.

74. Pourghasemi H. (2015). GIS-based forest fire susceptibility mapping in Iran: A comparison between evidential belief function and binary logistic regression

models, Scandinavian Journal of Forest Research, 40 pp., DOI:

10.1080/02827581.2015.1052750.

75. Rouse, J.W., R.H. Haas, J.A. Schell, and D.W. Deering (1973). Monitoring Vegetation Systems in the Great Plains with ERTS, Third ERTS Symposium,

NASA SP-351 I: 309-317.

76. Ruano A., Jolly W., Freeborn P., Nieva D., Vega N., Herrera C., Rodrigues M. (2022). Spatial Predictions of Human and Natural-Caused Wildfire

Likelihood across Montana (USA), Remote Sensing, 13(8), 1200.

77. Saaty T.L. (2000). Fundamentals of the Analytic Hierarchy Process, RWS

Publications.

78. Saaty T.L. (2008). Decision making with the analytic hierarchy process,

International Journal of Services Sciences, 1, 83-98.

79. Sivrikaya F., Kucuk O. (2022). Modeling forest fire risk based on GIS-based analytical hierarchy process and statistical analysis in Mediterranean region,

Ecological Informatics, 68, 101537.

80. Shetinsky E.A. (1994). Protection of forests and forests pyrology, Ecology,

Moscow: 209 pp.

81. Sokolova G., Makogonov S. (2013). Development of the forest fire forecast method (a Case Study for the Far East), Russian Meteorology and Hydrology,

38, 222 – 226.

82. Stipaničev D., Vuko T., Kristinić D., Štula M., and Bodrožić L. (2006). Forest fire protection by advanced video detection system - Croatian experiences, Third TIEMS Work. Improvment Disaster Management Systems.

83. Tan C., Feng Z. (2023). Mapping forest fire risk zones using machine learning in Hunan province, China, Sustainability, 15(7):6292.

algorithms https://doi.org/10.3390/su15076292.

84. Trinh L.H., Zablotskii V.R. (2017). The application of Landsat multi-temporal thermal infrared data to identify coal fire in the Khanh Hoa coal mine, Thai

131

Nguyen province, Vietnam, Izvestiya, Atmospheric and Oceanic Physics,

53(9), 1181 – 1188.

85. Xu Q., Li W., Liu J., Wang X. (2023). A geographical similarity-based sampling method of non-fire point data for spatial prediction of forest fires,

Forest

Ecosystems,

Vol.10,

100104,

https://doi.org/10.1016/j.fecs.2023.100104.

86. Yassemi S., Dragicevic S., Schmidt M. (2008). Design and implementation of an integrated GIS-based cellular automata model to characterize forest fire

behaviour, Ecological Modelling, 210, 71 – 84.

87. Wang L., Qu J. (2007). NMDI: a normalized multi-band drought index for monitoring soil and vegetation moisture with satellite remote sensing, Vol.34(20), Hydrology

Studies,

Surface

Land

and

https://doi.org/10.1029/2007GL031021.

88. Williams M. (1983). Remote sensing, GIS and wildland fire management: A global perspective, Proceedings of the International Workshop on Satellite

Technology and GIS

for Mediterranean Forest Mapping and Fire

Management.

89. Wimberly M., Reilly M. (2007). Assessment of fire severity and species diversity in the southern Appalachians using Landsat TM and ETM+ imagery,

Remote Sensing of Environment, 108(2), 189 – 197.

90. Valor E., Caselles V. (1996). Mapping land surface emissivity from NDVI.

Application to European African and South American areas, Remote sensing

of Environment, 57, pp. 167 – 184.

91. Van de Griend A., Owen M. (1993). On the relationship between thermal

emissivity and the normalized difference vegetation index for natural surface,

International Journal of Remote Sensing 14, pp. 1119 – 1131.

92. Vasilakos C., Kalabokidis K., Hatzopoulos J., Matsinos T. (2009). Identifying wildland fire ignition factors through sensitivity analysis of a neural network,

Natural Hazards, 50, 125 – 143.

93. Venevsky K. (2002). Simulating fire regimes

in human-dominated ecosystems: Iberian Peninsula case study, Global Change Biology 8: 984-998.

132

94. Zhao P., Zhang F., Lin H., Xu S. (2021). GIS based forest fire risk model: a case study in Laoshan national forest park, Nanjing, Remote Sensing, 13(18),

DOI: 10.3390/rs13183704.

Website

95. https://kiemlam.org.vn, truy cập ngày 9/12/2022. 96. http://watch.pcccr.vn/thongKe/diemChay, truy cập ngày 20/11/2022 97. https://glovis.usgs.gov, truy cập ngày 10/8/2022. 98. https://wildfiretoday.com/, truy cập ngày 14/9/2022. 99. https://digital-geography.com/forest-fire-tracking-landsat-8/, truy cập ngày

14/9/2022.

100. https://glovis.usgs.gov. 101. https://scihub.copernicus.eu/dhus/#/home 102. https://geoviet.vn, truy cập ngày 17/9/2022 103. https://effis.jrc.ec.europa.eu/apps/effis_current_situation/,

truy cập ngày

19/9/2022.

104. https://www.worldclim.org/. 105. https://data.worldpop.org/ 106. https://www.javatpoint.com/machine-learning-decision-tree-classification-

algorithm, truy cập ngày 18/11/2022.

107. https://geohackweek.github.io/GoogleEarthEngine/02-code-editor/, truy cập

ngày 20/11/2022.

108. https://serc.carleton.edu/sp/library/google_earth/earth_engine_api.html, truy

cập ngày 18/11/2022.

109. Cổng thông tin điện tử tỉnh Nghệ An, https://www.nghean.gov.vn/.

PHỤ LỤC

Mã code module xử lý dữ liệu viễn thám và GIS trong dự báo nguy cơ cháy

* Thiết kế giao diện var colors = {'transparent': '#11ffee00', 'gray': '#F8F9FA'}; var TITLE_STYLE = { fontWeight: '100', fontSize: '32px', padding: '8px', color: '#616161', backgroundColor: colors.transparent, }; var SUBTITLE_STYLE = { fontWeight: '350', fontSize: '16px', padding: '8px', color: '#616161', textAlign: 'center', //maxWidth: '450px', backgroundColor: colors.transparent, }; var PARAGRAPH_STYLE = { fontSize: '14px', fontWeight: '50', color: '#616161', padding: '8px', maxWidth: '500px', backgroundColor: colors.transparent, }; var BUTTON_STYLE = { fontSize: '14px', fontWeight: '100', color: '#616161', padding: '8px', backgroundColor: colors.transparent, }; var SELECT_STYLE = { fontSize: '14px', fontWeight: '50', color: '#616161', padding: '2px',

rừng trên nền tảng GEE

backgroundColor: colors.transparent, width: '150px' }; var LABEL_STYLE = { fontWeight: '50', textAlign: 'center', fontSize: '14px', padding: '2px', backgroundColor: colors.transparent, }; var infoPanel = ui.Panel({ layout: ui.Panel.Layout.flow(), style: { stretch: 'horizontal', height: '100%', width: '450px', backgroundColor: colors.gray } }); var mappingPanel = ui.Map({ center: {'lat': 19.256653155442255, 'lon': 104.80993612578748, 'zoom': 9} }); ui.root.clear(); ui.root.add(ui.SplitPanel(mappingPanel, infoPanel)); var visPanel = ui.Panel({style: {backgroundColor: colors.transparent}}); infoPanel.add(ui.Label('Fire Forest Danger', TITLE_STYLE)); var info_description = 'The application is used for the purpose of predicting the danger of ' +'forest fires in the six districts of Nghe An province'; infoPanel.add(ui.Label(info_description, PARAGRAPH_STYLE)); var algorithmTitle = ui.Label('Choosing a classification algorithm', TITLE_STYLE); var Algorithms_Selector = ui.Select({ items: [ {label: 'Support Vector Machine', value: 'SVM'}, {label: 'Random Forest', value: 'RF'}, {label: 'CART', value: 'CART'}, ], placeholder: 'Support Vector Machine', value: 'SVM', style: SELECT_STYLE }); var treeTextBox = ui.Textbox({ placeholder: '5', onChange: function(text) {

var tree = ee.Number.parse(ee.String(text)); } }); var gammaTextBox = ui.Textbox({ placeholder: '0.001', onChange: function(text) { var gamma = ee.Number.parse(ee.String(text)); } }); var costTextBox = ui.Textbox({ placeholder: '30', onChange: function(text) { var cost = ee.Number.parse(ee.String(text)); } }); var costPanel = ui.Panel({style: {backgroundColor: colors.transparent}}); var cost_label = ui.Label('Cost:', LABEL_STYLE); costPanel.add(cost_label).add(costTextBox); var treePanel = ui.Panel({style: {backgroundColor: colors.transparent}}); var tree_label = ui.Label('Tree:', LABEL_STYLE); treePanel.add(tree_label).add(treeTextBox); var gammaPanel = ui.Panel({style: {backgroundColor: colors.transparent}}); var gamma_label = ui.Label('Gamma:', LABEL_STYLE); gammaPanel.add(gamma_label).add(gammaTextBox); var SVMPanel = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, padding: '4px'}}); SVMPanel.add(gammaPanel).add(costPanel); var RFPanel = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, padding: '4px'}}); RFPanel.add(treePanel); var AlgorithmsParameters = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, padding: '4px'}}); AlgorithmsParameters.add(SVMPanel); Algorithms_Selector.onChange(function(x) { if (x == 'SVM') { AlgorithmsParameters.clear(); AlgorithmsParameters.add(SVMPanel); } else if (x == 'RF') { AlgorithmsParameters.clear(); AlgorithmsParameters.add(RFPanel); } else { AlgorithmsParameters.clear(); AlgorithmsParameters.add(RFPanel);

} }); visPanel.add(algorithmTitle).add(Algorithms_Selector).add(AlgorithmsParameters); infoPanel.add(visPanel); infoPanel.widgets().set(12, ui.Label('Showing results', TITLE_STYLE)); var buttonHold = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, textAlign: 'center', stretch: 'both', padding: '4px'}}); infoPanel.add(buttonHold); var runButton = ui.Button({label: 'Result image', style: {width: '125px', maxWidth: '250px', color: '#616161'}}); var clearButton = ui.Button({label: 'Remove image', style: {width: '125px', maxWidth: '250px', color: '#616161'}}); buttonHold.add(runButton).add(clearButton); * Hàm chạy thuật toán var buildResult = runButton.onClick(function() { * Tạo mẫu var newfc = fire.merge(no_fire); * Thời gian nghiên cứu var start = '2021-11-15'; var end = '2022-02-15'; * Khu vực nghiên cứu var NgheAn = admin.filter(ee.Filter.eq('ADM1_NAME', 'Nghe An')); var NA = NgheAn.geometry(); Map.addLayer(NA, {color: 'silver'}, 'Nghe An'); Map.centerObject(NA, 10); * Tìm dữ liệu ảnh Sentinel-2 và tính NDVI, NDMI var S2 = ee.ImageCollection('COPERNICUS/S2_SR').filterDate(start, end).filter(ee.Filter.lt('CLOUDY_PIXEL_PERCENTAGE', 10)).median(); var img = S2.clip(NA); var NDVI = (img.select('B8').subtract(img.select('B4'))).divide(img.select('B8').add(img.select('B4'))); var NDMI = (img.select('B8').subtract(img.select('B12'))).divide(img.select('B8').add(img.select('B12'))); * Đồng bộ các lớp dữ liệu cùng khu vực nghiên cứu aspect = aspect.updateMask(docao); danso = danso.updateMask(docao); docao = docao.updateMask(docao); gio = gio.updateMask(docao); luongmua = luongmua.updateMask(docao); slope = slope.updateMask(docao); NDMI = NDMI.updateMask(docao); NDVI = NDVI.updateMask(docao); LST = LST.updateMask(docao); danso3 = danso3.updateMask(docao); * Tạo lớp huấn luyện var dataset = ee.Image.cat(aspect, danso, docao, gio, luongmua, slope, NDMI, NDVI, LST); var bands = dataset.bandNames(); * Tạo bộ huấn luyện var training = dataset.select(bands).sampleRegions({

collection: newfc, properties: ['fire'], scale: 10 }); * Nếu huấn luyện bằng SVM cần chuẩn hoá dữ liệu if (Algorithms_Selector.getValue() == 'SVM') { var classifier_alg_SVM = "SVM"; if(classifier_alg_SVM == "SVM"){ var dataset_SVM = dataset; var minMax = dataset_SVM.reduceRegion({ reducer: ee.Reducer.minMax(), geometry: dataset_SVM.geometry(), scale: 10, maxPixels: 10e9, tileScale: 4, bestEffort: true }); dataset_SVM = ee.ImageCollection.fromImages( dataset_SVM.bandNames().map(function(name){ name = ee.String(name); var band = dataset_SVM.select(name); return band.unitScale(ee.Number(minMax.get(name.cat('_min'))), ee.Number(minMax.get(name.cat('_max')))); })).toBands().rename(dataset_SVM.bandNames()); var training_SVM = dataset_SVM.select(bands).sampleRegions({ collection: newfc, properties: ['fire'], scale: 10 }); if (classifier_alg_SVM == "SVM") { * Lấy dữ liệu nhập từ bàn phím var parameter_gamma_SVM = gammaTextBox.getValue(); var parameter_cost_SVM = costTextBox.getValue(); var classifier = ee.Classifier.libsvm({ kernelType: 'RBF', gamma: 0.001, cost: ee.Number.parse(parameter_cost_SVM) }); * Huấn luyện và kiểm tra var classifier_SVM = classifier.setOutputMode('PROBABILITY').train(training_SVM, 'fire', bands); var classified_SVM = dataset_SVM.select(bands).classify(classifier_SVM); classified_SVM = classified_SVM.unitScale(ee.Number(0), ee.Number(1)); var classified = classified_SVM; * Hiển thị kết quả theo các lớp var random1 = classified.lt(0.1); var class1 = classified.updateMask(random1); mappingPanel.addLayer(class1,{'palette':'14790b'},'Level 5');

var random2 = classified.gte(0.1).and(classified.lt(0.25)); var class2 = classified.updateMask(random2); mappingPanel.addLayer(class2,{'palette':'57d646'},'Level 4'); var random3 = classified.gte(0.25).and(classified.lt(0.4)); var class3 = classified.updateMask(random3); mappingPanel.addLayer(class3,{'palette':'f6f810'},'Level 3'); var random4 = classified.gte(0.4).and(classified.lt(0.6)); var class4 = classified.updateMask(random4); mappingPanel.addLayer(class4,{'palette':'ffa90e'},'Level 2'); var random5 = classified.gte(0.6); var class5 = classified.updateMask(random5); mappingPanel.addLayer(class5,{'palette':'ef3600'},'Level 1'); } } } * Huấn luyện bằng thuật toán RF else if (Algorithms_Selector.getValue() == 'RF'){ var classifier_alg_RF = "RF"; if(classifier_alg_RF =="RF"){ * Lấy dữ liệu nhập từ bàn phím var parameter_tree_RF = treeTextBox.getValue(); * Tạo bộ huấn luyện và huấn luyện, lấy số cây theo dữ liệu nhập var classifier_RF = ee.Classifier.smileRandomForest(ee.Number.parse(parameter_tree_RF)).setOutputMode('PR OBABILITY').train({ features: training, classProperty: 'fire', inputProperties: bands }); * Tạo kết quả phân loại var classified_RF = dataset.select(bands).classify(classifier_RF); * Hiển thị kết quả theo các lớp var random_RF1 = classified_RF.lt(0.4); var class_RF1 = classified_RF.updateMask(random_RF1); mappingPanel.addLayer(class_RF1,{'palette':'14790b'},'Level 5'); var random_RF2 = classified_RF.gte(0.4).and(classified_RF.lt(0.6)); var class_RF2 = classified_RF.updateMask(random_RF2); mappingPanel.addLayer(class_RF2,{'palette':'57d646'},'Level 4'); var random_RF3 = classified_RF.gte(0.6).and(classified_RF.lt(0.75)); var class_RF3 = classified_RF.updateMask(random_RF3); mappingPanel.addLayer(class_RF3,{'palette':'f6f810'},'Level 3'); var random_RF4 = classified_RF.gte(0.75).and(classified_RF.lt(0.9)); var class_RF4 = classified_RF.updateMask(random_RF4); mappingPanel.addLayer(class_RF4,{'palette':'ffa90e'},'Level 2'); var random_RF5 = classified_RF.gte(0.9); var class_RF5 = classified_RF.updateMask(random_RF5); mappingPanel.addLayer(class_RF5,{'palette':'ef3600'},'Level 1'); } }

* Huấn luyện bằng thuật toán CART else { * Lấy dữ liệu nhập từ bàn phím var parameter_tree_cart = treeTextBox.getValue(); * Tạo bộ huấn luyện và huấn luyện, lấy số cây theo dữ liệu nhập var classifier_cart = ee.Classifier.smileCart(ee.Number.parse(parameter_tree_cart)).setOutputMode('PROBABILI TY').train({ features: training, classProperty: 'fire', inputProperties: bands }); * Tạo kết quả phân loại var classified_cart = dataset.select(bands).classify(classifier_cart); * Hiển thị kết quả theo các lớp var random_cart1 = classified_cart.lt(0.4); var class_cart1 = classified_cart.updateMask(random_cart1); mappingPanel.addLayer(class_cart1,{'palette':'14790b'},'Level 5'); var random_cart2 = classified_cart.gte(0.4).and(classified_cart.lt(0.6)); var class_cart2 = classified_cart.updateMask(random_cart2); mappingPanel.addLayer(class_cart2,{'palette':'57d646'},'Level 4'); var random_cart3 = classified_cart.gte(0.6).and(classified_cart.lt(0.75)); var class_cart3 = classified_cart.updateMask(random_cart3); mappingPanel.addLayer(class_cart3,{'palette':'f6f810'},'Level 3'); var random_cart4 = classified_cart.gte(0.75).and(classified_cart.lt(0.9)); var class_cart4 = classified_cart.updateMask(random_cart4); mappingPanel.addLayer(class_cart4,{'palette':'ffa90e'},'Level 2'); var random_cart5 = classified_cart.gte(0.9); var class_cart5 = classified_cart.updateMask(random_cart5); mappingPanel.addLayer(class_cart5,{'palette':'ef3600'},'Level 1'); } }); * Chức năng xoá lớp dữ liệu var clearMap = clearButton.onClick(function() { var layers = mappingPanel.layers(); layers.forEach(function(x) { mappingPanel.remove(x); }); });