BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
ĐOÀN THỊ NAM PHƯƠNG
LỰA CHỌN MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG
TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ
LUẬN ÁN TIẾN SĨ KỸ THUẬT
HÀ NỘI - 2023
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
ĐOÀN THỊ NAM PHƯƠNG
LỰA CHỌN MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG
TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ
Ngành: Kỹ thuật Trắc địa – Bản đồ
Mã số: 9520503
LUẬN ÁN TIẾN SĨ KỸ THUẬT
TIỂU BAN HƯỚNG DẪN
1.PGS. TS. NGUYỄN VĂN TRUNG
2. GS.TS. BÙI TIẾN DIỆU
HÀ NỘI - 2023
i
LỜI CAM ĐOAN
Tôi xin cam đoan luận án này là công trình nghiên cứu khoa học của riêng
tôi. Các số liệu trình bày trong luận án được phản ánh hoàn toàn trung thực.
Các kết quả nghiên cứu trong luận án chưa có ai công bố trong bất kỳ công
trình nghiên cứu nào.
Tác giả luận án
Đoàn Thị Nam Phương
ii
LỜI CẢM ƠN
Em xin chân thành cảm ơn Ban Giám hiệu, phòng đào tạo Sau đại học,
trường Đại học Mỏ - Địa chất đã tạo mọi điều kiện cho NCS trong quá trình
học tập và hoàn thành Luận án này.
Em xin gửi lời tri ân tới Quý Thầy, Quý Cô bộ môn Đo ảnh và viễn thám,
khoa Trắc địa - Bản đồ và Quản lý đất đai đã tận tình giảng dạy, chỉ bảo, góp ý
để em hoàn thiện Luận án tốt nhất.
Em xin bày tỏ lòng biết ơn sâu sắc đến Tiểu ban hướng dẫn khoa học,
Thầy PGS.TS Nguyễn Văn Trung và Thầy GS.TS Bùi Tiến Diệu đã tận tình
giúp đỡ, chỉ bảo em trong suốt quá trình thực hiện Luận án.
Em xin gửi lời cảm ơn chân thành tới các Nhà khoa học công tác tại các
cơ quan, viện nghiên cứu đã nhiệt tình giúp đỡ, hỗ trợ để em hoàn thành luận
án.
Xin gửi lời cảm ơn tới tất cả bạn bè, đồng nghiệp và gia đình những người
luôn ủng hộ, động viên và tạo mọi điều kiện tốt nhất để em hoàn thành luận án.
Do hạn chế về kiến thức, kinh nghiệm trong nghiên cứu khoa học nên
Luận án chắc chắn còn nhiều thiếu sót. Em rất mong sẽ nhận được nhiều ý kiến
góp ý và chỉ bảo của các Nhà khoa học để em dần nâng cao trình độ chuyên
môn hơn nữa.
Em xin chân thành cảm ơn!
iii
MỤC LỤC LỜI CAM ĐOAN ............................................................................................. i
LỜI CẢM ƠN .................................................................................................. ii
MỤC LỤC ....................................................................................................... iii
DANH MỤC CHỮ VIẾT TẮT ..................................................................... vi
DANH MỤC BẢNG BIỂU .......................................................................... viii
DANH MỤC HÌNH VẼ ................................................................................. ix
MỞ ĐẦU .......................................................................................................... 1
1. Tính cấp thiết của đề tài ............................................................................. 1
2. Mục tiêu nghiên cứu .................................................................................. 4
3. Nội dung nghiên cứu ................................................................................. 4
4. Đối tượng và phạm vi nghiên cứu ............................................................. 5
5. Phương pháp nghiên cứu ........................................................................... 5
6. Luận điểm bảo vệ ....................................................................................... 6
7. Những điểm mới của luận án ..................................................................... 6
8. Ý nghĩa khoa học và thực tiễn của luận án ................................................ 6
9. Cơ sở tài liệu thực hiện luận án ................................................................. 6
10. Cấu trúc luận án ....................................................................................... 7
CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU ......................... 8
1.1 Đặc điểm về tài nguyên rừng ở Việt Nam ............................................... 8
1.2 Hiện trạng cháy rừng ở Việt Nam ......................................................... 13
1.2.1 Khái niệm cơ bản về cháy rừng .......................................................... 13
1.2.2 Quy định về cấp dự báo cháy rừng ..................................................... 14
1.3 Nguyên nhân gây cháy rừng ở Việt Nam ............................................. 17
1.4 Các phương pháp dự báo nguy cơ cháy rừng ........................................ 18
1.5 Tổng quan tình hình nghiên cứu trong và ngoài nước .......................... 29
1.5.1 Trên thế giới .................................................................................... 29
iv
1.5.2 Trong nước ...................................................................................... 36
1.6 Luận giải những vấn đề cần nghiên cứu ................................................ 44
1.7 Tiểu kết chương 1 .................................................................................. 46
CHƯƠNG 2. CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH DỰ BÁO
NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG
TIN ĐỊA LÝ ................................................................................................... 48
2.1 Đặc điểm khu vực nghiên cứu ............................................................... 48
2.2 Tổng quan chung về dữ liệu phục vụ xây dựng mô hình dự báo nguy cơ
cháy rừng ..................................................................................................... 53
2.3 Các lớp thông tin thành phần và phương pháp xây dựng cơ sở dữ liệu
thành phần .................................................................................................... 54
2.3 Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa lý .............. 61
2.4 Nhóm các lớp thông tin khác ................................................................. 68
2.5 Phương pháp xử lý dữ liệu trên nền tảng Google Earth Engine ............ 70
2.6 Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn
thám và hệ thông tin địa lý .......................................................................... 72
2.6.1 Phương pháp phân tích thứ bậc AHP ................................................. 72
2.6.2 Phương pháp sử dụng thuật toán Rừng ngẫu nhiên ............................ 75
2.6.3 Phương pháp sử dụng thuật toán Máy hỗ trợ vector .......................... 77
2.6.4 Phương pháp sử dụng thuật toán cây phân loại và hồi quy ................ 79
2.6.5 Sơ đồ mô hình dự báo nguy cơ cháy rừng .......................................... 81
2.7 Tiểu kết chương 2 .................................................................................. 85
CHƯƠNG 3. THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY RỪNG KHU
VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ
THÔNG TIN ĐỊA LÝ ................................................................................... 87
3.1 Đặc điểm dữ liệu sử dụng ...................................................................... 87
3.1.1 Dữ liệu viễn thám ............................................................................ 87
v
3.1.2 Dữ liệu GIS ..................................................................................... 89
3.2 Kết quả xây dựng các lớp thông tin chuyên đề ..................................... 90
3.3 Kết quả xây dựng bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn thám
và GIS ........................................................................................................ 100
3.3.1 Kết quả dự báo nguy cơ cháy rừng bằng kỹ thuật AHP ............... 100
3.3.2 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán Random Forest103
3.3.3 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM ............ 106
3.3.4 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART .......... 107
3.4 Đánh giá độ chính xác và lựa chọn mô hình dự báo nguy cơ cháy rừng
.................................................................................................................... 109
3.5 Xây dựng công cụ xử lý dữ liệu viễn thám và GIS trên nền tảng GEE115
3.6 Tiểu kết chương 3 ................................................................................ 117
KẾT LUẬN VÀ KIẾN NGHỊ .................................................................... 119
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ ............... 122
TÀI LIỆU THAM KHẢO .......................................................................... 123
PHỤ LỤC………………………………………………………………….134
vi
DANH MỤC CHỮ VIẾT TẮT
Tên đầy đủ tiếng anh Tên đầy đủ tiếng việt
Tên viết tắt AB AdaBoost
AHP The Analytic Hierarchy Process
AUC AUC BĐĐH CA Phương pháp phân tích thứ bậc Đường cong AUC Bản đồ địa hình
CART Cây Phân loại và hồi quy Area Under the ROC Curve Under the Curve Topographic Map Cellular Automata Classification and Regression Trees
CMCN Cách mạng công nghệ Technological Revolution
CSDL Cơ sở dữ liệu
DEM
EFFIS Mô hình số độ cao Hệ thống thông tin cháy rừng châu Âu
for Environment ENVI Phần mềm xử lý ảnh ENVI
ETM+ Bộ cảm biến ETM+
Agriculture and FAO
FRI GB Database Digital Elevation Model The European Forest Fire Information System The Visualizing Images Enhanced Thematic Mapper Plus Food Organization Fire risk index Gradient Bo boost
GEE Google Earth Engine Tổ chức lương thực và nông nghiệp Liên hiệp quốc Chỉ số rủi ro cháy Nền tảng điện toán đám mây
Information GIS Hệ thông tin địa lý
GPS Hệ định vị toàn cầu
Weighted GWR Hồi quy trọng số địa lý
IDL Geographical System Global Position Systems Geographically Regression Interactive Data Language Ngôn ngữ lập trình IDL
vii
IPNAS
LDA LST LR LSWI MIR MSI Hệ thống giám sát cháy rừng tích hợp Nhiệt độ bề mặt Hồi quy logistic Chỉ số nước mặt Hồng ngoại trung Thiết bị quét đa phổ
Difference NDDI Chỉ số hạn khác biệt
Difference NDVI Chỉ số khác biệt thực vật
NDWI Chỉ số khác biệt nước
NIR Cận hồng ngoại
Multi- NMDI Chỉ số hạn NMDI
OLI Bộ cảm biến OLI
Operating ROC Đường cong ROC
RF SMI SVM SWIR TIR TM Rừng ngẫu nhiên Chỉ số độ ẩm đất Máy hỗ trợ vector Hồng ngoại sóng ngắn Hồng ngoại nhiệt Bộ cảm biến TM
TVWI Chỉ số ẩm nhiệt độ-thực vật
Vegetation TVDI Chỉ số hạn nhiệt độ thực vật
XGB Integral Forest Fire Monitoring System Linear Discriminant Analysis Land surface temperature Logistic Regression Land Surface Water Index Middle Infrared MultiScanner Instrument Normalized Drought Index Normalized Vegetation Index Normalized Difference Water Index Near Infrared Normalized band Drought Index Operational Land Image Receiver Characteristic Random Forest Soil Moisture Index Support Vector Machine Shortware Infrared Thermal Infrared Thematic Mapper Temperature-vegetation wetness index Temperature Dryness Index eXtreme Gradient Bo boost
viii
DANH MỤC BẢNG BIỂU
Tên bảng Trang Bảng
Diện tích và độ che phủ rừng các tỉnh, thành phố trực thuộc Bảng 1.1 10 trung ương tính đến 31/12/2020
Phân cấp dự báo cháy rừng (theo Nghị định 156/2018/NĐ- Bảng 1.2 15 CP)
Bảng tra cấp dự báo cháy rừng theo chỉ số P (Shetinsky, Bảng 1.3 19 1994)
Bảng 1.4 Bảng tra cấp dự báo cháy rừng theo Bộ NN&PTNT (2000) 20
Bảng phân cấp dự báo cháy rừng có điều chỉnh (Nguyễn Bảng 1.5 21 Phương Văn và cộng sự, 2019)
Cấp dự báo khả năng cháy rừng ở vườn quốc gia U Minh Hạ Bảng 1.6 22 theo chỉ số Pt (Trần Văn Hùng và cộng sự, 2010)
Bảng 2.1 Đặc điểm ảnh hồng ngoại nhiệt Landsat 60
62 Bảng 2.2 Giá trị K1, K2 đối với ảnh hồng ngoại nhiệt LANDSAT
Bảng 2.3 Thang điểm so sánh mức độ quan trọng của các chỉ tiêu 75
Bảng tra giá trị RI theo số lượng chỉ tiêu khác nhau (Saaty, Bảng 2.4 76 2000; Saaty, 2008)
Ma trận so sánh cặp của các yếu tố ảnh hưởng đến nguy cơ Bảng 3.1 103 cháy rừng
Bảng 3.2 Kết quả chuẩn hóa ma trận so sánh cặp 103
So sánh kết quả dự báo nguy cơ cháy rừng giữa các phương Bảng 3.3 111 án
Bảng 3.4 Giá trị AUC của các mô hình học máy 115
Bảng 3.5 Diện tích các khu vực với nguy cơ cháy rừng khác nhau 115
ix
DANH MỤC HÌNH VẼ
Hình Trang
Hình 1.1 10
Tên hình Tỉ lệ che phủ rừng ở Việt Nam giai đoạn 2008 - 2020 – nguồn: http://inforgraphics.vn Hình 1.2 Biển báo cấp dự báo cháy rừng 14
Hình 1.3 25
Hình 1.4 26
Hình 1.5 27
Hình 1.6 28
Hình 1.7 29
Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên tổ hợp màu ảnh Landsat 8, sử dụng các kênh NIR và MIR (nguồn: https://digital-geography.com/) Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên kênh hồng ngoại nhiệt (kênh 10) ảnh Landsat 8 (nguồn: https://digital-geography.com/) Cháy rừng ở California nhìn từ ảnh vệ tinh quang học Sentinel 2 (nguồn: https://wildfiretoday.com/) Hình ảnh cháy rừng U Minh Hạ năm 2002 từ ảnh vệ tinh MODIS Lớp thông tin khoảng cách từ đất nông nghiệp đến rừng trong mô hình dự báo nguy cơ cháy rừng (Hoang et al., 2020)
Hình 1.8 Hệ thống thông tin cháy rừng châu Âu (EFFIS) 31
Hình 1.9 32
Hình 1.10 34
Hình 1.11 39
Hình 1.12 40
Hình 1.13 43
Hình 1.14 44
Hệ thống thông tin giám sát môi trường phục vụ cảnh báo cháy rừng của Croatia (IPNAS) Giao diện mô hình nghiên cứu cháy rừng của Yassemi và cộng sự (2008) Phân loại nguy cơ cháy rừng trên cơ sở phương pháp phân loại cây quyết định (Doãn Hà Phong, 2007) Hệ thống theo dõi cháy rừng FireWatch Việt Nam (nguồn: geoviet.vn) Thuật toán trích xuất điểm dị thường nhiệt từ dữ liệu viễn thám phục vụ phát hiện sớm cháy rừng (Lê Ngọc Hoàn, Trần Quang Bảo, 2018) Giao diện WebGIS cảnh báo nguy cơ cháy rừng tại huyện Thuận Châu, tỉnh Sơn La (Đặng Ngô Bảo Toàn, 2021)
Hình 2.1 Vị trí địa lý tỉnh Nghệ An 49
Hình 2.2 59
Hình 2.3 65 Ví dụ về phân cấp nguy cơ cháy rừng từ chỉ số NMDI (Avetisyan và Nedkov, 2015) Ví dụ về mô hình số độ cao Aster GDEM (nguồn https://lpdaac.usgs.gov/)
x
(nguồn
Hình 2.4 66
Hình 2.5 và (a) (b) SRTM 67
Hình 2.6 68
Hình 2.7 69
Hình 2.8 70
Hình 2.9 71
trong GEE
(nguồn:
Hình 2.10 72
Mô hình DEM SRTM khu vực Nghệ An https://lpdaac.usgs.gov/) So sánh dữ liệu mô hình số độ cao JAXA’s Global ALOS 3D World (nguồn: https://www.satpalda.com/alos-world-3d) So sánh dữ liệu mô hình số độ cao GMTED 2010 và GTOPO30 (Danielson và Gesch, 2011) Ví dụ về kết quả xác định hướng dốc từ DEM (Mokarram và Zarei, 2018) Ví dụ về xác định độ dốc từ DEM (James và Thallak, 2015) Thông tin về tốc độ gió khu vực vườn quốc gia Tam Đảo trích xuất từ CSDL WorldClim (Pham Duc Dat và Le Thai Son, 2022) Thông tin về mật độ dân số toàn cầu năm 2020 trích xuất từ CSDL WorldPop (https://data.worldpop.org/) Giao diện Code Editor https://geohackweek.github.io/ Minh họa về bộ mã lệnh API trong GEE
Hình 2.11 73
(nguồn: https://serc.carleton.edu/)
Hình 2.12 74
Hình 2.13 78 Sơ đồ thuật toán RF trong phân loại (chỉnh sửa từ nguồn: https://www.section.io/)
80 81
Hình 2.16 82
Hình 2.17 85 Hình 2.14 Mô tả các vector hỗ trợ trong thuật toán SVM Hình 2.15 Thuật toán SVM với giá trị tham số C khác nhau (Liu, 2020) Mô tả thuật toán Cây Phân loại và hồi quy CART (nguồn: https://www.javatpoint.com/ Sơ đồ quy trình công nghệ lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS
Hình 3.1 Dữ liệu ảnh Sentinel 2 MSI khu vực nghiên cứu 90
Hình 3.2 91
Hình 3.3 92
Hình 3.4 93
Dữ liệu ảnh Landsat 8 khu vực nghiên cứu, tổ hợp màu tự nhiên Dữ liệu mô hình số độ cao DEM SRTM khu vực nghiên cứu Chỉ số thực vật NDVI xác định từ ảnh vệ tinh Sentinel 2 MSI Độ bốc thoát hơi nước bề mặt khu vực nghiên cứu thu
thập từ CSDL GEE trên cơ sở ảnh vệ tinh MODIS Hình 3.5 94
xi
Hình 3.6 95
Hình 3.7 95 Kết quả xác định nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8 Kết quả phân cấp nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8
Hình 3.8 Lớp thông tin độ cao khu vực nghiên cứu Hình 3.9 Lớp thông tin độ dốc khu vực nghiên cứu Hình 3.10 Lớp thông tin hướng sườn khu vực nghiên cứu Hình 3.11 Kết quả xây dựng lớp thông tin về mật độ dân cư Hình 3.12 Lớp thông tin mật độ dân cư sau khi được phân lớp 96 97 97 98 99
Hình 3.13 100
Hình 3.14 101 Kết quả xây dựng lớp thông tin lượng mưa trung bình tháng Kết quả xây dựng lớp thông tin tốc độ gió trung bình khu vực nghiên cứu
Hình 3.15 Kết quả phân vùng tốc độ gió khu vực nghiên cứu 101
Hình 3.16 104 Kết quả dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng kỹ thuật phân tích thứ bậc (AHP)
106
Hình 3.18 106
Hình 3.19 107
Hình 3.20 108
Hình 3.21 108
Hình 3.22 110
Hình 3.23 110
Hình 3.24 115
Hình 3.25 117
Hình 3.26 118 Hình 3.17 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF 3 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF 100 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF 200 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 25 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 30 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 5 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 30 Ví dụ kết quả xác định đường cong ROC đối với một số phương án xây dựng mô hình dự báo nguy cơ cháy rừng Công cụ xử lý dữ liệu cho mô hình dự báo nguy cơ cháy rừng trên nền tảng GEE Công cụ tổ hợp màu ảnh viễn thám trong module phần mềm
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Rừng là một nguồn tài nguyên thiên nhiên quan trọng, đóng vai trò to lớn
trong phát triển kinh tế - xã hội cũng như bảo vệ môi trường. Mặc dù vậy, trong
những năm gần đây, cùng với sự bùng nổ dân số và quá trình đô thị hóa, công
nghiệp hóa, diện tích rừng biến động một cách nhanh chóng cùng với sự suy
giảm của chất lượng rừng. Ngoài các tác động của con người, biến đổi khí hậu
và các hiện tượng thời tiết cực đoan xảy ra nhiều trong những năm gần đây
cũng ảnh hưởng sâu sắc đến thảm phủ rừng và hệ sinh thái rừng. Nhiệt độ tăng
cao và hạn hán khắc nghiệt, kéo dài cũng làm gia tăng nguy cơ cháy rừng. Dưới
tác động của biến đổi khí hậu, các kiểu hệ sinh thái rừng cũng chịu những ảnh
hưởng khác nhau như thay đổi ranh giới; chỉ số tăng trưởng sinh khối giảm;
tăng nguy cơ cháy rừng và tăng mức độ và tần suất của các đợt dịch và sâu bệnh
hại cây rừng.
Cháy rừng là một thảm họa đe dọa đến tính mạng con người, cơ sở hạ
tầng và môi trường. Biến đổi khí hậu đã gây ra các hiện tượng như lượng mưa
ít đi, nhiệt độ tăng lên, mùa khô dài hơn là các nguyên nhân gây ra cháy rừng.
Ngoài ra, ở nhiều nơi trên thế giới các hoạt động của con người cũng làm cho
tần suất cháy rừng tăng lên đến mức báo động. Việc dự báo nguy cơ cháy rừng
là một vấn đề có tính cấp thiết, cung cấp nguồn thông tin kịp thời phục vụ công
tác bảo vệ và phát triển tài nguyên rừng, hỗ trợ chính quyền địa phương trong
quản lý và quy hoạch rừng, phân bổ nguồn lực, xử lý tình huống khẩn cấp và
cảnh báo sớm cháy rừng.
Theo Cục Kiểm lâm, Bộ Nông nghiệp và Phát triển Nông thôn, hàng năm
vào mùa hè, Nghệ An là một trong những tỉnh đứng đầu trên toàn quốc về nguy
cơ cháy rừng ở cấp V, cấp cực kỳ nguy hiểm. Toàn tỉnh Nghệ An có gần
2
942.508 ha rừng, tập trung chủ yếu ở các huyện miền núi: Kỳ Sơn, Tương
Dương, Con Cuông, Quế Phong, Quỳ Châu, Quỳ Hợp, Tân Kỳ và Nghĩa Đàn
thường hay xảy ra cháy rừng. Cụ thể, theo số liệu thống kê các vụ cháy rừng ở
Nghệ An cho thấy năm 1998, toàn tỉnh có 105 vụ cháy rừng với diện tích thiệt
hại 564 ha và 7 tháng đầu năm 2010, toàn tỉnh đã xảy ra 33 vụ cháy với diện
tích rừng bị cháy trên 150 ha, trong đó hơn 62 ha rừng thông, có vụ cháy gây
ra chết người. Kể từ năm 2010 trở lại đây, số điểm cháy tăng nhanh ở khu vực
miền núi phía Tây tỉnh Nghệ An, bao gồm 3 huyện: Kỳ Anh, Tương Dương và
Quế Phong. Ngoài nguyên nhân khách quan do thời tiết khắc nghiệt, nắng nóng
kéo dài, hạn nặng ở nhiều khu vực, thảm thực bì dày đậm, dễ bắt cháy, ... còn
có nguyên nhân chủ quan như người dân đốt rẫy cháy lan vào rừng, một số du
khách hoặc người dân bất cẩn khi dùng lửa trong rừng, ... Mùa cháy rừng ở
Nghệ An thường kéo dài trong 10 tháng, bắt đầu từ tháng 11 năm trước đến
tháng 8 năm sau. Sở dĩ, Nghệ An có mùa cháy rừng kéo dài hơn so với cả nước
là vì tỉnh Nghệ An có vị trí địa lý và địa hình đặc biệt. Nghệ An có khí hậu biến
đổi và phân hóa rõ rệt, vừa phân theo vĩ độ, vừa phân theo vành đai cao, chịu
ảnh hưởng của 3 loại gió mùa chính là gió mùa Đông Bắc, gió mùa Đông Nam
và gió mùa Tây Nam (gió phơn, gió Lào).
Theo dự báo của Trung tâm Khí tượng thủy văn Trung ương và Cục
Kiểm lâm, mùa khô những năm gần đây, tình hình thời tiết sẽ có nhiều diễn
biến phức tạp, nhiệt độ mặt nước biển ấm dần lên, nền nhiệt độ tiếp tục có xu
hướng cao hơn trung bình nhiều năm, dự báo tổng lượng mưa sẽ giảm và thiếu
hụt từ 10-20% so với trung bình nhiều năm, do đó, nguy cơ cháy rừng tại Việt
Nam nói chung, tỉnh Nghệ An nói riêng có khả năng tăng cao. Do vậy, nghiên
cứu, phân tích, lựa chọn và đề xuất các mô hình dự báo nguy cơ cháy rừng là
một nhiệm vụ rất quan trọng, có tính cấp bách trong điều kiện hiện nay.
3
Công nghệ địa không gian, trong đó chủ đạo là công nghệ viễn thám và
hệ thông tin địa lý (GIS) đã được sử dụng rộng rãi và hiệu quả trong xây dựng
các mô hình dự báo nguy cơ cháy rừng trên thế giới. Viễn thám và GIS cho
phép thu thập dữ liệu về thảm phủ rừng và sử dụng chúng để phân tích, quản
lý, mô hình hóa nhằm cảnh báo sớm nguy cơ xảy ra cháy rừng. Ngoài các ảnh
vệ tinh thương mại, nhiều hệ thống viễn thám hiện nay đã và đang cung cấp dữ
liệu ảnh viễn thám hoàn toàn miễn phí với độ phân giải không gian đa dạng.
Do được cập nhật liên tục, nguồn dữ liệu viễn thám miễn phí này đã trở thành
công cụ hết sức hiệu quả trong nghiên cứu, giám sát tài nguyên rừng. Có thể kể
đến các ảnh vệ tinh như Landsat (độ phân giải không gian 30m, chu kỳ cập nhật
16 ngày), bao gồm các vệ tinh từ Landsat 1 đến Landsat 9 với nguồn dữ liệu
được lưu trữ từ những năm cuối thập kỷ 70 đến nay. Landsat 8 và Landsat 9
cách nhau 08 ngày. Gần đây, hệ thống vệ tinh Sentinel của Cơ quan Hàng không
vũ trụ châu Âu (ESA) với nhiều thế hệ vệ tinh khác nhau, từ các vệ tinh radar
(Sentinel 1) đến quang học (Sentinel 2, 3...) cung cấp ảnh viễn thám ở độ phân
giải không gian cao hơn (lên đến 10m), thời gian cập nhật ngắn (5 ngày). Ngoài
ra, có thể kể đến một số loại dữ liệu viễn thám miễn phí khác như ảnh MODIS,
ảnh Aster...Có thể khẳng định, các nguồn dữ liệu địa không gian hiện nay hết
sức đa dạng và dễ dàng tiếp cận, việc khai thác ứng dụng các nguồn dữ liệu này
kết hợp các kỹ thuật học máy phục vụ xây dựng mô hình dự báo nguy cơ cháy
rừng ở các địa phương là hoàn toàn khả thi. Thực tế cho thấy, đã có nhiều mô
hình dự báo nguy cơ cháy rừng sử dụng dữ liệu viễn thám và hệ thông tin địa
lý như mô hình dựa trên kỹ thuật phân tích thứ bậc AHP, mô hình dựa trên thuật
toán Random Forest (RF), mô hình dựa trên thuật toán máy vector hỗ trợ (SVM
– support vector machine), mô hình dựa trên mạng neural nhân tạo…
Các mô hình dự báo nguy cơ cháy rừng đều có những ưu, nhược điểm riêng
và việc lựa chọn mô hình phù hợp với điều kiện tự nhiên, xã hội, dữ liệu ở từng
4
khu vực cụ thể là một vấn đề có tính thực tiễn cao. Với những lý do trên, luận án
“Lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và hệ
thông tin địa lý” được lựa chọn xuất phát từ nhu cầu thực tế, có ý nghĩa khoa
học và thể hiện sự cần thiết phải nghiên cứu. Những kết quả đạt được trong luận
án cũng góp phần chứng minh tính hiệu quả của việc kết hợp dữ liệu viễn thám,
GIS và các kỹ thuật học máy trong xây dựng các mô hình dự báo nguy cơ cháy
rừng.
2. Mục tiêu nghiên cứu
- Lựa chọn được mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và
hệ thông tin địa lý cho khu vực phía tây tỉnh Nghệ An.
3. Nội dung nghiên cứu
Để đạt được mục tiêu trên, trong luận án tiến hành nghiên cứu các nội
dung sau:
Tổng quan về vấn đề nghiên cứu: tài nguyên rừng ở Việt Nam và tỉnh
Nghệ An, hiện trạng nguy cơ cháy rừng, các phương pháp dự báo nguy
cơ cháy rừng, tổng quan tình hình nghiên cứu trong và ngoài nước;
Cơ sở khoa học xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu
viễn thám và hệ thông tin địa lý;
Thu thập, tiền xử lý và chiết tách các lớp thông tin chuyên đề từ dữ liệu
viễn thám và hệ thông tin địa lý;
Nghiên cứu đề xuất qui trình xây dựng bản đồ dự báo nguy cơ cháy rừng
từ dữ liệu viễn thám và hệ thông tin địa lý trên cơ sở các kỹ thuật như
AHP, Rừng ngẫu nhiên (RF), Máy hỗ trợ vector (SVM), Cây phân loại
và hồi quy (CART);
Đánh giá và lựa chọn mô hình phù hợp với điều kiện cụ thể khu vực phía
tây tỉnh Nghệ An;
Phân tích kết quả.
5
- Đối tượng nghiên cứu trong luận án là các mô hình dự báo nguy cơ cháy
4. Đối tượng và phạm vi nghiên cứu
rừng trên cơ sở kết hợp dữ liệu viễn thám, hệ thông tin địa lý và các kỹ thuật
học máy.
- Phạm vi khoa học của luận án tập trung vào phân tích, đánh giá, thử
nghiệm nhằm lựa chọn mô hình dự báo nguy cơ cháy rừng phù hợp với điều
kiện cụ thể khu vực nghiên cứu.
- Phạm vi không gian của luận án là khu vực phía tây tỉnh Nghệ An.
5. Phương pháp nghiên cứu
Phương pháp phân tích, tổng hợp: Tổng hợp, phân tích và đánh giá
các nghiên cứu trong và ngoài nước liên quan đến ứng dụng viễn thám và hệ
thông tin địa lý trong xây dựng mô hình dự báo nguy cơ cháy rừng.
Phương pháp viễn thám: Xử lý dữ liệu ảnh viễn thám quang học
Landsat, Sentinel 2, sử dụng ngôn ngữ lập trình Java trên nền tảng điện toán
đám mây Google Earth Engine nhằm thu thập, tiền xử lý, xử lý dữ liệu, chiết
tách các lớp dữ liệu chuyên đề (nhiệt độ, lớp phủ...) phục vụ xây dựng mô hình
dự báo nguy cơ cháy rừng; Xây dựng công cụ xử lý dữ liệu viễn thám và GIS
trên nền tảng GEE phục vụ xây dựng mô hình
Phương pháp GIS: sử dụng trong xây dựng các lớp dữ liệu chuyên đề
và thành lập bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An;
Phương pháp học máy, phương pháp mô hình hóa: các mô hình học
máy (RF, SVM, CART) được sử dụng để chạy mô hình dự báo nguy cơ cháy
rừng.
Phương pháp thống kê: Sử dụng phương pháp thống kê để đánh giá độ
chính xác của các mô hình dự báo nguy cơ cháy rừng.
Kỹ thuật lập trình: sử dụng để xây dựng công cụ xử lý dữ liệu viễn
thám và GIS trên nền tảng Google Earth Engine.
6
6. Luận điểm bảo vệ
Luận điểm 1: 09 lớp thông tin đầu vào chiết xuất từ dữ liệu viễn thám
và GIS (mật độ dân cư, lớp phủ thực vật, độ bốc thoát hơi nước bề mặt, hướng
sườn, độ dốc, tốc độ gió, độ cao, nhiệt độ bề mặt và lượng mưa trung bình
tháng) cho phép xây dựng mô hình dự báo nguy cơ cháy rừng phù hợp với điều
kiện khu vực nghiên cứu ở phía Tây tỉnh Nghệ An.
Luận điểm 2: Sử dụng kỹ thuật học máy (thuật toán Random Forest)
giúp dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS với độ chính xác
cao nhất đối với z khu vực nghiên cứu.
7. Những điểm mới của luận án
Lựa chọn được 9 lớp thông tin đầu vào cho mô hình dự báo nguy cơ cháy
rừng khu vực phía tây tỉnh Nghệ An từ dữ liệu viễn thám và GIS phù hợp
với điều kiện khu vực nghiên cứu.
Lựa chọn được mô hình dự báo nguy cơ cháy rừng khu vực phía tây tỉnh
Nghệ An bằng dữ liệu viễn thám và GIS trên cơ sở thuật toán Random
Forest.
8. Ý nghĩa khoa học và thực tiễn của luận án
a) Ý nghĩa khoa học: góp phần hoàn thiện cơ sở khoa học và minh chứng
tính hiệu quả của phương pháp ứng dụng dữ liệu viễn thám, GIS và các kỹ thuật
trí tuệ nhân tạo (học máy) trong xây dựng mô hình dự báo nguy cơ cháy rừng.
b) Ý nghĩa thực tiễn: Cung cấp thông tin và công cụ xử lý dữ liệu viễn
thám, GIS trên nền tảng Google Earth Engine để các nhà quản lý đưa ra các
biện pháp trong giám sát và cảnh báo sớm nguy cơ cháy rừng. Bên cạnh đó, kết
quả nhận được trong đề tài cũng có thể sử dụng, tham khảo trong công tác
nghiên cứu khoa học, giảng dạy ở các trường đại học, viện nghiên cứu.
9. Cơ sở tài liệu thực hiện luận án
Dữ liệu ảnh viễn thám (ảnh Landsat, ảnh Sentinel 2 MSI);
Các bản đồ chuyên đề khu vực thực nghiệm, bộ dữ liệu về điều kiện tự
7
nhiên (lớp phủ bề mặt, độ bốc thoát hơi nước bề mặt, nhiệt độ bề mặt), khí
tượng - khí hậu (lượng mưa trung bình tháng, tốc độ gió) và dữ liệu về mật độ
dân số khu vực nghiên cứu;
Dữ liệu về các điểm cháy ở khu vực thực nghiệm (khai thác từ cơ sở dữ
liệu Firewatch của Cục Kiểm lâm, Bộ Nông nghiệp và Phát triển nông thôn) và
các CSDL quốc tế;
Các tài liệu, số liệu khác.
10. Cấu trúc luận án
Luận án gồm 03 chương chính, phần mở đầu, kết luận - kiến nghị và tài
liệu tham khảo. Nội dung chính của luận án được trình bày trong 03 chương,
bao gồm:
Chương 1. Tổng quan về vấn đề nghiên cứu
Chương 2. Cơ sở khoa học xây dựng mô hình dự báo nguy cơ cháy rừng
từ dữ liệu viễn thám và hệ thông tin địa lý
Chương 3. Thực nghiệm dự báo nguy cơ cháy rừng khu vực phía tây tỉnh
Nghệ An từ dữ liệu viễn thám và hệ thông tin địa lý
8
CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU
1.1 Đặc điểm về tài nguyên rừng ở Việt Nam
Việt Nam là một quốc gia có ¾ diện tích là khu vực đồi núi với tỉ lệ che
phủ của rừng là trên 42% (theo công bố của Bộ Nông nghiệp và Phát triển nông
thôn năm 2020). Rừng là một nguồn tài nguyên sinh thái quan trọng của nước
ta, có giá trị cho sự phát triển kinh tế xã hội và hạnh phúc của cộng đồng trên
đất nước. Rừng đóng vai trò quan trọng trong việc thích nghi với biến đổi khí
hậu thông qua những chức năng môi trường như chống xói mòn đảm bảo tuần
hoàn nước. Rừng cũng có vai trò xã hội to lớn, góp phần tạo công ăn việc làm
và thu nhập cho người dân. Vai trò của rừng cũng được thể hiện ở vùng sâu
vùng xa, vùng cao nơi 10% dân cư sống bên trong hoặc gần các khu rừng (diện
tích xấp xỉ 12 triệu hecta) là người nghèo hoặc người dân tộc thiểu số
(UNDP/GEF SGP, 2017).
Do đất nước ta trải dài từ bắc xuống nam và điạ hình với nhiều cao độ
khác nhau so với mực nước biển nên rừng phân bố trên khắp các dạng địa hình,
với nét độc đáo của vùng nhiệt đới và rất đa dạng: có nhiều rừng xanh quanh
năm, rừng già nguyên thủy, rừng cây lá rộng, rừng cây lá kim, rừng thứ cấp,
truông cây bụi và đặc biệt là rừng ngập mặn... Rừng Việt Nam có nguồn tài
nguyên sinh vật đa dạng, trong đó nước ta là trung tâm thu nhập các luồng thực
vật và động vật từ phía bắc xuống, phía tây qua, phía nam lên và từ đây phân
bố đến các nơi khác trong vùng. Ðồng thời, nước ta có độ cao ngang từ mực
nước biển đến trên 3.000 m nên có nhiều loại rừng với nhiều loại thực vật và
động vật quý hiếm và độc đáo mà các nước ôn đới khó có thể tìm thấy được
(Chu Thái Thành, 2011):
- Về thực vật, theo số liệu thống kê gần đây thì có khoảng 12.000 loài
thực vật, nhưng chỉ có khoảng 10.500 loài đã được mô tả, trong đó có khoảng
9
10% là loài đặc hữu; 800 loài rêu; 600 loài nấm... Khoảng 2.300 loài cây có
mạch đã được dùng làm lương thực, thực phẩm, làm thức ăn cho gia súc. Về
cây lấy gỗ gồm có 41 loài cho gỗ quí (nhóm 1), 20 loài cho gỗ bền chắc (nhóm
2), 24 loài cho gỗ đồ mộc và xây dựng (nhóm 3).... Ngoài ra rừng Việt Nam
còn có loại rừng tre, trúc chiếm khoảng 1,5 triệu ha gồm khoảng 25 loài đã
được gây trồng có giá trị kinh tế cao. Ngoài những cây làm lương thực, thực
phẩm và những cây lấy gỗ ra, rừng Việt Nam còn có những cây được sử dụng
làm dược liệu gồm khoảng 1500 loài trong đó có khoảng 75% là cây hoang dại.
Những cây có chứa hóa chất quý hiếm như cây Tô hạp (Altingia sp.) có nhựa
thơm phân bố ở vùng núi Tây Bắc và Trung bộ; cây Gió bầu (Aquilaria
agalocha) sinh ra trầm hương, phân bố từ Nghệ tỉnh đến Ninh Thuận, Bình
Thuận; cây Dầu rái (Dipterocarpus) cho gỗ và cho dầu nhựa...
- Về động vật, ngoài các loài động vật đặc hữu Việt Nam còn có những
loài mang tính chất tổng hợp của khu hệ động vật miền nam Trung Hoa, Ấn
Ðộ, Mã Lai, Miến Ðiện, trong đó có khoảng 774 loài chim, 273 loài thú, 180
loài bò sát, 80 loài lưỡng cư, 475 loài cá nước ngọt và 1.650 loài cá ở rừng ngập
mặn và cá biển, trong đó có nhiều loài có giá trị kinh tế cao, có ý nghĩa khoa
học. Nhiều loài quý hiếm có tên trong Sách đỏ của thế giới.
Theo Cục Lâm nghiệp (Bộ Nông nghiệp và Phát triển nông thôn), tỉ lệ
che phủ rừng ở Việt Nam có xu hướng liên tục tăng trong giai đoạn từ 2008
đến nay (tính đến 31/12/2020), trong đó năm 2008, tỉ lệ che phủ rừng đạt 38,7%,
năm 2020 đạt 42,0% (hình 1.1), tương ứng với diện tích rừng tăng từ 13,1 triệu
ha (năm 2008) lên 14,6 triệu ha (năm 2020). Về loại rừng, sự gia tăng diện tích
rừng chủ yếu là rừng trồng, với 2,8 triệu ha năm 2008 lên 4,3 triệu ha năm 2019.
10
Hình 1.1 Tỉ lệ che phủ rừng ở Việt Nam giai đoạn 2008 - 2020 – nguồn: http://inforgraphics.vn
Tỉ lệ che phủ, tổng diện tích rừng, diện tích rừng tự nhiên và diện tích
rừng trồng của các tỉnh, thành phố trực thuộc Trung ương tính đến 31/12/2021
được trình bày trong bảng 1.1. Có thể nhận thấy, địa phương có tỉ lệ che phủ
rừng lớn nhất là Bắc Kạn với 73,40%, trong khi đó một số địa phương không
có rừng hoặc có tỉ lệ che phủ rừng rất thấp như Nam Định (1,81%), Đồng Tháp
(1,69%), Tiền Giang (0,90%)...Về diện tích, địa phương có diện tích rừng lớn
nhất là Nghệ An (1.008.741 ha), tỷ lệ che phủ đạt 58,41%, trong đó có 788.991
Bảng 1.1: Diện tích và độ che phủ rừng các tỉnh, thành phố trực thuộc trung ương tính đến 31/12/2021 (Quyết định 2860/QĐ-BNN-TCLN, 2022)
ha rừng tự nhiên và 219.750 ha rừng trồng.
Vùng
Tỉnh
Diện tích có rừng (ha)
Rừng tự nhiên (ha)
Rừng trồng (ha)
Tỷ lệ che phủ (%)
14.745.201
10.171.757
4.573.444
42,02
Tây Bắc
TOÀN QUỐC Tổng Lai Châu Điện Biên Sơn La
1.808.285 469.567 412.350 659.837
1.584.974 447.005 403.001 593.355
223.310 22.563 9.350 66.482
47,06 51,44 42,96 46,40
11
Vùng
Tỉnh
Diện tích có rừng (ha)
Rừng tự nhiên (ha)
Rừng trồng (ha)
Hoà Bình
266.529
Tỷ lệ che phủ (%) 51,54
141.614
124.915
Đông Bắc
Tổng Lào Cai Yên Bái Hà Giang Tuyên Quang Phú Thọ Vĩnh Phúc Cao Bằng Bắc Kạn Thái Nguyên Quảng Ninh Lạng Sơn Bắc Giang Bắc Ninh
3.970.714 378.036 464.008 472.809 426.042 170.053 33.303 378.421 373.081 187.540 370.213 556.266 160.386 556
2.331.602 267.373 213.880 383.819 233.171 47.409 12.049 357.221 272.790 76.302 121.872 290.223 55.494 -
1.639.112 110.663 250.128 88.990 192.872 122.643 21.254 21.200 100.291 111.238 248.341 266.043 104.892 556
56,34 56,91 63,00 58,27 65,21 40,00 25,00 55,88 73,40 47,47 55,00 63,40 38,00 0,68
83.326
46.326
37.000
6,18
13.831
9.039
4.792
8,46
Sông Hồng
Tổng TP Hải Phòng Hải Dương Hưng Yên TP Hà Nội Hà Nam Nam Định Thái Bình Ninh Bình
8.945 - 19.680 5.636 3.092 4.284 27.858
2.241 - 7.584 4.416 - - 23.046
6.704 - 12.096 1.220 3.092 4.284 4.813
5,26 - 5,65 6,53 1,81 2,49 19,65
Bắc Trung Bộ
Tổng Thanh Hoá Nghệ An Hà Tĩnh Quảng Bình Quảng Trị T.Thiên Huế
3.131.061 648.371 1.008.741 335.485 588.387 245.996 304.081
2.201.435 393.360 788.991 217.367 469.421 126.622 205.674
929.625 255.011 219.750 118.118 118.966 119.374 98.407
57,35 53,50 58,41 52,25 68,59 50,00 57,15
Duyên Hải
Tổng TP Đà Nẵng Quảng Nam
2.451.496 63.361 680.250
1.566.677 43.190 463.357
884.820 20.172 216.893
50,43 47,17 58,61
12
Vùng
Tỉnh
Diện tích có rừng (ha)
Rừng tự nhiên (ha)
Rừng trồng (ha)
Tây Nguyên
Tỷ lệ che phủ (%) 50,72 56,51 45,65 45,70 46,85 43,02 45,94 63,12 40,79 54,60 38,35 38,15
226.748 165.538 120.064 68.739 12.688 53.978 468.604 77.154 168.201 84.083 83.728 55.439
Quảng Ngãi Bình Định Phú Yên Khánh Hoà Ninh Thuận Bình Thuận Tổng Kon Tum Gia Lai Lâm Đồng Đắk Lắk Đăk Nông
333.520 380.122 247.194 245.164 159.342 342.543 2.572.701 624.735 646.992 539.403 509.774 251.797
106.772 214.584 127.130 176.426 146.654 288.564 2.104.097 547.581 478.791 455.321 426.046 196.358
19,42 29,29
222.566 58.248
479.871 182.018
257.304 123.770
13,79
12.085
28.550
16.465
Đông Nam Bộ
15,93 3,03 22,79 16,10
20.049 8.069 103.717 20.398
Tổng Đồng Nai Bà Rịa - V.Tàu TP HCM Bình Dương Bình Phước Tây Ninh
33.557 9.878 159.563 66.304
13.509 1.809 55.847 45.906
Tây Nam Bộ
5,44 3,29 1,69 0,90 1,77 - 4,04 - 1,62 2,53 1,61 3,70 12,00 17,84
168.407 21.161 6.162 2.427 3.186 - 6.571 - 3.776 8.438 2.581 12.745 18.880 82.480
Tổng Long An Đồng Tháp Tiền Giang Bến Tre Vĩnh Long Trà Vinh TP Cần Thơ Hậu Giang Sóc Trăng Bạc Liêu An Giang Kiên Giang Cà Mau
247.748 21.999 6.162 2.427 4.359 - 9.493 - 3.776 10.180 4.502 13.860 76.909 94.081
79.341 838 - - 1.173 - 2.922 - - 1.742 1.921 1.116 58.029 11.601
13
Mặc dù vậy, thời gian qua do sự bùng nổ dân số cũng như tác động của
quá trình phát triển kinh tế - xã hội, tài nguyên rừng ở Việt Nam đang có những
biến động rất sâu sắc. Theo FAO, Việt Nam từng là nước có tỷ lệ đất rừng và
trữ lượng gỗ bình quân đầu người thuộc loại thấp trên toàn cầu. Giai đoạn gần
đây, mặc dù tỉ lệ che phủ của rừng trên toàn quốc có gia tăng đáng kể, tuy nhiên
diện tích rừng tự nhiên cũng như chất lượng rừng có sự suy giảm mạnh. Những
năm 1945, đa số là rừng tự nhiên, còn trong tổng số hơn 14 triệu ha rừng hiện
nay, rừng đặc dụng chỉ có 2,15 triệu ha, rừng phòng hộ là 4,6 triệu ha, còn hơn
nửa là rừng sản xuất. Trong hơn 10 năm qua, trung bình mỗi năm cả nước trồng
được khoảng 230 nghìn ha rừng, nhưng có 215 nghìn ha là rừng sản xuất. Diện
tích rừng trồng mới không thể thay thế được giá trị của hàng chục nghìn ha
rừng nguyên sinh đã bị mất đi dẫn đến hệ sinh thái, đa dạng sinh học bị phá vỡ.
Một số địa phương còn tính diện tích cây công nghiệp dài ngày vào độ che phủ
rừng, trong khi đó diện tích các cây công nghiệp dài ngày này không mang tính
bền vững, không có tính đa dạng sinh học cũng như không hiệu quả trong chống
mưa lũ.
1.2 Hiện trạng cháy rừng ở Việt Nam
1.2.1 Khái niệm cơ bản về cháy rừng
Theo Tổ chức Nông lương thế giới (FAO): ‘cháy rừng là sự xuất hiện và
lan truyền của những đám cháy trong rừng mà không nằm trong sự kiểm soát
của con người; gây nên những tổn thất nhiều mặt về tài nguyên, của cải và môi
trường’ (FAO, 1999).
Cháy rừng được phân loại thành 3 loại, bao gồm (Bế Minh Châu, 2010):
- Cháy dưới tán rừng (cháy trên bề mặt đất rừng): là những đám cháy
mà ngọn lửa cháy lan tràn trên mặt đất làm tiêu hủy một phần hoặc toàn bộ lớp
thảm mục, cành khô, lá rụng, cỏ khô, thảm tươi, cây bụi, cây tái sinh cháy sém
vỏ và một phần nào đó ở gốc cây, rễ cây nổi lên trên mặt đất và ở sát mặt đất.
14
- Cháy tán rừng (cháy trên ngọn): là hình thức cháy được phát triển từ
cháy dưới tán lên đến tán rừng. Cháy tán rừng thường xuất hiện ở kiểu rừng có
mật độ tán dày của những loại cây có dầu, bao gồm cháy ổn định (cháy toàn bộ
tán rừng) và cháy lướt nhanh.
- Cháy ngầm: là loại cháy mà ngọn lửa lan tràn dưới mặt đất làm tiêu hủy
lớp mùn, than bùn và tiêu hủy những vật liệu hữu cơ khác đã được tích lũy dưới
lớp đất mặn trong nhiều năm. Một ví dụ điển hình nhất của loại cháy ngầm là
vụ cháy rừng U Minh Thượng, U Minh Hạ trong mùa khô 2001 – 2002.
1.2.2 Quy định về cấp dự báo cháy rừng
Cấp dự báo cháy rừng được quy định cụ thể trong Điều 46 Nghị định
156/2018/NĐ-CP ngày 16 tháng 11 năm 2018 quy định chi tiết thi hành một số
điều của Luật Lâm nghiệp, trong đó Cấp dự báo cháy rừng gồm 5 cấp, từ cấp I
đến cấp V.
Ký hiệu biển báo cấp cháy rừng là 1/2 hình tròn có đường kính vành
ngoài 2,5 m; vành trong 1,8 m nền trắng, xung quanh viền màu đỏ và có mũi
tên (quay được) chỉ cấp dự báo từ cấp I đến cấp V (Hình 1.2) (nguồn:
https://kiemlam.org.vn). Phân cấp và đặc trưng cháy rừng được trình bày trong
Hình 1.3 Biển báo cấp dự báo cháy rừng (https://kiemlam.org.vn)
bảng 1.2 (Nghị định 156/2018/NĐ-CP)
15
Bảng 1.2 Phân cấp dự báo cháy rừng (theo Nghị định 156/2018/NĐ-CP)
STT Cấp cháy
Đặc trưng cháy rừng
I
1
Cấp thấp: Ít có khả năng cháy rừng Khả năng cháy rừng thấp, trên biển báo mũi tên chỉ số I.
II
2
Cấp trung bình: Có khả năng cháy rừng Khả năng cháy rừng ở mức trung bình, trên biển báo mũi tên chỉ số II.
III
3
Cấp cao: Thời tiết khô hanh kéo dài, dễ xảy ra cháy rừng. Chú trọng phòng cháy các loại rừng thông, khộp, bạch đàn, tre, nứa, tràm... Khả năng cháy lan trên diện rộng, trên biển báo mũi tên chỉ số III.
IV
4
Cấp nguy hiểm: Thời tiết khô hanh, hạn kéo dài có nguy cơ xảy ra cháy rừng lớn, tốc độ lan tràn lửa nhanh. Nguy cơ cháy rừng lớn, trên biển báo mũi tên chỉ số IV.
V
5
Cấp cực kỳ nguy hiểm: Thời tiết khô, hạn, kiệt kéo dài, có khả năng cháy lớn và lan tràn nhanh trên các loại rừng Rất nguy hiểm, thời tiết khô, hạn, kiệt kéo dài có khả năng cháy lớn ở tất cả các loại rừng, tốc độ lửa lan tràn rất nhanh, trên biển báo mũi tên chỉ số V.
1.2.3 Phân tích tình hình cháy rừng ở Việt Nam
Mặc dù tổng diện tích rừng và tỉ lệ che phủ ở Việt Nam tăng liên tục
trong giai đoạn gần đây, tuy nhiên diện tích rừng tự nhiên và chất lượng rừng
có sự suy giảm rõ rệt. Các nguyên nhân gây mất rừng và suy thoái rừng bao
gồm: (1) chuyển và xâm lấn rừng tự nhiên sang sản xuất đất nông nghiệp và
đất khác; (2) chuyển rừng tự nhiên nghèo sang rừng sản xuất, cây công nghiệp;
(3) suy thoái rừng tự nhiên do khai thác; (4) mất rừng do cháy rừng (Nguyễn
Thị Mai Dương và cộng sự, 2016).
Cháy rừng là một trong những nguyên nhân quan trọng gây nên sự suy
giảm diện tích rừng và suy thoái chất lượng rừng ở Việt Nam (Trần Quang Bảo
16
và cộng sự, 2016; Nguyễn Văn Lợi và cộng sự, 2017). Các số liệu của Cục Lâm
nghiệp cho thấy, trong 10 năm của giai đoạn 2009 - 2018, cháy rừng đã thiêu
hủy gần 22 nghìn ha rừng ở nước ta, gây thiệt hại lớn về kinh tế cho đất nước,
trong đó cao điểm nhất là năm 2010 với khoảng 6.723 ha rừng đã bị lửa thiêu
rụi. Thời gian đây, diện tích rừng bị cháy tuy có giảm, nhưng vẫn tồn tại những
diễn biến bất ngờ và phức tạp khó lường, nhất là trong điều kiện ảnh hưởng của
biến đổi khí hậu. Đặc biệt, vào những tháng cao điểm của mùa khô hạn, nắng
nóng, nhiều khu rừng của Việt Nam nằm trong tình trạng cảnh báo có nguy cơ
cháy rừng cấp V (cấp cực kỳ nguy hiểm), nguy cơ xảy ra cháy rừng rất cao.
Cháy rừng thường xảy ra ở các địa phương tập trung nhiều rừng và rừng
trồng các loại cây dễ cháy như: rừng thông, rừng tre nứa, rừng bạch đàn, rừng
khộp, rừng tràm, rừng phi lao…, trong đó Hà Tĩnh, Nghệ An, Hà Giang, Sơn
La, Yên Bái, Quảng Trị, Bình Định, Bình Thuận… là những địa phương
thường xuyên xảy ra cháy rừng với thiệt hại lớn. Chỉ riêng thiệt hại do cháy
rừng của tỉnh Sơn La trong năm 2016 đã lên đến 919 ha, chiếm 27,68% tổng
diện tích rừng thiệt hại trong năm của cả nước, gấp gần 2 lần tổng diện tích
rừng thiệt hại của cả năm 2017. Năm 2020, cả nước xảy ra 179 vụ cháy rừng
với diện tích rừng bị thiệt hại là 645 ha.
Ảnh hưởng của cháy rừng không chỉ gói gọn trong những diện tích rừng
bị cháy mà còn tác động sâu sắc đến nhiều mặt của đời sống, kinh tế - xã hội.
Đặc biệt, khi cháy rừng xảy ra ở những cánh rừng nguyên sinh, có thể mất đi
hàng trăm ha diện tích rừng lâu năm và phải mất rất lâu mới có thể tái tạo, phát
triển lại hệ sinh thái rừng. Cháy rừng cũng thải vào bầu khí quyển khối lượng
khí CO2 khổng lồ (Kolari, 2008), góp phần làm cho trái đất nóng lên, làm
nghiêm trọng hơn ảnh hưởng của biến đổi khí hậu, ảnh hưởng đến môi trường
sống và sức khỏe người dân. Cháy rừng đầu nguồn, rừng phòng hộ, còn dẫn
đến gia tăng nguy cơ, tần suất và cường độ thiên tai như lũ lụt, xói mòn, sạt lở
17
đất, lũ quét… Cháy rừng cũng ảnh hưởng nghiêm trọng đến thảm thực vật,
động vật sống trong rừng, gây mất đa dạng sinh học và mất cân bằng sinh thái.
1.3 Nguyên nhân gây cháy rừng ở Việt Nam
Có rất nhiều nguyên nhân cháy rừng mà các nhà nghiên cứu đã xác định
được. Dưới đây là một trong số những yếu tố chủ yếu gây ra hiện tượng này:
1.3.1 Nguyên nhân do biến đổi khí hậu.
Một trong những nguyên nhân gây cháy rừng chính là sự thay đổi rõ rệt
của thời tiết, khí hậu trong thời gian gần đây. Việt Nam nằm trong khu vực
châu Á - Thái Bình Dương, là khu vực thường xuyên chịu ảnh hưởng khô hạn
và thời tiết ấm dần lên do tác động của hiện tượng El Nino. Nước ta cũng có
lượng bức xạ mặt trời rất lớn với số giờ nắng từ 1.400-3000 giờ/năm, nhiệt bức
xạ trung bình năm tới 100 kcal/cm2. Ngoài ra, nền nhiệt trung bình ở hầu hết
các vùng khí hậu Việt Nam trong nhiều năm trở lại đây đều có xu hướng cao
hơn trung bình các năm trước đó, cứ năm sau nắng nóng lại gay gắt hơn năm
trước khiến khô hạn kéo dài, làm gia tăng nguy cơ cháy rừng. Trong khi đó, do
mục đích phát triển kinh tế, rừng trồng ở Việt Nam thường là các loại cây có
tinh dầu, dễ cháy như bạch đàn, thông, tràm, khộp…. Các yếu tố do địa hình
tạo ra cũng có ảnh hưởng trực tiếp đến điều kiện bốc hơi nước và độ ẩm của
vật liệu cháy hoặc chi phối quy mô, tốc độ lây lan các đám cháy rừng.
1.3.2 Nguyên nhân do hoạt động của con người và sinh vật.
Đây được xem là nguyên nhân chủ yếu gây ra phần lớn các vụ cháy rừng
tại Việt Nam. Cháy rừng do con người gây ra thường do nhận thức, ý thức
không cao và sự bất cẩn trong các hoạt động sản xuất, sinh hoạt. Tại một số địa
phương đặc biệt là tại các khu vực miền núi, nơi đồng bào có dân trí thấp, người
dân vẫn còn giữ thói quen đốt nương làm rẫy, thậm chí đốt rừng làm nương rẫy;
đốt quang thực bì cỏ khô, rơm rạ gần rừng. Nhiều vụ cháy rừng lớn xảy ra do
đốt lửa sưởi ấm, hun khói để lấy mật ong…dẫn đến lửa cháy lan không kiểm
18
soát được. Cháy rừng cũng xảy ra do người dân vào rừng khai thác gỗ, củi để
lại các vật liệu bắt lửa như than củi, tàn thuốc…vào những tầng thực bì dễ cháy.
Hoặc các loài động vật gây hại như là côn trùng cũng góp phần giết chết nhiều
cây cối. Khiến rừng trở nên dễ bị bắt lửa hơn. Khi mùa hè kéo dài hơn do khí
hậu nóng lên, côn trùng sẽ sinh sản nhanh hơn và nhiều hơn. Ngoài ra, các hiện
tượng thiên nhiên như tia sét cũng có thể gây cháy rừng.
1.4 Các phương pháp dự báo nguy cơ cháy rừng
1.4.1 Phương pháp dự báo cháy rừng truyền thống
Các nghiên cứu về cháy rừng đã được các nhà khoa học ở các nước như
Mỹ, Liên Xô (cũ), Canada, Nhật Bản, Trung Quốc...quan tâm từ những năm đầu
thế kỷ XX. Các phương pháp dự báo cháy rừng truyền thống đề dự trên mối quan
hệ giữa các yếu tố khí tượng, khí hậu và vật liệu cháy.
Beals (1914) đã nghiên cứu dự báo khả năng xảy ra cháy rừng thông qua
lớp thảm mục (Beal, 1914). Các nghiên cứu tiếp theo đã đề xuất các mô hình dự
báo cải tiến trên cơ sở kết hợp các yếu tố thời tiết, độ ẩm, vật liệu cháy và địa
hình để dự báo mức độ nguy hiểm của lửa rừng.
Tại Liên Xô (cũ), Nesterov (1949) đã đề xuất phương pháp dự báo cháy
rừng, trong đó cấp độ nguy hiểm của cháy rừng được xác định theo giá trị chỉ số
P bằng tổng các tích số giữa nhiệt độ và độ hụt bão hòa của không khí lúc 13h00
hàng ngày kể tử ngày cuối cùng có lượng mưa lớn hơn 3 mm. Phương pháp này
dựa trên các yếu tố khí tượng, khí hậu để phân cấp mức độ nguy hiểm của cháy
rừng thông qua bảng tra. Cách tính giá trị chỉ số P của Nesterov để sử dụng bảng
tra được thực hiện như sau (Nesterov, 1949):
(1.1)
Trong đó:
- P là chỉ tiêu khí tượng tổng hợp đánh giá mức nguy hiểm cháy rừng.
19
Giá trị P được tính bởi 3 yếu tố thời tiết do trạm dự báo khí tượng thủy văn đặt
ở từng vùng đo, tính và thông báo cấp cháy;
- K là hệ số điều chỉnh theo lượng mưa ngày, trong đó:
+ K=1 khi lượng mưa ngày nhỏ hơn 5 mm;
+ K=0 khi lượng mưa ngày lớn hơn 5 mm, hoặc có đợt mưa phùn kéo
dài 3 đến 5 ngày, lượng mưa mặc dù chưa đạt 5 mm K vẫn bằng 0.
- là nhiệt độ (0C) lúc 13 giờ, giờ cao điểm dễ xảy ra cháy rừng trong
ngày.
- D13 là độ chênh lệch bão hòa (hPa) lúc 13 giờ;
- i=1 là ngày thứ nhất lấy kết quả đo của 3 yếu tố thời tiết.
- n là ngày thứ n lấy kết quả đo của 3 yếu tố thời tiết.
Chỉ số P có giá trị càng cao thể hiện nguy cơ cháy rừng cảng lớn. Nhiều
nghiên cứu về sau đã sử dụng chỉ số P để cải tiến các mô hình dự báo nguy cơ
cháy rừng. Từ kết quả tính chỉ số P, các cấp nguy cơ cháy rừng được phân cấp
như trong bảng 1.3 (Shetinsky, 1994).
Bảng 1.3 Bảng tra cấp dự báo cháy rừng theo chỉ số P (Shetinsky, 1994)
Cấp cháy Giá trị P Đặc trưng của các cấp dự báo cháy rừng
< 300 Cấp thấp: ít có khả năng cháy rừng I
301 - 1000 Cấp trung bình: Có khả năng cháy rừng II
1001 - 4000 Cấp cao: Có khả năng dễ cháy rừng III
4001 - 10000 IV Cấp nguy hiểm: có khả năng cháy rừng lớn
> 10000 V Cấp cực kỳ nguy hiểm: có khả năng cháy rừng lớn và lan tràn lửa nhanh
Phương pháp do Nesterov đề xuất đã được sử dụng trong nhiều nghiên
cứu trên thế giới nhằm dự báo sớm nguy cơ cháy rừng, trong đó một số thông số
trong mô hình dự báo đã được điều chỉnh và bổ sung để phù hợp với điều kiện
20
thực tiễn khu vực thử nghiệm (Shetinsky, 1994; Arpaci et al., 2013; Khan, 2012;
Sokolova and Makogonov, 2013; Venevsky, 2002).
Ban đầu, các nghiên cứu ở Việt Nam đã sử dụng phương pháp dự báo của
Nesterov có điều chỉnh theo lượng mưa ngày để đánh giá cấp độ nguy cơ cháy
rừng. Nghiên cứu của Phạm Ngọc Hưng đã cải tiến phương pháp dự báo nguy
cơ cháy rừng theo số ngày khô hạn liên tục, trong đó đã xây dựng bảng phân cấp
nguy hiểm của cháy rừng căn cứ vào số ngày khô hạn liên tục cho các mùa khí
hậu trong năm (Phạm Ngọc Hưng, 1988). Trên cơ sở phương pháp Nesterov, các
nghiên cứu ở Việt nam đã cải tiến bằng cách sử dụng thêm các yếu tố như kiểu
rừng, sức gió, mức sương mù...để phù hợp với điều kiện Việt Nam (Phạm Ngọc
Hưng, 2004).
Bộ Nông nghiệp và Phát triển Nông thôn đã đưa ra bảng tra cấp dự báo
cháy rừng trên cơ sở giá trị chỉ số P như sau:
Bảng 1.4 Bảng tra cấp dự báo cháy rừng theo Bộ NN&PTNT (2000)
Cấp cháy Giá trị P Đặc trưng của các cấp dự báo cháy rừng
< 5000 Cấp thấp: ít có khả năng cháy rừng I
5001 - 10000 Cấp trung bình: Có khả năng cháy rừng II
10001 - 15000 Cấp cao: Có khả năng dễ cháy rừng III
15001 - 20000 IV Cấp nguy hiểm: có khả năng cháy rừng lớn
> 20000 V Cấp cực kỳ nguy hiểm: có khả năng cháy rừng lớn và lan tràn lửa nhanh
Nguồn: Bộ Nông nghiệp và Phát triển Nông thôn, 2000.
Dự án tăng cường khả năng phòng cháy, chữa cháy rừng ở Việt Nam do
UNDP tài trợ đã đề xuất cái tiến phương pháp Nesterov khi thêm yếu tố sức gió,
trong đó giá trị P được nhân với hệ số 1,0; 1,5; 2,0 và 3,0 nếu tốc độ gió tương
ứng là 0, 4, 5 và 15 m/s (Cooper et al., 1991).
21
Nguyễn Quang Văn và cộng sự (2019) đã nghiên cứu, đề xuất hiệu chỉnh
phân cấp dự báo cháy rừng các vùng sinh thái và tỉnh Quảng Bình dựa trên số
liệu quan trắc khí tượng trong khu vực giai đoạn 2015 – 2017, tương quan giữa
độ ẩm của vật liệu cháy và chỉ số P (Bảng 1.5) (Nguyễn Phương Văn và cộng
sự, 2019). Phân cấp cháy rừng đã được hiệu chỉnh phù hợp với tình hình thực
tiễn cháy rừng ở khu vực nghiên cứu, trong đó khoảng cách giữa các cấp cháy
được xác định trên cơ sở cấp cháy và mức độ nguy hiểm trong mùa cháy. Có thể
nhận thấy, so với quy định của Bộ Nông nghiệp và Phát triển Nông thôn, giá trị
chỉ số P trong phân cấp của Nguyễn Phương Văn và cộng sự đã được điều chỉnh
thấp hơn.
Bảng 1.5 Bảng phân cấp dự báo cháy rừng có điều chỉnh (Nguyễn Phương Văn và cộng sự, 2019)
Cấp cháy Giá trị P Khả năng cháy rừng
< 5000 Ít có khả năng cháy rừng I
5001 - 7500 Có khả năng cháy rừng II
7501 - 10000 Nhiều khả năng cháy rừng III
10001 - 15000 Nguy hiểm IV
> 15000 Cực kỳ nguy hiểm V
Trần Văn Hùng và cộng sự (2000) đã đề xuất giải pháp nâng cao độ chính
xác dự báo cháy rừng, trong đó đưa ra chỉ tiêu tổng hợp Pt trên cơ sở kết hợp giá
trị P theo nhân tố khí tượng thủy văn và P theo vật liệu cháy (Trần Văn Hùng và
cộng sự, 2010). Từ giá trị chỉ tiêu tổng hợp Pt, tác giả đã phân cấp lại thang cấp
độ cháy như sau:
Bảng 1.6 Cấp dự báo khả năng cháy rừng ở vườn quốc gia U Minh Hạ theo chỉ số Pt (Trần Văn Hùng và cộng sự, 2010)
Mức độ cháy Cấp cháy Đặc trưng cấp dự báo cháy rừng Chỉ tiêu tổng hợp Pt
1 - 14000 Thấp Ít có khả năng cháy rừng I
22
Chỉ tiêu tổng hợp Mức độ cháy Cấp cháy Đặc trưng cấp dự báo cháy rừng
Pt 14000 - 40000 Trung bình Có khả năng cháy II
40000 - 100000 Cao Có khả năng dễ cháy III
100000 - 200000 Nguy hiểm Có khả năng cháy lớn IV
> 200000 V Cực kỳ nguy hiểm Có khả năng cháy lớn, lan nhanh
Võ Đình Tiến đề xuất phương pháp dự báo mùa cháy rừng trên cơ sở 6
yếu tố: nhiệt độ không khí trung bình, lượng mưa trung bình, độ ẩm không khí
trung bình, vận tốc gió trung bình, số vụ cháy rừng trung bình, lượng người vào
rừng trung bình (Võ Đình Tiến, 1995).
Vương Văn Quỳnh và cộng sự đã nghiên cứu chi tiết hóa phương pháp dự
báo cháy rừng của Nesterov cho các trạng thái rừng khác nhau, từ đó áp dụng
thử nghiệm trong dự báo cháy rừng tại Tây Nguyên và rừng U Minh (Vương
Văn Quỳnh và cộng sự, 2005).
Có thể nhận thấy, phương pháp dự báo cháy rừng truyền thống trên cơ sở
chỉ số P do Nesterov đề xuất được sử dụng rộng rãi trên thế giới và ở Việt Nam.
Đây cũng là phương pháp đang được Bộ Nông nghiệp và Phát triển Nông thôn
sử dụng trong dự báo nguy cơ cháy rừng, trong đó đã điều chỉnh một số yếu tố
đầu và cho phù hợp với điều kiện thực tế ở Việt Nam.
1.4.2 Phương pháp sử dụng dữ liệu viễn thám và GIS trong nghiên cứu cháy
rừng
Phương pháp dự báo nguy cơ cháy rừng truyền thống trên cơ sở chỉ số P
mặc dù đã được sử dụng phổ biến và mang lại hiệu quả nhất định trên thế giới
cũng như ở Việt Nam, tuy nhiên phương pháp này cũng tồn tại những nhược
điểm cơ bản khi chủ yếu sử dụng dữ liệu khí tượng mặt đất. Trong khi đó, số
lượng các trạm khí tượng ở các địa phương là khá ít, ảnh hưởng đến khả năng áp
23
dụng cho khu vực có diện tích lớn cũng như độ chính xác của mô hình dự báo
nguy cơ cháy rừng. Những hạn chế này của phương pháp dự báo cháy rừng
truyền thống có thể được khắc phục khi sử dụng kết hợp dữ liệu viễn thám và hệ
thông tin địa lý (GIS).
Phương pháp dự báo nguy cơ cháy rừng bằng dữ liệu viễn thám và GIS là
quá trình đánh giá mức độ ảnh hưởng của các yếu tố tự nhiên và xã hội tham gia
vào quá trình hình thành cháy rừng. Các yếu tố này bao gồm (Phạm Ngọc Hưng,
2004):
1) Đặc trưng của rừng:
- Cấu trúc lâm phần.
- Kiểu rừng.
2) Kết cấu vật liệu cháy:
- Kích thước vật liệu.
- Sự sắp xếp và phân bố của vật liệu.
- Độ ẩm của vật liệu.
- Khối lượng vật liệu cháy.
3) Khí hậu và thời tiết:
- Nhiệt độ không khí, đặc biệt là nhiệt độ không khí ngày.
- Độ ẩm tương đối của không khí.
- Tốc độ gió.
- Lượng mưa và thời gian mưa.
4) Địa hình:
- Độ dốc của địa hình.
- Hướng sườn.
- Vị trí tương đối theo sườn dốc.
Ngoài ra, một số mô hình dự báo nguy cơ cháy rừng còn sử dụng các yếu
tố đầu vào như khoảng cách từ các khu dân cư tới rừng, khoảng cách từ các
24
tuyến đường giao thông đến rừng, số người trung bình vào rừng mỗi
ngày...(Gholamreza, 2012).
Có thể nhận thấy, nhiều thông tin đầu vào của mô hình dự báo nguy cơ
cháy rừng như lớp phủ bề mặt, nhiệt độ bề mặt, độ ẩm, kiểu rừng,...có thể chiết
tách từ dữ liệu viễn thám một cách nhanh chóng. Hiện nay, cùng với sự phát
triển vượt bậc của công nghệ vũ trụ, dữ liệu viễn thám đã được ứng dụng rộng
rãi ở nhiều nước trên thế giới và mang lại hiệu quả cao trong quản lý, giám sát
và cảnh báo sớm nguy cơ cháy rừng. Ngoài các ảnh vệ tinh thương mại như
SPOT, WorldView, Ikonos..., nhiều hệ thống viễn thám hiện nay đã và đang
cung cấp dữ liệu ảnh viễn thám hoàn toàn miễn phí với độ phân giải không gian
đa dạng. Do được cập nhật liên tục, nguồn dữ liệu viễn thám miễn phí này đã
trở thành công cụ hết sức hiệu quả trong nghiên cứu, quản lý tài nguyên và
giám sát môi trường, trong đó có đánh giá chất lượng nước mặt. Có thể kể đến
các dữ liệu viễn thám miễn phí như Landsat, Sentinel, MODIS…
Một số loại ảnh vệ tinh cho phép xác định được các điểm có dị thường
nhiệt, các dấu hiệu của cháy rừng (bụi, khói) và sự phát triển của đám cháy theo
thời gian,... Công việc này có thể xác định được thông qua đặc trưng nhiệt độ
của các đối tượng trong dải phổ hồng ngoại nhiệt và cận hồng ngoại. Bên cạnh
bộ cảm quang học, một số hệ thống vệ tinh hiện nay có gắn các bộ cảm để thu
được các tín hiệu nhiệt độ bức xạ của các đối tượng trên mặt đất như Landsat,
Aster, MODIS. Nhiệt độ bề mặt là thông tin hết sức quan trọng trong phát hiện
sớm các khu vực xảy ra cháy rừng. Dữ liệu ảnh hồng ngoại nhiệt từ các hệ
thống vệ tinh này cho phép chiết tách nhanh thông tin nhiệt độ bề mặt, phát
hiện những khu vực có nhiệt độ bất thường để cảnh báo nguy cơ cháy rừng.
Hệ thống vệ tinh Landsat bao gồm các vệ tinh từ Landsat 1 đến Landsat
9, trong đó Landsat 1 là vệ tinh nghiên cứu tài nguyên thiên nhiên đầu tiên trên
thế giới. Landsat được xem là một trong những hệ thống vệ tinh viễn thám lớn
25
nhất trên thế giới với kho dữ liệu khổng lồ từ cuối những năm 70 thế kỷ XX
đến nay. Dữ liệu Landsat được cung cấp hoàn toàn miễn phí, người sử dụng có
thể tạo tài khoản và tải dữ liệu ảnh, bao gồm các ảnh từ các vệ tinh Landsat
đang hoạt động như Landsat 8/9 lẫn dữ liệu ảnh từ các vệ tinh Landsat đã dừng
hoạt động.
Hình 1.3 Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên tổ hợp màu ảnh Landsat 8, sử dụng các kênh NIR và MIR (nguồn: https://digital-geography.com/)
Trên hình 1.4 thể hiện hình ảnh cháy rừng tại khu vực hạt Västmanland
(Thụy Điển) ngày 4/8/2014 trên tổ hợp màu ảnh Landsat 8, sử dụng các kênh
cận hồng ngoại (NIR) và hồng ngoại sóng ngắn (MIR). Có thể nhận thấy, khu
vực xảy ra cháy rừng được phát hiện và phân biệt rõ ràng với các khu vực xung
quanh, giúp các nhà quản lý có thể ứng phó hiệu quả hơn với cháy rừng. Trên tổ
hợp màu này, các điểm cháy được thể hiện bởi màu cam đỏ, các khu vực lửa đã
tắt được thể hiện bởi màu đỏ đậm.
Ngoài các kênh ở dải sóng nhìn thấy và hồng ngoại, trên ảnh Landsat TM,
ETM+ và Landsat 8/9 còn có các kênh hồng ngoại nhiệt với độ phân giải không
gian từ 60 - 120m cho phép chiết tách nhanh thông tin nhiệt độ bề mặt Trái Đất.
26
Dữ liệu nhiệt độ bề mặt Trái Đất có thể sử dụng để phát hiện sớm các khu vực
có dị thường về nhiệt, trong đó có các khu vực xảy ra cháy rừng. Hình 1.5 thể
hiện hình ảnh cháy rừng khu vực hạt Västmanland (Thụy Điển) ngày 4/8/2014
trên kênh hồng ngoại nhiệt (kênh 10) ảnh vệ tinh Landsat 8. Khu vực cháy rừng
được thể hiện bởi các pixel màu trắng sáng, thể hiện bởi nhiệt độ bề mặt cao hơn
rất nhiều so với khu vực xung quanh.
Hình 1.4 Hình ảnh cháy rừng ở hạt Västmanland (Thụy Điển) ngày 4/8/2014 trên kênh hồng ngoại nhiệt (kênh 10) ảnh Landsat 8 (nguồn: https://digital- geography.com/)
Gần đây, hệ thống vệ tinh Sentinel của Cơ quan Hàng không vũ trụ Châu
Âu (ESA) với nhiều thế hệ vệ tinh khác nhau, từ các vệ tinh radar (Sentinel 1)
đến vệ tinh quang học (Sentinel 2 MSI) cung cấp ảnh viễn thám ở độ phân giải
không gian cao hơn (lên đến 10m), thời gian cập nhật ngắn đã được sử dụng
hiệu quả và rộng rãi trên thế giới trong lĩnh vực tài nguyên, môi trường. Đặc
biệt, các thế hệ vệ tinh Sentinel thường bao gồm 01 cặp vệ tinh (Sentinel 2A và
Sentinel 2B)…với đặc điểm hoàn toàn giống nhau giúp rút ngắn thời gian thu
nhận ảnh tại một vị trí trên bề mặt Trái Đất. Điều này giúp nâng cao tần suất
chụp ảnh cũng như khắc phục được phần nào ảnh hưởng của điều kiện thời tiết
27
để chất lượng ảnh chụp, đặc biệt là ảnh quang học. Cũng như dữ liệu ảnh
Landsat, hệ thống vệ tinh Sentinel cho phép người sử dụng được tải ảnh hoàn
toàn miễn phí từ website của ESA. Trên hình 1.6 thể hiện hình ảnh cháy rừng
ở California (Mỹ) nhìn từ ảnh vệ tinh Sentinel 2. Do có độ phân giải không gian
cao, có thể nhận thấy, các khu vực đang xảy ra cháy được phân biệt rất rõ trên
ảnh Sentinel 2 ở tổ hợp màu tự nhiên so với sử dụng ảnh Landsat. Việc phát
hiện sớm các khu vực cháy rừng cho phép đánh giá ảnh hưởng cũng như dự
báo nguy cơ lan tràn của lửa rừng, giúp ứng phó hiệu quả hơn với cháy rừng.
Hình 1.5 Cháy rừng ở California ngày 27/10/2019 nhìn từ ảnh vệ tinh quang học Sentinel 2 (nguồn: https://wildfiretoday.com/)
Ngoài các dữ liệu vệ tinh với độ phân giải trung bình như Landsat,
Sentinel, có thể kể đến một số loại dữ liệu viễn thám miễn phí khác như ảnh
MODIS, ảnh Planet... Ảnh MODIS được thu nhận từ hai hệ thống vệ tinh chính,
bao gồm: MODIS Terra và MODIS Aqua. Ảnh MODIS có 36 kênh phổ, với 3
độ phân giải: 250, 500 và 1000 mét, trong đó có 15 kênh trong dải sóng hồng
ngoại nhiệt (từ 3,660μm – 14,385μm). Mặc dù độ phân giải không gian không
28
cao, nhưng với tầm phủ rộng, chu kỳ cập nhật ngắn, ảnh MODIS là nguồn dữ
liệu giá trị cao trong nghiên cứu tài nguyên, môi trường. Kênh hồng ngoại nhiệt
(kênh 31 và 32) ảnh MODIS thường được sử dụng để xác định nhiệt độ bề mặt
lớp phủ mặt đất, từ đó phát hiện các điểm dị thường về nhiệt độ và đưa ra cảnh
báo sớm về các khu vực có nguy cơ xảy ra cháy rừng. Tại Việt Nam, Tổng cục
Kiểm lâm cũng đã xây dựng hệ thống cảnh báo cháy rừng trên cơ sở nhiệt độ
bề mặt xác định từ ảnh vệ tinh MODIS. Hình 1.6 trình bày hình ảnh vụ cháy
rừng U Minh Hạ năm 2002 trên ảnh MODIS, trong đó có thể phát hiện khói do
ảnh hưởng của cháy rừng.
Hình 1.6 Hình ảnh cháy rừng U Minh Hạ năm 2002 từ ảnh vệ tinh MODIS
Ngoài các lớp thông tin có thể chiết tách từ dữ liệu viễn thám phục vụ xây
dựng mô hình dự báo nguy cơ cháy rừng, nhiều lớp thông tin khác như địa hình,
độ dốc, hướng sườn,…có thể chiết tách từ dữ liệu mô hình số độ cao (DEM) trên
cơ sở ứng dụng công nghệ GIS. Hệ thông tin địa lý có những ưu điểm nổi bật
trong phân tích, xử lý, hiển thị dữ liệu không gian, trong đó có các lớp thông tin
về tự nhiên và xã hội của mô hình dự báo nguy cơ cháy rừng. Các lớp thông tin
29
trong mô hình dự báo nguy cơ cháy rừng như khoảng cách từ các khu dân cư
đến rừng, khoảng cách từ các tuyến đường giao thông đến rừng, khoảng cách
từ khu vực đất nông nghiệp đến rừng...cũng có thể được xây dựng một cách
nhanh trong với sự trợ giúp của GIS trên cơ sở sử dụng các kỹ thuật phân tích
không gian.
cơ cháy rừng (Zhao et al., 2021)
Hình 1.7 Lớp thông tin khoảng cách tới đường giao thông trong mô hình dự báo nguy
Như vậy, có thể nhận thấy việc sử dụng dữ liệu viễn thám và hệ thông tin
địa lý trên cơ sở các kỹ thuật học máy là một tiếp cận phù hợp, hiệu quả trong
nghiên cứu dự báo sớm nguy cơ cháy rừng hiện nay.
1.5 Tổng quan tình hình nghiên cứu trong và ngoài nước
1.5.1 Trên thế giới
Do cháy rừng ảnh hưởng nghiêm trọng đến đời sống, tính mạng và hoạt
động sản xuất, các nghiên cứu về cháy rừng đã được các nhà khoa học trên thế
30
giới quan tâm từ những năm đầu thế kỷ XX. Các nghiên cứu về cháy rừng được
chia thành các hướng chính, bao gồm:
(1): Nghiên cứu bản chất của cháy rừng;
(2): Nghiên cứu phương pháp dự báo nguy cơ cháy rừng;
(3): Nghiên cứu các công trình phòng chống cháy rừng;
(4): Nghiên cứu các phương pháp chữa cháy rừng;
(5): Nghiên cứu phương tiện chữa cháy rừng.
Các phương pháp dự báo nguy cơ cháy rừng đều cho thấy mối quan hệ
chặt chẽ giữa điều kiện thời tiết, độ ẩm của vật liệu cháy và khả năng xuất hiện
cháy rừng. Bên cạnh các yếu tố khí tượng diễn biến hàng ngày như lượng mưa,
nhiệt độ, độ ẩm không khí (Williams, 1993), một số phương pháp dự báo cháy
rừng trên cơ sở chỉ tiêu tổng hợp P còn tính đến ảnh hưởng của các yếu tố khác
như độ ẩm của vật liệu cháy (Chandler, 1983), tốc độ gió, số ngày không mưa,
lượng nước bốc hơi (Dong, 2005). Nhìn chung, với mỗi khu vực khác nhau,
các mô hình dự báo nguy cơ cháy rừng thường khác nhau, điều này cũng gây
nên những hạn chế nhất định trong hiệu quả phòng chống cháy rừng bằng
phương pháp nghiên cứu truyền thống.
Với sự phát triển vượt bậc của công nghệ địa không gian, trong đó có
công nghệ viễn thám và GIS trong thời gian qua, nhiều nghiên cứu đã ứng dụng
dữ liệu viễn thám và GIS nhằm xây dựng các mô hình dự báo nguy cơ cháy
rừng trên cơ sở kết hợp các kỹ thuật truyền thống và các kỹ thuật xử lý dữ liệu
không gian hiện đại.
Những nghiên cứu đầu tiên trong ứng dụng viễn thám và GIS dự báo nguy
cơ cháy rừng có thể kể đến Hệ thống thông tin cháy rừng châu Âu (EFFIS) do
Trung tâm hợp tác nghiên cứu châu Âu xây dựng năm 2000 (Hình 1.8). Hiện
nay, có hàng chục quốc gia đã tham gia vào mạng lưới này và hệ thống EFFIS
cho phép dự báo nguy cơ cháy, phát hiện sớm cháy rừng, lập bản đồ các khu vực
31
cháy cũng như đánh giá thiệt hại do cháy rừng tới độ che phủ đất, lượng khí thải
phát sinh...( https://effis.jrc.ec.europa.eu/apps). Dữ liệu viễn thám sử dụng trong
hệ thống này là ảnh vệ tinh quang học MODIS, VIIRS và Sentinel 2.
Hình 1.8 Hệ thống thông tin cháy rừng châu Âu (EFFIS)
Hình 1.9 Hệ thống thông tin giám sát môi trường phục vụ cảnh báo cháy rừng của Croatia (IPNAS)
32
Một quốc gia ở châu Âu khác là Croatia cũng xây dựng Hệ thống thông
tin giám sát môi trường cho phòng chống cháy rừng (IPNAS – Croatian
Intergral Forest Fire Monitoring System), bao gồm nhiều hợp phần phục vụ dự
báo sớm nguy cơ cháy rừng trên cơ sở kết hợp dữ liệu địa không gian (GIS,
GPS) và các thông tin bổ trợ khác (Stipaničev et al., 2006) – Hình 1.9. Dữ liệu
trong hệ thống IPNAS bao gồm: dữ liệu video thời gian thực, dữ liệu khí tượng
thời gian thực và cơ sở dữ liệu GIS.
Jaiswal và cộng sự (2002) sử dụng phương pháp phân tích thứ bậc (AHP)
để thành lập bản đồ dự báo nguy cơ cháy rừng khu vực Gorna Subwatershed
(bang Madhya Pradesh, Ấn Độ) trên cơ sở dữ liệu ảnh vệ tinh IRS và công nghệ
GIS. Ảnh vệ tinh IRS 1D LISS III được sử dụng để thành lập bản đồ thảm phủ
thực vật, kết hợp các lớp thông ti khác như độ dốc, bản đồ địa hình, khoảng
cách đến khu dân cư...để thành lập bản đồ nguy cơ cháy rừng, trong đó mỗi yếu
tố được xác định trọng số ảnh hưởng đến khả năng cháy. Kết quả nhận được
cho thấy, gần 30% diện tích khu vực nghiên cứu nằm ở nguy cơ cháy rừng
'‘cao'' đến '‘rất cao'’, phù hợp với các địa điểm xảy ra cháy rừng (Jaiswal et al.,
2002).
Nghiên cứu của Wimberly và cộng sự (2008) đã sử dụng dữ liệu ảnh vệ
tinh Landsat đa thời gian nhằm thành lập bản đồ mức độ nghiêm trọng do cháy
rừng ở phía nam Appalachians (Bắc Carolina, Mỹ). Tác giả đã sử dụng chỉ số
cháy NBR (Normalized Burn Ration index) xác định từ kênh cận hồng ngoại
(kênh 4) và kênh hồng ngoại sóng ngắn (kênh 7) ảnh vệ tinh Landsat để đánh
giá sự thay đổi của lớp phủ bề mặt trước và sau khi cháy theo công thức:
(1.2)
Trong đó, NBRpre và NBRpost là chỉ số NBR trước và sau khi xảy ra cháy rừng.
Từ kết quả này, các tác giả đã đánh giá được ảnh hưởng của địa hình và kiểu
rừng đến mức độ nghiêm trọng của đám cháy cũng như mối quan hệ giữa mức
33
độ nghiêm trọng của đám cháy đến độ phong phú của loài (Wimberly et al.,
2008).
Yassemi và cộng sự (2008) tích hợp sử dụng công nghệ GIS, các mô hình
môi trường và các thiết bị di động (cellular automata - CA) nhằm xây dựng một
mô hình dự báo nguy cơ cháy rừng, áp dụng cho khu vực Nordegg Alberta
(Canada). Kết quả nhận được cho thấy sự phù hợp giữa kết quả mô phỏng từ
mô hình đề xuất và dữ liệu cháy tại khu vực nghiên cứu. Việc tích hợp công
nghệ GIS-CA cho phép mô phỏng thực tế các kịch bản cháy rừng (Yassemi et
al., 2008). Nghiên cứu cũng đã xây dựng được module phần mềm mô phỏng
cháy rừng với giao diện đơn giản, dễ sử dụng (hình 1.10).
Hình 1.10 Giao diện mô hình nghiên cứu cháy rừng của Yassemi và cộng sự (2008)
Chowdhury và cộng sự (2013) sử dụng ảnh vệ tinh MODIS nhằm dự báo
nguy cơ cháy rừng khu vực phía bắc Alberta (Canada). Từ ảnh MODIS, các tác
34
giả đã tính toán các thông số đầu vào, bao gồm: nhiệt độ bề mặt (land surface
temperature), chi số hạn (Normalized Multi-band Drought Index – NMDI), chỉ
số độ ẩm thực vật (TVWI – Temperature Vegetation Wetness Index) để xây
dựng bản đồ dự báo nguy cơ cháy rừng (Chowdhury et al., 2013). Kết quả nhận
được cho thấy, 91,63% số vụ cháy rừng xảy ra trong khu vực được phân cấp
mức độ cháy là '‘rất cao'’.
Để nâng cao độ chính xác của các mô hình dự báo nguy cơ cháy rừng từ
dữ liệu viễn thám và GIS, một số nghiên cứu đã sử dụng các kỹ thuật trí tuệ
nhân tạo (mạng neural nhân tạo, random forest, support vector machine,...) kết
hợp phương pháp phân tích thứ bậc AHP để nâng cao độ chính xác (Vasilakos
et al., 2009; Oliveira et al., 2012; Dieu Tien Bui et al., 2016). Các kỹ thuật hồi
quy như hồi quy đa biến (multiple regression) (Oliveira et al., 2012), hồi quy
logistic (Pourghasemi, 2015), hồi quy trọng số địa lý (geographically weighted
regression - GWR) (Fernandez et al., 2012), kỹ thuật khai phá dữ liệu (data
mining) (Arpaci et al., 2014) cũng được sử dụng để xây dựng các mô hình dự
báo nguy cơ cháy rừng trên cơ sở đánh giá mối quan hệ giữa các yếu tố tự
nhiên, xã hội và khả năng xảy ra cháy. Arndt và cộng sự (2013) đã nghiên cứu
mối quan hệ giữa các hoạt động du lịch, cơ sở hạ tầng, nông nghiệp và lâm
nghiệp và sự phân bố không gian của các đám cháy rừng trong khoảng thời
gian từ 1993 - 2009 bằng phương pháp hồi quy logistic. Trong nghiên cứu này,
59 biến số kinh tế - xã hội độc lập đã được được phân tích với các mô hình khác
nhau, kết quả nhận được chỉ ra rằng mật độ đường sắt, đường rừng và đường
mòn cùng với hoạt động nông nghiệp và lâm nghiệp có ảnh hưởng đáng kể đên
nguy cơ cháy rừng (Arndt et al., 2013).
Enoh và cộng sự (2021) sử dụng dữ liệu ảnh vệ tinh Landsat 8 OLI, mô
hình số độ cao DEM xác định từ dữ liệu Aster, ảnh viễn thám độ phân giải cao
Google Earth để xây dựng các lớp thông tin như bản đồ lớp phủ mặt đất, các
35
thông tin địa hình (độ dốc, độ cao, độ dài sườn), mạng lưới đường bộ, khu dân
cư...nhằm thành lập bản đồ nguy cơ cháy rừng khu vực Cross (Niger). Kết quả
nhận được trong nghiên cứu cho thấy sự hiệu quả của công nghệ viễn thám và
GIS trong dự báo sớm nguy cơ cháy rừng, cũng như chứng minh nguồn gốc
chủ yếu của cháy rừng tại khu vực Cross là do các hoạt động của con người gây
ra (Enod et al., 2021).
Nghiên cứu của Ruano và cộng sự (2022) sử dụng chỉ số thực vật NDVI
xác định từ ảnh viễn thám và các dữ liệu khác về địa hình, vật liệu cháy, hạ
tầng giao thông nhằm xây dựng một số mô hình dự báo khả năng cháy rừng do
ảnh hưởng của các yếu tố tự nhiên, xã hội. Các tác giả đã lựa chọn thử nghiệm
với các mô hình như mô hình tuyến tính tổng quát hóa (GLMs – generalized
linear models), mô hình tổng quát GAMs – generalized additive models để đánh
giá nguy cơ phát sinh cháy rừng do con người và các yếu tố tự nhiên gây ra. Độ
chính xác của các mô hình được đánh giá trên cơ sở đường cong AUC, trong
đó đạt 0,84 và 0,89 với các mô hình GLMs, GAMs (Ruano et al., 2022).
Herrera và cộng sự (2022) sử dụng ảnh vệ tinh MODIS giai đoạn 2012 –
2018 và các số liệu về vật liệu cháy để thành lập bản đồ các khu vực xảy ra
cháy rừng, hỗ trợ công tác giám sát, đánh giá sự lan tràn của lửa rừng và lập kế
hoạch dập lửa (Herrera et al., 2022). Tại khu vực thử nghiệm ở Mexico, 24 loại
vật liệu cháy được nghiên cứu để phân tích ảnh hưởng của khoảng cách giữa
vật liệu cháy và khu vực xảy ra cháy, từ đó lập bản đồ chu vi ảnh hưởng của
các đám cháy đang hoạt động.
Iban và Sekertekin (2022) cũng sử dụng dữ liệu các điểm dị thường nhiệt
từ ảnh MODIS và kết quả dự báo với 7 kỹ thuật học sâu (deep learning), bao
gồm: hồi quy logistic độc lập (LR), máy vectơ hỗ trợ (SVM), phân tích phân
biệt tuyến tính (LDA), rừng ngẫu nhiên (RF), Gradient Bo boost (GB), eXtreme
Gradient Bo boost (XGB) và AdaBoost (AB) để lựa chọn phương pháp phù
36
hợp với khu vực Adana và Mersin (Thổ Nhĩ Kỳ). Kết quả nhận được cho thấy,
phương pháp RF cho độ chính xác cao nhất, với giá trị đường cong AUC đạt
0.879. Nghiên cứu cũng chứng minh rằng, các yếu tố bao gồm độ cao, nhiệt độ
và độ dốc có ảnh hưởng lớn nhất đến nguy cơ xảy ra cháy rừng tại khu vực thử
nghiệm (Iban, Sekertekin, 2022).
Các lớp thông tin như cấu trúc rừng, địa hình, môi trường, khí hậu và 16
yếu tố phụ được sử dụng để thành lập bản đồ nguy cơ cháy rừng ở khu vực phía
đông Địa Trung Hải (Thổ Nhĩ Kỳ). So sánh với dữ liệu thực tế cho thấy, 85%
các điểm cháy được phân bố trong các khu vực có nguy cơ cháy rừng cao
(Sivrikaya, Kucuk, 2022). Các yếu tố địa hình như độ cao, độ dốc, hướng sườn,
chỉ số thực vật NDVI, độ che phủ đất, lượng nước bốc hơi được sử dụng trong
nghiên cứu của Nasiri và cộng sự (2022) nhằm đánh giá khả năng xảy ra cháy
rừng ở khu vực Paved (Iran) trên cơ sở kỹ thuật AHP và công nghệ GIS (Nasiri
et al., 2022). Kết quả nhận được cho thấy, 64,7% các điểm cháy trong quá khứ
nằm trong khu vực có mức độ xảy ra cháy rừng «cao» và «rất cao». Nhìn chung,
các nghiên cứu trên thế giới đã minh chứng tính hiệu quả của phương pháp sử
dụng dữ liệu viễn thám và công nghệ GIS trong xây dựng các mô hình dự báo
nguy cơ cháy rừng.
1.5.2 Trong nước
Các nghiên cứu dự báo nguy cơ cháy rừng ở Việt Nam được thực hiện
từ những năm cuối thế kỷ XX trên cơ sở phương pháp dự báo của Nesterov sử
dụng chỉ tiêu tổng hợp P (Phạm Ngọc Hưng, 1988; Võ Đình Tiến, 1995).
Phương pháp truyền thống này tiếp tục được sử dụng trong các nghiên cứu thời
gian sau, trong đó mô hình dự báo được bổ sung thêm các lớp thông tin đầu vào
cũng như điều chỉnh giá trị chỉ tiêu P trong phân cấp nguy cơ cháy rừng (Trần
Quang Bảo và cộng sự, 2019; Lê Sỹ Doanh, Vương Văn Quỳnh, 2014; Trần
Văn Hùng và cộng sự, 2010; Nguyễn Phương Văn, 2019). Trong nghiên cứu
37
(Lê Sỹ Doanh, Vương Văn Quỳnh, 2014), các tác giả đề xuất phương pháp dự
báo nguy cơ cháy rừng theo điều kiện khí hậu ở Việt Nam, trong đó chỉ số khí
hậu phản ánh nguy cơ cháy rừng Qi được xây dựng trên cơ sở phân tích tương
quan hồi quy giữa các giá trị Qi xác định bằng các phương pháp khác nhau và
chỉ số Snc45 (số ngày có nguy cơ cháy rừng cao và rất cao trong tháng theo chỉ
số Nesterov).
Những năm đầu thế kỷ XXI, nhiều nghiên cứu ở Việt Nam đã sử dụng
dữ liệu viễn thám, đặc biệt là các hệ thống viễn thám có bộ cảm biến hồng ngoại
nhiệt như Landsat TM, Landsat ETM+, MODIS để xây dựng các module phần
mềm cảnh báo cháy rừng ở Việt Nam (Vương Văn Quỳnh, 2005; Vương Văn
Quỳnh và cộng sự, 2006; Doãn Hà Phong, 2007; Bế Minh Châu và Vương Văn
Quỳnh, 2009; Trần Quang Bảo và cộng sự 2016).
Đề tài cấp nhà nước của Vương Văn Quỳnh (2005) «Nghiên cứu giải
pháp phòng chống và khắc phục hậu quả cháy rừng cho vùng U Minh và Tây
Nguyên» đã xây dựng được phần mềm tự động phát hiện các khu vực cháy
rừng từ dữ liệu Landsat và MODIS. Trên cơ sở đặc điểm vật liệu cháy (khối
lượng, độ ẩm, phân bố vật liệu cháy) và tần suất xuất hiện cháy ở các trạng thái
rừng khác nhau, Vương Văn Quỳnh đã phân loại thảm phủ rừng theo mức nguy
cơ cháy khác nhau, từ thấp đến cao (Vương Văn Quỳnh, 2005).
Luận án của Doãn Hà Phong (Doãn Hà Phong, 2007) đã nghiên cứu xây
dựng thuật toán chiết tách nhiệt độ bề mặt từ dữ liệu ảnh vệ tinh MODIS nhằm
hỗ trợ thông tin đầu vào cho các mô hình dự báo nguy cơ cháy rừng. Tác giả
đã sử dụng phương pháp hồi quy tuyến tính để hiệu chỉnh các tham số của thuật
toán xác định nhiệt độ bề mặt phù hợp với điều kiện Việt Nam, thử nghiệm xây
dựng công cụ tính toán trên phần mềm xử lý ảnh ENVI trên cơ sở ngôn ngữ
IDL (Interactive Data Language). Sử dụng giá trị nhiệt độ bề mặt và thông tin
lớp phủ (chỉ số thực vật NDVI), Doãn Hà Phong đã đưa ra phân cấp nguy cơ
38
cháy rừng bằng phương pháp phân loại cây quyết định (Decesion Tree – Hình
1.12). Kết quả nhận được cho thấy, các khu vực có chỉ số thực vật NDVI lớn
hơn 0.5 (đại diện cho các khu vực có lớp phủ rừng) và nhiệt độ bề mặt trên
350C có nguy cơ cháy rừng ở mức «cực kỳ nguy hiểm». Trong khi đó, với khu
vực có chỉ số NDVI lớn hơn 0.5 và nhiệt độ bề mặt dưới 30.50C, nguy cơ cháy
Hình 1.11 Phân loại nguy cơ cháy rừng trên cơ sở phương pháp phân loại cây quyết định (Doãn Hà Phong, 2007)
rừng ở mức thấp.
Năm 2007, Tổng cục Kiểm lâm (nay là Cục Kiểm lâm) đã xây dựng Hệ
thống theo dõi cháy rừng trực tuyến (FireWatch Việt Nam) bằng cách sử dụng
dữ liệu viễn thám MODIS nhằm phát hiện sớm các điểm cháy rừng (hotspots)
trên toàn lãnh thổ Việt Nam. Thông tin các điểm cháy phát hiện được truyền
tải một cách nhanh chóng đến các địa phương thông qua trang Web của Cục
39
nhằm hỗ trợ kịp thời công tác phòng cháy chữa cháy rừng trên toàn quốc. Hệ
thống này tiếp tục được hoàn thiện với các phiên bản cập nhật trong giai đoạn
sau đó. Các chức năng chính của FireWatch bao gồm: (1) cập nhật tức thời
thông tin về các điểm cháy phát hiện từ ảnh vệ tinh, (2) cung cấp dữ liệu thống
kê cháy theo thời gian và theo địa phương, (3) cung cấp cơ sở dữ liệu cháy...
(https://kiemlam.org.vn). Mặc dù vậy, hệ thống FireWatch Việt Nam hiện nay
Hình 1.12 Hệ thống theo dõi cháy rừng FireWatch Việt Nam (nguồn: geoviet.vn)
đã dừng hoạt động.
Về hướng xây dựng các phần mềm cảnh báo nguy cơ cháy rừng ở Việt
Nam trên cơ sở dữ liệu ảnh viễn thám hồng ngoại nhiệt như Landsat, MODIS có
Vương Văn Quỳnh, 2009; Trần Quang Bảo và cộng sự, 2016). Điểm chung của các
thể kể đến các nghiên cứu (Vương Văn Quỳnh và cộng sự, 2006; Bế Minh Châu và
nghiên cứu này đều sử dụng thông tin nhiệt độ bề mặt xác định từ ảnh viễn thám
nhằm phát hiện các điểm dị thường về nhiệt, từ đó đưa ra các cảnh báo về nguy
40
cơ xảy ra cháy rừng. Ngoài phát hiện cháy rừng, các điểm dị thường về nhiệt độ
bề mặt xác định từ dữ liệu viễn thám hồng ngoại nhiệt cũng được sử dụng trong
phát hiện sớm cháy ngầm từ các khu vực khai thác than như ở mỏ than Khánh
Hòa, tỉnh Thái Nguyên (Trinh Le Hung, Zablotskii, 2017).
Trần Văn Hùng và cộng sự (2010) sử dụng chỉ số tổng hợp P của
Nesterov với sự trợ giúp của hệ thông tin địa lý (GIS) và dữ liệu viễn thám để
xây dựng bản đồ dự báo khả năng xuất hiện cháy rừng theo thời gian và không
2010). Mặc dù vậy, phương pháp sử dụng trong nghiên cứu này khá đơn giản
gian tại Vườn quốc gia U Minh Hạ, tỉnh Cà Mau (Trần Văn Hùng và cộng sự,
và cũng chưa kiểm chứng được độ chính xác của bản đồ dự báo nguy cơ cháy
rừng.
Nghiên cứu của Võ Thành Minh và Lê Thị Thu Hiền (2015) đã sử dụng
ảnh vệ tinh Landsat 8 và công nghệ GIS để thành lập bản đồ nhạy cảm cháy tại
Vườn quốc gia Tràm Chim. Các lớp thông tin đầu vào, bao gồm chỉ số thực vật
NDVI, chỉ số độ ẩm NDWI, kiểu thảm phủ bề mặt và nhiệt độ bề mặt được
chiết tách từ ảnh vệ tinh Landsat 8 giai đoạn 2013 – 2014, kết hợp với các lớp
thông tin xây dựng bằng công nghệ GIS như khoảng cách đến khu dân cư,
khoảng cách đến nguồn nước...nhằm xây dựng chỉ số nguy cơ cháy rừng FRI
(Fire risk index) (Võ Thành Minh, Lê Thị Thu Hiền, 2015). Trên cơ sở giá trị chỉ
số FRI, nguy cơ cháy rừng được chia thành 3 cấp: thấp, trung bình và cao. Kết
quả nhận được cho thấy, vào mùa khô, diện tích các khu vực có nguy cơ cháy
rừng ở mức ‘’cao’’ lớn gấp hơn 3 lần so với thời điểm mùa mưa.
Trần Quang Bảo (2017) sử dụng công nghệ địa không gian (viễn thám,
GIS, hệ định vị toàn cầu GPS) nhằm phát hiện cháy rừng và giám sát tài nguyên
rừng. Nghiên cứu đã chứng minh, việc phát hiện sớm cháy rừng bằng dữ liệu
viễn thám đa thời gian mang lại hiệu quả cao và phù hợp ở quy mô nghiên cứu
rộng lớn. Sử dụng ảnh MODIS (từ vệ tinh TERRA và AQUA), các tác giả đã
41
phát triển thuật toán ATBD-MOD14 của NASA để xây dựng thuật toán của mô
hình dự báo cháy rừng, trong đó sử dụng 4 kênh phổ (kênh 21, 22, 31 và 32)
ảnh MODIS. Độ chính xác của mô hình được kiểm chứng thông qua thông tin
về các vụ cháy thực tế xảy ra tại các địa phương và các điểm cháy của Cục
Bảo, 2017).
Kiểm lâm với kết quả kiểm chứng thực tế đạt độ chính xác 75% (Trần Quang
Phạm Minh Hải và Vũ Ngọc Phan (2018) sử dụng công nghệ viễn thám
và GIS nghiên cứu vật liệu cháy trong các kiểu rừng phục vụ công tác phòng
chống cháy rừng tại tỉnh Bắc Giang. Trên cơ sở phương pháp chuyên gia và
phân tích các yếu tố ảnh hưởng đến quá trình cháy rừng tại huyện Sơn Động
(Bắc Giang), các tác giả đã lựa chọn và đề xuất các chỉ tiêu đầu vào cho mô
hình phân loại thảm thực vật rừng dễ cháy, bao gồm nhóm các yếu tố tự nhiên
(thảm thực vật, độ dốc, hướng sườn, lượng mưa trung bình tháng, nhiệt độ trung
bình ngày) và nhóm các yếu tố xã hội (khoảng cách từ các khu dân cư đến rừng,
Phan, 2018).
khoảng cách từ đất canh tác nương rẫy đến rừng) (Phạm Minh Hải, Vũ Ngọc
Lê Ngọc Hoàn và Trần Quang Bảo (2018) sử dụng ảnh MODIS giai đoạn
2010 – 2015 để trích xuất các điểm dị thường nhiệt, đồng thời tổng hợp và phân
tích đặc điểm phân bố các điểm dị thường nhiệt theo không gian và thời gian.
Kết quả nhận được được so sánh với kết quả phân vùng trọng điểm cháy rừng
và mùa cháy rừng ở Việt Nam, làm cơ sở để phát hiện sớm và cảnh báo nguy
cơ cháy rừng. Thuật toán trích xuất điểm dị thường nhiệt được trình bày trên
hình 1.13 (Lê Ngọc Hoàn, Trần Quang Bảo, 2018).
42
Hình 1.13 Thuật toán trích xuất điểm dị thường nhiệt từ dữ liệu viễn thám phục vụ
phát hiện sớm cháy rừng (Lê Ngọc Hoàn, Trần Quang Bảo, 2018)
Nguyễn Ngọc Thạch và cộng sự đã xây dựng bản đồ nguy cơ cháy rừng
ở cấp xã phục vụ công tác quản lý phòng chống cháy rừng tại tỉnh Sơn La. Với
sự trợ giúp của công nghệ GIS, nghiên cứu đã xây dựng các lớp thông tin đầu
vào của mô hình, bao gồm các yếu tố tự nhiên và kinh tế - xã hội ảnh hưởng
đến khả năng xảy ra cháy rừng, từ đó thành lập được bản đồ nguy cơ cháy rừng
chi tiết tới cấp xã (Nguyễn Ngọc Thạch và cộng sự, 2015). Giải pháp này tiếp tục
được hoàn thiện với các nghiên cứu của Nguyễn Ngọc Thạch và cộng sự (2017),
Đặng Ngô Bảo Toàn và cộng sự (2017). Phương pháp phân tích thứ bậc AHP
và các kỹ thuật học máy (Random forest, Support vector machine...) cũng được
Thach Nguyen et al., 2019; Đặng Ngô Bảo Toàn, 2021; Hoang V.T. et al., 2020).
kết hợp sử dụng để nâng cao độ chính xác dự báo nguy cơ cháy rừng (Ngoc
Luận án của Đặng Ngô Bảo Toàn (2021) cũng xây dựng được WebGIS hỗ trợ
cảnh báo, giám sát nguy cơ cháy rừng khu vực huyện Thuận Châu, tỉnh Sơn
43
La. Các kỹ thuật học sâu cũng được áp dụng trong nghiên cứu của Lê Văn Hưng
và cộng sự trong xây dựng mô hình dự báo nguy cơ cháy rừng cho khu vực tỉnh
Lâm Đồng (Lê Văn Hưng và cộng sự, 2019).
Hình 1.14 Giao diện WebGIS cảnh báo nguy cơ cháy rừng tại huyện Thuận Châu, tỉnh Sơn La (Đặng Ngô Bảo Toàn, 2021)
Luận án tiến sĩ của Trần Minh Cảnh đã sử dụng ảnh vệ tinh Landsat để
thành lập bản đồ hiện trạng rừng, sau đó xây dựng bản đồ phân cấp nguy cơ
cháy rừng trên cơ sở bản đồ hiện trạng và cấp nguy cơ cháy của chúng. Quá
trình thực hiện được tiến hành trên phần mềm ArcGIS 10.4 trên cơ sở các kỹ
thuật chồng xếp các lớp bản đồ (Trần Minh Cảnh, 2019). Nguyễn Phương Văn
sử dụng dữ liệu ảnh vệ tinh Landsat 7 ETM+ và Landsat 8 nhằm chiết xuất
thông tin nhiệt độ bề mặt, kết hợp cùng các lớp thông tin khác để xây dựng bản
Phương Văn, 2019). Các giải pháp kỹ thuật xử lý ảnh viễn thám cũng như phân
đồ nguy cơ cháy rừng trên cơ sở phương pháp phân tích thứ bậc AHP (Nguyễn
tích không gian trong các nghiên cứu trên còn khá đơn giản và chưa được các
tác giả quan tâm phân tích sâu.
44
Ngoài các nghiên cứu liên quan đến xây dựng mô hình dự báo nguy cơ
cháy rừng, dữ liệu viễn thám và GIS cũng được sử dụng trong nhiều nghiên
cứu phục vụ xây dựng các mô hình tài nguyên - môi trường khác nhau như phát
hiện và giám sát cháy ngầm ở bể than Quảng Ninh (Nguyễn Tiến Thành, 2021),
giám sát hệ thực vật ngập nước (Nguyễn Văn Hùng, 2022), xác định thông tin
bốc thoát hơi nước bề mặt (Lê Hùng Chiến, 2022)...
Nhìn chung, từ phân tích các kết quả nghiên cứu ở Việt Nam cho thấy,
việc sử dụng dữ liệu viễn thám và công nghệ GIS trong xây dựng các mô hình
dự báo nguy cơ cháy rừng là một tiếp cận phù hợp, khả thi, có hiệu quả cao,
tiết kiệm thời gian và công sức khi áp dụng với các khu vực có quy mô rộng.
Nhưng hạn chế của các nghiên cứu phần lớn các mô hình dựa trên chỉ số
Netresov, trong đó dựa chủ yếu vào các yếu tố khí tượng, Một số nghiên cứu
dùng viễn thám và GIS, nhưng đánh giá trọng số của các yếu tố ảnh hưởng,
chưa dùng các kỹ thuật AI trong dự báo. Một số nghiên cứu dùng nhiệt độ bề
mặt, rồi phân ngưỡng để đánh giá nguy cơ cháy rừng. Nhìn chung, chưa có
nghiên cứu nào xử lý dữ liệu trên nền tảng điện toán đám mây GEE, trong đó
kết hợp nhiều kỹ thuật học máy để lựa chọn phương pháp phù hợp với đặc điểm
khu vực nghiên cứu.
1.6 Luận giải những vấn đề cần nghiên cứu
Từ phân tích các nghiên cứu trên thế giới và ở Việt Nam cho thấy, hiện
nay vẫn chưa có phương pháp dự báo cháy rừng chung cho toàn thế giới. Mỗi
quốc gia, khu vực đã áp dụng và phát triển các phương pháp dự báo cháy rừng
riêng, phù hợp với điều kiện cụ thể của địa phương. Ở Việt Nam, phương pháp
dự báo cháy rừng phổ biến nhất là sử dụng chỉ số khí tượng tổng hợp Nesterov,
trong đó có điều chỉnh một số hệ số cho phù hợp với các khu vực khác nhau.
Mặc dù vậy, việc sử dụng các chỉ số tổng hợp có nhiều hạn chế do bỏ qua nhiều
yếu tố đầu vào có ảnh hưởng tới nguy cơ xảy ra cháy rừng như các chỉ số thảm
45
thực vật, khoảng cách đường giao thông, khoảng cách tới khu dân cư, mật độ
Cùng với sự phát triển của khoa học địa không gian và CMCN 4.0, thời
dân cư...
gian gần đây, nhiều nghiên cứu đã sử dụng dữ liệu viễn thám và hệ thông tin
địa lý kết hợp các kỹ thuật trí tuệ nhân tạo để xây dựng các mô hình dự báo
nguy cơ cháy rừng. Tuy nhiên, với mỗi khu vực khác nhau có điều kiện tự
nhiên, kinh tế - xã hội khác nhau, cần thiết phải nghiên cứu, đánh giá và lựa
chọn xây dựng mô hình phù hợp nhằm nâng cao hiệu quả công tác giám sát, dự
báo và cảnh báo nguy cơ cháy rừng.
Các nghiên cứu trong nước mặc dù đã thử nghiệm với nhiều mô hình
khác nhau, trong đó đã áp dụng các kỹ thuật trí tuệ nhân tạo trong xử lý dữ liệu
viễn thám và GIS nhằm nâng cao độ chính xác trong dự báo nguy cơ cháy rừng,
một số nghiên cứu đã xây dựng được WebGIS hỗ trợ cảnh báo cháy rừng, tuy
nhiên các công trình này chưa quan tâm nghiên cứu xử lý các dữ liệu không
gian này trên các nền tảng mở. Đây là một xu hướng phù hợp trong xử lý dữ
liệu lớn nói chung, dữ liệu không gian nói riêng, góp phần khắc phục các hạn
chế về hạ tầng lưu trữ cũng như nâng cao hiệu quả công tác quản lý và cảnh
báo sớm nguy cơ cháy rừng. Với sự phát triển mạnh mẽ của các kỹ thuật trí tuệ
nhân tạo trong thời gian qua, đặc biệt là các thuật toán học máy (machine
learning), học sâu (deep learning), việc kết hợp phương pháp phân tích thứ bậc
và các kỹ thuật xử lý dữ liệu không gian hiện đại là một tiếp cận phù hợp và
hiệu quả trong xây dựng các mô hình dự báo nguy cơ cháy rừng trên cơ sở dữ
liệu viễn thám và hệ thông tin địa lý.
Từ phân tích các kết quả đạt được cũng như những hạn chế trong các
nghiên cứu trước đó, đặc biệt là các nghiên cứu ở Việt Nam, trong luận án này,
nghiên cứu sinh tập trung nghiên cứu, lựa chọn mô hình dự báo nguy cơ cháy
rừng trên cơ sở dữ liệu viễn thám và hệ thông tin địa lý, bao gồm phương pháp
46
phân tích thứ bậc AHP, phương pháp sử dụng các kỹ thuật học máy như random
forest (RF), support vector machine (SVM), classification and regression trees
(CART)...Dữ liệu các điểm cháy trong quá khứ tại khu vực nghiên cứu được
sử dụng cho các mô hình học máy trong dự báo nguy cơ cháy rừng. Ngoài ra,
dữ liệu các điểm cháy cũng được sử dụng trong đánh giá độ chính xác của các
mô hình dự báo nguy cơ cháy rừng trên cơ sở phân tích sự phù hợp giữa các
điểm cháy và phân bố không gian các khu vực có nguy cơ cháy khác nhau (xác
định từ mô hình dự báo). Trên cơ sở kết quả đánh giá độ chính xác của mô hình
dự báo, mô hình có sự phù hợp nhất với dữ liệu các điểm cháy được lựa chọn
để dự báo nguy cơ cháy rừng ở khu vực nghiên cứu.
Để khắc phục được các hạn chế trên, trong luận án tiến hành nghiên cứu
các nội dung sau:
- Nghiên cứu, phân tích cơ sở khoa học các mô hình dự báo nguy cơ
cháy rừng bằng dữ liệu viễn thám và hệ thông tin địa lý;
- Thu thập và xử lý dữ liệu địa không gian khu vực nghiên cứu;
- Thử nghiệm, phân tích, đánh giá độ chính xác của các mô hình dự
báo nguy cơ cháy rừng trên cơ sở kết hợp các phương pháp truyền
thống và phương pháp học máy. Lựa chọn mô hình phù hợp đối với
khu vực nghiên cứu;
- Xây dựng bản đồ phân vùng nguy cơ cháy rừng khu vực nghiên cứu;
- Phân tích và đánh giá kết quả.
1.7 Tiểu kết chương 1
Trong chương 1, đã nghiên cứu tổng quan về đặc điểm tài nguyên rừng,
hiện trạng và nguyên nhân cháy rừng ở Việt Nam. Trong chương 1 cũng trình
bày các phương pháp dự báo nguy cơ cháy rừng, bao gồm các phương pháp
nghiên cứu truyền thống dựa trên mối quan hệ giữa các yếu tố khí tượng và khả
năng xảy ra cháy và phương pháp sử dụng dữ liệu viễn thám và GIS. Từ phân
47
tích tổng quan tình hình nghiên cứu trong và ngoài nước, trong chương 1 nghiên
cứu sinh đã luận giải các vấn đề còn tồn tại, đề xuất hướng giải quyết trong luận
án nhằm nâng cao hiệu quả ứng dụng dữ liệu viễn thám và GIS kết hợp các kỹ
thuật xử lý dữ liệu không gian hiện đại dựa trên trí tuệ nhân tạo nhằm nâng cao
hiệu quả ứng dụng trong cảnh báo sớm nguy cơ cháy rừng ở Việt Nam. Các kết
quả nhận được trong chương 1 cho thấy sự cần thiết phải nghiên cứu ứng dụng
các kỹ thuật học máy nhằm nâng cao độ chính xác của các mô hình dự báo
nguy cơ cháy rừng từ dữ liệu viễn thám và GIS.
48
CHƯƠNG 2. CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH DỰ BÁO
NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG
TIN ĐỊA LÝ
2.1 Đặc điểm khu vực nghiên cứu
Nghệ An nằm ở trung tâm vùng Bắc Trung Bộ, có tọa độ địa lý từ 18º33'
đến 20º01' vĩ độ Bắc, 103º52' đến 105º48’ kinh độ Đông, tiếp giáp với tỉnh Thanh
Hóa ở phía Bắc, tỉnh Hà Tĩnh ở phía Nam, phía Tây giáp nước Cộng hòa dân
chủ nhân dân Lào với đường biên giới dài 419 km; phía Đông giáp biển, trong
đó đường bờ biển dài 82 km. Nghệ An có diện tích 16.490,25 km2, lớn nhất cả
nước. Nghệ An có 21 đơn vị hành chính trực thuộc, bao gồm: 01 thành phố, 3
thị xã và 17 huyện, trong đó, thành phố Vinh là đô thị loại 1, là trung tâm kinh
tế, văn hóa của tỉnh và khu vực Bắc Trung bộ. Vị trí địa lý khu vực nghiên cứu
Hình 2.1 Vị trí địa lý tỉnh Nghệ An
được trình bày trên hình 2.1.
49
Điều kiện tự nhiên
Địa hình, địa mạo. Nghệ An có địa hình đa dạng và phức tạp, bị chia cắt
mạnh bởi các dãy đồi, núi và hệ thống sông suối. Về tổng thể, địa hình tỉnh
Nghệ An nghiêng theo hướng Tây Bắc - Đông Nam, với ba vùng sinh thái rõ
rệt: miền núi, trung du, đồng bằng ven biển, trong đó, miền núi chiếm khoảng
83% diện tích toàn tỉnh. Địa hình có độ dốc lớn với gần 80% diện tích tự nhiên
toàn tỉnh có độ dốc trên 8°, đặc biệt có trên 38% diện tích đất có độ dốc lớn
hơn 25°. Nơi cao nhất là đỉnh Puxailaileng (2.711 m) ở huyện Kỳ Sơn, thấp
nhất là vùng đồng bằng các huyện Quỳnh Lưu, Diễn Châu, Yên Thành, có nơi
chỉ cao 0,2 m so với mặt nước biển (xã Quỳnh Thanh, huyện Quỳnh Lưu).
Khí hậu. Nghệ An nằm trong vùng khí hậu nhiệt đới gió mùa, có mùa
mùa hè nóng ẩm, mưa nhiều (từ tháng 5 đến tháng 10) và mùa đông lạnh, ít
mưa (từ tháng 11 đến tháng 4 năm sau). Đây cũng là khu vực chịu ảnh hưởng
mạnh của gió phơn tây nam khô và nóng trong khoảng thời gian từ tháng 4 đến
tháng 8 hàng năm. Đây là loại gió đặc trưng tại khu vực Bắc Trung Bộ, hoạt
động mạnh nhất ở khu vực phía tây tỉnh Nghệ An, gây ra khí hậu khô và nóng,
ảnh hưởng tiêu cực đến hoạt động sản xuất, đời sống sinh hoạt cũng như làm
gia tăng nguy cơ cháy rừng.
Nhiệt độ trung bình hàng năm ở Nghệ An từ 23 - 24°C. Sự chênh lệch
nhiệt độ giữa các tháng trong năm khá cao, trong đó các tháng nóng nhất (tháng
6 đến tháng 7) nhiệt độ trung bình là 33°C. Nhiệt độ trung bình các tháng
lạnh nhất (tháng 12 năm trước đến tháng 2 năm sau) là 19°C. Số giờ nắng trung
bình/năm trong khoảng từ 1.500 đến 1.700 giờ. Lượng mưa bình quân hàng
năm dao động từ 1.200 - 2.000 mm/năm, với khoảng 123 - 152 ngày mưa trong
năm. Lượng mưa tập trung chủ yếu vào mùa hè (mùa mưa), chiếm từ 80 - 85%
tổng lượng mưa cả năm. Trong khi đó vào mùa khô (từ tháng 11 đến tháng 4
năm sau), lượng mưa chỉ chiếm từ 15 - 20% tổng lượng mưa. Tháng 1 và 2
50
được xem là các tháng khô hạn nhất trong năm, lượng mưa chỉ đạt trung bình
7 - 60 mm/tháng. Độ ẩm không khí trung bình năm dao động trong khoảng từ
80 - 90%, trong đó thấp nhất ở các huyện vùng núi như Kỳ Sơn, Tương Dương
và cao nhất tại khu vực thượng nguồn sông Hiếu.
Thủy văn. Nghệ An có hệ thống sông, suối dày đặc với mật độ lưới sông
trung bình trong khoảng từ 0,6 - 0,7 km/km2. Phần lớn sông ngòi ở Nghệ An
thuộc hệ thống sông Lam (còn gọi là sông Cả). Hệ thống sông Lam là một trong
9 lưu vực sông lớn nhất ở Việt Nam, trong đó có 44 sông nhánh cấp I, trong đó
sông Hiếu là sông nhánh lớn nhất với chiều dài 228 km, diện tích lưu vực đạt
5.340 km2. Các sông còn lại ở Nghệ An có lưu vực nhỏ (2000 - 3000 km2) với
chiều dài trung bình khoảng 60 - 70 km.
Tài nguyên rừng. Nghệ An có diện tích rừng và đất lâm nghiệp lớn nhất
cả nước, chiếm gần 70% diện tích đất tự nhiên toàn tỉnh, trong đó diện tích rừng
khoảng hơn 1 triệu ha (gần 786.550 ha rừng tự nhiên và 214.325 ha rừng trồng).
Mật độ che phủ rừng đạt 58,50% (theo báo cáo hiện trạng rừng Việt Nam năm
2020), trữ lượng gỗ đạt khoảng 91 triệu m3. Do có tiềm năng tài nguyên rừng
lớn, Nghệ An cũng là nơi đặt Khu lập nghiệp ứng dụng công nghệ cao vùng
Bắc Trung Bộ theo quyết định số 509/QĐ-TTg ngày 31/3/2021 của Thủ tướng
Chính phủ. Nghệ An cũng có khu dự trữ sinh quyển lớn nhất khu vực Đông
Nam Á với vườn quốc gia Pù Mát (diện tích 93.523 ha), khu bảo tồn thiên nhiên
Pù Huống (41.127 ha) và khu bảo tồn thiên nhiên Pù Hoạt (34.723 ha).
Mặc dù có diện tích và tiềm năng tài nguyên rừng lớn, hệ sinh thái rừng
ở Nghệ An cũng có những biến động sâu sắc trong thời gian gần đây. Độ che
phủ rừng toàn tỉnh có xu hướng tăng nhưng phần lớn diện tích tăng là rừng
trồng có giá trị đa dạng sinh học không cao. Diện tích rừng tự nhiên có sự suy
giảm rõ rệt cả về chất lượng và diện tích. Rừng nguyên sinh chưa bị tác động
51
chỉ còn là những khu vực nhỏ, rời rạc tại vùng núi phía Tây của Nghệ An, thuộc
các khu bảo tồn thiên nhiên và vườn quốc gia.
Điều kiện kinh tế - xã hội
Nghệ An là một tỉnh có dân số lớn của cả nước, với dân số năm 2020 đạt
3.365.198 người (đứng thứ 4 cả nước), mật độ trung bình 204 người/km2. Dân
số sinh sống tại khu vực miền núi ở tỉnh Nghệ An trên 1,2 triệu người (chiếm
36% dân số toàn tỉnh). Đồng bào dân tộc thiểu số là 491.267 người, chiếm
14,76% dân số toàn tỉnh và chiếm 40,93% dân số trên địa bàn miền núi. Nghệ
An hiện có 47 dân tộc cùng sinh sống, ngoài người Kinh còn có dân tộc Thái
(338.559 người), Thổ (71.420 người), Khơ Mú (43.139 người), Mông (33.957
người) (theo Cổng thông tin điện tử tỉnh Nghệ An).
Nghệ An là một đầu mối giao thông quan trọng của cả nước, có mạng
lưới giao thông phát triển và đa dạng, bao gồm hệ thống đường bộ, đường sắt,
đường sông, sân bay và cảng biển, được hình thành và phân bố khá hợp lý theo
các vùng dân cư và các trung tâm hành chính, kinh tế. Với điều kiện tự nhiên
đa dạng và phong phú, Nghệ An có nhiều lợi thế để phát triển du lịch, bao gồm
du lịch biển ở phía Đông và các khu du lịch gắn liền với các khu bảo tồn thiên
nhiên ở phía Tây. Nhìn chung, khu vực phía tây tỉnh Nghệ An là nơi có đặc
điểm địa hình, thủy văn, giao thông, thực phủ, dân cư...khác so với khu vực
bằng phẳng gần biển ở phía đông của tỉnh. Điều này cũng ảnh hưởng đến đặc
điểm cháy rừng ở Nghệ An.
Đặc điểm cháy rừng ở Nghệ An
Do ảnh hưởng của điều kiện thời tiết và các hoạt động của con người,
Nghệ An là một trong những khu vực có tình trạng cháy rừng diễn ra phức tạp
trong cả nước. Chỉ riêng 6 tháng đầu năm 2020 ở Nghệ An xảy ra 16 vụ cháy,
tổng diện tích rừng bị cháy là 116 ha, trong đó chỉ có 4 vụ cháy rừng xác định
52
được đối tượng gây cháy. 5 tháng đầu năm 2022 cũng xảy ra 2 vụ cháy rừng tại
Nghệ An, tuy nhiên đã được lực lượng kiểm lâm ứng phó kịp thời.
Theo Sở Nông nghiệp và Phát triển nông thôn Nghệ An, các nguyên nhân
gây cháy rừng bao gồm: ảnh hưởng của thời tiết nắng nóng; do mâu thuẫn cá
nhân và tranh chấp đất đai. Nắng nóng gay gắt kéo dài và gió thổi mạnh dẫn
đến nguy cơ cháy rừng vào mùa hè ở Nghệ An luôn cao với cảnh báo cháy rừng
từ cấp IV đến cấp V. Ngoài ra, do đường băng cản lửa hạn chế về chiều ngang
dẫn đến khi gió thổi mạnh, đường băng không cản được lửa dẫn đến lây lan
cháy rừng.
Mối quan hệ giữa các yếu tố tự nhiên, xã hội và cháy rừng
Từ đặc điểm cháy rừng ở Nghệ An cho thấy, nguyên nhân chính của tình
trạng này là do ảnh hưởng của các yếu tố tự nhiên cũng như hoạt động của con
người (yếu tố xã hội).
Chất lượng rừng là một trong những yếu tố tự nhiên có ảnh hưởng đến
tình trạng cháy rừng ở Nghệ An. Trong những năm qua, mặc dù diện tích rừng
ở Nghệ An tăng lên nhưng chất lượng rừng lại có chiều hướng suy giảm. Đặc
điểm này càng thể hiện rõ nét ở khu vực phía tây Nghệ An khi diện tích rừng
nguyên sinh chỉ còn chiếm tỉ lệ rất ít (tập trung ở các khu bảo tồn thiên nhiên,
vườn quốc gia), trong khi rừng thứ sinh nghèo kiệt và rừng trồng chiếm phần
lớn diện tích rừng, và đây là loại rừng rất dễ xảy ra cháy. Ngoài ra, rừng dễ
cháy còn liên quan đến loại hình thực bì có đặc tính bắt lửa hay địa hình của
các cánh rừng tạo nên các khu vực tiểu khí hậu khô hạn, ít mưa ở các tỉnh Trung
Bộ, trong đó có Nghệ An.
Diễn biến thời tiết, khí hậu ngày càng phức tạp và khó lường, đặc biệt tại
các tỉnh miền Trung cũng làm cho nguy cơ tiềm ẩn về cháy rừng ngày càng
nghiêm trọng. Điều kiện thời tiết và các nhân tố khí tượng là các tác nhân cho
sự phát sinh, phát triển của một đám cháy rừng bao gồm nhiệt độ, độ ẩm, gió,
53
trong đó nhiệt độ là yếu tố gây ảnh hưởng trực tiếp đến quá trình cháy rừng;
gió là nhân tố thúc đẩy nhanh quá trình làm khô vật liệu cháy và làm đám cháy
lan rộng.
Bên cạnh yếu tố tự nhiên, cháy rừng còn bắt nguồn từ các hoạt động xã
hội và các hoạt động sản xuất của con người như đốt rừng làm nương rẫy, đốt
quang thực bì, đốt rác trong vườn cạnh khu rừng trồng, hun khói để lấy mật
ong... Nhiều diện tích rừng trồng không được chăm sóc dẫn đến gia tăng nguồn
vật liệu cháy, do vậy về mùa khô rất dễ bốc cháy khi gặp nguồn lửa. Rất nhiều
vụ cháy rừng ở Việt Nam nói chung, khu vực Nghệ An nói riêng có nguyên
nhân trực tiếp là yếu tố con người, bao gồm cả nguyên nhân do mâu thuẫn và
tranh chấp đất đai.
2.2 Tổng quan chung về dữ liệu phục vụ xây dựng mô hình dự báo nguy
cơ cháy rừng
Xây dựng dữ liệu cho mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn
thám và GIS là một nội dung có ý nghĩa rất quan trọng trong phát hiện và cảnh
báo sớm các khu vực có nguy cơ xảy ra cháy rừng cao. Các lớp thông tin đầu
vào của mô hình được xây dựng dựa trên dữ liệu viễn thám (ảnh vệ tinh quang
học Sentinel 2 MSI, Landsat 8/9, MODIS), dữ liệu GIS (trên cơ sở phân tích
mô hình số độ cao DEM) và các số liệu, tài liệu khác.
Trên cơ sở đặc điểm tự nhiên, xã hội và thực trạng dữ liệu ở khu vực
nghiên cứu (phía tây tỉnh Nghệ An), trong luận án này, nghiên cứu sinh tiến
hành thu thập và xây dựng dữ liệu đầu vào của mô hình dự báo nguy cơ cháy
rừng với 09 lớp thông tin, bao gồm:
+ Mật độ dân số;
+ Thông tin về lớp phủ thực vật (chỉ số thực vật NDVI);
+ Thông tin về độ ẩm bề mặt (độ bốc thoát hơi nước);
+ Hướng sườn (Aspect);
54
+ Độ dốc (Slope);
+ Tốc độ gió;
+ Độ cao;
+ Nhiệt độ bề mặt (land surface temperature);
+ Lượng mưa trung bình tháng.
Trong các lớp thông tin này, chỉ số thực vật NDVI, nhiệt độ bề mặt được
chiết xuất từ dữ liệu viễn thám (ảnh Sentinel 2 MSI và Landsat 8/9). Độ dốc,
hướng sườn, độ cao được chiết xuất thông qua dữ liệu GIS trên cơ sở sử dụng
mô hình số độ cao DEM. Độ bốc thoát hơi nước được thu thập từ bộ sản phẩm
ảnh vệ tinh MODIS trên nền tảng GEE. Các lớp thông tin còn lại được thu thập
từ các cơ sở dữ liệu về kinh tế - xã hội, khí tượng, khí hậu, sau đó biên tập và
chuẩn hóa lại theo quy định.
Cấu trúc dữ liệu của các lớp thông tin đầu vào trong mô hình dự báo nguy
cơ cháy rừng được chuẩn hóa và lưu trữ dưới dạng vector và raster để thuận
tiện khi thực hiện các phép phân tích không gian trong môi trường GIS.
2.3 Các lớp thông tin thành phần và phương pháp xây dựng cơ sở dữ liệu
thành phần
a) Thông tin lớp phủ thực vật
Lớp phủ thực vật là một yếu tố đầu vào hết sức qua trọng của các mô
hình dự báo nguy cơ cháy rừng. Lớp thông tin về thực vật có thể được xây dựng
từ các bản đồ địa hình, bản đồ chuyên đề hoặc chiết xuất từ ảnh viễn thám
quang học, trong đó phương pháp chỉ số thực vật (vegetation index) được sử
dụng phổ biến nhất do sự hiệu quả và đơn giản trong tính toán các chỉ số thực
vật. Các chỉ số phổ thực vật được xác định từ các kênh ảnh ở dải sóng cận hồng
ngoại, hồng ngoại và đỏ là các tham số trung gian mà từ đó có thể thấy được
các đặc tính khác nhau của thảm thực vật như sinh khối, chỉ số diện tích lá, khả
năng quang hợp, tổng các sản phẩm sinh khối theo mùa mà thực vật có thể tạo
55
ra. Những đặc tính đó có liên quan và phụ thuộc rất lớn vào dạng thực vật bao
phủ và thời tiết, đặc tính sinh lý, sinh hoá và sâu bệnh…Hiện nay, có hàng chục
2009; Vũ Danh Tuyên và cộng sự, 2020).
chỉ số thực vật khác nhau và chia thành 7 nhóm chính (Cherepanov, Druzhinina,
Trong số các chỉ số thực vật, chỉ số khác biệt thực vật NDVI được sử
dụng phổ biến và hiệu quả trong nghiên cứu thông tin lớp phủ bề mặt. Hiện
nay, rất nhiều mô hình dự báo, cảnh báo thiên tai như các mô hình cảnh báo xói
mòn đất, trượt lở đất, lũ quét...đã sử dụng chỉ số NDVI là đại diện cho lớp phủ
thực vật khu vực thực nghiệm. Chỉ số NDVI được Rousse và cộng sự đề xuất
năm 1974 trên cơ sở phân tích ảnh vệ tinh quang học Landsat và được xác định
theo công thức sau (Rouse et al., 1974):
(2.1)
Trong đó, NIR và RED là phổ phản xạ bề mặt ở kênh cận hồng ngoại và
kênh đỏ. Với ảnh Sentinel 2 MSI, kênh cận hồng ngoại và đỏ tương ứng với
kênh 8 và kênh 4.
Chỉ số NDVI nhận giá trị trong khoảng từ -1 đến +1, trong đó thực vật
có giá trị lớn hơn 0,2. Trong trường hợp chỉ số NDVI > 0,5, bề mặt được coi là
được phủ kín bởi thực vật (sóng điện từ không tới được lớp đất). Đối với đất
trống không có thực vật bao phủ, NDVI < 0,2. Đối với mặt nước và đất ẩm, chỉ
số NDVI nhận giá trị âm (Vũ Danh Tuyên và cộng sự, 2020).
Việc sử dụng chỉ số NDVI chiết xuất từ ảnh viễn thám quang học cho
phép xác định nhanh thông tin lớp phủ thực vật. Hơn nữa, do khả năng chụp
lặp lại và mức độ cập nhật cao của dữ liệu viễn thám, việc sử dụng chỉ số NDVI
cũng cho phép các mô hình dự báo nguy cơ cháy rừng có thông tin về lớp phủ
gần với thời gian thực hơn so với việc xác định từ các bản đồ địa hình, bản đồ
chuyên đề.
56
b) Thông tin độ ẩm bề mặt
Để xây dựng lớp thông tin độ ẩm bề mặt có thể sử dụng các chỉ số độ ẩm
đất (soil moisture index) hoặc độ bốc thoát hơi nước (Evaporation) xác định từ
ảnh viễn thám quang học. Hiện nay, có nhiều chỉ số độ ẩm đất khác nhau được
sử dụng phổ biến trong đánh giá mức độ ẩm bề mặt như chỉ số TVDI
(Temperature Vegetation Dryness Index), NDDI (Normalized Difference
Drought Index), LSWI (Land Surface Water Index), NMDI (Normalized Multi-
band Drought Index), SMI (Soil Moisture Index)...Các chỉ số độ ẩm này được
xây dựng trên cơ sở sử dụng các kênh ở dải sóng hồng ngoại và hồng ngoại
sóng ngắn, một số chỉ số sử dụng thêm thông tin nhiệt độ bề mặt chiết tách từ
các kênh hồng ngoại nhiệt (Wang and Qu, 2007). Ví dụ về phân cấp nguy cơ
cháy rừng từ chỉ số NMDI đối với khu vực Simitli Municipality (Bulgaria)
Hình 2.2 Ví dụ về phân cấp nguy cơ cháy rừng từ chỉ số NMDI (Avetisyan và Nedkov, 2015)
được trình bày trên hình 2.2 (Avetisyan và Nedkov, 2015).
57
Độ bốc thoát hơi nước cũng có thể được sử dụng trong xây dựng lớp
thông tin đầu vào về độ ẩm bề mặt. Bốc thoát hơi nước đóng một vai trò rất
quan trọng trong hệ sinh thái, kết nối các chu trình nước, carbon và năng lượng
toàn cầu. Tỉ lệ bốc thoát hơi nước của lớp phủ thực vật cho phép xác định tình
trạng sinh trưởng cũng như thiếu nước của cây trồng. Độ bốc thoát hơi nước
cao và độ ẩm bề mặt bị giảm sẽ tạo điều kiện thuận lợi cho phát sinh nguy cơ
cháy rừng.
Độ bốc thoát hơi nước có thể chiết xuất từ ảnh viễn thám quang học như
Landsat, MODIS..., trong đó sản phẩm độ bốc thoát hơi nước xác định từ ảnh
MODIS được sử dụng một cách rộng rãi và được cung cấp trên nền tảng GEE.
Do vậy, trong luận án này, đã sử dụng thông tin độ bốc thoát hơi nước để xây
dựng lớp dữ liệu đầu vào về độ ẩm bề mặt cho mô hình dự báo nguy cơ cháy
rừng.
c) Thông tin nhiệt độ bề mặt
Nhiệt độ bề mặt là một lớp thông tin rất quan trọng trong các mô hình
khí hậu, khí tượng nói chung, mô hình dự báo nguy cơ cháy rừng nói riêng.
Nhiệt độ bề mặt có thể được xác định bằng cách sử dụng các kênh hồng ngoại
nhiệt ảnh viễn thám như Landsat, Aster, MODIS...So với các phương pháp
nghiên cứu truyền thống, việc sử dụng dữ liệu viễn thám hồng ngoại nhiệt cho
phép chiết tách nhanh thông tin nhiệt độ bề mặt ở một khu vực rộng lớn, kể cả
thông tin nhiệt độ bề mặt trong quá khứ.
Trong số các dữ liệu ảnh viễn thám hồng ngoại nhiệt, ảnh hồng ngoại
nhiệt Landsat được sử dụng phổ biến và hiệu quả nhất do những ưu điểm nổi
bật như kho dữ liệu đa thời gian, độ phân giải không gian tốt và được cung cấp
miễn phí. Ngoài các kênh ảnh ở dải sóng quang học, bộ cảm biến hồng ngoại
nhiệt được trang bị trên các vệ tinh Landsat 4, Landsat 5, Landsat 7, Landsat 8
và Landsat 9 để thu nhận tín hiệu phản hồi về nhiệt độ của vật thể trên bề mặt
58
Trái đất. Đặc điểm các kênh hồng ngoại nhiệt ảnh vệ tinh Landsat được trình
Bảng 2.1. Đặc điểm ảnh hồng ngoại nhiệt Landsat
bày trong Bảng 2.1.
STT
Vệ tinh
Kênh
Bước sóng (µm)
Độ phân giải không gian (m)
1
Landsat 4/5 TM
6
10.40 – 12.50
120 m
2
Landsat 7 ETM+
6
10.40 – 12.50
60 m
10
10.30 – 11.30
100 m
Landsat 8/9
3
OLI_TIRS
11
11.50 – 12.50
100 m
+ Phương pháp sử dụng kênh đơn (single-channel)
Phương pháp single-channel trong xác định nhiệt độ bề mặt được đề xuất
bởi Cơ quan Hàng không vũ trụ Hoa Kỳ (NASA). Trong phương pháp này, đầu
tiên, giá trị số (DN - digital number) của kênh hồng ngoại nhiệt được chuyển
đổi sang giá trị thực của bức xạ điện từ (spectral radiance, Wm-2µm-1).
Đối với kênh hồng ngoại nhiệt ảnh Landsat 5 TM, giá trị bức xạ phổ được
xác định theo công thức sau:
(2.3)
Trong đó:
Lλ – Giá trị bức xạ phổ [W/(m2.sr.µm)];
DN – Giá trị số của ảnh (digital number);
DNmax – Giá trị số lớn nhất (=255);
DNmin – Giá trị số nhỏ nhất (=1);
Lmaxλ, Lminλ – Giá trị bức xạ phổ ứng với DNmax và DNmin ở từng kênh
phổ.
Giá trị các hệ số Lmaxλ và Lminλ được cung cấp trong tệp siêu dữ liệu
(metadata file) đi kèm theo sản phẩm ảnh vệ tinh Landsat.
59
Đối với ảnh Landsat 8/9 OLI_TIRS, giá trị bức xạ phổ được xác định
theo công thức sau:
(2.4)
Trong đó:
ML, AL – Hệ số chuyển đổi, được lấy trong tệp siêu dữ liệu (metadata
file) ảnh Landsat 8/9;
Qcal – Giá trị số của ảnh.
Ở bước tiếp theo, giá trị bức xạ phổ xác định ở bước trên được sử dụng
để tính nhiệt độ bức xạ (brightness temperature) theo công thức sau:
(2.5)
Trong đó:
TB – Nhiệt độ bức xạ (0K);
K1 – Hằng số chuyển đổi [W/(m2.sr.µm)];
K2 – Hằng số chuyển đổi [K];
Giá trị các hằng số K1, K2 được cung cấp trong tệp siêu dữ liệu ảnh
Landsat (Bảng 2.2).
Bảng 2.2 Giá trị K1, K2 đối với ảnh hồng ngoại nhiệt LANDSAT
10
LANDSAT 8/9
774.89
1321.08
11
LANDSAT 8/9
480.89
1201.14
6
LANDSAT TM
607.66
1260.56
6
LANDSAT ETM+
666.09
1282.71
Kênh Vệ tinh K1 (Watts.m-2.ster-1µm-1) K2 (K)
Cuối cùng, nhiệt độ bề mặt (LST – land surface temperature) được xác
định theo công thức sau:
60
(2.6)
Trong đó:
ℎ.𝑐
𝜆 – giá trị bước sóng trung tâm kênh hồng ngoại nhiệt;
𝜎
, σ – Hằng số Stefan Boltzmann (5.67.10-8 (Wm-2.K-4)); 𝜌 =
h – Hằng số Plank (6.626.10-34J.sec);
c – vận tốc ánh sáng (2.998.108 m/sec).
và Caseless, 1996):
ε – độ phát xạ bề mặt, được xác định theo công thức (2.7) như sau (Valor
(2.7)
Trong đó εv, εs – độ phát xạ bề mặt của thực vật và đất trống, được xác
định trên cơ sở chỉ số NDVI băng cách áp dụng thuật toán do Van de Griend
và Owen đề xuất (Van de Griend và Owen, 1993) theo công thức 2.8:
(2.8)
Pv là tỉ lệ thực vật trong từng pixel, được xác định theo công thức sau:
(2.9)
+ Phương pháp sử dụng 2 kênh hồng ngoại nhiệt (split-window)
Khác với phương pháp single-channel chỉ sử dụng một kênh hồng ngoại
nhiệt, nhiệt độ bề mặt được xác định bằng phương pháp Split-window trên cơ
al., 2006):
sở cả 02 kênh hồng ngoại nhiệt ảnh Landsat 8/9 theo công thức sau (Sobrino et
(2.10)
Trong đó:
61
TB10, TB11– nhiệt độ bức xạ (brightness temperature) xác định từ kênh 10
và 11 ảnh Landsat 8/9;
w – hàm lượng hơi nước trong khí quyển (g/cm2). w xác định theo
phương pháp do Huazhong đề xuất (Huazhong et al., 2004).
ε – giá trị độ phát xạ bề mặt trung bình;
Δε – chênh lệch độ phát xạ bề mặt ở kênh 10 và 11;
C0 đến C6 – Hệ số trong phương pháp SW (Sobrino et al., 2006).
Độ phát xạ bề mặt trung bình được lấy bằng trung bình cộng độ phát xạ
bề mặt đối với kênh 10 và kênh 11 ảnh Landsat 8/9 theo công thức sau:
(2.11)
Trong khi đó, chênh lệch độ phát xạ bề mặt ở kênh 10 và kênh 11 được
xác định như sau:
(2.12)
Trong đó, ε10 và ε11 là độ phát xạ bề mặt tại các kênh 10 và 11 ảnh vệ
tinh Landsat 8/9 xác định theo công thức (2.7). Giá trị độ phát xạ bề mặt của
đất trống và thực vật đối với kênh 10 và 11 ảnh vệ tinh Landsat 9 được tham
khảo theo nghiên cứu của Yu (Yu et al., 2014).
2.3 Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa lý
a) Độ cao (DEM)
DEM (mô hình số độ cao) là một trong những nguồn dữ liệu địa hình
phổ biến nhất trên thế giới, được lưu trữ ở định dạng ô lưới (grid/raster) và là
thông tin đầu vào của rất nhiều các mô hình quản lý tài nguyên, môi trường,
cảnh báo sớm thiên tai. DEM là dữ liệu đầu vào để tính toán các thông tin địa
hình như độ dốc, hướng dốc, độ dài sườn dốc, xác định lưu vực,...DEM có thể
62
được xây dựng trên cơ sở sử dụng phương pháp chụp ảnh lập thể, ảnh viễn thám
radar hoặc xây dựng từ các đường đồng mức trong bản đồ địa hình.
Hiện nay, có nhiều nguồn dữ liệu DEM toàn cầu được cung cấp miễn phí
với độ phân giải không gian cao, hỗ trợ hiệu quả cho các mục đích khác nhau,
từ quản lý tài nguyên, môi trường, phát triển kinh tế - xã hội và đảm bảo quốc
phòng - an ninh. Một số nguồn dữ liệu DEM toàn cầu miễn phí bao gồm:
+ Aster Global Digital Elevation Model (GDEM)
GDEM là sản phẩm mô hình số độ cao toàn cầu trong chương trình hợp
tác giữa NASA và chính phủ Nhật Bản thông qua hệ thống vệ tinh ASTER.
GDEM được xây dựng trên cơ sở phương pháp chụp ảnh lập thể, có độ phân
giải không gian 90m ở phạm vi toàn cầu và 30m ở lãnh thổ Hoa Kỳ. Do được
xây dựng từ dữ liệu viễn thám quang học, Aster GDEM được đánh giá chính
xác hơn SRTM tại các khu vực miền núi. Mặc dù vậy, Aster GDEM cũng có
nhược điểm khi độ chính xác không cao tại các khu vực bị mây che phủ do đặc
điểm thu nhận ảnh viễn thám quang học. Người dùng có thể tải miễn phí dữ
liệu Aster GDEM tại cơ sở dữ liệu Earth Explorer. Ví dụ về Aster GDEM với
https://lpdaac.usgs.gov/).
độ phân giải không gian 30m được trình bày trên hình 2.3 (nguồn:
63
Hình 2.3 Ví dụ về mô hình số độ cao Aster GDEM (nguồn https://lpdaac.usgs.gov/)
+ Space Shuttle Radar Topography Mission (SRTM)
Sứ mệnh địa hình tàu con thoi (SRTM) là dữ liệu DEM toàn cầu với độ
phân giải không gian 30m được thực hiện bởi Cơ quan hàng không vũ trụ Mỹ
(NASA) thông qua kỹ thuật radar giao thoa (InSAR) trên tàu con thoi
Endeavour. Sử dụng các ảnh radar ở băng tần C và X, SRTM bao phủ khoảng
80% diện tích Trái Đất và được lưu trữ trên cơ sở dữ liệu USGS Earth Explorer.
Đây là nguồn dữ liệu DEM với độ phân giải không gian cao, hỗ trợ hiệu quả
cho nhiều ứng dụng cụ thể.
Sản phẩm SRTM bao gồm các mức xử lý khác nhau:
- SRTM Non-void Filled: DEM được xử lý từ ảnh radar băng tần C với
độ phân giải không gian 30m đối với lãnh thổ Hoa Kỳ và 90m đối với
khu vực bên ngoài Hoa Kỳ.
- SRTM Void Filled: là kết quả quá trình xử lý bổ sung để khắc phục
việc thiếu dữ liệu ở một số khu vực trong bộ dữ liệu SRTM Non-void
Filled do quá trình xử lý ban đầu không đảm bảo yêu cầu chất lượng.
Quá trình lấp đầy dữ liệu này được thực hiện bằng các thuật toán nội
64
suy không gian kết hợp sử dụng các nguồn dữ liệu độ cao khác. Độ
phân giải không gian của SRTM Void Filled đạt 30m tại lãnh thổ Hoa
Kỳ và 90m bên ngoài Hoa Kỳ.
- SRTM1 Arc-second Global: dữ liệu DEM trên phạm vi toàn thế giới
với độ phân giải không gian 30m, được lưu trữ trên cơ sở dữ liệu
Hình 2.4 Mô hình DEM SRTM khu vực Nghệ An (nguồn https://lpdaac.usgs.gov/)
EarthExplorer.
+ JAXA’s Global ALOS 3D World
ALOS 3D World là mô hình số bề mặt (DSM – Digital Surface Model)
với độ phân giải không gian 30m do Cơ quan Hàng không vũ trụ Nhật Bản
(JAXA) xây dựng bằng phương pháp chụp ảnh lập thể từ hệ thống vệ tinh
ALOS. Đây được xem là bộ dữ liệu độ cao ở quy mô toàn cầu có độ chính xác
cao nhất hiện nay. So sánh dữ liệu độ cao ALOS 3D World và SRTM được
trình bày trên hình 2.5, trong đó có thể nhận thấy độ phân giải không gian của
dữ liệu ALOS 3D World tốt hơn rất nhiều so với SRTM.
65
b)
a)
Hình 2.5 So sánh dữ liệu mô hình số độ cao JAXA’s Global ALOS 3D World (a) và SRTM (b) (nguồn: https://www.satpalda.com/alos-world-3d)
+ GMTED 2010, GTOPO30
GMTED 2010 là dữ liệu độ cao toàn cầu với 3 độ phân giải không gian:
225m, 450m và 1km. GMTED 2010 là bộ dữ liệu thay thế cho dữ liệu mô hình
số độ cao GTOPO30 (độ phân giải không gian 1km), và được ứng dụng cho
các khu vực có diện tích lớn như ở quy mô quốc gia, châu lục.
Dữ liệu GMTED 2010 và GTOPO30 được thu thập từ nhiều nguồn khác
nhau bằng phương pháp tổng hợp. So sánh hai bộ dữ liệu mô hình số độ cao
2011).
GMTED 2010 và GTOPO30 được trình bày trên hình 2.6 (Danielson và Gesch,
66
Hình 2.6 So sánh dữ liệu mô hình số độ cao GMTED 2010 và GTOPO30 (Danielson và Gesch, 2011)
b) Hướng dốc (Aspect)
Bề mặt thường được định theo một hướng cụ thể. Hướng này được gọi
là hướng của góc dốc (aspect). Hai góc, một là góc đo hướng và một góc chỉ
độ nghiêng của sườn dốc xác định hướng dốc. Phương pháp toán học để xác
định các hướng là tính toán góc của gradient so với hướng Bắc. Phương vị (góc
tạo bởi sự dịch chuyển theo chiều kim đồng hồ từ hướng Bắc tới hướng của góc
dốc cực đại) nằm trong khoảng từ 0o tới 360o, nó tương ứng với những hướng
sau: Bắc, Đông, Nam, Tây hoặc ở vị trí nào đó giữa 4 hướng chính trên. Hiệu
giữa 90o và góc gradient thể hiện độ nghiêng của góc dốc dọc theo một hướng
xác định. Góc lệch này càng nhỏ thì độ dốc càng lớn (Aronoff, 1989).
Ví dụ về kết quả xác định hướng dốc từ DEM được trình bày trên hình
2.7 (Mokarram và Zarei, 2018).
67
Hình 2.7 Ví dụ về kết quả xác định hướng dốc từ DEM (Mokarram và Zarei, 2018)
Hướng dốc là một lớp thông tin về bề mặt địa hình trong nhiều mô hình
dự báo, cảnh báo thiên tai, trong đó có mô hình dự báo nguy cơ cháy rừng.
Hướng dốc có thể được xác định trên cơ sở phân tích mô hình số độ cao (DEM).
Các phần mềm GIS thông dụng hiện nay như ArcGIS, MapInfo, MicroStation
đều có các công cụ để tính toán hướng dốc từ dữ liệu DEM.
c) Độ dốc (Slope)
Độ dốc (góc dốc) là tham số đưa ra độ dốc của địa hình bằng cách tính
toán mức độ thay đổi của độ cao. Độ dốc có thể được xác định theo đơn vị độ
(0 – 900) hoặc phần trăm là hàm tang của góc dốc (độ dốc 45 độ tương ứng với
độ dốc 100%). Độ dốc của địa hình thường được xác định từ mô hình số độ cao
(DEM). Độ dốc là thông số đầu quan trọng vào của nhiều mô hình đánh giá,
phân vùng nguy cơ xói mòn, trượt lở, thoái hóa đất; lũ quét…sử dụng dữ liệu
liệu GIS và viễn thám. Hình 2.8 trình bày ví dụ về kết quả tính độ dốc từ mô
hình số độ cao (DEM) trong cảnh báo nguy cơ trượt lở đất tại khu vực Sikkim
(Ấn Độ) (James và Thallak, 2015).
68
Hình 2.8 Ví dụ về xác định độ dốc từ DEM (James và Thallak, 2015)
2.4 Nhóm các lớp thông tin khác
Các lớp dữ liệu Tốc độ gió, Lượng mưa trung bình tháng được trích xuất
qua cơ sở dữ liệu WorldClim (https://www.worldclim.org/). WorldClim là một
cơ sở dữ liệu về dữ liệu thời tiết và khí hậu toàn cầu có độ phân giải không gian
cao. Những dữ liệu này có thể được sử dụng để lập bản đồ và mô hình hóa
không gian. Trong luận án, lựa chọn sử dụng bộ dữ liệu có độ phân giải không
gian 30s (~1km2) trước khi nội suy về độ phân giải 10m để phù hợp với độ phân
giải của các lớp thông tin khác. Ví dụ về bản đồ lớp thông tin tốc độ gió khu
vực vườn quốc gia Tam Đảo (Việt Nam) trích xuất từ cơ sở dữ liệu WorldClim
được trình bày trên hình 2.9 (Pham Duc Dat và Le Thai Son, 2022).
69
Hình 2.9 Thông tin về tốc độ gió khu vực vườn quốc gia Tam Đảo trích xuất từ
CSDL WorldClim (Pham Duc Dat và Le Thai Son, 2022)
Lớp dữ liệu Mật độ dân số được trích xuất qua tập dữ liệu nhân khẩu học
WorldPop (https://data.worldpop.org/). WorldPop đã phát triển các phương
pháp nhằm xây dựng dữ liệu không gian địa lý mở và có độ phân giải cao về
phân bố dân cư, nhân khẩu học và động lực học, tập trung vào các quốc gia có
thu nhập thấp và trung bình. Trong luận án này, thông tin mật độ dân số của
khu vực nghiên cứu được trích xuất theo ranh giới 6 huyện phía tây tỉnh Nghệ
An từ dữ liệu mật độ dân số WorldPop năm 2020, sau đó nội suy về độ phân
giải 10m. Bản đồ mật độ dân số toàn cầu năm 2020 từ cơ sở dữ liệu WolldPop
được trình bày trên hình 2.10 (https://data.worldpop.org/).
70
Hình 2.10 Thông tin về mật độ dân số toàn cầu năm 2020 trích xuất từ CSDL
WorldPop (https://data.worldpop.org/)
2.5 Phương pháp xử lý dữ liệu trên nền tảng Google Earth Engine
Xử lý dữ liệu viễn thám đa thời gian trên các nền tảng địa không gian mở như
Google Earth Engine (GEE) là một xu hướng công nghệ phổ biến và phù hợp trong
điều kiện hiện nay. Hiện nay có hàng trăm hệ thống vệ tinh viễn thám khác nhau của
nhiều quốc gia trên thế giới đã và đang hoạt động, cung cấp nguồn dữ liệu viễn thám
khổng lồ, đa thời gian, đa chủng loại. Điều này cũng dẫn đến khó khăn về hạ tầng lưu
trữ khi xử lý dữ liệu lớn viễn thám. Việc sử dụng các nền tảng địa không gian mở
trong xử lý trực tuyến dữ liệu viễn thám đa thời gian là một tiếp cận phù hợp và hiệu
quả, giúp giải quyết các khó khăn về cơ sở hạ tầng viễn thám, nhất là với các ứng
dụng đòi hỏi dữ liệu viễn thám lớn.
Google Earth Engine (GEE) là một nền tảng phân tích không gian địa lý
dựa trên điện toán đám mây cho phép người dùng trực quan hóa và phân tích
hình ảnh vệ tinh Trái đất. Bộ dữ liệu của GEE lưu trữ dữ liệu viễn thám của các
hệ thống vệ tinh trong giai đoạn 40 năm qua, cùng với các công cụ tính toán
cần thiết để phân tích và khai thác kho dữ liệu khổng lồ đó mà không cần phải
71
tải về máy tính. Không những thế, dữ liệu từ GEE có thể sử dụng trên các phần
mềm khác như QGIS, GIS, Foris để tối ưu hóa dữ liệu. Nền tảng được sử dụng
miễn phí với mục đích nghiên cứu, giáo dục và mục đích phi lợi nhuận. Danh
mục dữ liệu công khai của GEE bao gồm nhiều bộ dữ liệu raster lên đến 5 triệu
Hình 2.11 Giao diện Code Editor trong GEE (nguồn: https://geohackweek.github.io/)
gigabyte (5 petabyte).
GEE làm việc thông qua giao diện trực tuyến của ứng dụng JavaScript
(API) được gọi là Code Editor (hình 2.11). Trên giao diện này, người dùng có
thể viết và chạy các tập lệnh để xử lý dữ liệu không gian. Code Editor giúp
người dùng thực hiện toàn bộ các chức năng có trong Earth Engine. Bên cạnh
đó, người dùng cũng có thể tạo một tập lệnh khác tùy theo mục đích nghiên cứu
của mình bằng cách truy cập https://code.earthengine.google.com/.
Bằng việc sử dụng và mở rộng ứng dụng với bộ mã lệnh API, người sử
dụng có thể tùy biến công cụ phục vụ các mục đích khác nhau. GEE hỗ trợ xây
dựng chuỗi bản đồ đa thời gian, đặc biệt là các thông tin về thời tiết, khí hậu.
72
Bên cạnh đó, GEE cho phép người sử dụng có thể chủ động xây dựng các công
cụ chạy trên nền tảng GEE, giúp xử lý nhanh dữ liệu viễn thám phục vụ các
mục đích cụ thể, trong đó có dự báo nguy cơ cháy rừng. Minh họa về bộ mã
lệnh API trong GEE được trình bày trên hình 2.12 (nguồn:
Hình 2.12 Minh họa về bộ mã lệnh API trong GEE (nguồn: https://serc.carleton.edu/)
https://serc.carleton.edu).
Như vậy, có thể nhận định, việc sử dụng các nền tảng địa không gian mở
như GEE là một tiếp cận phù hợp và hiệu quả cho các bài toán xử lý dữ liệu
viễn thám đa thời gian, giúp nâng cao hiệu quả sử dụng các nguồn dữ liệu viễn
thám miễn phí, hỗ trợ tốt hơn công tác cảnh báo sớm và dự báo nguy cơ cháy
rừng.
2.6 Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn
thám và hệ thông tin địa lý
2.6.1 Phương pháp phân tích thứ bậc AHP
73
Phương pháp AHP được phát triển bởi Saaty là một trong những cách
tiếp cận phân tích đa chỉ tiêu (MCA) linh hoạt và thuận lợi nhất, đã được sử
dụng rộng rãi trong xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu
viễn thám và GIS. Phương pháp dự báo nguy cơ cháy rừng từ dữ liệu viễn thám
và GIS trên cơ sở phương pháp phân tích thứ bậc AHP bao gồm các bước cơ
bản sau (Saaty, 2000; Saaty, 2008):
Bước 1: Xác định các yếu tố có liên quan đến nguy cơ cháy rừng (lớp
phủ thực vật, độ ẩm bề mặt, nhiệt độ, độ dốc, hướng dốc...), sắp xếp chúng theo
cấu trúc thứ bậc.
Bước 2: Xác định mức độ quan trọng tương đối của các chỉ tiêu bằng
cách so sánh cặp.
Việc so sánh được thực hiện giữa các cặp chỉ tiêu với nhau và tổng hợp
lại thành một ma trận gồm n dòng và n cột (n là số chỉ tiêu). Phần tử aij thể
hiện mức độ quan trọng của chỉ tiêu hàng i so với chỉ tiêu cột j.
𝑛×𝑛
= [ ] (2.13) 𝐴 = (𝑎𝑖𝑗) 1 𝑎21 ⋮
… 𝑎1𝑛 … 𝑎2𝑛 ⋮ ⋮ … 1 𝑎12 1 ⋮ 𝑎𝑛1 𝑎𝑛2
Mức độ quan trọng tương đối của chỉ tiêu i so với j được tính theo tỷ lệ
k (k từ 1 đến 9), ngược lại của chỉ tiêu j so với i là 1/k. Như vậy aij> 0, aij =
1/aji, aii =1 (Saaty, 2000; Saaty, 2008).
Bảng 2.3: Thang điểm so sánh mức độ quan trọng của các chỉ tiêu
Định nghĩa
Giải thích
Mức độ quan trọng 1
Quan trọng bằng nhau
Quan trọng vừa phải
3
Quan trọng mạnh
5
Hai yếu tố có mức quan trọng bằng nhau Kinh nghiệm và nhận định hơi nghiêng về yếu tố này hơn yếu tố kia Kinh nghiệm và nhận định nghiêng mạnh về yếu tố này hơn yếu tố kia
74
7
Quan trọng rất mạnh
9
Quan trọng tuyệt đối
2,4,6,8
Mức trung gian giữa các mức trên
Một yếu tố được ưu tiên rất mạnh hơn yếu tố kia và được biểu lộ trong thực tế Sự quan trọng của yếu tố này hơn yếu tố kia ở mức cao nhất Cần sự thỏa hiệp giữa hai mức độ nhận định
Bước 3: Tính tỷ số nhất quán (CR) của từng ma trận so sánh cặp. Những
ma trận so sánh có tỷ số nhất quán (CR) ≤ 10% thì đưa vào tính toán tổng hợp,
ngược lại thì cần phải thẩm định lại mức độ quan trọng của các chỉ tiêu. Chỉ số
nhất quán được xác định theo công thức (Saaty, 2000; Saaty, 2008):
(2.14)
Trong đó: CI - chỉ số nhất quán, là chỉ số đo lường mức độ chệch hướng nhất
quán, được xác định theo công thức (Saaty, 2000; Saaty, 2008):
(2.15)
Với λmax là giá trị trung bình của vector nhất quán và n là số chỉ tiêu:
(2.16)
RI là chỉ số ngẫu nhiên, hay giá trị trung bình của CI khi nhận định so
sánh ngẫu nhiên, phụ thuộc vào số chỉ tiêu được so sánh.
6 1.24
10 1.49
7 1.34
9 1.45
1 0.00
2 0.00
3 0.52
8 1.40
4 0.89
N RI
Bảng 2.4: Bảng tra giá trị RI theo số lượng chỉ tiêu khác nhau (Saaty, 2000; Saaty, 2008) 5 1.11
Bước 4: Tính toán trọng số (W) cho từng chỉ tiêutheo phương pháp
vector riêng hoặc phương pháp chuẩn hóa ma trận.
Bước 5: Tổng hợp chỉ số thích nghi theo công thức:
(2.17)
75
Trong đó, S là chỉ số thích nghi, Wi là trọng số của chỉ tiêu i, Xi là giá
trị (đã lượng hóa) của chỉ tiêu i, i là chỉ tiêu (i = 1, n).
Bước 6: Chuyển đổi từ chỉ số thích nghi sang mức độ thích nghi (S1, S2,
S3, N).
Trong mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS
trên cơ sở phương pháp phân tích thứ bậc AHP, ứng với mỗi chỉ tiêu (yếu tố
ảnh hưởng đến khả năng xảy ra cháy rừng) sẽ xây dựng một lớp thông tin
chuyên đề GIS, tiến hành tổng hợp và chồng xếp các lớp thông tin, tích hợp các
trọng số đánh giá và phân loại theo cấp độ ảnh hưởng phù hợp để thành lập bản
đồ dự báo nguy cơ cháy rừng.
2.6.2 Phương pháp sử dụng thuật toán Rừng ngẫu nhiên
Rừng ngẫu nhiên là một thuật toán học máy có giám sát được sử dụng
rộng rãi trong các bài toán hồi quy và phân loại, đồng thời tạo ra kết quả phân
loại tốt ngay cả khi không điều chỉnh siêu tham số. Đây là một trong các thuật
toán được sử dụng phổ biến nhất trong các mô hình dự báo thiên tai do ưu điểm
đơn giản và độ chính xác cao của thuật toán. RF hoạt động trên cơ sở xây dựng
nhiều cây quyết định (decision tree) trên các mẫu huấn luyện, mỗi cây quyết
định sẽ khác nhau (có yếu tố random). Sau đó ở bước dự đoán, với một dữ liệu
mới, đối với mỗi cây quyết định sẽ đi từ trên xuống theo các node (nút) điều
kiện để được các dự đoán, sau đó kết quả cuối cùng được tổng hợp từ kết quả
của các cây quyết định (Hình 2.13). Như vậy, Random Forest lấy ngẫu nhiên
dữ liệu và thuộc tính để xây dựng cây quyết định (Breiman, 2001).
Về mặt toán học, khi phân tích một đặc trưng, việc phân chia ngưỡng
khác nhau sẽ dẫn tới việc kết quả phân loại khác nhau, đồng thời có thể xảy ra
trường hợp với cùng ngưỡng phân loại cho đặc trưng đó nhưng có kết quả phân
loại khác nhau. Chính vì vậy, chỉ số Gini được sử dụng để xác định nhiễu trong
76
tập dữ liệu. Giả sử tập dữ liệu được phân loại thành hai lớp A và B, chỉ số Gini
được xác định (Breiman, 2001):
Hình 2.13 Sơ đồ thuật toán RF trong phân loại (chỉnh sửa từ nguồn: https://www.section.io/)
(2.18)
Trong đó, PA là xác suất của dữ liệu thuộc lớp A, PB là xác suất của dữ
liệu thuộc lớp B. Công thức trên sử dụng xác suất để xác định giá trị chỉ số Gini
trên mỗi nhánh đặc trưng, mỗi phân ngưỡng trên mỗi đặc trưng, xác định nhánh
nào có nhiều khả năng xảy ra nhất.
Ngoài ra, chỉ số Entropy cũng được sử dụng để xác định khả năng xảy ra
2001):
trên các nút phân nhánh. Chỉ số Entropy được tính theo công thức (Breiman,
(2.19)
Thuật toán Random Forest tỏ ra hữu ích đối với nhiều loại dữ liệu khác
nhau, bao gồm cả các lớp dữ liệu không gian. Đây là thuật toán dễ sử dụng, quá
77
trình đào tạo nhanh và kết quả phân loại (dự đoán) có độ chính xác cao. Sơ đồ
thuật toán RF được trình bày trên hình 2.13.
2.6.3 Phương pháp sử dụng thuật toán Máy hỗ trợ vector
Máy hỗ trợ vector (SVM) là một thuật toán quan trọng và hiệu quả trong
những thuật toán học máy, được sử dụng trong cả phân lớp và hồi quy. SVM
được sự dụng phổ biến ngay từ khi mới được phát triển vào những năm 1990
và được áp dụng cho nhiều mô hình dự báo thiên tai, thảm họa tự nhiên. Khác
với nhiều thuật toán học máy khác như mạng neural, người sử dụng không phải
thực hiện nhiều tinh chỉnh trong quá trình thực hiện để có được kết quả dự báo
tốt với thuật toán SVM.
Vapnik, 1995; Drucker et al., 1997):
Cơ sở toán học của thuật toán SVM có thể được hiểu như sau (Corters và
Cho vectơ , khi đó độ dài của x được gọi là chuẩn của x,
ký hiệu là , được tính theo công thức:
(2.20)
Tích vô hướng của hai vectơ x và y được tính như sau:
(2.21)
Giả sử, cho tập dữ liệu , . Để phân loại tập
dữ liệu với các nhãn yi cần phải xác định một siêu phẳng F sao cho các dữ liệu
cùng nhãn sẽ được phân loại về một phía của mặt phẳng. F được xác định như
sau:
(2.22)
Với các điểm dữ liệu x đã cho, khoảng cách từ điểm dữ liệu đó tới mặt
phẳng phân loại được xác định như sau:
78
Hình 2.14 Mô tả các vector hỗ trợ trong thuật toán SVM
(2.23)
Mục tiêu của thuật toán SVM là tìm một siêu phẳng trong không gian N
chiều (ứng với N đặc trưng) để phân loại được các điểm dữ liệu, hay nói cách
khác, mục tiêu là tối đa hoá khoảng cách của các điểm dữ liệu tới siêu phẳng
(hình 2.14). Hàm tối ưu có thể viết dưới dạng:
(2.24)
Khi đó, các nhãn được dự đoán sẽ có dạng:
(2.25)
Tuy nhiên để việc tìm một siêu phẳng có thể phân chia chính xác tuyệt
đối các điểm dữ liệu là không thể xảy ra trong thế giới thực. Chính vì vậy, các
thuật toán SVM thường bổ sung các tham số C (tham số phạt) và đại diện cho
mức độ lỗi khi phân loại. Khi đó, hàm tối ưu có thể viết dưới dạng:
79
(2.26)
Tham số C càng lớn có nghĩa là SVM càng bị phạt nặng khi thực hiện
kết quả phân loại sai, từ đó dẫn đến lề (margin) càng hẹp và có ít vector hỗ trợ
Hình 2.15 Thuật toán SVM với giá trị tham số C khác nhau (Liu, 2020)
được sử dụng (hình 2.15).
2.6.4 Phương pháp sử dụng thuật toán cây phân loại và hồi quy
Thuật toán cây phân loại và hồi quy (CART - Classification and
Regression Trees) là một kỹ thuật học máy có giám sát được sử dụng phổ biến
để dự đoán biến mục tiêu định tính (cartegorical target variable), tạo cây phân
loại hoặc biến mục tiêu liên tục (continuous target variable), tạo ra cây hồi quy.
Việc phân loại của CART đòi hỏi một cây nhị phân, là sự kết hợp của một nút
(nodes) gốc ban đầu, các nút quyết định và các nút cuối. Nút gốc và mỗi nút
quyết định đại diện cho một đặc tính và giá trị ngưỡng của đặc tính đó. Do ưu
điểm dễ hiểu và đơn giản, CART là một trong những phương pháp học máy
được sử dụng phổ biến nhất hiện nay (Breiman et al., 1984). Mô tả sở đồ thuật
toán CART được trình bày trên hình 2.16.
80
Hình 2.16 Mô tả thuật toán Cây Phân loại và hồi quy CART (nguồn:
https://www.javatpoint.com/)
Thuật toán Cây Phân loại và hồi quy CART yêu cầu phân loại cây dữ liệu
sao cho phần phân tách là tốt nhất. CART có thể sử dụng chỉ số Gini giống như
thuật toán Random Forest. Trong thuật toán CART, chỉ số Gini dùng để đánh
giá xem việc phân chia ở các nút điều kiện có chính xác hay không. Để tìm
cách phân loại tốt nhất cần tính tổng trọng số của chỉ số Gini cho toàn bộ các
nút con và sau đó lấy phần có chỉ số Gini thấp nhất làm phần có độ chính xác
phân loại tốt nhất.
So với các thuật toán học máy khác như Rừng ngẫu nhiên (Random
Forest), máy hỗ trợ vector (SVM), thuật toán Cây Phân loại và hồi quy (CART)
có ưu điểm đơn giản và tốc độ tính toán nhanh hơn, cho phép người sử dụng
xây dựng các mô hình dự báo một cách nhanh chóng. Random Forest tạo ra
nhiều cây CART dựa trên các mẫu dữ liệu và sau đó kết hợp các dự đoán, do
vậy có hiệu suất làm việc và độ chính xác dự đoán tốt hơn so với một mô hình
CART đơn lẻ. Tuy nhiên, trong một số bài toán, mô hình Random Forest sẽ có
thời gian xử lý lâu hơn do sự ràng buộc của các biến trong mô hình, khi đó việc
sử dụng thuật toán CART là một tiếp cận phù hợp.
81
2.6.5 Sơ đồ mô hình dự báo nguy cơ cháy rừng
Từ việc phân tích tổng quan dữ liệu đầu vào và cơ sở khoa học các
phương pháp xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám
và GIS, trong luận án NCS đề xuất sơ đồ quy trình công nghệ như sau.
Bước 1: Khảo sát khu vực nghiên cứu, thu thập dữ liệu
Trong bước này, sau khi nghiên cứu, khảo sát và phân tích đặc điểm khu
vực thử nghiệm cũng như hiện trạng nguồn dữ liệu, dữ liệu đầu vào bao gồm
ảnh vệ tinh (ảnh Landsat 8/9, Sentinel 2 MSI), mô hình số độ cao (DEM) và
các lớp dữ liệu khác như mật độ dân số, lượng mưa trung bình tháng, tốc độ gió
được thu thập để xây dựng các lớp thông tin đầu vào cho mô hình dự báo nguy
cơ cháy rừng, cụ thể như sau:
Ảnh Landsat 8/9 thu thập từ cơ sở dữ liệu của Cục Khảo sát Địa chất Hoa
Kỳ (USGS) dùng để chiết tách thông tin nhiệt độ bề mặt. Ảnh Sentinel 2 MSI
thu thập từ cơ sở dữ liệu của Cơ quan Hàng không vũ trụ Châu Âu (ESA) dùng
để tính chỉ số thực vật NDVI.
Mô hình số độ cao được sử dụng trong luận án là dữ liệu DEM SRTM
với độ phân giải không gian 30m dùng để xây dựng các lớp thông tin về địa
hình khu vực nghiên cứu (độ dốc, độ cao, hướng dốc).
Các lớp dữ liệu khác bao gồm mật độ dân số được thu thập từ cơ sở dữ
liệu WorldPop, lượng mưa trung bình tháng và tốc độ gió được thu thập từ cơ
sở dữ liệu WorldClim. Các lớp dữ liệu này có thể sử dụng từ nền tảng điện toán
đám mây (GEE). Độ bốc thoát hơi nước cũng được thu thập từ nền tảng GEE
trên cơ sở dữ liệu ảnh vệ tinh quang học MODIS.
Dữ liệu điểm cháy rừng được thu thập tại website của Cục Kiểm lâm (Bộ
Nông nghiệp và Phát triển nông thôn) về quản lý cháy rừng, mất rừng và khai
thác thông tin tại địa chỉ http://watch.pcccr.vn/thongKe/diemChay. Ngoài ra,
dữ liệu các điểm cháy tại các CSDL quốc tế như NASA cũng được sử dụng cho
82
mô hình học máy và đánh giá độ chính xác kết quả dự báo nguy cơ cháy rừng.
Các điểm cháy này được chia thành 2 nhóm: nhóm sử dụng phục vụ các mô
hình học máy và nhóm dùng để đánh giá độ chính xác các mô hình dự báo.
Bước 2: Xây dựng các lớp thông tin đầu của mô hình
9 lớp thông tin đầu vào của mô hình dự báo nguy cơ cháy rừng từ dữ liệu
viễn thám và GIS được trích xuất và xây dựng từ dữ liệu đầu vào, cụ thể:
+ Lớp thông tin về lớp phủ thực vật,được chiết xuất từ ảnh vệ tinh quang
học Sentinel 2 MSI thông qua chỉ số thực vật NDVI (công thức 2.1), trong đó
sử dụng giá trị phản xạ phổ tại kênh 8 (cận hồng ngoại) và kênh 4 (đỏ).
+ Lớp thông tin nhiệt độ bề mặt được chiết xuất từ ảnh vệ tinh Landsat
8/9 trên cơ sở sử dụng các kênh hồng ngoại nhiệt và thông tin về độ phát xạ bề
mặt xác định trên cơ sở chỉ số NDVI. Trong luận án này, phương pháp sử dụng
đơn kênh (single-channel) được lựa chọn do sự đơn giản trong tính toán cũng
như có độ chính xác đảm bảo.
+ Lớp thông tin về độ bốc thoát hơi nước được thu thập từ nền tảng GEE,
sau đó biên tập theo ranh giới khu vực nghiên cứu.
+ Các lớp thông tin về địa hình, bao gồm độ cao, độ dốc (góc dốc), hướng
sường (aspect) được trích xuất từ mô hình số độ cao (DEM) SRTM.
+ Lớp thông tin về mật độ dân số được xây dựng trên cơ sở dữ liệu dân
số tại cơ sở dữ liệu WorldPop, lớp thông tin về tốc độ gió và lượng mưa trung
bình tháng được xây dựng bằng dữ liệu đầu vào thu thập từ cơ sở dữ liệu
WorldClim.
Tất cả các lớp thông tin đầu vào này được trình bày ở cấu trúc dữ liệu
raster, sau đó nội suy về độ phân giải (kích thước pixel) 10m để đồng bộ hóa
các lớp dữ liệu đầu vào của mô hình dự báo nguy cơ cháy rừng.
83
Hình 2.17 Sơ đồ quy trình công nghệ lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS
84
Bước 3: Thử nghiệm lựa chọn mô hình dự báo nguy cơ cháy rừng bằng
phương pháp phân tích thứ bậc AHP và các thuật toán học máy (RF, SVM,
CART)
Để lựa chọn mô hình dự báo nguy cơ cháy rừng phù hợp với đặc điểm
khu vực nghiên cứu tại phía tây tỉnh Nghệ An, trong luận án tiến hành thử
nghiệm với 04 phương pháp: phương pháp phân tích thứ bậc AHP và 03 thuật
toán học máy (RF, SVM, CART).
Đối với phương pháp sử dụng kỹ thuật phân tích thứ bậc AHP, trong luận
án tiến hành tính các trọng số ảnh hưởng đến nguy cơ cháy rừng của từng yếu
tố đầu vào, sau đó xây dựng bản đồ dự báo.
Đối với các mô hình học máy (RF, SVM, CART), trong luận án sử dụng
bộ dữ liệu mẫu các điểm cháy rừng, trích xuất đặc trưng tương ứng trên các lớp
dữ liệu, đồng thời gán nhãn cho mẫu thành lớp “cháy” và “không cháy” phục
vụ quá trình học tập của mô hình. Tại kết quả đầu ra của các mô hình học máy,
kết quả trả về xác suất về khả năng cháy rừng đối với toàn bộ điểm các ảnh tại
khu vực nghiên cứu. Cuối cùng, bản đồ phân vùng nguy cơ cháy rừng được
thành lập bằng cách phân ngưỡng theo các mức độ nguy cơ cháy rừng khác
nhau, từ thấp đến cao.
Bước 4: Đánh giá độ chính xác các mô hình dự báo nguy cơ cháy rừng
Bên cạnh bộ dữ liệu các điểm cháy rừng sử dụng cho mô hình học máy,
một phần dữ liệu này cũng được sử dụng để đánh giá độ chính xác. Vị trí các
điểm cháy và không cháy được kiểm tra trên kết quả dự báo của từng mô hình
để đánh giá mức độ phù hợp của các mô hình dự báo.
Ngoài ra, đường cong ROC cũng được sử dụng để đánh giá, so sánh độ
chính xác của các mô hình dự báo.
Bước 5: Lựa chọn mô hình dự báo phù hợp với khu vực thử nghiệm
Từ kết quả đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy
85
rừng (AHP, RF, SVM, CART), trong luận án lựa chọn mô hình có độ chính xác
cao nhất để tiến hành áp dụng cho khu vực nghiên cứu.
Bước 6: Xây dựng bản đồ dự báo nguy cơ cháy rừng
Tại bước này, bản đồ dự báo nguy cơ cháy rừng khu vực nghiên cứu
được xây dựng trên cơ sở mô hình dự báo được lựa chọn ở bước 5, trong đó
nguy cơ xảy ra cháy rừng được chia thành 5 cấp: rất thấp, thấp, trung bình, cao
và rất cao.
2.7 Tiểu kết chương 2
Trong chương 2, đã nghiên cứu tổng quan về dữ liệu đầu vào cho mô
hình dự báo nguy cơ cháy từng từ dữ liệu viễn thám và GIS. Trên cơ sở đó,
luận án đã lựa chọn 09 lớp thông tin đầu vào để xây dựng mô hình dự báo nguy
cơ cháy rừng, bao gồm: mật độ dân số, lớp phủ thực vật, độ ẩm bề mặt (độ bốc
thoát hơi nước bề mặt), hướng sườn, độ dốc, tốc độ gió, độ cao, nhiệt độ bề mặt
và lượng mưa trung bình tháng.
Các lớp thông tin về lớp phủ thực vật, độ bốc thoát hơi nước bề mặt,
nhiệt độ bề mặt được chiết tách từ dữ liệu viễn thám (ảnh vệ tinh Landsat và
Sentinel 2 MSI, ảnh MODIS). Các lớp thông tin về địa hình như độ dốc, độ
cao, hướng sườn được trích xuất từ mô hình số độ cao DEM SRTM với độ phân
giải 30m. Các lớp thông tin còn lại như tốc độ gió, lượng mưa trung bình tháng
được trích xuất từ CSDL WolrdClim, mật độ dân số được trích xuất từ CSDL
WorldPop.
Để dự báo nguy cơ cháy rừng, 04 phương pháp được thử nghiệm, bao
gồm: phương pháp phân tích thứ bậc AHP và 03 phương pháp học máy (RF,
SVM, CART). Độ chính xác của các mô hình dự báo này được đánh giá, so
sánh trên cơ sở dữ liệu về các điểm cháy rừng của Cục Kiểm lâm (Bộ Nông
nghiệp và Phát triển Nông thôn).
86
Trong chương 2, đề xuất được sơ đồ quy trình công nghệ xây dựng mô
hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS, làm cơ sở để tiến
hành thực nghiệm trong chương 3.
87
CHƯƠNG 3. THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY RỪNG
KHU VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU VIỄN THÁM
VÀ HỆ THÔNG TIN ĐỊA LÝ
3.1 Đặc điểm dữ liệu sử dụng
3.1.1 Dữ liệu viễn thám
Dữ liệu viễn thám sử dụng trong luận án các ảnh vệ tinh quang học
Sentinel 2 MSI và Landsat 8, thu thập từ cơ sở dữ liệu Copernicus của Cơ quan
Hàng không vũ trụ châu Âu (ảnh Sentinel 2 MSI) và Cục Khảo sát Địa chất Mỹ
(USGS, ảnh Landsat 8). Dữ liệu viễn thám được thu thập và xử lý trực tiếp trên
nền tảng điện toán đám mây GEE.
65 cảnh ảnh Sentinel 2 MSI, bao gồm ảnh Sentinel 2A và Sentinel 2B ở các
phiên hiệu T48 QUG, T48 QVG, T48 QWG, T48 QVF và T48 QWF chụp giai
đoạn từ 15/11/2021 đến 16/01/2022 được sử dụng để tạo ảnh không mây khu vực
nghiên cứu (phía tây tỉnh Nghệ An). Những ảnh có độ che phủ của mây lớn hơn
80% không được lựa chọn do chúng có ít giá trị trong việc lọc mây, hơn nữa
các pixels mây trong ảnh có thể tạo ra nhiễu khó kiểm soát trong quá trình tính
toán. Ảnh Sentinel 2 MSI khu vực thực nghiệm được tiến hành lọc mây và lọc
bóng mây bằng cách sử dụng thuật toán Google cloudScore để tạo mặt nạ cho
đám mây và Temporal Dark Outlier Mask (TDOM) cho bóng mây. Quá trình
xử lý nhằm loại bỏ ảnh hưởng của mây đến ảnh vệ tinh Sentinel 2 MSI được
thực hiện trên nền tảng GEE. Kết quả tạo ảnh Sentinel 2 MSI không mây từ bộ
ảnh Sentinel 2 MSI giai đoạn 15/11/2021 đến 16/01/2022 đối với khu vực
nghiên cứu ở phía tây tỉnh Nghệ An được trình bày trên hình 3.1. Ảnh Sentinel
2 MSI nhận được sau quá trình này sẽ được sử dụng để tính các chỉ số khác biệt
thực vật (NDVI).
88
Hình 3.1 Dữ liệu ảnh Sentinel 2 MSI khu vực nghiên cứu
Để xác định nhiệt độ bề mặt khu vực nghiên cứu, trong luận án sử dụng 15
cảnh ảnh vệ tinh quang học Landsat 8 chụp trong giai đoạn từ 15/11/2021 đến
16/01/2022, bao gồm các ảnh có vị trí hàng cột (path/row) là 127/047, 127/046 và
128/046. Tương tự như với bộ dữ liệu ảnh Sentinel 2 MSI, trong luận án cũng tiến
hành lọc mây từ bộ dữ liệu ảnh Landsat 8 để tạo ảnh không mây cho khu vực
nghiên cứu. Kết quả tạo ảnh Landsat 8 không mây khu vực phía tây tỉnh Nghệ An
được trình bày trên hình 3.2 (ở tổ hợp màu tự nhiên, sử dụng các kênh xanh lam -
kênh 2, xanh lục - kênh 3 và đỏ - kênh 4).
89
Hình 3.2 Dữ liệu ảnh Landsat 8 khu vực nghiên cứu, tổ hợp màu tự nhiên
3.1.2 Dữ liệu GIS
Mô hình số độ cao DEM SRTM với độ phân giải không gian 30m được
thu thập và xử lý nhằm xây dựng các lớp thông tin chuyên đề, bao gồm độ cao,
độ dốc, hướng sườn. Quá trình thu thập và xử lý được thực hiện trên nền tảng
Google Earth Engine (GEE). Dữ liệu DEM SRTM khu vực nghiên cứu được
trình bày trên hình 3.3.
Dữ liệu về mật độ dân cư được thu thập từ cơ sở dữ liệu WorldPop. Trong
khi đó, dữ liệu về tốc độ gió và lượng mưa trung bình tháng được thu thập từ
cơ sở dữ liệu WorldClim. Tất cả các dữ liệu này đều được cung cấp trong kho
dữ liệu của nền tảng GEE, cho phép đơn giản hóa quá trình thu thập và xử lý
nhằm tạo các lớp thông tin đầu vào cho mô hình dự báo nguy cơ cháy rừng.
90
Hình 3.3 Dữ liệu mô hình số độ cao DEM SRTM khu vực nghiên cứu
3.2 Kết quả xây dựng các lớp thông tin chuyên đề
Các lớp thông tin xác định từ ảnh vệ tinh
Ảnh Sentinel 2 MSI sau khi thu thập, tiền xử lý và lọc mây được sử dụng
để tính chỉ số thực vật NVDI (công thức 2.1).
Giá trị phản xạ phổ ở kênh cận hồng ngoại (kênh 8) và kênh đỏ (kênh 4)
ảnh Sentinel 2 MSI được sử dụng để tính chỉ số thực vật NDVI. Kết quả xác
định chỉ số thực vật NDVI khu vực phía tây tỉnh Nghệ An từ ảnh Sentinel 2
MSI được trình bày trên hình 3.4, trong đó giá trị chỉ số NDVI đạt được trong
khoảng từ -0.742 đến 0.802, chỉ số NDVI càng cao thể hiện các khu vực có lớp
phủ thực vật càng dày và tươi tốt. Trên hình 3.4, thực vật được thể hiện bởi các
pixel có màu trắng sáng, các khu vực đất trống, mặt nước có màu tối.
91
Hình 3.4 Chỉ số thực vật NDVI xác định từ ảnh vệ tinh Sentinel 2 MSI
Độ bốc thoát hơi nước bề mặt được xác định từ ảnh vệ tinh quang học độ
phân giải thấp MODIS và được khai thác từ bộ sản phẩm ảnh MODIS trên nền
tảng GEE với độ phân giải không gian 1000m. Kết quả xây dựng lớp thông tin
độ bốc thoát hơi nước bề mặt đối với khu vực phía tây tỉnh Nghệ An được trình
bày trên hình 3.5. Độ bốc thoát hơi nước bề mặt khu vực nghiên cứu có giá trị
trong khoảng từ 10 đến 640, trong đó các pixel màu trắng thể hiện các khu vực
có độ độ bốc thoát hơi nước cao, các pixel màu tối thể hiện các khu vực có độ
bốc thoát hơi nước thấp. Để phù hợp với các lớp thông tin đầu vào khác, độ bốc
thoát hơi nước được nội suy về kích thước pixel 10m.
92
Hình 3.5 Độ bốc thoát hơi nước bề mặt khu vực nghiên cứu thu thập từ CSDL
GEE trên cơ sở ảnh vệ tinh MODIS
Để xây dựng lớp thông tin nhiệt độ bề mặt, trong luận án sử dụng ảnh vệ
tinh Landsat 8 sau khi tiền xử lý, lọc mây, ghép và cắt theo ranh giới khu vực
nghiên cứu. Kênh 10 ảnh Landsat 8 được sử dụng để tính nhiệt độ bề mặt theo
phương pháp single-channel.
Kết quả xác định nhiệt độ bề mặt khu vực nghiên cứu được trình bày trên
hình 3.6, trong đó nhiệt độ bề mặt nhận giá trị trong khoảng từ 10.150C đến
35.470C. Các khu vực có nhiệt độ bề mặt thấp tập trung tại vùng núi với lớp
phủ thực vật dày, trong khi các khu vực có nhiệt độ bề mặt cao tập trung tại các
vùng đất ở, đất trống. Để trực quan, trong luận án tiến hành phân vùng nhiệt độ
bề mặt thành 9 khoảng: nhỏ hơn 180C, 18 - 190C, 19 - 200C, 20 - 210C, 21 -
220C, 22 - 230C, 23 - 240C, 24 - 300C và lớn hơn 300C (hình 3.7).
93
Hình 3.6 Kết quả xác định nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8
Hình 3.7 Kết quả phân cấp nhiệt độ bề mặt từ ảnh vệ tinh Landsat 8
94
Nhiệt độ bề mặt xác định từ ảnh Landsat 8 có độ phân giải không gian
30m, để thống nhất với các lớp thông tin đầu vào của mô hình, trong luận án
tiến hành nội suy lại nhiệt độ bề mặt về kích thước pixel 10m.
Các lớp thông tin xác định từ DEM
Từ dữ liệu DEM SRTM với độ phân giải không gian 30m, trong luận án
tiến hành trích xuất các lớp thông tin chuyên đề về độ cao, độ dốc và hướng
sườn phục vụ xây dựng mô hình dự báo nguy cơ cháy rừng. Quá trình tính toán
các lớp thông tin về địa hình được thực hiện trực tiếp trên nền tảng GEE. Kết
quả xây dựng các lớp thông tin chuyên đề về độ cao, độ dốc (ở đơn vị %) và
hướng sườn đối với khu vực phía tây tỉnh Nghệ An được thể hiện trên các hình
3.8, 3.9 và 3.10. Để chuẩn hóa phù hợp với các lớp thông tin đầu vào của mô
hình, trong nghiên cứu cũng tiến hành nội suy lại kích thước pixel đối với các
lớp thông tin này từ 30m về 10m.
Hình 3.8 Lớp thông tin độ cao khu vực nghiên cứu
95
Hình 3.9 Lớp thông tin độ dốc khu vực nghiên cứu
Hình 3.10 Lớp thông tin hướng sườn khu vực nghiên cứu
96
Các lớp thông tin khác
Dữ liệu về mật độ dân số thu thập từ cơ sở dữ liệu WorldPop và dữ liệu
về khí hậu (lượng mưa trung bình tháng, tốc độ gió) thu thập từ cơ sở dữ liệu
WorldClim được sử dụng để xây dựng các lớp thông tin chuyên đề cho mô hình
Hình 3.11 Kết quả xây dựng lớp thông tin về mật độ dân cư
dự báo nguy cơ cháy rừng.
Kết quả xây dựng lớp thông tin về mật độ dân cư khu vực phía tây tỉnh
Nghệ An được trình bày trên hình 3.11. Do độ phân giải của dữ liệu thu thập từ
CSDL WorldPop là 1000m, để thống nhất với các lớp thông tin khác, trong
luận án tiến hành nội suy lại về kích thước pixel 10m. Để trực quan, trong
nghiên cứu cũng tiến hành phân vùng mật độ dân cư thành 9 khoảng như hình
3.12. Có thể nhận thấy, phần lớn khu vực nghiên cứu có mật độ dân cư thấp
97
(dưới 25 người/km2), tập trung tại các khu vực núi cao và có lớp phủ rừng. Các
khu vực có mật độ dân cư trên 100 người/km2 tập trung chủ yếu ở phía đông
Hình 3.12 Lớp thông tin mật độ dân cư sau khi được phân lớp
và một phần phía nam khu vực nghiên cứu.
Kết quả xây dựng lớp thông tin về lượng mưa trung bình tháng khu vực
phía tây tỉnh Nghệ An được thể hiện trên hình 3.13, trong đó lượng mưa ở khu
vực nghiên cứu nằm trong khoảng từ 113 mm/tháng đến 164 mm/tháng. Kết
quả nhận được cho thấy, lượng mưa trung bình tháng ở khu vực nghiên cứu chủ
yếu đạt dưới 130 mm/tháng. Các khu vực có lượng mưa trung bình tháng đạt
trên 130mm/tháng tập trung cục bộ ở phía nam khu vực nghiên cứu (được thể
hiện bởi màu tối trên hình 3.13).
98
Hình 3.13 Kết quả xây dựng lớp thông tin lượng mưa trung bình tháng
Hình 3.14 trình bày kết quả xây dựng lớp thông tin về tốc độ gió khu vực
phía tây tỉnh Nghệ An từ CSDL WorldClim, trong đó tốc độ gió nằm trong
khoảng từ 1,5 đến 2,9 m/s. Để trực quan, trong luận án tiến hành phân vùng tốc
độ gió khu vực nghiên cứu thành 07 khoảng: 1,5 - 1,7 m/s, 1,7 - 1,9 m/s, 1,9 -
2,1 m/s, 2,1 - 2,3 m/s, 2,3 - 2,5 m/s, 2,5 - 2,7 m/s và 2,7 - 2,9 m/s (Hình 3.15).
Có thể nhận thấy, phần lớn khu vực nghiên cứu có tốc độ gió nhỏ hơn 1,9 m/s.
Các khu vực có tốc độ gió trên 2 m/s tập trung chủ yếu ở phần rìa phía nam khu
vực thực nghiệm, cũng là nơi có lượng mưa trung bình tháng cao hơn so với
các khu vực khác (Hình 3.15).
Tương tự như với các lớp thông tin khác, lớp thông tin về lượng mưa
trung bình tháng và tốc độ gió được nội suy về độ phân giải không gian 10m.
99
Hình 3.14 Kết quả xây dựng lớp thông tin tốc độ gió trung bình khu vực nghiên cứu
Hình 3.15 Kết quả phân vùng tốc độ gió khu vực nghiên cứu
100
3.3 Kết quả xây dựng bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn
thám và GIS
3.3.1 Kết quả dự báo nguy cơ cháy rừng bằng kỹ thuật AHP
Từ 9 lớp thông tin của mô hình dự báo nguy cơ cháy rừng lựa chọn trong
luận án, đã đánh giá vai trò của các yếu tố ảnh hưởng đến khả năng xảy ra cháy
rừng thông qua ma trận so sánh cặp của các chỉ tiêu bằng phương pháp phân
tích thứ bậc AHP. Dựa trên phân tích, đánh giá vai trò của các yếu tố ảnh hưởng
đến nguy cơ cháy rừng từ các nghiên cứu trên thế giới (Lamat et al., 2020) và
tham khảo các tài liệu, số liệu về mức độ quan trọng của các yếu tố ảnh hưởng
đến nguy cơ cháy rừng, trong luận án đã đưa ra ma trận so sánh cặp của các chỉ
tiêu như bảng 3.1. Trong nghiên cứu của Lamat và cộng sự (2021), tác giả đã
sử dụng 8 lớp thông tin đầu vào, bao gồm: mật độ dân số, lớp phủ thực vật, độ
cao, nhiệt độ bề mặt, độ dốc, hướng sườn, tốc độ gió và lượng mưa trung bình
tháng để xây dựng mô hình cảnh báo nguy cơ cháy rừng bằng kỹ thuật AHP.
Theo Lamat và cộng sự, mật độ dân số có ảnh hưởng lớn nhất đến nguy cơ xảy
ra cháy rừng. Các yếu tố có mức độ quan trọng tiếp theo bao gồm: lớp phủ thực
vật, độ cao, nhiệt độ bề mặt, độ dốc, hướng sườn, tốc độ gió lượng mưa trung
bình tháng.
Trong luận án này, nghiên cứu sinh bổ sung thêm yếu tố độ ẩm bề mặt
(thông qua độ bốc thoát hơi nước bề mặt) để đánh giá vai trò của từng yếu tố
đến khả năng xảy ra cháy rừng tại khu vực phía tây tỉnh Nghệ An, trong đó mức
độ quan trọng của độ ẩm bề mặt được xem như tương đương với nhiệt độ bề
mặt, từ đó tính toán các trọng số ảnh hưởng.
Trọng số ảnh hưởng của từng yếu tố đến nguy cơ cháy rừng được thể
hiện trong bảng 3.2. Giá trị chỉ số nhất quán CR đạt 0.096 (nhỏ hơn 10%) nên
kết quả tính toán trọng số của các chỉ tiêu (lớp thông tin) ảnh hưởng tới nguy
cơ cháy rừng là chấp nhận được.
101
Yếu tố
Độ cao [3]
Độ dốc [5]
Hường sườn [6]
Tốc độ gió [7]
Độ ẩm bề mặt [9]
Mật độ dân số [1]
Lớp phủ thực vật [2]
Nhiệt độ bề mặt [4]
Bảng 3.1 Ma trận so sánh cặp của các yếu tố ảnh hưởng đến nguy cơ cháy rừng
[1] [2] [3] [4] [5] [6] [7] [8] [9] Tổng
1 0.33 0.33 0.20 0.20 0.17 0.14 0.14 0.20 2.72
3 1 0.33 0.25 0.20 0.20 0.17 0.14 0.25 5.54
3 3 1 0.33 0.33 0.25 0.20 0.20 0.33 8.65
5 4 3 1 0.33 0.33 0.20 0.17 1 15.03
5 5 3 3 1 0.50 0.33 0.14 3 20.98
6 5 4 3 2 1 0.33 0.2 3 24.53
7 6 5 5 3 3 1 0.2 5 35.20
Lượng mưa TB tháng [8] 7 7 5 6 7 5 5 1 6 49.00
5 4 3 1 0.33 0.33 0.20 0.17 1 15.03
Trọng số
Yếu tố
Độ dốc [5]
Hường sườn [6]
Tốc độ gió [7]
Độ ẩm bề mặt [9]
Độ cao [3]
Mật độ dân số [1]
Lớp phủ thực vật [2]
Nhiệt độ bề mặt [4]
[1] [2] [3] [4] [5] [6] [7] [8] [9]
0.37 0.12 0.12 0.07 0.07 0.06 0.05 0.05 0.07
0.54 0.18 0.06 0.05 0.04 0.04 0.03 0.03 0.05
0.35 0.35 0.12 0.04 0.04 0.03 0.02 0.02 0.04
0.33 0.27 0.20 0.07 0.02 0.02 0.01 0.01 0.07
0.24 0.20 0.16 0.12 0.08 0.04 0.01 0.01 0.12
0.20 0.17 0.14 0.14 0.09 0.09 0.03 0.01 0.14
Lượng mưa TB tháng [8] 0.14 0.14 0.10 0.12 0.14 0.10 0.10 0.02 0.12
0.33 0.27 0.20 0.07 0.02 0.02 0.01 0.01 0.07
Bảng 3.2 Kết quả chuẩn hóa ma trận so sánh cặp
0.31 0.22 0.14 0.09 0.06 0.05 0.03 0.02 0.09
0.24 0.24 0.14 0.14 0.05 0.02 0.02 0.01 0.14
102
Có thể nhận thấy, trong số 9 yếu tố được lựa chọn để đưa vào mô hình,
mật độ dân cư có vai trò quan trọng nhất ảnh hưởng đến nguy cơ cháy rừng,
với trọng số ảnh hưởng đạt 0.31. Yếu tố được đánh giá quan trọng thứ 2 là lớp
phủ/sử dụng đất (thông qua chỉ số thực vật NDVI) có trọng số ảnh hưởng đạt
0.22. Yếu tố độ cao có mức độ ảnh hưởng đứng thứ 3 với trọng số đạt 0.14.
Nhiệt độ bề mặt và độ ẩm bề mặt có trọng số ảnh hưởng là 0.09. Các yếu tố
khác như độ dốc, hướng sườn, tốc độ gió và lượng mưa trung bình tháng có
mức độ ảnh hưởng thấp đến nguy cơ cháy rừng, thể hiện qua giá trị các trọng
số đạt lần lượt là 0.06, 0.05, 0.03 và 0.02. Kết quả xây dựng bản đồ phân vùng
nguy cơ cháy rừng trên cơ sở phương pháp phân tích thứ bậc AHP sử dụng 9
Hình 3.16 Kết quả dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng kỹ thuật phân tích thứ bậc (AHP)
lớp thông tin đầu vào được trình bày trên hình 3.16.
103
Trong luận án, nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An được
phân chia thành 05 cấp: rất thấp (0 - 0.4), thấp (0.4 - 0.6), trung bình (0.6 -
0.75), cao (0.75 - 0.9) và rất cao (0.9 - 1). Giá trị ngưỡng để phân vùng mức độ
nguy cơ cháy rừng được tham khảo từ nghiên cứu của Bùi Tiến Diệu và cộng
sự (2017).
Trên hình 3.16, các ký hiệu màu đen thể hiện vị trí các điểm cháy đã diễn
ra trong quá khứ, màu xanh thể hiện các điểm báo cháy nhưng không xảy ra
cháy tại khu vực nghiên cứu. Có thể nhận thấy, kết quả phân vùng nguy cơ cháy
rừng bằng kỹ thuật AHP có độ chính xác không cao, các khu vực có cấp độ
cháy rừng khác nhau được phân bố cục bộ thành mảng lớn. Điều này dẫn đến
mặc dù có nhiều điểm cháy được phân loại vào khu vực có nguy cơ cháy rừng
cao và rất cao, tuy nhiên, rất nhiều các điểm không cháy cũng được phân vùng
vào các khu vực có nguy cơ cháy cao và rất cao.
3.3.2 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán Random Forest
Về bản chất, các mô hình học máy xử lý bài toán dự báo nguy cơ cháy
rừng như một vấn đề nhận dạng (phân loại) nhị phân. Giá trị các tham số của
thuật toán, như số lượng cây (numberOfTrees) đối với thuật toán RF, tham số
phạt (C) đối với thuật toán SVM hay số lượng nút (maxNodes) với thuật toán
CART có ảnh hưởng quan trọng đến độ chính xác kết quả phân loại.
Để dự báo nguy cơ cháy rừng bằng thuật toán Random Forest, nghiên
cứu sinh thử nghiệm với nhiều giá trị khác nhau của tham số numberOfTrees.
Với mỗi giá trị tham số numberOfTrees, người sử dụng xác định số lượng cây
quyết định cần khởi tạo trước khi thuật toán tự học. Dựa trên bộ dữ liệu đầu
vào bao gồm các điểm cháy và 9 lớp thông tin, thuật toán RF tiến hành học tập,
sau đó phân loại cấp độ cháy rừng, trong đó cấp độ cháy rừng cũng được chia
thành 5 cấp, tương tự như với sử dụng kỹ thuật phân tích thứ bậc AHP. Từ kết
quả thử nghiệm cho thấy, với tham số numberOfTrees 100 có độ chính xác cao
104
nhất, thể hiện qua vị trí phân bố dữ liệu các điểm cháy, không cháy và kết quả
đánh giá bằng đường cong ROC. Kết quả dự báo nguy cơ cháy rừng bằng thuật
toán RF với giá trị thông số numberOfTrees bằng 3, 100 và 200 được trình bày
Hình 3.17 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF(3)
trên các hình 3.17 - 3.19.
105
Hình 3.18 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF(100)
Hình 3.19 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán RF(200)
106
Có thể nhận thấy, kết quả dự báo nguy cơ cháy rừng khu vực phía tây
tỉnh Nghệ An bằng thuật toán RF có độ chính xác và mức độ chi tiết cao hơn
so với sử dụng kỹ thuật AHP (không phân bố thành các mảng lớn có cấp độ dự
báo cháy như nhau), trong cả 3 trường hợp sử dụng giá trị tham số
numberOfTrees là 3, 100 và 200.
3.3.3 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM
Để dự báo nguy cơ cháy rừng bằng thuật toán SVM, trong luận án thử
nghiệm với các giá trị tham số phạt (tham số C) khác nhau. Tham số C đại diện
cho mức độ lỗi (sai số) khi phân loại, trong đó C càng lớn có nghĩa là thuật toán
SVN bị phạt càng nặng khi thực hiện kết quả phân loại sai. Trên cơ sở phân
tích vị trí phân bố dữ liệu điểm cháy, trong luận án lựa chọn 02 giá trị tham số
C cho kết quả dự báo phù hợp nhất để đánh giá, so sánh với các thuật toán khác
Hình 3.20 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 25
(hình 3.20 và 3.21 với 5 cấp độ nguy cơ cháy rừng khác nhau).
107
Hình 3.21 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán SVM, C = 30
Nhìn chung, kết quả phân vùng nguy cơ cháy rừng bằng thuật toán SVM
có độ chính xác thấp hơn so với thuật toán RF. Với giá trị tham số C là 30, các
khu vực có cấp độ nguy cơ cháy rừng "cao" tập trung thành các vùng rất lớn,
điều này dẫn đến nhiều điểm không xảy ra cháy rừng được phân bố vào khu
vực có cấp độ cháy rừng "cao"và "rất cao".
3.3.4 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART
Tương tự như với các thuật toán học máy RF và SVM, để dự báo nguy
cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng thuật toán CART trên cơ sở
9 lớp dữ liệu đầu và và dữ liệu các điểm cháy, trong luận án nghiên cứu sinh đã
thử nghiệm với các giá trị tham số maxNodes khác nhau, ứng với số lượng nút
lá tối đa trên mỗi cây quyết định. Kết quả nhận được cho thấy, với giá trị
maxNodes càng thấp, mức độ chi tiết của kết quả phân vùng nguy cơ cháy rừng
càng thấp, trong đó các khu vực có nguy cơ cháy rừng cao chiếm tỉ lệ rất lớn,
108
phân bố cục bộ thành vùng lớn tại phía bắc khu vực nghiên cứu. Có thể nhận
thấy, với giá trị maxNodes bằng 5, hơn một nửa diện tích khu vực nghiên cứu
(ở phía bắc) được phân loại ở cấp độ cháy rừng "rất cao". Như vậy, hầu hết các
điểm cháy và không cháy từ CSDL của Cục Kiểm lâm đều được phân bố trong
các khu vực có nguy cơ cháy "rất cao". (Hình 3.22). Khi thay đổi giá trị
maxNodes cao hơn, mức độ chi tiết trong phân vùng nguy cơ cháy rừng có xu
hướng tăng lên, tuy nhiên so với thuật toán RF và SVM mức độ chi tiết thấp
hơn rất nhiều (vẫn phân bố thành các khu vực lớn cục bộ). Điều này sẽ dẫn đến
những sai số lớn khi dự báo nguy cơ cháy rừng.
Từ thử nghiệm với các giá trị tham số maxNodes khác nhau, trong luận
án nhận thấy, với giá trị tham số maxNodes bằng 30 có mức độ phù hợp cao
nhất giữa kết quả dự báo và vị trí phân bố các điểm cháy, điểm không cháy
Hình 3.22 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 5
(Hình 3.23).
109
Hình 3.23 Kết quả dự báo nguy cơ cháy rừng bằng thuật toán CART, maxNodes 30
3.4 Đánh giá độ chính xác và lựa chọn mô hình dự báo nguy cơ cháy rừng
a) Đánh giá bằng bộ dữ liệu điểm cháy
Để đánh giá độ chính xác kết quả dự báo nguy cơ cháy rừng bằng các mô
hình khác nhau, trong luận án sử dụng bộ dữ liệu cháy rừng khu vực phía tây
tỉnh Nghệ An và lân cận từ CSDL của Cục Kiểm lâm và CSDL quốc tế của
NASA. Ngoài dữ liệu để chạy mô hình, bộ dữ liệu bao gồm 36 điểm cháy và
61 điểm không cháy được sử dụng để đánh giá độ chính xác của mô hình dự
báo. Vị trí các điểm cháy được thể hiện bởi hình tam giác màu đen trên các bản
đồ dự báo nguy cơ cháy rừng, trong khi các điểm không cháy được thể hiện bởi
ký hiệu các hình tam giác màu xanh. So sánh kết quả dự báo nguy cơ cháy rừng
giữa các mô hình khác nhau được trình bày trong bảng 3.3.
110
Bảng 3.3: So sánh kết quả dự báo nguy cơ cháy rừng giữa các phương án
Cấp độ nguy cơ cháy rừng
Thuật
toán
Rất thấp
Thấp
TB
Cao
Rất cao
Điểm cháy
0
3
6
8
19
RF3
Điểm không cháy
11
18
21
9
2
Điểm cháy
0
2
3
8
23
RF100
Điểm không cháy
14
25
15
5
2
Điểm cháy
2
2
9
20
3
RF200
Điểm không cháy
8
17
17
12
7
Điểm cháy
0
2
1
4
29
CART5
Điểm không cháy
8
11
10
2
30
Điểm cháy
0
2
2
8
24
CART30
Điểm không cháy
10
19
2
1
29
Điểm cháy
0
4
2
25
6
SVM30
Điểm không cháy
0
5
3
38
15
Điểm cháy
1
3
11
18
3
SVM25
Điểm không cháy
3
17
8
28
5
Điểm cháy
0
8
7
15
6
AHP
Điểm không cháy
0
3
5
31
22
Phân tích kết quả đạt được từ bảng 3.3 cho thấy:
+ Với thuật toán Rừng ngẫu nhiên (RF): giá trị tham số
numberOfTrees bằng 100 (RF100) cho kết quả dự báo chính xác nhất. Trong
số 36 điểm xảy ra cháy trong quá khứ, có 31 điểm phân bố vào các khu vực có
cấp độ dự báo cháy "cao" và "rất cao" (tương đương 86.11%), trong đó riêng
cấp độ dự báo cháy "rất cao" có 23 điểm (63.89% tổng số điểm cháy). Các điểm
cháy được phân bố vào các khu vực có cấp độ "thấp" và "trung bình" đạt 2 và
3 điểm. Không có điểm cháy nào được phân bố vào khu vực có cấp độ cháy
"rất thấp". Phần lớn các điểm không cháy phân bố vào các khu vực có cấp độ
dự báo "rất thấp" (14/61 điểm), "thấp" (25/61 điểm) và "trung bình" (15/61
111
điểm). Chỉ có 5 điểm không cháy phân bố ở cấp độ "cao" và 2 điểm ở cấp độ
"rất cao".
Với giá trị tham số numberOfTrees bằng 3 (RF3), có 27 điểm cháy phân
bố vào cấp độ dự báo cháy "cao" và "rất cao", thấp hơn so với phương án
RF100. Số lượng điểm cháy phân bố vào khu vực có cấp độ cháy "rất cao" cũng
thấp hơn (19 so với 23). Có 6 điểm cháy phân bố ở khu vực có cấp độ dự báo
"trung bình" và 3 điểm cháy ở khu vực có cấp độ dự báo "thấp". Số lượng các
điểm không cháy phân bố vào các khu vực có cấp độ "rất thấp" và "thấp" cũng
ít hơn đáng kể so với RF100, với 11/61 điểm ở cấp độ "rất thấp", 18/61 điểm ở
cấp độ "thấp". Ngoài ra, có tới 11/61 điểm không cháy phân bố ở khu vực có
cấp độ cháy "cao" và "rất cao", nhiều hơn 4 điểm khi so với với phương án
RF100.
Phương án sử dụng giá trị tham số numberOfTrees bằng 200 (RF200) có
độ chính xác thấp nhất so với các phương án RF3 và RF100, thể hiện ở số lượng
điểm cháy phân bố ở các khu vực có cấp độ cháy rừng "cao" và "rất cao", đạt
23 điểm (20 điểm ở nguy cơ cao, 3 điểm ở nguy cơ rất cao), trong khi có tới 4
điểm cháy được phân bố ở các khu vực có cấp độ cháy "rất thấp", và "thấp".
Ngược lại, số lượng điểm không cháy phân bố vào khu vực có nguy cơ cháy
rừng "cao" và "rất cao", chiếm tới 19/61 điểm, cao hơn đáng kể so với phương
án RF3 (11/61 điểm) và RF100 (7/61 điểm). Nhìn chung, khi giá trị tham số
numberOfTrees cao trên 100, độ chính xác kết quả dự báo nguy cơ cháy rừng
có sự suy giảm.
+ Với thuật toán SVM: với 02 phương án lựa chọn giá thị tham số C có
độ chính xác cao nhất của thuật toán SVM (SVM 25 và SVM30) cho thấy, kết
quả dự báo cháy rừng bằng thuật toán SVM có độ chính xác thấp hơn đáng kể
so với thuật toán RF. Với phương án SVM25, có 18/36 điểm cháy được phân
bố vào khu vực có cấp độ dự báo cháy "cao" 3 điểm vào khu vực có cấp độ «rất
112
cao»; có 4 điểm cháy phân bố ở khu vực có cấp độ dự báo cháy "rất thấp"và
"thấp".. Trong khi đó, có tới 33/61 điểm không cháy được phân bố vào khu vực
có cấp độ dự báo cháy "cao" và "rất cao", với phương án SVM30 là 53/61 điểm.
Như vậy có thể nhận thấy, mức độ sai số của các phương án SVM25 và SVM30
là khá lớn, độ chính xác dự báo cháy rừng bằng thuật toán SVM là không cao
so với khi sử dụng thuật toán RF. Điều này cũng phù hợp với nhiều nghiên cứu
trên thế giới khi sử dụng thuật toán RF và SVM cho các bài toán phân loại nhị
2023; Xu et al., 2023).
phân như với bài toán dự báo nguy cơ cháy rừng (Gao et al., 2022; Tan and Feng,
+ Với thuật toán CART: Với phương án sử dụng tham số maxNodes
bằng 5 (CART5) (Hình 3.23), phần lớn các điểm cháy và không cháy phân bố
ở các khu vực có cấp độ dự báo cháy "cao" và "rất cao", tương ứng với 33/36
điểm cháy và 32/61 điểm không cháy. Tương tự như với phương án CART30,
có 32/36 điểm cháy phân bố ở khu vực có cấp độ dự báo cháy "cao" và "rất
cao", trong khi đó cũng có tới 31/61 điểm không cháy được phân bố trong khu
vực có cấp độ dự báo cháy "cao" và "rất cao". Kết quả nhận được khi sử dụng
thuật toán CART cũng tương tự như với thuật toán SVM, khi kết quả dự báo
nguy cơ cháy rừng phân bố cục bộ thành các mảng lớn dẫn đến phần lớn các
điểm cháy và không cháy phân bố cục bộ ở các khu vực cấp độ dự báo cháy
"cao" và "rất cao"
+ Với phương án sử dụng kỹ thuật AHP: Nhìn chung, kết quả dự báo
nguy cơ cháy rừng bằng kỹ thuật phân tích thứ bậc AHP trên cơ sở 9 lớp dữ
liệu đầu vào có độ chính xác thấp hơn vo với các thuật toán học máy, đặc biệt
là so với phương án sử dụng thuật toán RF. Điều này thể hiện ở chỗ có tới 53/61
điểm không cháy (86.89% tổng số điểm không cháy) được phân bố vào khu
vực có cấp độ dự báo cháy "cao" và "rất cao", trong khi không có điểm nào
phân bố ở khu vực có cấp độ dự báo cháy '‘rất thấp'’. Kết quả dự báo nguy cơ
113
cháy trên hình 3.17 cho thấy, phần lớn khu vực nghiên cứu được dự báo ở cấp
độ cháy "cao" và "rất cao", khu vực có cấp độ nguy cơ cháy «rất thấp» hầu như
chiếm tỉ lệ không đáng kể.
b) Đánh giá dựa trên đường cong ROC
Trong các bài toán phân lớp có hai lớp dữ liệu, các nghiên cứu thường
sử dụng phương pháp đánh giá độ hiệu quả của mô hình qua True, False,
Positive, Negative. Cụ thể hơn, trong hai lớp dữ liệu này có một lớp quan trọng
hơn lớp kia và cần được dự đoán chính xác. Trong những trường hợp này, các
nghiên cứu thường định nghĩa lớp dữ liệu quan trọng hơn cần được xác định
đúng là lớp Positive (P – dương tính), lớp còn lại được gọi là Negative (N – âm
tính). Các nghiên cứu thường quan tâm đến TPR, FNR, FPR, TNR (R – tỷ lệ)
dựa trên ma trận nhầm lẫn như phía dưới. Như vậy, các nghiên cứu có thể chấp
nhận FPR cao để đạt được FNR thấp. Bên cạnh đó, tổng giá trị của các cột luôn
bằng 1.
Positive
Negative
FNR = FN/(TP+FN)
TPR = TP/(TP+FN)
Positive
(tỉ lệ nhầm)
TNR = TN/(FP+TN)
FPR = FP/(FP+TN)
Negative
(tỉ lệ bỏ sót)
ROC (Receiver Operating Characteristic) là biểu đồ thể hiện hiệu suất
của mô hình phân loại ở tất cả các ngưỡng phân loại. Đường cong này biểu diễn
hai tham số: True Positive Rate (TPR), False Positive Rate (FPR).
AUC (Under the Curve) là một kỹ thuật đánh giá hiệu quả của mô hình
hồi quy logistic trong việc phân loại dữ liệu. Giá trị AUC thay đổi từ 0 đến 1,
trong đó giá trị AUC càng lớn thì mô hình phân loại dữ liệu càng tốt. Một mô
114
hình có AUC là 1 có thể phân loại chính xác hoàn toàn các điểm dữ liệu vào
đúng các lớp.
So sánh giá trị AUC của các mô hình dự báo được thể hiện trong bảng
3.4, trong đó mô hình RF(100) đạt giá trị AUC cao nhất, cũng phù hợp với phân
bố các điểm cháy và không cháy khi so sánh, đánh giá độ chính xác. Kết quả
xác định đường cong ROC đối với các phương án CART30, RF(3), RF(100),
SVM(3) được trình bày trên hình 3.24.
Bảng 3.4: Giá trị AUC của các mô hình học máy
RF(3) RF(100) RF(200) CART(5) CART(30) SVM(25) SVM(30)
0.947
0.938
0.905
0.916
0.756
0.743
AUC
0.951
Hình 3.24: Kết quả xác định đường cong ROC đối với một số phương án xây dựng
mô hình dự báo nguy cơ cháy rừng
Nhận xét: Từ kết quả thử nghiệm mô hình dự báo nguy cơ cháy rừng
trên cơ sở phương pháp phân tích thứ bậc AHP và các thuật toán học máy (RF,
SVM và CART) cho thấy, phương án sử dụng thuật toán Random Forest với
giá trị tham số numberOfTrees bằng 100 (RF100) có độ chính xác cao nhất khi
dự báo nguy cơ cháy rừng.
115
Trên cơ sở so sánh, đánh giá độ chính xác dự báo nguy cơ cháy rừng
bằng các mô hình khác nhau, trong luận án đã lựa chọn mô hình RF100 để xây
dựng bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An. Kết quả
dự báo nguy cơ cháy rừng khu vực nghiên cứu được trình bày trong bảng 3.5.
Phân tích các kết quả thu được cho thấy gần một nửa diện tích khu vực
nghiên cứu có mức độ nguy hiểm cháy rừng “trung bình” (43,38%), được thể
hiện bởi màu vàng ở hình 3.18. Diện tích có nguy cơ cháy rừng “rất thấp” và
“thấp” chiếm 5,75% và 23,00% tổng diện tích, chủ yếu ở phía Đông Nam tỉnh
Nghệ An. Diện tích có nguy cơ cháy rừng “cao” chiếm 16,68% tổng diện tích
khu vực nghiên cứu. Trong khi đó, diện tích có nguy cơ cháy rừng “rất cao”
chiếm 4,63% tổng diện tích và nằm chủ yếu ở phía Đông khu vực nghiên cứu
(được thể hiện bằng màu đỏ trong Hình 3.18). Những khu vực có nguy cơ cháy
rừng «cao» và «rất cao» phân bố tập trung ở những vùng có mật độ dân số cao,
Bảng 3.5. Diện tích các khu vực với nguy cơ cháy rừng khác nhau
lớp phủ rừng chủ yếu là rừng thứ sinh và rừng trồng.
Nguy cơ cháy rừng
STT 1 2 3 4 5
Rất thấp Thấp Trung bình Cao Rất cao
Diện tích (ha) 636,65 3271,13 4800,45 1845,96 511,35
Diện tích (%) 5,75 29,56 43,38 16,68 4,63
3.5 Xây dựng công cụ xử lý dữ liệu viễn thám và GIS trên nền tảng GEE
GEE là nền tảng điện toán đám mây để phân tích dữ liệu viễn thám, có
tích hợp sẵn một kho lưu trữ hàng chục petabyte dữ liệu viễn thám miễn phí,
trong đó có ảnh Landsat và Sentinel. Đây là một công cụ rất hiệu quả trong xử
lý dữ liệu viễn thám đa thời gian phục vụ các mô hình nghiên cứu, giám sát tài
nguyên môi trường, trong đó có xây dựng các mô hình dự báo nguy cơ cháy
rừng từ dữ liệu viễn thám và GIS.
116
Trong luận án, nghiên cứu sinh sử dụng ngôn ngữ lập trình JavaScript
trên giao diện Code Editor để đưa dữ liệu ảnh Landsat 8/9 và Sentinel 2 MSI
vào nền tảng và tiến hành các bước xử lý, phân tích, hiển thị và xuất kết quả.
Các lớp thông tin đầu vào như lớp phủ thực vật, độ ẩm bề mặt, độ cao, độ dốc,
hướng sườn, tốc độ gió, lượng mưa trung bình tháng, mật độ dân cư được thu
thập và xử lý trên nền tảng GEE trước khi đưa vào mô hình. Việc sử dụng công
cụ GEE trong luận án cho phép xử lý dữ liệu đầu vào cho mô hình một cách
nhanh chóng, thuận tiện khi nền tảng GEE cung cấp đầy đủ các thông tin đầu
vào này. Hơn nữa, điều này cũng giúp người sử dụng không cần tải dữ liệu về
máy tính cá nhân. Ngoài ra, người dùng có thể cập nhật thường xuyên các dữ
liệu đầu vào (ảnh vệ tinh, tốc độ gió, lượng mưa...) để dự báo nguy cơ cháy
rừng một cách kịp thời hơn.
Mã code module phần mềm mô hình dự báo nguy cơ cháy rừng từ dữ
liệu viễn thám và GIS trên nền tảng GEE được trình bày trong Phụ lục 1. Giao
Hình 3.25 Công cụ xử lý dữ liệu cho mô hình dự báo nguy cơ cháy rừng trên nền tảng GEE
diện công cụ được minh họa trên hình 3.25.
117
Công cụ cho phép lựa chọn các thuật toán trong xây dựng mô hình dự
báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS, bao gồm AHP, RF, SVM,
CART. Với các thuật toán học máy, người sử dụng có thể nhập các tham số
khác nhau để thử nghiệm, chẳng hạn với thuật toán RF (hình 3.25) cho kết quả
khi xây dựng mô hình dự báo với tham số numberOfTrees bằng 100 (RF100).
Để hiển thị, người sử dụng click vào '‘Result image'’ Để thử nghiệm với thuật
toán khác, người sử dụng click vào '‘Remove image'’, sau đó lựa chọn thuật
toán, lựa chọn tham số để hiện thị kết quả.
Hình 3.26 trình bày ví dụ kết quả dự báo nguy cơ cháy rừng khu vực
nghiên cứu bằng thuật toán CART với giá trị maxNodes bằng 30 (CART30).
Hình 3.26 Công cụ tổ hợp màu ảnh viễn thám trong module phần mềm
3.6 Tiểu kết chương 3
Trong chương 3, đã tiến hành thử nghiệm mô hình dự báo nguy cơ cháy
rừng khu vực phía tây tỉnh Nghệ An từ dữ liệu viễn thám và GIS. Với 9 lớp
thông tin đầu vào, bao gồm: mật độ dân cư, lớp phủ thực vật, độ cao, nhiệt độ
bề mặt, độ bốc thoát hơi nước bề mặt, độ dốc, hướng sườn, tốc độ gió và lượng
mưa trung bình tháng, nghiên cứu sinh đã thực nghiệm với các phương pháp
khác nhau, bao gồm sử dụng kỹ thuật phân tích thứ bậc AHP và các kỹ thuật
118
học máy Random Forest, Support Vector Machine, Classification and
Regression Trees để đánh giá, lựa chọn phương án phù hợp nhất với khu vực
nghiên cứu.
Trên cơ sở so sánh, đánh giá kết quả dự báo nguy cơ cháy rừng từ mô
hình đề xuất và dữ liệu các điểm cháy, điểm không cháy từ CSDL của Cục
Kiểm lâm, Bộ Nông nghiệp và Phát triển nông thôn cho thấy, phương án sử
dụng thuật toán Random Forest với giá trị tham số numberOfTrees bằng 100
(RF100) cho độ chính xác cao nhất, thể hiện ở tỉ lệ các điểm cháy phân bố ở
các khu vực có cấp độ dự báo nguy cơ cháy "cao" và "rất cao", đạt cao nhất,
trong khi phần lớn các điểm không cháy nằm ở các khu vực có cấp độ dự báo
cháy "rất thấp", và "thấp". Mức độ chi tiết trong phân vùng nguy cơ cháy rừng
(bao gồm 5 cấp: rất thấp, thấp, trung bình, cao và rất cao) cũng tốt hơn so với
các phương án khác. Từ kết quả này, trong luận án sử dụng phương án RF4 để
thành lập bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An.
Để xử lý dữ liệu viễn thám và GIS phục vụ xây dựng mô hinh dự báo
nguy cơ cháy rừng, trong luận án đã xây dựng công cụ phần mềm trên nền tảng
điện toán đám mây GEE. Công cụ này cho phép xử lý trực tiếp trên nền tảng
GEE và chỉ cần tải kết quả về máy tính. Đây là một cách tiếp cận phù hợp trong
điều kiện dữ liệu viễn thám rất đa dạng với dung lượng khổng lồ như hiện nay.
119
KẾT LUẬN VÀ KIẾN NGHỊ
Kết luận
Qua quá trình nghiên cứu, trong luận án đã lựa chọn được mô hình dự
báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS cho khu vực phía tây tỉnh
Nghệ An. Từ những kết quả đạt được trong luận án, rút ra các kết luận sau:
Dữ liệu viễn thám và GIS có thể sử dụng hiệu quả phục vụ xây dựng các
lớp thông tin đầu vào cho mô hình dự báo nguy cơ cháy rừng. Trong luận án,
ngoài 8 lớp thông tin các mô hình dự báo nguy cơ cháy rừng khác thường áp
dụng (mật độ dân cư, lớp phủ thực vật, độ cao, nhiệt độ bề mặt, độ dốc, hướng
sườn, tốc độ gió, lượng mưa trung bình tháng), đã thử nghiệm thêm với lớp
thông tin độ bốc thoát hơi nước bề mặt để xây dựng mô hình dự báo. Các lớp
thông tin này có thể được chiết xuất nhanh từ dữ liệu viễn thám (ảnh Landsat
8/9, Sentinel 2 MSI, MODIS) cũng như các CSDL về dân cư, khí hậu.
Trong luận án đã thử nghiệm với 04 phương pháp dự báo nguy cơ cháy
rừng, bao gồm phương pháp truyền thống trên cơ sở kỹ thuật phân tích thứ bậc
AHP và 03 phương pháp sử dụng các thuật toán học máy: Random Forest,
Support Vector Machine, Classification and Regression Trees để phân tích,
đánh giá và so sánh kết quả dự báo nguy cơ cháy rừng. Với các thuật toán học
máy, nghiên cứu sinh cũng đã thử nghiệm với các tham số khác nhau của thuật
toán, từ đó lựa chọn phương án tối ưu, phù hợp với điều kiện khu vực thực
nghiệm.
Phân tích kết quả nhận được cho thấy, thuật toán Random Forest với tham
số numberOfTrees bằng 100 (RF100) có độ chính xác cao nhất trong dự báo
nguy cơ cháy rừng ở khu vực phía tây tỉnh Nghệ An. Thông qua so sánh vị trí
phân bố dữ liệu các điểm cháy và không cháy từ CSDL của Cục Kiểm lâm, Bộ
Nông nghiệp và Phát triển nông thôn và CSDL NASA cho thấy, thuật toán
RF100 có số lượng các điểm cháy phân bố vào khu vực có cấp độ dự báo nguy
120
cơ cháy rừng ‘’cao’’ và ‘’rất cao’’ đạt tỉ lệ lớn nhất (31/36 điểm), trong khi các
điểm không cháy phần lớn phân bố ở các khu vực có cấp độ dự báo cháy ‘’rất
thấp’’ và ‘’thấp’’ (39/61 điểm). Giá trị AUC của mô hình RF100 là 0.951 cũng
cao nhất so với các phương án học máy khác, tương ứng với 0.947, 0.938, 0.905,
0.756 và 0.743 khi sử dụng các mô hình RF(3), RF(200), CART(5), CART(30),
SVM(25) và SVM(30).
Mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS trên cơ
sở các kỹ thuật học máy xây dựng trong luận án là một công cụ hiệu quả, giúp
các nhà quản lý đưa ra những biện pháp trong theo dõi, giám sát, đưa ra các
cảnh báo nhằm giảm thiểu thiệt hại do cháy rừng gây ra. Mô hình này có thể áp
dụng cho các khu vực khác có điều kiện tự nhiên, kinh tế - xã hội tương tự.
Các lớp thông tin đầu vào chiết xuất từ dữ liệu viễn thám và GIS (mật độ
dân số, lớp phủ thực vật, độ bốc thoát hơi nước bề mặt, hướng sườn, độ dốc,
tốc độ gió, độ cao, nhiệt độ bề mặt và lượng mưa trung bình tháng) cho phép
xây dựng mô hình dự báo nguy cơ cháy rừng phù hợp với điều kiện khu vực
nghiên cứu ở phía Tây tỉnh Nghệ An.
Kỹ thuật học máy (thuật toán Random Forest) giúp dự báo nguy cơ cháy
rừng từ dữ liệu viễn thám và GIS với độ chính xác cao nhất đối với khu vực
nghiên cứu.
Kiến nghị
Trên cơ sở những kết quả đạt được, đề xuất một số kiến nghị sau:
Do khả năng chủ động trong cung cấp nguồn dữ liệu viễn thám và GIS,
bước tiếp theo có thể xây dựng phần mềm tự động cập nhật và xác định nhanh
các lớp thông tin đầu vào của mô hình dự báo nguy cơ cháy rừng, từ đó đưa ra
kết quả dự báo một cách kịp thời, liên tục.
Ngoài bộ dữ liệu điểm cháy từ CSDL của Cục Kiểm lâm (Bộ Nông
nghiệp và Phát triển nông thôn), cần thu thập thêm các dữ liệu, số liệu khác về
121
các khu vực đã xảy ra cháy trong quá khứ nhằm giúp tăng độ chính xác của các
mô hình học máy trong quá trình học tập, phân loại các khu vực có cấp độ nguy
cơ cháy rừng khác nhau.
Luận án góp phần hoàn thiện cơ sở khoa học và minh chứng tính hiệu
quả của phương pháp ứng dụng dữ liệu viễn thám, GIS và các kỹ thuật trí tuệ
nhân tạo (học máy) trong xây dựng mô hình dự báo nguy cơ cháy rừng. Đề nghị
Sở Nông nghiệp và Phát triển nông thôn tỉnh Nghệ An xem xét được vào thử
nghiệm trong thực tế nhằm nâng cao hiệu quả công tác dự báo sớm nguy cơ
cháy rừng ở khu vực phía tây tỉnh Nghệ An.
122
[1]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu (2018). Sử dụng các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ
mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn, Nghệ An,, Hội nghị ERSD, trang 71. [2]. Nguyễn Văn Trung, Đoàn Thị Nam Phương, Bùi Tiến Diệu (2018). Sử dụng
các chỉ số phổ của dữ liệu ảnh vệ tinh Sentinel-2 và Landsat-8 thành lập bản đồ
mức độ cháy rừng ở xã Na Ngoi, Kỳ Sơn, Nghệ An, Tạp chí Khoa học kỹ thuật Mỏ
- Địa chât ISSN 1859-1469 Tâp 59 Kỳ 5, trang 44. [3]. Doan Thi Nam Phuong, Nguyen Van Trung, Bui Tien Dieu (2019).
Evaluation of forest fire on Na Ngoi commune, Ky Son, Nghe An using Sentinel
2A and Landsat-8 Operational Land Imager (OLI) spectral indices, Hội nghị
Khoa học Quốc tế Forum, trang 71 (Bài báo đăng kỷ yếu Hội nghị Quốc tế có
phản biện).
[4]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Phạm Thị Thanh Hòa, Trần
Thanh Hà, Lê Thanh Nghị (2019). Quy trình thành lập bản đồ mức độ cháy rừng
bằng dữ liệu ảnh vệ tinh Sentinel-2. Tạp chí Tài nguyên và Môi trường ISSN 1859-
1477 số 19 kì 1 tháng 10, trang 30. [5]. Đoàn Thị Nam Phương, Nguyễn Văn Trung, Bùi Tiến Diệu, Nguyễn Văn Sơn, Trần Thị Trúc Mai, Ngô Thanh Xuân (2020). Xây dựng và chuẩn hóa các cơ sở dữ liệu thành phần phục vụ dự báo nguy cơ cháy rừng, Hội nghị ERSD, trang 71.
[6]. Doan Thi Nam Phuong, Nguyen Van Trung, Pham Thi Thanh Hoa, Tran
Thanh Ha, Le Thi Thu Ha (2022). Forest Fire Risk Assessment and Mapping Using Support Vector Machine Algorithm, A Case Study in Nghe An Province,
Viet Nam. European Geographical Studies. 9(1), 3
- 12, DOI:
10.13187/egs.2022.1.3.
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ
123
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Bộ Nông nghiệp và Phát triển Nông thôn (2022). Quyết định công bố hiện
trạng rừng toàn quốc năm 2021, Quyết định số 2860/QĐ-BNN-TCLN.
2. Bộ Nông nghiệp và Phát triển Nông thôn (2000). Quy định về cấp dự báo, báo động và các biện pháp tổ chức thực hiện phòng cháy, chữa cháy rừng, Quyết
định số 127/2000-QĐ-BNN-KL ngày 11/12/2000 của Bộ Nông nghiệp và Phát
triển nông thôn.
3. Trần Quang Bảo, Võ Minh Hoàn, Nguyễn Thị Hoa, Dương Huy Khôi (2019). Nghiên cứu đặc điểm vật liệu cháy và phân vùng nguy cơ cháy rừng tại khu
bảo tồn thiên nhiên văn hóa Đồng Nai, Tạp chí Khoa học và Công nghệ lâm
nghiệp, số 5, trang 38 – 48.
4. Trần Quang Bảo (2017). Nghiên cứu sử dụng công nghệ không gian địa lý (RS, GIS, GPS) trong phát hiện cháy rừng và giám sát tài nguyên rừng, Đề tài
nghiên cứu khoa học cấp Bộ.
5. Trần Quang Bảo, Phùng Nam Thắng, Lê Ngọc Hoàn (2016). Nghiên cứu phát triển phần mềm ứng dụng phát hiện sớm cháy rừng từ ảnh vệ tinh MODIS,
Tạp chí Nông nghiệp và Phát triển Nông thôn, số 21, trang 114 – 120.
6. Trần Minh Cảnh (2019). Nghiên cứu xây dựng các giải pháp quản lý lửa rừng
cho Vườn quốc gia Hoàng Liên, Luận án Tiến sĩ Lâm nghiệp.
7. Bế Minh Châu, Vương Văn Quỳnh (2010). Nghiên cứu hoàn thiện phương pháp và phần mềm cảnh báo nguy cơ cháy rừng ở Việt Nam, Tạp chí Nông
nghiệp và Phát triển Nông thôn, số 10, trang 105 – 111.
8. Lê Hùng Chiến (2022). Nghiên cứu xây dựng mô hình giám sát sự bốc - thoát hơi nước của lớp phủ khu vực Tây Bắc Việt Nam từ dữ liệu ảnh vệ tinh, Luận án tiến sĩ kỹ thuật, Đại học Mỏ Địa chất.
9. Chính phủ nước CHXHCN Việt Nam (2018). Nghị định Quy định chi tiết thi
hành một số điều của Luật Lâm nghiệp, Số 156-2018/NĐ-CP.
10. Lê Sỹ Doanh, Vương Văn Quỳnh (2014). Phương pháp dự báo nguy cơ cháy rừng theo điều kiện khí hậu ở Việt Nam. Tạp chí Khoa học Công nghệ lâm nghiệp, số 1, trang 3-10.
124
11. Nguyễn Thị Mai Dương, Lã Nguyên Khang, Lê Công Trường, Phùng Văn Kiên, Nguyễn Văn Hào (2016). Phân tích nguyên nhân mất rừng, suy thoái
rừng làm cơ sở đề xuất giải pháp quản lý bảo vệ rừng tỉnh Đắk Nông, Tạp chí Khoa học và Công nghệ lâm nghiệp, số 6, trang 39 – 48.
12. Phạm Minh Hải, Vũ Ngọc Phan (2018). Ứng dụng công nghệ viễn thám và GIS nghiên cứu vật liệu cháy trong các kiểu rừng phục vụ công tác phòng
chống cháy rừng tại tỉnh Bắc Giang, Tạp chí Khoa học Đo đạc và Bản đồ, số 35, trang 29 – 37.
13. Lê Ngọc Hoàn, Trần Quang Bảo (2018). Ứng dụng thuật toán trích xuất điểm dị thường nhiệt từ ảnh vệ tinh MODIS để phát hiện cháy rừng ở Việt Nam,
Tạp chí Khoa học và Công nghệ lâm nghiệp, số 1, trang 94 – 102.
14. Nguyễn Văn Hùng (2022). Nghiên cứu ứng dụng dữ liệu viễn thám đa thời gian trong giám sát sự biến động hệ thực vật vùng ven biển (vùng chuyển tiếp
giữa lục địa và biển, bao gồm vùng biển ven bờ và vùng đất ven biển), Báo
cáo tổng hợp đề tài khoa học và công nghệ, Bộ Tài nguyên và Môi trường. 15. Trần Văn Hùng, Võ Quang Minh, Võ Thị Gương (2010). Xây dựng phương pháp cản báo cháy rừng ở khu vực vườn quốc gia U Minh Hạ, Cà Mau dưới
sự hỗ trợ của Hệ thống thông tin địa lý (GIS), Tạp chí Khoa học trường Đại
học Cần Thơ, 14, 97 – 106.
16. Trịnh Lê Hùng (2014). Nghiên cứu phân bố nhiệt độ bề mặt từ dữ liệu ảnh hồng ngoại nhiệt Landsat, Tạp chí Các Khoa học về Trái Đất, số 36(1), trang
82 – 89.
17. Lê Văn Hưng, Nguyễn Thị Thanh, Đặng Hữu Nghị, Hoàng Anh Đức (2019). Xây dựng mô hình học sâu đánh giá nguy cơ cháy rừng tại Lâm Đồng, Hội
nghị Nghiên cứu cơ bản trong Khoa học Trái đất và Môi trường, trang 386 -
389.
18. Phạm Ngọc Hưng (1988). Xây dựng phương pháp dự báo cháy rừng Thông nhựa (Pinus merkusii J.) ở Quảng Ninh, Luận án PTS khoa học Nông nghiệp, Hà Nội.
19. Phạm Ngọc Hưng (2004). Quản lý cháy rừng ở Việt Nam, Nhà xuất bản Nghệ
An, 233 trang.
20. Nguyễn Văn Lợi, Trần Minh Đức, Nguyễn Phương Văn (2017). Thực trạng và giải pháp quản lý cháy rừng ứng phó với biến đổi khí hậu tại tỉnh Quảng Bình, Tạp chí Khoa học Lâm nghiệp, số 4, trang 139 – 150.
125
21. Vũ Thành Minh, Lê Thị Thu Hiền (2015). Ứng dụng GIS và viễn thám để thành lập bản đồ nhạy cảm cháy tại Vườn quốc gia Tràm Chim, Tạp chí Phát
triển Khoa học và Công nghệ, tập 18, số 16, trang 221 – 235.
22. Doãn Hà Phong (2007). Xây dựng thuật toán và phương trình xác định nhiệt độ bề mặt đất trong theo dõi cảnh báo cháy rừng trên cơ sở ảnh vệ tinh MODIS
(TERRA và AQUA) trên lãnh thổ Việt Nam, Luận án Tiến sỹ kỹ thuật, Trường
Đại học Mỏ Địa chất.
23. Vương Văn Quỳnh (2005). Nghiên cứu xây dựng các giải pháp phòng chống và khắc phục hậu quả cháy rừng cho vùng U Minh và Tây Nguyên, Báo cáo
tổng kết đề tài, Đề tài cấp nhà nước KC08.24 thuộc Chương trình bảo vệ môi
trường và phòng tránh thiên tai, Bộ Khoa học và Công nghệ.
24. Vương Văn Quỳnh, Chu Thị Bình, Trần Quang Bảo (2006). Phần mềm phát hiện cháy rừng từ ảnh vệ tinh, Tạp chí Nông nghiệp và Phát triển Nông thôn,
số 3+4, trang 135 – 137.
25. Võ Đình Tiến (1995). Phương pháp dự báo, lập bản đồ, khoanh vùng trọng điểm cháy rừng ở Bình Thuận, Tạp chí Lâm nghiệp, số 10, trang 11 – 14. 26. Nguyễn Ngọc Thạch, Phạm Xuân Cảnh, Đoàn Thu Phương, Hà Thị Bích Phượng, Đặng Ngô Bảo Toàn (2015). Ứng dụng GIS xây dựng bản đồ nguy
cơ cháy rừng cấp xã phục vụ công tác quản lí phòng chống cháy rừng tại tỉnh
Sơn La, Hội thảo GIS toàn quốc, tr.174-180.
27. Nguyễn Ngọc Thạch, Đặng Ngô Bảo Toàn, Phạm Xuân Cảnh (2017). Ứng dụng viễn thám và GIS thành lập bản đồ nguy cơ cháy rừng phục vụ phòng
chống, giảm thiểu thiệt hại do cháy rừng tại tỉnh Sơn La, Việt Nam, Tạp chí
Khoa học ĐHQGHN: Các Khoa học Trái đất và Môi trường, 33(3), 53-66. 28. Chu Thái Thành (2011). Bảo vệ rừng: nhiệm vụ quan trọng cấp thiết của chúng
ta, Tạp chí Cộng sản điện tử, truy cập tháng 12/2022.
29. Nguyễn Tiến Thành (2021). Nghiên cứu cơ sở khoa học ứng dụng ảnh hồng ngoại nhiệt và GIS trong cảnh báo cháy ngầm trên bể than Quảng Ninh, Báo cáo tổng hợp đề tài khoa học và công nghệ, Bộ Tài nguyên và Môi trường. 30. Đặng Ngô Bảo Toàn, Nguyễn Ngọc Thạch, Phạm Xuân Cảnh (2017). Ứng dụng viễn thám và GIS thành lập bản đồ nguy cơ cháy rừng phục vụ phòng chống, giảm thiểu thiệt hại do cháy rừng tại tỉnh Sơn La, Việt Nam, Hội thảo GIS toàn quốc, tr.252-261.
126
31. Đặng Ngô Bảo Toàn (2021). Nghiên cứu nguy cơ và cảnh báo cháy rừng tỉnh Sơn La trên cơ sở ứng dụng công nghệ địa thông tin, Luận án Tiến sĩ Địa lý,
Đại học Quốc gia Hà Nội.
32. Vũ Danh Tuyên, Trịnh Lê Hùng, Nguyễn Tiến Thành (2020). Viễn thám nâng cao, Giáo trình sau đại học, Nhà xuất bản Khoa học và Kỹ thuật, 207 trang. 33. Nguyễn Phương Văn, Nguyễn Văn Lợi, Trần Minh Đức (2019). Nghiên cứu hiệu chỉnh phân cấp dự báo cháy rừng trong bối cảnh biến đổi khí hậu tại tỉnh Quảng Bình, Tạp chí Khoa học Đại học Huế: Nông nghiệp và Phát triển nông
thôn, tập 128, số 3A, trang 179 – 190.
34. Nguyễn Phương Văn (2019). Nghiên cứu thực trạng và đề xuất giải pháp quản lý cháy rừng thích ứng với biến đổi khí hậu tại tỉnh Quảng Bình, Luận án tiến sĩ Lâm nghiệp.
Tiếng Anh
35. Aronoff S. (1989). Geographic Information System, WDL Publication, Ottaw,
19.
36. Arndt N., Vacik H., Koch V., Arpaci A., Gossow H. (2013). Modelling human-caused forest fire ignition for assessing forest fire danger in Austria,
iForest 6: 315-325
37. Arpaci A., Eastaugh C., Vacik H. (2013). Selecting the best performing fire for Austrian ecoregions, Theoretical and Applied
weather
indices
Climatology, 114, 393 – 406.
38. Arpaci A., Malowerschnig B., Sass O., Vacik H. (2014). Using multi variate data mining techniques for estimating fire susceptibility of Tyrolean forests,
Applied Geography, 53, 258 – 270.
39. Avetisyan D., Nedkov R. (2015). Assessment of fire hazard zones in the forest landscapes in Simitli Municipality (Bulgaria), Journal of Environment Protection and Sustainable Development, 1(4), 225 – 233.
40. Beals E.A. (1914). The value of weather forecasts in the problem of protecting
forests from fire, Monthly Weather Review, 42, 111–119.
41. Breiman L.
(2001). Random Forests, Machine Learning 45, 5–32,
https://doi.org/10.1023/A:1010933404324.
127
42. Breiman L., Friedman J., Olshen R., Stone C. (1984). Classification and regression trees, Monterey, CA: Wadsworth & Brooks/Cole Advanced Books
& Software, ISBN 978-0-412-04841-8.
43. Chandler C., Thomas P., Trabaud L., Williams D. (1993). Fire in forestry, Volume I: Forest fire behavior and effects, John Wiley & Sons, New Yok. 44. Cherepanov A., Druzhinina E. (2009). Spectral properties of vegetation and
vegetation indexes, Geomatics, 3, 28-32.
45. Chowdhury H., Hassan K. (2013). Use of remote sensingderived variables in developing a forest fire danger forecasting system, Natural Hazards, 67, 321-
334
46. Cooper S., Neiman K., Roberts D. (1991). Forest habitat types of northern Idaho: A second approximation, General Technical Report, INT 236, Ogden,
UT: U.S. Department of Agriculture, Forest Service, Intermountain Research
Station. 143 p.
47. Cortes C., Vapnik V. (1995). Support-vector networks, Mach Learn 20, 273–
297, https://doi.org/10.1007/BF00994018.
48. Danielson J., Gesch D. (2011). Global multi-resolution terrain elevation data
2010 (GMTED 2010), Open-File Report 2011-1073.
49. Dieu Tien Bui, Quang Thanh Bui, Quoc Phi Nguyen, Pradhan B., Nampak H., Phan Trong Trinh (2017). A hybrid artificial intelligence approach using GIS-
based neural-fuzzy inference system and particle swarm optimization for
forest fire susceptibility modeling at a tropical area, Agricultural and Forest
Meteorology, 233, 32 – 44.
50. Dieu Tien Bui, Kim Thoa Thi Le, Van Cam Nguyen, Hoang Duc Le, Revhaug I. (2016). Tropical Forest Fire Susceptibility Mapping at the Cat Ba National
Park Area, Hai Phong City, Vietnam, Using GIS-Based Kernel Logistic Regression, Remote Sensing, 8, 347, doi:10.3390/rs8040347.
51. Dong X. (2005). Forest fire risk zone mapping from satellite images and GIS for Baihe Forestry Bureau, Jilin, China, Journal of Forestry Research 16(3): 169-174.
52. Drucker H., Burges C., Kaufman L., Smola A., Vapnik V. (1997). Support vector regression machines, in Advances in Neural Information Processing Systems 9, NIPS 1996, 155–161, MIT Press.
128
53. Enoh M., Okeke U., Narinua N. (2021). Identification and modelling of forest fire severity and risk zones in the Cross – Niger transition forest with remotely
sensed satellite data, The Egyptian Journal of Remote Sensing and Space Science, 24(3), 879 – 887.
54. FAO (1999). FAO meeting on public policies affecting forest fires, FAO
Forestry Paper, 02586150, ISBN 92-5-104289-6, 380 pp.
55. Fernandez J., Chuvieco E., Koutsias N. (2012). Modelling long-term fire occurrence factors in Spain by accounting for local variations with
geographically weighted regression, Natural Hazards Earth System Scieces,
12, 1-17.
56. Gao C., Lin H., Hu H. (2023). Forest-fire-risk prediction based on Random Forest and backpropagation neural network of Heihe area in Heilongjiang
province, China, Forests 14(2): 170. https://doi.org/10.3390/f14020170. 57. Herrera C., Nieva D., Reyes J., Vega N., Serrano P., Rivas J., Alvarado E., Perez S., Pelaez E., Salicrup D., Jolly W. (2022). Fuel-specific aggregation of
cctive fire detections for rapid mapping of forest fire perimeters in Mexico,
Remote Sensing, 13(1), 124.
58. Gholamreza J.G., B.G., Osman M.D. (2012). Forest fire risk zone mapping
form Geographic Information System in Northern Forests of Iran (Case study,
Golestan province), International Journal of Agriculture and Crop Science,
Vol.4(12), 818 – 824.
59. Hoang V.T., Chou T., Fang Y., Nguyen N.T., Nguyen Q.H., Pham X.C., Dang
N.B.T., Nguyen X.L., Meadows M. (2020). Mapping forest fire risk and
development of early warning system for NW Vietnam using AHP and
MCA/GIS methods, Applied Sciences, 10(12), 4348.
60. Iban M., Sekertekin A. (2022). Machine learning based wildfire susceptibility mapping using remotely sensed fire data and GIS: A case study of Adana and Mersin provinces, Turkey, Ecological Informatics, 69, 101647.
61. Jaiswal R., Mukherjee S., Raju K., Saxena R. (2002). Forest fire risk zone mapping from satellite imagery and GIS, International Journal of Applied Earth Observation and Geoinformation, 4(1), 1-10.
62. James N., Thallak S. (2015). Macro-level assessment of seismically induced landslide hazard for the State of Sikkim, India based on GIS technique, IOP
129
Conference Series Earth and Environmental Scienc, 26(1):01202, DOI:
10.1088/1755-1315/26/1/012027.
63. Khan V. (2012). Long-range forecasting of forest fire danger based on the SLAV model seasonal ensemble forecasts, Russian Meteorology and
Hydrology, 37, 505 – 513.
64. Kolari D. (2008). Intergrated system for forest fire early detection and
manggement, Perioducum Biologorum, 110(2), 205 – 211.
65. Lamat R., Kumar M., Kundu A., Lai D. (2020). Forest fire risk mapping using analytical hierarchy process (AHP) and earth observation datasets: a case
study in the mountainous terrain of Northeast India, SN Applied Sciences,
3:425, https://doi.org/10.1007/s42452-021-04391-0. (2020). SVM hyperparameter
66. Liu C.
tuning using GridSearchCV,
https://towardsdatascience.com/svm-hyper-parameter-tuning-using-
gridsearchcv-49c0bc55ce29.
67. Mokarram M., Zarei A. (2018). Landslide susceptibility mapping using Fuzzy-
AHP, Geotechnical and Geological Engineering, 36(37), 3931 – 3943.
68. Nasiri V., Sadeghi S., Bagherabadi R., Moradi F., Deljouei A., Borz S. (2022). Modeling wildfire risk in western Iran based on the integration of AHP and
GIS,
Environmental Monitoring
and
Assessment,
194,
644,
https://doi.org/10.1007/s10661-022-10318-y.
69. Nesterov V. (1949) Forest fires and methods of fire risk determination.
Russian. Goslesbumizdat, Moscow.
70. Ngoc Thach Nguyen, Bao Toan Ngo Dang, Xuan Canh Pham, Hong Thi Nguyen, Hang Thi Bui, Nhat Duc Hoang, Dieu Tien Bui (2018). Spatial
pattern asessment of tropical forest fire danger at Thuan Chau area (Vietnam)
using GIS-based advanced machine learning algorithms: A comparative study, Ecological Informatics, vol.46, pp.74-85.
71. Olivera S., Oehler F., Ayanz J., Camia A., Pereira J. (2012). Modeling spatial patterns of fire occurrence in Mediterranean Europe using Multiple Regression and Random Forest, Forest Ecology and Management, 275, 117 – 129.
72. Onderka M., Melichercik I. (2010). Fire-prone areas delineated from a combination of the Nesterov Fire-risk Rating Index with multispectral satellite data, Applied Geomatics, 2, 1 – 7.
130
73. Pham Duc Dat, Le Thai Son (2022). Wildfire risk zone mapping from geographic information system in Tam Dao national park of Vietnam, Journal
of Foresty Science and Technology, 13, 45 – 55.
74. Pourghasemi H. (2015). GIS-based forest fire susceptibility mapping in Iran: A comparison between evidential belief function and binary logistic regression
models, Scandinavian Journal of Forest Research, 40 pp., DOI:
10.1080/02827581.2015.1052750.
75. Rouse, J.W., R.H. Haas, J.A. Schell, and D.W. Deering (1973). Monitoring Vegetation Systems in the Great Plains with ERTS, Third ERTS Symposium,
NASA SP-351 I: 309-317.
76. Ruano A., Jolly W., Freeborn P., Nieva D., Vega N., Herrera C., Rodrigues M. (2022). Spatial Predictions of Human and Natural-Caused Wildfire
Likelihood across Montana (USA), Remote Sensing, 13(8), 1200.
77. Saaty T.L. (2000). Fundamentals of the Analytic Hierarchy Process, RWS
Publications.
78. Saaty T.L. (2008). Decision making with the analytic hierarchy process,
International Journal of Services Sciences, 1, 83-98.
79. Sivrikaya F., Kucuk O. (2022). Modeling forest fire risk based on GIS-based analytical hierarchy process and statistical analysis in Mediterranean region,
Ecological Informatics, 68, 101537.
80. Shetinsky E.A. (1994). Protection of forests and forests pyrology, Ecology,
Moscow: 209 pp.
81. Sokolova G., Makogonov S. (2013). Development of the forest fire forecast method (a Case Study for the Far East), Russian Meteorology and Hydrology,
38, 222 – 226.
82. Stipaničev D., Vuko T., Kristinić D., Štula M., and Bodrožić L. (2006). Forest fire protection by advanced video detection system - Croatian experiences, Third TIEMS Work. Improvment Disaster Management Systems.
83. Tan C., Feng Z. (2023). Mapping forest fire risk zones using machine learning in Hunan province, China, Sustainability, 15(7):6292.
algorithms https://doi.org/10.3390/su15076292.
84. Trinh L.H., Zablotskii V.R. (2017). The application of Landsat multi-temporal thermal infrared data to identify coal fire in the Khanh Hoa coal mine, Thai
131
Nguyen province, Vietnam, Izvestiya, Atmospheric and Oceanic Physics,
53(9), 1181 – 1188.
85. Xu Q., Li W., Liu J., Wang X. (2023). A geographical similarity-based sampling method of non-fire point data for spatial prediction of forest fires,
Forest
Ecosystems,
Vol.10,
100104,
https://doi.org/10.1016/j.fecs.2023.100104.
86. Yassemi S., Dragicevic S., Schmidt M. (2008). Design and implementation of an integrated GIS-based cellular automata model to characterize forest fire
behaviour, Ecological Modelling, 210, 71 – 84.
87. Wang L., Qu J. (2007). NMDI: a normalized multi-band drought index for monitoring soil and vegetation moisture with satellite remote sensing, Vol.34(20), Hydrology
Studies,
Surface
Land
and
https://doi.org/10.1029/2007GL031021.
88. Williams M. (1983). Remote sensing, GIS and wildland fire management: A global perspective, Proceedings of the International Workshop on Satellite
Technology and GIS
for Mediterranean Forest Mapping and Fire
Management.
89. Wimberly M., Reilly M. (2007). Assessment of fire severity and species diversity in the southern Appalachians using Landsat TM and ETM+ imagery,
Remote Sensing of Environment, 108(2), 189 – 197.
90. Valor E., Caselles V. (1996). Mapping land surface emissivity from NDVI.
Application to European African and South American areas, Remote sensing
of Environment, 57, pp. 167 – 184.
91. Van de Griend A., Owen M. (1993). On the relationship between thermal
emissivity and the normalized difference vegetation index for natural surface,
International Journal of Remote Sensing 14, pp. 1119 – 1131.
92. Vasilakos C., Kalabokidis K., Hatzopoulos J., Matsinos T. (2009). Identifying wildland fire ignition factors through sensitivity analysis of a neural network,
Natural Hazards, 50, 125 – 143.
93. Venevsky K. (2002). Simulating fire regimes
in human-dominated ecosystems: Iberian Peninsula case study, Global Change Biology 8: 984-998.
132
94. Zhao P., Zhang F., Lin H., Xu S. (2021). GIS based forest fire risk model: a case study in Laoshan national forest park, Nanjing, Remote Sensing, 13(18),
DOI: 10.3390/rs13183704.
Website
95. https://kiemlam.org.vn, truy cập ngày 9/12/2022. 96. http://watch.pcccr.vn/thongKe/diemChay, truy cập ngày 20/11/2022 97. https://glovis.usgs.gov, truy cập ngày 10/8/2022. 98. https://wildfiretoday.com/, truy cập ngày 14/9/2022. 99. https://digital-geography.com/forest-fire-tracking-landsat-8/, truy cập ngày
14/9/2022.
100. https://glovis.usgs.gov. 101. https://scihub.copernicus.eu/dhus/#/home 102. https://geoviet.vn, truy cập ngày 17/9/2022 103. https://effis.jrc.ec.europa.eu/apps/effis_current_situation/,
truy cập ngày
19/9/2022.
104. https://www.worldclim.org/. 105. https://data.worldpop.org/ 106. https://www.javatpoint.com/machine-learning-decision-tree-classification-
algorithm, truy cập ngày 18/11/2022.
107. https://geohackweek.github.io/GoogleEarthEngine/02-code-editor/, truy cập
ngày 20/11/2022.
108. https://serc.carleton.edu/sp/library/google_earth/earth_engine_api.html, truy
cập ngày 18/11/2022.
109. Cổng thông tin điện tử tỉnh Nghệ An, https://www.nghean.gov.vn/.
PHỤ LỤC
Mã code module xử lý dữ liệu viễn thám và GIS trong dự báo nguy cơ cháy
* Thiết kế giao diện var colors = {'transparent': '#11ffee00', 'gray': '#F8F9FA'}; var TITLE_STYLE = { fontWeight: '100', fontSize: '32px', padding: '8px', color: '#616161', backgroundColor: colors.transparent, }; var SUBTITLE_STYLE = { fontWeight: '350', fontSize: '16px', padding: '8px', color: '#616161', textAlign: 'center', //maxWidth: '450px', backgroundColor: colors.transparent, }; var PARAGRAPH_STYLE = { fontSize: '14px', fontWeight: '50', color: '#616161', padding: '8px', maxWidth: '500px', backgroundColor: colors.transparent, }; var BUTTON_STYLE = { fontSize: '14px', fontWeight: '100', color: '#616161', padding: '8px', backgroundColor: colors.transparent, }; var SELECT_STYLE = { fontSize: '14px', fontWeight: '50', color: '#616161', padding: '2px',
rừng trên nền tảng GEE
backgroundColor: colors.transparent, width: '150px' }; var LABEL_STYLE = { fontWeight: '50', textAlign: 'center', fontSize: '14px', padding: '2px', backgroundColor: colors.transparent, }; var infoPanel = ui.Panel({ layout: ui.Panel.Layout.flow(), style: { stretch: 'horizontal', height: '100%', width: '450px', backgroundColor: colors.gray } }); var mappingPanel = ui.Map({ center: {'lat': 19.256653155442255, 'lon': 104.80993612578748, 'zoom': 9} }); ui.root.clear(); ui.root.add(ui.SplitPanel(mappingPanel, infoPanel)); var visPanel = ui.Panel({style: {backgroundColor: colors.transparent}}); infoPanel.add(ui.Label('Fire Forest Danger', TITLE_STYLE)); var info_description = 'The application is used for the purpose of predicting the danger of ' +'forest fires in the six districts of Nghe An province'; infoPanel.add(ui.Label(info_description, PARAGRAPH_STYLE)); var algorithmTitle = ui.Label('Choosing a classification algorithm', TITLE_STYLE); var Algorithms_Selector = ui.Select({ items: [ {label: 'Support Vector Machine', value: 'SVM'}, {label: 'Random Forest', value: 'RF'}, {label: 'CART', value: 'CART'}, ], placeholder: 'Support Vector Machine', value: 'SVM', style: SELECT_STYLE }); var treeTextBox = ui.Textbox({ placeholder: '5', onChange: function(text) {
var tree = ee.Number.parse(ee.String(text)); } }); var gammaTextBox = ui.Textbox({ placeholder: '0.001', onChange: function(text) { var gamma = ee.Number.parse(ee.String(text)); } }); var costTextBox = ui.Textbox({ placeholder: '30', onChange: function(text) { var cost = ee.Number.parse(ee.String(text)); } }); var costPanel = ui.Panel({style: {backgroundColor: colors.transparent}}); var cost_label = ui.Label('Cost:', LABEL_STYLE); costPanel.add(cost_label).add(costTextBox); var treePanel = ui.Panel({style: {backgroundColor: colors.transparent}}); var tree_label = ui.Label('Tree:', LABEL_STYLE); treePanel.add(tree_label).add(treeTextBox); var gammaPanel = ui.Panel({style: {backgroundColor: colors.transparent}}); var gamma_label = ui.Label('Gamma:', LABEL_STYLE); gammaPanel.add(gamma_label).add(gammaTextBox); var SVMPanel = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, padding: '4px'}}); SVMPanel.add(gammaPanel).add(costPanel); var RFPanel = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, padding: '4px'}}); RFPanel.add(treePanel); var AlgorithmsParameters = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, padding: '4px'}}); AlgorithmsParameters.add(SVMPanel); Algorithms_Selector.onChange(function(x) { if (x == 'SVM') { AlgorithmsParameters.clear(); AlgorithmsParameters.add(SVMPanel); } else if (x == 'RF') { AlgorithmsParameters.clear(); AlgorithmsParameters.add(RFPanel); } else { AlgorithmsParameters.clear(); AlgorithmsParameters.add(RFPanel);
} }); visPanel.add(algorithmTitle).add(Algorithms_Selector).add(AlgorithmsParameters); infoPanel.add(visPanel); infoPanel.widgets().set(12, ui.Label('Showing results', TITLE_STYLE)); var buttonHold = ui.Panel({layout: ui.Panel.Layout.flow('horizontal'), style: {backgroundColor: colors.transparent, textAlign: 'center', stretch: 'both', padding: '4px'}}); infoPanel.add(buttonHold); var runButton = ui.Button({label: 'Result image', style: {width: '125px', maxWidth: '250px', color: '#616161'}}); var clearButton = ui.Button({label: 'Remove image', style: {width: '125px', maxWidth: '250px', color: '#616161'}}); buttonHold.add(runButton).add(clearButton); * Hàm chạy thuật toán var buildResult = runButton.onClick(function() { * Tạo mẫu var newfc = fire.merge(no_fire); * Thời gian nghiên cứu var start = '2021-11-15'; var end = '2022-02-15'; * Khu vực nghiên cứu var NgheAn = admin.filter(ee.Filter.eq('ADM1_NAME', 'Nghe An')); var NA = NgheAn.geometry(); Map.addLayer(NA, {color: 'silver'}, 'Nghe An'); Map.centerObject(NA, 10); * Tìm dữ liệu ảnh Sentinel-2 và tính NDVI, NDMI var S2 = ee.ImageCollection('COPERNICUS/S2_SR').filterDate(start, end).filter(ee.Filter.lt('CLOUDY_PIXEL_PERCENTAGE', 10)).median(); var img = S2.clip(NA); var NDVI = (img.select('B8').subtract(img.select('B4'))).divide(img.select('B8').add(img.select('B4'))); var NDMI = (img.select('B8').subtract(img.select('B12'))).divide(img.select('B8').add(img.select('B12'))); * Đồng bộ các lớp dữ liệu cùng khu vực nghiên cứu aspect = aspect.updateMask(docao); danso = danso.updateMask(docao); docao = docao.updateMask(docao); gio = gio.updateMask(docao); luongmua = luongmua.updateMask(docao); slope = slope.updateMask(docao); NDMI = NDMI.updateMask(docao); NDVI = NDVI.updateMask(docao); LST = LST.updateMask(docao); danso3 = danso3.updateMask(docao); * Tạo lớp huấn luyện var dataset = ee.Image.cat(aspect, danso, docao, gio, luongmua, slope, NDMI, NDVI, LST); var bands = dataset.bandNames(); * Tạo bộ huấn luyện var training = dataset.select(bands).sampleRegions({
collection: newfc, properties: ['fire'], scale: 10 }); * Nếu huấn luyện bằng SVM cần chuẩn hoá dữ liệu if (Algorithms_Selector.getValue() == 'SVM') { var classifier_alg_SVM = "SVM"; if(classifier_alg_SVM == "SVM"){ var dataset_SVM = dataset; var minMax = dataset_SVM.reduceRegion({ reducer: ee.Reducer.minMax(), geometry: dataset_SVM.geometry(), scale: 10, maxPixels: 10e9, tileScale: 4, bestEffort: true }); dataset_SVM = ee.ImageCollection.fromImages( dataset_SVM.bandNames().map(function(name){ name = ee.String(name); var band = dataset_SVM.select(name); return band.unitScale(ee.Number(minMax.get(name.cat('_min'))), ee.Number(minMax.get(name.cat('_max')))); })).toBands().rename(dataset_SVM.bandNames()); var training_SVM = dataset_SVM.select(bands).sampleRegions({ collection: newfc, properties: ['fire'], scale: 10 }); if (classifier_alg_SVM == "SVM") { * Lấy dữ liệu nhập từ bàn phím var parameter_gamma_SVM = gammaTextBox.getValue(); var parameter_cost_SVM = costTextBox.getValue(); var classifier = ee.Classifier.libsvm({ kernelType: 'RBF', gamma: 0.001, cost: ee.Number.parse(parameter_cost_SVM) }); * Huấn luyện và kiểm tra var classifier_SVM = classifier.setOutputMode('PROBABILITY').train(training_SVM, 'fire', bands); var classified_SVM = dataset_SVM.select(bands).classify(classifier_SVM); classified_SVM = classified_SVM.unitScale(ee.Number(0), ee.Number(1)); var classified = classified_SVM; * Hiển thị kết quả theo các lớp var random1 = classified.lt(0.1); var class1 = classified.updateMask(random1); mappingPanel.addLayer(class1,{'palette':'14790b'},'Level 5');
var random2 = classified.gte(0.1).and(classified.lt(0.25)); var class2 = classified.updateMask(random2); mappingPanel.addLayer(class2,{'palette':'57d646'},'Level 4'); var random3 = classified.gte(0.25).and(classified.lt(0.4)); var class3 = classified.updateMask(random3); mappingPanel.addLayer(class3,{'palette':'f6f810'},'Level 3'); var random4 = classified.gte(0.4).and(classified.lt(0.6)); var class4 = classified.updateMask(random4); mappingPanel.addLayer(class4,{'palette':'ffa90e'},'Level 2'); var random5 = classified.gte(0.6); var class5 = classified.updateMask(random5); mappingPanel.addLayer(class5,{'palette':'ef3600'},'Level 1'); } } } * Huấn luyện bằng thuật toán RF else if (Algorithms_Selector.getValue() == 'RF'){ var classifier_alg_RF = "RF"; if(classifier_alg_RF =="RF"){ * Lấy dữ liệu nhập từ bàn phím var parameter_tree_RF = treeTextBox.getValue(); * Tạo bộ huấn luyện và huấn luyện, lấy số cây theo dữ liệu nhập var classifier_RF = ee.Classifier.smileRandomForest(ee.Number.parse(parameter_tree_RF)).setOutputMode('PR OBABILITY').train({ features: training, classProperty: 'fire', inputProperties: bands }); * Tạo kết quả phân loại var classified_RF = dataset.select(bands).classify(classifier_RF); * Hiển thị kết quả theo các lớp var random_RF1 = classified_RF.lt(0.4); var class_RF1 = classified_RF.updateMask(random_RF1); mappingPanel.addLayer(class_RF1,{'palette':'14790b'},'Level 5'); var random_RF2 = classified_RF.gte(0.4).and(classified_RF.lt(0.6)); var class_RF2 = classified_RF.updateMask(random_RF2); mappingPanel.addLayer(class_RF2,{'palette':'57d646'},'Level 4'); var random_RF3 = classified_RF.gte(0.6).and(classified_RF.lt(0.75)); var class_RF3 = classified_RF.updateMask(random_RF3); mappingPanel.addLayer(class_RF3,{'palette':'f6f810'},'Level 3'); var random_RF4 = classified_RF.gte(0.75).and(classified_RF.lt(0.9)); var class_RF4 = classified_RF.updateMask(random_RF4); mappingPanel.addLayer(class_RF4,{'palette':'ffa90e'},'Level 2'); var random_RF5 = classified_RF.gte(0.9); var class_RF5 = classified_RF.updateMask(random_RF5); mappingPanel.addLayer(class_RF5,{'palette':'ef3600'},'Level 1'); } }