
Ứng dụng dữ liệu địa không gian và kỹ thuật học máy trong dự báo nguy cơ cháy rừng, thử nghiệm tại khu vực phía tây tỉnh Nghệ An
lượt xem 0
download

Nghệ An là tỉnh có diện tích rừng và đất lâm nghiệp lớn nhất cả nước với hơn 1 triệu ha rừng, tỉ lệ che phủ đạt 58,33%.Do ảnh hưởng của biến đổi khí hậu và hoạt động của con người, lớp phủ rừng ở Nghệ An có sự biến động sâu sắc, trong đó cháy rừng là một trong những nguyên nhân chính. Bài viết này trình bày kết quả ứng dụng dữ liệu địa không gian và các kỹ thuật học máy nhằm dự báo nguy cơ cháy rừng khu vực phía Tây tỉnh Nghệ An.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Ứng dụng dữ liệu địa không gian và kỹ thuật học máy trong dự báo nguy cơ cháy rừng, thử nghiệm tại khu vực phía tây tỉnh Nghệ An
- 50 Journal of Mining and Earth Sciences, Vol 65, Issue 5 (2024) 50 - 60 Forest fire risk prediction using geospatial data and machine learning techniques, a case study in the western region of Nghe An province Phuong Nam Thi Doan 1,*, Hung Le Trinh 2, Trung Van Nguyen 1, Ha Thu Thi Le 1, Phu Van Le 2 1 Hanoi University of Mining and Geology, Hanoi, Vietnam 2 Le Quy Don Technical University, Hanoi, Vietnam ARTICLE INFO ABSTRACT Article history: Nghe An is the province with the largest area of forests and forestry land Received 27th Mar. 2024 in the country with more than 1 million hectares of forest, coverage rate Revised 28th July 2024 reaching 58,33%. Due to the influence of climate change and human Accepted 26th Aug. 2024 activities, forest cover in Nghe An has profound fluctuations, of which Keywords: forest fires are one of the main causes. This article presents the results of Forest fire risk prediction developing a forest fire risk prediction model in the western region of model, Nghe An province from geospatial data and machine learning algorithms. From the analysis of natural and social conditions in the study area, 9 Geospatial data, input data layers include: (1) elevation, (2) slope, (3) aspect, (4) Machine learning, vegetation cover density, (5) population density, (6) land surface Nghe An province. temperature, (7) evapotranspiration, (8) wind speed and (9) average monthly rainfall is used to build a forest fire risk prediction model. In the study, we tested with 02 machine learning algorithms, including Random Forest (RF) and Gradient Tree Boosting (GTB), then selected the appropriate algorithm by evaluating accuracy using the fire point data set as well as model performance. The obtained results showed that the AUC (Area Under the Curve) value of the GTB(350) algorithm reached 0,948, higher than the RF(100) (0,947). From this result, the study used the GTB algorithm with 350 trees to create a forest fire risk prediction map in the western region of Nghe An province. Copyright © 2024 Hanoi University of Mining and Geology. All rights reserved. _____________________ *Corresponding author E - mail: doanthinamphuong@humg.edu.vn DOI: 10.46326/JMES.2024.65(5).06
- Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất Tập 65, Kỳ 5 (2024) 50 - 60 51 Ưng dụ ng dư liệ u địa không gian và kỹ thuạ t họ c má y trong dư ́ ̃ ̣ bá o nguy cơ chá y rưng, thư nghiệ m tạ i khu vưc phía tây tỉnh ̀ ̉ ̣ Nghệ An Đoà n Thị Nam Phương 1,*, Trịnh Lê Hù ng 2, Nguyễ n Văn Trung 1, Lê Thị Thu Hà 1, Lê Văn Phú 2 1 Trường Đại học Mỏ Địa chất, Hà Nội, Việt Nam 2 Trường Đại học Kỹ thuật Lê Quý Đôn, Hà Nội, Việt Nam THÔNG TIN BÀI BÁO TÓM TẮT Quá trình: Nghệ An là tỉnh có diện tích rừng và đất lâm nghiệp lớn nhất cả nước với Nhận bài 27/3/2024 hơn 1 triệu ha rừng, tỉ lệ che phủ đạt 58,33%. Do ảnh hưởng của biến đổi khí Sửa xong 28/7/2024 hậu và hoạt động của con người, lớp phủ rừng ở Nghệ An có sự biến động Chấp nhận đăng 26/8/2024 sâu sắc, trong đó cháy rừng là một trong những nguyên nhân chính. Bài báo Từ khóa: này trình bày kết quả ứng dụng dữ liệu địa không gian và các kỹ thuật học Dư liệ u địa không gian, ̃ máy nhằm dự báo nguy cơ cháy rừng khu vực phía Tây tỉnh Nghệ An. Từ Họ c má y, phân tích điều kiện tự nhiên-xã hội khu vực nghiên cứu, chín lớp dữ liệu bao gồm: (1) độ cao, (2) độ dốc, (3) hướng sườn, (4) mật độ che phủ, (5) mật độ Mô hình dư bá o nguy cơ chá y ̣ dân cư, (6) nhiệt độ bề mặt, (7) độ bốc thoát hơi nước, (8) tốc độ gió và (9) rưng, ̀ lượng mưa trung bình tháng được sử dụng để mô hình hóa nguy cơ cháy Tỉnh Nghệ An. rừng. Trong nghiên cứu đã thử nghiệm với 02 thuật toán học máy khác nhau, bao gồm Random Forest (RF) và Gradient Tree Boosting (GTB), từ đó lựa chọn thuật toán phù hợp thông qua đánh giá độ chính xác bằng bộ dữ liệu điểm cháy cũng như hiệu suất mô hình. Kết quả nhận được cho thấy, giá trị AUC (Area Under the Curve) của thuật toán GTB(350) đạt 0,948, cao hơn so với thuật toán RF(100) (0,947). Từ kết quả này, trong nghiên cứu đã sử dụng thuật toán GTB với số lượng cây 350 để thành lập bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An. © 2024 Trường Đại học Mỏ - Địa chất. Tất cả các quyền được bảo đảm. _____________________ *Tác giả liên hệ E - mail: doanthinamphuong@humg.edu.vn DOI: 10.46326/JMES.2024.65(5).06
- 52 Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 Cá c nghiên cưu dư bá o nguy cơ chá y rưng ơ ́ ̣ ̀ ̉ 1. Mở đầu Việ t Nam đươc thưc hiệ n tư nhưng năm cuó i thế ̣ ̣ ̀ ̃ Theo công bó hiệ n trạ ng rưng năm 2023, Việ t ̀ kỷ XX trên cơ sơ sư dụ ng cá c chỉ só tỏ ng hơp, chủ ̉ ̉ ̣ Nam có diệ n tích rưng trên 14 triệ u ha, tỉ lệ che ̀ yế u là chỉ só Nesterov - chỉ só P (Phạm, 1988; Võ, phủ đạ t 42,02% (MARD, 2024). Mạ c dù tỏ ng diệ n 1995). Phương phá p truyề n thó ng nà y tiế p tụ c tích rưng và tỉ lệ che phủ ơ Việ t Nam có xu hương ̀ ̉ ́ đươc sư dụ ng trong cá c nghiên cưu thơi gian sau, ̣ ̉ ́ ̀ gia tăng trong giai đoạ n gà n đây, tuy nhiên diệ n trong đó mô hình dư bá o đươc bỏ sung thêm cá c ̣ ̣ tích rưng gia tăng chủ yế u là rưng trò ng, trong khi ̀ ̀ lơp thông tin đà u và o cũ ng như điề u chỉnh giá trị ́ rưng tư nhiên tiế p tụ c suy giả m. Có nhiề u nguyên ̀ ̣ chỉ tiêu P trong phân cá p nguy cơ chá y rưng (Lê và ̀ nhân khá c nhau gây nên sư suy giả m diệ n tích vạ̀ Vương, 2014; Nguyễn, 2019). Thơi gian gà n đây, ̀ chá t lương rưng ơ Việ t Nam, trong đó chá y rưng là ̣ ̀ ̉ ̀ mọ t só nghiên cưu đã kế t hơp dư liệ u viễ n thá m, ́ ̣ ̃ mọ t trong nhưng nguyên nhân quan trọ ng (Trà n, ̃ GIS và cá c mô hình họ c má y để nâng cao đọ chính 2017; Nguyễn và nnk., 2017). Cháy rừng là một xá c kế t quả dư bá o nguy cơ chá y rưng (Đạ ng và ̣ ̀ hiện tượng phức tạp bị ảnh hưởng bởi sự kết hợp nnk,, 2017 Hoang và nnk., 2020). Cá c nghiên cưu ́ của các yếu tố. Thơi tiế t và cá c hoạ t đọ ng củ a con ̀ nà y đã sư dụ ng mọ t só mô hình họ c má y như RF, ̉ ngươi là cá c yế u tó chính góp phần vào việc xảy ra ̀ SVM và Classification and Regression Tree (CART) và lan rộng của cháy rừng. Bên cạnh đó, biến đổi để dư bá o nguy cơ chá y rưng trên cơ sở xác suất ̣ ̀ khí hậu và sự thay đổi về địa hình có thể ảnh xảy ra cháy của từng điểm ảnh. Kế t quả nhạ n đươc ̣ hưởng đến hành vi và đẩy nhanh quá trình cháy cho thá y, thuạ t toá n RF có đọ chính xá c cao nhá t (Hoang và nnk., 2020). trong dư bá o nguy cơ chá y rưng, trong khi đó ̣ ̀ Lớp phủ rừng thường phân bố ở các khu vực thuạ t toá n CART có đọ chính xá c thá p nhá t (Đoà n, có địa hình phức tạp, khó tiếp cận, do vậy các 2023). phương pháp truyền thống có nhiều hạn chế trong Bài báo nà y trình bà y kế t quả xây dưng bả n ̣ phát hiện và dự báo nguy cơ cháy rừng. Những đò dư bá o nguy cơ chá y rưng khu vưc phía tây tỉnh ̣ ̀ ̣ hạn chế này có thể được khắc phục khi sử dụng Nghệ An sư dụ ng dư liệ u địa không gian và kỹ ̉ ̃ công nghệ địa không gian, trong đó chủ đạo là dữ thuạ t họ c má y. Ba thuạ t toá n họ c má y thông dụ ng, liệu viễn thám và GIS. Mọ t só hệ thó ng cả nh bá o đã đươc chưng minh hiệ u quả trong cá c nghiên ̣ ́ chá y rưng tư dư liệ u viễ n thá m và GIS đươc á p ̀ ̀ ̃ ̣ cưu khá c nhau bao gò m RF, SVM và GTB đươc thư ́ ̣ ̉ dụ ng như Hệ thó ng thông tin chá y rưng châu Âu ̀ nghiệ m để lưa chọ n thuạ t toá n phù hơp vơi điề u ̣ ̣ ́ (EFFIS) sư dụ ng dư liệ u ả nh MODIS, hệ thó ng ̉ ̃ kiệ n cụ thể khu vưc nghiên cưu. Bọ dư liệ u đà u và o ̣ ́ ̃ INPAS (Croatia) sư dụ ng kế t hơp đa nguò n dư liệ u ̉ ̣ ̃ bao gò m cá c lơp đạ i diệ n cho yế u tó địa hình, lơp ́ ́ (video, dư liệ u khí tương, dư liệ u GIS). Với sự phát ̃ ̣ ̃ phủ , khí hạ u, điề u kiệ n kinh tế -xã họ i đươc lưa ̣ ̣ triển mạnh mẽ của trí tuệ nhân tạo, thời gian gần chọ n và xây dưng tư dư liệ u viễ n thá m, GIS và cá c ̣ ̀ ̃ đây nhiều nghiên cưu đã sư dụ ng cá c mô hình học ́ ̉ cơ sở dữ liệu quó c tế . Đọ chính xá c kế t quả dư bá o ̣ máy, học sâu như mạ ng neural nhân tạ o, random nguy cơ chá y rưng đươc đá nh giá thông qua bọ dư ̀ ̣ ̃ forest, support vector machine,... để nâng cao đọ liệ u điể m chá y trong quá khư cũ ng như đá nh giá ́ chính xá c kết quả dự báo nguy cơ cháy rừng hiệ u năng củ a mô hình. (Vasilakos và nnk., 2009; Oliveira và nnk., 2012; Dieu và nnk., 2016; Enod và nnk., 2021; Iban và 2. Dữ liệu và phương pháp nghiên cứu Sekertekin, 2022; Nguyen và nnk, 2018). Cá c kỹ thuạ t hò i quy như hò i quy đa biế n (multiple 2.1. Dữ liệu và khu vực nghiên cứu regression) (Oliveira và nnk., 2012), hò i quy Ả nh Sentinel 2 MSI chụ p trong khoả ng thơi ̀ logistic (Pourghasemi, 2015), hò i quy trọ ng só địa gian tư 15/11/2021 đế n 16/01/2022 đươc sư ̀ ̣ ̉ lý (geographically weighted regression - GWR) dụ ng để tạ o ả nh không mây và xây dưng lơp dư ̣ ́ ̃ (Fernandez và nnk., 2012), kỹ thuạ t khai phá dư ̃ liệ u về mạ t đọ che phủ . Trong khi đó , ả nh Landsat liệ u (data mining) (Arpaci và nnk., 2014), cá c mô 8 trong cù ng thơi gian trên đươc sư dụ ng để tính ̀ ̣ ̉ hình tỏ ng quá t (GLMs, GAMs) (Ruano và nnk., nhiệ t đọ bề mạ t. 2022) cũ ng đươc sư dụ ng để đánh giá và dư bá o ̣ ̉ ̣ Dư liệ u DEM toà n cà u SRTM vơi đọ phân giả i ̃ ́ nguy cơ chá y rưng từ bộ dữ liệu đầu vào đại diện ̀ không gian 30 m cung cá p bơi Cơ quan Hà ng ̉ cho các yế u tó tư nhiên và kinh tế - xã họ i. ̣ không vũ trụ Mỹ (NASA) đươc sư dụ ng để chiế t ̣ ̉
- Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 53 xuá t thông tin cá c yế u tó địa hình như đọ dó c, đọ Khu vực nghiên cứu được lựa chọn là địa bà n cao, hương sươn. ́ ̀ phía tây tỉnh Nghệ An bao gồm các huyện Con Bên cạnh đó, dữ liệu về khí hậu và thời tiết, Cuông, Kỳ Sơn, Quế Phong, Quỳ Châu, Quỳ Hợp và bao gò m: tó c đọ gió , lương mưa trung bình thá ng, ̣ Tương Dương (Hình 1). Theo bá o cá o hiệ n trạ ng đọ bó c thoá t hơi nươc cũng được sử dụng trong ́ rưng Việ t Nam năm 2023 của Bộ Nông nghiệp và ̀ nghiên cứu. Các lớp dữ liệu này được thu thạ p từ Phát triển nông thôn, Nghệ An có diệ n tích rưng và ̀ cơ sở dữ liệu quốc tế về khí hậu WorldClim đá t lâm nghiệ p lơn nhá t cả nươc, chiế m gà n 70% ́ ́ (https://www.worldclim.org/). Lơp dữ liệu Mật ́ diệ n tích đá t tư nhiên toà n tỉnh, mạ t đọ che phủ ̣ độ dân cư được thu thập và xây dựng từ cơ sở dữ rưng đạ t 58,36%. Nghệ An cũng là một trong các ̀ liệu nhân khẩu học WorldPop (https://data. địa phương đứng đầu trên toàn quốc về nguy cơ worldpop.org/). Các lớp dữ liệu được thu thập cháy rừng ở cấp V, cấp cực kỳ nguy hiểm. Phía tây tương ứng trong giai đoạn thu thập dữ liệu điểm tỉnh Nghệ An nằm trong vùng núi và có đặc điểm cháy rừng. địa hình đa dạng, bao gồm khu vưc nú i cao, thung ̣ Bọ dư liệ u điể m chá y trong quá khư đươc thu ̃ ́ ̣ lũng và sông suối. Do đặc điểm địa hình phức tạp thạ p trong giai đoạ n 2018÷2023 dưa trên hò sơ ̣ và thảm phủ rừng dày đặc, phía tây tỉnh Nghệ An chá y củ a Cụ c Kiể m lâm (Bọ Nông nghiệp và Phát có nguy cơ cháy rừng cao trong mùa khô. Một số triển Nông thôn) và dư liệ u hỏ a hoạ n tư hệ thó ng ̃ ̀ vụ cháy rừng điển hình như cháy rừng tại xã Châu FIRMS (NASA). Bên cạ nh đó , trong nghiên cưu ́ Bính, huyện Quỳ Châu (14/04/2022) đã gây thiệt cũ ng xây dựng bọ dư liệ u cá c điể m «không chá y» ̃ hại hơn 500 ha rừng, cháy rừng tại xã Mường Típ, đươc lá y theo các vị trí có mật độ cây thấp, mặt ̣ huyện Kỳ Sơn (25/04/2022) đã gây thiệt hại hơn nước, ít hoạt động của con người để huá n luyệ n và 200 ha rừng, cháy rừng tại xã Lục Dạ, huyện Con kiể m định mô hình dư bá o. ̣ Cuông (05/05/2022) gây thiệt hại hơn 100 ha rừng. Hình 1. Mô tả vị trí khu vực nghiên cứu.
- 54 Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 Mưc đọ quan trọ ng củ a tưng yế u tó đà u đươc ́ ̀ ̣ 2.2. Phương pháp nghiên cứu xá c định trên cơ sơ hệ só tương quan Pêarson (hệ ̉ a) Xây dựng bộ dữ liệu đầu vào và chuẩn hoá dữ só r). Hệ só (r) có giá trị trong khoả ng tư -1÷1, ̀ liệu trong đó giá trị r dương thể hiệ n tương quan thuạ n, r âm thể hiệ n tương quan nghịch. Trong Để lựa chọn và xây dựng bọ dư liệ u đà u và o ̃ nghiên cưu nà y, hệ só r đươc xá c định bà ng phà n ́ ̣ củ a mô hình, trong bài báo tiến hành phân tích, mề m QGIS 2.18. đá nh giá ảnh hưởng của các điều kiện tự nhiên, kinh tế - xã hội đến nguy cơ xảy ra cháy rừng. Phân b) Lựa chọn thuật toán học máy tích đạ c điể m chá y rưng ơ khu vực nghiên cứu cho ̀ ̉ Để dư bá o nguy cơ chá y rưng khu vưc phía tây ̣ ̀ ̣ thá y, nguyên nhân chính củ a tình trạ ng nà y là do tỉnh Nghệ An tư bọ dư liệ u đà u và o bao gò m chín ̀ ̃ ả nh hương củ a điều kiện tư nhiên (đạ c điể m lơp ̉ ̣ ́ yế u tó , trong bà i bá o thư nghiệ m vơi mọ t só thuạ t ̉ ́ phủ , cá c yế u tó thơi tiế t, khí hạ u, địa hình) cũ ng ̀ toá n họ c má y thông dụng như Random Forêst như hoạ t đọ ng củ a con ngươi (du lịch rừng, đốt ̀ (RF), Support Vector Machine (S SVM VM) và nương làm rẫy, sự mở rộng đô thị và nông thôn). Gradient Tree Boosting (GTB). Tư kế t quả nà y, trong bà i bá o đã lưa chọ n chín lơp ̀ ̣ ́ Random Forest dư liệ u để lưa chọ n xây dưng mô hình dư bá o nguy ̃ ̣ ̣ ̣ cơ chá y rưng, bao gò m: (1) đọ cao, (2) đọ dó c, (3) ̀ RF là một thuật toán học máy có giám sát hương sươn, (4) mạ t đọ che phủ thưc vạ t, (5) mạ t ́ ̀ ̣ được sử dụng phổ biến trong hồi quy và phân loại, đọ dân cư, (6) nhiệ t đọ bề mạ t, (7) đọ bó c thoá i hơi đồng thời tạo ra kết quả phân loại tốt ngay cả khi nươc bề mạ t, (8) tó c đọ gió , (9) lương mưa trung ́ ̣ không điều chỉnh bộ siêu tham số. RF hoạ t đọ ng bình thá ng. trên cơ sơ xây dựng nhiề u cây quyết định ̉ Cá c lơp dư liệ u về địa hình (đọ cao, đọ dó c, ́ ̃ (decision tree) trên các mẫu huá n luyệ n, mỗi cây hương sươn) đươc xây dưng tư DEM SRTM ́ ̀ ̣ ̣ ̀ quyết định sẽ khác nhau (có yếu tố random). Ở (30m). Cá c lơp dư liệ u về thơi tiế t, khí hạ u, dân cư ́ ̃ ̀ bước tiếp theo, đó i vơi mỗi cây quyết định sẽ đi từ ́ đươc thu thạ p tư cơ sở dữ liệu WorldClim và ̣ ̀ trên xuống theo các nú t điều kiện để được các dự WorldPop. Nhiệ t đọ bề mạ t đươc xá c định tư ả nh ̣ ̀ đoán, sau đó kết quả cuối cùng được tổng hợp từ vệ tinh Landsat 8 thêo phương phá p do NASA kết quả của các cây quyết định. Như vạ y, RF lá y cung cá p (Landsat 8 data users handbook). Trong ngã u nhiên dư liệ u và thuọ c tính để xây dưng cây ̃ ̣ khi đó , mạ t đọ che phủ đươc xá c định thông qua ̣ quyế t định (Breiman, 2001). chỉ só thưc vạ t NDVI theo công thưc (1) (Trinh and ̣ ́ Gradient Tree Boosting Zablotskii, 2017): NDVI − NDVI min (1) GTB là một thuật toán học máy kết hợp sức Pv = mạnh của cây quyết định với kỹ thuật tối ưu hóa NDVI max − NDVI min giảm dần độ dốc. Đây là một thuật toán linh hoạt Do cá c lơp dư liệ u đà u và o đươc xây dưng tư ́ ̃ ̣ ̣ ̀ và mạnh mẽ được sử dụng rộng rãi cho cả bà i toá n cá c nguò n khá c nhau vơi thang đo không thó ng ́ phân loại và hồi quy (Friedman, 2001). nhá t, để có thể đưa và o mô hình dư bá o, tất cả các ̣ GTB hoạt động bằng cách xây dựng một tập lơp dư liệ u nà y được chuyển đổi sang định dạng ́ ̃ hợp các cây quyết định, trong đó mỗi cây được raster vơi độ phân giải 10 m (phù hơp vơi đọ phân ́ ̣ ́ huấn luyện để cải thiện dự đoán của các cây trước giả i không gian củ a ả nh Sentinel 2 MSI). Tiếp theo, đó. Thuật toán sử dụng kỹ thuật tối ưu hóa giảm cá c lơp dư liệ u được chuẩn hóa về phạm vi [0÷1] ́ ̃ độ dốc để giảm thiểu hàm mất mát, đây là thước theo công thưc (2) (Dieu và nnk., 2012): ́ đo sai số giữa giá trị dự đoán và giá trị thực. Fai − Min( Fa) Nv = 0,99 − 0,01 + 0,01 (2) Về mặt toán học, giả sử X và Y lần lượt là đầu Max( Fa) − Min( Fa) vào và mục tiêu của N mẫu. Nghiên cứu cần xây Trong đó: Fai - giá trị của hệ số được xem xét, dựng một hàm f(x) ánh xạ các đặc trưng đầu vào X Min(Fa) và Max(Fa) là giá trị tối thiểu và giá trị tối tới các biến mục tiêu y. Hàm mất mát được xác đa của hệ số được xem xét; Nv - giá trị tính toán định là sự khác biệt giữa các biến thực tế và dự mới cho hệ số được xem xét. đoán theo công thưc (3) (Friedman, 2001; Sharma ́ and Ghosh, 2023):
- Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 55 L ( yi , f ( xi ) ) N L( f ) = L ( yi , f ( xi ) ) (3) gim = − (6) f ( xi ) f ( xi )= fm−1 ( xi ) i =1 Mục tiêu của bài toán là muốn cực tiểu hoá hàm mất mát L(f) đối với f như công thưc (4): ́ Thuật toán sẽ chạy cho tới khi giá trị hm trở N nên quá nhỏ. Khi đó, hàm f(x) được xây dựng và f 0 ( x) = arg min ( L ( f ) ) = arg min L ( yi , f ( xi ) ) (4) f f i =1 phù hợp với mô hình. Trong quá trình thực thi cây tăng cường độ Sơ đò quy trình dư bá o nguy cơ chá y rưng tư ̣ ̀ ̀ dốc, tại bước thứ m, để cải thiện giá trị của fm, thuật dư liệ u địa không gian và mô hình họ c má y đươc ̃ ̣ toán sẽ tích hợp các giá trị ước tính hm (công thưc ́ mô tả trên Hình 2, bao gồm: (5)) Bươc 1: Nghiên cứu xây dưng bọ dư liệ u đà u ́ ̣ ̃ và o và chuẩn hoá dữ liệu. Đồng thời, dữ liệu điểm yi = f m+1 ( xi ) = f m ( xi ) + hm ( xi ) (5) cháy và không cháy được thu thập. Các dữ liệu Đối với việc tăng cường độ dốc ở bước thứ m, mẫu được chia thành bộ dữ liệu huấn luyện và bộ độ dốc cao nhất tìm thấy là hm = − m g m . Trong dữ liệu kiểm tra. Bươc 2: Xây dựng mô hình nguy cơ cháy rừng ́ đó m là giá trị không đổi được gọi là độ dài bước, với các thuật toán RF và GTB. Thiết lập các tham g m là độ dốc của hàm mất mát L(f). g m được xác số ban đầu cho thuật toán. định theo công thưc (6): ́ Bươc 3: Thay đổi các tham số và đánh giá độ ́ chính xác của tường mô hình. Lựa chọn mô hình có độ chính xác cao nhất làm mô hình tối ưu. Hình 2. Sơ đồ mô hình dự báo nguy cơ cháy rừng.
- 56 Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 Hình 3. Các lớp dữ liệu độ cao, độ dốc, hướng sườn, mật độ che phủ, độ bốc thoát hơi nước và nhiệt độ bề mặt khu vực nghiên cứu. Hình 4: Các lớp dữ liệu mật độ dân cư, lượng mưa trung bình tháng và tốc độ gió khu vực nghiên cứu. Bươc 4: Sử dụng mô hình tối ưu, xây dựng lớp ́ liệ u nà y đươc nọ i suy về cù ng đọ phân giả i không ̣ dữ liệu nguy cơ cháy rừng và biên tập bản đồ. gian 10 m và chuả n hó a về thang giá trị [0÷1] theo công thưc (2). ́ 3. Kết quả và thảo luận Sau khi xây dưng cá c lơp thông tin đà u và o ̣ ́ Trên Hình 3 và 4 trình bà y kế t quả xây dưng ̣ cho mô hình, trong nghiên cưu tiế n hà nh xá c định ́ bọ dư liệ u đà u và o cho mô hình dư bá o nguy cơ ̃ ̣ hệ só tương quan Pêarson giưa cá c lơp dư liệ u đà u ̃ ́ ̃ chá y rưng khu vưc phía tây tỉnh Nghệ An, bao gò m ̀ ̣ và o và bọ dư liệ u điể m chá y trong quá khư để ̃ ́ chín lơp dư liệ u: đọ cao, đọ dó c, hương sươn, mạ t ́ ̃ ́ ̀ đá nh giá mưc đọ quan trọ ng củ a tưng yế u tó đó i ́ ̀ đọ che phủ , đọ bó c thoá t hơi nươc bề mạ t, nhiệ t đọ ́ vơi mô hình dư bá o. Bảng 1 trình bày giá trị tương ́ ̣ bề mạ t (Hình 3) và mạ t đọ dân cư, lương mưa ̣ quan so với dữ liệu dự báo cháy rừng. Kế t quả trung bình thá ng, tó c đọ gió (Hình 4). Cá c lơp dư ́ ̃ nhạ n đươc cho thá y, lơp dư liệ u nhiệ t đọ bề mạ t ̣ ́ ̃
- Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 57 có ả nh hương lơn nhá t đế n nguy cơ chá y rưng, thể ̉ ́ ̀ rưng trong quá khư, có 27 điể m đươc phân bó và o ̀ ́ ̣ hiệ n qua hệ só tương quan r đạ t 0,582. Mạ t đọ che khu vưc có cá p đọ dư bá o « nguy hiể m » và « cưc ̣ ̣ ̣ phủ củ a thưc vạ t, đọ bó c thoá t hơi nươc bề mạ t, đọ ̣ ́ kỳ nguy hiể m », tương đương 75%. Không có dó c và lương mưa trung bình thá ng có tương quan ̣ điể m chá y nà o phân bó ơ khu vưc có cá p đọ dư bá o ̉ ̣ ̣ ơ mưc trung bình vơi bọ dư liệ u điể m chá y (hệ só ̉ ́ ́ ̃ « thá p », trong khi 9/36 điể m phân bó ơ khu vưc ̉ ̣ r tư 0,2 đế n trên 0,4). Trong khi đó , lơp dư liệ u về ̀ ́ ̃ có cá p đọ dư bá o chá y rưng « trung bình » và ̣ ̀ tó c đọ gió , hương sươn và mạ t đọ dân cư có mưc ́ ̀ ́ « cao » (tương đương 25%). đọ quan trọ ng thá p hơn, thể hiệ n qua giá trị hệ só Vơi thuạ t toá n RF, tham só số lượng cây ́ tương quan r xá p xỉ 0,1. Mạ c dù có tương quan (numberOfTrees) là 100 (RF(100)) có đọ chính không cao vơi bọ dư liệ u điể m chá y trong quá khư ́ ̃ ́ xá c cao nhá t, thể hiệ n qua vị trí phân bó dư liệ u cá c ̃ ơ khu vưc nghiên cưu, tuy nhiên vơi đạ c thù khu ̉ ̣ ́ ́ điể m chá y, không chá y và kế t quả đá nh giá bà ng vưc thư nghiệ m có địa hình dó c, chịu ả nh hương ̣ ̉ ̉ đương cong ROC. Để lưa chọ n mô hình phù hơp ̀ ̣ ̣ củ a gió phơn Tây Nam (gió Là o) cũ ng như nhiề u vơi điề u kiệ n cụ thể khu vưc thư nghiệ m, trong ́ ̣ ̉ vụ chá y rưng ơ khu vưc phía tây tỉnh Nghệ An có ̀ ̉ ̣ nghiên cưu đã tiế n hà nh so sá nh hiệ u suá t củ a mô ́ nguyên nhân tư hoạ t đọ ng củ a con ngươi, cá c lơp ̀ ̀ ́ hình GTB(350) và cá c mô hình RF(100) và dư liệ u trên vã n đươc lưa chọ n để đưa và o cá c mô ̃ ̣ ̣ SVM(25). Bọ dư liệ u huá n luyệ n và bọ dư liệ u kiể m ̃ ̃ hình dư bá o nguy cơ chá y rưng. ̣ ̀ tra đươc so sá nh, đá nh giá thông qua giá trị AUC ̣ (Area under Curve). AUC là một kỹ thuật đánh giá Bảng 1. Giá trị tương quan so với dữ liệu dự báo hiệu quả của mô hình hồi quy trong phân loại dữ cháy rừng. liệu. Giá trị AUC thay đổi từ 0 đến 1, trong đó giá Lớp dữ liệu bổ sung Giá trị trị AUC càng lớn thì mô hình phân loại dữ liệu càng Hướng sườn 0,052 tốt. Kế t quả nhạ n đươc cho thá y, giá trị AUC củ a ̣ Mật độ dân số 0,089 thuạ t toá n GTB(350) đạ t 0,948, tương đương vơi ́ Độ cao -0,175 thuạ t toá n RF(100) (0,947) và cao hơn đá ng kể so Tốc độ gió 0,098 vơi thuạ t toá n SVM(25) (0,756). ́ Lượng mưa -0,441 Tư kế t quả nà y, trong nghiên cưu đã lưa chọ n ̀ ́ ̣ Độ dốc -0,288 thuạ t toá n GTB(350) để dư bá o nguy cơ chá y rưng ̣ ̀ Độ bốc thoát hơi nước 0,257 khu vưc thực nghiệm. Bả n đò dư bá o nguy cơ chá y ̣ ̣ Mật độ thực vật 0,273 rưng bà ng thuạ t toá n GTB(350) đươc thể hiệ n ̀ ̣ Nhiệt độ 0,582 trên Hình 5, trong đó nguy cơ chá y rưng đươc chia ̀ ̣ thà nh 5 mưc đọ thêo quy định của Điều 46 Nghị ́ Bọ dư liệ u điể m chá y bao gò m 324 điể m đươc ̃ ̣ định 156/2018/NĐ-CP, bao gồm thá p, trung bình, thu thạ p tư cơ sở dữ liệu củ a Cụ c Kiể m lâm, Bọ ̀ cao, nguy hiể m và cưc kỳ nguy hiể m. ̣ Nông nghiệ p và Phá t triể n Nông thôn và cá c cơ sở Phân tích các kết quả thu được cho thấy, gà n dữ liệu quó c tế khác. Bọ dư liệ u nà y đươc chia theo ̃ ̣ mọ t nưa diệ n tích khu vưc nghiên cưu có mức độ ̉ ̣ ́ tỉ lệ 7:3, trong đó 70% só điể m chá y (227 điể m) nguy hiểm cháy rừng «nguy hiể m» và «cưc kỳ ̣ đươc sư dụ ng để huá n luyệ n mô hình, 30% só ̣ ̉ nguy hiể m», tương ưng vơi 40,38% và 4,06% tỏ nǵ ́ điể m (97 điể m, bao gò m 36 vị trí xả y ra chá y và 61 diệ n tích khu vưc nghiên cưu (thể hiệ n bơi mà u ̣ ́ ̉ vị trí có bá o chá y nhưng không xả y ra chá y) đươc ̣ cam và mà u đỏ trên Hình 5). Những khu vưc có ̣ sư dụ ng để đá nh giá đọ chính xá c củ a mô hình. Bọ ̉ nguy cơ chá y rưng «cưc kỳ nguy hiể m» phân bó ̀ ̣ tham só đó i vơi thuạ t toá n họ c má y RF và GTB ́ tạ p trung ơ những vù ng gà n khu vưc dân cư, lơp ̉ ̣ ́ đươc thư nghiệ m vơi nhiề u giá trị khá c nhau để ̣ ̉ ́ phủ rưng chủ yế u là rừng thứ sinh và rừng trồng. ̀ lưa chọ n tham só có đọ chính xá c cao nhá t. Vơi ̣ ́ Diện tích có nguy cơ cháy rừng «thá p» chỉ thuạ t toá n GTB, các tham số tỉ lệ giảm kích thước chiế m 3,94% tổng diện tích, phân bó chủ yếu ở (shrinkage), tỉ lệ lấy mẫu (samplingRate), nhân phía Đông Nam tỉnh Nghệ An. 19,91% tỏ ng diệ n (seed) được đặt cố định với giá trị lần lượt là tích khu vưc nghiên cưu có nguy cơ chá y rưng ơ ̣ ́ ̀ ̉ 0,005, 0,7 và 0. Kế t quả nhạ n đươc cho thá y, thuạ t ̣ mưc đọ «trung bình». Cá c khu vưc có nguy cơ chá y ́ ̣ toá n GTB vơi só lương cây 350 (GTB(350)) có đọ ́ ̣ rưng «cao» chiế m 31,71% tỏ ng diệ n tích và phân ̀ chính xá c cao nhá t. Trong só 36 vị trí xả y ra chá y bó đề u trên toà n bọ khu vưc nghiên cưu. ̣ ́
- 58 Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 Hình 5. Kết quả xây dựng bản đồ dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng mô hình học máy GTB(350). quả n lý trong theo dõ i, ưng phó và giả m thiể u thiệ t ́ 4. Kết luận hạ i do chá y rưng gây ra. ̀ Trong nghiên cưu nà y, dư liệ u địa không gian ́ ̃ Lời cảm ơn và ba thuạ t toá n họ c má y (RF, GTB) đươc sư dụ ng ̣ ̉ để dư bá o nguy cơ chá y rưng cho khu vưc phía tây ̣ ̀ ̣ Bà i bá o có sư dụ ng mọ t phà n só liệ u và kế t ̉ tỉnh Nghệ An. Chín yế u tó ả nh hương tơi nguy cơ ̉ ́ quả củ a đề tà i KH&CN cá p cơ sơ “Nghiên cứu mô ̉ chá y rưng, bao gò m: (1) đọ cao, (2) đọ dó c, (3) ̀ hình dự báo nguy cơ cháy rừng bằng công nghệ Địa hương sươn, (4) mạ t đọ che phủ thưc vạ t, (5) mạ t ́ ̀ ̣ không gian, thử nghiệm cho khu vực phía Tây tỉnh đọ dân cư, (6) nhiệ t đọ bề mạ t, (7) đọ bó c thoá i hơi Nghệ An”, mã só T23-38. Cá c tá c giả xin chân thà nh nươc bề mạ t, (8) tó c đọ gió , (9) lương mưa trung ́ ̣ cả m ơn Trương Đạ i họ c Mỏ Địa chá t và Ban chủ ̀ bình thá ng đươc lưa chọ n để xây dưng bọ dư liệ u ̣ ̣ ̣ ̃ nhiệ m đề tà i đã hõ trơ nhó m nghiên cưu hoà n ̣ ́ đà u và o cho mô hình. Kế t quả nhạ n đươc cho thá y,̣ thà nh bà i bá o nà y. mô hình GTB vơi só lương cây 350 (GTB350) có ́ ̣ đọ chính xá c cao nhá t khi so sá nh vơi bọ dư liệ u ́ ̃ Đóng góp của các tác giả điể m chá y trong quá khư. Ngoà i ra, GTB(350) ́ Đoà n Thị Nam Phương, Trịnh Lê Hù ng - lên ý cũ ng có hiệ u suá t cao khi so sá nh vơi cá c mô hình ́ tương, viế t bả n thả o bà i bá o; Nguyễ n Văn Trung, ̉ họ c má y khá c như RF và SVM thông qua giá trị Lê Thị Thu Hà - đá nh giá và chỉnh sưa; Lê Văn Phú ̉ AUC. Tư kế t quả nà y, trong nghiên cưu đã xây ̀ ́ - thu thạ p và xư lý dư liệ u. ̉ ̃ dưng đươc bả n đò dư bá o nguy cơ chá y rưng khu ̣ ̣ ̣ ̀ vưc phía tây tỉnh Nghệ An vơi năm cá p đọ khá c ̣ ́ Tài liệu tham khảo nhau. Kế t quả nhạ n đươc trong nghiên cưu có thể ̣ ́ Arpaci A., Malowerschnig, B., Sass, O., Vacik, H. sư dụ ng nhà m cung cá p thông tin giú p cá c nhà ̉ (2014). Using multivariate data mining
- Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 59 techniques for estimating fire susceptibility of and MCA/GIS methods, Applied Sciences, Tyrolean forests, Applied Geography, 53, 258 - 10(12), 4348. 270. Iban, M., Sekertekin, A. (2022). Machine learning Breiman, L. (2001). Random Forests, Machine based wildfire susceptibility mapping using Learning 45, 5-32, https://doi.org/10.1023/ remotely sensed fire data and GIS: A case study A:1010933404324. of Adana and Mersin provinces, Turkey, Ecological Informatics, 69, 101647. Dieu, T. B., Pradhan, B., Lofman, O., Revhaug, I., Dick, O. B. (2012). Spatial prediction of Lê, S. D., Vương, V. Q. (2014). Phương phá p dư bá o ̣ landslide hazards in Hoa Binh province nguy cơ chá y rưng thêo điề u kiệ n khí hạ u ơ ̀ ̉ (Vietnam): A comparative assessment of the Việ t Nam, Tạp chí Khoa học Công nghệ lâm efficacy of evidential belief functions and fuzzy nghiệp, só 1, trang 3-10. logic models, CATENA 96, 28-40. Nguyễ n, V. L., Trà n, M. Đ., Nguyễ n, P. V. (2017). Dieu, T. B., Thoa, L. T. K., Van, N. C., Duc, L. H., Thưc trạ ng và giả i phá p quả n lý chá y rưng ưng ̣ ̀ ́ Revhaug, I. (2016). Tropical forest fire phó vơi biế n đỏ i khí hạ u tạ i tỉnh Quả ng Bình, ́ susceptibility mapping at the Cat Ba national Tạp chí Khoa học Lâm nghiệp, só 4, trang 139 - park area, Hai Phong city, Vietnam, using GIS- 150. based kernel logistic regression, Remote Nguyễ n, P.V (2019). Nghiên cưu thưc trạ ng và đề ́ ̣ Sensing, 8, 347, doi:10.3390/rs8040347. xuá t giả i phá p quả n lý chá y rưng thích ưng vơi ̀ ́ ́ Đoà n, T. N. P. (2023). Lưa chọ n mô hình dư bá o ̣ ̣ biế n đỏ i khí hạ u tạ i tỉnh Quả ng Bình, Luận án nguy cơ chá y rưng tư dư liệ u viễ n thá m và hệ ̀ ̀ ̃ tiến sĩ Lâm nghiệp. thông tin địa lý , Luạ n á n tiế n sĩ kỹ thuạ t, Hà Nọ i. Nguyen, N.T., Dang, B.T.N, Pham, X.C., Nguyen, Đặng, N.B.T., Nguyễn, N.T., Phạm, X.C. (2017). Ứng H.T., Bui, H.T., Hoang, N.D., Bui, D.T. (2018). dụng viễn thám và GIS thành lập bản đồ nguy Spatial pattern assessment of tropical forest cơ cháy rừng phục vụ phòng chống, giảm thiểu fire danger at Thuan Chau area (Vietnam) thiệt hại do cháy rừng tại tỉnh Sơn La, Việt Nam, using GIS-based advanced machine learning Hội thảo GIS toàn quốc, tr.252-261. algorithms: A comparative study, Ecological Informatics, vol.46, pp.74-85. Enoh, M., Okeke, U., Narinua, N. (2021). Identification and modelling of forest fire Oliveira, S., Oehler, F., Ayanz, J., Camia, A., Pereira, severity and risk zones in the Cross - Niger J. (2012). Modeling spatial patterns of fire transition forest with remotely sensed satellite occurrence in Mediterranean Europe using data, The Egyptian Journal of Remote Sensing Multiple Regression and Random Forest, and Space Science, 24(3), 879 - 887. Forest Ecology and Management, 275, 117 - 129 Fernandez, J., Chuvieco, E., Koutsias, N. (2012). Modelling long-term fire occurrence factors in Phạm, N. H. (1988). Xây dựng phương pháp dự Spain by accounting for local variations with báo cháy rừng Thông nhựa (Pinus merkusii J.) geographically weighted regression, Natural ở Quảng Ninh, Luận án PTS khoa học Nông Hazards Earth System Sciences, 12, 1-17. nghiệp, Hà Nội. Friedman, J. H. (2001). Greedy function Pourghasemi, H. (2015). GIS-based forest fire approximation: a gradient boosting machine, susceptibility mapping in Iran: A comparison Annals of Statistics, 29(5), 1189-1232. between evidential belief function and binary logistic regression models, Scandinavian Hoang, V. T., Chou, T., Fang, Y., Nguyen, N. T., Journal of Forest Research, 40 pp., DOI: Nguyen, Q. H., Pham, X. C., Dang, N. B. T., 10.1080/02827581.2015.1052750. Nguyen, X. L., Meadows, M. (2020). Mapping forest fire risk and development of early Ruano, A., Jolly, W., Freeborn, P., Nieva, D., Vega, N., warning system for NW Vietnam using AHP Herrera, C., Rodrigues, M. (2022). Spatial predictions of human and natural-caused
- 60 Đoàn Thị Nam Phương và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 65 (5), 50 - 60 wildfire likelihood across Montana (USA), Remote Hoa coal mine, Thai Nguyen province, Sensing, 13(8), 1200. Vietnam, Izvestiya, Atmospheric and Oceanic Physics, 53(9), 11850 - 6088. Sharma, V., Ghosh, S. K. (2023). Evaluating the potential of 8 band Planet scope dataset for Vasilakos, C., Kalabokidis, K., Hatzopoulos, J., crop classification using Random Forest and Matsinos, T. (2009). Identifying wildland fire Gradient Tree Booting by Google Earth Engine, ignition factors through sensitivity analysis of The International Archives of the a neural network, Natural Hazards, 50, 125 - Photogrammetry, Remote Sensing and Spatial 143. Information Sciences, XLVIII-M-1-2023, 325- Võ , Đ. T. (1995). Phương phá p dư bá o, lạ p bả n đò , ̣ 330. khoanh vù ng trọ ng điể m chá y rưng ơ Bình ̀ ̉ Trần, Q. B. (2017). Nghiên cứu sử dụng công nghệ Thuạ n, Tạp chí Lâm nghiệp, só 10, trang 11 - 14. không gian địa lý (RS, GIS, GPS) trong phát hiện cháy rừng và giám sát tài nguyên rừng, Đề tà i nghiên cưu khoa họ c cá p Bọ . ́ Trinh, L. H., Zablotskii, V. R. (2017). The application of Landsat multi-temporal thermal infrared data to identify coal fire in the Khanh

CÓ THỂ BẠN MUỐN DOWNLOAD


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
