Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất Tập 59, Kỳ 5 (2018) 55-66 55<br />
<br />
<br />
<br />
<br />
Ứng dụng thuật toán phân cụm mờ trên ảnh chỉ số nước trong<br />
chiết tách thông tin nước mặt khu vực cửa sông<br />
Cao Xuân Cường *, Võ Ngọc Dũng<br />
Khoa Trắc địa - Bản đồ và Quản lý đất đai, Trường Đại học Mỏ - Địa chất, Việt Nam<br />
<br />
<br />
<br />
THÔNG TIN BÀI BÁO TÓM TẮT<br />
<br />
Quá trình:<br />
Nước tại khu vực cửa sông là một trong những môi trường có sự đa dạng sinh<br />
Nhận bài 10/8/2018 học bậc nhất trên bề mặt đất. Tuy nhiên, hiện nay, môi trường này thường<br />
Chấp nhận 25/9/2018 xuyên bị đe dọa bởi các hoạt động của con người. Để tăng cường hiệu quả cho<br />
Đăng online 31/10/2018 công tác quản lý và bảo vệ môi trường quan trọng này thì một giải pháp chiết<br />
Từ khóa: tách thông tin nước bề mặt trên tư liệu ảnh viễn thám nhanh chóng và chính<br />
Nước mặt xác là rất cần thiết. Trong nghiên cứu này, phương pháp phân cụm mờ fuzzy<br />
c-means (FCM) tích hợp với thông tin không gian của các điểm ảnh láng giềng<br />
Viễn thám<br />
(MFCM) áp dụng lên ảnh chỉ số nước (WIs)được sử dụngđể chiết tách nước<br />
Chiết tách nước mặt trên ảnh viễn thám. Phương pháp này được áp dụng cho ảnh Landsat 8<br />
Chỉ số nước OLI chụp khu vực cửa sông Bạch Đằng thuộc thành phố Hải Phòng và tỉnh<br />
Landsat Quảng Ninh. Bên cạnh đó, nghiên cứu cũng đánh giá sự ảnh hưởng tới hiệu<br />
Fuzzy c-means quả chiết tách nước mặt của tham số mức độ mờ hóa(fuzzification) và số<br />
lượng các điểm ảnh láng giềng trong thuật toán FCM. Kết quả thực nghiệm<br />
cho thấy,khi hệ số mờ và số điểm ảnh láng giềng tăng, độ chính xác chiết tách<br />
nước sẽ giảm, với m =2 và số điểm láng giềng là 8 thìphương phápđạthiệu quả<br />
cao nhất về thời gian xử lý. Ngoài ra, khi so sánh với phương pháp phân<br />
ngưỡng, phương pháp được sử dụng cũng cho độ chính xác cao hơn với hệ số<br />
kappa của hai phương pháp lần lượt là 0.84 và 0.87.<br />
© 2018 Trường Đại học Mỏ - Địa chất. Tất cả các quyền được bảo đảm.<br />
<br />
<br />
<br />
sinh thái quan trọng như hệ sinh thái rừng ngập<br />
1. Mở đầu<br />
mặn phát triển (Pham & Yoshino, 2016). Tuy<br />
Cửa sông là nơi các dòng sông đổ ra biển, nơi nhiên, các hoạt động của con người đã và đang đe<br />
nước ngọt giao hòa với nước mặn. Điều kiện đặc dọa nghiêm trọng tới môi trường các cửa sông.<br />
biệt này đã tạo ra một trong những môi trường có Bên cạnh đó, biến đổi khí hậu cũng góp phần làm<br />
sự đa dạng sinh học bậc nhất trên bề mặt đất thay đổi môi trường này(Fujii, 2012). Để quản lý<br />
(Fujii, 2012; McKeon et al., 2015). Việt Nam là một và bảo vệ môi trường cửa sông một cách hiệu quả,<br />
quốc gia có đường bờ biển dài với nhiều khu vực một giải pháp chiết tách thông tin nước bề mặt ở<br />
cửa sông quan trọng. Đây là môi trường cho các hệ khu vực này trên tư liệu ảnh viễn thám nhanh<br />
chóng và chính xác là rất cần thiết.<br />
_____________________ Viễn thám là một trong những công nghệ đã<br />
*Tácgiả liên hệ được sử dụng hiệu quả trong giám sát tài nguyên<br />
E-mail: caoxuancuong@humg.edu.vn<br />
56 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66<br />
<br />
thiên nhiên nói chung và tài nguyên nước nói tăng cường sự khác biệt giữa các điểm ảnh mang<br />
riêng (Alsdorf & Lettenmaier, 2003). Khi sử dụng thông tin nước và các điểm ảnh mang thông tin<br />
tư liệu ảnh viễn thám thành lập bản đồ chuyên đề của các đối tượng khác liền kề, đồng thời loại bỏ<br />
về tài nguyên nước mặt, bên cạnh cac phương các điểm ảnh nhiễu. Nghien cưu củ a Hao và đò ng<br />
phap thường được sử dụ ng như số hóa dựa trên nghiẹ p đã sử dụ ng hiẹ u quả phương phap chỉ só<br />
giải đoán bằng mắt (digitizing), phương pháp nươc đẻ lạ p bả n đò cac song và hò bà ng ả nh<br />
phân ngưỡng (density slicing), phân loại có kiểm Landsat (Hao et al., 2014). Tuy nhien, cac tac giả<br />
định và không kiểm định (supervised and cũ ng chỉ ra cac nhược điẻ m củ a phương phap nà y<br />
unsupervised classifications), phương pháp phân như: (1) đọ chinh xac phan loạ i thá p vơi cac điẻ m<br />
cụm mờ (fuzzy c – means) áp dụng trên các chỉ số ả nh lã n giữa nươc và cac đó i tượng khac; (2) vơi<br />
nước (water indices-WIs) còn tương đối mới mẻ. mõ i khu vực khac nhau thì đạ t mọ t ngưỡng phan<br />
Trong nghiên cứu của Yang et al. (2015), các tác loạ i khac nhau; (3) khong loạ i bỏ được cac nhiẽ u.<br />
giả đã phân tích đánh giá chi tiết cac phương phap Mạ c dù mõ i phương phap co ưu nhược điẻ m rieng,<br />
nêu trên và đưa ra các ưu nhược điểm của từng nhưng sự đa dạ ng cac phương phap chié t tach<br />
phương pháp. Cụ thể, phương phap só hoa dựa nươc bè mạ t neu tren đã chưng minh khả nang ưu<br />
tren giả i đoan bà ng má t tuy cho đọ chinh xac cao viẹ t củ a phương phap viẽ n tham trong nghien cưu<br />
nhưng lạ i tó n nhiè u thời gian và sưc lao đọ ng, do tà i nguyen nươc mạ t.<br />
đo khong thực té trong cac trường hợp nghien cưu Thuạ t toan phan cụ m mờ (fuzzy c-means -<br />
tren qui mo rọ ng. Phương phap phan ngưỡng FCM) được ưng dụ ng trong nhiè u nghien cưu củ a<br />
được đè xuá t và sử dụ ng trong nhiè u nghien cưu lĩnh vực viẽ n tham (Ghosh et al., 2011; Kersten et<br />
củ a (Frazier et al., 2003; Ryu et al., 2002; White, al., 2005). Ghosh và các đồng nghiệp (2011) đã sử<br />
1999). Trong nghien cưu vè lũ lụ t ở khu vực đá t dụ ng thuạ t toan phan cụ m mờ nang cao đọ chinh<br />
ngạ p nươc củ a Frazier và đồng nghiệp (2003), cac xac phan loạ i và phat hiẹ n bié n đọ ng. Mọ t só<br />
gia trị ngưỡng đã được sử dụ ng phan loạ i nươc và nghien cưu khac chỉ ra rà ng thuạ t toan phan cụ m<br />
khong phả i nươc tren kenh 5 củ a ả nh Landsat mờ co tich hợp thong tin cac điẻ m ả nh lan cạ n co<br />
TM(Frazier et al., 2003). Đay là phương phap đơn thẻ xử ly được nhiẽ u và vá n đè vè gia trị tương<br />
giả n và hiẹ u quả vè mạ t thời gian, tuy nhien, đọ phả n phỏ thá p (Ghaffarian & Ghaffarian, 2014;<br />
chinh xac bị ả nh hưởng nhiè u bởi sự cac yé u tó Stavrakoudis et al., 2011). Tinh chá t bié n đỏ i lien<br />
như bong địa hình và may (Verpoorter et al., tụ c từ 0 đé n 1 củ a gia trị thà nh vien (membership)<br />
2014). Mọ t phương phap khac co thẻ được sử trong logic mờ (fuzzy) (Bezdek et al., 1984)co thẻ<br />
dụ ng đẻ chié t tach nươc là phan loạ i co kiẻ m định được sử dụ ng đẻ biẻ u diẽ n sự bié n đỏ i lien tụ c vè<br />
và khong kiẻ m định. Phương phap phan loạ i co gia trị đọ ả m củ a khu vực chuyẻ n tié p giữa nươc<br />
kiẻ m định phụ thuọ c nhiè u và o y kié n chủ quan và khong phả i nươc. Trên thế giới, việc kết hợp<br />
củ a chuyen gia và chá t lượng củ a viẹ c lá y mã u, giữa FCM và WIs trên ảnh viễn thám nhằm chiết<br />
trong khi phương phap phan loạ i khong kiẻ m định tách thông tin nước mặt đã được Yang et al.<br />
cho đọ chinh xac thá p khi khu vực phan loạ i lã n (2015) thực hiện thành công cho một số các đối<br />
nhiè u đó i tượng co sự tương phả n vè phỏ thá p tượng nước mặt khác nhau trên phạm vi toàn cầu.<br />
(Hao et al., 2014). Chié t tach nươc sử dụ ng cac chỉ Tuy nhiên, nước là môi trường khá đa dạng và<br />
só toan họ c (chỉ só nươc-WIs) được tinh từ cac phức tạp, mỗi khu vực sẽ có đặc điểm lý hóa và<br />
kenh ả nh là mọ t trong cac phương phap được sử sinh học khác nhau. Với điều kiện môi trường đặc<br />
dụ ng kha phỏ bié n do tinh hiẹ u quả và tiẹ n lợi củ a trưng riêng như cửa sông, việc tìm ra một giải<br />
no. Cac chỉ số nước như Normalized Difference pháp phù hợp là cần thiết. Bài báo giới thiệu kết<br />
Water Index (NDWI) (McFeeters, 1996), Modified quả ứng dụng phương pháp FCM trên ảnh chỉ số<br />
Normalized Difference Water Index (MNDWI) nước WIs trong chiết tách nước mặt của khu vực<br />
(Xu, 2006), và Automated Water Extraction Index cửa sông Việt Nam.<br />
(AWEI) (Feyisa et al., 2014) được xác định từ các<br />
kênh ảnh green (kênh 2), near-infrared (kênh 4), 2. Khu vực và dữ liệu nghiên cứu<br />
và SWIR1 (kênh 6) của Landsat. Các chỉ số này<br />
được thiết kế nhằm làm nổi bật các đối tượng 2.1. Khu vực nghiên cứu<br />
nước bề mặt trên ảnh quang học thông qua việc Khu vực được lựa chọn cho nghiên cứu nhằm<br />
Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 57<br />
<br />
đánh giá giải pháp đề xuất là khu vực cửa sông với độ chính xác cỡ 0.4 pixel và được xem là chấp<br />
Bạch Đằng, thuộc địa bàn thành phố Hải Phòng và nhận được về độ chính xác không gian.<br />
tỉnh Quảng Ninh (Hình 1). Đây là khu vực có sự Để đánh giá độ chính xác kết quả chiết tách<br />
hiện diện chủ yếu của rừng ngập mặn. Những năm nước, ảnh Planetscope có độ phân giải 3 m chụp<br />
gần đây, nhờ chính sách bảo vệ, phục hồi và phát vào cùng thời gian với ảnh Landsat được dùng để<br />
triển rừng ngập mặn của Chính phủ Việt Nam, số hóa các đối tượng nước. Yêu cầu về độ chính xác<br />
đồng thời với các dự án hỗ trợ quốc tế như dự án của đồng đăng ký ảnh được đảm bảo nhờ thực<br />
của tổ chức Chữ thập đỏ Nhật Bản (JRC) (Pham & hiện thủ công. Cơ sở dữ liệu số hóa được coi là dữ<br />
Yoshino, 2016), rừng ngập mặn ở khu vực này liệu chuẩn phục vụ đánh giá độ chính xác phân<br />
phát triển tương đối tốt. loại.<br />
<br />
2.2. Dữ liệu nghiên cứu 3. Phương pháp nghiên cứu<br />
Dữ liệu sử dụng cho nghiên cứu là ảnh<br />
3.1. Phương pháp chỉ số nước trên tư liệu ảnh<br />
Landsat 8 OLI ở mức xử lý L1 đã được nắn và hiệu<br />
viễn thám<br />
chỉnh ảnh hưởng địa hình từ USGS EarthExplorer.<br />
Mô tả chi tiết về mức độ che phủ bởi mây, thời gian Các chỉ số nước như Normalized Difference<br />
chụp, và các thông tin quan trọng khác được cung Water Index (NDWI) (McFeeters, 1996), Modified<br />
cấp trong bảng 1. Normalized Difference Water Index (MNDWI)<br />
Ảnh được chọn sau khi đã khảo sát tất cả các (Xu, 2006), và Automated Water Extraction Index<br />
ảnh nhằm tránh ảnh hưởng của mây. Ảnh có định (AWEI) (Feyisa et al., 2014) được xác định từ các<br />
dạng GeoTIFF, trong hệ qui chiếu UTM được nắn kênh ảnh green (kênh 2), near-infrared (kênh 4),<br />
và SWIR1 (kênh 6) của Landsat 5 TM.<br />
<br />
<br />
<br />
<br />
Hình 1. Khu vực nghiên cứu (ảnh Landsat 8 OLI tổ hợp RGB: 753).<br />
Bảng 1. Dữ liệu ảnh vệ tinh nghiên cứu.<br />
Ảnh Path/row Thời gian chụp Mây che phủ (%) Độ phân giải (m)<br />
Landsat 8 OLI 126/46 17/09/2017 9.79 30<br />
LC81260462017260LGN00 03:17:45<br />
Planetscope Strip_id 17/09/2017 0 3<br />
20170917_024558_0f25 761211 02:45:58<br />
20170917_024559_0f25 02:45:59<br />
20170917_024600_0f25 02:46:00<br />
58 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66<br />
<br />
Các chỉ số này được thiết kế nhằm làm nổi bật nước AWEI, chỉ số này gồm hai chỉ số là AWEIsh và<br />
các đối tượng nước bề mặt trên ảnh quang học AWEInsh.<br />
thông qua việc tăng cường sự khác biệt giữa các AWEIsh = ρband1 + 2.5 x ρband2 -1.5 x<br />
điểm ảnh mang thông tin nước và các điểm ảnh (3)<br />
(ρband4 + ρband5) – 0.25 x ρband7<br />
mang thông tin của các đối tượng khác liền kề,<br />
đồng thời loại bỏ các điểm ảnh nhiễu (Yang et al., AWEInsh = 4 x (ρband2 - ρband5) –0.25 x<br />
(4)<br />
2015). ρband4 + 2.75 x ρband7<br />
Năm 1996, McFeeters và đồng nghiệp đưa ra Trong đó, ρ là giá trị phản xạ phổ của 5 kênh<br />
công thức tính chỉ số nước sử dụng hai kênh Green ảnh Landsat TM sau:<br />
và NIR: Band 1: kênh blue; band 2: kênh Green; band<br />