BỘ THÔNG TIN VÀ TRUYỀN THÔNG

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

NGUYỄN TU TRUNG

NGHIÊN CỨU NÂNG CAO CHẤT LƯỢNG VÀ GIẢI ĐOÁN ẢNH VIỄN THÁM ĐA PHỔ DỰA TRÊN TÍNH TOÁN MỀM

LUẬN ÁN TIẾN SĨ KỸ THUẬT

HÀ NỘI – 2018

1

BỘ THÔNG TIN VÀ TRUYỀN THÔNG

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

NGUYỄN TU TRUNG

NGHIÊN CỨU NÂNG CAO CHẤT LƯỢNG VÀ GIẢI ĐOÁN ẢNH VIỄN THÁM ĐA PHỔ DỰA TRÊN TÍNH TOÁN MỀM

Chuyên ngành: Hệ thống thông tin

Mã số: 9.48.01.04

LUẬN ÁN TIẾN SĨ KỸ THUẬT

Người hướng dẫn khoa học:

1. TS. Vũ Văn Thoả

2. PGS.TS. Đặng Văn Đức

HÀ NỘI – 2018

2

MỤC LỤC

LỜI CAM ĐOAN 7

LỜI CẢM ƠN 8

DANH MỤC CHỮ VIẾT TẮT 9

DANH SÁCH BẢNG 11

DANH SÁCH HÌNH VẼ 13

PHẦN MỞ ĐẦU 17

1. Tính cấp thiết của luận án 17

2. Mục tiêu, đối tượng và phương pháp nghiên cứu của luận án 19

3. Đóng góp chính của luận án 20

4. Bố cục của luận án 20

CHƯƠNG I - TỔNG QUAN VỀ VIỄN THÁM VÀ GIẢI ĐOÁN ẢNH VIỄN

THÁM ĐA PHỔ 22

1.1. Tổng quan về viễn thám 22

1.1.1. Tiến trình viễn thám 22

1.1.2. Đặc trưng viễn thám 23

1.1.3. Khuôn mẫu ảnh viễn thám 25

1.1.4. Các loại ảnh viễn thám 25

1.2. Tổng quan về giải đoán, phân tích ảnh viễn thám đa phổ 26

1.2.1. Khái quát về giải đoán, phân tích ảnh viễn thám đa phổ 26

1.2.2. Khái niệm và tiến trình giải đoán ảnh đa phổ 26

1.2.3. Hiệu chỉnh ảnh 29

1.2.4. Tăng cường chất lượng ảnh trực quan 32

1.2.5. Giải đoán thủ công 34

1.2.6. Giải đoán tự động theo phương pháp số 35

3

1.2.7. Hậu giải đoán, phân lớp 41

1.3. Tổng quan về tính toán mềm 42

1.3.1. Khái niệm về tính toán mềm 42

1.3.2. Phân biệt tính toán mềm và tính toán cứng 43

1.3.3. Một số đặc điểm của tính toán mềm 44

1.3.4. Các kỹ thuật trong tính toán mềm 45

1.4. Tình hình nghiên cứu trong và ngoài nước 47

1.4.1. Tăng cường hình ảnh trực quan 47

1.4.2. Giải đoán ảnh viễn thám 57

1.5. Phân tích, đánh giá về thành công, ưu điểm, hạn chế 71

1.6. Kết luận chương I 72

CHƯƠNG II: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN TĂNG CƯỜNG ĐỘ TƯƠNG PHẢN ẢNH VIỄN THÁM ĐA PHỔ 73

2.1. Một số thuật toán tăng cường độ tương phản ảnh dựa trên logic mờ 73

2.1.1. Tăng cường ảnh mờ với toán tử tăng cường 73

2.1.2. Tăng cường ảnh mờ với toán tử Hyperbol 73

2.1.1. Tăng cường ảnh mờ dựa trên phân bố xác suất 74

2.1.2. Cải thiện độ tương phản dựa trên luật If-Then mờ 75

2.2. Hạn chế của các thuật toán tăng cường mờ 75

2.3. Một số độ đo chất lượng tăng cường ảnh 76

2.4. Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục bộ 78

2.5. Tăng cường ảnh viễn thám sử dụng phân cụm mờ 79

2.5.1. Thuật toán tăng cường ảnh viễn thám sử dụng phân cụm mờ 79

2.5.2. Phát triển thuật toán LoRSIE_FCM cho ảnh đa phổ 83

2.5.3. Thuật toán tăng cường ảnh viễn thám kích thước lớn 84

4

2.5.5. Thử nghiệm và đánh giá 85

2.6. Tăng cường ảnh viễn thám sử dụng phân cụm KMeans 93

2.6.1. Thuật toán tăng cường ảnh viễn thám sử dụng thuật toán phân cụm KMeans 93

2.6.2. Phát triển thuật toán cho ảnh đa phổ 96

2.6.3. Thử nghiệm và đánh giá 97

2.7. Kết luận chương II 101

CHƯƠNG III: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN LỚP ẢNH VIỄN THÁM ĐA PHỔ 103

3.1. Phân cụm ảnh viễn thám với thuật toán KMeans 103

3.1.1. Thuật toán KMeans 103

3.1.2. Thuật toán CCEA_KMeans 103

3.1.3. Thuật toán 2D-KMeans 104

3.1.4. Hạn chế của thuật toán KMeans 104

3.1.5. Một số độ đo chất lượng phân cụm ảnh 105

3.1.6. Đề xuất thuật toán WIKMeans 105

3.1.7. Đề xuất thuật toán CIKMeans 112

3.1.8. Đề xuất thuật toán KMeansCMN 119

3.2. Phân cụm ảnh viễn thám với thuật toán Fuzzy C-Means 127

3.2.1. Hạn chế của thuật toán Fuzzy C-Means 127

3.2.2. Đề xuất thuật toán lsiFCM 127

3.3. Phân lớp ảnh viễn thám 132

3.3.1. Phân lớp hợp lý tối đa 132

3.3.2. Một số độ đo phân lớp 134

3.3.3. Đề xuất tiếp cận lai cho phân lớp ảnh viễn thám 135

3.4. Kết luận chương III 143

5

KẾT LUẬN 145

DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA NGHIÊN CỨU SINH 147

TÀI LIỆU THAM KHẢO 149

PHỤ LỤC – BIẾN ĐỔI WAVELET 162

6

LỜI CAM ĐOAN

Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép

từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn

tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.

Tác giả luận án

Nguyễn Tu Trung

7

LỜI CẢM ƠN

Luận án này báo cáo các kết quả nghiên cứu trong thời gian tôi làm nghiên cứu sinh. Trong suốt thời gian này ngoài nỗ lực làm việc của bản thân tôi, phòng

Tin học Viễn thông và nhóm aSoftwareGroup, Viện Công nghệ Thông tin đã tạo

cho tôi một môi trường làm việc, điều kiện để thực hiện các nghiên cứu về chuyên

nghành xử lý ảnh nói chung và xử lý ảnh viễn thám nói riêng.

Tôi xin chân thành cảm ơn TS. Vũ Văn Thoả, PGS.TS Đặng Văn Đức đã tận

tình hướng dẫn tôi để hoàn thành được luận án này. Tôi cũng xin chân thành cảm ơn

thầy Ngô Hoàng Huy, phòng Nhận dạng và Công nghệ Tri thức, Viện Công nghệ

Thông tin. Thầy có ảnh hưởng rất lớn đến lĩnh vực nghiên cứu mà tôi quan tâm.

Xin cảm ơn các đồng nghiệp tại Tin học Viễn thông, Viện Công nghệ Thông

tin đã đóng góp những ý kiến thiết thực mỗi lần tôi seminar về vấn đề xử lý ảnh

viễn thám.

Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới bố mẹ tôi, vợ tôi và đại gia

đình tôi mà thiếu họ chắc chắn tôi đã không đủ nghị lực để hoàn thành công trình

này.

8

DANH MỤC CHỮ VIẾT TẮT

AIVHE Adaptively Increasing Value Histogram Equalization

Ant System AS

Ant Colony Optimization ACO

Ant Colony System ACS

KMeans KM

Moving KMeans MKM

Two-Dimensional KMeans 2D-KM

2D-MKM Two-Dimensional Moving Kmeans

FKM Fuzzy Kmeans

CDFKM Center Displacement FKM

Cluster Center Estimation Algorithm CCEA

Open Source Cluster Application Resource OSCAR

Compute Unified Device Architecture CUDA

MR-FCM Multi Resolution Fuzzy C-Means

Gray level co-occurrence matrix GLCM

Maximum information compression index MICI

Back Propagation Through Structure BPTS

MDASER Multispectral Data Analysis System for Earth Resource

Maximum Likelihood Classification MLC

Layered Neural Networks LNN

Back propagation neural network BPNN

pulse coupled neural network PCNN

9

SVM Support vector Machine

GRASS Geographic Resources Analysis Support System

LoRSIE Local based Remote Sensing Image Enhancement

DWT Discrete Wavelet Transform

LaSRSIE Large Size Remote Sensing Image Enhancement

wiKMeans Wavelet init Kmeans

CIKMeans Context Information Kmeans

WICI-Kmeans Wavelet init - Context Information Kmeans

cwKMeans Center Weight Kmeans

CMN Cepstal Mean Normalisation

lsiFCM large size image Fuzzy cMeans

PSI Pixel Shape Index

MICI Maximum Information Compression Index

10

DANH SÁCH BẢNG

Bảng 1.1. Ảnh phân loại cuối cùng (a) ảnh gốc và (b) đến (d) là các ảnh gốc được áp watershed từ độ phân giải mức 2 đến mức 0 tương ứng [85]. .............................. 63

Bảng 2.1. Quy trình thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ. 78

Bảng 2.2. Các hàm biến đổi mức xám theo từng cụm. ............................................... 81

Bảng 2.3. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 86

Bảng 2.4. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 87

Bảng 2.5: Thời gian thực thi. ...................................................................................... 88

Bảng 2.6. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 88

Bảng 2.7. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 89

Bảng 2.8. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 89

Bảng 2.9. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 90

Bảng 2.10. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 90

Bảng 2.11. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải

tiến. .............................................................................................................................. 91

Bảng 2.12. Thời gian thực thi. .................................................................................... 91

Bảng 2.13. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 92

Bảng 2.14. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải

tiến. .............................................................................................................................. 92

Bảng 2.15. Thời gian thực thi. .................................................................................... 93

Bảng 2.16. Các hàm biến đổi mức xám theo từng cụm. ............................................. 95

Bảng 2.17. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 98

Bảng 2.18. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. .............................................................................................................................. 98

Bảng 2.19. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 99

11

Bảng 2.20. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải

tiến. .............................................................................................................................. 99

Bảng 2. 21. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................ 100

Bảng 2.22. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải

tiến. ............................................................................................................................ 100

Bảng 2. 23. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................ 101

Bảng 2.24. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải

tiến. ............................................................................................................................ 101

Bảng 3. 3. Các ảnh đầu vào trong tử nghiệm 1, 2 và 3. ........................................... 109

Bảng 3.4. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 114

Bảng 3.5. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 115

Bảng 3.6. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 116

Bảng 3.7. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 118

Bảng 3.9. So sánh độ đồng nhất cụm (*1.0e+3). ...................................................... 121

Bảng 3.10. Thời gian phân cụm (ms). ....................................................................... 122

Bảng 3.11. So sánh độ đồng nhất cụm (*1.0e+3). .................................................... 123

Bảng 3.12. Thời gian phân cụm. ............................................................................... 124

Bảng 3.13. Tâm cụm sinh từ KMeans và KMeansCMN. .......................................... 125

Bảng 3.14. Thời gian phân cụm. ............................................................................... 126

Bảng 3.15. Các ảnh dùng trong các thử nghiệm. ..................................................... 129

Bảng 3.16. So sánh độ chính xác. ............................................................................. 138

Bảng 3.17. So sánh độ chính xác. ............................................................................. 140

Bảng 3.18. So sánh độ chính xác. ............................................................................. 142

12

DANH SÁCH HÌNH VẼ

Hình 1.1. Tiến trình viễn thám. ................................................................................... 22

Hình 1.2. Ảnh chụp và ảnh số. .................................................................................... 24

Hình 1.3. Tiến trình giải đoán tự động ảnh viễn thám đa phổ.................................... 28

Hình 1.4. Nắn chỉnh hình học. .................................................................................... 31

Hình 1.5. Cân bằng lược đồ màu. ............................................................................... 32

Hình 1.6. Nguyên tắc chính của tăng cường ảnh mờ [47]. ........................................ 33

Hình 1.7. Phân lớp có giám sát (trái) và không giám sát (phải). ............................... 36

Hình 1.8. Các bước cơ bản trong phương pháp phân lớp có giám sát. ..................... 38

Hình 1.9. Quy trình phân lớp ảnh đa phổ hướng điểm ảnh. ....................................... 39

Hình 1.10. Quy trình phân loại ảnh đa phổ hướng đối tượng. ................................... 40

Hình 1.11. Ví dụ của ảnh khử sương mù sử dụng dò tìm điểm tối; Trái: Ảnh sương

mù đầu vào, Phải: Kết quả của phương pháp trong [122]. ........................................ 48

Hình 1.12. So sánh kết quả của trong [70] với trong [48]. ........................................ 49

Hình 1.13. (a-f): So sánh kết quả xử lý với các hàm wavelet khác nhau và bộ lọc

đồng cấu [124]. ........................................................................................................... 50

Hình 1.14. So sánh với phương pháp nhanh của Tarel và Hautiere [105]. Phương

pháp trong [29] nhanh và cho kết quả chính xác hơn phương pháp của Tarel. ........ 51

Hình 1.15: thử nghiệm loại bỏ mây mù trong [120]. .................................................. 52

Hình 1.16. So sánh kết quả thuật toán của Cheng (c) với thuật toán ACE (b) [24]. .. 54

Hình 1.17. So sánh kết quả 2 kĩ thuật tăng cường: đầu vào, luật mờ, toán tử tăng

cường [99]. .................................................................................................................. 55

Hình 1.18. Kiến trúc phân lớp của Napoleon và cộng sự [77]. .................................. 59

Hình 1.19. Ảnh đầu vào Landsat và kết quả với 5 cụm [77]. ..................................... 60

Hình 1 20. Kết quả phân loại có kiểm soát ảnh World View 1, QuickBird [7]. ......... 68

Hình 1 21. Sơ đồ quá trình nhận dạng. ....................................................................... 70

13

Hình 1.22. Ảnh đầu vào, kết quả phân loại dựa trên tiếp cận điểm ảnh, tiếp cận đối

tượng. .......................................................................................................................... 70

Hình 2.1. Hàm phân bố xác suất cho việc tính toán các giá trị hàm thuộc. ............... 74

Hình 2.2. Hàm thuộc. .................................................................................................. 75

Hình 2.3. Hàm phân bố và các ngưỡng theo từng cụm. ............................................. 82

Hình 2.4. Hàm phân bố và các ngưỡng theo từng cụm. ............................................. 96

Hình 3.1. Biến đổi ảnh với Wavelet. ......................................................................... 106

Hình 3 2. Cây phân cấp cho phân rã nhiều mức. ..................................................... 107

Hình 3.3. Ảnh đầu vào kết quả phân rã ảnh viễn thám đa phổ. ............................... 107

Hình 3.5. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh

thử nghiệm 1. ............................................................................................................. 109

Hình 3.6. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với

ảnh thử nghiệm 1. ...................................................................................................... 110

Hình 3.7. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh

thử nghiệm 2. ............................................................................................................. 110

Hình 3.8. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với

ảnh thử nghiệm 2. ...................................................................................................... 111

Hình 3.9. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh

thử nghiệm 3. ............................................................................................................. 111

Hình 3 10. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans

với ảnh thử nghiệm 3. ................................................................................................ 112

Hình 3.11. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,

WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3). ......................... 116

Hình 3.12. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3). ......................... 117

Hình 3.13. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3). ......................... 119

Hình 3.14. Kết quả phân cụm bởi KMeans. .............................................................. 121

14

Hình 3.15. Kết quả phân cụm bởi KMeansCMN. ..................................................... 121

Hình 3.16. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,

KMeansCMN (*1.0e+3). ........................................................................................... 122

Hình 3.17. Kết quả phân cụm bởi KMeans. .............................................................. 123

Hình 3.18. Kết quả phân cụm bởi KMeansCMN. ..................................................... 123

Hình 3.19. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,

KMeansCMN (*1.0e+3). ........................................................................................... 124

Hình 3.20. Kết quả phân cụm bởi KMeans. .............................................................. 125

Hình 3.21. Kết quả phân cụm bởi KMeansCMN. ..................................................... 125

Hình 3.22. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,

KMeansCMN (*1.0e+3). ........................................................................................... 126

Hình 3.23. Chi tiết từng cụm của FCM của thử nghiệm 1. ....................................... 129

Hình 3.24. Chi tiết từng cụm của lsiFCM của thử nghiệm 1. ................................... 129

Hình 3.25. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử

nghiệm 1 (*1.0e+3). .................................................................................................. 130

Hình 3.26. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của

thử nghiệm 1 (*1.0e-3). ............................................................................................. 130

Hình 3.27. Chi tiết từng cụm của FCM của thử nghiệm 2. ....................................... 131

Hình 3.28. Chi tiết từng cụm của lsiFCM của thử nghiệm 2. ................................... 131

Hình 3.29. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử

nghiệm 2(*1.0e+3). ................................................................................................... 131

Hình 3.30. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của

thử nghiệm 2 (*1.0e-3). ............................................................................................. 131

Hình 3.31. Quy trình phân loại ảnh đa phổ theo tiếp cận lai. .................................. 135

Hình 3.32: Sơ đồ thử nghiệm quy trình thử nghiệm phân lớp theo tiếp cận lai. ...... 136

Hình 3.33: Lựa chọn và hiển thị vùng mẫu trên ảnh. ............................................... 137

Hình 3.34. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 138

Hình 3.35. So sánh độ chính xác. .............................................................................. 139

15

Hình 3.36. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 140

Hình 3.37. So sánh độ chính xác. .............................................................................. 141

Hình 3.38. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 142

Hình 3.39. So sánh độ chính xác. .............................................................................. 143

16

PHẦN MỞ ĐẦU

1. Tính cấp thiết của luận án

Viễn thám được hiểu là một khoa học và nghệ thuật để thu nhận thông tin về

một đối tượng, một khu vực hoặc một hiện tượng, thông qua việc phân tích tài liệu

thu nhận được bằng các phương tiện [6]. Viễn thám bao gồm các thiết bị cảm biến,

ghi lại năng lượng phát ra từ đối tượng nghiên cứu, và bao gồm tổ hợp phần cứng/phần mềm với khả năng xử lý, phân tích và ứng dụng các thông tin thu được

từ ảnh. Với cách hiểu này thì quá trình viễn thám bao gồm hai giai đoạn chính: (i)

Thu thập thông tin viễn thám; (ii) Xử lý và phân tích dữ liệu viễn thám. Đề tài được

đặt ra nhằm nghiên cứu một số phương pháp xử lý ảnh viễn thám để hỗ trợ giải quyết các vấn đề liên quan đến giai đoạn (ii), Xử lý và phân tích ảnh viễn thám.

Những công nghệ mới trong thu nhận và xử lý ảnh viễn thám không ngừng

được phát triển, cho phép không ngừng nâng cao độ phân giải của ảnh cả về phổ và không gian. Một trong những tiên phong trong lĩnh vực này là hãng Kestrel. Kestrel

đã thiết kế, xây dựng, thử nghiệm và triển khai hệ thống xử lý ảnh siêu phổ

(hyperspectral) có chi phí hiệu quả, sử dụng phép chuyển đổi Fourier mới được phát

triển theo chương trình Small Business Innovation. Hệ thống xử lý này đã được đưa

vào sử dụng trên vệ tinh MightySat của Không lực Hoa kỳ năm 2000. Hãng Kestrel

đang tiếp tục phát triển bộ cảm biến dữ liệu siêu phổ hai chiều CCD, nhằm tăng

cường khả năng chụp mặt đất tốc độ cao, đặc tính vốn bị hạn chế do việc sử dụng hệ

thống phát hiện một chiều truyền thống.Ngoài ra, các nhà nghiên cứu còn hướng

quan tâm tới việc tăng cường khả năng chụp ảnh trong điều kiện sáng yếu và hỗ trợ

truy nhập dữ liệu quang phổ ở những dải năng lượng thấp. Bên cạnh đó, những tiến

bộ công nghệ trong cảm biến và quang học cũng được áp dụng nhằm tăng cường

chất lượng dữ liệu ảnh thu được, giảm nhẹ gánh nặng cho quá trình xử lý ảnh.

Ngày nay, một xu hướng mới của ứng dụng phần mềm ảnh viễn thám đó là các dịch vụ bản đồ trực tuyến. Giá trị của dữ liệu viễn thám đã được nhiều nhà cung cấp nặng ký trong các dịch vụ Web phát hiện. Microsoft và Google đã lần lượt phát triển các dịch vụ bản đồ trực tuyến “MSN Virtual Earth” và “Google Earth”. Sự kết hợp của dữ liệu viễn thám và các công cụ bản đồ thân thiện trên dịch vụ bản đồ trực tuyến đã đem dữ liệu viễn thám tới đại chúng và mở ra những khả năng ứng dụng mới cho viễn thám.

17

Quá trình xử lý và phân tích thông tin viễn thám được thực hiện bằng phần

mềm máy tính. Ảnh viễn thám ngày càng có những ứng dụng quan trọng trong

nhiều lĩnh vực, từ hỗ trợ quản lý đất đai phục vụ dân sinh, quản lý, giám sát chủ quyền quốc gia, cho đến hỗ trợ giám sát tài nguyên, môi trường ... Ứng dụng ngày

càng phổ biến của ảnh viễn thám tất yếu dẫn đến nhu cầu ngày càng tăng của việc sử dụng phần mềm xử lý ảnh viễn thám.

Ngày nay, có rất nhiều phần mềm cả thương mại lẫn mã nguồn mở phục vụ

công tác xử lý dữ liệu viễn thám. Theo nghiên cứu của hãng Global Marketing

Insights, những phần mềm liên quan tới xử lý dữ liệu viễn thám được ứng dụng nhiều nhất tại các nhóm nghiên cứu châu Á là ESRI 30%; ERDAS 25%; RSI ENVI

17%; MapInfo 17%; ERMapper 11%. Trong khi đó, ở phương Tây, những con số

này là ESRI 39%, ERDAS 27%, MapInfo 9%, AutoDesk 7%, RSI ENVI 17% [42].

Còn ở Việt Nam, công nghệ xử lý ảnh viễn thám đã xâm nhập khá sớm, từ

năm 1983 (Viện Khoa học Việt Nam). Để nhanh chóng phát triển công nghệ vũ trụ

phục vụ cho phát triển kinh tế của đất nước, Nhà nước đã xây dựng đề án: “Kế

hoạch tổng thể về ứng dụng và phát triển công nghệ viễn thám ở Việt Nam” nhằm

hướng đến sự phát triển bền vững trên cơ sở sử dụng hợp lý tài nguyên thiên nhiên

và bảo vệ môi trường. Năm 2006, Viện Công nghệ Vũ trụ, thuộc Viện Hàn Lâm

Khoa học và Công nghệ Việt Nam được thành lập. Năm 2013 Việt Nam đã phóng

vệ tinh viễn thám đầu tiên mang tên VNRedsat-1. Vệ tinh viễn thám thứ 2

VNRedsat-2 dự kiến được phóng vào năm 2019.

Các bài toán liên quan đến hoạt động nhận thức, trí tuệ của con người đều hàm

chứa những đại lượng, thông tin không chính xác, không chắc chắn và không đầy đủ. Trong lĩnh vực khoa học kĩ thuật, các hệ thống phức tạp thực tế không thể mô tả

đầy đủ và chính xác bởi các phương trình toán học truyền thống. Kết quả là những

tiếp cận kinh điển dưa trên kỹ thuật phân tích và các phương trình toán học nhanh chóng tỏ ra không còn phù hợp. Vì thế, công nghệ tính toán mềm là giải pháp trong lĩnh vực này. Vấn đề giải đoán ảnh viễn thám cũng phức tạp và cần sử dụng các kĩ thuật trong công nghệ tính toán mềm. Công nghệ tính toán mềm gồm các thành phần: Logic mờ, Mạng Neural nhân tạo, lập luận xác suất, hệ hỗ trợ ra quyết định. Các kĩ thuật phân lớp thuộc về công nghệ tính toán mềm.

Xuất phát từ thực tế và những lý do trên, nghiên cứu sinh đã lựa chọn đề tài

“Nghiên cứu phương pháp nâng cao chất lượng và giải đoán ảnh đa phổ dựa

18

trên tính toán mềm” để thực hiện luận án tiến sĩ chuyên ngành Hệ thống thông tin.

Kết quả nghiên cứu được áp dụng trên ảnh viễn thám, đặc biệt là ảnh viễn thám tại

khu vực trong nước để phân tích các đặc thù của lớp phủ nước ta và đưa ra những kết quả hữu ích cho giai đoạn hậu phân loại như xây dựng bản đồ...

Thách thức đặt ra với đề tài là rất lớn vì ảnh viễn thám có nhiều loại với đặc thù riêng. Mỗi loại có phương pháp xử lý, phân tích riêng. Vì vậy, việc lựa chọn

phương pháp, kĩ thuật phù hợp để từ đó cải tiến là rất quan trọng.

2. Mục tiêu, đối tượng và phương pháp nghiên cứu của luận án

Mục tiêu của luận án là nghiên cứu kĩ thuật tăng cường và phân lớp để hỗ

trợ cho việc giải đoán ảnh viễn thám đa phổ.

Từ mục tiêu, luận án tập trung vào bốn nội dung nghiên cứu chính bao gồm:

 Nội dung thứ nhất là đánh giá các phương pháp, kĩ thuật tiền xử lý, tăng

cường ảnh viễn thám.

 Nội dung thứ hai là so sánh, đánh giá các phương pháp, kĩ thuật phân lớp

ảnh viễn thám.

 Nội dung thứ ba là đề xuất kĩ thuật mới tăng cường ảnh viễn thám đa phổ và chứng minh phương pháp mới hiệu quả hơn các phương pháp đã có theo các tiêu chuẩn đánh giá được chọn.

 Nội dung thứ tư là đề xuất kĩ thuật mới phân loại ảnh viễn thám đa phổ và chứng minh phương pháp mới hiệu quả hơn các phương pháp đã có theo

các tiêu chuẩn đánh giá được chọn.

Đối tượng nghiên cứu của luận án bao gồm:

 Các kĩ thuật tiền xử lý, tăng cường ảnh viễn thám.

 Các kĩ thuật phân lớp ảnh viễn thám.

Ảnh viễn thám bao gồm nhiều loại khác khau với các đặc trưng và phương pháp xử lý khác nhau. Luận án tập trung vào ảnh viễn thám đa phổ và các kĩ thuật xử lý tương ứng. Vì vậy, phạm vi nghiên cứu của luận án tập trung chủ yếu ở hai vấn đề chính. Một là, nghiên cứu kĩ thuật tiền xử lý, tăng cường ảnh viễn thám đa phổ. Hai là, nghiên cứu phương pháp phân lớp ảnh viễn thám đa phổ.

19

Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu

thực nghiệm. Về nghiên cứu lý thuyết: Tổng hợp các thông tin liên quan, lựa chọn

các cách tiếp cận đã được áp dụng thành công dựa vào các kiến thức cơ bản, các kết quả nghiên cứu đã công bố; trao đổi thông qua seminar hoặc tham gia báo cáo tại

các hội thảo khoa học; trao đổi, làm việc và kết hợp chặt chẽ với các chuyên gia về lĩnh vực viễn thám. Về nghiên cứu thực nghiệm: luận án thực hiện cài đặt các thuật

toán, chạy thử nghiệm thuật toán với các bộ số liệu ảnh viễn thám, so sánh và đánh

giá kết quả thực nghiệm so với kết quả nghiên cứu lý thuyết, từ đó kết luận tính

đúng đắn của kết quả nghiên cứu.

3. Đóng góp chính của luận án

 Đề xuất kỹ thuật tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục bộ theo cụm thông qua 2 giải thuật phân cụm KMeans và phân cụm mờ

FCM.

 Cải tiến thuật toán phân cụm KMeans áp dụng với ảnh viễn thám: (i) WIKMeans với bước khởi tạo tâm cụm xác lập dựa theo kỹ thuật Wavelet; (ii) CIKMeans dựa trên vector trung b nh cụm, (iii) KMeansCMN với công thức tính tâm cụm áp dụng kĩ thuật chuẩn hóa trung bình phổ và (iv) Fuzzy C-Means thành lsiFCM với những tuỳ biến để xử lý với ảnh k ch thước lớn trên cơ sở FCM.

4. Bố cục của luận án

Luận án gồm phần mở đầu và ba chương nội dung, phần kết luận, danh mục

các công trình và danh mục các tài liệu tham khảo.

Chương 1 trình bày tổng quan tình hình nghiên cứu về viễn thám và xử lý ảnh

viễn thám đa phổ.

Các đóng góp chính của luận án được trình bày trong chương chương 2 và

chương 3.

Chương 2 trình bày một số thuật toán tăng cường ảnh dựa trên logic mờ. Từ đó, chương 2 để xuất một kĩ thuật tăng cường ảnh viễn thám mới dựa trên tiếp cận cục bộ. Trong đó, bao gồm hai thuật toán chính dựa trên hai thuật toán phân cụm khác nhau là KMeans và Fuzzy CMeans. Tuy nhiên, do nhược điểm cố hữu của thuật toán

phân cụm mờ dẫn đến gặp vấn đề với ảnh viễn thám kích thước lớn, chương 2 cũng

20

đề xuất thuật toán tăng cường ảnh cải tiến cho thuật toán tăng cường dựa trên Fuzzy

CMeans nói trên cho ảnh viễn thám kích thước lớn. Đánh giá và so sánh với các

phương pháp đã có dựa trên chỉ số mờ của các ảnh tăng cường thu được.

Chương 3 đề xuất các kĩ thuật phân lớp có giám sát và không giám sát mới cho

ảnh viễn thám. Về phương pháp phân lớp không giám sát bao gồm các thuật toán đề xuất cải tiến từ các thuật toán KMeans và Fuzzy CMeans. Đánh giá và so sánh với

các phương pháp đã có dựa trên chỉ số về độ đồng nhất cụm cũng như thời gian thực

thi của các các thuật toán phân cụm. Về phương pháp phân lớp giám sát là một tiếp

cận mới lai dựa trên hai tiếp cận hướng điểm ảnh và hướng đối tượng, thuật toán đề xuất cải tiến từ thuật toán phân lớp hợp lý tối đa (Maximum likehood).

Cuối cùng, phần kết luận nêu những đóng góp của luận án, hướng phát triển

và những vấn đề quan tâm của nghiên cứu sinh.

21

CHƯƠNG I - TỔNG QUAN VỀ VIỄN THÁM VÀ GIẢI

ĐOÁN ẢNH VIỄN THÁM ĐA PHỔ

Trong chương 1, luận án trình bày tổng quan về viễn thám, giải đoán ảnh đa

phổ. Tiếp đó, luận án trình bày về tình hình nghiên cứu trên thế giới. Từ đó, luận án

phân tích kết quả đạt được và những vấn đề còn hạn chế. Những phân tích này làm

tiền đề để luận án đề xuất những cải tiến mới trong các chương tiếp theo.

1.1. Tổng quan về viễn thám

1.1.1. Tiến trình viễn thám

Theo các định nghĩa trong [22][62] thì viễn thám (Remote Sensing) được hiểu như một khoa học, nghệ thuật thu nhận thông tin về đối tượng, khu vực hay hiện

tượng trên bề mặt Trái đất mà không tiếp xúc trực tiếp với chúng. Công việc này

được thực hiện bởi cảm nhận (sensing) và lưu trữ các năng lượng phản xạ hay được

phát ra từ các đối tượng nghiên cứu. Sau đó là thực hiện phân tích, xử lý và ứng

dụng các thông tin này vào nhiều lĩnh vực khác nhau.

Tiến trình viễn thám bao gồm nhiều công đoạn, trong đó có tương tác giữa bức

xạ và đối tượng nghiên cứu. Khái niệm đối tượng nghiên cứu trong tài liệu này

được hiểu là các đối tượng, khu vực hay hiện tượng nào đó trên bề mặt Trái đất mà

Hình 1.1. Tiến trình viễn thám.

con người muốn thu thập thông tin về nó. Trên hình 1.1 là mô tả vắn tắt bảy thành phần của hệ thống thu ảnh viễn thám [22].

Nguồn năng lượng hay nguồn sáng (A): Yêu cầu đầu tiên của viễn thám là phải có nguồn năng lượng để chiếu sáng hay cung cấp năng lượng điện từ đến đối

tượng nghiên cứu.

22

Bức xạ và khí quyển (B): Vì năng lượng đi từ nguồn tới đối tượng đích cho

nên nó tiếp xúc và đi qua khí quyển. Việc tương tác này còn xảy ra lần nữa khi năng

lượng đi từ đối tượng đích tới cảm biến (sensor).

Tương tác với đối tượng đích (C): Sau khi năng lượng được truyền qua khí

khuyển nó sẽ tương tác với đối tượng đích. Cách thức tương tác của chúng phụ thuộc vào tính chất của đối tượng đích và bức xạ.

Thu nhận năng lượng bằng đầu cảm biến (D): Sau khi năng lượng bị đối

tượng đích truyền đi hay phân tán (scattered), đầu cảm biến sẽ thu nhận (không tiếp

xúc) và lưu trữ bức xạ điện từ.

Truyền, nhận và xử lý dữ liệu cảm biến (E): Năng lượng được thu nhận bởi

cảm biến sẽ được truyền đi, thông thường dưới dạng điện tử, đễn trạm thu và xử lý,

nơi mà dữ liệu được xử lý thành ảnh (dưới dạng hard-copy hay dạng số).

Diễn giải và phân tích (F): Ảnh được diễn giải bằng trực giác hay hệ thống

số để trích chọn các thông tin về đối tượng nghiên cứu.

Ứng dụng (G): Phần tử cuối cùng của tiến trình viễn thám là áp dụng các

thông tin vừa trích chọn từ ảnh về đối tượng nghiên cứu để hiểu rõ hơn về nó, làm

nổi lên các thông tin mới hay hỗ trợ giải quyết một số vấn đề cụ thể.

Đề tài “Nghiên cứu phương pháp nâng cao chất lượng và giải đoán ảnh đa

phổ dựa trên tính toán mềm” tập trung nghiên cứu một số vấn đề liên quan đến

thành phần F và G được mô tả trong sơ đồ trên đây. Đó là làm thế nào để phân tích,

diễn giải dữ liệu viễn thám và ứng dụng chúng trong thực tế.

1.1.2. Đặc trưng viễn thám

Năng lượng điện từ có thể được nhận biết bằng phim ảnh hay điện tử. Có thể ghi biến thiên năng lượng trên phim nhạy ánh sáng. Cần phân biệt hai khái niệm

ảnh (image) và ảnh chụp (photograph) trong viễn thám. Ảnh được hiểu là hình thức biểu diễn “cảnh” bất kỳ, không quan tâm đến bước sóng hay thiết bị viễn thám nào được sử dụng. Ảnh chụp đề cập đến ảnh được chụp trên phim ảnh. Thông thường,

ảnh được chụp tại bước sóng từ 0.3m đến 0.9m (vùng nhìn thấy và vùng hồng

ngoại phản xạ). Vậy, mọi ảnh chụp là ảnh, nhưng không phải mọi ảnh là ảnh chụp.

Ảnh chụp có thể được biểu diễn và hiển thị dưới dạng ảnh số bằng cách chia ảnh

23

thành các ô vuông nhỏ bằng nhau (theo cột và hàng), gọi là pixel. Biểu diễn độ sáng

Hình 1.2. Ảnh chụp và ảnh số.

của mỗi vùng bằng một giá trị số (DN- Digital Number).

Hình 1.2 thể hiện qui trình sinh ảnh số từ ảnh chụp. Ảnh chụp được quét và

được chia nhỏ thành các pixel. Mỗi pixel được gán một số biểu diễn độ chói. Máy

tính hiển thị mỗi giá trị số với mức độ chói khác nhau.

Các đặc trưng viễn thám bao gồm:

 Kênh ảnh (Channel, Band): Thông thường, một dải hẹp bước sóng được đo và tập dữ liệu được lưu trữ tách biệt, chúng được gọi là băng (Band) hay

kênh (Channel) ảnh. Có thể tổ hợp và hiển thị các kênh thông tin nhờ ba

màu cơ sở (red, green và blue).

 Độ phân giải ảnh không gian: Đề cập đến vùng được đo, kích thước đặc

trưng nhỏ nhất trên mặt đất mà sensor có thể nhận biết.

 Độ phân giải phổ: Đề cập đến bước sóng phổ mà sensor nhạy cảm với. Có thể nói độ phân giải phổ là số lượng kênh của ảnh số về một khu vực nào

đó.

 Độ phân giải bức xạ: Đề cập đến mức độ năng lượng được đo bởi sensor. Nói cách khác là những sự khác biệt nhỏ nhất trong mức năng lượng mà sensor có thể nhận biết.

 Độ phân giải thời gian: Đề cập đến thời gian thu thập dữ liệu. Nó liên quan

đến khả năng chụp lặp cùng một vùng của vệ tinh.

24

1.1.3. Khuôn mẫu ảnh viễn thám

Khuôn mẫu dữ liệu ảnh viễn thám mô tả cách thức dữ liệu được ghi lên thiết bị

lưu trữ, ví dụ DVD. Một ảnh viễn thám thường được lưu trữ trong hai tệp, ví dụ với Landsat ETM+ như sau:

 Tệp metadata: Chứa tập các mô tả bằng chữ hay số của dữ liệu lưu trữ trong tệp dữ liệu ảnh (tệp thứ 2). Chúng bao gồm tổng số dòng quét, số

pixel/dòng, phép chiếu sử dụng và tọa độ địa lý của tâm ảnh...

 Tệp dữ liệu ảnh: Chứa các giá trị điểm ảnh của các kênh 1-7, sắp xếp theo từng kênh. Với mỗi kênh, các giá trị pixel của dòng quét thứ 1 được lưu trữ

từ trái sang phải thành một bản ghi. Tiếp theo là lưu trữ dữ liệu của dòng

quét thứ 2,...

1.1.4. Các loại ảnh viễn thám

Phân loại ảnh viễn thám theo nguồn năng lượng [129] và chiều dài bước sóng,

ta có thể chia ảnh vệ tinh thành 3 loại cơ bản:

 Ảnh quang học là loại ảnh được tạo ra bởi việc thu nhận các bước sóng ánh sáng nhìn thấy (bước sóng 0.4 – 0.76 micromet). Nguồn năng lượng

chính là bức xạ mặt trời

 Ảnh hồng ngoại (ảnh nhiệt) là loại ảnh được tạo ra bởi việc thu nhận các bước sóng hồng ngoại phát ra từ vật thể (bước sóng 8 – 14 micromet).

Nguồn năng lượng chính là bức xạ nhiệt của các vật thể.

 Ảnh radar là loại ảnh được tạo ra bởi việc thu nhận các bước sóng trong dải sóng cao tần (bước sóng từ 1mm – 1m). Nguồn năng lượng chính là

sóng rada phản xạ từ các vật thể do vệ tinh tự phát xuống theo những bước

sóng đã được xác định.

 Vệ tinh /Cảm biến thời tiết: TIROS-1, GOES, NOAA AVHRR…

 Các cảm biến/ vệ tinh quan trắc mặt đất: Landsat, SPOT, IRS, ASTER,

Một số hệ thống vệ tinh và loại ảnh viễn thám

 Các cảm biến/vệ tinh quan trắc hải dương: Nimbus-7, MOS, SeaWiFS

MODIS

25

 …

1.2. Tổng quan về giải đoán, phân tích ảnh viễn thám đa phổ

1.2.1. Khái quát về giải đoán, phân tích ảnh viễn thám đa phổ

Để có thể sử dụng được dữ liệu viễn thám ta phải có khả năng tách thông tin có ý nghĩa từ ảnh. Nói cách khác là phải diễn giải và phân tích ảnh viễn thám. Phân

tích ảnh viễn thám là thực hiện nhận biết hoặc/và đo các đối tượng khác nhau trong

ảnh để tách các thông tin hữu ích về chúng. Các đặc trưng của đối tượng trên ảnh có

các đặc trưng sau:

 Đối tượng có thể là các đặc trưng điểm, đường và vùng. Nó có thể có hình

dạng bất kỳ.

 Đối tượng cần được phân biệt với nhau, phải tương phản với các đặc trưng

khác ở xung quanh chúng.

Phần lớn công việc diễn giải và giải đoán ảnh viễn thám được thực hiện bằng

thủ công hay mắt thường trên các ảnh chụp (ảnh tương tự). Đối với các ảnh số, có

thể giải đoán bằng thủ công hay bằng máy tính. Xử lý số có thể được sử dụng cho

các ảnh số để tăng cường chất lượng ảnh để giải đoán tốt hơn. Xử lý và phân tích

ảnh số có thể tự động giải đoán các đối tượng trên ảnh mà không cần can thiệp của

con người. Tuy nhiên, thực tế thì rất ít khi xử lý và phân tích ảnh thay thế hoàn toàn

thủ công. Nó thường là hỗ trợ người phân tích trong việc giải đoán ảnh viễn thám.

Giải đoán ảnh viễn thám bằng máy tính hay thủ công đều có ưu nhược điểm riêng.

Vậy, cả hai kỹ thuật giải đoán này thường được sử dụng.

Xử lý ảnh số là thực hiện một loạt thủ tục bao gồm lập khuôn mẫu, hiệu chỉnh

dữ liệu, nâng cao chất lượng để dễ dàng giải đoán hay phân lớp tự động các đối

tượng bằng máy tính. Để có thể xử lý số ảnh viễn thám, dữ liệu phải được thu thập dưới dạng số phù hợp và lưu trữ trong máy tính. Đồng thời phải có phần cứng, phần mềm phù hợp, nói cách khác phải có hệ thống phân tích ảnh phù hợp.

1.2.2. Khái niệm và tiến trình giải đoán ảnh đa phổ

Giải đoán ảnh viễn thám là quá trình tách thông tin định tính cũng như định lượng từ ảnh dựa trên các tri thức chuyên ngành hoặc kinh nghiệm của người đoán đọc điều vẽ [6]. Việc tách thông tin trong viễn thám có thể phân thành 5 loại:

26

 Phân lớp đa phổ.

 Phát hiện biến động.

 Chiết tách các thông tin tự nhiên.

 Xác định các chỉ số.

 Xác định các đối tượng đặc biệt.

Phân lớp đa phổ là quá trình tách gộp thông tin dựa trên các tính chất phổ,

không gian và thời gian của đối tượng. Phát hiện biến động là phát hiện và phân tích

các biến động dựa trên tư liệu ảnh đa thời gian. Chiết tách các thông tin tự nhiên tương ứng với việc đo nhiệt độ trạng thái khí quyển, độ cao của vật thể dựa trên các

đặc trưng phổ hoặc thị sai của cặp ảnh lập thể. Xác định các chỉ số là việc tính toán

các chỉ số mới, ví dụ chỉ số thực vật.

Xác định các đặc tính hoặc hiện tượng đặc biệt như thiên tai, các cấu trúc

tuyến tính, các biểu hiện tìm kiếm khảo cổ. Quá trình tách thông tin từ ảnh có thể

được thực hiện bằng mát người hay máy tính.

Việc giải đoán bằng mắt có ưu điểm là có thể khai thác được các tri thức

chuyên môn và kinh nghiệm của con người, mặt khác việc giải đoán bằng mắt có

thể phân tích được các thông tin phân bố không gian. Tuy nhiên phương pháp này

có nhược điểm là tốn kém thời gian và kết quả thu được không đồng nhất.

Việc xử lý bằng máy tính có ưu điểm là năng suất cao, thời gian xử lý ngắn, có

thể đo được các chỉ số đặc trưng tự nhiên nhưng nó có yếu điểm là khó kết hợp với

tri thức và kinh nghiệm của con người, kết quả phân tích các thông tin kém. Để khắc phục nhược điểm này, những năm gần đây người ta đang nghiên cứu các hệ

chuyên gia, đó là các hệ chương trình máy tính có khả năng mô phỏng tri thức

chuyên môn của con người phục vụ cho việc đoán đọc điều vẽ tự động.

27

Hình 1.3. Tiến trình giải đoán tự động ảnh viễn thám đa phổ.

Theo sơ đồ trên, dữ liệu ảnh viễn thám thu được từ các vệ tinh viễn thám có

thể bị sai lệch về mặt hình học hay bức xạ, sẽ được chuyển vào bộ hiệu chỉnh để sửa

lại. Sau đó, dữ liệu được chuyển qua giai đoạn phân lớp để rút trích các thông tin

cần thiết của đối tượng thu nhận. Đề hỗ trợ cho việc giải đoán thủ công hay kiểm tra

lại kết quả phân lớp, dữ liệu viễn thám có thể được chuyển qua bộ tăng cường chất

lượng ảnh trực quan để có thể quan sát và phân tách hiệu quả hơn. Giai đoạn hậu phân lớp là từ các thông tin thu được sau phân lớp sẽ kết xuất các đầu ra cần thiết cho việc báo cáo, quản lý hiện trạng lớp phủ...

Hiệu chỉnh ảnh: Đây là giai đoạn mà các tín hiệu số được hiệu chỉnh hệ thống nhằm tạo ra một tư liệu ảnh có thể sử dụng được. Giai đoạn này thường được thực hiện trên các máy tính lớn tại các Trung tâm thu số liệu vệ tinh.

28

Tăng cường hình ảnh trực quan: Các quá trình xử lý như tăng cường chất

lượng, biến đổi tuyến tính... Giai đoạn này có thể thực hiện trên các máy tính nhỏ

như máy vi tính trong khuôn khổ của một phòng thí nghiệm. Việc tăng cường ảnh để hỗ trợ cho khâu giải đoán ảnh bao gồm cả giải đoán thủ công và giải đoán tự

động dựa trên phân lớp.

Phân lớp: Phân lớp đa phổ để tách các thông tin cần thiết phục vụ việc theo

dõi các đối tượng hay lập bản đồ chuyên đề là khâu then chốt của việc khai thác tư

liệu viễn thám.

Quá trình giải đoán ảnh viễn thám đa phổ gồm rất nhiều giai đoạn. Trong đó có hai giai đoạn quan trọng là Tăng cường hình ảnh trực quan và Phân lớp mà luận

án tập trung.

1.2.3. Hiệu chỉnh ảnh

Hiệu chỉnh ảnh còn gọi là khôi phục ảnh, bao gồm hiệu chỉnh hình học và hiệu

chỉnh bức xạ và hiệu chỉnh khí quyển.

1.2.3.1. Hiệu chỉnh bức xạ

Hiệu chỉnh bức xạ bao gồm hiệu chỉnh dữ liệu do tính không đều của sensor hay

nhiễu khí quyển.

Tất cả các tư liệu số hầu như bao giờ cũng chịu một mức độ nhiễu xạ nhất định [6].

Để loại trừ các nhiễu này cần phải thực hiện một số phép tiền xử lý. Khi thu các bức

xạ từ mặt đất trên các vật mang vũ trụ, người ta thấy chúng có một số khác biệt so

với trường hợp quan sát cùng đối tượng đó ở khoảng cách gần. Điều này chứng tỏ ở

khoảng cách xa như vậy tổn tại một lượng nhiễu nhất định do góc nghiêng và độ

cao mặt trời, một số điều kiện quang học khí quyển như sự hấp thụ, tán xạ, độ mù gây ra... Chính vì vậy để bảo đảm được sự tương đồng nhất định về mặt bức xạ cần

phải hiệu chỉnh ảnh.

Các nguồn nhiễu bức xạ gồm 3 nhóm chính sau:

 Các nguồn nhiễu do biến đổi độ nhậy của bộ cảm

Trong trường hợp các bộ cảm thuần tuý quang học bao giờ cũng xảy ra trường hợp cường độ bức xạ tại tâm ảnh lớn hơn tại các góc. Hiện tượng này gọi là hiện tượng làm mờ ảnh.

29

Đây là một sai lệch không thể tránh khỏi cho các hệ quang học. Khi sử

dụng các bộ cảm quang điện tử thì sự chênh lệch giữa cường độ bức xạ

trước ống kính và cường độ mà thiết bị thực sự ghi nhận cũng là một đại lượng cần đưa vào quá trình hiệu chỉnh.

 Các nguồn nhiễu do góc chiếu của mặt trời và do địa hình

Bóng chói mặt trời: Bản thân mặt trời tạo bóng chói của mình trên mặt

đất dưới dạng một vùng sáng hơn những vùng khác. Bóng chói mặt trời có

thể được loại trừ cùng với hiện tượng làm mờ ảnh trên nguyên lý ứng dụng

chuỗi Furie.

Bóng che: Bóng che là hiện tượng che khuất nguồn bức xạ do bản thân

địa hình. Để có thể loại trừ nó cần có số liệu mô hình số địa hình và toạ độ

vật mang tại thời điểm thu tín hiệu.

 Các nguồn nhiễu do trạng thái khí quyển

Rất nhiều các hiệu ứng khí quyển khác nhau như hấp thụ, phản xạ, tán

xạ... ảnh hưởng tới chất lượng ảnh thu được. Người ta thường sử dụng các mô hình khí quyển để mô phỏng trạng thái khí quyển và áp dụng các qui

luật quang hình học và quang khí quyển để giải quyết vấn đề này.

1.2.3.2. Hiệu chỉnh hình học

Hiệu chỉnh hình học bao gồm hiệu chỉnh biến dạng hình học vì dao động của

hình học Trái đất-sensor và chuyển đổi dữ liệu sang hệ tọa độ thế giới thực (kinh vĩ

độ) trên bề mặt Trái đất.

Hai loại méo hình học: Hệ thống và không hệ thống. Méo không hệ thống là

méo không ổn định về mặt hình học như tốc độ bay của vệ tinh, góc nhìn, độ cao...

Méo hệ thống do tốc độ gương bị thay đổi, nó gây ra các đường quét đều méo giống nhau hoặc đường quét bị kéo lệch một phía. Nắn ảnh méo hệ thống tương đối đơn giản.

Méo hình hình học là sai lệch vị trí giữa tọa độ ảnh thực tế đo được và tọa độ

ảnh lý tưởng thu được từ bộ cảm có thiết kế hình học lý tưởng và trong các điều kiện thu nhận lý tưởng.

Méo hình hình học gồm méo hình nội sai và méo hình ngoại sai. Méo hình nội

sai sinh ra do tính chất hình học của bộ cảm và méo hình ngoại sai gây ra do vị trí

30

của vật mang và hình dáng của vật thể. Để đưa các tọa độ ảnh thực tế về tọa độ ảnh

lý tưởng phải hiệu chỉnh hình học. Bản chất của hiệu chỉnh hình học là xây dựng

được mối tương quan giữa hệ tọa độ ảnh đo và hệ tọa độ qui chiếu chuẩn. Hệ tọa độ qui chiếu chuẩn có thể là hệ tọa độ mặt đất (hệ tọa độ vuông góc hoặc hệ tọa độ địa

Hình 1.4. Nắn chỉnh hình học.

lý) hoặc hệ tọa độ ảnh khác.

1.2.3.3. Hiệu chỉnh khí quyển

Bức xạ mặt trời trên đường truyền xuống trái đất bị hấp thụ, tán xạ một lượng nhất

định trước khi tới mặt đất và bức xạ, tán xạ từ vật thể cũng bị hấp thụ hay tán xạ

trước khi tới được bộ cảm [6]. Do vậy bức xạ mà bộ cảm thu được không chỉ chứa

riêng năng lượng hữu ích mà còn chứa nhiều thành phần nhiễu khác nữa. Hiệu

chỉnh khí quyển là một công đoạn tiền xử lý nhằm loại trừ những thành phần bức xạ không mang thông tin hữu ích.

Có 3 nhóm phương pháp chính sử dụng trong hiệu chỉnh khí quyển bao gồm:

 Phương pháp sử dụng hàm truyền khí quyển

Phương pháp sử dụng hàm truyền khí quyển là giải pháp gần đúng hay

được sử dụng. Mọi thông số dựa trên trạng thái trung bình của khí quyển kể cả hàm lượng các hạt bụi lơ lửng và hơi nước.

 Phương pháp sử dụng các số liệu quan trắc thực địa

Trong phương pháp này người ta tiến hành đo đạc bức xạ các đối tượng cần nghiên cứu ngay tại thời điểm bay chụp. Sau đó dựa trên sự khác biệt cường độ bức xạ thu được trên vệ tinh và giá trị đo được người ta tiến hành

31

hiệu chỉnh bức xạ. Phương pháp này cho kết quả rất tốt nhưng không phải

lúc nào và ở đâu cũng thực hiện được.

 Các phương pháp khác.

Một số vệ tinh được trang bị các bộ cảm đặc biệt chuyên thu nhận các tham số trạng thái khí quyển đồng thời với các bộ cảm thu nhận ảnh và việc

hiệu chỉnh khí quyển được tiến hành ngay trong quá trình bay.

1.2.4. Tăng cường chất lượng ảnh trực quan

Các thao tác này làm tăng cường độ rõ của ảnh để hỗ trợ giải đoán và phân tích ảnh.

Hình 1.5. Cân bằng lược đồ màu.

Các chức năng nâng cao chất lượng ảnh bao gồm dãn tương phản, lọc không gian để làm nổi các mẫu trên ảnh ...

Nhiễu trong ảnh viễn thám bao gồm nhiễu thông thường giống ảnh màu và các

nhiễu mang tính đặc trưng sương mù, đám mây... Đối với nhiễu thông thường,

chúng ta có thể dùng các phương pháp khử nhiễu thông thường như các phương

pháp lọc. Để tăng cường chất lượng ảnh viễn thám, cũng có thể dùng các phương

pháp tăng tính tương phản.

Theo [9], các kĩ thuật tăng cường ảnh chia làm ba loại. Một là, họ các kĩ thuật histogram mà tiêu biểu là cân bằng histogram và đặc tả histogram. Hai là, họ các kĩ thuật dựa trên tiếp cận logic mờ. Ba là, các kĩ thuật tăng cường dựa trên tối ưu.

Các kĩ thuật này được áp dụng cho ảnh đa cấp xám. Với ảnh đa kênh, có thể

thực hiện tăng cường trên từng kênh ảnh.

32

1.2.4.1. Kĩ thuật histogram

Cân bằng lược đồ xám là kĩ thuật hiệu chỉnh cường độ ảnh để tăng cường độ tương

phản. Trong cân bằng lược đồ xám điểm ảnh sẽ được phân phối một cách thống nhất thay vì phân phối điểm ảnh ban đầu và do đó ảnh trở nên trong trẻo hơn.

1.2.4.2. Tăng cường ảnh dựa trên logic mờ

Tăng cường ảnh mờ dựa trên việc ánh xạ mức xám vào mặt phẳng mờ, sử

dụng hàm biến đổi thành viên [47]. Mục tiêu là để sinh một ảnh có độ tương phản

cao hơn ảnh gốc bằng việc đưa trọng số lớn hơn cho các mức xám mà gần hơn với

mức xám trung bình của ảnh hơn là để chúng xa hơn trung bình. Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập mờ để phát triển các kĩ thuật

mới cho việc cải thiện độ tương phản.

Một ảnh I, có kích thước M x N và L mức xám, có thể được xem như một

mảng đơn mờ, mỗi phần tử là một giá trị hàm thuộc biểu thị mức độ sáng của nó

liên quan tới vài mức độ sáng. Với ảnh I, chúng ta có thể viết trong ký hiệu tập mờ

[47][99] như sau:

m = 1,2,…,M và n = 1,2,…,N (1) ⋃

Trong đó gmn là cường độ của điểm ảnh (m, n) và giá trị hàm thuộc của nó μmn. Hàm thuộc đặc trưng cho thuộc tính thích nghi của ảnh (ví dụ thuộc tính biên, tối,

kết cấu). Mỗi toán tử tăng cường có thể có dạng hàm thành viên khác khau. Trong

những năm gần đây, một số nhà nghiên cứu đã áp dụng khái niệm mờ để phát triển

các thuật toán mới cho việc tăng cường ảnh. Nguyên tắc của lược đồ tăng cường mờ

Hình 1.6. Nguyên tắc chính của tăng cường ảnh mờ [47].

được minh họa trong hình 1.6.

1.2.4.3. Tăng cường ảnh dựa trên tối ưu tham số

Trong tăng cường ảnh, việc chọn, tối ưu các tham số liên quan đến các hàm, toán tử tăng cường là rất quan trọng. Nhiều kĩ thuật tối ưu việc chọn tham số được sử dụng như là hệ thống tham lam, di truyền, phá vi khuẩn, đàn kiến [9].

33

1.2.5. Giải đoán thủ công

Đoán đọc điều vẽ ảnh bằng mắt có thể áp dụng trong mọi điều kiện trang thiết

bị [6]. Đoán đọc điều vẽ bằng mắt là việc sử dụng mắt người cùng với các dụng cụ quang học như kính lúp, kính lập thể, máy tổng hợp mầu để xác định các đối tượng.

Cơ sở để đoán đọc điều vẽ bằng mắt là các chuẩn đoán đọc điều vẽ và mẫu đoán đọc điều vẽ.

Các chuẩn đoán đọc điều vẽ ảnh vệ tinh và mẫu đoán đọc điều vẽ gồm 8

nhóm:

 Chuẩn kích thước: Cần phải chọn một tỷ lệ ảnh phù hợp để đoán đọc điều vẽ. Kích thước của đối tượng có thể xác định nếu lấy kích thước đo được

trên ảnh nhân với mẫu số tỷ lệ ảnh.

 Chuẩn hình dạng: Hình dạng có ý nghĩa quan trọng trong đoán đọc ảnh. Hình dạng đặc trưng cho mỗi đối tượng khi nhìn từ trên cao xuống và được

coi là chuẩn đoán đọc quan trọng.

 Chuẩn bóng: Bóng của vật thể dễ dàng nhận thấy khi nguồn sáng không nằm chính xác ở đỉnh đầu hoặc trường hợp chụp ảnh xiên. Dựa vào bóng

của vật thể có thể xác định được chiều cao của nó.

 Chuẩn độ đen: Độ đen trên ảnh đen trắng biến thiên từ trắng đến đen. Mỗi vật thể được thể hiện bằng một cấp độ sáng nhất định tỷ lệ với cường độ

phản xạ ánh sáng của nó. Ví dụ cát khô phản xạ rất mạnh ánh sáng nên bao

giờ cũng có mầu trắng, trong khi đó cát ướt do độ phản xạ kém hơn nên có

mầu tối hơn trên ảnh đen trắng. Trên ảnh hồng ngoại đen trắng do cây lá

nhọn phản xạ mạnh tia hồng ngoại nên chúng có mầu trắng và nước lại hấp

thụ hầu hết bức xạ trong dải sóng này nên bao giờ cũng có mầu đen.

 Chuẩn mầu sắc: Mầu sắc là một chuẩn rất tốt trong việc xác định các đối tượng. Ví dụ các kiểu loài thực vật có thể được phát hiện dễ dàng ngay cả cho những người không có nhiều kinh nghiệm trong đoán đọc điều vẽ ảnh khi sử dụng ảnh hồng ngoại mầu. Các đối tượng khác nhau cho các tông mầu khác nhau đặc biệt khi sử dụng ảnh đa phổ tổng hợp mầu.

34

 Chuẩn cấu trúc: Cấu trúc là một tập hợp của nhiều hình mẫu nhỏ. Ví dụ một bãi cỏ không bị lẫn các loài cây khác cho một cấu trúc mịn trên ảnh, ngược

lại rừng hỗn giao cho một cấu trúc sần sùi.

 Chuẩn phân bố: Chuẩn phân bố là một tập hợp của nhiều hình dạng nhỏ phân bố theo một quy luật nhất định trên toàn ảnh và trong mối quan hệ với

đối tượng cần nghiên cứu. Ví dụ hình ảnh của các dãy nhà, hình ảnh của

ruộng lúa nước, các đồi trồng chè... tạo ra những hình mẫu đặc trưng riêng

cho các đối tượng đó.

 Chuẩn mối quan hệ tương hỗ: Một tổng thể các chuẩn đoán đọc điều vẽ, môi trường xung quanh hoặc mối liên quan của đối tượng nghiên cứu với

các đối tượng khác cung cấp một thông tin đoán đọc điều vẽ quan trọng.

Ảnh tổng hợp mầu

Nhờ khả năng phân biệt cao của mầu sắc mà nó có thể truyền đạt các khác biệt

về phổ của đối tượng, ảnh tổng hợp mầu có tính trực quan sinh động hơn ảnh phổ

trắng đen. Đối với ảnh phổ chụp ở vùng hồng ngoại, ảnh tổng hợp mầu cho ta bức

tranh mầu giả không có thực trong tự nhiên.

Lựa chọn kênh phổ để tổng hợp mầu là một công việc quan trọng quyết định

chất lượng thông tin của kết quả tổng hợp mầu. Việc lựa chọn kênh phổ được xác

định trên cơ sở như sau:

 Đặc tính phản xạ phổ của các đối tượng cần đoán đọc điều vẽ.

 Nhiệm vụ đoán đọc điều vẽ.

 Yêu cầu đối với lực phân giải.

 Đặc điểm của vùng cần tổng hợp mầu...

1.2.6. Giải đoán tự động theo phương pháp số

1.2.6.1. Khái niệm

Mục đích tổng quát của phân lớp đa phổ là tự động phân lớp tất cả các pixel trong ảnh thành các lớp phủ đối tượng [6]. Thông thường người ta sử dụng các dữ liệu đa phổ để phân lớp và tất nhiên, mẫu phổ trong cơ sở dữ liệu đối với mỗi pixel sẽ được dùng làm cơ sở để phân lớp. Có nghĩa là, các kiểu đặc trưng khác nhau biểu thị các

tổ hợp giá trị số dựa trên sự bức xạ phổ và đặc trưng bức xạ vốn có của chúng. Vì

35

vậy một “mẫu phổ” không nói đến tính chất hình học mà đúng hơn, thuật ngữ "phổ"

ở đây nói đến một tập hợp giá trị đo bức xạ thu được trong các kênh phổ khác nhau

đối với mỗi pixel. Việc nhận biết mẫu phổ đề cập đến một số phương pháp phân lớp có sử dụng thông tin phổ trên các pixel làm cơ sở để tự động phân loại các lớp đối

tượng.

Phân lớp ảnh là phân chia các điểm ảnh, các vùng về các miền, các lớp khác nhau.

Phân lớp ảnh viễn thám là một công việc rất quan trọng với nhiều ứng dụng khác

Hình 1.7. Phân lớp có giám sát (trái) và không giám sát (phải).

nhau trong nông nghiệp, lâm nghiệp, địa chất học, thủy văn...

Có hai phương pháp phân lớp ảnh đa phổ chủ yếu là phân lớp có giám sát (còn

gọi là phân lớp) và không giám sát (còn gọi là phân cụm).

Trong phương pháp phân lớp có giám sát người giải đoán ảnh sẽ “kiểm tra”

quá trình phân lớp pixel bằng việc quy định cụ thể theo thuật toán máy tính, các chữ

số mô tả bằng số các thể loại lớp phủ mặt đất khác nhau có mặt trên một cảnh. Để

làm việc này, các điểm lấy mẫu đại diện của loại lớp phủ đã biết (gọi là các vùng

mẫu) được sử dụng để biên tập thành một “khóa giải đoán” bằng số mô tả các thuộc

tính phổ cho mỗi thể loại điển hình. Sau đó mỗi pixel trong tập hợp dữ liệu sẽ được so sánh với mỗi chủng loại trong khóa giải đoán và được gán nhãn bằng tên của chủng loại mà nó “có vẻ giống nhất”.

Còn phương pháp phân lớp không giám sát không giống như phương pháp phân lớp có giám sát, quy trình phân lớp không giám sát gồm hai bước riêng biệt. Điểm khác biệt cơ bản giữa hai phương pháp này là ở chỗ phương pháp phân lớp có giám sát bao gồm bước lấy mẫu và bước phân loại, còn trong phương pháp phân lớp

không giám sát, trước tiên dữ liệu ảnh được phân loại bằng cách nhóm chúng thành

36

các nhóm tự nhiên hoặc thành các cụm có mặt trên cảnh. Sau đó người giải đoán

ảnh sẽ xác định tính đồng nhất của lớp phủ mặt đất của các nhóm phổ này bằng

cách so sánh các dữ liệu hình ảnh đã phân lớp với các dữ liệu tham khảo mặt đất.

Một đơn vị phân lớp có thể là một tập các điểm ảnh lân cận hoặc một điểm

ảnh hoặc chính ảnh viễn thám [77]. Đơn vị này tập trung vào thông tin phổ trong ảnh phân lớp, có thể xem xét việc sử dụng các thông tin thời gian, không gian và

các thông tin khác. Hai lớp được giới thiệu là lớp thông tin và lớp phổ để minh hoạ

phân loại giám sát và không giám sát. Lớp thông tin là lớp trong đó thông tin được

trích chọn bằng phân tích trong khi lớp phổ xử lý với các vector mức xám tương tự. Có sự liên quan một lớp phổ đến một lớp thông tin là sự khác biệt chính giữa phân

loại giám sát và không giám sát. Trong một phân loại giám sát lớp thông tin được

đặc tả đầu tiên trên ảnh và để thiết lập dấu hiệu của lớp, thuật toán được sử dụng để

tóm lược thông tin đa phổ từ các vùng mẫu trên ảnh. Quá trình này được biết đến

như là huấn luyện không giám sát. Nhưng trong phân loại không giám sát thuật toán

được áp dụng đầu tiên trên ảnh và các lớp phổ được thiết lập. Sau đó, phân tích ảnh

gán lớp phổ đến lớp thông tin.

Có hai tiếp cận phân lớp chủ yếu là: Tiếp cận dựa trên điểm ảnh và tiếp cận

dựa trên đối tượng.

1.2.6.2. Phân lớp có giám sát

Trong giai đoạn lấy mẫu, người giải đoán sẽ nhận dạng các vùng đại diện và nghiên

cứu cách mô tả các thuộc tính phổ của mỗi loại lớp phủ mặt đất trong cảnh này bằng

số. Tiếp theo, trong giai đoạn phân lớp mỗi pixel trong tập hợp dữ liệu hình ảnh

được phân thành các loại lớp phủ mặt đất mà nó gần giống nhất. Nếu pixel không giống với bất kỳ tập dữ liệu nào thì nó được gán nhãn “chưa biết”. Nhãn phân lớp

gán cho mỗi pixel trong quá trình này được ghi lại trong ô tương ứng của tập dữ liệu giải đoán. Như vậy, ma trận ảnh nhiều chiều này được sử dụng để xây dựng một ma trận tương ứng của các loại lớp phủ mặt đất cần giải đoán. Sau khi đã phân lớp toàn bộ dữ liệu, các kết quả được trình bày trong giai đoạn đưa ra kết quả. Do việc phân loại bằng số, cho nên kết quả có thể sử dụng theo nhiều cách khác nhau. Ba dạng điển hình của kết quả đầu ra là bản đồ chuyên đề, bảng thống kê diện tích toàn cảnh hoặc phân cảnh cho các loại lớp phủ mặt đất khác nhau, và các file dữ liệu bằng số

để đưa vào hệ thống thông tin địa lý GIS, khi đó "kết quả đầu ra" của việc phân lớp

37

trở thành "đầu vào" của GIS. Hình 1.8 tóm tắt 3 bước cơ bản trong phương pháp

Hình 1.8. Các bước cơ bản trong phương pháp phân lớp có giám sát.

phân lớp có giám sát.

Việc phân lớp đa phổ trong phương pháp phân lớp có có thường dùng các

thuật toán sau:

 Thuật toán phân lớp theo xác suất cực đại.

 Thuật toán phân lớp theo khoảng cách ngắn nhất.

 Thuật toán phân lớp hình hộp.

1.2.6.3. Phân lớp không giám sát

Phân lớp không giám sát (phân đoạn ảnh) là thực hiện phân hoạch ảnh thành tập các vùng đồng nhất có ý nghĩa, các điểm ảnh trong cùng vùng có cùng thuộc tính như mức xám, tương phản, giá trị phổ hay tính chất kết cấu.

Phân lớp không giám sát không sử dụng dữ liệu mẫu làm cơ sở để phân lớp,

mà dùng các thuật toán để xem xét các pixel chưa biết trên một ảnh và kết hợp

chúng thành một số loại dựa trên các nhóm tự nhiên hoặc các loại tự nhiên có trong

38

ảnh. Nguyên lý cơ bản của phương pháp này là các giá trị phổ trong một loại lớp

phủ phải gần giống nhau trong không gian đo, trong lúc các dữ liệu của các loại

khác nhau phải được phân biệt rõ với nhau về phương diện phổ.

Các loại thu được do việc phân lớp không giám sát gọi là các lớp phổ. Do chỗ

chúng chỉ dựa trên các nhóm tự nhiên có trong ảnh, đặc điểm nhận dạng của các loại phổ lúc ban đầu chưa biết nên người giải đoán phải so sánh các dữ liệu đã được

phân lớp với một dạng nào đó của dữ liệu tham khảo (chẳng hạn ảnh tỉ lệ lớn hơn

hoặc bản đồ) để xác định đặc điểm nhận dạng và giá trị thông tin của các loại phổ.

Thuật toán được sử dụng phổ biến trong phân lớp không giám sát ảnh viễn thám đa phổ là KMeans. Ngoài ra, nhiều kỹ thuật phân lớp không giám sát [109] đã

được nghiên cứu thử nghiệm như tách cạnh, tách đường và tách điểm; các bộ tách

cạnh được hình thành trên cơ sở các toán tử Robert, toán tử Sobel, toán tử Prewitt, toán tử Canny; phân ngưỡng ảnh; phát triển vùng; phân cụm; thuật toán

Watershed...

1.2.6.4. Tiếp cận phân lớp hướng điểm ảnh

Tiếp cận kinh điển của phân loại ảnh viễn thám dựa trên điểm ảnh [73]. Tiếp

cận này chỉ thông tin phổ được sử dụng trong việc phân lớp [100]. Tiếp cận này bao

gồm phương pháp phân lớp có giám sát và không giám sát truyền thống [100][73].

Phương pháp phân loại hợp lý tối đa (maximum likehood) thuộc tiếp cận này. Hình

Hình 1.9. Quy trình phân lớp ảnh đa phổ hướng điểm ảnh.

1.9 minh hoạ quy trình phân loại ảnh hướng điểm ảnh.

Về mặt toán học, có thể phát biểu bài toán phân lớp ảnh như sau:

 Đầu vào: là tập các pixel, n là số pixel; là tập các nhãn ứng với mỗi lớp cần phân lớp, m là số lớp.

 Đầu ra: Mỗi pixel , 1 ≤ k ≤ n, được gán nhãn , 1 ≤ j ≤ m.

39

Về mặt nguyên tắc chung, các thuật toán phân lớp hướng điểm ảnh sẽ xây dựng các hàm phân biệt ( ) để xác định lớp mà điểm ảnh thuộc về. Khi này luật quyết định có dạng:

(2) ( ) ( )

1.2.6.5. Tiếp cận phân lớp hướng đối tượng

Trong tiếp cận hướng đối tượng, đơn vị xử lý không còn là các điểm ảnh đơn giản mà là các đối tượng ảnh [100]. Đầu tiên, ảnh được phân đoạn thành các nhóm điểm

ảnh có nghĩa. Thứ hai, một tập các luật phân vùng dựa trên tri thức để mô tả mỗi lớp

được định nghĩa. Luật bao gồm thông tin phổ, không gian, ngữ cảnh, và kết cấu. Và

sau đó, bộ phân loại sẽ được chọn để gán mỗi đoạn về lớp phù hợp theo luật [66].

Hình 1.10. Quy trình phân loại ảnh đa phổ hướng đối tượng.

Hình 1.10 minh hoạ quy trình phân loại dựa trên tiếp cận hướng đối tượng.

Sau khi phân cụm, ảnh gốc I không biểu diễn dưới dạng tập điểm ảnh nữa mà

được biểu diễn lại dưới dạng tập O các cụm hay đối tượng như sau:

(3)

Trong đó, .

Các đối tượng này sẽ được tính đặc trưng: ( ).

Về nguyên tắc chung, các thuật toán phân lớp hướng điểm ảnh sẽ xây dựng các hàm phân biệt ( ) để xác định lớp mà điểm ảnh thuộc về. Khi này luật quyết định có dạng:

(4) ( ( )) ( ( ))

Các đặc trưng của cụm có thể là:

 Cường độ

40

 Kết cấu

 Chỉ số thảm thực vật NDVI

 Hình dạng

 Liên quan

1.2.7. Hậu giải đoán, phân lớp

Công dụng của bất kỳ phương pháp phân loại hình ảnh nào cuối cùng sẽ phụ

thuộc vào sản phẩm các kết quả đưa ra mà chuyển tải một cách hữu hiệu thông tin được giải đoán cho người sử dụng. Ở đây, ranh giới giữa viễn thám, bản đồ máy

tính, làm bản đồ số và hệ thống thông tin địa lý bị xóa hòa. Có thể lựa chọn một cách không hạn chế các sản phẩm đầu ra. Ba dạng tổng quát thường được sử dụng,

bao gồm các sản phẩm “bản đồ” đồ họa, các bảng số liệu thống kê khu vực và các

file dữ liệu bằng số.

1.2.7.1. Các sản phẩm đồ họa

Bởi vì các dữ liệu được phân lớp nằm dưới dạng mảng dữ liệu hai chiều, kết

quả đồ họa dễ dàng được đưa ra bằng máy vi tính bằng cách hiển thị các màu các

tông hoặc các chữ cho mỗi ô trong mảng theo loại lớp phủ đối tượng đã được gán

cho. Có thể sử dụng một loạt thiết bị cho mục đích này như các màn hình thể hiện

mầu, các máy in, các máy ghi phim và các máy quét cỡ lớn. Những cách hiển thị đó

trình bày các kết quả phân loại một cách rất hữu hiệu và người phân tích có thể

chọn cách hiển thị một cách tương tác chỉ các tập con (tập hợp con) của file ban đầu

hoặc dễ dàng thay đổi cách gán mầu sắc, tạo nhóm các loài... Khi muốn có sản

phẩm đầu ra copy giấy đối với các dữ liệu trên có thể sử dụng máy in tĩnh điện hoặc

in laze. Các bản in ra có thể là trắng đen hoặc in mầu. Ta cũng có thể sử dụng máy

chụp phim mầu để sản xuất các bản in cứng có độ chính xác cao về mầu và hình học.

1.2.7.2. Các dữ liệu đưa ra bằng bảng

Một hình thức chung nữa về kết quả đầu ra là dùng một bảng liệt kê tóm tắt các số liệu thống kê về diện tích của các loại lớp phủ có mặt trên cảnh tượng hoặc trong các diện tích nhỏ hơn cảnh tượng mà người sử dụng đã xác định. Ta có thể rút

ra các số liệu thống kê về diện tích từ file dữ liệu đã giải đoán dựa theo từng ô lưới.

41

Trước hết ranh giới của một vùng đang quan tâm (như là một lưu vực, thung lũng

hoặc một tỉnh) được số hóa đối với các tọa độ ma trận ảnh. Trong ranh giới đó, số

lượng các ô trong mỗi loại lớp phủ sẽ được lập bảng và nhân với diện tích mặt đất của một ô tương ứng. Quá trình này đơn giản hơn việc đo thủ công các vùng trên

một bản đồ và là ưu điểm chủ yếu của xử lý dữ liệu lớp phủ mặt đất dưới dạng số.

1.2.7.3. Các file thông tin bằng số

Một thể loại cuối cùng để đưa ra kết quả là các file dữ liệu đã giải đoán chứa

các kết quả phân loại được ghi lại trên một số phương tiện lưu trữ bằng máy tính

(chẳng hạn CCT hoặc đĩa). Dữ liệu được giải đoán dưới dạng này, có thể dễ dàng nhập vào hệ thống GIS để hòa nhập với các file dữ liệu địa lý khác.

1.3. Tổng quan về tính toán mềm

Trong thực tế cuộc sống, các bài toán liên quan đến hệ thống nhận thức, trí tuệ

của con người đều hàm chứa những đại lượng, thông tin không chính xác, không

chắc chắn và không đầy đủ. Ví dụ; sẽ chẳng bao giờ có các thông tin, dữ liệu cũng

như các mô hình tính toán đầy đủ và chính xác cho bài toán dự báo thời tiết. Nhìn

chung con người luôn ở trong bối cảnh không có thông tin chính xác và đầy đủ cho

các hệ thống ra quyết định.

Trong lĩnh vực khoa học kỹ thuật cũng vậy, các hệ thống phức tạp trên thực tế

thường không thể mô tả một cách đầy đủ và chính xác bởi các phương trình toán học truyền thống. Kết quả là những cách tiếp cận kinh điển dựa trên kỹ thuật phân

tích và các phương trình toán học nhanh chóng tỏ ra không còn phù hợp. Vì thế,

công nghệ tính toán mềm chính là giải pháp trong lĩnh vực này.

1.3.1. Khái niệm về tính toán mềm

Tính toán mềm (Soft computing) khác với tính toán cứng truyền thống (Hard

computing) ở chỗ: tính toán mềm cho phép sự không chính xác, tính bất định, gần dúng, xấp xỉ trong tính toán [55]. Các mô hình tính toán mềm dựa trên kinh nghiệm của con người, sử dụng sai số cho phép của sự không chính xác, tính bất định, gần đúng, xấp xỉ để tìm lời giải hiệu quả - đơn giản, dễ hiểu, dễ thực hiện, chi phí thấp.

Tính toán mềm biểu thị một sự chuyển dịch, biến hoá quan trọng trong các hướng tính toán: sự dịch chuyển này phản ánh sự kiện trí tuệ con người, không như

42

máy tính, có khả năng đáng kể trong việc lưu trữ và xử lý thông tin không chính xác

và bất định, và đây mới là những thông tin thực tế thường gặp.

Các ứng dụng thành công cho thấy tính toán mềm ngày càng phát triển mạnh và đóng vai trò đặc biệt trong các lĩnh vực khác nhau của khoa học và kỹ thuật.

Tính toán mềm được ứng dụng trong hầu hêt các chuyên ngành kỹ thuật như kỹ thuật điện, kỹ thuật điều khiển, kỹ thuật hoá học, kỹ thuật xây dựng… Trong đó, kỹ

thuật điện là lĩnh vực đầu tiên ứng dụng tính toán mềm trong điều khiển mờ, xử lý

ảnh mờ, mạch điện tử dùng logic, người máy…

Khái niệm tính toán mềm được Zadeh đưa ra đầu tiên vào năm 1994 được mô tả như sau: “Một cách cơ bản, tính toán mềm không phải là thể thống nhất các khái

niệm và kỹ thuật. Đúng ra, nó là sự kết hợp của các phương pháp riêng biệt theo

cách này hay cách khác để thích nghi với nguyên lý của nó. Tại điểm giao đó, mục đích cuối cùng của tính toán mềm là khai thác khả năng thứ lỗi (Tolerance) cho tính

không chính xác hay tính bất định để đạt được mục tiêu với chi phí thấp”. Một cách

đơn giản hơn, “Tất cả các tính toán có bao gồm sự không chính xác một cách có chủ

đích trong tính toán ở một hay nhiều mức và cho phép tính không chính xác này

làm thay đổi (làm giảm) độ chính xác của bài toán, hay “làm mềm” mục tiêu tối ưu

ở một số bước, đều bị coi là thuộc lĩnh vực tính toán mềm”.

1.3.2. Phân biệt tính toán mềm và tính toán cứng

Tính toán truyền thông, hay còn gọi là tính toán cứng, là phương pháp sử dụng

các kỹ thuật tính toán, dựa trên dữ liệu đầu vào để đưa ra kết quả cuối cùng một

cách chính xác theo yêu cầu cảu bài toán.

Bảng dưới đây đưa ra một số điểm khác biệt giữa tính toán mềm và tính toán

cứng, để chúng ta có được một hình dung cụ thể hơn về tính toán mềm.

Bảng 1: Một số khác biệt giữa tính toán mềm và tính toán cứng.

- Xử lý bài toán dựa trên số

- Không đòi hỏi dữ liệu phải

Tiêu chí Tính toán cứng Tính toán mềm

liệu chính xác chính xác

- Ví dụ: Giá trị của A phải là 0

Dữ liệu xử lý

- Ví dụ: Giá trị của A có thể nằm trong khoảng từ 0 đến 1: [0,1]

hoặc 1: {0,1}

43

- Yêu cầu đưa ra kết quả gần tối

- Yêu cầu đưa ra kết quả tối ưu

Kết quả

- Kỹ thuật tính toán dựa trên

đầu ra (kết quả chính xác hoàn toàn) ưu (cho phép sự sai lệch nhất định trong kết quả tìm được)

- Sử dụng kỹ thuật tính toán

- Thời gian tính toán thường

Kỹ thuật Heurtistic được sử dụng phổ tính toán truyền thống biến

- Thời gian tính toán nhanh hơn

chậm hơn. Trong một số Thời gian trường hợp, không thể đưa ra tính toán với chi phí thấp hơn

- Các bài toán không yêu cầu lời

- Các bài toán yêu cầu lời giải

kết quả trong thời gian chấp nhận được

giải chính xác, song phải đưa ra Lĩnh vực chính xác, không cho phép sự kết quả trong một khoảng thời áp dụng sai lệch. gian nhất định với chi phí nhất

định

 Tính toán mềm căn cứ trên các đặc điểm, hành vi của con người và tự nhiên

1.3.3. Một số đặc điểm của tính toán mềm

để đưa ra quyết định hợp lý trong điều kiện không chính xác, không chắc

 Các thành phần của tính toán mềm có sự bổ sung, hỗ trợ nhau.

 Tính toán mềm là một hướng nghiên cứu mở, bất kỳ một kỹ thuật mới nào được tạo ra từ việc bắt chước trí thông minh của con người, đều có thể trở thành một thành phần mới của tính toán mềm.

chắn.

 Không phải bài toán nào cung có thuật toán có thể giải quyết được bằng

Chính nhờ những đặc điểm đó mà tính toán mềm đang được nghiên cứu và ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là: trí tuệ nhân tạo, khoa học máy tính. Lý do:

tính toán cứng.

44

 Không phải bài toán nào có thuật toán có thể giải quyết bằng tính toán cứng

 Khi bản thân dữ liệu không chính xác thì không thể giải quyết được bằng

thì chi phí và thời gian thực hiện có thể chấp nhận được.

phương pháp chính xác.

Với những ưu thế trên, tính toán mềm đang dần thể hiện vai trò của mình, nhất

là trong việc giải quyết vấn đề mới.

1.3.4. Các kỹ thuật trong tính toán mềm

 Logic mờ (Fuzzy logic)

 Mạng neural nhân tạo (Neural Network)

 Lập luận xác suất (probabilistic reasoning): Giải thuật di truyền (Genetic

Theo [31], tính toán mềm có 3 thành phần chính:

Algorithm), lý thuyết hỗn mang

 Hệ thống mờ (Fuzzy Systems - FS), bao gồm logic mờ (Fuzzy Logic - FL).

 Tính toán tiến hoá (Evolutionary Computation - EC),bao gồm giải thuật di

Theo [55], các thành phần chính của tính toán mềm bao gồm:

 Mạng Neural (Neural Networks - NN), bao gồm mạng Neural (Neural

truyền (Genetic Algorithms - GA)

 Học máy (Machine Learning - ML);

 Lập luận xác suất (Probabilistic Reasoning - PR).

Computing - NC);

Các mục tiếp theo dưới đây sẽ giới thiệu sơ lược về Logic mờ, Mạng Neural

và Giải thuật di trueyèn

1.3.4.1. Logic mờ (Fuzzy logic - FL)

Khái niệm tập mờ (Fuzzy set) được Zadeh đưa ra năm 1965 với mục đích cho phép các phần tử không chỉ thuộc về một tập liên tục hay rời rạc. Kể từ đó, các ứng dụng và phát triển dựa trên khái niệm tưởng chừng rất đơn giản này, đã mang lại những kết quả khó có thể tin được. Thậm chí, khó có thể chỉ ra các ứng dụng, phát triển hay sản phẩm nào không liên quan đến khái niệm tập mờ. Ví dụ: chúng ta

thường nghe đến nhiều thuật ngữ như: máy giặt fuzzy, quạt fuzzt, ze máy fuzzy…

45

Khái niệm tập mờ có vai trò rất quan trọng trong việc giải quyết các bài toán

tối ưu, đưa ra các bài toán có tính thực tế, giải quyết bài toán với chi phí thấp và

trong thời gian nhanh hơn (mặc dù chấp nhận việc có thể có sai số). Trong lĩnh vực an toàn thông tin, tập mờ cũng được sử dụng rất rộng rãi. Tất cả các thuật toán, giải

thuật, kỹ thuật được giới thiệu dưới đây đều được xuất phát từ tập mờ.

1.3.4.2. Mạng neural nhân tạo (Neural Network - NN)

NN là mô hình tính toán dựa trên bộ não. Mô hình NN bao gồm các bộ xử lý –

các Neural có mối liên kết chặt chẽ với nhau, tương tự như hoạt động của các

Neural trong não người. Các Neural được kết nối bởi các đường liên kết có đánh trọng số, truyền tín hiệu từ neural này đến neural khác. Mỗi neural nhận các tín hiệu

đầu vào (có trọng số) thông qua các đường kết nối và tạo một tín hiệu đầu ra.

1.3.4.3. Giải thuật di truyền (Genetic Algorithm - GA)

Thuật toán di truyền là thuật toán tối ưu ngẫu nhiên dựa trên cơ chế chọn lọc

tự nhiên và tiến hoá di truyền. Nguyên lý cơ bản của thuật toán di truyền đã được

Holland giới thiệu vào năm 1962. Cơ sở toán học đã được phát triển từ cuối những

năm 1960 và đã được giới thiệu trong quyển sách đầu tiên của Holland, Adaptive in

Natural and Artifical Systems. Thuật toán di truyền được ứng dụng đầu tiên trong

hai lĩnh vực chính: tối ưu hoá và học máy. Trong lĩnh vực tối ưu hoá, thuật toán di

truyền được phát triển nhanh chóng và ứng dụng trong nhiều lĩnh vực khác nhau

như tối ưu hàm, xử lý ảnh, bài toán hành trình người bán hàng, nhận dạng hệ thống

và điều khiển.

Thuật toán di truyền cũng như các thuật toán tiến hoá nói chung, hình thành

dựa trên quan niệm cho rằng, quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó đã mang tính tối ưu. Quan niệm này có thể xem như một tiên

đề đúng, không chứng minh được, nhưng phù hợp với thực tế khách quan. Quá trình tiến hoá thể hiện tính tối ưu ơ chỗ, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện hơn) thế hệ trước bởi tính kế thừa và đấu tranh sinh tồn.

 GA lập luận mang tính ngẫu nhiên thay vì xác định như toán học giải tích.

 GA xét duyệt toàn bộ các giải pháp, sau đó lựa chọn giải pháp tốt nhất dựa

Các tính chất đặc trưng của giải thuật di truyền:

trên hệ số thích nghi.

46

 GA chỉ tập trung vào giải pháp (dãy số tượng trưng cho giải pháp) mà

 GA thích hợp cho việc tìm điều kiện tối ưu cho việc điều hành và phân

không cần quan tâm đến chi tiết vấn đề.

nhóm những giải pháp có được.

 Tái sinh

 Lai ghép

 Đột biến

Các phép toán của giải thuật di truyền:

1.4. Tình hình nghiên cứu trong và ngoài nước

Luận án tập trung nghiên cứu các giai đoạn: Tăng cường và giải đoán (phân lớp) ảnh viễn thám đa phổ nên phần này sẽ tìm hiểu, khảo sát tình hình nghiên cứu

các giai đoạn này.

1.4.1. Tăng cường hình ảnh trực quan

1.4.1.1. Lọc mây, sương mù của ảnh viễn thám

Tất cả bức xạ mặt trời trong viễn thám phải vượt qua khí quyển của trái đất.

Trong khi lan truyền, bức xạ này tương tác với khí quyển, sinh hiệu ứng khác nhau

trên ảnh vệ tinh mà sau đó phải được loại bỏ thông qua hiệu chỉnh khí quyển ([106];

[28]; [35]. Một vài ảnh hưởng khí quyển, như mây, chặn hầu hết tất cả bức xạ trong

vùng phổ nhìn thấy và hồng ngoại. Ảnh hưởng khác che khuất một phần bức xạ lên bề mặt trái đất và phản xạ một phần thông tin bị thay đổi. Sương mù là một ví dụ về

ảnh hưởng một phần. Sương mù biểu thị một tập ảnh hưởng không khí mà làm giảm

độ tương phản. Nói chung, tác động của sương mù là hiển nhiên khi xem ảnh trong bộ phận lục và lam của phổ điện từ. Ở bước sóng này, nói chung nó là ảnh hưởng bức xạ thêm vào và thay đổi về mặt không gian, với ảnh vệ tinh theo mô hình

khuếch tán. Như vậy, cần loại bỏ sương mù để phân tích cảnh.

Một số kĩ thuật dò tìm và loại bỏ sương mù bao gồm:

 Trừ đối tượng tối đơn giản [115], [27], tiếp cận mục tiêu tối dựa trên ảnh ([107]). Gần đây, trong [122], các tác giả đề xuất một phương pháp đơn giản, dò tìm điểm tối, nhưng hiệu quả để loại bỏ sương mù trong ảnh có

sương mù. Điểm tối là điểm ảnh trong ảnh không bị ảnh hưởng bởi sương

47

mù với giá trị trong tất cả kênh màu RGB gần với không. Với phương pháp

này, thuật toán đề xuất có thể ước lượng một cách hiệu quả độ dày sương

mù và tìm lại một cảnh không bị ảnh hưởng bởi sương mù một cách rõ ràng thậm chí cả khi đối tượng cảnh vốn tương tự với ánh sáng không khí trên

Hình 1.11. Ví dụ của ảnh khử sương mù sử dụng dò tìm điểm tối; Trái: Ảnh sương mù đầu

vào, Phải: Kết quả của phương pháp trong [122].

 Mô hình truyền bức xạ không khí phức tạp ([40]; [97]; [103]; [89], [90].

một vùng rộng. Ngoài ra, thuật toán trong [122] nhanh và với chất lượng khử sương mù tốt.

Trong [70], các tác giả đề xuất phương pháp đơn giản nhưng hiệu quả cho

việc loại bỏ sương mù ảnh viễn thám đơn. Kĩ thuật khử sương mù của họ

làm việc tốt mà không sinh ra những vệt sáng và rất nhanh. Dựa trên sự ưu

tiên kênh tối, các tác giả có thể trích chọn tự động ánh sáng không khí toàn

cục và đánh giá màng chắn không khí một cách gần đúng. Sau đó, là lọc

màng khí quyển sử dụng bộ lọc Gaussian thông thấp. Để loại bỏ sự sai lệch

về màu của ảnh sau khi khôi phục, họ tính lại sự truyền. Với ánh sáng

không khí toàn cục và sự truyền, thuật toán có thể sinh ảnh không có sương

mù.Ảnh viễn thám được khôi phục rất hấp dẫn về mặt trực quan, chúng chứa các chi tiết rất tốt và bảo tồn màu của cảnh gốc với thời gian xử lý thấp. Hơn nữa, với ảnh chứa các vùng rõ ràng và sương mù cục bộ, thuật toán của họ có thể đạt được kết quả tốt. Tuy nhiên, hạn chế chính trong phương pháp của họ là nó có thể làm mất đi sự hiệu quả với ảnh có độ chênh lệch sương mù lớn.

48

Hình 1.12. So sánh kết quả của trong [70] với trong [48].

 Hiệu chỉnh sử dụng ảnh đa kênh và đa thời gian ([23]; [44]; [65]

 Hiệu chỉnh sử dụng dữ liệu mặt đất ([14]; [82]

 Hiệu chỉnh sử dụng mục tiêu bất biến [91]

Hiện nay, các nghiên cứu còn bổ sung kĩ thuật mới như phân tích wavelet để

tăng cường hiệu quả lọc mây mù.

Trong [124], các tác giả đề xuất phương pháp loại bỏ sương mù, đám mây sử

dụng thuật toán Mallat bằng cách phân tích các đặc trưng phân bố tần số của ảnh

viễn thám bị ảnh hưởng bởi mây và sương mù. Dựa trên đặc trưng xác suất thấp

tương đối của mây và sương mù, tần số cao tương đối của cảnh, và đa độ phân giải

của hàm wavelet, các tác giả phân tích đặc trưng của biến đối wavelet trong cả lý

thuyết và ứng dụng thực tế, và kết luận rằng hệ số chi tiết tại mức thấp hơn của

wavelet biểu diễn tương đối tần số cao của ảnh, hệ số chi tiết tại mức cao của nó

biểu diễn kênh tần số thấp tương đối của ảnh...

49

Hình 1.13. (a-f): So sánh kết quả xử lý với các hàm wavelet khác nhau và bộ lọc đồng cấu

[124].

Trong [124], một số vấn đề cần tiếp tục nghiên cứu và cải thiện mà các tác giả

đề xuất bao gồm:

1) Làm thế nào một hàm wavelet khác ảnh hưởng đến kết quả xử lý của ảnh,

và làm sao để tìm được hàm wavelet tốt nhất.

2) Kết hợp biến đổi wavelet với các phương pháp xử lý ảnh khác như hợp nhất

ảnh để cải thiện kết quả xử lý.

3) Trong các thử nghiệm trên, số mức và các thừa số được thiết lập theo kinh

nghiệm, cần tiếp tục nghiên cứu dựa trên xử lý ảnh thông minh và thích ứng.

Trong [29], các tác giả đề xuất một tiếp cận khử sương mù ảnh đơn mới. Phương pháp này sử dụng một chiến lược dựa trên sự liên hợp mà xem đầu vào như hai phiên bản thích ứng của ảnh gốc mà được gắn trọng số bởi các ánh xạ đặc biệt để sinh các kết quả không mây chính xác. Phương pháp này tính toán trong cách thức trên điểm ảnh được cài đặt minh bạch. Phương pháp trong [29] chứng minh để

50

sinh các kết quả so sánh được và thậm chí tốt hơn các kĩ thuật phức tạp hơn nhưng

Hình 1.14. So sánh với phương pháp nhanh của Tarel và Hautiere [105]. Phương pháp trong [29] nhanh và cho kết quả chính xác hơn phương pháp của Tarel.

có ưu điểm là thích hợp với ứng dụng thời gian thực.

Trong [120], các tác giả sử dụng kĩ thuật phân tích Wavelet để tìm và loại bỏ

sương mù cho ảnh vệ tinh độ phân giải cao (hình 1.15). Một thủ tục dò tìm và loại

bỏ sương mù liên quan đến phân tích nội dung thông tin tần số thấp của cảnh. Ảnh

bị mờ bởi mây được phân rã thành các mức khác nhau với biến đổi wavelet. Mặc dù

mây được phân bố trong miền tần số thấp, miền này cũng có thể chứa thành phần

của lớp phủ đất mà tương đối ổn định về mặt không gian và thời gian. Một ảnh

tham chiếu không mây tại vùng tương tự được sử dụng để đặc trưng hoá lớp phủ

đất. Thành phần của lớp phủ đất được đặc trưng sau đó được trừ với phân tích

wavelet. Các hệ số wavelet còn lại được sử dụng để tạo một mặt nạ biến đổi cho

việc dò tìm và loại bỏ mây tiếp theo. Sau khi làm trơn, mặt nạ được trừ từ ảnh bị mờ

để thu được ảnh chính xác với các đặc trưng loại mây. Cả sự kiểm tra trực quan và

đánh giá độ chính xác thống kê thể hiện sự hiệu chuẩn sương mù là hợp lệ và mạnh

mẽ.

51

Hình 1.15: thử nghiệm loại bỏ mây mù trong [120].

1.4.1.2. Tăng cường ảnh

Tăng cường ảnh dựa trên histogram

Duan đã giới thiệu một thuật toán xử lý lược đồ xám mới mà xem phân phối

ban đầu của điểm ảnh trong xử lý cân bằng [34]. Độ sáng và thành phần bão hoà

của điểm ảnh bị thay đổi và thành phần sắc còn lại sự tương phản. Sự phát triển của thuật toán này thể hiện sự tương phản hơn và ảnh trông tự nhiên và tránh thành

phần lạ trực quan. Tác giả Arich đã giới thiệu thuật toán độ phức tạp thấp cho cân

bằng lược đồ xám [15]. Kĩ thuật đặc tả lược đồ xám (HM) như: Cân bằng lược đồ

xám hiệu chỉnh, Làm trơn lược đồ xám, Xấp xỉ lược đồ xám có trọng số, Giãn đen trắng đã được thực hiện bởi việc tính toán lược đồ xám và hiệu chỉnh mức tăng cường. Do đó, độ tương phản của ảnh có thể được cải thiện mà không đưa vào

thành phần lạ trực quan, nhưng ảnh tăng cường không vừa ý một cách trực quan.

Tăng cường ảnh dựa trên logic mờ

Để loại bỏ nhiễu từ một ảnh và tăng cường nó, Tang và cộng sự đã giới thiệu một tiếp cận mới [102]. Thuật toán này dựa trên sự phân tách dữ liệu màu thành sắc độ và độ sáng, và sau đó xử lý mỗi thành phần đó với phương trình vi phân từng

phần hoặc luồng khuếch tán. Ảnh thừa sáng và thiếu sáng không được tăng cường

52

đúng. Trong lĩnh vực xử lý ảnh số, để tăng cường một ảnh, sự có mặt nhiễu được

loại bỏ bằng việc sử dụng bộ lọc. Manglesh đã đề xuất thuật toán mới để tăng

cường ảnh màu bị làm hỏng bởi nhiễu Gaussian sử dụng logic mờ. Luật logic mờ được sinh. Sau đó giá trị RGB của ảnh được đưa vào tiếp cận logic mờ. Đầu ra mờ

sẽ phân biệt giữa các màu mơ hồ [72]. Sarode đã giới thiệu thuật toán mới để khôi phục các đặc tính liên quan đến dịch bước đặc biệt. Sắc độ được bảo tồn, chỉ sự bão

hoà và giá trị bị thay đổi và sau đó luật logic mờ được áp dụng, dựa trên điều

nàynhững quyết định liên quan đến việc phân lớp màu sẽ được thực hiện. Đầu ra sẽ

được bao gồm chỉ những vùng bướu nghiêm trọng và điểm ảnh nhiễu bị loại bỏ [94].

Kĩ thuật tăng cường mờ được đề xuất bởi Hanmandlu trong đó một toán tử

tăng cường độ tương phản được giới thiệu, mà bao gồm tham số ‘t’. Bằng việc bảo

tồn H, và chỉ thay đổi S và V và bằng việc cực tiểu entropy mờ, chất lượng của ảnh

được cải thiện về mặt trực quan với nhận thức tương phản của con người [44]. Để

duy trì nhận thức trực quan của con người, Lior Shamir đã đề xuất tiếp cận dựa trên

nhận thức con người để phân đoạn màu điểm ảnh [69]. Tập mờ được phân loại dựa

trên các thành phần màu H, V và V. Sắc độ H được định nghĩa sử dụng Đỏ, Cam

tối, Cam nhạt, Vàng, Xanh nhạt, Xanh tối, Aqua, Lam, Tím tối, Tím nhạt. Sự bão

hoà S được định nghĩa sử dụng năm tập mờ: Xám, Gần như Xám, Trung bình, Gần

như sáng, sáng. Giá trị V được định nghĩa sử dụng bốn tập mờ: Tối, Tối trung bình,

Sáng trung bình và Sáng. Luật mờ trong mô hình này được định nghĩa dựa trên sự

quan sát của con người. Ví dụ, luật “Cam tối, Trung bình, Tối trung bình đưa ra

Nâu tối” được định nghĩa thủ công bởi việc phân loại thành phần màu HSV. Phương pháp dựa trên logic mờ cung cấp một phân loại màu chính xác hơn.

Trong [24], tác giả Cheng đã đề xuất một kĩ thuật tăng cường độ tương phản

mờ trực tiếp thích ứng mới, hàm thuộc Sigma được sử dụng để ánh xạ ảnh từ miền

không gian vào miền mờ. Ảnh kết quả thu được được tăng cường đúng. Trong khi chuyển ảnh từ một không gian màu (RGB) vào không gian màu khác (HSV, HIS, YIQ) sắc độ không bị thay đổi chỉ thành phần cường độ và độ bão hoà bị thay đổi. Tuy nhiên, ảnh sau tăng cường có thể không còn giữ được sự trong trẻo. Để khắc phục vấn đề này, trong [76], Naik đã cố gắng giữ các giá trị được biến đổi trong phạm vi của không gian RGB.

53

Hình 1.16. So sánh kết quả thuật toán của Cheng (c) với thuật toán ACE (b) [24].

Thuật toán tăng cường và đánh giá ảnh màu được điều khiển HVS được đề

xuất bởi Huang mà chủ yếu tập trung vào hiệu ứng trực quan và ảnh được tăng

cường không quá mức hay có thành phần sáng lạ [51]. Bằng việc sử dụng các thuật

toán khác nhau ảnh suy thoái được tăng cường, nhưng thỉnh thoảng ảnh có thể bị

tăng cường quá mức. Vì vậy, để khắc phục vấn đề này, trong [121] Yu đã giới thiệu

thuật toán điều chỉnh việc bảo tồn sắc độ tên là điều chỉnh SI chuẩn hoá cho loại

tăng cường khác nhau. Chất lượng ảnh về mặt trực quan được tăng cường nhưng

quá trình xử lý tiêu thụ thời gian.

Trong [47], các tác giả đưa ra một nghiên cứu so sánh các kĩ thuật tằng cường

ảnh mờ.

Trong [99], hai kĩ thuật tăng cường là tăng cường độ tương phản dựa trên luật

mờ và tăng cường độ tương phản sử dụng toán tử tăng cường được trình bày với

ảnh xám độ tương phản thấp. Trong kĩ thuật đầu tiên, hàm ứng với hệ mờ thu được

bởi các luật if-then đơn giản, và trong kĩ thuật thứ hai toán tử tăng cường độ tương

phản mờ đóng vai trò như công cụ cho việc tăng cường độ tương phản trong miền

mờ. Sự phân tích so sánh của các kĩ thuật này được thực hiện bởi việc tính chỉ số

mờ và thời gian xử lý. Giá trị thấp hơn của chỉ số mờ biểu thị ảnh tăng cường tốt hơn.

54

Hình 1.17. So sánh kết quả 2 kĩ thuật tăng cường: đầu vào, luật mờ, toán tử tăng cường

[99].

Kết quả thực nghiệm cho thấy, lược đồ xám của ảnh gốc và các ảnh tăng

cường có các đặc trưng cơ bản giống nhau, điều này không làm được trong cân

bằng lược đồ xám [99]. Ngoài ra, tăng cường độ tương phản sử dụng kĩ thuật toán

tử tăng cường có các giá trị chỉ số mờ thấp hơn khi so với kĩ thuật tăng cường độ

tương phản sử dụng luật mờ. Tuy nhiên, về thời gian xử lý, kĩ thuật tăng cường độ

tương phản dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật tăng cường sử dụng

toán tử tăng cường.

Kĩ thuật tối ưu

Hanmandlu đã giới thiệu một hàm thuộc Gaussian để mờ hoá ảnh mà bao gồm

tham số tăng cường t, mờ fh và điểm chéo cho việc tăng cường ảnh màu. Bằng việc

tối ưu entropy mờ của ảnh, các tham số được tối ưu, chất lượng ảnh nhìn thấy được quan sát với ảnh thiếu sáng [45]. John See đã đề xuất bộ dò tìm cạnh Gaussian dựa

trên mờ sử dụng cả thuộc tính toàn cục và cục bộ[58]. Trong giai đoạn tăng cường

độ tương phản toàn cục, hàm thuộc Gaussian được sử dụng. Một hàm tăng cường

độ tương phản không tuyến tính bao gồm ba tham số được sử dụng để tăng cường

ảnh. Trong pha cục bộ, mặt nạ dò tìm cạnh kiểu Gaussian chứa hai tham số mờ

được tối ưu bằng việc sử dụng hàm entropy ảnh mờ và thuật toán này đã thể hiện một cải tiến trực quan đáng lưu ý. Palanikumar đã giới thiệu một thuật toán mới dựa trênCân bằng lược đồ xám(HE) và HE tăng giá trị thích ứng (AIVHE) [84]. Bằng

việc sử dụng phương pháp AIVHE, độ tương phản được tăng cường và được điều khiển bởi hai tham số người dùng beta và gamma, nhưng thông tin chi tiết không phải lúc nào cũng được bảo tồn. Để khắc phục vấn đề này thuật toán di truyền được dùng để tối ưu giá trị beta và gamma bằng việc tối ưu giá trị entropy.

55

Một tiếp cận heuristic tham lam, được điều khiển bởi một tham số đơn giản,

để xấp xỉ vấn đề tối ưu mà bao gồm ràng buộc cảm nhận bắt nguồn từ hàm nhạy

cảm tương phản ngưỡng trên của con người mà theo luật weber được đề xuất bởi Aditi Majumder [8].

Ảnh bao gồm nhiều đối tượng được phân cụm mà chồng lặp lên mỗi cụm khác và giấu đi cấu trúc mà hướng đến vấn đề trích chọn cấu trúc. Để giải quyết vấn đề

phân lớp, Subba Rao Katteda và cộng sự đã đề xuất thuật toán gọi là tối ưu đàn kiến

và kĩ thuật dựa trên logic mờ [98]. Bằng việc sử dụng logic mờ các luật được hình

thành và bằng việc sử dụng tối ưu đàn kiến mỗi giá trị cường độ điểm ảnh được thu thập một cách riêng biệt. Dựa trên luật logic mờ các điểm ảnh được gom nhóm với

nhau để lấy lại cấu trúc, nhưng rất phức tạp để hình thành luật mờ.

Một hệ thống tối ưu đàn kiến mờ mới cho việc xác định tham số được đề xuất bởi Tao mà dựa trên luật mờ, hành vi chuyển đổi của những con kiến được khởi

xướng. Luật xác suất chuyển được tạo mới để chọn thành phố tiếp theo. Do đó tham

số đúng của bộ điều khiển trượt mờ cho việc dao động và cân bằng quả lắc đảo

ngược và hệ thống xe đẩy được tìm ra [104].Vittorio Maniezzo trong nghiên cứu

của mình đã đề xuất thuật toán siêu heuristic cho vấn đề tối ưu kết hợp. Hệ kiến

(AS) được áp dụng ban đầu đến giải pháp của vấn đề người bán hàng du lịch, sau đó

ACO được áp dụng để tìm giải pháp tốt hơn [114]. Trong AS mùi được cập nhật

cho tất cả các giải pháp thu được bởi đàn kiến. Trong ACS tất cả kiến được lặp và

tại thời điểm kết thúc mỗi mỗi vòng lặp, mùi chỉ được cập nhật bởi giải pháp tốt

nhất. Vì vậy con kiến tìm được đường một cách dễ dàng và tránh được thời gian hội

tụ dài.

Tối ưu đàn kiến (ACO) là kĩ thuật tối ưu được lấy cảm hứng từ hành vi của

con kiến trong thực tế, làm sao đàn kiến gửi mùi để tìm thức ăn. J. Tian đã giới

thiệu ACO để giải quyết vấn đề tìm cạnh. ACO dựa trên tiếp cận tìm cạnh phát triển ma trận mùi mà thể hiện thông tin cạnh trên mỗi vị trí điểm ảnh. Quá trình xây dựng và cập nhật được thực hiện lặp đi lặp lại để phát triển ma trận mùi. Cuối cùng, cạnh được xác định bằng việc sử dụng quá trình quyết định, nhưng tải tính toán cần được giảm bớt [108]. S. Meshoul đã đề xuất để thi hành việc khớp điểm mạnh mẽ và đề nghị ước lượng cho mục đích đăng ký ảnh từ thông tin nhiễu và ngoại lai. Hệ kiến

(ACS) được sử dụng như một chiến lược tìm kiếm để xác định giải pháp khởi tạo.

Một tìm kiếm cục bộ được bao gồm cùng với chiến lược tìm kiếm để làm mịn giải

56

pháp thu được. Sự hội tụ đạt được và do đó độ chính xác được cải thiện, nhưng nó

có thể ổn định lên tới 30% dữ liệu ngoại lai [74].

Một ảnh có thể được nhóm thành các vùng thiếu sáng, hỗn tạp và quá sáng dựa trên sự phơi bày trên ảnh[81]. Ảnh RGB được chuyển đổi thành ảnh HSV. Sắc

độ được bảo tồn còn thành phần độ sáng của ảnh bị thay đổi. Việc mờ hoá được thực hiện trên các vùng thiếu và thừa sáng bằng việc sử dụng hàm thuộc Gaussian

dựa trên điểm giao và tham số tăng cường. Giá trị tối ưu của các tham số này đạt

được bởi kĩ thuật tối ưu hệ kiến thay đổi lặp đi lặp lại[81]. Ảnh sau tăng cường

được sinh bởi tiếp cận này vừa ý về mặt trực quan hơn.

Trong [11], Aman Tusia và cộng sự đã thực hiện một phân tích hiệu năng của

hệ thống mờ loại 2 cho việc tăng cường ảnh và tối ưu chỉ số hấp dẫn trực quan.

Trước khi xử lý, ảnh được vào được chuyển từ không gian màu RGB được chuyển về không gian HSV để bảo tồn thông tin màu sắc. Hai ngưỡng dưới và trên được

định nghĩa để cung cấp ước lượng của các vùng thiếu sáng, trộn sáng và thừa sáng

trong ảnh. Ảnh được mờ hoá (loại 2) sử dụng hàm thuộc Gausian. Hàm sigmoid

được sử dụng để tăng cường các thành phần độ sáng của các vùng thiếu và thừa

sáng, các vùng trộn sáng được giữ nguyên trong suốt quá trình xử lý. Một hàm mục

tiêu bao gồm hàm entropy Shannon như nhân tố thông tin và chỉ số hấp dẫn trực

quan được tối ưu, để xác định các tham số cần cho việc tăng cường chỉ số hấp dẫn

trực quanthay vì xem xét entropy để làm ảnh thân thiện với mắt người. Qua việc so

sánh, tiếp cận này cho thấy sự tốt hơn so với tiếp cận tối ưu đàn kiến nhận tạo.

Ngoài ra, trong [13], [16], các tác giả cũng trình bày kĩ thuật tăng cường ảnh

dựa trên việc làm nổi bật cạnh sử dụng biến đổi Wavelet và lọc hình thái. Trong [101], Swaminathan và cộng sự trình bày kĩ thuật tăng cường ảnh bằng việc kết hợp

giữa các phép biến đổi và phương pháp nộ suy.

1.4.2. Giải đoán ảnh viễn thám

1.4.2.1. Phân lớp không giám sát

Phân đoạn ảnh là nhiệm vụ cơ bản trong xử lý ảnh nói chung và xử lý ảnh viễn thám nói riêng.Trong phân loại không giám sát, thông tin cho trước là không cần thiết. Nó không yêu cầu chú thích con người hiểu được và tự động hoàn toàn. Thuật

toán này xác định các cụm trong dữ liệu và cũng phân tích nhãn cụm.

57

Phân đoạn ảnh có thể được định nghĩa như một quá trình hoà nhập các điểm

ảnh có đặc tính tương tự thành vào cùng nhóm, vùng. Ảnh phân đoạn do đó là hơp

của các nhóm phân biệt, tại đó các điểm ảnh của các vùng đồng nhất được kết hợp đến cùng nhóm. Nhiều kĩ thuật đã được đề xuất, nơi mà các đặc trưng màu sắc, kết

cấu và cạnh được sử dụng để mô tả mỗi nhóm [39]. Các phương pháp phân đoạn sớm chỉ xem xét ảnh xám. Khi ảnh màu, ảnh đa kênh trở thành chuẩn của rất nhiều

ứng dụng (ví dụ, ảnh địa lý, ảnh y tế, hoặc giám sát video, ảnh viễn thám) và sự tiến

bộ trong cả công nghệ ảnh màu, ảnh đa kênh và hiệu năng tính toán, sự quan tâm

của các kĩ thuật phân đoạn ảnh màu cũng tăng lên.

K-means là một trong những phương pháp học không giám sát đơn giản mà

giải quyết vấn đề phân cụm nổi tiếng [18]. Thủ tục theo một tiếp cận đơn giản và dễ

dàng để phân loại một tập dữ liệu đã cho thông qua một số cụm nhất định. Ý tưởng

chính là định nghĩa k trọng tâm, một trọng tâm cho mỗi cụm.

Trong [18], Balaji và cộng sự trình bày một phương pháp phân đoạn ảnh mới

dựa trên đặc trưng màu từ ảnh với việc chuyển điểm ảnh từ không gian RGB sang

không gian L*a*b* và phân cụm trên không gian này.Trong thuật toán này tác giả

không sử dụng bất kỳ dữ liệu huấn luyện nào và nghiên cứu được chia thành 2 giai

đoạn. Đầu tiên, tăng cường sự phân biệt màu của ảnh vệ tinh sử dụng giãn phản

tương quan được thực hiện và sau đó các vùng được nhóm thành một tập 5 lớp sử

dụng thuật toán phân cụm KMeans. Sử dụng quy trình hai bước này, có thể giảm

chi phí tính toán tránh việc tính đặc trưng cho mọi điểm ảnh.

Theo [54], các thuật toán phân đoạn ảnh truyền thống xử lý các điểm ảnh độc

lập và phân cụm chỉ dựa theo thông tin phổ. Điều này bỏ qua thông tin không gian mà sẵn có trong ảnh. Các tác giả đã đề xuất tiếp cận đơn giản – một biến thể của

thuật toán KMeans – mà sử dụng cả thuộc tính không gian và phổ của ảnh. Những

điểm ảnh liền kề về mặt không gian rất có thể thuộc cùng một lớp hơn là một cặp điểm ảnh ngẫu nhiên. KMeans truyền thống chỉ sử dụng thông tin phổ của một điểm ảnh cho việc phân cụm. Ở đây, tác giả xem xét điểm ảnh tăng cường gồm bao gồm toàn bộ các điểm ảnh trong lân cận 3 x 3 của điểm ảnh đang xét. Ảnh Landsat gồm 7 kênh nên điểm ảnh tăng cường có số chiều là 63. Tác giả tiếp tục sử dụng kĩ thuật phân tích thành phần chính để giảm chiều rồi mới xử lý phân cụm. Tuy nhiên, chi

phí tính toán của thuật toán này vẫn rất lớn so với thuật toán k-means.

58

KMeans đánh mất đặc trưng ngữ cảnh (thông tin lân cận) của mỗi điểm ảnh

khi chỉ xem xét đặc trưng cường độ [52]. Các tác giả đã đề xuất thuật toán 2D-

KMeans với việc bổ sung giá trị trung vị như tham số không gian (thông tin ngữ cảnh cục bộ) để tăng hiệu quả phân cụm. Cụ thể, nhóm giới thiệu các phiên bản

thay đổi của các thuật toán KMeans (KM) và KMeans dịch chuyển (MKM), được gọi tương ứng là K-Means hai chiều (2D-KM) và K-Means dịch chuyển 2 chiều

(2D-MKM). Hiệu năng của hai thuật toán đề xuất này được so sánh với ba thuật

toán phân cụm thông thường được sử dụng không gian biến, tên là K-Means (KM),

C-Means mờ (FCM) và K-Means dịch chuyển (MKM). Các thuật toán mới kết hợp giá trị trung vị của cường độ điểm ảnh được xem xét với điểm ảnh lân cận của nó;

cùng với cường độ của chính điểm ảnh cho quá trình gán của điểm ảnh đến cụm gần

nhất. Từ kết quả định tính và định lượng quan sát được, chứng minh rằng 2D-KM

và 2D-MKM thực hiện tốt hơn KM, FCM và MKM về việc sinh các kết quả phân

đoạn đồng nhất hơn, trong khi thời gian thực thi ngắn hơn khi so sánh với FCM.

Trong [77], Napoleon cùng cộng sự đã đề xuất một lược đồ phân lớp ảnh viễn

thám dựa trên phân loại không giám sát sử dụng hiệu quả thuật toán KMeans. Tập

dữ liệu thử nghiệm bao gồm tập dữ liệu ảnh Quick Bird và Landsat. Hình 1.18 mô

Hình 1.18. Kiến trúc phân lớp của Napoleon và cộng sự [77].

tả kiến trúc phân lớp mà Napoleon và cộng sự đề xuất.

59

Hình 1.19. Ảnh đầu vào Landsat và kết quả với 5 cụm [77].

Với máy tính cá nhân, giới hạn của tài nguyên phần cứng và thời gian tính

toán lớn trong việc xử lý một số lượng lớn ảnh viễn thám. Trong [123], thử nghiệm

việc song song hoá thuật toán KMeans trên Hadoop, một hệ nguồn mở mà cài đặt

mô hình lập trình MapReduce.Mô hình này yêu cầu các tính năng ‘map/reduce’ tuỳ

chỉnh, cho phép người dùng xử lý song song trong hai giai đoạn. Ưu điểm dễ thấy là

thời gian phân cụm giảm do dữ liệu được chia để thực hiện song song bởi nhiều bộ

xử lý. Tuy nhiên, vì Hadoop chưa xử lý trực tiếp đầu vào là ảnh nên phải có bước

chuyển đổi từ dạng file ảnh về file text và kích thước file đầu vào cho Hadoop tăng

lên.

Một số phương pháp có sẵn dùng để tăng tốc độ phân cụm k-means cứng

[61][64].Kanungo và các cộng sự [61] đã phát triển một thuật toán lọc trên một kd- tree để tăng tốc độ sinh các tâm cụm mới.Việc sắp xếp các điểm dữ liệu trong một

kd-tree cho phân cụm k-means cũng được sử dụng bởi Pelleg và Moore [86].Sau

một số vòng lặp của phân cụm k-means cứng, hầu hết các tâm đã hội tụ đến vị trí

cuối cùng và đa số các điểm dữ liệu có vài đề cử được chọn như các tâm gần chúng

nhất. Lai và các cộng sự [64] đã khai thác đặc trưng này để phát triển một thuật toán

phân cụm KMeans nhanh để giảm độ phức tạp tính toán của phân cụm k-means.

Trong số các công thức phân cụm mà cực tiểu hoá hàm mục tiêu, phân cụm k- means mờ được sử dụng và nghiên cứu rộng rãi [19].Thuật toán phân cụm k-means mờ (FKM) thực hiện lặp bước phân vùng và bước sinh đại diện cụm mới cho đến

khi hội tụ. Trong [33], trình bay ứng dụng của FKM, đã cung cấp một đánh giá tốt về FKM. Mỗi vòng lặp với việc tính toán mở rộng thường được yêu cầu để sinh một tập các đại diện cụm. Sự hội tụ của FKM thường chậm hơn rất nhiều so với phân cụm k-means cứng [36].

60

Để giảm độ phức tạp tính toán của FKM, Shankar và Pal đã sử dụng việc lấy

mẫu ngẫu nhiên đa trạng thái để giảm kích thước dữ liệu [95]. Phương pháp này đã

giảm độ phức tạp tính toán từ 2 đến 4 lần.

Höppner đã phát triển một FKM xấp xỉ để giảm độ phức tạp tính toán của

FKM truyền thống [50]. Phương pháp này đã đưa ra cùng một thành viên như FKM truyền thống trong một độ chính xác đưa vào và đã giảm thời gian tính toán của

FKM xuống từ 2 đến 4 lần.

Chú ý rằng tất cả các phương pháp trên không thể đạt được cùng kết quả phân

cụm như FKM truyền thống. Sau một số vòng lặp của FKM, hy vọng rằng nhiều tâm cụm đã hội tụ đến vị trí cuối cùng và nhiều tính toán khoảng cách có thể được

tránh tại các lặp tiếp theo. Đặc điểm này được khai thác để giảm bởi độ phức tạp

tính toán của phân cụm KMeans mờ.

Trong [26], hai thuật toán được trình bày để giảm thời gian tính toán của phân

cụm KMeans mờ. Một là, CDFKM. Ý tưởng của thuật toán này là sau một số vòng

lặp, một số tâm cụm đã ổn định (2 vòng lặp liên tiếp tâm thay đổi không đáng kể)

thì ko tính lại các tâm cụm này ở các vòng lặp sau đó để giảm chi phí tính toán. Hai

là, để tăng tốc độ hội tụ của CDFKM, các tác giả tình bày thuật toán CCEA để khởi

tạo tâm cụm. Ý tưởng của CCEA là chọn ngẫu nhiên một số tập con của tập dữ liệu

đầu vào. Ban đầu, CDFKM thực hiện trên một tập con để thu được tập tâm. Tiếp

đó, tập dữ liệu đầu vào được tăng lên bằng cách hợp thêm với một tập con và thực

hiện phân cụm bởi CDFKM sử dụng tập tâm khởi tạo của lần phân cụm trước. Cứ

như thế cho đến khi không còn tập con nào và ta có tập tâm cụm khởi tạo cuối cùng.

So với thuật toán phân cụm k-means mờ thông thường, phương pháp đề xuất trong [26] có thể giảm thời gian tính toán từ 3.2 đến 6.5 lần. Phương pháp này mới sử

dụng khoảng cách Euclidean. Nhóm tác giả định hướng mở rộng với độ đo khoảng

cách khác như khoảng cách Hamming.

Trong [49], các tác giả tập trung trên tiếp cận phân cụm, đặc biệt là phân cụm mờ (FCM) [119], mà được sử dụng bởi nhiều phương pháp phân đoạn [10] [25] [63] [68] [118]. Tuy nhiên, các thuật toán này yêu cầu việc khởi tạo mỗi cụm [53], và không khả thi với tập dữ liệu rất lớn như ảnh màu. Trong [49], cáctác giả đề xuất một thuật toán khởi tạo hiệu quả mới đặc biệt để giải quyết vấn đề phân đoạn ảnh.

Hơn nữa, họ giới thiệu thuật toán lặp mờ mới cho phép phân đoạn ảnh nhanh.

61

Thuật toán FCM tuần tự tính toán rất nhiều và yêu cầu bộ nhớ đáng kể. Với

các ứng dụng như phân đoạn ảnh y khoa và phân tích ảnh địa lý đa số với các ảnh

kích thước lớn, FCM tuần tự rất chậm. Trong [88], các tác giả đề xuất một thuật toán C-Mean mờ song song (FCM) cho phân đoạn ảnh. Trong thuật toán FCM song

song này, việc phân chia tính toán giữa các bộ xử lý và tối thiểu sự cần thiết truy cập bộ nhớ thứ hai, tăng cường hiệu năng và hiệu quả của nhiệm vụ phân đoạn ảnh

cũng được so sánh với thuật toán tuần tự.Thuật toán này được cài đặt trên Red Hat

dựa trên cụm với 9 nút được cài đặt sử dụng phần mềm OSCAR (Open Source

Cluster Application Resource).

Một vấn đề của thuật toán phân cụm mờ là yêu cầu tính toán quá mức của

chúng khi xử lý tập dữ liệu ảnh lớn. Ngày nay phần cứng đồ họa thương mại cung

cấp khả năng tính toán song song cao. Trong [125], các tác giả trình bày một cài đặt

thuật toán phân đoạn ảnh kết nối mờ song song trên nền tảng kiến trúc thiết bị thống

nhất tính toán của Nvidia (CUDA) cho việc phân đoạn dữ liệu ảnh y khóa lớn. Thử

nghiệm dựa trên ba tập dữ liệu với kích thước nhỏ, trung bình, và lớn để minh

chứng hiệu quả của thuật toán song song, mà đạt được hệ số tăng tốc tương ứng là

7.2x, 7.3x, và 14.4x, cho ba tập dữ liệu trên cài đặt thuật toán trên CPU.

Trong [43], Golpar và cộng sự đã đề xuất thuật toán phân đoạn mờ đa độ phân

giải cho ảnh viễn thám. Theo [43], phân đoạn ảnh viễn thám, như một bước chính

của xử lý ảnh viễn thám, thường được thực hiện bởi việc phân cụm khi thực địa

không sẵn sàng cung cấp mẫu để huấn luyện một bộ phân loại giám sát. Để giải

quyết vấn đề này, Golpar và cộng sự đề xuất một tiếp cận mới với mục đích giảm

lỗi phân đoạn mờ cũng như thông tin cấu trúc được sử dụng trong thuật toán phân cụm mờ đa độ phân giải họ đề xuất (MR-FCM). Kết quả thể hiện rằng thuật toán

MR-FCM có thể cải tiến kết quả của FCM chuẩn cho tiếp cận phân loại không giám

sát.

Trong [85], Parvathi và cộng sự đã đề xuất Thuật toán phân đoạn watershed hình chop cho ảnh viễn thám độ phân giải cao sử dụng biến đổi wavelet rời rạc. Biến đổi watershed là một công cụ phân đoạn hình thái hữu ích cho ảnh xám. Tuy

nhiên, hiện tượng quá nhiều phân đoạn và quá ít phân đoạn đã trở thành những vấn

62

đề chính cho thuật toán thông thường. Trong bài báo này, một phương pháp phân

đoạn có hiệu quả cho việc phân tích ảnh viễn thám độ phân giải cao được trình bày.

Phân tích Wavelet là một trong những kĩ thuật phổ biến nhất có thể được sử dụng để tìm ra biến đổi cường độ cục bộ và do đó biến đổi wavelet được sử dụng để phân

tích ảnh. Biến đổi wavelet được áp dụng cho ảnh, sinh chi tiết (ngang, dọc, chéo) và các hệ số xấp xỉ. Gradient của ảnh với số lượng tối thiểu các vùng được chọn được

ước lượng với hình thái tỉ lệ xám cho ảnh xấp xỉ ở độ phân giải phù hợp, và sau đó

watershed được áp dụng cho ảnh gradient để tránh hiện tượng quá nhiều phân đoạn.

Ảnh được phân đoạn được chiếu lên các độ phân giải cao sử dụng biến đổi wavelet ngược. Phân đoạn watershed được áp dụng cho tập ảnh con có kích thước nhỏ, đòi

hỏi thời gian tính toán nhỏ. Các tác giả áp dụng tiếp cận mới này để phân tích ảnh

viễn thám. Thuật toán được cài đặt trên MATLAB. Các kết quả thử nghiệm đã

Bảng 1.1. Ảnh phân loại cuối cùng (a) ảnh gốc và (b) đến (d) là các ảnh gốc được áp

watershed từ độ phân giải mức 2 đến mức 0 tương ứng [85].

chứng tỏ đây là một phương pháp rất hiệu quả.

a

Ảnh vệ tinh 1 Ảnh vệ tinh 2

b

63

c

d

1.4.2.2. Phân lớp có giám sát

Phân lớp có giám sát yêu cầu thông tin trước khi thử nghiệm và thông tin này

phải được thu thập bởi phân tích. Phân tích này xác định các vùng huấn luyện cho

mỗi lớp thông tin và cũng từ đây thuật toán sinh các ranh giới quyết định. Tiếp cận

phân loại giám sát được sử dụng phổ biến là khoảng cách tối thiểu đến trung bình và

hợp lý tối đa.

Các phương pháp phân lớp truyền thống trong xử lý ảnh viễn thám như là phương pháp hình hộp, phương pháp hợp lý tối đa vẫn được dùng trong việc phân lớp [126].

Logic mờ là lý thuyết rất mạnh mẽ. Ưu điểm lớn của lý thuyết này là nó cho phép mô tả tự nhiên, về ngôn ngữ, các vấn đề mà cần được giải quyết hơn là theo

mối quan hệ giữa các giá trị số chắc chắn. Ưu điểm này, nó có thể xử lý những hệ

thống phức tạp theo cách đơn giản, là lý do chính tại sao lý thuyết logic mờ được áp

dụng rộng rãi trong kĩ thuật. Nó cũng có thể được sử dụng để phân loại ảnh viễn

64

thám. Trong [78], Nedeljkovic đã đề xuất phương pháp phân lớp ảnh viễn thám mới

sử dụng logic mờ. Trong đó, tri thức cho trước về thông tin phổ cho các lớp phủ

nhất định được sử dụng để xây dựng tập luật mờ. Để xây dựng tập luật này, trước tiên, hai tham số trung bình và độ lệch chuẩn đươc tính từ tập dữ liệu huấn luyện

của mỗi lớp. Phương pháp được thực hiện với sự hỗ trợ của công cụ logic mờ của Matlab. Kết quả thử nghiệm của thuật toán đề xuất được so sánh với kết quả thử

nghiệm của thuật toán phân lớp hợp lý tối đa trong phần mềm ImageWorks của

PCI.

Ảnh viễn thám có nhiều kênh phổ có số lượng lớn dữ liệu về vùng đất được quan tâm [96]. Kích thước ảnh tăng lên do sự cải tiến của các cảm biến vệ tinh chụp

ảnh. Việc xử lý các ảnh này đặt ra nhiều thách thức như là việc lựa chọn các kênh

thích hợp, trích chọn các đặc trưng liên quan, phân lớp… do sự đồng nhất phổ và

không gian. Việc chỉ sử dụng thông tin phổ từ ảnh đã phổ không đầy đủ để phân

loại. Sự kết hợp cả thông tin kết cấu và không gian với thông tin phổ làm tăng độ

chính xác phân loại của hệ thống.

Các đặc trưng không gian khác nhau được trích chọn từ ảnh như là độ dài,

động rộng, PSI (Pixel Shape Index), tỉ lệ… sử dụng khái niệm về đường trực tiếp

[67]. Ma trận đồng biến cố mức xám (GLCM- Gray level co-occurrence matrix)

[75] được sử dụng chủ yếu và thành công theo một số mức, và được dùng để tìm

đặc trưng kết cấu từ ảnh LANDSAT. Trong [83], một độ đo tương tự đặc trưng mới

được giới thiệu, được biết đến là chỉ số nén thông tin cực đại (MICI- Maximum

Information Compression Index). Tiếp cận này dựa trên sự phục thuộc tuyến tính

giữa các biến và lợi ích của việc lựa độ đo này rằng nếu chúng ta xoá một đặc trưng phụ thuộc tuyến tính, dữ liệu sẽ vẫn có thể phân biệt một cách tuyến tính. Sau khi

trích chọn và lựa chọn các đặc trưng phù hợp từ anhrm các đặc trưng này được đưa

vào bộ phân loại để tiếp tục xử lý. Các tiếp cận phân loại như là KMeans [17], SVM

[117], BPNN [57][17] và PCNN được sử dụng. Trong [20], các kĩ thuật mạng Neural được trình bày và so sánh cho ảnh viễn thám.

Trong [96], ảnh đa phổ LANDSAT được sử dụng để thực nghiệm và phân tích kết quả. Đầu tiên, ảnh được phân tích thành phần chính sử dụng kĩ thuật PCA để giảm số kênh từ bảy xuống còn ba. Sau đó, các đặc trưng kết cấu và không gian

được trích chọn sử dụng GLCM và PSI. Việc tính toán đặc trưng cấu trúc sử dụng

65

hai đặc trưng này [117]. Thứ ba, đặc trưng liên quan được chọn sử dụng tiếp cận S-

Index [83]. Thứ tư, cùng với đặc trưng phổ tạo thành đầu vào cho bộ phân loại.

Ba kĩ thuật phân lớp là k-NN, BPNN và PCNN được xem xét để phân lớp sử dụng đặc trưng kết cấu, không gian và phổ [96]. Thử nghiệm thể hiện rằng tiếp cận

giám sát thực hiện tốt hơn tiếp cận không giám sát. So sánh giữa k-NN, BPNN và PCNN được thực hiện sử dụng ba đặc trưng và độ chính xác phân loại của BPNN là

cao hơn so với k-NN và PCNN.

Trong [116], tác giả đưa ra một kết hợp giữa phân rã wavelet và mạng neural

cho việc phân loại ảnh viễn thám thuộc vùng đô thị.Phân loại ảnh viễn thám đóng vai trò quan trọng trong nhiều nghiên cứu về đô thị. Nghiên cứu này trình bày một

phương pháp phân lớp ảnh toàn sắc sử dụng đặc trưng wavelet trong mạng Neural.

Một mạng Neural dựa trên cấu trúc với sự lan truyền ngược thông qua thuật toán cấu trúc (BPTS) được thực hiện cho việc phân lớp ảnh toàn sắc. Sau khi phân ra

wavelet, nội dung của đối tượng có thể được phản ánh bởi các hệ số wavelet của đối

tượng đó. Do đó, cường độ phổ của điểm ảnh và các hệ số wavelet của nó có thể

được kết hợp như các thuộc tính cho mạng Neural. Các nút của biểu diễn cây của

một đối tượng có thể được biểu diễn bởi các thuộc tính. Để chứng tỏ hiệu quả của

phương pháp đề xuất, đặc trưng thông thường cũng được sử dụng trong thử nghiệm.

2510 điểm ảnh ứng với bốn lớp được lựa chọn ngẫu nhiên như tập dữ liệu cho việc

huấn luyện mạng Neural và 19498 điểm ảnh được chọn cho việc thử nghiệm. Bốn

lớp phủ đất được phân lớp hoàn toàn sử dụng dữ liệu huấn luyện. Độ chính xác

phân lớp dựa trên tập dữ liệu thử nghiệm lên tới 99.68%, tốt hơn 10% so với việc

chỉ sử dụng tập đặc trưng thông thường. Kết quả thử nghiệm thể hiện tiếp cận đề xuất cho việc phân lớp ảnh toàn sắc hiệu quả và tin cậy hơn nhiều.

Trong [93], các tác giả cũng thử nghiệm và đánh giá phương pháp phân loại

SVM cho ảnh viễn thám.Trước đó, ứng dụng của các bộ phân lớp thống kê và mạng Neural cho ảnh viễn thám đã được xem xét. Do đó, hiệu quả, đặc trưng, ưu và khuyết điểm của các bộ phân loại đó cũng đã được biết đến, thậm chí với cả những chuyên gia viễn thám. Trong bài báo này, các tác giả trình bày ứng dụng phân lớp ảnh viễn thám với kĩ thuật nhận dạng mẫu mới được giới thiệu gần đây trong lý thuyết học máy mà được phát triển bởi Vapnik và các công sự, có tên máy vector hỗ

trợ (SVM). Các thử nghiệm được thực hện trên tập dữ liệu ảnh viễn thám, với nhấn

mạnh cụ thể các giai đoạn thiết kế và huấn luyện SVM. Kết quả thử nghiệm cho

66

thấy hiệu quả phân lớp với SVM là cao hơn so với việc phân lớp sử dụng mạng

Neural và k láng giềng gần nhất.

Trong [37], các tác giả cũng thử nghiệm và đánh giá phương pháp phân loại SVM cho ảnh viễn thám siêu phổ.Bài báo này tập trung vào vấn đề phân loại ảnh

viễn thám siêu phổ bằng máy vector hỗ trợ. Đầu tiên, các tác giả đề xuất một thảo luận mang tính lý thuyết và phân tích thực nghiệm để hiểu và đánh giá khả năng của

bộ phân lớp SVM trong không gian đặc trưng siêu chiều. Sau đó, đánh giá hiệu quả

của SVM với mối liên hệ với các tiếp cận dựa trên việc giảm đặc trưng thông

thường và hiệu năng của chúng trong các siêu không gian con với số chiều khác nhau. Để đảm bảo phân tích như vây, hiệu năng của SVM được so sánh với hiệu

năng của hai bộ phân tích phi tham số khác (ví dụ, mạng Neural hàm cơ sở radial và

bộ phân loại K láng giềng gần nhất). Cuối cùng, bài báo nghiên cứu vấn đề tiềm

năng quan trọng của việc áp dụng các SVM nhị phân để các vấn đề đa lớp trong dữ

liệu siêu phổ. Cụ thể, bốn chiến lược đa lớp khác nhau được phân tích và so sánh:

một đối với tất cả, một với một, và hai chiến lược dựa trên cây phân cấp. Các chỉ số

hiệu năng khác nhau được sử dụng để hỗ trợ cho các nghiên cứu thực nghiệm một

cách chi tiết và chính xác, ví dụ, độ chính xác phân loại, thời gian tính toán, sự ổn

định trong việc thiết lập tham số, và sự phức tạp của kiến trúc đa lớp. Kết quả thu

được trên tập dữ liệu siêu phổ ảnh hàng không cho phép kết luận rằng, bất kì chiến

lược đa lớp nào được thông qua, SVM là thay thế hợp lệ và hiệu quả cho các tiếp

cận nhận dạng mẫu thông thường (thủ tục giảm đặc trưng kết hợp với một phương

pháp phân loại) cho việc phân lớp dữ liệu viễn thám siêu phổ.

Trong [7], các tác giả nghiên cứu sử dụng ảnh viễn thám xác định sự phân bố đất than bùn ở U Minh hạ. Việc nghiên cứu ứng dụng ảnh viễn thám trong xác định

sự hiện diện của than bùn là một nghiên cứu hết sức cần thiết, nhằm đáp ứng kịp

thời cho công tác quản lý, sử dụng hợp lý nguồn tài nguyên này. Kết quả đã sử dụng

ảnh viễn thám của vệ tinh World View1 và QuickBird với 58 điểm khảo sát hiện trạng và 40 điểm khảo sát than bùn đã xác định được 6 nhóm đối tượng (lung bàu, rừng già, rừng trồng lớn, rừng trồng nhỏ, lau sậy, dớn choại), với độ chính xác toàn cục khá cao lần lượt là 94% và 95,6%. Đặc biệt đã xác định được đối tượng rừng tràm già, dớn choại có tương quan cao với sự hiện diện của than bùn; từ đó đã giải đoán và thành lập được bản đồ phân bố than bùn cho 2 ảnh theo 3 nhóm: khu vực

than bùn-rừng già, khu vực than bùn-dớnchoại và khu vực không có than bùn. Tuy

67

nhiên, dữ liệu thử nghiệm đều có độ phân giải không cao. Nhóm tác giả dự kiến tiếp

tục nghiên cứu trên các loại ảnh có độ phân giải không gian cũng như các loại ảnh

với các band phổ của các vệ tinh khác nhau trong nghiên cứu thành lập bản đồ phân bố đất than bùn cũng như các nguồn tài nguyên khác. Các tác giả sử dụng phân

Hình 1 20. Kết quả phân loại có kiểm soát ảnh World View 1, QuickBird [7].

mềm Envi để thực hiện việc hiệu chỉnh, phân lớp dữ liệu.

Trong [5], tác giả đã nghiên cứuảnh hưởng của dữ liệu huấn luyện trong các

thuật toán phân loại ảnh viễn thám thông qua việc so sánh kết quả phân loại giữa hai

bộ phân loại là MLC (Maximum Likelihood Classification) và mạng thần kinh đa lớp LNN (Layered Neural Networks).Phương pháp phânloại gần đúng nhất MLC

(Maximum Likelihood Classification) dựa trên cơ sở giả thuyết hàm mật độ xác

suất tuân theo luật phân bố chuẩn, đã được áp dụng khá phổ biến trong phân loại

ảnh viễn thám và được xem như là thuật toán chuẩn để so sánh với các thuật toán

khác. Bằng thuật toán MLC, chúng ta có thể nhận một kết quả phân loại sai lệch nếu như dữ liệu ảnh vệ tinh được tiến hành phân loại không tuân theo luật phân bố chuẩn. Để khắc phục nhược điểm của MLC, mạng thần kinh đa lớp LNN (Layered Neural Networks) đã được áp dụng và đem lại kết quả rất đáng tin cậy. Mối quan hệ lý thuyết giữa LNN và MLC đã được làm sáng tỏ bởi Wan (1990) và Ruck et al. (1990) với kết luận là giá trị xuất của LNN, khi đã được huấn luyện với bộ dữ liệu mẫu đầy đủ, được xem như là giá trị ước tính của xác suất sau trong phân loại

MLC.

68

Để khảo sát ảnh hưởng của bộ dữ liệu huấn luyện đến kết quả phân loại của 2

phương pháp, bộ ảnh quang học đa phổ được sử dụng để phân thành 7 loại [5]. Ba

bộ dữ liệu mẫu có số pixels khác nhau (1000, 1500 và 2000 pixels) được thực nghiệm trên thuật toán phân loại gần đúng nhất (MLC) và mạng neural đa lớp

(LNN).Ưu thế của từng phương pháp phân loại trên cùng bộ dữ liệu huấn luyện sẽ được đánh giá bởi ma trận sai số trong phân loại.

Trong [4], các tác giả đã trình bày chiến lược phân loại hướng đối tượng cho

ảnh viễn thám độ phân giải cao.Các kĩ thuật viễn thám đang đạt được nhiều và quan

trọng hơn trong việc phân loại lớp phủ và phân tích đô thị. Và tiếp cận phổ biến nhất của phân loại là phân loại giám sát dựa trên điểm ảnh để phân loại các kiểu lớp

phủ khác nhau. Tiếp cận phân loại giám sát dựa trên điểm ảnh đề phân loại ảnh sử

dụng đặc trưng phổ. Hiện tại, với ảnh đa phổ viễn thám độ phân giải cao, chúng ta

không thể thu được độ chính xác cao của phân loại lớp phủ nếu sử dụng tiếp cận

dựa trên điểm ảnh. Trong bài báo này, một chiến lược phân loại dựa trên đối tượng

sử dụng máy vector hỗ trợ phân cấp được giới thiệu. Bằng việc kết hợp thông tin

không gian và phổ, số lượng chồng chép giữa các lớp có thể tăng lên. Bằng cách

này, độ chính xác phân loại cao hơn và bản đồ lớp phủ đô thị càng chính xác. Lúc

đầu, ảnh được phân đoạn với kĩ thuật phân đoạn đa tỉ lệ. Các đối tượng ảnh được

phân lớp với bộ phân loại máy vector hỗ trợ phân cấp. Ngoài đặc trưng phổ, đối

tượng ảnh được trích chọn thêm các đặc trưng diện tích, entropy, chỉ số hình dạng

và đặc trưng liên quan ngữ cảnh.

69

Hình 1 21. Sơ đồ quá trình nhận dạng.

Hình 1.22. Ảnh đầu vào, kết quả phân loại dựa trên tiếp cận điểm ảnh, tiếp cận đối tượng.

Thành công của tiếp cận phân loại hướng đối tượng phụ thuộc rất nhiều và chất lượng của pha phân đoạn [4]. Ảnh thử nghiệm của nhóm tác giả vẫn là ảnh màu với kích thước nhỏ nên chưa thể hiện được vấn đề của thuật toán phân đoạn, đặc biệt là phân đoạn đa tỉ lệ (thuật toán watershed). Với ảnh kích thước lớn, độ

phân giải cao như ảnh viễn thám, tốc độ thực thi của các thuật toán phân cụm, đặc biệt là phân đoạn đa tỉ lệ [85] hay phân cụm mờ rất chậm.

70

Trong [2], các tác giả đã xây dựng phát triển phần mềm xử lý ảnh viễn thám

VNSIP trên nền phần mềm nguồn mở GRASS với nhiều tính năng: Nhập xuất, tăng

cường ảnh, phân đoạn và phân lớp ảnh...Các tác giả giới thiệu một số kết quả liên quan đến việc phát triển phần mềm xử lý ảnh viễn thám trên nền phần mềm nguồn

mở GRASS. Sau khi khảo sát, đánh giá các ưu nhược điểm chính của phần mềm GRASS, một số kỹ thuật mới về xử lý ảnh, phân lớp ảnh viễn thám được nghiên

cứu và phát triển bổ sung. Giao diện người sử dụng thuận tiện cũng đã được nghiên

cứu cài đặt. Cuối cùng, bài báo trình bày kết quả đánh giá, thử nghiệm bước đầu về

phương pháp xử lý, phân loại ảnh viễn thám và giao diện phần mềm này tiến tới khuyến cáo sử dụng sao cho phù hợp. Các kết quả nghiên cứu và thử nghiệm trình

bày trong báo cáo này được hoàn thành trong khuôn khổ thực hiện đề tài NCKH cấp

nhà nước thuộc Chương trình Khoa học và Công nghệ Vũ trụ mã số VT01/09-2009.

1.5. Phân tích, đánh giá về thành công, ưu điểm, hạn chế

Cho đến hiện tại, lĩnh vực ứng dụng viễn thám nói chung và xử lý, phân tích

ảnh viễn thám nói riêng, các nghiên cứu trên thế giới đã đạt được những thành công

to lớn từ giai đoạn thu thập ảnh với những cải tiến sâu sắc, thành tựu lớn của các vệ

tinh viễn thám ngày càng hiện đại, các vấn đề tiền dữ lý dữ liệu viễn thám cho đến

việc phân loại, phân tích ảnh viễn thám cũng như các ứng dụng hậu phân loại.

Trong nước ta, lĩnh vựcnày cũng xuất hiện từ khá sớm và hiện tại đang được quan

tâm rất lớn.

Tuy nhiên, nói riêng trong vấn đề xử lý, phân tích ảnh viễn thám vẫn còn một

 Thứ nhất, các phương pháp tăng độ tương phản áp dụng tiếp cận toàn cục để tăng cường tất cả mức độ sáng của ảnh. Ưu điểm của tiếp cận này là đơn

số vấn đề sau mà có thể cải tiến:

giản, tất cả các điểm ảnh đều có chung một chiến lược biến đổi, tăng cường.

Tuy nhiên, ảnh vệ tinh có nhiều đối tượng và các vùng khác nhau cùng với đó là các thông tin tương phản cục bộ. Nếu chỉ sử dụng tiếp cận toàn cục thường khó để tăng cường tất cả các đối tượng xuất hiện trong, bởi vì thông tin tương phản cục bộ và chi tiết có thể bị mất trong các vùng sáng và tối. Theo quan điểm của xác suất thống kê, tiếp cận toàn cục xem như toàn bộ dữ liệu ứng với một phân bố và áp dụng chung một mô hình cho mỗi phần tử. Quan điểm này là không thực tế. Do đó, đã có nhiều nghiên cứu xem dữ

71

liệu có sự tổng hợp của nhiều phân bố. Phần tử nào thuộc phân bố nào sẽ

được áp dụng mô hình ứng với phân bố đó. Ngoài ra, các phương pháp này

vẫn chọn thủ công các giá trị cho các ngưỡng cận dưới và cận trên nên không phải lúc nào cũng chọn được giá trị tốt làm ảnh hưởng đến kết quả

tăng cường ảnh.

 Thứ hai, về vấn đề phân lớp ảnh viễn thám, các kĩ thuật phân lớp thường áp dụng cho ảnh viễn thám đa phổ là không mới như các kĩ thuật đã áp dụng cho ảnh màu. Nếu như có thể cải tiến các kĩ thuật đã có và các kĩ thuật mới

đã áp dụng thành công cho ảnh màu có thể tăng cường chất lượng phân lớp

ảnh viễn thám đa phỏ. Hơn nữa, tốc độ thực thi của một số kĩ thuật phân lớp

vẫn chậm với ảnh kích thước lớn như ảnh viễn thám độ phân giải cao.

1.6. Kết luận chương I

Chương I đã trình bày tổng quan về viễn thám và xử lý ảnh viễn thám bao

gồm: trình bày tiến trình viễn thám, các đặc trưng viễn thám và khuôn dạng chung

của ảnh viễn thám và các loại ảnh vệ tinh khác nhau. Viễn thám được ứng dụng

rộng rãi trong nhiều lĩnh vực khác nhau.

Chương I cũng trình bày tổng quan về giải đoán ảnh viễn thám đa phổ. Quy

trình giải đoán ảnh viễn thám bao gồm nhiều bước như: Hiệu chỉnh ảnh, tăng cường

ảnh và giải đoán (Phân lớp ảnh). Trong đó, luận án tập trung nghiên cứu sâu về tăng

cường và giải đoán tự đoạn-phân lớp ảnh viễn thám đa phổ.

Tiếp theo, chương I đưa ra bức tranh tổng quan về tình hình nghiên cứu trong

và ngoài nước liên quan đến vấn đề tăng cường chất lượng ảnh và phân lớp ảnh viễn

thám. Cho đến hiện tại, các nghiên cứu trên thế giới đã đạt được những thành công

to lớn từ giai đoạn thu thập ảnh với những cải tiến sâu sắc, thành tựu lớn của các vệ

tinh viễn thám ngày càng hiện đại, các vấn đề hiệu chỉnh, tăng cường chất lượng dữ liệu cho đến việc phân lớp, phân tích ảnh viễn thám cũng như các ứng dụng hậu phân lớp. Trong nước ta, lĩnh vực này cũng xuất hiện từ khá sớm và hiện tại đang được quan tâm rất lớn.

Qua đây, luận án phân tích ưu điểm cũng như những mặt còn hạn chế của các phương pháp và nghiên cứu đã có, làm cơ sở để nghiên cứu sinh tìm ra các phương pháp mới, để có thể cải tiến và ứng dụng vào thực tế đem lại hiệu quả tốt hơn. Các

cải tiến của luận án được trình bày trong chương II và III.

72

CHƯƠNG II: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN TĂNG CƯỜNG ĐỘ TƯƠNG PHẢN ẢNH VIỄN THÁM ĐA PHỔ

Trong chương II, luận án trình bày một số thuật toán tăng cường độ tương

phản dựa trên logic mờ. Qua đó, phân tích những hạn chế của các thuật toán này.

Từ đây, luận án đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám mới dựa trên tiếp cận cục bộ theo cụm. Kết quả đề xuất được nghiên cứu sinh công bố trong

các bài [TRU1], [TRU2] và [TRU9].

2.1. Một số thuật toán tăng cường độ tương phản ảnh dựa trên logic mờ

2.1.1. Tăng cường ảnh mờ với toán tử tăng cường

Phương pháp này sử dụng toán tử tăng cường để giảm tính mờ của ảnh mà đưa

ra trong một sự tăng cường độ tương phản ảnh [47]. Thuật toán có thể được phát

biểu như sau:

Bước 1: Đặt các tham số Fe (Exponential fuzzifiers), Fd (Denomination

fuzzifiers), gmax (Maximum gray level) của hàm thuộc

(5) Fe= 2 và

]

Bước 2: Định nghĩa hàm thuộc

(6) ( ) [

Bước 3: Thay đổi giá trị hàm thuộc

{

[ ] [ ]

(7)

Bước 4: Sinh mức xám mới

) ))

(

) (((

(8)

2.1.2. Tăng cường ảnh mờ với toán tử Hyperbol

Ý tưởng của lược đồ tần suất hyperbol hoá, và lược đồ tần suất hyperbol hoá mờ được mô tả tương ứng trong [110]. Do nhận thức độ sáng của con người không

73

tuyến tính, thuật toán này thay đổi giá trị hàm thuộc của các mức xám bởi hàm

logarit. Thuật toán có thể được phát biểu như sau:

Bước 1: Thiết lập dạng hàm thuộc.

Bước 2: Đặt giá trị của tham số mờ β.

Bước 3: Tính các giá trị hàm thuộc μmn.

Bước 4: Thay đổi các giá trị hàm thuộc bởi β.

Bước 5: Sinh mức xám mới, như mô tả ở dưới.

Trong thuật toán này, dạng của hàm thuộc được thiết lập như tam giác để đặc trưng

mn bởi đẳng thức sau:

]

cho ranh giới, và giá trị của tham số mờ β như một ranh giới: β = - 0.75 + 1.5μ. Sau đó, bằng việc tính giá trị hàm thuộc μmn và thay đổi giá trị hàm thuộc bởi β, sinh giá trị mức xám mới g’

(

(9) ) [

2.1.1. Tăng cường ảnh mờ dựa trên phân bố xác suất

Phân bố xác suất [9] của các mức xám trong ảnh gốc có thể được đặc trưng bằng

việc sử dụng năm tham số: (α, β1, γ, β2, max). Ở đó, giá trị cường độ γ biểu diễn giá

trị trung bình của phân bố, α là cực tiểu, và max là cực đại. Mục tiêu là để giảm các

mức xám nhỏ hơn β1, và lớn hơn β2. Các mức cường độ giữa (β1, γ) và giữa (γ,

β2) được giãn theo hai hướng từ trung bình γ.

Hình 2.1. Hàm phân bố xác suất cho việc tính toán các giá trị hàm thuộc.

74

2.1.2. Cải thiện độ tương phản dựa trên luật If-Then mờ

Tiếp cận dựa trên luật mờ là phương pháp mạnh và phổ biến cho nhiều tác vụ

trong xử lý ảnh [47]. Một hệ thống dựa trên luật suy luận rất đơn giản được phát triển. Hàm mờ được mô tả trong hình 3.40.

Hình 2.2. Hàm thuộc.

Thuật toán bắt đầu với việc khởi tạo các tham số ảnh; mức xám cự đại và cực

tiểu. Sau đó bằng việc mờ hóa các mức xám (ví dụ, giá trị hàm thuộc thành tối, xám

và sáng) thiết lập các mức xám. Thủ tục suy luận đánh giá một cách thích hợp các

luật sau đây:

(1) Nếu tối thì đen

(2) Nếu xám thì xám

(3) Nếu sáng thì trắng

2.2. Hạn chế của các thuật toán tăng cường mờ

Qua phân tích về phương pháp tăng cường ảnh mờ đã có như được trình bày

 Một là, các thuật toán tăng cường mờ trên vẫn sử dụng tiếp cận toàn cục như các phương pháp truyền thống, điểm ưu việt hơn chỉ là có thêm ma trận hàm thuộc cho ảnh. Vì vậy, vẫn khó để tăng cường độ tương phản giữa các lớp phủ đất (các đối tượng che phủ mặt đất) xuất hiện trong ảnh vệ tinh, bởi

trong các mục 2.1 của luận án, luận án có một số nhận xét sau:

75

vì thông tin tương phản cục bộ và chi tiết vẫn có thể bị mất trong các vùng

 Hai là, khi cài đặt thuật toán, cụ thể trong [47], các ngưỡng cận trên max, dưới min vẫn phải chọn thủ công dựa trên lựa đồ xám. Như vậy, với mỗi

sáng và tối.

 Ba là, giống như phương pháp truyền thống, phương pháp tăng cường ảnh

ảnh khác nhau thì sẽ phải dò tìm thủ công, thiếu hiệu quả và việc chọn ngưỡng có thể không tốt.

,

,

,

,

,

,

mờ chỉ thực hiện trên một kênh phổ (ảnh đa cấp xám hay từng kênh của ảnh

đa kênh). Với ảnh đa phổ như ảnh màu RGB hay ảnh viễn thám đa phổ, thuật toán sẽ được thực hiện trên từng kênh ảnh. Giả sử ta có một điểm ảnh …). Như vậy, P với các mức xám tương ứng với các kênh là ( … có quan hệ cùng một điểm ảnh. Khi thực hiện các giá trị xám thuật toán tăng cường ảnh mờ theo từng kênh, mối quan hệ này không được …) sẽ được tăng bao hàm. Khi đó, mỗi value xám trong bộ ( cường một cách độc lập nên khó đảm bảo quan hệ phổ nêu trên giữa các giá

trị xám mới sau tăng cường. Do đó, tương quan phổ của các đối tượng trong

ảnh sau đầu ra có thể không được bảo tồn.

2.3. Một số độ đo chất lượng tăng cường ảnh

Để đánh giá chất lượng ảnh, chúng ta có thể sử dụng phương pháp trực quan hay

các chỉ số độ đo chất lượng. Để đo độ tương phản của ảnh, chúng ta có thể sử dụng

một số độ đo như sau: Shannon Entropy H, Entropy mờ FH, chỉ số tuyến tính mờ γ,

độ đo chất lượng ảnh IQM …

a. Độ đo Entropy

Shannon Entropy (hoặc entropy thông tin) là một phương pháp đo tính không chắc

chắn của thông tin. Giả sử có n sự kiện trong không gian mẫu, xác suất mỗi sự kiện là pi (i = 1, 2, …, n), mỗi pi ≥ 0, và tổng của pi được đinh nghĩa bằng 1. Do đó, một hàm H có thể được định nghĩa để đo độ không chắc chắn của không gian mẫu [56].

Với xử lý ảnh, n đưa ra bởi số mức xám. Sau đó H được mô tả như đẳng thức 18. Từ các giá trị của entropy, nó chứng tỏ rằng thông tin của ảnh là phong phú hơn khi entropy cao hơn.

(10) ∑ ( )

76

Trong đó,

L = số mức xám.

Pi = xác xuất của mức i trong histogram.

Như vậy, để tính Entropy của ảnh ta có thể phát biểu như sau:

Đầu vào: Ảnh đa cấp xám.

Đầu ra: Giá trị Entropy.

Thuật toán được mô tả như sau hình 2.3 dưới đây:

 Bước 1: Đặt L = 255, i = 0, nhập ảnh

 Bước 2: Nếu i < L sang B3, ngược lại kết thúc.

 Bước 3: Tính xác suất của mức xám i từ ảnh

 Bước 4: Cập nhật Entropy.

 Bước 5: Xuất giá trị Entropy.

b. Độ đo tính mờ và entropy mờ

Chỉ số mờ γ được định nghĩa bởi Kaufmann [47][99] và entropy mờ FH bởi

DeLuca và Termini [47]. Chỉ số mờ, ví dụ, phản ánh sự không rõ ràng trong ảnh bởi

việc đo khoảng cách giữa mặt phẳng thuộc tính mờ và mặt phẳng thông thường gần

nhất. Cả chỉ số mờ và entropy mờ đều là chỉ số đo cho sự không rõ ràng mức xám

toàn cục của ảnh. Các chỉ số này có thể được lưu ý như một độ khó trong việc quyết

định liệu một điểm ảnh nên được xem như đen (tối) hoặc trắng (sáng).

∑ (11) ∑ ( )

∑ ∑ ( ) ( ) ( ) ⁄

(12)

Trong đó,

M x N: Kích thước ảnh

: Giá trị hàm thuộc của điểm ảnh tại vị trí dòng m, cột n

Như vậy, để tính độ đo mờ của ảnh ta có thể phát biểu như sau:

77

Input: Ảnh đa cấp xám.

Ouput: Giá trị γ.

 Bước 1: Với mỗi điểm ảnh, tính giá trị độ thuộc tương ứng

 Bước 2: Cập nhật giá trị độ đo mờ

 Bước 3: Nếu vẫn còn điểm ảnh thì quay lại bước 1, ngược lại thì kết

Thuật toán tính độ đo mờ của ảnh được mô tả như sau:

thúc.

Nill và Bouzas đã đề xuất một phương pháp đo chất lượng của cảnh tự nhiên dựa

trên hệ thống trực quan con người chỉ số IQM [80].

∑ ( ) ( ) ( ) ( )

(13)

Trong đó,

M2 = kích thước ảnh.

S( 1) = tham số tỉ lệ ảnh có hướng.

W(ρ) = bộ lọc nhiễu Wiener sửa đổi.

A2(Tρ) = hàm truyền điều chế của hệ thống trực quan con người.

P(ρ, ) = phổ năng lượng ảnh chuẩn hóa độ sáng.

ρ, = tần số không gian trong hệ tọa độ cực.

Trong các công trình nghiên cứu và luận án, nghiên cứu sinh sử dụng độ đo Entropy

và độ đo tính mờ để đánh giá chất lượng của ảnh trước và sau tăng cường.

2.4. Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục bộ

Bảng 2.1. Quy trình thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ.

Các bước chính của kĩ thuật tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ (Local based Remote Sensing Image Enhancement-LoRSIE) được liệt kê trong bảng 2.1.

Giai đoạn Nhiệm vụ

78

1 Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm

2 Xây dựng mô hình hiệu chỉnh mức xám theo cụm

3 Tính ngưỡng tự động theo cụm

4 Sinh ảnh tăng cường dựa trên việc tổng hợp các mức

xám hiệu chỉnh theo từng cụm

Trong các phần 2.5 và 2.6, luận án trình bày hai thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ sử dụng các thuật toán phân cụm mờ FCM và

phân cụm rõ KMeans.

2.5. Tăng cường ảnh viễn thám sử dụng phân cụm mờ

2.5.1. Thuật toán tăng cường ảnh viễn thám sử dụng phân cụm mờ

2.5.1.1. Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm mờ

Phân cụm c-Means mờ [119] là thuật toán được dùng rộng rãi của phân lớp mờ.

Trong khi xem xét logic tập mờ, thuật toán được phát triển dựa trên phân cụm

KMeans. Trong thuật toán này, mỗi điểm ảnh không về duy nhất cụm nào và được

biểu diễn bởi nhiều thành viên của mỗi cụm.

Bài toán phân cụm mờ phát biểu như sau. Cho tập dữ liệu X gồm n đối tượng tổ chức thành c cụm thể hiện qua hàm liên thuộc mô tả mức độ đối tượng dữ liệu thuộc về cụm i với mọi :

(14) ( )

(15) ( )

∑ ∑ ( )

Thuật toán phân cụm FCM [119] được thực hiện lặp nhằm tối ưu (cực tiểu hóa) hàm mục tiêu (Jm) sau:

(16) ( )

Trong đó:

c: số cụm;

n là số pixel của ảnh;

79

là giá trị hàm thuộc của pixel thứ j và trung tâm cụm thứ i;

m là trọng số mũ, tham số mờ;

là vector thứ j;

là vector trung tâm của cụm thứ i;

( ) là khoảng cách giữa và .

Để tối ưu hóa hàm mục tiêu trong công thức (2), các trung tâm cụm và giá trị có thể được tính theo công thức sau:

∑ ( ) ∑ ( )

( ) (17)

[∑ (

( ) ) ( )

] (18) ( )

3. Thuật toán FCM như sau:

Đầu vào: Số cụm c, tham số mờ, tiêu chuẩn dừng .

Đầu ra: c cụm dữ liệu sao cho hàm mục tiêu (2) đạt giá trị tối thiểu.

Bắt đầu

Bước 1: Nhập giá trị cho 2 tham số c( ), [ ); k = 0; khởi tạo ma trận phân hoạch ( ) thỏa mãn (1a), (1b), (1c), điều kiện dừng .

Bước 2: Tại bước k:

2.1: Tính các tâm cụm ( ) theo công thức (3).

2.2: Tính ma trận thành viên cập nhật ( ) theo công thức (4).

2.3: So sánh ( ) và ( ). Nếu ‖ ( ) ( )‖ thì dừng.

Ngược lại, tăng k, quay lại 2.1.

Kết thúc.

2.5.1.2. Xây dựng mô hình biến đổi mức xám theo cụm

Trong phần này, chúng ta sẽ xây dựng hàm biến đổi mức xám để tăng cường

theo mỗi cụm. Hàm này được tạo từ công thức giãn mức xám sau đây:

80

(19)

Hàm biến đổi mức xám theo cụm được phát biểu như sau:

(20) ( )

Trong đó:

là giá trị cực tiểu

là giá trị cực đại

là cận dưới

là cận trên

là giá trị mức xám cũ

là giá trị mức xám mới

Theo cách trên, ta đã xây dựng được hàm biến đổi mức xám theo toán tử giãn

mức xám. Bằng cách tương tự, chúng ta có thể xây dựng được hàm biến đổi mức

xám cho toán tử Hyperbol, tăng cường... Trong nghiên cứu này, luận án xây dựng

hàm biến đổi cho toán tử Giãn mức xám và Hyperbol, và được phát biểu theo từng

Bảng 2.2. Các hàm biến đổi mức xám theo từng cụm.

cụm trong bảng 2.2.

Ý nghĩa Công thức biến đổi Ti(g)

) [ ( ) ] (22)

(

(21) Giãn mức xám

Trong đó:

Biến đổi Hyperbol

{

(23)

Trong đó:

81

g = giá trị xám gốc.

= cận trên của việc giãn cụm i.

= cận dưới của việc giãn cụm i.

= tâm cụm i.

Giá trị của các ngưỡng và được tính tự động theo từng cụm

như trong mục 2.4.1.3.

2.5.1.3. Tính ngưỡng tự động theo cụm

Giả sử, ( ) là hàm phân bố của mức xám theo một cụm cho trước. ( )

và các tham số: , , được thể hiện trong hình 2.1.

Các ngưỡng , được xác định bằng cách chọn sao cho vùng gạch chéo (hình 2.1) có diện tích bằng 95% tổng diện tích được bao bởi các đường

Hình 2.3. Hàm phân bố và các ngưỡng theo từng cụm.

y = 0 và y = ( ).

Ý nghĩa của việc chọn ngưỡng như trên là để vùng được chọn không bị ảnh

hưởng bởi nhiễu.

2.5.1.4. Sinh ảnh tăng cường dựa trên việc tổng hợp mức xám hiệu chỉnh theo cụm

Dựa trên mô hình biến đổi mức xám theo mỗi cụm đã xây dựng trong phần

2.5.1.2, mỗi giá trị xám đầu vào sẽ được chuyển các thành giá trị mới tương ứng với

các cụm. Nhiệm vụ còn lại là tổng hợp các giá trị này để sinh ra giá trị xám duy

nhất. Hàm tổng hợp này có dạng tổng quát như sau: g | g’ = T(g). Trong đó,

82

(24) ( ) ∑ ( )

( )

Trong đó:

g = giá trị xám gốc.

= cận trên của việc giãn cụm i.

= g cận dưới của việc giãn cụm i.

= tâm cụm i.

= giá trị độ thuộc của mức xám g theo cụm i.

2.5.2. Phát triển thuật toán LoRSIE_FCM cho ảnh đa phổ

Thuật toán LoRSIE_FCM dựa trên tiếp cận phân cụm, thực hiện tính ngưỡng

tự động, khắc phục được hạn chế 1 và 2 (nhận xét trong mục 2.2). Tuy nhiên, đối

với ảnh đa kênh, vẫn chưa rõ làm thế nào để thuật toán này có thể khắc phục được

hạn chế 3. Phát triển dưới đây sẽ cho phép giải quyết vấn đề này.

Bản chất FCM là thuật toán phân cụm các đối tượng là các vector có nhiều

thành phần. Và do vậy, FCM đã thực hiện rất tốt cho ảnh đa kênh như ảnh màu

,

,

,

,

 Bước 1: Cục bộ hóa ảnh đầu vào. Sau khi thực hiện thủ tục phân cụm, mỗi …) sẽ được đặc trưng thêm bởi một bộ các giá trị độ điểm ảnh P( thuộc ứng với các cụm khác nhau. Như vậy, quan hệ cùng một điểm ảnh …) được đặc trưng bởi bộ các giá trị độ thuộc trên. của một bộ ( Do đó, giải quyết được hạn chế thứ 3 trong mục 2.2.

 Bước 2: Xây dựng mô hình hiệu chỉnh mức xám. Vẫn thực hiện việc này

RGB. Như vậy, thuật toán trên áp dụng cho ảnh viễn thám đa phổ như sau:

được tính

 Bước 3: Tính ngưỡng tự động. Các ngưỡng

như được trình bày trong mục 2.4.1.b.

 Bước 4: Sinh ảnh tăng cường. Với mỗi điểm ảnh P, ta có:

tự động theo từng cụm và từng kênh k.

) ∑ (

)

)

(25) (

(

83

= giá trị xám gốc của điểm ảnh P thuộc kênh thứ k.

= cận trên của việc giãn cụm i thuộc kênh thứ k.

Trong đó:

,

= tâm cụm i thuộc kênh thứ k. Mỗi tâm gồm môt bộ (

,

= cận dưới của việc giãn cụm i thuộc kênh thứ k.

…)

= giá trị độ thuộc của mức xám g theo cụm i.

2.5.3. Thuật toán tăng cường ảnh viễn thám kích thước lớn

2.5.3.1. Nhược điểm của FCM với ảnh viễn thám kích thước lớn

Thuật toán phân cụm mờ [119] nảy sinh vấn đề khi gặp ảnh có kích thước rất

lớn mà cụ thể ở đây là ảnh viễn thám độ phân giải cao. Vấn đề nảy sinh từ ma trận

độ thuộc µ. Theo công thức (26), kích thước của µ được tính như sau:

(Byte)

(26)

Trong đó, c là số cụm, n là số pixel (kích thước) của ảnh. Giả sử ta có một ảnh kích thước 2048 x 2048. Ta muốn phân thành 20 cụm. Khi đó, Sizeµ là 2048 x 2048 x 20 x 8 (B) = 4 x 20 x 8 (MB) = 640 (MB). Ma trận độ thuộc được lưu trong RAM.

Như vậy, chỉ cần có RAM 1GB thì có thể lưu ma trận độ thuộc trong trường hợp này. Tuy nhiên, nếu chúng ta muốn phân thành 40 cụm thì Sizeµ là 1280 (MB) > 1024 (MB) = 1GB. Điều này nghĩa là nếu chỉ có RAM 1GB thì không đủ để chứa

các phần tử của ma trận độ thuộc. Và để thuật toán FCM có thể thực hiện ta buộc

phải tăng RAM.

Nếu ảnh có kích thước 16000 x 16000, số lớp c = 20, Sizeµ là 16000 x 16000 x 20 x 8 (B) = 39062.5 (MB) ≈ 39 (GB). Chúng ta thấy, với ảnh kích thước và số lớp như trên thì kể cả bộ nhớ RAM lớn nhất hiện nay cho máy tính cá nhân cũng không thể chứa dẫn tới FCM không thể thực thi nếu ma trận độ thuộc được lưu trên RAM. Chúng ta có thể nghĩ đến việc dùng đĩa cứng để lưu ma trận này thay vì dung RAM. Tuy nhiên, khi đó ngay cả với ảnh màu thông thường thì thời gian thực hiện của

FCM là rất chậm. Với ảnh viễn thám, thời gian này có thể lên tới đơn vị ngày. Như

84

vậy là không hiệu quả. Tất cả điều này đã giải thích nguyên nhân vì sao FCM [119]

gặp vấn đề với ảnh kích thước rất lớn mà cụ thể là ảnh viễn thám.

Có hai cách để khắc phục vấn đề này. Một là, có thể áp dụng kĩ thuật wavelet. Hai là, cải tiến trực tiếp thuật toán phân cụm mờ để khắc phục hạn chế này. Phương

án sử dụng kĩ thuật wavelet được trình bày dưới đây. Phương án cải tiến thuật toán phân cụm mờ được trình bày trong mục 3.2.3 trong chương III.

2.5.3.2. Thuật toán tăng cường ảnh viễn thám kích thước lớn

Trong phần này, luận án đề xuất thuật toán tăng cường ảnh viễn thám kích

thước lớn mà luận án tạm gọi là Large Size Remote Sensing Image Enhancement Using FCM (LaSRSIE_FCM). Thuật toán được mô tả như sau:

Đầu vào: Ảnh gốc

Đầu ra: Ảnh tăng cường

Bắt đầu

 Bước 1: Biến đổi Wavelet DWT.

 Bước 2: Tăng cường ảnh cực tiểu lựa chọn với thuật toán LoRSIE_FCM.

 Bước 3: Biến đổi Wavelet ngược IDWT với ảnh cực tiểu sau tăng cường.

Kết thúc.

Theo như mô tả trên, thuật toán được thực hiện như sau. Đầu tiên, ảnh đầu vào

được giảm kích thước sử dụng biến đổi Wavelet thuận đến kích thước đủ nhỏ được

ảnh xấp xỉ cực tiểu lựa chọn. Thực hiện tăng cường ảnh xấp xỉ cực tiểu lựa chọn

này sử dụng thuật toán LoRSIE. Tiếp đó, thay ảnh xấp xỉ cực tiểu bằng ảnh xấp xỉ

đã tăng cường và thực hiện biến đổi ngược sử dụng biến đổi Wavelet nghịch để thu

được ảnh tăng cường ứng với ảnh gốc.

2.5.5. Thử nghiệm và đánh giá

2.5.5.1. Quy trình thử nghiệm

Luận án tiến hành thử nghiệm thuật toán tăng cường ảnh đề xuất và so sánh với kết quả của phương pháp tăng cường mờ. Giả sử ảnh đầu vào có kích thước M x N điểm ảnh. Nhóm tác giả thực hiện phân rã Wavelet trên ảnh xấp xỉ cho đến khi

ảnh xấp xỉ có kích thước không lớn hơn 512 x 512.

85

Môi trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Ghz, RAM 2G, hệ

điều hành Windows 7.

Quá trình thử nghiệm gồm 2 bước:

 Bước 1: Thực hiện tăng cường ảnh đầu vào.

 Bước 2: Đánh giá chất lượng ảnh tăng cường và ảnh đầu vào.

Để đánh giá, luận án sử dụng phương pháp trực quan và đánh giá thông qua

chỉ số tuyến tính mờ γ [47][99] như đã mô tả trong mục 2.4.4.

2.5.5.2. Tập dữ liệu thử nghiệm

Tập dữ liệu phục vụ cho thử nghiệm gồm ba loại. Một là, loại ảnh LANDSAT

ETM+ chụp khu vực Hòa Bình ngày 15/02/2001, bao gồm 11 ảnh ranh giới từng

huyện và một ảnh theo ranh giới tỉnh của tỉnh Hòa Bình. Ảnh LANDSAT ETM+

gồm 7 kênh: Chàm, Lục, Đỏ, Cận hồng ngoại, Hồng ngoại trung, Hồng ngoại nhiệt,

Hồng ngoại trung. Hai là, loại ảnh SPOT 5, gồm 4 kênh phổ: Lục (độ phân giải

10m), Đỏ (độ phân giải 10m), Cận hồng ngoại (độ phân giải 10m), Hồng ngoại

trung (độ phân giải 20m), chụp khu vực Hòa Bình và Sơn La với 21 ảnh chụp ngày 22/12/2003 và 14 ảnh chụp năm 2008. Hai loại ảnh này, nhóm tác giả có được khi

tham gia thực hiện đề tài “Phát triển phần mềm xử lý ảnh viễn thám trên nền phần

mềm GRASS’. Đây là đề tài cấp nhà nước, thuộc Chương trình KHCN Vũ Trụ. Dữ

liệu này mới chỉ hiệu chỉnh về mặt hình học theo vệ tinh chụp, chưa có hiệu chỉnh

bức xạ nên về cơ bản là dữ liệu gốc, chưa có tiền xử lý biến đổi ảnh. Ba là, loại ảnh

Quickbird, gồm 4 kênh: Lam, Lục, Đỏ, và cận hồng ngoại, được tải từ dữ liệu mẫu

trên trang http://opticks.org. Do khuôn khổ bài báo có hạn, nhóm tác giả trình việc

thử nghiệm với ba mẫu ảnh đầu vào khác nhau. Ảnh hiển thị minh họa trong thử

nghiệm với SPOT lấy tổ hợp màu: Lục, Đỏ, Cận hồng ngoại. Ảnh hiển thị minh họa

trong thử nghiệm với QuickBird lấy tổ hợp màu tự nhiên, gồm các kênh Blue, Green, Red.

2.5.5.3. Thử nghiệm

a. Thử nghiệm 1

Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Kim

Bảng 2.3. Tăng cường ảnh với phương pháp mờ và cải tiến.

Bôi có kích thước 1581 x 1527 (điểm ảnh).

86

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn FCM

Hyperbol FCM

Bảng 2.3 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương

pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng

cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương

pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

Trong bảng 2.4, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.4. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ

Tăng cường mờ Giãn FCM Hyperbol FCM

1

0.38

0.43

0.27

0.30

2

0.31

0.45

0.24

0.26

3

0.38

0.39

0.34

0.36

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

Bảng 2.5 thống kê thời gian thực thi trung bình (với năm lần chạy) của các

thuật toán tăng cường. Chúng ta thấy, thời gian thực thi của các thuật toán LoRSIE

là chậm hơn rất nhiều so với các thuật toán dựa trên logic mờ. Điều nay là dễ hiểu vì các thuật toán LoRSIE trước khi thực hiện việc tăng cường đều phải thực hiện thuật toán phân cụm mờ. Thuật toán phân cụm mờ có tốc độ khá chậm đặc biệt với ảnh kích thước lớn như viễn thám. Tuy nhiên, với hai mức biến đổi Wavelet, tốc độ thực thi của thuật toán LaSRSIE đã thay đổi đáng kể so với LoRSIE.

87

Bảng 2.5: Thời gian thực thi.

Thuật toán

Thời gian

Hyperbol mờ

2485

Tăng cường mờ

2281

Giãn FCM

LoRSIE

1028756

LaSRSIE -2 Level

57764

LoRSIE

1027408

Hyperbol FCM

LaSRSIE -2 Level

57724

b. Thử nghiệm 2

Trong thử nghiệm 2, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lạc

Bảng 2.6. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Giãn FCM

Hyperbol FCM

Tăng cường mờ

Thủy thuộc tỉnh Hoà Bình có kích thước 1733 x 1747.

Bảng 2.6 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

88

Trong bảng 2.7, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.7. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ Tăng cường mờ Giãn FCM Hyperbol FCM

1

0.28

0.28

0.12

0.15

2

0.27

0.30

0.07

0.09

3

0.27

0.28

0.19

0.23

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

c. Thử nghiệm 3

Trong thử nghiệm 3, ảnh gốc là ảnh vệ tinh LANDSAT khu vực thị xã Hòa

Bình thuộc tỉnh Hoà Bình có kích thước 1512 x 2592.

Bảng 2.8 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương

pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của luận án

với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng

cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương

Bảng 2.8. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn FCM

Hyperbol FCM

pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

Trong bảng 2.9, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ. Tuy nhiên, độ tương

89

phản về mặt chỉ số không cao hơn nhiều so với phương pháp mờ. Điều này cho thấy

Bảng 2.9. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh

Hyperbol mờ

Tăng cường mờ Giãn FCM Hyperbol FCM

1

0.28

0.29

0.25

0.28

2

0.29

0.35

0.21

0.22

3

0.30

0.32

0.29

0.30

phương pháp mờ cho kết quả tốt với mẫu thử nghiệm này.

d. Thử nghiệm 4

Trong thử nghiệm 4, ảnh gốc là ảnh vệ tinh SPOT có kích thước 1951 x 1951.

Bảng 2.10 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng

phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của

luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau

tăng cường sử dụng toán tử tăng cường mờ chỉ cải thiện một phần độ tương phản.

Trong khi đó, kết quả của toán tử Hyp mờ và các toán tử của phương pháp cải tiến

Bảng 2.10. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn FCM

Hyperbol FCM

cho ảnh tương phản rõ rệt và sáng hơn rất nhiều.

Trong bảng 2.11, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

90

Bảng 2.11. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh

Hyperbol mờ

Tăng cường mờ

Giãn FCM

Hyperbol FCM

0.72

0.60

0.20

0.33

1

0.87

0.84

0.33

0.51

2

0.85

0.81

0.22

0.41

3

Bảng 2.12 thống kê thời gian thực thi trung bình (với năm lần chạy) của các thuật toán tăng cường. Chúng ta thấy, thời gian thực thi của các thuật toán LoRSIE

là chậm hơn rất nhiều so với các thuật toán dựa trên logic mờ. Điều nay là dễ hiểu

vì các thuật toán LoRSIE trước khi thực hiện việc tăng cường đều phải thực hiện

thuật toán phân cụm mờ. Thuật toán phân cụm mờ có tốc độ khá chậm đặc biệt với

ảnh kích thước lớn như viễn thám. Tuy nhiên, với hai mức biến đổi Wavelet, tốc độ

Bảng 2.12. Thời gian thực thi.

thực thi của thuật toán LaSRSIE đã thay đổi đáng kể so với LoRSIE.

Thuật toán

Thời gian

Hyperbol mờ

25188

Tăng cường mờ

25414

Giãn FCM

LoRSIE

2005436

LaSRSIE-2 Level 152671

LoRSIE

2005443

Hyperbol FCM

LaSRSIE-2 Level 152484

e. Thử nghiệm 5

Trong thử nghiệm 5, ảnh gốc là ảnh vệ tinh Quickbird có kích thước 1904 x

1922.

Bảng 2.13 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng cường sử dụng các toán tử theo phương pháp mờ chỉ cải thiện một phần độ

91

tương phản. Trong khi đó, kết quả của toán tử Hyp mờ và các toán tử của phương

Bảng 2.13. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn FCM

Hyperbol FCM

pháp cải tiến cho ảnh tương phản và sáng hơn rất nhiều.

Trong bảng 2.14, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.14. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ

Tăng cường mờ Giãn FCM Hyperbol FCM

1

0.72

0.60

0.20

0.33

2

0.87

0.84

0.33

0.51

3

0.85

0.81

0.22

0.41

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

Bảng 2.15 thống kê thời gian thực thi trung bình (với năm lần chạy) của các

thuật toán tăng cường. Chúng ta thấy, thời gian thực thi của các thuật toán LoRSIE

là chậm hơn rất nhiều so với các thuật toán dựa trên logic mờ. Điều nay là dễ hiểu

vì các thuật toán LoRSIE trước khi thực hiện việc tăng cường đều phải thực hiện thuật toán phân cụm mờ. Thuật toán phân cụm mờ có tốc độ khá chậm đặc biệt với ảnh kích thước lớn như viễn thám. Tuy nhiên, với hai mức biến đổi Wavelet, tốc độ thực thi của thuật toán LaSRSIE đã thay đổi đáng kể so với LoRSIE.

92

Bảng 2.15. Thời gian thực thi.

Thuật toán

Thời gian

Hyperbol mờ

22406

Tăng cường mờ

22922

Giãn FCM

LoRSIE

2595006

LaSRSIE-2 Level

184158

LoRSIE

2592406

Hyperbol FCM

LaSRSIE-2 Level

184127

2.6. Tăng cường ảnh viễn thám sử dụng phân cụm KMeans

2.6.1. Thuật toán tăng cường ảnh viễn thám sử dụng thuật toán phân cụm

KMeans

2.6.1.1. Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm KMeans

Thuật toán kMeans [128] bao gồm 4 bước, được trình bày như sau:

Đầu vào: n đối tượng xi với i = 1..n và số cụm c

Đầu ra: Các cụm Cj (j = 1..c) sao cho hàm mục tiêu E sau đây đạt cực tiểu:

∑ (27) ∑ ( )

Bước 1: Khởi tạo

Chọn k đối tượng Cj (j=1..c) là tâm ban đầu của c cụm dữ liệu đầu vào (lựa

chọn ngẫu nhiên hoặc theo kinh nghiệm).

Bước 2: Gán tâm cụm theo khoảng cách

Với mỗi đối tượng xi (i = 1..n), tính khoảng cách của nó tới mỗi tâm Cj với j = 1..c. Đối tượng thuộc về cụm CS mà khoảng cách từ tâm CS tương ứng đến đối tượng đó là nhỏ nhất.

( ) ( ) (28)

Bước 3: Cập nhật tâm cụm

Đối với mỗi j = 1..c, cập nhật lại tâm cụm Cj bằng cách xác định trung bình

cộng của các vector đối tượng dữ liệu đã được gán về cụm.

93

( )

( ( ))

(29)

Bước 4: Lặp và kiểm tra điều kiện dừng

Lặp lại các bước 2 và 3 cho đến khi các tâm cụm không thay đổi giữa hai

lần lặp liên tiếp.

Trong đó:

 ( ): khoảng cách từ x đến tâm Cj

 : thành phần thứ k của tâm cụm Cj

 : thành phần thứ k của đối tượng x

2.6.1.2. Xây dựng mô hình biến đổi mức xám theo cụm

Trong phần này, chúng ta sẽ xây dựng hàm biến đổi mức xám để tăng cường

theo mỗi cụm. Hàm này được tạo từ công thức giãn mức xám sau đây:

(30)

Hàm biến đổi mức xám theo cụm được phát biểu như sau:

(31) ( )

Trong đó:

là giá trị cực tiểu

là giá trị cực đại

là cận dưới

là cận trên

là giá trị mức xám cũ

là giá trị mức xám mới

Theo cách trên, ta đã xây dựng được hàm biến đổi mức xám theo toán tử giãn

mức xám. Bằng cách tương tự, chúng ta có thể xây dựng được hàm biến đổi mức xám cho toán tử Hyperbol, tăng cường... Trong nghiên cứu này, luận án xây dựng hàm biến đổi cho toán tử Giãn mức xám và Hyperbol, và được phát biểu theo từng cụm trong bảng 2.16.

94

Bảng 2.16. Các hàm biến đổi mức xám theo từng cụm.

Ý nghĩa Công thức biến đổi T(g)

(32) Giãn mức xám

) [ ( ) ] (33)

(

Trong đó:

Biến đổi

Hyperbol

{

(34)

Trong đó:

g = giá trị xám gốc.

= cận trên của việc giãn cụm .

= cận dưới của việc giãn cụm .

= tâm cụm.

Giá trị của các ngưỡng và được tính tự động theo từng cụm

như trong mục c dưới đây.

2.6.1.3. Tính ngưỡng tự động theo cụm

Giả sử, ( ) là hàm phân bố của mức xám theo một cụm cho trước. ( )

và các tham số: , , được thể hiện trong hình 2.4.

Các ngưỡng , được xác định bằng cách chọn sao cho vùng gạch chéo (hình 2.4) có diện tích bằng 95% tổng diện tích được bao bởi các đường

y = 0 và y = ( ).

95

Hình 2.4. Hàm phân bố và các ngưỡng theo từng cụm.

2.6.1.4. Sinh ảnh tăng cường dựa trên việc tổng hợp mức xám hiệu chỉnh theo

cụm

Dựa trên mô hình biến đổi mức xám theo mỗi cụm đã xây dựng trong mụcb,

mỗi giá trị xám đầu vào sẽ được chuyển các thành giá trị mới tương ứng với các

cụm. Nhiệm vụ còn lại là tổng hợp các giá trị này để sinh ra giá trị xám duy nhất.

Hàm tổng hợp này có dạng tổng quát như sau: g | g’ = T(g). Trong đó,

(35) ( ) ( )

( )

Trong đó:

g = giá trị xám gốc.

= cận trên của việc giãn cụm V.

= g cận dưới của việc giãn cụm V.

= tâm cụm.

2.6.2. Phát triển thuật toán cho ảnh đa phổ

,

,

 Bước 1: Cục bộ hóa ảnh đầu vào. Sau khi thực hiện thủ tục phân cụm, mỗi …) sẽ được đặc trưng thêm bởi một bộ các giá trị độ điểm ảnh P( thuộc ứng với các cụm khác nhau. Như vậy, quan hệ cùng một điểm ảnh

Bản chất KMeans là thuật toán phân cụm các đối tượng là các vector có nhiều thành phần. Và do vậy, KMeans đã thực hiện rất tốt cho ảnh đa kênh như ảnh màu RGB. Như vậy, thuật toán trên áp dụng cho ảnh viễn thám đa phổ như sau:

96

…) được đặc trưng bởi bộ các giá trị độ thuộc trên.

,

,

 Bước 2: Xây dựng mô hình hiệu chỉnh mức xám. Vẫn thực hiện việc này

của một bộ ( Do đó, giải quyết được hạn chế thứ 3 trong mục 2.2.

được tính tự

 Bước 3: Tính ngưỡng tự động. Các ngưỡng

như được trình bày trong mục 2.5.1.b.

 Bước 4: Sinh ảnh tăng cường. Với mỗi điểm ảnh P, ta có:

động theo từng cụm và từng kênh k.

)

) (

)

(36) (

(

= giá trị xám gốc của điểm ảnh P thuộc kênh thứ k.

= cận trên của việc giãn cụm thuộc kênh thứ k.

Trong đó:

= cận dưới của việc giãn cụm thuộc kênh thứ k.

= tâm cụm. Mỗi tâm gồm môt bộ ( , , …)

2.6.3. Thử nghiệm và đánh giá

2.6.3.1. Quy trình thử nghiệm

Luận án tiến hành thử nghiệm thuật toán tăng cường ảnh đề xuất và so sánh

với kết quả của phương pháp tăng cường mờ. Quá trình thử nghiệm thuật toán

LoRSIE_KM tượng tự như được mô tả trong mục 2.5.5.1.

Môi trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Ghz, RAM 2G, hệ

điều hành Windows 7.

Để đánh giá, luận án sử dụng phương pháp trực quan và đánh giá thông qua chỉ số tuyến tính mờ γ [47][99] như đã mô tả trong mục 2.4.4. Tập dữ liệu thử nghiệm như được trình bày trong mục 2.4.5.2.

2.6.3.2. Thử nghiệm

a. Thử nghiệm 1

Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lac

Son, tỉnh Hoà Bình.

97

Bảng 2.17. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn KM

Hyperbol KM

Bảng 2.17 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng

phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của

luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau

tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không

được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương

pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

Trong bảng 2.18, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.18. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ Tăng cường mờ

Giãn KM

Hyperbol KM

1

0.34

0.43

0.18

0.12

2

0.29

0.43

0.21

0.17

3

0.35

0.40

0.24

0.20

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

b. Thử nghiệm 2

Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lạc

Thuỷ, tỉnh Hoà Bình.

98

Bảng 2.19. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn KM

Hyperbol KM

Bảng 2.19 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của

luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau

tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương

pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

Trong bảng 2.20, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.20. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ Tăng cường mờ

Giãn KM

Hyperbol KM

1

0.28

0.28

0.16

0.11

2

0.27

0.30

0.15

0.11

3

0.27

0.28

0.17

0.14

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

c. Thử nghiệm 3

Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh SPOT.

99

Bảng 2.21. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn KM

Hyperbol KM

Bảng 2.21 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của

luận với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng

cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương

pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

Trong bảng 2.22, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.22. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ Tăng cường mờ

Giãn KM

Hyperbol KM

1

0.20

0.50

0.13

0.08

2

0.43

0.36

0.32

0.27

3

0.39

0.49

0.33

0.22

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

d. Thử nghiệm 4

Trong thử nghiệm 4, ảnh gốc là ảnh vệ tinh Quickbird.

100

Bảng 2.23. Tăng cường ảnh với phương pháp mờ và cải tiến.

Đầu vào

Hyperbol mờ

Tăng cường mờ

Giãn KM

Hyperbol KM

Bảng 2.23 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng

phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của

luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau

tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương

pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.

Trong bảng 2.24, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi

phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương

Bảng 2.24. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.

Kênh Hyperbol mờ

Tăng cường mờ

Giãn KM

Hyperbol KM

1

0.72

0.60

0.24

0.18

2

0.87

0.84

0.26

0.22

3

0.85

0.81

0.32

0.27

pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.

2.7. Kết luận chương II

Đầu tiên, luận án đã trình bày một số toán tử tăng cường mờ. Qua đó, luận án

phân tích một số hạn chế của tiếp cận tăng cường độ tương phản ảnh dựa trên logic mờ.

Từ việc phân tích hạn chế của phương pháp tăng cường ảnh mờ, luận án trình bày đề xuất các giải pháp tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ LoRSIE. LoRSIE được chia thành bốn giai đoạn. Thứ nhất, ảnh được cục bộ hóa bởi thuật toán phân cụm mờ. Thứ hai, tính tự động các ngưỡng theo mỗi cụm. Thứ

ba, hiệu chỉnh các công thức biến đổi mức xám để phù hợp cho việc biến đổi theo

101

cụm. Giai đoạn cuối cùng là sinh ảnh tăng cường qua việc tổng hợp mức xám mới

từ các cụm theo công thức biến đổi mức xám đã hiệu chỉnh.

LoRSIE được thể hiện qua hai thuật toán tăng cường sử dụng thuật toán phân cụm KMeans và FCM. Hai thuật toán này cũng được hiệu chỉnh để áp dụng cho ảnh

đa phổ.

Thuật toán tăng cường sử dụng FCM gặp vấn đề với ảnh kích thước lớn nên

được cải tiến để phát triển thành thuật toán LaRSIE_FCM. Kết quả thử nghiệm cho

thấy phương pháp cải tiến cho chất lượng ảnh tăng cường cao hơn so với phương

pháp tăng cường dựa trên logic đã có và thực hiện tốt trên ảnh viễn thám kích thước lớn. Ngoài ra, với những ảnh viễn thám kích thước trung bình, thuật toán LaRSIE

giúp cải thiện tốc độ thực thi so với thuật toán LoRSIE. Tuy nhiên, tốc độ thực thi

của các thuật toán dựa trên tiếp cận cục bộ còn chậm. Ngay cả các thuật toán LaRSIE, dù đã cải thiện tốc độ so với LoRSIE nhưng vẫn còn chậm so với các thuật

toán dựa trên logic mờ. Trong nghiên cứu tiếp theo, luận dự kiến sẽ nghiên cứu giải

pháp tăng tốc độ thuật toán phân cụm mờ để tăng tốc độ thực thi cho thuật toán

LoRSIE.

Tăng cường ảnh là một trong những khâu tiền xử lý quan trọng để hỗ trợ cho

việc giải đoán ảnh viễn thám, đặc biệt trong đoán đọc điều vẽ bằng mắt. Một số cải

tiến trong giai đoạn giải đoán ảnh viễn thám đa phổ được trình bày trong chương

tiếp theo.

102

CHƯƠNG III: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN

PHÂN LỚP ẢNH VIỄN THÁM ĐA PHỔ

Trong chương III, luận án trình bày các thuật toán CCEA_KMeans và 2D-

KMeans trong hai nghiên cứu gần đây. Tiếp đó, luận án phân tích hạn chế của thuật

toán KMeans. Từ đây, luận án trình bày các đề xuất mới dựa trên thuật toán KMeans và so sánh kết quả với CCEA_KMeans và 2D-KMeans. Kết quả này đã

được nghiên cứu sinh công bố trong [TRU3], [TRU4], [TRU5], [TRU6], [TRU7] và

[TRU8].

3.1. Phân cụm ảnh viễn thám với thuật toán KMeans

3.1.1. Thuật toán KMeans

Thuật toán KMeans đã được trình bày trong mục 2.6.1.1.

3.1.2. Thuật toán CCEA_KMeans

Trong [26], các tác giả đề xuất thuật toán khởi tạo tâm CCEA để tăng tốc độ

thuật toán KMeans mờ. Thuật toán được trình bày như sau:

Đầu vào:

 Tập S gồm N đối tượng xi với i = 1..N

 M số tập con SBl (l = 1..M) của S

 f để xác định kích thước tập con SBl của S (f < 1)

Đầu ra: Các cụm Cj (j = 1..c)

Các bước thuật toán như sau:

Bước 1: Chọn ngẫu nhiên M tập con SBl có kích thước fN từ tập dữ liệu S

sao cho SBi SBj = Ø (i ≠ j), trong đó f < 1. Đặt SU = SBl và p = 0.

Bước 2: Cho tập tâm cụm khởi đầu SCp = {Cj} và tập dữ liệu SU, sử dụng

CDFKM để xác định tập các tâm cụm SCp+1 = {Cj}.

Bước 3: Cập nhật p = p + 1 và đặt SU = SU SBp+1. Nếu p ≤ M, quay lại

bước 2.

Bước 4: SCM là tập tâm cụm khởi tạo.

103

Bước 5: Phân cụm tập S với tập tâm SCM

Nếu áp dụng CCEA cho KMeans thì trong bước 2 chỉ cần thay CDFKM bằng

KMeans ta được CCEA_KMeans.

3.1.3. Thuật toán 2D-KMeans

Trong [52], các tác giả trình bày thuật toán 2D-KMeans. Điểm khác biệt giữa

KMeans và 2D-KMeans là:

 Với KMeans, mỗi đối tượng x là một vector với các thành phần là cường độ của đối tượng tương ứng: xINT. Như vậy, mỗi tâm là một vector trung bình cường độ theo cụm: CINT.

 Với 2D-KMeans, mỗi đối tượng x gồm một cặp 2 vector: vector với các thành phần cường độ xINT và vector trung vị cục bộ xMED (công thức 18). Như vậy, mỗi tâm C gồm một cặp 2 vector: vector trung bình cường độ theo cụm: CINT và vector trung bình trung vị theo cụm: CMED (công thức 19).

(37) ( )

[(∑ (38) ) (∑ )]

3.1.4. Hạn chế của thuật toán KMeans

Thuật toán KMeans dù phân cụm ảnh viễn thám rất hiệu quả vẫn còn hai điểm

hạn chế:

Hạn chế 1: Tốc độ thực thi với ảnh kích thước lớn như ảnh viễn thám còn

chậm.

Trong bảng 1, trong bước 1, việc tâm cụm được khởi tạo ngẫu nhiên ảnh hưởng đến tốc độ thuật toán. Trong một lần thực thi thuật toán, nếu các tâm chọn ngẫu nhiên tốt, giả sử gần với vị trí các tâm sau khi hội tụ, khi này thời gian thực thi còn lại sẽ không nhiều. Tuy nhiên, nếu các tâm chọn ngẫu nhiên không tốt, chẳng hạn các tâm rất gần nhau, khi này, sẽ mất rất nhiều thời gian để xác định các tâm sau hội tụ vì số lần lặp sẽ rất lớn. Đây chính là lý do mà các nhà nghiên cứu tìm cách sao cho tâm cụm khởi tạo được tốt nhất.

104

Hạn chế 2: Không bao gồm thông tin ngữ cảnh – lân cận của mỗi điểm ảnh

[52].

Như trong nhiều kĩ thuật xử lý ảnh (ví dụ như lọc, tăng cường độ tương phản …) đặc trưng của điểm ảnh thường quan hệ với sự ảnh hưởng của các điểm lân cận.

Bằng cách bỏ đi hành vi quan hệ này, nhất định lượng thông tin ảnh bị mất trong quá trình xử lý. Do đó, thường trong việc phân đoạn ảnh bằng việc sử dụng phân

cụm một chiều thông thường các hạn chế sau đây được quan sát:

 Các điểm ảnh nhiễu được xem như một đặc trưng độc lập, được gán sai

đến cụm, và lưu lại có thể nhìn thấy sau quá trình phân cụm.

 Bằng cách loại bỏ các ảnh hưởng quan hệ của các tham số không gian của

một điểm ảnh, có khả năng thông tin trong ảnh bị mất.

Hiệu năng có thể suy giảm nhanh chóng khi tương tác không gian giữa các

điểm ảnh trở nên chủ yếu hơn các giá trị mức xám [52].

3.1.5. Một số độ đo chất lượng phân cụm ảnh

Để đánh giá chất lượng phân cụm, chúng ta có thể sử dụng chỉ số F(I), F’(I) ... Chỉ số này tuân theo các tiêu chí về sự đồng nhất cụm [52]. Chỉ số này được tính

như sau:

( )

(39) ( ) √ ∑

( )

√∑ (40) ( ) [ ( )] ∑

Trong đó, I là ảnh phân đoạn, là kích thước ảnh, R là số vùng trong ảnh phân cụm, là diện tích điểm ảnh vùng thứ i, và là lỗi màu vùng i (tổng khoảng cách Euclide giữa các vector màu mức xám của các điểm ảnh của vùng thứ i và vector màu qui cho vùng i trong ảnh phân đoạn), R(A) là số vùng có diện tích bằng A, và Max là diện tích của vùng lớn nhất trong ảnh phân đoạn. F(I) càng nhỏ thì tính đồng nhất cụm càng cao tức là chất lượng phân cụm càng tốt.

3.1.6. Đề xuất thuật toán WIKMeans

3.1.6.1. Trình bày thuật toán WIKMeans

Để khăc phục hạn chế (1), trong mục này, luận án để xuất thuật toán phân cụm

KMeans cải tiến với việc khởi tạo tâm cụm sử dụng kĩ thuật Wavelet. Biến đổi

105

Wavelet được sử dụng để giảm kích thước ảnh. Ảnh cực tiểu của biến đổi Wavelet

được sử dụng để tiến hành phân cụm và sinh tập tâm khởi tạo.

Đầu vào: Ảnh gốc.

Đầu ra: Ảnh phân đoạn cuối cùng.

Thuật toán được mô tả như sau:

B1: Biến đổi Wavelet

Biến đổi sóng nhỏ (Wavelet) là công cụ toán học hay được sử dụng vào việc

biểu diễn ảnh đa độ phân giải. Sau khi thực hiện phép biến đổi ta thu được tập hệ số

Wavelet, là hàm co dãn và vị trí của sóng nhỏ.

Với tín hiệu số như ảnh viễn thám, thì tập hệ số Wavelet có thể thu được nhờ

phép biến đổi sóng nhỏ rời rạc (Discrete Wavelet Transform- DWT). Với phần lớn

ảnh số thì nội dung tần số thấp là quan trọng nhất, giữ được hầu như các đặc tính

của ảnh đầu vào của phép biến đầu với kích thước giảm bốn lần. Sau khi áp dụng bộ lọc thông thấp theo hai hướng (LL) ta thu được ảnh xấp xỉ (cA1) của ảnh gốc. Nếu áp dụng bộ lọc thông thấp cho chiều ngang và bộ lọc thông cao cho chiều dọc ảnh (LH) ta có tập hệ số ngang (cH1) của ảnh gốc. Tương tự ta có tập hệ số dọc (cV1) và tập hệ số chéo (cD1). Lặp tiến trình trên băng con (LL) để sinh ra các hệ số ở mức 2 tiếp theo. Hình 3.41 mô tả DWT ảnh theo thuật toán hình kim tự tháp của Mallat

Hình 3.1. Biến đổi ảnh với Wavelet.

[124].

Vậy, ảnh gốc S được biểu diễn trên cơ sở các hệ số biến đổi sóng con của nó

như sau:

(41)

106

Thực hiện lặp tiến trình cho đến khi mức độ chi tiết là mẫu hay pixel. Tại mức

J, ảnh gốc được biểu diễn bởi:

(42)

Các hệ số xấp xỉ được tính toán như sau:

( ) (43)

Mỗi lần thực hiện phân rã wavelet, kích thước của ảnh xấp xỉ cAj giảm đi bốn

lần so với lần thực hiện trước đó (mỗi chiều giảm xuống một nửa). Như vậy, giả sử

chúng ta phân rã 3 mức cho ảnh đầu vào, ta thu được ảnh xấp xỉ có kích thước giảm xuống 64 lần. Hình 3.42 minh họa cây phân cấp cho phân ra wavelet nhiều mức.

Hình 3 2. Cây phân cấp cho phân rã nhiều mức.

Hình 3.43 minh họa về ảnh đầu vào và kết quả phân rã.

Hình 3.3. Ảnh đầu vào kết quả phân rã ảnh viễn thám đa phổ.

B2: Phân cụm KMeans ảnh cực tiểu

107

Tiến hành phân cụm ảnh xấp xỉ cực tiểu lựa chọn với thuật toán

KMeans. Sau khi đã phân cụm tất cả các ô, ta được tập tâm cụm như sau:

(44) VInit = {vj: 1 ≤ j ≤k}

B3: Phân cụm ảnh gốc

Sử dụng KMeans để thực hiện phân cụm ảnh gốc với tập tâm khởi tạo

thu được trong B2 ở trên.

Nhận xét:

Lúc đầu, do thuật toán WIKMeans không thực thi trực tiếp trên ảnh gốc mà

trên ảnh kích thước nhỏ hơn nên sẽ thu được tập tâm khởi tạo rất nhanh và càng nhanh nếu mức rã càng nhiều. Hơn nữa, ảnh cực tiểu lựa chọn là ảnh xấp xỉ của ảnh

ban đầu nên gần như giữa nguyên được các đặc trưng trên ảnh gốc, khác biệt chính

là về kích thước và tỉ lệ nhiễu. Do đó, tập tâm khởi tạo thu được rất gần tập tâm khi

hội tụ trong trường hợp KMeans phân cụm trực tiếp trên ảnh đầu vào. Do đó, tập

tâm này là khởi tạo rất tốt để KMeans phân cụm trên ảnh gốc.

3.1.6.2. Thử nghiệm

Luận án tiến hành thử nghiệm thuật toán đề xuất WIKMeans và so sánh kết

quả với thuật toán KMeans, CCEAKMeans về mặt tốc độ thực thi phân cụm. Nhóm

tác giả sử dụng biến đổi Wavelet rời rạc trong các thử nghiệm. Giả sử ảnh đầu vào

có kích thước M x N điểm ảnh. Nhóm tác giả thực hiện phân rã Wavelet 3 mức với

hàm nhân là Biorthogonal. Ngôn ngữ lập trình được sử dụng là C#. Như vậy, ảnh

xấp xỉ cực tiểu luận án chọn có kích thước M/8 x N/8 điểm ảnh.

Tập dữ liệu phục vụ cho thử nghiệm như được trình bày tại mục 2.4.5 trong

chương II. Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT về huyện Đà Bắc thuộc tỉnh Hoà Bình có kích thước 1596 x 1333 (điểm ảnh). Trong thử nghiệm 2,

ảnh gốc là ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh).Trong thử nghiệm 3, ảnh gốc là ảnh vệ tinh SPOT về tỉnh Hoà Bình có kích thước 2201 x 2101 (điểm ảnh). Bảng 3.3 minh họa các ảnh đầu vào của các mẫu trong các thử nghiệm 1, 2 và 3. Dưới đây là một số thử nghiệm đánh giá về tốc độ thực thi trung bình (với năm lần chạy) của thuật toán đề xuất WIKMeans. Đánh giá về chất lượng phân cụm được trình bày trong phần tiếp theo cùng thuật toán CIKMeans.

108

Bảng 3.1. Các ảnh đầu vào trong tử nghiệm 1, 2 và 3.

Thử nghiệm 1 Thử nghiệm 2 Thử nghiệm 3

Hình 3.4. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh thử

nghiệm 1.

a. Thử nghiệm 1 – Đà Bắc

Hình 3.2 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán KMeans

và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 1.

Hình 3.3 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán CCEAKMeans và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 1.

109

Hình 3.5. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với ảnh thử nghiệm 1.

b. Thử nghiệm 2 - QB

Hình 3.4 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán KMeans

Hình 3.6. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh thử nghiệm 2.

và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 1.

Hình 3.5 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán CCEAKMeans và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 1.

110

Hình 3.7. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với ảnh

thử nghiệm 2.

c. Thử nghiệm 3 - SPOT

Hình 3.6 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán KMeans

Hình 3.8. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh thử nghiệm 3.

và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 3.

Hình 3.7 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán CCEAKMeans và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử

nghiệm 3.

111

Hình 3 9. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với ảnh thử nghiệm 3.

Nhận xét:

Các kết quả thử nghiệm cho thấy, về mặt tốc độ thực thi:

 Thời gian thực hiện của thuật toán KMeans là rất lớn so với thuật toán đề

xuất WIKMeans.

 Thời gian thực hiện của thuật toán đề xuất WIKMeans là nhỏ hơn so với

thuật toán CCEAKMeans.

3.1.7. Đề xuất thuật toán CIKMeans

3.1.7.1. Trình bày thuật toán CIKMeans

Theo mục 3.1.3, với 2D-KMeans, mỗi đối tượng x gồm một cặp 2 vector: vector với các thành phần cường độ xINT và vector trung vị cục bộ xMED. Như vậy, mỗi tâm C gồm một cặp 2 vector: vector trung bình cường độ theo cụm: CINT và vector trung bình trung vị theo cụm: CMED.

Để khắc phục hạn chế (3), với CIKMeans (Context Information KMeans), mỗi đối tượng x gồm một cặp 2 vector: vector với các thành phần cường độ xINT và vector gần trung vị cục bộ xHP. xHP lấy xMED hoặc bên trái xMED hoặc bên phải xMED tuỳ theo điểm nào gần với điểm trong ảnh đầu vào nhất. Như vậy, mỗi tâm C gồm một cặp 2 vector: vector trung bình cường độ theo cụm: CINT và vector trung bình gần trung vị theo cụm: CHP. Kết quả này đã được nghiên cứu sinh công bố trong [TRU6].

(45) ( )

112

[(∑ (46) ) (∑ )]

3.1.7.2. Thử nghiệm

Tập dữ liệu phục vụ cho thử nghiệm được mô tả tại mục 2.4.6 trong chương II. Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT về huyện Đà Bắc thuộc tỉnh

Hoà Bình có kích thước 1596 x 1333 (điểm ảnh). Trong thử nghiệm 2, ảnh gốc là

ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh).Trong thử nghiệm 3,

ảnh gốc là ảnh vệ tinh SPOT về tỉnh Hoà Bình có kích thước 2201 x 2101 (điểm

ảnh). Bảng 3.2 minh họa các ảnh đầu vào của các mẫu trong các thử nghiệm 1, 2 và

Bảng 3.2. Các ảnh đầu vào trong tử nghiệm 1, 2 và 3.

Thử nghiệm 1 Thử nghiệm 2 Thử nghiệm 3

3.

Để đánh giá chất lượng phân cụm, luận án sử dụng chỉ số F(I), như được mô

tả trong mục 3.1.5.

a. Thử nghiệm 1 – Đà Bắc

Bảng 3.3 đưa ra so sánh kết quả phân cụm trực quan của 2D-KMeans và

CIKMeans trong trường hợp 5 cụm.

113

Bảng 3.3. Ảnh kết quả phân cụm với 5 cụm.

Cụm thứ

2D-KMeans

CIKMeans

1

2

3

4

5

Để thấy rõ hơn sự khác biệt về kết quả phân cụm, bảng 3.4 thể hiện kết quả

dạng phóng to ¼ kích thước ảnh, tại vùng góc dưới bên phải của ảnh.

114

Bảng 3.4. Ảnh kết quả phân cụm với 5 cụm.

Cụm thứ

2D-KMeans

CIKMeans

1

2

3

4

5

Hình 3.9 thống kê độ đồng nhất các cụm của KMeans, WIKMeans, 2D- KMeans, CIKMeans và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17. Trong đó, WICI-KMeans là sự kết hợp của WIKMeans (khởi tạo tâm) và CIKMeans.

115

Hình 3.10. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans,

2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).

b. Thử nghiệm 2 – QB

Bảng 3.5 đưa ra so sánh kết quả phân cụm trực quan của 2D-KMeans và

Bảng 3.5. Ảnh kết quả phân cụm với 5 cụm.

2D-KMeans

CIKMeans

Cụm thứ

1

2

3

CIKMeans trong trường hợp 5 cụm.

116

4

5

Hình 3.10 thống kê độ đồng nhất các cụm của KMeans, WIKMeans, 2D- KMeans, CIKMeans và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17.

Trong đó, WICI-KMeans là sự kết hợp của WIKMeans (khởi tạo tâm) và

Hình 3.11. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans,

2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).

CIKMeans.

c. Thử nghiệm 3 – SPOT

Bảng 3.6 đưa ra so sánh kết quả phân cụm trực quan của 2D-KMeans và

CIKMeans trong trường hợp 5 cụm.

117

Bảng 3.6. Ảnh kết quả phân cụm với 5 cụm.

2D-KMeans

CIKMeans

Cụm

thứ

1

2

3

4

5

Hình 3.11 thống kê độ đồng nhất các cụm của KMeans, WIKMeans, 2D- KMeans, CIKMeans và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17. Trong đó, WICI-KMeans là sự kết hợp của WIKMeans (khởi tạo tâm) và CIKMeans.

118

Hình 3.12. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).

Nhận xét:

Các kết quả thử nghiệm cho thấy, về chất lượng phân cụm, độ đồng nhất của

các cụm sinh ra bởi thuật toán đề xuất CIKMeans là cao hơn so với thuật toán 2D-

KMeans.

3.1.8. Đề xuất thuật toán KMeansCMN

3.1.8.1. Trình bày thuật toán KMeansCMN

Với công thức tính tâm như (13), tâm thu được dễ bị ảnh hưởng bởi nhiễu. Chúng ta có thể áp dụng phép chuẩn hóa trung bình phổ để cho một công thức tính

tâm cụm có thể giảm nhiễu. Tuy nhiên, phép chuẩn hóa này chỉ tốt khi số phần tử là

rất lớn. Trong phần này, luận án đề xuất thuật toán phân cụm KMeansCMN cải tiến

cho ảnh viễn thám kích thước lớn [TRU4] và [TRU7] với công thức tính tâm cụm

áp dụng kĩ thuật chuẩn hóa trung bình phổ như sau:

Đầu vào: n đối tượng và số cụm k

Đầu ra: Các cụm Ci (i=1..k) sao cho hàm mục tiêu E sau đây đạt cực tiểu:

(47) ∑ ∑ ( )

Thuật toán gồm các bước:

Bước 1: Khởi tạo

Chọn k đối tượng Cj (j=1..k) là tâm ban đầu của k cụm dữ liệu đầu vào

(lựa chọn ngẫu nhiên hoặc theo kinh nghiệm).

Bước 2: Gán tâm cụm theo khoảng cách

119

Với mỗi đối tượng xi (1 ≤ i ≤ n), tính khoảng cách của nó tới mỗi tâm Cj với j = 1..k. Đối tượng thuộc về cụm CS mà khoảng cách từ tâm CS tương ứng đến đối tượng đó là nhỏ nhất.

( ) ( ) (48)

Bước 3: Cập nhật tâm cụm

Đối với mỗi j = 1..k, cập nhật lại tâm cụm Cj bằng cách xác định trung

bình cộng của các vector đối tượng dữ liệu đã được gán về cụm.

- Nếu số lượng điểm ảnh trong cụm nhỏ hơn hằng số rất lớn Max thì

( )

tâm vẫn tính theo công thức (13) như sau:

( ( ))

(49)

- Nếu số lượng điểm ảnh trong cụm lớn hơn hằng số rất lớn Max thì

tâm tính theo công thức (17) như sau:

( ) (50)

Bước 4: Lặp và kiểm tra điều kiện dừng

Lặp lại các bước 2 và 3 cho đến khi các tâm cụm không thay đổi giữa hai

lần lặp liên tiếp.

Thủ tục tính tâm cụm CMN(Clusterj) tại vòng lặp thứ n như sau:

Bước 1: Khởi tạo tâm theo công thức

(51)

Bước 2: Với mỗi tính theo công thức

-

(52)

Trong nghiên cứu này, luận án chọn Max = 50000 và = 0.95.

3.1.8.2. Thử nghiệm

Tập dữ liệu phục vụ cho thử nghiệm gồm các ảnh LANDSAT, SPOT và

Quickbird như được mô tả trong mục 2.4.6.

Để đánh giá chất lượng phân cụm, trong [52], luận án sử dụng chỉ số F(I) như

trình bày trong mục 3.1.5.

120

Hình 3.13. Kết quả phân cụm bởi KMeans.

Hình 3.14. Kết quả phân cụm bởi KMeansCMN.

a. Thử nghiệm 1

Trong thử nghiệm 1, ảnh đầu vào là một ảnh SPOT. Hình 3.12 và hình 3.13 là

ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường hợp 5 cụm với

ảnh SPOT (hình 3.12 và 3.13). Các ảnh từ 1 đến 5 là ảnh từng cụm. Ảnh thứ 6 là

Bảng 3.7. So sánh độ đồng nhất cụm (*1.0e+3).

ảnh đã thay các điểm ảnh gốc bằng tâm các cụm.

Số cụm KMeans KMeansCMN

5

2.24

2.04

7

2.19

1.93

10

1.58

0.81

Bảng 3.7 và hình 3.14 so sánh độ đồng nhất tâm cụm giữa KMeans và

KMeansCMN. Bảng 3.8 thống kê số thời gian thực thi của KMeans và

KMeansCMN với 5, 7 và 10 cụm. Chúng ta thấy độ đồng nhất của KMeansCMN là

tốt hơn so với KMeans. Ngoài ra, thời gian phân cụm của KMeansCMN cũng nhỏ hơn KMeans.

121

Hình 3.15. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, KMeansCMN (*1.0e+3).

Bảng 3.8. Thời gian phân cụm (ms).

Số cụm

KMeans KMeansCMN

Thời gian (ms)

2,616,938

2,413,791

5

Số vòng lặp

25

23

Thời gian (ms)

3,663,713

3,379,307

7

Số vòng lặp

23

22

Thời gian (ms)

11,275,333

8,618,345

10

Số vòng lặp

30

26

b. Thử nghiệm 2

Dưới đây là ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường hợp 5 cụm với ảnh LANSAT (hình 3.15 và 3.16). Các ảnh từ 1 đến 5 là ảnh từng cụm. Ảnh thứ 6 là ảnh đã thay các điểm ảnh gốc bằng tâm các cụm.

122

Hình 3.16. Kết quả phân cụm bởi KMeans.

Hình 3.17. Kết quả phân cụm bởi KMeansCMN.

Bảng 3.9 và hình 3.17 so sánh độ đồng nhất tâm cụm giữa KMeans và

KMeansCMN. Bảng 3.10 thống kê số bước lặp cũng như thời gian thực thi của

KMeans và KMeansCMN với 5, 8 và 10 cụm. Chúng ta thấy độ đồng nhất của

KMeansCMN là tốt hơn so với Kmeans. Ngoài ra, thời gian phân cụm của

Bảng 3.9. So sánh độ đồng nhất cụm (*1.0e+3).

KMeansCMN cũng nhỏ hơn KMeans.

Số cụm KMeans KMeansCMN

5

1.66

1.5

8

1.61

1.53

10

1.42

1.45

123

Hình 3.18. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, KMeansCMN (*1.0e+3).

Bảng 3.10. Thời gian phân cụm.

Số cụm

KMeans KMeansCMN

Thời gian (ms)

263,672

213,109

5

Số vòng lặp

10

8

Thời gian (ms)

1,658,609

1,568,062

8

Số vòng lặp

25

23

Thời gian (ms)

2,513,044

2,323,055

10

Số vòng lặp

23

20

c. Thử nghiệm 3

Dưới đây là ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường hợp 5 cụm với ảnh Quickbird (hình 3.18 và 3.19). Các ảnh từ 1 đến 5 là ảnh từng cụm. Ảnh thứ 6 là ảnh đã thay các điểm ảnh gốc bằng tâm các cụm.

124

Hình 3.19. Kết quả phân cụm bởi KMeans.

Hình 3.20. Kết quả phân cụm bởi KMeansCMN.

Bảng 3.11 và hình 3.20 so sánh độ đồng nhất tâm cụm giữa Kmeans và

KMeansCMN. Bảng 3.12 thống kê số bước lặp cũng như thời gian thực thi của

KMeans và KMeansCMN với 5, 8 và 10 cụm. Chúng ta thấy độ đồng nhất của

KMeansCMN là tốt hơn so với KMeans. Ngoài ra, thời gian phân cụm của

Bảng 3.11. Tâm cụm sinh từ KMeans và KMeansCMN.

KMeansCMN cũng nhỏ hơn KMeans.

Cụm KMeans KMeansCMN

5

4.69

4.35

8

5.75

5.36

10

6.37

5.80

125

Hình 3.21. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,

KMeansCMN (*1.0e+3).

Bảng 3.12. Thời gian phân cụm.

Số cụm

KMeans KMeansCMN

Thời gian (ms)

607,818

498,719

5

Số vòng lặp

10

8

Thời gian (ms) 2,114,812

2,004,578

8

Số vòng lặp

11

10

Thời gian (ms) 3,662,355

2,625,564

10

Số vòng lặp

18

12

Nhận xét:

Việc tính tâm theo công thức (31) chắc chắn lâu hơn công thức (30). Do đó, về mặt lý thuyết, nhiều khả năng thời gian phân cụm của KMeansCMN sẽ lâu hơn KMeans. Tuy nhiên, theo thống kê về thời gian thực thi, số vòng lặp và thời gian thực thi của KMeansCMN ít hơn. Nói cách khác, để thuật toán hội tụ, KMeansCMN cần số vòng lặp thực thi ít hơn dẫn tới thời gian thực thi được cải thiện.

126

3.2. Phân cụm ảnh viễn thám với thuật toán Fuzzy C-Means

3.2.1. Hạn chế của thuật toán Fuzzy C-Means

Nhược điểm của FCM với ảnh viễn thám kích thước lớn được trình bày tại

mục 2.4.3 trong chương II.

3.2.2. Đề xuất thuật toán lsiFCM

3.2.2.1. Trình bày thuật toán lsiFCM

Trong phần này, luận án đề xuất thuật toán phân cụm mờ ảnh viễn thám kích thước

lớn mà chúng tôi tạm gọi là lsiFCM (large size image Fuzzy cMeans). Thuật toán

được trình bày như sau:

Đầu vào: Ảnh gốc.

Đầu ra: Ảnh phân đoạn cuối cùng.

Thuật toán gồm các bước:

B1: Chia ô

Chúng ta có thể biểu diễn lại ảnh theo khía cạnh tập hợp. Biểu diễn ban

đầu của ảnh theo tập các pixel. Giả sử ảnh có kích thước M x N. Khi đó ta

có:

Image = {Pix(i,j): 1 ≤ i ≤ M, 1 ≤ j ≤ N} (50)

Ảnh gốc được chia thành P x Q ô (p ô theo chiều ngang, q ô theo chiều

dọc). Mỗi ô có kích thước không quá 512 x 512 (Mc x Nc) pixel để đảm

bảo thủ tục FCM có thể thực thi. Theo chiều ngang, 2 ô liền kề có phần xếp

chồng bằng một nửa kích thước mỗi ô Cell(x,y). Theo chiều dọc, 2 ô liền kề

có phần xếp chồng bằng một nửa kích thước mỗi ô. Khi đó, ta có biểu diễn

mới của ảnh như sau:

Image = {Cell(x,y): 1 ≤ x ≤ P, 1 ≤ y ≤ Q} (51)

Trong đó:

Cell(x,y) = {Pix(i,j): 1 ≤ i ≤ Mc, 1 ≤ j ≤ Nc} (52)

Mc, Nc < 1024

B2: Phân cụm FCM các ô

127

Tiến hành phân cụm mỗi ô Cell(x,y) với thuật toán FCM.Gọi V(x,y,k) là

tâm thứ k tại ô Cell(x,y), ta được c tâm cụm của ô Cell(x,y):

(53) CentersCell(x,y) = {V(x,y,k): 1 ≤ k ≤ c }

1 ≤ x ≤ P, 1 ≤ y ≤ Q

Tính trọng số mỗi tâm thứ k của ô Cell(x,y) theo công thức:

( ) ∑ ∑ ( ( ) )

(54)

Trong đó, ( ( ) ) là giá trị hàm thuộc của điểm ảnh ( ) với

cụm thứ k trong ô Cell(x,y).

Sau khi đã phân cụm tất cả các ô, ta được:

 Tập tâm cụm như sau:

(55) CentersImage = {CentersCell(x,y) : 1 ≤ x ≤ P, 1 ≤ y ≤ Q }

(56) CentersImage = {V(x,y,k): 1 ≤ x ≤ P, 1 ≤ y ≤ Q, 1 ≤ k ≤ c }

 Tập các trọng số như sau:

(57) WeiImage = {Wei(x,y,k): 1 ≤ x ≤ P, 1 ≤ y ≤ Q, 1 ≤ k ≤ c }

B3: Phân cụm tập tâm cụm sử dụng FCM

Sau khi thu được tập các tâm cụm của các ô, tiếp tục thực hiện thuật toán

phân cụm FCM trên tập các tâm cụm này với hàm mục tiêu và công thức

tính tâm hiệu chỉnh như sau:

∑ ( )

∑ ( )

(58) ( )

Từ đây, ta thu được tập tâm cụm với c tâm cụm cuối cùng.

B4: Tổng hợp

Từ c tâm cụm thu được trong B3, tính lại giá trị hàm thuộc của từng

điểm trong ảnh ảnh đầu vào với mỗi tâm cụm.

3.2.2.2. Thử nghiệm

Luận án tiến hành thử nghiệm thuật toán đề xuất lsiFCM và so sánh với thuật toán gốc FCM. Tập dữ liệu thử nghiệm như được mô tả trong phần 2.4.4. Trong đó,

2 mẫu với kích thước trung bình mà vẫn có thể thực hiện với FCM (trong điều kiện

128

RAM không lớn) để so sánh kết quả của hai thuật toán. Kích thước mỗi ô không lớn

hơn 250 x 250 điểm ảnh.

Để đánh giá chất lượng phân cụm, luận án sử dụng chỉ số độ đồng nhất cụm

F(I) và F’(I) [52] như được trình bày trong mục 3.1.5.

Tập dữ liệu phục vụ cho thử nghiệm được mô tả tại mục 2.4.5.2 trong chương II. Các mẫu đại diện được liệt kê trong bảng 3.13. Trong thử nghiệm này chúng tôi

chọn máy tính có RAM 1GB. Các mẫu thử nghiệm là ảnh lớn mà với số cụm trong

Bảng 3.13. Các ảnh dùng trong các thử nghiệm.

Thử nghiệm 1

Thử nghiệm 2

thử nghiệm đủ để FCM không thể thực hiện với RAM 1GB.

a. Thử nghiệm 1

Ảnh gốc là ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh). Hình 3.22 và 3.23 mô tả ảnh mỗi cụm được sinh ra bởi thuật toán FCM và lsiFCM với 5

Hình 3.22. Chi tiết từng cụm của FCM của thử nghiệm 1.

Hình 3.23. Chi tiết từng cụm của lsiFCM của thử nghiệm 1.

cụm.

129

Hình 3.24, 3.25 thống kê độ đồng nhất theo các chỉ số F(I) và F’(I) của các

Hình 3.24. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử

nghiệm 1 (*1.0e+3).

Hình 3.25. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của thử nghiệm 1 (*1.0e-3).

cụm sinh ra bởi FCM và lsiFCM với số cụm lần lượt là 5, 7, 9.

b. Thử nghiệm 2

Ảnh gốc là ảnh vệ tinh SPOTcó kích thước 2200 x 2101. Hình 3.26 và 3.27

mô tả ảnh mỗi cụm được sinh ra bởi thuật toán FCM và lsiFCM với 4 cụm.

130

Hình 3.26. Chi tiết từng cụm của FCM của thử nghiệm 2.

Hình 3.27. Chi tiết từng cụm của lsiFCM của thử nghiệm 2.

Hình 3.28, 3.29 thống kê độ đồng nhất theo các chỉ số F(I) và F’(I) các cụm

Hình 3.28. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử

nghiệm 2(*1.0e+3).

Hình 3.29. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của thử nghiệm 2 (*1.0e-3).

sinh ra bởi FCM và lsiFCM với số cụm lần lượt là 4, 6, 7, 9.

131

Nhận xét:

Về mặt chất lượng phân cụm, theo đánh giá độ đồng nhất từ các bảng và biểu đồ

trên, lsiFCM vẫn đảm bảo độ ổn định so với FCM, thậm chí có trường hợp tốt hơn FCM.

3.3. Phân lớp ảnh viễn thám

3.3.1. Phân lớp hợp lý tối đa

3.3.1. Phân lớp Bayes

Ký hiệu các lớp phổ cho một ảnh qua việc biểu diễn như sau: . Trong đó, M là tổng số lớp [59]. Trong việc cố gắng xác định lớp hoặc loại mà vector điểm ảnh x thuộc lớp đó là xác xuất có điều kiện ( ⁄ ) . Vector độ đo x là một cột giá trị độ sáng cho điểm ảnh. Nó mô tả điểm ảnh như một điểm trong không gian đa phổ với hệ tọa độ được bởi độ sáng. Xác suất ( ⁄ ) cho sự hợp lý mà lớp chính xác là cho một điểm ảnh tại vị trí x. Phân loại được thực hiện theo

(59) ( ⁄ ) ( ⁄ )

Nghĩa là, điểm ảnh tại x thuộc lớp nếu ( ⁄ ) là lớn nhất. Luật quyết định trực giác này là một trường hợp đặc biệt của một luật tổng quát hơn trong đó các quyết

định có thể được chịu ảnh hưởng theo mức độ khác nhau của ý nghĩa được gắn đến

sự phân loại không chính xác khác.

3.1.2. Luật quyết định hợp lý tối đa

Mặc dù rất đơn giản, ( ⁄ ) không được biết đến. Tuy nhiên, nếu giả sử rằng dữ liệu huấn luyện đầy đủ sẵn sàng cho mỗi loại che phủ đất [59]. Điều này có

thể được dùng để ước lượng một phân bố xác suất cho một loại che phủ mà mô tả cơ hội tìm một điểm ảnh từ lớp tại vị trí x. Sau đó, việc hình thức hóa hàm phân bố này sẽ được tạo cụ thể hơn. Tuy nhiên, hiện tại, hàm này được giữ lại trong dạng chung và được biểu diễn bởi ký hiệu ( ⁄ ). Sẽ có nhiều ( ⁄ ) như có các lớp che phủ đất. Nói cách khác, với một điểm ảnh tại vị trí x trong không gian đa phổ một tập các khả năng có thể được tính mà đưa ra sự hợp lý liên quan mà điểm ảnh thuộc về mỗi lớp sẵn có.

132

( ⁄ ) mong muốn trong phần 1 và ( ⁄ ) sẵn có – được ước lượng từ dữ liệu huấn luyện – liên quan bởi định lý Bayes (Freund, 1992):

⁄ (60) ( ⁄ ) ( ⁄ ) ( ) ( )

Trong đó, ( ) là xác suất mà lớp xảy ra trong ảnh. Nếu, chẳng hạn, 15% điểm ảnh của ảnh thuộc về lớp thì ( ) ; ( ) trong (2) là xác suất để tìm được điểm ảnh trong bất kỳ lớp nào tại vị trí x. Nó được quan tâm vì:

( ) ∑ ( ⁄ )

(61) ( ),

mặc dù chính ( ) không quan trọng trong những điều sau đây. ( ) được gọi là xác suất ưu tiên, khi chúng là xác suất với thành viên lớp của một điểm ảnh có thể được dự đoán trước khi phân loại. Bằng việc so sánh ( ⁄ ) là các khả năng sau đó. Sử dụng (2) có thể thấy rằng luật phân loại của phần 1 là:

(62) ( ⁄ ) ( ) ( ⁄ ) ( )

Trong đó, ( ) đã được xóa như một thừa số chung. Luật (4) dễ chấp nhận hơn so với luật (1) khi ( ⁄ ) được biết từ dữ liệu huấn luyện và nó có thể được hiểu rằng ( ) cũng đã biết hoặc có thể ước lượng từ tri thức phân tích ảnh. Kết quả phù hợp về mặt toán học nếu trong (58) định nghĩa:

(63) ( ) ( ⁄ ) ( ) ( ⁄ ) ( )

được sử dụng, trong đó ln là logarit tự nhiên, và (4) được trình bày lại như sau:

(64) ( ) ( )

Nghĩa là, với thay đổi như trên, luật quyết định được sử dụng trong phân loại

hợp lý tối đa; ( ) tham chiếu đến hàm phân biệt (discriminant).

3.1.3. Mô hình lớp chuẩn đa biến

Ở giai đoạn này, giả sử rằng phân bố xác suất của các lớp thuộc dạng mô hình chuẩn đa biến [59]. Đây là một giả định, hơn là một thuộc tính có thể chứng minh của các lớp phổ tự nhiên hoặc thông tin. Tuy nhiên, nó dẫn đến sự đơn giản hóa về

mặt toán học như sau đây. Hơn nữa nó là một phân bố cho các thuộc tính của dạng đa biến đã biết.

Trong (58) vì thế, bây giờ được giả sử cho N kênh rằng (xem phụ lục E)

133

( ) ∑ ( )

} ( ⁄ ) ( ) ⁄ | | ⁄ {

(65)

( ) ∑ ( )

( )

(66) ( ⁄ ) – | |

Trong đó, và là vector trung bình và ma trận hiệp phương sai của dữ liệu trong lớp . Ta có – ( ) là chung cho tất cả ( ) và không giúp cho sự phân biệt. Do đó, thừa số này được bỏ qua và dạng cuối của hàm phân biệt cho

phân loại hợp lý tối đa, dựa trên giả định của thống kê chuẩn, là (thay 62 vào 59):

( ) ∑ ( )

(67) ( ) ( ) | |

Thông thường, người phân tích không có thông tin hữu ích về ( ), trong trường hợp một tình huống của các khả năng ưu tiên cân bằng được giả định; như một hệ quả ( ) có thể được xóa bỏ từ (63) khi nó giống nhau với mọi i. Trong trường hợp này thừa số ½ cũng có thể được loại bỏ, như hàm phân biệt:

(68) ( ) | | ( ) ∑ ( )

Việc cài đặt luật quyết định hợp lý tối đa liên quan đến việc sử dụng hoặc (67) hoặc

(68). Tuy nhiên có một suy xét xa hơn liên quan đến liệu rằng bất kỳ nhãn hay lớp nào sẵn sàng cũng hợp lý.

3.3.2. Một số độ đo phân lớp

Để đánh giá một giải thuật máy học một số chỉ số thông dụng được sử dụng.

Trong đó có Độ chính xác (Precision), Độ hồi tưởng (Recall) [127], Độ đo F1.

(69)

(70)

(71)

Trong đó:

 Số đúng dương (TP- True positive): số phần tử dương được phân loại

dương.

 Số sai âm (FN - False negative): số phần tử dương được phân loại âm.

 Số đúng âm (TN- True negative): số phần tử âm được phân loại âm.

134

 Số sai dương (FP - False positive): số phần tử âm được phân loại

dương.

3.3.3. Đề xuất tiếp cận lai cho phân lớp ảnh viễn thám

3.3.2.1. Trình bày tiếp cận lai cho phân lớp ảnh viễn thám

Trong nghiên cứu này, luận án đề xuất một tiếp cận phân loại ảnh với sự kết

hợp cả hai tiếp cận trên mà chúng tôi tạm gọi là tiếp cận lai. Đầu tiên, ảnh gốc được

tiến hành phân vùng. Thay vì trích chọn đặc trưng đối tượng như trong tiếp cận

hướng đối tượng, các vùng sẽ được đưa vào bộ phân loại lai để cho quyết định phân

Hình 3.30. Quy trình phân loại ảnh đa phổ theo tiếp cận lai.

lớp cuối cùng. Hình 3.30 mô tả quy trình phân loại theo tiếp cận lai.

Thuật toán gồm các bước như sau:

B1: Phân vùng ảnh (Unsupervised Segmentation)

Sử dụng thuật toán phân cụm để chia ảnh đầu vào thành các vùng, cụm

khác nhau.

B2: Phân lớp lai

Hàm phân biệt ( ) như được trình bày trong mục 3.3.2 của phương pháp phân lớp hợp lý tối đa chỉ áp dụng cho từng điểm ảnh. Trong phần này, chúng tôi đề xuất một cải tiến cho hàm phân biệt này để áp dụng cho việc phân lớp các cụm-đối tượng đã thu được từ giai đoạn phân loại không giám sát.

Sau khi phân cụm ảnh gốc I ta được tập O cụm-đối tượng như sau:

(72)

Trong đó,  = ; i j, i,j = 1,2,.., K; o1 o2 … oK = I.

135

Luận án xây dựng hàm phân biệt cho mỗi cụm như sau:

(73) ( ) ( ) ∑ ( )

Từ đây luận án đề xuất luật quyết định lớp cho mỗi cụm như sau:

(74) ( ) ( )

Như vậy, có thể thấy rằng điểm khác biệt giữa các tiếp cận phân lớp là:

 Tiếp cận dựa điểm ảnh chỉ trích chọn đặc trưng điểm ảnh, cụ thể trong thuật toán trên là xây dựng hàm phân biệt và tính giá trị hàm này cho mỗi điểm

ảnh.

 Tiếp cận dựa trên điểm ảnh trích chọn các đặc trưng đối tượng (đã liệt kê

trong chương 1) theo mỗi cụm.

 Thuật toán cải tiến theo tiếp cận lai thì chỉ xây dựng hàm phân biệt và tính

giá trị hàm này cho mỗi cụm (hay cụm).

3.3.2.2. Thử nghiệm và đánh giá

Hình 3.31: Sơ đồ thử nghiệm quy trình thử nghiệm phân lớp theo tiếp cận lai.

a. Quy trình thử nghiệm

Quá trình thử nghiệm chia làm ba giai đoạn:

136

 Giai đoạn 1: Lấy mẫu – Trích chọn đặc trưng

Để có dữ liệu mô hình, trước tiên cần lấy mẫu huấn luyện từ trên ảnh đầu

vào. Sau đó, trung bình và ma trận hiệp phương sai của mỗi lớp sẽ được

Hình 3.32: Lựa chọn và hiển thị vùng mẫu trên ảnh.

tính và lưu lại thành dữ liệu mô hình. Hình 3.32 mô tả quá trình lựa chọn vùng mẫu, đặt tên lớp phủ.

 Giai đoạn 2: Phân lớp dữ liệu

- Bước 1: Phân cụm

Trong nghiên cứu này, luận án đã thử nghiệm cài đặt thuật toán

KMeansCMN (được trình bày trong mục 3.1.7).

- Bước 2: Phân lớp lai:

Tính giá trị hàm phân biệt cho từng cụm và so sánh để đưa ra quyết

định phân lớp cho các cụm này.

 So sánh và đánh giá

Kết quả thử nghiệm có sự so sánh giữa thuật toán phân loại theo phương

pháp phân loại hợp lý tối đa (thuật toán gốc), được cài đặt trong phần mềm

137

Grass, và thuật toán dựa trên tiếp cận lai (thuật toán cải tiến). Để đánh giá

độ chính xác phân lớp đối với mỗi lớp, luận án sử dụng chỉ số Precision.

Tập dữ liệu phục vụ cho thử nghiệm gồm các ảnh như được mô tả trong mục 2.4.5.2 trong chương II.

b. Thử nghiệm đại diện

Thử nghiệm 1

Mẫu thứ nhất là ảnh SPOT. Thực hiện việc phân loại ảnh đầu vào với 3 lớp:

đất (màu nâu trong ảnh kết quả), nước (màu vàng trong ảnh kết quả), rừng (màu

xanh lam trong ảnh kết quả). Kết quả phân loại được thể hiện trong hình 3.33. Từ kết quả trong hình 3.33, quan sát vùng được khoanh tròn trên ảnh, vùng rừng có xen

lẫn đất vơú tính hỗn tạp rất cao. Tuy nhiên, thuật toán gốc không phản ánh rõ sự đan

Hình 3.33. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến.

xen này mà quy về một lớp. Trong khi thuật toán cải tiến phân biệt rất rõ.

Bảng 3.14 và hình 3.34 thống kê độ chính xác Precision của thuật toán

Bảng 3.14. So sánh độ chính xác.

Maximum Likehood và thuật toán theo tiếp cận lai.

138

Lớp MLK Lai

Đất

95%

98%

Rừng

99.8% 99.9%

Nước

97%

98%

Hình 3.34. So sánh độ chính xác.

Thử nghiệm 2

Mẫu thứ hai là ảnh LANDSAT (huyện Đà Bắc, tỉnh Hoà Bình). Thực hiện

việc phân loại ảnh đầu vào với 3 lớp: Núi đá (màu đen trong ảnh kết quả), nước

(màu xanh trong ảnh kết quả), rừng (màu vàng trong ảnh kết quả). Kết quả được thể

hiện trong hình 3.35. Ảnh đầu vào cũng có tính hỗn tạp cao và được thể hiện rõ hơn

qua ảnh kết quả của thuật toán phân loại đề xuất.

139

Hình 3.35. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến.

Bảng 3.15 và hình 3.36 thống kê độ chính xác Precision của thuật toán

Bảng 3.15. So sánh độ chính xác.

Maximum Likehood và thuật toán theo tiếp cận lai.

Lớp MLK Lai

Núi đá

85%

84%

Rừng

90%

93%

Nước 99.6% 99.7%

140

Hình 3.36. So sánh độ chính xác.

Thử nghiệm 3

Mẫu thứ hai là ảnh LANDSAT (huyện Lạc Thuỷ, tỉnh Hoà Bình). Thực hiện

việc phân loại ảnh đầu vào với 3 lớp: Đất (màu nâu trong ảnh kết quả), nước (màu

xanh trong ảnh kết quả), rừng (màu vàng trong ảnh kết quả). Kết quả được thể hiện

trong hình 3.37. Ảnh đầu vào cũng có tính hỗn tạp cao và được thể hiện rõ hơn qua

ảnh kết quả của thuật toán phân loại đề xuất.

141

Hình 3.37. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến.

Bảng 3.16 và hình 3.38 thống kê độ chính xác Precision của thuật toán

Bảng 3.16. So sánh độ chính xác.

Maximum Likehood và thuật toán theo tiếp cận lai.

Lớp MLK Lai

Rừng

95%

97%

Đất

99.5% 99.7%

Nước

85%

90%

142

Hình 3.38. So sánh độ chính xác.

3.4. Kết luận chương III

Chương III dược chia thành ba phần chính.

Trong phần đầu tiên, chương III có nghiên cứu và cải tiến liên quan đến thuật

toán KMeans. Thứ nhất, trình thuật toán phân cụm toán kinh điển KMeans. Tiếp

theo là hai cải tiến gần đây CCEA_KMeans và 2D-KMeans về tốc độ thực thi và

chất lượng phân cụm. Luận án cũng phân tích hạn chế của thuật toán KMeans. Từ

đó, luận án đề xuất cải tiến thuật toán KMeans nhằm khắc phục những hạn chế nói

trên. Các đề xuất bao gồm các thuật toán: WiKMeans, CIKMeans và KMeans.

Trong đó, thuật toán WiKMeans để khởi tạo tập tâm tốt và hỗ trợ tăng tốc độ phân

vùng ảnh viễn thám.Các kết quả thử nghiệm cho thấy wiKMeans cho tốc độ tốt hơn

rất nhiều KMeans và tốt hơn CCEA_KMeans (một cải tiến gần đây của KMeans về mặt tốc độ thực thi). Thuật toán CIKMeans để phân cụm với thông tin ngữ cảnh

kèm theo cho mỗi điểm ảnh.Các kết quả thử nghiệm cho thấy CIKMeans cho chất lượng phân cụm tốt hơn so với KMeans và 2D-Kmeans (một cải tiến gần đây của KMeans về mặt chất lượng phân cụm). Thuật toán KMeansCMN với mục tiêu áp dụng phương thức chuẩn hóa trung bình phổ để tính tâm cụm cho việc phân vùng ảnh viễn thám kích thước lớn. Các kết quả thử nghiệm cho thấy KMeansCMN phân cụm tốt với ảnh viễn thám kích thước lớn. Ngoài ra, tốc độ phân cụm của KMeansCMN là tốt hơn so với KMeans thông thường. Hiện tại, thủ tục tính tâm theo CMN vẫn sử dụng nhiều tính toán với số thưc nên tốc độ chậm. Trong nghiên

143

cứu tiếp theo, nhóm tác giả dự kiến sử dụng phương pháp tính toán chấm tĩnh để

tăng cường tốc độ thủ tục này để tăng tốc độ phân cụm.

Trong phần thứ hai, chương III có nghiên cứu và cải tiến liên quan đến thuật toán phân cụm mờ. Trước tiên, phần này cũng trình bày thuật toán phân cụm FCM

và phân tích hạn chế của nó. Tiếp đó, chương III đề xuất một thuật toán phân vùng ảnh viễn thám mới lsiFCM. Ý tưởng của thuật toán này là kết hợp việc thuật toán

phân cụm mờ với việc chia ảnh viễn thám kích thước lớn đầu vào thành những

mảnh nhỏ hơn làm sao cho FCM vẫn thực thi được cùng với việc tính bộ trọng số

tâm cho từng mảnh. Sau khi tất cả các mảnh đều được phân cụm, ta có tập các tâm cụm của các ô này trọng số tương ứng. Tiếp tục sử dụng thuật toán FCM với công

thức tính tâm mới để phân cụm tập các tâm này. Kết quả thu được tập các tâm cho

toàn ảnh. Quá trình tổng hợp là việc tính lại giá trị hàm thuộc từng điểm ảnh và tập

các tâm cuối cùng. Các kết quả thử nghiệm chứng tỏ lsiFCM cho kết quả phân vùng

tốt, vẫn đạt độ ổn định so với FCM. Tuy nhiên, do việc thực hiện thuật toán FCM

với rất nhiều ô, tốc độ thực thi của lsiFCM chậm hơn nhiều so với FCM.

Trong phần thứ ba, chương III khảo sát về kĩ thuật phân lớp có giám sát hợp lý

tối đa được dùng phổ biến trong phân lớp ảnh viễn thám đa phổ. Đó là kĩ thuật phân

lớp dựa trên hướng tiếp cận điểm ảnh truyền thống. Tiếp đó, chương III đề xuất một

tiếp cận phân loại lai với sự kết hợp cả hai tiếp cân hướng điểm ảnh và hướng đối

tượng. Thuật toán dựa trên tiếp cận lai được cải tiến từ kĩ thuật phân lớp có giám sát

hợp lý tối đa nhưng được sử dụng không phải để phân lớp từng điểm ảnh mà phân

lớp các cụm-đối tượng. Quy trình phân loại theo tiếp cận này gồm hai giai đoạn.

Một là, phân vùng ảnh, trong thuật toán cải tiến theo tiếp cận này, chúng tôi sử dụng thuật toán KMeans. Hai là, phân lớp lai, các vùng sau đó sẽ được phân lớp theo bộ

phân lớp lai sử dụng hàm quyết định phân lớp mới mà luận án đề xuất. Hàm quyết

định phân lớp này được cải tiến dựa trên hàm phân biệt của phương pháp phân loại

hợp lý tối đa. Các kết quả thử nghiệm cho thấy kết quả phân lớp của thuật toán dựa trên tiếp cận đề xuất cho độ chính xác cao hơn so với thuật toán của phương pháp hợp lý tối đa.

Trong phần kết luận, luận án tóm tắt những kết quả chính đã đạt được và

hướng phát triển tiếp theo.

144

KẾT LUẬN

Luận án đã trình bày tổng quan về vấn đề giải đoán ảnh viễn thám đa phổ và tình hình nghiên cứu trong và ngoài nước. Qua đó, luận án phân tích những thành

công cũng như một số điểm còn hạn chế. Dựa theo những phân tích này, luận án

thực hiện cải tiến các khâu tăng cường và phân lớp ảnh viễn thám đa phổ.

Kết quả đạt được của luận án bao gồm:

(1) Giai đoạn tăng cường ảnh:

 Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám đa phổ mới dựa trên tiếp cận cục bộ theo cụm với hai thuật toán tăng cường sử dụng các thuật toán phân cụm FCM và KMeans.

 Đề xuất thêm hai thuật toán tăng cường ảnh viễn thám kích lớn dựa trên

việc cải tiến thuật toán phân cụm mờ và sử dụng kĩ thuật Wavelet.

 Kết quả này đã được nghiên cứu sinh công bố trong [TRU1], [TRU2] và

[TRU9].

(2) Giai đoạn phân lớp ảnh:

 Để tăng cường tốc độ thực thi và chất lượng phân cụm của thuật toán phân cụm KMeans, luận án đề xuất thuật toán WIKMeans và CIKMeans.

Trong đó, WIKMeans (Wavelet Inited KMeans) với sự hỗ trợ của phép

biến đổi Wavelet để tăng tốc độ thực thi của KMeans thông qua một khởi

tạo tâm cụm tốt. CIKMeans (Context Information KMeans) để khôi phục

thông tin ngữ cảnh cho thuật toán. Kết quả này đã được nghiên cứu sinh

công bố trong [TRU3], [TRU6], [TRU8].

 Luận án đề xuất thuật toán KMeansCMN với sử dụng phép chuẩn hoá CMN (Cepstral Mean Normalisation) được sử dụng trong công thức tính

tâm cụm mới. Kết quả này đã được nghiên cứu sinh công bố trong [TRU4] và [TRU7]. Ngoài ra, luận án đề xuất thuật toán phân cụm ảnh viễn thám kích thước lớn được cải tiến từ thuật toán phân cụm mờ. Kết quả này đã được nghiên cứu sinh công bố trong [TRU5].

 Trong giai đoạn phân lớp có giám sát, luận án đề xuất một kĩ thuật lai với sự kết hợp cả hai hướng tiếp cận để đưa ra một thuật toán phân loại ảnh

145

viễn thám hiệu quả hơn mà chúng tôi tạm gọi là phương pháp tựa đối

tượng. Kết quả này đã được nghiên cứu sinh công bố trong [TRU7].

Trong các kết quả của luận án, các đóng góp quan trọng trong vấn đề tăng cường và phân cụm ảnh viễn thám. Tuy nhiên, luận án chưa đạt được nhiều kết quả

trong giai đoạn phân lớp. Do đó, hướng nghiên cứu của luận án:

 Nghiên cứu giải pháp tăng tốc độ thuật toán phân cụm mờ để tăng tốc độ

thực thi cho thuật toán LoRSIE_FCM và LaRSIE_FCM.

 Nghiên cứu đề xuất toán tử tăng cường ảnh mới, có thể áp dụng đại số gia

tử.

 Hướng tới việc song song hóa giai đoạn phân cụm các ô để tăng tốc độ thực

thi của thuật toán lsiFCM.

 Tập trung vào giai đoạn phân lớp có giám sát để đưa ra thêm những cải tiến cho tiếp cận phân lớp lai nói riêng hay phân lớp ảnh viễn thám nói chung

cũng như có những so sánh, đánh giá sâu hơn với hai tiếp cận hướng điểm

ảnh và hướng đối tượng.

146

DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA NGHIÊN CỨU SINH

Tạp chí

[TRU1] Trung Nguyen Tu, Huy Ngo Hoang, Thoa Vu Van, Using fuzzy logic

to enhance the large size remote sensing images, International Journal of Information and Electronics Engineering, Vol.5, No.6, 2015.

[TRU2] Nguyễn Tu Trung, Vũ Văn Thoả, Đặng Văn Đức, Một phương pháp

tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục bộ, Chuyên san các công trình nghiên cứu, Tạp chí Công nghệ thông tin và

Truyền thông, Bộ Thông tin và Truyền thông, Kỳ 3, tập V-2, số 14 (34), 2015.

[TRU3] Trung Nguyen Tu, Huy Ngo Hoang, Duc Dang Van, Thoa Vu Van, A

improvement of KMeans algorithm using wavelet technique to increase

speed of clustering remote sensing images, International Journal of

Computer and Electrical Engineering, Vol. 8, No. 2, 2016, pp. 177-

184.

[TRU4] Nguyễn Tu Trung, Ngô Hoàng Huy, Một chứng minh hình thức cho

phép bù trừ phổ CMN của tín hiệu số và ứng dụng trong phân vùng

ảnh viễn thám, Tạp chí Khoa học, Đại học sư phạm Hà Nội, Vol. 60,

No. 7A, 2015, pp. 137-144.

[TRU5] Nguyễn Tu Trung, Vũ Văn Thỏa, Đặng Văn Đức, Phân vùng ảnh

viễn thám kích thước lớn dựa trên phân cụm mờ, Tạp chí Khoa học

Công nghệ Thông tin và Truyền thông, Học Viện Công nghệ Bưu chính Viễn thông, Tập 1, Số 1 năm 2016, pp. 45-51.

[TRU6] Nguyễn Tu Trung, Đặng Văn Đức, Vũ Văn Thỏa, Một số cải tiến kĩ thuật phân cụm cho ảnh viễn thám, được chấp nhận đăng trên Chuyên san các công trình nghiên cứu, Tạp chí Công nghệ thông tin và Truyền thông, Bộ Thông tin và Truyền thông, số 16 (36), 2016.

147

[TRU7] Nguyễn Tu Trung, Ngô Hoàng Huy, Đặng Văn Đức, Vũ Văn Thỏa,

Lại Anh Khôi, Một kĩ thuật phân lớp ảnh viễn thám sử dụng tiếp cận lai, Tạp chí Khoa học Công nghệ Thông tin và Truyền thông, Học

Viện Công nghệ Bưu chính Viễn thông, Số 2 năm 2016.

Kỷ yếu Hội nghị

[TRU8] Nguyễn Tu Trung, Ngô Hoàng Huy, Vũ Văn Thoả, Đặng Văn Đức,

Một cải tiến thuật toán KMeans cho việc phân vùng ảnh viễn thám,

Hội thảo “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin”, Hà

Nội, 2015.

[TRU9] Trung Nguyen Tu, Duc Dang Van, Huy Ngo Hoang, Thoa Vu Van, A method to enhance the remote sensing images based on the local

approach using Kmeans algorithm, Hội thảo “International Conference

on Advances in Information and Communication Technology”, ICTA

2016.

148

TÀI LIỆU THAM KHẢO

[1]

Dương Hiếu Đẩu và Đặng Văn Liệt, (2005), Dùng biến đổi wavelet rời rạc để phân tích các dị thường trọng lực, Tạp chí khoa học Đại Học Cần Thơ – số định kỳ: 04 (2005).

[2]

Đặng Văn Đức và cộng sự, Một số kĩ thuật ứng dụng trong phát triển phần mềm xử lý ảnh viễn thám trên nền phần mềm GRASS, Hội thảo Công nghệ Vũ trụ và Ứng dụng, 2010, pp. 158-166.

[3] Đặng Văn Liệt, Nguyễn Anh Hoàng, Nguyễn Chí Nhân, (2002), Ứng dụng phổ biến đổi Wavelet 1-D trong phân tích tài liệu từ, Hội nghị NCKH lần thứ Trường ĐH Khoa Học Tự Nhiên, TP HCM.

[4]

Dang Huu Nghi, Luong Chi Mai, An object-oriented classification techniques for high resolution satellite imagery, International Symposium on Geoinformatics for Spatial Infrastructure Development in Earth and Allied Sciences 2008.

[5]

Lê Văn Trung, Ảnh hưởng của dữ liệu huấn luyện trong các thuật toán phân loại ảnh viễn thám, tạp chí Phát triển KH&CN, số 10, 2007, pp. 57- 61.

Nguyễn Khắc Thời và cộng sự, Giáo trình viễn thám, 2011. [6]

[7]

Võ Quang Minh và Nguyễn Thị Thanh Nhanh, Nghiên cứu sử dụng ảnh viễn thám xác định sự phân bố đất than bùn ở U Minh hạ, Tạp chí Khoa học 2010:16b, pp. 49-57.

[8]

Aditi M., Irani S., Contrast Enhancement of Images using Human Contrast Sensitivity, Applied perception in graphics and visualization, 11, 2006, pp. 69-76.

[9]

Adlin S. T., Kumudha R., A Survey on Color Image Enhancement Techniques, IOSR Journal of Engineering (IOSRJEN), Vol. 3, Issue 2 (Feb. 2013), pp. 20-24.

[10]

Ahmed M. N., Yamany S.M., Mohamed N., and Faragant A.A., Moriarty T., A modified fuzzy c-means algorithm for bias field estimation and segmentation of mridata, IEEE Transactions on Medical Imaging, 21(3), 2002, pp. 193–199.

149

[11]

Aman T., Naresh K., Performance Analysis of Type-2 Fuzzy System for Image Enhancement using Optimization, International Journal of Enhanced Research in Science Technology & Engineering, Vol. 3 Issue 7, July-2014, pp: (108-116).

[12] Anderson G., Fundamentals of Fuzzy Logic, SENSORS, 2001.

[13]

Anumolu Lasmika, K. Raveendra, “Improving Quality of Satellite Image by Wavelet Transforming & Morphological Filtering”, International Journal of Innovative Research in Science, Engineering and Technology, ISSN: 2319-8753, Vol. 3, Issue 7, July 2014.

[14]

Ahern,F.J., Brown,R.J., Cihlar,J., Gauther, R..P., Murphy,J., Neville, R.A., and P.M. Teillet. (1987), Radiometric correction of visible and infrared remote sensing data at the Canada Centre for Remote Sensing, International Journal of Remote Sensing. 8:1349-1376.

[15]

Arich T., Dikbas S., A histogram modification framework and its application for image contrast enhancement, IEEE Trans. Image Process., 18, 2009.

[16]

Arya P Unni, Satellite Image Enhancement Using 2D Level DWT, International Journal of Engineering Research & Technology (IJERT), ISSN: 2278-0181, Vol. 3 Issue 3, March – 2014.

[17]

Ashwini T. S., Chandraprakash B., Tarapore N. Z., Satellite Image Classification using the Back Propagation Algorithm of Artificial Neural Network, In the proceedings of IEEE on geoscience and remote sensing, Vol. 46, September, 2001.

[18]

Balaji T., Sumathi M., Relational Features of Remote Sensing Image classification using Effective KMeans Clustering, International Journal of Advancements in Research & Technology, Volume 2, Issue 8, August- 2013, pp. 103-107.

[19]

Berget I., Mevik B. H., and Naæs T., New modifications and applications of fuzzy c-means methodology, Computational Statistics and Data Analysis, Vol. 52, 2008, pp. 2403-2418.

[20] Bischof H., Schneider W., and Pinz A. J., Multispectral Classification of

150

Landsat Images Using Neural Networks, In the proceedings of IEEE transactions on Geosciences and remote sensing, Vol. 30, NO 3, May 1992.

[21]

Burt, P.J. and Adelson, E.H.(1983), “The Laplacian pyramid as a compactimage code”, IEEE Trans, Commun., Vol COM-31, pp. 532- 540.

[22]

Canada Center for Remote Sensing, Fundamentals of Remote Sensing, Canada, 2007.

[23]

Caselles, V. and Lopez Garcia M.J., An alternative simple approach to estimate atmospheric correction in multitemporal studies, International Journal of Remote Sensing, 1989, 10: pp. 1127-1134.

[24]

Cheng H.D., Xu H., A novel fuzzy logic approach to contrast enhancement, Pattern Recognition, 33, 2000, pp. 809-819.

[25]

Chen S. and Zhang D., Robust image segmentation using fcm with spatial constraints based on new kernel-induced distance measure, IEEE Transactionson Systems, Man and Cybernetics, PartB., 34(4), 2004, pp. 1907–1916.

[26]

Chih-Tang C., Iim Z. C. Lai, and Mu-Der Jeng, A Fuzzy K-means Clustering Algorithm Using Cluster Center Displacement, Journal of Information Science and Engineering 27, (2011), pp. 995-1009.

[27]

Chavez P.S. Jr., An improved dark-object subtraction technique for atmospheric scattering correction of multispectral data, Remote Sensing of Environment, 1988, pp. 459-479.

[28]

Cihlar J., Du Y. and Latifovic R., Land cover dependence in the detection of contaminated pixels in satellite optical data, IEEE Transactions on Geoscience and Remote Sensing, 2001.

[29]

Codruta O. A., Cosmin A. and Philippe B., Effective Single Image Dehazing by Fusion, Proceedings of 2010 IEEE 17th International Conference on Image Processing, Hong Kong, 2010, pp. 3541-3544.

[30]

Crochiere, Weber and Flanagan, (1976) “Digital Coding of Speech in Sub-bands”, Bell System Technical Journal, vol. 55, pp. 1069-1085.

151

INTRODUCTION TO SOFT COMPUTING, [31]

Dmitry Bystrov, LECTURE NOTICE.

[32]

Dorigo M., Caro G.D., Ant colony optimization: a new meta-heuristic, Proceedings of the Congress on Evolutionary Computation, IEEE, 2, 1999, pp. 1470–1477.

[33]

Döring C., Lesot M. J., and Kruse R., Data analysis with fuzzy clustering methods, Computational Statistics and Data Analysis, 2006, pp. 192-214.

[34]

Duan J., Qiu G., Novel histogram processing for colour image enhancement, Third International Conference on Image and Graphics, 4, 2004, pp. 55–58.

[35]

Du Y. and Gower J.F.R., Cloud detection and thin cloud calibration in NOAA AVHRR images with fuzzy logic. Canadian Journal of Remote Sensing, 2000, pp.54-63.

[36]

Fan J. L., Zhen W. Z., and Xie W. X., Suppressed fuzzy c-means clustering algorithm, Pattern Recognition Letters, 2003, pp. 1607-1612.

[37]

Farid M. và Lorenzo B., Classification of Hyperspectral Remote Sensing Images With Support Vector Machines, IEEE, 2004, pp. 1778-1790.

[38]

Fedi, M., Quarta T., (1998), “Wavelet analysis for the regional - residual separation of potential field anomalies”, Geophysical Prospecting, Vol. 46, pp. 507-525.

[39]

Forsyth D.A. and Ponce J., Computer Vision: A Modern Approach, Prentice Hall, 2003, pp.1074-1081.

[40]

Forster, B.C., Derivation of atmospheric correction procedures for Landsat MSS with particular reference to urban data, International Journal of Remote Sensing. 1984, pp. 799-817.

[41]

Gabor D., (1946). “Theory of communication”, Jour. IEEE, (London), 93, pp. 429-457.

[42]

Global Marketing Insights Inc., Survey and Analysis of Remote Sensing Market Aerial and Spaceborne, 2005.

[43] Golpar E. R., Hasanzade M., Lot T., F. Fattahzadeh, Multi Resolution

152

Fuzzy Segmentation of Satellite Images, International Journal Industrial Mathematics Vol. 1, No. 1 (2009), pp. 77-85.

[44]

Hanmandlu M., Jha D., Sharma R., Color image enhancement by fuzzy intensification, Pattern Recognition. Lett., 24, 2003, pp. 81–87.

[45]

Hanmandlu M., Member, IEEE and Devendra Jha, An optimal Fuzzy System for color image enhancement, IEEE Trans., 15, 2006, pp. 2956- 2966.

[44]

Hall F.G., Strebel D.E., Nickeson J.E. and Goetz S.J., Radiometric rectification: Towards a common radiometric response among multidate, multisensor images, Remote Sensing of Environment, 1991, 35: pp. 11- 27.

[47]

Hasanien A.E., Badr A., A Comparative Study on Digital Mamography Enhancement Algorithms Based on Fuzzy Theory, Studies in Informatics and Control, Vol.12, No.1, March 2003, pp.21-31.

[48]

He K., Sun J. and Tang X., Single image haze removal using dark channel prior, IEEE Conferenceon Computer Vision and Pattern Recognition, 2009, pp.1956-1963.

[49]

Hoel L. C. and Carl F., A fast fuzzyc-means algorithm for color image segmentation, EUSFLAT-LFA, France, 2011, pp. 1074-1081.

[50]

Höppner F., Speeding up fuzzy c-means using a hierarchical data organization tocontrol the precision of membership calculation, Fuzzy Sets and Systems, Vol. 128, 2002, pp. 365-376.

[51]

Huang K.Q., Wang Q., Wu Z.Y., Natural color image enhancement and evaluation algorithm based on human visual system, Comput. Vis. Image Underst., 103, 2006, pp. 52–63.

[52]

Intan A. Y., Nor A. M. I., Two-Dimensional Clustering Algorithms for Image Segmentation, WSEAS Transactions on Computers, Issue 10, Volume 10, October 2011, pp.332-342.

[53]

Jain A., Murty M., and Flynn P., Data clustering: A review, ACM Computing Surveys, 31, 1999, pp. 264–323.

153

[54]

James T., Galen G., A contiguity-enhanced k-means clustering algorithm for unsupervised multispectral image segmentation, Proc SPIE 3159, 1997, pp. 108-118.

[55]

Jaroslav Ramík, SoftComputing: Overview and Recent Developments in Fuzzy Optimization, 2011.

[56]

Jaynes E.T., Information Theory and Statistical Mechanics. Physical Review, 1957, pp. 620-630.

[57]

Jiefeng J., Jing Z., Gege Y., Dapeng Z., Lianjun Z., Application of Back Propagation Neural Network in the Classification of High Resolution Remote Sensing Image, supported by the geographic information technology research, 2009.

[58]

John S., Hanmandlu M., Vasikarla S., Fuzzy based arameterized Guassian Edge Detector Using Global and Local Properties, International Conference on Information Technology, 02, 2005, pp. 101– 106.

[59]

John A. R., Xiuping J., Remote Sensing Digital Image Analysis, Springer-Verlag Berlin Heidelberg 2006.

[60] Kaiser, G., (1994), “A friendly guide of wavelets”, Birkkauser.

[61]

Kanungo T. et al, An efficient k-means clustering algorithm: analysis and implementation, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, pp. 881-892.

[62]

Norman K. et al, Principles of Remote Sensing, The International Institute for Geo-Information Science and Earth Observation, The Netherlands, 2004

[63]

Krinidis S. and Chatzis V., A robust fuzzy local information c-means clustering algorithm, IEEE Transactions on Image Processing, 19, 2010, pp. 1328–1337.

[64]

Lai J. Z. C., Huang T. J., and Liaw Y. C., A fast k-means clustering algorithm using cluster center displacement, Pattern Recognition, Vol. 42, 2009, pp. 2551-2556.

154

[65] images.

Lavreau, J. (1991), De-haze Landsat Thematic Mapper Photogrammetric Engineering and Remote Sensing. 57:1297-1302.

[66]

Leukert k., Transferability of knowledge-based classification rules, ISPRS2004, Istanbul, 2004.

[67]

Liangpei Z., Xin H., Bo H., and Pingxiang L., A Pixel Shape Index Coupled With Spectral Information for Classification of High Spatial Resolution Remotely Sensed Imagery, In the proceedings of IEEE transactions on Geosciences and remote sensing, VOL. 44, NO. 10, OCTOBER 2006, pp. 2950 - 2961.

[68]

Liew A., Leung S.H., and Lau W.H., Segmentation of color lip images by spatial fuzzy clustering, IEEE Transactions on Fuzzy Systems, 11(4), 2003, pp. 542–549.

[69]

Lior S., Human Perception-based Color Segmentation Using Fuzzy Logic, IPCV, 2, 2006, pp. 496-502.

[70]

Long J., Shi Z., Tang W., Zhang C., Single Remote Sensing Image Dehazing, IEEE Geoscience and Remote Sensing, 2013, pp. 59 – 63.

[71] Mallat, S., (1989), “Multiresolution approximations and wavelet the American

orthonormal bases of L2(R)”, Transactions of Mathematical Society, Vol.315, No.1.

[72] Manglesh K., Shweta S., Priya B., An efficient algorithm

for Journal of Computer Science and Indian

ImageEnhancement, Engineering (IJCSE), 2, 2005, pp. 118-123.

[73] Matinfar H.R., Sarmadian F., Alavi P. S.K., Heck R.J., Comparison of object-oriented and pixel-based classification on Lansadsat7, Etm+ Spectral Bands (Case Study: Arid Region of Iran)”, American-Eurasian J. Agric. & Environ, 2007, pp.448-456.

[74] Meshoul S., Batouche M., Ant colony system with extremal dynamics for point matching and pose estimation, International Conference on Pattern Recognition, 3, 2002, pp. 823–826.

[75] Mryka H. B., The GLCM Tutorial, 2007.

155

[76]

Naik S.K., Murthy C.A., Hue-preserving color image enhancement without gamut problem, IEEE Trans. Image Process., 12, 2003, pp. 1591–1598.

[77]

Napoleon D., Ramaraj E., An Efficient Segmentation of Remote Sensing Images For The Classification of Satellite Data Using K-Means Clustering Algorithm, International Journal for Innovative Research in Science & Technology| Volume 1 | Issue 6 | November 2014, pp. 314- 319.

[78]

Nedeljkovic, Image Classification Based On Fuzzy Logic, The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vol. 34, Part XXX, 2007.

[79]

Neteler M. and Mitasova H., Open Source GIS: A GRASS GIS Approach, 3rd Edition, 2008, Springer, New York.

[80]

Nill N. B. and Bouzas B.., Objective image quality measure derived from digital image power spectra, Optical Engineering, 1992, pp. 813-825.

[81]

Om P. V., Puneet K., Hanmandlu M., Sidharth C., High dynamic range optimal fuzzy color image enhancement using Artificial Ant Colony System, Applied Soft Computing, 12, 2011, pp. 394-404.

[82]

Ottermen, J., and Robinove, C. J. (1981), Effects of the atmosphere on the detection of surface changes from Landsat Multispectral Scanner data, International Journal of Remote Sensing. 2 (4): 351-360.

[83]

Pabitra M., Unsupervised Feautre Selection using Feautre Similarity, In the proceedings of IEEE transactions on Geosciences and remote sensing, vol. 44, NO. 10, October 2002, pp. 301 - 312.

[84]

Palanikumar S., Sasikumar M., J. Rajeesh, Entropy Optimized Palmprint Enhancement Using Genetic Algorithm and Histogram Equalization, International Journal of Genetic Engineering, 2, 2012, pp. 12-18.

[85]

Parvathi K. et al, Pyramidal Watershed Segmentation Algorithm For High Resolution Remote Sensing Images Using Discrete Wavelet Transforms, Discrete Dynamics in Nature and Society Volume 2009 (2009), Article ID 601638, 11 pages.

156

[86]

Pelleg D. and Moore A., Accelerating exact k-means algorithms with geometric reasoning, in Proceedings of ACM SIGKDD International Conference on Knowledge and Data Mining, 1999, pp. 277-281.

[87]

Ratika Pradhan, M. K. Ghose, A. Jeyaram, Land Cover Classification of Remotely Sensed Satellite Data using Bayesian and Hybrid classifier, International Journal of Computer Applications, 2010, pp. 1-4.

[88]

Rahimi S., Zargham M., Thakre. A.; and Chhillar D., A Parallel Fuzzy C- Mean algorithm for Image Segmentation, Publications. Paper 26, http://opensiuc.lib.siu.edu/cs_pubs/26, 2004, pp. 234-237.

[89]

Richter, R., A fast atmospheric correction algorithm applied to Landsat TM images, International Journal of Remote Sensing, 1990, 11(1): 159- 166.

[90]

Richter R., Atmospheric correction of satellite data with haze removal including a haze/clear transition region, Computers & Geosciences, 1996, 22(6): pp. 675-681.

[91]

Richter R., A spatially adaptive fast atmospheric correction algorithm, International Journal of Remote Sensing, 1996, 17(6): pp. 1201-1214.

[92] Ridsdill Smith, T. A. and Dentith, M. C., (1999), “The wavelet transform in aeromagnetic processing, Geophysics”, Vol 64, pp.1003–1013.

[93]

Roli F., Fumera G., Support Vector Machines for Remote-Sensing Image Classification, Proceedings of SPIE Image and Signal Processing for Remote Sensing VI, Vol. 4170, 2011, pp. 160-166.

[94]

Sarode M.K.V, Ladhake S.A., Deshmukh P.R., Fuzzy system for color image enhancement, World Academy of Science, Engineering & Technology, 48, 2008, pp. 311-316.

[95]

Shankar B. U. and Pal N., FFCM: An effective method for large data sets, in Proceedings of the 3rd International Conference on Fuzzy, Logic, Neural Nets, and Soft Computing, 1994, pp. 331-332.

[96]

Smriti S., Remotely Sensed LANDSAT Image Classification Using Neural Network Approaches, International Journal of Engineering Research and Applications (IJERA), Vol. 2, Issue 5, 2012, pp.43-46.

157

[97]

Spanner M.A., Pierce L.L., Peterson D.L., and S.W. Running, Remote Sensing of temperate coniferous forest leaf area index: the influence of canopy closure, understory vegetation and background reflectance, International Jounal of Remote Sensing, 1990, 11 (6): pp. 1469-1476.

[98]

Subba R. K., Raju C. N., and Maddala L. B., Feature Extraction for Image Classification and Analysis with Ant Colony Optimization Using Fuzzy Logic Approach, Signal and image processing, An International Journal (SIPIJ), 2(4), 2011, pp.137-143.

[99]

International

Sudhavani G., Srilakshmi M., Rao P. V., Comparison of Fuzzy Contrast Journal of Computer Enhancement Techniques, Applications, Volume 95– No.22, June 2014, pp.26-31.

[100] Sun X.X., Zhang J.X. and Liu Z.J.,A Comparison of Object-Oriented and Pixel-Based Classification Approachs Using Quickbird Imagery, ISPRS Proceedings, XXXVI-2/W25, 2005.

[101] Swaminathan R., Dr.Manoj Wadhwa, Satellite Image enhancement using Combination of Transform Techniques and Interpolation Methods, International Journal Of Engineering And Computer Science ISSN:2319- 7242, Volume 3 Issue 4 April, 2014.

[102] Tang B., Sapiro G., Caselles V., Color image enhancement via chromaticity diffusion, IEEE Trans. Image Process., 10, 2001, pp. 701– 707.

[103] Tanre D., Deroo C., Duhaut M., Morcrette J.J., Perbos J., and P.Y. Deschamps, Description of a computer code to simulate the satellite signal in the solar spectrum: the 5S code. International Journal of Remote Sensing, 1990, 11 (2): pp. 659-668.

[104] Tao C.W., Taur J.S., Jeng J.T., and Wang W.Y., A Novel Fuzzy Ant Colony System for Parameter Determination of Fuzzy Controllers, International Journal of Fuzzy Systems, 11(4), 2009, pp.298-307.

[105] Tarel J.P. and Hautiere N., Fast visibility restoration from a single color

or gray level image, IEEE ICCV, 2009.

[106] Teillet P.M., A status overview of earth observation

158

calibration/validation for terrestrial applications. Canadian Journal of Remote Sensing. 1997, pp. 291-298.

[107] Teillet P.M. and Fedosejevs G., On the dark target approach to atmospheric correction of remotely sensed data, Canadian Journal of Remote Sensing. 1995, pp. 374-387.

[108] Tian J., Yu W., Xie S., An ant colony optimization algorithm for image edge detection, IEEE Congress on Evolutionary Computation, 9, 2008, pp. 751–756.

[109] Tinku Acharya, Ajoy K. R., Image Processing: Principles and

Applications, John Wiley & Sons, Inc, 2005.

[110] TIZHOOSH H. R., FOCHEM M., Image Enhancement with Fuzzy Histogram Hyperbolization, Proceedings of EUFIT’95, vol. 3, 1995, pp. 1695-1698.

[111] Ucan O.N., Seker, S., Albora, A.M. and Ozmen A., (2000), “Separation of magnetic fields in geophysical studies using a 2-D multi-resolution Wavelet analysis approach”, Journal of Bankan Geophysical Society, Vol.3, pp. 53-58.

[112] Valliammal N.,Geethalakshmi S.N., Leaf Image Segmentation Based On the Combination of Wavelet Transform and K Means Clustering, International Journal of Advanced Research in Artificial Intelligence, Vol. 1, No. 3, 2012, pp.37-43.

[113] Vecsey, L., (2002), Chaos in thermal convection and the wavelet analysis of geophysics field, Ph. D. Thesis, Charles University, Prague, pp. 7-20.

[114] Vittorio M., Luca M. G., Fabio D. L., Ant Colony Optimization, Optimization Techniques in Engineering. Springer-Verlag conference, 141,2004, pp. 101-117.

[115] Vincent R. K., An ERTS Multispectral scanner experiment for mapping iron compounds, In proceedings of the Eighth International Symposium on Remote Sensing of Environment, Ann Arbor, Michigan, 1973, pp. 1239-1247.

[116] Weibao Z., Neural network based remote sensing image classification in

159

urban area, IEEE, 2012, pp.1-6.

[117] Xin H., Liangpei Z., and Pingxiang L., Classification and Extraction of spatial Features in Urban Areas Using High Resolution Multispectral Imagery, In the proceedings of IEEE Geosciences and remote sensing letters, VOL. 4, NO. 2, APRIL 2007, pp. 260 - 264.

[118] Yang M-S. and Tsai H-S., A Gaussian kernel based fuzzy c-means algorithm with a spatial bias correction, Pattern Recognition Letters, 29(12), 2008, pp. 1713–1725.

[119] Yinghua Lu, Tinghuai Ma, Changhong Yin, Xiaoyu Xie, Wei Tian and ShuiMing Zhong, Implementation of the Fuzzy C-Means Clustering Algorithm in Meteorological Data, International Journal of Database Theory and Application, Vol.6, No.6 (2013), pp.1-18.

[120] Yong Du, Bert Guindon and Josef Cihlar, Haze Detection and Removal in High Resolution Satellite Image with Wavelet Analysis, IEEE Transactions on Geoscience and Remote Sensing, 2002, vol. 40, issue 1, pp. 210-217.

[121] Yu D., Ma L. H., Lu H.Q., Normalized SI correction for hue-preserving image enhancement, International Conference on Machine

color Learning and Cybernetics, 2007, pp. 1498–1503.

[122] Yu Q.et al, Dark Pixel Detection: A Novel Single Image Dehaze

Approach, IVCNZ, 2011.

[123] Zhenhua L., Yingjie H., Haidong Z., Wu J., Bo Li, and Hui Zhao, Parallel K-Means Clustering of Remote Sensing Images Based on MapReduce, Springer-Verlag Berlin Heidelberg 2010, pp. 162–170.

[124] Zhu Xifang, Wu Feng, An Improved Approach to Remove Cloud and Mist from Remote Sensing Images Based on Mallat Algorithm, International Symposium on Photoelectronic Detection and Imaging 2007, Beijing 2007, pp. 662510.1-662510.9.

[125] Zhuge Y., Cao Y., Miller R. W., GPU Accelerated Fuzzy Connected Image Segmentation by using CUDA, In: Engineering in Medicine and Biology Society, EMBC 2009, Annual International Conference of the

160

IEEE, 2009, pp. 6341-6344.

[126] http://www.grass.itc.it

[127]

http://stats.stackexchange.com/questions/62621/recall-and-precision-in- classification

[128] http://www.onmyphd.com/?p=k-means.clustering.

[129] http://www.ungdunggis.edu.vn/

161

PHỤ LỤC – BIẾN ĐỔI WAVELET

Trong xử lý tín hiệu, phép biến đổi Fourier (FT, Fourier Transform) là một công cụ toán học quan trọng vì nó là cầu nối cho việc biểu diễn tín hiệu giữa miền

không gian và miền tần số; việc biểu diễn tín hiệu trong miền tần số đôi khi có lợi

hơn là việc biểu diễn trong miền không gian. Hình 1a biểu diễn tín hiệu theo thời

gian, hình 1b biểu diễn phép biến đổi Fourier của tín hiệu trong miền tần số. Tuy nhiên, phép biến đổi Fourier chỉ cung cấp thông tin có tính toàn cục và chỉ thích hợp

cho những tín hiệu tuần hoàn, không chứa các đột biến hoặc các thay đổi không dự

báo được. Trong hình 1b, phổ của f(t) cho thấy các thành phần tần số cấu thành tín

hiệu nhưng không cho biết các tần số này xuất hiện ở đâu. Để khắc phục khuyết điểm này, Gabor, D., (1946) [41] đã áp dụng phép biến đổi Fourier cửa sổ (WFT,

Windowed Fourier Transform) cho từng đoạn nhỏ của tín hiệu (cửa sổ); phép biến đổi này cho thấy mối liên hệ giữa không gian và tần số nhưng bị khống chế bởi

nguyên lý bất định Heisengber cho các thành phần tần số cao và tần số thấp trong

tín hiệu (Kaiser, G., 1994) [60]. Phép biến đổi wavelet là bước tiếp theo để khắc

phục hạn chế này.

Hình 1a: Tín hiệu f(t).

162

Hình 1b: Biến đổi Fourier của tín hiệu f(t).

Năm 1975, Morlet, J., phát triển phương pháp đa phân giải (multiresolution).

Trong đó, ông ta sử dụng một xung dao động, được hiểu là một “wavelet” (dịch

theo từ gốc của nó là một sóng nhỏ) cho thay đổi kích thước và so sánh với tín hiệu

ở từng đoạn riêng biệt. Kỹ thuật này bắt đầu với sóng nhỏ (wavelet) chứa các dao

động tần số khá thấp, sóng nhỏ này được so sánh với tín hiệu phân tích để có một

bức tranh toàn cục của tín hiệu ở độ phân giải thô. Sau đó sóng nhỏ được nén lại để

nâng cao dần tần số dao động. Quá trình này gọi là làm thay đổi tỉ lệ (scale) phân

tích; khi thực hiện tiếp bước so sánh, tín hiệu sẽ được nghiên cứu chi tiết ở các độ

phân giải cao hơn, giúp phát hiện các thành phần biến thiên nhanh còn ẩn bên trong

tín hiệu.

1. Phép biến đổi Wavelet liên tục

1.1. Phép biến đổi wavelet thuận

Gọi f(x) là tín hiệu 1-D, phép biến đổi wavelet liên tục của f(x) sử dụng hàm

wavelet được biểu diễn bởi:

( ∫ ( )

(75) ( ) ) √

trong đó:

- ( ) là hệ số biến đổi wavelet liên tục của f(x), với s là tỉ lệ (nghịch đảo

( ) là hàm liên hiệp phức của wavelet ( ) được gọi là hàm wavelet

của tần số) và b là dịch chuyển đặt trưng vị trí.

- phân tích.

163

Phương trình (1) cho thấy, phép biến đổi wavelet là một ánh xạ chuyển từ hàm

một biến f(x) thành hàm W(s, b) phụ thuộc hai biến số là biến tỉ lệ s và biến dịch

chuyển b. Hệ số chuẩn hóa trong (75) đảm bảo cho sự chuẩn hóa sóng wavelet

với các tỉ lệ phân tích s khác nhau ‖ ( )‖ ‖ ‖.

Phép biến đổi wavelet có tính linh động cao so với phép biến đổi Fourier (sử

dụng duy nhất hàm mũ) vì không nhất thiết phải sử dụng một hàm wavelet cố định,

và có thể lựa chọn các hàm wavelet khác nhau trong họ hàm wavelet sao cho thích

hợp với bài toán (hình dạng của hàm wavelet phù hợp với tín hiệu cần phân tích) để kết quả phân tích là tốt nhất. Hiện nay, người ta đã xây dựng được khoảng vài chục

các họ hàm wavelet khác nhau nhằm áp dụng cho nhiều mục đích phân tích đa

dạng. Hình 2 đồ thị của ba hàm wavelet là hàm wavelet Harr, hàm wavelet

Daubechies 5 và hàm wavelet Morlet.

Biểu thức (75) có thể viết lại dưới dạng tích trong (inner product) như sau:

(76) ( ) 〈 ( ) ( )( )〉

trong đó:

(77) ) ( )( ) ( √

Hình 2: Ba dạng hàm wavelet.

a) Wavelet Harr, b) Wavelet Daubechies 5, c) Wavelet Morlet.

1.2. Phép biến đổi wavelet nghịch

164

Tương tự như phép biến đổi Fourier, phép biến đổi wavelet liên tục có tính

thuận nghịch. Nếu phép biến đổi wavelet thuận có dạng (75) thì phép biến đổi

wavelet nghịch có dạng:

∫ ∫

( ) ) (78) ( ) (

trong đó: cg là hằng số phụ thuộc vào hàm wavelet được sử dụng. Công thức (78) cho phép khôi phục lại tín hiệu nguyên thủy từ các hệ số biến đổi wavelet bằng

phép tính tích phân theo toàn bộ các tham số tỉ lệ s và dịch chuyển b. Trong (78), hàm wavelet được sử dụng thay cho hàm liên hiệp phức của nó trong biểu thức (75).

Trong thực tế, việc khôi phục chính xác tín hiệu gốc từ phép biến đổi wavelet

gặp khó khăn (không giống như việc khôi phục tín hiệu từ phép biến đổi Fourier).

Theo Vecsey, L., (2002) [113] việc khôi phục tín hiệu gốc từ phép biến đổi wavelet

sẽ cho kết quả chính xác khi phương trình sau đây được thỏa:

‖ ̂( )‖ ‖ ‖

(79) } { ∫ ∫

trong đó: ̂( ) là biến đổi Fourier của hàm ( ).

2. Phép biến đổi Wavelet rời rạc

Cơ sở của phép biến đổi wavelet rời rạc (DWT, Discrete Wavelet Transform)

có từ năm 1976 khi Croiser, Esteban và Galand đưa ra kỹ thuật biến đổi tín hiệu

thời gian rời rạc; đến cuối năm 1976, Crochiere, Weber và Flanagan [30] đã dùng

phép biến đổi wavelet rời rạc để mã hóa tiếng nói, kỹ thuật này tương tự kỹ thuật

của Croiser và có tên là sự mã hoá băng con (subband coding). Năm 1983, Burt, P. J. và Adelson, E.H., [21] phát triển phương pháp mã hoá băng con và đặt tên là mã hóa hình tháp (pyramidal coding). Năm 1989, Mallat, S., [71] đưa ra kỹ thuật phân tích đa phân giải (multiresolution analysis) trên cơ sở mã hóa hình tháp và đề xuất các họ hàm wavelet trực giao để áp dụng trong xử lý tín hiệu số.

Trong phân tích tài liệu từ (và trọng lực), phép biến đổi wavelet rời rạc được

sử dụng trong việc lọc nhiễu tài liệu từ hàng không (Ridsdill – Smith, T.A. và

165

Dentith, M.C., (1999) [92]) và tách trường khu vực và trường địa phương từ trường

quan sát (Fedi, M., Quarta, T., (1998), [38], Ucan, O.N., và nnk., (2000) [111]). Ở

Việt Nam, Đặng Văn Liệt và nnk., (2002) [3], (2005) [1] đã sử dụng phép biến đổi wavelet rời rạc để lọc nhiễu và tách trường khu vực và trường địa phương. Ngoài ra,

còn có nhiều nhóm nghiên cứu khác sử dụng phép biến đổi wavelet rời rạc trong cáclĩnh vực khác như viễn thông, điện tử, y học…

2.1. Phép biến đổi wavelet rời rạc và phân tích đa phân giải

Ý tưởng của phân tích đa phân giải là sử dụng các kỹ thuật lọc số trong quá

trình phân tích. Trong đó, mỗi một tín hiệu được phân tích thành hai thành phần:

thành phần xấp xỉ A (Approximation) ‘tương ứng với thành phần tần số thấp’ và thành phần chi tiết D (Detail) ‘tương ứng với thành phần tần số cao’, thông qua hai

bộ lọc thông thấp và thông cao như mô tả trong hình 1.10. Trong đó, bộ lọc thông

cao sử dụng hàm wavelet ψ(x) và bộ lọc thông thấp sử dụng hàm tỉ lệ (scaling function) Φ(x). Mối quan hệ giữa hàm tỉ lệ và hàm wavelet đươc cho bởi:

(80) ( ) ∑ ( )

(81) ( ) ∑( ) ( )

Các phép lọc được tiến hành với nhiều tầng (level) khác nhau và để khối

lượng tính toán không tăng, khi qua mỗi bộ lọc, tín hiệu được lấy mẫu xuống 2.

Ứng với mỗi tầng, tín hiệu có độ phân giải khác nhau. Do đó, phép biến đổi wavelet rời rạc được gọi là phân tích đa phân giải (MRA, multiresolution analysis).

166

Hình 2: Phân tích đa phân giải sử dụng biến đổi wavelet rời rạc.

Tại mỗi tầng lọc, biểu thức của phép lọc được cho bởi công thức:

( ) ∑ ( ) ( ) (82)

( ) ∑ ( ) ( ) (83)

Trong đó, S(n) là tín hiệu, h(n) là đáp ứng xung của các bộ lọc thông thấp tương ứng với hàm tỉ lệ Φ(n) và g(n) là đáp ứng xung của các bộ lọc thông cao tương ứng với hàm wavelet ψ(n). Hai bộ lọc này liên hệ nhau theo hệ thức:

(84) ( ) ( ) ( )

167

trong đó, N là số mẫu trong tín hiệu.

Tín hiệu S(n) có thể được tái tạo theo các bước ngược lại gọi là phép biến đổi

wavelet rời rạc nghịch (IDWT, inverse discrete wavelet transform) được cho bởi:

( ) ∑ ( ( ) ( )) ( ( ) (85)

( ))

trong đó, ( ) và ( ) lần lượt là tín hiệu ngõ ra sau khi đi qua các bộ lọc thông cao và bộ lọc thông thấp đã đề cập ở trên. Để đảm bảo cho việc phục hồi tín

hiệu được chính xác như ban đầu, khi qua mỗi tầng lọc tái tạo, tín hiệu được tiến

hành lấy mẫu lên 2.

Lưu ý là không phải các hàm wavelet nào cũng tồn tại hàm tỉ lệ tương ứng xác

định từ biểu thức (80) và (81); nên khi thực hiện phép biến đổi wavelet rời rạc, phải

chọn lựa các hàm wavelet có hàm tỉ lệ tương ứng như hệ hàm wavelet Daubechies

trực chuẩn – họ hàm này đều có các hàm tỉ lệ tương ứng.

2.2. Phép biến đổi wavelet rời rạc hai chiều

Để xử lý các dữ liệu hai chiều, cần sử dụng các phép biến đổi wavelet hai

chiều (Ucan, O.N., (2000) [111]) . Trong phép biến đổi wavelet rời rạc hai chiều (2-

D), tín hiệu hai chiều S(x, y) được tách thành nhiều tín hiệu một chiều rồi lấy biến đổi wavelet 1-D trên chúng. Kết quả tổng hợp là biến đổi wavelet 2-D của tín hiệu.

Hình 1.11 mô tả quá trình thực hiện biến đổi wavelet rời rạc hai chiều. Gọi x

và y là hai trục tọa độ của tín hiệu 2-D, L là phép lọc thông thấp, H là phép lọc

thông cao (tương tự trường hợp 1-D), phép biến đổi wavelet 2-D được tính cụ thể

như sau:

( )( ) ( ) ( )

(85)

( )( ) ( ) ( )

(87)

( )( ) ( ) ( )

(88)

( )( ) ( ) ( )

(89)

168

Hình 3: Phép biến đổi wavelet rời rạc 2-D.

169