BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NGUYỄN TU TRUNG
NGHIÊN CỨU NÂNG CAO CHẤT LƯỢNG VÀ GIẢI ĐOÁN
ẢNH VIỄN THÁM ĐA PHỔ DỰA TRÊN TÍNH TOÁN MỀM
LUẬN ÁN TIẾN SĨ KỸ THUẬT
HÀ NỘI – 2018
1
BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NGUYỄN TU TRUNG
NGHIÊN CỨU NÂNG CAO CHẤT LƯỢNG VÀ GIẢI ĐOÁN
ẢNH VIỄN THÁM ĐA PHỔ DỰA TRÊN TÍNH TOÁN MỀM
Chuyên ngành: Hệ thống thông tin
Mã số: 9.48.01.04
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người hướng dẫn khoa học:
1. TS. Vũ Văn Thoả
2. PGS.TS. Đặng Văn Đức
HÀ NỘI – 2018
2
MỤC LỤC
LỜI CAM ĐOAN 7
LỜI CẢM ƠN 8
DANH MỤC CHỮ VIẾT TẮT 9
DANH SÁCH BẢNG 11
DANH SÁCH HÌNH VẼ 13
PHẦN MỞ ĐẦU 17
1. Tính cấp thiết của luận án 17
2. Mục tiêu, đối tượng và phương pháp nghiên cứu của luận án 19
3. Đóng góp chính của luận án 20
4. Bố cục của luận án 20
CHƯƠNG I - TỔNG QUAN VỀ VIỄN THÁM VÀ GIẢI ĐOÁN ẢNH VIỄN
THÁM ĐA PHỔ 22
1.1. Tổng quan về viễn thám 22
1.1.1. Tiến trình viễn thám 22
1.1.2. Đặc trưng viễn thám 23
1.1.3. Khuôn mẫu ảnh viễn thám 25
1.1.4. Các loại ảnh viễn thám 25
1.2. Tổng quan về giải đoán, phân tích ảnh viễn thám đa phổ 26
1.2.1. Khái quát về giải đoán, phân tích ảnh viễn thám đa phổ 26
1.2.2. Khái niệm và tiến trình giải đoán ảnh đa phổ 26
1.2.3. Hiệu chỉnh ảnh 29
1.2.4. Tăng cường chất lượng ảnh trực quan 32
1.2.5. Giải đoán thủ công 34
1.2.6. Giải đoán tự động theo phương pháp số 35
3
1.2.7. Hậu giải đoán, phân lớp 41
1.3. Tổng quan về tính toán mềm 42
1.3.1. Khái niệm về tính toán mềm 42
1.3.2. Phân biệt tính toán mềm và tính toán cứng 43
1.3.3. Một số đặc điểm của tính toán mềm 44
1.3.4. Các kỹ thuật trong tính toán mềm 45
1.4. Tình hình nghiên cứu trong và ngoài nước 47
1.4.1. Tăng cường hình ảnh trực quan 47
1.4.2. Giải đoán ảnh viễn thám 57
1.5. Phân tích, đánh giá về thành công, ưu điểm, hạn chế 71
1.6. Kết luận chương I 72
CHƯƠNG II: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN TĂNG CƯỜNG ĐỘ
TƯƠNG PHẢN ẢNH VIỄN THÁM ĐA PHỔ 73
2.1. Một số thuật toán tăng cường độ tương phản ảnh dựa trên logic mờ 73
2.1.1. Tăng cường ảnh mờ với toán tử tăng cường 73
2.1.2. Tăng cường ảnh mờ với toán tử Hyperbol 73
2.1.1. Tăng cường ảnh mờ dựa trên phân bố xác suất 74
2.1.2. Cải thiện độ tương phản dựa trên luật If-Then mờ 75
2.2. Hạn chế của các thuật toán tăng cường mờ 75
2.3. Một số độ đo chất lượng tăng cường ảnh 76
2.4. Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục
bộ 78
2.5. Tăng cường ảnh viễn thám sử dụng phân cụm mờ 79
2.5.1. Thuật toán tăng cường ảnh viễn thám sử dụng phân cụm mờ 79
2.5.2. Phát triển thuật toán LoRSIE_FCM cho ảnh đa phổ 83
2.5.3. Thuật toán tăng cường ảnh viễn thám kích thước lớn 84
4
2.5.5. Thử nghiệm và đánh giá 85
2.6. Tăng cường ảnh viễn thám sử dụng phân cụm KMeans 93
2.6.1. Thuật toán tăng cường ảnh viễn thám sử dụng thuật toán phân cụm
KMeans 93
2.6.2. Phát triển thuật toán cho ảnh đa phổ 96
2.6.3. Thử nghiệm và đánh giá 97
2.7. Kết luận chương II 101
CHƯƠNG III: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN LỚP ẢNH VIỄN
THÁM ĐA PHỔ 103
3.1. Phân cụm ảnh viễn thám với thuật toán KMeans 103
3.1.1. Thuật toán KMeans 103
3.1.2. Thuật toán CCEA_KMeans 103
3.1.3. Thuật toán 2D-KMeans 104
3.1.4. Hạn chế của thuật toán KMeans 104
3.1.5. Một số độ đo chất lượng phân cụm ảnh 105
3.1.6. Đề xuất thuật toán WIKMeans 105
3.1.7. Đề xuất thuật toán CIKMeans 112
3.1.8. Đề xuất thuật toán KMeansCMN 119
3.2. Phân cụm ảnh viễn thám với thuật toán Fuzzy C-Means 127
3.2.1. Hạn chế của thuật toán Fuzzy C-Means 127
3.2.2. Đề xuất thuật toán lsiFCM 127
3.3. Phân lớp ảnh viễn thám 132
3.3.1. Phân lớp hợp lý tối đa 132
3.3.2. Một số độ đo phân lớp 134
3.3.3. Đề xuất tiếp cận lai cho phân lớp ảnh viễn thám 135
3.4. Kết luận chương III 143
5
KẾT LUẬN 145
DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA NGHIÊN CỨU SINH 147
TÀI LIỆU THAM KHẢO 149
PHỤ LỤC – BIẾN ĐỔI WAVELET 162
6
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các
kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép
từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn
tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Tác giả luận án
Nguyễn Tu Trung
7
LỜI CẢM ƠN
Luận án này báo cáo các kết quả nghiên cứu trong thời gian tôi làm nghiên
cứu sinh. Trong suốt thời gian này ngoài nỗ lực làm việc của bản thân tôi, phòng
Tin học Viễn thông và nhóm aSoftwareGroup, Viện Công nghệ Thông tin đã tạo
cho tôi một môi trường làm việc, điều kiện để thực hiện các nghiên cứu về chuyên
nghành xử lý ảnh nói chung và xử lý ảnh viễn thám nói riêng.
Tôi xin chân thành cảm ơn TS. Vũ Văn Thoả, PGS.TS Đặng Văn Đức đã tận
tình hướng dẫn tôi để hoàn thành được luận án này. Tôi cũng xin chân thành cảm ơn
thầy Ngô Hoàng Huy, phòng Nhận dạng và Công nghệ Tri thức, Viện Công nghệ
Thông tin. Thầy có ảnh hưởng rất lớn đến lĩnh vực nghiên cứu mà tôi quan tâm.
Xin cảm ơn các đồng nghiệp tại Tin học Viễn thông, Viện Công nghệ Thông
tin đã đóng góp những ý kiến thiết thực mỗi lần tôi seminar về vấn đề xử lý ảnh
viễn thám.
Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới bố mẹ tôi, vợ tôi và đại gia
đình tôi mà thiếu họ chắc chắn tôi đã không đủ nghị lực để hoàn thành công trình
này.
8
DANH MỤC CHỮ VIẾT TẮT
AIVHE Adaptively Increasing Value Histogram Equalization
Ant System AS
Ant Colony Optimization ACO
Ant Colony System ACS
KMeans KM
Moving KMeans MKM
Two-Dimensional KMeans 2D-KM
2D-MKM Two-Dimensional Moving Kmeans
FKM Fuzzy Kmeans
CDFKM Center Displacement FKM
Cluster Center Estimation Algorithm CCEA
Open Source Cluster Application Resource OSCAR
Compute Unified Device Architecture CUDA
MR-FCM Multi Resolution Fuzzy C-Means
Gray level co-occurrence matrix GLCM
Maximum information compression index MICI
Back Propagation Through Structure BPTS
MDASER Multispectral Data Analysis System for Earth Resource
Maximum Likelihood Classification MLC
Layered Neural Networks LNN
Back propagation neural network BPNN
pulse coupled neural network PCNN
9
SVM Support vector Machine
GRASS Geographic Resources Analysis Support System
LoRSIE Local based Remote Sensing Image Enhancement
DWT Discrete Wavelet Transform
LaSRSIE Large Size Remote Sensing Image Enhancement
wiKMeans Wavelet init Kmeans
CIKMeans Context Information Kmeans
WICI-Kmeans Wavelet init - Context Information Kmeans
cwKMeans Center Weight Kmeans
CMN Cepstal Mean Normalisation
lsiFCM large size image Fuzzy cMeans
PSI Pixel Shape Index
MICI Maximum Information Compression Index
10
DANH SÁCH BẢNG
Bảng 1.1. Ảnh phân loại cuối cùng (a) ảnh gốc và (b) đến (d) là các ảnh gốc được
áp watershed từ độ phân giải mức 2 đến mức 0 tương ứng [85]. .............................. 63
Bảng 2.1. Quy trình thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ. 78
Bảng 2.2. Các hàm biến đổi mức xám theo từng cụm. ............................................... 81
Bảng 2.3. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 86
Bảng 2.4. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 87
Bảng 2.5: Thời gian thực thi. ...................................................................................... 88
Bảng 2.6. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 88
Bảng 2.7. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 89
Bảng 2.8. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 89
Bảng 2.9. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 90
Bảng 2.10. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 90
Bảng 2.11. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 91
Bảng 2.12. Thời gian thực thi. .................................................................................... 91
Bảng 2.13. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 92
Bảng 2.14. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 92
Bảng 2.15. Thời gian thực thi. .................................................................................... 93
Bảng 2.16. Các hàm biến đổi mức xám theo từng cụm. ............................................. 95
Bảng 2.17. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 98
Bảng 2.18. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 98
Bảng 2.19. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 99
11
Bảng 2.20. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 99
Bảng 2. 21. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................ 100
Bảng 2.22. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. ............................................................................................................................ 100
Bảng 2. 23. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................ 101
Bảng 2.24. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. ............................................................................................................................ 101
Bảng 3. 3. Các ảnh đầu vào trong tử nghiệm 1, 2 và 3. ........................................... 109
Bảng 3.4. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 114
Bảng 3.5. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 115
Bảng 3.6. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 116
Bảng 3.7. Ảnh kết quả phân cụm với 5 cụm. ............................................................. 118
Bảng 3.9. So sánh độ đồng nhất cụm (*1.0e+3). ...................................................... 121
Bảng 3.10. Thời gian phân cụm (ms). ....................................................................... 122
Bảng 3.11. So sánh độ đồng nhất cụm (*1.0e+3). .................................................... 123
Bảng 3.12. Thời gian phân cụm. ............................................................................... 124
Bảng 3.13. Tâm cụm sinh từ KMeans và KMeansCMN. .......................................... 125
Bảng 3.14. Thời gian phân cụm. ............................................................................... 126
Bảng 3.15. Các ảnh dùng trong các thử nghiệm. ..................................................... 129
Bảng 3.16. So sánh độ chính xác. ............................................................................. 138
Bảng 3.17. So sánh độ chính xác. ............................................................................. 140
Bảng 3.18. So sánh độ chính xác. ............................................................................. 142
12
DANH SÁCH HÌNH VẼ
Hình 1.1. Tiến trình viễn thám. ................................................................................... 22
Hình 1.2. Ảnh chụp và ảnh số. .................................................................................... 24
Hình 1.3. Tiến trình giải đoán tự động ảnh viễn thám đa phổ.................................... 28
Hình 1.4. Nắn chỉnh hình học. .................................................................................... 31
Hình 1.5. Cân bằng lược đồ màu. ............................................................................... 32
Hình 1.6. Nguyên tắc chính của tăng cường ảnh mờ [47]. ........................................ 33
Hình 1.7. Phân lớp có giám sát (trái) và không giám sát (phải). ............................... 36
Hình 1.8. Các bước cơ bản trong phương pháp phân lớp có giám sát. ..................... 38
Hình 1.9. Quy trình phân lớp ảnh đa phổ hướng điểm ảnh. ....................................... 39
Hình 1.10. Quy trình phân loại ảnh đa phổ hướng đối tượng. ................................... 40
Hình 1.11. Ví dụ của ảnh khử sương mù sử dụng dò tìm điểm tối; Trái: Ảnh sương
mù đầu vào, Phải: Kết quả của phương pháp trong [122]. ........................................ 48
Hình 1.12. So sánh kết quả của trong [70] với trong [48]. ........................................ 49
Hình 1.13. (a-f): So sánh kết quả xử lý với các hàm wavelet khác nhau và bộ lọc
đồng cấu [124]. ........................................................................................................... 50
Hình 1.14. So sánh với phương pháp nhanh của Tarel và Hautiere [105]. Phương
pháp trong [29] nhanh và cho kết quả chính xác hơn phương pháp của Tarel. ........ 51
Hình 1.15: thử nghiệm loại bỏ mây mù trong [120]. .................................................. 52
Hình 1.16. So sánh kết quả thuật toán của Cheng (c) với thuật toán ACE (b) [24]. .. 54
Hình 1.17. So sánh kết quả 2 kĩ thuật tăng cường: đầu vào, luật mờ, toán tử tăng
cường [99]. .................................................................................................................. 55
Hình 1.18. Kiến trúc phân lớp của Napoleon và cộng sự [77]. .................................. 59
Hình 1.19. Ảnh đầu vào Landsat và kết quả với 5 cụm [77]. ..................................... 60
Hình 1 20. Kết quả phân loại có kiểm soát ảnh World View 1, QuickBird [7]. ......... 68
Hình 1 21. Sơ đồ quá trình nhận dạng. ....................................................................... 70
13
Hình 1.22. Ảnh đầu vào, kết quả phân loại dựa trên tiếp cận điểm ảnh, tiếp cận đối
tượng. .......................................................................................................................... 70
Hình 2.1. Hàm phân bố xác suất cho việc tính toán các giá trị hàm thuộc. ............... 74
Hình 2.2. Hàm thuộc. .................................................................................................. 75
Hình 2.3. Hàm phân bố và các ngưỡng theo từng cụm. ............................................. 82
Hình 2.4. Hàm phân bố và các ngưỡng theo từng cụm. ............................................. 96
Hình 3.1. Biến đổi ảnh với Wavelet. ......................................................................... 106
Hình 3 2. Cây phân cấp cho phân rã nhiều mức. ..................................................... 107
Hình 3.3. Ảnh đầu vào kết quả phân rã ảnh viễn thám đa phổ. ............................... 107
Hình 3.5. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh
thử nghiệm 1. ............................................................................................................. 109
Hình 3.6. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với
ảnh thử nghiệm 1. ...................................................................................................... 110
Hình 3.7. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh
thử nghiệm 2. ............................................................................................................. 110
Hình 3.8. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với
ảnh thử nghiệm 2. ...................................................................................................... 111
Hình 3.9. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh
thử nghiệm 3. ............................................................................................................. 111
Hình 3 10. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans
với ảnh thử nghiệm 3. ................................................................................................ 112
Hình 3.11. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3). ......................... 116
Hình 3.12. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3). ......................... 117
Hình 3.13. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
WIKMeans, 2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3). ......................... 119
Hình 3.14. Kết quả phân cụm bởi KMeans. .............................................................. 121
14
Hình 3.15. Kết quả phân cụm bởi KMeansCMN. ..................................................... 121
Hình 3.16. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3). ........................................................................................... 122
Hình 3.17. Kết quả phân cụm bởi KMeans. .............................................................. 123
Hình 3.18. Kết quả phân cụm bởi KMeansCMN. ..................................................... 123
Hình 3.19. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3). ........................................................................................... 124
Hình 3.20. Kết quả phân cụm bởi KMeans. .............................................................. 125
Hình 3.21. Kết quả phân cụm bởi KMeansCMN. ..................................................... 125
Hình 3.22. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3). ........................................................................................... 126
Hình 3.23. Chi tiết từng cụm của FCM của thử nghiệm 1. ....................................... 129
Hình 3.24. Chi tiết từng cụm của lsiFCM của thử nghiệm 1. ................................... 129
Hình 3.25. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 1 (*1.0e+3). .................................................................................................. 130
Hình 3.26. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của
thử nghiệm 1 (*1.0e-3). ............................................................................................. 130
Hình 3.27. Chi tiết từng cụm của FCM của thử nghiệm 2. ....................................... 131
Hình 3.28. Chi tiết từng cụm của lsiFCM của thử nghiệm 2. ................................... 131
Hình 3.29. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 2(*1.0e+3). ................................................................................................... 131
Hình 3.30. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của
thử nghiệm 2 (*1.0e-3). ............................................................................................. 131
Hình 3.31. Quy trình phân loại ảnh đa phổ theo tiếp cận lai. .................................. 135
Hình 3.32: Sơ đồ thử nghiệm quy trình thử nghiệm phân lớp theo tiếp cận lai. ...... 136
Hình 3.33: Lựa chọn và hiển thị vùng mẫu trên ảnh. ............................................... 137
Hình 3.34. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 138
Hình 3.35. So sánh độ chính xác. .............................................................................. 139
15
Hình 3.36. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 140
Hình 3.37. So sánh độ chính xác. .............................................................................. 141
Hình 3.38. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 142
Hình 3.39. So sánh độ chính xác. .............................................................................. 143
16
PHẦN MỞ ĐẦU
1. Tính cấp thiết của luận án
Viễn thám được hiểu là một khoa học và nghệ thuật để thu nhận thông tin về
một đối tượng, một khu vực hoặc một hiện tượng, thông qua việc phân tích tài liệu
thu nhận được bằng các phương tiện [6]. Viễn thám bao gồm các thiết bị cảm biến,
ghi lại năng lượng phát ra từ đối tượng nghiên cứu, và bao gồm tổ hợp phần
cứng/phần mềm với khả năng xử lý, phân tích và ứng dụng các thông tin thu được
từ ảnh. Với cách hiểu này thì quá trình viễn thám bao gồm hai giai đoạn chính: (i)
Thu thập thông tin viễn thám; (ii) Xử lý và phân tích dữ liệu viễn thám. Đề tài được
đặt ra nhằm nghiên cứu một số phương pháp xử lý ảnh viễn thám để hỗ trợ giải
quyết các vấn đề liên quan đến giai đoạn (ii), Xử lý và phân tích ảnh viễn thám.
Những công nghệ mới trong thu nhận và xử lý ảnh viễn thám không ngừng
được phát triển, cho phép không ngừng nâng cao độ phân giải của ảnh cả về phổ và
không gian. Một trong những tiên phong trong lĩnh vực này là hãng Kestrel. Kestrel
đã thiết kế, xây dựng, thử nghiệm và triển khai hệ thống xử lý ảnh siêu phổ
(hyperspectral) có chi phí hiệu quả, sử dụng phép chuyển đổi Fourier mới được phát
triển theo chương trình Small Business Innovation. Hệ thống xử lý này đã được đưa
vào sử dụng trên vệ tinh MightySat của Không lực Hoa kỳ năm 2000. Hãng Kestrel
đang tiếp tục phát triển bộ cảm biến dữ liệu siêu phổ hai chiều CCD, nhằm tăng
cường khả năng chụp mặt đất tốc độ cao, đặc tính vốn bị hạn chế do việc sử dụng hệ
thống phát hiện một chiều truyền thống.Ngoài ra, các nhà nghiên cứu còn hướng
quan tâm tới việc tăng cường khả năng chụp ảnh trong điều kiện sáng yếu và hỗ trợ
truy nhập dữ liệu quang phổ ở những dải năng lượng thấp. Bên cạnh đó, những tiến
bộ công nghệ trong cảm biến và quang học cũng được áp dụng nhằm tăng cường
chất lượng dữ liệu ảnh thu được, giảm nhẹ gánh nặng cho quá trình xử lý ảnh.
Ngày nay, một xu hướng mới của ứng dụng phần mềm ảnh viễn thám đó là
các dịch vụ bản đồ trực tuyến. Giá trị của dữ liệu viễn thám đã được nhiều nhà cung
cấp nặng ký trong các dịch vụ Web phát hiện. Microsoft và Google đã lần lượt phát
triển các dịch vụ bản đồ trực tuyến “MSN Virtual Earth” và “Google Earth”. Sự kết
hợp của dữ liệu viễn thám và các công cụ bản đồ thân thiện trên dịch vụ bản đồ trực
tuyến đã đem dữ liệu viễn thám tới đại chúng và mở ra những khả năng ứng dụng
mới cho viễn thám.
17
Quá trình xử lý và phân tích thông tin viễn thám được thực hiện bằng phần
mềm máy tính. Ảnh viễn thám ngày càng có những ứng dụng quan trọng trong
nhiều lĩnh vực, từ hỗ trợ quản lý đất đai phục vụ dân sinh, quản lý, giám sát chủ
quyền quốc gia, cho đến hỗ trợ giám sát tài nguyên, môi trường ... Ứng dụng ngày
càng phổ biến của ảnh viễn thám tất yếu dẫn đến nhu cầu ngày càng tăng của việc
sử dụng phần mềm xử lý ảnh viễn thám.
Ngày nay, có rất nhiều phần mềm cả thương mại lẫn mã nguồn mở phục vụ
công tác xử lý dữ liệu viễn thám. Theo nghiên cứu của hãng Global Marketing
Insights, những phần mềm liên quan tới xử lý dữ liệu viễn thám được ứng dụng
nhiều nhất tại các nhóm nghiên cứu châu Á là ESRI 30%; ERDAS 25%; RSI ENVI
17%; MapInfo 17%; ERMapper 11%. Trong khi đó, ở phương Tây, những con số
này là ESRI 39%, ERDAS 27%, MapInfo 9%, AutoDesk 7%, RSI ENVI 17% [42].
Còn ở Việt Nam, công nghệ xử lý ảnh viễn thám đã xâm nhập khá sớm, từ
năm 1983 (Viện Khoa học Việt Nam). Để nhanh chóng phát triển công nghệ vũ trụ
phục vụ cho phát triển kinh tế của đất nước, Nhà nước đã xây dựng đề án: “Kế
hoạch tổng thể về ứng dụng và phát triển công nghệ viễn thám ở Việt Nam” nhằm
hướng đến sự phát triển bền vững trên cơ sở sử dụng hợp lý tài nguyên thiên nhiên
và bảo vệ môi trường. Năm 2006, Viện Công nghệ Vũ trụ, thuộc Viện Hàn Lâm
Khoa học và Công nghệ Việt Nam được thành lập. Năm 2013 Việt Nam đã phóng
vệ tinh viễn thám đầu tiên mang tên VNRedsat-1. Vệ tinh viễn thám thứ 2
VNRedsat-2 dự kiến được phóng vào năm 2019.
Các bài toán liên quan đến hoạt động nhận thức, trí tuệ của con người đều hàm
chứa những đại lượng, thông tin không chính xác, không chắc chắn và không đầy
đủ. Trong lĩnh vực khoa học kĩ thuật, các hệ thống phức tạp thực tế không thể mô tả
đầy đủ và chính xác bởi các phương trình toán học truyền thống. Kết quả là những
tiếp cận kinh điển dưa trên kỹ thuật phân tích và các phương trình toán học nhanh
chóng tỏ ra không còn phù hợp. Vì thế, công nghệ tính toán mềm là giải pháp trong
lĩnh vực này. Vấn đề giải đoán ảnh viễn thám cũng phức tạp và cần sử dụng các kĩ
thuật trong công nghệ tính toán mềm. Công nghệ tính toán mềm gồm các thành
phần: Logic mờ, Mạng Neural nhân tạo, lập luận xác suất, hệ hỗ trợ ra quyết định.
Các kĩ thuật phân lớp thuộc về công nghệ tính toán mềm.
Xuất phát từ thực tế và những lý do trên, nghiên cứu sinh đã lựa chọn đề tài
“Nghiên cứu phương pháp nâng cao chất lượng và giải đoán ảnh đa phổ dựa
18
trên tính toán mềm” để thực hiện luận án tiến sĩ chuyên ngành Hệ thống thông tin.
Kết quả nghiên cứu được áp dụng trên ảnh viễn thám, đặc biệt là ảnh viễn thám tại
khu vực trong nước để phân tích các đặc thù của lớp phủ nước ta và đưa ra những
kết quả hữu ích cho giai đoạn hậu phân loại như xây dựng bản đồ...
Thách thức đặt ra với đề tài là rất lớn vì ảnh viễn thám có nhiều loại với đặc
thù riêng. Mỗi loại có phương pháp xử lý, phân tích riêng. Vì vậy, việc lựa chọn
phương pháp, kĩ thuật phù hợp để từ đó cải tiến là rất quan trọng.
2. Mục tiêu, đối tượng và phương pháp nghiên cứu của luận án
Mục tiêu của luận án là nghiên cứu kĩ thuật tăng cường và phân lớp để hỗ
trợ cho việc giải đoán ảnh viễn thám đa phổ.
Từ mục tiêu, luận án tập trung vào bốn nội dung nghiên cứu chính bao gồm:
Nội dung thứ nhất là đánh giá các phương pháp, kĩ thuật tiền xử lý, tăng
cường ảnh viễn thám.
Nội dung thứ hai là so sánh, đánh giá các phương pháp, kĩ thuật phân lớp
ảnh viễn thám.
Nội dung thứ ba là đề xuất kĩ thuật mới tăng cường ảnh viễn thám đa phổ
và chứng minh phương pháp mới hiệu quả hơn các phương pháp đã có theo
các tiêu chuẩn đánh giá được chọn.
Nội dung thứ tư là đề xuất kĩ thuật mới phân loại ảnh viễn thám đa phổ và
chứng minh phương pháp mới hiệu quả hơn các phương pháp đã có theo
các tiêu chuẩn đánh giá được chọn.
Đối tượng nghiên cứu của luận án bao gồm:
Các kĩ thuật tiền xử lý, tăng cường ảnh viễn thám.
Các kĩ thuật phân lớp ảnh viễn thám.
Ảnh viễn thám bao gồm nhiều loại khác khau với các đặc trưng và phương
pháp xử lý khác nhau. Luận án tập trung vào ảnh viễn thám đa phổ và các kĩ thuật
xử lý tương ứng. Vì vậy, phạm vi nghiên cứu của luận án tập trung chủ yếu ở hai
vấn đề chính. Một là, nghiên cứu kĩ thuật tiền xử lý, tăng cường ảnh viễn thám đa
phổ. Hai là, nghiên cứu phương pháp phân lớp ảnh viễn thám đa phổ.
19
Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu
thực nghiệm. Về nghiên cứu lý thuyết: Tổng hợp các thông tin liên quan, lựa chọn
các cách tiếp cận đã được áp dụng thành công dựa vào các kiến thức cơ bản, các kết
quả nghiên cứu đã công bố; trao đổi thông qua seminar hoặc tham gia báo cáo tại
các hội thảo khoa học; trao đổi, làm việc và kết hợp chặt chẽ với các chuyên gia về
lĩnh vực viễn thám. Về nghiên cứu thực nghiệm: luận án thực hiện cài đặt các thuật
toán, chạy thử nghiệm thuật toán với các bộ số liệu ảnh viễn thám, so sánh và đánh
giá kết quả thực nghiệm so với kết quả nghiên cứu lý thuyết, từ đó kết luận tính
đúng đắn của kết quả nghiên cứu.
3. Đóng góp chính của luận án
Đề xuất kỹ thuật tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận
cục bộ theo cụm thông qua 2 giải thuật phân cụm KMeans và phân cụm mờ
FCM.
Cải tiến thuật toán phân cụm KMeans áp dụng với ảnh viễn thám: (i)
WIKMeans với bước khởi tạo tâm cụm xác lập dựa theo kỹ thuật Wavelet;
(ii) CIKMeans dựa trên vector trung b nh cụm, (iii) KMeansCMN với công
thức tính tâm cụm áp dụng kĩ thuật chuẩn hóa trung bình phổ và (iv) Fuzzy
C-Means thành lsiFCM với những tuỳ biến để xử lý với ảnh k ch thước lớn
trên cơ sở FCM.
4. Bố cục của luận án
Luận án gồm phần mở đầu và ba chương nội dung, phần kết luận, danh mục
các công trình và danh mục các tài liệu tham khảo.
Chương 1 trình bày tổng quan tình hình nghiên cứu về viễn thám và xử lý ảnh
viễn thám đa phổ.
Các đóng góp chính của luận án được trình bày trong chương chương 2 và
chương 3.
Chương 2 trình bày một số thuật toán tăng cường ảnh dựa trên logic mờ. Từ đó,
chương 2 để xuất một kĩ thuật tăng cường ảnh viễn thám mới dựa trên tiếp cận cục
bộ. Trong đó, bao gồm hai thuật toán chính dựa trên hai thuật toán phân cụm khác
nhau là KMeans và Fuzzy CMeans. Tuy nhiên, do nhược điểm cố hữu của thuật toán
phân cụm mờ dẫn đến gặp vấn đề với ảnh viễn thám kích thước lớn, chương 2 cũng
20
đề xuất thuật toán tăng cường ảnh cải tiến cho thuật toán tăng cường dựa trên Fuzzy
CMeans nói trên cho ảnh viễn thám kích thước lớn. Đánh giá và so sánh với các
phương pháp đã có dựa trên chỉ số mờ của các ảnh tăng cường thu được.
Chương 3 đề xuất các kĩ thuật phân lớp có giám sát và không giám sát mới cho
ảnh viễn thám. Về phương pháp phân lớp không giám sát bao gồm các thuật toán đề
xuất cải tiến từ các thuật toán KMeans và Fuzzy CMeans. Đánh giá và so sánh với
các phương pháp đã có dựa trên chỉ số về độ đồng nhất cụm cũng như thời gian thực
thi của các các thuật toán phân cụm. Về phương pháp phân lớp giám sát là một tiếp
cận mới lai dựa trên hai tiếp cận hướng điểm ảnh và hướng đối tượng, thuật toán đề
xuất cải tiến từ thuật toán phân lớp hợp lý tối đa (Maximum likehood).
Cuối cùng, phần kết luận nêu những đóng góp của luận án, hướng phát triển
và những vấn đề quan tâm của nghiên cứu sinh.
21
CHƯƠNG I - TỔNG QUAN VỀ VIỄN THÁM VÀ GIẢI
ĐOÁN ẢNH VIỄN THÁM ĐA PHỔ
Trong chương 1, luận án trình bày tổng quan về viễn thám, giải đoán ảnh đa
phổ. Tiếp đó, luận án trình bày về tình hình nghiên cứu trên thế giới. Từ đó, luận án
phân tích kết quả đạt được và những vấn đề còn hạn chế. Những phân tích này làm
tiền đề để luận án đề xuất những cải tiến mới trong các chương tiếp theo.
1.1. Tổng quan về viễn thám
1.1.1. Tiến trình viễn thám
Theo các định nghĩa trong [22][62] thì viễn thám (Remote Sensing) được hiểu
như một khoa học, nghệ thuật thu nhận thông tin về đối tượng, khu vực hay hiện
tượng trên bề mặt Trái đất mà không tiếp xúc trực tiếp với chúng. Công việc này
được thực hiện bởi cảm nhận (sensing) và lưu trữ các năng lượng phản xạ hay được
phát ra từ các đối tượng nghiên cứu. Sau đó là thực hiện phân tích, xử lý và ứng
dụng các thông tin này vào nhiều lĩnh vực khác nhau.
Tiến trình viễn thám bao gồm nhiều công đoạn, trong đó có tương tác giữa bức
xạ và đối tượng nghiên cứu. Khái niệm đối tượng nghiên cứu trong tài liệu này
được hiểu là các đối tượng, khu vực hay hiện tượng nào đó trên bề mặt Trái đất mà
Hình 1.1. Tiến trình viễn thám.
con người muốn thu thập thông tin về nó. Trên hình 1.1 là mô tả vắn tắt bảy thành
phần của hệ thống thu ảnh viễn thám [22].
Nguồn năng lượng hay nguồn sáng (A): Yêu cầu đầu tiên của viễn thám là
phải có nguồn năng lượng để chiếu sáng hay cung cấp năng lượng điện từ đến đối
tượng nghiên cứu.
22
Bức xạ và khí quyển (B): Vì năng lượng đi từ nguồn tới đối tượng đích cho
nên nó tiếp xúc và đi qua khí quyển. Việc tương tác này còn xảy ra lần nữa khi năng
lượng đi từ đối tượng đích tới cảm biến (sensor).
Tương tác với đối tượng đích (C): Sau khi năng lượng được truyền qua khí
khuyển nó sẽ tương tác với đối tượng đích. Cách thức tương tác của chúng phụ
thuộc vào tính chất của đối tượng đích và bức xạ.
Thu nhận năng lượng bằng đầu cảm biến (D): Sau khi năng lượng bị đối
tượng đích truyền đi hay phân tán (scattered), đầu cảm biến sẽ thu nhận (không tiếp
xúc) và lưu trữ bức xạ điện từ.
Truyền, nhận và xử lý dữ liệu cảm biến (E): Năng lượng được thu nhận bởi
cảm biến sẽ được truyền đi, thông thường dưới dạng điện tử, đễn trạm thu và xử lý,
nơi mà dữ liệu được xử lý thành ảnh (dưới dạng hard-copy hay dạng số).
Diễn giải và phân tích (F): Ảnh được diễn giải bằng trực giác hay hệ thống
số để trích chọn các thông tin về đối tượng nghiên cứu.
Ứng dụng (G): Phần tử cuối cùng của tiến trình viễn thám là áp dụng các
thông tin vừa trích chọn từ ảnh về đối tượng nghiên cứu để hiểu rõ hơn về nó, làm
nổi lên các thông tin mới hay hỗ trợ giải quyết một số vấn đề cụ thể.
Đề tài “Nghiên cứu phương pháp nâng cao chất lượng và giải đoán ảnh đa
phổ dựa trên tính toán mềm” tập trung nghiên cứu một số vấn đề liên quan đến
thành phần F và G được mô tả trong sơ đồ trên đây. Đó là làm thế nào để phân tích,
diễn giải dữ liệu viễn thám và ứng dụng chúng trong thực tế.
1.1.2. Đặc trưng viễn thám
Năng lượng điện từ có thể được nhận biết bằng phim ảnh hay điện tử. Có thể
ghi biến thiên năng lượng trên phim nhạy ánh sáng. Cần phân biệt hai khái niệm
ảnh (image) và ảnh chụp (photograph) trong viễn thám. Ảnh được hiểu là hình thức
biểu diễn “cảnh” bất kỳ, không quan tâm đến bước sóng hay thiết bị viễn thám nào
được sử dụng. Ảnh chụp đề cập đến ảnh được chụp trên phim ảnh. Thông thường,
ảnh được chụp tại bước sóng từ 0.3m đến 0.9m (vùng nhìn thấy và vùng hồng
ngoại phản xạ). Vậy, mọi ảnh chụp là ảnh, nhưng không phải mọi ảnh là ảnh chụp.
Ảnh chụp có thể được biểu diễn và hiển thị dưới dạng ảnh số bằng cách chia ảnh
23
thành các ô vuông nhỏ bằng nhau (theo cột và hàng), gọi là pixel. Biểu diễn độ sáng
Hình 1.2. Ảnh chụp và ảnh số.
của mỗi vùng bằng một giá trị số (DN- Digital Number).
Hình 1.2 thể hiện qui trình sinh ảnh số từ ảnh chụp. Ảnh chụp được quét và
được chia nhỏ thành các pixel. Mỗi pixel được gán một số biểu diễn độ chói. Máy
tính hiển thị mỗi giá trị số với mức độ chói khác nhau.
Các đặc trưng viễn thám bao gồm:
Kênh ảnh (Channel, Band): Thông thường, một dải hẹp bước sóng được
đo và tập dữ liệu được lưu trữ tách biệt, chúng được gọi là băng (Band) hay
kênh (Channel) ảnh. Có thể tổ hợp và hiển thị các kênh thông tin nhờ ba
màu cơ sở (red, green và blue).
Độ phân giải ảnh không gian: Đề cập đến vùng được đo, kích thước đặc
trưng nhỏ nhất trên mặt đất mà sensor có thể nhận biết.
Độ phân giải phổ: Đề cập đến bước sóng phổ mà sensor nhạy cảm với. Có
thể nói độ phân giải phổ là số lượng kênh của ảnh số về một khu vực nào
đó.
Độ phân giải bức xạ: Đề cập đến mức độ năng lượng được đo bởi sensor.
Nói cách khác là những sự khác biệt nhỏ nhất trong mức năng lượng mà
sensor có thể nhận biết.
Độ phân giải thời gian: Đề cập đến thời gian thu thập dữ liệu. Nó liên quan
đến khả năng chụp lặp cùng một vùng của vệ tinh.
24
1.1.3. Khuôn mẫu ảnh viễn thám
Khuôn mẫu dữ liệu ảnh viễn thám mô tả cách thức dữ liệu được ghi lên thiết bị
lưu trữ, ví dụ DVD. Một ảnh viễn thám thường được lưu trữ trong hai tệp, ví dụ với
Landsat ETM+ như sau:
Tệp metadata: Chứa tập các mô tả bằng chữ hay số của dữ liệu lưu trữ
trong tệp dữ liệu ảnh (tệp thứ 2). Chúng bao gồm tổng số dòng quét, số
pixel/dòng, phép chiếu sử dụng và tọa độ địa lý của tâm ảnh...
Tệp dữ liệu ảnh: Chứa các giá trị điểm ảnh của các kênh 1-7, sắp xếp theo
từng kênh. Với mỗi kênh, các giá trị pixel của dòng quét thứ 1 được lưu trữ
từ trái sang phải thành một bản ghi. Tiếp theo là lưu trữ dữ liệu của dòng
quét thứ 2,...
1.1.4. Các loại ảnh viễn thám
Phân loại ảnh viễn thám theo nguồn năng lượng [129] và chiều dài bước sóng,
ta có thể chia ảnh vệ tinh thành 3 loại cơ bản:
Ảnh quang học là loại ảnh được tạo ra bởi việc thu nhận các bước sóng
ánh sáng nhìn thấy (bước sóng 0.4 – 0.76 micromet). Nguồn năng lượng
chính là bức xạ mặt trời
Ảnh hồng ngoại (ảnh nhiệt) là loại ảnh được tạo ra bởi việc thu nhận các
bước sóng hồng ngoại phát ra từ vật thể (bước sóng 8 – 14 micromet).
Nguồn năng lượng chính là bức xạ nhiệt của các vật thể.
Ảnh radar là loại ảnh được tạo ra bởi việc thu nhận các bước sóng trong
dải sóng cao tần (bước sóng từ 1mm – 1m). Nguồn năng lượng chính là
sóng rada phản xạ từ các vật thể do vệ tinh tự phát xuống theo những bước
sóng đã được xác định.
Vệ tinh /Cảm biến thời tiết: TIROS-1, GOES, NOAA AVHRR…
Các cảm biến/ vệ tinh quan trắc mặt đất: Landsat, SPOT, IRS, ASTER,
Một số hệ thống vệ tinh và loại ảnh viễn thám
Các cảm biến/vệ tinh quan trắc hải dương: Nimbus-7, MOS, SeaWiFS
MODIS
25
…
1.2. Tổng quan về giải đoán, phân tích ảnh viễn thám đa phổ
1.2.1. Khái quát về giải đoán, phân tích ảnh viễn thám đa phổ
Để có thể sử dụng được dữ liệu viễn thám ta phải có khả năng tách thông tin
có ý nghĩa từ ảnh. Nói cách khác là phải diễn giải và phân tích ảnh viễn thám. Phân
tích ảnh viễn thám là thực hiện nhận biết hoặc/và đo các đối tượng khác nhau trong
ảnh để tách các thông tin hữu ích về chúng. Các đặc trưng của đối tượng trên ảnh có
các đặc trưng sau:
Đối tượng có thể là các đặc trưng điểm, đường và vùng. Nó có thể có hình
dạng bất kỳ.
Đối tượng cần được phân biệt với nhau, phải tương phản với các đặc trưng
khác ở xung quanh chúng.
Phần lớn công việc diễn giải và giải đoán ảnh viễn thám được thực hiện bằng
thủ công hay mắt thường trên các ảnh chụp (ảnh tương tự). Đối với các ảnh số, có
thể giải đoán bằng thủ công hay bằng máy tính. Xử lý số có thể được sử dụng cho
các ảnh số để tăng cường chất lượng ảnh để giải đoán tốt hơn. Xử lý và phân tích
ảnh số có thể tự động giải đoán các đối tượng trên ảnh mà không cần can thiệp của
con người. Tuy nhiên, thực tế thì rất ít khi xử lý và phân tích ảnh thay thế hoàn toàn
thủ công. Nó thường là hỗ trợ người phân tích trong việc giải đoán ảnh viễn thám.
Giải đoán ảnh viễn thám bằng máy tính hay thủ công đều có ưu nhược điểm riêng.
Vậy, cả hai kỹ thuật giải đoán này thường được sử dụng.
Xử lý ảnh số là thực hiện một loạt thủ tục bao gồm lập khuôn mẫu, hiệu chỉnh
dữ liệu, nâng cao chất lượng để dễ dàng giải đoán hay phân lớp tự động các đối
tượng bằng máy tính. Để có thể xử lý số ảnh viễn thám, dữ liệu phải được thu thập
dưới dạng số phù hợp và lưu trữ trong máy tính. Đồng thời phải có phần cứng, phần
mềm phù hợp, nói cách khác phải có hệ thống phân tích ảnh phù hợp.
1.2.2. Khái niệm và tiến trình giải đoán ảnh đa phổ
Giải đoán ảnh viễn thám là quá trình tách thông tin định tính cũng như định
lượng từ ảnh dựa trên các tri thức chuyên ngành hoặc kinh nghiệm của người đoán
đọc điều vẽ [6]. Việc tách thông tin trong viễn thám có thể phân thành 5 loại:
26
Phân lớp đa phổ.
Phát hiện biến động.
Chiết tách các thông tin tự nhiên.
Xác định các chỉ số.
Xác định các đối tượng đặc biệt.
Phân lớp đa phổ là quá trình tách gộp thông tin dựa trên các tính chất phổ,
không gian và thời gian của đối tượng. Phát hiện biến động là phát hiện và phân tích
các biến động dựa trên tư liệu ảnh đa thời gian. Chiết tách các thông tin tự nhiên
tương ứng với việc đo nhiệt độ trạng thái khí quyển, độ cao của vật thể dựa trên các
đặc trưng phổ hoặc thị sai của cặp ảnh lập thể. Xác định các chỉ số là việc tính toán
các chỉ số mới, ví dụ chỉ số thực vật.
Xác định các đặc tính hoặc hiện tượng đặc biệt như thiên tai, các cấu trúc
tuyến tính, các biểu hiện tìm kiếm khảo cổ. Quá trình tách thông tin từ ảnh có thể
được thực hiện bằng mát người hay máy tính.
Việc giải đoán bằng mắt có ưu điểm là có thể khai thác được các tri thức
chuyên môn và kinh nghiệm của con người, mặt khác việc giải đoán bằng mắt có
thể phân tích được các thông tin phân bố không gian. Tuy nhiên phương pháp này
có nhược điểm là tốn kém thời gian và kết quả thu được không đồng nhất.
Việc xử lý bằng máy tính có ưu điểm là năng suất cao, thời gian xử lý ngắn, có
thể đo được các chỉ số đặc trưng tự nhiên nhưng nó có yếu điểm là khó kết hợp với
tri thức và kinh nghiệm của con người, kết quả phân tích các thông tin kém. Để
khắc phục nhược điểm này, những năm gần đây người ta đang nghiên cứu các hệ
chuyên gia, đó là các hệ chương trình máy tính có khả năng mô phỏng tri thức
chuyên môn của con người phục vụ cho việc đoán đọc điều vẽ tự động.
27
Hình 1.3. Tiến trình giải đoán tự động ảnh viễn thám đa phổ.
Theo sơ đồ trên, dữ liệu ảnh viễn thám thu được từ các vệ tinh viễn thám có
thể bị sai lệch về mặt hình học hay bức xạ, sẽ được chuyển vào bộ hiệu chỉnh để sửa
lại. Sau đó, dữ liệu được chuyển qua giai đoạn phân lớp để rút trích các thông tin
cần thiết của đối tượng thu nhận. Đề hỗ trợ cho việc giải đoán thủ công hay kiểm tra
lại kết quả phân lớp, dữ liệu viễn thám có thể được chuyển qua bộ tăng cường chất
lượng ảnh trực quan để có thể quan sát và phân tách hiệu quả hơn. Giai đoạn hậu
phân lớp là từ các thông tin thu được sau phân lớp sẽ kết xuất các đầu ra cần thiết
cho việc báo cáo, quản lý hiện trạng lớp phủ...
Hiệu chỉnh ảnh: Đây là giai đoạn mà các tín hiệu số được hiệu chỉnh hệ thống
nhằm tạo ra một tư liệu ảnh có thể sử dụng được. Giai đoạn này thường được thực
hiện trên các máy tính lớn tại các Trung tâm thu số liệu vệ tinh.
28
Tăng cường hình ảnh trực quan: Các quá trình xử lý như tăng cường chất
lượng, biến đổi tuyến tính... Giai đoạn này có thể thực hiện trên các máy tính nhỏ
như máy vi tính trong khuôn khổ của một phòng thí nghiệm. Việc tăng cường ảnh
để hỗ trợ cho khâu giải đoán ảnh bao gồm cả giải đoán thủ công và giải đoán tự
động dựa trên phân lớp.
Phân lớp: Phân lớp đa phổ để tách các thông tin cần thiết phục vụ việc theo
dõi các đối tượng hay lập bản đồ chuyên đề là khâu then chốt của việc khai thác tư
liệu viễn thám.
Quá trình giải đoán ảnh viễn thám đa phổ gồm rất nhiều giai đoạn. Trong đó
có hai giai đoạn quan trọng là Tăng cường hình ảnh trực quan và Phân lớp mà luận
án tập trung.
1.2.3. Hiệu chỉnh ảnh
Hiệu chỉnh ảnh còn gọi là khôi phục ảnh, bao gồm hiệu chỉnh hình học và hiệu
chỉnh bức xạ và hiệu chỉnh khí quyển.
1.2.3.1. Hiệu chỉnh bức xạ
Hiệu chỉnh bức xạ bao gồm hiệu chỉnh dữ liệu do tính không đều của sensor hay
nhiễu khí quyển.
Tất cả các tư liệu số hầu như bao giờ cũng chịu một mức độ nhiễu xạ nhất định [6].
Để loại trừ các nhiễu này cần phải thực hiện một số phép tiền xử lý. Khi thu các bức
xạ từ mặt đất trên các vật mang vũ trụ, người ta thấy chúng có một số khác biệt so
với trường hợp quan sát cùng đối tượng đó ở khoảng cách gần. Điều này chứng tỏ ở
khoảng cách xa như vậy tổn tại một lượng nhiễu nhất định do góc nghiêng và độ
cao mặt trời, một số điều kiện quang học khí quyển như sự hấp thụ, tán xạ, độ mù
gây ra... Chính vì vậy để bảo đảm được sự tương đồng nhất định về mặt bức xạ cần
phải hiệu chỉnh ảnh.
Các nguồn nhiễu bức xạ gồm 3 nhóm chính sau:
Các nguồn nhiễu do biến đổi độ nhậy của bộ cảm
Trong trường hợp các bộ cảm thuần tuý quang học bao giờ cũng xảy ra
trường hợp cường độ bức xạ tại tâm ảnh lớn hơn tại các góc. Hiện tượng
này gọi là hiện tượng làm mờ ảnh.
29
Đây là một sai lệch không thể tránh khỏi cho các hệ quang học. Khi sử
dụng các bộ cảm quang điện tử thì sự chênh lệch giữa cường độ bức xạ
trước ống kính và cường độ mà thiết bị thực sự ghi nhận cũng là một đại
lượng cần đưa vào quá trình hiệu chỉnh.
Các nguồn nhiễu do góc chiếu của mặt trời và do địa hình
Bóng chói mặt trời: Bản thân mặt trời tạo bóng chói của mình trên mặt
đất dưới dạng một vùng sáng hơn những vùng khác. Bóng chói mặt trời có
thể được loại trừ cùng với hiện tượng làm mờ ảnh trên nguyên lý ứng dụng
chuỗi Furie.
Bóng che: Bóng che là hiện tượng che khuất nguồn bức xạ do bản thân
địa hình. Để có thể loại trừ nó cần có số liệu mô hình số địa hình và toạ độ
vật mang tại thời điểm thu tín hiệu.
Các nguồn nhiễu do trạng thái khí quyển
Rất nhiều các hiệu ứng khí quyển khác nhau như hấp thụ, phản xạ, tán
xạ... ảnh hưởng tới chất lượng ảnh thu được. Người ta thường sử dụng các
mô hình khí quyển để mô phỏng trạng thái khí quyển và áp dụng các qui
luật quang hình học và quang khí quyển để giải quyết vấn đề này.
1.2.3.2. Hiệu chỉnh hình học
Hiệu chỉnh hình học bao gồm hiệu chỉnh biến dạng hình học vì dao động của
hình học Trái đất-sensor và chuyển đổi dữ liệu sang hệ tọa độ thế giới thực (kinh vĩ
độ) trên bề mặt Trái đất.
Hai loại méo hình học: Hệ thống và không hệ thống. Méo không hệ thống là
méo không ổn định về mặt hình học như tốc độ bay của vệ tinh, góc nhìn, độ cao...
Méo hệ thống do tốc độ gương bị thay đổi, nó gây ra các đường quét đều méo giống
nhau hoặc đường quét bị kéo lệch một phía. Nắn ảnh méo hệ thống tương đối đơn
giản.
Méo hình hình học là sai lệch vị trí giữa tọa độ ảnh thực tế đo được và tọa độ
ảnh lý tưởng thu được từ bộ cảm có thiết kế hình học lý tưởng và trong các điều
kiện thu nhận lý tưởng.
Méo hình hình học gồm méo hình nội sai và méo hình ngoại sai. Méo hình nội
sai sinh ra do tính chất hình học của bộ cảm và méo hình ngoại sai gây ra do vị trí
30
của vật mang và hình dáng của vật thể. Để đưa các tọa độ ảnh thực tế về tọa độ ảnh
lý tưởng phải hiệu chỉnh hình học. Bản chất của hiệu chỉnh hình học là xây dựng
được mối tương quan giữa hệ tọa độ ảnh đo và hệ tọa độ qui chiếu chuẩn. Hệ tọa độ
qui chiếu chuẩn có thể là hệ tọa độ mặt đất (hệ tọa độ vuông góc hoặc hệ tọa độ địa
Hình 1.4. Nắn chỉnh hình học.
lý) hoặc hệ tọa độ ảnh khác.
1.2.3.3. Hiệu chỉnh khí quyển
Bức xạ mặt trời trên đường truyền xuống trái đất bị hấp thụ, tán xạ một lượng nhất
định trước khi tới mặt đất và bức xạ, tán xạ từ vật thể cũng bị hấp thụ hay tán xạ
trước khi tới được bộ cảm [6]. Do vậy bức xạ mà bộ cảm thu được không chỉ chứa
riêng năng lượng hữu ích mà còn chứa nhiều thành phần nhiễu khác nữa. Hiệu
chỉnh khí quyển là một công đoạn tiền xử lý nhằm loại trừ những thành phần bức xạ
không mang thông tin hữu ích.
Có 3 nhóm phương pháp chính sử dụng trong hiệu chỉnh khí quyển bao gồm:
Phương pháp sử dụng hàm truyền khí quyển
Phương pháp sử dụng hàm truyền khí quyển là giải pháp gần đúng hay
được sử dụng. Mọi thông số dựa trên trạng thái trung bình của khí quyển kể
cả hàm lượng các hạt bụi lơ lửng và hơi nước.
Phương pháp sử dụng các số liệu quan trắc thực địa
Trong phương pháp này người ta tiến hành đo đạc bức xạ các đối tượng
cần nghiên cứu ngay tại thời điểm bay chụp. Sau đó dựa trên sự khác biệt
cường độ bức xạ thu được trên vệ tinh và giá trị đo được người ta tiến hành
31
hiệu chỉnh bức xạ. Phương pháp này cho kết quả rất tốt nhưng không phải
lúc nào và ở đâu cũng thực hiện được.
Các phương pháp khác.
Một số vệ tinh được trang bị các bộ cảm đặc biệt chuyên thu nhận các
tham số trạng thái khí quyển đồng thời với các bộ cảm thu nhận ảnh và việc
hiệu chỉnh khí quyển được tiến hành ngay trong quá trình bay.
1.2.4. Tăng cường chất lượng ảnh trực quan
Các thao tác này làm tăng cường độ rõ của ảnh để hỗ trợ giải đoán và phân tích ảnh.
Hình 1.5. Cân bằng lược đồ màu.
Các chức năng nâng cao chất lượng ảnh bao gồm dãn tương phản, lọc không gian để
làm nổi các mẫu trên ảnh ...
Nhiễu trong ảnh viễn thám bao gồm nhiễu thông thường giống ảnh màu và các
nhiễu mang tính đặc trưng sương mù, đám mây... Đối với nhiễu thông thường,
chúng ta có thể dùng các phương pháp khử nhiễu thông thường như các phương
pháp lọc. Để tăng cường chất lượng ảnh viễn thám, cũng có thể dùng các phương
pháp tăng tính tương phản.
Theo [9], các kĩ thuật tăng cường ảnh chia làm ba loại. Một là, họ các kĩ thuật
histogram mà tiêu biểu là cân bằng histogram và đặc tả histogram. Hai là, họ các kĩ
thuật dựa trên tiếp cận logic mờ. Ba là, các kĩ thuật tăng cường dựa trên tối ưu.
Các kĩ thuật này được áp dụng cho ảnh đa cấp xám. Với ảnh đa kênh, có thể
thực hiện tăng cường trên từng kênh ảnh.
32
1.2.4.1. Kĩ thuật histogram
Cân bằng lược đồ xám là kĩ thuật hiệu chỉnh cường độ ảnh để tăng cường độ tương
phản. Trong cân bằng lược đồ xám điểm ảnh sẽ được phân phối một cách thống
nhất thay vì phân phối điểm ảnh ban đầu và do đó ảnh trở nên trong trẻo hơn.
1.2.4.2. Tăng cường ảnh dựa trên logic mờ
Tăng cường ảnh mờ dựa trên việc ánh xạ mức xám vào mặt phẳng mờ, sử
dụng hàm biến đổi thành viên [47]. Mục tiêu là để sinh một ảnh có độ tương phản
cao hơn ảnh gốc bằng việc đưa trọng số lớn hơn cho các mức xám mà gần hơn với
mức xám trung bình của ảnh hơn là để chúng xa hơn trung bình. Trong vài năm gần
đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập mờ để phát triển các kĩ thuật
mới cho việc cải thiện độ tương phản.
Một ảnh I, có kích thước M x N và L mức xám, có thể được xem như một
mảng đơn mờ, mỗi phần tử là một giá trị hàm thuộc biểu thị mức độ sáng của nó
liên quan tới vài mức độ sáng. Với ảnh I, chúng ta có thể viết trong ký hiệu tập mờ
[47][99] như sau:
m = 1,2,…,M và n = 1,2,…,N (1) ⋃
Trong đó gmn là cường độ của điểm ảnh (m, n) và giá trị hàm thuộc của nó μmn.
Hàm thuộc đặc trưng cho thuộc tính thích nghi của ảnh (ví dụ thuộc tính biên, tối,
kết cấu). Mỗi toán tử tăng cường có thể có dạng hàm thành viên khác khau. Trong
những năm gần đây, một số nhà nghiên cứu đã áp dụng khái niệm mờ để phát triển
các thuật toán mới cho việc tăng cường ảnh. Nguyên tắc của lược đồ tăng cường mờ
Hình 1.6. Nguyên tắc chính của tăng cường ảnh mờ [47].
được minh họa trong hình 1.6.
1.2.4.3. Tăng cường ảnh dựa trên tối ưu tham số
Trong tăng cường ảnh, việc chọn, tối ưu các tham số liên quan đến các hàm,
toán tử tăng cường là rất quan trọng. Nhiều kĩ thuật tối ưu việc chọn tham số được
sử dụng như là hệ thống tham lam, di truyền, phá vi khuẩn, đàn kiến [9].
33
1.2.5. Giải đoán thủ công
Đoán đọc điều vẽ ảnh bằng mắt có thể áp dụng trong mọi điều kiện trang thiết
bị [6]. Đoán đọc điều vẽ bằng mắt là việc sử dụng mắt người cùng với các dụng cụ
quang học như kính lúp, kính lập thể, máy tổng hợp mầu để xác định các đối tượng.
Cơ sở để đoán đọc điều vẽ bằng mắt là các chuẩn đoán đọc điều vẽ và mẫu đoán
đọc điều vẽ.
Các chuẩn đoán đọc điều vẽ ảnh vệ tinh và mẫu đoán đọc điều vẽ gồm 8
nhóm:
Chuẩn kích thước: Cần phải chọn một tỷ lệ ảnh phù hợp để đoán đọc điều
vẽ. Kích thước của đối tượng có thể xác định nếu lấy kích thước đo được
trên ảnh nhân với mẫu số tỷ lệ ảnh.
Chuẩn hình dạng: Hình dạng có ý nghĩa quan trọng trong đoán đọc ảnh.
Hình dạng đặc trưng cho mỗi đối tượng khi nhìn từ trên cao xuống và được
coi là chuẩn đoán đọc quan trọng.
Chuẩn bóng: Bóng của vật thể dễ dàng nhận thấy khi nguồn sáng không
nằm chính xác ở đỉnh đầu hoặc trường hợp chụp ảnh xiên. Dựa vào bóng
của vật thể có thể xác định được chiều cao của nó.
Chuẩn độ đen: Độ đen trên ảnh đen trắng biến thiên từ trắng đến đen. Mỗi
vật thể được thể hiện bằng một cấp độ sáng nhất định tỷ lệ với cường độ
phản xạ ánh sáng của nó. Ví dụ cát khô phản xạ rất mạnh ánh sáng nên bao
giờ cũng có mầu trắng, trong khi đó cát ướt do độ phản xạ kém hơn nên có
mầu tối hơn trên ảnh đen trắng. Trên ảnh hồng ngoại đen trắng do cây lá
nhọn phản xạ mạnh tia hồng ngoại nên chúng có mầu trắng và nước lại hấp
thụ hầu hết bức xạ trong dải sóng này nên bao giờ cũng có mầu đen.
Chuẩn mầu sắc: Mầu sắc là một chuẩn rất tốt trong việc xác định các đối
tượng. Ví dụ các kiểu loài thực vật có thể được phát hiện dễ dàng ngay cả
cho những người không có nhiều kinh nghiệm trong đoán đọc điều vẽ ảnh
khi sử dụng ảnh hồng ngoại mầu. Các đối tượng khác nhau cho các tông
mầu khác nhau đặc biệt khi sử dụng ảnh đa phổ tổng hợp mầu.
34
Chuẩn cấu trúc: Cấu trúc là một tập hợp của nhiều hình mẫu nhỏ. Ví dụ một
bãi cỏ không bị lẫn các loài cây khác cho một cấu trúc mịn trên ảnh, ngược
lại rừng hỗn giao cho một cấu trúc sần sùi.
Chuẩn phân bố: Chuẩn phân bố là một tập hợp của nhiều hình dạng nhỏ
phân bố theo một quy luật nhất định trên toàn ảnh và trong mối quan hệ với
đối tượng cần nghiên cứu. Ví dụ hình ảnh của các dãy nhà, hình ảnh của
ruộng lúa nước, các đồi trồng chè... tạo ra những hình mẫu đặc trưng riêng
cho các đối tượng đó.
Chuẩn mối quan hệ tương hỗ: Một tổng thể các chuẩn đoán đọc điều vẽ,
môi trường xung quanh hoặc mối liên quan của đối tượng nghiên cứu với
các đối tượng khác cung cấp một thông tin đoán đọc điều vẽ quan trọng.
Ảnh tổng hợp mầu
Nhờ khả năng phân biệt cao của mầu sắc mà nó có thể truyền đạt các khác biệt
về phổ của đối tượng, ảnh tổng hợp mầu có tính trực quan sinh động hơn ảnh phổ
trắng đen. Đối với ảnh phổ chụp ở vùng hồng ngoại, ảnh tổng hợp mầu cho ta bức
tranh mầu giả không có thực trong tự nhiên.
Lựa chọn kênh phổ để tổng hợp mầu là một công việc quan trọng quyết định
chất lượng thông tin của kết quả tổng hợp mầu. Việc lựa chọn kênh phổ được xác
định trên cơ sở như sau:
Đặc tính phản xạ phổ của các đối tượng cần đoán đọc điều vẽ.
Nhiệm vụ đoán đọc điều vẽ.
Yêu cầu đối với lực phân giải.
Đặc điểm của vùng cần tổng hợp mầu...
1.2.6. Giải đoán tự động theo phương pháp số
1.2.6.1. Khái niệm
Mục đích tổng quát của phân lớp đa phổ là tự động phân lớp tất cả các pixel trong
ảnh thành các lớp phủ đối tượng [6]. Thông thường người ta sử dụng các dữ liệu đa
phổ để phân lớp và tất nhiên, mẫu phổ trong cơ sở dữ liệu đối với mỗi pixel sẽ được
dùng làm cơ sở để phân lớp. Có nghĩa là, các kiểu đặc trưng khác nhau biểu thị các
tổ hợp giá trị số dựa trên sự bức xạ phổ và đặc trưng bức xạ vốn có của chúng. Vì
35
vậy một “mẫu phổ” không nói đến tính chất hình học mà đúng hơn, thuật ngữ "phổ"
ở đây nói đến một tập hợp giá trị đo bức xạ thu được trong các kênh phổ khác nhau
đối với mỗi pixel. Việc nhận biết mẫu phổ đề cập đến một số phương pháp phân lớp
có sử dụng thông tin phổ trên các pixel làm cơ sở để tự động phân loại các lớp đối
tượng.
Phân lớp ảnh là phân chia các điểm ảnh, các vùng về các miền, các lớp khác nhau.
Phân lớp ảnh viễn thám là một công việc rất quan trọng với nhiều ứng dụng khác
Hình 1.7. Phân lớp có giám sát (trái) và không giám sát (phải).
nhau trong nông nghiệp, lâm nghiệp, địa chất học, thủy văn...
Có hai phương pháp phân lớp ảnh đa phổ chủ yếu là phân lớp có giám sát (còn
gọi là phân lớp) và không giám sát (còn gọi là phân cụm).
Trong phương pháp phân lớp có giám sát người giải đoán ảnh sẽ “kiểm tra”
quá trình phân lớp pixel bằng việc quy định cụ thể theo thuật toán máy tính, các chữ
số mô tả bằng số các thể loại lớp phủ mặt đất khác nhau có mặt trên một cảnh. Để
làm việc này, các điểm lấy mẫu đại diện của loại lớp phủ đã biết (gọi là các vùng
mẫu) được sử dụng để biên tập thành một “khóa giải đoán” bằng số mô tả các thuộc
tính phổ cho mỗi thể loại điển hình. Sau đó mỗi pixel trong tập hợp dữ liệu sẽ được
so sánh với mỗi chủng loại trong khóa giải đoán và được gán nhãn bằng tên của
chủng loại mà nó “có vẻ giống nhất”.
Còn phương pháp phân lớp không giám sát không giống như phương pháp
phân lớp có giám sát, quy trình phân lớp không giám sát gồm hai bước riêng biệt.
Điểm khác biệt cơ bản giữa hai phương pháp này là ở chỗ phương pháp phân lớp có
giám sát bao gồm bước lấy mẫu và bước phân loại, còn trong phương pháp phân lớp
không giám sát, trước tiên dữ liệu ảnh được phân loại bằng cách nhóm chúng thành
36
các nhóm tự nhiên hoặc thành các cụm có mặt trên cảnh. Sau đó người giải đoán
ảnh sẽ xác định tính đồng nhất của lớp phủ mặt đất của các nhóm phổ này bằng
cách so sánh các dữ liệu hình ảnh đã phân lớp với các dữ liệu tham khảo mặt đất.
Một đơn vị phân lớp có thể là một tập các điểm ảnh lân cận hoặc một điểm
ảnh hoặc chính ảnh viễn thám [77]. Đơn vị này tập trung vào thông tin phổ trong
ảnh phân lớp, có thể xem xét việc sử dụng các thông tin thời gian, không gian và
các thông tin khác. Hai lớp được giới thiệu là lớp thông tin và lớp phổ để minh hoạ
phân loại giám sát và không giám sát. Lớp thông tin là lớp trong đó thông tin được
trích chọn bằng phân tích trong khi lớp phổ xử lý với các vector mức xám tương tự.
Có sự liên quan một lớp phổ đến một lớp thông tin là sự khác biệt chính giữa phân
loại giám sát và không giám sát. Trong một phân loại giám sát lớp thông tin được
đặc tả đầu tiên trên ảnh và để thiết lập dấu hiệu của lớp, thuật toán được sử dụng để
tóm lược thông tin đa phổ từ các vùng mẫu trên ảnh. Quá trình này được biết đến
như là huấn luyện không giám sát. Nhưng trong phân loại không giám sát thuật toán
được áp dụng đầu tiên trên ảnh và các lớp phổ được thiết lập. Sau đó, phân tích ảnh
gán lớp phổ đến lớp thông tin.
Có hai tiếp cận phân lớp chủ yếu là: Tiếp cận dựa trên điểm ảnh và tiếp cận
dựa trên đối tượng.
1.2.6.2. Phân lớp có giám sát
Trong giai đoạn lấy mẫu, người giải đoán sẽ nhận dạng các vùng đại diện và nghiên
cứu cách mô tả các thuộc tính phổ của mỗi loại lớp phủ mặt đất trong cảnh này bằng
số. Tiếp theo, trong giai đoạn phân lớp mỗi pixel trong tập hợp dữ liệu hình ảnh
được phân thành các loại lớp phủ mặt đất mà nó gần giống nhất. Nếu pixel không
giống với bất kỳ tập dữ liệu nào thì nó được gán nhãn “chưa biết”. Nhãn phân lớp
gán cho mỗi pixel trong quá trình này được ghi lại trong ô tương ứng của tập dữ liệu
giải đoán. Như vậy, ma trận ảnh nhiều chiều này được sử dụng để xây dựng một ma
trận tương ứng của các loại lớp phủ mặt đất cần giải đoán. Sau khi đã phân lớp toàn
bộ dữ liệu, các kết quả được trình bày trong giai đoạn đưa ra kết quả. Do việc phân
loại bằng số, cho nên kết quả có thể sử dụng theo nhiều cách khác nhau. Ba dạng
điển hình của kết quả đầu ra là bản đồ chuyên đề, bảng thống kê diện tích toàn cảnh
hoặc phân cảnh cho các loại lớp phủ mặt đất khác nhau, và các file dữ liệu bằng số
để đưa vào hệ thống thông tin địa lý GIS, khi đó "kết quả đầu ra" của việc phân lớp
37
trở thành "đầu vào" của GIS. Hình 1.8 tóm tắt 3 bước cơ bản trong phương pháp
Hình 1.8. Các bước cơ bản trong phương pháp phân lớp có giám sát.
phân lớp có giám sát.
Việc phân lớp đa phổ trong phương pháp phân lớp có có thường dùng các
thuật toán sau:
Thuật toán phân lớp theo xác suất cực đại.
Thuật toán phân lớp theo khoảng cách ngắn nhất.
Thuật toán phân lớp hình hộp.
1.2.6.3. Phân lớp không giám sát
Phân lớp không giám sát (phân đoạn ảnh) là thực hiện phân hoạch ảnh thành
tập các vùng đồng nhất có ý nghĩa, các điểm ảnh trong cùng vùng có cùng thuộc
tính như mức xám, tương phản, giá trị phổ hay tính chất kết cấu.
Phân lớp không giám sát không sử dụng dữ liệu mẫu làm cơ sở để phân lớp,
mà dùng các thuật toán để xem xét các pixel chưa biết trên một ảnh và kết hợp
chúng thành một số loại dựa trên các nhóm tự nhiên hoặc các loại tự nhiên có trong
38
ảnh. Nguyên lý cơ bản của phương pháp này là các giá trị phổ trong một loại lớp
phủ phải gần giống nhau trong không gian đo, trong lúc các dữ liệu của các loại
khác nhau phải được phân biệt rõ với nhau về phương diện phổ.
Các loại thu được do việc phân lớp không giám sát gọi là các lớp phổ. Do chỗ
chúng chỉ dựa trên các nhóm tự nhiên có trong ảnh, đặc điểm nhận dạng của các
loại phổ lúc ban đầu chưa biết nên người giải đoán phải so sánh các dữ liệu đã được
phân lớp với một dạng nào đó của dữ liệu tham khảo (chẳng hạn ảnh tỉ lệ lớn hơn
hoặc bản đồ) để xác định đặc điểm nhận dạng và giá trị thông tin của các loại phổ.
Thuật toán được sử dụng phổ biến trong phân lớp không giám sát ảnh viễn
thám đa phổ là KMeans. Ngoài ra, nhiều kỹ thuật phân lớp không giám sát [109] đã
được nghiên cứu thử nghiệm như tách cạnh, tách đường và tách điểm; các bộ tách
cạnh được hình thành trên cơ sở các toán tử Robert, toán tử Sobel, toán tử Prewitt,
toán tử Canny; phân ngưỡng ảnh; phát triển vùng; phân cụm; thuật toán
Watershed...
1.2.6.4. Tiếp cận phân lớp hướng điểm ảnh
Tiếp cận kinh điển của phân loại ảnh viễn thám dựa trên điểm ảnh [73]. Tiếp
cận này chỉ thông tin phổ được sử dụng trong việc phân lớp [100]. Tiếp cận này bao
gồm phương pháp phân lớp có giám sát và không giám sát truyền thống [100][73].
Phương pháp phân loại hợp lý tối đa (maximum likehood) thuộc tiếp cận này. Hình
Hình 1.9. Quy trình phân lớp ảnh đa phổ hướng điểm ảnh.
1.9 minh hoạ quy trình phân loại ảnh hướng điểm ảnh.
Về mặt toán học, có thể phát biểu bài toán phân lớp ảnh như sau:
Đầu vào: là tập các pixel, n là số pixel;
là tập các nhãn ứng với mỗi lớp cần phân lớp, m là số
lớp.
Đầu ra: Mỗi pixel , 1 ≤ k ≤ n, được gán nhãn , 1 ≤ j ≤ m.
39
Về mặt nguyên tắc chung, các thuật toán phân lớp hướng điểm ảnh sẽ xây
dựng các hàm phân biệt ( ) để xác định lớp mà điểm ảnh thuộc về. Khi này
luật quyết định có dạng:
(2) ( ) ( )
1.2.6.5. Tiếp cận phân lớp hướng đối tượng
Trong tiếp cận hướng đối tượng, đơn vị xử lý không còn là các điểm ảnh đơn giản
mà là các đối tượng ảnh [100]. Đầu tiên, ảnh được phân đoạn thành các nhóm điểm
ảnh có nghĩa. Thứ hai, một tập các luật phân vùng dựa trên tri thức để mô tả mỗi lớp
được định nghĩa. Luật bao gồm thông tin phổ, không gian, ngữ cảnh, và kết cấu. Và
sau đó, bộ phân loại sẽ được chọn để gán mỗi đoạn về lớp phù hợp theo luật [66].
Hình 1.10. Quy trình phân loại ảnh đa phổ hướng đối tượng.
Hình 1.10 minh hoạ quy trình phân loại dựa trên tiếp cận hướng đối tượng.
Sau khi phân cụm, ảnh gốc I không biểu diễn dưới dạng tập điểm ảnh nữa mà
được biểu diễn lại dưới dạng tập O các cụm hay đối tượng như sau:
(3)
Trong đó, .
Các đối tượng này sẽ được tính đặc trưng: ( ).
Về nguyên tắc chung, các thuật toán phân lớp hướng điểm ảnh sẽ xây dựng các hàm
phân biệt ( ) để xác định lớp mà điểm ảnh thuộc về. Khi này luật quyết định có
dạng:
(4) ( ( )) ( ( ))
Các đặc trưng của cụm có thể là:
Cường độ
40
Kết cấu
Chỉ số thảm thực vật NDVI
Hình dạng
Liên quan
1.2.7. Hậu giải đoán, phân lớp
Công dụng của bất kỳ phương pháp phân loại hình ảnh nào cuối cùng sẽ phụ
thuộc vào sản phẩm các kết quả đưa ra mà chuyển tải một cách hữu hiệu thông tin
được giải đoán cho người sử dụng. Ở đây, ranh giới giữa viễn thám, bản đồ máy
tính, làm bản đồ số và hệ thống thông tin địa lý bị xóa hòa. Có thể lựa chọn một
cách không hạn chế các sản phẩm đầu ra. Ba dạng tổng quát thường được sử dụng,
bao gồm các sản phẩm “bản đồ” đồ họa, các bảng số liệu thống kê khu vực và các
file dữ liệu bằng số.
1.2.7.1. Các sản phẩm đồ họa
Bởi vì các dữ liệu được phân lớp nằm dưới dạng mảng dữ liệu hai chiều, kết
quả đồ họa dễ dàng được đưa ra bằng máy vi tính bằng cách hiển thị các màu các
tông hoặc các chữ cho mỗi ô trong mảng theo loại lớp phủ đối tượng đã được gán
cho. Có thể sử dụng một loạt thiết bị cho mục đích này như các màn hình thể hiện
mầu, các máy in, các máy ghi phim và các máy quét cỡ lớn. Những cách hiển thị đó
trình bày các kết quả phân loại một cách rất hữu hiệu và người phân tích có thể
chọn cách hiển thị một cách tương tác chỉ các tập con (tập hợp con) của file ban đầu
hoặc dễ dàng thay đổi cách gán mầu sắc, tạo nhóm các loài... Khi muốn có sản
phẩm đầu ra copy giấy đối với các dữ liệu trên có thể sử dụng máy in tĩnh điện hoặc
in laze. Các bản in ra có thể là trắng đen hoặc in mầu. Ta cũng có thể sử dụng máy
chụp phim mầu để sản xuất các bản in cứng có độ chính xác cao về mầu và hình
học.
1.2.7.2. Các dữ liệu đưa ra bằng bảng
Một hình thức chung nữa về kết quả đầu ra là dùng một bảng liệt kê tóm tắt
các số liệu thống kê về diện tích của các loại lớp phủ có mặt trên cảnh tượng hoặc
trong các diện tích nhỏ hơn cảnh tượng mà người sử dụng đã xác định. Ta có thể rút
ra các số liệu thống kê về diện tích từ file dữ liệu đã giải đoán dựa theo từng ô lưới.
41
Trước hết ranh giới của một vùng đang quan tâm (như là một lưu vực, thung lũng
hoặc một tỉnh) được số hóa đối với các tọa độ ma trận ảnh. Trong ranh giới đó, số
lượng các ô trong mỗi loại lớp phủ sẽ được lập bảng và nhân với diện tích mặt đất
của một ô tương ứng. Quá trình này đơn giản hơn việc đo thủ công các vùng trên
một bản đồ và là ưu điểm chủ yếu của xử lý dữ liệu lớp phủ mặt đất dưới dạng số.
1.2.7.3. Các file thông tin bằng số
Một thể loại cuối cùng để đưa ra kết quả là các file dữ liệu đã giải đoán chứa
các kết quả phân loại được ghi lại trên một số phương tiện lưu trữ bằng máy tính
(chẳng hạn CCT hoặc đĩa). Dữ liệu được giải đoán dưới dạng này, có thể dễ dàng
nhập vào hệ thống GIS để hòa nhập với các file dữ liệu địa lý khác.
1.3. Tổng quan về tính toán mềm
Trong thực tế cuộc sống, các bài toán liên quan đến hệ thống nhận thức, trí tuệ
của con người đều hàm chứa những đại lượng, thông tin không chính xác, không
chắc chắn và không đầy đủ. Ví dụ; sẽ chẳng bao giờ có các thông tin, dữ liệu cũng
như các mô hình tính toán đầy đủ và chính xác cho bài toán dự báo thời tiết. Nhìn
chung con người luôn ở trong bối cảnh không có thông tin chính xác và đầy đủ cho
các hệ thống ra quyết định.
Trong lĩnh vực khoa học kỹ thuật cũng vậy, các hệ thống phức tạp trên thực tế
thường không thể mô tả một cách đầy đủ và chính xác bởi các phương trình toán
học truyền thống. Kết quả là những cách tiếp cận kinh điển dựa trên kỹ thuật phân
tích và các phương trình toán học nhanh chóng tỏ ra không còn phù hợp. Vì thế,
công nghệ tính toán mềm chính là giải pháp trong lĩnh vực này.
1.3.1. Khái niệm về tính toán mềm
Tính toán mềm (Soft computing) khác với tính toán cứng truyền thống (Hard
computing) ở chỗ: tính toán mềm cho phép sự không chính xác, tính bất định, gần
dúng, xấp xỉ trong tính toán [55]. Các mô hình tính toán mềm dựa trên kinh nghiệm
của con người, sử dụng sai số cho phép của sự không chính xác, tính bất định, gần
đúng, xấp xỉ để tìm lời giải hiệu quả - đơn giản, dễ hiểu, dễ thực hiện, chi phí thấp.
Tính toán mềm biểu thị một sự chuyển dịch, biến hoá quan trọng trong các
hướng tính toán: sự dịch chuyển này phản ánh sự kiện trí tuệ con người, không như
42
máy tính, có khả năng đáng kể trong việc lưu trữ và xử lý thông tin không chính xác
và bất định, và đây mới là những thông tin thực tế thường gặp.
Các ứng dụng thành công cho thấy tính toán mềm ngày càng phát triển mạnh
và đóng vai trò đặc biệt trong các lĩnh vực khác nhau của khoa học và kỹ thuật.
Tính toán mềm được ứng dụng trong hầu hêt các chuyên ngành kỹ thuật như kỹ
thuật điện, kỹ thuật điều khiển, kỹ thuật hoá học, kỹ thuật xây dựng… Trong đó, kỹ
thuật điện là lĩnh vực đầu tiên ứng dụng tính toán mềm trong điều khiển mờ, xử lý
ảnh mờ, mạch điện tử dùng logic, người máy…
Khái niệm tính toán mềm được Zadeh đưa ra đầu tiên vào năm 1994 được mô
tả như sau: “Một cách cơ bản, tính toán mềm không phải là thể thống nhất các khái
niệm và kỹ thuật. Đúng ra, nó là sự kết hợp của các phương pháp riêng biệt theo
cách này hay cách khác để thích nghi với nguyên lý của nó. Tại điểm giao đó, mục
đích cuối cùng của tính toán mềm là khai thác khả năng thứ lỗi (Tolerance) cho tính
không chính xác hay tính bất định để đạt được mục tiêu với chi phí thấp”. Một cách
đơn giản hơn, “Tất cả các tính toán có bao gồm sự không chính xác một cách có chủ
đích trong tính toán ở một hay nhiều mức và cho phép tính không chính xác này
làm thay đổi (làm giảm) độ chính xác của bài toán, hay “làm mềm” mục tiêu tối ưu
ở một số bước, đều bị coi là thuộc lĩnh vực tính toán mềm”.
1.3.2. Phân biệt tính toán mềm và tính toán cứng
Tính toán truyền thông, hay còn gọi là tính toán cứng, là phương pháp sử dụng
các kỹ thuật tính toán, dựa trên dữ liệu đầu vào để đưa ra kết quả cuối cùng một
cách chính xác theo yêu cầu cảu bài toán.
Bảng dưới đây đưa ra một số điểm khác biệt giữa tính toán mềm và tính toán
cứng, để chúng ta có được một hình dung cụ thể hơn về tính toán mềm.
Bảng 1: Một số khác biệt giữa tính toán mềm và tính toán cứng.
- Xử lý bài toán dựa trên số
- Không đòi hỏi dữ liệu phải
Tiêu chí Tính toán cứng Tính toán mềm
liệu chính xác chính xác
- Ví dụ: Giá trị của A phải là 0
Dữ liệu
xử lý
- Ví dụ: Giá trị của A có thể nằm
trong khoảng từ 0 đến 1: [0,1]
hoặc 1: {0,1}
43
- Yêu cầu đưa ra kết quả gần tối
- Yêu cầu đưa ra kết quả tối ưu
Kết quả
- Kỹ thuật tính toán dựa trên
đầu ra (kết quả chính xác hoàn toàn) ưu (cho phép sự sai lệch nhất
định trong kết quả tìm được)
- Sử dụng kỹ thuật tính toán
- Thời gian tính toán thường
Kỹ thuật Heurtistic được sử dụng phổ tính toán truyền thống biến
- Thời gian tính toán nhanh hơn
chậm hơn. Trong một số Thời gian trường hợp, không thể đưa ra tính toán với chi phí thấp hơn
- Các bài toán không yêu cầu lời
- Các bài toán yêu cầu lời giải
kết quả trong thời gian chấp
nhận được
giải chính xác, song phải đưa ra Lĩnh vực chính xác, không cho phép sự kết quả trong một khoảng thời áp dụng sai lệch. gian nhất định với chi phí nhất
định
Tính toán mềm căn cứ trên các đặc điểm, hành vi của con người và tự nhiên
1.3.3. Một số đặc điểm của tính toán mềm
để đưa ra quyết định hợp lý trong điều kiện không chính xác, không chắc
Các thành phần của tính toán mềm có sự bổ sung, hỗ trợ nhau.
Tính toán mềm là một hướng nghiên cứu mở, bất kỳ một kỹ thuật mới nào
được tạo ra từ việc bắt chước trí thông minh của con người, đều có thể trở
thành một thành phần mới của tính toán mềm.
chắn.
Không phải bài toán nào cung có thuật toán có thể giải quyết được bằng
Chính nhờ những đặc điểm đó mà tính toán mềm đang được nghiên cứu và
ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là: trí tuệ nhân tạo, khoa học máy
tính. Lý do:
tính toán cứng.
44
Không phải bài toán nào có thuật toán có thể giải quyết bằng tính toán cứng
Khi bản thân dữ liệu không chính xác thì không thể giải quyết được bằng
thì chi phí và thời gian thực hiện có thể chấp nhận được.
phương pháp chính xác.
Với những ưu thế trên, tính toán mềm đang dần thể hiện vai trò của mình, nhất
là trong việc giải quyết vấn đề mới.
1.3.4. Các kỹ thuật trong tính toán mềm
Logic mờ (Fuzzy logic)
Mạng neural nhân tạo (Neural Network)
Lập luận xác suất (probabilistic reasoning): Giải thuật di truyền (Genetic
Theo [31], tính toán mềm có 3 thành phần chính:
Algorithm), lý thuyết hỗn mang
Hệ thống mờ (Fuzzy Systems - FS), bao gồm logic mờ (Fuzzy Logic - FL).
Tính toán tiến hoá (Evolutionary Computation - EC),bao gồm giải thuật di
Theo [55], các thành phần chính của tính toán mềm bao gồm:
Mạng Neural (Neural Networks - NN), bao gồm mạng Neural (Neural
truyền (Genetic Algorithms - GA)
Học máy (Machine Learning - ML);
Lập luận xác suất (Probabilistic Reasoning - PR).
Computing - NC);
Các mục tiếp theo dưới đây sẽ giới thiệu sơ lược về Logic mờ, Mạng Neural
và Giải thuật di trueyèn
1.3.4.1. Logic mờ (Fuzzy logic - FL)
Khái niệm tập mờ (Fuzzy set) được Zadeh đưa ra năm 1965 với mục đích cho
phép các phần tử không chỉ thuộc về một tập liên tục hay rời rạc. Kể từ đó, các ứng
dụng và phát triển dựa trên khái niệm tưởng chừng rất đơn giản này, đã mang lại
những kết quả khó có thể tin được. Thậm chí, khó có thể chỉ ra các ứng dụng, phát
triển hay sản phẩm nào không liên quan đến khái niệm tập mờ. Ví dụ: chúng ta
thường nghe đến nhiều thuật ngữ như: máy giặt fuzzy, quạt fuzzt, ze máy fuzzy…
45
Khái niệm tập mờ có vai trò rất quan trọng trong việc giải quyết các bài toán
tối ưu, đưa ra các bài toán có tính thực tế, giải quyết bài toán với chi phí thấp và
trong thời gian nhanh hơn (mặc dù chấp nhận việc có thể có sai số). Trong lĩnh vực
an toàn thông tin, tập mờ cũng được sử dụng rất rộng rãi. Tất cả các thuật toán, giải
thuật, kỹ thuật được giới thiệu dưới đây đều được xuất phát từ tập mờ.
1.3.4.2. Mạng neural nhân tạo (Neural Network - NN)
NN là mô hình tính toán dựa trên bộ não. Mô hình NN bao gồm các bộ xử lý –
các Neural có mối liên kết chặt chẽ với nhau, tương tự như hoạt động của các
Neural trong não người. Các Neural được kết nối bởi các đường liên kết có đánh
trọng số, truyền tín hiệu từ neural này đến neural khác. Mỗi neural nhận các tín hiệu
đầu vào (có trọng số) thông qua các đường kết nối và tạo một tín hiệu đầu ra.
1.3.4.3. Giải thuật di truyền (Genetic Algorithm - GA)
Thuật toán di truyền là thuật toán tối ưu ngẫu nhiên dựa trên cơ chế chọn lọc
tự nhiên và tiến hoá di truyền. Nguyên lý cơ bản của thuật toán di truyền đã được
Holland giới thiệu vào năm 1962. Cơ sở toán học đã được phát triển từ cuối những
năm 1960 và đã được giới thiệu trong quyển sách đầu tiên của Holland, Adaptive in
Natural and Artifical Systems. Thuật toán di truyền được ứng dụng đầu tiên trong
hai lĩnh vực chính: tối ưu hoá và học máy. Trong lĩnh vực tối ưu hoá, thuật toán di
truyền được phát triển nhanh chóng và ứng dụng trong nhiều lĩnh vực khác nhau
như tối ưu hàm, xử lý ảnh, bài toán hành trình người bán hàng, nhận dạng hệ thống
và điều khiển.
Thuật toán di truyền cũng như các thuật toán tiến hoá nói chung, hình thành
dựa trên quan niệm cho rằng, quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất,
hợp lý nhất và tự nó đã mang tính tối ưu. Quan niệm này có thể xem như một tiên
đề đúng, không chứng minh được, nhưng phù hợp với thực tế khách quan. Quá trình
tiến hoá thể hiện tính tối ưu ơ chỗ, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn,
hoàn thiện hơn) thế hệ trước bởi tính kế thừa và đấu tranh sinh tồn.
GA lập luận mang tính ngẫu nhiên thay vì xác định như toán học giải tích.
GA xét duyệt toàn bộ các giải pháp, sau đó lựa chọn giải pháp tốt nhất dựa
Các tính chất đặc trưng của giải thuật di truyền:
trên hệ số thích nghi.
46
GA chỉ tập trung vào giải pháp (dãy số tượng trưng cho giải pháp) mà
GA thích hợp cho việc tìm điều kiện tối ưu cho việc điều hành và phân
không cần quan tâm đến chi tiết vấn đề.
nhóm những giải pháp có được.
Tái sinh
Lai ghép
Đột biến
Các phép toán của giải thuật di truyền:
1.4. Tình hình nghiên cứu trong và ngoài nước
Luận án tập trung nghiên cứu các giai đoạn: Tăng cường và giải đoán (phân
lớp) ảnh viễn thám đa phổ nên phần này sẽ tìm hiểu, khảo sát tình hình nghiên cứu
các giai đoạn này.
1.4.1. Tăng cường hình ảnh trực quan
1.4.1.1. Lọc mây, sương mù của ảnh viễn thám
Tất cả bức xạ mặt trời trong viễn thám phải vượt qua khí quyển của trái đất.
Trong khi lan truyền, bức xạ này tương tác với khí quyển, sinh hiệu ứng khác nhau
trên ảnh vệ tinh mà sau đó phải được loại bỏ thông qua hiệu chỉnh khí quyển ([106];
[28]; [35]. Một vài ảnh hưởng khí quyển, như mây, chặn hầu hết tất cả bức xạ trong
vùng phổ nhìn thấy và hồng ngoại. Ảnh hưởng khác che khuất một phần bức xạ lên
bề mặt trái đất và phản xạ một phần thông tin bị thay đổi. Sương mù là một ví dụ về
ảnh hưởng một phần. Sương mù biểu thị một tập ảnh hưởng không khí mà làm giảm
độ tương phản. Nói chung, tác động của sương mù là hiển nhiên khi xem ảnh trong
bộ phận lục và lam của phổ điện từ. Ở bước sóng này, nói chung nó là ảnh hưởng
bức xạ thêm vào và thay đổi về mặt không gian, với ảnh vệ tinh theo mô hình
khuếch tán. Như vậy, cần loại bỏ sương mù để phân tích cảnh.
Một số kĩ thuật dò tìm và loại bỏ sương mù bao gồm:
Trừ đối tượng tối đơn giản [115], [27], tiếp cận mục tiêu tối dựa trên ảnh
([107]). Gần đây, trong [122], các tác giả đề xuất một phương pháp đơn
giản, dò tìm điểm tối, nhưng hiệu quả để loại bỏ sương mù trong ảnh có
sương mù. Điểm tối là điểm ảnh trong ảnh không bị ảnh hưởng bởi sương
47
mù với giá trị trong tất cả kênh màu RGB gần với không. Với phương pháp
này, thuật toán đề xuất có thể ước lượng một cách hiệu quả độ dày sương
mù và tìm lại một cảnh không bị ảnh hưởng bởi sương mù một cách rõ ràng
thậm chí cả khi đối tượng cảnh vốn tương tự với ánh sáng không khí trên
Hình 1.11. Ví dụ của ảnh khử sương mù sử dụng dò tìm điểm tối; Trái: Ảnh sương mù đầu
vào, Phải: Kết quả của phương pháp trong [122].
Mô hình truyền bức xạ không khí phức tạp ([40]; [97]; [103]; [89], [90].
một vùng rộng. Ngoài ra, thuật toán trong [122] nhanh và với chất lượng
khử sương mù tốt.
Trong [70], các tác giả đề xuất phương pháp đơn giản nhưng hiệu quả cho
việc loại bỏ sương mù ảnh viễn thám đơn. Kĩ thuật khử sương mù của họ
làm việc tốt mà không sinh ra những vệt sáng và rất nhanh. Dựa trên sự ưu
tiên kênh tối, các tác giả có thể trích chọn tự động ánh sáng không khí toàn
cục và đánh giá màng chắn không khí một cách gần đúng. Sau đó, là lọc
màng khí quyển sử dụng bộ lọc Gaussian thông thấp. Để loại bỏ sự sai lệch
về màu của ảnh sau khi khôi phục, họ tính lại sự truyền. Với ánh sáng
không khí toàn cục và sự truyền, thuật toán có thể sinh ảnh không có sương
mù.Ảnh viễn thám được khôi phục rất hấp dẫn về mặt trực quan, chúng
chứa các chi tiết rất tốt và bảo tồn màu của cảnh gốc với thời gian xử lý
thấp. Hơn nữa, với ảnh chứa các vùng rõ ràng và sương mù cục bộ, thuật
toán của họ có thể đạt được kết quả tốt. Tuy nhiên, hạn chế chính trong
phương pháp của họ là nó có thể làm mất đi sự hiệu quả với ảnh có độ
chênh lệch sương mù lớn.
48
Hình 1.12. So sánh kết quả của trong [70] với trong [48].
Hiệu chỉnh sử dụng ảnh đa kênh và đa thời gian ([23]; [44]; [65]
Hiệu chỉnh sử dụng dữ liệu mặt đất ([14]; [82]
Hiệu chỉnh sử dụng mục tiêu bất biến [91]
Hiện nay, các nghiên cứu còn bổ sung kĩ thuật mới như phân tích wavelet để
tăng cường hiệu quả lọc mây mù.
Trong [124], các tác giả đề xuất phương pháp loại bỏ sương mù, đám mây sử
dụng thuật toán Mallat bằng cách phân tích các đặc trưng phân bố tần số của ảnh
viễn thám bị ảnh hưởng bởi mây và sương mù. Dựa trên đặc trưng xác suất thấp
tương đối của mây và sương mù, tần số cao tương đối của cảnh, và đa độ phân giải
của hàm wavelet, các tác giả phân tích đặc trưng của biến đối wavelet trong cả lý
thuyết và ứng dụng thực tế, và kết luận rằng hệ số chi tiết tại mức thấp hơn của
wavelet biểu diễn tương đối tần số cao của ảnh, hệ số chi tiết tại mức cao của nó
biểu diễn kênh tần số thấp tương đối của ảnh...
49
Hình 1.13. (a-f): So sánh kết quả xử lý với các hàm wavelet khác nhau và bộ lọc đồng cấu
[124].
Trong [124], một số vấn đề cần tiếp tục nghiên cứu và cải thiện mà các tác giả
đề xuất bao gồm:
1) Làm thế nào một hàm wavelet khác ảnh hưởng đến kết quả xử lý của ảnh,
và làm sao để tìm được hàm wavelet tốt nhất.
2) Kết hợp biến đổi wavelet với các phương pháp xử lý ảnh khác như hợp nhất
ảnh để cải thiện kết quả xử lý.
3) Trong các thử nghiệm trên, số mức và các thừa số được thiết lập theo kinh
nghiệm, cần tiếp tục nghiên cứu dựa trên xử lý ảnh thông minh và thích
ứng.
Trong [29], các tác giả đề xuất một tiếp cận khử sương mù ảnh đơn mới.
Phương pháp này sử dụng một chiến lược dựa trên sự liên hợp mà xem đầu vào như
hai phiên bản thích ứng của ảnh gốc mà được gắn trọng số bởi các ánh xạ đặc biệt
để sinh các kết quả không mây chính xác. Phương pháp này tính toán trong cách
thức trên điểm ảnh được cài đặt minh bạch. Phương pháp trong [29] chứng minh để
50
sinh các kết quả so sánh được và thậm chí tốt hơn các kĩ thuật phức tạp hơn nhưng
Hình 1.14. So sánh với phương pháp nhanh của Tarel và Hautiere [105]. Phương pháp
trong [29] nhanh và cho kết quả chính xác hơn phương pháp của Tarel.
có ưu điểm là thích hợp với ứng dụng thời gian thực.
Trong [120], các tác giả sử dụng kĩ thuật phân tích Wavelet để tìm và loại bỏ
sương mù cho ảnh vệ tinh độ phân giải cao (hình 1.15). Một thủ tục dò tìm và loại
bỏ sương mù liên quan đến phân tích nội dung thông tin tần số thấp của cảnh. Ảnh
bị mờ bởi mây được phân rã thành các mức khác nhau với biến đổi wavelet. Mặc dù
mây được phân bố trong miền tần số thấp, miền này cũng có thể chứa thành phần
của lớp phủ đất mà tương đối ổn định về mặt không gian và thời gian. Một ảnh
tham chiếu không mây tại vùng tương tự được sử dụng để đặc trưng hoá lớp phủ
đất. Thành phần của lớp phủ đất được đặc trưng sau đó được trừ với phân tích
wavelet. Các hệ số wavelet còn lại được sử dụng để tạo một mặt nạ biến đổi cho
việc dò tìm và loại bỏ mây tiếp theo. Sau khi làm trơn, mặt nạ được trừ từ ảnh bị mờ
để thu được ảnh chính xác với các đặc trưng loại mây. Cả sự kiểm tra trực quan và
đánh giá độ chính xác thống kê thể hiện sự hiệu chuẩn sương mù là hợp lệ và mạnh
mẽ.
51
Hình 1.15: thử nghiệm loại bỏ mây mù trong [120].
1.4.1.2. Tăng cường ảnh
Tăng cường ảnh dựa trên histogram
Duan đã giới thiệu một thuật toán xử lý lược đồ xám mới mà xem phân phối
ban đầu của điểm ảnh trong xử lý cân bằng [34]. Độ sáng và thành phần bão hoà
của điểm ảnh bị thay đổi và thành phần sắc còn lại sự tương phản. Sự phát triển của
thuật toán này thể hiện sự tương phản hơn và ảnh trông tự nhiên và tránh thành
phần lạ trực quan. Tác giả Arich đã giới thiệu thuật toán độ phức tạp thấp cho cân
bằng lược đồ xám [15]. Kĩ thuật đặc tả lược đồ xám (HM) như: Cân bằng lược đồ
xám hiệu chỉnh, Làm trơn lược đồ xám, Xấp xỉ lược đồ xám có trọng số, Giãn đen
trắng đã được thực hiện bởi việc tính toán lược đồ xám và hiệu chỉnh mức tăng
cường. Do đó, độ tương phản của ảnh có thể được cải thiện mà không đưa vào
thành phần lạ trực quan, nhưng ảnh tăng cường không vừa ý một cách trực quan.
Tăng cường ảnh dựa trên logic mờ
Để loại bỏ nhiễu từ một ảnh và tăng cường nó, Tang và cộng sự đã giới thiệu
một tiếp cận mới [102]. Thuật toán này dựa trên sự phân tách dữ liệu màu thành sắc
độ và độ sáng, và sau đó xử lý mỗi thành phần đó với phương trình vi phân từng
phần hoặc luồng khuếch tán. Ảnh thừa sáng và thiếu sáng không được tăng cường
52
đúng. Trong lĩnh vực xử lý ảnh số, để tăng cường một ảnh, sự có mặt nhiễu được
loại bỏ bằng việc sử dụng bộ lọc. Manglesh đã đề xuất thuật toán mới để tăng
cường ảnh màu bị làm hỏng bởi nhiễu Gaussian sử dụng logic mờ. Luật logic mờ
được sinh. Sau đó giá trị RGB của ảnh được đưa vào tiếp cận logic mờ. Đầu ra mờ
sẽ phân biệt giữa các màu mơ hồ [72]. Sarode đã giới thiệu thuật toán mới để khôi
phục các đặc tính liên quan đến dịch bước đặc biệt. Sắc độ được bảo tồn, chỉ sự bão
hoà và giá trị bị thay đổi và sau đó luật logic mờ được áp dụng, dựa trên điều
nàynhững quyết định liên quan đến việc phân lớp màu sẽ được thực hiện. Đầu ra sẽ
được bao gồm chỉ những vùng bướu nghiêm trọng và điểm ảnh nhiễu bị loại bỏ
[94].
Kĩ thuật tăng cường mờ được đề xuất bởi Hanmandlu trong đó một toán tử
tăng cường độ tương phản được giới thiệu, mà bao gồm tham số ‘t’. Bằng việc bảo
tồn H, và chỉ thay đổi S và V và bằng việc cực tiểu entropy mờ, chất lượng của ảnh
được cải thiện về mặt trực quan với nhận thức tương phản của con người [44]. Để
duy trì nhận thức trực quan của con người, Lior Shamir đã đề xuất tiếp cận dựa trên
nhận thức con người để phân đoạn màu điểm ảnh [69]. Tập mờ được phân loại dựa
trên các thành phần màu H, V và V. Sắc độ H được định nghĩa sử dụng Đỏ, Cam
tối, Cam nhạt, Vàng, Xanh nhạt, Xanh tối, Aqua, Lam, Tím tối, Tím nhạt. Sự bão
hoà S được định nghĩa sử dụng năm tập mờ: Xám, Gần như Xám, Trung bình, Gần
như sáng, sáng. Giá trị V được định nghĩa sử dụng bốn tập mờ: Tối, Tối trung bình,
Sáng trung bình và Sáng. Luật mờ trong mô hình này được định nghĩa dựa trên sự
quan sát của con người. Ví dụ, luật “Cam tối, Trung bình, Tối trung bình đưa ra
Nâu tối” được định nghĩa thủ công bởi việc phân loại thành phần màu HSV.
Phương pháp dựa trên logic mờ cung cấp một phân loại màu chính xác hơn.
Trong [24], tác giả Cheng đã đề xuất một kĩ thuật tăng cường độ tương phản
mờ trực tiếp thích ứng mới, hàm thuộc Sigma được sử dụng để ánh xạ ảnh từ miền
không gian vào miền mờ. Ảnh kết quả thu được được tăng cường đúng. Trong khi
chuyển ảnh từ một không gian màu (RGB) vào không gian màu khác (HSV, HIS,
YIQ) sắc độ không bị thay đổi chỉ thành phần cường độ và độ bão hoà bị thay đổi.
Tuy nhiên, ảnh sau tăng cường có thể không còn giữ được sự trong trẻo. Để khắc
phục vấn đề này, trong [76], Naik đã cố gắng giữ các giá trị được biến đổi trong
phạm vi của không gian RGB.
53
Hình 1.16. So sánh kết quả thuật toán của Cheng (c) với thuật toán ACE (b) [24].
Thuật toán tăng cường và đánh giá ảnh màu được điều khiển HVS được đề
xuất bởi Huang mà chủ yếu tập trung vào hiệu ứng trực quan và ảnh được tăng
cường không quá mức hay có thành phần sáng lạ [51]. Bằng việc sử dụng các thuật
toán khác nhau ảnh suy thoái được tăng cường, nhưng thỉnh thoảng ảnh có thể bị
tăng cường quá mức. Vì vậy, để khắc phục vấn đề này, trong [121] Yu đã giới thiệu
thuật toán điều chỉnh việc bảo tồn sắc độ tên là điều chỉnh SI chuẩn hoá cho loại
tăng cường khác nhau. Chất lượng ảnh về mặt trực quan được tăng cường nhưng
quá trình xử lý tiêu thụ thời gian.
Trong [47], các tác giả đưa ra một nghiên cứu so sánh các kĩ thuật tằng cường
ảnh mờ.
Trong [99], hai kĩ thuật tăng cường là tăng cường độ tương phản dựa trên luật
mờ và tăng cường độ tương phản sử dụng toán tử tăng cường được trình bày với
ảnh xám độ tương phản thấp. Trong kĩ thuật đầu tiên, hàm ứng với hệ mờ thu được
bởi các luật if-then đơn giản, và trong kĩ thuật thứ hai toán tử tăng cường độ tương
phản mờ đóng vai trò như công cụ cho việc tăng cường độ tương phản trong miền
mờ. Sự phân tích so sánh của các kĩ thuật này được thực hiện bởi việc tính chỉ số
mờ và thời gian xử lý. Giá trị thấp hơn của chỉ số mờ biểu thị ảnh tăng cường tốt
hơn.
54
Hình 1.17. So sánh kết quả 2 kĩ thuật tăng cường: đầu vào, luật mờ, toán tử tăng cường
[99].
Kết quả thực nghiệm cho thấy, lược đồ xám của ảnh gốc và các ảnh tăng
cường có các đặc trưng cơ bản giống nhau, điều này không làm được trong cân
bằng lược đồ xám [99]. Ngoài ra, tăng cường độ tương phản sử dụng kĩ thuật toán
tử tăng cường có các giá trị chỉ số mờ thấp hơn khi so với kĩ thuật tăng cường độ
tương phản sử dụng luật mờ. Tuy nhiên, về thời gian xử lý, kĩ thuật tăng cường độ
tương phản dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật tăng cường sử dụng
toán tử tăng cường.
Kĩ thuật tối ưu
Hanmandlu đã giới thiệu một hàm thuộc Gaussian để mờ hoá ảnh mà bao gồm
tham số tăng cường t, mờ fh và điểm chéo cho việc tăng cường ảnh màu. Bằng việc
tối ưu entropy mờ của ảnh, các tham số được tối ưu, chất lượng ảnh nhìn thấy được
quan sát với ảnh thiếu sáng [45]. John See đã đề xuất bộ dò tìm cạnh Gaussian dựa
trên mờ sử dụng cả thuộc tính toàn cục và cục bộ[58]. Trong giai đoạn tăng cường
độ tương phản toàn cục, hàm thuộc Gaussian được sử dụng. Một hàm tăng cường
độ tương phản không tuyến tính bao gồm ba tham số được sử dụng để tăng cường
ảnh. Trong pha cục bộ, mặt nạ dò tìm cạnh kiểu Gaussian chứa hai tham số mờ
được tối ưu bằng việc sử dụng hàm entropy ảnh mờ và thuật toán này đã thể hiện
một cải tiến trực quan đáng lưu ý. Palanikumar đã giới thiệu một thuật toán mới dựa
trênCân bằng lược đồ xám(HE) và HE tăng giá trị thích ứng (AIVHE) [84]. Bằng
việc sử dụng phương pháp AIVHE, độ tương phản được tăng cường và được điều
khiển bởi hai tham số người dùng beta và gamma, nhưng thông tin chi tiết không
phải lúc nào cũng được bảo tồn. Để khắc phục vấn đề này thuật toán di truyền được
dùng để tối ưu giá trị beta và gamma bằng việc tối ưu giá trị entropy.
55
Một tiếp cận heuristic tham lam, được điều khiển bởi một tham số đơn giản,
để xấp xỉ vấn đề tối ưu mà bao gồm ràng buộc cảm nhận bắt nguồn từ hàm nhạy
cảm tương phản ngưỡng trên của con người mà theo luật weber được đề xuất bởi
Aditi Majumder [8].
Ảnh bao gồm nhiều đối tượng được phân cụm mà chồng lặp lên mỗi cụm khác
và giấu đi cấu trúc mà hướng đến vấn đề trích chọn cấu trúc. Để giải quyết vấn đề
phân lớp, Subba Rao Katteda và cộng sự đã đề xuất thuật toán gọi là tối ưu đàn kiến
và kĩ thuật dựa trên logic mờ [98]. Bằng việc sử dụng logic mờ các luật được hình
thành và bằng việc sử dụng tối ưu đàn kiến mỗi giá trị cường độ điểm ảnh được thu
thập một cách riêng biệt. Dựa trên luật logic mờ các điểm ảnh được gom nhóm với
nhau để lấy lại cấu trúc, nhưng rất phức tạp để hình thành luật mờ.
Một hệ thống tối ưu đàn kiến mờ mới cho việc xác định tham số được đề xuất
bởi Tao mà dựa trên luật mờ, hành vi chuyển đổi của những con kiến được khởi
xướng. Luật xác suất chuyển được tạo mới để chọn thành phố tiếp theo. Do đó tham
số đúng của bộ điều khiển trượt mờ cho việc dao động và cân bằng quả lắc đảo
ngược và hệ thống xe đẩy được tìm ra [104].Vittorio Maniezzo trong nghiên cứu
của mình đã đề xuất thuật toán siêu heuristic cho vấn đề tối ưu kết hợp. Hệ kiến
(AS) được áp dụng ban đầu đến giải pháp của vấn đề người bán hàng du lịch, sau đó
ACO được áp dụng để tìm giải pháp tốt hơn [114]. Trong AS mùi được cập nhật
cho tất cả các giải pháp thu được bởi đàn kiến. Trong ACS tất cả kiến được lặp và
tại thời điểm kết thúc mỗi mỗi vòng lặp, mùi chỉ được cập nhật bởi giải pháp tốt
nhất. Vì vậy con kiến tìm được đường một cách dễ dàng và tránh được thời gian hội
tụ dài.
Tối ưu đàn kiến (ACO) là kĩ thuật tối ưu được lấy cảm hứng từ hành vi của
con kiến trong thực tế, làm sao đàn kiến gửi mùi để tìm thức ăn. J. Tian đã giới
thiệu ACO để giải quyết vấn đề tìm cạnh. ACO dựa trên tiếp cận tìm cạnh phát triển
ma trận mùi mà thể hiện thông tin cạnh trên mỗi vị trí điểm ảnh. Quá trình xây dựng
và cập nhật được thực hiện lặp đi lặp lại để phát triển ma trận mùi. Cuối cùng, cạnh
được xác định bằng việc sử dụng quá trình quyết định, nhưng tải tính toán cần được
giảm bớt [108]. S. Meshoul đã đề xuất để thi hành việc khớp điểm mạnh mẽ và đề
nghị ước lượng cho mục đích đăng ký ảnh từ thông tin nhiễu và ngoại lai. Hệ kiến
(ACS) được sử dụng như một chiến lược tìm kiếm để xác định giải pháp khởi tạo.
Một tìm kiếm cục bộ được bao gồm cùng với chiến lược tìm kiếm để làm mịn giải
56
pháp thu được. Sự hội tụ đạt được và do đó độ chính xác được cải thiện, nhưng nó
có thể ổn định lên tới 30% dữ liệu ngoại lai [74].
Một ảnh có thể được nhóm thành các vùng thiếu sáng, hỗn tạp và quá sáng
dựa trên sự phơi bày trên ảnh[81]. Ảnh RGB được chuyển đổi thành ảnh HSV. Sắc
độ được bảo tồn còn thành phần độ sáng của ảnh bị thay đổi. Việc mờ hoá được
thực hiện trên các vùng thiếu và thừa sáng bằng việc sử dụng hàm thuộc Gaussian
dựa trên điểm giao và tham số tăng cường. Giá trị tối ưu của các tham số này đạt
được bởi kĩ thuật tối ưu hệ kiến thay đổi lặp đi lặp lại[81]. Ảnh sau tăng cường
được sinh bởi tiếp cận này vừa ý về mặt trực quan hơn.
Trong [11], Aman Tusia và cộng sự đã thực hiện một phân tích hiệu năng của
hệ thống mờ loại 2 cho việc tăng cường ảnh và tối ưu chỉ số hấp dẫn trực quan.
Trước khi xử lý, ảnh được vào được chuyển từ không gian màu RGB được chuyển
về không gian HSV để bảo tồn thông tin màu sắc. Hai ngưỡng dưới và trên được
định nghĩa để cung cấp ước lượng của các vùng thiếu sáng, trộn sáng và thừa sáng
trong ảnh. Ảnh được mờ hoá (loại 2) sử dụng hàm thuộc Gausian. Hàm sigmoid
được sử dụng để tăng cường các thành phần độ sáng của các vùng thiếu và thừa
sáng, các vùng trộn sáng được giữ nguyên trong suốt quá trình xử lý. Một hàm mục
tiêu bao gồm hàm entropy Shannon như nhân tố thông tin và chỉ số hấp dẫn trực
quan được tối ưu, để xác định các tham số cần cho việc tăng cường chỉ số hấp dẫn
trực quanthay vì xem xét entropy để làm ảnh thân thiện với mắt người. Qua việc so
sánh, tiếp cận này cho thấy sự tốt hơn so với tiếp cận tối ưu đàn kiến nhận tạo.
Ngoài ra, trong [13], [16], các tác giả cũng trình bày kĩ thuật tăng cường ảnh
dựa trên việc làm nổi bật cạnh sử dụng biến đổi Wavelet và lọc hình thái. Trong
[101], Swaminathan và cộng sự trình bày kĩ thuật tăng cường ảnh bằng việc kết hợp
giữa các phép biến đổi và phương pháp nộ suy.
1.4.2. Giải đoán ảnh viễn thám
1.4.2.1. Phân lớp không giám sát
Phân đoạn ảnh là nhiệm vụ cơ bản trong xử lý ảnh nói chung và xử lý ảnh viễn
thám nói riêng.Trong phân loại không giám sát, thông tin cho trước là không cần
thiết. Nó không yêu cầu chú thích con người hiểu được và tự động hoàn toàn. Thuật
toán này xác định các cụm trong dữ liệu và cũng phân tích nhãn cụm.
57
Phân đoạn ảnh có thể được định nghĩa như một quá trình hoà nhập các điểm
ảnh có đặc tính tương tự thành vào cùng nhóm, vùng. Ảnh phân đoạn do đó là hơp
của các nhóm phân biệt, tại đó các điểm ảnh của các vùng đồng nhất được kết hợp
đến cùng nhóm. Nhiều kĩ thuật đã được đề xuất, nơi mà các đặc trưng màu sắc, kết
cấu và cạnh được sử dụng để mô tả mỗi nhóm [39]. Các phương pháp phân đoạn
sớm chỉ xem xét ảnh xám. Khi ảnh màu, ảnh đa kênh trở thành chuẩn của rất nhiều
ứng dụng (ví dụ, ảnh địa lý, ảnh y tế, hoặc giám sát video, ảnh viễn thám) và sự tiến
bộ trong cả công nghệ ảnh màu, ảnh đa kênh và hiệu năng tính toán, sự quan tâm
của các kĩ thuật phân đoạn ảnh màu cũng tăng lên.
K-means là một trong những phương pháp học không giám sát đơn giản mà
giải quyết vấn đề phân cụm nổi tiếng [18]. Thủ tục theo một tiếp cận đơn giản và dễ
dàng để phân loại một tập dữ liệu đã cho thông qua một số cụm nhất định. Ý tưởng
chính là định nghĩa k trọng tâm, một trọng tâm cho mỗi cụm.
Trong [18], Balaji và cộng sự trình bày một phương pháp phân đoạn ảnh mới
dựa trên đặc trưng màu từ ảnh với việc chuyển điểm ảnh từ không gian RGB sang
không gian L*a*b* và phân cụm trên không gian này.Trong thuật toán này tác giả
không sử dụng bất kỳ dữ liệu huấn luyện nào và nghiên cứu được chia thành 2 giai
đoạn. Đầu tiên, tăng cường sự phân biệt màu của ảnh vệ tinh sử dụng giãn phản
tương quan được thực hiện và sau đó các vùng được nhóm thành một tập 5 lớp sử
dụng thuật toán phân cụm KMeans. Sử dụng quy trình hai bước này, có thể giảm
chi phí tính toán tránh việc tính đặc trưng cho mọi điểm ảnh.
Theo [54], các thuật toán phân đoạn ảnh truyền thống xử lý các điểm ảnh độc
lập và phân cụm chỉ dựa theo thông tin phổ. Điều này bỏ qua thông tin không gian
mà sẵn có trong ảnh. Các tác giả đã đề xuất tiếp cận đơn giản – một biến thể của
thuật toán KMeans – mà sử dụng cả thuộc tính không gian và phổ của ảnh. Những
điểm ảnh liền kề về mặt không gian rất có thể thuộc cùng một lớp hơn là một cặp
điểm ảnh ngẫu nhiên. KMeans truyền thống chỉ sử dụng thông tin phổ của một điểm
ảnh cho việc phân cụm. Ở đây, tác giả xem xét điểm ảnh tăng cường gồm bao gồm
toàn bộ các điểm ảnh trong lân cận 3 x 3 của điểm ảnh đang xét. Ảnh Landsat gồm
7 kênh nên điểm ảnh tăng cường có số chiều là 63. Tác giả tiếp tục sử dụng kĩ thuật
phân tích thành phần chính để giảm chiều rồi mới xử lý phân cụm. Tuy nhiên, chi
phí tính toán của thuật toán này vẫn rất lớn so với thuật toán k-means.
58
KMeans đánh mất đặc trưng ngữ cảnh (thông tin lân cận) của mỗi điểm ảnh
khi chỉ xem xét đặc trưng cường độ [52]. Các tác giả đã đề xuất thuật toán 2D-
KMeans với việc bổ sung giá trị trung vị như tham số không gian (thông tin ngữ
cảnh cục bộ) để tăng hiệu quả phân cụm. Cụ thể, nhóm giới thiệu các phiên bản
thay đổi của các thuật toán KMeans (KM) và KMeans dịch chuyển (MKM), được
gọi tương ứng là K-Means hai chiều (2D-KM) và K-Means dịch chuyển 2 chiều
(2D-MKM). Hiệu năng của hai thuật toán đề xuất này được so sánh với ba thuật
toán phân cụm thông thường được sử dụng không gian biến, tên là K-Means (KM),
C-Means mờ (FCM) và K-Means dịch chuyển (MKM). Các thuật toán mới kết hợp
giá trị trung vị của cường độ điểm ảnh được xem xét với điểm ảnh lân cận của nó;
cùng với cường độ của chính điểm ảnh cho quá trình gán của điểm ảnh đến cụm gần
nhất. Từ kết quả định tính và định lượng quan sát được, chứng minh rằng 2D-KM
và 2D-MKM thực hiện tốt hơn KM, FCM và MKM về việc sinh các kết quả phân
đoạn đồng nhất hơn, trong khi thời gian thực thi ngắn hơn khi so sánh với FCM.
Trong [77], Napoleon cùng cộng sự đã đề xuất một lược đồ phân lớp ảnh viễn
thám dựa trên phân loại không giám sát sử dụng hiệu quả thuật toán KMeans. Tập
dữ liệu thử nghiệm bao gồm tập dữ liệu ảnh Quick Bird và Landsat. Hình 1.18 mô
Hình 1.18. Kiến trúc phân lớp của Napoleon và cộng sự [77].
tả kiến trúc phân lớp mà Napoleon và cộng sự đề xuất.
59
Hình 1.19. Ảnh đầu vào Landsat và kết quả với 5 cụm [77].
Với máy tính cá nhân, giới hạn của tài nguyên phần cứng và thời gian tính
toán lớn trong việc xử lý một số lượng lớn ảnh viễn thám. Trong [123], thử nghiệm
việc song song hoá thuật toán KMeans trên Hadoop, một hệ nguồn mở mà cài đặt
mô hình lập trình MapReduce.Mô hình này yêu cầu các tính năng ‘map/reduce’ tuỳ
chỉnh, cho phép người dùng xử lý song song trong hai giai đoạn. Ưu điểm dễ thấy là
thời gian phân cụm giảm do dữ liệu được chia để thực hiện song song bởi nhiều bộ
xử lý. Tuy nhiên, vì Hadoop chưa xử lý trực tiếp đầu vào là ảnh nên phải có bước
chuyển đổi từ dạng file ảnh về file text và kích thước file đầu vào cho Hadoop tăng
lên.
Một số phương pháp có sẵn dùng để tăng tốc độ phân cụm k-means cứng
[61][64].Kanungo và các cộng sự [61] đã phát triển một thuật toán lọc trên một kd-
tree để tăng tốc độ sinh các tâm cụm mới.Việc sắp xếp các điểm dữ liệu trong một
kd-tree cho phân cụm k-means cũng được sử dụng bởi Pelleg và Moore [86].Sau
một số vòng lặp của phân cụm k-means cứng, hầu hết các tâm đã hội tụ đến vị trí
cuối cùng và đa số các điểm dữ liệu có vài đề cử được chọn như các tâm gần chúng
nhất. Lai và các cộng sự [64] đã khai thác đặc trưng này để phát triển một thuật toán
phân cụm KMeans nhanh để giảm độ phức tạp tính toán của phân cụm k-means.
Trong số các công thức phân cụm mà cực tiểu hoá hàm mục tiêu, phân cụm k-
means mờ được sử dụng và nghiên cứu rộng rãi [19].Thuật toán phân cụm k-means
mờ (FKM) thực hiện lặp bước phân vùng và bước sinh đại diện cụm mới cho đến
khi hội tụ. Trong [33], trình bay ứng dụng của FKM, đã cung cấp một đánh giá tốt
về FKM. Mỗi vòng lặp với việc tính toán mở rộng thường được yêu cầu để sinh một
tập các đại diện cụm. Sự hội tụ của FKM thường chậm hơn rất nhiều so với phân
cụm k-means cứng [36].
60
Để giảm độ phức tạp tính toán của FKM, Shankar và Pal đã sử dụng việc lấy
mẫu ngẫu nhiên đa trạng thái để giảm kích thước dữ liệu [95]. Phương pháp này đã
giảm độ phức tạp tính toán từ 2 đến 4 lần.
Höppner đã phát triển một FKM xấp xỉ để giảm độ phức tạp tính toán của
FKM truyền thống [50]. Phương pháp này đã đưa ra cùng một thành viên như FKM
truyền thống trong một độ chính xác đưa vào và đã giảm thời gian tính toán của
FKM xuống từ 2 đến 4 lần.
Chú ý rằng tất cả các phương pháp trên không thể đạt được cùng kết quả phân
cụm như FKM truyền thống. Sau một số vòng lặp của FKM, hy vọng rằng nhiều
tâm cụm đã hội tụ đến vị trí cuối cùng và nhiều tính toán khoảng cách có thể được
tránh tại các lặp tiếp theo. Đặc điểm này được khai thác để giảm bởi độ phức tạp
tính toán của phân cụm KMeans mờ.
Trong [26], hai thuật toán được trình bày để giảm thời gian tính toán của phân
cụm KMeans mờ. Một là, CDFKM. Ý tưởng của thuật toán này là sau một số vòng
lặp, một số tâm cụm đã ổn định (2 vòng lặp liên tiếp tâm thay đổi không đáng kể)
thì ko tính lại các tâm cụm này ở các vòng lặp sau đó để giảm chi phí tính toán. Hai
là, để tăng tốc độ hội tụ của CDFKM, các tác giả tình bày thuật toán CCEA để khởi
tạo tâm cụm. Ý tưởng của CCEA là chọn ngẫu nhiên một số tập con của tập dữ liệu
đầu vào. Ban đầu, CDFKM thực hiện trên một tập con để thu được tập tâm. Tiếp
đó, tập dữ liệu đầu vào được tăng lên bằng cách hợp thêm với một tập con và thực
hiện phân cụm bởi CDFKM sử dụng tập tâm khởi tạo của lần phân cụm trước. Cứ
như thế cho đến khi không còn tập con nào và ta có tập tâm cụm khởi tạo cuối cùng.
So với thuật toán phân cụm k-means mờ thông thường, phương pháp đề xuất trong
[26] có thể giảm thời gian tính toán từ 3.2 đến 6.5 lần. Phương pháp này mới sử
dụng khoảng cách Euclidean. Nhóm tác giả định hướng mở rộng với độ đo khoảng
cách khác như khoảng cách Hamming.
Trong [49], các tác giả tập trung trên tiếp cận phân cụm, đặc biệt là phân cụm
mờ (FCM) [119], mà được sử dụng bởi nhiều phương pháp phân đoạn [10] [25]
[63] [68] [118]. Tuy nhiên, các thuật toán này yêu cầu việc khởi tạo mỗi cụm [53],
và không khả thi với tập dữ liệu rất lớn như ảnh màu. Trong [49], cáctác giả đề xuất
một thuật toán khởi tạo hiệu quả mới đặc biệt để giải quyết vấn đề phân đoạn ảnh.
Hơn nữa, họ giới thiệu thuật toán lặp mờ mới cho phép phân đoạn ảnh nhanh.
61
Thuật toán FCM tuần tự tính toán rất nhiều và yêu cầu bộ nhớ đáng kể. Với
các ứng dụng như phân đoạn ảnh y khoa và phân tích ảnh địa lý đa số với các ảnh
kích thước lớn, FCM tuần tự rất chậm. Trong [88], các tác giả đề xuất một thuật
toán C-Mean mờ song song (FCM) cho phân đoạn ảnh. Trong thuật toán FCM song
song này, việc phân chia tính toán giữa các bộ xử lý và tối thiểu sự cần thiết truy
cập bộ nhớ thứ hai, tăng cường hiệu năng và hiệu quả của nhiệm vụ phân đoạn ảnh
cũng được so sánh với thuật toán tuần tự.Thuật toán này được cài đặt trên Red Hat
dựa trên cụm với 9 nút được cài đặt sử dụng phần mềm OSCAR (Open Source
Cluster Application Resource).
Một vấn đề của thuật toán phân cụm mờ là yêu cầu tính toán quá mức của
chúng khi xử lý tập dữ liệu ảnh lớn. Ngày nay phần cứng đồ họa thương mại cung
cấp khả năng tính toán song song cao. Trong [125], các tác giả trình bày một cài đặt
thuật toán phân đoạn ảnh kết nối mờ song song trên nền tảng kiến trúc thiết bị thống
nhất tính toán của Nvidia (CUDA) cho việc phân đoạn dữ liệu ảnh y khóa lớn. Thử
nghiệm dựa trên ba tập dữ liệu với kích thước nhỏ, trung bình, và lớn để minh
chứng hiệu quả của thuật toán song song, mà đạt được hệ số tăng tốc tương ứng là
7.2x, 7.3x, và 14.4x, cho ba tập dữ liệu trên cài đặt thuật toán trên CPU.
Trong [43], Golpar và cộng sự đã đề xuất thuật toán phân đoạn mờ đa độ phân
giải cho ảnh viễn thám. Theo [43], phân đoạn ảnh viễn thám, như một bước chính
của xử lý ảnh viễn thám, thường được thực hiện bởi việc phân cụm khi thực địa
không sẵn sàng cung cấp mẫu để huấn luyện một bộ phân loại giám sát. Để giải
quyết vấn đề này, Golpar và cộng sự đề xuất một tiếp cận mới với mục đích giảm
lỗi phân đoạn mờ cũng như thông tin cấu trúc được sử dụng trong thuật toán phân
cụm mờ đa độ phân giải họ đề xuất (MR-FCM). Kết quả thể hiện rằng thuật toán
MR-FCM có thể cải tiến kết quả của FCM chuẩn cho tiếp cận phân loại không giám
sát.
Trong [85], Parvathi và cộng sự đã đề xuất Thuật toán phân đoạn watershed
hình chop cho ảnh viễn thám độ phân giải cao sử dụng biến đổi wavelet rời rạc.
Biến đổi watershed là một công cụ phân đoạn hình thái hữu ích cho ảnh xám. Tuy
nhiên, hiện tượng quá nhiều phân đoạn và quá ít phân đoạn đã trở thành những vấn
62
đề chính cho thuật toán thông thường. Trong bài báo này, một phương pháp phân
đoạn có hiệu quả cho việc phân tích ảnh viễn thám độ phân giải cao được trình bày.
Phân tích Wavelet là một trong những kĩ thuật phổ biến nhất có thể được sử dụng để
tìm ra biến đổi cường độ cục bộ và do đó biến đổi wavelet được sử dụng để phân
tích ảnh. Biến đổi wavelet được áp dụng cho ảnh, sinh chi tiết (ngang, dọc, chéo) và
các hệ số xấp xỉ. Gradient của ảnh với số lượng tối thiểu các vùng được chọn được
ước lượng với hình thái tỉ lệ xám cho ảnh xấp xỉ ở độ phân giải phù hợp, và sau đó
watershed được áp dụng cho ảnh gradient để tránh hiện tượng quá nhiều phân đoạn.
Ảnh được phân đoạn được chiếu lên các độ phân giải cao sử dụng biến đổi wavelet
ngược. Phân đoạn watershed được áp dụng cho tập ảnh con có kích thước nhỏ, đòi
hỏi thời gian tính toán nhỏ. Các tác giả áp dụng tiếp cận mới này để phân tích ảnh
viễn thám. Thuật toán được cài đặt trên MATLAB. Các kết quả thử nghiệm đã
Bảng 1.1. Ảnh phân loại cuối cùng (a) ảnh gốc và (b) đến (d) là các ảnh gốc được áp
watershed từ độ phân giải mức 2 đến mức 0 tương ứng [85].
chứng tỏ đây là một phương pháp rất hiệu quả.
a
Ảnh vệ tinh 1 Ảnh vệ tinh 2
b
63
c
d
1.4.2.2. Phân lớp có giám sát
Phân lớp có giám sát yêu cầu thông tin trước khi thử nghiệm và thông tin này
phải được thu thập bởi phân tích. Phân tích này xác định các vùng huấn luyện cho
mỗi lớp thông tin và cũng từ đây thuật toán sinh các ranh giới quyết định. Tiếp cận
phân loại giám sát được sử dụng phổ biến là khoảng cách tối thiểu đến trung bình và
hợp lý tối đa.
Các phương pháp phân lớp truyền thống trong xử lý ảnh viễn thám như là
phương pháp hình hộp, phương pháp hợp lý tối đa vẫn được dùng trong việc phân
lớp [126].
Logic mờ là lý thuyết rất mạnh mẽ. Ưu điểm lớn của lý thuyết này là nó cho
phép mô tả tự nhiên, về ngôn ngữ, các vấn đề mà cần được giải quyết hơn là theo
mối quan hệ giữa các giá trị số chắc chắn. Ưu điểm này, nó có thể xử lý những hệ
thống phức tạp theo cách đơn giản, là lý do chính tại sao lý thuyết logic mờ được áp
dụng rộng rãi trong kĩ thuật. Nó cũng có thể được sử dụng để phân loại ảnh viễn
64
thám. Trong [78], Nedeljkovic đã đề xuất phương pháp phân lớp ảnh viễn thám mới
sử dụng logic mờ. Trong đó, tri thức cho trước về thông tin phổ cho các lớp phủ
nhất định được sử dụng để xây dựng tập luật mờ. Để xây dựng tập luật này, trước
tiên, hai tham số trung bình và độ lệch chuẩn đươc tính từ tập dữ liệu huấn luyện
của mỗi lớp. Phương pháp được thực hiện với sự hỗ trợ của công cụ logic mờ của
Matlab. Kết quả thử nghiệm của thuật toán đề xuất được so sánh với kết quả thử
nghiệm của thuật toán phân lớp hợp lý tối đa trong phần mềm ImageWorks của
PCI.
Ảnh viễn thám có nhiều kênh phổ có số lượng lớn dữ liệu về vùng đất được
quan tâm [96]. Kích thước ảnh tăng lên do sự cải tiến của các cảm biến vệ tinh chụp
ảnh. Việc xử lý các ảnh này đặt ra nhiều thách thức như là việc lựa chọn các kênh
thích hợp, trích chọn các đặc trưng liên quan, phân lớp… do sự đồng nhất phổ và
không gian. Việc chỉ sử dụng thông tin phổ từ ảnh đã phổ không đầy đủ để phân
loại. Sự kết hợp cả thông tin kết cấu và không gian với thông tin phổ làm tăng độ
chính xác phân loại của hệ thống.
Các đặc trưng không gian khác nhau được trích chọn từ ảnh như là độ dài,
động rộng, PSI (Pixel Shape Index), tỉ lệ… sử dụng khái niệm về đường trực tiếp
[67]. Ma trận đồng biến cố mức xám (GLCM- Gray level co-occurrence matrix)
[75] được sử dụng chủ yếu và thành công theo một số mức, và được dùng để tìm
đặc trưng kết cấu từ ảnh LANDSAT. Trong [83], một độ đo tương tự đặc trưng mới
được giới thiệu, được biết đến là chỉ số nén thông tin cực đại (MICI- Maximum
Information Compression Index). Tiếp cận này dựa trên sự phục thuộc tuyến tính
giữa các biến và lợi ích của việc lựa độ đo này rằng nếu chúng ta xoá một đặc trưng
phụ thuộc tuyến tính, dữ liệu sẽ vẫn có thể phân biệt một cách tuyến tính. Sau khi
trích chọn và lựa chọn các đặc trưng phù hợp từ anhrm các đặc trưng này được đưa
vào bộ phân loại để tiếp tục xử lý. Các tiếp cận phân loại như là KMeans [17], SVM
[117], BPNN [57][17] và PCNN được sử dụng. Trong [20], các kĩ thuật mạng
Neural được trình bày và so sánh cho ảnh viễn thám.
Trong [96], ảnh đa phổ LANDSAT được sử dụng để thực nghiệm và phân tích
kết quả. Đầu tiên, ảnh được phân tích thành phần chính sử dụng kĩ thuật PCA để
giảm số kênh từ bảy xuống còn ba. Sau đó, các đặc trưng kết cấu và không gian
được trích chọn sử dụng GLCM và PSI. Việc tính toán đặc trưng cấu trúc sử dụng
65
hai đặc trưng này [117]. Thứ ba, đặc trưng liên quan được chọn sử dụng tiếp cận S-
Index [83]. Thứ tư, cùng với đặc trưng phổ tạo thành đầu vào cho bộ phân loại.
Ba kĩ thuật phân lớp là k-NN, BPNN và PCNN được xem xét để phân lớp sử
dụng đặc trưng kết cấu, không gian và phổ [96]. Thử nghiệm thể hiện rằng tiếp cận
giám sát thực hiện tốt hơn tiếp cận không giám sát. So sánh giữa k-NN, BPNN và
PCNN được thực hiện sử dụng ba đặc trưng và độ chính xác phân loại của BPNN là
cao hơn so với k-NN và PCNN.
Trong [116], tác giả đưa ra một kết hợp giữa phân rã wavelet và mạng neural
cho việc phân loại ảnh viễn thám thuộc vùng đô thị.Phân loại ảnh viễn thám đóng
vai trò quan trọng trong nhiều nghiên cứu về đô thị. Nghiên cứu này trình bày một
phương pháp phân lớp ảnh toàn sắc sử dụng đặc trưng wavelet trong mạng Neural.
Một mạng Neural dựa trên cấu trúc với sự lan truyền ngược thông qua thuật toán
cấu trúc (BPTS) được thực hiện cho việc phân lớp ảnh toàn sắc. Sau khi phân ra
wavelet, nội dung của đối tượng có thể được phản ánh bởi các hệ số wavelet của đối
tượng đó. Do đó, cường độ phổ của điểm ảnh và các hệ số wavelet của nó có thể
được kết hợp như các thuộc tính cho mạng Neural. Các nút của biểu diễn cây của
một đối tượng có thể được biểu diễn bởi các thuộc tính. Để chứng tỏ hiệu quả của
phương pháp đề xuất, đặc trưng thông thường cũng được sử dụng trong thử nghiệm.
2510 điểm ảnh ứng với bốn lớp được lựa chọn ngẫu nhiên như tập dữ liệu cho việc
huấn luyện mạng Neural và 19498 điểm ảnh được chọn cho việc thử nghiệm. Bốn
lớp phủ đất được phân lớp hoàn toàn sử dụng dữ liệu huấn luyện. Độ chính xác
phân lớp dựa trên tập dữ liệu thử nghiệm lên tới 99.68%, tốt hơn 10% so với việc
chỉ sử dụng tập đặc trưng thông thường. Kết quả thử nghiệm thể hiện tiếp cận đề
xuất cho việc phân lớp ảnh toàn sắc hiệu quả và tin cậy hơn nhiều.
Trong [93], các tác giả cũng thử nghiệm và đánh giá phương pháp phân loại
SVM cho ảnh viễn thám.Trước đó, ứng dụng của các bộ phân lớp thống kê và mạng
Neural cho ảnh viễn thám đã được xem xét. Do đó, hiệu quả, đặc trưng, ưu và
khuyết điểm của các bộ phân loại đó cũng đã được biết đến, thậm chí với cả những
chuyên gia viễn thám. Trong bài báo này, các tác giả trình bày ứng dụng phân lớp
ảnh viễn thám với kĩ thuật nhận dạng mẫu mới được giới thiệu gần đây trong lý
thuyết học máy mà được phát triển bởi Vapnik và các công sự, có tên máy vector hỗ
trợ (SVM). Các thử nghiệm được thực hện trên tập dữ liệu ảnh viễn thám, với nhấn
mạnh cụ thể các giai đoạn thiết kế và huấn luyện SVM. Kết quả thử nghiệm cho
66
thấy hiệu quả phân lớp với SVM là cao hơn so với việc phân lớp sử dụng mạng
Neural và k láng giềng gần nhất.
Trong [37], các tác giả cũng thử nghiệm và đánh giá phương pháp phân loại
SVM cho ảnh viễn thám siêu phổ.Bài báo này tập trung vào vấn đề phân loại ảnh
viễn thám siêu phổ bằng máy vector hỗ trợ. Đầu tiên, các tác giả đề xuất một thảo
luận mang tính lý thuyết và phân tích thực nghiệm để hiểu và đánh giá khả năng của
bộ phân lớp SVM trong không gian đặc trưng siêu chiều. Sau đó, đánh giá hiệu quả
của SVM với mối liên hệ với các tiếp cận dựa trên việc giảm đặc trưng thông
thường và hiệu năng của chúng trong các siêu không gian con với số chiều khác
nhau. Để đảm bảo phân tích như vây, hiệu năng của SVM được so sánh với hiệu
năng của hai bộ phân tích phi tham số khác (ví dụ, mạng Neural hàm cơ sở radial và
bộ phân loại K láng giềng gần nhất). Cuối cùng, bài báo nghiên cứu vấn đề tiềm
năng quan trọng của việc áp dụng các SVM nhị phân để các vấn đề đa lớp trong dữ
liệu siêu phổ. Cụ thể, bốn chiến lược đa lớp khác nhau được phân tích và so sánh:
một đối với tất cả, một với một, và hai chiến lược dựa trên cây phân cấp. Các chỉ số
hiệu năng khác nhau được sử dụng để hỗ trợ cho các nghiên cứu thực nghiệm một
cách chi tiết và chính xác, ví dụ, độ chính xác phân loại, thời gian tính toán, sự ổn
định trong việc thiết lập tham số, và sự phức tạp của kiến trúc đa lớp. Kết quả thu
được trên tập dữ liệu siêu phổ ảnh hàng không cho phép kết luận rằng, bất kì chiến
lược đa lớp nào được thông qua, SVM là thay thế hợp lệ và hiệu quả cho các tiếp
cận nhận dạng mẫu thông thường (thủ tục giảm đặc trưng kết hợp với một phương
pháp phân loại) cho việc phân lớp dữ liệu viễn thám siêu phổ.
Trong [7], các tác giả nghiên cứu sử dụng ảnh viễn thám xác định sự phân bố
đất than bùn ở U Minh hạ. Việc nghiên cứu ứng dụng ảnh viễn thám trong xác định
sự hiện diện của than bùn là một nghiên cứu hết sức cần thiết, nhằm đáp ứng kịp
thời cho công tác quản lý, sử dụng hợp lý nguồn tài nguyên này. Kết quả đã sử dụng
ảnh viễn thám của vệ tinh World View1 và QuickBird với 58 điểm khảo sát hiện
trạng và 40 điểm khảo sát than bùn đã xác định được 6 nhóm đối tượng (lung bàu,
rừng già, rừng trồng lớn, rừng trồng nhỏ, lau sậy, dớn choại), với độ chính xác toàn
cục khá cao lần lượt là 94% và 95,6%. Đặc biệt đã xác định được đối tượng rừng
tràm già, dớn choại có tương quan cao với sự hiện diện của than bùn; từ đó đã giải
đoán và thành lập được bản đồ phân bố than bùn cho 2 ảnh theo 3 nhóm: khu vực
than bùn-rừng già, khu vực than bùn-dớnchoại và khu vực không có than bùn. Tuy
67
nhiên, dữ liệu thử nghiệm đều có độ phân giải không cao. Nhóm tác giả dự kiến tiếp
tục nghiên cứu trên các loại ảnh có độ phân giải không gian cũng như các loại ảnh
với các band phổ của các vệ tinh khác nhau trong nghiên cứu thành lập bản đồ phân
bố đất than bùn cũng như các nguồn tài nguyên khác. Các tác giả sử dụng phân
Hình 1 20. Kết quả phân loại có kiểm soát ảnh World View 1, QuickBird [7].
mềm Envi để thực hiện việc hiệu chỉnh, phân lớp dữ liệu.
Trong [5], tác giả đã nghiên cứuảnh hưởng của dữ liệu huấn luyện trong các
thuật toán phân loại ảnh viễn thám thông qua việc so sánh kết quả phân loại giữa hai
bộ phân loại là MLC (Maximum Likelihood Classification) và mạng thần kinh đa
lớp LNN (Layered Neural Networks).Phương pháp phânloại gần đúng nhất MLC
(Maximum Likelihood Classification) dựa trên cơ sở giả thuyết hàm mật độ xác
suất tuân theo luật phân bố chuẩn, đã được áp dụng khá phổ biến trong phân loại
ảnh viễn thám và được xem như là thuật toán chuẩn để so sánh với các thuật toán
khác. Bằng thuật toán MLC, chúng ta có thể nhận một kết quả phân loại sai lệch nếu
như dữ liệu ảnh vệ tinh được tiến hành phân loại không tuân theo luật phân bố
chuẩn. Để khắc phục nhược điểm của MLC, mạng thần kinh đa lớp LNN (Layered
Neural Networks) đã được áp dụng và đem lại kết quả rất đáng tin cậy. Mối quan
hệ lý thuyết giữa LNN và MLC đã được làm sáng tỏ bởi Wan (1990) và Ruck et al.
(1990) với kết luận là giá trị xuất của LNN, khi đã được huấn luyện với bộ dữ liệu
mẫu đầy đủ, được xem như là giá trị ước tính của xác suất sau trong phân loại
MLC.
68
Để khảo sát ảnh hưởng của bộ dữ liệu huấn luyện đến kết quả phân loại của 2
phương pháp, bộ ảnh quang học đa phổ được sử dụng để phân thành 7 loại [5]. Ba
bộ dữ liệu mẫu có số pixels khác nhau (1000, 1500 và 2000 pixels) được thực
nghiệm trên thuật toán phân loại gần đúng nhất (MLC) và mạng neural đa lớp
(LNN).Ưu thế của từng phương pháp phân loại trên cùng bộ dữ liệu huấn luyện sẽ
được đánh giá bởi ma trận sai số trong phân loại.
Trong [4], các tác giả đã trình bày chiến lược phân loại hướng đối tượng cho
ảnh viễn thám độ phân giải cao.Các kĩ thuật viễn thám đang đạt được nhiều và quan
trọng hơn trong việc phân loại lớp phủ và phân tích đô thị. Và tiếp cận phổ biến
nhất của phân loại là phân loại giám sát dựa trên điểm ảnh để phân loại các kiểu lớp
phủ khác nhau. Tiếp cận phân loại giám sát dựa trên điểm ảnh đề phân loại ảnh sử
dụng đặc trưng phổ. Hiện tại, với ảnh đa phổ viễn thám độ phân giải cao, chúng ta
không thể thu được độ chính xác cao của phân loại lớp phủ nếu sử dụng tiếp cận
dựa trên điểm ảnh. Trong bài báo này, một chiến lược phân loại dựa trên đối tượng
sử dụng máy vector hỗ trợ phân cấp được giới thiệu. Bằng việc kết hợp thông tin
không gian và phổ, số lượng chồng chép giữa các lớp có thể tăng lên. Bằng cách
này, độ chính xác phân loại cao hơn và bản đồ lớp phủ đô thị càng chính xác. Lúc
đầu, ảnh được phân đoạn với kĩ thuật phân đoạn đa tỉ lệ. Các đối tượng ảnh được
phân lớp với bộ phân loại máy vector hỗ trợ phân cấp. Ngoài đặc trưng phổ, đối
tượng ảnh được trích chọn thêm các đặc trưng diện tích, entropy, chỉ số hình dạng
và đặc trưng liên quan ngữ cảnh.
69
Hình 1 21. Sơ đồ quá trình nhận dạng.
Hình 1.22. Ảnh đầu vào, kết quả phân loại dựa trên tiếp cận điểm ảnh, tiếp cận đối tượng.
Thành công của tiếp cận phân loại hướng đối tượng phụ thuộc rất nhiều và
chất lượng của pha phân đoạn [4]. Ảnh thử nghiệm của nhóm tác giả vẫn là ảnh
màu với kích thước nhỏ nên chưa thể hiện được vấn đề của thuật toán phân đoạn,
đặc biệt là phân đoạn đa tỉ lệ (thuật toán watershed). Với ảnh kích thước lớn, độ
phân giải cao như ảnh viễn thám, tốc độ thực thi của các thuật toán phân cụm, đặc
biệt là phân đoạn đa tỉ lệ [85] hay phân cụm mờ rất chậm.
70
Trong [2], các tác giả đã xây dựng phát triển phần mềm xử lý ảnh viễn thám
VNSIP trên nền phần mềm nguồn mở GRASS với nhiều tính năng: Nhập xuất, tăng
cường ảnh, phân đoạn và phân lớp ảnh...Các tác giả giới thiệu một số kết quả liên
quan đến việc phát triển phần mềm xử lý ảnh viễn thám trên nền phần mềm nguồn
mở GRASS. Sau khi khảo sát, đánh giá các ưu nhược điểm chính của phần mềm
GRASS, một số kỹ thuật mới về xử lý ảnh, phân lớp ảnh viễn thám được nghiên
cứu và phát triển bổ sung. Giao diện người sử dụng thuận tiện cũng đã được nghiên
cứu cài đặt. Cuối cùng, bài báo trình bày kết quả đánh giá, thử nghiệm bước đầu về
phương pháp xử lý, phân loại ảnh viễn thám và giao diện phần mềm này tiến tới
khuyến cáo sử dụng sao cho phù hợp. Các kết quả nghiên cứu và thử nghiệm trình
bày trong báo cáo này được hoàn thành trong khuôn khổ thực hiện đề tài NCKH cấp
nhà nước thuộc Chương trình Khoa học và Công nghệ Vũ trụ mã số VT01/09-2009.
1.5. Phân tích, đánh giá về thành công, ưu điểm, hạn chế
Cho đến hiện tại, lĩnh vực ứng dụng viễn thám nói chung và xử lý, phân tích
ảnh viễn thám nói riêng, các nghiên cứu trên thế giới đã đạt được những thành công
to lớn từ giai đoạn thu thập ảnh với những cải tiến sâu sắc, thành tựu lớn của các vệ
tinh viễn thám ngày càng hiện đại, các vấn đề tiền dữ lý dữ liệu viễn thám cho đến
việc phân loại, phân tích ảnh viễn thám cũng như các ứng dụng hậu phân loại.
Trong nước ta, lĩnh vựcnày cũng xuất hiện từ khá sớm và hiện tại đang được quan
tâm rất lớn.
Tuy nhiên, nói riêng trong vấn đề xử lý, phân tích ảnh viễn thám vẫn còn một
Thứ nhất, các phương pháp tăng độ tương phản áp dụng tiếp cận toàn cục
để tăng cường tất cả mức độ sáng của ảnh. Ưu điểm của tiếp cận này là đơn
số vấn đề sau mà có thể cải tiến:
giản, tất cả các điểm ảnh đều có chung một chiến lược biến đổi, tăng cường.
Tuy nhiên, ảnh vệ tinh có nhiều đối tượng và các vùng khác nhau cùng với
đó là các thông tin tương phản cục bộ. Nếu chỉ sử dụng tiếp cận toàn cục
thường khó để tăng cường tất cả các đối tượng xuất hiện trong, bởi vì thông
tin tương phản cục bộ và chi tiết có thể bị mất trong các vùng sáng và tối.
Theo quan điểm của xác suất thống kê, tiếp cận toàn cục xem như toàn bộ
dữ liệu ứng với một phân bố và áp dụng chung một mô hình cho mỗi phần
tử. Quan điểm này là không thực tế. Do đó, đã có nhiều nghiên cứu xem dữ
71
liệu có sự tổng hợp của nhiều phân bố. Phần tử nào thuộc phân bố nào sẽ
được áp dụng mô hình ứng với phân bố đó. Ngoài ra, các phương pháp này
vẫn chọn thủ công các giá trị cho các ngưỡng cận dưới và cận trên nên
không phải lúc nào cũng chọn được giá trị tốt làm ảnh hưởng đến kết quả
tăng cường ảnh.
Thứ hai, về vấn đề phân lớp ảnh viễn thám, các kĩ thuật phân lớp thường áp
dụng cho ảnh viễn thám đa phổ là không mới như các kĩ thuật đã áp dụng
cho ảnh màu. Nếu như có thể cải tiến các kĩ thuật đã có và các kĩ thuật mới
đã áp dụng thành công cho ảnh màu có thể tăng cường chất lượng phân lớp
ảnh viễn thám đa phỏ. Hơn nữa, tốc độ thực thi của một số kĩ thuật phân lớp
vẫn chậm với ảnh kích thước lớn như ảnh viễn thám độ phân giải cao.
1.6. Kết luận chương I
Chương I đã trình bày tổng quan về viễn thám và xử lý ảnh viễn thám bao
gồm: trình bày tiến trình viễn thám, các đặc trưng viễn thám và khuôn dạng chung
của ảnh viễn thám và các loại ảnh vệ tinh khác nhau. Viễn thám được ứng dụng
rộng rãi trong nhiều lĩnh vực khác nhau.
Chương I cũng trình bày tổng quan về giải đoán ảnh viễn thám đa phổ. Quy
trình giải đoán ảnh viễn thám bao gồm nhiều bước như: Hiệu chỉnh ảnh, tăng cường
ảnh và giải đoán (Phân lớp ảnh). Trong đó, luận án tập trung nghiên cứu sâu về tăng
cường và giải đoán tự đoạn-phân lớp ảnh viễn thám đa phổ.
Tiếp theo, chương I đưa ra bức tranh tổng quan về tình hình nghiên cứu trong
và ngoài nước liên quan đến vấn đề tăng cường chất lượng ảnh và phân lớp ảnh viễn
thám. Cho đến hiện tại, các nghiên cứu trên thế giới đã đạt được những thành công
to lớn từ giai đoạn thu thập ảnh với những cải tiến sâu sắc, thành tựu lớn của các vệ
tinh viễn thám ngày càng hiện đại, các vấn đề hiệu chỉnh, tăng cường chất lượng dữ
liệu cho đến việc phân lớp, phân tích ảnh viễn thám cũng như các ứng dụng hậu
phân lớp. Trong nước ta, lĩnh vực này cũng xuất hiện từ khá sớm và hiện tại đang
được quan tâm rất lớn.
Qua đây, luận án phân tích ưu điểm cũng như những mặt còn hạn chế của các
phương pháp và nghiên cứu đã có, làm cơ sở để nghiên cứu sinh tìm ra các phương
pháp mới, để có thể cải tiến và ứng dụng vào thực tế đem lại hiệu quả tốt hơn. Các
cải tiến của luận án được trình bày trong chương II và III.
72
CHƯƠNG II: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN TĂNG
CƯỜNG ĐỘ TƯƠNG PHẢN ẢNH VIỄN THÁM ĐA PHỔ
Trong chương II, luận án trình bày một số thuật toán tăng cường độ tương
phản dựa trên logic mờ. Qua đó, phân tích những hạn chế của các thuật toán này.
Từ đây, luận án đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám mới dựa
trên tiếp cận cục bộ theo cụm. Kết quả đề xuất được nghiên cứu sinh công bố trong
các bài [TRU1], [TRU2] và [TRU9].
2.1. Một số thuật toán tăng cường độ tương phản ảnh dựa trên logic mờ
2.1.1. Tăng cường ảnh mờ với toán tử tăng cường
Phương pháp này sử dụng toán tử tăng cường để giảm tính mờ của ảnh mà đưa
ra trong một sự tăng cường độ tương phản ảnh [47]. Thuật toán có thể được phát
biểu như sau:
Bước 1: Đặt các tham số Fe (Exponential fuzzifiers), Fd (Denomination
fuzzifiers), gmax (Maximum gray level) của hàm thuộc
(5) Fe= 2 và
]
Bước 2: Định nghĩa hàm thuộc
(6) ( ) [
Bước 3: Thay đổi giá trị hàm thuộc
{
[ ]
[ ]
(7)
Bước 4: Sinh mức xám mới
)
))
(
) (((
(8)
2.1.2. Tăng cường ảnh mờ với toán tử Hyperbol
Ý tưởng của lược đồ tần suất hyperbol hoá, và lược đồ tần suất hyperbol hoá mờ
được mô tả tương ứng trong [110]. Do nhận thức độ sáng của con người không
73
tuyến tính, thuật toán này thay đổi giá trị hàm thuộc của các mức xám bởi hàm
logarit. Thuật toán có thể được phát biểu như sau:
Bước 1: Thiết lập dạng hàm thuộc.
Bước 2: Đặt giá trị của tham số mờ β.
Bước 3: Tính các giá trị hàm thuộc μmn.
Bước 4: Thay đổi các giá trị hàm thuộc bởi β.
Bước 5: Sinh mức xám mới, như mô tả ở dưới.
Trong thuật toán này, dạng của hàm thuộc được thiết lập như tam giác để đặc trưng
mn bởi đẳng thức sau:
]
cho ranh giới, và giá trị của tham số mờ β như một ranh giới: β = - 0.75 + 1.5μ. Sau
đó, bằng việc tính giá trị hàm thuộc μmn và thay đổi giá trị hàm thuộc bởi β, sinh giá
trị mức xám mới g’
(
(9) ) [
2.1.1. Tăng cường ảnh mờ dựa trên phân bố xác suất
Phân bố xác suất [9] của các mức xám trong ảnh gốc có thể được đặc trưng bằng
việc sử dụng năm tham số: (α, β1, γ, β2, max). Ở đó, giá trị cường độ γ biểu diễn giá
trị trung bình của phân bố, α là cực tiểu, và max là cực đại. Mục tiêu là để giảm các
mức xám nhỏ hơn β1, và lớn hơn β2. Các mức cường độ giữa (β1, γ) và giữa (γ,
β2) được giãn theo hai hướng từ trung bình γ.
Hình 2.1. Hàm phân bố xác suất cho việc tính toán các giá trị hàm thuộc.
74
2.1.2. Cải thiện độ tương phản dựa trên luật If-Then mờ
Tiếp cận dựa trên luật mờ là phương pháp mạnh và phổ biến cho nhiều tác vụ
trong xử lý ảnh [47]. Một hệ thống dựa trên luật suy luận rất đơn giản được phát
triển. Hàm mờ được mô tả trong hình 3.40.
Hình 2.2. Hàm thuộc.
Thuật toán bắt đầu với việc khởi tạo các tham số ảnh; mức xám cự đại và cực
tiểu. Sau đó bằng việc mờ hóa các mức xám (ví dụ, giá trị hàm thuộc thành tối, xám
và sáng) thiết lập các mức xám. Thủ tục suy luận đánh giá một cách thích hợp các
luật sau đây:
(1) Nếu tối thì đen
(2) Nếu xám thì xám
(3) Nếu sáng thì trắng
2.2. Hạn chế của các thuật toán tăng cường mờ
Qua phân tích về phương pháp tăng cường ảnh mờ đã có như được trình bày
Một là, các thuật toán tăng cường mờ trên vẫn sử dụng tiếp cận toàn cục
như các phương pháp truyền thống, điểm ưu việt hơn chỉ là có thêm ma trận
hàm thuộc cho ảnh. Vì vậy, vẫn khó để tăng cường độ tương phản giữa các
lớp phủ đất (các đối tượng che phủ mặt đất) xuất hiện trong ảnh vệ tinh, bởi
trong các mục 2.1 của luận án, luận án có một số nhận xét sau:
75
vì thông tin tương phản cục bộ và chi tiết vẫn có thể bị mất trong các vùng
Hai là, khi cài đặt thuật toán, cụ thể trong [47], các ngưỡng cận trên max,
dưới min vẫn phải chọn thủ công dựa trên lựa đồ xám. Như vậy, với mỗi
sáng và tối.
Ba là, giống như phương pháp truyền thống, phương pháp tăng cường ảnh
ảnh khác nhau thì sẽ phải dò tìm thủ công, thiếu hiệu quả và việc chọn
ngưỡng có thể không tốt.
,
,
,
,
,
,
mờ chỉ thực hiện trên một kênh phổ (ảnh đa cấp xám hay từng kênh của ảnh
đa kênh). Với ảnh đa phổ như ảnh màu RGB hay ảnh viễn thám đa phổ,
thuật toán sẽ được thực hiện trên từng kênh ảnh. Giả sử ta có một điểm ảnh
…). Như vậy,
P với các mức xám tương ứng với các kênh là (
… có quan hệ cùng một điểm ảnh. Khi thực hiện
các giá trị xám
thuật toán tăng cường ảnh mờ theo từng kênh, mối quan hệ này không được
…) sẽ được tăng
bao hàm. Khi đó, mỗi value xám trong bộ (
cường một cách độc lập nên khó đảm bảo quan hệ phổ nêu trên giữa các giá
trị xám mới sau tăng cường. Do đó, tương quan phổ của các đối tượng trong
ảnh sau đầu ra có thể không được bảo tồn.
2.3. Một số độ đo chất lượng tăng cường ảnh
Để đánh giá chất lượng ảnh, chúng ta có thể sử dụng phương pháp trực quan hay
các chỉ số độ đo chất lượng. Để đo độ tương phản của ảnh, chúng ta có thể sử dụng
một số độ đo như sau: Shannon Entropy H, Entropy mờ FH, chỉ số tuyến tính mờ γ,
độ đo chất lượng ảnh IQM …
a. Độ đo Entropy
Shannon Entropy (hoặc entropy thông tin) là một phương pháp đo tính không chắc
chắn của thông tin. Giả sử có n sự kiện trong không gian mẫu, xác suất mỗi sự kiện
là pi (i = 1, 2, …, n), mỗi pi ≥ 0, và tổng của pi được đinh nghĩa bằng 1. Do đó, một
hàm H có thể được định nghĩa để đo độ không chắc chắn của không gian mẫu [56].
Với xử lý ảnh, n đưa ra bởi số mức xám. Sau đó H được mô tả như đẳng thức 18.
Từ các giá trị của entropy, nó chứng tỏ rằng thông tin của ảnh là phong phú hơn khi
entropy cao hơn.
(10) ∑ ( )
76
Trong đó,
L = số mức xám.
Pi = xác xuất của mức i trong histogram.
Như vậy, để tính Entropy của ảnh ta có thể phát biểu như sau:
Đầu vào: Ảnh đa cấp xám.
Đầu ra: Giá trị Entropy.
Thuật toán được mô tả như sau hình 2.3 dưới đây:
Bước 1: Đặt L = 255, i = 0, nhập ảnh
Bước 2: Nếu i < L sang B3, ngược lại kết thúc.
Bước 3: Tính xác suất của mức xám i từ ảnh
Bước 4: Cập nhật Entropy.
Bước 5: Xuất giá trị Entropy.
b. Độ đo tính mờ và entropy mờ
Chỉ số mờ γ được định nghĩa bởi Kaufmann [47][99] và entropy mờ FH bởi
DeLuca và Termini [47]. Chỉ số mờ, ví dụ, phản ánh sự không rõ ràng trong ảnh bởi
việc đo khoảng cách giữa mặt phẳng thuộc tính mờ và mặt phẳng thông thường gần
nhất. Cả chỉ số mờ và entropy mờ đều là chỉ số đo cho sự không rõ ràng mức xám
toàn cục của ảnh. Các chỉ số này có thể được lưu ý như một độ khó trong việc quyết
định liệu một điểm ảnh nên được xem như đen (tối) hoặc trắng (sáng).
∑ (11) ∑ ( )
∑ ∑ ( ) ( ) ( ) ⁄
(12)
Trong đó,
M x N: Kích thước ảnh
: Giá trị hàm thuộc của điểm ảnh tại vị trí dòng m, cột n
Như vậy, để tính độ đo mờ của ảnh ta có thể phát biểu như sau:
77
Input: Ảnh đa cấp xám.
Ouput: Giá trị γ.
Bước 1: Với mỗi điểm ảnh, tính giá trị độ thuộc tương ứng
Bước 2: Cập nhật giá trị độ đo mờ
Bước 3: Nếu vẫn còn điểm ảnh thì quay lại bước 1, ngược lại thì kết
Thuật toán tính độ đo mờ của ảnh được mô tả như sau:
thúc.
Nill và Bouzas đã đề xuất một phương pháp đo chất lượng của cảnh tự nhiên dựa
trên hệ thống trực quan con người chỉ số IQM [80].
∑
∑ ( ) ( ) ( ) ( )
(13)
Trong đó,
M2 = kích thước ảnh.
S( 1) = tham số tỉ lệ ảnh có hướng.
W(ρ) = bộ lọc nhiễu Wiener sửa đổi.
A2(Tρ) = hàm truyền điều chế của hệ thống trực quan con người.
P(ρ, ) = phổ năng lượng ảnh chuẩn hóa độ sáng.
ρ, = tần số không gian trong hệ tọa độ cực.
Trong các công trình nghiên cứu và luận án, nghiên cứu sinh sử dụng độ đo Entropy
và độ đo tính mờ để đánh giá chất lượng của ảnh trước và sau tăng cường.
2.4. Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám dựa trên
tiếp cận cục bộ
Bảng 2.1. Quy trình thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ.
Các bước chính của kĩ thuật tăng cường ảnh viễn thám dựa trên tiếp cận cục
bộ (Local based Remote Sensing Image Enhancement-LoRSIE) được liệt kê trong
bảng 2.1.
Giai đoạn Nhiệm vụ
78
1 Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm
2 Xây dựng mô hình hiệu chỉnh mức xám theo cụm
3 Tính ngưỡng tự động theo cụm
4 Sinh ảnh tăng cường dựa trên việc tổng hợp các mức
xám hiệu chỉnh theo từng cụm
Trong các phần 2.5 và 2.6, luận án trình bày hai thuật toán tăng cường ảnh
viễn thám dựa trên tiếp cận cục bộ sử dụng các thuật toán phân cụm mờ FCM và
phân cụm rõ KMeans.
2.5. Tăng cường ảnh viễn thám sử dụng phân cụm mờ
2.5.1. Thuật toán tăng cường ảnh viễn thám sử dụng phân cụm mờ
2.5.1.1. Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm mờ
Phân cụm c-Means mờ [119] là thuật toán được dùng rộng rãi của phân lớp mờ.
Trong khi xem xét logic tập mờ, thuật toán được phát triển dựa trên phân cụm
KMeans. Trong thuật toán này, mỗi điểm ảnh không về duy nhất cụm nào và được
biểu diễn bởi nhiều thành viên của mỗi cụm.
Bài toán phân cụm mờ phát biểu như sau. Cho tập dữ liệu X gồm n đối tượng
tổ chức thành c cụm thể hiện qua hàm liên thuộc mô
tả mức độ đối tượng dữ liệu thuộc về cụm i với mọi :
(14) ( )
∑
(15) ( )
∑ ∑ ( )
Thuật toán phân cụm FCM [119] được thực hiện lặp nhằm tối ưu (cực tiểu hóa) hàm
mục tiêu (Jm) sau:
(16) ( )
Trong đó:
c: số cụm;
n là số pixel của ảnh;
79
là giá trị hàm thuộc của pixel thứ j và trung tâm cụm thứ i;
m là trọng số mũ, tham số mờ;
là vector thứ j;
là vector trung tâm của cụm thứ i;
( ) là khoảng cách giữa và .
Để tối ưu hóa hàm mục tiêu trong công thức (2), các trung tâm cụm và giá trị
có thể được tính theo công thức sau:
∑ ( )
∑ ( )
( ) (17)
[∑ (
( )
)
( )
] (18) ( )
3. Thuật toán FCM như sau:
Đầu vào: Số cụm c, tham số mờ, tiêu chuẩn dừng .
Đầu ra: c cụm dữ liệu sao cho hàm mục tiêu (2) đạt giá trị tối thiểu.
Bắt đầu
Bước 1: Nhập giá trị cho 2 tham số c( ), [ ); k = 0;
khởi tạo ma trận phân hoạch ( ) thỏa mãn (1a), (1b), (1c), điều
kiện dừng .
Bước 2: Tại bước k:
2.1: Tính các tâm cụm ( ) theo công thức (3).
2.2: Tính ma trận thành viên cập nhật ( ) theo công thức (4).
2.3: So sánh ( ) và ( ). Nếu ‖ ( ) ( )‖ thì dừng.
Ngược lại, tăng k, quay lại 2.1.
Kết thúc.
2.5.1.2. Xây dựng mô hình biến đổi mức xám theo cụm
Trong phần này, chúng ta sẽ xây dựng hàm biến đổi mức xám để tăng cường
theo mỗi cụm. Hàm này được tạo từ công thức giãn mức xám sau đây:
80
(19)
Hàm biến đổi mức xám theo cụm được phát biểu như sau:
(20) ( )
Trong đó:
là giá trị cực tiểu
là giá trị cực đại
là cận dưới
là cận trên
là giá trị mức xám cũ
là giá trị mức xám mới
Theo cách trên, ta đã xây dựng được hàm biến đổi mức xám theo toán tử giãn
mức xám. Bằng cách tương tự, chúng ta có thể xây dựng được hàm biến đổi mức
xám cho toán tử Hyperbol, tăng cường... Trong nghiên cứu này, luận án xây dựng
hàm biến đổi cho toán tử Giãn mức xám và Hyperbol, và được phát biểu theo từng
Bảng 2.2. Các hàm biến đổi mức xám theo từng cụm.
cụm trong bảng 2.2.
Ý nghĩa Công thức biến đổi Ti(g)
) [ ( ) ] (22)
(
(21) Giãn
mức xám
Trong đó:
Biến đổi
Hyperbol
{
(23)
Trong đó:
81
g = giá trị xám gốc.
= cận trên của việc giãn cụm i.
= cận dưới của việc giãn cụm i.
= tâm cụm i.
Giá trị của các ngưỡng và được tính tự động theo từng cụm
như trong mục 2.4.1.3.
2.5.1.3. Tính ngưỡng tự động theo cụm
Giả sử, ( ) là hàm phân bố của mức xám theo một cụm cho trước. ( )
và các tham số: , , được thể hiện trong hình 2.1.
Các ngưỡng , được xác định bằng cách chọn sao cho vùng
gạch chéo (hình 2.1) có diện tích bằng 95% tổng diện tích được bao bởi các đường
Hình 2.3. Hàm phân bố và các ngưỡng theo từng cụm.
y = 0 và y = ( ).
Ý nghĩa của việc chọn ngưỡng như trên là để vùng được chọn không bị ảnh
hưởng bởi nhiễu.
2.5.1.4. Sinh ảnh tăng cường dựa trên việc tổng hợp mức xám hiệu chỉnh theo
cụm
Dựa trên mô hình biến đổi mức xám theo mỗi cụm đã xây dựng trong phần
2.5.1.2, mỗi giá trị xám đầu vào sẽ được chuyển các thành giá trị mới tương ứng với
các cụm. Nhiệm vụ còn lại là tổng hợp các giá trị này để sinh ra giá trị xám duy
nhất. Hàm tổng hợp này có dạng tổng quát như sau: g | g’ = T(g). Trong đó,
82
(24) ( ) ∑ ( )
( )
Trong đó:
g = giá trị xám gốc.
= cận trên của việc giãn cụm i.
= g cận dưới của việc giãn cụm i.
= tâm cụm i.
= giá trị độ thuộc của mức xám g theo cụm i.
2.5.2. Phát triển thuật toán LoRSIE_FCM cho ảnh đa phổ
Thuật toán LoRSIE_FCM dựa trên tiếp cận phân cụm, thực hiện tính ngưỡng
tự động, khắc phục được hạn chế 1 và 2 (nhận xét trong mục 2.2). Tuy nhiên, đối
với ảnh đa kênh, vẫn chưa rõ làm thế nào để thuật toán này có thể khắc phục được
hạn chế 3. Phát triển dưới đây sẽ cho phép giải quyết vấn đề này.
Bản chất FCM là thuật toán phân cụm các đối tượng là các vector có nhiều
thành phần. Và do vậy, FCM đã thực hiện rất tốt cho ảnh đa kênh như ảnh màu
,
,
,
,
Bước 1: Cục bộ hóa ảnh đầu vào. Sau khi thực hiện thủ tục phân cụm, mỗi
…) sẽ được đặc trưng thêm bởi một bộ các giá trị độ
điểm ảnh P(
thuộc ứng với các cụm khác nhau. Như vậy, quan hệ cùng một điểm ảnh
…) được đặc trưng bởi bộ các giá trị độ thuộc trên.
của một bộ (
Do đó, giải quyết được hạn chế thứ 3 trong mục 2.2.
Bước 2: Xây dựng mô hình hiệu chỉnh mức xám. Vẫn thực hiện việc này
RGB. Như vậy, thuật toán trên áp dụng cho ảnh viễn thám đa phổ như sau:
được tính
Bước 3: Tính ngưỡng tự động. Các ngưỡng
và
như được trình bày trong mục 2.4.1.b.
Bước 4: Sinh ảnh tăng cường. Với mỗi điểm ảnh P, ta có:
tự động theo từng cụm và từng kênh k.
) ∑ (
)
)
(25) (
(
83
= giá trị xám gốc của điểm ảnh P thuộc kênh thứ k.
= cận trên của việc giãn cụm i thuộc kênh thứ k.
Trong đó:
,
= tâm cụm i thuộc kênh thứ k. Mỗi tâm gồm môt bộ (
,
= cận dưới của việc giãn cụm i thuộc kênh thứ k.
…)
= giá trị độ thuộc của mức xám g theo cụm i.
2.5.3. Thuật toán tăng cường ảnh viễn thám kích thước lớn
2.5.3.1. Nhược điểm của FCM với ảnh viễn thám kích thước lớn
Thuật toán phân cụm mờ [119] nảy sinh vấn đề khi gặp ảnh có kích thước rất
lớn mà cụ thể ở đây là ảnh viễn thám độ phân giải cao. Vấn đề nảy sinh từ ma trận
độ thuộc µ. Theo công thức (26), kích thước của µ được tính như sau:
(Byte)
(26)
Trong đó, c là số cụm, n là số pixel (kích thước) của ảnh. Giả sử ta có một ảnh
kích thước 2048 x 2048. Ta muốn phân thành 20 cụm. Khi đó, Sizeµ là 2048 x 2048
x 20 x 8 (B) = 4 x 20 x 8 (MB) = 640 (MB). Ma trận độ thuộc được lưu trong RAM.
Như vậy, chỉ cần có RAM 1GB thì có thể lưu ma trận độ thuộc trong trường hợp
này. Tuy nhiên, nếu chúng ta muốn phân thành 40 cụm thì Sizeµ là 1280 (MB) >
1024 (MB) = 1GB. Điều này nghĩa là nếu chỉ có RAM 1GB thì không đủ để chứa
các phần tử của ma trận độ thuộc. Và để thuật toán FCM có thể thực hiện ta buộc
phải tăng RAM.
Nếu ảnh có kích thước 16000 x 16000, số lớp c = 20, Sizeµ là 16000 x 16000 x
20 x 8 (B) = 39062.5 (MB) ≈ 39 (GB). Chúng ta thấy, với ảnh kích thước và số lớp
như trên thì kể cả bộ nhớ RAM lớn nhất hiện nay cho máy tính cá nhân cũng không
thể chứa dẫn tới FCM không thể thực thi nếu ma trận độ thuộc được lưu trên RAM.
Chúng ta có thể nghĩ đến việc dùng đĩa cứng để lưu ma trận này thay vì dung RAM.
Tuy nhiên, khi đó ngay cả với ảnh màu thông thường thì thời gian thực hiện của
FCM là rất chậm. Với ảnh viễn thám, thời gian này có thể lên tới đơn vị ngày. Như
84
vậy là không hiệu quả. Tất cả điều này đã giải thích nguyên nhân vì sao FCM [119]
gặp vấn đề với ảnh kích thước rất lớn mà cụ thể là ảnh viễn thám.
Có hai cách để khắc phục vấn đề này. Một là, có thể áp dụng kĩ thuật wavelet.
Hai là, cải tiến trực tiếp thuật toán phân cụm mờ để khắc phục hạn chế này. Phương
án sử dụng kĩ thuật wavelet được trình bày dưới đây. Phương án cải tiến thuật toán
phân cụm mờ được trình bày trong mục 3.2.3 trong chương III.
2.5.3.2. Thuật toán tăng cường ảnh viễn thám kích thước lớn
Trong phần này, luận án đề xuất thuật toán tăng cường ảnh viễn thám kích
thước lớn mà luận án tạm gọi là Large Size Remote Sensing Image Enhancement
Using FCM (LaSRSIE_FCM). Thuật toán được mô tả như sau:
Đầu vào: Ảnh gốc
Đầu ra: Ảnh tăng cường
Bắt đầu
Bước 1: Biến đổi Wavelet DWT.
Bước 2: Tăng cường ảnh cực tiểu lựa chọn với thuật toán LoRSIE_FCM.
Bước 3: Biến đổi Wavelet ngược IDWT với ảnh cực tiểu sau tăng cường.
Kết thúc.
Theo như mô tả trên, thuật toán được thực hiện như sau. Đầu tiên, ảnh đầu vào
được giảm kích thước sử dụng biến đổi Wavelet thuận đến kích thước đủ nhỏ được
ảnh xấp xỉ cực tiểu lựa chọn. Thực hiện tăng cường ảnh xấp xỉ cực tiểu lựa chọn
này sử dụng thuật toán LoRSIE. Tiếp đó, thay ảnh xấp xỉ cực tiểu bằng ảnh xấp xỉ
đã tăng cường và thực hiện biến đổi ngược sử dụng biến đổi Wavelet nghịch để thu
được ảnh tăng cường ứng với ảnh gốc.
2.5.5. Thử nghiệm và đánh giá
2.5.5.1. Quy trình thử nghiệm
Luận án tiến hành thử nghiệm thuật toán tăng cường ảnh đề xuất và so sánh
với kết quả của phương pháp tăng cường mờ. Giả sử ảnh đầu vào có kích thước M x
N điểm ảnh. Nhóm tác giả thực hiện phân rã Wavelet trên ảnh xấp xỉ cho đến khi
ảnh xấp xỉ có kích thước không lớn hơn 512 x 512.
85
Môi trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Ghz, RAM 2G, hệ
điều hành Windows 7.
Quá trình thử nghiệm gồm 2 bước:
Bước 1: Thực hiện tăng cường ảnh đầu vào.
Bước 2: Đánh giá chất lượng ảnh tăng cường và ảnh đầu vào.
Để đánh giá, luận án sử dụng phương pháp trực quan và đánh giá thông qua
chỉ số tuyến tính mờ γ [47][99] như đã mô tả trong mục 2.4.4.
2.5.5.2. Tập dữ liệu thử nghiệm
Tập dữ liệu phục vụ cho thử nghiệm gồm ba loại. Một là, loại ảnh LANDSAT
ETM+ chụp khu vực Hòa Bình ngày 15/02/2001, bao gồm 11 ảnh ranh giới từng
huyện và một ảnh theo ranh giới tỉnh của tỉnh Hòa Bình. Ảnh LANDSAT ETM+
gồm 7 kênh: Chàm, Lục, Đỏ, Cận hồng ngoại, Hồng ngoại trung, Hồng ngoại nhiệt,
Hồng ngoại trung. Hai là, loại ảnh SPOT 5, gồm 4 kênh phổ: Lục (độ phân giải
10m), Đỏ (độ phân giải 10m), Cận hồng ngoại (độ phân giải 10m), Hồng ngoại
trung (độ phân giải 20m), chụp khu vực Hòa Bình và Sơn La với 21 ảnh chụp ngày
22/12/2003 và 14 ảnh chụp năm 2008. Hai loại ảnh này, nhóm tác giả có được khi
tham gia thực hiện đề tài “Phát triển phần mềm xử lý ảnh viễn thám trên nền phần
mềm GRASS’. Đây là đề tài cấp nhà nước, thuộc Chương trình KHCN Vũ Trụ. Dữ
liệu này mới chỉ hiệu chỉnh về mặt hình học theo vệ tinh chụp, chưa có hiệu chỉnh
bức xạ nên về cơ bản là dữ liệu gốc, chưa có tiền xử lý biến đổi ảnh. Ba là, loại ảnh
Quickbird, gồm 4 kênh: Lam, Lục, Đỏ, và cận hồng ngoại, được tải từ dữ liệu mẫu
trên trang http://opticks.org. Do khuôn khổ bài báo có hạn, nhóm tác giả trình việc
thử nghiệm với ba mẫu ảnh đầu vào khác nhau. Ảnh hiển thị minh họa trong thử
nghiệm với SPOT lấy tổ hợp màu: Lục, Đỏ, Cận hồng ngoại. Ảnh hiển thị minh họa
trong thử nghiệm với QuickBird lấy tổ hợp màu tự nhiên, gồm các kênh Blue,
Green, Red.
2.5.5.3. Thử nghiệm
a. Thử nghiệm 1
Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Kim
Bảng 2.3. Tăng cường ảnh với phương pháp mờ và cải tiến.
Bôi có kích thước 1581 x 1527 (điểm ảnh).
86
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn FCM
Hyperbol FCM
Bảng 2.3 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương
pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của luận án
với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng
cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
Trong bảng 2.4, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.4. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ
Tăng cường mờ Giãn FCM Hyperbol FCM
1
0.38
0.43
0.27
0.30
2
0.31
0.45
0.24
0.26
3
0.38
0.39
0.34
0.36
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
Bảng 2.5 thống kê thời gian thực thi trung bình (với năm lần chạy) của các
thuật toán tăng cường. Chúng ta thấy, thời gian thực thi của các thuật toán LoRSIE
là chậm hơn rất nhiều so với các thuật toán dựa trên logic mờ. Điều nay là dễ hiểu
vì các thuật toán LoRSIE trước khi thực hiện việc tăng cường đều phải thực hiện
thuật toán phân cụm mờ. Thuật toán phân cụm mờ có tốc độ khá chậm đặc biệt với
ảnh kích thước lớn như viễn thám. Tuy nhiên, với hai mức biến đổi Wavelet, tốc độ
thực thi của thuật toán LaSRSIE đã thay đổi đáng kể so với LoRSIE.
87
Bảng 2.5: Thời gian thực thi.
Thuật toán
Thời gian
Hyperbol mờ
2485
Tăng cường mờ
2281
Giãn FCM
LoRSIE
1028756
LaSRSIE -2 Level
57764
LoRSIE
1027408
Hyperbol
FCM
LaSRSIE -2 Level
57724
b. Thử nghiệm 2
Trong thử nghiệm 2, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lạc
Bảng 2.6. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Giãn FCM
Hyperbol FCM
Tăng cường
mờ
Thủy thuộc tỉnh Hoà Bình có kích thước 1733 x 1747.
Bảng 2.6 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau
tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
88
Trong bảng 2.7, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.7. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ Tăng cường mờ Giãn FCM Hyperbol FCM
1
0.28
0.28
0.12
0.15
2
0.27
0.30
0.07
0.09
3
0.27
0.28
0.19
0.23
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
c. Thử nghiệm 3
Trong thử nghiệm 3, ảnh gốc là ảnh vệ tinh LANDSAT khu vực thị xã Hòa
Bình thuộc tỉnh Hoà Bình có kích thước 1512 x 2592.
Bảng 2.8 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng phương
pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của luận án
với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng
cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
Bảng 2.8. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn FCM
Hyperbol FCM
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
Trong bảng 2.9, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ. Tuy nhiên, độ tương
89
phản về mặt chỉ số không cao hơn nhiều so với phương pháp mờ. Điều này cho thấy
Bảng 2.9. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh
Hyperbol mờ
Tăng cường mờ Giãn FCM Hyperbol FCM
1
0.28
0.29
0.25
0.28
2
0.29
0.35
0.21
0.22
3
0.30
0.32
0.29
0.30
phương pháp mờ cho kết quả tốt với mẫu thử nghiệm này.
d. Thử nghiệm 4
Trong thử nghiệm 4, ảnh gốc là ảnh vệ tinh SPOT có kích thước 1951 x 1951.
Bảng 2.10 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau
tăng cường sử dụng toán tử tăng cường mờ chỉ cải thiện một phần độ tương phản.
Trong khi đó, kết quả của toán tử Hyp mờ và các toán tử của phương pháp cải tiến
Bảng 2.10. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn FCM
Hyperbol FCM
cho ảnh tương phản rõ rệt và sáng hơn rất nhiều.
Trong bảng 2.11, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
90
Bảng 2.11. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh
Hyperbol mờ
Tăng cường mờ
Giãn FCM
Hyperbol FCM
0.72
0.60
0.20
0.33
1
0.87
0.84
0.33
0.51
2
0.85
0.81
0.22
0.41
3
Bảng 2.12 thống kê thời gian thực thi trung bình (với năm lần chạy) của các
thuật toán tăng cường. Chúng ta thấy, thời gian thực thi của các thuật toán LoRSIE
là chậm hơn rất nhiều so với các thuật toán dựa trên logic mờ. Điều nay là dễ hiểu
vì các thuật toán LoRSIE trước khi thực hiện việc tăng cường đều phải thực hiện
thuật toán phân cụm mờ. Thuật toán phân cụm mờ có tốc độ khá chậm đặc biệt với
ảnh kích thước lớn như viễn thám. Tuy nhiên, với hai mức biến đổi Wavelet, tốc độ
Bảng 2.12. Thời gian thực thi.
thực thi của thuật toán LaSRSIE đã thay đổi đáng kể so với LoRSIE.
Thuật toán
Thời gian
Hyperbol mờ
25188
Tăng cường mờ
25414
Giãn FCM
LoRSIE
2005436
LaSRSIE-2 Level 152671
LoRSIE
2005443
Hyperbol
FCM
LaSRSIE-2 Level 152484
e. Thử nghiệm 5
Trong thử nghiệm 5, ảnh gốc là ảnh vệ tinh Quickbird có kích thước 1904 x
1922.
Bảng 2.13 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau
tăng cường sử dụng các toán tử theo phương pháp mờ chỉ cải thiện một phần độ
91
tương phản. Trong khi đó, kết quả của toán tử Hyp mờ và các toán tử của phương
Bảng 2.13. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn FCM
Hyperbol FCM
pháp cải tiến cho ảnh tương phản và sáng hơn rất nhiều.
Trong bảng 2.14, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.14. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ
Tăng cường mờ Giãn FCM Hyperbol FCM
1
0.72
0.60
0.20
0.33
2
0.87
0.84
0.33
0.51
3
0.85
0.81
0.22
0.41
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
Bảng 2.15 thống kê thời gian thực thi trung bình (với năm lần chạy) của các
thuật toán tăng cường. Chúng ta thấy, thời gian thực thi của các thuật toán LoRSIE
là chậm hơn rất nhiều so với các thuật toán dựa trên logic mờ. Điều nay là dễ hiểu
vì các thuật toán LoRSIE trước khi thực hiện việc tăng cường đều phải thực hiện
thuật toán phân cụm mờ. Thuật toán phân cụm mờ có tốc độ khá chậm đặc biệt với
ảnh kích thước lớn như viễn thám. Tuy nhiên, với hai mức biến đổi Wavelet, tốc độ
thực thi của thuật toán LaSRSIE đã thay đổi đáng kể so với LoRSIE.
92
Bảng 2.15. Thời gian thực thi.
Thuật toán
Thời gian
Hyperbol mờ
22406
Tăng cường mờ
22922
Giãn FCM
LoRSIE
2595006
LaSRSIE-2 Level
184158
LoRSIE
2592406
Hyperbol
FCM
LaSRSIE-2 Level
184127
2.6. Tăng cường ảnh viễn thám sử dụng phân cụm KMeans
2.6.1. Thuật toán tăng cường ảnh viễn thám sử dụng thuật toán phân cụm
KMeans
2.6.1.1. Cục bộ hóa ảnh viễn thám dựa trên thuật toán phân cụm KMeans
Thuật toán kMeans [128] bao gồm 4 bước, được trình bày như sau:
Đầu vào: n đối tượng xi với i = 1..n và số cụm c
Đầu ra: Các cụm Cj (j = 1..c) sao cho hàm mục tiêu E sau đây đạt cực tiểu:
∑ (27) ∑ ( )
Bước 1: Khởi tạo
Chọn k đối tượng Cj (j=1..c) là tâm ban đầu của c cụm dữ liệu đầu vào (lựa
chọn ngẫu nhiên hoặc theo kinh nghiệm).
Bước 2: Gán tâm cụm theo khoảng cách
Với mỗi đối tượng xi (i = 1..n), tính khoảng cách của nó tới mỗi tâm Cj với j
= 1..c. Đối tượng thuộc về cụm CS mà khoảng cách từ tâm CS tương ứng đến
đối tượng đó là nhỏ nhất.
( ) ( ) (28)
Bước 3: Cập nhật tâm cụm
Đối với mỗi j = 1..c, cập nhật lại tâm cụm Cj bằng cách xác định trung bình
cộng của các vector đối tượng dữ liệu đã được gán về cụm.
93
∑
( )
( ( ))
(29)
Bước 4: Lặp và kiểm tra điều kiện dừng
Lặp lại các bước 2 và 3 cho đến khi các tâm cụm không thay đổi giữa hai
lần lặp liên tiếp.
Trong đó:
( ): khoảng cách từ x đến tâm Cj
: thành phần thứ k của tâm cụm Cj
: thành phần thứ k của đối tượng x
2.6.1.2. Xây dựng mô hình biến đổi mức xám theo cụm
Trong phần này, chúng ta sẽ xây dựng hàm biến đổi mức xám để tăng cường
theo mỗi cụm. Hàm này được tạo từ công thức giãn mức xám sau đây:
(30)
Hàm biến đổi mức xám theo cụm được phát biểu như sau:
(31) ( )
Trong đó:
là giá trị cực tiểu
là giá trị cực đại
là cận dưới
là cận trên
là giá trị mức xám cũ
là giá trị mức xám mới
Theo cách trên, ta đã xây dựng được hàm biến đổi mức xám theo toán tử giãn
mức xám. Bằng cách tương tự, chúng ta có thể xây dựng được hàm biến đổi mức
xám cho toán tử Hyperbol, tăng cường... Trong nghiên cứu này, luận án xây dựng
hàm biến đổi cho toán tử Giãn mức xám và Hyperbol, và được phát biểu theo từng
cụm trong bảng 2.16.
94
Bảng 2.16. Các hàm biến đổi mức xám theo từng cụm.
Ý nghĩa Công thức biến đổi T(g)
(32) Giãn
mức xám
) [ ( ) ] (33)
(
Trong đó:
Biến đổi
Hyperbol
{
(34)
Trong đó:
g = giá trị xám gốc.
= cận trên của việc giãn cụm .
= cận dưới của việc giãn cụm .
= tâm cụm.
Giá trị của các ngưỡng và được tính tự động theo từng cụm
như trong mục c dưới đây.
2.6.1.3. Tính ngưỡng tự động theo cụm
Giả sử, ( ) là hàm phân bố của mức xám theo một cụm cho trước. ( )
và các tham số: , , được thể hiện trong hình 2.4.
Các ngưỡng , được xác định bằng cách chọn sao cho vùng
gạch chéo (hình 2.4) có diện tích bằng 95% tổng diện tích được bao bởi các đường
y = 0 và y = ( ).
95
Hình 2.4. Hàm phân bố và các ngưỡng theo từng cụm.
2.6.1.4. Sinh ảnh tăng cường dựa trên việc tổng hợp mức xám hiệu chỉnh theo
cụm
Dựa trên mô hình biến đổi mức xám theo mỗi cụm đã xây dựng trong mụcb,
mỗi giá trị xám đầu vào sẽ được chuyển các thành giá trị mới tương ứng với các
cụm. Nhiệm vụ còn lại là tổng hợp các giá trị này để sinh ra giá trị xám duy nhất.
Hàm tổng hợp này có dạng tổng quát như sau: g | g’ = T(g). Trong đó,
(35) ( ) ( )
( )
Trong đó:
g = giá trị xám gốc.
= cận trên của việc giãn cụm V.
= g cận dưới của việc giãn cụm V.
= tâm cụm.
2.6.2. Phát triển thuật toán cho ảnh đa phổ
,
,
Bước 1: Cục bộ hóa ảnh đầu vào. Sau khi thực hiện thủ tục phân cụm, mỗi
…) sẽ được đặc trưng thêm bởi một bộ các giá trị độ
điểm ảnh P(
thuộc ứng với các cụm khác nhau. Như vậy, quan hệ cùng một điểm ảnh
Bản chất KMeans là thuật toán phân cụm các đối tượng là các vector có nhiều
thành phần. Và do vậy, KMeans đã thực hiện rất tốt cho ảnh đa kênh như ảnh màu
RGB. Như vậy, thuật toán trên áp dụng cho ảnh viễn thám đa phổ như sau:
96
…) được đặc trưng bởi bộ các giá trị độ thuộc trên.
,
,
Bước 2: Xây dựng mô hình hiệu chỉnh mức xám. Vẫn thực hiện việc này
của một bộ (
Do đó, giải quyết được hạn chế thứ 3 trong mục 2.2.
được tính tự
Bước 3: Tính ngưỡng tự động. Các ngưỡng
và
như được trình bày trong mục 2.5.1.b.
Bước 4: Sinh ảnh tăng cường. Với mỗi điểm ảnh P, ta có:
động theo từng cụm và từng kênh k.
)
) (
)
(36) (
(
= giá trị xám gốc của điểm ảnh P thuộc kênh thứ k.
= cận trên của việc giãn cụm thuộc kênh thứ k.
Trong đó:
= cận dưới của việc giãn cụm thuộc kênh thứ k.
= tâm cụm. Mỗi tâm gồm môt bộ ( , , …)
2.6.3. Thử nghiệm và đánh giá
2.6.3.1. Quy trình thử nghiệm
Luận án tiến hành thử nghiệm thuật toán tăng cường ảnh đề xuất và so sánh
với kết quả của phương pháp tăng cường mờ. Quá trình thử nghiệm thuật toán
LoRSIE_KM tượng tự như được mô tả trong mục 2.5.5.1.
Môi trường thực nghiệm: Bộ xử lý Core 2 Duo tốc độ 1.8Ghz, RAM 2G, hệ
điều hành Windows 7.
Để đánh giá, luận án sử dụng phương pháp trực quan và đánh giá thông qua
chỉ số tuyến tính mờ γ [47][99] như đã mô tả trong mục 2.4.4. Tập dữ liệu thử
nghiệm như được trình bày trong mục 2.4.5.2.
2.6.3.2. Thử nghiệm
a. Thử nghiệm 1
Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lac
Son, tỉnh Hoà Bình.
97
Bảng 2.17. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn KM
Hyperbol KM
Bảng 2.17 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau
tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
Trong bảng 2.18, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.18. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ Tăng cường mờ
Giãn KM
Hyperbol KM
1
0.34
0.43
0.18
0.12
2
0.29
0.43
0.21
0.17
3
0.35
0.40
0.24
0.20
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
b. Thử nghiệm 2
Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT khu vực huyện Lạc
Thuỷ, tỉnh Hoà Bình.
98
Bảng 2.19. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn KM
Hyperbol KM
Bảng 2.19 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau
tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
Trong bảng 2.20, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.20. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ Tăng cường mờ
Giãn KM
Hyperbol KM
1
0.28
0.28
0.16
0.11
2
0.27
0.30
0.15
0.11
3
0.27
0.28
0.17
0.14
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
c. Thử nghiệm 3
Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh SPOT.
99
Bảng 2.21. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn KM
Hyperbol KM
Bảng 2.21 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau tăng
cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
Trong bảng 2.22, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.22. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ Tăng cường mờ
Giãn KM
Hyperbol KM
1
0.20
0.50
0.13
0.08
2
0.43
0.36
0.32
0.27
3
0.39
0.49
0.33
0.22
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
d. Thử nghiệm 4
Trong thử nghiệm 4, ảnh gốc là ảnh vệ tinh Quickbird.
100
Bảng 2.23. Tăng cường ảnh với phương pháp mờ và cải tiến.
Đầu vào
Hyperbol mờ
Tăng cường mờ
Giãn KM
Hyperbol KM
Bảng 2.23 bao gồm ảnh đầu vào và ảnh kết quả khi tăng cường sử dụng
phương pháp mờ với các toán tử tăng cường, hyperbol và phương pháp cải tiến của
luận án với hai toán tử giãn và hyperbol. Về mặt trực quan, ta có thể thấy ảnh sau
tăng cường sử dụng phương pháp mờ tương quan màu giữa các các điểm ảnh không
được bảo tồn, đặc biệt là với toán tử Hyperbol. Trong khi đó, kết quả của phương
pháp cải tiến chỉ mang tính làm nổi bật hơn so với ảnh gốc.
Trong bảng 2.24, qua việc so sánh chỉ số mờ, ta thấy γ của ảnh sinh ra bởi
phương pháp cải tiến là thấp hơn khẳng định chất lượng ảnh tăng cường bởi phương
Bảng 2.24. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến.
Kênh Hyperbol mờ
Tăng cường mờ
Giãn KM
Hyperbol KM
1
0.72
0.60
0.24
0.18
2
0.87
0.84
0.26
0.22
3
0.85
0.81
0.32
0.27
pháp cải tiến cao hơn so với ảnh sinh ra bởi phương pháp mờ.
2.7. Kết luận chương II
Đầu tiên, luận án đã trình bày một số toán tử tăng cường mờ. Qua đó, luận án
phân tích một số hạn chế của tiếp cận tăng cường độ tương phản ảnh dựa trên logic
mờ.
Từ việc phân tích hạn chế của phương pháp tăng cường ảnh mờ, luận án trình
bày đề xuất các giải pháp tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ
LoRSIE. LoRSIE được chia thành bốn giai đoạn. Thứ nhất, ảnh được cục bộ hóa
bởi thuật toán phân cụm mờ. Thứ hai, tính tự động các ngưỡng theo mỗi cụm. Thứ
ba, hiệu chỉnh các công thức biến đổi mức xám để phù hợp cho việc biến đổi theo
101
cụm. Giai đoạn cuối cùng là sinh ảnh tăng cường qua việc tổng hợp mức xám mới
từ các cụm theo công thức biến đổi mức xám đã hiệu chỉnh.
LoRSIE được thể hiện qua hai thuật toán tăng cường sử dụng thuật toán phân
cụm KMeans và FCM. Hai thuật toán này cũng được hiệu chỉnh để áp dụng cho ảnh
đa phổ.
Thuật toán tăng cường sử dụng FCM gặp vấn đề với ảnh kích thước lớn nên
được cải tiến để phát triển thành thuật toán LaRSIE_FCM. Kết quả thử nghiệm cho
thấy phương pháp cải tiến cho chất lượng ảnh tăng cường cao hơn so với phương
pháp tăng cường dựa trên logic đã có và thực hiện tốt trên ảnh viễn thám kích thước
lớn. Ngoài ra, với những ảnh viễn thám kích thước trung bình, thuật toán LaRSIE
giúp cải thiện tốc độ thực thi so với thuật toán LoRSIE. Tuy nhiên, tốc độ thực thi
của các thuật toán dựa trên tiếp cận cục bộ còn chậm. Ngay cả các thuật toán
LaRSIE, dù đã cải thiện tốc độ so với LoRSIE nhưng vẫn còn chậm so với các thuật
toán dựa trên logic mờ. Trong nghiên cứu tiếp theo, luận dự kiến sẽ nghiên cứu giải
pháp tăng tốc độ thuật toán phân cụm mờ để tăng tốc độ thực thi cho thuật toán
LoRSIE.
Tăng cường ảnh là một trong những khâu tiền xử lý quan trọng để hỗ trợ cho
việc giải đoán ảnh viễn thám, đặc biệt trong đoán đọc điều vẽ bằng mắt. Một số cải
tiến trong giai đoạn giải đoán ảnh viễn thám đa phổ được trình bày trong chương
tiếp theo.
102
CHƯƠNG III: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN
PHÂN LỚP ẢNH VIỄN THÁM ĐA PHỔ
Trong chương III, luận án trình bày các thuật toán CCEA_KMeans và 2D-
KMeans trong hai nghiên cứu gần đây. Tiếp đó, luận án phân tích hạn chế của thuật
toán KMeans. Từ đây, luận án trình bày các đề xuất mới dựa trên thuật toán
KMeans và so sánh kết quả với CCEA_KMeans và 2D-KMeans. Kết quả này đã
được nghiên cứu sinh công bố trong [TRU3], [TRU4], [TRU5], [TRU6], [TRU7] và
[TRU8].
3.1. Phân cụm ảnh viễn thám với thuật toán KMeans
3.1.1. Thuật toán KMeans
Thuật toán KMeans đã được trình bày trong mục 2.6.1.1.
3.1.2. Thuật toán CCEA_KMeans
Trong [26], các tác giả đề xuất thuật toán khởi tạo tâm CCEA để tăng tốc độ
thuật toán KMeans mờ. Thuật toán được trình bày như sau:
Đầu vào:
Tập S gồm N đối tượng xi với i = 1..N
M số tập con SBl (l = 1..M) của S
f để xác định kích thước tập con SBl của S (f < 1)
Đầu ra: Các cụm Cj (j = 1..c)
Các bước thuật toán như sau:
Bước 1: Chọn ngẫu nhiên M tập con SBl có kích thước fN từ tập dữ liệu S
sao cho SBi SBj = Ø (i ≠ j), trong đó f < 1. Đặt SU = SBl và p = 0.
Bước 2: Cho tập tâm cụm khởi đầu SCp = {Cj} và tập dữ liệu SU, sử dụng
CDFKM để xác định tập các tâm cụm SCp+1 = {Cj}.
Bước 3: Cập nhật p = p + 1 và đặt SU = SU SBp+1. Nếu p ≤ M, quay lại
bước 2.
Bước 4: SCM là tập tâm cụm khởi tạo.
103
Bước 5: Phân cụm tập S với tập tâm SCM
Nếu áp dụng CCEA cho KMeans thì trong bước 2 chỉ cần thay CDFKM bằng
KMeans ta được CCEA_KMeans.
3.1.3. Thuật toán 2D-KMeans
Trong [52], các tác giả trình bày thuật toán 2D-KMeans. Điểm khác biệt giữa
KMeans và 2D-KMeans là:
Với KMeans, mỗi đối tượng x là một vector với các thành phần là cường độ
của đối tượng tương ứng: xINT. Như vậy, mỗi tâm là một vector trung bình
cường độ theo cụm: CINT.
Với 2D-KMeans, mỗi đối tượng x gồm một cặp 2 vector: vector với các
thành phần cường độ xINT và vector trung vị cục bộ xMED (công thức 18).
Như vậy, mỗi tâm C gồm một cặp 2 vector: vector trung bình cường độ
theo cụm: CINT và vector trung bình trung vị theo cụm: CMED (công thức
19).
(37) ( )
[(∑ (38) ) (∑ )]
3.1.4. Hạn chế của thuật toán KMeans
Thuật toán KMeans dù phân cụm ảnh viễn thám rất hiệu quả vẫn còn hai điểm
hạn chế:
Hạn chế 1: Tốc độ thực thi với ảnh kích thước lớn như ảnh viễn thám còn
chậm.
Trong bảng 1, trong bước 1, việc tâm cụm được khởi tạo ngẫu nhiên ảnh
hưởng đến tốc độ thuật toán. Trong một lần thực thi thuật toán, nếu các tâm chọn
ngẫu nhiên tốt, giả sử gần với vị trí các tâm sau khi hội tụ, khi này thời gian thực thi
còn lại sẽ không nhiều. Tuy nhiên, nếu các tâm chọn ngẫu nhiên không tốt, chẳng
hạn các tâm rất gần nhau, khi này, sẽ mất rất nhiều thời gian để xác định các tâm
sau hội tụ vì số lần lặp sẽ rất lớn. Đây chính là lý do mà các nhà nghiên cứu tìm
cách sao cho tâm cụm khởi tạo được tốt nhất.
104
Hạn chế 2: Không bao gồm thông tin ngữ cảnh – lân cận của mỗi điểm ảnh
[52].
Như trong nhiều kĩ thuật xử lý ảnh (ví dụ như lọc, tăng cường độ tương phản
…) đặc trưng của điểm ảnh thường quan hệ với sự ảnh hưởng của các điểm lân cận.
Bằng cách bỏ đi hành vi quan hệ này, nhất định lượng thông tin ảnh bị mất trong
quá trình xử lý. Do đó, thường trong việc phân đoạn ảnh bằng việc sử dụng phân
cụm một chiều thông thường các hạn chế sau đây được quan sát:
Các điểm ảnh nhiễu được xem như một đặc trưng độc lập, được gán sai
đến cụm, và lưu lại có thể nhìn thấy sau quá trình phân cụm.
Bằng cách loại bỏ các ảnh hưởng quan hệ của các tham số không gian của
một điểm ảnh, có khả năng thông tin trong ảnh bị mất.
Hiệu năng có thể suy giảm nhanh chóng khi tương tác không gian giữa các
điểm ảnh trở nên chủ yếu hơn các giá trị mức xám [52].
3.1.5. Một số độ đo chất lượng phân cụm ảnh
Để đánh giá chất lượng phân cụm, chúng ta có thể sử dụng chỉ số F(I), F’(I) ...
Chỉ số này tuân theo các tiêu chí về sự đồng nhất cụm [52]. Chỉ số này được tính
như sau:
( )
√
(39) ( ) √ ∑
( )
√
√∑ (40) ( ) [ ( )] ∑
Trong đó, I là ảnh phân đoạn, là kích thước ảnh, R là số vùng trong
ảnh phân cụm, là diện tích điểm ảnh vùng thứ i, và là lỗi màu vùng i (tổng
khoảng cách Euclide giữa các vector màu mức xám của các điểm ảnh của vùng thứ i
và vector màu qui cho vùng i trong ảnh phân đoạn), R(A) là số vùng có diện tích
bằng A, và Max là diện tích của vùng lớn nhất trong ảnh phân đoạn. F(I) càng nhỏ
thì tính đồng nhất cụm càng cao tức là chất lượng phân cụm càng tốt.
3.1.6. Đề xuất thuật toán WIKMeans
3.1.6.1. Trình bày thuật toán WIKMeans
Để khăc phục hạn chế (1), trong mục này, luận án để xuất thuật toán phân cụm
KMeans cải tiến với việc khởi tạo tâm cụm sử dụng kĩ thuật Wavelet. Biến đổi
105
Wavelet được sử dụng để giảm kích thước ảnh. Ảnh cực tiểu của biến đổi Wavelet
được sử dụng để tiến hành phân cụm và sinh tập tâm khởi tạo.
Đầu vào: Ảnh gốc.
Đầu ra: Ảnh phân đoạn cuối cùng.
Thuật toán được mô tả như sau:
B1: Biến đổi Wavelet
Biến đổi sóng nhỏ (Wavelet) là công cụ toán học hay được sử dụng vào việc
biểu diễn ảnh đa độ phân giải. Sau khi thực hiện phép biến đổi ta thu được tập hệ số
Wavelet, là hàm co dãn và vị trí của sóng nhỏ.
Với tín hiệu số như ảnh viễn thám, thì tập hệ số Wavelet có thể thu được nhờ
phép biến đổi sóng nhỏ rời rạc (Discrete Wavelet Transform- DWT). Với phần lớn
ảnh số thì nội dung tần số thấp là quan trọng nhất, giữ được hầu như các đặc tính
của ảnh đầu vào của phép biến đầu với kích thước giảm bốn lần. Sau khi áp dụng bộ
lọc thông thấp theo hai hướng (LL) ta thu được ảnh xấp xỉ (cA1) của ảnh gốc. Nếu
áp dụng bộ lọc thông thấp cho chiều ngang và bộ lọc thông cao cho chiều dọc ảnh
(LH) ta có tập hệ số ngang (cH1) của ảnh gốc. Tương tự ta có tập hệ số dọc (cV1) và
tập hệ số chéo (cD1). Lặp tiến trình trên băng con (LL) để sinh ra các hệ số ở mức 2
tiếp theo. Hình 3.41 mô tả DWT ảnh theo thuật toán hình kim tự tháp của Mallat
Hình 3.1. Biến đổi ảnh với Wavelet.
[124].
Vậy, ảnh gốc S được biểu diễn trên cơ sở các hệ số biến đổi sóng con của nó
như sau:
(41)
106
Thực hiện lặp tiến trình cho đến khi mức độ chi tiết là mẫu hay pixel. Tại mức
J, ảnh gốc được biểu diễn bởi:
(42)
Các hệ số xấp xỉ được tính toán như sau:
( ) (43)
Mỗi lần thực hiện phân rã wavelet, kích thước của ảnh xấp xỉ cAj giảm đi bốn
lần so với lần thực hiện trước đó (mỗi chiều giảm xuống một nửa). Như vậy, giả sử
chúng ta phân rã 3 mức cho ảnh đầu vào, ta thu được ảnh xấp xỉ có kích thước giảm
xuống 64 lần. Hình 3.42 minh họa cây phân cấp cho phân ra wavelet nhiều mức.
Hình 3 2. Cây phân cấp cho phân rã nhiều mức.
Hình 3.43 minh họa về ảnh đầu vào và kết quả phân rã.
Hình 3.3. Ảnh đầu vào kết quả phân rã ảnh viễn thám đa phổ.
B2: Phân cụm KMeans ảnh cực tiểu
107
Tiến hành phân cụm ảnh xấp xỉ cực tiểu lựa chọn với thuật toán
KMeans. Sau khi đã phân cụm tất cả các ô, ta được tập tâm cụm như sau:
(44) VInit = {vj: 1 ≤ j ≤k}
B3: Phân cụm ảnh gốc
Sử dụng KMeans để thực hiện phân cụm ảnh gốc với tập tâm khởi tạo
thu được trong B2 ở trên.
Nhận xét:
Lúc đầu, do thuật toán WIKMeans không thực thi trực tiếp trên ảnh gốc mà
trên ảnh kích thước nhỏ hơn nên sẽ thu được tập tâm khởi tạo rất nhanh và càng
nhanh nếu mức rã càng nhiều. Hơn nữa, ảnh cực tiểu lựa chọn là ảnh xấp xỉ của ảnh
ban đầu nên gần như giữa nguyên được các đặc trưng trên ảnh gốc, khác biệt chính
là về kích thước và tỉ lệ nhiễu. Do đó, tập tâm khởi tạo thu được rất gần tập tâm khi
hội tụ trong trường hợp KMeans phân cụm trực tiếp trên ảnh đầu vào. Do đó, tập
tâm này là khởi tạo rất tốt để KMeans phân cụm trên ảnh gốc.
3.1.6.2. Thử nghiệm
Luận án tiến hành thử nghiệm thuật toán đề xuất WIKMeans và so sánh kết
quả với thuật toán KMeans, CCEAKMeans về mặt tốc độ thực thi phân cụm. Nhóm
tác giả sử dụng biến đổi Wavelet rời rạc trong các thử nghiệm. Giả sử ảnh đầu vào
có kích thước M x N điểm ảnh. Nhóm tác giả thực hiện phân rã Wavelet 3 mức với
hàm nhân là Biorthogonal. Ngôn ngữ lập trình được sử dụng là C#. Như vậy, ảnh
xấp xỉ cực tiểu luận án chọn có kích thước M/8 x N/8 điểm ảnh.
Tập dữ liệu phục vụ cho thử nghiệm như được trình bày tại mục 2.4.5 trong
chương II. Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT về huyện Đà Bắc
thuộc tỉnh Hoà Bình có kích thước 1596 x 1333 (điểm ảnh). Trong thử nghiệm 2,
ảnh gốc là ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh).Trong thử
nghiệm 3, ảnh gốc là ảnh vệ tinh SPOT về tỉnh Hoà Bình có kích thước 2201 x
2101 (điểm ảnh). Bảng 3.3 minh họa các ảnh đầu vào của các mẫu trong các thử
nghiệm 1, 2 và 3. Dưới đây là một số thử nghiệm đánh giá về tốc độ thực thi trung
bình (với năm lần chạy) của thuật toán đề xuất WIKMeans. Đánh giá về chất lượng
phân cụm được trình bày trong phần tiếp theo cùng thuật toán CIKMeans.
108
Bảng 3.1. Các ảnh đầu vào trong tử nghiệm 1, 2 và 3.
Thử nghiệm 1 Thử nghiệm 2 Thử nghiệm 3
Hình 3.4. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh thử
nghiệm 1.
a. Thử nghiệm 1 – Đà Bắc
Hình 3.2 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán KMeans
và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 1.
Hình 3.3 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán
CCEAKMeans và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử
nghiệm 1.
109
Hình 3.5. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với ảnh
thử nghiệm 1.
b. Thử nghiệm 2 - QB
Hình 3.4 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán KMeans
Hình 3.6. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh thử
nghiệm 2.
và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 1.
Hình 3.5 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán
CCEAKMeans và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử
nghiệm 1.
110
Hình 3.7. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với ảnh
thử nghiệm 2.
c. Thử nghiệm 3 - SPOT
Hình 3.6 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán KMeans
Hình 3.8. Biểu đồ so sánh thời gian phân cụm của KMeans và WIKMeans với ảnh thử
nghiệm 3.
và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử nghiệm 3.
Hình 3.7 đưa ra biểu đồ so sánh thời gian phân cụm giữa thuật toán
CCEAKMeans và WIKMeans với số cụm lần lượt là 5, 8, 11, 14 và 17 với ảnh thử
nghiệm 3.
111
Hình 3 9. Biểu đồ so sánh thời gian phân cụm của CCEAKMeans và WIKMeans với ảnh
thử nghiệm 3.
Nhận xét:
Các kết quả thử nghiệm cho thấy, về mặt tốc độ thực thi:
Thời gian thực hiện của thuật toán KMeans là rất lớn so với thuật toán đề
xuất WIKMeans.
Thời gian thực hiện của thuật toán đề xuất WIKMeans là nhỏ hơn so với
thuật toán CCEAKMeans.
3.1.7. Đề xuất thuật toán CIKMeans
3.1.7.1. Trình bày thuật toán CIKMeans
Theo mục 3.1.3, với 2D-KMeans, mỗi đối tượng x gồm một cặp 2 vector: vector với
các thành phần cường độ xINT và vector trung vị cục bộ xMED. Như vậy, mỗi tâm C
gồm một cặp 2 vector: vector trung bình cường độ theo cụm: CINT và vector trung
bình trung vị theo cụm: CMED.
Để khắc phục hạn chế (3), với CIKMeans (Context Information KMeans),
mỗi đối tượng x gồm một cặp 2 vector: vector với các thành phần cường độ xINT và
vector gần trung vị cục bộ xHP. xHP lấy xMED hoặc bên trái xMED hoặc bên phải xMED
tuỳ theo điểm nào gần với điểm trong ảnh đầu vào nhất. Như vậy, mỗi tâm C gồm
một cặp 2 vector: vector trung bình cường độ theo cụm: CINT và vector trung bình
gần trung vị theo cụm: CHP. Kết quả này đã được nghiên cứu sinh công bố trong
[TRU6].
(45) ( )
112
[(∑ (46) ) (∑ )]
3.1.7.2. Thử nghiệm
Tập dữ liệu phục vụ cho thử nghiệm được mô tả tại mục 2.4.6 trong chương II.
Trong thử nghiệm 1, ảnh gốc là ảnh vệ tinh LANDSAT về huyện Đà Bắc thuộc tỉnh
Hoà Bình có kích thước 1596 x 1333 (điểm ảnh). Trong thử nghiệm 2, ảnh gốc là
ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh).Trong thử nghiệm 3,
ảnh gốc là ảnh vệ tinh SPOT về tỉnh Hoà Bình có kích thước 2201 x 2101 (điểm
ảnh). Bảng 3.2 minh họa các ảnh đầu vào của các mẫu trong các thử nghiệm 1, 2 và
Bảng 3.2. Các ảnh đầu vào trong tử nghiệm 1, 2 và 3.
Thử nghiệm 1 Thử nghiệm 2 Thử nghiệm 3
3.
Để đánh giá chất lượng phân cụm, luận án sử dụng chỉ số F(I), như được mô
tả trong mục 3.1.5.
a. Thử nghiệm 1 – Đà Bắc
Bảng 3.3 đưa ra so sánh kết quả phân cụm trực quan của 2D-KMeans và
CIKMeans trong trường hợp 5 cụm.
113
Bảng 3.3. Ảnh kết quả phân cụm với 5 cụm.
Cụm thứ
2D-KMeans
CIKMeans
1
2
3
4
5
Để thấy rõ hơn sự khác biệt về kết quả phân cụm, bảng 3.4 thể hiện kết quả
dạng phóng to ¼ kích thước ảnh, tại vùng góc dưới bên phải của ảnh.
114
Bảng 3.4. Ảnh kết quả phân cụm với 5 cụm.
Cụm thứ
2D-KMeans
CIKMeans
1
2
3
4
5
Hình 3.9 thống kê độ đồng nhất các cụm của KMeans, WIKMeans, 2D-
KMeans, CIKMeans và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17.
Trong đó, WICI-KMeans là sự kết hợp của WIKMeans (khởi tạo tâm) và
CIKMeans.
115
Hình 3.10. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans,
2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).
b. Thử nghiệm 2 – QB
Bảng 3.5 đưa ra so sánh kết quả phân cụm trực quan của 2D-KMeans và
Bảng 3.5. Ảnh kết quả phân cụm với 5 cụm.
2D-KMeans
CIKMeans
Cụm
thứ
1
2
3
CIKMeans trong trường hợp 5 cụm.
116
4
5
Hình 3.10 thống kê độ đồng nhất các cụm của KMeans, WIKMeans, 2D-
KMeans, CIKMeans và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17.
Trong đó, WICI-KMeans là sự kết hợp của WIKMeans (khởi tạo tâm) và
Hình 3.11. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans,
2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).
CIKMeans.
c. Thử nghiệm 3 – SPOT
Bảng 3.6 đưa ra so sánh kết quả phân cụm trực quan của 2D-KMeans và
CIKMeans trong trường hợp 5 cụm.
117
Bảng 3.6. Ảnh kết quả phân cụm với 5 cụm.
2D-KMeans
CIKMeans
Cụm
thứ
1
2
3
4
5
Hình 3.11 thống kê độ đồng nhất các cụm của KMeans, WIKMeans, 2D-
KMeans, CIKMeans và WICI-KMeans với số cụm lần lượt là 5, 8, 11, 14 và 17.
Trong đó, WICI-KMeans là sự kết hợp của WIKMeans (khởi tạo tâm) và
CIKMeans.
118
Hình 3.12. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans, WIKMeans,
2D-KMeans, CIKMeans và WICI-Kmeans (*1.0e+3).
Nhận xét:
Các kết quả thử nghiệm cho thấy, về chất lượng phân cụm, độ đồng nhất của
các cụm sinh ra bởi thuật toán đề xuất CIKMeans là cao hơn so với thuật toán 2D-
KMeans.
3.1.8. Đề xuất thuật toán KMeansCMN
3.1.8.1. Trình bày thuật toán KMeansCMN
Với công thức tính tâm như (13), tâm thu được dễ bị ảnh hưởng bởi nhiễu.
Chúng ta có thể áp dụng phép chuẩn hóa trung bình phổ để cho một công thức tính
tâm cụm có thể giảm nhiễu. Tuy nhiên, phép chuẩn hóa này chỉ tốt khi số phần tử là
rất lớn. Trong phần này, luận án đề xuất thuật toán phân cụm KMeansCMN cải tiến
cho ảnh viễn thám kích thước lớn [TRU4] và [TRU7] với công thức tính tâm cụm
áp dụng kĩ thuật chuẩn hóa trung bình phổ như sau:
Đầu vào: n đối tượng và số cụm k
Đầu ra: Các cụm Ci (i=1..k) sao cho hàm mục tiêu E sau đây đạt cực tiểu:
(47) ∑ ∑ ( )
Thuật toán gồm các bước:
Bước 1: Khởi tạo
Chọn k đối tượng Cj (j=1..k) là tâm ban đầu của k cụm dữ liệu đầu vào
(lựa chọn ngẫu nhiên hoặc theo kinh nghiệm).
Bước 2: Gán tâm cụm theo khoảng cách
119
Với mỗi đối tượng xi (1 ≤ i ≤ n), tính khoảng cách của nó tới mỗi tâm Cj
với j = 1..k. Đối tượng thuộc về cụm CS mà khoảng cách từ tâm CS tương
ứng đến đối tượng đó là nhỏ nhất.
( ) ( ) (48)
Bước 3: Cập nhật tâm cụm
Đối với mỗi j = 1..k, cập nhật lại tâm cụm Cj bằng cách xác định trung
bình cộng của các vector đối tượng dữ liệu đã được gán về cụm.
- Nếu số lượng điểm ảnh trong cụm nhỏ hơn hằng số rất lớn Max thì
∑
( )
tâm vẫn tính theo công thức (13) như sau:
( ( ))
(49)
- Nếu số lượng điểm ảnh trong cụm lớn hơn hằng số rất lớn Max thì
tâm tính theo công thức (17) như sau:
( ) (50)
Bước 4: Lặp và kiểm tra điều kiện dừng
Lặp lại các bước 2 và 3 cho đến khi các tâm cụm không thay đổi giữa hai
lần lặp liên tiếp.
Thủ tục tính tâm cụm CMN(Clusterj) tại vòng lặp thứ n như sau:
Bước 1: Khởi tạo tâm theo công thức
(51)
Bước 2: Với mỗi tính theo công thức
-
(52)
Trong nghiên cứu này, luận án chọn Max = 50000 và = 0.95.
3.1.8.2. Thử nghiệm
Tập dữ liệu phục vụ cho thử nghiệm gồm các ảnh LANDSAT, SPOT và
Quickbird như được mô tả trong mục 2.4.6.
Để đánh giá chất lượng phân cụm, trong [52], luận án sử dụng chỉ số F(I) như
trình bày trong mục 3.1.5.
120
Hình 3.13. Kết quả phân cụm bởi KMeans.
Hình 3.14. Kết quả phân cụm bởi KMeansCMN.
a. Thử nghiệm 1
Trong thử nghiệm 1, ảnh đầu vào là một ảnh SPOT. Hình 3.12 và hình 3.13 là
ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường hợp 5 cụm với
ảnh SPOT (hình 3.12 và 3.13). Các ảnh từ 1 đến 5 là ảnh từng cụm. Ảnh thứ 6 là
Bảng 3.7. So sánh độ đồng nhất cụm (*1.0e+3).
ảnh đã thay các điểm ảnh gốc bằng tâm các cụm.
Số cụm KMeans KMeansCMN
5
2.24
2.04
7
2.19
1.93
10
1.58
0.81
Bảng 3.7 và hình 3.14 so sánh độ đồng nhất tâm cụm giữa KMeans và
KMeansCMN. Bảng 3.8 thống kê số thời gian thực thi của KMeans và
KMeansCMN với 5, 7 và 10 cụm. Chúng ta thấy độ đồng nhất của KMeansCMN là
tốt hơn so với KMeans. Ngoài ra, thời gian phân cụm của KMeansCMN cũng nhỏ
hơn KMeans.
121
Hình 3.15. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3).
Bảng 3.8. Thời gian phân cụm (ms).
Số cụm
KMeans KMeansCMN
Thời gian (ms)
2,616,938
2,413,791
5
Số vòng lặp
25
23
Thời gian (ms)
3,663,713
3,379,307
7
Số vòng lặp
23
22
Thời gian (ms)
11,275,333
8,618,345
10
Số vòng lặp
30
26
b. Thử nghiệm 2
Dưới đây là ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường
hợp 5 cụm với ảnh LANSAT (hình 3.15 và 3.16). Các ảnh từ 1 đến 5 là ảnh từng
cụm. Ảnh thứ 6 là ảnh đã thay các điểm ảnh gốc bằng tâm các cụm.
122
Hình 3.16. Kết quả phân cụm bởi KMeans.
Hình 3.17. Kết quả phân cụm bởi KMeansCMN.
Bảng 3.9 và hình 3.17 so sánh độ đồng nhất tâm cụm giữa KMeans và
KMeansCMN. Bảng 3.10 thống kê số bước lặp cũng như thời gian thực thi của
KMeans và KMeansCMN với 5, 8 và 10 cụm. Chúng ta thấy độ đồng nhất của
KMeansCMN là tốt hơn so với Kmeans. Ngoài ra, thời gian phân cụm của
Bảng 3.9. So sánh độ đồng nhất cụm (*1.0e+3).
KMeansCMN cũng nhỏ hơn KMeans.
Số cụm KMeans KMeansCMN
5
1.66
1.5
8
1.61
1.53
10
1.42
1.45
123
Hình 3.18. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3).
Bảng 3.10. Thời gian phân cụm.
Số cụm
KMeans KMeansCMN
Thời gian (ms)
263,672
213,109
5
Số vòng lặp
10
8
Thời gian (ms)
1,658,609
1,568,062
8
Số vòng lặp
25
23
Thời gian (ms)
2,513,044
2,323,055
10
Số vòng lặp
23
20
c. Thử nghiệm 3
Dưới đây là ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường
hợp 5 cụm với ảnh Quickbird (hình 3.18 và 3.19). Các ảnh từ 1 đến 5 là ảnh từng
cụm. Ảnh thứ 6 là ảnh đã thay các điểm ảnh gốc bằng tâm các cụm.
124
Hình 3.19. Kết quả phân cụm bởi KMeans.
Hình 3.20. Kết quả phân cụm bởi KMeansCMN.
Bảng 3.11 và hình 3.20 so sánh độ đồng nhất tâm cụm giữa Kmeans và
KMeansCMN. Bảng 3.12 thống kê số bước lặp cũng như thời gian thực thi của
KMeans và KMeansCMN với 5, 8 và 10 cụm. Chúng ta thấy độ đồng nhất của
KMeansCMN là tốt hơn so với KMeans. Ngoài ra, thời gian phân cụm của
Bảng 3.11. Tâm cụm sinh từ KMeans và KMeansCMN.
KMeansCMN cũng nhỏ hơn KMeans.
Cụm KMeans KMeansCMN
5
4.69
4.35
8
5.75
5.36
10
6.37
5.80
125
Hình 3.21. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3).
Bảng 3.12. Thời gian phân cụm.
Số cụm
KMeans KMeansCMN
Thời gian (ms)
607,818
498,719
5
Số vòng lặp
10
8
Thời gian (ms) 2,114,812
2,004,578
8
Số vòng lặp
11
10
Thời gian (ms) 3,662,355
2,625,564
10
Số vòng lặp
18
12
Nhận xét:
Việc tính tâm theo công thức (31) chắc chắn lâu hơn công thức (30). Do đó, về
mặt lý thuyết, nhiều khả năng thời gian phân cụm của KMeansCMN sẽ lâu hơn
KMeans. Tuy nhiên, theo thống kê về thời gian thực thi, số vòng lặp và thời gian
thực thi của KMeansCMN ít hơn. Nói cách khác, để thuật toán hội tụ,
KMeansCMN cần số vòng lặp thực thi ít hơn dẫn tới thời gian thực thi được cải
thiện.
126
3.2. Phân cụm ảnh viễn thám với thuật toán Fuzzy C-Means
3.2.1. Hạn chế của thuật toán Fuzzy C-Means
Nhược điểm của FCM với ảnh viễn thám kích thước lớn được trình bày tại
mục 2.4.3 trong chương II.
3.2.2. Đề xuất thuật toán lsiFCM
3.2.2.1. Trình bày thuật toán lsiFCM
Trong phần này, luận án đề xuất thuật toán phân cụm mờ ảnh viễn thám kích thước
lớn mà chúng tôi tạm gọi là lsiFCM (large size image Fuzzy cMeans). Thuật toán
được trình bày như sau:
Đầu vào: Ảnh gốc.
Đầu ra: Ảnh phân đoạn cuối cùng.
Thuật toán gồm các bước:
B1: Chia ô
Chúng ta có thể biểu diễn lại ảnh theo khía cạnh tập hợp. Biểu diễn ban
đầu của ảnh theo tập các pixel. Giả sử ảnh có kích thước M x N. Khi đó ta
có:
Image = {Pix(i,j): 1 ≤ i ≤ M, 1 ≤ j ≤ N} (50)
Ảnh gốc được chia thành P x Q ô (p ô theo chiều ngang, q ô theo chiều
dọc). Mỗi ô có kích thước không quá 512 x 512 (Mc x Nc) pixel để đảm
bảo thủ tục FCM có thể thực thi. Theo chiều ngang, 2 ô liền kề có phần xếp
chồng bằng một nửa kích thước mỗi ô Cell(x,y). Theo chiều dọc, 2 ô liền kề
có phần xếp chồng bằng một nửa kích thước mỗi ô. Khi đó, ta có biểu diễn
mới của ảnh như sau:
Image = {Cell(x,y): 1 ≤ x ≤ P, 1 ≤ y ≤ Q} (51)
Trong đó:
Cell(x,y) = {Pix(i,j): 1 ≤ i ≤ Mc, 1 ≤ j ≤ Nc} (52)
Mc, Nc < 1024
B2: Phân cụm FCM các ô
127
Tiến hành phân cụm mỗi ô Cell(x,y) với thuật toán FCM.Gọi V(x,y,k) là
tâm thứ k tại ô Cell(x,y), ta được c tâm cụm của ô Cell(x,y):
(53) CentersCell(x,y) = {V(x,y,k): 1 ≤ k ≤ c }
1 ≤ x ≤ P, 1 ≤ y ≤ Q
Tính trọng số mỗi tâm thứ k của ô Cell(x,y) theo công thức:
( ) ∑ ∑ ( ( ) )
(54)
Trong đó, ( ( ) ) là giá trị hàm thuộc của điểm ảnh ( ) với
cụm thứ k trong ô Cell(x,y).
Sau khi đã phân cụm tất cả các ô, ta được:
Tập tâm cụm như sau:
(55) CentersImage = {CentersCell(x,y) : 1 ≤ x ≤ P, 1 ≤ y ≤ Q }
(56) CentersImage = {V(x,y,k): 1 ≤ x ≤ P, 1 ≤ y ≤ Q, 1 ≤ k ≤ c }
Tập các trọng số như sau:
(57) WeiImage = {Wei(x,y,k): 1 ≤ x ≤ P, 1 ≤ y ≤ Q, 1 ≤ k ≤ c }
B3: Phân cụm tập tâm cụm sử dụng FCM
Sau khi thu được tập các tâm cụm của các ô, tiếp tục thực hiện thuật toán
phân cụm FCM trên tập các tâm cụm này với hàm mục tiêu và công thức
tính tâm hiệu chỉnh như sau:
∑ ( )
∑ ( )
(58) ( )
Từ đây, ta thu được tập tâm cụm với c tâm cụm cuối cùng.
B4: Tổng hợp
Từ c tâm cụm thu được trong B3, tính lại giá trị hàm thuộc của từng
điểm trong ảnh ảnh đầu vào với mỗi tâm cụm.
3.2.2.2. Thử nghiệm
Luận án tiến hành thử nghiệm thuật toán đề xuất lsiFCM và so sánh với thuật
toán gốc FCM. Tập dữ liệu thử nghiệm như được mô tả trong phần 2.4.4. Trong đó,
2 mẫu với kích thước trung bình mà vẫn có thể thực hiện với FCM (trong điều kiện
128
RAM không lớn) để so sánh kết quả của hai thuật toán. Kích thước mỗi ô không lớn
hơn 250 x 250 điểm ảnh.
Để đánh giá chất lượng phân cụm, luận án sử dụng chỉ số độ đồng nhất cụm
F(I) và F’(I) [52] như được trình bày trong mục 3.1.5.
Tập dữ liệu phục vụ cho thử nghiệm được mô tả tại mục 2.4.5.2 trong chương
II. Các mẫu đại diện được liệt kê trong bảng 3.13. Trong thử nghiệm này chúng tôi
chọn máy tính có RAM 1GB. Các mẫu thử nghiệm là ảnh lớn mà với số cụm trong
Bảng 3.13. Các ảnh dùng trong các thử nghiệm.
Thử nghiệm 1
Thử nghiệm 2
thử nghiệm đủ để FCM không thể thực hiện với RAM 1GB.
a. Thử nghiệm 1
Ảnh gốc là ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh). Hình
3.22 và 3.23 mô tả ảnh mỗi cụm được sinh ra bởi thuật toán FCM và lsiFCM với 5
Hình 3.22. Chi tiết từng cụm của FCM của thử nghiệm 1.
Hình 3.23. Chi tiết từng cụm của lsiFCM của thử nghiệm 1.
cụm.
129
Hình 3.24, 3.25 thống kê độ đồng nhất theo các chỉ số F(I) và F’(I) của các
Hình 3.24. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 1 (*1.0e+3).
Hình 3.25. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 1 (*1.0e-3).
cụm sinh ra bởi FCM và lsiFCM với số cụm lần lượt là 5, 7, 9.
b. Thử nghiệm 2
Ảnh gốc là ảnh vệ tinh SPOTcó kích thước 2200 x 2101. Hình 3.26 và 3.27
mô tả ảnh mỗi cụm được sinh ra bởi thuật toán FCM và lsiFCM với 4 cụm.
130
Hình 3.26. Chi tiết từng cụm của FCM của thử nghiệm 2.
Hình 3.27. Chi tiết từng cụm của lsiFCM của thử nghiệm 2.
Hình 3.28, 3.29 thống kê độ đồng nhất theo các chỉ số F(I) và F’(I) các cụm
Hình 3.28. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 2(*1.0e+3).
Hình 3.29. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 2 (*1.0e-3).
sinh ra bởi FCM và lsiFCM với số cụm lần lượt là 4, 6, 7, 9.
131
Nhận xét:
Về mặt chất lượng phân cụm, theo đánh giá độ đồng nhất từ các bảng và biểu đồ
trên, lsiFCM vẫn đảm bảo độ ổn định so với FCM, thậm chí có trường hợp tốt hơn
FCM.
3.3. Phân lớp ảnh viễn thám
3.3.1. Phân lớp hợp lý tối đa
3.3.1. Phân lớp Bayes
Ký hiệu các lớp phổ cho một ảnh qua việc biểu diễn như sau: .
Trong đó, M là tổng số lớp [59]. Trong việc cố gắng xác định lớp hoặc loại mà
vector điểm ảnh x thuộc lớp đó là xác xuất có điều kiện ( ⁄ ) .
Vector độ đo x là một cột giá trị độ sáng cho điểm ảnh. Nó mô tả điểm ảnh như một
điểm trong không gian đa phổ với hệ tọa độ được bởi độ sáng. Xác suất ( ⁄ )
cho sự hợp lý mà lớp chính xác là cho một điểm ảnh tại vị trí x. Phân loại được
thực hiện theo
(59) ( ⁄ ) ( ⁄ )
Nghĩa là, điểm ảnh tại x thuộc lớp nếu ( ⁄ ) là lớn nhất. Luật quyết định trực
giác này là một trường hợp đặc biệt của một luật tổng quát hơn trong đó các quyết
định có thể được chịu ảnh hưởng theo mức độ khác nhau của ý nghĩa được gắn đến
sự phân loại không chính xác khác.
3.1.2. Luật quyết định hợp lý tối đa
Mặc dù rất đơn giản, ( ⁄ ) không được biết đến. Tuy nhiên, nếu giả sử
rằng dữ liệu huấn luyện đầy đủ sẵn sàng cho mỗi loại che phủ đất [59]. Điều này có
thể được dùng để ước lượng một phân bố xác suất cho một loại che phủ mà mô tả
cơ hội tìm một điểm ảnh từ lớp tại vị trí x. Sau đó, việc hình thức hóa hàm phân
bố này sẽ được tạo cụ thể hơn. Tuy nhiên, hiện tại, hàm này được giữ lại trong dạng
chung và được biểu diễn bởi ký hiệu ( ⁄ ). Sẽ có nhiều ( ⁄ ) như có các lớp
che phủ đất. Nói cách khác, với một điểm ảnh tại vị trí x trong không gian đa phổ
một tập các khả năng có thể được tính mà đưa ra sự hợp lý liên quan mà điểm ảnh
thuộc về mỗi lớp sẵn có.
132
( ⁄ ) mong muốn trong phần 1 và ( ⁄ ) sẵn có – được ước lượng từ dữ liệu
huấn luyện – liên quan bởi định lý Bayes (Freund, 1992):
⁄ (60) ( ⁄ ) ( ⁄ ) ( ) ( )
Trong đó, ( ) là xác suất mà lớp xảy ra trong ảnh. Nếu, chẳng hạn, 15%
điểm ảnh của ảnh thuộc về lớp thì ( ) ; ( ) trong (2) là xác suất để
tìm được điểm ảnh trong bất kỳ lớp nào tại vị trí x. Nó được quan tâm vì:
( ) ∑ ( ⁄ )
(61) ( ),
mặc dù chính ( ) không quan trọng trong những điều sau đây. ( ) được gọi là
xác suất ưu tiên, khi chúng là xác suất với thành viên lớp của một điểm ảnh có thể
được dự đoán trước khi phân loại. Bằng việc so sánh ( ⁄ ) là các khả năng sau
đó. Sử dụng (2) có thể thấy rằng luật phân loại của phần 1 là:
(62) ( ⁄ ) ( ) ( ⁄ ) ( )
Trong đó, ( ) đã được xóa như một thừa số chung. Luật (4) dễ chấp nhận
hơn so với luật (1) khi ( ⁄ ) được biết từ dữ liệu huấn luyện và nó có thể được
hiểu rằng ( ) cũng đã biết hoặc có thể ước lượng từ tri thức phân tích ảnh. Kết
quả phù hợp về mặt toán học nếu trong (58) định nghĩa:
(63) ( ) ( ⁄ ) ( ) ( ⁄ ) ( )
được sử dụng, trong đó ln là logarit tự nhiên, và (4) được trình bày lại như sau:
(64) ( ) ( )
Nghĩa là, với thay đổi như trên, luật quyết định được sử dụng trong phân loại
hợp lý tối đa; ( ) tham chiếu đến hàm phân biệt (discriminant).
3.1.3. Mô hình lớp chuẩn đa biến
Ở giai đoạn này, giả sử rằng phân bố xác suất của các lớp thuộc dạng mô hình
chuẩn đa biến [59]. Đây là một giả định, hơn là một thuộc tính có thể chứng minh
của các lớp phổ tự nhiên hoặc thông tin. Tuy nhiên, nó dẫn đến sự đơn giản hóa về
mặt toán học như sau đây. Hơn nữa nó là một phân bố cho các thuộc tính của dạng
đa biến đã biết.
Trong (58) vì thế, bây giờ được giả sử cho N kênh rằng (xem phụ lục E)
133
( ) ∑ ( )
} ( ⁄ ) ( ) ⁄ | | ⁄ {
(65)
( ) ∑ ( )
( )
(66) ( ⁄ ) – | |
Trong đó, và là vector trung bình và ma trận hiệp phương sai của dữ
liệu trong lớp . Ta có – ( ) là chung cho tất cả ( ) và không giúp cho
sự phân biệt. Do đó, thừa số này được bỏ qua và dạng cuối của hàm phân biệt cho
phân loại hợp lý tối đa, dựa trên giả định của thống kê chuẩn, là (thay 62 vào 59):
( ) ∑ ( )
(67) ( ) ( ) | |
Thông thường, người phân tích không có thông tin hữu ích về ( ), trong
trường hợp một tình huống của các khả năng ưu tiên cân bằng được giả định; như
một hệ quả ( ) có thể được xóa bỏ từ (63) khi nó giống nhau với mọi i. Trong
trường hợp này thừa số ½ cũng có thể được loại bỏ, như hàm phân biệt:
(68) ( ) | | ( ) ∑ ( )
Việc cài đặt luật quyết định hợp lý tối đa liên quan đến việc sử dụng hoặc (67) hoặc
(68). Tuy nhiên có một suy xét xa hơn liên quan đến liệu rằng bất kỳ nhãn hay lớp
nào sẵn sàng cũng hợp lý.
3.3.2. Một số độ đo phân lớp
Để đánh giá một giải thuật máy học một số chỉ số thông dụng được sử dụng.
Trong đó có Độ chính xác (Precision), Độ hồi tưởng (Recall) [127], Độ đo F1.
(69)
(70)
(71)
Trong đó:
Số đúng dương (TP- True positive): số phần tử dương được phân loại
dương.
Số sai âm (FN - False negative): số phần tử dương được phân loại âm.
Số đúng âm (TN- True negative): số phần tử âm được phân loại âm.
134
Số sai dương (FP - False positive): số phần tử âm được phân loại
dương.
3.3.3. Đề xuất tiếp cận lai cho phân lớp ảnh viễn thám
3.3.2.1. Trình bày tiếp cận lai cho phân lớp ảnh viễn thám
Trong nghiên cứu này, luận án đề xuất một tiếp cận phân loại ảnh với sự kết
hợp cả hai tiếp cận trên mà chúng tôi tạm gọi là tiếp cận lai. Đầu tiên, ảnh gốc được
tiến hành phân vùng. Thay vì trích chọn đặc trưng đối tượng như trong tiếp cận
hướng đối tượng, các vùng sẽ được đưa vào bộ phân loại lai để cho quyết định phân
Hình 3.30. Quy trình phân loại ảnh đa phổ theo tiếp cận lai.
lớp cuối cùng. Hình 3.30 mô tả quy trình phân loại theo tiếp cận lai.
Thuật toán gồm các bước như sau:
B1: Phân vùng ảnh (Unsupervised Segmentation)
Sử dụng thuật toán phân cụm để chia ảnh đầu vào thành các vùng, cụm
khác nhau.
B2: Phân lớp lai
Hàm phân biệt ( ) như được trình bày trong mục 3.3.2 của phương
pháp phân lớp hợp lý tối đa chỉ áp dụng cho từng điểm ảnh. Trong phần
này, chúng tôi đề xuất một cải tiến cho hàm phân biệt này để áp dụng cho
việc phân lớp các cụm-đối tượng đã thu được từ giai đoạn phân loại không
giám sát.
Sau khi phân cụm ảnh gốc I ta được tập O cụm-đối tượng như sau:
(72)
Trong đó, = ; i j, i,j = 1,2,.., K; o1 o2 … oK = I.
135
Luận án xây dựng hàm phân biệt cho mỗi cụm như sau:
(73) ( ) ( ) ∑ ( )
Từ đây luận án đề xuất luật quyết định lớp cho mỗi cụm như sau:
(74) ( ) ( )
Như vậy, có thể thấy rằng điểm khác biệt giữa các tiếp cận phân lớp là:
Tiếp cận dựa điểm ảnh chỉ trích chọn đặc trưng điểm ảnh, cụ thể trong thuật
toán trên là xây dựng hàm phân biệt và tính giá trị hàm này cho mỗi điểm
ảnh.
Tiếp cận dựa trên điểm ảnh trích chọn các đặc trưng đối tượng (đã liệt kê
trong chương 1) theo mỗi cụm.
Thuật toán cải tiến theo tiếp cận lai thì chỉ xây dựng hàm phân biệt và tính
giá trị hàm này cho mỗi cụm (hay cụm).
3.3.2.2. Thử nghiệm và đánh giá
Hình 3.31: Sơ đồ thử nghiệm quy trình thử nghiệm phân lớp theo tiếp cận lai.
a. Quy trình thử nghiệm
Quá trình thử nghiệm chia làm ba giai đoạn:
136
Giai đoạn 1: Lấy mẫu – Trích chọn đặc trưng
Để có dữ liệu mô hình, trước tiên cần lấy mẫu huấn luyện từ trên ảnh đầu
vào. Sau đó, trung bình và ma trận hiệp phương sai của mỗi lớp sẽ được
Hình 3.32: Lựa chọn và hiển thị vùng mẫu trên ảnh.
tính và lưu lại thành dữ liệu mô hình. Hình 3.32 mô tả quá trình lựa chọn
vùng mẫu, đặt tên lớp phủ.
Giai đoạn 2: Phân lớp dữ liệu
- Bước 1: Phân cụm
Trong nghiên cứu này, luận án đã thử nghiệm cài đặt thuật toán
KMeansCMN (được trình bày trong mục 3.1.7).
- Bước 2: Phân lớp lai:
Tính giá trị hàm phân biệt cho từng cụm và so sánh để đưa ra quyết
định phân lớp cho các cụm này.
So sánh và đánh giá
Kết quả thử nghiệm có sự so sánh giữa thuật toán phân loại theo phương
pháp phân loại hợp lý tối đa (thuật toán gốc), được cài đặt trong phần mềm
137
Grass, và thuật toán dựa trên tiếp cận lai (thuật toán cải tiến). Để đánh giá
độ chính xác phân lớp đối với mỗi lớp, luận án sử dụng chỉ số Precision.
Tập dữ liệu phục vụ cho thử nghiệm gồm các ảnh như được mô tả trong mục 2.4.5.2
trong chương II.
b. Thử nghiệm đại diện
Thử nghiệm 1
Mẫu thứ nhất là ảnh SPOT. Thực hiện việc phân loại ảnh đầu vào với 3 lớp:
đất (màu nâu trong ảnh kết quả), nước (màu vàng trong ảnh kết quả), rừng (màu
xanh lam trong ảnh kết quả). Kết quả phân loại được thể hiện trong hình 3.33. Từ
kết quả trong hình 3.33, quan sát vùng được khoanh tròn trên ảnh, vùng rừng có xen
lẫn đất vơú tính hỗn tạp rất cao. Tuy nhiên, thuật toán gốc không phản ánh rõ sự đan
Hình 3.33. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến.
xen này mà quy về một lớp. Trong khi thuật toán cải tiến phân biệt rất rõ.
Bảng 3.14 và hình 3.34 thống kê độ chính xác Precision của thuật toán
Bảng 3.14. So sánh độ chính xác.
Maximum Likehood và thuật toán theo tiếp cận lai.
138
Lớp MLK Lai
Đất
95%
98%
Rừng
99.8% 99.9%
Nước
97%
98%
Hình 3.34. So sánh độ chính xác.
Thử nghiệm 2
Mẫu thứ hai là ảnh LANDSAT (huyện Đà Bắc, tỉnh Hoà Bình). Thực hiện
việc phân loại ảnh đầu vào với 3 lớp: Núi đá (màu đen trong ảnh kết quả), nước
(màu xanh trong ảnh kết quả), rừng (màu vàng trong ảnh kết quả). Kết quả được thể
hiện trong hình 3.35. Ảnh đầu vào cũng có tính hỗn tạp cao và được thể hiện rõ hơn
qua ảnh kết quả của thuật toán phân loại đề xuất.
139
Hình 3.35. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến.
Bảng 3.15 và hình 3.36 thống kê độ chính xác Precision của thuật toán
Bảng 3.15. So sánh độ chính xác.
Maximum Likehood và thuật toán theo tiếp cận lai.
Lớp MLK Lai
Núi đá
85%
84%
Rừng
90%
93%
Nước 99.6% 99.7%
140
Hình 3.36. So sánh độ chính xác.
Thử nghiệm 3
Mẫu thứ hai là ảnh LANDSAT (huyện Lạc Thuỷ, tỉnh Hoà Bình). Thực hiện
việc phân loại ảnh đầu vào với 3 lớp: Đất (màu nâu trong ảnh kết quả), nước (màu
xanh trong ảnh kết quả), rừng (màu vàng trong ảnh kết quả). Kết quả được thể hiện
trong hình 3.37. Ảnh đầu vào cũng có tính hỗn tạp cao và được thể hiện rõ hơn qua
ảnh kết quả của thuật toán phân loại đề xuất.
141
Hình 3.37. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến.
Bảng 3.16 và hình 3.38 thống kê độ chính xác Precision của thuật toán
Bảng 3.16. So sánh độ chính xác.
Maximum Likehood và thuật toán theo tiếp cận lai.
Lớp MLK Lai
Rừng
95%
97%
Đất
99.5% 99.7%
Nước
85%
90%
142
Hình 3.38. So sánh độ chính xác.
3.4. Kết luận chương III
Chương III dược chia thành ba phần chính.
Trong phần đầu tiên, chương III có nghiên cứu và cải tiến liên quan đến thuật
toán KMeans. Thứ nhất, trình thuật toán phân cụm toán kinh điển KMeans. Tiếp
theo là hai cải tiến gần đây CCEA_KMeans và 2D-KMeans về tốc độ thực thi và
chất lượng phân cụm. Luận án cũng phân tích hạn chế của thuật toán KMeans. Từ
đó, luận án đề xuất cải tiến thuật toán KMeans nhằm khắc phục những hạn chế nói
trên. Các đề xuất bao gồm các thuật toán: WiKMeans, CIKMeans và KMeans.
Trong đó, thuật toán WiKMeans để khởi tạo tập tâm tốt và hỗ trợ tăng tốc độ phân
vùng ảnh viễn thám.Các kết quả thử nghiệm cho thấy wiKMeans cho tốc độ tốt hơn
rất nhiều KMeans và tốt hơn CCEA_KMeans (một cải tiến gần đây của KMeans về
mặt tốc độ thực thi). Thuật toán CIKMeans để phân cụm với thông tin ngữ cảnh
kèm theo cho mỗi điểm ảnh.Các kết quả thử nghiệm cho thấy CIKMeans cho chất
lượng phân cụm tốt hơn so với KMeans và 2D-Kmeans (một cải tiến gần đây của
KMeans về mặt chất lượng phân cụm). Thuật toán KMeansCMN với mục tiêu áp
dụng phương thức chuẩn hóa trung bình phổ để tính tâm cụm cho việc phân vùng
ảnh viễn thám kích thước lớn. Các kết quả thử nghiệm cho thấy KMeansCMN phân
cụm tốt với ảnh viễn thám kích thước lớn. Ngoài ra, tốc độ phân cụm của
KMeansCMN là tốt hơn so với KMeans thông thường. Hiện tại, thủ tục tính tâm
theo CMN vẫn sử dụng nhiều tính toán với số thưc nên tốc độ chậm. Trong nghiên
143
cứu tiếp theo, nhóm tác giả dự kiến sử dụng phương pháp tính toán chấm tĩnh để
tăng cường tốc độ thủ tục này để tăng tốc độ phân cụm.
Trong phần thứ hai, chương III có nghiên cứu và cải tiến liên quan đến thuật
toán phân cụm mờ. Trước tiên, phần này cũng trình bày thuật toán phân cụm FCM
và phân tích hạn chế của nó. Tiếp đó, chương III đề xuất một thuật toán phân vùng
ảnh viễn thám mới lsiFCM. Ý tưởng của thuật toán này là kết hợp việc thuật toán
phân cụm mờ với việc chia ảnh viễn thám kích thước lớn đầu vào thành những
mảnh nhỏ hơn làm sao cho FCM vẫn thực thi được cùng với việc tính bộ trọng số
tâm cho từng mảnh. Sau khi tất cả các mảnh đều được phân cụm, ta có tập các tâm
cụm của các ô này trọng số tương ứng. Tiếp tục sử dụng thuật toán FCM với công
thức tính tâm mới để phân cụm tập các tâm này. Kết quả thu được tập các tâm cho
toàn ảnh. Quá trình tổng hợp là việc tính lại giá trị hàm thuộc từng điểm ảnh và tập
các tâm cuối cùng. Các kết quả thử nghiệm chứng tỏ lsiFCM cho kết quả phân vùng
tốt, vẫn đạt độ ổn định so với FCM. Tuy nhiên, do việc thực hiện thuật toán FCM
với rất nhiều ô, tốc độ thực thi của lsiFCM chậm hơn nhiều so với FCM.
Trong phần thứ ba, chương III khảo sát về kĩ thuật phân lớp có giám sát hợp lý
tối đa được dùng phổ biến trong phân lớp ảnh viễn thám đa phổ. Đó là kĩ thuật phân
lớp dựa trên hướng tiếp cận điểm ảnh truyền thống. Tiếp đó, chương III đề xuất một
tiếp cận phân loại lai với sự kết hợp cả hai tiếp cân hướng điểm ảnh và hướng đối
tượng. Thuật toán dựa trên tiếp cận lai được cải tiến từ kĩ thuật phân lớp có giám sát
hợp lý tối đa nhưng được sử dụng không phải để phân lớp từng điểm ảnh mà phân
lớp các cụm-đối tượng. Quy trình phân loại theo tiếp cận này gồm hai giai đoạn.
Một là, phân vùng ảnh, trong thuật toán cải tiến theo tiếp cận này, chúng tôi sử dụng
thuật toán KMeans. Hai là, phân lớp lai, các vùng sau đó sẽ được phân lớp theo bộ
phân lớp lai sử dụng hàm quyết định phân lớp mới mà luận án đề xuất. Hàm quyết
định phân lớp này được cải tiến dựa trên hàm phân biệt của phương pháp phân loại
hợp lý tối đa. Các kết quả thử nghiệm cho thấy kết quả phân lớp của thuật toán dựa
trên tiếp cận đề xuất cho độ chính xác cao hơn so với thuật toán của phương pháp
hợp lý tối đa.
Trong phần kết luận, luận án tóm tắt những kết quả chính đã đạt được và
hướng phát triển tiếp theo.
144
KẾT LUẬN
Luận án đã trình bày tổng quan về vấn đề giải đoán ảnh viễn thám đa phổ và
tình hình nghiên cứu trong và ngoài nước. Qua đó, luận án phân tích những thành
công cũng như một số điểm còn hạn chế. Dựa theo những phân tích này, luận án
thực hiện cải tiến các khâu tăng cường và phân lớp ảnh viễn thám đa phổ.
Kết quả đạt được của luận án bao gồm:
(1) Giai đoạn tăng cường ảnh:
Đề xuất kĩ thuật tăng cường độ tương phản ảnh viễn thám đa phổ mới
dựa trên tiếp cận cục bộ theo cụm với hai thuật toán tăng cường sử dụng
các thuật toán phân cụm FCM và KMeans.
Đề xuất thêm hai thuật toán tăng cường ảnh viễn thám kích lớn dựa trên
việc cải tiến thuật toán phân cụm mờ và sử dụng kĩ thuật Wavelet.
Kết quả này đã được nghiên cứu sinh công bố trong [TRU1], [TRU2] và
[TRU9].
(2) Giai đoạn phân lớp ảnh:
Để tăng cường tốc độ thực thi và chất lượng phân cụm của thuật toán
phân cụm KMeans, luận án đề xuất thuật toán WIKMeans và CIKMeans.
Trong đó, WIKMeans (Wavelet Inited KMeans) với sự hỗ trợ của phép
biến đổi Wavelet để tăng tốc độ thực thi của KMeans thông qua một khởi
tạo tâm cụm tốt. CIKMeans (Context Information KMeans) để khôi phục
thông tin ngữ cảnh cho thuật toán. Kết quả này đã được nghiên cứu sinh
công bố trong [TRU3], [TRU6], [TRU8].
Luận án đề xuất thuật toán KMeansCMN với sử dụng phép chuẩn hoá
CMN (Cepstral Mean Normalisation) được sử dụng trong công thức tính
tâm cụm mới. Kết quả này đã được nghiên cứu sinh công bố trong
[TRU4] và [TRU7]. Ngoài ra, luận án đề xuất thuật toán phân cụm ảnh
viễn thám kích thước lớn được cải tiến từ thuật toán phân cụm mờ. Kết
quả này đã được nghiên cứu sinh công bố trong [TRU5].
Trong giai đoạn phân lớp có giám sát, luận án đề xuất một kĩ thuật lai với
sự kết hợp cả hai hướng tiếp cận để đưa ra một thuật toán phân loại ảnh
145
viễn thám hiệu quả hơn mà chúng tôi tạm gọi là phương pháp tựa đối
tượng. Kết quả này đã được nghiên cứu sinh công bố trong [TRU7].
Trong các kết quả của luận án, các đóng góp quan trọng trong vấn đề tăng
cường và phân cụm ảnh viễn thám. Tuy nhiên, luận án chưa đạt được nhiều kết quả
trong giai đoạn phân lớp. Do đó, hướng nghiên cứu của luận án:
Nghiên cứu giải pháp tăng tốc độ thuật toán phân cụm mờ để tăng tốc độ
thực thi cho thuật toán LoRSIE_FCM và LaRSIE_FCM.
Nghiên cứu đề xuất toán tử tăng cường ảnh mới, có thể áp dụng đại số gia
tử.
Hướng tới việc song song hóa giai đoạn phân cụm các ô để tăng tốc độ thực
thi của thuật toán lsiFCM.
Tập trung vào giai đoạn phân lớp có giám sát để đưa ra thêm những cải tiến
cho tiếp cận phân lớp lai nói riêng hay phân lớp ảnh viễn thám nói chung
cũng như có những so sánh, đánh giá sâu hơn với hai tiếp cận hướng điểm
ảnh và hướng đối tượng.
146
DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA NGHIÊN CỨU SINH
Tạp chí
[TRU1] Trung Nguyen Tu, Huy Ngo Hoang, Thoa Vu Van, Using fuzzy logic
to enhance the large size remote sensing images, International Journal
of Information and Electronics Engineering, Vol.5, No.6, 2015.
[TRU2] Nguyễn Tu Trung, Vũ Văn Thoả, Đặng Văn Đức, Một phương pháp
tăng cường độ tương phản ảnh viễn thám dựa trên tiếp cận cục bộ,
Chuyên san các công trình nghiên cứu, Tạp chí Công nghệ thông tin và
Truyền thông, Bộ Thông tin và Truyền thông, Kỳ 3, tập V-2, số 14
(34), 2015.
[TRU3] Trung Nguyen Tu, Huy Ngo Hoang, Duc Dang Van, Thoa Vu Van, A
improvement of KMeans algorithm using wavelet technique to increase
speed of clustering remote sensing images, International Journal of
Computer and Electrical Engineering, Vol. 8, No. 2, 2016, pp. 177-
184.
[TRU4] Nguyễn Tu Trung, Ngô Hoàng Huy, Một chứng minh hình thức cho
phép bù trừ phổ CMN của tín hiệu số và ứng dụng trong phân vùng
ảnh viễn thám, Tạp chí Khoa học, Đại học sư phạm Hà Nội, Vol. 60,
No. 7A, 2015, pp. 137-144.
[TRU5] Nguyễn Tu Trung, Vũ Văn Thỏa, Đặng Văn Đức, Phân vùng ảnh
viễn thám kích thước lớn dựa trên phân cụm mờ, Tạp chí Khoa học
Công nghệ Thông tin và Truyền thông, Học Viện Công nghệ Bưu
chính Viễn thông, Tập 1, Số 1 năm 2016, pp. 45-51.
[TRU6] Nguyễn Tu Trung, Đặng Văn Đức, Vũ Văn Thỏa, Một số cải tiến kĩ
thuật phân cụm cho ảnh viễn thám, được chấp nhận đăng trên Chuyên
san các công trình nghiên cứu, Tạp chí Công nghệ thông tin và Truyền
thông, Bộ Thông tin và Truyền thông, số 16 (36), 2016.
147
[TRU7] Nguyễn Tu Trung, Ngô Hoàng Huy, Đặng Văn Đức, Vũ Văn Thỏa,
Lại Anh Khôi, Một kĩ thuật phân lớp ảnh viễn thám sử dụng tiếp cận
lai, Tạp chí Khoa học Công nghệ Thông tin và Truyền thông, Học
Viện Công nghệ Bưu chính Viễn thông, Số 2 năm 2016.
Kỷ yếu Hội nghị
[TRU8] Nguyễn Tu Trung, Ngô Hoàng Huy, Vũ Văn Thoả, Đặng Văn Đức,
Một cải tiến thuật toán KMeans cho việc phân vùng ảnh viễn thám,
Hội thảo “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin”, Hà
Nội, 2015.
[TRU9] Trung Nguyen Tu, Duc Dang Van, Huy Ngo Hoang, Thoa Vu Van, A
method to enhance the remote sensing images based on the local
approach using Kmeans algorithm, Hội thảo “International Conference
on Advances in Information and Communication Technology”, ICTA
2016.
148
TÀI LIỆU THAM KHẢO
[1]
Dương Hiếu Đẩu và Đặng Văn Liệt, (2005), Dùng biến đổi wavelet rời
rạc để phân tích các dị thường trọng lực, Tạp chí khoa học Đại Học Cần
Thơ – số định kỳ: 04 (2005).
[2]
Đặng Văn Đức và cộng sự, Một số kĩ thuật ứng dụng trong phát triển phần
mềm xử lý ảnh viễn thám trên nền phần mềm GRASS, Hội thảo Công nghệ
Vũ trụ và Ứng dụng, 2010, pp. 158-166.
[3] Đặng Văn Liệt, Nguyễn Anh Hoàng, Nguyễn Chí Nhân, (2002), Ứng dụng
phổ biến đổi Wavelet 1-D trong phân tích tài liệu từ, Hội nghị NCKH lần
thứ Trường ĐH Khoa Học Tự Nhiên, TP HCM.
[4]
Dang Huu Nghi, Luong Chi Mai, An object-oriented classification
techniques for high resolution satellite imagery, International Symposium
on Geoinformatics for Spatial Infrastructure Development in Earth and
Allied Sciences 2008.
[5]
Lê Văn Trung, Ảnh hưởng của dữ liệu huấn luyện trong các thuật toán
phân loại ảnh viễn thám, tạp chí Phát triển KH&CN, số 10, 2007, pp. 57-
61.
Nguyễn Khắc Thời và cộng sự, Giáo trình viễn thám, 2011. [6]
[7]
Võ Quang Minh và Nguyễn Thị Thanh Nhanh, Nghiên cứu sử dụng ảnh
viễn thám xác định sự phân bố đất than bùn ở U Minh hạ, Tạp chí Khoa
học 2010:16b, pp. 49-57.
[8]
Aditi M., Irani S., Contrast Enhancement of Images using Human
Contrast Sensitivity, Applied perception in graphics and visualization,
11, 2006, pp. 69-76.
[9]
Adlin S. T., Kumudha R., A Survey on Color Image Enhancement
Techniques, IOSR Journal of Engineering (IOSRJEN), Vol. 3, Issue 2
(Feb. 2013), pp. 20-24.
[10]
Ahmed M. N., Yamany S.M., Mohamed N., and Faragant A.A., Moriarty
T., A modified fuzzy c-means algorithm for bias field estimation and
segmentation of mridata, IEEE Transactions on Medical Imaging, 21(3),
2002, pp. 193–199.
149
[11]
Aman T., Naresh K., Performance Analysis of Type-2 Fuzzy System for
Image Enhancement using Optimization, International Journal of
Enhanced Research in Science Technology & Engineering, Vol. 3 Issue
7, July-2014, pp: (108-116).
[12] Anderson G., Fundamentals of Fuzzy Logic, SENSORS, 2001.
[13]
Anumolu Lasmika, K. Raveendra, “Improving Quality of Satellite Image
by Wavelet Transforming & Morphological Filtering”, International
Journal of Innovative Research in Science, Engineering and Technology,
ISSN: 2319-8753, Vol. 3, Issue 7, July 2014.
[14]
Ahern,F.J., Brown,R.J., Cihlar,J., Gauther, R..P., Murphy,J., Neville,
R.A., and P.M. Teillet. (1987), Radiometric correction of visible and
infrared remote sensing data at the Canada Centre for Remote Sensing,
International Journal of Remote Sensing. 8:1349-1376.
[15]
Arich T., Dikbas S., A histogram modification framework and its
application for image contrast enhancement, IEEE Trans. Image
Process., 18, 2009.
[16]
Arya P Unni, Satellite Image Enhancement Using 2D Level DWT,
International Journal of Engineering Research & Technology (IJERT),
ISSN: 2278-0181, Vol. 3 Issue 3, March – 2014.
[17]
Ashwini T. S., Chandraprakash B., Tarapore N. Z., Satellite Image
Classification using the Back Propagation Algorithm of Artificial Neural
Network, In the proceedings of IEEE on geoscience and remote sensing,
Vol. 46, September, 2001.
[18]
Balaji T., Sumathi M., Relational Features of Remote Sensing Image
classification using Effective KMeans Clustering, International Journal of
Advancements in Research & Technology, Volume 2, Issue 8, August-
2013, pp. 103-107.
[19]
Berget I., Mevik B. H., and Naæs T., New modifications and applications
of fuzzy c-means methodology, Computational Statistics and Data
Analysis, Vol. 52, 2008, pp. 2403-2418.
[20] Bischof H., Schneider W., and Pinz A. J., Multispectral Classification of
150
Landsat Images Using Neural Networks, In the proceedings of IEEE
transactions on Geosciences and remote sensing, Vol. 30, NO 3, May
1992.
[21]
Burt, P.J. and Adelson, E.H.(1983), “The Laplacian pyramid as a
compactimage code”, IEEE Trans, Commun., Vol COM-31, pp. 532-
540.
[22]
Canada Center for Remote Sensing, Fundamentals of Remote Sensing,
Canada, 2007.
[23]
Caselles, V. and Lopez Garcia M.J., An alternative simple approach to
estimate atmospheric correction in multitemporal studies, International
Journal of Remote Sensing, 1989, 10: pp. 1127-1134.
[24]
Cheng H.D., Xu H., A novel fuzzy logic approach to contrast
enhancement, Pattern Recognition, 33, 2000, pp. 809-819.
[25]
Chen S. and Zhang D., Robust image segmentation using fcm with spatial
constraints based on new kernel-induced distance measure, IEEE
Transactionson Systems, Man and Cybernetics, PartB., 34(4), 2004, pp.
1907–1916.
[26]
Chih-Tang C., Iim Z. C. Lai, and Mu-Der Jeng, A Fuzzy K-means
Clustering Algorithm Using Cluster Center Displacement, Journal of
Information Science and Engineering 27, (2011), pp. 995-1009.
[27]
Chavez P.S. Jr., An improved dark-object subtraction technique for
atmospheric scattering correction of multispectral data, Remote Sensing
of Environment, 1988, pp. 459-479.
[28]
Cihlar J., Du Y. and Latifovic R., Land cover dependence in the
detection of contaminated pixels in satellite optical data, IEEE
Transactions on Geoscience and Remote Sensing, 2001.
[29]
Codruta O. A., Cosmin A. and Philippe B., Effective Single Image
Dehazing by Fusion, Proceedings of 2010 IEEE 17th International
Conference on Image Processing, Hong Kong, 2010, pp. 3541-3544.
[30]
Crochiere, Weber and Flanagan, (1976) “Digital Coding of Speech in
Sub-bands”, Bell System Technical Journal, vol. 55, pp. 1069-1085.
151
INTRODUCTION TO SOFT COMPUTING, [31]
Dmitry
Bystrov,
LECTURE NOTICE.
[32]
Dorigo M., Caro G.D., Ant colony optimization: a new meta-heuristic,
Proceedings of the Congress on Evolutionary Computation, IEEE, 2,
1999, pp. 1470–1477.
[33]
Döring C., Lesot M. J., and Kruse R., Data analysis with fuzzy clustering
methods, Computational Statistics and Data Analysis, 2006, pp. 192-214.
[34]
Duan J., Qiu G., Novel histogram processing for colour image
enhancement, Third International Conference on Image and Graphics, 4,
2004, pp. 55–58.
[35]
Du Y. and Gower J.F.R., Cloud detection and thin cloud calibration in
NOAA AVHRR images with fuzzy logic. Canadian Journal of Remote
Sensing, 2000, pp.54-63.
[36]
Fan J. L., Zhen W. Z., and Xie W. X., Suppressed fuzzy c-means
clustering algorithm, Pattern Recognition Letters, 2003, pp. 1607-1612.
[37]
Farid M. và Lorenzo B., Classification of Hyperspectral Remote Sensing
Images With Support Vector Machines, IEEE, 2004, pp. 1778-1790.
[38]
Fedi, M., Quarta T., (1998), “Wavelet analysis for the regional - residual
separation of potential field anomalies”, Geophysical Prospecting, Vol.
46, pp. 507-525.
[39]
Forsyth D.A. and Ponce J., Computer Vision: A Modern Approach,
Prentice Hall, 2003, pp.1074-1081.
[40]
Forster, B.C., Derivation of atmospheric correction procedures for
Landsat MSS with particular reference to urban data, International
Journal of Remote Sensing. 1984, pp. 799-817.
[41]
Gabor D., (1946). “Theory of communication”, Jour. IEEE, (London),
93, pp. 429-457.
[42]
Global Marketing Insights Inc., Survey and Analysis of Remote Sensing
Market Aerial and Spaceborne, 2005.
[43] Golpar E. R., Hasanzade M., Lot T., F. Fattahzadeh, Multi Resolution
152
Fuzzy Segmentation of Satellite Images, International Journal Industrial
Mathematics Vol. 1, No. 1 (2009), pp. 77-85.
[44]
Hanmandlu M., Jha D., Sharma R., Color image enhancement by fuzzy
intensification, Pattern Recognition. Lett., 24, 2003, pp. 81–87.
[45]
Hanmandlu M., Member, IEEE and Devendra Jha, An optimal Fuzzy
System for color image enhancement, IEEE Trans., 15, 2006, pp. 2956-
2966.
[44]
Hall F.G., Strebel D.E., Nickeson J.E. and Goetz S.J., Radiometric
rectification: Towards a common radiometric response among multidate,
multisensor images, Remote Sensing of Environment, 1991, 35: pp. 11-
27.
[47]
Hasanien A.E., Badr A., A Comparative Study on Digital Mamography
Enhancement Algorithms Based on Fuzzy Theory, Studies in Informatics
and Control, Vol.12, No.1, March 2003, pp.21-31.
[48]
He K., Sun J. and Tang X., Single image haze removal using dark
channel prior, IEEE Conferenceon Computer Vision and Pattern
Recognition, 2009, pp.1956-1963.
[49]
Hoel L. C. and Carl F., A fast fuzzyc-means algorithm for color image
segmentation, EUSFLAT-LFA, France, 2011, pp. 1074-1081.
[50]
Höppner F., Speeding up fuzzy c-means using a hierarchical data
organization tocontrol the precision of membership calculation, Fuzzy
Sets and Systems, Vol. 128, 2002, pp. 365-376.
[51]
Huang K.Q., Wang Q., Wu Z.Y., Natural color image enhancement and
evaluation algorithm based on human visual system, Comput. Vis. Image
Underst., 103, 2006, pp. 52–63.
[52]
Intan A. Y., Nor A. M. I., Two-Dimensional Clustering Algorithms for
Image Segmentation, WSEAS Transactions on Computers, Issue 10,
Volume 10, October 2011, pp.332-342.
[53]
Jain A., Murty M., and Flynn P., Data clustering: A review, ACM
Computing Surveys, 31, 1999, pp. 264–323.
153
[54]
James T., Galen G., A contiguity-enhanced k-means clustering algorithm
for unsupervised multispectral image segmentation, Proc SPIE 3159,
1997, pp. 108-118.
[55]
Jaroslav Ramík, SoftComputing: Overview and Recent Developments in
Fuzzy Optimization, 2011.
[56]
Jaynes E.T., Information Theory and Statistical Mechanics. Physical
Review, 1957, pp. 620-630.
[57]
Jiefeng J., Jing Z., Gege Y., Dapeng Z., Lianjun Z., Application of Back
Propagation Neural Network in the Classification of High Resolution
Remote Sensing Image, supported by the geographic information
technology research, 2009.
[58]
John S., Hanmandlu M., Vasikarla S., Fuzzy based arameterized
Guassian
Edge Detector Using Global and Local Properties,
International Conference on Information Technology, 02, 2005, pp. 101–
106.
[59]
John A. R., Xiuping J., Remote Sensing Digital Image Analysis,
Springer-Verlag Berlin Heidelberg 2006.
[60] Kaiser, G., (1994), “A friendly guide of wavelets”, Birkkauser.
[61]
Kanungo T. et al, An efficient k-means clustering algorithm: analysis and
implementation, IEEE Transactions on Pattern Analysis and Machine
Intelligence, 2002, pp. 881-892.
[62]
Norman K. et al, Principles of Remote Sensing, The International
Institute for Geo-Information Science and Earth Observation, The
Netherlands, 2004
[63]
Krinidis S. and Chatzis V., A robust fuzzy local information c-means
clustering algorithm, IEEE Transactions on Image Processing, 19, 2010,
pp. 1328–1337.
[64]
Lai J. Z. C., Huang T. J., and Liaw Y. C., A fast k-means clustering
algorithm using cluster center displacement, Pattern Recognition, Vol.
42, 2009, pp. 2551-2556.
154
[65] images.
Lavreau, J. (1991), De-haze Landsat Thematic Mapper
Photogrammetric Engineering and Remote Sensing. 57:1297-1302.
[66]
Leukert k., Transferability of knowledge-based classification rules,
ISPRS2004, Istanbul, 2004.
[67]
Liangpei Z., Xin H., Bo H., and Pingxiang L., A Pixel Shape Index
Coupled With Spectral Information for Classification of High Spatial
Resolution Remotely Sensed Imagery, In the proceedings of IEEE
transactions on Geosciences and remote sensing, VOL. 44, NO. 10,
OCTOBER 2006, pp. 2950 - 2961.
[68]
Liew A., Leung S.H., and Lau W.H., Segmentation of color lip images by
spatial fuzzy clustering, IEEE Transactions on Fuzzy Systems, 11(4),
2003, pp. 542–549.
[69]
Lior S., Human Perception-based Color Segmentation Using Fuzzy
Logic, IPCV, 2, 2006, pp. 496-502.
[70]
Long J., Shi Z., Tang W., Zhang C., Single Remote Sensing Image
Dehazing, IEEE Geoscience and Remote Sensing, 2013, pp. 59 – 63.
[71] Mallat, S., (1989), “Multiresolution approximations and wavelet
the American
orthonormal bases of L2(R)”, Transactions of
Mathematical Society, Vol.315, No.1.
[72] Manglesh K., Shweta S., Priya B., An efficient algorithm
for
Journal of Computer Science and Indian
ImageEnhancement,
Engineering (IJCSE), 2, 2005, pp. 118-123.
[73] Matinfar H.R., Sarmadian F., Alavi P. S.K., Heck R.J., Comparison of
object-oriented and pixel-based classification on Lansadsat7, Etm+
Spectral Bands (Case Study: Arid Region of Iran)”, American-Eurasian
J. Agric. & Environ, 2007, pp.448-456.
[74] Meshoul S., Batouche M., Ant colony system with extremal dynamics for
point matching and pose estimation, International Conference on Pattern
Recognition, 3, 2002, pp. 823–826.
[75] Mryka H. B., The GLCM Tutorial, 2007.
155
[76]
Naik S.K., Murthy C.A., Hue-preserving color image enhancement
without gamut problem, IEEE Trans. Image Process., 12, 2003, pp.
1591–1598.
[77]
Napoleon D., Ramaraj E., An Efficient Segmentation of Remote Sensing
Images For The Classification of Satellite Data Using K-Means
Clustering Algorithm, International Journal for Innovative Research in
Science & Technology| Volume 1 | Issue 6 | November 2014, pp. 314-
319.
[78]
Nedeljkovic, Image Classification Based On Fuzzy Logic, The
International Archives of the Photogrammetry, Remote Sensing and
Spatial Information Sciences, Vol. 34, Part XXX, 2007.
[79]
Neteler M. and Mitasova H., Open Source GIS: A GRASS GIS Approach,
3rd Edition, 2008, Springer, New York.
[80]
Nill N. B. and Bouzas B.., Objective image quality measure derived from
digital image power spectra, Optical Engineering, 1992, pp. 813-825.
[81]
Om P. V., Puneet K., Hanmandlu M., Sidharth C., High dynamic range
optimal fuzzy color image enhancement using Artificial Ant Colony
System, Applied Soft Computing, 12, 2011, pp. 394-404.
[82]
Ottermen, J., and Robinove, C. J. (1981), Effects of the atmosphere on
the detection of surface changes from Landsat Multispectral Scanner
data, International Journal of Remote Sensing. 2 (4): 351-360.
[83]
Pabitra M., Unsupervised Feautre Selection using Feautre Similarity, In
the proceedings of IEEE transactions on Geosciences and remote
sensing, vol. 44, NO. 10, October 2002, pp. 301 - 312.
[84]
Palanikumar S., Sasikumar M., J. Rajeesh, Entropy Optimized Palmprint
Enhancement Using Genetic Algorithm and Histogram Equalization,
International Journal of Genetic Engineering, 2, 2012, pp. 12-18.
[85]
Parvathi K. et al, Pyramidal Watershed Segmentation Algorithm For
High Resolution Remote Sensing Images Using Discrete Wavelet
Transforms, Discrete Dynamics in Nature and Society Volume 2009
(2009), Article ID 601638, 11 pages.
156
[86]
Pelleg D. and Moore A., Accelerating exact k-means algorithms with
geometric reasoning, in Proceedings of ACM SIGKDD International
Conference on Knowledge and Data Mining, 1999, pp. 277-281.
[87]
Ratika Pradhan, M. K. Ghose, A. Jeyaram, Land Cover Classification of
Remotely Sensed Satellite Data using Bayesian and Hybrid classifier,
International Journal of Computer Applications, 2010, pp. 1-4.
[88]
Rahimi S., Zargham M., Thakre. A.; and Chhillar D., A Parallel Fuzzy C-
Mean algorithm for Image Segmentation, Publications. Paper 26,
http://opensiuc.lib.siu.edu/cs_pubs/26, 2004, pp. 234-237.
[89]
Richter, R., A fast atmospheric correction algorithm applied to Landsat
TM images, International Journal of Remote Sensing, 1990, 11(1): 159-
166.
[90]
Richter R., Atmospheric correction of satellite data with haze removal
including a haze/clear transition region, Computers & Geosciences,
1996, 22(6): pp. 675-681.
[91]
Richter R., A spatially adaptive fast atmospheric correction algorithm,
International Journal of Remote Sensing, 1996, 17(6): pp. 1201-1214.
[92] Ridsdill Smith, T. A. and Dentith, M. C., (1999), “The wavelet transform
in aeromagnetic processing, Geophysics”, Vol 64, pp.1003–1013.
[93]
Roli F., Fumera G., Support Vector Machines for Remote-Sensing Image
Classification, Proceedings of SPIE Image and Signal Processing for
Remote Sensing VI, Vol. 4170, 2011, pp. 160-166.
[94]
Sarode M.K.V, Ladhake S.A., Deshmukh P.R., Fuzzy system for color
image enhancement, World Academy of Science, Engineering &
Technology, 48, 2008, pp. 311-316.
[95]
Shankar B. U. and Pal N., FFCM: An effective method for large data
sets, in Proceedings of the 3rd International Conference on Fuzzy, Logic,
Neural Nets, and Soft Computing, 1994, pp. 331-332.
[96]
Smriti S., Remotely Sensed LANDSAT Image Classification Using Neural
Network Approaches, International Journal of Engineering Research and
Applications (IJERA), Vol. 2, Issue 5, 2012, pp.43-46.
157
[97]
Spanner M.A., Pierce L.L., Peterson D.L., and S.W. Running, Remote
Sensing of temperate coniferous forest leaf area index: the influence of
canopy closure, understory vegetation and background reflectance,
International Jounal of Remote Sensing, 1990, 11 (6): pp. 1469-1476.
[98]
Subba R. K., Raju C. N., and Maddala L. B., Feature Extraction for
Image Classification and Analysis with Ant Colony Optimization Using
Fuzzy Logic Approach, Signal and image processing, An International
Journal (SIPIJ), 2(4), 2011, pp.137-143.
[99]
International
Sudhavani G., Srilakshmi M., Rao P. V., Comparison of Fuzzy Contrast
Journal of Computer
Enhancement Techniques,
Applications, Volume 95– No.22, June 2014, pp.26-31.
[100] Sun X.X., Zhang J.X. and Liu Z.J.,A Comparison of Object-Oriented and
Pixel-Based Classification Approachs Using Quickbird Imagery, ISPRS
Proceedings, XXXVI-2/W25, 2005.
[101] Swaminathan R., Dr.Manoj Wadhwa, Satellite Image enhancement using
Combination of Transform Techniques and Interpolation Methods,
International Journal Of Engineering And Computer Science ISSN:2319-
7242, Volume 3 Issue 4 April, 2014.
[102] Tang B., Sapiro G., Caselles V., Color image enhancement via
chromaticity diffusion, IEEE Trans. Image Process., 10, 2001, pp. 701–
707.
[103] Tanre D., Deroo C., Duhaut M., Morcrette J.J., Perbos J., and P.Y.
Deschamps, Description of a computer code to simulate the satellite
signal in the solar spectrum: the 5S code. International Journal of
Remote Sensing, 1990, 11 (2): pp. 659-668.
[104] Tao C.W., Taur J.S., Jeng J.T., and Wang W.Y., A Novel Fuzzy Ant
Colony System for Parameter Determination of Fuzzy Controllers,
International Journal of Fuzzy Systems, 11(4), 2009, pp.298-307.
[105] Tarel J.P. and Hautiere N., Fast visibility restoration from a single color
or gray level image, IEEE ICCV, 2009.
[106] Teillet P.M., A status overview of earth observation
158
calibration/validation for terrestrial applications. Canadian Journal of
Remote Sensing. 1997, pp. 291-298.
[107] Teillet P.M. and Fedosejevs G., On the dark target approach to
atmospheric correction of remotely sensed data, Canadian Journal of
Remote Sensing. 1995, pp. 374-387.
[108] Tian J., Yu W., Xie S., An ant colony optimization algorithm for image
edge detection, IEEE Congress on Evolutionary Computation, 9, 2008,
pp. 751–756.
[109] Tinku Acharya, Ajoy K. R., Image Processing: Principles and
Applications, John Wiley & Sons, Inc, 2005.
[110] TIZHOOSH H. R., FOCHEM M., Image Enhancement with Fuzzy
Histogram Hyperbolization, Proceedings of EUFIT’95, vol. 3, 1995, pp.
1695-1698.
[111] Ucan O.N., Seker, S., Albora, A.M. and Ozmen A., (2000), “Separation
of magnetic fields in geophysical studies using a 2-D multi-resolution
Wavelet analysis approach”, Journal of Bankan Geophysical Society,
Vol.3, pp. 53-58.
[112] Valliammal N.,Geethalakshmi S.N., Leaf Image Segmentation Based On
the Combination of Wavelet Transform and K Means Clustering,
International Journal of Advanced Research in Artificial Intelligence,
Vol. 1, No. 3, 2012, pp.37-43.
[113] Vecsey, L., (2002), Chaos in thermal convection and the wavelet analysis
of geophysics field, Ph. D. Thesis, Charles University, Prague, pp. 7-20.
[114] Vittorio M., Luca M. G., Fabio D. L., Ant Colony Optimization,
Optimization Techniques in Engineering. Springer-Verlag conference,
141,2004, pp. 101-117.
[115] Vincent R. K., An ERTS Multispectral scanner experiment for mapping
iron compounds, In proceedings of the Eighth International Symposium
on Remote Sensing of Environment, Ann Arbor, Michigan, 1973, pp.
1239-1247.
[116] Weibao Z., Neural network based remote sensing image classification in
159
urban area, IEEE, 2012, pp.1-6.
[117] Xin H., Liangpei Z., and Pingxiang L., Classification and Extraction of
spatial Features in Urban Areas Using High Resolution Multispectral
Imagery, In the proceedings of IEEE Geosciences and remote sensing
letters, VOL. 4, NO. 2, APRIL 2007, pp. 260 - 264.
[118] Yang M-S. and Tsai H-S., A Gaussian kernel based fuzzy c-means
algorithm with a spatial bias correction, Pattern Recognition Letters,
29(12), 2008, pp. 1713–1725.
[119] Yinghua Lu, Tinghuai Ma, Changhong Yin, Xiaoyu Xie, Wei Tian and
ShuiMing Zhong, Implementation of the Fuzzy C-Means Clustering
Algorithm in Meteorological Data, International Journal of Database
Theory and Application, Vol.6, No.6 (2013), pp.1-18.
[120] Yong Du, Bert Guindon and Josef Cihlar, Haze Detection and Removal
in High Resolution Satellite Image with Wavelet Analysis, IEEE
Transactions on Geoscience and Remote Sensing, 2002, vol. 40, issue 1,
pp. 210-217.
[121] Yu D., Ma L. H., Lu H.Q., Normalized SI correction for hue-preserving
image enhancement, International Conference on Machine
color
Learning and Cybernetics, 2007, pp. 1498–1503.
[122] Yu Q.et al, Dark Pixel Detection: A Novel Single Image Dehaze
Approach, IVCNZ, 2011.
[123] Zhenhua L., Yingjie H., Haidong Z., Wu J., Bo Li, and Hui Zhao,
Parallel K-Means Clustering of Remote Sensing Images Based on
MapReduce, Springer-Verlag Berlin Heidelberg 2010, pp. 162–170.
[124] Zhu Xifang, Wu Feng, An Improved Approach to Remove Cloud and
Mist from Remote Sensing Images Based on Mallat Algorithm,
International Symposium on Photoelectronic Detection and Imaging
2007, Beijing 2007, pp. 662510.1-662510.9.
[125] Zhuge Y., Cao Y., Miller R. W., GPU Accelerated Fuzzy Connected
Image Segmentation by using CUDA, In: Engineering in Medicine and
Biology Society, EMBC 2009, Annual International Conference of the
160
IEEE, 2009, pp. 6341-6344.
[126] http://www.grass.itc.it
[127]
http://stats.stackexchange.com/questions/62621/recall-and-precision-in-
classification
[128] http://www.onmyphd.com/?p=k-means.clustering.
[129] http://www.ungdunggis.edu.vn/
161
PHỤ LỤC – BIẾN ĐỔI WAVELET
Trong xử lý tín hiệu, phép biến đổi Fourier (FT, Fourier Transform) là một
công cụ toán học quan trọng vì nó là cầu nối cho việc biểu diễn tín hiệu giữa miền
không gian và miền tần số; việc biểu diễn tín hiệu trong miền tần số đôi khi có lợi
hơn là việc biểu diễn trong miền không gian. Hình 1a biểu diễn tín hiệu theo thời
gian, hình 1b biểu diễn phép biến đổi Fourier của tín hiệu trong miền tần số. Tuy
nhiên, phép biến đổi Fourier chỉ cung cấp thông tin có tính toàn cục và chỉ thích hợp
cho những tín hiệu tuần hoàn, không chứa các đột biến hoặc các thay đổi không dự
báo được. Trong hình 1b, phổ của f(t) cho thấy các thành phần tần số cấu thành tín
hiệu nhưng không cho biết các tần số này xuất hiện ở đâu. Để khắc phục khuyết
điểm này, Gabor, D., (1946) [41] đã áp dụng phép biến đổi Fourier cửa sổ (WFT,
Windowed Fourier Transform) cho từng đoạn nhỏ của tín hiệu (cửa sổ); phép biến
đổi này cho thấy mối liên hệ giữa không gian và tần số nhưng bị khống chế bởi
nguyên lý bất định Heisengber cho các thành phần tần số cao và tần số thấp trong
tín hiệu (Kaiser, G., 1994) [60]. Phép biến đổi wavelet là bước tiếp theo để khắc
phục hạn chế này.
Hình 1a: Tín hiệu f(t).
162
Hình 1b: Biến đổi Fourier của tín hiệu f(t).
Năm 1975, Morlet, J., phát triển phương pháp đa phân giải (multiresolution).
Trong đó, ông ta sử dụng một xung dao động, được hiểu là một “wavelet” (dịch
theo từ gốc của nó là một sóng nhỏ) cho thay đổi kích thước và so sánh với tín hiệu
ở từng đoạn riêng biệt. Kỹ thuật này bắt đầu với sóng nhỏ (wavelet) chứa các dao
động tần số khá thấp, sóng nhỏ này được so sánh với tín hiệu phân tích để có một
bức tranh toàn cục của tín hiệu ở độ phân giải thô. Sau đó sóng nhỏ được nén lại để
nâng cao dần tần số dao động. Quá trình này gọi là làm thay đổi tỉ lệ (scale) phân
tích; khi thực hiện tiếp bước so sánh, tín hiệu sẽ được nghiên cứu chi tiết ở các độ
phân giải cao hơn, giúp phát hiện các thành phần biến thiên nhanh còn ẩn bên trong
tín hiệu.
1. Phép biến đổi Wavelet liên tục
1.1. Phép biến đổi wavelet thuận
Gọi f(x) là tín hiệu 1-D, phép biến đổi wavelet liên tục của f(x) sử dụng hàm
wavelet được biểu diễn bởi:
(
∫ ( )
(75) ( ) ) √
trong đó:
- ( ) là hệ số biến đổi wavelet liên tục của f(x), với s là tỉ lệ (nghịch đảo
( ) là hàm liên hiệp phức của wavelet ( ) được gọi là hàm wavelet
của tần số) và b là dịch chuyển đặt trưng vị trí.
-
phân tích.
163
Phương trình (1) cho thấy, phép biến đổi wavelet là một ánh xạ chuyển từ hàm
một biến f(x) thành hàm W(s, b) phụ thuộc hai biến số là biến tỉ lệ s và biến dịch
√
chuyển b. Hệ số chuẩn hóa trong (75) đảm bảo cho sự chuẩn hóa sóng wavelet
với các tỉ lệ phân tích s khác nhau ‖ ( )‖ ‖ ‖.
Phép biến đổi wavelet có tính linh động cao so với phép biến đổi Fourier (sử
dụng duy nhất hàm mũ) vì không nhất thiết phải sử dụng một hàm wavelet cố định,
và có thể lựa chọn các hàm wavelet khác nhau trong họ hàm wavelet sao cho thích
hợp với bài toán (hình dạng của hàm wavelet phù hợp với tín hiệu cần phân tích) để
kết quả phân tích là tốt nhất. Hiện nay, người ta đã xây dựng được khoảng vài chục
các họ hàm wavelet khác nhau nhằm áp dụng cho nhiều mục đích phân tích đa
dạng. Hình 2 đồ thị của ba hàm wavelet là hàm wavelet Harr, hàm wavelet
Daubechies 5 và hàm wavelet Morlet.
Biểu thức (75) có thể viết lại dưới dạng tích trong (inner product) như sau:
(76) ( ) 〈 ( ) ( )( )〉
trong đó:
(77) ) ( )( ) ( √
Hình 2: Ba dạng hàm wavelet.
a) Wavelet Harr, b) Wavelet Daubechies 5, c) Wavelet Morlet.
1.2. Phép biến đổi wavelet nghịch
164
Tương tự như phép biến đổi Fourier, phép biến đổi wavelet liên tục có tính
thuận nghịch. Nếu phép biến đổi wavelet thuận có dạng (75) thì phép biến đổi
wavelet nghịch có dạng:
∫ ∫
( ) ) (78) ( ) (
trong đó: cg là hằng số phụ thuộc vào hàm wavelet được sử dụng. Công thức (78)
cho phép khôi phục lại tín hiệu nguyên thủy từ các hệ số biến đổi wavelet bằng
phép tính tích phân theo toàn bộ các tham số tỉ lệ s và dịch chuyển b. Trong (78),
hàm wavelet được sử dụng thay cho hàm liên hiệp phức của nó trong biểu thức
(75).
Trong thực tế, việc khôi phục chính xác tín hiệu gốc từ phép biến đổi wavelet
gặp khó khăn (không giống như việc khôi phục tín hiệu từ phép biến đổi Fourier).
Theo Vecsey, L., (2002) [113] việc khôi phục tín hiệu gốc từ phép biến đổi wavelet
sẽ cho kết quả chính xác khi phương trình sau đây được thỏa:
‖ ̂( )‖
‖ ‖
(79) } { ∫ ∫
trong đó: ̂( ) là biến đổi Fourier của hàm ( ).
2. Phép biến đổi Wavelet rời rạc
Cơ sở của phép biến đổi wavelet rời rạc (DWT, Discrete Wavelet Transform)
có từ năm 1976 khi Croiser, Esteban và Galand đưa ra kỹ thuật biến đổi tín hiệu
thời gian rời rạc; đến cuối năm 1976, Crochiere, Weber và Flanagan [30] đã dùng
phép biến đổi wavelet rời rạc để mã hóa tiếng nói, kỹ thuật này tương tự kỹ thuật
của Croiser và có tên là sự mã hoá băng con (subband coding). Năm 1983, Burt, P.
J. và Adelson, E.H., [21] phát triển phương pháp mã hoá băng con và đặt tên là mã
hóa hình tháp (pyramidal coding). Năm 1989, Mallat, S., [71] đưa ra kỹ thuật phân
tích đa phân giải (multiresolution analysis) trên cơ sở mã hóa hình tháp và đề xuất
các họ hàm wavelet trực giao để áp dụng trong xử lý tín hiệu số.
Trong phân tích tài liệu từ (và trọng lực), phép biến đổi wavelet rời rạc được
sử dụng trong việc lọc nhiễu tài liệu từ hàng không (Ridsdill – Smith, T.A. và
165
Dentith, M.C., (1999) [92]) và tách trường khu vực và trường địa phương từ trường
quan sát (Fedi, M., Quarta, T., (1998), [38], Ucan, O.N., và nnk., (2000) [111]). Ở
Việt Nam, Đặng Văn Liệt và nnk., (2002) [3], (2005) [1] đã sử dụng phép biến đổi
wavelet rời rạc để lọc nhiễu và tách trường khu vực và trường địa phương. Ngoài ra,
còn có nhiều nhóm nghiên cứu khác sử dụng phép biến đổi wavelet rời rạc trong
cáclĩnh vực khác như viễn thông, điện tử, y học…
2.1. Phép biến đổi wavelet rời rạc và phân tích đa phân giải
Ý tưởng của phân tích đa phân giải là sử dụng các kỹ thuật lọc số trong quá
trình phân tích. Trong đó, mỗi một tín hiệu được phân tích thành hai thành phần:
thành phần xấp xỉ A (Approximation) ‘tương ứng với thành phần tần số thấp’ và
thành phần chi tiết D (Detail) ‘tương ứng với thành phần tần số cao’, thông qua hai
bộ lọc thông thấp và thông cao như mô tả trong hình 1.10. Trong đó, bộ lọc thông
cao sử dụng hàm wavelet ψ(x) và bộ lọc thông thấp sử dụng hàm tỉ lệ (scaling
function) Φ(x). Mối quan hệ giữa hàm tỉ lệ và hàm wavelet đươc cho bởi:
(80) ( ) ∑ ( )
(81) ( ) ∑( ) ( )
Các phép lọc được tiến hành với nhiều tầng (level) khác nhau và để khối
lượng tính toán không tăng, khi qua mỗi bộ lọc, tín hiệu được lấy mẫu xuống 2.
Ứng với mỗi tầng, tín hiệu có độ phân giải khác nhau. Do đó, phép biến đổi wavelet
rời rạc được gọi là phân tích đa phân giải (MRA, multiresolution analysis).
166
Hình 2: Phân tích đa phân giải sử dụng biến đổi wavelet rời rạc.
Tại mỗi tầng lọc, biểu thức của phép lọc được cho bởi công thức:
( ) ∑ ( ) ( ) (82)
( ) ∑ ( ) ( ) (83)
Trong đó, S(n) là tín hiệu, h(n) là đáp ứng xung của các bộ lọc thông thấp
tương ứng với hàm tỉ lệ Φ(n) và g(n) là đáp ứng xung của các bộ lọc thông cao
tương ứng với hàm wavelet ψ(n). Hai bộ lọc này liên hệ nhau theo hệ thức:
(84) ( ) ( ) ( )
167
trong đó, N là số mẫu trong tín hiệu.
Tín hiệu S(n) có thể được tái tạo theo các bước ngược lại gọi là phép biến đổi
wavelet rời rạc nghịch (IDWT, inverse discrete wavelet transform) được cho bởi:
( ) ∑ ( ( ) ( )) ( ( ) (85)
( ))
trong đó, ( ) và ( ) lần lượt là tín hiệu ngõ ra sau khi đi qua các bộ lọc
thông cao và bộ lọc thông thấp đã đề cập ở trên. Để đảm bảo cho việc phục hồi tín
hiệu được chính xác như ban đầu, khi qua mỗi tầng lọc tái tạo, tín hiệu được tiến
hành lấy mẫu lên 2.
Lưu ý là không phải các hàm wavelet nào cũng tồn tại hàm tỉ lệ tương ứng xác
định từ biểu thức (80) và (81); nên khi thực hiện phép biến đổi wavelet rời rạc, phải
chọn lựa các hàm wavelet có hàm tỉ lệ tương ứng như hệ hàm wavelet Daubechies
trực chuẩn – họ hàm này đều có các hàm tỉ lệ tương ứng.
2.2. Phép biến đổi wavelet rời rạc hai chiều
Để xử lý các dữ liệu hai chiều, cần sử dụng các phép biến đổi wavelet hai
chiều (Ucan, O.N., (2000) [111]) . Trong phép biến đổi wavelet rời rạc hai chiều (2-
D), tín hiệu hai chiều S(x, y) được tách thành nhiều tín hiệu một chiều rồi lấy biến
đổi wavelet 1-D trên chúng. Kết quả tổng hợp là biến đổi wavelet 2-D của tín hiệu.
Hình 1.11 mô tả quá trình thực hiện biến đổi wavelet rời rạc hai chiều. Gọi x
và y là hai trục tọa độ của tín hiệu 2-D, L là phép lọc thông thấp, H là phép lọc
thông cao (tương tự trường hợp 1-D), phép biến đổi wavelet 2-D được tính cụ thể
như sau:
( )( ) ( ) ( )
(85)
( )( ) ( ) ( )
(87)
( )( ) ( ) ( )
(88)
( )( ) ( ) ( )
(89)
168
Hình 3: Phép biến đổi wavelet rời rạc 2-D.
169