TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ TRI THỨC (cid:87)(cid:9)(cid:88) NGUYỄN BÁ CÔNG NGUYỄN HỮU ĐỨC
THIẾT KẾ HỆ THỐNG TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG CẤP THẤP VÀ ĐẶC TRƯNG CẤP CAO LUẬN VĂN CỬ NHÂN TIN HỌC Tp. Hồ Chí Minh –Năm 2005
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ TRI THỨC (cid:87)(cid:9)(cid:88) NGUYỄN BÁ CÔNG -0112127 NGUYỄN HỮU ĐỨC -0112168
THIẾT KẾ HỆ THỐNG TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG CẤP THẤP VÀ ĐẶC TRƯNG CẤP CAO LUẬN VĂN CỬ NHÂN TIN HỌC Giảng viên hướng dẫn
Ths – Lý Quốc Ngọc
Tp. Hồ Chí Minh –Năm 2005
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Lời cảm ơn
Đầu tiên chúng em xin chân thành gửi lời cảm ơn đến Thầy Lý Quốc Ngọc,
người đã tận tình hướng dẫn, động viên và giúp đỡ chúng em trong suốt thời gian
qua. Nếu không có lời chỉ dẫn, những tài liệu, những lời động viên khích lệ của
Thầy thì luận văn này khó lòng hòan thiện được. Một lần nữa chúng em xin tỏ
lòng biết ơn Thầy.
Cũng xin gửi lời cảm ơn đến gia đình, bạn bè và những ngừơi thân đã ủng
hộ động viên tinh thần chúng em để luận văn được hòan thành.
Chúng em cũng xin chân thành cảm ơn các thầy cô trong khoa Công nghệ
thông tin đã tận tình chỉ bảo và giúp đỡ chúng em trong suốt thời gian chúng em
học đại học và trong suốt quá trình chúng em làm luận văn.
Tp. Hồ Chí Minh, tháng 7 năm 2005
Nguyễn Bá Công – Nguyễn Hữu Đức
i
Nguyễn Bá Công – Nguyễn Hữu Đức
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Lời mở đầu
Cùng với sự mở rộng của multimedia, với khối lượng hình ảnh và phim lưu
trữ ngày càng lớn, cùng với sự phát triển vượt bậc của các thiết bị Điện Tử, Tin
Học và Viễn Thông đã thu hút ngày càng nhiều những chuyên gia đi vào nghiên
cứu những công cụ cung cấp cho việc lấy thông tin dữ liệu ảnh từ nội dung của
chúng.
Hiện nay trên thế giới việc truy tìm ảnh đã bước sang thời kỳ mới, thời kỳ
truy tìm ảnh dựa vào nội dung .Việc truy tìm dữ liệu hình ảnh dựa vào nội dung
ảnh ngày càng phát triển mạnh mẽ, nó khắc phục khuyết điểm của việc truy tìm
ảnh dựa vào văn bản kí tự. Dữ liệu đầu vào được mô phỏng gần gũi với con người
hơn, kết quả ảnh trả về mang ngữ nghĩa gần đúng với ảnh truy vấn hơn.
Nằm trong xu hướng đó, trong luận văn này chúng em trình bày một mô
hình truy tìm thông tin hình ảnh dựa vào nội dung thông qua đặc trưng cấp thấp và
đặc trưng cấp cao của ảnh. Nó có thể được sử dụng bởi các tổ chức sở hữu tư liệu
Nguyễn Bá Công – Nguyễn Hữu Đức
ii
ảnh và video, thư viện số, ảnh vệ tinh, ảnh y học, giáo dục từ xa,…
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
Tp. Hồ Chí Minh, ngày tháng 07 năm 2005
Nguyễn Bá Công – Nguyễn Hữu Đức
iii
ThS.Lý Quốc Ngọc
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
....................................................................................................................................
Nguyễn Bá Công – Nguyễn Hữu Đức
iv
Tp. Hồ Chí Minh, ngày tháng 07 năm 2005
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Mục lục
Nguyễn Bá Công – Nguyễn Hữu Đức
v
Lời cảm ơn ................................................................................................................ i Lời mở đầu ............................................................................................................... ii NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN.................................................... iii NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN ....................................................... iv Mục lục .................................................................................................................... v Mục lục các hình ..................................................................................................... ix Thuật ngữ chuyên ngành....................................................................................... xiv Chương 1 Tổng quan ............................................................................................... 1 1.1. Hướng truy tìm ảnh dựa vào nội dung.......................................................... 2 1.2. Hệ thống tìm kiếm ảnh thế hệ đầu tiên (dựa vào văn bản) ........................... 3 1.3. Hệ thống tìm kiếm thông tin trực quan thế hệ mới....................................... 5 1.3.1 Các hệ thống tìm kiếm ảnh tĩnh .............................................................. 5 1.3.2 Các hệ thống tìm kiếm phim ảnh (video) ............................................... 6 1.3.3 Các hệ thống tìm kiếm ảnh 3 chiều và video.......................................... 6 1.3.4 Các hệ thống tìm kiếm trên Internet ....................................................... 6 1.4. Xu hướng phát triển từ đặc trưng cấp thấp đến đặc trưng cấp cao và tiến dần đến ngữ nghĩa....................................................................................................... 8 1.5. Một số hệ thống truy tìm ảnh dựa vào nội dung hiện nay .......................... 10 1.6. Sự hình thành “Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao” .................................................................................................... 11 1.7. Hướng tiếp cận của bài toán........................................................................ 13 1.7.1 Xây dựng cơ sở dữ liệu ......................................................................... 13 1.7.2 Xây dựng hệ thống tìm kiếm ................................................................ 14 1.7.2.1 Tìm kiếm dựa vào sự phân bố mang tính tòan cục ........................ 14 1.7.2.1.1 Đặc trưng lược đồ màu ........................................................... 14 1.7.2.1.2 Đặc trưng vector liên kết màu (Color Coherence Vector)...... 14 1.7.2.1.3 Đặc trưng tự tương quan màu (AutoCorrelogram)................. 15 1.7.2.1.4 Đặc trưng lược đồ hệ số góc (Edge Direction Histogram) ..... 16 1.7.2.1.5 Đặc trưng Vector liên kết hệ số góc (Edge Direction Coherence Vector) ................................................................................................... 16 1.7.2.2 Tìm kiếm dựa vào sự phân bố mang tính cục bộ........................... 17 1.7.2.3 Tìm kiếm theo vùng, đối tượng ..................................................... 18 1.7.2.4 Tìm kiếm theo ngữ nghĩa ............................................................... 20 Chương 2 CÁC KHÁI NIỆM CƠ BẢN ................................................................ 21 2.1. Màu sắc ....................................................................................................... 22 2.1.1 Khái niệm về màu sắc ........................................................................... 22 2.1.2 Một số đặc tính vật lý đặc biệt về màu sắc ........................................... 22 2.1.3 Các hệ màu thông dụng......................................................................... 24 2.1.3.1 Hệ màu chuẩn RGB: ...................................................................... 24 2.1.3.2 Hệ màu CMY................................................................................. 25 2.1.3.3 Hệ màu YIQ ................................................................................... 26
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Nguyễn Bá Công – Nguyễn Hữu Đức
vi
2.1.3.4 Hệ màu L*a*b:............................................................................... 27 2.1.3.5 Hệ màu HSI: Hue-Saturation-Intensity.......................................... 27 2.1.4 Các đặc trưng về màu sắc ..................................................................... 30 2.1.4.1 Lược đồ màu (Histogram).............................................................. 30 2.1.4.2 Vector liên kết màu (Color Coherence Vector) ............................. 32 2.1.4.3 Đặc trưng tự tương quan màu (AutoCorrelogram) ........................ 34 2.2. Vân (textture) .............................................................................................. 38 2.2.1 Khái niệm.............................................................................................. 38 2.2.2 Một số loại vân tiêu biểu....................................................................... 39 2.2.3 Ma trận đồng hiện (Co-occurrence Matrix) .......................................... 39 2.2.4 Phép biến đổi Wavelet .......................................................................... 41 2.3. Hình dáng.................................................................................................... 43 2.3.1 Khái niệm về biên cạnh......................................................................... 43 2.3.2 Các phương pháp phát hiện biên........................................................... 44 2.3.2.1 Phát hiện biên trực tiếp .................................................................. 44 2.3.2.2 Phương pháp phát hiện biên gián tiếp............................................ 48 2.3.3 Các đặc trưng về biên cạnh ................................................................... 49 2.3.3.1 Lược đồ hệ số góc (Edge Direction Histogram) ............................ 49 2.3.3.2 Vector liên kết hệ số góc (Edge Direction Coherence Vector): .... 51 2.3.4 Vùng và các đặc trưng về vùng............................................................. 52 2.3.4.1 Đặc trưng màu................................................................................ 53 2.3.4.2 Đặc trưng vân................................................................................. 53 2.3.4.3 Đặc trưng hình dáng....................................................................... 53 2.4. Độ đo........................................................................................................... 55 2.4.1 Khái niệm.............................................................................................. 55 2.4.2 Một số độ đo thông dụng ...................................................................... 56 2.4.2.1 Khoảng cách Minkowsky: ............................................................. 56 2.4.2.2 Độ đo khoảng cách min-max: ........................................................ 56 2.4.2.3 Khoảng cách Euclide L2:............................................................... 56 2.4.2.4 Khoảng cách city-block L1:........................................................... 56 2.4.3 Các độ đo được sử dụng trong bài tóan ................................................ 57 2.4.3.1 Độ đo tương tự giữa 2 bin màu trong hệ màu HSI ........................ 57 2.4.3.2 Độ đo dùng cho lược đồ màu......................................................... 57 2.4.3.3 Độ đo dùng cho đặc trưng liên kết màu (Color Coherence Vector) .................................................................................................................... 61 2.4.3.4 Độ đo dùng cho đặc trưng tự tương quan màu(AutoCorrelogram) 61 2.4.3.5 Độ đo dùng cho đặc trưng lược đồ hệ số góc (Edge Direction Histogram) ................................................................................................. 62 2.4.3.6 Độ đo dùng cho đặc trưng liên kết hệ số góc (Edge Direction Coherence Vector) ..................................................................................... 62 Chương 3 TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG CẤP THẤP ................. 64 3.1. Các đặc trưng được sử dụng để truy tìm ảnh .............................................. 65 3.1.1 Đặc trưng về màu sắc............................................................................ 65
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
3.1.1.1 Lược đồ màu (histogram) .............................................................. 65 3.1.1.2 Vector liên kết màu (Color Coherence Vector) ............................. 65 3.1.1.3 Đặc trưng tự tương quan màu (AutoCorrelogram) ........................ 66 3.1.2 Đặc trưng về hình dáng......................................................................... 67 3.1.2.1 Lược đồ hệ số góc (Edge Direction Histogram) ............................ 67 3.1.2.2 Vector liên kết hệ số góc (Edge Direction Coherence Vector)...... 67
Nguyễn Bá Công – Nguyễn Hữu Đức
vii
3.2. Giải thuật phân lớp phân cấp (Hierarchical Agglomerative Clustering Algorithm- HAC) và áp dụng giải thuật trong phân lớp ảnh theo các đặc trưng của ảnh ............................................................................................................... 68 3.2.1 Tổng quan về giải thuật......................................................................... 68 3.2.2 Giải thuật............................................................................................... 68 3.2.3 Áp dụng giải thuật phân lớp phân cấp vào việc xây dựng cây phân cấp theo các đặc trưng của ảnh............................................................................. 70 3.3. Tạo chỉ mục truy tìm ảnh ............................................................................ 78 3.4. Các chiến lược truy tìm ảnh ........................................................................ 79 3.4.1 Truy tìm ảnh xét đến tính phân bố toàn cục ......................................... 79 3.4.1.1 Tìm kiếm theo màu sắc .................................................................. 79 3.4.1.1.1 Lược đồ màu ........................................................................... 79 3.4.1.1.2 Vector liên kết màu................................................................. 80 3.4.1.1.3 Đặc trưng tương quan màu (Correlogram): ............................ 82 3.4.1.2 Tìm kiếm theo hình dáng ............................................................... 82 3.4.1.2.1 Lược đồ hệ số góc ................................................................... 83 3.4.1.2.2 Vector liên kết hệ số góc......................................................... 83 3.4.1.3 Tìm kiếm kết hợp........................................................................... 84 3.4.1.3.1 Tìm kiếm kết hợp các đặc trưng với nhau dùng toán tử BOOL ................................................................................................................ 85 3.4.1.3.2 Tìm kiếm kết hợp các đặc trưng với nhau dùng trọng số ....... 86 3.4.2 Truy tìm ảnh xét đến tính phân bố cục bộ (yếu tố không gian)............ 87 3.4.2.1 Tìm kiếm xét đến tính cục bộ với việc chia lưới tìm kiếm............ 87 3.4.2.2 Tìm kiếm xét đến tính cục bộ với việc vẽ...................................... 90 Chương 4 TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG CẤP CAO ................... 93 4.1. Bài toán phân đoạn ảnh............................................................................... 94 4.1.1 Chọn đặc trưng để phân đoạn ảnh......................................................... 94 4.1.2 Phân đoạn ảnh ....................................................................................... 96 4.1.3 Các ví dụ về bài toán phân đoạn ảnh .................................................... 98 4.2. Vùng và đặc trưng vùng.............................................................................. 99 4.3. Áp dụng giải thuật phân lớp phân cấp vào bài toán phân lớp vùng.......... 101 4.4. Tạo chỉ mục tìm kiếm ............................................................................... 105 4.5. Các chiến lược truy tìm theo đặc trưng cấp cao ....................................... 105 4.5.1 Giai đoạn nhập dữ liệu ........................................................................ 106 4.5.2 Giai đoạn truy tìm ............................................................................... 110 4.5.3 Giai đoạn sắp hạng (RANKING)........................................................ 110 Chương 5 TRUY TÌM ẢNH DỰA VÀO NGỮ NGHĨA .................................... 112
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Nguyễn Bá Công – Nguyễn Hữu Đức
viii
Chương 6 CÀI ĐẶT VÀ THỬ NGHIỆM ........................................................... 117 6.1. Cài đặt ....................................................................................................... 118 6.1.1 Chương trình ....................................................................................... 118 6.1.2 Các đặc trưng sử dụng cho chương trình ............................................ 118 6.1.3 Cơ sở dữ liệu ....................................................................................... 119 6.1.3.1 Cơ sở dữ liệu truy tìm theo đặc trưng cấp thấp............................ 119 6.1.3.2 Cơ sở dữ liệu truy tìm theo đặc trưng cấp cao............................. 119 6.1.4 Chức năng truy tìm ảnh....................................................................... 119 6.2. Thử nghiệm ............................................................................................... 120 6.2.1 Tìm kiếm xét đến tính toàn cục........................................................... 120 6.2.1.1 Tìm kiếm theo lược đồ màu......................................................... 120 6.2.1.2 Tìm kiếm theo lược đồ hệ số góc................................................. 121 6.2.1.3 Tìm kiếm theo vector liên kết màu .............................................. 123 6.2.1.4 Tìm kiếm theo vector liên kết hệ số góc...................................... 124 6.2.1.5 Tìm kiếm theo AutoCorrelogram................................................. 125 6.2.1.6 Tìm kiếm ảnh bằng việc kết hợp các đặc trưng với nhau theo tóan tử AND..................................................................................................... 126 6.2.1.7 Tìm kiếm ảnh bằng cách kết hợp các đặc trưng dùng trọng số ... 128 6.2.2 Tìm kiếm dựa trên tính phân bố cục bộ .............................................. 129 6.2.2.1 Tìm kiếm bằng cách chia lưới...................................................... 129 6.2.2.2 Tìm kiếm bằng cách vẽ vùng....................................................... 133 6.2.3 Tìm kiếm dựa theo vùng, đối tượng của ảnh có sẵn ........................... 135 6.2.4 Tìm kiếm dựa theo vùng, đối tượng khi mà người dùng chưa có ý niệm rõ ràng về tấm ảnh........................................................................................ 141 6.2.5 Tìm kiếm dựa vào ngữ nghĩa .............................................................. 144 6.3. Kết quả thực nghiệm của hệ thống ........................................................... 145 6.3.1 Thực nghiệm việc tìm kiếm theo các đặc trưng cấp thấp ................... 146 6.3.2 Thực nghiệm việc tìm kiếm theo đặc trưng cấp cao........................... 147 Chương 7 TỔNG KẾT VÀ HƯỚNG PHÁT TRIỂN .......................................... 148 7.1. Tổng kết .................................................................................................... 149 7.2. Hướng phát triển ....................................................................................... 149 7.3. Kết luận ..................................................................................................... 149 TÀI LIỆU THAM KHẢO ................................................................................... 151
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Mục lục các hình
Nguyễn Bá Công – Nguyễn Hữu Đức
ix
Hình 1: Mô hình của hệ thống tìm kiếm thế hệ đầu tiên ......................................... 4 Hình 2: Mô hình của hệ thống tìm kiếm thế hệ mới ................................................ 8 Hình 3: Hình gốc 1................................................................................................... 9 Hình 4: Ảnh giống lược đồ màu với ảnh gốc........................................................... 9 Hình 5: Minh họa các vùng của ảnh ........................................................................ 9 Hình 6: Minh họa các vùng của ảnh có gán ngữ nghĩa.......................................... 10 Hình 7:Mô hình “Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao”.................................................................................................................. 12 Hình 8: minh họa 2 ảnh có lược đồ màu giống nhau 89%..................................... 14 Hình 9: minh họa 2 ảnh có vector liên kết màu giống nhau 75%.......................... 15 Hình 10:minh họa 2 ảnh có đặc trưng Correlogram giống nhau 75% ................... 15 Hình 11: minh họa 2 ảnh có lược đồ hệ số góc giống nhau 88% .......................... 16 Hình 12: minh họa 2 ảnh có Vector liên kết hệ số góc giống nhau 78%............... 17 Hình 13: Ảnh minh họa chia lưới 1x3 ................................................................... 17 Hình 14: Ảnh minh họa vẽ vùng tìm kiếm ............................................................ 18 Hình 15: Ảnh minh họa tìm kiếm theo vùng ......................................................... 19 Hình 16: Minh họa tìm kiếm theo vùng khi người dùng có một vài ý niệm về ảnh truy vấn .................................................................................................................. 19 Hình 17: Minh họa việc áp dụng mô hình học vào các vùng của ảnh để tìm kiếm theo ngữ nghĩa........................................................................................................ 20 Hình 18: Hệ màu RGB........................................................................................... 25 Hình 19: Hệ màu CMY.......................................................................................... 26 Hình 20:Hệ màu HSI.............................................................................................. 28 Hình 21: Không gian màu HSI .............................................................................. 29 Hình 22: Minh họa sự thay đổi cường độ sáng trong hệ màu HSI ........................ 29 Hình 23: Ảnh trong hệ màu RGB .......................................................................... 31 Hình 24: Ảnh trong hệ màu HSI ............................................................................ 31 Hình 25: Lược đồ màu của ảnh sau khi lượng hoá ................................................ 32 Hình 26: Ảnh trong hệ màu RGB .......................................................................... 33 Hình 27: Ảnh trong hệ màu HSI ............................................................................ 33 Hình 28: Màu đỏ thể hiện liên kết màu trong ảnh ................................................. 33 Hình 29: Lược đồ vector liên kết màu của ảnh sau khi được lượng hoá ............... 34 Hình 30: Các ví dụ về vân...................................................................................... 39 Hình 31: Decompostion để tạo ra các frequency bands bởi biến đổi Wavelet ...... 42 Hình 32: Đường bao của ảnh ................................................................................. 43 Hình 33: Gradient của ảnh theo hướng θ ............................................................... 45 Hình 34: Mô hình 8 hướng..................................................................................... 45 Hình 35: Ảnh minh họa mảnh biên........................................................................ 47 Hình 36: Ảnh sau khi dùng phương pháp Gradient phát hiện biên ....................... 47 Hình 37: Ảnh sau khi được làm mảnh biên ........................................................... 48 Hình 38: Minh họa nguyên lý Bellman.................................................................. 49
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Nguyễn Bá Công – Nguyễn Hữu Đức
x
Hình 39: Ảnh minh họa lược đồ hệ số góc ............................................................ 50 Hình 40: Đường biên của ảnh ................................................................................ 50 Hình 41: Lược đồ hệ số góc của ảnh...................................................................... 50 Hình 42: Ảnh minh họa vector liên kết hệ số góc.................................................. 52 Hình 43: Ảnh minh họa sự liên kết giữa các biên cạnh ......................................... 52 Hình 44: Lược đồ vector liên kết hệ số góc của ảnh.............................................. 52 Hình 45: Minh họa vùng của ảnh........................................................................... 55 Hình 46: minh họa 2 lược đồ màu giống nhau ...................................................... 58 Hình 47: Lược đồ màu thể hiện phần giao của 2 lược đồ màu trên....................... 59 Hình 48: Hình minh họa độ đo Euclide ................................................................. 59 Hình 49: Lược đồ màu thể hiện độ khác nhau giữa 2 lược đồ màu trên ............... 60 Hình 50:Cây phân cấp cho việc phân lớp cơ sở dữ liệu ........................................ 71 Hình 51: Cơ sở dữ liệu minh họa thuật toán HAC vào việc phân lớp ảnh theo đặc trưng lược đồ màu .................................................................................................. 72 Hình 52:Cây phân cấp theo lược đồ màu............................................................... 73 Hình 53: Nhóm các ảnh có cùng đặc trưng màu.................................................... 73 Hình 54:Cơ sở dữ liệu phân lớp ảnh theo đặc trưng liên kết màu ......................... 73 Hình 55: Cây phân cấp theo đặc trưng liên kết màu.............................................. 74 Hình 56: Nhóm các ảnh có cùng đặc trưng liên kết màu....................................... 74 Hình 57: Cơ sở dữ liệu minh họa thuật toán HAC đồi với đặc trưng Correlogram ................................................................................................................................ 75 Hình 58: Cây phân cấp theo đặc trưng Correlogram ............................................ 75 Hình 59: Nhóm các ảnh có cùng đặc trưng Correlogram ...................................... 75 Hình 60: Cơ sở dữ liệu minh họa thuật toán HAC đối với đặc trưng lược đồ hệ số góc .......................................................................................................................... 76 Hình 61: Cây phân cấp theo đặc trưng lược đồ hệ số góc ..................................... 76 Hình 62: Nhóm các ảnh có cùng đặc trưng lược đồ hệ số góc .............................. 76 Hình 63: Cơ sở dữ liệu ảnh minh họa thuật toán HAC để phân lớp theo đặc trưng vector liên kết hệ số góc......................................................................................... 77 Hình 64: Cây phân cấp theo đặc trưng liên kết hệ số góc...................................... 77 Hình 65: Nhóm các ảnh có cùng đặc trưng liên kết hệ số góc............................... 77 Hình 66: Cây phân cấp ban đầu ............................................................................. 78 Hình 67: Cây chỉ mục ............................................................................................ 79 Hình 68: Minh họa 2 ảnh có lược đồ màu giống nhau .......................................... 80 Hình 69: Minh họa 2 ảnh giống nhau về lược đồ màu nhưng khác nhau về ngữ nghĩa....................................................................................................................... 80 Hình 70: Minh họa 2 ảnh có lược đồ màu giống nhau nhưng khác nhau về ngữ nghĩa....................................................................................................................... 81 Hình 71: Hình minh họa vector liên kết màu khắc phục tính không duy nhất của lược đồ màu............................................................................................................ 81 Hình 72: Hình minh họa 2 ảnh có đặc trưng tương quan màu giống nhau 81.2% 82 Hình 73: minh hoạ 2 ảnh có lược đồ hệ số góc giống nhau................................... 83 Hình 74:minh họa 2 ảnh có lược đồ hệ số góc giống nhau 80% ........................... 84
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Nguyễn Bá Công – Nguyễn Hữu Đức
xi
Hình 75: Hình minh họa 2 ảnh có vector liên kết hệ số góc khác nhau ................ 84 Hình 76: Hìmh minh họa 2 ảnh giống nhau về lược đồ màu và lược đồ hệ số góc85 Hình 77:Hình minh họa tìm kiếm chia lưới-1........................................................ 87 Hình 78: Minh họa ảnh được chia lưới 3x3 để tìm kiếm-1 ................................... 88 Hình 79: Hình minh họa tìm kiếm chia lưới-2....................................................... 88 Hình 80: Minh hoạ chia lưới 1x2 để tìm kiếm-2 ................................................... 89 Hình 81: Ảnh minh họa tìm kiếm chia lưới-3........................................................ 89 Hình 82: Minh hoạc chia lưới 1x3 cho việc tìm kiếm trên ảnh-3.......................... 89 Hình 83: Ảnh minh họa tìm kiếm vẽ ..................................................................... 90 Hình 84: Chia lưới 3x3 trên ảnh tìm kiếm ............................................................ 90 Hình 85: Minh họa vẽ hình trên ảnh tìm kiếm...................................................... 91 Hình 86: Hỉnh minh họa vẽ trên ảnh tìm kiếm ...................................................... 91 Hình 87: Hình minh hoa vẽ tìm kiếm .................................................................... 92 Hình 88: Hình minh họa vẽ tìm kiếm .................................................................... 92 Hình 89: Hình minh họa cây phân cấp................................................................... 97 Hình 90: Minh họa áp dụng giải thuật HAC vào phân đoạn ảnh-1 ....................... 98 Hình 91: Minh họa áp dụng giải thuật HAC vào phân đoạn ảnh-2 ....................... 99 Hình 92: Minh hoạ dùng thuật toán HAC phân đoạn ảnh-3.................................. 99 Hình 93: Minh họa vùng của ảnh......................................................................... 100 Hình 94: Cơ sở dữ liệu dùng để phân vùng ảnh .................................................. 102 Hình 95: Các vùng của tập ảnh được tách ra bằng giải thuật HAC..................... 103 Hình 96: Cây phân cấp của tập vùng trên ............................................................ 103 Hình 97: Nhóm các vùng giống nhau .................................................................. 103 Hình 98: Cơ sở dữ liệu ảnh phân vùng ................................................................ 104 Hình 99: Các vùng của tập dữ liệu ảnh sau khi được tách bằng giải thuật HAC 104 Hình 100: Cây phân cấp của tập vùng trên .......................................................... 104 Hình 101: Nhóm các vùng giống nhau ................................................................ 105 Hình 102: ảnh minh họa tìm kiếm theo vùng ...................................................... 107 Hình 103: Hình minh họa tìm kiếm theo vùng, đối tượng................................... 108 Hình 104: Câu truy vấn “Bầu trời” AND “ Cỏ” AND “ Hoa màu trắng” ........... 109 Hình 105: Câu truy vấn “Hoa màu vàng” AND NOT “ Lá màu xanh” .............. 109 Hình 106: Các vùng đã được gán nhãn................................................................ 114 Hình 107: Kết quả câu truy vấn “Hoa màu tím”.................................................. 114 Hình 108: Kết quả câu truy vấn “ Hoa mai”........................................................ 115 Hình 109: Kết quả câu truy vấn “ Cỏ” và “ Nhà”............................................... 115 hình 110: Kết quả câu truy vấn “ Sư tử” AND “ Bầu trời” ................................. 116 Hình 111: Mô hình hệ thống................................................................................ 118 Hình 112: Ảnh truy vấn theo lược đồ màu .......................................................... 120 Hình 113: Tập kết quả tìm kiếm theo lược đồ màu ............................................. 121 Hình 114: Kết quả tìm kiếm theo lược đồ màu với độ giống nhau 70% ............. 121 Hình 115:Ảnh truy vấn theo lược đồ hệ số góc ................................................... 121 Hình 116: Tập kết quả tìm kiếm theo lược đồ hệ số góc ..................................... 122 Hình 117: Tập kết quả tìm theo lược đồ hệ số góc với độ giống nhau 89% ....... 122
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Nguyễn Bá Công – Nguyễn Hữu Đức
xii
Hình 118: Ảnh truy tìm theo đặc trưng vector liên kết màu................................ 123 Hình 119:Tập kết quả tìm theo đặc trưng vector liên kết màu ............................ 123 Hình 120: Kết quả tìm kiếm với độ giống nhau 70% .......................................... 123 Hình 121: Ảnh truy vấn theo đặc trưng vector liên kết hệ số góc ....................... 124 Hình 122: Tập kết quả tìm theo đặc trưng liên kết hệ số góc .............................. 124 Hình 123: Tập kết quả tìm theo đặc trưng liên kết hệ số góc với độ giống nhau 84% ...................................................................................................................... 125 Hình 124: Ảnh truy vấn ....................................................................................... 125 Hình 125: Tập kết quả thu được .......................................................................... 125 Hình 126: Tập kết quả tìm được với độ giống nhau 70%.................................... 126 Hình 127: Ảnh truy vấn ....................................................................................... 126 Hình 128: Tập kết quả tìm được .......................................................................... 126 Hình 129: Tập kết quả tìm được .......................................................................... 127 Hình 130: Tập kết quả tìm được .......................................................................... 127 Hình 131: Ảnh truy vấn ....................................................................................... 127 Hình 132: Tập kết quả tìm được .......................................................................... 128 Hình 133: Ảnh truy vấn ....................................................................................... 128 Hình 134: Tập kết quả tìm được .......................................................................... 128 Hình 135: Ảnh truy vấn ....................................................................................... 129 Hình 136: Tập kết quả tìm được .......................................................................... 129 Hình 137: Ảnh truy vấn tìm kiếm dựa trên tính phân bố cục bộ ......................... 129 Hình 138: Ảnh minh họa chia lưới và vùng được chọn....................................... 130 Hình 139: Tập ảnh kết quả tìm được ................................................................... 130 Hình 140: Ảnh truy vấn ....................................................................................... 130 Hình 141: Ảnh minh hoạ cá vùng đựơc chọ ........................................................ 131 Hình 142: Tập ảnh tìm được ................................................................................ 131 Hình 143: Ảnh truy vấn ....................................................................................... 131 Hình 144: Ảnh sau khi chia lưới .......................................................................... 132 Hình 145: Tập ảnh kết quả tìm được ................................................................... 132 Hình 146: Tập ảnh kết quả tìm được ................................................................... 133 Hình 147: Ảnh truy vấn ...................................................................................... 133 Hình 148: Minh họa vẽ tìm kiếm......................................................................... 134 Hình 149: Tập ảnh tìm được ................................................................................ 134 Hình 150: Tập ảnh tìm được ................................................................................ 135 Hình 151: Ảnh truy vấn theo vùng ...................................................................... 135 Hình 152: Các vùng của ảnh sau khi phân đoạn.................................................. 135 Hình 153: Tập kết quả tìm theo vùng hoa màu tím ............................................. 136 Hình 154: Các vùng của ảnh truy vấn.................................................................. 137 Hình 155: Vùng tìm kiếm .................................................................................... 137 Hình 156: Tập kết quả tìm được theo vùng sư tử ............................................... 138 Hình 157: Minh họa tìm kiếm theo toán tử BOOL.............................................. 138 Hình 158: Tập kết quả thu được .......................................................................... 139 Hình 159: Ảnh sau khi phân đoạn........................................................................ 139
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Nguyễn Bá Công – Nguyễn Hữu Đức
xiii
Hình 160: Minh họa câu truy vấn ........................................................................ 140 Hình 161: Kết quả tìm được................................................................................. 140 Hình 162: Câu truy vấn........................................................................................ 141 Hình 163: Kết quả thực hiện câu truy vấn trên.................................................... 141 Hình 164: Hình minh họa tìm kiếm theo vùng .................................................... 142 Hình 165: Kết quả tìm được................................................................................. 142 Hình 166: Minh họa câu truy vấn theo vùng ....................................................... 143 Hình 167: Tập Kết quả tìm được ......................................................................... 143 Hình 168:Tập kết quả tìm kiếm với từ khoá” hổ con”......................................... 144 Hình 169: Ảnh minh hoạ tìm kiếm theo ngữ nghĩa, từ khoá “Chúa sơn lâm” .... 145 Hình 170: Kết quả tìm kiếm với từ khoá “ Chúa sơn lâm” với độ giống nhau 64% .............................................................................................................................. 145
Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao
Thuật ngữ chuyên ngành
Color coherence vector: vectơ liên kết màu
Edge direction coherence vector: vectơ liên kết hệ số góc
Edge direction histogram: lược đồ hệ số góc
Hierarchical Agglomerative Clustering Algorithm (HAC): thuật toán phân lớp
phân cấp
Histogram: lược đồ màu
Nguyễn Bá Công – Nguyễn Hữu Đức
xiv
Texture: vân
Chương 1: Tổng quan
Chương 1 Tổng quan
Nguyễn Bá Công – Nguyễn Hữu Đức
1
Chương 1: Tổng quan
1.1. Hướng truy tìm ảnh dựa vào nội dung
Truy tìm ảnh dựa vào nội dung là tìm kiếm thông tin trực quan. Truy tìm
thông tin trực quan là chủ đề nghiên cứu mới trong lĩnh vực công nghệ thông tin.
Tương tác với nội dung trực quan là cách thiết yếu nhất để truy tìm thông tin trực
quan. Các yếu tố trực quan như màu sắc, vân, hình dáng đối tượng và các yếu tố
không gian trực tiếp liên quan đến khía cạnh của cảm nhận nội dung ảnh, cùng với
các khái niệm ở mức cao như ý nghĩa đối tượng, khung cảnh trong ảnh, được dùng
như là manh mối cho tìm kiếm hình ảnh với nội dung tương tự từ cơ sở dữ liệu.
Truy tìm ảnh dựa vào nội dung đòi hỏi phải có sự đóng góp từ các lĩnh vực
nghiên cứu khác là rất lớn và đặt ra nhiều thử thách trong nghiên cứu đối với các
nhà khoa học và kỹ sư. Các lĩnh vực nghiên cứu khác nhau, được phát triển một
các độc lập, đóng góp rất lớn cho chủ đề nghiên cứu mới mẽ này. Truy tìm thông
tin, mô hình hóa và thể hiện dữ liệu trực quan, phân tích và xử lý phim/ảnh, nhận
dạng và thị giác máy tính (computer vision), tổ chức cơ sở dữ liệu đa phương tiện
(multimedia), lập chỉ mục đa chiều, mô hình hóa tâm lí hành vi người dùng, hệ
tương tác người-máy và trực quan hóa dữ liệu, là các lĩnh vực nghiên cứu quan
trọng nhất đóng góp cho truy tìm thông tin trực quan.
Các yếu tố mô tả nội dung có liên quan đến các đặc trưng cảm nhận như
màu sắc, vân, hình dạng, cấu trúc, mối liên hệ về không gian và chuyển động. Các
yếu tố cơ sở nguồn gốc của màu sắc như đối tượng, vai trò, sự kiện, hay các thông
tin có liên hệ với màu sắc như cảm giác, cảm tưởng hay ý nghĩa của hình ảnh. Do
vậy, phân tích ảnh, nhận dạng và thị giác máy tính đóng vai trò cơ bản trong các
hệ thống truy tìm thông tin trực quan. Nó cho phép tự động trích chọn hầu hết các
thông tin cảm nhận, thông qua việc phân tích phân bố điểm ảnh và rút ra các độ đo
Nguyễn Bá Công – Nguyễn Hữu Đức
2
nội dung trực quan.
Chương 1: Tổng quan
1.2. Hệ thống tìm kiếm ảnh thế hệ đầu tiên (dựa vào văn
bản)
Thế hệ đầu tiên của hệ thống tìm kiếm ảnh dựa vào nội dung cho phép truy
cập trực tiếp đến ảnh thông qua thuộc tính chuỗi. Kho ngữ liệu của hệ thống trong
thế hệ đầu tiên dựa trên chuỗi, sơ đồ trình bày, mô hình quan hệ, cấu trúc khung.
Dữ liệu mô tả và phụ thuộc nội dung được thể hiện thông qua từ khoá hay
nguyên bản. Từ khoá rất thích hợp cho việc xác định: Các thực thể quan trọng
trong hình ảnh (như đối tượng, con người…), các khái niệm hay thuật ngữ phụ
thuộc ngữ cảnh (như: mắt, miệng, gương mặt…) hay khung cảnh thể hiện (cảnh
bãi biển, cảnh núi non, cảnh hoàng hôn…). Nguyên bản là các mô tả bao quát hơn,
thường được viết bởi các chuyên gia, tóm tắt vào từ ngữ những gì thể hiện được và
ý nghĩa của ảnh. Truy tìm thông tin dựa trên các hệ thống tìm kiếm truyền thống
làm việc trên văn bản dùng ngôn ngữ truy vấn như SQL hay tìm kiếm toàn văn
bản.
Do hệ thống tìm kiếm này là dựa vào từ khóa được chú thích bằng văn bản
do đó có những hạn chế sau: Việc tạo từ khóa cho một số lượng lớn ảnh tốn thời
gian, từ khóa thì ngắn không thể mô tả hết các nét cảm nhận nổi bật của các đặc
trưng trực quan và không duy nhất, văn bản không thích hợp cho việc xây dựng độ
đo tương tự về giác quan, những mô tả bằng văn bản chỉ phản ánh quan điểm của
người chú thích chứ không phải người dùng cuối tương tác với hệ thống nhưng
việc nhận thức là một vấn đề chủ quan của từng người. Do những hạn chế trên đã
dẫn đến sự ra đời của hệ thống tìm kiếm ảnh dựa vào nội dung. Thế hệ mới của hệ
thống tìm kiếm ảnh dựa vào nội dung hỗ trợ đầy đủ việc lấy thông tin dựa vào nội
dung thuộc về thị giác. Chúng cho phép phân tích đối tượng, tự động rút trích đặc
trưng.
Những tìm kiếm đặc thù cho những hệ thống dạng này là “ tìm tất cả những
hình ảnh có hình con chó “ hay “ tìm kiếm tất cả những tấm ảnh về biển ở Việt
Nguyễn Bá Công – Nguyễn Hữu Đức
3
Nam”.
Chương 1: Tổng quan
Những khuyết điểm mà tìm kiếm theo văn bản không thực hiện được khi
người dùng muốn tìm kiếm những tấm ảnh có nội dung “ảnh có hoa màu xanh
xanh” hay “hoa màu vàng có nhụy màu tím ” việc tìm kiếm theo văn bản không
thực hiện được vì có rất nhiều loại hoa màu xanh cũng như hoa màu vàng nhụy
màu tím. Vả lại từ khóa là do quan điểm của người chú thích chứ không phải của
người dùng.
Mô hình hệ thống tìm kiếm thế hệ đầu tiên:
Nguyễn Bá Công – Nguyễn Hữu Đức
4
Hình 1: Mô hình của hệ thống tìm kiếm thế hệ đầu tiên
Chương 1: Tổng quan
1.3. Hệ thống tìm kiếm thông tin trực quan thế hệ mới
Hệ thống tìm kiếm thông tin trực quan thế hệ mới hỗ trợ tìm kiếm hoàn toàn
bằng nội dung trực quan. Truy cập đến thông tin không chỉ ở mức khái niệm dùng
từ khoá và văn bản, mà còn thông qua mức độ cảm nhận dùng các độ đo khách
quan của nội dung trực quan và các mô hình tương tự thích hợp. Trong các hệ
thống này thì xử lý ảnh, nhận dạng và thị giác máy tính làm một phần được tích
hợp vào kiến trúc và vận hành hệ thống. Nó cho phép phân tích khách quan sự
phân bố điểm ảnh và tự động rút trích độ đo từ dữ liệu nhập thô.
1.3.1 Các hệ thống tìm kiếm ảnh tĩnh
Nội dung của ảnh tĩnh bao gồm:
Thuộc tính cảm nhận: màu sắc, vân, hình dạng, yếu tố không
gian.
Các yếu tố nội dung cơ sở: đối tượng, quang cảnh.
Cảm giác, cảm nhận và ý nghĩa được kết hợp với tập các đặc
trưng cảm nhận.
Để tìm ảnh tương ứng với các thuộc tính cảm nhận, mô hình tìm
kiếm đòi hỏi với mỗi ảnh các đặc trưng tiêu biểu (tham số) được tính trước.
Truy vấn được thông qua các mẫu trực quan. Để khởi tạo truy vấn, người
dùng chọn các đặc trưng và phạm vi của các tham số quan trọng và chọn độ
đo tương tự. Mẫu có thể được soạn thảo bởi người dùng hay rút từ các ảnh
mẫu. Hệ thống kiểm tra độ tương tự giữa nội dung trực quan được ngừơi
dùng truy vấn và ảnh trong cơ sở dữ liệu. Vì không thể dự đoán được kết
quả trả về tương ứng với truy vấn có thoả mãn hay không nên kỹ thuật để
cải thiện chất lượng truy vấn là giữ đến mức thấp nhất có thể số thất thoát
(do chi phí của số lượng lớn hơn các truy vấn thất bại) và cho phép một
hình thức tương tác gọi là hồi đáp thích hợp (relevance feedback). Trong đó
Nguyễn Bá Công – Nguyễn Hữu Đức
5
các mẫu rất cứng nhắc, thiếu độ linh động cần thiết để giải quyết các khái
Chương 1: Tổng quan
niệm và yếu tố màu sắc của hình ảnh. Vì thế, để tìm kiếm ảnh dựa trên các
thuộc tính cấp cao thì phải thực hiện truy vấn lại bằng văn bản.
1.3.2 Các hệ thống tìm kiếm phim ảnh (video)
Khác với ảnh tĩnh, ảnh phim truyền các thông điệp có nhiều thông
tin hơn thông qua nhiều khía cạnh thông tin. Bao gồm cách các khung ảnh
liên kết lại với nhau sử dụng các hiệu ứng soạn thảo (cắt, giảm,phân rã,làm
mờ…) và nội dung thể hiện trong ảnh (nhân vật, nội dung câu chuyện,
thông điệp câu chuyện). Sự thay đổi về màu sắc, vân, hình dạng và chuyển
động (của cả thiết bị thu nhận ảnh, nhân vật và đối tượng) được quan sát
trong nhiều khung ảnh, là quan trọng hơn thông tin được nhúng vào các
khung ảnh đơn. Kỹ thuật dùng để thu nhận phim ảnh cũng góp phần quan
trọng vào thông tin của luồng phim ảnh. Mỗi loại phim ảnh có các đặc
trưng riêng. Điều này được thể hiện trong cách mỗi đơn vị phim ảnh được
rút trích, tổ chức trong cấu trúc kiến thức, chỉ mục và truy cập bởi người
dùng. Trong hệ thống tìm kiếm video việc truy cập có thể được thực hiện
thông qua cả mức cấu trúc lẫn nội dung.
1.3.3 Các hệ thống tìm kiếm ảnh 3 chiều và video
Tập các ảnh 3 chiều và video giờ được dùng rất nhiều trong nhiều
lĩnh vực như y học, CAD (thiết kế bộ phận máy móc), bản đồ địa lý, phân
loại ảnh nghệ thuật (điêu khắc, đối tượng 3D, mô hình…). Việc nghiên cứu
lĩnh vực tìm kiếm này chỉ mới bắt đầu.
1.3.4 Các hệ thống tìm kiếm trên Internet
Môi trừơng mạng phát triển rất nhanh trong đó việc tìm kiếm, truy
cập và truyền tải các thông tin trực quan rất quan trọng. Với các hệ thống
dựa trên web, người dùng có thể tìm kiếm hình ảnh và phim từ nhiều nguồn
Nguyễn Bá Công – Nguyễn Hữu Đức
6
dữ liệu khác nhau được phân tán trên mạng. Thông tin có thể thu nhận từ:
Chương 1: Tổng quan
URL (tên tập tin ảnh và chủ đề), tập tin HTML, thuộc tính ảnh (loại tập tin,
kích thước, ngày tháng)…
Nói chung, mục đích chính của truy tìm thông tin hình ảnh dựa trên
nội dung ảnh là tìm ra các ảnh tương tự với ảnh mẫu hay phác thảo ảnh
được cung cấp bởi người sử dụng. Để thực hiện điều này thông thường phải
qua các bước sau đây:
Sự biểu thị đặc điểm độc lập lĩnh vực của nội dung trực quan của
hình ảnh.
Kỹ thuật xử lí ảnh để tự động trích các đặc điểm trực quan một cách
tự động.
Tóm tắt biểu thị ngắn gọn cho các đặc điểm này.
Hàm tính độ tương tự để so sánh ảnh một cách hiệu quả.
Kỹ thuật lập chỉ mục để việc truy xuất ảnh trong cơ sở dữ liệu có
hiệu suất cao.
Khuyết điểm: Trong các hệ thống tìm kiếm thế hệ mới này các đặc
trưng tìm kiếm chủ yếu là các đặc trưng cấp thấp, dữ liệu nhận chưa mô
phỏng gần gũi với suy nghĩ của con người, ảnh tìm được có thể mang nội
dung ngữ nghĩa rất khác so với ảnh truy vấn. Điều này làm bất lợi cho
người dùng cũng như hệ thống họat động với hiệu quả không cao. Do đó,
nhu cầu đòi hỏi phải có hệ thống tìm kiếm họat động với hiệu quả cao hơn
cũng như tiện dụng hơn để đáp ứng nhu cầu ngày càng cao của con người.
Để đáp ứng nhu cầu trên, hàng lọat những hệ thống truy tìm ảnh dựa vào
nội dung mới ra đời trong đó có hệ thống “Truy tìm ảnh dựa vào đặc
trưng cấp thấp và đặc trưng cấp cao”.
Nguyễn Bá Công – Nguyễn Hữu Đức
7
Mô hình hệ thống tìm kiếm thế hệ mới:
Chương 1: Tổng quan
Hình 2: Mô hình của hệ thống tìm kiếm thế hệ mới
1.4. Xu hướng phát triển từ đặc trưng cấp thấp đến đặc
trưng cấp cao và tiến dần đến ngữ nghĩa
Nhằm đáp ứng nhu cầu ngày càng cao của con người trong tìm kiếm ảnh,
nên các hệ thống truy tìm ảnh đã không ngừng nâng cao khả năng tìm kiếm của
mình. Các hệ thống tìm kiếm theo các trưng cấp thấp đang dần được thay thế bằng
các hệ thống tìm kiếm theo đặc trưng cấp thấp kết hợp với đặc trưng cấp cao. Việc
tìm kiếm theo các đặc trưng cấp cao đã khắc phục được các khuyết điểm của việc
tìm kiếm theo các đặc trưng cấp thấp đó là: giải quyết được vấn đề lớn đang cản
trở bước phát triển truy tìm ảnh dựa vào nội dung trong việc dữ liệu nhận mô
Nguyễn Bá Công – Nguyễn Hữu Đức
8
phỏng gần gũi hơn với suy nghĩ của con người, và ảnh tìm được mang nội dung
Chương 1: Tổng quan
ngữ nghĩa gần hơn so với ảnh truy vấn. Bên cạnh các đặc trưng cấp cao như vùng
(hay còn gọi là vần của ảnh) được tách ra từ ảnh, việc áp dụng mô hình học vào sẽ
làm cho hệ thống tìm kiếm theo nội dung tiến thêm một bước đó là tìm kiếm dựa
vào ngữ nghĩa.
Ví dụ minh họa trong tìm kiếm: Giả sử ta có ảnh ban đầu như sau:
Hình 3: Hình gốc 1 Với việc tìm kiếm theo đặc trưng cấp thấp thì người dùng chỉ có thể
tìm kiếm những tấm ảnh có màu sắc gần giống với tấm ảnh trên như:
Hình 4: Ảnh giống lược đồ màu với ảnh gốc Điều này dẫn đến khả năng xuất hiện những ảnh tuy giống nhau về
màu sắc nhưng khác nhau về ngữ nghĩa, không hiệu quả trong tìm kiếm.
Để tránh khả năng trên xảy ra ta có thể tiến hành tìm kiếm ảnh theo
các đặc trưng cấp cao là vùng. Chúng ta có thể phân đọan ảnh thành các
vùng, và từ đó chọn các vùng cần thiết cho quá trình tìm kiếm. Điều này làm
cho kết quả tìm kiếm cao hơn và hiệu quả hơn do vùng mang ngữ nghĩa hơn
và thể hiện được tính phân bố của các thành phần trong ảnh.
Ví dụ các vùng trong ảnh sau khi phân đoạn ảnh:
Nguyễn Bá Công – Nguyễn Hữu Đức
9
Hình 5: Minh họa các vùng của ảnh
Chương 1: Tổng quan
Việc tìm kiếm theo đặc trưng cấp cao là vùng trong ảnh còn có thể
đưa lên một bước là tìm kiếm theo ngữ nghĩa. Từ tập ảnh cơ sơ dữ liệu ban
đầu qua bước phân đoạn ảnh và gán nhãn tự động cho ảnh ta có được những
vùng ảnh với những ngữ nghĩa xác định. Vì vậy việc tìm kiếm bây giờ chỉ là
đưa ra ngữ nghĩa của ảnh muốn tìm kiếm thông qua tập các nhãn ngữ nghĩa
đã gán ở trên dứơi dạng một câu truy vấn.
Ví dụ các vùng ảnh sau khi gán nhãn ngữ nghĩa:
Hình 6: Minh họa các vùng của ảnh có gán ngữ nghĩa
Với các nhãn được gán trên, khi chúng ta có nhu cầu tìm kiếm
những ảnh có hình con sư tử thì chúng ta chỉ cần thực hiện câu truy vấn “Sư
tử” thì kết quả trả về sẽ là những ảnh chỉ có hình con sư tử. Đây là bước
tiến nhảy vọt trong truy tìm ảnh dựa vào nội dung.
1.5. Một số hệ thống truy tìm ảnh dựa vào nội dung hiện
nay
Trong những năm gần đây, nhiều hệ thống tìm kiếm ảnh dựa vào nội dung
(content-based image retrieval: CBIR) đã được đề xuất và phát triển trong cộng
đồng nghiên cứu như:
QBIC (Query By Image Content) của IBM.
Virage của công ty Virage.
Photobook của phòng thí nghiệm truyền thông MIT.
VisualSEEK của đại học Columbia.
Nguyễn Bá Công – Nguyễn Hữu Đức
10
RetriecvalWare của tập đòan công nghệ Excalibur.
Chương 1: Tổng quan
Netra của Đại học California, Thư viện ảnh Alexandria.
CORE của Đại học Singapore.
Nhìn chung, các hệ thống trên đa số chỉ ở giai đọan hòan tất việc tìm kiếm
theo đặc trưng cấp thấp, còn đặc trưng cấp cao thì các hệ thống trên chỉ kết thúc
trong giai đọan tìm theo hình dáng ảnh, chưa đến giai đọan tách vùng ảnh. Do đó,
đòi hỏi phải có một hệ thống họat động với hiệu quả cao hơn, dữ liệu mô tả đầu
vào mô phỏng gần gũi với con người hơn. Để đáp ứng yêu cầu đó, một hệ thống
hệ thống “ ruy tìm ảnh dựa vào đặc trưng cấp thấp và T tìm kiếm mới ra đời
đặc trưng cấp cao”. Hệ thống này có thể giải quyết được các khuyết điểm của các
hệ thống trước kia, đồng thời tiến đến “Tìm kiếm theo ngữ nghĩa”, tạo một bước
nhảy vọt trong lĩnh vực truy tìm ảnh dựa vào nội dung.
1.6. Sự hình thành “Hệ thống truy tìm ảnh dựa vào đặc
trưng cấp thấp và đặc trưng cấp cao”
Giả sử khi có nhu cầu tìm kiếm một vài tấm ảnh trong cơ sở dữ liệu hàng
trăm ngàn ảnh, điều này có thể thực hiện được khi ta tìm kiếm bằng tay theo cách
thông thường, nghĩa là xem từng tấm ảnh cho đến khi tìm thấy ảnh cần tìm. Việc
tìm kiếm này làm tốn rất nhiều thời gian chúng ta. Do đó, nhu cầu đòi hỏi phải có
một công cụ hỗ trợ giúp cho việc tìm kiếm nhanh hơn, hiệu quả hơn. Do đó đề tài
“Thiết kế hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao”
ra đời để đáp ứng nhu cầu trên.
Truy tìm ảnh dựa vào nội dung là tìm kiếm thông tin trực quan. Tương tác
với nội dung trực quan là cách thiết yếu nhất để truy tìm thông tin hiệu quả nhất.
Các yếu tố trực quan như màu sắc, vân (texture), hình dạng đối tượng và các yếu
tố không gian trực tiếp liên quan đến khía cạnh cảm nhận nội dung ảnh.
Do đó nội dung của đề tài sẽ được giải quyết như sau: truy tìm ảnh dựa vào
các đặc trưng như lược đồ màu (Histogram), Vector liên kết màu (Color
Coherence Vector), Correlogram, lược đồ hệ số góc (Edge Direction Histogram),
Nguyễn Bá Công – Nguyễn Hữu Đức
11
Vector liên kết hệ số góc (Edge Direction Coherence Vector), vân(texture), vùng.
Chương 1: Tổng quan
Tuy hệ thống này tiến dần đến “Tìm kiếm theo ngữ nghĩa” nhưng các đặc
trưng cấp thấp không thể thiếu trong quá trình xây dựng hệ thống. Việc áp dụng
mô hình học vào hệ thống cũng phải dựa vào các đặc trưng cấp thấp như lược đồ
màu, vector liên kết màu,... .Do đó, đặc trưng cấp thấp là nền tảng để xây dựng các
hệ thống cao hơn và cũng như tìm kiếm theo đặc trưng cấp thấp không bao giờ bị
lạc hậu.
Sau đây là mô hình của hệ thống:
Nguyễn Bá Công – Nguyễn Hữu Đức
12
Hình 7:Mô hình “Hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao”
Chương 1: Tổng quan
1.7. Hướng tiếp cận của bài toán
Các vấn đề mà đề tài tập trung giải quyết:
Xây dựng cơ sở dữ liệu ảnh.
Xây dựng hệ thống tìm kiếm ảnh:
o Tìm kiếm theo các đặc trưng cấp thấp: Lược đồ màu
(Histogram), Vector liên kết màu (Color Coherence
Vector), tương quan màu (Correlogram), Vân (Texture),
lược đồ hệ số góc (Edge Direction Histogram), Vector liên
kết hệ số góc (Edge Direction Coherence Vector).
o Tìm kiếm theo vùng, đối tượng.
o Tìm kiếm theo ngữ nghĩa.
1.7.1 Xây dựng cơ sở dữ liệu
Để tăng hiệu quả trong việc tìm kiếm cũng như mô tả trực quan hơn về
các đối tượng ảnh. Chúng em hướng tới xây dựng một cơ sở dữ liệu ảnh nhằm
đưa những ảnh có đặc điểm giống nhau về cùng một nhóm. Ở đây, mỗi đặc
trưng chúng em gom thành một cây, từ đó giúp cho việc tìm kiếm các đối
tượng ảnh một cách dễ dàng, cũng như việc thể hiện chúng sinh động hơn, giúp
người dùng có thể hình dung được tập dữ liệu ảnh của mình. Thuật tóan được
chúng em sử dụng để xây cây là “Thuật tóan phân lớp phân cấp
Hierarchical Agglomerative Clustering Algorithm- HAC . )” (
Chúng em chọn “Thuật tóan phân lớp phân cấp” này cho bài tóan mà
không chọn các thuật tóan khác vì nó có một số ưu điểm sau:
Không cần xác định trước số phân lớp nên ta có thể phân lớp
từ thô cho đến mịn.
Dễ cài đặt.
Nguyễn Bá Công – Nguyễn Hữu Đức
13
Tốc độ nhanh.
Chương 1: Tổng quan
1.7.2 Xây dựng hệ thống tìm kiếm
1.7.2.1 Tìm kiếm dựa vào sự phân bố mang tính tòan cục
Khi người dùng có nhu cầu tìm kiếm những tấm ảnh có sự giống
nhau về đặc trưng nào đó trong tòan tấm ảnh so với ảnh truy vấn thì người
dùng có thể chọn chức năng tìm kiếm dựa vào sự phân bố tòan cục. Đây
cũng là nền tảng cho các tìm kiếm cấp cao hơn về sau.
1.7.2.1.1 Đặc trưng lược đồ màu
Màu sắc là thông tin gần gũi, trực quan với con người nhất.
Qua đặc trưng màu sắc, có thể lọc được rất nhiều lớp ảnh thông qua
vị trí, không gian, định lượng của màu trong ảnh.
Ví dụ hai ảnh có lược đồ màu giống nhau:
Hình 8: minh họa 2 ảnh có lược đồ màu giống nhau 89%
1.7.2.1.2 Đặc trưng vector liên kết màu (Color Coherence
Vector)
Cũng như đặc trưng lược đồ màu, đặc trưng vector liên kết
màu là thông tin quan trọng trong ảnh. Nó thể hiện rõ ràng mật độ
Nguyễn Bá Công – Nguyễn Hữu Đức
14
phân bố màu trong ảnh. Với 2 ảnh có thể rất giống nhau về lược đồ
Chương 1: Tổng quan
màu nhưng do khác nhau về sự phân bố màu sắc, nên trong quá trình
tìm kiếm theo lược đồ màu có thể cho ra nhiều ảnh “dư thừa”, khác
nhau về ngữ nghĩa. Nếu trong quá trình tìm kiếm trên ta sử dụng
vector liên kết màu thì sẽ khắc phục được tình trạng trên.
Ví dụ hai ảnh có lược đồ vector liên kết màu giốn nhau:
Hình 9: minh họa 2 ảnh có vector liên kết màu giống nhau 75%
1.7.2.1.3 Đặc trưng tự tương quan màu (AutoCorrelogram) Đây cũng là đặc trưng cấp cao của ảnh. Nó thể hiện tính phân
bố cục bộ về màu. Cũng giống như đặc trưng vector liên kết màu,
đặc trưng này giúp ta có thể phân biệt được những ảnh có thể rất
giống nhau về lược đồ màu khác nhau về ngữ nghĩa.
Ví dụ hai ảnh có đặc trưng correlogram giống nhau:
Nguyễn Bá Công – Nguyễn Hữu Đức
15
Hình 10:minh họa 2 ảnh có đặc trưng Correlogram giống nhau 75%
Chương 1: Tổng quan
1.7.2.1.4 Đặc trưng lược đồ hệ số góc (Edge Direction
Histogram)
Đây là cũng đặc trưng quan trọng của ảnh. Nó thể hiện về
hình dáng của ảnh. Đối với các ảnh muốn tìm kiếm theo hình dáng
thì đặc trưng về màu sắc không thể giải quyết được. Vì vậy trong các
hệ tìm kiếm dựa vào nội dung của ảnh không thể thiếu đặc trưng
này.
Ví dụ hai ảnh có đặc trưng lược đồ hệ số góc giống nhau:
Hình 11: minh họa 2 ảnh có lược đồ hệ số góc giống nhau 88%
1.7.2.1.5 Đặc trưng Vector liên kết hệ số góc (Edge
Direction Coherence Vector)
Cũng như đặc trưng lược đồ hệ số góc, đặc trưng vector liên
kết hệ số góc là đặc trưng cấp cao của ảnh. Nó thể hiện rõ ràng hơn
về hình dáng của ảnh. Ngòai ra nó còn thể hiện mối liên kết chặt chẽ
giữa các điểm biên cạnh (các điểm biên cạnh có cùng góc độ), cũng
Nguyễn Bá Công – Nguyễn Hữu Đức
16
như là những điểm không phải là biên cạnh.
Chương 1: Tổng quan
Ví dụ hai ảnh có lược đồ vector liên kết hệ số góc giống nhau:
Hình 12: minh họa 2 ảnh có Vector liên kết hệ số góc giống nhau 78%
1.7.2.2 Tìm kiếm dựa vào sự phân bố mang tính cục bộ
Khi người dùng có nhu cầu tìm kiếm một vùng nào đó trong ảnh,
thì việc tìm kiếm mang tính tòan cục không giải quyết được vấn đề trên.
Chính vì vậy chúng em đã giải quyết vấn để này bằng việc cho người
dùng chia lưới hoặc có thể vẽ một vùng nào đó trong ảnh mà họ muốn tìm
kiếm. Vì vậy với cách tìm kiếm này sẽ giúp cho hệ thống họat động hiệu
quả hơn.
Minh họa việc chia lưới tìm kiếm:
Khi người dùng muốn tìm kiếm những tấm ảnh dạng “cảnh
thành phố lúc hòan hôn” thì người dùng có thể chia lưới như sau:
Nguyễn Bá Công – Nguyễn Hữu Đức
17
Hình 13: Ảnh minh họa chia lưới 1x3
Chương 1: Tổng quan
Trong đó block 0 tìm theo luợc đồ màu, còn block 1, 2 tìm
kiếm theo lược đồ hệ số góc.
Minh họa việc vẽ vùng để tìm kiếm:
Khi người dùng muố tìm kiếm những ảnh có bông hoa ở
giữa thì có thể vẽ như sau:
Hình 14: Ảnh minh họa vẽ vùng tìm kiếm
1.7.2.3 Tìm kiếm theo vùng, đối tượng
Đây là bứơc tiến nhảy vọt trong việc truy tìm ảnh dựa vào nội
dung. Vùng là đặc trưng cấp cao của ảnh. Với đặc trưng về vùng, chúng ta
có thể thực hiện được các ý tưởng sau:
Với vùng, sẽ làm cho dữ liệu đầu vào được mô phỏng gần gũi
với chúng ta hơn.
Với vùng, sẽ giúp cho chúng ta có thể tiến thêm một bước
trong vấn đề tìm kiếm ảnh dựa vào nội dung là “Tìm kiếm theo
ngữ nghĩa” bằng việc áp dụng mô hình học vào vùng.
Ở đây việc tìm kiếm theo vùng đối tượng có thể chia ra làm hai
chiến lược:
Tìm kiếm theo vùng, đối tựơng từ ảnh có sẵn: Từ ảnh truy vấn
Nguyễn Bá Công – Nguyễn Hữu Đức
18
có sẵn ban đầu qua bước phân đọan ảnh, ta có thể chia ảnh
Chương 1: Tổng quan
thành các vùng gọi là vần của ảnh. Từ các vần này ta có thể
chọn ra vài vần cần truy tìm. Và hệ thống có thể tìm ra được
những ảnh phù hợp theo ý muốn của người dùng.
Ví dụ minh họa chia vùng ảnh có sẵn để tìm kiếm:
Hình 15: Ảnh minh họa tìm kiếm theo vùng
Tìm kiếm khi người dùng chưa có ý niệm rõ lắm về tấm ảnh
cần tìm, mà chỉ có một số yêu cầu nào đó về các “vần” cấu
thành nên nó hoặc họ chỉ cần tìm các ảnh tương tự với các vần
chính của ảnh truy vấn chứ không cần sự tương tự toàn cục.
Ví dụ minh họa:
Khi người dùng có ý niệm tìm kiếm những tấm ảnh
như sau: “Cỏ non xanh tận chân trời, cành lê trắng điểm một
vài bông hoa”. Người dùng có thể ghép các vùng lại với nhau
từ tập dữ liệu có sẵn như sau:
Nguyễn Bá Công – Nguyễn Hữu Đức
19
Hình 16: Minh họa tìm kiếm theo vùng khi người dùng có một vài ý niệm về ảnh truy vấn
Chương 1: Tổng quan
1.7.2.4 Tìm kiếm theo ngữ nghĩa
Với việc áp dụng mô hình học vào bài tóan phân vùng ảnh, khi đó
mỗi vùng (vần) trong ảnh có thể mang một ngữ nghĩa nào đó. Điều này
dẫn đến một khả năng truy tìm mới là dựa vào câu truy vấn dạng ngôn
ngữ, liên kết với các vùng đại diện theo một luận lý để truy tìm ảnh. Điều
này giúp cho người dùng có thể thực hiện câu truy vấn dễ dàng.
Ví dụ minh họa tìm kiếm theo ngữ nghĩa:
Hình 17: Minh họa việc áp dụng mô hình học vào các vùng của ảnh để tìm kiếm theo ngữ nghĩa
Với các nhãn ngữ nghĩa trên, khi người dùng muốn tìm kiếm
hoa mai vàng, người dùng chỉ việc đánh từ khóa “hoa mai vàng” để
Nguyễn Bá Công – Nguyễn Hữu Đức
20
tìm kiếm.
Chương 2: Các khái niệm cơ bản
Chương 2 CÁC KHÁI NIỆM CƠ BẢN
Nguyễn Bá Công – Nguyễn Hữu Đức
21
Chương 2: Các khái niệm cơ bản
2.1. Màu sắc
2.1.1 Khái niệm về màu sắc
Sự nhận thức về màu sắc là rất quan trọng trong đời sống của con người.
Sự nhận thức về màu sắc phụ thuộc vào cả tính chất vật lý của ánh sáng và quá
trình xử lý của thị giác với sự góp phần rất quan trọng của kinh nghiệm. Con
người có thể dùng thông tin màu sắc để phân biệt đối tượng, vật liệu, đồ ăn, vị
trí, và ngay cả thời gian của ngày, ...
2.1.2 Một số đặc tính vật lý đặc biệt về màu sắc
Con người chỉ có khả năng nhận thức được ánh sáng có bức xạ điện từ
với bước sóng trong khoảng 400 – 700 nanomet. Cơ quan thị giác cảm nhận
được ánh sáng là do bề mặt đối tượng phát ra ánh sáng, là kết quả của sự tương
tác giữa năng lượng chiếu sáng và những phân tử của bề mặt đối tượng. Một
đối tượng màu xanh dương sẽ có bề mặt màu xanh dương khi chiếu ánh sáng
trắng vào. Nhưng đối tượng đó sẽ có màu tím khi chiếu ánh sáng đỏ vào.Với sự
phát triển mạnh mẽ của các thiết bị kinh tế, máy móc xử lý màu sắc trở nên
thông dụng: Chúng ta có các thiết bị như máy quay phim màu, thiết bị chiếu
màu và những phần mềm xử lý ảnh màu. Máy móc có thể dùng màu sắc cho
những mục đích như là con người. Đặc biệt, màu sắc thuận tiện bởi vì nó cung
cấp phép đo lường đa dạng tại mỗi điểm ảnh đơn, có thể phân lớp, phân loại
mà không cần đến những sự xử lý không gian phức tạp để đưa đến quyết định.
Do đó, việc lựa chọn mô hình màu thích hợp và sử dụng lược đồ lượng hoá
màu thích hợp sẽ giảm bớt độ phân giải màu. Đây là các vấn đề quan trọng
trong việc tìm kiếm ảnh dựa trên màu sắc. Màu sắc thường được biểu diễn như
là các điểm trong không gian màu 3 chiều. Hiện tại có rất nhiều mô hình màu
hình học hỗ trợ việc thể hiện màu sắc một cách rõ ràng, dễ lượng hoá .Mô hình
Nguyễn Bá Công – Nguyễn Hữu Đức
22
màu có thể khác biệt:
Chương 2: Các khái niệm cơ bản
(cid:153) Mô hình dựa trên thiết bị đo màu: Kết quả từ độ đo vật lý hệ số
phản xạ quang phổ sử dụng thiết bị đo màu. Các không gian màu
chuẩn theo CIE (Comission International d’Eclairage) thuộc loại
này.
(cid:153) Mô hình màu dựa trên cảm nhận sinh lí: Kết quả từ các nghiên
cứu về thần kinh. Tồn tại 3 kiểu hình nón phân biệt trong võng
mạc của con người đóng vai trò vào việc sắp xếp màu sắc trong
không gian màu. Các mô hình màu CIE XYZ, RGB và các biến
thể thuộc nhóm này.
(cid:153) Mô hình màu dựa trên tâm lý học: dựa trên cách mà màu sắc hình
thành trong đầu của người quan sát. Các mô hình đối lập dựa trên
các phân tích thực nghiệm phản ứng của con người đối với các
thành phần đối lập cơ sở. Họ các không gian màu HSB (Hue-
Saturation-Brightness) thuộc lớp này.
(cid:153) Mô hình màu có thể phân biệt
o Mô hình hướng thiết bị: Định nghĩa theo thuộc tính của
thiết bị dùng để hiển thì màu như màn hình TiVi, màn hình
máy tính và máy in. Các mô hình màu hướng thiết bị là
RGB, CMY, YIQ. Người dùng rất khó xử lý trên các mô
hình này vì nó không phản ánh trực tiếp các khái niệm trực
giác màu sắc, sắc thái (còn gọi là sắc độ, là độ đậm nhạt
của màu sắc) và cường độ sáng.
o Mô hình hướng ngừơi dùng: Dựa trên khả năng cảm nhận
màu sắc của con người. Con người cảm nhận màu sắc
thông qua các đối tượng trực giác màu sắc, sắc thái và
cường độ sáng. Các mô hình màu hướng ngừơi dùng là
Nguyễn Bá Công – Nguyễn Hữu Đức
23
HSL, HSV, HCV, HSB, MTM, L*u*v, L*a*b* và L*C*h .
Chương 2: Các khái niệm cơ bản
Không gian màu là một cách biểu diễn toán học một tập các màu.
Các không gian màu có thể được phân vào 2 loại không gian màu:
phụ thuộc thiết bị hay độc lập thiết bị.
o Không gian màu độc lập thiết bị được chia thành nhiều
không gian màu được định theo chuẩn CIE như: XYZ,
L*a*b và L*u*v, ứng dụng chính cho mục đích đo màu .
o Không gian màu phụ thuộc thiết bị được chia vào 3 lớp
rộng: không gian màu in, không gian màu video, và không
gian màu màn hình. Các không gian màu in CMY, CMYK
dựa trên màu mực được dùng trong ngành in và nhiếp ảnh.
Các không gian màu màn hình là các biến thể của không
gian màu RGB, các không gian màu video - tất cả đều
tương tự như không gian màu YUV được phân thành các
không gian màu riêng tuỳ vào ứng dụng.
2.1.3 Các hệ màu thông dụng
2.1.3.1 Hệ màu chuẩn RGB:
Mắt người có thể phân biệt hàng ngàn màu sắc khác nhau, những
con số chính xác hơn vẫn còn đang được bàn cãi nhiều. Ba màu RGB (Red-Green- Blue) mã hóa hệ thống đồ họa sử dụng ba byte 224 hay
khoảng chừng 16 triệu màu phân biệt. Máy tính có thể phân biệt bất kỳ
màu gì sau khi được mã hóa, nhưng việc mã hóa có thể không trình bày
được những sự khác biệt trong thế giới thực. Mỗi điểm ảnh RGB bao gồm
một byte cho màu R, một byte cho màu G và một byte cho màu B. Việc
mã hóa một màu tùy ý trong dãy hiển thị được làm bằng cách tổ hợp ba
màu chính. Ví dụ: Red(255,0,0), Green(0,255,0), Blue(0,0,255),
Black(0,0,0) Hệ thống màu RGB là một hệ thống màu cộng vào bởi vì
mỗi màu được tạo nên bằng cách cộng thêm các phần tử vào màu
Nguyễn Bá Công – Nguyễn Hữu Đức
24
đen(0,0,0) Khuôn dạng của không gian màu RGB là định dạng phổ biến
Chương 2: Các khái niệm cơ bản
nhất của ảnh số, lý do chính là tính tương thích với màn hình hiển thị
chính là màn hình vi tính. Tuy nhiên không gian màu RGB có hạn chế lớn
nhất là không phù hợp với cách con người cảm nhận về màu sắc. Do đó
không phù hợp cho việc ứng dụng vào tìm kiếm ảnh.
Hình 18: Hệ màu RGB
2.1.3.2 Hệ màu CMY
Không gian màu CMY được dùng trong in ấn. Màu lục lam, màu
đỏ tươi và màu vàng là phần bù của màu đỏ, màu xanh lá cây và màu xanh
dương được gọi là các thành phần cơ sở trừ vì chúng được tạo ra bằng
cách trừ đi độ sáng từ màu trắng. Ví dụ màu lục lam là phần bù của màu
đỏ, tạo ra bằng cách xoá thành phần đỏ từ màu trắng. Có thể chuyển từ
không gian màu RGB sang không gian màu CMY bằng công thức chuyển
đổi đơn giản nhưng không chính xác: C=1-R, M=1-G, Y=1-B. Hệ thống
Nguyễn Bá Công – Nguyễn Hữu Đức
25
màu CMY dường như là một sự đảo ngược của hệ thống màu RGB. Đặc
Chương 2: Các khái niệm cơ bản
tính của nó là sự đơn giản, ứng dụng nhiều trong thực tế. Tuy nhiên
khuyết điểm của nó cũng tương tự như không gian màu RGB, tức là cách
mã hóa khác với cách mà con người cảm nhận về màu sắc. Không thích
hợp cho bài toán tìm kiếm ảnh dựa vào nội dung.
Hình 19: Hệ màu CMY
2.1.3.3 Hệ màu YIQ
Về cơ bản mô hình màu YIQ là sự biến thể hệ màu RGB bằng cách
chuyển đổi hiệu quả và duy trì sự tương thích với TV đơn sắc chuẩn. Thật
sự, thành phần Y của mô hình màu YIQ cung cấp tất cả các thông tin
video yêu cầu bởi một tập các TV đơn sắc. Công thức chuyển đổi từ RGB
=
299.0 596.0
275.0
587.0 −
=
114.0 −
B
212.0
532.0
−
−
⎤ ⎥ ⎥ ⎥ ⎦
R ⎡ ⎢ G ⎢ ⎢ ⎣
⎤ ⎥ 321.0 ⎥ ⎥ 311.0 ⎦
⎡ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎦
Y ⎡ ⎢ I ⎢ ⎢ Q ⎣
sang YIQ:
Để lấy được các giá trị RGB từ tập YIQ, chúng ta chỉ cần thực hiện
toán tử đảo ma trận .Hệ màu YIQ được thiết kế giúp cho sự cảm nhận của
con người về sự thay đổi độ sáng chói tốt hơn sự thay đổi đặc trưng màu
Nguyễn Bá Công – Nguyễn Hữu Đức
26
sắc (Hue) và độ thuần khiết (Sataration). Lợi thế của YIQ trong việc xử lý
Chương 2: Các khái niệm cơ bản
ảnh là độ sáng chói (Y) và thông tin màu (I và Q) được tách riêng ra. Sự
quan trọng của việc tách riêng này giúp cho việc xử lý thành phần Y của
ảnh có thể không có ảnh hưởng đến nội dung màu.
Không gian màu này đều gây khó khăn cho người sử dụng vì nó
không phản ánh trực tiếp khái niệm giác quan của màu sắc: màu, sắc thái
và độ sáng.
2.1.3.4 Hệ màu L*a*b:
Mô hình L*a*b được đề cử bởi CIE cho việc lượng hóa sự khác biệt
của màu sắc trong vật chiếu sáng của ánh sáng ban ngày. Tuy nhiên nó có
một sự chuyển đổi được ghi vào để mà tính toán cho việc thích nghi với
những nguồn sáng. Một màu được xác bằng 2 toạ độ x và y. Độ sáng L*
dựa trên độ đo giác quan của thành phần sáng u*, v* là toạ độ màu. Các
màu khác nhau theo một hướng duy nhất là xấp xỉ bằng nhau trong không
gian màu này. Do đó khoảng cách Euclician được dùng để quyết định
khoảng cách tương đối giữa 2 màu. Tuy nhiên, việc chuyển sang không
gian màu RGB là không tuyến tính. Đây là hệ thống màu có sự tách riêng
ánh sáng và màu sắc ra riêng. Do đó, cũng có khả năng lớn cho việc tìm
kiếm dựa vào nội dung.
2.1.3.5 Hệ màu HSI: Hue-Saturation-Intensity
Hệ thống màu HSI mã hóa thông tin màu sắc bằng cách chia giá trị
intensity I từ hai giá trị được mã hóa thuộc về độ hội tụ của màu- hue H và
saturation S. Thành phần không gian màu HSI gồm có ba phần: Hue được
định nghĩa có giá trị 0-2Π, mang thông tin về màu sắc. Saturation có giá
trị 0-1, mang giá trị về độ thuần khiết của thành phần Hue. Intensity
(Value) mang thông tin về độ sáng của điểm ảnh.Ta có thể hình dung
không gian màu HSI như là vật hình nón. Với trục chính biểu thị cường
Nguyễn Bá Công – Nguyễn Hữu Đức
27
độ sáng Intensity. Khoảng cách đến trục biểu thị độc tập trung Saturation.
Chương 2: Các khái niệm cơ bản
Góc xung quanh trục biểu thị cho sắc màu Hue. Đôi khi, hệ thống màu
HSI được coi như là hệ thống màu HSV dùng Value thay vì Intensity. Hệ
thống màu HSI thì thích hợp hơn với một số thiết kế đồ họa bởi vì nó
cung cấp sự điều khiển trực tiếp đến ánh sáng và hue. Hệ thống màu HSI
cũng hỗ trợ tốt hơn cho những thuật toán xử lý ảnh vì sự tiêu chuẩn hóa về
ánh sáng và tập chung vào hai tham số về độ hội tụ màu, và cường độ
màu. Hệ thống màu HSI có sự phân chia rõ rệt giữa ánh sáng và màu sắc.
Do đó có khả năng rất lớn được áp dụng cho việc tính đặc trưng và so
sánh sự giống nhau về màu sắc của hai ảnh. Do đó nó rất thích hợp cho
việc tìm kiếm ảnh dựa vào màu. Sự giống và khác nhau giữa hai ảnh về
mặt màu sắc đối với mắt người chỉ mang ý nghĩa tương đối. Do đó khi áp
dụng vào bài toán này trên máy tính thì ta cũng giả lập sự tương đối này.
Phương pháp chính của việc tìm kiếm theo màu sắc là dùng lược đồ màu
để làm đặc trưng cho từng ảnh. Do những đặc điểm riêng của mô hình
màu HSI và đặc trưng của việc tìm kiếm nên tính lược đồ màu cũng được
dùng một mô mình rất đặc biệt để phù hợp cho những đặc điểm riêng này.
Hình minh hoạ màu trong không gian màu HSI:
Nguyễn Bá Công – Nguyễn Hữu Đức
28
Hình 20:Hệ màu HSI
Chương 2: Các khái niệm cơ bản
Công thức chuyển đổi từ không gian màu RGB sang HSI:
Cho RGB c1(r, g, b) và HSI c2(h, s, i). Ta có:
i
, bgr ),
−
s
=
i = max(r, g, b),
min( i
r
'
,
g
'
,
b
'
=
=
=
Đặt
i − min(
r , bgr ),
i
i − min(
g , bgr ),
i
bi − min( , bgr ),
i
−
−
−
b
,'
khi
r
max(
, gvàbgr ),
min(
, bgr ),
+
=
=
g
,'
khi
r
max(
, gvàbgr ),
min(
, bgr ),
−
=
≠
r
,'
gkhi
max(
, bvàbgr ),
min(
, bgr ),
+
=
=
h
=
b
,'
gkhi
max(
, bvàbgr ),
min(
, bgr ),
−
=
≠
g
,'
bkhi
max(
, rvàbgr ),
min(
, bgr ),
+
=
=
r
,'
khác
−
5 ⎧ ⎪ 1 ⎪ ⎪⎪ 1 ⎨ 3 ⎪ ⎪ 3 ⎪ ⎪ 5 ⎩
Minh hoạ thành phần cường độ sáng i thay đổi:
Hình 21: Không gian màu HSI
Nguyễn Bá Công – Nguyễn Hữu Đức
29
Hình 22: Minh họa sự thay đổi cường độ sáng trong hệ màu HSI
Chương 2: Các khái niệm cơ bản
Với các đặc tính trên, mô hình màu HSI có các ưu điểm sau:
o Dễ cảm nhận, phù hợp với cảm nhận mắt người.
o Dễ định lượng, tách bạch thành phần màu và độ sáng.
Với 2 ưu điểm trên, mô hình màu rất thích hợp cho bài tóan truy tìm
ảnh. Do đó, chúng em chọn mô hình màu HSI cho bài tóan truy tìm ảnh dựa
vào đặc trưng màu sắc.
2.1.4 Các đặc trưng về màu sắc
2.1.4.1 Lược đồ màu (Histogram)
Là đại lượng đặc trưng cho phân bố màu cục bộ của ảnh .
)
,
i
(
,
)
=
CIH D
i
CIm ( D ( In )
D
Được định lượng:
Ci là màu của điểm ảnh.
n(ID).Tổng số điểm ảnh trong ảnh.
m(ID,Ci)thể hiện số điểm ảnh có giá trị màu Ci.
H: lược đồ màu của ảnh.
Mặc dù lược đồ màu cần tính là rất lớn (224 màu), tuy nhiên do mức
độ cảm nhận của mắt con người còn hạn chế nên thật sự chúng ta không
thể phân biệt được một lượng màu lớn như vậy. Do đó chúng em đề nghị
sử dụng hệ màu HSI (12 H, 3 S, 3 I) và thêm 5 mức xám. Vì vậy chúng ta có 113 màu đại diện cho 224 màu trong việc tìm kiếm.
Lược đồ màu bất biến đối với phép quay và tịnh tiến ảnh, và nếu
chuẩn hoá lược đồ màu sẽ bất biến đối với phép co giãn .
Độ đo tính tương tự về màu sắc giữa lược đồ màu của ảnh truy vấn
Nguyễn Bá Công – Nguyễn Hữu Đức
30
H(IQ)và lược đồ màu của ảnh trong cơ sở dữ liệu ảnh H(ID):
Chương 2: Các khái niệm cơ bản
M
min(
( IH
,
), IHj (
,
j
))
Q
D
1
j
,
I
)
∑ ==
( ID H
Q
D
M
( IH
,
j
)
D
∑
1
j
=
Công thức trên cho ta thấy, tính tương tự về màu sắc được tính
bằng phần giao của 2 lược đồ màu ảnh truy vấn H(IQ) và ảnh trong cơ sở
dữ liệu ảnh H(ID). Kết quả sẽ là một lược đồ màu thể hiện độ giống nhau
giữa 2 ảnh trên.
Tuy nhiên vì lược đồ màu chỉ thể hiện tính phân bố màu toàn cục
của ảnh mà không xét đến tính phân bố cục bộ của điểm ảnh nên có thể có
2 ảnh trông rất khác nhau nhưng lại có cùng lược đồ màu. Để khắc phục
được tình trạng này, chúng ta dùng phân hoạch lưới ô vuông trên ảnh.
Lược đồ màu của ảnh là không duy nhất.
Ví dụ minh hoạ ảnh trong hệ màu RGB và HSI:
Hình 23: Ảnh trong hệ màu RGB
Nguyễn Bá Công – Nguyễn Hữu Đức
31
Hình 24: Ảnh trong hệ màu HSI
Chương 2: Các khái niệm cơ bản
Hình 25: Lược đồ màu của ảnh sau khi lượng hoá
2.1.4.2 Vector liên kết màu (Color Coherence Vector)
Là lược đồ tinh chế lược đồ màu, chia mỗi ô màu (bin) thành 2
nhóm điểm ảnh: Nhóm liên kết màu (coherence pixels) và nhóm không
liên kết màu (non-coherence pixels)
Một pixel trong 1 ô màu (bin) được gọi là điểm liên kết màu
(coherent) nếu nó thuộc vùng gồm các màu tương tự với kích thướt lớn
(thường bằng khoảng 1%b kích thướt ảnh)
Với mỗi ô màu (bin) giả sử số điểm liên kết màu là α và số điểm
không liên kết màu là β thì vector liên kết màu được xác định:
Vc=[(α1,β1), (α2,β2), …,(αn,βn)], n là số ô màu (bin)
Độ đo tính tương tự giữa 2 ảnh dựa trên đặc trưng vector liên kết
n
,
I
)
(|
|
|
|)
=
+
−
( ID c
Q
D
αα − D
Q
β Q
β D
j
j
j
j
∑
j
1
=
Nhận xét:
màu:
Ngoài việc sử dụng đặc trưng liên kết màu cho việc tìm kiếm
ảnh, đặc trưng này còn có thể được sử dụng cho việc phân biệt cảnh
thiên nhiên và cảnh thành phố:
Ảnh thiên nhiên (núi, cảnh thiên nhiên, hoàng hôn)có khuynh
hướnh có số điểm liên kết màu nhiều hơn số điểm không liên kết
Nguyễn Bá Công – Nguyễn Hữu Đức
32
màu .Còn cảnh thành phố có khuynh hướng có số điểm liên kết màu
Chương 2: Các khái niệm cơ bản
và số điểm không liên kết màu gần như nhau. Vì vậy có thể dùng
vector liên kết màu làm đặc trưng phân biệt cảnh thiên nhiên và cảnh
thành phố.
Chỉ dùng đặc trưng lược đồ màu khó phân biệt ảnh thiên
nhiên và ảnh thành phố.
Ngòai ra vector liên kết màu còn giúp giải quyết khuyết điểm
về tính không duy nhất của lược đồ màu đối với ảnh. Hai ảnh có thể
có chung lược đồ màu nhưng khác nhau hòan tòan, đây là khuyết
điểm của lược đồ màu. Nhưng với tìm kiếm theo đặc trưng vector
liên kết màu thì nó sẽ giải quyết được khuyết điểm không duy nhất
này.
Ví dụ minh hoạ các điểm liên kết màu trong ảnh:
Hình 26: Ảnh trong hệ màu RGB
Hình 27: Ảnh trong hệ màu HSI
Nguyễn Bá Công – Nguyễn Hữu Đức
33
Hình 28: Màu đỏ thể hiện liên kết màu trong ảnh
Chương 2: Các khái niệm cơ bản
Hình 29: Lược đồ vector liên kết màu của ảnh sau khi được lượng hoá
1
2
2
a
I
S
cos
H
S
cos
H
sin
H
S
sin
H
I
=
−
+
−
+
−
)
(
)
( S
)
kl
l
k
l
k
l
k
l
l
k
k
] 2/12
[ (
5
Công thức thể hiện 2 màu giống nhau:
Sau khi tính được akl thì chọn ngưỡng nào đó thoả 2 màu liên kết
nhau.
2.1.4.3 Đặc trưng tự tương quan màu (AutoCorrelogram)
Đặc trưng tương quan màu biểu diễn sự thay đổi mối quan hệ về
không gian giữa các cặp màu theo khoảng cách. Lược đồ màu chỉ ghi
nhận được sự phân bố màu trong ảnh mà không chứa các thông tin mối
quan hệ về khoảng cách.
Ký kiệu:
Gọi I là một ảnh có kích thước n x n. Các màu trong I được
p
x y ( ,
)
I
=
rút gọn vào m khoảng (bin) c1, …cm.
∈ , gọi I(p) là màu của pixel p.
p I p | (
)
=
=
Với mỗi pixel
{
} c
cI
p I I p
, (
)
∈
p
I∈ tương đương với
c =
Đặt
c
Khi đó, ký hiệu
Để thống nhất, ta sử dụng quy tắc L∞ để đo khoảng cách giữa
Nguyễn Bá Công – Nguyễn Hữu Đức
34
các pixel. Ví dụ, với các pixel p1=(x1,y1), p2=(x2,y2) thì
Chương 2: Các khái niệm cơ bản
|p1-p2|=max{|x1-x2|,|y1-y2|}.
Quy ước {1,2,…n} = [n].
Định nghĩa:
[ i m∈
]
= ⋅
h n c i
⎡ p I ∈⎣ c i
⎤ ⎦(1)
2 Pr p I ∈
2
( ) /
n
là: Lược đồ màu h của I với mỗi
ich I
trong đó với mỗi pixel trong ảnh, là xác suất xuất
i của pixel.
d
hiện màu c
[ ] n∈
. Khi đó, Correlogram của I Chọn một khoảng cách
k
=
∈
−
=
) ( ) I
p 2
I p p c 2 1
( k γ c c , i
j
j
⎡ ⎣
⎤ ⎦ ,
Pr p I p I , ∈ ∈ ci 2 1
i
,
d
, ∀ ∈
∈
được định nghĩa như sau:
[ j m k
]
[
]
)
(2)
c cγ là xác suất tìm thấy một
( k ,i
j
Với mỗi pixel có màu ci trong ảnh,
pixel có màu cj cách pixel ban đầu một khoảng cách là k. Kích thước của Correlogram là O(m2d).
Khi chọn d để tính Correlogram, chúng ta cần chú ý vấn đề sau:
giá trị d lớn thì cần nhiều chi phí tính toán và không gian lưu trữ, giá trị d
nhỏ có thể làm giảm giá trị của đặc trưng.
Tiếp theo là một số thuật toán tính Correlogram. Các thuật toán
này có thể chia nhỏ để tính toán song song nên có thể tăng tốc tính toán
rất nhiều.
I
|
=
∈
∈
−
=
) ( ) I
c
p 1
p 1
p 2
Để tính được Correlogram, điều kiện cần là phải tính được:
( k Γ c c , i
j
I p , c 2 i
j
{
} k
Nguyễn Bá Công – Nguyễn Hữu Đức
35
(4)
Chương 2: Các khái niệm cơ bản
I ( )
( ) 8 k ⋅
) ( k γ c c , i
j
( k =Γ c c , i
j
h I c i
) ( ) ( I
với . Mẫu số là tổng số số
)
pixel cách pixel có màu ci một khoảng cách là k (hệ số 8k là do tính
chất của L∞ ).
Thuật toán này có ý tưởng chính như sau: với mỗi p1∈I của
màu ci và với mỗi k∈ [d], tính tổng số các p2∈I của màu cj với |p1- p2|L∞=k. Thuật toán này có độ phức tạp O(n2d2).
k
x
i y ,
I
| 0
k
=
+
∈
i ≤ ≤
)
)
c
, c h λ ( , x y
Để giảm chi phí tính toán, ta định nghĩa các đại lượng sau:
k
x y ,
I
| 0
k
=
i ≤ ≤
)
) i + ∈
c
{ ( { (
} }
, c v λ ( , x y
) ( ) (
(5,6)
Đại lượng này đếm số pixel có màu c cách pixel gốc (x,y) một
khoảng nhỏ hơn k theo chiều ngang (horizontal, hay chiều dọc
(vertical).
c h , x yλ và ( ) ,
c v , x yλ . Khi tính cần chia làm 2 trường hợp đại lượng d có giá trị nhỏ ( ,
)
Khi đó, để tính Correlogram thì trước tiên phải tính
∈
(độ phức tạp O(n2d)) và d có giá trị lớn (độ phức tạp O(n3dw-3) với
w [2,3)).
k
k
=
(cid:153) Quy hoạch động: khi giá trị d nhỏ
)
) 1 − +
,
c h , λ ( x y ,
c h , λ ( x y ,
c h , λ + ( x k y
) ( ) 0
(7) Để dàng kiểm chứng: ) ( ) (
1= nếu p∈Ic và 0 nếu ngược lại.
( ) c h , 0 pλ
với quy ước
)
( ,c h kλ p
Ta tính cho mọi p∈Ic với mỗi k=1,…d theo
,c v
công thức (7). Khi đó, với mỗi k ta mất chi phí O(n2) nên chi phí tổng cộng là O(n2d).
pλ . Ta có công thức tổng quát:
Nguyễn Bá Công – Nguyễn Hữu Đức
36
ới Tương tự v
Chương 2: Các khái niệm cơ bản
2
k
2
k
2
k
2
2
Γ
=
+
+
−
+
2k −
) ( ) I
)
)
)
)
+
−
− + 1
− + 1
( k c c , i
j
) (
c h , λ j ( − x k y k ,
) (
c v , λ j ( − x k y k ,
) (
c v , λ j ( + x k y k ,
) (
( c h , λ j ( − x k y k ,
)
x y ,
∑ ) ∈ I
(
ci
Độ phức tạp của công thức trên là O(n2). Độ phức tạp của toàn thuật toán là O(n2d) nhưng với hằng số
d nhỏ thì độ phức tạp tương đương O(n2).
(cid:153) Nhân ma trận: khi giá trị d lớn
Khi giá trị d lớn và cách xa nhau thì thuật toán trên không còn
được tối ưu. Khi đó ta sẽ sử dụng phương pháp quy hoạch động
phức tạp hơn – thuật toán nhân ma trận nhanh.
)
( ,c h kλ p
) 1
)
I p (
c
= ⇔
= . Sau
thành phép nhân ma Trước tiên, ta chuyển việc tính
cI p (
trận. Đặt Ic là ma trận 0–1 cấp n x n với
T
y
1 −
k }} 0,...0,1,...,1, 0..., 0
đó định nghĩa N1 là ma trận cấp n x nd với cột thứ (nk+y), y∈ [n],
⎡ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎦
,
y
+
=
k∈ [d] là . Dễ dàng kiểm chứng
(
)
1
)[ I N x nk c
]
) ( , c h kλ ( x y ,
.
Σ
Tiếp theo ta dùng ma trận N2 dùng tích luỹ kết quả
cN1 với mỗi khoảng cách k∈ [d] và
n x
k ) (2 )
λ= 1 (
c h , x k y k , −
+
từ phép nhân I
mỗi cột y∈ [n]. Để tích luỹ tổng này, cột thứ k của N2 có dạng
[1,2,…,2k+1,2k+1,…,2k+1,2k…,1]. Với N2 nhân vào bên phải IcN1,
((
)
,
]
k (2 )
= Σ
kết quả của n x d phép nhân thể hiện bằng tổng trên
n x
I N N y k c
2 )[
1
)
λ= 1 (
c h , x k y k , −
−
). (
Ta có (IcN1)N2=Ic(N1N2), mặt khác N1N2=N là ma trận kích
thước n x d. Khi đó, thuật toán tính trước N với n được cho và sử
Σ
dụng phép nhân ma trận nhanh để tính IcN. Bằng cách thêm từng cột
k ) (2 )
x y ( ,
c h , λ∈ ) ( x k y k , I −
+
Nguyễn Bá Công – Nguyễn Hữu Đức
37
trong phép nhân, chúng ta có thể tính , thành
Chương 2: Các khái niệm cơ bản
Γ
) ( ) I
( k ,i c c
j
phần thứ nhất của . Tương tự, ta có thể tính 3 thành phần
còn lại.
∈
Chi phí của thuật toán này là chi phí của phép nhân IcN, ma
(thực nghiệm, trận 0–1 kích thước n x n với ma trận nguyên kích thước n x d. Do đó, chi phí của thuật toán là O(n3dw-3) với w [2,3)
thuật toán Strassen có w ≈ 2,7).
2.2. Vân (textture)
2.2.1 Khái niệm
Vân (texture), đến nay vẫn chưa có một định nghĩa chính xác cụ thể về
vân, là một đối tượng dùng để phân hoạch ảnh ra thành những vùng được quan
tâm và để phân lớp những vùng đó. Vân cung cấp thông tin sự sắp xếp về mặt
không gian của màu sắc và cường độ của một ảnh. Vân được đặc trưng bởi sự
phân bổ không gian của những mức cường độ trong một khu vực láng giềng
với nhau. Vân của ảnh màu và vân đối với ảnh xám là như nhau. Vân gồm
nhiều vân gốc hay vân phần tử gộp lại, đôi khi được gọi là texel. Xét về vấn đề
phân tích vân, có hai đặc trưng chính yếu nhất:
(cid:131) Cấu trúc vân: vân là tập hợp những texel được sắp xếp theo một số
quy luật nhất định hay có cấu trúc không gian lặp đi lặp lại
(cid:131) Sự thống kê vân được định nghĩa như sau: vân là một độ đo về số
lượng của sự sắp xếp những mức xám hay cường độ sáng trong
vùng. Một vân bất kỳ có thể coi như là một tập của những texel thô
trong một quan hệ không gian đặc biệt nào đó. Một cấu trúc không
gian của một vân bất kỳ sau đó có thể bao gồm một sự mô tả của
texel và một đặc tả về không gian. Những texel đương nhiên phải
được phân đoạn và quan hệ không gian phải được tính toán một cách
thật hiệu quả. Texel là những vùng ảnh có thể trích rút từ một số
Nguyễn Bá Công – Nguyễn Hữu Đức
38
hàm phân ngưỡng đơn giản. Đặc điểm quan hệ không gian của
Chương 2: Các khái niệm cơ bản
chúng có thể miêu tả như sau: Giả sử rằng chúng ta có tập những
texel, với mỗi phần tử của tập hợp này ta có thể đặc trưng bởi một
điểm ý nghĩa nhất, điểm này gọi là trọng tâm. Đặt S là tập của những
điểm này. Với mỗi cặp điểm P và Q trong tập S, ta có thể xây dựng
đường phân giác trực giao nối chúng lại với nhau. Đường phân giác
trực giao này chia mặt phẳng thành hai nửa mặt phẳng, một trong
chúng là tập của những điểm gần với P hơn và cái còn lại là tập những điểm gần với Q hơn. Đặt HQ(P) là nửa mặt phẳng gần P hơn.
Ta có thể lặp lại quá trình này với mỗi điểm Q trong S. Đa giác
PV (
)
Q PH (
Voronoi của P là vùng đa giác bao gồm tất cả những điểm gần P hơn
= I
#,
PQSQ∈
những điểm khác của S và được định nghĩa: )
2.2.2 Một số loại vân tiêu biểu
Hình 30: Các ví dụ về vân
2.2.3 Ma trận đồng hiện (Co-occurrence Matrix)
Ma trận đồng hiện là ma trận lưu trữ số lần xuất hiện của những cặp
điểm ảnh trên một vùng đang xét. Các cặp điểm này được tính theo những quy
luật cho trước.
Nguyễn Bá Công – Nguyễn Hữu Đức
39
Ví dụ với ảnh f như sau:
Chương 2: Các khái niệm cơ bản
f
=
=
ta có ma trận đồng hiện p
(1,0), với
)0,1(P
2200
204 022 200
⎤ ⎥ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎣
2200
0011 ⎡ ⎢ 0011 ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎦
(lưu ý là có rất nhiều ma trận đồng hiện khác nhau cho một ma trận
ban đầu)
Ma trận đồng hiện trên tạo ra bởi những cặp điểm lệch nhau (1,0) –
nghĩa là 2 điểm kế nhau trên cùng hàng. Giá trị tại dòng 0, cột 0 của ma trận
đồng hiện trên là 4 vì ảnh f có 4 cặp điểm 0 0 kế nhau trên cùng một hàng.
Tương tự như vậy, giá trị ở dòng 1, cột 2 của ma trận là 0 vì không có cặp 1 2
nào xuất hiện nhau trên cùng một hàng.
j ],[
cr |],{[|
crf ),(
rfvài (
t
)
j |}
trong
tđó
(
t
,
t
)
=
=
+
+
=
=
iC t
ct , x
y
y
x
Công thức tổng quát của ma trận đồng hiện là:
Ví dụ với ma trận f đã cho như trên thì khi t=(1,0) ta sẽ có ma trận
đồng hiện như ví dụ trên, và khi t=(1,1), nghĩa là tìm những cặp điểm kế
=
)1,1(P
202 112 100
⎤ ⎥ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎣
nhau trên cùng một đường chéo, ta có ma trận đồng hiện là:
Từ ma trận đồng hiện người ta định nghĩa ra các đặc trưng về vân
như sau:
],[2 j
iP t
∑∑
i
j
(cid:153) Energy:
log],[ j
(
j
])
2
iP t
,[ iP t
∑∑
i
j
(cid:153) Entropy:
(cid:153) Maximan Probability:
iPt
max ji ,
Nguyễn Bá Công – Nguyễn Hữu Đức
40
],[ j
Chương 2: Các khái niệm cơ bản
k
i
j
|
],[ j
l iP t
∑∑ − |
i
j
(cid:153) Contrast (thông thường k=2 và l=1)
,
i
j
≠
∑∑
l ],[ iP j t k | | i j −
i
j
(cid:153) Inverset difference moment:
)(
],[ j
( ui −
−
) iPuj j
t
i
∑∑
i
j
aa i
j
u
])
u
])
=
=
(cid:153) Correlation
i
jiP .[ t
j
jiP .[ t
∑ ∑ i (
∑ ∑ j (
i
j
j
i
1 =
1 =
2
a
((
)
j ],[
=
ui −
i
i
iP t
∑
∑
i
j
1 =
2
a
((
)
j ],[
=
uj −
j
j
iP t
∑
∑
j
i
1 =
,
Thuật tóan tính ra các đặc trưng vân từ ma trận đồng hiện
(cid:153) Xây dựng các ma trận đồng hiện với nhiều t khác nhau.
(cid:153) Tính 6 đặc trưng của texture ứng với mỗi ma trận đồng hiện đã
xây dựng ở bước 1
2.2.4 Phép biến đổi Wavelet
Vân thu được từ biến đối wavelet được hầu hết các nghiên cứu công
nhận là đặc trưng về vân tốt nhất cho việc phân đoạn ảnh.Từ một vùng kích
thước nxn ta có thể thu được một vector có 3 thành phần đặc trưng cho texture
với biến đối wavelet ở mức 1. Để có được 3 thành phần này, chúng ta áp dụng
biến đổi wavelet Daubechies-4 hoặc bộ lọc Haar với thành phần L của ảnh. Sau
khi áp dụng 1 mức biến đổi, chúng ta sẽ có 4 miền tần số (frequency band) thì
khi đó một thành phần vector sẽ được tính bằng giá trị trung bình của vùng trên
miền tần số tương ứng ấy. Ví dụ, ta xét trên vùng 4x4, thông qua biến đổi
Daubechies-4, ta có 4 miền tần số là LL, HL, LH, HH như ở Hình 4, từ 4 miền
Nguyễn Bá Công – Nguyễn Hữu Đức
41
đó, ta có được 3 thành phần tương ứng với giá trị ở các miền HL, LH và HH.
Chương 2: Các khái niệm cơ bản
Hình 31: Decompostion để tạo ra các frequency bands bởi biến đổi Wavelet Như vậy với một hình có kích thước 4x4 như trong ví dụ trên thì
cc , , lk k l ,1 +
c , c , lk 1, k +
l 1,1 ++
thành phần ứng với HL (giả sử HL bao gồm ) sẽ được
1 2
2
f
=
(
c
i
,
i
j
)
+
+
1 1 ∑ ∑ 0 0
1 4
tính:
Tính tóan tương tự cho các vùng LH, HH:
Thuật tóan tính ra các đặc trưng vân theo biến đổi Wavelet:
o Tính biến đổi Wavelet trên toàn ảnh.
o Ứng với mỗi vùng cần tính, ta tính được 3 thành phần ứng
với các miền HL, LH và HH
o Khi áp dụng biến đổi wavelet ở những mức sâu hơn, ta sẽ
có tương ứng 3xV thành phần ứng với V là chiều sâu của
biến đổi Wavelet.
Lưu ý: Một cải tiến khác sẽ đem lại hiệu quả rất nhiều cho việc phân
đọan là áp dụng DWF (discrete wavelet frames). Cách thức trên được khá
Nguyễn Bá Công – Nguyễn Hữu Đức
42
nhiều nghiên cứu khác đã vận dụng và thành công.
Chương 2: Các khái niệm cơ bản
2.3. Hình dáng
2.3.1 Khái niệm về biên cạnh
Biên cạnh là đối tượng phân cách giữa 2 vùng ảnh thuần nhất có độ
sáng khác nhau (Biên là nơi có biến thiên về độ sáng). Tập hợp các điểm biên
tạo thành biên hay đường bao của ảnh (boundary). Ví dụ, trong một ảnh nhị
phân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm
trắng lân cận. Trong bài toán truy tìm ảnh, biên được sử dụng cho việc tìm
kiếm những ảnh có cùng hình dáng với nhau. Để hình dung tầm qua trọng của
biên ta xét đến ví dụ sau: khi người hoạ sĩ vẽ một cái bàn gỗ, chỉ cần vài nét
phát thảo về hình dáng như mặt bàn chân bàn mà không cần thêm các chi tiết
khác, người xem đã co 1thể nhận ra đó là cái bàn. Nếu ứng dụng của ta là phân
lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn thành. Tuy nhiên nếu
đòi hỏi thêm các chi tiết khác như vân gỗ hay màu sắc, … thì với chừng ấy
thông tin là chưa đủ. Nhìn chung về mặt toán học, người ta coi điểm biên của
ảnh là điểm có sự biến đổi đột ngột về độ xám. Nhìn chung về mặt toán học,
người ta có thể coi điểm biên của ảnh là điểm có sự biến đổi đột ngột về độ
xám như chỉ ra trong hình sau:
Nguyễn Bá Công – Nguyễn Hữu Đức
43
Hình 32: Đường bao của ảnh
Chương 2: Các khái niệm cơ bản
Như vậy phát hiện biên một cách lý tưởng là xác định được tất cả các
đường bao trong các đối tượng. Định nghĩa toán học của biên ở trên là cơ sỡ
cho các kỹ thuật phát hiện biên.
2.3.2 Các phương pháp phát hiện biên
xfkjh
),(
(
yj ,
k
)
=
−
−
∑ ) yxg ,( Trong đó:
Phương pháp chung:
g(x,y):ảnh kết quả
h(j,k): ảnh góc
f(x-j,y-k): mặt nạ
Có 2 phương pháp phát hiện biên:
2.3.2.1 Phát hiện biên trực tiếp
Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá
trị độ sáng của điểm ảnh. Kỹ thuật chủ yếu dùng phát hiện biên ở đây là
kỹ thuật đạo hàm. Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp
gradient, nếu lấy đạo hàm bậc 2 ta có kỹ thuật Laplace.
o phát biểu phương pháp Gradient (Mức độ biến thiên lớn
nhất của hàm ảnh)
Phương pháp gradient là phương pháp dò biên cục bộ
dựa vào cực đại của đạo hàm. Theo định nghĩa gradient là một
vector các thành phần biểu thị tốc độ thay đổi giá trị của điểm
ảnh theo 2 hướng x và y.
Gradient của f(x,y)
▼f(x,y)=[∂f(x,y)/∂x,∂f(x,y)/∂y]=[fx,fy]
2)1/2
Biên độ:
2 + fy
C(x,y)=(fx
Hứơng
Nguyễn Bá Công – Nguyễn Hữu Đức
44
Ф (x,y)=arctan(fy/fx)
Chương 2: Các khái niệm cơ bản
Hình 33: Gradient của ảnh theo hướng θ
o Phương pháp Laplace:
Toán tử Laplace do gradient theo một số hướng đã
chọn. Nếu ta ký hiệu gk là gradient Laplace theo hướng θ=Л/2
+ 2kЛ với k=0,1,…,7. Do vậy ta đo gradient E theo 8 hướng ngược chiều kim đồng hồ, mỗi hướng cách nhau 450 theo
ngược chiều kim đồng hồ.
Hình 34: Mô hình 8 hướng
▼f(x,y)=[∂f2(x,y)/∂x2,∂f(x,y)2/∂y2]
Rời rạc hoá toán tử Laplace
Nguyễn Bá Công – Nguyễn Hữu Đức
45
(cid:57) Sai phân bậc 1:
Chương 2: Các khái niệm cơ bản
{
xf yf
yx ),( yx ),(
yxf ),( yxf ),(
Δ Δ
= =
− −
xf y ) ( ,1 − )1 ,( yxf −
),1(
),1(
)1,(
),(2 yxfyxfyxfyxf ∇ +−++=
++
yxf ),(4)1,( yxf −−
(cid:57) Sai phân bậc 2:
Mặt nạ:
1 1 1 0 1 0
1 -8 1 1 -4 1
1 1 1 0 1 0
Lân cận 4 Lân cận 8
Đánh giá 2 phương pháp trên:
Khi độ sáng thay đổi rõ nét thì phương pháp Gradient làm
việc tốt .Phương pháp Laplace làm việc tốt hơn với nhiễu.
Do 2 kỹ thuật trên không hiệu quả với nhiễu nên sau khi cài
xong một trong 2 thuật toán trên ta cần tìm cách làm mảnh biên. Sau
đây là thuật toán làm mảnh biên:
Thuật toán làm mảnh biên (Non Maximal Suppression):
Bước 1: Định lượng Edge Directions trong lân cận 8
Bước 2: Với mỗi pixel có e(x,y)#0, khảo sát 2 điểm lân cận
Nguyễn Bá Công – Nguyễn Hữu Đức
46
theo hướng cạnh
Chương 2: Các khái niệm cơ bản
Bước 3: Nếu e(x’,y’)>e(x,y) thì đánh dấu (x’,y’ thuộc lân
cận đang xét của x,y)
Bước 4: Duyệt lại toàn bộ ảnh, xóa bỏ các điểm có e(x,y)#0
và bị đánh dấu.
Ví dụ minh họa:
Hình 35: Ảnh minh họa mảnh biên Sau khi dùng phương pháp Gradient phát hiện biên ta được:
Hình 36: Ảnh sau khi dùng phương pháp Gradient phát hiện biên
Nguyễn Bá Công – Nguyễn Hữu Đức
47
Sau khi dùng thuật tóan làm mảnh biên ta thu được kết quả như sau:
Chương 2: Các khái niệm cơ bản
Hình 37: Ảnh sau khi được làm mảnh biên
Các bộ lọc thông dụng dùng trong kỹ thuật Gradient
Lọc Sobel
1 0 -1 -1 -2 -1
2 0 -2 0 0 0
1 0 -1 2 1 1
Lọc Prewitt
1 1 1 -1 0 1
0 0 -1 0 1
-1 -1 -1 -1 0 1
2.3.2.2 Phương pháp phát hiện biên gián tiếp
Nếu bằng cách nào đấy, ta phân được ảnh thành các vùng thì đường
phân ranh giữa các vùng đó chính là biên. Việc phân vùng ảnh thường
được dựa vào kết cấu (texture) bề mặt của ảnh.
Cần lưu ý rằng kỹ thuật dò biên và phân vùng ảnh là 2 bài toán đối
ngẫu nhau. Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi
đã phân lớp xong có nghĩa là đã phân vùng được ảnh. Và ngược lại khi đã
phân vùng, ảnh được phân thành các đối tượng, ta có thể phát hiện được
biên. Phương pháp dò biên trực tiếp khá hiệu quả và ít chịu ảnh hưởng của
nhiễu. Song nếu sự biến thiên độ sáng không đột ngột, phương pháp này
tỏ ra kém hiệu quả. Phương pháp dò biên gián tiếp tuy khó cài đặt, song
lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ.
Nguyễn Bá Công – Nguyễn Hữu Đức
48
Ngoài ra chúng ta còn có thể dò biên theo Quy Hoạch Động
Chương 2: Các khái niệm cơ bản
Như đã nói dò biên theo phương pháp Gradient là xác định cực trị
cục bộ của Gradient theo các hướng; còn phương pháp Laplace dựa vào
cắt điểm không của đạo hàm bậc 2. Phương pháp dò biên theo Quy Hoạch
Động là phương pháp tìm cực trị tổng thể của các quá trình nhiều bước.
Nó dựa vào nguyên lý tối ưu của Bellman. Nguyên lý này phát biểu như
sau: “ Con đường tối ưu giữa 2 điểm cho trước cũng là tối ưu giữa 2 điểm
bất kỳ nằm trên đường tối ưu đó”.
Thí dụ, nếu C là 1 điểm trên con đường tối ưu giữa A và B thì đoạn
CB cũng là con đường tối ưu từ C đến B không kể đến ta đến C bằng cách
nào.
Hình 38: Minh họa nguyên lý Bellman
2.3.3 Các đặc trưng về biên cạnh
2.3.3.1 Lược đồ hệ số góc (Edge Direction Histogram)
Lược đồ gồm 73 phần tử trong đó:72 phần tử đầu chứa số điểm ảnh
có hệ số gốc từ 0 – 355 độ, các hệ số góc này cách nhau 5 độ. Phần tử
cuối chứa số phần tử không nằm trên biên cạnh .
Cần chuẩn hóa các đặc trưng này để thích hợp với kích thước khác
,
,
1,0[
,...,
]71
,
)
i
( IH
i
=
∈
D
) i )
( Im ( n
D I
E
D
Nguyễn Bá Công – Nguyễn Hữu Đức
49
nhau của ảnh:
Chương 2: Các khái niệm cơ bản
H
)72(
=
H )72( DIn ) (
m(ID,i) là số điểm ảnh thuộc biên cạnh có hệ số gốc là αi=i*5
nE(ID) là tổng số các điểm ảnh thuộc biên cạnh
n(ID) là tổng số điểm ảnh của ảnh ID
Ví dụ minh hoạ về lược đồ hệ số góc của ảnh:
Hình 39: Ảnh minh họa lược đồ hệ số góc
Hình 40: Đường biên của ảnh
Nguyễn Bá Công – Nguyễn Hữu Đức
50
Hình 41: Lược đồ hệ số góc của ảnh
Chương 2: Các khái niệm cơ bản
2.3.3.2 Vector liên kết hệ số góc (Edge Direction Coherence
Vector):
Là lược đồ tinh chế lược đồ hệ số góc, chia mỗi ô chứa (bin) thành
2 nhóm điển ảnh: Nhóm điểm liên kết hệ số góc (coherent pixels) và
nhóm điểm không liên kết hệ số góc (non-coherence pixels).
Một pixel trong một ô chứa (bin) được gọi là điểm liên kết hệ số
góc (coherent) nếu nó thụôc vùng gồm các điểm thuộc cạnh có hệ số góc
tương tự với kích thướt lớn (thường vào khoảng 0.1% kíh thướt ảnh).
Với mỗi ô chứa (bin) giả sử số điêm liên kết hệ số góc là α và số
điểm không liên kết hệ số góc là β thì vector liên kết hệ số góc được xác
định:
VE=[(α1,β1),(α2,β2),..,(αn,βn)], n là số ô màu (bin)
Độ đo tính tương tự giữa 2 ảnh dựa trên đặc trưng vector liên kết
n
−
−
IID ,( ) DQE
Q j
D j
Q j
=∑ (| | | + ββαα D j
|)
j 1 =
hệ số góc:
Nhận xét:
Chỉ cần dùng 145 đặc trưng cho mỗi ảnh (72 x2 +1)
Ảnh thành phố có khuynh hướng tạo các điểm liên kết hệ số
góc theo hướng ngang dọc
Ảnh thiên nhiên có khuynh hướng ít tạo các điểm liên kết hệ
số góc theo hướng ngang dọc .
Vì vậy nó là đặc trưng có ưu điểm hơn lược đồ hệ số góc đối
với việc phân lớp ảnh thiên nhiên và thành phố .
Do đó khi tìm kiếm cảnh thành phố người sử dụng nên chọn
đặc trưng lược đồ hệ số góc hay vector liên kết hệ số góc.
Nguyễn Bá Công – Nguyễn Hữu Đức
51
Ví dụ minh họa ảnh và lược đồ vector liên kết hệ số góc:
Chương 2: Các khái niệm cơ bản
Hình 42: Ảnh minh họa vector liên kết hệ số góc
Hình 43: Ảnh minh họa sự liên kết giữa các biên cạnh
Màu đỏ là thể hiện những điểm liên kết với nhau
Hình 44: Lược đồ vector liên kết hệ số góc của ảnh
2.3.4 Vùng và các đặc trưng về vùng
Ảnh gồm tập hợp các vùng hay còn gọi là vần. Đây là đặc trưng cấp cao
của ảnh. Với đặc trưng vùng sẽ giúp cho chúng ta có thể giải quyết được một
vấn đề lớn đang cản trở bước phát triển việc truy tìm ảnh dựa vào nội dung là
dữ liệu nhập được mô phỏng gần gũi hơn với suy nghĩ của con người và ảnh
tìm được có thể mang nội dung ngữ nghĩa rất khác so với ảnh truy vấn.
Để cho dễ diễn đạt các đặc trưng về vùng, ở đây mỗi ảnh A được chia
Nguyễn Bá Công – Nguyễn Hữu Đức
52
nhỏ thành các khối con Ki kích thước 4x4 (điểm ảnh). Các đặc trưng trong mỗi
Chương 2: Các khái niệm cơ bản
khối con gồm 3 đặc trưng: màu,3 đặc trưng về vân, và vị trí của các khối Ki
trong ảnh.
Sau khi phân đoạn ảnh thành các vùng thì các đặc trưng về vùng chính
là các đặc trưng cấp cao của ảnh. Sau đây là các đặc trưng về vùng:
2.3.4.1 Đặc trưng màu
Vì vùng Ci bây giờ gồm nhiều khối con Ki có đặc trưng màu tương
tự nhau nên chúng ta không chọn đặc trưng màu cho vùng là đặc trưng
màu trung bình vì sẽ không thể hiện được chính xác phân bố màu trong
vùng , vì vậy chúng em chọn đặc trưng lược đồ màu ứng với mỗi vùng ,
với hệ màu HSI (Hue , Saturation , Intensity ) cùng việc định lượng không
gian màu gồm 12 H , 3 S , 3 I , ta có đặc trưng lược đồ màu:
ich
{ [j] , jє[0..107]},
ich
trong đó [j] là phần tử thứ j của lược đồ màu của vùng c i
2.3.4.2 Đặc trưng vân
Giả sử mỗi vùng có N khối con .Đặc trưng vân của mỗi khối con Ki
là { Vi1 , Vi2 , Vi3},
N
N
N
V
V
V
V
V
V
C
1
l
1
C
3
l
3
C
2
l
2
i
i
i
Đặc trưng vân của vùng Ci là:
,
,
l
l
l
1 =
1 =
1 =
1 ⎛ = ∑ ⎜ N ⎝
⎞ ⎟ ⎠
1 ⎛ = ∑ ⎜ N ⎝
⎞ ⎟ ⎠
1 ⎛ = ∑ ⎜ N ⎝
⎞ ⎟ ⎠
2.3.4.3 Đặc trưng hình dáng
Là đặc trưng cấp cao góp phần quan trọng trong việc truy tìm ảnh
phù hợp hơn về mặt ngữ nghĩa.
=
DTCi
| Ci
| A
| |
Nguyễn Bá Công – Nguyễn Hữu Đức
53
Đặc trưng thứ nhất đặc tả diện tích của vùng:
Chương 2: Các khái niệm cơ bản
|
|
=
iC
, yx
∑ ) ∈
(
1 iC
|
A
| =
là số điểm ảnh trong vùng Ci là số điểm ảnh trong ảnh A
,
∑ 1 ) Ayx ∈
(
Đặc trưng thứ 2 đặc tả vị trí của vùng:
Vị trí này chính là trọng tâm của vùng , điểm này có thể nằm
trong vùng , tuy nhiên điều này không quan trọng vì khoảng cách
VT
|/
C
,|
|/
C
|
=
C
i
i
i
x C
, yx
y C
, yx
∑ ) ∈
(
∑ ) ∈
(
i
i
⎞ ⎟ ⎟ ⎠
⎛ ⎜ ⎜ ⎝
so sánh giữa các vùng không phụ thuộc điều này .
x,y là vị trí điểm ảnh trong vùng Ci,
| Ci | số điểm ảnh trong vùng Ci
Đặc trưng thứ 3 diễn tả tính Compact của vùng:
(
,
)
(
)
|
|
|
=
−
+
−
+
−
+
CCd i
j
hdw m C
h C
Vw | C v
V C
w vt
VT C
VT C
L
J
i
j
L 1
i
i
j
2
|
|
w
|
|
−
+
−
w dt
DT C
DT C
com
Com C
Com C
i
j
i
j
|
Độ đo đối sánh vùng
N
N
,
)
(
)( k
(
k
))(
)( l
( al ))
=
−
−
( hd C
h C
h C
h C
h C
h C
kl
i
j
i
j
i
j
∑∑
k
l
1 =
1 =
)(k
trong đó:
h iC
là phần tử thứ k của lược đồ màu của vùng ci, N
2/1
2
2
I
I
S
cos
H
S
H
−
+
−
+
(
)
(
1
k
l
k
l
k
l
a
=
kl
2
5
S
) sin
H
S
sin
H
−
cos (
)
k
k
l
l
⎛ ⎜ ⎜ ⎝
⎞ ⎟ ⎟ ⎠
,
,
,
,
số ô màu của lược đồ màu ,
wwwww vt
dt
m
v
com
là các trọng số xác định mức độ
quan trọng của các đặc trưng màu , vân ,vùng
Nguyễn Bá Công – Nguyễn Hữu Đức
54
Ví dụ minh họa về vùng của ảnh:
Chương 2: Các khái niệm cơ bản
Hình 45: Minh họa vùng của ảnh
2.4. Độ đo
2.4.1 Khái niệm
Có một thuyết rất nổi tiếng viết rằng: Độ đo tương tự về nhận thức của
con người dựa trên một khoảng cách thích hợp trong một không gian metric
thuộc tâm lý học. Trong thuyết này, cho rằng một tập các mô hình đặc trưng
bao gồm các thuộc tính sau cho nó có thể được trình bày như là một điểm trong
một không gian đặc trưng phù hợp. Nếu D là hàm khoảng cách và k,l,m là các
đối tượng thì D cần đáp ứng các tiền đề sau:
(cid:153) D(k,l)=0 (cid:217) k≡l
(cid:153) D(k,l)≥0 khoảng cách là số dương
(cid:153) D(k,l)=D(l,k) khoảng cách có tính đối xứng
Do đó, độ đo có ý nghĩa quan trọng trong tìm kiếm ảnh dựa vào nội
dung. Độ đo mang ý nghĩa quyết định kết quả tìm kiếm sẽ như thế nào, mức
độ chính xác ra sao.
Nguyễn Bá Công – Nguyễn Hữu Đức
55
(cid:153) D(k,m) ≤ D(k,l) + D(l,m) bất đẳng thức tam giác
Chương 2: Các khái niệm cơ bản
2.4.2 Một số độ đo thông dụng
2.4.2.1 Khoảng cách Minkowsky:
/1
S
S
−
),( lkD M
x ik
x il
⎡ = ∑ ⎢ ⎣
⎤ ⎥ ⎦
Trong đó:
D(k,l): là khoảng cách từ đối tượng k đến đối tượng l
d : là số chiều của không gian .
: là toạ độ thứ i của đối tượng k. xik
: là đối tượng thứ i của đối tượng l. xil
2.4.2.2 Độ đo khoảng cách min-max:
Được thực hiện trên ý tưởng lấy phần giao của 2 lược đồ cần so
sánh, ta sẽ được một lược đồ, tính tổng các giá trị có được từ lược đồ này
cho ta được độ đo min-max. Khỏang cách min-max thể hiện sự tương tự
d
),( lkD
min(
x
)
=
, ik x
il
∑
i
1 =
giữa 2 lược đồ. Công thức:
2.4.2.3 Khoảng cách Euclide L2:
Được thực hiện trên ý tưởng lấy hiệu giữa các bin của 2 lược đồ.
Khác với khỏang cách min-max, nó thể hiện sự khác nhau giữa 2 lược
2/1
d
2
x
x
−
(
)
lkD ),( E
ik
il
i
1 =
⎡ = ∑ ⎢ ⎣
⎤ ⎥ ⎦
đồ.Công thức như sau:
2.4.2.4 Khoảng cách city-block L1:
d
x
x
=
−
),( lkD CB
ik
il
∑
i
1 =
Nguyễn Bá Công – Nguyễn Hữu Đức
56
Chương 2: Các khái niệm cơ bản
2.4.3 Các độ đo được sử dụng trong bài tóan
Trong quá trình tìm kiếm dữ liệu ảnh dựa vào nội dung điều quan trọng
là xác định mức độ giống nhau của hai đặc trưng của 2 tấm ảnh cần so sánh.
Do đó, cần một giá trị để biếu thị cho sự giống nhau này, có nhiều cách để tính
giá trị này. Ta gọi những giá trị được tính từ những cách khác nhau này là các
loại độ đo.
Một cách đơn giản, độ đo được coi là một giá trị để biểu thị cho độ so
khớp sự giống nhau của hai đặc trưng. Tùy theo từng trường hợp, từng loại độ
đo mà giá trị này có thể âm hoặc dương, lớn hoặc nhỏ tương ứng với mức độ
giống nhau như thế nào của các loại đặc trưng .
Mỗi loại độ đo có những ưu và khuyết điểm riêng, trong từng trường
hợp cụ thể.
2.4.3.1 Độ đo tương tự giữa 2 bin màu trong hệ màu HSI
1
2
2
I
S
cos
H
S
cos
H
sin
H
S
sin
H
a
I
−
+
−
+
−
=
)
(
)
( S
)
l
k
l
k
l
k
l
l
k
kl
k
] 2/12
[ (
5
Trong đó:
k: chỉ bin màu thứ k
l: chỉ bin màu thứ l
các thành phần H, S, I tương ứng là các giá trị thành phần
màu trong hệ màu HSI.
akl là độ tương tự giữa 2 bin màu
2.4.3.2 Độ đo dùng cho lược đồ màu
Gọi h(I) và h(M) tương ứng là 2 lược đồ màu của hai ảnh I và
ảnh M. Khi đó các loại độ đo màu được định nghĩa là một số nguyên
(hoặc số thực) theo các loại độ đo tương ứng như sau:
o Độ đo khoảng cách min-max:
Được thực hiện dựa trên ý tưởng lấy phần giao của của
Nguyễn Bá Công – Nguyễn Hữu Đức
57
hai lược đồ cần so sánh, ta sẽ được một lược đồ, tính tổng các
Chương 2: Các khái niệm cơ bản
giá trị có được từ lược đồ này cho ta được độ đo min-max.
N
), MhIhd
((
(
))
( Ih
)[
], jMhj ( )[
]
=
Đối với độ đo min: ta tính dựa vào giá trị min tại mỗi N bin.
{∑ min
j
1 =
}
Đối với độ đo max: ta tính dựa vào giá trị max tại mỗi
N
), MhIhd
((
(
))
( Ih
)[
], jMhj ( )[
]
=
N bin.
{∑ max
j
1 =
((
(
(
))
Matching
), MhIh
=
max(
],
])
(( ( Ih
)) ( )[ iMh
), ( MhIhd ∑ ∑ )[ i
i
i
}
Ví dụ minh họa: có 2 lược đồ màu như sau:
Hình 46: minh họa 2 lược đồ màu giống nhau
Sau khi dùng độ đo khỏang cách min-max ta sẽ được
Nguyễn Bá Công – Nguyễn Hữu Đức
58
một lược đồ màu như sau:
Chương 2: Các khái niệm cơ bản
Hình 47: Lược đồ màu thể hiện phần giao của 2 lược đồ màu trên
o Độ đo khoảng cách Euclide:
Đây là cách tính khoảng cách Euclide thông thường
N
), MhIhd
((
(
))
)[
j
]
)[ jMh
(
=
−
( ( Ih
) 2]
∑
j
1 =
giữa các N bin:
N
), MhIhd
((
(
))
( Ih
)[
j
]
)[ jMh
(
]
=
−
∑
j
1 =
hoặc có thể là:
Ví dụ: cũng 2 lược đồ màu trên
Nguyễn Bá Công – Nguyễn Hữu Đức
59
Hình 48: Hình minh họa độ đo Euclide
Chương 2: Các khái niệm cơ bản
Sau khi dùng độ đo khỏang các euclide ta sẽ được một
lược đồ màu như sau:
Hình 49: Lược đồ màu thể hiện độ khác nhau giữa 2 lược đồ màu trên
o Độ đo khoảng cách toàn phương:
Với việc sử dụng 2 độ đo trên sẽ có những nhược điểm
như sau: giả sử có 3 màu đỏ, cam và xanh trên hệ trục tọa độ
HSI thì ta có d(đỏ, cam)=d(đỏ, xanh). Nhưng thật ra thì
d(đỏ,cam) này chúng em đề nghị một độ đo khác là “Độ đo khỏang cách N N , ) ( )(
k ( k ))( )(
l (
al
)) = − − (
hd
C h
C h
C h
C h
C h
C kl i j i j i j ∑∑ k l 1
= 1
= )(k tòan phương”. Công thức: h
iC 1 2 2 cos H S S I I a cos H sin H S sin H − + − = + − ) ( ) (
S ) k k k l l kl l k l l k là phần tử thứ k của lược đồ màu của vùng ci, N ] 2/12 5 số ô màu của lược đồ màu ,
[
( D Q D ( I , I ) (
gCgCD ), ( ( )) grid Q D H ∑= g )(gC Q o Độ đo khoảng cách khi chia lưới D )(gC D Trong đó biểu thị màu trong lưới ô vuông g của ảnh I Q Nguyễn Bá Công – Nguyễn Hữu Đức 60 Trong đó biểu thị màu trong lưới ô vuông g của ảnh I Chương 2: Các khái niệm cơ bản o Độ đo khoảng cách min-max: Đối với độ đo min: ta tính dựa vào giá trị min tại mỗi n , I ) (min( ) min( )) = + (
ID
c Q D ,
αα
Q D ,
ββ
D Q j j j j ∑ 1 j = N bin. Trong đó: α: là số điểm liên kết màu. β: là số điểm không liên kết màu. Đối với độ đo max: ta tính dựa vào giá trị max tại mỗi n , I ) (max( ) max( )) = + ,
ββ (
ID
c Q D ,
αα
Q D Q D j j j j ∑ 1 j = N bin. o Độ đo khoảng cách L1: n ( , I ) (| | | |) = α − α + β − β ID
c Q D Q D Q D j j j j ∑ 1 j = Đây là cách tính khoảng cách thông thường Trong đó: α: là số điểm liên kết màu. β: là số điểm không liên kết màu. o Khoảng cách min-max: n m min( [ dc
][ ], [ dc
][ D = Độ đo min: α
i α
j ∑∑ c d 1
= 1
= )] Nguyễn Bá Công – Nguyễn Hữu Đức 61 Độ đo max: Chương 2: Các khái niệm cơ bản m n max( [ dc
][ ], [ dc
][ D = α
i α
j ∑∑ d c 1
= 1
= )] Trong đó: n: số bin màu. m: m={1,3,5,7,9,…,2k+1}. n m [ ][
dc ] [ ][
dc ] D − = α
i α
j ∑∑ c d 1
= 1
= o Khoảng cách L1: Trong đó: n: số bin màu. m: m={1,3,5,7,9,…,2k+1}. o Độ đo khoảng cách min-max: n , I ) min( ) = (
ID
E Q D ,
αα
Q D j j ∑ 1 j = Đối với độ đo min: Đối với độ đo max: ta tính dựa vào giá trị max tại mỗi N n , I ) max( ) = (
ID
E Q D ,
αα
Q
D j j ∑ 1 j = bin. L1 : o Độ đo khoảng cách n , I ) = − α (
ID
E Q D α
Q D j j ∑ j 1 = Đây là cách tính khoảng cách euclide thông thường o Độ đo khoảng cách min-max: Nguyễn Bá Công – Nguyễn Hữu Đức 62 Đối với độ đo min: Chương 2: Các khái niệm cơ bản n , I ) min( ) min( ) + ID
(
E Q D ,
αα
Q D ,
ββ
D Q j j j j = ∑ 1 j = Đối với độ đo max: ta tính dựa vào giá trị max tại mỗi n ( , I ) max( ) max( N bin. + ,
ββ ID
E Q D ,
αα
Q D Q D j j j j = ∑ 1 j = ) Độ đo khoảng cách L1: n , I ) + − β
Q β
D (
ID
E Q D −
αα
D Q j j j j = ∑ j =1 Nguyễn Bá Công – Nguyễn Hữu Đức 63 Đây là cách tính khoảng cách thông thường Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Nguyễn Bá Công – Nguyễn Hữu Đức 64 Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Lược đồ màu thể hiện màu sắc của ảnh. Màu sắc là thông tin gần gũi với con người nhất. Do đó, việc tìm kiếm theo lược đồ màu sẽ thân thiện với người dùng hơn. Dựa vào lược đồ màu có thể giúp cho người dùng tìm kiếm những tấm ảnh có sự giống nhau về màu sắc. Độ đo tính tương tự về màu sắc giữa lược đồ màu của ảnh truy vấn M min( (
IH , ),
IHj ( , j )) D Q ∑ 1 j = D ( I , I ) = H Q D M (
IH , j ) D ∑ 1 j = H(IQ)và lược đồ màu của ảnh trong cơ sở dữ liệu ảnh H(ID): Trong đó: M: tổng số bin màu Ưu điểm: Lược đồ màu bất biến đối với phép biến đổi như co, quay, tịnh tiến… Khuyế điểm: Có thể 2 ảnh khác nhau về ngữ nghĩa nhưng có lược đồ màu giống nhau. Cũng giống như lược đồ màu đặc trưng vector liên kết màu cũng thể hiện màu sắc của ảnh. Nó thể hiện rõ ràng mật độ phân bố những màu Nguyễn Bá Công – Nguyễn Hữu Đức 65 trong ảnh. Với 2 ảnh có thể rất giống nhau về lược đồ màu nhưng do khác Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp nhau về sự phân bố màu sắc, nên trong quá trình tìm kiếm theo lược đồ màu có thể cho ra nhiều ảnh “dư thừa”. Nếu trong quá trình tìm kiếm trên ta sử dụng vector liên kết màu thì có thể khắc phục được tình trạng trên. Với mỗi ô màu (bin) giả sử số điểm liên kết màu là α và số điểm không liên kết màu là β thì vector liên kết màu được xác định: Vc=[(α1,β1), (α2,β2), …,(αn,βn)], n là số ô màu (bin) Độ đo tính tương tự giữa 2 ảnh dựa trên đặc trưng vector liên kết n , I ) (| | | |) = − α + − (
ID
c Q D α
Q D β
Q β
D j j j j ∑ j 1 = màu: Cũng giống như vector liên kết màu, đặc trưng tương quan màu cũng thể hiện sự phân bố màu sắc của ảnh. Nó thể hiện rõ ràng mật độ phân bố màu trong ảnh hơn. Đặc trưng này cũng nhằm giúp giải quyết việc dư thừa trong tìm kiếm ảnh, giúp tìm kiếm những ảnh có ngữ nghĩa gần với ảnh truy vấn hơn nhờ các tính chất sau: (cid:153) Bao gồm các thông tin về sự tương quan về mặt không gian giữa các màu. (cid:153) Có thể được dùng để mô tả sự phân bố toàn cục của mối quan hệ không gian cục bộ giữa các màu. (cid:153) Kích thước của véctơ đặc trưng có dung lượng lưu trữ nhỏ. Độ đo tính tương tự về màu sắc giữa đặc trưng tương quan màu của N D I( , I ) | [ d ][ i ] [ d ][ i |] α − α D I I Q Q D = ∑ ∑ i d 1 = ảnh truy vấn IQ và ảnh trong cơ sở dữ liệu ảnh ID: Nguyễn Bá Công – Nguyễn Hữu Đức 66 Trong đó: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp d={1,3,5,…,2k+1} N: là tổng số bin màu. Đây cũng là đặc trưng quan trọng của ảnh. Nó thể hiện về hình dáng của ảnh. Đối với các ảnh muốn tìm kiếm theo hình dáng thì đặc trưng về màu sắc không thể giải quyết được. Vì vậy trong các hệ tìm kiếm dựa vào nội dung của ảnh không thể thiếu đặc trưng này. Độ đo tính tương tự về đặc trưng lược đồ hệ số góc của ảnh truy n (
ID , I ) min( ) = D Q ,
αα
Q
D j j ∑ 1 j = vấn IQ và ảnh ID trong cơ sở dữ liệu là: Trong đó: n: 73 phần tử. Cũng như đặc trưng lược đồ hệ số góc, vectơ liên kết hệ số góc là đặc trưng về hình dáng của ảnh. Nó thể hiện rõ ràng hơn về hình dáng của ảnh: thể hiện mối liên kết chặt chẽ giữa các điểm biên cạnh (các điểm biên cạnh có cùng góc độ), cũng như là những điểm không phải là biên cạnh. Vectơ liên kết hệ số góc còn có thể khắc phục được khuyết điểm của lược đồ hệ số góc đó là: 2 ảnh có lược đồ hệ số góc giống nhau nhưng khác nhau về ngữ nghĩa. Việc tìm kiếm theo đặc trưng vector liên kết hệ số góc giúp cho kết quả chính xác hơn, ảnh tìm được mang ngữ nghĩa gần ảnh truy vấn hơn. Với mỗi ô chứa (bin) giả sử số điểm liên kết hệ số góc là α và số điểm không liên kết hệ số góc là β thì vectơ liên kết hệ số góc được xác Nguyễn Bá Công – Nguyễn Hữu Đức 67 định: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp VE=[(α1,β1),(α2,β2),..,(αn,βn)], n là số bin Độ đo tính tương tự giữa 2 ảnh dựa trên đặc trưng vectơ liên kết hệ n ID
( , I ) (| | | = α − α + − β số góc: Q D Q D β
Q D j j j j ∑ 1 j = )| Việc chọn đặc trưng vectơ liên kết hệ số góc cho việc tìm kiếm, giúp ta có thể phân biệt ảnh thiên nhiên và ảnh thành phố. Ảnh thành phố có khuynh hướng tạo các điểm liên kết hệ số góc theo hướng ngang dọc. Ảnh thiên nhiên có khuynh hướng ít tạo các điểm liên kết hệ số góc theo hướng ngang dọc. Vì vậy nó là đặc trưng có ưu điểm hơn lược đồ hệ số góc đối với việc phân lớp ảnh thiên nhiên và thành phố. Giải thuật này giúp ta tạo được một cây phân cấp từ một tập dữ liệu bất kỳ mà ta có thể xác định khỏang cách giữa các phần tử. Giải thuật này có ưu điểm nổi bật so với các thuật toán phân lớp phân cấp khác là: số lớp cơ sở phân cấp không cần xác định trước. Từ đó ta có thể phân lớp từ thô cho đến mịn một tập dữ liệu nào đó. Chi tiết giải thuật phân lớp phân cấp HAC dùng để phân lớp một tập các đối tượng thành các lớp phân cấp Nguyễn Bá Công – Nguyễn Hữu Đức 68 Giải thuật: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp A { ,...,2,1 N } = ,
iK
i = Giả sử ta có tập , với Ki là các đối tượng cần phân lớp Giải thuật được thực hiện gồm các giai đọan chính sau: { ,...2,1 N } = Giai đọan khởi động: R
0 ,
iK
i = Bước 1: Tạo phân cấp , với Ci = Ki Bước 2: P0 = P(k) Trong đó P(k) là ma trận kích thước NxN với P(i, j)=d(Ki,Kj). Bước 3: t = 0. Giai đọan phân lớp: Bước 1: t = t + 1. r ≠
s Bước 2: Chọn cặp Ci, Cj sao cho d(Ci, Cj) = min d(Cr, Cs), r, s = 1, 2, …, N, ( }) C
{ } = − ∪ R
t R
t CC
{
i
, j q 1
− Bước 3: Kết nạp Ci, Cj vào lớp Cq và tạo một phân cấp Rt, Bước 4: Cập nhật P(t) từ P(t-1) bằng 2 bước: Xóa các dòng và cột tương ứng với 2 lớp vừa được kết nạp . Thêm dòng mới và cột mới chứa khỏang cách giữa lớp mới tạo và các lớp cũ. Bước 5: Lặp lại B1 khi nào các Ki đều chưa thuộc cùng một lớp. Giai đọan chọn số lớp khớp với dữ liệu: ( , ) max{ ), (
Cdia )}, > ∀ ∈ , CCd
i j (
Cdia
i ,
CC
i
, j j R
t dia(C) y), x, y C} max{d(x,
= ∈ Chọn thời điểm dừng trong cây phân cấp khi Rt thỏa: Nguyễn Bá Công – Nguyễn Hữu Đức 69 Trong đó Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp dữ liệu. Điều này tránh việc truy tìm tuần tự trên cơ sở dữ liệu lớn theo truyền thống trước đây, đồng thời giúp cho tốc độ tìm kiếm nhanh hơn đáng kể so với tìm kiếm tuần tự. Các ảnh được xét chỉ là nhóm các ảnh thuộc cùng một lớp có độ giống nhau về đặc trưng nào đó. Giải thuật phân lớp phân cấp theo các đặc trưng của ảnh Giả sử A={Ki,i=1,2,…,N}, với A là cơ sở dữ liệu ảnh, Ki là ảnh thứ i trong cơ sở dữ liệu. Gải thuật xây dựng cây gồm các gai doạn: { ,...2,1 N } = Giai đọan khởi động: R
0 ,
iK
i = Bước 1: Tạo phân cấp , với Ci = Ki Bước 2: P0 = P(k) Trong đó P(k) là ma trận kích thước NxN với P(i, j)=d(Ki,Kj). Bước 3: t = 0. Giai đọan phân lớp: Bước 1: t = t + 1. r ≠
s Bước 2: Chọn cặp Ci, Cj sao cho d(Ci, Cj) = min d(Cr, Cs), r, s = 1, 2, …, N, ( }) C
{ } = − ∪ R
t R
t CC
{
i
, j q 1
− Bước 3: Kết nạp Ci, Cj vào lớp Cq và tạo một phân cấp Rt, Bước 4: Cập nhật P(t) từ P(t-1) bằng 2 bước: Xóa các dòng và cột tương ứng với 2 lớp vừa được kết nạp . Thêm dòng mới và cột mới chứa khỏang cách giữa lớp Nguyễn Bá Công – Nguyễn Hữu Đức 70 mới tạo và các lớp cũ. Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Bước 5: Lặp lại B1 khi nào các Ki đều chưa thuộc cùng một lớp. Giai đoạn rút gọn cây: Sau khi xây dựng câp phân cấp xong, chúng ta cần thực hiện việc rút gọn cây, để gôm những nút giống nhau về cùng một nhóm. Việc rút gọn cây được thực hiện như sau: Giả sử có cây phân cấp: Node P_l ←{ dmin(nl,nr), dmax(nl,nr) Node n_l ←{dmin(cl,cr), dmax(cl,cr) ,(min{ ld ), = ∀ ),(min
d
ba l
ba ,
blal
εε ∀
a b max{ ), = ∀ ),(max
d
ba ,(
ld
a l
b ,
blal
εε ∀
a b d d c
min pc
),( Δ = min p
−
min
c
d
min d d c
max pc
),( Δ = max p
max
d −
c
max Nguyễn Bá Công – Nguyễn Hữu Đức 71 Hình 50:Cây phân cấp cho việc phân lớp cơ sở dữ liệu Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Mỗi nhóm sau khi đuợc gôm lại sẽ được trích chọn một phần tử đại diện. Phần tử đại diện được chọn là phần tử có tổng khoảng cách đến các phân tử còn lại nhỏ nhất. Việc phân lớp này nhằm chuẩn bị cho giai đoạn truy tìm. Nó giúp rút ngắn thời gian tìm kiếm nhờ vào việc tránh phải duyệt toàn bộ cơ sở dữ liệu. Các ví dụ minh hoạ việc phân lớp ảnh theo các đặc trưng : (cid:131) Về đặc trưng lược đồ màu chúng em minh họa trên cơ sở dữ liệu gồm 9 ảnh và thu được kết quả như sau như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 72 Hình 51: Cơ sở dữ liệu minh họa thuật toán HAC vào việc phân lớp ảnh theo đặc trưng lược đồ màu Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 52:Cây phân cấp theo lược đồ màu Hình 53: Nhóm các ảnh có cùng đặc trưng màu (cid:131) Về đặc trưng vector liên kết màu chúng em minh họa dựa trên cơ sở dữ liệu gồm 8 ảnh và cũng thu được kết quả như sau: Hình 54:Cơ sở dữ liệu phân lớp ảnh theo đặc trưng liên Nguyễn Bá Công – Nguyễn Hữu Đức 73 kết màu Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 55: Cây phân cấp theo đặc trưng liên kết màu Hình 56: Nhóm các ảnh có cùng đặc trưng liên kết màu (cid:131) Về đặc trưng Correlogram cũng được minh họa bằng cơ sở dữ liệu Nguyễn Bá Công – Nguyễn Hữu Đức 74 gồm 9 tấm ảnh và kết quả thu được như sau: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp đặc trưng Correlogram Hình 58: Cây phân cấp theo đặc trưng Correlogram Hình 59: Nhóm các ảnh có cùng đặc trưng Correlogram (cid:131) Về đặc trưng lược đồ hệ số góc chúng em minh họa trên cơ sở dữ Nguyễn Bá Công – Nguyễn Hữu Đức 75 liệu gồm 8 tấm ảnh và kết quả thu được như sau: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 60: Cơ sở dữ liệu minh họa thuật toán HAC đối với đặc trưng lược đồ hệ số góc Hình 61: Cây phân cấp theo đặc trưng lược đồ hệ số góc Hình 62: Nhóm các ảnh có cùng đặc trưng lược đồ hệ số góc (cid:131) Về đặc trưng vector liên kết hệ số góc chúng em minh họa trên cơ sở Nguyễn Bá Công – Nguyễn Hữu Đức 76 dữ liệu gồm 8 tấm ảnh và kết quả thu được như sau: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 63: Cơ sở dữ liệu ảnh minh họa thuật toán HAC để phân lớp theo đặc trưng vector liên kết hệ số góc Hình 64: Cây phân cấp theo đặc trưng liên kết hệ số góc Nguyễn Bá Công – Nguyễn Hữu Đức 77 Hình 65: Nhóm các ảnh có cùng đặc trưng liên kết hệ số góc Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Quá trình rút trích đặc trưng của ảnh đòi hỏi phải tốn nhiều thời gian, do đó khi tìm kiếm trên một cơ sở dữ liệu ảnh lớn thì vấn đề thời gian là một trong những vấn đề gây khó khăn cho bài toán, do đó cần phải có biện pháp tổ chức cơ sở dữ liệu hiệu quả giúp cho việc tìm kiếm được nhanh hơn, hiệu quả hơn. Điều đó đã được giải quyết bằng cách xây dựng cơ sở dữ liệu ảnh chúng ta thành những cây phân cấp bằng giải thưật HAC, nghĩa là xây dựng cây với các nút lá là tập các ảnh trong cơ sở dữ liệu có đặc trưng giống nhau tuỳ theo người dùng muốn về chung một nhóm. Việc tạo cây phân cấp với các nút đuợc gôm lại thành từng nhóm, mỗi nhóm có một phần tử đại diện giúp cho việc truy tìm có thể loại bỏ được những nhóm có ảnh không giống với ảnh truy vấn một cách nhanh chóng. Từ đó việc truy tìm sẽ hiệu quả hơn về thời gian truy xuất. Và như vậy có thể coi là một chỉ mục để truy tìm ảnh hiệu quả. Ví dụ minh họa cây phân cấp ban đầu và cây chỉ mục sau khi tiến hành gom nhóm: Nguyễn Bá Công – Nguyễn Hữu Đức 78 Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Phương pháp phổ biến để tìm kiếm ảnh trong một tập những ảnh hỗn tạp cho trước là dựa vào màu sắc của chúng. Đây là cách làm khá đơn giản, tốc độ tìm kiếm tương đối nhanh nhưng khuyết điểm là kết quả tìm kiếm lại có độ chính xác không cao. Nhưng đây có thể được xem như là bước lọc đầu tiên cho những tìm kiếm sau. Muốn được kết quả chính xác cao đòi hỏi sự kết hợp đồng thời với vân (texture) và hình dáng (shape). Cho đến nay, để giải quyết vấn đề về màu sắc, cách tiếp cận chính vẫn là dựa vào các đặc trưng sau: lược đồ màu, vector liên kết màu, lược đồ tương quan màu. Hệ màu chúng em sử dụng là hệ màu HSI, với 113 màu đại diện
cho 224 màu sẽ giúp ta giảm được không gian lưu trữ rất nhiều, mà không gây ảnh hưởng nhiều đến mức cảm nhân của con người. Tìm kiếm ảnh sử dụng lược đồ màu là phương pháp thông Nguyễn Bá Công – Nguyễn Hữu Đức 79 dụng nhât và dễ cảm nhận nhất. Nhưng việc tìm kiếm theo đặc trưng Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp này thất bại trong trường hơp: có thể có 2 ảnh giống nhau về lược đồ màu nhưng khác nhau nhiều về ngữ nghĩa. Ví dụ 1: ảnh có lược đồ màu giống nhau với độ giống nhau là 70%. Hình 68: Minh họa 2 ảnh có lược đồ màu giống nhau Ví dụ 2: 2 ảnh cũng có độ giống nhau về lược đồ màu là 70% nhưng khác nhau về ngữ nghĩa Hình 69: Minh họa 2 ảnh giống nhau về lược đồ màu nhưng khác nhau về ngữ nghĩa Trong tìm kiếm ảnh với việc sử dụng đặc trưng vectơ liên kết màu sẽ giúp ta tránh được tình trạng hai ảnh có cùng lược đồ màu nhưng khác nhau hoàn toàn về ngữ nghĩa. Nguyễn Bá Công – Nguyễn Hữu Đức 80 Ví dụ minh họa: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Cũng giống ví dụ về lược đồ màu ở trên. 2 ảnh sau có độ giống nhau về lược đồ màu là 70%. Nhưng theo đặc trưng vector liên kết màu thì 2 ảnh này hòan tòan khác nhau. Theo đặc trưng Lược đồ màu: Hình 70: Minh họa 2 ảnh có lược đồ màu giống nhau nhưng khác nhau về ngữ nghĩa Theo đặc trưng Vector liên kết màu: Hình 71: Hình minh họa vector liên kết màu khắc phục tính không duy nhất của lược đồ màu Như vậy, với đặc trưng lược đồ màu thì không thể lọai bỏ những ảnh có lược đồ màu giống nhau nhưng khác nhau về ngữ nghĩa. Trái lại với đặc trưng Vector liên kết màu thì khắc phục được nhược điểm này của lược đồ màu. Do đó, tìm kiếm theo đặc trưng vector liên kết màu sẽ giảm bớt đáng kể những ảnh dư thừa trong quá trình tìm kiếm, nâng cao hiệu quả tìm kiếm, kết quả tìm được Nguyễn Bá Công – Nguyễn Hữu Đức 81 mang ngữ nghĩa giống với ảnh truy vấn hơn. Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Cũng giống như đặc trưng vectơ liên kết màu, đặc trưng tương quan màu thể hiện mối quan hệ chặt chẽ về sự phân bố màu trong ảnh. Chính vì vây nếu truy tìm ảnh sử dụng đặc trưng này cũng tránh được tình trạng mà đặc trưng lược đồ màu vấp phải. Ví dụ minh hoạ: Với thông tin màu sắc con người có thể tìm kiếm những ảnh giống nhau về màu sắc mà con người cảm nhận được. Nhưng khi con người có nhu cầu tìm kiếm những ảnh giống nhau về hình dáng thì thông tin màu sắc không thể hiện được. Khi đó cần một đặc trưng khác đáp ứng yêu cầu trên, đó là đặc trưng về hình dáng. Hình dáng là một đặc trưng cấp cao hơn màu sắc. Nó đòi hỏi sự phân biệt giữa các vùng để tiến hành xử lý về độ đo của hình dáng. Trong nhiều trường hợp, sự phân biệt này cần thiết phải làm bằng tay. Nhưng sự tự động hóa trong một số trường hợp có thể khả thi. Sự so khớp hình dáng ảnh cũng có thể dùng những kỹ thuật về cấu trúc, trong đó một ảnh được mô tả bởi những thành phần chính của nó và quan hệ không gian của chúng. Trong việc tìm kiếm dữ liệu ảnh dựa vào nội dung, ta cần những phương pháp có thể quyết định sự giống và khác nhau một cách nhanh chóng. Thông thường, chúng ta luôn đòi hỏi sự bất biến cả đối với kích thước của ảnh cũng như hướng của ảnh trong không gian. Vì vậy, một đối Nguyễn Bá Công – Nguyễn Hữu Đức 82 tượng có thể được xác định trong một số hướng. Tuy nhiên, tính chất này Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp không thường được yêu cầu trong tìm kiếm ảnh. Trong rất nhiều cảnh vật, hướng của đối tượng thường là không đổi. Ví dụ như: cây cối, nhà cửa, ... Sau đây là các chiến lược tìm kiếm theo từng đặc trưng về hình dáng: Để tìm kiếm một ảnh mà ta quan tâm nhiều đến khía cạnh hình dáng của các đối tượng trong ảnh thì nên sử dụng các đặc trưng về hình dáng. Đặc trưng cơ bản nhất về hình dáng là lược đồ hệ số góc. Đây là đặc trưng chỉ thể hiện được hình dáng chung của các đối tượng trong ảnh. Ví dụ tìm kiếm theo đặc trưng lược đồ hệ số góc: Hình 73: minh hoạ 2 ảnh có lược đồ hệ số góc giống nhau Với việc sử dụng đặc trưng vectơ liên kết hệ số góc thay cho lược đồ hệ số góc giúp cho ta có thể gải quyết được trường hợp 2 ảnh có lược đồ hệ số góc giống nhau nhưng lại khác nhau nhiều về ngữ nghĩa. Ví dụ minh họa tìm kiếm theo vectơ liên kết hệ số góc giải quyết trường hợp mà lược đồ hệ số góc mắc phải: Hai ảnh có lược đồ hệ số góc giống nhau 86% nhưng có Nguyễn Bá Công – Nguyễn Hữu Đức 83 vector liên kết hệ số góc khác nhau: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 74:minh họa 2 ảnh có lược đồ hệ số góc giống nhau 80% Hình 75: Hình minh họa 2 ảnh có vector liên kết hệ số góc khác nhau Thừơng tìm kiếm theo từng đặc trưng có thể cho ra kết quả khá nhiều, xuất hiện những tấm ảnh không cần thiết nên để nâng cao hiệu quả của việc tìm kiếm, làm cho việc tìm kiếm được chính xác hơn thì chúng ta nên kết hợp các đặc trưng lại với nhau. Giả sử khi ta muốn tìm kiếm “một Nguyễn Bá Công – Nguyễn Hữu Đức 84 ngừơi mặc áo màu vàng và dáng đứng thẳng thì ta có thể kết hợp 2 đặc Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp trưng màu và lược đồ hệ số góc lại với nhau thì sẽ loại bỏ đi những tấm ảnh có người đó mà không có dáng đứng thẳng”. Có 2 cách tìm kiếm kết hợp: tìm kiếm kết hợp các đặc trưng với nhau dùng toán tử BOOL; tìm kiếm kết hợp các đặc trưng với nhau dùng trọng số. Đây là tìm kiếm kết hợp các đặc trưng lại với nhau dùng toán tử BOOL. Ví dụ tìm những ảnh có người mặc áo màu vàng và dáng đứng thẳng dùng toán tử AND nghĩa là: tìm những tấm ảnh sao cho vừa thoả đặc trưng về màu sắc vừa thoả đặc trưng về hình dáng cần tìm. Ví dụ minh hoạ tìm kiếm kết hợp các đặc trưng: Hình 76: Hìmh minh họa 2 ảnh giống nhau về lược đồ màu và lược đồ hệ số góc Nhận xét: Cách tìm kiếm này có thể cho ra kết quả rỗng, nghĩa là không có ảnh nào trong cơ sở dữ liệu thoả yêu cầu tìm kiếm. Nhưng nếu tồn tại ảnh thì phương pháp này cho ra kết quả Nguyễn Bá Công – Nguyễn Hữu Đức 85 chính xác hơn. Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Đây cũng là phương pháp tìm kiếm kết hợp các đặc trưng lại với nhau nhưng khác trên là ở đây ta dùng trọng số. Trọng số ở đây được hiểu là mức độ ưu tiên của các đặc trưng cần tìm kiếm. Ví dụ người dùng cần tìm kiếm những tấm ảnh có người mặc áo màu vàng và có dáng đứng thẳng thì người dùng có thể kết hợp 2 đặc trưng lược đồ màu (Histogram) và lược đồ hệ số góc (Edge Direction Histogram) lại với nhau. Nhưng ở đây khác với việc kết hợp dùng toán tử BOOL là người dùng muốn ưu tiên cho lược đồ màu hơn thì người dùng có thể chọn độ ưu tiên cho lược đồ màu là 70% còn lược đồ hệ số góc chỉ có 30% thôi. Khi đó việc truy vấn sẽ trả ra kết quả thoả mản yêu cầu tìm kiếm. Id
( , I ) , I ) , I ) , I ) = + ...
++ Idw
(
11 Idw
(
2 2 D Q D Q D Q Idw
(
n n Q D Công thức tính độ đo giữa 2 ảnh Trong đó: w1,w2,…,wn là trọng số các đặc trưng tương ứng. w1 + w2 + … + wn=1. d1,d2,…,dn: là khoảng cách giữa 2 ảnh về đặc trưng i nào đó i∈[1,..,n]. Khác với việc kết hợp dùng toán tử BOOL, việc tìm kiếm kết hợp theo trọng số này luôn trả ra kết quả cho người dùng. Việc tìm kiếm này giúp cho chúng ta có thể sắp hạng tập kết quả dễ dàng, cũng như giúp cho người dùng có thể xem tập kết quả nhanh chóng Nguyễn Bá Công – Nguyễn Hữu Đức 86 và hiệu quả hơn. Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp hiện được nhiều ý tưởng hơn trong việc tìm kiếm. Đồng thời kết quả tập ảnh trả về sẽ chính xác hơn cũng như không bị thiếu xót trong quá trình tìm kiếm (Precision and Recall). Ví dụ, người dùng chỉ muốn tìm một bông hồng nhỏ ở ngay tại vị trí nào đó trong ảnh thì khi tìm kiếm theo tính phân bố toàn cục thì có thể có ảnh cũng có bông hồng nhỏ nhưng khác nhau về vị trí hay là cũng có bông hồng tại vị trí đó nhưng chỉ giống nhau về màu hồng không đủ để 2 ảnh giống nhau theo yêu cầu về độ giống nhau đưa ra, nên kết quả sẽ không có bông hồng này. Do đó, để giải quyết vấn đề này ta nghĩ ngay đến việc tìm kiếm ảnh dựa vào tính phân bố cục bộ. Có 2 phương pháp được đề cử trong việc tìm kiếm này là: tìm kiếm với việc chia lưới, và tìm kiếm với việc vẽ vùng trên ảnh để tìm kiếm. Với ý tưởng chia ảnh thành nhiều khối nhỏ sẽ giúp cho chúng ta có thể đưa các đặc trưng tìm kiếm khác nhau vào lưới.Với ý tưởng này người dùng có thể thực hiện được nhiều ý tưởng khác nhau như: thành phố lúc hoàng hôn, Vịnh Hạ Long lúc trời mưa… Ví dụ minh họa tìm kiếm xét đến tình phân bố cục bộ với việc chia lứoi: Ví dụ 1: Nguyễn Bá Công – Nguyễn Hữu Đức 87 Hình 77:Hình minh họa tìm kiếm chia lưới-1 Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Khi đó người dùng chỉ muốn tìm những tấm ảnh có đặc trưng màu là hoa màu tím ngay tại vị trí chính giữa giống như ảnh truy vấn này khi đó ngừơi dùng có thể chia thành lưới 3x3 như sau: Hình 78: Minh họa ảnh được chia lưới 3x3 để tìm kiếm-1 Lúc này người dùng chỉ cần chọn block thứ 4 tìm kiếm theo đặc trưng màu là kết quả có thể giải quyết. Kết quả sẽ cho ra những tấm ảnh chỉ có màu hoa tím ở chính giữa còn các block khác trên ảnh không quan tâm. Ví dụ 2: Hình 79: Hình minh họa tìm kiếm chia lưới-2 Người dùng muốn tìm kiếm phần trên là nhà, phần dưới là cỏ Nguyễn Bá Công – Nguyễn Hữu Đức 88 thì người dùng có thể chia thành lưới 2x1 như sau: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 80: Minh hoạ chia lưới 1x2 để tìm kiếm-2 Khi đó người dùng chỉ cần chọn block 0 là tìm theo đặc trưng lược đố hệ số góc (Edge Direction Histogram) và chọn block 1 là tìm theo đặc trưng màu. Khi đó kết quả sẽ là những tấm ảnh có phần trên có hình dáng giống như hình dáng của ngôi nhà đó và phần dưới có màu là màu bãi cỏ như trong hình. Ví dụ 3: Hình 81: Ảnh minh họa tìm kiếm chia lưới-3 Nguyễn Bá Công – Nguyễn Hữu Đức 89 Hình 82: Minh hoạc chia lưới 1x3 cho việc tìm kiếm trên ảnh-3 Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Với việc chia lưới trên người dùng có thể thực hiện ý tưởng tìm kiếm cảnh thành phố lúc hoàn hôn như sau: người dùng chọn block 0 tìm kiếm theo đặc trưng màu, block 1 và block 2 tìm kiếm theo đặc trưng lược đồ hệ số góc. Nói cách khác tìm kiếm chia lưới sẽ giúp cho ngừơi dùng có thể dễ dàng tìm kiếm hơn theo ý mình muốn. Việc tìm kiếm chia lưới đã có thể giúp nâng cao hiệu quả tìm kiếm rất nhiều, nhưng đôi khi việc chia lưới vẫn không phủ hết các đối tượng cần tìm. Do đó, tìm kiếm với việc cho người dùng vẽ đối tượng cần tìm trên ảnh sẽ giúp hiệu quả hơn và chính xác hơn trong việc tím kiếm. Xét ví dụ trên: giả sử ảnh truy vấn ban đầu như sau Hình 83: Ảnh minh họa tìm kiếm vẽ Hình 84: Chia lưới 3x3 trên ảnh tìm kiếm Giả sử đối tượng cần tìm là nguyên một bông hoa ngay chính giữa Nguyễn Bá Công – Nguyễn Hữu Đức 90 nhưng có chia lưới như thế nào đi nữa thì vẫn không phủ vừa hết nguyên Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp bông hoa trong cùng một block. Do đó, việc tìm kiếm cho phép người dùng vẽ trên ảnh sẽ khắc phục tình trạng này, làm cho nhu cầu tìm kiếm cao hơn, hiệu quả hơn. Với việc vẽ vùng ta được: Hình 85: Minh họa vẽ hình trên ảnh tìm kiếm Lúc này người dùng có thể chọn các đặc trưng tìm kiếm theo nhu cầu của người mình trên khung hình chữ nhật đã vẽ. Nói tóm lại, tìm kiếm với việc vẽ trên ảnh sẽ giúp cho ta có thể tìm kiếm một đối tượng nào đó bất kỳ trong ảnh mà người dùng muốn bằng cách vẽ bao quanh đối tượng đó bằng một hình chữ nhật. Ví dụ minh hoạ 1: Hình 86: Hỉnh minh họa vẽ trên ảnh tìm kiếm Khi người dùng muốn tìm những ảnh có bông hoa màu hồng ở chính giữa thì có thể vẽ vùng như ở trên. Nguyễn Bá Công – Nguyễn Hữu Đức 91 Ví dụ minh họa 2: Chương 3:Truy tìm ảnh dựa vào đặc trưng cấp thấp Hình 87: Hình minh hoa vẽ tìm kiếm Với cách vẽ trên người dùng có thể thực hiện tìm kiếm những con sư tử tại vị trí khung chữ nhật đã vẽ. Ví dụ 3: Hình 88: Hình minh họa vẽ tìm kiếm Cũng giống như tìm kiếm dựa trên tính phân bố toàn cục việc tìm kiếm này cũng có thể cho người dùng kết hợp các đặc trưng lại với nhau theo toán tử BOOL và theo trọng số. Các đặc trưng được sử dụng cho việc dựa vào tính phân bố cục bộ cũng giống như các đặc trưng tìm kiếm dựa trên tính phân bố toàn cục. Các đặc trưng đó là: Lược đồ màu, Vector liên kết màu, Lược đồ hệ số góc, Nguyễn Bá Công – Nguyễn Hữu Đức 92 Vector liên kết hệ số góc, lược đồ tương quan màu. Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Nguyễn Bá Công – Nguyễn Hữu Đức 93 Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Đặc trưng cấp cao của ảnh ở đây là vùng, hay còn gọi là vần của ảnh. Đối với dạng bài toán này có nhiều cách để giải quyết, như có thể áp dụng giải thuật người láng giềng gần nhất (K-Min) để tìm ra những điểm mầm của vùng, rồi từ đó lan ra tìm vùng tương ứng. Nhưng ở đây chúng em sử dụng giải thuật phân lớp phân cấp HAC để phân đoạn ảnh. Với việc dùng giải thuật này ta không cần xác định trước số vùng trong ảnh, và ta có thể tiến hành phân vùng từ thô cho tới mịn dựa trên cây phân cấp thu được. Mục đích của việc phân đoạn ảnh là tách ảnh ra thành các vùng, giúp cho người dùng có thể mô phỏng dữ liệu đầu vào dễ dàng hơn, cũng như giúp cho việc tìm kiếm đạt được hiệu quả cao. Một bài toán phân đoạn ảnh thường qua hai khâu chính: khâu chọn đặc trưng để phân đoạn, và khâu phân đoạn ảnh. Các đặc trưng được sử dụng cho việc phân đọan ảnh là: Đặc trưng màu, Đặc trưng vân và đặc trưng vị trí (xét đến tính liên thông). Mỗi ảnh A được chia nhỏ thành các khối con Ki kích thước 4x4 (điểm ảnh). Các đặc trưng trong mỗi khối con gồm 3 đặc trưng: màu, 3 đặc trưng về vân., và vị trí của khối con Ki trong ảnh. Đặc trưng màu: Chọn sử dụng hệ màu HSI(Hue , Saturation , Intensity) cùng với việc định lượng không gian màu gồm 12H , 3S , 3I. Mỗi khối con gồm 3 15 15 15 M 1 iH
][ M 2 iS
][ M 3 iI
][ = = = đặc trưng màu: M1 , M2 , M3: ∑ ∑ ∑ 1
16 1
16 1
16 0 0 0 i i i = = = , , trong đó H[i] , S[i] , I[i] là thành phần H, S, I của điểm ảnh thứ i. Đặc trưng vân: Nguyễn Bá Công – Nguyễn Hữu Đức 94 Mỗi khối con gồm 3 đặc trưng vân: V1 , V2 , V3. Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Thực hiện phép biến đổi Wavelet[1] trên khối con 4x4 đối với thành phần màu I(hoặc trên ảnh độ xám ) , ta được 3 khối kích thước 2x2 tương ứng với khối qua bộ lọc thông thấp của cao (HL) , bộ lọc thông cao của thấp(LH) , bộ lọc thông cao của cao (HH). Gọi 4 hệ số của khối qua bộ lọc thông thấp của cao (HL) là: {hl0,hl1,hl2,hl3} 2/1 3 ihl V
1 0 =i 1
⎛
= ∑
⎜
4
⎝ ⎞
⎟
⎠ Đặc trưng V1 trong khối HL: Gọi 4 hệ số của khối qua bộ lọc thông cao của thấp (LH) là: {lh0,lh1,lh2,lh3}, 2/1 3 V ilh 2 0 =i 1
⎛
= ∑
⎜
4
⎝ ⎞
⎟
⎠ Đặc trưng V2 trong khối LH: Gọi 4 hệ số của khối qua bộ lọc thông thấp của cao (HH) là: {hh0,hh1,hh2,hh3} 2/1 3 ihh V
3 0 =i 1
⎛
= ∑
⎜
4
⎝ ⎞
⎟
⎠ Đặc trưng V3 trong khối HH: Đặc trưng vị trí: Mỗi khối con i có tâm Ci toạ độ xi,yi . Việc đưa thêm đặc trưng vị trí giúp phân đoạn được các vùng có tính liên thông. Chuẩn hoá các đặc trưng màu , vân , vị trí: Gọi ƒi là vector đặc trưng của khối con Ki của ảnh , ƒi={Mi1,Mi2,Mi3,Vi1,Vi2,Vi3,xi,yi} Mij , j Є[1..3] là các đặc trưng màu đã được chuẩn hoá của khối Nguyễn Bá Công – Nguyễn Hữu Đức 95 con Ki, Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Vij , j Є[1..3] là các đặc trưng vân đã được chuẩn hoá của khối con Ki ,xi , yi là các đặc trưng vị trí đã được chuẩn hoá của khối con Ki. 3 3 2 2 2 2/12 ( , ) V x y = + − + − + − (
MM
− ) ) ) ( ) KKd
i j w
m il jl w
v jl j y
i j (
V
il (
(
xw
i
t ) ∑ ∑ l l 1
= 1
= Độ đo đối sánh giữa các khối con: Trong đó: Mil là đặc trưng thứ l của khối Ki, Vil là đặc trưng vân thứ l của khối Ki, xi,yi là toạ độ trọng tâm của khối Ki, wm , w v, wi là trọng số xác định mức độ quan trọng của đặc trưng màu , vân và vị trí Phân đoạn ảnh thực chất là phân lớp các điểm ảnh. Chúng em chọn phương pháp phân lớp phân cấp [5] vì nó có khả năng tổ chức vùng theo cấu trúc phân cấp. Thuật toán phân đoạn ảnh: Giả sử A={Ki,i=1,2,…,N}, với A là ảnh, Ki là các khối con thứ i của ảnh. Thuật toán chia ra làm 3 giai đoạn chính: giai đoạn khởi động, giai đoạn phân lớp và giai đoạn rút gọn cây phân cấp. Giai đoạn khởi động: Bước 1: Tạo phân cấp R0={Ki, i=1,2,…,N} với Ci=Ki Bước 2: P0=P(K) Trong đó P(K) là ma trận kích thước NxN với P(i,j)=d(Ki,Kj). Nguyễn Bá Công – Nguyễn Hữu Đức 96 Bước 3: t=0 Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Giai đoạn phân lớp Bước 1: t=t+1 r ≠
s Bước 2: Chọn cặp Ci, Cj sao cho d(Ci,Cj)=mind(Cr,Cs) ,r ,s =1 ,2 ,…,N, Bước 3: Kết nạp Ci, Cj vào lớp Cq và tạo 1 phân cấp Rt Rt=(Rt-1 – {Ci,Cj}) {C∪ q} Bước 4: Cập nhật P(t) từ P(t-1) bằng 2 bước Xoá các dòng và cột tương ứng với 2 lớp vừa được kết nạp thêm dòng mới và cột mới chứa khoảng cách giữa lớp mới mới tạo và các lớp cũ Bước 5: Lặp lại bước bước 1 khi nào các Ki đều chưa cùng thuộc một lớp. Giai đoạn rút gọn cây: Sau khi xây dựng câp phân cấp xong, chúng ta cần thực hiện thuật tóan rút gọn cây như sau: Node P_l ←{ dmin(nl,nr), dmax(nl,nr) Nguyễn Bá Công – Nguyễn Hữu Đức 97 Hình 89: Hình minh họa cây phân cấp Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Node n_l ←{dmin(cl,cr), dmax(cl,cr) ,(min{ ld ), = ∀ ),(min
ba
d l
ba ,
blal
εε ∀
a b max{ ), = ∀ ),(max
ba
d ,(
ld
a l
b ,
blal
εε ∀
a b d d c
min ),(
pc Δ = min p
−
min
c
d
min d d c
max pc
),( Δ = max p
max
d −
c
max Ví dụ 1: Áp dụng thuật toán HAC vào việc phân đọan ảnh chúng em thu được những kết quả như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 98 Hình 90: Minh họa áp dụng giải thuật HAC vào phân đoạn ảnh-1 Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Hình 91: Minh họa áp dụng giải thuật HAC vào phân đoạn ảnh-2 Hình 92: Minh hoạ dùng thuật toán HAC phân đoạn ảnh-3 Ảnh gồm tập hợp các vùng hay còn gọi là vần. Đây là đặc trưng cấp cao của ảnh. Với đặc trưng vùng sẽ giúp cho chúng ta có thể giải quyết được một vấn đề lớn đang cản trở bước phát triển việc truy tìm ảnh dựa vào nội dung là dữ liệu nhập chưa được mô phỏng gần gũi hơn với suy nghĩ của con người và ảnh tìm được có thể mang nội dung ngữ nghĩa rất khác so với ảnh truy vấn. Với đặc trưng vùng con người có thể tiến thêm một bước trong việc truy tìm ảnh dựa vào nội dung là tìm kiếm dựa vào ngữ nghĩa. Với việc áp dụng mô hình học vào bài toán vùng. Khi đó, mỗi vùng sẽ mang một ngữ nghĩa, từ đó làm cho Nguyễn Bá Công – Nguyễn Hữu Đức 99 dữ liệu đầu vào được mô phỏng gần gũi với con người hơn. Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Ví dụ minh họa về vùng của ảnh: Hình 93: Minh họa vùng của ảnh ( , ) ( ) | | | = − + − + − + CCd
i j hdw
m
C h
C Vw
|
C
v V
C w
vt VT
C VT
C L L
1 2 J i j i i j | | w | | − + − w
dt DT
C DT
C com Com
C Com
C | i j i j Độ đo đối sánh vùng N N , ) ( )(
k ( k ))( )(
l (
al
)) = − − (
hd
C h
C h
C h
C h
C h
C kl i j i j i j ∑∑ k l 1
= 1
= )(k trong đó: h
iC là phần tử thứ k của lược đồ màu của vùng ci, N số ô 2/1 2 2 I I S cos cos H − + + ( ) ( k l k SH
−
k l l a = kl 2 1
5 S sin sin H ( ) )
SH
−
k l k l ⎤
⎥
⎥
⎦ ⎡
⎢
⎢
⎣ , , , , màu của lược đồ màu , wwwww
vt dt m v com là các trọng số xác định mức độ quan Nguyễn Bá Công – Nguyễn Hữu Đức 100 trọng của các đặc trưng màu , vân ,vùng Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Sau khi phân đoạn ảnh thành các vùng thì các đặc trưng về vùng chính là các đặc trưn cấp cao và đóng vai trò rất quan trọng giúp chúng ta lấp một phần hố ngăn cách giữa các đặc trưng cấp thấp và ngữ nghĩa của ảnh. Các đặc trưng về vùng được chọn để phân lớp vùng gồm: đặc trưng màu, vân, và hình dáng (diện tích, vị trí, tính Compact). ( , ) ( ) | | | = − + − + − + CCd
i j hdw
m
C h
C Vw
|
C
v V
C w
vt VT
C VT
C L L
1 2 J i j i i j | | w | | − + − w
dt DT
C DT
C com Com
C Com
C | i j i j Độ đo đối sánh giữa 2 vùng: N N , ) ( )(
k ( k ))( )(
l (
al
)) = − − (
hd
C h
C h
C h
C h
C h
C kl i j i j i j ∑∑ k l 1
= 1
= )(k trong đó: h
iC là phần tử thứ k của lược đồ màu của vùng ci, N số ô 2/1 2 2 I I S cos cos H − + + ( ) ( k l k SH
−
k l l a = kl 2 1
5 S sin sin H ( ) )
SH
−
k l k l ⎤
⎥
⎥
⎦ ⎡
⎢
⎢
⎣ màu của lược đồ màu , V: đại diện đặc trưng vân của vùng VT: vị trí của vùng DT: diện tích của vùng , , , , Com: tính Compact của vùng. wwwww
vt dt m v com là các trọng số xác định mức độ quan trọng của các đặc trưng màu , vân ,vùng Chúng em thay việc phân lớp ảnh về bài toán phân lớp các vùng cấu thành Nguyễn Bá Công – Nguyễn Hữu Đức 101 nên ảnh.Chúng em chọn phương pháp phân lớp phân cấp [5]. Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao iCDT ][ j Chúng em cải tiến việc phân lớp các vùng theo đặc trưng hình học ( ) iCCom h
iC rồi đến đặc trưng compact ( ), đặc trưng màu ( ),j=1,2,…113) và cuối iCV cùng là đặc trưng vân ( ). Mỗi lớp vùng sẽ được trích chọn một phần tử đại diện . Việc phân lớp này nhằm chuẩn bị cho giai đoạn truy tìm. Nó giúp rút ngắn thời gian tìm kiếm nhờ vào việc tránh phải duyệt toàn bộ cơ sở dữ liệu vùng với độ đo đối sánh trên toàn bộ các đặc trưng của vùng. Ví dụ minh họa phân lớp vùng: Chúng em minh họa cơ sở dự liệu gồm 5 tấm ảnh và kết quả thu được như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 102 Hình 94: Cơ sở dữ liệu dùng để phân vùng ảnh Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Hình 95: Các vùng của tập ảnh được tách ra bằng giải thuật HAC Hình 96: Cây phân cấp của tập vùng trên Nguyễn Bá Công – Nguyễn Hữu Đức 103 Hình 97: Nhóm các vùng giống nhau Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Ví dụ 2: Dữ liệu ảnh phân vùng: Hình 98: Cơ sở dữ liệu ảnh phân vùng Hình 99: Các vùng của tập dữ liệu ảnh sau khi được tách bằng giải thuật HAC Nguyễn Bá Công – Nguyễn Hữu Đức 104 Hình 100: Cây phân cấp của tập vùng trên Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Hình 101: Nhóm các vùng giống nhau Quá trình phân đoạn vùng của ảnh đòi hỏi phải tốn nhiều thời gian, do đó khi tìm kiếm trên một cơ sở dữ liệu ảnh lớn thì vấn đề thời gian là một trong những vấn đề gây khó khăn cho bài toán, do đó cần phải có biện pháp tổ chức cơ sở dữ liệu hiệu quả giúp cho việc tìm kiếm được nhanh hơn, hiệu quả hơn. Giải thuật HAC cũng được chúng em áp dụng vào việc phân lớp vùng, nghĩa là xây dựng cây với các nút lá là tập các vùng trong cơ sở dữ liệu. Việc tạo cây phân cấp với các nút đuợc gôm lại thành từng nhóm, mỗi nhóm có một phần tử đại diện giúp cho việc truy tìm có thể loại bỏ được những nhóm có vùng không giống với vùng truy vấn một cách nhanh chóng. Từ đó việc truy tìm sẽ hiệu quả hơn về thời gian truy xuất. Và như vậy có thể coi là một chỉ mục để truy tìm ảnh hiệu quả. Trong việc phát triển truy tìm ảnh dựa vào nội dung, một vấn đề lớn đang cản trở bước phát triển này là dữ liệu nhận cần phải mô phỏng gần gũi hơn với suy nghĩ của con người và ảnh tìm được không được mang nội dung ngữ nghĩa quá khác so với ảnh truy vấn . Để giải quyết vấn đề này, chúng em tiếp cận theo hướng cho phép dữ liệu nhập bao gồm các mẫu chính cấu thành nên ảnh truy vấn, và cơ sở dữ liệu ảnh được phân đoạn và phân lớp theo các mẫu cấu thành, được gọi là vần của ảnh . Nguyễn Bá Công – Nguyễn Hữu Đức 105 Cách tiếp cận này giúp giải quyết được bốn vấn đề sau: Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Người dùng chưa có ý niệm rõ lắm về tấm ảnh cần tìm mà chỉ có một số yêu cầu nào đó về các vần cấu thành nên nó hoặc họ chỉ cần tìm các ảnh tương tự với các vần chính của ảnh truy vấn chứ không cần sự tương tự toàn cục . Các khó khăn trong bài toán phân lớp ảnh với nội dung phong phú. Qui bài toán phân lớp ảnh về bài toán phân lớp các vần cấu thành nên ảnh . Tránh truy tìm tuần tự trên cơ sở dữ liệu lớn. Các ảnh được xét chỉ là nhóm các ảnh có các vần thuộc lớp các vần truy vấn . Tăng độ chính xác và độ trung thực trong kết quả truy tìm . Kết quả thực nghiệm cho thấy cách tiếp cận trên mang lại hiệu quả truy tìm tốt hơn so với cách tiếp cận truyền thống chỉ dựa trên các đặc trưng cấp thấp của toàn ảnh và truy tìm có tính chất tuần tự . Khi sử dụng các hệ truy tìm ảnh dựa vào nội dung, con người luôn mong muốn có thể thể hiện được dễ dàng, tương đối đầy đủ nội dung mà họ muốn tìm kiếm. Một cách truyền thống là họ chọn một ảnh truy vấn phù hợp với yêu cầu, tuy nhiên họ có thể không có sẵn bức ảnh truy vấn mà chỉ có một số ý niệm nào đó về bức ảnh (ví dụ họ cần tìm các bức ảnh có dáng vẻ như sau: cỏ non xanh tận chân trời, cành lê trắng điểm một vài bông hoa), hoặc nhiều khi có được bức ảnh truy vấn nhưng họ chỉ muốn tìm các ảnh giống một số đối tượng nào đó trong ảnh. Vấn đề này được giải quyết bằng việc cho người dùng có thể tìm kiếm theo đối tượng hay còn gọi là vần của ảnh. Trong quá trình tìm ảnh, hệ thống của chúng em được tổ chức thành 3 giai đoạn chính: Giai đoạn nhập dữ liệu, giai đoạn truy tìm và giai đoạn kết xuất . Trong giai đoạn này ngừơi sử dụng có thể nhập dữ liệu bằng 2 cách: Nguyễn Bá Công – Nguyễn Hữu Đức 106 Cách thứ nhất: Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Người dùng chọn một số ảnh truy vấn tuỳ ý, sau đó hệ thống tự động n đoạn các ảnh này, cuối cùng người dùng chọn các vùng cần truy sẽ phâ tìm và các vùng không cần tìm trong các ảnh này theo lý luận: D (Sel(Ci) OR Sel(Cj)) AND (Sel(Ck)OR Sel(Cl)) AN NOT(S el(Cm)OR Sel(Cn)) Trong đó: Sel(Ci): C i được chọn. dụ minh họa: Các ví Ví dụ 1: Hình 102: ảnh minh họa tìm kiếm theo vùng người dùng có thể chọn một trong 3 vùng của ả Khi đó nh để m. Ngòai ra người dùng có thể thực hiện câu truy vấn như tìm kiế sau: (1 AND 2) nghĩa là tìm những ảnh có cả con thú và cỏ hay thực hiện câu truy vấn (1 NOT 2) nghĩa là có con thú nhưng không có cỏ. Nguyễn Bá Công – Nguyễn Hữu Đức 107 Ví dụ 2: Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Hình 103: Hình minh họa tìm kiếm theo vùng, đối tượng Cũng như trên người dùng có thể tìm kiếm kết hợp các vùng lại với nhau. Ví dụ như ngừơi dùng có thể tìm kiếm những tấm ảnh có dạng “ con sư tử đứng ngòai bầu trời có mây” thì người dùng có thể thực hiện câu truy vấn như sau: (2 AND 3) hoặc (2 AND 3 AND 4) Cách thứ hai: Người dùng chọn các mẫu truy vấn đã có sẵn trong cơ sở dữ liệu ảnh (trong bước phân lớp vùng) theo lý luận: (Sel(Ci) OR Sel(Cj)) AND (Sel(Ck)OR Sel(Cl)) AND NOT(Sel(Cm)OR Sel(Cn)) Cụ thể là trong tập cơ sở dữ liệu ảnh ban đầu đã phân thành các vùng, người dùng muốn chọn vùng nào để tìm kiếm thì chỉ cần người dùng chọn vùng đó để tìm kiếm. Ví dụ như người dùng muốn tìm kiếm những tấm ảnh có dạng sau “ Cỏ non xanh tận chân trời, cành lê trắng điểm một vài bông hoa” thì người dùng có thể chọn các vùng sau: “ cỏ màu xanh “,”màu bầu trời”, ”cành lê có những bông hoa màu trắng” . Nguyễn Bá Công – Nguyễn Hữu Đức 108 Các ví dụ minh họa: Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao Ví dụ 1: Người dùng muốn tìm kiếm ảnh như sau: “Cỏ non xanh tận chân trời, cành lê trắng điểm một vài bông hoa” thì người dùng có thể chọn các vùng sau: Hình 104: Câu truy vấn “Bầu trời” AND “ Cỏ” AND “ Hoa màu trắng” Ví dụ 2: Hoặc là người dùng có ý niệm tìm những ảnh có dạng sau:”Tìm những ảnh có hoa màu vàng nhưng không có lá màu xanh bên cạnh”. Yêu cầu sẽ được giải quyết như sau: Hình 105: Câu truy vấn “Hoa màu vàng” AND NOT “ Lá màu xanh” Trong cả 2 cách đều có thể chọn mức độ quan trọng của các ( , ) ( ) | = − + − + CCd
i j h
C Vw
|
v
C V
C hdw
C
m
i J i j L
1 Nguyễn Bá Công – Nguyễn Hữu Đức 109 đặc trưng dựa vào các trọng số tương ứng trong độ đo đối sánh vùng: Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao | | | | w | | − + − + − w
vt VT
C VT
C w
dt DT
C DT
C com Com
C Com
C i j L
2 i j L
1 i j | L
1 Với mẫu truy vấn Cq, so sánh với các mẫu đại diện trong cây phân lớp vùng để lọc bớt các lớp không tương thích với mẫu và chọn được mẫu đại diện thích hợp với mẫu truy vấn . Gọi mẫu đại diện khớp với mẫu truy vấn là Cr, lớp đó là Br . Gọi tập các ảnh có ít nhất một vùng thuộc về lớp Br là TA (Br). Tập ảnh ứng với câu truy vấn: (Sel(Ci) OR Sel(Cj)) AND (Sel(Ck)OR Sel(Cl)) AND NOT(Sel(Cm) OR Sel(Cn)) ∪ ∪ ∪ sẽ tương ứng: ∩ (TA(Bk) Bl))\ (TA(Bm) n)) TA(Bj)) TA(B TA(B (TA(Bi) Với cách làm trên,sẽ đạt độ chính xác cao,mức độ tìm sót thấp,đồng thời tốc độ truy tìm khá nhanh vì không phải duyệt qua toàn bộ cơ sở dữ liệu ảnh và sử dụng toàn bộ các đặc trưng trong đối xứng ảnh. Tập ảnh kết quả tìm được sẽ đươc sắp hạng theo độ tương tự với ảnh truy vấn, giúp cho người dùng tìm được ảnh cần tìm nhanh chóng hơn. Độ tương tự giữa ảnh truy vấn và ảnh trong tập kết quả được xác định như sau: Giả sử xét 2 ảnh Ai, Aj: Ai={ Ci0,Ci1, …,CiN-1 }, với Cik, kє[0..N-1] là các vùng của ảnh Ai Aj={ Cj0,Cj1, …,CjM-1 }, với Cjl, lє[0..N-1] là các vùng của ảnh Aj Độ đo tương tự giữa các ảnh dựa vào độ đo tương tự giữa các vùng: d(Ai,Aj)=min{d(Cik,Cjl),kє[0,N],lє[0,M]} Tuy nhiên độ tương tự trên không phản ánh được độ tương tự thật sự Nguyễn Bá Công – Nguyễn Hữu Đức 110 giữa các ảnh vì có thể tồn tại 2 vùng rất giống nhau giữa 2 ảnh tuy nhiên lại Chương 4:Truy tìm ảnh dựa vào đặc trưng cấp cao có sự khác biệt rất lớn ở những vùng còn lại. Vì vậy cần đưa ra một độ đo tương tự thể hiện được sự tham gia của các vùng trong cả 2 ảnh . Sự tương tự giữa 2 ảnh càng cao khi có sự tương tự cao giữa các N M −
1 −
1 , ) , ) (
ACdw + ik ik j (
ACdw
i jl jl ∑ ∑ k 0 l 0 = = ( , ) = AAd
i j 2 vùng trong 2 ảnh. N là số vùng của ảnh Ai , M là số vùng của ảnh Aj , d(Cik,Aj)=min{d(Cik,Cjl),l=0..M-1, là khoảng cách từ vùng Cik của ảnh Ai đến ảnh Aj, d(Cjl,Ai)=min{d(Cjl,Cik),k=0..N-1, là khoảng cách từ vùng Cjl của ảnh Aj đến ảnh Ai, wik=Nik/NKi, Nik là số khối trong vùng Cik, NKi số khối con của ảnh Ai wjl=Njl/NKj, Njl là số khối trong vùng Cjl, NKj số khối con của ảnh Aj wik và wjl thể hiện vai trò quan trọng của vùng có diện tích lớn trong độ đo đối sánh . Cách tiếp cận của chúng em là dùng đặc trưng cấp cao là vùng mà chúng em còn gọi là vần ảnh (cùng với đặc trưng cấp thấp như màu, vân, hình dáng) để bắc cầu nối giữa đặc trưng cấp thấp và ngữ nghĩa ảnh. Chúng em xem ảnh gồm các vùng cũng như một đoạn văn gồm các từ. Vì vậy trong việc truy tìm cũng như trong việc phân lớp, đơn vị phải xử lý là các vùng của ảnh . Điều này dẫn đến một khả năng truy tìm mới là dựa vào câu truy vấn dạng ngôn ngữ, liên kết giữa các vùng đại diện theo một lý luận để truy tìm Nguyễn Bá Công – Nguyễn Hữu Đức 111 ảnh . Chương 5:Truy tìm ảnh dựa vào ngữ nghĩa Nguyễn Bá Công – Nguyễn Hữu Đức 112 Chương 5:Truy tìm ảnh dựa vào ngữ nghĩa Cách truy vấn này là dùng đặc trưng cấp cao là vùng mà chúng em còn gọi là vần ảnh (cùng với đặc trưng cấp thấp như màu, vân, hình dáng) để bắt cầu nối giữa đặc trưng cấp thấp và ngữ nghĩa ảnh. Chúng em xem ảnh gồm các vùng cũng như một đoạn văn gồm các từ. Vì vậy trong việc truy tìm cũng như trong việc phân lớp, đơn vị phải xử lý là các vùng của ảnh. Điều này dẫn đến một khả năng truy tìm mới là dựa vào câu truy vấn dạng ngôn ngữ, liên kết giữa các vùng đại diện theo một lý luận để truy tìm ảnh. Trong từng nhóm ảnh đã được phân loại bằng tay, trích ra các vùng đặc thù cho nhóm ảnh để khi truy vấn ta có thể diễn dịch từ ngôn ngữ sang vần ảnh. Ví dụ như tìm cảnh bãi biển lúc bình minh, thì liên kết nhóm từ bãi biển với vùng đại diện cho bãi biển và liên kết nhóm từ bình minh với vùng đại diện cho bình minh Đây có thể xem là hướng truy tìm ảnh theo phương pháp mới. Với phương pháp này ta có thể truy tìm ảnh chỉ bằng những câu chữ mà không cần hình ảnh có sẵn. Việc tìm kiếm này đem đến sự tiện dụng cho người dùng. Ví dụ minh họa: Đầu tiên người dùng vào cơ sở dữ liệu gán nhãn cho tất cả các vùng sau khi được phân lớp ở bước tìm kiếm theo vùng. Ứng với mỗi vùng, người dùng gán nhãn tương ứng cho vùng đó. Khi tìm kiếm chỉ cần dùng ngôn ngữ để truy tìm. Nguyễn Bá Công – Nguyễn Hữu Đức 113 Sau đây là ví dụ minh họa các vùng đã được gán nhãn: Chương 5:Truy tìm ảnh dựa vào ngữ nghĩa Hình 106: Các vùng đã được gán nhãn Sau khi người dùng gán nhãn xong, tiếp theo là người dùng có thể thực hiện câu truy vấn của mình. Ví dụ như người dùng có thể thực hiệc các câu truy vấn sau: ”Hoa màu tím” sẽ cho kết quả những ảnh có bông hoa có màu tím. Nguyễn Bá Công – Nguyễn Hữu Đức 114 Hình 107: Kết quả câu truy vấn “Hoa màu tím” Chương 5:Truy tìm ảnh dựa vào ngữ nghĩa +”Hoa mai” sẽ cho kết quả những ảnh có hoa Hình 108: Kết quả câu truy vấn “ Hoa mai” +”Cỏ” AND “Nhà” sẽ cho kết quả những ảnh có nhà và cỏ Hình 109: Kết quả câu truy vấn “ Cỏ” và “ Nhà” Nguyễn Bá Công – Nguyễn Hữu Đức 115 +”Sư tử” và “bầu trời” sẽ cho kết quả như sau: Chương 5:Truy tìm ảnh dựa vào ngữ nghĩa Nguyễn Bá Công – Nguyễn Hữu Đức 116 hình 110: Kết quả câu truy vấn “ Sư tử” AND “ Bầu trời” Chương 6:Cài đặt và thử nghiệm Nguyễn Bá Công – Nguyễn Hữu Đức 117 Chương 6:Cài đặt và thử nghiệm Chương trình được cài đặt trên môi trường Visual C++ 6.0. Chương trình có sử dụng thư viện IJL15.dll để đọc tập tin JPG. Chương trình được xây dựng theo mô hình sau: Hình 111: Mô hình hệ thống Các đặc trưng được sử dụng trong bài tóan là: (cid:131) Đặc trưng màu sắc: Đặc trưng lược đồ màu, đặc trưng lược vector liên kết màu, đặc trưng Correlogram. (cid:131) Đặc trưng hình dáng: đặc trưng lược đồ hệ số góc, đặc trưng vector Nguyễn Bá Công – Nguyễn Hữu Đức 118 liên kết hệ số góc. Chương 6:Cài đặt và thử nghiệm (cid:131) Về đặc trưng được sử dụng để phân vùng: Đặc trưng màu, đặc trưng vân, đặc trưng vị trí. Việc xây dựng cây phân cấp các đặc trưng chúng em cài đúng theo thuật tóan phân lớp phânc cấp (HAC). Kết quả thu được khá khả quan. Cơ sở dữ liệu dùng chung cho đặc trưng cấp thấp gồm 5091 ảnh. Đặc trưng Số nhóm (Cluster) Lược đồ màu 724 Vector liên kết màu 747 Tương quan màu 626 Lược đồ hệ số góc 227 Vector liên kết hệ số góc 204 Cơ sở dữ liệu ảnh phân vùng gồm 1494 ảnh, phân đoạn ảnh được 4156 vùng, và phân thành nhóm. Chương trình gồm 5 modul tìm kiếm riêng biệt: (cid:131) Tìm kiếm dạng cơ bản: gồm các đặc trưng lược đồ màu (Histogram), lược đồ hệ số góc (Edge Direction Histogram), Vector liên kết màu (Color Coherence Vector), Vector liên kết hệ số góc(Edge Direcrion Coherence Vector), Correlogram. Trong phần này người dùng có thể kết hợp các đặc trưng này lại với nhau dùng tóan tử AND hay dùng Nguyễn Bá Công – Nguyễn Hữu Đức 119 trọng số. Chương 6:Cài đặt và thử nghiệm (cid:131) Tìm kiếm có chia lưới hay cho người dùng vẽ hình chữ nhật trên ảnh truy vấn để tìm kiếm. Vẫn sử dụng các đặc trưng cơ bản trên. (cid:131) Tìm kiếm theo vùng, đối tượng: Từ ảnh truy vấn có sẵn, chương trình tách thành các vùng (vần) cấu thành nên ảnh, tiếp theo người dùng chọn các vùng cần thiết cho việc tìm kiếm. (cid:131) Tìm kiếm theo vùng, đối tượng khi mà người dùng chưa có ý niệm về tấm ảnh cần tìm kiếm (cid:131) Người dùng chưa có ý niệm rõ lắm về tấm ảnh cần tìm mà chỉ có một số yêu cầu nào đó về các vần cấu thành nên nó hoặc họ chỉ cần tìm các ảnh tương tự với các vần chính của ảnh truy vấn chứ không cần sự tương tự toàn cục. (cid:131) Tìm kiếm dựa vào đánh nhãn các vùng: sau khi tách các vùng của từng ảnh, chúng ta sẽ gán nhãn cho từng vùng. Sau đó, người dùng dùng ngôn ngữ để truy vấn Ảnh truy vấn Hình 112: Ảnh truy vấn theo lược đồ màu Khi người dùng chọn tìm kiếm theo đặc trưng Histogram với độ Nguyễn Bá Công – Nguyễn Hữu Đức 120 giống nhau giữa 2 ảnh là 55% sẽ cho kết quả như sau: Chương 6:Cài đặt và thử nghiệm Hình 113: Tập kết quả tìm kiếm theo lược đồ màu Nhưng khi người dùng tăng độ giống nhau giữa 2 ảnh lên là 70% thì sẽ cho kết quả như sau: Hình 114: Kết quả tìm kiếm theo lược đồ màu với độ giống nhau 70% Với ảnh truy vấn ban đầu như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 121 Hình 115:Ảnh truy vấn theo lược đồ hệ số góc Chương 6:Cài đặt và thử nghiệm Khi người dùng chọn độ giống nhau giữa 2 ảnh theo đặc trưng lược đồ hệ số góc là 85% sẽ cho kết quả như sau: Hình 116: Tập kết quả tìm kiếm theo lược đồ hệ số góc Nhưng khi người dùng tăng độ giống nhau giữa 2 ảnh lên 89% thì cho kết quả như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 122 Hình 117: Tập kết quả tìm theo lược đồ hệ số góc với độ giống nhau 89% Chương 6:Cài đặt và thử nghiệm Hình 118: Ảnh truy tìm theo đặc trưng vector liên kết màu Người dùng vẫn chọn độ giống nhau giữa 2 ảnh là 55% nhưng ở đây theo đặc trưng Vector liên kết màu. Có kết quả như sau: Hình 119:Tập kết quả tìm theo đặc trưng vector liên kết màu Như vậy, ở đây cho kết quả chính xác hơn so với tìm theo đặc trưng lược đồ màu. Khi người dùng tìm theo đặc trưng này nhưng độ chính xác giữa 2 ảnh là 70% sẽ cho kết quả như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 123 Hình 120: Kết quả tìm kiếm với độ giống nhau 70% Chương 6:Cài đặt và thử nghiệm Vẫn là ảnh tìm theo lược đồ hệ số góc nhưng người dùng không tìm theo lược đồ hệ số góc mà tìm theo Vector liên kết hệ số góc. Ở đây độ giống nhau là 79% Hình 121: Ảnh truy vấn theo đặc trưng vector liên kết hệ số góc Kết quả cho sẽ như sau: Hình 122: Tập kết quả tìm theo đặc trưng liên kết hệ số góc Ở đây, có thể cho kết quả chính xác hơn so với tìm theo lược đồ hệ số góc mặc dù là theo độ giống nhau chỉ có 79%. Khi tăng độ giống nhau Nguyễn Bá Công – Nguyễn Hữu Đức 124 lên 84% thì kết quả như sau: Chương 6:Cài đặt và thử nghiệm Hình 123: Tập kết quả tìm theo đặc trưng liên kết hệ số góc với độ giống nhau 84% Vẫn là ảnh tìm theo lược đồ màu, nhưng đây tìm theo đặc trưng Correlogram cũng với độ giống nhau là 55%. Ả nh truy vấn Hình 124: Ảnh truy vấn Kết quả tìm được: Nguyễn Bá Công – Nguyễn Hữu Đức 125 Hình 125: Tập kết quả thu được Chương 6:Cài đặt và thử nghiệm Nhưng khi người dùng tăng độ chính xác lên 70% thì kết quả như sau: Hình 126: Tập kết quả tìm được với độ giống nhau 70% Vẫn là ảnh tìm theo lược đồ màu. Hình 127: Ảnh truy vấn
Nhưng ở đây tìm theo đặc trưng màu (Histogram) là 55% và lược đồ hệ số góc (Edge Direction Histogram)là 75%. Kết quả cho như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 126 Hình 128: Tập kết quả tìm được Chương 6:Cài đặt và thử nghiệm Khi người dùng tìm theo đặc trưng Correlogram 50% và vector liên kết hệ số góc 65% thì kết quả như sau: Khi người dùng tìm kiếm theo đặc trưng liên kết màu 50% và đặc trưng liên kết hệ số góc 65% thì kết quả như sau: Hình 130: Tập kết quả tìm được Ví dụ khác: Ảnh truy vấn ban đầu Nguyễn Bá Công – Nguyễn Hữu Đức 127 Hình 131: Ảnh truy vấn Chương 6:Cài đặt và thử nghiệm Khi người dùng tìm kiếm theo đặc trưng histogram 47% và đặc trưng lược đồ hệ số góc thì kết quả như sau: Hình 132: Tập kết quả tìm được V ẫn là ảnh trên Nhưng ở đây người dùng tìm kiếm theo lược đồ màu với độ ưu tiên là 0.6 và đặc trưng lược đồ hệ số góc với độ ưu tiên là 0.4 và độ đo chung là 70% thì sẽ cho kết quả như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 128 Ví dụ khác: Chương 6:Cài đặt và thử nghiệm Ảnh truy vấn ban đầu Hình 135: Ảnh truy vấn
Khi tìm theo đặc trưng liên kết màu với độ ưu tiên là 45% và đặc trưng liên kết hệ số góc với độ ưu tiên 55% và độ giống nhau giữa 2 ảnh là 63% sẽ cho kết quả như sau: Hình 136: Tập kết quả tìm được Ví dụ 1:
Ả nh truy vấn Hình 137: Ảnh truy vấn tìm kiếm dựa trên tính phân bố cục bộ Người dùng muốn tìm kiếm những ảnh có màu giống như màu của bông hoa màu tím và vị trí là ở giữa hình thì người dùng có Nguyễn Bá Công – Nguyễn Hữu Đức 129 thể chia thành lưới 3x3 như sau: Chương 6:Cài đặt và thử nghiệm Hình 138: Ảnh minh họa chia lưới và vùng được chọn Khi đó người dùng chọn block thứ 4 tìm theo lược đồ màu với độ giống nhau là 50% thì sẽ cho kết quả như sau: Ví dụ khác: Ả nh truy vấn Hình 140: Ảnh truy vấn Người dùng tìm kiếm những tấm ảnh có bông hoa ở giữa và Nguyễn Bá Công – Nguyễn Hữu Đức 130 bên cạnh có lá thì người dùng có thể chia thành lưới như sau Chương 6:Cài đặt và thử nghiệm Hình 141: Ảnh minh hoạ cá vùng đựơc chọ Người dùng tìm kiếm block thứ 4 theo đặc trưng lược đồ màu là 50% và block thứ 5 cũng theo đặc trưng lược đồ màu với độ giống nhau là 60% thì cho kết quả như sau: Hình 142: Tập ảnh tìm được Ví dụ 3: Ảnh truy vấn: Nguyễn Bá Công – Nguyễn Hữu Đức 131 Hình 143: Ảnh truy vấn Chương 6:Cài đặt và thử nghiệm Ảnh sau khi chia lưới 2x1 Khi người dùng muốn tìm kiếm những ảnh có bầu trời thì người dùng chọn block 0 với đặc trưng màu là 45% thì sẽ cho kết quả như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 132 Hình 145: Tập ảnh kết quả tìm được Chương 6:Cài đặt và thử nghiệm Nhưng khi người dùng kết hợp với block thứ 1 theo đặc trưng vector liên kết góc với độ giống nhau là 55% sẽ cho kết quả sau: Hình 146: Tập ảnh kết quả tìm được Ví dụ : Nguyễn Bá Công – Nguyễn Hữu Đức 133 Hình 147: Ảnh truy vấn Chương 6:Cài đặt và thử nghiệm Hình 148: Minh họa vẽ tìm kiếm Khi người dùng muốn tìm theo đặc trưng lược đồ màu với độ giống nhau là 64% sẽ cho kết quả như sau: Hình 149: Tập ảnh tìm được Vẫn ảnh truy vấn trên nhưng người dùng tìm theo đặc trưng màu với độ giống nhau là 64% và đặc trưng liên kết hệ số góc với độ giống nhau là Nguyễn Bá Công – Nguyễn Hữu Đức 134 60% thì sẽ cho kết quả như sau: Chương 6:Cài đặt và thử nghiệm Hình 150: Tập ảnh tìm được Trong phần này cơ sở dữ liệu ảnh chúng em gồm 500 tấm ảnh Ví dụ 1: Ả nh truy vấn ban đầu Hình 151: Ảnh truy vấn theo vùng Sau khi phân đọan ảnh ta được các vùng của ảnh như sau: Nguyễn Bá Công – Nguyễn Hữu Đức 135 Hình 152: Các vùng của ảnh sau khi phân đoạn Chương 6:Cài đặt và thử nghiệm Chọn vùng truy tìm Kết quả thu được: Hình 153: Tập kết quả tìm theo vùng hoa màu tím Ví dụ 2: Nguyễn Bá Công – Nguyễn Hữu Đức 136 Ảnh truy vấn ban đầu Chương 6:Cài đặt và thử nghiệm Sau khi phân đọan ảnh ta thu được các vùng của ảnh như sau: Hình 154: Các vùng của ảnh truy vấn Khi người dùng muốn tìm kiếm những tấm ảnh có vùng là con sư tử với độ giống nhau là 65%: Hình 155: Vùng tìm kiếm Nguyễn Bá Công – Nguyễn Hữu Đức 137 Kết quả tìm được những con sư tử có độ giống nhau 65%: Chương 6:Cài đặt và thử nghiệm Hình 156: Tập kết quả tìm được theo vùng sư tử Để lọai bớt những tấm ảnh dư thừa trong tìm kiếm cũng như cho kết quả chính xác hơn người dùng có thể chọn thêm vùng tìm kiếm hay tăng ngưỡng trong tìm kiếm. Ví dụ người dùng chọn thêm vùng bầu trời cho việc tìm kiếm: Hình 157: Minh họa tìm kiếm theo toán tử BOOL Nguyễn Bá Công – Nguyễn Hữu Đức 138 Kết quả thu được như sau: Chương 6:Cài đặt và thử nghiệm Hình 158: Tập kết quả thu được Ví dụ 3: Ảnh ban đầu Nguyễn Bá Công – Nguyễn Hữu Đức 139 Hình 159: Ảnh sau khi phân đoạn Chương 6:Cài đặt và thử nghiệm Người dùng có thể tìm kiếm bằng câu truy vấn Hình 160: Minh họa câu truy vấn Kết quả tìm được: Nguyễn Bá Công – Nguyễn Hữu Đức 140 Khi người dùng tìm kiếm theo câu truy vấn sau: Chương 6:Cài đặt và thử nghiệm Hình 162: Câu truy vấn Kết quả thu được: Ví du 1: Khi người dùng muốn tìm những ảnh có nền xanh thì người Nguyễn Bá Công – Nguyễn Hữu Đức 141 dùng có thể chọn vùng và câu truy vấn dạng sau: Chương 6:Cài đặt và thử nghiệm Hình 164: Hình minh họa tìm kiếm theo vùng Kết quả thu được: Ví dụ 2: Khi người dùng muốn tìm những ảnh có bông hoa màu vàng và Nguyễn Bá Công – Nguyễn Hữu Đức 142 nền màu xanh: Chương 6:Cài đặt và thử nghiệm Hình 166: Minh họa câu truy vấn theo vùng Kết quả thu được: Nguyễn Bá Công – Nguyễn Hữu Đức 143 Hình 167: Tập Kết quả tìm được Chương 6:Cài đặt và thử nghiệm Ví dụ 1: với nhãn hổ con được gán cho vùng sau trong cơ sở dữ liệu: Khi muốn tìm kiếm những hình có con hổ thì người dùng chỉ việc đánh từ khoá “hổ con” để tìm kiếm. Kết quả tìm kiếm với từ khoá hổ con như sau: Hình 168:Tập kết quả tìm kiếm với từ khoá” hổ con” Ví dụ 2: Với từ khoá “Chúa sơn lâm” được gán cho sư tử trong cơ sở dữ liệu. Khi muốn tìm kiếm những con sư tử, người dùng có thể thực hiện từ khóa “ Nguyễn Bá Công – Nguyễn Hữu Đức 144 Chúa sơn lâm” cho con sư tử Chương 6:Cài đặt và thử nghiệm Hình 169: Ảnh minh hoạ tìm kiếm theo ngữ nghĩa, từ khoá “Chúa sơn lâm” Kết quả tìm kiếm như sau: Hình 170: Kết quả tìm kiếm với từ khoá “ Chúa sơn lâm” với độ giống nhau 64% Để đánh giá tính hiệu quả của hệ thống chúng em sử dụng 2 đại lượng: Nguyễn Bá Công – Nguyễn Hữu Đức 145 (cid:131) Độ chính xác = Số ảnh tìm được đúng / Số ảnh tìm được Chương 6:Cài đặt và thử nghiệm (cid:131) Độ trung thực = Số ảnh tìm được đúng / Tổng số ảnh đúng thực có Phương pháp nhập liệu Số mẫu thử Độ chính xác Độ trung thực Phương pháp truy tìm trung bình trung bình Chọn ảnh truy vấn 200 90 83 Truy tìm dựa vào lược đồ màu Chọn ảnh truy vấn 200 82 78 Truy tìm dựa vào lươc đồ hệ số góc Chọn ảnh truy vấn 200 86 80 Truy tìm dựa vào lược đồ liên kết hệ số góc Chọn ảnh truy vấn 200 92 84 Truy tìm dựa vào lược đồ vector liên kết màu Chọn ảnh truy vấn 200 90 84 Truy tìm dựa vào correlogram Chọn ảnh truy vấn 200 91 83 Truy tìm bằng cách chia lưới Chọn ảnh truy vấn 200 92 83 Nguyễn Bá Công – Nguyễn Hữu Đức 146 Truy tìm bằng cách vẽ vùng Chương 6:Cài đặt và thử nghiệm Phương pháp nhập liệu Số mẫu Độ chính xác Độ trung thực Phương pháp truy tìm trung bình trung bình thử Chọn vùng của ảnh truy vấn 94 150 91 Truy tìm dựa vào độ đo đối sánh vùng 92 Chọn các mẫu truy vấn có sẵn 150 95 Truy tìm dựa vào độ đo đối sánh vùng Chọn ngữ nghĩa của vùng 150 95 92 Truy tìm dựa vào độ đo đối Nguyễn Bá Công – Nguyễn Hữu Đức 147 sánh vùng Chương 7:Tổng kết và hướng phát triển Nguyễn Bá Công – Nguyễn Hữu Đức 148 Chương 7:Tổng kết và hướng phát triển Hiện nay hệ thống “Truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao” có khả năng: (cid:131) Tìm kiếm ảnh dựa vào các đặc trưng cấp thấp (hay tìm kiếm ảnh dựa vào tính phân bố tòan cục). (cid:131) Tìm kiếm ảnh dựa vào tính phân bố cục bộ (tìm kiếm bằng việc chia lưới hay cho người dùng vẽ trên ảnh truy vấn). (cid:131) Tìm kiếm ảnh dựa vào vùng, đối tượng ảnh có sẵn. (cid:131) Tìm kiếm dựa vào vùng,đối tượng khi mà người dùng chưa có ý niệm rõ ràng về ảnh cần tìm kiếm. (cid:131) Tìm kiếm dựa vào ngữ nghĩa (bán tự động). Với các chức năng trên hệ thống đã hòan thành các mục tiêu đề ra ban đầu là xây dựng hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp, đặc trưng cấp cao và hướng tới việc tìm kiếm ảnh dựa vào ngữ nghĩa. Với hệ thống này, chúng em đã xây dựng được một nền tảng vững chắc giúp ta lấp dần hố ngăn cách giữa các đặc trưng cấp thấp, cấp cao với ngữ nghĩa của ảnh. Đây cũng là một hệ thống mở, tạo tiền đề cho việc tiến lên ngữ nghĩa một cách dễ dàng. Cụ thể là hệ thống có thể phát triển lên thành hệ thống dịch ảnh tự động chỉ thông qua việc học mẫu để gán nhãn cho vùng. Cùng với đó kết hợp với việc xây dựng một bộ luật ngôn ngữ riêng, giúp ta tiến lên một bước truy tìm ảnh cao hơn là: truy tìm ảnh chỉ bằng câu truy vấn dạng ngôn thông thường. Hệ thống “Truy tìm ảnh dựa vào đặc trưng cấp thấp và đặc trưng cấp cao” là một công trình rất có ý nghĩa. Đây là một sản phẩm thể hiện trí tuệ Việt Nam, Nguyễn Bá Công – Nguyễn Hữu Đức 149 và là sản phẩm của con người Việt Nam hoà vào trào lưu phát triển chung của thế Chương 7:Tổng kết và hướng phát triển giới. Nhận thức rõ ý nghĩa to lớn này, chúng em nguyện cố gắng nhiều hơn nữa, Nguyễn Bá Công – Nguyễn Hữu Đức 150 tìm hiểu cải tiến chất lượng cho hệ thống càng hòan thiện hơn. Tài liệu tham khảo [1] Alberto Del Bimbo,”Visual Information Retrieval”, Morgan Publishers, Inc.1999 [2] D .BimBo Visual information Retrieval. Morgan Kaufmann ,1999 [3] Ihtisham Kabir Ihtisham Kabir,”High Performance Computer Imaging”, Manning Publiccations Company, 1996. [4] Lý Quốc Ngọc Truy tìm thông tin thị giác dựa vào nội dung bằng phương pháp gán nhãn ngữ nghĩa cho ảnh. Tạp chí phát triển khoa học công nghệ, tập 7, tháng 4&5 năm 2004. [5] Nguyễn Lãm, Lý Quốc Ngọc, Dương Anh Đức, Nguyễn Bá Công, Nguyễn Hữu Đức Truy tìm hình ảnh dựa vào nội dung bằng phương pháp đánh vần ảnh. Tạp chí phát triển khoa học công nghệ. [6] Rafael C.Gonzalez, Richard E.Woods Digital Image Processing. Second Edition, Prentice – Hall, Inc.2002 [7] Quoc Ngoc Ly, Anh Duc Duong. Hierarchical Algorithm Clustering in Content-Based-Image-Retrieval Proceedings of The International Technical Conference on Circuits/Systems, Computers, and Communication (ITC- CSCC 2005), July 4, 2005. Korea. [8] Quoc Ngoc Ly, Anh Duc Duong. Hierarchical Data Model in Content-based Image Retrieval. International Journal of Information Technology, International Conference on Intelligent Computing, 23-28 August, 2005 China. Nguyễn Bá Công – Nguyễn Hữu Đức 151 [9] Sergios Theodoridis, Konstantinos Koutroumbas Tài liệu tham khảo Nguyễn Bá Công – Nguyễn Hữu Đức 152 Pattern Recognition, Academic Press, 19992.4.3.3 Độ đo dùng cho đặc trưng liên kết màu (Color Coherence
Vector)
2.4.3.4 Độ đo dùng cho đặc trưng tự tương quan
màu(AutoCorrelogram)
2.4.3.5 Độ đo dùng cho đặc trưng lược đồ hệ số góc (Edge
Direction Histogram)
2.4.3.6 Độ đo dùng cho đặc trưng liên kết hệ số góc (Edge
Direction Coherence Vector)
Chương 3 TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG
CẤP THẤP
3.1. Các đặc trưng được sử dụng để truy tìm ảnh
3.1.1 Đặc trưng về màu sắc
3.1.1.1 Lược đồ màu (histogram)
3.1.1.2 Vector liên kết màu (Color Coherence Vector)
3.1.1.3 Đặc trưng tự tương quan màu (AutoCorrelogram)
3.1.2 Đặc trưng về hình dáng
3.1.2.1 Lược đồ hệ số góc (Edge Direction Histogram)
3.1.2.2 Vector liên kết hệ số góc (Edge Direction Coherence
Vector)
3.2. Giải thuật phân lớp phân cấp (Hierarchical
Agglomerative Clustering Algorithm- HAC) và áp
dụng giải thuật trong phân lớp ảnh theo các đặc
trưng của ảnh
3.2.1 Tổng quan về giải thuật
3.2.2 Giải thuật
3.2.3 Áp dụng giải thuật phân lớp phân cấp vào việc xây
dựng cây phân cấp theo các đặc trưng của ảnh
Giải thuật HAC cũng được chúng em áp dụng vào việc phân lớp cơ sở
Hình 57: Cơ sở dữ liệu minh họa thuật toán HAC đồi với
3.3. Tạo chỉ mục truy tìm ảnh
Hình 66: Cây phân cấp ban đầu
Hình 67: Cây chỉ mục
3.4. Các chiến lược truy tìm ảnh
3.4.1 Truy tìm ảnh xét đến tính phân bố toàn cục
3.4.1.1 Tìm kiếm theo màu sắc
3.4.1.1.1 Lược đồ màu
3.4.1.1.2 Vector liên kết màu
3.4.1.1.3 Đặc trưng tương quan màu (Correlogram):
Hình 72: Hình minh họa 2 ảnh có đặc trưng tương quan màu giống nhau
81.2%
3.4.1.2 Tìm kiếm theo hình dáng
3.4.1.2.1 Lược đồ hệ số góc
3.4.1.2.2 Vector liên kết hệ số góc
3.4.1.3 Tìm kiếm kết hợp
3.4.1.3.1 Tìm kiếm kết hợp các đặc trưng với nhau dùng
toán tử BOOL
3.4.1.3.2 Tìm kiếm kết hợp các đặc trưng với nhau dùng
trọng số
3.4.2 Truy tìm ảnh xét đến tính phân bố cục bộ (yếu tố
không gian)
Với việc tìm kiếm dựa vào tính phân bố cục bộ sẽ cho chúng ta thực
3.4.2.1 Tìm kiếm xét đến tính cục bộ với việc chia lưới tìm kiếm
3.4.2.2 Tìm kiếm xét đến tính cục bộ với việc vẽ
Chương 4 TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG
CẤP CAO
4.1. Bài toán phân đoạn ảnh
4.1.1 Chọn đặc trưng để phân đoạn ảnh
4.1.2 Phân đoạn ảnh
4.1.3 Các ví dụ về bài toán phân đoạn ảnh
4.2. Vùng và đặc trưng vùng
4.3. Áp dụng giải thuật phân lớp phân cấp vào bài toán
phân lớp vùng
4.4. Tạo chỉ mục tìm kiếm
4.5. Các chiến lược truy tìm theo đặc trưng cấp cao
4.5.1 Giai đoạn nhập dữ liệu
4.5.2 Giai đoạn truy tìm
4.5.3 Giai đoạn sắp hạng (RANKING)
Chương 5 TRUY TÌM ẢNH DỰA VÀO NGỮ NGHĨA
Chương 6 CÀI ĐẶT VÀ THỬ NGHIỆM
6.1. Cài đặt
6.1.1 Chương trình
6.1.2 Các đặc trưng sử dụng cho chương trình
6.1.3 Cơ sở dữ liệu
6.1.3.1 Cơ sở dữ liệu truy tìm theo đặc trưng cấp thấp
6.1.3.2 Cơ sở dữ liệu truy tìm theo đặc trưng cấp cao
6.1.4 Chức năng truy tìm ảnh
6.2. Thử nghiệm
6.2.1 Tìm kiếm xét đến tính toàn cục
6.2.1.1 Tìm kiếm theo lược đồ màu
6.2.1.2
Tìm kiếm theo lược đồ hệ số góc
6.2.1.3 Tìm kiếm theo vector liên kết màu
Vẫn là ảnh tìm kiếm theo lược đồ màu
6.2.1.4 Tìm kiếm theo vector liên kết hệ số góc
6.2.1.5 Tìm kiếm theo AutoCorrelogram
6.2.1.6 Tìm kiếm ảnh bằng việc kết hợp các đặc trưng với nhau
theo tóan tử AND
Hình 129: Tập kết quả tìm được
6.2.1.7 Tìm kiếm ảnh bằng cách kết hợp các đặc trưng dùng
trọng số
Hình 133: Ảnh truy vấn
Hình 134: Tập kết quả tìm được
6.2.2 Tìm kiếm dựa trên tính phân bố cục bộ
6.2.2.1 Tìm kiếm bằng cách chia lưới
Hình 139: Tập ảnh kết quả tìm được
Hình 144: Ảnh sau khi chia lưới
6.2.2.2 Tìm kiếm bằng cách vẽ vùng
6.2.3 Tìm kiếm dựa theo vùng, đối tượng của ảnh có sẵn
Hình 161: Kết quả tìm được
Hình 163: Kết quả thực hiện câu truy vấn trên
6.2.4 Tìm kiếm dựa theo vùng, đối tượng khi mà người
dùng chưa có ý niệm rõ ràng về tấm ảnh
Hình 165: Kết quả tìm được
6.2.5 Tìm kiếm dựa vào ngữ nghĩa
6.3. Kết quả thực nghiệm của hệ thống
6.3.1 Thực nghiệm việc tìm kiếm theo các đặc trưng cấp
thấp
6.3.2 Thực nghiệm việc tìm kiếm theo đặc trưng cấp cao
Chương 7 TỔNG KẾT VÀ HƯỚNG PHÁT TRIỂN
7.1. Tổng kết
7.2. Hướng phát triển
7.3. Kết luận
TÀI LIỆU THAM KHẢO