Bài giảng Chương 4: Tìm kiếm DL ĐPT (Phần 2 - Nguyễn Thị Oanh)
lượt xem 7
download
Nội dung "Bài giảng Chương 4: Tìm kiếm DL ĐPT (Phần 2 - Nguyễn Thị Oanh)" tập trung vào những kiến thức cơ bản nhất về tổng quan ảnh và lưu trữ, biểu diễn ảnh, trích chọn đặc trưng, đánh chỉ mục và đối sánh ảnh.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Chương 4: Tìm kiếm DL ĐPT (Phần 2 - Nguyễn Thị Oanh)
- Chương 4: Tìm kiếm DL ĐPT P2: Dữ liệu ảnh Nguyễn Thị Oanh Bộ môn HTTT – Viện CNTT & TT oanhnt@soict.hut.edu.vn 1
- Nội dung Tổng quan Biểu diễn ảnh – trích chọn đặc trưng – Đặc trưng toàn cục: Shape – texture - color – Đặc trưng cục bộ: Phân đoạn (segmentation) Key points (characters points) Đánh chỉ mục (chỉ số hóa) (indexing) Đối sánh ảnh: tương tự, không gian 2
- Ảnh và lưu trữ Mức xám - 8 bits: 0 - đen 255 - trắng 64 60 69 100 149 151 176 182 179 65 62 68 97 145 148 175 183 181 65 66 70 95 142 146 176 185 184 66 66 68 90 135 140 172 184 184 66 64 64 84 129 134 168 181 182 59 63 62 88 130 128 166 185 180 60 62 60 85 127 125 163 183 178 62 62 58 81 122 120 160 181 176 63 64 58 78 118 117 159 180 176 3 Source : Tal Hassner. Computer Vision. Weizmann Institute of Science (Israel).
- Ảnh và lưu trữ x y x = 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 y = 41 210 209 204 202 197 247 143 71 64 80 84 54 54 57 58 42 206 196 203 197 195 210 207 56 63 58 53 53 61 62 51 43 201 207 192 201 198 213 156 69 65 57 55 52 53 60 50 44 216 206 211 193 202 207 208 57 69 60 55 77 49 62 61 45 221 206 211 194 196 197 220 56 63 60 55 46 97 58 106 46 209 214 224 199 194 193 204 173 64 60 59 51 62 56 48 47 204 212 213 208 191 190 191 214 60 62 66 76 51 49 55 48 214 215 215 207 208 180 172 188 69 72 55 49 56 52 56 49 209 205 214 205 204 196 187 196 86 62 66 87 57 60 48 50 208 209 205 203 202 186 174 185 149 71 63 55 55 45 56 51 207 210 211 199 217 194 183 177 209 90 62 64 52 93 52 52 208 205 209 209 197 194 183 187 187 239 58 68 61 51 56 53 204 206 203 209 195 203 188 185 183 221 75 61 58 60 60 54 200 203 199 236 188 197 183 190 183 196 122 63 58 64 66 55 205 210 202 203 199 197 196 181 173 186 105 62 57 64 63 4 Source : Tal Hassner. Computer Vision. Weizmann Institute of Science (Israel).
- Ảnh và lưu trữ Ảnh là tín hiệu 2D (x,y) Về mặt toán học: – Ảnh là một ma trận biểu diễn tín hiệu Đối với người dùng: – Ảnh chứa các thông tin về ngữ nghĩa 5
- Phân loại ảnh Ảnh tự nhiên: ảnh thu nhận từ các thiết bị – camera, microscope, tomography, infrared, satellite, … Ảnh nhân tạo: tạo ra từ các phần mềm chuyên biệt – Đồ họa máy tính (computer graphics), thực tại ảo (virtual reality) Ảnh tự nhiên ảnh nhân tạo Ảnh nhân tạo 6
- Phân loại ảnh Ảnh mức xám Ảnh nhị phân Ảnh màu I(x,y) [0..255] I(x,y) {0 , 1} IR(x,y) IG(x,y) IB(x,y) 7 Source : Tal Hassner. Computer Vision. Weizmann Institute of Science (Israel).
- Ảnh màu trong hệ tọa độ RGB Bên cạnh hệ tọa độ màu RGB ta còn có các hệ tọa độ màu khác 8 Source : Tal Hassner. Computer Vision. Weizmann Institute of Science (Israel).
- Cơ sở dữ liệu ảnh 2 kiểu CSDL ảnh: – CSDL chung (General database) : Photo collection, Internet – CSDL hẹp/cụ thể (Specific database): face database, medical database 9
- CSDL ảnh (…): General database General database : Photo collection, Internet – Nội dung đa dạng, không đồng nhất – Biểu diễn dựa trên các đặc trưng chung (shape, color, texture,..) – Vùng ứng dụng rộng 10
- CSDL ảnh (…): Specific database Specific database: Nội dung khá thuần nhất – Thường dành cho các ứng dụng đặt biệt (ảnh sinh trắc học (- bimometry, ảnh y học – medical images) – Đặc trưng được trích chọn tùy thuộc vào mỗi lĩnh vực ứng dụng 11 http://rad.usuhs.edu/medpix/master.php3?mode=slide_sorter&pt_id=13985
- Tìm kiếm ảnh Tìm các bức hình của « Steve Jobs » ? Đây là bức hình của ai ? / Đây là cái gì ? / Bức hình này chụp ở đâu ? What ? Where ? Who ? 12
- Kiểu truy vấn: từ khóa Tìm các bức hình của « Steve Jobs » ? Được sử dụng rộng rãi nhất: Google, youtube, … 13
- Kiểu truy vấn: từ khóa Hạn chế: – Từ khóa được lấy từ: Văn bản xung quanh ảnh (Google Image, Google Video) Đánh dấu thủ công giá thành cao – Nhập nhằng: chọn từ khóa thế nào ? Tính chủ quan của người đánh dấu keyword-image Phụ thuộc ngôn ngữ Phụ thuộc ngữ cảnh 14
- Kiểu truy vấn: dựa trên nội dung http://www- 15 roc.inria.fr/imedia/index.php?option=com_content&view=article&id=95&Itemid=60
- Kiểu truy vấn: dựa trên nội dung 16http://www- roc.inria.fr/imedia/index.php?option=com_content&view=article&id=95&Itemid=60
- Kiểu truy vấn: dựa trên nội dung Đặc điểm: – Truy vấn chứa hình ảnh – Mục đích tìm kiếm : «tương tự »: đối sánh không chính xác Trích chọn tự động các đặc trưng và tìm kiếm dựa trên độ tương tự giữa các đặc trưng Lĩnh vực nghiên cứu đang được quan tâm Truy vấn: – Bằng ví dụ – Bộ phận 17 – Bằng hình vẽ (Sketch)
- Kiểu truy vấn: dựa trên nội dung Vấn đề: – Nội dung đa dạng – Khối lượng dữ liệu cần xử lý lớn và thường trùng lặp: Numeric gap – Vấn đề về ngữ nghĩa: Semantic gap VD: làm thế nào để biết 1 người đang vui /buồn 18
- CBIR 19 Source: Slides of Muriel Visani
- CBIR – các bước chính Trích chọn đặc trưng (Biểu diễn ảnh): Đánh chỉ mục để tăng hiệu năng tìm kiếm (xem chương 3) Lựa chọn thước đo độ tương tự ? 20
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng IC3 GS4 - Bài 16: Tìm kiếm thông tin
25 p | 427 | 73
-
Bài giảng Trí tuệ nhân tạo (Artificial Intelligent) - TS. Nguyễn Đình Thuân
113 p | 369 | 34
-
Bài giảng Cấu trúc dữ liệu và thuật toán: Chương giới thiệu - Nguyễn Khánh Phương
8 p | 82 | 21
-
Bài giảng Nhập môn trí tuệ nhân tạo: Chương 4.1 - TS. Ngô Hữu Phúc
69 p | 90 | 9
-
Bài giảng Chương 4: Tìm kiếm DL ĐPT (Phần 1 - Nguyễn Thị Oanh)
50 p | 70 | 8
-
Bài giảng Cấu trúc dữ liệu và thuật toán: Chương 4 - ThS. Phạn Nguyệt Thuần
76 p | 76 | 8
-
Bài giảng Cấu trúc dữ liệu và giải thuật - Chương 4: Một số giải thuật sắp xếp và tìm kiếm
29 p | 41 | 6
-
Bài giảng Cơ sở dữ liệu đa phương tiện: Chương 4 (P1) - Nguyễn Thị Oanh
50 p | 37 | 6
-
Bài giảng Các hệ thống thông minh nhân tạo và ứng dụng - Chương 4: Bài toán tìm kiếm 2
33 p | 40 | 5
-
Bài giảng Cấu trúc dữ liệu và giải thuật: Chương 4 - ThS. Phạm Thanh An
62 p | 64 | 5
-
Bài giảng Cơ sở dữ liệu đa phương tiện: Chương 4 (P2) - Nguyễn Thị Oanh
94 p | 34 | 5
-
Bài giảng Trí tuệ nhân tạo: Bài 4 - Trương Xuân Nam
27 p | 37 | 4
-
Bài giảng Chương 4: Các thuật toán tìm kiếm
36 p | 58 | 4
-
Bài giảng Cấu trúc dữ liệu và giải thuật (Data structures and Algorithms): Chương giới thiệu - Ngô Công Thắng
2 p | 49 | 3
-
Bài giảng Cấu trúc dữ liệu 1 - Nguyễn Thái Dư
85 p | 82 | 3
-
Bài giảng Cấu trúc dữ liệu 1: Giới thiệu - Huỳnh Cao Thế Cường
10 p | 51 | 2
-
Bài giảng Trí tuệ nhân tạo (Artificial Intelligence): Chương 4 – GV. Nguyễn Văn Hòa
27 p | 3 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn