intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Khoa học máy tính: Kỹ thuật tìm kiếm ảnh trên cơ sở biểu đồ màu mờ

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:72

12
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Đề tài “Kỹ thuật tìm kiếm ảnh trên cơ sở biểu đồ màu mờ” tập trung trình bày kỹ thuật tìm kiếm ảnh trên một biểu đồ màu mới, được gọi là biểu đồ màu mờ (Fuzzy Color Histogram - FCH), ứng dụng các thuật toán, hàm tập mờ. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học máy tính: Kỹ thuật tìm kiếm ảnh trên cơ sở biểu đồ màu mờ

  1. ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TRẦN QUỐC BẢO KỸ THUẬT TÌM KIẾM ẢNH TRÊN CƠ SỞ BIỂU ĐỒ MÀU MỜ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên, tháng 6 năm 2018
  2. ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TRẦN QUỐC BẢO KỸ THUẬT TÌM KIẾM ẢNH TRÊN CƠ SỞ BIỂU ĐỒ MÀU MỜ Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 8480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS. Đặng Văn Đức Thái Nguyên, tháng 6 năm 2018
  3. i LỜI CAM ĐOAN Tôi xin cam đoan luận văn với tên đề tài “Kỹ thuật tìm kiếm ảnh trên cơ sở biểu đồ màu mờ” là kết quả nghiên cứu của bản thân học viên, dựa trên nghiên cứu và thu thập cơ sở dữ liệu thực tiễn dưới sự hướng dẫn khoa học của PGS. TS. Đặng Văn Đức. Các số liệu, kết quả nêu trong luận văn là hoàn toàn trung thực, những tư liệu được sử dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ. Người cam đoan Trần Quốc Bảo
  4. ii LỜI CẢM ƠN Trong suốt thời gian hoàn thành luận văn nghiên cứu, tôi luôn nhận được giúp đỡ tận tình của thầy giáo hướng dẫn. Nhân dịp này, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới PGS. TS. Đặng Văn Đức về những chỉ dẫn khoa học, những góp ý quý báu và tận tình hướng dẫn tôi trong suốt quá trình thực hiện luận văn tốt nghiệp. Tôi xin chân thành cảm ơn tập thể các Thầy, Cô giáo trong trường Đại học Công nghệ thông tin và Truyền thông đã luôn nhiệt tình quan tâm, giúp đỡ và tạo mọi điều kiện tốt nhất cho tôi trong suốt quá trình học tập tại trường. Xin chân thành cảm ơn tới tập thể các thầy cô và các bạn đồng nghiệp tại trường Cao đẳng Y tế Thái Bình nơi tôi đang công tác, đã luôn cổ vũ, động viên và tạo mọi điều kiện thuận lợi để tôi hoàn thành luận văn của mình. Cuối cùng, tôi muốn bày tỏ lòng cảm ơn vô hạn tới bạn bè, tới những người thân yêu luôn bên tôi. Xin bày tỏ lòng cảm ơn sâu sắc tới bố mẹ, vợ, con và những người thân trong gia đình đã là điểm tựa tinh thần lẫn vật chất cho tôi trong những lúc khó khăn, luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện luận văn tốt nghiệp. Xin trân trọng cảm ơn tất cả sự giúp đỡ quý báu đó ! Sinh viên Trần Quốc Bảo
  5. iii MỤC LỤC LỜI CAM ĐOAN ....................................................................................................... i LỜI CẢM ƠN ............................................................................................................ ii MỤC LỤC ................................................................................................................. iii DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT ................................................................v DANH MỤC HÌNH ................................................................................................. vii PHẦN MỞ ĐẦU .........................................................................................................1 CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH..............................3 THEO NỘI DUNG .....................................................................................................3 1.1. Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung .............................3 1.2. Các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung...............................4 1.2.1. Đặc trưng màu sắc: ...................................................................................5 1.2.2. Đặc trưng kết cấu ......................................................................................9 1.2.3. Đặc trưng hình dạng ...............................................................................10 1.2.4. Biểu đồ màu (Color Histogram) .............................................................11 1.3. Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung .....................12 1.3.1. Hệ thống QBIC (Query By Image Content) ...........................................12 1.3.2. Hệ thống WebSEEK và VisualSEEK ....................................................12 1.3.3. ImageRover WWW Search Engine ........................................................13 1.4. Khái quát về logic mờ ....................................................................................14 1.4.1. Mở đầu ....................................................................................................14 1.4.2. Khái niệm tập hợp mờ ............................................................................14 1.4.3. Đặc trưng trên tập mờ .............................................................................15 1.4.4. Các phép toán trên tập mờ ......................................................................15 1.4.5. Các kiểu hàm thuộc của tập mờ..............................................................17 1.5. Kết luận chương .............................................................................................20 CHƯƠNG 2: TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ BIỂU ĐỒ MÀU MỜ ............................................................................................................................21 2.1. Đo khoảng cách giữa các biểu đồ màu ..........................................................21 2.1.1. Độ đo khoảng cách Minkowski (Lp) ......................................................21 2.1.2. Độ đo khoảng cách toàn phương (Quaratic) ..........................................22
  6. iv 2.1.3. Độ đo khoảng cách biểu đồ giao nhau (Histogram Intersection Distance) ..........................................................................................................................23 2.2. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu thông thường ..............23 2.3. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ ..............................29 2.3.1. Định nghĩa biểu đồ màu mờ (FCH) ........................................................29 2.3.2. Tính toán FCH và độ đo khoảng cách ....................................................29 2.4. Tổng kết chương ............................................................................................39 CHƯƠNG 3: THỬ NGHIỆM ...................................................................................40 3.1. Giới thiệu bài toán thử nghiệm ......................................................................40 3.2. Dữ liệu thử nghiệm ........................................................................................40 3.3. Mô tả hệ thống thử nghiệm ............................................................................41 3.3.1. Xây dựng CSDL đặc trưng .....................................................................41 3.3.2. Chức năng tìm kiếm ảnh.........................................................................42 3.4. Môi trường và công cụ sử dụng xây dựng thử nghiệm..................................42 3.5. Thiết kế chương trình thử nghiệm .................................................................43 3.5.1. Chức năng xây dựng CSDL đặc trưng ...................................................44 3.5.2. Xây dựng chức năng tìm kiếm ảnh trên cơ sở CCH theo RGB hoặc HSV và FCH ..............................................................................................................46 3.5.3. Thiết kế giao diện của chương trình thử nghiệm....................................47 3.6. Đánh giá kết quả thử nghiệm .........................................................................48 3.6.1. Đo lường hiệu suất trong hệ thống tìm kiếm ảnh ...................................48 3.6.2. Kết quả thử nghiệm ................................................................................49 KẾT LUẬN ...............................................................................................................58 TÀI LIỆU THAM KHẢO .........................................................................................60 PHỤ LỤC 1 ...............................................................................................................61
  7. v DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT Từ viết STT Từ viết đầy đủ Diễn giải tắt Tìm kiếm ảnh dựa theo 1 CBIR Content Based Image Retrieval nội dung Biểu đồ màu thông 2 CCH Conventional Color Histogram thường Commission Internationale de Ủy ban Quốc tế về màu 3 CIE l’Eclairage sắc Commission Internationale de Không gian màu đồng 4 CIELAB l’Eclairage L-*a-*b color space nhất CIELAB Cyan-Magenta-Yellow color 5 CMY Không gian màu CMY space 6 CSDL Cơ sở dữ liệu 7 FCH Fuzzy Color Histogram Biểu đồ màu mờ Thuật toán phân cụm mờ 8 FCM Fuzzy C – Mean C - Mean 9 GIS Geographic Information System Hệ thống thông tin địa lý 10 HSV Hue-Saturation-Value color space Không gian màu HSV Tập đoàn máy tính quốc 11 IBM International Business Machines tế IBM Định dạng hình ảnh 12 JPEG Joint Photographic Experts Group JPEG Không gian màu đồng 13 L*a*b* L*a*b* color space nhất L*a*b* Hàm thành viên hay hàm 14 MF Membership Functions thuộc Truy vấn ảnh dựa trên nội 15 QBIC Query By Image Content dung 16 RGB Red-Green-Blue color space Không gian màu RGB 17 WWW World Wide Web Mạng toàn cầu Y-Luma (Brighness hay 18 YCbCr Luminance); CbCr - Chroma Blue Không gian màu YCbCr và Chroma Red color space Y- Luminance; UV-chrominance 19 YUV Không gian màu YUV channels
  8. vi DANH MỤC HÌNH Bảng 3.1 Kết quả thử nghiệm độ chính xác với ảnh xe bus và một số ảnh khác nhau đã thêm 15% nhiễu gaussian và thay đổi độ sáng 15% ......................... 53 Bảng 3.2 Một số kết quả thử nghiệm trên CSDL ảnh WANG ....................... 54 Bảng 3.3 Một số kết quả thử nghiệm trên CSDL ảnh y tế .............................. 56
  9. vii DANH MỤC HÌNH Hình 1.1 Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung ..........................3 Hình 1.2 Cảm nhận màu từ quá trình xử lý thị giác [1] ..............................................5 Hình 1.3 Dải tần quang phổ điện từ [1] ......................................................................5 Hình 1.4 Không gian màu RGB [1] ............................................................................6 Hình 1.5 Không gian màu HSV ..................................................................................7 Hình 1.6 Không gian màu L*a*b ................................................................................8 Hình 1.7 Đặc trưng kết cấu .........................................................................................9 Hình 1.8 Đặc trưng hình dạng ...................................................................................10 Hình 1.9 Mô tả biểu đồ màu của ảnh ........................................................................11 Hình 1.10 Giao của hai tập mờ .................................................................................16 Hình 1.11 Hợp của hai tập mờ ..................................................................................16 Hình 1.12 Phần bù của một tập mờ ...........................................................................17 Hình 1.13 Các tập mờ tam giác .................................................................................17 Hình 1.14 Các tập mờ hình thang .............................................................................18 Hình 1.15 Tập mờ L ..................................................................................................18 Hình 1.16 Tập mờ Gamma tuyến tính ......................................................................19 Hình 1.17 Tập mờ Singleton .....................................................................................19 Hình 2.1 Độ đo khoảng cách Minkowski [6] ............................................................22 Hình 2.2 Độ đo khoảng cách Quaratic [6] ................................................................22 Hình 2.3 Sơ đồ khối hệ thống tìm kiếm ảnh sử dụng CCH trong .............................24 không gian màu RGB hoặc HSV ..............................................................................24 Hình 2.4 Biểu đồ CCH trong không gian màu RGB của ảnh truy vấn .....................25 Hình 2.5 Minh họa hai ảnh khác nhau có cùng biểu đồ màu CCH...........................27 trong RGB sử dụng 8 bin màu (23) ...........................................................................27 Hình 2.6 Tính toán và so sánh biểu đồ màu cục bộ của hình ảnh (A, B) .................28 Hình 2.7 Sơ đồ thủ tục tính toán FCH (n’=163 = 4096) ............................................30 Hình 2.8 Sơ đồ khối hệ thống suy luận mờ ...............................................................34 Hình 2.9 Hàm thành viên của L*,a* và b* [6] ..........................................................35 Hình 2.10 Hàm thành viên mờ đầu ra của hệ thống [6] ............................................36 Hình 2.11 Cấu trúc của biểu đồ màu mờ ..................................................................36
  10. viii Hình 2.12 Hệ thống suy luận mờ tạo ra biểu đồ màu mờ .........................................37 Hình 2.13 Biểu đồ FCH - 1D tạo ra từ hệ thống liên kết mờ của ảnh truy vấn gồm 10 bin màu. ................................................................................................................37 Hình 3.1 Kiến trúc hệ thống tìm kiếm ảnh theo nội dung trong luận văn ................43 Hình 3.2 Biểu đồ hoạt động của chức năng xây dựng CSDL đặc trưng CCH .........45 trong không gian màu RGB, HSV ............................................................................45 Hình 3.3 Biểu đồ hoạt động chức năng xây dựng CSDL đặc trưng .........................45 FCH trong không gian màu L*a*b* .........................................................................45 Hình 3.4 Biểu đồ hoạt động chức năng tìm kiếm ảnh trên cơ sở CCH theo RGB hoặc HSV ..................................................................................................................46 Hình 3.5 Biểu đồ hoạt động của chức năng tìm kiếm ảnh trên cơ sở FCH ..............47 Hình 3.6 Giao diện chính của chương trình thử nghiệm...........................................48 Hình 3.7 Giao diện tìm kiếm và hiển thị ảnh kết quả của chương trình ...................48 Hình 3.8 Biểu đồ màu CCH và FCH của ảnh bus 340.jpg và ảnh đã thêm 15% nhiễu gaussian ...........................................................................................................50 Hình 3.9 Biểu đồ màu CCH và FCH của ảnh xe bus 340.jpg...................................51 và ảnh đã thay đổi độ sáng 15% ................................................................................51 Hình 3.10 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với FCH.........................52 Hình 3.11 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong RGB .....52 Hình 3.12 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong HSV ......53
  11. 1 PHẦN MỞ ĐẦU Trong những năm gần đây, với sự tiến bộ trong công nghệ máy tính và viễn thông hiện đại đã dẫn đến việc lưu trữ dữ liệu đa phương tiện rất lớn trong các lĩnh vực. Hình ảnh đóng một vai trò rất quan trọng trong bất kỳ hệ thống thông tin trực quan và đa phương tiện nào. Hình ảnh là một đại diện trực quan của một đối tượng hoặc cảnh hoặc người hoặc trừu tượng. Bộ sưu tập hình ảnh đang tăng lên nhanh chóng với sự đa dạng các thiết bị chụp ảnh khác nhau như máy ảnh điện thoại, máy quét, máy ảnh kỹ thuật số, máy ảnh di động và việc tăng cường sử dụng dữ liệu đa phương tiện trên Internet. Vì vậy, nhu cầu tìm kiếm ảnh phục vụ cho công việc là một nhu cầu tất yếu. Hiện tại, tìm kiếm ảnh dựa trên nội dung ứng dụng trong nhiều lĩnh vực như quản lý nhãn hiệu logo, truy bắt tội phạm, ứng dụng trong y khoa, quân sự… bởi vì nó mang tính trực quan cao cho người sử dụng. Tìm kiếm ảnh dựa theo nội dung (Content Based Image Retrieval - CBIR) là tập hợp các kỹ thuật tìm kiếm hình ảnh mong muốn từ một bộ sưu tập hình ảnh lớn dựa trên các đặc trưng của ảnh (chẳng hạn như màu sắc, kết cấu và hình dạng) có thể được tự động trích xuất từ hình ảnh [4]. Kỹ thuật hay được sử dụng nhất trong CBIR là dựa trên cơ sở biểu đồ màu [1]. Ví dụ biểu đồ màu của một bức ảnh Luận văn thạc sĩ – Trần Quốc Bảo
  12. 2 Biểu đồ màu thông thường (Conventional Color Histogram - CCH) của một hình ảnh biểu thị tần suất xuất hiện của mọi màu trong một hình ảnh. CCH không xem xét độ tương đồng màu giữa các bin màu, hai màu lân cận nhưng ở hai bin màu khác nhau trong cùng dải màu thì màu khác nhau hoàn toàn. Do đó, nó nhạy cảm với nhiễu và sự thay đổi độ sáng của hình ảnh [1],[5]. Hơn nữa, số chiều hoặc số bin màu của biểu đồ lớn của CCH yêu cầu tính toán lớn khi so sánh biểu đồ. Vì vậy đề tài “Kỹ thuật tìm kiếm ảnh trên cơ sở biểu đồ màu mờ” tập trung trình bày kỹ thuật tìm kiếm ảnh trên một biểu đồ màu mới, được gọi là biểu đồ màu mờ (Fuzzy Color Histogram - FCH), ứng dụng các thuật toán, hàm tập mờ [1],[5-8]. Các phương pháp này sẽ giúp loại bỏ những phép tính lớn không cần thiết, FCH mạnh mẽ với nhiễu và sự thay đổi độ sáng mang lại độ chính xác hơn CCH và kết quả thực nghiệm sẽ cho thấy hiệu quả của việc tìm kiếm ảnh, nhất là trên CSDL ảnh lớn. Ngoài phần mở đầu giới thiệu các vấn đề liên quan đến bài toán cần giải quyết, phần kết luận chỉ ra các kết quả chính đạt được và hướng phát triển tiếp theo của luận văn, nội dung luận văn bao gồm ba chương chính như sau: Chương 1: Tổng quan về hệ thống tìm kiếm ảnh theo nội dung Trình bày kiến trúc tổng quan, các đặc trưng của ảnh sử dụng trong việc tìm kiếm, khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung. Trình bày khái quát về logic mờ, tập mờ, các phép toán tập mờ. Chương 2. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ Trình bày các kỹ thuật tìm kiếm ảnh dựa trên biểu đồ màu thông thường, biểu đồ màu mờ. Chương 3. Thử nghiệm Nêu bài toán thử nghiệm, mô tả và thiết kế chương trình thử nghiệm. Luận văn thạc sĩ – Trần Quốc Bảo
  13. 3 CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG 1.1. Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung CBIR là phương pháp tìm kiếm hình ảnh quan trọng, hiệu quả nhất và được nghiên cứu rộng rãi trong cả lĩnh vực học thuật và ngành công nghiệp. Những hình ảnh liên quan với một hình ảnh truy vấn được tìm thấy bằng hệ thống CBIR là sử dụng các đặc trưng cấp thấp (màu sắc, hình dạng, kết cấu) hoặc các đặc trưng cấp cao (nhận thức của con người) [4]. Kiến trúc của một hệ thống CBIR có thể được hiểu là một tập hợp các mô đun cơ bản tương tác với nhau để lấy ra các hình ảnh cơ sở dữ liệu theo một truy vấn đã cho. Trong một hệ thống tìm kiếm hình ảnh dựa trên nội dung điển hình (hình 1.1) được chia làm hai giai đoạn: Trích chọn đặc trưng ngoại tuyến (offline) và tìm kiếm ảnh trực tuyến (online). Trong giai đoạn ngoại tuyến, hệ thống tự động trích xuất các thuộc tính trực quan của từng hình ảnh trong CSDL dựa trên các giá trị pixel của nó và mô tả bằng các vectơ đặc trưng. Các vectơ đặc trưng này được lưu trữ trong một CSDL khác được gọi là CSDL đặc trưng. Ảnh truy vấn CSDL ảnh Trích chọn Trích chọn đặc trưng đặc trưng Đặc trưng ảnh Đo độ tương CSDL truy vấn tự đặc trưng Các ảnh Ngoại tuyến kết quả Trực tuyến Hình 1.1 Kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung Luận văn thạc sĩ – Trần Quốc Bảo
  14. 4 Trong giai đoạn trực tuyến, người dùng cung cấp cho hệ thống tìm kiếm hình ảnh truy vấn hoặc các hình vẽ phác thảo. Sau đó hệ thống biểu diễn hình ảnh truy vấn thành các vectơ đặc trưng. Các điểm tương đồng hay khác biệt giữa các vectơ đặc trưng của hình ảnh truy vấn và những hình ảnh trong CSDL sau đó được tính toán và so sánh khoảng cách. Kết quả của phép so sánh là một chỉ số đánh giá độ tương tự giữa ảnh truy vấn và ảnh lấy ra từ CSDL. Dựa vào chỉ số độ tương tự tính toán được ở trên, hệ thống sẽ sắp xếp các ảnh tìm được trong CSDL ảnh theo thứ tự giảm dần độ tương tự và hiển thị ảnh kết quả ở đầu ra của hệ thống. Một số hệ thống CBIR sử dụng mô-đun tùy chọn đến phản hồi có liên quan, nơi người dùng tinh chỉnh kết quả tìm kiếm dần dần bằng cách đánh dấu hình ảnh trong kết quả là "có liên quan", "không liên quan" hoặc "trung lập" đối với truy vấn tìm kiếm, sau đó lặp lại tìm kiếm với thông tin mới. Do đó, từ kết quả truy vấn, người dùng có thể đánh giá hình ảnh nào có liên quan và hệ thống có thể tái sử dụng thông tin của họ để cải thiện kết quả. 1.2. Các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung Việc trích chọn những đặc trưng trực quan từ hình ảnh là mục tiêu cơ bản của một hệ thống CBIR. Việc lựa chọn các đặc trưng để đại diện cho một hình ảnh là một trong những bài toán của nó. Do tính chủ quan nhận thức và thành phần phức tạp của dữ liệu trực quan, không tồn tại một biểu diễn tốt nhất cho bất kỳ đặc trưng hình ảnh cụ thể nào. Nhiều phương pháp tiếp cận đã được giới thiệu và mỗi phương pháp mô tả đặc trưng này bằng những quan điểm khác nhau. Những đặc trưng này được sử dụng trong nhiều ứng dụng về xử lý ảnh, nhận dạng ảnh, …Các phương pháp trích chọn đặc trưng của ảnh tập trung vào: màu sắc, kết cấu và hình dạng. Luận văn thạc sĩ – Trần Quốc Bảo
  15. 5 1.2.1. Đặc trưng màu sắc: Đặc trưng màu sắc được sử dụng phổ biến nhất trong tìm kiếm ảnh theo nội dung. Vì một ảnh màu thì thông tin quan trọng nhất trong ảnh chính là màu sắc. Hơn nữa, màu sắc là đặc điểm trực quan đầu tiên và dễ nhất cho việc đánh chỉ số, trích chọn thông tin màu của ảnh đưa ra phân tích và tìm kiếm ảnh đã có hiệu quả thông qua biểu đồ màu. Có nhiều định nghĩa về màu, từ góc nhìn khoa học: Màu là phân bổ bước sóng λ (red: 700 nm, violet: 400 nm) hay tần số f của sóng điện từ. Từ quá trình xử lý thị giác: Màu là thuộc tính quan sát vật thể, kết quả từ việc vật thể phát ra, truyền hay phản xạ ánh sáng đến mắt người. Hình 1.2 Cảm nhận màu từ quá trình xử lý thị giác [1] Ánh sáng (hay màu) mà con người nhận biết là dải tần hẹp trong quang phổ điện từ. Hình 1.3 Dải tần quang phổ điện từ [1] Luận văn thạc sĩ – Trần Quốc Bảo
  16. 6 Con người chỉ có khả năng nhận thức được ánh sáng có bức xạ điện từ với bước sóng trong khoảng 400nm – 700nm. Cơ quan thị giác cảm nhận được ánh sáng là do bề mặt đối tượng phát ra ánh sáng, là kết quả của sự tương tác giữa năng lượng chiếu sáng và những phân tử của bề mặt đối tượng. Một đối tượng màu xanh dương sẽ có bề mặt màu xanh dương khi chiếu ánh sáng trắng vào nhưng đối tượng đó sẽ có màu tím khi chiếu vào ánh sáng đỏ. Ánh xạ dạng sóng vào bộ ba phần tử số để biểu diễn ba tính chất vật lý: bước sóng gốc (màu), độ tinh khiết và cường độ/độ chói. Các vấn đề chính trong khai thác đặc trưng màu bao gồm không gian màu, lượng tử hóa màu và lựa chọn chức năng tương tự. Các nghiên cứu khác nhau về nhận thức màu sắc và không gian màu đã được đề xuất [4]. Không gian màu là mô hình toán học trừu tượng mô tả cách biểu diễn màu mà con người có thể nhận biết bởi bộ các chữ số (3 hay 4 giá trị) hay bởi các thành phần màu [1]. Mỗi điểm ảnh trên một bức ảnh có thể được biểu diễn bằng một điểm trong một không gian màu 3 chiều. Một số không gian màu thông dụng: 1.2.1.1. Không gian màu RGB Hình 1.4 Không gian màu RGB [1] RGB là không gian màu được sử dụng phổ biến nhất để hiển thị ảnh, bao gồm 3 thành phần màu là Đỏ (Red), Xanh lá cây (Green) và Xanh lam (Blue). Không gian RGB thuộc mô hình cộng bởi vì các màu sắc trong không gian RGB đều có thể thu được bằng cách cộng 3 thành phần màu này lại với Luận văn thạc sĩ – Trần Quốc Bảo
  17. 7 nhau. Việc biểu diễn một màu tùy ý trong dãy hiển thị được làm bằng cách tổ hợp ba màu chính, gán giá trị từ 0 đến 1 cho R(1,0,0), G(0,1,0), B(0,0,1). Ví dụ: Red (1,0,0) + Blue (0,0,1)  Magenta (1,0,1). Đường chéo từ (0,0,0) đến (1,1,1) biểu diễn màu xám. Tuy nhiên không gian màu RGB không thể biểu diễn mọi màu trong phổ nhìn thấy. 1.2.1.2. Không gian màu HSV Không gian HSV được mô tả bằng khối lập phương RGB quay trên đỉnh Black. H (Hue) là góc quay trục V (Value) qua 2 đỉnh Black và White. Các giá trị biến thiên của H, S, V như sau: Hue: Bước sóng gốc của ánh sáng, biểu diễn bằng góc từ 00 đến 3600. Hình 1.5 Không gian màu HSV Saturation: Thước đo độ tinh khiết ánh sáng gốc, S có giá trị từ 0 - 1. Biểu diễn độ tinh khiết của màu / độ tinh khiết cực đại. Value: Cường độ hay độ chói ánh sáng, Value có giá trị từ 0 - 1, V = 0  màu đen. Đỉnh có cường độ màu cực đại. Không gian HSV trực giác hơn RGB. Bắt đầu từ Hue (H cho trước và V=1, S=1), thay đổi S: Bổ sung hay bớt trắng, thay đổi V: Bổ sung hay bớt đen cho đến khi có màu mong muốn. Mắt người có thể phân biệt 128 Hues, 130 tints (thêm trắng) và cực đại 30 shades (thêm đen): 128 x 130 x 30 = 382.720 màu khác nhau [1]. 1.2.1.3. Không gian màu YUV Không gian màu YUV là Không gian màu dành cho TV tương tự (NTSC, PAL và SECAM): Y là độ chói (luminance) của điểm ảnh và chỉ sử dụng kênh đen trắng; U và V là các kênh màu (chrominance channels); V biểu diễn R-Y và U biểu diễn B-Y. Kênh Y được định nghĩa bởi trọng số của giá Luận văn thạc sĩ – Trần Quốc Bảo
  18. 8 trị R(0.299), G(0.587), B(0.144). Sơ đồ lượng tử hoá cho không gian màu YUV và YIQ thường được sử dụng là 125 (53) hoặc 216 (63) mức. 1.2.1.4. Không gian màu L*a*b (CIELAB) Không gian L*a*b được phát triển bởi CIE (Commission Internationale de l’Eclairage) cho việc định nghĩa một không gian màu đồng nhất về cảm nhận. Không gian màu là một hình trụ với L* hình thành nên trục đầu tiên (thẳng đứng), L* xác định độ sáng của màu từ đen đến trắng (hình 1.6). Hình 1.6 Không gian màu L*a*b Không gian màu L*a*b được đưa ra như những sự lựa chọn cho các không gian màu mà độ chói được thừa nhận là không đổi cho tất cả các màu. Tầm quan trọng của màu sắc và độ chói là cân bằng nhau. Kết quả là trong không gian màu này, ba đặc tính biểu diễn một không gian màu sắc là tính đồng nhất, tính đầy đủ và tính duy nhất được đáp ứng. Do đó, nó thích hợp cho bài toán tìm kiếm ảnh theo nội dung. 1.2.1.5. Lượng tử hóa màu Lượng tử hóa màu là quá trình tối ưu hóa việc sử dụng các màu riêng biệt trong một hình ảnh mà không ảnh hưởng đến các thuộc tính trực quan của một hình ảnh. Đối với hình ảnh màu thực (24 bit), số màu riêng biệt lên đến 224 = 16.777.216 màu và việc trích xuất trực tiếp đặc trưng màu từ màu thực sẽ dẫn đến tính toán lớn. Để giảm tính toán, lượng tử hóa màu có thể được sử Luận văn thạc sĩ – Trần Quốc Bảo
  19. 9 dụng để thể hiện hình ảnh mà không làm giảm đáng kể chất lượng hình ảnh, do đó làm giảm không gian lưu trữ và tăng tốc độ xử lý. Khi giảm một màu {R, G ,B} 24 bit màu thành màu mới {R’, G’ ,B’} với n3 màu được tính theo công thức: R’ = n*R/28 G’ = n*G/28 B’ = n*B/28 Vì vậy, sau khi giảm số màu sẽ có n*n*n=n3 màu. 1.2.2. Đặc trưng kết cấu Kết cấu (texture) là một tính chất quan trọng khác của ảnh. Kết cấu là một thành phần có ảnh hưởng rất quan trọng đối với sự nhận thức trực quan của con người. Nó cung cấp bản mẫu trực quan về vùng của ảnh. Các thuộc tính quan trọng của đặc trưng kết cấu như: Độ tương phản, thuộc tính thô, hướng, tính quy luật, chu kỳ và tính ngẫu nhiên. Hình 1.7 Đặc trưng kết cấu Không giống như màu sắc, kết cấu thể hiện trên một vùng chứ không phải tại một điểm ảnh và thường được định nghĩa bằng các mức xám. Rất nhiều cách thể hiện kết cấu đã được nghiên cứu trong lĩnh vực nhận dạng và thị giác máy tính. Xét một cách cơ bản, các phương pháp biểu diễn kết cấu có thể được chia thành hai loại: Phương pháp cấu trúc và phương pháp thống kê. Các phương pháp cấu trúc bao gồm các toán tử hình thái và đồ thị liền kề, mô tả kết cấu bằng cách định nghĩa các nguyên thuỷ cấu trúc và luật sắp Luận văn thạc sĩ – Trần Quốc Bảo
  20. 10 đặt của chúng. Các phương pháp này tỏ ra có hiệu quả khi áp dụng trong trường hợp kết cấu thông thường. Các phương pháp thống kê bao gồm: Phương pháp phổ năng lượng Fourier, ma trận đồng khả năng, Tamura, Phân tích Wold, trường ngẫu nhiên Markov, Không gian fractal, các bộ lọc đa phân giải như biến đổi Gabor và biến đổi dạng sóng... thể hiện kết cấu bằng sự phân bố thống kê của độ sáng của các điểm ảnh. 1.2.3. Đặc trưng hình dạng Các đặc điểm phát hiện biên của các vùng ảnh và các đối tượng ảnh được sử dụng trong rất nhiều hệ thống tìm kiếm ảnh. So với các đặc điểm về màu sắc và các đặc điểm về kết cấu thì các đặc điểm về hình dạng thường chỉ được sử dụng sau khi ảnh đã phân thành các vùng hoặc các đối tượng ảnh. Nhưng do việc phân vùng và tách đối tượng ảnh khó thu được kết quả tốt nên việc sử dụng các đặc điểm hình dạng để tìm kiếm ảnh thường bị bó hẹp trong một số ứng dụng mà ở đó các vùng ảnh hoặc đối tượng ảnh đã được tách biệt rõ ràng. Các phương pháp trích chọn đặc điểm hình dạng thường được chia thành hai loại là trích chọn dựa theo đường biên (xấp xỉ đa giác, không gian phần tử hữu hạn, mô tả hình dạng theo Fourier) và trích chọn dựa theo vùng ảnh (không gian thống kê). Hình 1.8 Đặc trưng hình dạng Trước khi áp dụng các phương pháp trích chọn đặc điểm hình dạng, các đối tượng ảnh cần phải được tách ra khỏi ảnh. Giả sử là trong mỗi ảnh chỉ có Luận văn thạc sĩ – Trần Quốc Bảo
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2