intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Hệ thống thông tin: Nghiên cứu phương pháp xây dựng hệ thống tìm kiếm ảnh theo nội dung sử dụng biểu đồ màu mờ

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:85

33
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn này sẽ thể hiện một số kỹ thuật dựa trên phản hồi liên quan, được ứng dụng trong công nghệ tra cứu ảnh theo nội dung. Để cải thiện hiệu năng tra cứu, thu hẹp khoảng cách về ngữ nghĩa. Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Hệ thống thông tin: Nghiên cứu phương pháp xây dựng hệ thống tìm kiếm ảnh theo nội dung sử dụng biểu đồ màu mờ

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM Trịnh Trung Nghĩa LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ Hà Nội – tháng 5 năm 2020
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGH Ệ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM Trịnh Trung Nghĩa LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ Chuyên ngành: Hệ thống thông tin Mã số: 8480104 CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS.TS. ĐẶNG VĂN ĐỨC Hà Nội , 2020
  3. ` LỜI CAM ĐOAN Tôi xin cam đoan luận văn với tên đề tài “Nghiên cứu phương pháp tra cứu ảnh theo nội dung sử dụng biểu đồ màu mờ” là kết quả của việc học tập và nghiên cứu của bản thân học viên, thu thập cơ sở dữ liệu thực tiễn dưới sự hướng dẫn khoa học của PGS. TS. Đặng Văn Đức. Các số liệu, kết quả đưa ra tại luận văn này của tôi là hoàn toàn đúng đắn và trung thực, những tài liệu thông tin sử dụng trong luận văn này được trích dẫn và có nguồn gốc rõ ràng, đầy đủ. . Hà Nội, Ngày …. Tháng …. Năm 2020 Ngƣời cam đoan Trịnh Trung Nghĩa 1
  4. ` LỜI CẢM ƠN Trong quá trình học tập và thực hiện luận văn, tôi đã được các Thầy cô của Viện Hàn lâm Khoa học và Công nghệ Việt Nam tạo mọi điều kiện thuận lợi và được bạn bè cùng đồng nghiệp đã thường xuyên động viên để tôi hoàn thành Luận văn này. Tôi xin bày tỏ sự cảm ơn chân thành với những sự hỗ trợ và giúp đỡ này. Luận văn sẽ không thể hoàn thành nếu không có sự hướng dẫn tận tình của Thầy hướng dẫn khoa học PGS.TS Đặng Văn Đức, là người thầy mà tôi muốn bày tỏ lòng biết ơn sâu sắc nhất. Thầy đã cho tôi nhiều ý kiến đóng góp, giúp đỡ quan trọng trong quá trình thực hiện luận văn. Xin chân thành cảm ơn Ban quản lý Học Viện CNTT cùng toàn thể các Thầy Cô giáo Viện Công Nghệ Thông Tin - Viện Hàn Lâm Việt Nam đã quan tâm tạo môi trường thuận lợi để cho tôi học tập và nghiên cứu chuyên sâu về lĩnh vực Công nghệ thông tin. Cuối cùng tôi cảm ơn tất cả những sự giúp đỡ của đồng nghiệp, bạn bè đã đóng góp ý kiến, động viên để tôi hoàn thành được luận văn này. Hà Nội, Ngày …. Tháng 5 Năm 2020 Học Viên Trịnh Trung Nghĩa 2
  5. ` DANH MỤC KÝ HIỆU,CHỮ VIẾT TẮT STT Từ viết tắt Từ viết đầy đủ Diễn giải 1 CBIR Content Based Image Tìm kiếm ảnh dựa theo Retrieval nội dung 2 CCH Conventional Color Biểu đồ màu thông Histogram thường 3 CIE Commission Internationale Ủy ban Quốc tế về màu del’Eclairage sắc 4 CIELAB Commission Internationale Không gian màu đồng del’Eclairage L-*a-*b color nhất CIELAB space 5 CMY Cyan-Magenta-Yellowcolor Không gian màu CMY space 6 CSDL Cơ sở dữ liệu 7 FCH Fuzzy Color Histogram Biểu đồ màu mờ 8 FCM Fuzzy C – Mean Thuật toán phân cụm mờ C - Mean 9 GIS Geographic Information Hệ thống thông tin địa lý System 10 HSV Hue-Saturation-Value color Không gian màu HSV space 3
  6. ` 11 IBM International Business Tập đoàn máy tính quốc Machines tế IBM 12 JPEG Joint Photographic Experts Định dạng hình ảnh Group JPEG 13 L*a*b* L*a*b* color space Không gian màu đồng nhất L*a*b* 14 MF Membership Functions Hàm thành viên hay hàm thuộc 15 QBIC Query By Image Content Truy vấn ảnh dựa trên nội dung 16 RGB Red-Green-Blue color space Không gian màu RGB 17 WWW World Wide Web Mạng toàn cầu Y-Luma (Brighnesshay 18 YCbCr Luminance); CbCr – Không gian màu YCbCr ChromaBlue và Chroma Red color space 19 YUV Y- Luminance; UV - Không gian màu YUV chrominancechannels 4
  7. ` DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN Hình 1.1: Tổng quan kiến trúc về hệ thống tra cứu ảnh Hình 1.2: Tương quan màu sắc, ánh sáng với Mắt Hình 1.3: Không gian màu RGB Hình 1.4: Đặc trưng kết cấu của ảnh Hình 2.1: Biểu đồ mô tả màu của ảnh Hình 2.2: Biểu đồ màu của 3 ảnh khác nhau Hình 2.3 : Công cụ tìm kiếm hình ảnh của Google Hình 2.4: Phần bù của một tập mờ Hình 2.5: Độ đo khoảng cách Minkowski Hình 2.6: Độ đo khoảng cách Quadretic Hình 2.7: Ảnh và biểu đồ màu của ảnh thử nghiệm Hình 2.7.1: Tính khoảng cách giữa ảnh A và B sử dụng LCH Hình 2.7.2: Sơ đồ thủ tục tính toán FCH (n’=163 = 4096) Hình 2.8: Sơ đồ khối hệ thống suy luận mờ Hình 2.9: Hàm thành viên của L*,a* và b* Hình 2.10: Hàm thành viên mờ đầu ra của hệ thống Hình 2.11: Cấu trúc của biểu đồ màu mờ Hình 2.12: Hệ thống suy luận mờ tạo ra biểu đồ màu mờ Hình 2.13: Biểu đồ FCH - 1D tạo ra từ hệ thống liên kết mờ của ảnh truy vấn Hình 3.1 Kiến trúc hệ thống tìm kiếm ảnh theo nội dung ở trong luận văn Hình 3.2 Kiểu dữ liệu struct trong CSDL đặc trưng trong Matlab Hình 3.2 Biểu đồ chức năng hoạt động của xây dựng CSDL đặc trưng CCH trong không gian màu RGB, HSV 5
  8. ` Hình 3.3 Biểu đồ chức năng hoạt động, xây dựng CSDL đặc trưng FCH trong không gian màu L*a*b* Hình 3.4 Biểu đồ hoạt động chức năng tìm kiếm ảnh trên cơ sở CCH theo RGB hoặc HSV Hình 3.6 Giao diện chính của chương trình thử nghiệm Hình 3.7 Giao diện tìm kiếm và hiển thị ảnh kết quả của chương trình Hình 3.8 Biểu đồ màu CCH và FCH của ảnh bus 340.jpg và ảnh đã thêm 15% nhiễu gaussian Hình 3.9 Biểu đồ màu CCH và FCH của ảnh xe bus 340.jpg và ảnh đã thay đổi độ sáng 15% Hình 3.10 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với FCH Hình 3.11 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trongRG Hình 3.12 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong HSV Bảng 3.1 Kết quả thử nghiệm độ chính xác với ảnh xe bus và một số ảnh khác nhau , đã tạo thêm 15% độ nhiễu Gausian và thay đổi độ sáng 15%. Bảng 3.2 Một số kết quả thử nghiệm tìm kiếm trong CSDL ảnh WANG Bảng 3.3 Một số kết quả thử nghiệm từ chương trình tìm kiếm ảnh trên CSDL ảnh y tế 6
  9. ` MỤC LỤC LỜI CAM ĐOAN ............................................................................................ 1 LỜI CẢM ƠN .................................................................................................. 2 DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN ......................................... 5 MỤC LỤC ........................................................................................................ 7 PHẦN MỞ ĐẦU ............................................................................................ 10 CHƢƠNG 1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG 12 1.1. Hệ thống tra cứu ảnh theo nội dung và những thành phần chính của nó........................................................................................................... 15 1.2. Các đặc trƣng trong hệ thống tìm kiếm ảnh dựa trên nội dung .... 16 1.2.1. Đặc trưng màu sắc ....................................................................... 16 Các đặc trưng về hình dạng của ảnh ........................................................ 18 1.2.2. Đặc trưng kết cấu ......................................................................... 20 1.2.3. Biểu đồ màu .................................................................................. 21 1.3. Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung ..... 24 1.3.1. Công cụ tìm kiếm Google Image Search ...................................... 25 1.3.2. Hệ thống QBIC (Query By ImageContent) .................................. 26 1.3.3. Hệ thống WebSEEK và VisualSEEK ............................................ 26 1.4. Tổng quan về Logic mờ ...................................................................... 27 1.4.1. Giới thiệu chung về Logic mờ ...................................................... 27 1.4.2. Khái niệm tập hợp mờ. ................................................................. 29 1.4.3. Các đặc trưng của tập mờ ............................................................ 29 1.4.4. Các phép toán trên tập mờ ........................................................... 30 1.5. Kết luận chƣơng .................................................................................. 34 7
  10. ` CHƢƠNG 2. TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ BIỀU ĐỒ MÀU MỜ...................................................................................... 35 2.1. Đo khoảng cách giữa các biểu đồ màu .............................................. 35 2.1.1. Độ đo khoảng cách Minkowski(Lp) .............................................. 36 2.1.2. Độ đo khoảng cách toàn phương(Quaratic) ................................ 37 2.1.3. Độ đo khoảng cách biểu đồ giao nhau (Histogram Intersection Distance) ................................................................................................... 39 2.2. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu thông thƣờng ...................................................................................................................... 39 2.2.1. Biểu đồ màu toàn bộ (Global Color Histogram) ......................... 39 2.2.2. Biểu đồ màu cục bộ ( LCH )......................................................... 41 2.3. Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ ............... 43 2.3.1. Định nghĩa biểu đồ màu mờ(FCH) .............................................. 43 2.3.2. Tính toán FCH và độ đo khoảng cách ......................................... 43 2.3.3. Tính toán FCH trong không gian màu CIELAB sử dụng thuật toán phân cụm mờ ............................................................................................. 44 2.3.4. Phương pháp tạo biểu đồ màu dựa vào hệ thống liên kết mờ trong không gian màu L*a*b* ........................................................................... 47 2.4. Tổng kết chƣơng.................................................................................. 54 CHƢƠNG 3. THỬ NGHIỆM .................................................................... 55 3.1. Giới thiệu bài toán thử nghiệm .......................................................... 55 3.2. Dữ liệu thử nghiệm ............................................................................. 55 3.3. Mô tả hệ thống thử nghiệm ................................................................ 56 3.3.1. Xây dựng CSDL đặc trưng ........................................................... 56 3.3.2. Chức năng tìm kiếm ảnh............................................................... 56 3.4. Môi trƣờng và công cụ sử dụng xây dựng thử nghiệm ................... 57 8
  11. ` 3.5. Thiết kế chƣơng trình thử nghiệm .................................................... 58 3.5.1. Xây dựng CSDL đặc trưng - Thiết kế CSDL đặc trưng ............... 59 3.5.2. Thiết kế giao diện của chương trình thử nghiệm ......................... 63 3.6. Đánh giá kết quả thử nghiệm............................................................. 64 3.6.1. Đo lường hiệu suất trong hệ thống tìm kiếm ảnh......................... 64 3.6.2. Kết quả thử nghiệm ...................................................................... 65 CHƢƠNG 4. KẾT LUẬN........................................................................... 78 TÀI LIỆU THAM KHẢO ............................................................................ 80 PHỤ LỤC 1 .................................................................................................... 82 9
  12. ` PHẦN MỞ ĐẦU Ngày nay với sự phát triển của của các phương tiện truyền thông, các phương tiện lưu trữ hình ảnh, cùng kích thước của các tập ảnh số được gia tăng một cách chóng mặt. Thì việc tìm kiếm ảnh và lưu trữ ảnh sao cho nhanh chóng và hiệu quả là rất cần thiết với người dùng. Việc tra cứu ảnh là nhu cầu rất cần thiết từ nhiều lĩnh vực khác nhau như: trinh sát, dự báo thời tiết, phòng chống tội phạm…. Cùng chung mục đích này, rất nhiều các chương trình thiết kế để tìm kiếm ảnh đã được xây dựng và ứng dụng trong thực tế. Trong đó có hai nền tảng chính là: dựa trên văn bản (text-based) và dựa trên nội dung (content-based). Các phương pháp tiếp cận trong những năm 1970 dựa trên văn bản được sử dụng nhiều. Tại thời điểm đó các bức ảnh được con người chú thích bằng văn bản một cách thủ công , sau đó được lưu trữ bởi các hệ thống quản lý cơ sở dữ liệu, và đưa vào thực hiện việc tra cứu ảnh. Khi đó người ta nhận ra một số nhược điểm của phương pháp này đó là: Thứ nhất: Nó cần quá nhiều công sức lao động của con người để tạo chú thích cho những bức ảnh. Thứ hai là: nếu việc đánh chú thích không chuẩn do nhận thức chủ quan của mỗi người là khác nhau. Để khắc phục hai nhược điểm trên của hệ thống tra cứu ảnh dựa trên văn bản, khái niệm tra cứu ảnh dựa trên nội dung được giới thiệu vào đầu năm 1980. Với Luận văn này sẽ thể hiện một số kỹ thuật dựa trên phản hồi liên quan, được ứng dụng trong công nghệ tra cứu ảnh theo nội dung. Để cải thiện hiệu năng tra cứu, thu hẹp khoảng cách về ngữ nghĩa. Luận văn được chia làm 3 chương cụ thể như sau: Chƣơng 1: Các khái niệm chung về tra cứu ảnh dựa trên nội dung. Giới thiệu các kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung, các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung, khả năng ứng dụng và khái quát về Logic mờ. 10
  13. ` Chƣơng 2: Đo khoảng cách giữa các biểu đồ màu, Tìm kiếm ảnh theo nội dung dựa trên cơ sở biểu đồ màu thông thường, Tìm kiếm ảnh theo nội dung trên cơ sở biều đồ màu mờ. Chƣơng 3: Áp dụng cài đặt chương trình thử nghiệm. Cài đặt chương trình tìm kiếm ảnh, thử nghiệm trên Matlab dựa theo kiến thức và lý thuyết từ các chương của luận văn. 11
  14. ` CHƢƠNG 1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG Giới thiệu: Hiện nay với việc bùng nổ về hệ thống thông tin thì việc tìm kiếm thông tin dữ liệu có vai trò quan trọng, trong đó việc tìm kiếm ảnh cũng đang trở nên cần thiết. Truy xuất thông tin hình ảnh dựa trên nội dung, hoặc truy xuất hình ảnh dựa trên nội dung là một trong những lĩnh vực nghiên cứu mạnh mẽ nhất trong lĩnh vực máy tính trong hơn 10 năm qua. Sự sẵn có của số lượng lớn dữ liệu trực quan và đa phương tiện đang phát triển, và sự phát triển của Internet nhấn mạnh đến các nhu cầu để tạo ra các phương thức truy cập theo chủ đề, cung cấp nhiều hơn các truy vấn hoặc yêu cầu dựa trên văn bản đơn giản, dựa trên các trường cơ sở dữ liệu chính xác. Có nhiều chương trình và công cụ đã được phát triển để hình thành và thực hiện các truy vấn dựa trên nội dung hình ảnh hoặc âm thanh, để giúp chạy duyệt các kho dữ liệu đa phương tiện lớn. Tuy nhiên, không có bước đột phá chung nào đạt được đối với các cơ sở dữ liệu lớn khác nhau với các tài liệu thuộc các loại khác nhau về đặc điểm và nội dung. Một số câu trả lời cho nhiều câu hỏi liên quan đến tốc độ, mô tả ngữ nghĩa hoặc giải thích hình ảnh khách quan vẫn chưa được trả lời. Để tìm kiếm ảnh hiện nay có hai cách: một là phương pháp tìm kiếm theo từ khoá và hai là tìm kiếm theo nội dung ảnh. Phương pháp thứ nhất là tìm kiếm ảnh theo từ khoá phương pháp này người dùng khá ưa thích vì tính chất đơn giản và dễ thao tác. Cùng với đó việc tìm kiếm ảnh dựa theo từ khoá thì nhanh hơn so với tìm kiếm theo nội dung bởi vì tìm kiếm theo từ khóa hoạt động trên việc so sánh và phân tích các từ hay cụm từ khi xác định chúng giống với nhau thì đưa ra kết quả gần đúng nhất . Do kiểu dữ liệu đầu vào là dạng văn bản nên việc tìm kiếm và xuất kết quả thực hiện một cách nhanh chóng, và không đòi hỏi người tìm kiếm phải chuẩn bị ảnh mẫu trước. Bên cạnh đó việc tìm kiếm theo phương pháp này còn có một số hạn chế đó là kết quả tìm kiếm khi trả về đôi khi không đúng ý định ban đầu của người dùng. 12
  15. ` Để khắc phục các hạn chế trên thì phương pháp tìm kiếm ảnh dựa trên nội dung được ra đời để khắc phục những hạn chế này. Tư tưởng chính của phương pháp tìm kiếm ảnh này là người ta tự động trực tiếp gắn mô tả cho những bức ảnh, phân tích nội dung ảnh mà không có sự can thiệp thủ công. Điểm nổi bật của thuật toán này so với thuật toán tìm kiếm ảnh dựa trên từ khóa đó là nội dung của ảnh luôn luôn nhất quán và ở phần trích chọn đặc trưng của ảnh được thực hiện một cách tự động. Trên thực tế, người sử dụng luôn thích dùng các từ khóa, để mô tả văn bản và giải thích cho hình ảnh của họ và đo độ tương tự. Trên một khía cạnh nào đó những đặc trưng này được trích chọn tự động bằng việc sử dụng các kỹ thuật của thị giác máy và chủ yếu là các đặc trưng ở mức thấp như đặc trưng về hình dạng, đặc trưng về màu sắc ảnh, đặc trưng về kết cấu, …). Cho dù đã có nhiều thuật toán được đầu tư về kỹ thuật để mô tả các đặc trưng của ảnh như màu sắc, hình dạng nhưng vẫn không thể phản ánh hết các ngữ nghĩa của ảnh. Phân tích nội dung đa phương tiện được áp dụng trong các ứng dụng thị giác máy tính trong thế giới thực khác nhau và hình ảnh kỹ thuật số là một phần chính của dữ liệu đa phương tiện. Trong vài năm qua, sự phức tạp của nội dung đa phương tiện, đặc biệt là hình ảnh đã tăng theo cấp số nhân và trên cơ sở hàng ngày, hơn hàng triệu hình ảnh được tải lên tại các kho lưu trữ khác nhau như Twitter, Facebook và Instagram. Để tìm kiếm một hình ảnh có liên quan từ một kho lưu trữ là một vấn đề nghiên cứu đầy thách thức cho cộng đồng nghiên cứu tầm nhìn máy tính. Hầu hết các công cụ tìm kiếm lấy hình ảnh trên cơ sở các cách tiếp cận dựa trên văn bản truyền thống dựa trên chú thích và siêu dữ liệu. Trong thập kỷ qua , nghiên cứu sâu rộng được báo cáo để tìm kiếm , ảnh dựa trên nội dung (CBIR) , phân loại hình ảnh và phân tích. Các khái niệm quan trọng và nghiên cứu chính dựa trên CBIR và biểu diễn hình ảnh sẽ được thảo luận chi tiết và các hướng nghiên cứu trong tương lai được kết luận và tạo điều kiện cho nghiễn cứu tiếp theo trong lĩnh vực này. Kỹ thuật tìm kiếm ảnh dựa trên nội dung (CBIR) đã được đưa vào như 13
  16. ` một câu trả lời cho những khó khăn của cách tiếp cận dựa trên văn bản. Kỹ thuật CBIR vượt qua rào cản đại diện cho một hình ảnh mang tính văn bản. Trong các hệ thống CBIR , thuật toán xử lý hình ảnh được sử dụng và các vector đặc trưng được trích xuất tự động. Các tính năng của hình ảnh là màu sắc, kết cấu và hình dạng. Các vecto đặc trưng đại diện cho các tính năng này. Ưu điểm của CBIR : - Quá trình thu hồi được xử lý một cách tự động. - Không cần nỗ lực để chú thích hình ảnh. Nhược điểm của CBIR: - Quản lý hình ảnh khá phức tạp. - CBIR cần chuyển đổi nhận thức của user cấp cao thành tính năng hình ảnh cấp thấp. - Việc lập các chỉ mục hình ảnh là phức tạp. - Xử lý truy vấn cũng phụ thuộc vào diễn giải trực quan. Do vậy, các khái niệm đặc trưng mức cao và các đặc trưng mức thấp vẫn còn nhiều nên hiệu suất của CBIR là vẫn còn tương đối lớn với mong muốn của người sử dụng. 14
  17. ` 1.1. Hệ thống tra cứu ảnh theo nội dung và những thành phần chính của nó. Một hệ thống tra cứu ảnh theo nội dung cần các thành phần sau: Hình 1-1: Tổng quan về kiến trúc của hệ thống tra cứu ảnh Trong một hệ thống tra cứu ảnh theo nội dung có ba thành phần quan trọng nhất đó là: Giao diện truy vấn cho người dùng, đánh chỉ số và trích chọn đặc trưng . 15
  18. ` 1.2. Các đặc trƣng trong hệ thống tìm kiếm ảnh dựa trên nội dung CBIR đề cập đến nội dung hình ảnh được lấy trực tiếp, qua đó các hình ảnh có tính năng nhất định hoặc chứa nội dung nhất định sẽ được tìm kiếm trong cơ sở dữ liệu hình ảnh. Ý tưởng chính của CBIR là phân tích thông tin hình ảnh bằng các tính năng cấp thấp của hình ảnh, bao gồm: màu sắc, kết cấu, hình dạng và mối quan hệ không gian của các đối tượng, v.v.. và thiết lập các vector đặc trưng của hình ảnh làm chỉ mục. Phương pháp truy xuất tập trung tính toán mức độ tương đồng giữa véc tơ đặc trưng đa chiều ảnh đầu vào và các véc tơ đặc trưng đa chiều trong CSDL. 1.2.1. Đặc trƣng màu sắc Hiện nay việc sử dụng đặc trưng màu sắc của ảnh trong tìm kiếm ảnh được sử dụng rất nhiều, đặc biệt trong lĩnh vực tra cứu ảnh dựa theo nội dung.Vì ta thấy được rằng trong một bức ảnh màu thì dữ liệu quan trọng nhất của nó là màu sắc. Mặt khác, màu sắc có những đặc điểm rất dễ trong việc đánh chỉ số và có tính trực quan, trích chọn theo thông tin màu của ảnh sau đó đưa ra những phân tích và tìm kiếm ảnh đã có hiệu quả thông qua biểu đồ màu. Có nhiều định nghĩa về màu, từ góc nhìn khoa học: Màu là phân bổ bước sóng λ (red: 700nm, violet: 400nm) hay tần số f của sóng điện từ.Từ quá trình xử lý thị giác: Màu là thuộc tính quan sát vật thể, kết quả từ việc vật thể phát ra, truyền hay phản xạ ánh sáng đến mắt người. 16
  19. ` H1.2 Tương quan màu sắc, ánh sáng với Mắt Trong tra cứu ảnh việc sử dụng dặc trưng màu sắc được sử dụng phổ biến. Trên một không gian màu thì các màu sắc được định nghĩa cụ thể. Sự đa dạng của không gian màu là có sẵn, rất nhiều ứng dụng hiện nay đều đang sử dụng, khai thác các đặc trưng của ảnh. Các vấn đề chính trong khai thác đặc trưng màu bao gồm không gian màu, và lựa chọn chức năng tương tự. Các nghiên cứu khác nhau về nhận thức màu sắc và không gian màu đã được đề xuất. Có thể hiểu rằng không gian màu là mô hình toán học trừu tượng dùng để mô tả cách biểu diễn màu mà con người có thể nhận biết bởi bộ các chữ số (có giá trị )hay bởi các thành phần màu.Tại mỗi điểm ảnh trên một bức ảnh nào đó ta có thể biểu diễn được bằng một điểm trong một không gian màu 3 chiều. 17
  20. ` Hình 1.3 Không gian màu RGB RGB là không gian màu được sử dụng nhiều nhất hiện nay để hiển thị ảnh, RBG bao gồm 3 thành phần màu cụ thể là: màu đỏ, màu xanh lá và màu xanh lam. Không gian RGB là một dạng của mô hình cộng bởi vì các màu sắc trong không gian này có thể cộng lại với nhau tạo ra một màu sắc cụ thể nào đó. Cách biểu diễn một màu tùy ý trong dãy hiển thị được thực hiện bằng cách tổ hợp ba màu Đỏ, Xanh lá và Xanh Lam với nhau, gán giá trị từ 0 đến 1 cho R(1,0,0), G(0,1,0), B(0,0,1). Ví dụ: Red (1,0,0) + Blue (0,0,1) →Magenta (1,0,1). Đường chéo từ (0,0,0) đến ( 1,1, 1 ) biểu diễn màu xám. Tuy nhiên không gian màu RGB không thể biểu diễn mọi màu trong phổ nhìn thấy. Các đặc trƣng về hình dạng của ảnh Khi ta so sánh đặc trưng về hình dạng với các đặc trưng về màu sắc hay đặc trưng về kết cấu thì các đặc trưng của hình dạng thường chỉ được sử dụng sau khi ảnh đã phân tách thành các vùng hoặc các đối tượng ảnh. Bởi 18
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2