intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:139

15
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận án Tiến sĩ Máy tính "Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ" trình bày các nội dung chính sau: Tổng quan về tra cứu dựa trên nội dung; Nâng cao hiệu quả của việc tra cứu ảnh dựa trên nội dung bằng cách kết hợp tối ưu khoảng cách của tra cứu ảnh và phân tích phân biệt tuyến tính; Cải thiện hiệu quả của tra cứu ảnh dựa trên nội dung sử dụng phân hoạch đô thị.

Chủ đề:
Lưu

Nội dung Text: Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ

  1. BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Lan Phương MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Hà Nội - 2023
  2. BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Thị Lan Phương MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Mã số: 9 48 01 01 Xác nhận của Học viện Người hướng dẫn 1 Người hướng dẫn 2 Khoa học và Công nghệ PGS.TS. Ngô Quốc Tạo TS. Nguyễn Ngọc Cương Hà Nội - 2023
  3. LỜI CAM ĐOAN Nghiên cứu sinh Nguyễn Thị Lan Phương
  4. LỜI CẢM ƠN Hà Nội, ngày tháng 10 năm 2023 Nghiên cứu sinh Nguyễn Thị Lan Phương
  5. MỤC LỤC i
  6. ii
  7. iii
  8. iv
  9. v
  10. DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT TBIR Text-based image retrieval Tra cứu ảnh dựa trên văn bản CBIR Content-based image retrieval Tra cứu ảnh dựa trên nội dung Image retrieval method using Phương pháp tra cứu ảnh sử IRIC Incremental clustering dụng phân cụm tăng dần Clustering Images Set using Nhóm ảnh được thiết lập bằng CISE Eigenvectors cách sử dụng Eigenvectos INC Incremental Clustering Phân cụm tăng dần CNN convolutional neural networks Mạng nơ ron phức hợp Tra cứu ảnh bằng cách sử dụng Image Retrieval using the khoảng cách khoảng cách tối ODLDA optimal distance and linear ưu và phân tích phân biệt tuyến Discriminant analysis tính Online Algorithm for Scalable Mở rộng thuật toán trực tuyến OASIS Image Similarity cho sự giống nhau của ảnh DML Distance metric learning Học khoảng cách khoảng cách Discriminative Components Phân tích các thành phần phân DCA Analysis biệt IR Information retrieval Tra cứu thông tin RF Relevance feedback Mức độ trả lời liên quan ST Semantic template Mẫu ngữ nghĩa RGB Red Green Blue Đỏ lục lam CCVs Color coherence vectors Các vectơ liên kết màu Shift-invariant principal Phân tích thành phần chính SPCA component analysis thay đổi – bất biến vi
  11. Maximum likelihood Tính toán khả năng xảy ra tối MLE estimation đa vii
  12. viii
  13. DANH MỤC HÌNH VẼ Hình I.1. Sơ đồ tra cứu ảnh dựa vào nội dung .................................................. 8 Hình I. 2. PCA cho bài toán phân lớp với 2 lớp ............................................. 35 Hình I. 3. Khoảng cách phân kỳ giữa các kỳ vọng và tổng các phương sai ảnh hưởng tới độ tách của dữ liệu. ......................................................................... 38 Hình I. 4. Hình ảnh đầu vào (bên trái) và bộ mô tả GIST 512D của nó (bên phải). Nhiều phần nền trong hình ảnh giống nhau về nội dung trực quan dẫn đến sự giống nhau của các khối mô tả. ........................................................... 49 Hình I. 5. Lỗi lượng tử hoá cho tập dữ liệu 1M SIFT(a) và 1M GIST (b). .... 52 Hình I. 6. Hình ảnh đầu vào (bên trái) và bộ mô tả SIFT được tính toán tại 4 điểm chính (bên phải)...................................................................................... 55 Hình I. 7. Chất lượng mã hoá cho SIFT (a) và GIST (b) ................................ 59 Hình I. 8. Hiệu suất tìm kiếm ANN cho SIFT (a) và GIST (b) ...................... 61 Hình II. 1 Một ví dụ về sự mơ hồ và giàu ngữ nghĩa...................................... 69 Hình II. 2. Ví dụ về ba bộ ảnh khác nhau được truy xuất với cùng một truy vấn tuỳ thuộc vào loại nhiệm vụ CBIR.................................................................. 71 Hình II. 3. Sơ đồ của phương pháp đề xuất ODLDA ..................................... 82 Hình II. 4. Kiến trúc học biểu diễn dựa vào mô hình CNN được tiền huấn luyện ......................................................................................................................... 85 Hình II. 5. Một số mẫu trong thư viện ảnh Corel............................................ 90 Hình II. 6. Một số mẫu trong tập SIMPLIcity ................................................ 91 Hình II. 7. So sánh độ chính xác trung bình của các phương pháp trên scope 50, 100 và 150 trên tập SIMPLIcity ...................................................................... 93 Hình III. 1. Sơ đồ của tra cứu ảnh sử dụng phân hoạch đồ thị ..................... 102 ix
  14. Hình III. 2. Một số ảnh trong tập SIMPLIcity .............................................. 107 Hình III. 3. So sánh độ chính xác của ba phương pháp trên tập ảnh SIMPLIcity ....................................................................................................................... 109 x
  15. 1
  16. 2
  17. 3
  18. 4
  19. 3. Đối tượng nghiên cứu Đối tượng nghiên cứu của luận án là tra cứu ảnh dựa trên nội dung bằng cách kết hợp khoảng cách tối ưu và phân tích phân biệt tuyến tính, tiến hành thực nghiệm trên tập cơ sở dữ liệu tập ảnh Corel (1 0.800 ảnh), phân hoạch đồ thị với cơ sở dữ liệu ảnh SIMPLIcity (1.000 ảnh với 10 chủ đề. Mỗi ảnh có kích thước 256×384 hoặc 384×256). 5
  20. 6
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
12=>0