
v
TÓM TẮT LUN VĂN
Sự phát triển mạnh mẽ của công nghệ ảnh số làm lượng ảnh lưu trữ
trên web tăng lên một cách nhanh chóng đòi hỏi phải có các công cụ hỗ trợ
tìm kiếm ảnh hiệu quả và tiện lợi. Mặc dù các công cụ tìm kiếm ảnh theo
văn bản đi kèm ảnh ra đời cho phép người dùng tìm kiếm ảnh với thời gian
đáp ứng khá nhanh, tuy nhiên, các công cụ này vẫn còn hạn chế trong việc
giải quyết nhập nhằng giữa nội dung câu truy vấn và nội dung hiển thị của
ảnh trả về. Sự ra đời của các công cụ tìm kiếm hình ảnh theo nội dung ảnh
đã giải quyết được những nhập nhằng trên.
Trong luận văn này, chúng tôi xin đề xuất một phương pháp sử dụng
mô hình học sâu mạng nơ-ron tích chập (CNN) để tìm kiếm hình ảnh theo
nội dung ảnh nhằm nâng cao chất lượng tìm kiếm ảnh. Đầu tiên, chúng tôi
kế thừa và huấn luyện mô hình CNN từ mô hình Pre-trained CNN để trích
chọn đặc trưng ảnh. Tiếp đó, dựa theo phương pháp tìm kiếm k láng giềng
gần nhất kết hợp độ đo tương đồng về khoảng cách giữa các véc-tor đặc
trưng và tiến hành thực nghiệm mô hình. Các thực nghiệm được thực hiện
trên cơ sở dữ liệu hình ảnh Oxford-IIIT Pet Dataset và tự thu thập thêm từ
trang web Kaggle và sử dụng các phương pháp Độ chính xác (Accuracy
score), Ma trận nhầm lẫn (Confusion matrix), Độ đo F1 (Precision, Recall
và F1 score) để đánh giá mô hình; Độ chính xác trung bình Average
Precision (AP) và Mean Average Precision (mAP) để đánh giá kết quả tìm
kiếm của hệ thống tìm kiếm của chúng tôi.
Thực nghiệm ban đầu cho thấy, từ một ảnh truy vấn đầu vào, hệ
thống trả kết quả về 40 ảnh tương đồng nhất với mỗi truy vấn với độ chính
xác trên 94% và đây là một kết quả khả quan.