Y BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HC TH DU MT
PHẠM HOÀNG PHƯƠNG
TÌM KIM HÌNH NH
BẰNG PHƯƠNG PHÁP HỌC SÂU
CHUYÊN NGÀNH: H THNG THÔNG TIN
MÃ S: 8480104
LUN VĂN THẠC
BÌNH DƯƠNG – 2021
ii
U BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HC TH DU MT
PHẠM HOÀNG PHƯƠNG
TÌM KIM HÌNH NH
BẰNG PHƯƠNG PHÁP HỌC SÂU
CHUYÊN NGÀNH: H THÔNG THÔNG TIN
MÃ S: 8480104
LUN VĂN THẠC
NGƯỜI HƯNG DN KHOA HC:
TS. BÙI THANH HÙNG
BÌNH DƯƠNG – 2021
iii
LỜI CAM ĐOAN
Tên tôi là: Phạm Hoàng Phương
Sinh ngày: 06/08/1983
Hc viên lp cao hc CH19HT01 Trường Đi hc Th Du Mt
Xin cam đoan: Đề tài Tìm kiếm hình nh bằng phương pháp hc
sâudo Thầy TS. Bùi Thanh Hùng ng dn công trình nghiên cu ca
riêng chúng tôi. Tt c tài liu tham khảo đu ngun gc, trích dn
ràng.
Tác gi xin cam đoan tt c nhng ni dung trong luận văn đúng n
nội dung trong đ cương và yêu cu ca thầy giáo hướng dn. Nếu sai chúng
tôi hoàn toàn chu trách nhim trưc hi đng khoa hc.
Bình Dương, tháng 10 năm 2021
Tác gi luận văn
Phạm Hoàng Phương
iv
LI CM ƠN
Sau mt thi gian nghiên cu làm việc nghiêm túc, đưc s động
viên, giúp đỡ ng dn tn tình ca Thầy hướng dn TS. Bùi Thanh
Hùng, luận văn Thạc sĩ Tìm kiếm hình nh bằng phương pháp hc sâu
đã hoàn thành.
Tôi xin bày t lòng biết ơn sâu sắc đến:
Thầy hướng dn TS. Bùi Thanh Hùng đã tận tình ch dẫn, giúp đỡ
tôi hoàn thành lun văn này. Đng thi tôi gi li cảm ơn đến các thy,
đã giảng dy truyền đạt kiến thc quý o cho tôi trong sut thi gian hc
tp và nghiên cu.
Tôi chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động viên,
khích l, tạo điều kiện giúp đ tôi trong sut quá trình hc tp, thc hin
hoàn thành luận văn này.
v
TÓM TT LUN VĂN
S phát trin mnh m ca công ngh nh s làm ng ảnh u trữ
trên web tăng lên một cách nhanh chóng đòi hỏi phi các công c h tr
tìm kiếm nh hiu qu tin li. Mc các công c tìm kiếm nh theo
văn bản đi kèm ảnh ra đời cho phép người ng tìm kiếm nh vi thi gian
đáp ng khá nhanh, tuy nhiên, các công c này vn còn hn chế trong vic
gii quyết nhp nhng gia ni dung câu truy vn ni dung hin th ca
nh tr v. S ra đời ca các công c tìm kiếm hình nh theo ni dung nh
đã giải quyết đưc nhng nhp nhng trên.
Trong luận văn này, chúng tôi xin đề xut mt phương pháp sử dng
hình hc sâu mạng -ron tích chập (CNN) để tìm kiếm hình nh theo
ni dung nh nhm nâng cao chất lượng tìm kiếm nh. Đầu tiên, chúng tôi
kế tha hun luyn hình CNN t hình Pre-trained CNN để trích
chọn đặc trưng nh. Tiếp đó, dựa theo phương pháp tìm kiếm k láng ging
gn nht kết hợp độ đo tương đồng v khong cách gia các véc-tor đặc
trưng tiến hành thc nghim hình. Các thc nghiệm được thc hin
trên sở d liu hình nh Oxford-IIIT Pet Dataset t thu thp thêm t
trang web Kaggle s dng các phương pháp Đ chính xác (Accuracy
score), Ma trn nhm ln (Confusion matrix), Đ đo F1 (Precision, Recall
F1 score) để đánh giá hình; Đ chính xác trung bình Average
Precision (AP) Mean Average Precision (mAP) để đánh giá kết qu tìm
kiếm ca h thng tìm kiếm ca chúng tôi.
Thc nghiệm ban đầu cho thy, t mt nh truy vấn đầu vào, h
thng tr kết qu v 40 ảnh tương đồng nht vi mi truy vn với độ chính
xác trên 94% và đây là một kết qu kh quan.