B CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC ĐIỆN LC
TRẦN VĂN HUY
KT HP XP HẠNG ĐA TẠP VÀ HC ĐỘ ĐO
TƯƠNG TỰ CHO TRA CU NH
TÓM TT LUN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội, năm 2025
B CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC ĐIỆN LC
TRẦN VĂN HUY
KT HP XP HẠNG ĐA TẠP VÀ HC ĐỘ ĐO
TƯƠNG TỰ CHO TRA CU NH
Ngành: Công ngh thông tin
Mã s: 9480201
TÓM TT LUN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DN KHOA HC:
1. TS. NGÔ HOÀNG HUY
2. TS. NGUYỄN VĂN ĐOÀN
Hà Nội, năm 2025
1
MỞ ĐẦU
1. Tính cp thiết của đề tài
Trong thp k qua DOMO thng d liu ca thế gii, cho thy s gia tăng đáng k trong hot
động trên internet, t Instagram và X đến Amazon. T năm 2013 đến 2024 s người dùng Internet phát
trin t 2.1 t người đến 5.52 t người, cùng với đó số ng d liu nh khng l đã được ti lên
internet. Các sở d liu hình ảnh này được s dụng đ ci thin hiu sut x thông tin trong các
ng dng thông minh, phc v cho nghiên cu và cuc sng hàng ngày.
K thut tra cu nh da trên ni dung (CBIR) đã được phát triển để tìm kiếm các hình nh liên
quan t cơ sở d liu dựa trên đối tượng hoc ni dung ca hình ảnh đầu vào. Đây là một bài toán đưc
áp dng rộng rãi trong lĩnh vực th giác máy nh mang li hiu qu kinh tế trong nhiu ng dng,
chng hạn như: tìm kiếm khuôn mt, vân tay, hình nh y tế, k thut hình sự, thương mại điện t
nhiu ng dng khác.
Hn chế của các phương pháp xếp hạng đa tạp hin ti khi áp dng cho bài toán tra cu nh da
trên ni dung:
i. Vic xây dng đ th ca các đim d liu da vào đ th K-NN là không kh thi vi d liu quy mô ln [15].
ii. Khi thêm nh o cơ sở d liu, phi nh tn li tn b xếp hng EMR (như trong EMR, SGR).
iii. Hn chế trong việc xác định độ tương tự vi ảnh ngoài cơ sở d liu.
Trong lun án này, thut ng “xếp hạng đa tạp” là kỹ thut xếp hng nhm khám phá cu trúc phi
tuyến tính ca d liệu đa tạp được hiểu là phương pháp xếp hạng các đim trong CSDL theo th t
có liên quan với điểm d liu truy vấn được áp dng trên tập cơ sở d liệu đa tạp.
Để gii quyết mt phn các hn chế trên, lun án chọn đề tài Kết hp xếp hạng đa tạp và hc
độ đo tương tự cho tra cu nh.
2. Mc tiêu ca lun án
Mc tiêu chung ca lun án: Nâng cao hiu qu tra cu nh da trên kết hp xếp hạng đa tạp và
tiếp cn học độ đo tương tự.
Mc tiêu c th ca lun án:
Đề xuất được mt s giải pháp nâng cao độ chính xác tra cu nh da trên ni dung theo tiếp cn
xếp hạng đa tạp bao gm:
Nghiên cu mt s giải pháp nâng cao độ chính xác tra cu nh da trên ni dung theo tiếp cn
xếp hạng đa tạp bao gm:
- Nghiên cu thut toán xếp hng đa tạp hiu qu, nghiên cu kết hp nhiu b xếp hng hình nh
theo đặc trưng mức thp vi xếp hng ca hình ảnh đặc trưng mức cao.
- Nghiên cu xây dựng độ đo tương tự nh theo tiếp cn hc bán giám sát các giá tr xếp hng
EMR để gii quyết vic nh tra cu nằm ngoài cơ sở d liu.
3. Đối tượng nghiên cu ca lun án
- Các phương pháp hiện ti v Tra cu nh da vào ni dung.
- Các k thut biu din nh với đặc trưng mức thp, đặc trưng véc nhúng, đặc trưng CNN
ặc trưng ảnh được trích rút t mng hc sâu).
- Các k thut hc máy, hc bán giám sát các giá tr xếp hng EMR.
- Môi trường thc nghim, tp d liu nh thc nghiệm và phương pháp đánh giá độ chính xác.
2
4. Phm vi nghiên cu
Trong lun án này, phm vi nghiên cu bao gm:
- Nghiên cu thut toán xếp hạng đa tạp trong tra cu nh da vào ni dung.
- Nghiên cứu phương pháp tổ hp xếp hạng đa tạp hiu qu (EMR) kết hp nhiu b xếp hng
hình ảnh theo đặc trưng mức thp vi xếp hng ca hình ảnh đặc trưng mức cao (đặc trưng véc tơ nhúng,
đặc trưng CNN).
- Nghiên cứu phương pháp nâng cao hiệu qu tra cu nh bng cách xây dựng độ đo tương tự
nh theo tiếp cn hc bán giám sát các giá tr xếp hạng EMR. Đề xut k thut tra cu EMR Learning
để gii quyết vic nh tra cu nằm ngoài cơ sở d liu.
- Trong phm vi ca lun án ch tp trung nâng cao chất lượng tra cu v độ chính xác, các vn
đề v thi gian cho mt truy vấn cũng được xem xét khía cnh có th chp nhận được.
. 5. Các đóng góp của lun án
Nhm mục tiêu nâng cao độ chính xác ca tra cu nh s dụng phương học đ đo tương t, lun
án có các đóng góp sau:
(1) Nghiên cứu phương pháp tổ hp các b xếp hạng đa tạp hiu quả, đề xut thut toán CoEMR
kết hp nhiu b xếp hng hình ảnh theo đặc trưng mức thp, xếp hng ca hình ảnh đặc trưng mức cao
[CT1, CT2, CT3, CT4]. Đề xuất phương pháp sử dng truy vn nhiu nh trên CBIR [CT8].
(2) Nghiên cứu phương pháp nâng cao hiệu qu tra cu nh bng cách xây dựng độ đo tương tự
nh theo tiếp cn hc bán giám sát các giá tr xếp hạng EMR. Đề xut thut toán tra cu EMR Learning
để gii quyết vic nh tra cu nằm ngoài cơ sở d liu [CT5, CT6, CT7].
6. B cc ca lun án
Luận án được t chức thành ba chương:
Chương 1: Tra cu nh da trên ni dung.
Chương 2: Phương pháp tra cứu nh s dng thut toán kết hp nhiu b xếp hng đa tạp hiu qu.
Chương 3: Xây dng đ đo tương t nh theo các giá tr xếp hng EMR
Cui cùng, luận án đưa ra một s đề xuất và định hướng nghiên cứu trong tương lai.
Chương 1
TRA CU NH DA TRÊN NI DUNG
1.1. Gii thiu v tra cu nh da vào ni dung
Tra cu nh da vào ni dung (CBIR) [31] thu hút rt nhiu s chú ý t các nhà nghiên cu
được s dng nhiu trong công nghip, thương mại trong những năm qua do nhiu ng dng hu ích
ca nó. Các thut toán tra cu ảnh thường xây dựng các độ đo tương tự toàn cc gia các vector đặc
trưng biểu diễn đối tượng nh đối sánh vi toàn b vector đặc trưng trong CSDL.
1.2. Biu din nh bằng vector đặc trưng
Trong chương này luận án trình bày tng quan v các đặc trưng biểu din nh
1.2.1. Đặc trưng mức thp ca nh
Trình bày tng quan v các đặc trưng mức thấp được s dụng trong CBIR nói chung như: Đặc
trưng màu sc; Đặc trưng kết cu; Đặc trưng hình dạng
3
1.2.2. Đặc trưng mức cao ca nh
Đặc trưng Véc tơ nhúng: Là đặc trưng được trích rút lp fully connected cui cùng ca mng
hc sâu
Đặc trưng CNN: Là đặc trưng được trích rút tng cuối (trước tng phân lp) ca mng CNN.
Hình 1.. Mô hình trích rút đặc trưng ảnh bng mô hình hc sâu
Hình 1.5 là mô hình thut toán biu diễn đặc trưng ảnh được trích rút da vào mng hc sâu CNN
tin hun luyện thu được tập đặc trưng mc cao ca nh.
1.3. Độ đo khoảng cách, độ đo tương tự
1.3.1. Độ đo khoảng cách, độ đo tương tự
Độ đo tương tự là mt trong những phương pháp tốt để máy tính phân biệt được các hình nh qua
ni dung của chúng. Thông thưng h thng tra cu nh s truy vn hình nh bằng phương pháp đo
tương tự da trên các chức năng, việc xác định nó có th dưới nhiu hình thức như phát hin biên, màu
sc, v trí điểm nh....
Mt s công thức tính độ khoảng cách hay được s dụng trong CBIR được mô t như bảng sau:
Bng 1.2: M s độ đo khoảng cách, độ đo tương tự và công thc
Độ đo
Công thc tính
Euclid
( ) ( )
T
x y x y−−
Mahalanobis
1
( ) ( )
T
x y C x y
−−
; C là psd
Minkowski
1
1
( , ) ( | | )
npp
ii
i
D x y x y
=
=−
Manhattan (Taxicab/City Block)
(Khong cách L1)
1
( , ) | |
k
ii
i
D x y x y
=
=−
(k là s block)
Chebyshev
( , ) max(| |)
ii
i
D x y x y=−
Cosine
𝐷(𝑋,𝑌)=𝑐𝑜𝑠𝜃= 𝑋.𝑌
||𝑋||.||𝑌||
1.3.2. Học độ đo khoảng cách, đ đo tương t
Thông thường có 2 phương pháp học độ đo khoảng cách, độ tương tự nh
+ Loi hc bán giám sát: Gn trng s vào c chiu ca thành phn d liệu đặc trưng nh khi tính
khoảng cách Euclid thông thường.