ÑI HC QU»C GIA NÀI
TR◊ÕNG ÑI HC CÔNG NGHõ
Nguyπn Tußn Anh
NHäN DÑNG »I T◊—NG « HA TRONG
ÉNH VãN BÉN SD÷NG MÑNG NÃRON
TÍCH CHäP
LUäN VãN THÑC Sû
Ngành: Khoa hÂc y tính
NÀI - 2021
ÑI HC QU»C GIA NÀI
TR◊ÕNG ÑI HC CÔNG NGHõ
Nguyπn Tußn Anh
NHäN DÑNG »I T◊—NG « HA TRONG
ÉNH VãN BÉN SD÷NG MÑNG NÃRON
TÍCH CHäP
LUäN VãN THÑC Sû
Ngành: Khoa hÂc y tính
Cán bÎh˜Óng d®n: TS. Nguyπn ThNgÂc Diªp
NÀI - 2021
TÓM TçT
ChuynÍi sËvà sËhóa v´n b£nãem l§i nh˙ng lÒi ích vô cùng to lÓn cho
các doanh nghiªp ct gi£m chi phí vn hành, và t´ng hiªu qu£làm viªc, các quyt
‡nh y giÌ ˜Òc˜a ra nhanh chóng và chính xác hÏn nhÌcác hªthËng báo cáo
thông suËt kp thÌi. Íi l§i, sËl˜Òng các v´n b£n báo cáo cn ph£i gi£i quyt và l˜u
tr˙ngày mÎt lÓn d®n∏n bài toán tìm kim ngày mÎt ph˘c t§p. Nhu cu giÌ ây
không còn chød¯ng l§iviªc tìm kim t¯nÎi dung v´n b£n còn cn tìm kim các
Ëi t˜Òng Á hÂa nh˜b£ng biu, Á th. Các hªthËng tìm kimÁ hÂa muËn ho§t
Îng hiªu qu£thì cn b˜Óc nhn d§ng và phát hiªn các Ëi t˜Òng này. a phn
các ph˜Ïng pháp và hình nhn diªnËi t˜Òng Á hÂa trong £nh v´n b£n hiªn nay
ang ˜Òc hußn luyªn trên mÎt bÎd˙liªu ı hai phn vtrí và tên nhãn cıa
Ëi t˜Òng Á hÂa. Công s˘c và thÌi gian ∫ gán nhãn cho các bÎd˙liªu này rßt
lÓn. Do vy trong lun v´n này chúng tôi ∑ xußt mÎt ph˜Ïng pháp thtn dˆng
bÎd˙liªu kng yı vtên nhãn cıa các lÓp nhn d§ng c Ëi t˜Òng Á hÂa.
Nh˙ng óng góp chính cıa lun v´n bao gÁm.
∑ xußt ph˜Ïng pháp s˚dˆng m§ng nÏron tích chp YOLO cho bài toán ‡nh
v Ëi t˜Òng Á hÂa vÓi bÎd˙liªu chøbao gÁm các vtrí cıa hÎp giÓi h§n.
∑ xußt ph˜Ïng pháp s˚dˆng m§ng hÂc sâu t¸giám sát DINO cho b˜Óc trích
xußt thuÎc tính hình £nh dùng trong bài toán phân lo§i các lÓpËi t˜Òng Á
hÂa vÓi bÎd˙liªu sËl˜Òng £nh mÈi lÓp h§n ch.
y d¸ng và phát trin hªthËng tìm kim và truy xußt các Ëi t˜Òng Á hÂa
trong £nh v´n b£n.
Ph˜Ïng pháp nhn d§ng các Ëi t˜Òng Á hÂa trong £nh v´n b£n˜Òc trình y trong
lun v´nã˜Òc th˚nghiªm và §t kt qu£xßp xø74% trên các bÎd˙liªu kim th˚
ánh giá. Áp dˆng các ph˜Ïng pháp trên o xây d¸ng nên hªthËng tìm kim
truy xußt các v´n b£n t¯các Ëi t˜Òng Á hÂa§t˜Òc kt qu£ Î hÁi t˜ng §t
93,3%.
T¯khóa: nhn d§ng Ëi t˜Òng, phân lo§i hình £nh, Ëi t˜Òng Á hÂa
1
ABSTRACT
Digital transformation and digitization of documents have greatly benefited busi-
nesses as they can cut operating costs and increase working efficiency. Decisions are
now made quickly and accurately through timely and transparent reporting systems.
In turn, the number of report documents that need to be processed and stored in-
creases, leading to an increasingly complex search problem. The need now is not just
to search from the textual content but also to look for graphic objects such as tables
and graphs. For visual search systems to work effectively, there is a need to recognize
and detect these objects. Most of the methods and models for recognizing graphic
objects in-text images are currently being trained on a dataset with two parts, the lo-
cation and the label name of the graphical object. The effort to label these datasets is
not tiny, and the time spent is also considerable. Therefore, in this thesis, we propose
amethodthatcanusetheincompletedatasetoflabelnamesofclassestoidentify
graphic objects. The main contributions of the thesis include.
We propose using a convolutional neural network (YOLO) to locate graphic
objects with a dataset that includes only the bounding box’s locations.
We propose a method to use a self-supervised deep learning network (DINO) for
the feature extraction step used to classify graphic objects with a dataset with
alimitednumberofimagesperclass.
Building and developing a system for searching and retrieving graphic objects in
text images.
The method of recognizing graphic objects in text images presented in this thesis has
been tested and achieved approximately 74% results on test and evaluation datasets.
Applying the above methods to build a system for searching and retrieving documents
from graphic objects also achieved the top 3 recall results of 93.3%.
Keywords: object recognition, image classification, graphic object
2
LÕI CÉMÃN
LÌi¶u tiên cho tôi xin ˜Òc g˚i lÌi c£mÏn chân thành và sâu sc nhßt tÓi TS.
Nguyπn ThNgÂc Diªp ng˜Ìiã h˜Óng d®n và chøb£o tn tình nhßt cho tôi trong
suËt quá trình hoàn thành lun v´n này.
i xin ˜Òc g˚i lÌi c£mÏn tÓi toàn bÎcác thy giáo, cô giáo cıa tr˜Ìng §i
hÂc Công Nghª-§i hÂc QuËc Gia NÎi nh˙ng ng˜Ìiã t§oiu kiªn tËt nhßt∫
tôi thhÂc tp, nghiên c˘u và hÏn c£ ã truyn thˆcho tôi nh˙ng hành trang
kin th˘c¶yı nhßt.
i cÙng xin g˚i lÌi c£mÏn chân thành nhßt tÓi nh˙ng ng˜Ìi b§n ng˜Ìi anh, ch
ã giúp Ô tôi hoàn thiªn c£vkin th˘c chuyên môn và kˇn´ng hÂc tp nghiên c˘u.
CuËi cùng và không ththiuó lÌi c£mÏn tÓi bËmµvà chtôi và ∞c biªt
b§n Dung Phùng nh˙ng ng˜Ìiã luôn bên c§nh tôi giúp Ô và Îng viên cÍvÙtinh
thn tôi trong nh˙ng lúc khó kh´n nhßt.
i xin chân thành c£mÏn!
NÎi, ngày 10 tháng 10 n´m 2021
Sinh viên
Nguyπn Tußn Anh
i