Trang chủ » Luận Văn - Báo Cáo » Thạc sĩ - Tiến sĩ - Cao học

62 trang

158 lượt xem

Luận văn Thạc sĩ Khoa học máy tính: Nhận dạng đối tượng đồ hoạ trong ảnh văn bản sử dụng mạng nơ ron tích chập

Mục tiêu của luận văn "Nhận dạng đối tượng đồ hoạ trong ảnh văn bản sử dụng mạng nơ ron tích chập" này đó là sử dụng bộ dữ liệu chỉ bao gồm vị trí các hộp giới hạn và một bộ dữ liệu dùng để phân loại các đối tượng đồ họa với số lượng ảnh mỗi lớp là hạn chế; Từ đó đề xuất phương pháp nhận dạng đối tượng đồ họa trong ảnh văn bản.

Chủ đề:

khanhchi0912

Luận văn thạc sĩ CNTT

Luận văn thạc sĩ trí tuệ nhân tạo

ÑI H≈C QU»C GIA HÀ NÀI

TR◊ÕNG ÑI H≈C CÔNG NGHõ

Nguyπn Tußn Anh

NHäN DÑNG »I T◊—NG « H≈A TRONG

ÉNH VãN BÉN S€D÷NG MÑNG NÃRON

TÍCH CHäP

LUäN VãN THÑC Sû

Ngành: Khoa hÂc máy tính

HÀ NÀI - 2021

ÑI H≈C QU»C GIA HÀ NÀI

TR◊ÕNG ÑI H≈C CÔNG NGHõ

Nguyπn Tußn Anh

NHäN DÑNG »I T◊—NG « H≈A TRONG

ÉNH VãN BÉN S€D÷NG MÑNG NÃRON

TÍCH CHäP

LUäN VãN THÑC Sû

Ngành: Khoa hÂc máy tính

Cán bÎh˜Óng d®n: TS. Nguyπn Th‡NgÂc Diªp

HÀ NÀI - 2021

TÓM TçT

Chuy∫nÍi sËvà sËhóa v´n b£nãem l§i nh˙ng lÒi ích vô cùng to lÓn cho

các doanh nghiªp là c≠t gi£m chi phí v™n hành, và t´ng hiªu qu£làm viªc, các quy∏t

‡nh bây giÌ ˜Òc˜a ra nhanh chóng và chính xác hÏn nhÌcác hªthËng báo cáo

thông suËt k‡p thÌi. Íi l§i, sËl˜Òng các v´n b£n báo cáo c¶n ph£i gi£i quy∏t và l˜u

tr˙ngày mÎt lÓn d®n∏n bài toán tìm ki∏m ngày mÎt ph˘c t§p. Nhu c¶u giÌ ây

không còn chød¯ng l§iviªc tìm ki∏m t¯nÎi dung v´n b£n mà còn c¶n tìm ki∏m các

Ëi t˜Òng Á hÂa nh˜b£ng bi∫u, Á th‡. Các hªthËng tìm ki∏mÁ hÂa muËn ho§t

Îng hiªu qu£thì c¶n có b˜Óc nh™n d§ng và phát hiªn các Ëi t˜Òng này. a ph¶n

các ph˜Ïng pháp và mô hình nh™n diªnËi t˜Òng Á hÂa trong £nh v´n b£n hiªn nay

ang ˜Òc hußn luyªn trên mÎt bÎd˙liªu có ı hai ph¶n là v‡trí và tên nhãn cıa

Ëi t˜Òng Á hÂa. Công s˘c và thÌi gian ∫ gán nhãn cho các bÎd˙liªu này là rßt

lÓn. Do v™y trong lu™n v´n này chúng tôi ∑ xußt mÎt ph˜Ïng pháp có th∫t™n dˆng

bÎd˙liªu không ¶yı v∑tên nhãn cıa các lÓp∫ nh™n d§ng các Ëi t˜Òng Á hÂa.

Nh˙ng óng góp chính cıa lu™n v´n bao gÁm.

–∑ xußt ph˜Ïng pháp s˚dˆng m§ng nÏron tích ch™p YOLO cho bài toán ‡nh

v‡ Ëi t˜Òng Á hÂa vÓi bÎd˙liªu chøbao gÁm các v‡trí cıa hÎp giÓi h§n.

–∑ xußt ph˜Ïng pháp s˚dˆng m§ng hÂc sâu t¸giám sát DINO cho b˜Óc trích

xußt thuÎc tính hình £nh dùng trong bài toán phân lo§i các lÓpËi t˜Òng Á

hÂa vÓi bÎd˙liªu có sËl˜Òng £nh mÈi lÓp h§n ch∏.

–Xây d¸ng và phát tri∫n hªthËng tìm ki∏m và truy xußt các Ëi t˜Òng Á hÂa

trong £nh v´n b£n.

Ph˜Ïng pháp nh™n d§ng các Ëi t˜Òng Á hÂa trong £nh v´n b£n˜Òc trình bày trong

lu™n v´nã˜Òc th˚nghiªm và §t k∏t qu£xßp xø74% trên các bÎd˙liªu ki∫m th˚

và ánh giá. Áp dˆng các ph˜Ïng pháp trên vào ∫ xây d¸ng nên hªthËng tìm ki∏m

và truy xußt các v´n b£n t¯các Ëi t˜Òng Á hÂa§t˜Òc k∏t qu£ Î hÁi t˜ng §t

93,3%.

T¯khóa: nh™n d§ng Ëi t˜Òng, phân lo§i hình £nh, Ëi t˜Òng Á hÂa

ABSTRACT

Digital transformation and digitization of documents have greatly benefited busi-

nesses as they can cut operating costs and increase working efficiency. Decisions are

now made quickly and accurately through timely and transparent reporting systems.

In turn, the number of report documents that need to be processed and stored in-

creases, leading to an increasingly complex search problem. The need now is not just

to search from the textual content but also to look for graphic objects such as tables

and graphs. For visual search systems to work effectively, there is a need to recognize

and detect these objects. Most of the methods and models for recognizing graphic

objects in-text images are currently being trained on a dataset with two parts, the lo-

cation and the label name of the graphical object. The effort to label these datasets is

not tiny, and the time spent is also considerable. Therefore, in this thesis, we propose

amethodthatcanusetheincompletedatasetoflabelnamesofclassestoidentify

graphic objects. The main contributions of the thesis include.

–We propose using a convolutional neural network (YOLO) to locate graphic

objects with a dataset that includes only the bounding box’s locations.

–We propose a method to use a self-supervised deep learning network (DINO) for

the feature extraction step used to classify graphic objects with a dataset with

alimitednumberofimagesperclass.

–Building and developing a system for searching and retrieving graphic objects in

text images.

The method of recognizing graphic objects in text images presented in this thesis has

been tested and achieved approximately 74% results on test and evaluation datasets.

Applying the above methods to build a system for searching and retrieving documents

from graphic objects also achieved the top 3 recall results of 93.3%.

Keywords: object recognition, image classification, graphic object

LÕI CÉMÃN

LÌi¶u tiên cho tôi xin ˜Òc g˚i lÌi c£mÏn chân thành và sâu s≠c nhßt tÓi TS.

Nguyπn Th‡NgÂc Diªp ng˜Ìiã h˜Óng d®n và chøb£o t™n tình nhßt cho tôi trong

suËt quá trình hoàn thành lu™n v´n này.

Tôi xin ˜Òc g˚i lÌi c£mÏn tÓi toàn bÎcác th¶y giáo, cô giáo cıa tr˜Ìng §i

hÂc Công Nghª-§i hÂc QuËc Gia Hà NÎi nh˙ng ng˜Ìiã t§oi∑u kiªn tËt nhßt∫

tôi có th∫hÂc t™p, nghiên c˘u và hÏn c£là ã truy∑n thˆcho tôi nh˙ng hành trang

ki∏n th˘c¶yı nhßt.

Tôi cÙng xin g˚i lÌi c£mÏn chân thành nhßt tÓi nh˙ng ng˜Ìi b§n ng˜Ìi anh, ch‡

ã giúp Ô tôi hoàn thiªn c£v∑ki∏n th˘c chuyên môn và kˇn´ng hÂc t™p nghiên c˘u.

CuËi cùng và không th∫thi∏uó là lÌi c£mÏn tÓi bËmµvà ch‡tôi và ∞c biªt là

b§n Dung Phùng nh˙ng ng˜Ìiã luôn bên c§nh tôi giúp Ô và Îng viên cÍvÙtinh

th¶n tôi trong nh˙ng lúc khó kh´n nhßt.

Tôi xin chân thành c£mÏn!

Hà NÎi, ngày 10 tháng 10 n´m 2021

Sinh viên

Nguyπn Tußn Anh

Tài liệu liên quan

Fact-checking nội dung multimedia: Ứng dụng mô hình fusion đa phương thức và trí tuệ nhân tạo explicable (Luận văn Thạc sĩ)

Master thesis: Fact-checking des contenus multimédias: Exploitation des modèles de fusion multimodale et del’intelligence artificielle explicable

Cảm biến điện tử đo thế năng ma trận của đất: Chế tạo, vận hành và truyền dữ liệu thời gian thực (Lora, 4G) - Master thesis

Master thesis: Chế tạo và vận hành các cảm biến điện tử đo thế năng ma trận của đất; truyền dữ liệu thời gian thực (Lora, 4G)

Xây dựng biểu đồ kiến thức từ cơ sở dữ liệu quan hệ: Luận văn Thạc sĩ

Master thesis: Xây dựng biểu đồ kiến thức từ cơ sở dữ liệu quan hệ

Xây dựng hệ thống điều khiển và thu nhận dữ liệu cho Robot dịch vụ: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Xây dựng hệ thống điều khiển và thu nhận dữ liệu cho Robot dịch vụ

Nghiên cứu Đề án Thạc sĩ: Bề mặt thông minh tái cấu hình (RIS) giảm thiểu hiệu ứng Doppler, Fading đa đường

Đề án Thạc sĩ: Nghiên cứu bề mặt thông minh có khả năng tái cấu hình (RIS) để giảm thiểu hiệu ứng Doppler và Fading đa đường

Phát hiện tấn công XSS bằng Deep Learning: Đề án Thạc sĩ kết hợp CodeBERT và Attention

Đề án Thạc sĩ: Phát hiện tấn công XSS bằng Deep Learning, kết hợp CodeBERT và Attention

Xác minh giọng nói tiếng Việt: Đề án Thạc sĩ sử dụng học sâu đa nhiệm

Đề án Thạc sĩ: Xác minh giọng nói tiếng Việt sử dụng học sâu đa nhiệm

Nghiên cứu ứng dụng học máy: Đề án Thạc sĩ phát hiện vận động bất thường

Đề án Thạc sĩ: Nghiên cứu ứng dụng học máy để phát hiện vận động bất thường

Luận văn: Sử dụng điểm cắt zero tìm hiểu đặc trưng phụ âm tiếng Việt phục vụ nhận dạng, kỹ thuật

Luận văn Thạc sĩ Kỹ thuật: Sử dụng điểm cắt zero tìm hiểu đặc trưng của một số phụ âm tiếng Việt phục vụ cho bài toán nhận dạng

Dự báo sạt lở đất: Ứng dụng trí tuệ nhân tạo trong luận văn Thạc sĩ Kỹ thuật xây dựng dân dụng và công nghiệp

Luận văn Thạc sĩ Kỹ thật xây dựng dân dụng và công nghiệp: Ứng dụng trí tuệ nhân tạo để dự báo sạt lở đất

Tài liêu mới

Các yếu tố ảnh hưởng tỷ lệ thu nhập lãi cận biên của ngân hàng thương mại tại Việt Nam: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Các yếu tố ảnh hưởng tỷ lệ thu nhập lãi cận biên của các ngân hàng thương mại tại Việt Nam

Phát triển ngân hàng xanh tại Việt Nam: Nghiên cứu các nhân tố ảnh hưởng (Luận văn Thạc sĩ)

Luận văn Thạc sĩ: Nghiên cứu các nhân tố ảnh hưởng đến phát triển ngân hàng xanh tại Việt Nam

Tác động của đa dạng hóa thu nhập đến rủi ro phá sản của các Ngân hàng thương mại cổ phần Việt Nam: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Tác động của đa dạng hóa thu nhập đến rủi ro phá sản của các Ngân hàng thương mại cổ phần Việt Nam

Ảnh hưởng chính sách cổ tức đến giá cổ phiếu ngân hàng niêm yết tại Việt Nam - Luận văn Thạc sĩ

Luận văn Thạc sĩ: Ảnh hưởng của chính sách cổ tức đến giá cổ phiếu của các ngân hàng niêm yết tại Việt Nam

Tác động của cơ cấu vốn đến rủi ro thanh khoản và hiệu quả hoạt động của các ngân hàng thương mại tại Việt Nam: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Tác động của cơ cấu vốn đến rủi ro thanh khoản và hiệu quả hoạt động của các ngân hàng thương mại tại Việt Nam

Rủi ro thanh khoản ngân hàng thương mại Việt Nam: Luận văn Thạc sĩ về các yếu tố tác động

Luận văn Thạc sĩ: Các yếu tố tác động đến rủi ro thanh khoản của ngân hàng thương mại Việt Nam

Ảnh hưởng của khẩu vị rủi ro đến rủi ro phá sản ngân hàng thương mại Việt Nam: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Ảnh hưởng của khẩu vị rủi ro đến rủi ro phá sản của các ngân hàng thương mại Việt Nam

Luận văn Thạc sĩ: Tác động của chuyển đổi số và cạnh tranh đến sự ổn định ngân hàng thương mại Việt Nam

Luận văn Thạc sĩ: Tác động của chuyển đổi số, cạnh tranh đến sự ổn định của các ngân hàng thương mại Việt Nam

Các yếu tố ảnh hưởng chất lượng dịch vụ ngân hàng số tại Vietcombank Cần Thơ: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Các yếu tố ảnh hưởng đến chất lượng dịch vụ ngân hàng số tại Ngân hàng Thương mại Cổ phần Ngoại thương Việt Nam - Chi nhánh Cần Thơ

Các yếu tố ảnh hưởng chất lượng dịch vụ ngân hàng số tại Ngân hàng TMCP Ngoại thương Việt Nam - Chi nhánh Cần Thơ: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Các yếu tố ảnh hưởng đến chất lượng dịch vụ ngân hàng số tại Ngân hàng TMCP Ngoại thương Việt Nam - Chi nhánh Cần Thơ

Ảnh hưởng của nợ đến hiệu quả tài chính doanh nghiệp sản xuất nông nghiệp niêm yết trên thị trường chứng khoán Việt Nam: Luận văn Thạc sĩ

Luận văn Thạc sĩ: Ảnh hưởng của nợ đối với hiệu quả tài chính của các doanh nghiệp sản xuất nông nghiệp niêm yết trên thị trường chứng khoán Việt Nam

Luận văn Thạc sĩ: Các nhân tố ảnh hưởng đến hiệu quả tài chính của ngân hàng niêm yết trên sàn giao dịch chứng khoán Việt Nam - Nghiên cứu về đặc điểm của Hội đồng quản trị

Luận văn Thạc sĩ: Các nhân tố thuộc đặc điểm của hội đồng quản trị ảnh hưởng đến hiệu quả tài chính của các ngân hàng được niêm yết trên sàn giao dịch chứng khoán Việt Nam

Luận văn Thạc sĩ: Tác động của cấu trúc sở hữu đến hiệu quả tài chính doanh nghiệp công nghiệp niêm yết HOSE - Sở Giao dịch Chứng khoán Thành phố Hồ Chí Minh

Luận văn Thạc sĩ: Tác động của cấu trúc sở hữu đến hiệu quả tài chính của doanh nghiệp: Trường hợp các doanh nghiệp công nghiệp niêm yết trên Sở Giao dịch Chứng khoán Thành phố Hồ Chí Minh (HOSE)

Luận văn Thạc sĩ Khoa học máy tính: Nhận dạng đối tượng đồ hoạ trong ảnh văn bản sử dụng mạng nơ ron tích chập

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi