
1
PHẠM VĂN DƯƠNG
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM
KHOA HỌC VÀ CÔNG NGHỆ VN
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Phạm Văn Dương
HỆ THỐNG THÔNG TIN
NGHIÊN CỨU BÀI TOÁN BÓC TÁCH THÔNG TIN
TRONG CHỨNG MINH THƯ SỬ DỤNG HỌC SÂU
LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH
2021
Hà Nội – 2021

2
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM
KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Phạm Văn Dương
NGHIÊN CỨU BÀI TOÁN BÓC TÁCH THÔNG TIN
TRONG CHỨNG MINH THƯ SỬ DỤNG HỌC SÂU
Chuyên ngành : Hệ thống thông tin
Mã số: 8480104
LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC :
PGS.TS. NGÔ QUỐC TẠO
Hà Nội – 2021

3
LỜI CAM ĐOAN
Tôi là Phạm Văn Dương, học viên khóa 2019B, ngành Máy tính, chuyên ngành
Hệ thống thông tin. Tôi xin cam đoan luận văn “Nghiên cứu bài toán bóc tách
thông tin trong chứng minh thư sử dụng học sâu” là do tôi nghiên cứu, tìm
hiểu và phát triển dưới sự hướng dẫn của PGS.TS. Ngô Quốc Tạo, không phải sự
sao chép từ các tài liệu, công trình nghiên cứu của người khác mà không ghi rõ
trong tài liệu tham khảo. Tôi xin chịu trách nhiệm về lời cam đoan này.
Hà Nội, ngày tháng năm 2021
Tác giả
Phạm Văn Dương

4
LỜI CẢM ƠN
Lời cảm ơn trân trọng đầu tiên Tôi muốn dành tới các thầy cô Học viện
khoa học và công nghệ Việt Nam, Viện công nghệ thông tin, Viện Hàn lâm khoa
học và công nghệ Việt Nam nói chung và các thầy cô trong bộ môn Hệ thống
thông tin cũng như khoa Công nghệ thông tin nói riêng đã tận tình giảng dạy và
truyền đạt nhưng kiến thức quý báu trong suốt khoá cao học vừa qua, giúp tôi có
nhưng kiến thức chuyên môn nền tảng để làm cơ sở lý luận khoa học cho luận
văn này.
Đặc biệt Tôi xin chân thành cảm ơn thầy PGS.TS. Ngô Quốc Tạo đã dìu
dắt và hướng dẫn tôi trong suốt quá trình làm luận văn, sự chỉ bảo và định hướng
của thầy giúp tôi tự tin nghiên cứu nhưng vấn đề mới và giải quyết bài toán một
cách khoa học.
Tôi xin trân trọng cảm ơn Ban giám hiệu Học viện khoa học công nghệ Việt
Nam - Viện Hàn lâm khoa học và công nghệ Việt Nam đã tạo các điều kiện cho
tôi được học tập và làm luận văn một cách thuận lợi.
Tôi xin cảm ơn sự hỗ trợ của nhiệm vụ: “Hỗ trợ hoạt động nghiên cứu khoa
học cho nghiên cứu viên cao cấp năm 2021”. mã số: nvcc02.01/21-21 của Viện
Hàn lâm Khoa học và Công nghệ Việt Nam (VAST), Hà Nội, Việt Nam.
Mặc dù đã cố gắng rất nhiều, nhưng chắc chắn trong quá trình học tập cũng
như luận văn không khỏi nhưng thiết sót. Tôi rất mong được sự thông cảm và chỉ
bảo tận tình của các thầy cô và các bạn.
Hà Nội, ngày tháng năm 2021
. Tác giả
Phạm Văn Dương

5
MỤC LỤC
DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT ...................................................... 7
DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ ............................................................................. 8
MỞ ĐẦU ....................................................................................................................... 10
CHƯƠNG 1. TỔNG QUAN VỀ PHÁT HIỆN, NHẬN DẠNG KÝ TỰ, SỰ PHÁT
TRIỂN CỦA HỌC MÁY VÀ HỌC SÂU ..................................................................... 12
1.1 Tổng quan về phát hiện và nhận dạng ký tự ...................................................... 12
1.2 Sự phát triển của học máy và học sâu ............................................................... 13
1.3 Kết luận chương ................................................................................................ 17
CHƯƠNG 2. GIỚI THIỆU VỀ MẠNG CONVOLUTION NEURAL NETWORK ... 18
2.1 Giới thiệu sơ lược về CNN ................................................................................ 18
2.2 Convolution Layer – Tầng Tích Chập ................................................................ 18
2.3 Strides – Bước nhảy ............................................................................................ 20
2.4 Padding – Đệm ................................................................................................... 21
2.5 Non Linearity (ReLU) – Phi tuyến tính .............................................................. 21
2.6 Pooling Layer – Tầng gộp .................................................................................. 22
2.7 Full Connected Layer – Tầng kết nối đầy đủ. ..................................................... 23
2.8 Kết luận chương. .................................................................................................. 23
CHƯƠNG 3. MÔ HÌNH MẠNG PIXELLINK CHO PHÁT HIỆN VĂN BẢN .......... 24
3.1 Cấu trúc mạng .................................................................................................... 24
3.2 Kết nối các điểm ảnh ......................................................................................... 27
3.3 Tối ưu................................................................................................................. 27
3.3.1 Tính toán vùng chính xác ............................................................................. 27
3.3.2 Hàm mất mát ................................................................................................. 28
3.4 Chuẩn bị dữ liệu và đào tạo ............................................................................... 30
3.4.1 Chuẩn bị dữ liệu ........................................................................................... 30
3.4.2 Dữ liệu thật: .................................................................................................. 31
3.4.3 Dữ liệu được sinh ra ..................................................................................... 32
3.4.4 Tiền xử lý dữ liệu: ........................................................................................ 33

