
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
HUỲNH VĂN HUY
NGHIÊN CỨU PHƯƠNG PHÁP NÂNG CAO
ĐỘ CHÍNH XÁC PHÁT HIỆN VÀ NHẬN DẠNG
TIẾNG VIỆT TRONG ẢNH CĂN CƯỚC CÔNG DÂN VÀ
ẢNH NGOẠI CẢNH
LUẬN ÁN TIẾN SĨ
NGÀNH KHOA HỌC MÁY TÍNH
Đồng Nai - năm 2025

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
HUỲNH VĂN HUY
NGHIÊN CỨU PHƯƠNG PHÁP NÂNG CAO
ĐỘ CHÍNH XÁC PHÁT HIỆN VÀ NHẬN DẠNG
TIẾNG VIỆT TRONG ẢNH CĂN CƯỚC CÔNG DÂN VÀ
ẢNH NGOẠI CẢNH
LUẬN ÁN TIẾN SĨ
NGÀNH KHOA HỌC MÁY TÍNH
(Bản luận án được bảo vệ cấp Trường)
Chuyên ngành: Khoa học máy tính
Mã số ngành: 9480101
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. Ngô Quốc Tạo
TS. Nguyễn Thị Thanh Tân
Đồng Nai - năm 2025

i
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của riêng tác giả và được
sự hướng dẫn khoa học của PGS.TS Ngô Quốc Tạo và TS Nguyễn Thị Thanh Tân.
Các nội dung nghiên cứu, kết quả trong luận án này là trung thực do chính tác giả
thực hiện và không vi phạm đạo đức nghiên cứu. Những số liệu trong các bảng biểu,
những hình ảnh phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả
thu thập, xử lý và những thông tin từ các nguồn khác có ghi rõ trong phần tài liệu
tham khảo.
Đồng Nai, ngày …… tháng …… năm …….
Tác giả luận án
Huỳnh Văn Huy

ii
LỜI CẢM ƠN
Tác giả xin kính gửi lời cảm ơn đến 2 người hướng dẫn khoa học là PGS.TS.
Ngô Quốc Tạo và TS. Nguyễn Thị Thanh Tân đã dày công hướng dẫn để luận án
được hoàn thành. Nhân dịp này, tác giả kính gửi lời cảm ơn đến Ban Giám hiệu
trường Đại học Lạc Hồng, Ban Lãnh đạo Khoa Sau Đại học cùng Quý Thầy Cô bộ
môn đã có sự quan tâm sâu sát, tạo mọi điều kiện thuận lợi và nhiệt huyết trong
giảng dạy để góp phần vô cùng quan trọng giúp cho tác giả có thêm động lực và
kiến thức để hoàn thành được luận án. Tác giả xin kính gửi lời cảm ơn đến gia đình,
người thân, đồng nghiệp và bạn bè đã có những sẻ chia, động viên kịp thời để giúp
tác giả hoàn thành nhiệm vụ học tập này.
Đồng Nai, ngày …… tháng …… năm …….
Tác giả luận án
Huỳnh Văn Huy

iii
TÓM TẮT LUẬN ÁN
Ngày nay các thiết bị thông minh đang phát triển rất mạnh mẽ như xe tự lái,
điện thoại di động có cài đặt trình ứng dụng dịch thuật tự động các ngôn ngữ hiển
thị trên các bản hiệu cũng như rất nhiều loại thiết bị khác. Các thiết bị này đã nhận
dạng chữ có trên các bề mặt đa dạng để thực hiện nhiều mục đích khác nhau trong
thực tế. Điều này cho thấy việc huấn luyện để máy tính tự động nhận dạng chữ viết
xuất hiện trong không gian ngoại cảnh đóng một vai trò quan trọng để góp phần vào
sự phát triển và nâng cao thị giác máy tính, giúp cho các thiết bị thông minh ngày
càng hoàn thiện hơn. Bên cạnh việc nhận dạng chữ tiếng Việt trên các văn bản giấy
thông thường đã được hoàn thiện, việc nhận dạng chữ tiếng Việt trên các bề mặt
ngoại cảnh như bản cảnh báo, bản hiệu quảng cáo, tên đường phố và nhiều bề mặt
khác có chữ Việt được trình bày trên nhiều cách thức khác nhau đã làm cho máy
tính chưa thể nhận dạng chúng một cách đầy đủ và chính xác. Vì vậy, luận án đã tập
trung vào việc nghiên cứu đối tượng là văn bản tiếng Việt được chụp lại một cách
ngẫu nhiên mà chúng được bố trí đa dạng trên các bề mặt khác nhau ở ngoại cảnh.
Hình ảnh có khả năng chứa văn bản tiếng Việt được đưa qua các bước gồm tiền xử
lý, phát hiện và nhận dạng văn bản. Luận án gồm có 5 chương chính thức nhằm
mục tiêu tìm giải pháp nâng cao độ chính xác trong việc phát hiện và nhận dạng chữ
Việt xuất hiện trong các ảnh phức tạp này. Chương 1 trình bày tổng quan về bài
toán phát hiện và nhận dạng văn bản nói chung và văn bản tiếng Việt xuất hiện ở
môi trường ngoại cảnh nói riêng cùng với nền tảng khoa học trình bày trong chương
này là lý thuyết học sâu. Chương 2 trình bày về phương pháp nâng cao độ chính xác
tiền xử lý, nắn chỉnh hình ảnh đầu vào để có được hình ảnh đạt chuẩn trước khi đưa
chúng vào xử lý các bước tiếp theo. Phương pháp này được luận án đề xuất và đặt
tên là VNST-REC. Các nội dung chính của chương này gồm thuật toán phát hiện
vùng quan tâm, phân vùng ảnh và phát hiện các điểm góc, thuật toán nắn chỉnh hình
ảnh. Chương 3 trình bày kết quả nghiên cứu để nâng cao độ chính xác phát hiện văn
bản tiếng Việt trong ảnh ngoại cảnh, trong đó phương pháp nâng cao độ chính xác
phát hiện văn bản thông qua 4 bước chính gồm trích chọn đặc trưng từ ảnh đầu vào,