BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
HUỲNH VĂN HUY
NGHIÊN CỨU PHƯƠNG PHÁP NÂNG CAO
ĐỘ CHÍNH XÁC PHÁT HIỆN VÀ NHẬN DẠNG
TIẾNG VIỆT TRONG ẢNH CĂN CƯỚC CÔNG DÂN VÀ
ẢNH NGOẠI CẢNH
LUẬN ÁN TIẾN
NGÀNH KHOA HỌC MÁY TÍNH
Đồng Nai - năm 2025
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
HUỲNH VĂN HUY
NGHIÊN CỨU PHƯƠNG PHÁP NÂNG CAO
ĐỘ CHÍNH XÁC PHÁT HIỆN VÀ NHẬN DẠNG
TIẾNG VIỆT TRONG ẢNH CĂN CƯỚC CÔNG DÂN VÀ
ẢNH NGOẠI CẢNH
LUẬN ÁN TIẾN
NGÀNH KHOA HỌC MÁY TÍNH
(Bản luận án được bảo vệ cấp Trường)
Chuyên ngành: Khoa học máy tính
Mã số ngành: 9480101
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. Ngô Quốc Tạo
TS. Nguyễn Thị Thanh Tân
Đồng Nai - năm 2025
i
LỜI CAM ĐOAN
Tác giả xin cam đoan đây công trình nghiên cứu của riêng tác giả được
sự hướng dẫn khoa học của PGS.TS Ngô Quốc Tạo TS Nguyễn Thị Thanh Tân.
Các nội dung nghiên cứu, kết quả trong luận án này trung thực do chính tác giả
thực hiện và không vi phạm đạo đức nghiên cứu. Những số liệu trong các bảng biểu,
những hình ảnh phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả
thu thập, xử những thông tin từ các nguồn khác ghi rõ trong phần tài liệu
tham khảo.
Đồng Nai, ngày …… tháng …… năm …….
Tác giả luận án
Huỳnh Văn Huy
ii
LỜI CẢM ƠN
Tác giả xin kính gửi lời cảm ơn đến 2 người ớng dẫn khoa học PGS.TS.
Ngô Quốc Tạo TS. Nguyễn Thị Thanh Tân đã dày công hướng dẫn để luận án
được hoàn thành. Nhân dịp này, tác giả kính gửi lời cảm ơn đến Ban Giám hiệu
trường Đại học Lạc Hồng, Ban Lãnh đạo Khoa Sau Đại học cùng Quý Thầy bộ
môn đã sự quan tâm sâu sát, tạo mọi điều kiện thuận lợi nhiệt huyết trong
giảng dạy để góp phần cùng quan trọng giúp cho tác giả thêm động lực
kiến thức để hoàn thành được luận án. Tác giả xin kính gửi lời cảm ơn đến gia đình,
người thân, đồng nghiệp bạn đã có những sẻ chia, động viên kịp thời để giúp
c giả hoàn thành nhiệm vụ học tập này.
Đồng Nai, ngày …… tháng …… năm …….
Tác giả luận án
Huỳnh Văn Huy
iii
TÓM TẮT LUẬN ÁN
Ngày nay các thiết bị thông minh đang phát triển rất mạnh mẽ nxe tự lái,
điện thoại di động cài đặt trình ứng dụng dịch thuật tự động các ngôn ngữ hiển
thị trên các bản hiệu cũng như rất nhiều loại thiết bị khác. Các thiết bị này đã nhận
dạng chữ trên các bề mặt đa dạng để thực hiện nhiều mục đích khác nhau trong
thực tế. Điều này cho thấy việc huấn luyện đmáy tính tự động nhận dạng chữ viết
xuất hiện trong không gian ngoại cảnh đóng một vai trò quan trọng để góp phần vào
sự phát triển nâng cao thị giác máy tính, giúp cho các thiết bị thông minh ngày
càng hoàn thiện hơn. Bên cạnh việc nhận dạng chữ tiếng Việt trên các văn bản giấy
thông thường đã được hoàn thiện, việc nhận dạng chữ tiếng Việt trên các bề mặt
ngoại cảnh như bản cảnh báo, bản hiệu quảng cáo, tên đường phố nhiều bề mặt
khác chữ Việt được trình bày trên nhiều cách thức khác nhau đã làm cho máy
tính chưa thể nhận dạng chúng một cách đầy đủ và chính xác. Vì vậy, luận án đã tập
trung vào việc nghiên cứu đối tượng văn bản tiếng Việt được chụp lại một cách
ngẫu nhiên chúng được bố trí đa dạng trên các bề mặt khác nhau ngoại cảnh.
Hình ảnh khả năng chứa văn bản tiếng Việt được đưa qua các bước gồm tiền xử
lý, phát hiện nhận dạng văn bản. Luận án gồm 5 chương chính thức nhằm
mục tiêu tìm giải pháp nâng cao độ chính xác trong việc phát hiện và nhận dạng chữ
Việt xuất hiện trong các ảnh phức tạp này. Chương 1 trình bày tổng quan về bài
toán phát hiện nhận dạng văn bản nói chung văn bản tiếng Việt xuất hiện
môi trường ngoại cảnh nói riêng cùng với nền tảng khoa học trình bày trong chương
này là lý thuyết học sâu. Chương 2 trình bày về phương pháp nâng cao độ chính xác
tiền xử lý, nắn chỉnh hình ảnh đầu o để có được hình ảnh đạt chuẩn trước khi đưa
chúng o xử các bước tiếp theo. Phương pháp này được luận án đề xuất đặt
tên VNST-REC. Các nội dung chính của chương này gồm thuật toán phát hiện
vùng quan tâm, phân vùng ảnh và phát hiện các điểm góc, thuật toán nắn chỉnh hình
ảnh. Chương 3 trình bày kết quả nghiên cứu để nâng cao độ chính xác phát hiện văn
bản tiếng Việt trong nh ngoại cảnh, trong đó phương pháp nâng cao độ chính xác
phát hiện văn bản thông qua 4 bước chính gồm trích chọn đặc trưng từ ảnh đầu vào,