1
Ngày nay các thiết bị thông minh đang phát triển rất mạnh mẽ như xe tự
lái, điện thoại di động có cài đặt trình ứng dụng dịch thuật tự động các ngôn ngữ
hiển thị trên các bản hiệu cũng như rất nhiều loại thiết bị khác. Các thiết bị này
đã nhận dạng chữ có trên các bề mặt đa dạng để thực hiện nhiều mục đích khác
nhau trong thực tế. Điều này cho thấy việc huấn luyện để máy tính tự động nhận
dạng chữ viết xuất hiện trong không gian ngoại cảnh đóng một vai trò quan trọng
để góp phần vào sự phát triển và nâng cao thị giác máy tính, giúp cho các thiết
bị thông minh ngày càng hoàn thiện hơn. Bên cạnh việc nhận dạng chữ tiếng
Việt trên các văn bản giấy thông thường đã được hoàn thiện, việc nhận dạng chữ
tiếng Việt trên các bề mặt ngoại cảnh như bản cảnh báo, bản hiệu quảng cáo, tên
đường phố và nhiều bề mặt khác có chữ Việt được trình bày trên nhiều cách thức
khác nhau đã làm cho máy tính chưa thể nhận dạng chúng một cách đầy đủ và
chính xác. Vì vậy, luận án đã tập trung vào việc nghiên cứu đối tượng là văn bản
tiếng Việt được chụp lại một cách ngẫu nhiên mà chúng được bố trí đa dạng trên
các bề mặt khác nhau ở ngoại cảnh. Hình ảnh có khả năng chứa văn bản tiếng
Việt được đưa qua các bước gồm tiền xử lý, phát hiện và nhận dạng văn bản.
Luận án gồm có 5 chương chính thức nhằm mục tiêu đưa giải pháp nâng cao độ
chính xác trong việc phát hiện và nhận dạng văn bản tiếng Việt xuất hiện trong
các ảnh phức tạp này. Chương 1 trình bày tổng quan về bài toán phát hiện và
nhận dạng văn bản nói chung và văn bản tiếng Việt xuất hiện ở môi trường ngoại
cảnh nói riêng cùng với nền tảng khoa học trình bày trong chương này là lý
thuyết học sâu. Chương 2 trình bày về phương pháp nâng cao chất lượng tiền xử
lý, nắn chỉnh hình ảnh đầu vào để có được hình ảnh đạt chuẩn trước khi đưa
chúng vào xử lý các bước tiếp theo. Phương pháp này được luận án đề xuất và
đặt tên là VNST-REC. Các nội dung chính của chương này gồm thuật toán phát
hiện vùng quan tâm, phân vùng ảnh và phát hiện các điểm góc, thuật toán nắn
chỉnh hình ảnh. Chương 3 trình bày kết quả nghiên cứu để nâng cao chất lượng
phát hiện văn bản tiếng Việt trong ảnh ngoại cảnh, trong đó phương pháp nâng
cao chất lượng phát hiện văn bản thông qua 4 bước chính gồm trích chọn đặc
trưng từ ảnh đầu vào, mô hình hợp nhất, mô hình tập trung ngữ cảnh, phân vùng