Giới thiệu tài liệu
Học viện Ứng dụng nhận dạng tiếng Việt trong trích xuất thông tin từ căn cước công dân - Trịnh Tấn Đạt là một bài giảng hướng dẫn về việc sử dụng một hệ thống nhận dạng ký tự Việt ngữ trong hình ảnh chất lượng thấp. Bài giảng gồm ba phần: Cropper, Text Detector và Text Recognition.
Đối tượng sử dụng
Sinh viên, nhà nghiên cứu và doanh nghiệp có quan tâm đến việc sử dụng hệ thống nhận dạng ký tự Việt ngữ trong hình ảnh chất lượng thấp
Nội dung tóm tắt
Bài giảng Ứng dụng nhận dạng tiếng Việt trong trích xuất thông tin từ căn cước công dân là một bài giảng hướng dẫn về việc sử dụng một hệ thống nhận dạng ký tự Việt ngữ trong hình ảnh chất lượng thấp. Bài giảng bao gồm giới thiệu về các mô hình đề xuất, công việc của từng phần, và kết quả của các mô hình. Mô hình Cropper sử dụng Mask R-CNN để phân đoạn ảnh CCCD và tìm biên của CCCD. Mô hình Text Detector sử dụng hai hướng tiếp cận khác nhau là dùng các kỹ thuật xử lý ảnh và EAST detector để trích xuất các vùng thông tin trong ảnh CCCD. Mô hình Text Recognition sử dụng mạng tích chập hồi quy (CRNN) kết hợp CTC, mạng CRNN kết hợp cơ chế Attention, và kết hợp giữa mạng tích chập (CNN), mạng hồi quy (LSTM) và cơ chế Attention kết hợp CTC trong một mô hình đầu cuối. Bài giảng cũng trình bày kết quả của các mô hình đề xuất, bao gồm kết quả trích xuất và nhận dạng các vùng thông tin trong ảnh CCCD. Tài liệu kết luận rằng hệ thống nhận dạng ký tự Việt ngữ trong hình ảnh chất lượng thấp có thể được cải thiện bằng cách sử dụng các mô hình đề xuất này.