Thư viện Tesseract
-
Mục tiêu của đề tài "Nghiên cứu nhận dạng chữ ba na trên văn bản hình ảnh" là tìm hiểu phương thức trích xuất thông tin từ hình ảnh để sinh ra ký tự, văn bản số thông qua việc nhận dạng ký tự quang học (OCR) cho tiếng Ba Na. Ở bước sau trích xuất, đề xuất kỹ thuật huấn luyện mô hình ngôn ngữ để sửa sai lỗi chính tả kí tự trên văn bản được sinh ra.
67p dongcoxanh2510 25-10-2022 16 5 Download
-
Mục tiêu nghiên cứu của đề tài này là áp dụng thư viện mã nguồn mở Tessaract tạo ra bộ dữ liệu từ điển tiếng Việt và tiếng Anh, từ đó khôi phục văn bản tiếng Anh và Việt thông qua máy quét. Mời các bạn cùng tham khảo!
43p bobietbay 22-12-2021 28 7 Download
-
Báo cáo đồ án thực tập tốt nghiệp với đề tài "Xây dựng phần mềm nhận dạng ký tự quang học sử dụng mã nguồn mở tesseract OCR" được thực hiện nhằm mục đích tìm hiểu, chỉnh sửa công cụ Tesseract để thực hiện việc rút trích các văn bản từ tập tin hình ảnh. Kết cấu của luận văn gồm 3 chương và Kết luận, cụ thể: Chương 1 - Tổng quan về đề tài, chương 2 - Tìm hiểu hệ thống mã nguồn mở Tesseract OCR, chương 3 - Xây dựng chương trình nhận dạng văn bản tiếng Việt sử dụng thư viện Tesseract OCR.
44p change04 26-05-2016 488 86 Download