Công cụ mã nguồn mở Tesseract
-
Trong bài báo này, chúng tôi bước đầu tìm hiểu các phương pháp trích lọc văn bản từ hình ảnh của một số công trình liên quan đồng thời cũng tìm hiểu, hiệu chỉnh công cụ mã nguồn mở Tesseract để thực hiện trích lọc văn bản tiếng Anh từ tập tin hình ảnh. Kết quả thử nghiệm bước đầu cho thấy công cụ này rút trích khá tốt các văn bản từ tập tin hình ảnh chứa văn bản được đánh máy.
7p quaymax4 05-09-2018 68 5 Download
-
Báo cáo đồ án thực tập tốt nghiệp với đề tài "Xây dựng phần mềm nhận dạng ký tự quang học sử dụng mã nguồn mở tesseract OCR" được thực hiện nhằm mục đích tìm hiểu, chỉnh sửa công cụ Tesseract để thực hiện việc rút trích các văn bản từ tập tin hình ảnh. Kết cấu của luận văn gồm 3 chương và Kết luận, cụ thể: Chương 1 - Tổng quan về đề tài, chương 2 - Tìm hiểu hệ thống mã nguồn mở Tesseract OCR, chương 3 - Xây dựng chương trình nhận dạng văn bản tiếng Việt sử dụng thư viện Tesseract OCR.
44p change04 26-05-2016 481 86 Download
-
Rút trích văn bản từ tập tin hình ảnh đang là một trong những bài toán quan trọng trong xử lý ảnh hiện nay. Trong bài báo này, chúng tôi bước đầu tìm hiểu các phương pháp trích lọc văn từ hình ảnh của một số công trình liên quan đồng thời cũng tìm hiểu, hiệu chỉnh công cụ mã nguồn mở Tesseract để thực hiện trích lọc văn bản tiếng Anh từ tập tin hình ảnh. Kết quả thử nghiệm bước đầu cho thấy công cụ này rút trích khá tốt các văn bản từ tập tin hình ảnh chứa văn bản được đánh máy.
7p votinhdon91 28-08-2014 174 24 Download