intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Xử lý ảnh, xử lý âm thanh, khuynh hướng phát triển và một số kết quả nghiên cứu triển khai ở viện Công nghệ thông tin

Chia sẻ: Na Na | Ngày: | Loại File: PDF | Số trang:12

146
lượt xem
22
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Sự phát triển nhanh chóng của công nghệ thông tin đã đẩy nhanh và mở ra hướng phát triển cho nhiều ngành khác. Trong số đó phải kể đến lĩnh vực xử lý hình ảnh và xử lý âm thanh. Trong báo cáo "Xử lý ảnh, xử lý âm thanh, khuynh hướng phát triển và một số kết quả nghiên cứu triển khai ở viện Công nghệ thông tin" dưới đây tác giả đề cập đến một số kết quả nghiên cứu và triển khai về xử lý ảnh và xử lý âm thanh ở Viện Công nghệ thông tin, Viện Khoa học và Công nghệ Việt Nam. Mời bạn đọc cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Xử lý ảnh, xử lý âm thanh, khuynh hướng phát triển và một số kết quả nghiên cứu triển khai ở viện Công nghệ thông tin

Bộ Giáo dục và Đào tạo - Trường Đại học Duy Tân<br /> <br /> XỬ LÝ ẢNH, XỬ LÝ ÂM THANH, KHUYNH HƯỚNG PHÁT TRIỂN VÀ MỘT SỐ KẾT QUẢ NGHIÊN CỨU TRIỂN KHAI Ở VIỆN CÔNG NGHỆ THÔNG TIN<br /> ĐỖ NĂNG TOÀN *<br /> <br /> TÓM TẮT Sự phát triển nhanh chóng của công nghệ thông tin đã đẩy nhanh và mở ra hướng phát triển cho nhiều ngành khác. Trong số đó phải kể đến lĩnh vực xử lý hình ảnh và xử lý âm thanh. Trong báo cáo này chúng tôi đề cập đến một số kết quả nghiên cứu và triển khai về xử lý ảnh và xử lý âm thanh ở Viện Công nghệ thông tin, Viện Khoa học và Công nghệ Việt Nam. ABTRACTS The rapid development of information technology has accelerated the development and opening for many other industries. Among them is the field of image processing and audio processing. This report mentions a number of research results and development of image processing and audio processing at the Institute of Information Technology, Institute of Science and Technology of Vietnam. Key words: Image processing; OCR; Vectorization; 3D; VR… 1. Giới thiệu Sự phát triển nhanh chóng của công nghệ thông tin đã có những ảnh hưởng tích cực đến đời sống xã hội của con người. Ngày nay, ở bất kỳ nơi đâu ta cũng thấy sự hiện diện của công nghệ thông tin. Sự phát triển trên cả hai lĩnh vực: Phần cứng và phần mềm đã ngày càng đưa công nghệ thông tin vào cả những lĩnh vực tưởng chừng như không thể sử dụng được máy móc. Trong số những lĩnh vực đó phải kể đến xử lý ảnh và xử lý âm thanh. Một trong những mục đích cao cả của công nghệ thông tin là tạo ra được máy có thể thay thế con người trong việc xử lý thông tin. Một cách tự nhiên máy tính cần thiết phải mô phỏng các quá trình thu nhận và xử lý thông tin của con người. Các thông tin mà con người thu nhận được thông qua 05 giác quan: Thị giác, thính giác, vị giác, khứu giác và cảm giác. Trên cơ sở đó các tiếp cận trong công nghệ thông tin được chia thành các hướng chủ yếu sau: 110<br /> * PGS.TS, Viện Công nghệ thông tin -Viện KH&CN Việt Nam<br /> <br /> KỶ YẾU HỘI NGHỊ KHOA HỌC - Hướng liên quan đến thị giác: Ở đây thông tin vào là các tệp hình ảnh thu nhận thông qua các thiết bị điện tử như camera, scanner v.v.. Các bài toán thuộc kiểu này bao gồm: Tổng quát hoá bản đồ (gồm có các đường vẽ và văn bản bên trong bản đồ), nhận dạng văn bản chữ viết in, chữ viết tay, chữ ký nhận dạng hoá đơn, nhận dạng phiếu điều tra v.v.. - Hướng liên quan đến thính giác: Thông tin vào là tín hiệu âm thanh được thu nhận thông qua các thiết bị thu nhận âm thanh. Các bài toán thuộc hướng này liên quan đến việc: Tổng hợp và nhận dạng tiếng nói chẳng hạn, đọc các văn bản có sẵn trên máy tính hoặc trên mạng, nhận dạng tiếng nói chuyển tiếng nói thành các văn bản để lưu trữ trên máy tính v.v.. - Hướng liên quan đến cảm giác (Sensor): Bộ biến cảm ở đây được ví như bộ phận cảm nhận của con người, nó tiếp nhận thông tin vào như: Cân nặng, nhiệt độ, độ ồn v.v.. Các thông tin này được số hoá và ghi vào tệp dữ liệu. Báo cáo này đề cập đến một số kết quả nghiên cứu liên quan đến xử lý âm thanh và hình ảnh được thực hiện tại Viện công nghệ thông tin, Viện Khoa học và Công nghệ Việt Nam. Đây cũng là hướng nghiên cứu chính của chúng tôi trong những năm vừa qua. Phần còn lại của báo cáo được sắp xếp như sau: Phần 2 trình bày nhưng kết quả liên quan đến xử lý và nhận dạng ảnh 2 chiều. Phần 3 là ảnh động. Tiếp theo, phần 4 là âm thanh. Phần 5 là xử lý ảnh 3 chiều và thực tại ảo. Cuối cùng là kết luận về hướng phát triển của lĩnh vực. 2. Xử lý và nhận dạng ảnh hai chiều Trong xử lý và nhận dạng ảnh hai chiều chúng tôi tập trung vào hướng: Nhập dữ liệu tự động. Nhập dữ liệu tự động là quá trình nhập dữ liệu thông quá các thiết bị kỹ thuật không có hoặc ít có sự can thiệp của con người. Mục đích của nhập liệu tự động là trợ giúp máy tính nhận biết nhanh nhất và chính xác nhất các thông tin vào, nó mô phỏng quá trình tiếp nhận thông tin của con người thông qua các giác quan. Đây là một trong những yếu tố quan trọng nhằm nâng cao tốc độ và hiệu quả của quá trình xử lý thông tin. Kỹ thuật nhập liệu tự động trong thời gian qua đã phát triển một cách mạnh mẽ và đã mang lại sự thay đổi lớn trong các tính toán khoa học kỹ thuật cũng như trong quản lý hành chính và điều khiển học v.v.. 2.1 Phần mềm nhập liệu tự động bản đồ MapScan [3] Nghiên cứu kỹ thuật và thiết kế phần mềm bản đồ tự động với các yêu cầu: Tự động hoá nhập bản đồ - chuyển đổi sang dạng véc tơ các đường biên trên bản đồ thu được dưới dạng đen trắng, đa cấp xám và màu. Map scanning quét những bản đồ giấy và lưu lại như ảnh raster[1,2]. Tiền xử lý hay raster image editing để cải tiến chất lượng như loại bỏ những đối tựơng không cần thiết, nối những đường bị gãy, quay ảnh và kết nối nhiều trang thành một ảnh bản đồ. Text label extracting hay nhận dạng tài liệu chữ in (Optical Character Recognition: 111<br /> <br /> Bộ Giáo dục và Đào tạo - Trường Đại học Duy Tân OCR) để định vị những dạng cho các miền, khu vực, thành phố, tỉnh lỵ; nhận ra văn bản tham chiếu và xác định những toạ độ không gian. Những văn bản được nhận dạng bị loại khỏi ảnh raster suốt trong quá trình véc tơ hoá, và tệp tham chiếu văn bản đựơc sinh ra để sử dụng trong bản vẽ đặc biệt và phần mềm GIS.<br /> Scanned image<br /> LAND.PCX<br /> <br /> Raster Edit<br /> <br /> Edited raster image<br /> LAND.PCX<br /> <br /> OCR<br /> <br /> LAND.REF or LAND.DXF<br /> <br /> Reference text<br /> <br /> Raster image without reference text<br /> LAND.PCX<br /> <br /> Vectorization<br /> <br /> LAND.MAP or LAND.DXF<br /> <br /> Vector map<br /> <br /> Vector Edit<br /> <br /> LAND.MAP or LAND.DXF<br /> <br /> Edited vector map<br /> <br /> Hình 1. Sơ đồ của phần mềm MapScan Véc tơ hoá (Vectorization) để chuyển (tại giai đoạn này của việc xử lý) ảnh raster chứa những điểm, đường và đa giác (không có văn bản tham chiếu) thành dạng véc tơ. Một tệp toạ độ bản đồ được sinh ra để sử dụng trong bản vẽ đặt biệt và trong phần mềm GIS. Hậu xử lý hay soạn thảo bản đồ véc tơ (vector map editing) một bản đồ véc tơ được sinh ra bằng cách đóng các đa giác, loại bụi, nối các đoạn thẳng, quay bản đồ, kết nối nhiều trang thành một bản đồ véc tơ, chọn những đoạn thẳng và gán những thuộc tính mức đặc biệt. Những bản đồ véc tơ cũng có thể được địa tham chiếu thành hệ toạ độ thế giới thực. Một khi toàn bộ quá trình này hoàn thành, tệp văn bản tham chiếu và tệp ảnh véc tơ có thể sử dụng với một hệ vẽ. MapScan phù hợp với phần lớn những dạng tệp đồ hoạ, bao gồm Paintbrush PCX, GEM Raster IMG, Tagged Image File Format TIF, CompuServe GIF, JPG và các dạng Windows BMP, và đưa ra AutoCAD DXF (một dạng chuẩn công nghiệp được chấp nhận rộng rãi, không hạn chế), Atlas GIS BNA, tệp ArcView Shape và các dạng PopMap MAP. Yêu cầu hệ thống IBM PC/AT hay tương thích, bộ xử lý 80386/80486 hay cao hơn và 640KB RAM. Nên có bộ nhớ mở rộng thêm ít nhất 8MB. Một đĩa mềm và một đĩa cứng tối thiểu có 4MB chỗ trống. Màn hình màu VGA. Windows 3.1, Windows for Workgroup 3.11, Windows 95, or Windows NT. Chuột tương thích Microsoft. Máy quét và Twain driver (optional).<br /> <br /> 112<br /> <br /> KỶ YẾU HỘI NGHỊ KHOA HỌC<br /> <br /> Hình 2. Giao diện của chương trình MapScan 2.2. Phần mềm nhận dạng VnDOCR[4] Chức năng xử lý: Tự động xác định độ nghiêng của văn bản, quay ảnh 1800, +900, hoặc góc bất kỳ. Xoá nhiễu, làm dày, làm mảnh đường nét, đảo độ sáng ảnh văn bản,... Xử lý được những tài liệu có lẫn ảnh, hình vẽ. Tự động phân vùng, đánh dấu vùng ngăn cách giữa các khối văn bản và các khối hình ảnh. - Nhận dạng Nhận dạng các dạng font chữ kiểu không chân và có chân Arial, Avant, Times, Courier,... với kích thước của các ký tự từ 8 đến 72 điểm và các thuộc tính như bình thường, đậm, nghiêng, hay kết hợp đậm-nghiêng (đối với văn bản in sạch rõ, không đứt nét, không dính, font chữ chuẩn). Tốc độ nhận dạng 15 - 17 giây cho một trang A4 trên máy PENTIUM 200MHz, 32 MB RAM. Thực hiện song song quá trình quét và nhận dạng. Quá trình thực hiện sẽ giống như quá trình hoạt động của một máy photocopy. Nhờ quá trình này thời gian thực hiện nhận dạng sẽ giảm. Nhận dạng các bảng biểu, mẫu biểu<br /> <br /> 113<br /> <br /> Bộ Giáo dục và Đào tạo - Trường Đại học Duy Tân<br /> <br /> Hình 3. Giao diện của hệ VnDOCR - Học thêm các kiểu chữ mới Tách các ký tự trên các font chữ mới để người dùng dạy bổ sung thêm cho chương trình, thông qua cơ chế hội thoại. - Kiểm tra kết quả nhận dạng Đọc và soát chính tả kết quả nhận dạng theo từ đơn hoặc kép và đưa ra các gợi ý thay thế hoặc cho phép sửa bằng tay. Cho phép bổ sung các từ, hoặc các cụm từ mới vào từ điển soát chính tả của người sử dụng. - Giao diện ứng dụng Chương trình có giao diện thân thiện và dễ sử dụng đối với người dùng. Hệ thống giao diện hiển thị bằng tiếngViệt hoặc tiếng Anh. Tính năng trang làm việc hiện thời (workspace) cho phép lưu giữ trạng thái hiện thời của công việc (ảnh văn bản quét vào, văn bản đã nhận dạng và chỉnh sửa) để tiếp tục công việc, điều này đặc biệt cần thiết khi xử lý nhiều tài liệu nhiều trang. Hỗ trợ (Help) với tính năng multimedia sau: - Với các chức năng ở trên hệ thống nhận dạng vnDOCR đã được các giải thưởng Giải nhất thi sản phẩm CNTT 1998 Giải thưởng khoa học kỹ thuật thanh niên 1999 Giải nhất - giải thưởng sáng tạo KHCN Việt Nam 1999 Giải nhất - sản phẩm phần mềm hứa hẹn nhất 2000 Huy chương vàng - sản phẩm phần mềm đạt doanh số cao 2000 05 năm liền được bình chọn là sản phẩm CNTT ưa chuộng nhất 1999-2003<br /> <br /> 114<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0