intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Gán nhãn đối tượng dựa vào kỹ thuật nhận dạng

Chia sẻ: Phan Phan | Ngày: | Loại File: PDF | Số trang:23

81
lượt xem
14
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn được thực hiện với mục đích nhằm tìm hiểu về bài toán nhận dạng hình ảnh và gán nhãn, ứng dụng của nó trong các lĩnh vực; tìm hiểu một số vấn đề, các thuật toán liên quan; Đặt nền tảng cho cá nhân nghiên cứu, tìm hiểu sâu hơn về vấn đề này, từ đó thiết kế một chương trình thử nghiệm nhận dạng và gán nhãn cho một ảnh cụ thể. Để biết rõ hơn về nội dung chi tiết, mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Gán nhãn đối tượng dựa vào kỹ thuật nhận dạng

ĐẠI HỌC QUỐC GIA HÀ NỘI<br /> VIỆN CÔNG NGHỆ THÔNG TIN<br /> <br /> NGUYỄN VŨ QUANG<br /> <br /> GÁN NHÃN ĐỐI TƯỢNG DỰA VÀO<br /> KỸ THUẬT NHẬN DẠNG<br /> Ngành: Công nghệ thông tin<br /> Chuyên ngành: Quản lý Hệ thống thông tin<br /> Mã số: Chuyên ngành đào tạo thí điểm<br /> <br /> TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN<br /> <br /> NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. Đỗ Năng Toàn<br /> <br /> Hà Nội - 2015<br /> <br /> 1<br /> <br /> PHẦN MỞ ĐẦU<br /> Cùng với sự phát triển ngày càng mạnh mẽ của khoa học kĩ<br /> thuật trong một vài thập kỷ gần đây, xử lý ảnh tuy là một ngành khoa<br /> học còn tương đối mới mẻ so với nhiều ngành khoa học khác nhưng<br /> hiện nay nó đang là một trong những lĩnh vực phát triển rất nhanh và<br /> thu hút sự quan tâm đặc biệt từ các nhà khoa học, thúc đẩy các trung<br /> tâm nghiên cứu, ứng dụng về lĩnh vực hấp dẫn này.<br /> Nhận dạng và gán nhãn cho hình ảnh đóng vai trò quan trọng<br /> trong nhiều ứng dụng thực tế về khoa học kĩ thuật cũng như trong<br /> cuộc sống thường ngày như: sản xuất và kiểm tra chất lượng, sự di<br /> chuyển của Robot, các phương tiện đi lại tự trị, công cụ hướng dẫn<br /> cho người mù, an ninh và giám sát, nhận dạng đối tượng, nhận dạng<br /> mặt, các ứng dụng trong y học, sản xuất, hiệu chỉnh video,…<br /> Một trong những ứng dụng quan trọng, là việc nhận dạng và<br /> gán nhãn cho các loại hình ảnh …. Tự động nhận dạng ảnh và đặt vị<br /> trí nhãn là một lĩnh vực trong trực quan hóa thông tin. Nhãn là các<br /> đoạn văn bản nhằm truyền đạt thông tin, làm rõ ý nghĩa của các cấu<br /> trúc phức tạp được biểu diễn ở dạng đồ họa.<br /> Bài toán nhận dạng và gán nhãn đã được đề cập, nghiên cứu<br /> nhiều trên thế giới. Tại Việt Nam bài toán này cũng đang rất được<br /> chú trọng và được ứng dụng trong rất nhiều lĩnh vực. Vì vậy, đề tài<br /> này được xây dựng với các mục đích: Tìm hiểu về bài toán nhận dạng<br /> hình ảnh và gán nhãn, ứng dụng của nó trong các lĩnh vực; Tìm hiểu<br /> một số vấn đề, các thuật toán liên quan; Đặt nền tảng cho cá nhân<br /> nghiên cứu, tìm hiểu sâu hơn về vấn đề này. Từ đó thiết kế một<br /> chương trình thử nghiệm nhận dạng và gán nhãn cho một ảnh cụ thể.<br /> Luận văn gồm phần mở đầu, phần kết luận và 3 chương, nội<br /> dung các chương như sau:<br /> Chương 1: Khái quát về gán nhãn và bài toán nhận dạng<br /> đối tượng<br /> <br /> 2<br /> <br /> Chương này khái quát lại cơ bản những kiến thức về bài toán<br /> gán nhãn gồm xử lý ảnh và gán nhãn trong xử lý ảnh. Đồng thời nói<br /> về bài toán nhận dạng đối tượng, vai trò và tầm quan trọng của bài<br /> toán nhận dạng đối tượng, các phương pháp nhận dạng đối tượng<br /> cũng như một số hệ thống nhận dạng đối tượng nổi tiếng trên thế giới<br /> Chương 2: Một số vấn đề trong nhận dạng đối tượng sử<br /> dụng mạng nơron<br /> Chương 2 đề cập đến một số vấn đề trong nhận dạng đối tượng<br /> sử dụng mạng nơron. Mô tả kiến trúc của một hệ thống nhận dạng<br /> đối tượng sử dụng mạng nơron nhân tạo và cách thiết kế, huấn luyện<br /> mạng nơron nhân tạo cho việc nhận dạng.<br /> Chương 3: Chương trình thử nghiệm<br /> Chương này áp dụng các kiến thức nghiên cứu trong chương 1<br /> và chương 2, sử dụng mạng nơron nhiều lớp lan truyền ngược và kỹ<br /> thuật gán nhãn để xây dựng một chương trình nhận dạng ký tự.<br /> <br /> 3<br /> <br /> CHƯƠNG 1: KHÁI QUÁT VỀ GÁN NHÃN VÀ BÀI TOÁN<br /> NHẬN DẠNG ĐỐI TƯỢNG<br /> Chương này khái quát lại cơ bản những kiến thức về bài toán<br /> gán nhãn gồm xử lý ảnh và gán nhãn trong xử lý ảnh. Đồng thời nói<br /> về bài toán nhận dạng đối tượng, vai trò và tầm quan trọng của bài<br /> toán nhận dạng đối tượng, các phương pháp nhận dạng đối tượng<br /> cũng như một số hệ thống nhận dạng đối tượng nổi tiếng trên thế<br /> giới.<br /> 1.1. Khái quát về gán nhãn<br /> 1.1.1. Xử lý ảnh<br /> Xử lý ảnh là một phần của lĩnh vực xử lý tín hiệu số. Tăng<br /> cường chất lượng thông tin hình ảnh đối với quá trình tri giác của con<br /> người và biễu diễn trên máy tính. Xử lý ảnh số bao gồm các phương<br /> pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự<br /> nhiên.<br /> Xử lý ảnh liên quan đến việc thay đổi hình ảnh để đạt được<br /> một trong hai mục đích:<br /> - Thứ nhất: biến đổi ảnh và làm đẹp ảnh.<br /> - Thứ hai: tự động phân tích nhận dạng ảnh hay đoán nhận ảnh<br /> và đánh giá các nội dung của ảnh.<br /> Lý do phải xử lý ảnh:<br /> - Ảnh có thể bị lỗi trong quá trình thu ảnh, truyền dẫn và hiển<br /> thị (hồi phục, nâng cao chất lượng ảnh, nội suy)<br /> - Ảnh có thể mang các nội dung nhạy cảm (vd, chống lại copy<br /> không hợp pháp, giả mạo và lừa đảo)<br /> - Tạo các bức ảnh có hiệu ứng nghệ thuật<br /> Có thể tạm phân biệt các hệ thống xử lý ảnh theo mức độ phức<br /> tạp của thuật toán xử lý như sau:<br /> - Xử lý ảnh mức thấp: đó là các quá trình biến đổi đơn giản<br /> như thực hiện các bộ lọc nhằm khử nhiễu trong ảnh, tăng cường độ<br /> <br /> 4<br /> <br /> tương phản hay độ nét của ảnh. Trong trường hợp này, tín hiệu đưa<br /> vào hệ thống xử lý và tín hiệu ở đầu ra là ảnh quang học.<br /> - Xử lý ảnh mức trung: quá trình xử lý phức tạp hơn, thường<br /> được sử dụng để phân lớp, phân đọan ảnh, xác định và dự đóan biên<br /> ảnh, nén anh để lưu trữ hoặc truyền phát. Đặc điểm của các hệ thống<br /> xử lý ảnh mức trung là tín hiệu đầu vào là hình ảnh, còn tín hiệu đầu<br /> ra là các thành phần được tách ra từ hình ảnh gốc, hoặc luồng dữ liệu<br /> nhận được sau khi nén ảnh.<br /> - Xử lý ảnh mức cao: là quá trình phân tích và nhận dạng hình<br /> ảnh. Đây cũng là quá trình xử lý được thực hiện trong hệ thống thì<br /> giác của con người.<br /> Chúng ta có thể thấy rằng, không phải bất kỳ một ứng dụng xử<br /> lý ảnh nào cũng bắt buộc phải tuân theo các bước xử lý đã nêu ở trên,<br /> ví dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước<br /> tiền xử lý. Một cách tổng quát thì những chức năng xử lý bao gồm cả<br /> nhận dạng và giải thích thường chỉ có mặt trong hệ thống phân tích<br /> ảnh tự động hoặc bán tự động, được dùng để rút trích ra những thông<br /> tin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng kí tự quang<br /> học, nhận dạng chữ viết tay vv….<br /> 1.1.2. Gán nhãn trong xử lý ảnh<br /> Nhãn là các đoạn văn bản nhằm truyền đạt thông tin, làm rõ<br /> ý nghĩa của các cấu trúc phức tạp được biểu diễn ở dạng đồ họa. Bài<br /> toán tự động gán nhãn được xác định là một lĩnh vực nghiên cứu<br /> quan trọng của ACM Computational Geometry Task Force (Đội tính<br /> toán hình học ACM)<br /> Gán nhãn là nguồn của nhiều bài toán tối ưu hóa hình học.<br /> Ngay cả khi nhãn được đặt vào vị trí cố định tương ứng với một<br /> điểm, đây vẫn là bài toán NP-hard. Các bản đồ cần được gán nhãn,<br /> vậy cần có các giải thuật hiệu quả, giải thuật heuristics để xác định<br /> những ràng buộc, vị trí có thể.<br /> <br /> 5<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2