Luận văn Thạc sĩ Công nghệ thông tin: Phát hiện ảnh giả mạo dựa trên phân tích nguồn sáng
lượt xem 4
download
Nội dung của luận văn bao gồm: Chương 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề cập đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh. Khái quát một số phương pháp giả mạo ảnh số thường gặp, đồng thời cũng trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó giúp người đọc có cái nhìn tổng quan về lĩnh vực ảnh số giả mạo. Chương 2: Phát hiện ảnh giả mạo dựa trên phân tích nguồn sáng: Chương này nghiên cứu về các dạng nguồn sáng, từ đó đưa ra phương pháp phát hiện ảnh giả mạo dựa vào nguồn sáng bao gồm ý tưởng, thuật toán. Chương 3: Chương trình thực nghiệm: Tiến hành xây dựng chương trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dựa trên phân tích nguồn sáng.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận văn Thạc sĩ Công nghệ thông tin: Phát hiện ảnh giả mạo dựa trên phân tích nguồn sáng
- 1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NGUYỆT PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN PHÂN TÍCH NGUỒN SÁNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - Năm 2014
- 2 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NGUYỆT PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN PHÂN TÍCH NGUỒN SÁNG Chuyên ngành: Hệ thống thông tin Mã số: 60 48 01 04 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Ngƣời hƣớng dẫn khoa học: PGS.TS Đỗ Năng Toàn Hà Nội - Năm 2014
- 3 LỜI CẢM ƠN Trước tiên, tôi xin gửi lời cảm ơn Thầy PGS.TS. Đỗ Năng Toàn là người đã định hướng nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn. Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn thành luận văn này. Đồng thời tôi cũng xin chân thành cảm ơn các thầy cô Khoa Công nghệ thông tin – Trường Đại học Công nghệ đã tận tình giảng dạy và cung cấp cho tôi những kiến thức cần thiết trong suốt thời gian học tập tại trường. Cuối cùng xin gửi lời cảm ơn chân thành đến gia đình, cơ quan, bạn bè và đồng nghiệp đã tạo điều kiện, giúp đỡ và động viên tôi trong suốt thời gian học tập cũng như trong thời gian nghiên cứu luận văn. Tuy có nhiều cố gắng nhưng do thời gian và kiến thức của bản thân còn nhiều hạn chế nên trong luận văn không tránh khỏi những thiếu sót. Kính mong nhận được sự góp ý của thầy cô và các bạn để luận văn được hoàn thiện hơn. Tôi xin chân thành cảm ơn ! Nguyễn Thị Nguyệt
- 4 LỜI CAM ĐOAN Tôi xin cam đoan: Bản luận văn tốt nghiệp này là kết quả nghiên cứu thực sự của cá nhân, được thực hiện trên cơ sở nghiên cứu lý thuyết, cài đặt thực nghiệm chương trình. Kết quả của luận văn là cả một quá trình nghiên cứu nghiêm túc các kiến thức được học ở trường và dưới sự hướng dẫn khoa học của PGS.TS Đỗ Năng Toàn. Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu đã được công bố, các website,…. Dữ liệu để thực nghiệm có nguồn gốc rõ ràng và không mang tính chất thương mại. Học viên Nguyễn Thị Nguyệt
- 5 MỤC LỤC LỜI CẢM ƠN...............................................................................................................................................1 LỜI CAM ĐOAN .......................................................................................................................................4 DANH MỤC CÁC HÌNH ......................................................................................................................7 LỜI NÓI ĐẦU ..............................................................................................................................................9 CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO.............................10 1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh ................................... 10 1.1.1. Một số khái niệm cơ bản ...................................................................... 10 1.1.2. Một số vấn đề cơ bản trong xử lý ảnh .................................................. 11 1.1.3. Các giai đoạn trong xử lý ảnh .............................................................. 16 1.1.3.1. Thu nhận ảnh ............................................................................... 16 1.1.3.2. Tiền xử lý..................................................................................... 16 1.1.3.3. Phân đoạn ảnh.............................................................................. 17 1.1.3.4. Trích chọn đặc trưng ................................................................... 17 1.1.3.5. Nhận dạng .................................................................................... 18 1.1.4. Biên và vai trò của biên trong nhận dạng ............................................. 19 1.1.4.1. Biên và các kiểu biên cơ bản trong ảnh....................................... 19 1.1.4.1.1. Biên lý tưởng ................................................................... 20 1.1.4.1.2. Biên dốc ........................................................................... 21 1.1.4.1.3. Biên không trơn ............................................................... 21 1.1.4.2. Vai trò của biên trong nhận dạng ................................................ 22 1.1.5. Phát hiện và so khớp các đặc trưng bất biến ........................................ 23 1.1.5.1. Điểm bất động và đặc trưng bất biến .......................................... 23 1.1.5.2. So khớp đặc trưng........................................................................ 25 1.2. Ảnh giả mạo và các dạng giả mạo ảnh cơ bản ........................................... 26 1.2.1. Ảnh giả mạo ......................................................................................... 26 1.2.2. Các loại ảnh giả mạo cơ bản................................................................. 28 1.2.2.1. Ghép ảnh ...................................................................................... 28 1.2.2.2. Tăng cường ảnh ........................................................................... 29 1.2.2.3. Sao chép và dịch chuyển vùng trên ảnh ...................................... 30 1.2.3. Các cách tiếp cận phát hiện ảnh giả mạo ............................................. 32 1.2.3.1. Dựa vào hình dạng....................................................................... 32 1.2.3.2. Dựa vào phân tích nguồn sáng .................................................... 32 1.2.3.3. Dựa vào biến đổi màu sắc ........................................................... 32 1.2.3.4. Dựa vào cơ sở dữ liệu .................................................................. 33
- 6 1.2.3.5. Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ ........................... 33 1.2.3.6. Dựa vào phân tích ánh sáng ........................................................ 33 CHƢƠNG 2: PHÁT HIỆN ẢNH GIẢ MẠO DỰA VÀO PHÂN TÍCH NGUỒN SÁNG 2.1. Phương pháp phát hiện biên ....................................................................... 35 2.1.1. Các phương pháp phát hiện biên trực tiếp ............................................ 35 2.1.2. Một số phương pháp dò biên ................................................................ 39 2.1.2.1. Phương pháp Canny .................................................................... 39 2.1.2.2. Phương pháp Shen – Castan ........................................................ 41 2.2. Nguồn sáng và ước lượng hướng nguồn sáng ............................................ 41 2.2.1. Các dạng nguồn sáng ............................................................................ 41 2.2.1.1. Nguồn sáng ở vô tận (3-D) .......................................................... 41 2.2.1.2. Nguồn sáng ở vô tận (2-D) .......................................................... 43 2.2.1.3. Nguồn sáng ở gần (bộ phận) (2-D) ............................................. 46 2.2.1.4. Nhiều nguồn sáng ........................................................................ 48 2.2.2. Ước lượng hướng nguồn sáng .............................................................. 48 2.2.2.1. Ước lượng hướng chiếu của nguồn sáng..................................... 48 2.2.2.2. Tìm những đường có khả năng là biên khuất .............................. 48 2.2.2.3. Ước lượng hướng chiếu sáng cho từng đường biên tìm được .... 49 2.2.2.4. Sử dụng mạng Bayes tìm ước lượng tốt nhất .............................. 50 2.3. Phát hiện ảnh giả mạo dựa trên sự khác biệt hướng nguồn sáng ............... 50 2.3.1. Thuật toán dò biên đối tượng ............................................................... 51 2.3.2. Loại bỏ các đối tượng nhỏ, nhiễu, làm mảnh biên ............................... 53 2.3.2.1. Loại bỏ các đối tượng nhỏ và nhiễu ............................................ 53 2.3.2.2. Làm mảnh biên và nối nét đứt ..................................................... 53 2.3.3. Lựa chọn các đoạn biên liên thông của đối tượng dùng ước lượng hướng nguồn sáng.............................................................................................. 55 2.3.4. Xây dựng thuật toán xác định hướng ánh sáng trên mỗi đường biên .......... 56 CHƢƠNG 3: CHƢƠNG TRÌNH THỰC NGHIỆM .............................................................58 3.1. Bài toán ....................................................................................................... 58 3.2. Phân tích, lựa chọn công cụ ........................................................................ 59 3.3. Một số kết quả chương trình....................................................................... 59 KẾT LUẬN..................................................................................................................................................62 TÀI LIỆU THAM KHẢO ...................................................................................................................63
- 7 DANH MỤC CÁC HÌNH Hình 1.1. Quá trình xử lý ảnh........................................................................................................ 11 Hình 1.2. Biểu diễn ảnh bằng hàm f ( X , Y ) .............................................................................. 11 Hình 1.3. Ảnh thu nhận và ảnh mong muốn .............................................................................. 13 Hình 1.4. Các bước cơ bản trong xử lý ảnh số ........................................................................... 16 Hình 1.5. Các thành phần cơ bản của một hệ xử lý ảnh ........................................................... 19 Hình 1.6. Đường biên lý tưởng ..................................................................................................... 20 Hình 1.7. Đường biên dốc.............................................................................................................. 21 Hình 1.8. Đường biên không trơn ................................................................................................ 22 Hình 1.9. Sơ đồ phân tích ảnh ....................................................................................................... 22 Hình 1.10. Minh họa về việc giả mạo ảnh .................................................................................. 27 Hình 1.11. Ảnh giả của John Kerry và Jane Fonda được cắt ghép từ hai ảnh riêng lẻ..26 Hình 1.12. Ghép ảnh từ hai ảnh riêng rẽ...................................................................................... 29 Hình 1.13. Ví dụ về tăng cường ảnh ............................................................................................ 30 Hình 1.14. Ảnh che phủ và bỏ đi đối tượng............................................................................... 31 Hình 1.15. Ảnh bổ sung đối tượng.............................................................................................. 31 Hình 1.16. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu ............................................. 33 Hình 1.17. Sự khác biệt của các hướng nguồn sáng khác nhau .............................................. 34 Hình 2.1. Mô hình minh họa cho: nguồn sáng vô tận (3-D), nguồn sáng vô tận (2-D), và nguồn sáng cục bộ (2-D). Trong trường hợp 2-D, thành phần z của bề mặt bằng 0. không giống trường hợp nguồn sáng vô tận, hướng nguồn sáng ( ) biến đổi từ bên này qua bên kia của bề mặt hình cầu. .................................................................................................. 43 Hình 2.2. Hai đối tượng được chiếu bởi 1 nguồn sáng ở gần.................................................. 47 Hình 2.3. Hướng pháp tuyến ......................................................................................................... 52 Hình 2.4. Minh họa các liên thông theo 4, 8, 6 láng giềng....................................................... 53 Hình 2.5. Minh họa các điểm được đánh dấu để xóa................................................................ 53 Hình 2.6. Tám lân cận của điểm p1 ............................................................................................. 54 Hình 2.7. Minh họa các điểm được đánh dấu để nối nét đứt................................................... 55 Hình 3.1. Sơ đồ bài toán phát hiện ảnh giả mạo......................................................................... 58
- 8 Hình 3.2 - Ảnh minh họa để xem có giả mạo không................................................................ 59 Hình 3.3 - Ảnh minh họa kết quả xác định hướng ánh sáng trên bức ảnh là khác nhau nên đây là ảnh giả mạo........................................................................................................................... 60 Hình 3.4 – Hình gốc chưa cắt/dán, chỉ có 1 nguồn sáng duy nhất 1250 ................................ 60 Hình 3.5 – Hình gốc chưa cắt/dán, chỉ có 1 nguồn sáng duy nhất 800................................... 61 Hình 3.6 - Minh họa kết quả xác định hướng ánh sáng trên bức ảnh giả mạo có sẵn....... 61
- 9 LỜI NÓI ĐẦU Việc sử dụng hình ảnh kỹ thuật số đang trở nên phổ biến, ảnh hưởng của những thông tin từ những bức ảnh là rất lớn, thông tin hình ảnh luôn có tác động mạnh và trực tiếp tới con người. Do vậy hình ảnh được coi là công cụ biểu diễn và truyền đạt thông tin rất phổ biến và hữu dụng. Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật tiên tiến được ứng dụng vào thực tế và ảnh số là một trong những thành quả đó. Với khả năng của các phần mềm biên tập và xử lý ảnh, các bức ảnh có thể dễ dàng bị sửa chữa và hiệu chỉnh. Các chương trình phần mềm có thể cắt ghép, thêm vào hay bỏ đi các đặc trưng của ảnh mà không để lại dấu vết về sự giả mạo. Người ta tạo những bức ảnh giả mạo có thể nhằm vào nhiều mục đích khác nhau như việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v… Điều đó có nghĩa việc phát hiện ra ảnh giả mạo là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn. Từ yêu cầu thực tế đó, tôi lựa chọn đề tài “Phát hiện ảnh giả mạo dựa trên phân tích nguồn sáng” nhằm nghiên cứu kỹ thuật phát hiện ảnh kỹ thuật số giả mạo được tạo ra bởi sự cắt ghép từ các ảnh khác nhau sẽ có hướng nguồn sáng khác nhau. Bố cục của luận văn được trình bày như sau: Phần mở đầu Chƣơng 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề cập đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh. Khái quát một số phương pháp giả mạo ảnh số thường gặp, đồng thời cũng trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó giúp người đọc có cái nhìn tổng quan về lĩnh vực ảnh số giả mạo. Chƣơng 2: Phát hiện ảnh giả mạo dựa trên phân tích nguồn sáng: Chương này nghiên cứu về các dạng nguồn sáng, từ đó đưa ra phương pháp phát hiện ảnh giả mạo dựa vào nguồn sáng bao gồm ý tưởng, thuật toán. Chƣơng 3: Chƣơng trình thực nghiệm: Tiến hành xây dựng chương trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dựa trên phân tích nguồn sáng. Phần kết luận
- 10 CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO 1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh 1.1.1. Một số khái niệm cơ bản Để có thể xử lý bằng máy tính điện tử thì ảnh cần phải được số hóa. Đó là quá trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấy mẫu và lượng tử hóa. Trong quá trình này người ta sử dụng khái niệm “pixel”. Mỗi pixel được đặc trưng bởi một cặp tọa độ ( X , Y ) và màu sắc của nó. Ảnh và điểm ảnh: Ảnh là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một mảng hai chiều I ( n, p ) có n dòng và p cột, ảnh sẽ có n p (pixel). Ta ký hiệu I ( X ,Y ) để chỉ điểm ảnh có toạ độ ( X , Y ) . Điểm ảnh (pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là 16, 32, 64 mức. Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường sử dụng các phần tử đặc trưng của ảnh là pixel. Một hàm hai biến chứa các thông tin như một biểu diễn ảnh. Một số mô hình thường dùng để biểu diễn ảnh là mô hình toán (biểu diễn ảnh nhờ các hàm cơ sở), mô hình thống kê (ảnh coi như một phần tử của một tập hợp đặc trưng bởi kỳ vọng toán, hiệp biến, phương sai, moment…). Tăng cƣờng ảnh: Đây là một bước quan trọng bao gồm các kỹ thuật lọc độ tương phản, khử nhiễu, nổi màu…. Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng các kỹ thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích Kronecker. Phân tích ảnh: Liên quan tới việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh. Có những kỹ thuật cơ bản để hỗ trợ phân tích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân vùng ảnh
- 11 1.1.2. Một số vấn đề cơ bản trong xử lý ảnh Xử lý ảnh? Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận. Ảnh “tốt Ảnh XỬ LÝ ẢNH hơn" Kết luận Hình 1.1. Quá trình xử lý ảnh Cách biểu diễn ảnh Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm cường độ sáng hai chiều f ( X , Y ) , trong đó X , Y là các giá trị toạ độ không gian và hàm giá trị của f tại một điểm ( X , Y ) bất kỳ sẽ tỷ lệ với độ sáng hay mức xám của điểm ảnh tại điểm này. * P(X,Y) Hình 1.2. Biểu diễn ảnh bằng hàm f ( X , Y ) Trong một số trường hợp hàm ảnh còn được biểu diễn với một trục thứ 3 gọi là hàm cường độ sáng (với hình 1.2, trục thứ 3 bằng 0). Một ảnh số là một ảnh f ( X , Y ) được gián đoạn theo không gian và cường độ sáng. Một ảnh số được xem như một ma trận với hàng và cột biểu diễn một điểm trong ảnh và giá trị điểm ma trận tương ứng với mức xám tại điểm đó. Các phần tử của một dãy số như thế được gọi là các điểm ảnh. Ánh sáng có dạng năng lượng f ( X , Y ) phải khác 0 và hữu hạn: 0 f ( X ,Y ) (1.1)
- 12 Con người có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các vật thể. Cơ sở của f ( X , Y ) được đặc trưng qua hai thành phần: Số lượng ánh sáng nguồn rơi trên cảnh vật được nhìn thấy. Số lượng ánh sáng nguồn phản xạ từ vật thể ( trong cảnh vật). Chúng được gọi gần đúng là sự phát sáng và các thành phần phản xạ, và được biểu diễn tương ứng là i( X , Y ) và r ( X , Y ) . Bản chất của i( X , Y ) được xác định bằng nguồn sáng và của r ( X , Y ) được xác định bằng các đặc trưng của vật thể. Hàm i( X , Y ) và r ( X , Y ) kết hợp với nhau để cho hàm f ( X , Y ) f ( X , Y ) i( X , Y ) r ( X , Y ) (1.2) Với: ( 0 i( X , Y ) 0 r( X ,Y ) 1 ) Ở đây ta gọi cường độ sáng của một ảnh đen trắng tại tọa độ ( X , Y ) là mức xám (l ) của ảnh tại điểm đó. Từ (1.2), (1.3), (1.4) , l nằm trong khoảng: Lmin l Lmax (1.3) Trong lý thuyết, chỉ cần Lmin 0 và Lmax hữu hạn. Trong thực tế: Lmin imin rmin (1.4) Lmax imax rmax Sử dụng các giá trị chiếu sáng và phản xạ đã được tổng kết qua thực nghiệm hoặc xem là các giá trị cơ bản Lmin 0.005, Lmax 100 cho xử lý ảnh. Khoảng Lmin , Lmax được gọi là thang xám. Ta có thể dịch khoảng này đến 0, L , trong đó l 0 là đen và l L là trắng trong thang xám. Giá trị tức thời là các dạng mức xám thay đổi liên tục từ đen đến trắng. Các điểm 4 láng giềng: Giả sử (i,j) là một điểm ảnh, khi đó các điểm 4 – láng giềng là: N4= {(i-1,j); (i+1,j); (i, j-1); (i, j+1)} Các điểm 8 láng giềng: N8 = N4 {(i-1,j-1); (i-1,j+1); (i+1,j-1); (i+1,j+1)}
- 13 Nắn chỉnh biến dạng Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử. Hình 1.3. Ảnh thu nhận và ảnh mong muốn Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được xây dựng trên tập các điểm điều khiển. Giả sử (Pi, Pi’) i= 1, n có n các tập điều khiển Tìm hàm f: Pi → f (Pi) sao cho n P f (P ) P P min i 1 i i ' 2 Giả sử ảnh bị biến đổi chỉ bao gồm : Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất tuyến tính. Khi đó hàm f có dạng: f(x,y) = (a1x + b1y + c1, a2x + b2y + c2) Ta có: n 2 n (f(Pi ) Pi' ) (a1x i b1yi c1 x i' ) 2 (a 2 x i b 2 yi c 2 yi' ) 2 (1.5) i 1 i 1 Để cho →min (1.6)
- 14 Giải hệ phương trình tuyến tính tìm được a1, b1, c1 Tương tự tìm được a2, b2, c2 Xác định được hàm f Kỹ thuật phóng to, thu nhỏ ảnh: Khi ảnh quá lớn chúng ta muốn nhìn toàn bộ ảnh thì chúng ta phải thu nhỏ ảnh lại và ngược lại khi ta muốn xem chi tiết một bộ phận nào đó của ảnh thì ta phải phóng to nó lên. - Kỹ thuật phóng to ảnh: Khi phóng to ảnh với một tỉ lệ k nào đó ta thu được ảnh mới to gấp k lần ảnh cũ (k là độ phóng của ảnh) như thế ảnh mới sẽ có kích thước là: Height = Height * k Width = Width * k Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức: xp=x/k yp=y/k - Kỹ thuật thu nhỏ ảnh: Tương tự như phóng to ảnh, khi thu nhỏ ảnh ta thu được ảnh mới giống ảnh cũ nhưng có kích thước nhỏ hơn ảnh cũ. Kích thước của ảnh mới là: Height = Height / k Width = Width / k Việc tính các điểm ảnh tương ứng của ảnh mới sẽ được tính theo công thức: xp=x*k yp=y*k Nhận dạng ảnh: Quá trình này liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc trưng chủ yếu của đối tượng.
- 15 Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách mơ hồ (vaguely defined) và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể: Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định. Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh. Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây: - Thu nhận dữ liệu và tiền xử lý - Biểu diễn dữ liệu - Nhận dạng, ra quyết định Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: - Đối sánh mẫu dựa trên các đặc trưng được trích chọn. - Phân loại thống kê. - Đối sánh cấu trúc. - Phân loại dựa trên mạng nơ-ron nhân tạo. Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lại (hybrid system) bao gồm nhiều mô hình kết hợp.
- 16 Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu. 1.1.3. Các giai đoạn trong xử lý ảnh Bài toán xử lý ảnh bao gồm các giai đoạn tổng quát như sau: Phân đoạn Biểu diễn Scanner, Camera Nhận dạng và nội suy Tiền xử lý Cơ sở tri thức Thu nhận ảnh Kết quả Hình 1.4. Các bước cơ bản trong xử lý ảnh số 1.1.3.1. Thu nhận ảnh Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này ta cần có bộ thu ảnh và khả năng số hóa những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh,…. Trong trường hợp bộ thu ảnh cung cấp chưa phải là dạng số ta còn phải chuyển đổi hay số hóa ảnh. Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận dạng số hóa của ảnh. Các thông số quan trọng ở bước này là độ phân giải, chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị. Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất nhiều đến công đoạn kế tiếp. 1.1.3.2. Tiền xử lý Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử bóng, khử độ lệch, v.v…. với mục đích làm cho chất lượng ảnh trở nên tốt hơn nữa,
- 17 chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý ảnh. Quá trình này thường được thực hiện bởi các bộ lọc. + Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu ngẫu nhiên. Đặc trưng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể khử nhiễu bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm. đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc trung vị và trung bình. + Chỉnh mức xám: đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh. + Chỉnh tán xạ: ảnh thu nhận được từ các thiết bị quang học hay điện tử có thể bị mờ, nhòe. Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này. 1.1.3.3. Phân đoạn ảnh Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều phần tử khác nhau cấu tạo nên ảnh thô. Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu. 1.1.3.4. Trích chọn đặc trƣng Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt ra những yêu cầu về tốc độ tính toán.
- 18 Đặc điểm chung của tất cả các ứng dụng đó là những đặc điểm đặc trưng cần thiết là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu. Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống. Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây: - Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm uốn,….. - Đặc điểm biến đổi: các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn,v.v…) - Đặc điểm biên và đường biên: đặc trưng cho đường biên của đối tượng là do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. các đặc điểm này có thể là được trích chọn nhờ toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing)…. 1.1.3.5. Nhận dạng Nhận dạng ảnh là quá trình xác định nội dung ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu) từ trước. Đây là bước cuối cùng trong quá trình xử lý ảnh. Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn cho các đối tượng trong ảnh. Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý. Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng và giải thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán tự
- 19 động, được dùng để rút trích ra những thông tin quan trọng từ ảnh. Ví dụ như các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay, v.v…. Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một số thành phần cơ bản sau đây: Màn hình đồ họa Bộ nhớ ảnh Camera Bộ xử lý tương tự Bộ nhớ ngoài Máy chủ Bộ xử lý ảnh số Màn hình Bàn phím Máy in Hình 1.5. Các thành phần cơ bản của một hệ xử lý ảnh Bộ xử lý tương tự thực hiện các chức năng: - Chọn Camera thích hợp nếu có nhiều Camera - Chọn màn hình hiển thị tín hiệu - Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa - Tiền xử lý ảnh khi thu nhận Bộ xử lý ảnh số bao gồm nhiều bộ xử lý chuyên dụng: Xử lý lọc, trích chọn đặc trưng, nhị phân hóa ảnh. Máy chủ đóng vai trò điều khiển các thành phần khác. Bộ nhớ ngoài: Lưu trữ dữ liệu ảnh cũng như các kiểu dữ liệu khác để có thể chuyển giao cho các quá trình có nhu cầu. 1.1.4. Biên và vai trò của biên trong nhận dạng 1.1.4.1. Biên và các kiểu biên cơ bản trong ảnh
- 20 Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ xám, phân bố xác suất, phân bố không gian, biên ảnh [1]. Biên là một vấn đề chủ yếu và đặc biệt quan trọng trong phân tích ảnh vì các kĩ thuật phân đoạn ảnh chủ yếu dựa vào biên. Hiện nay có nhiều định nghĩa về biên ảnh [1] và mỗi định nghĩa được sử dụng trong một số trường hợp nhất định. Song nhìn chung, ta có thể hiểu là: một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám. Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh. Tập hợp các điểm biên tạo thành biên, hay còn gọi là đường bao của ảnh (boundary). Chẳng hạn, trong một ảnh nhị phân, một điểm có thể được gọi là biên nếu đây là một điểm đen và có ít nhất một điểm trắng nằm trong lân cận điểm đó. Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính toán từ những điểm lân cận nó. Đó là một biến Vector bao gồm hai thành phần: - Độ lớn của Gadient. - Hướng φ được xoay đối với hướng Gradient ψ. 1.1.4.1.1. Biên lý tƣởng Việc phát hiện biên một cách lý tưởng là việc xác định được tất cả các đường bao trong đối tượng. Biên là sự thay đổi đột ngột về mức xám nên sự thay đổi cấp xám giữa các vùng trong ảnh càng lớn thì càng dễ dàng nhận ra biên. Hình sau đây minh hoạ điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột: Hình 1.6. Đường biên lý tưởng
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Luận văn Thạc sĩ công nghệ thông tin: Ứng dụng mạng Nơron trong bài toán xác định lộ trình cho Robot
88 p | 707 | 147
-
Luận văn thạc sĩ Công nghệ Sinh học: Nghiên cứu mối quan hệ di truyền của một số giống ngô (Zea maysL.) bằng chỉ thị RAPD
89 p | 294 | 73
-
Luận văn thạc sĩ Công nghệ Sinh học: Nghiên cứu ảnh hưởng bổ sung tế bào và hormone lên sự phát triển của phôi lợn thụ tinh ống nghiệm
67 p | 278 | 50
-
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu phương pháp quản trị rủi ro hướng mục tiêu và thử nghiệm ứng dụng trong xây dựng cổng thông tin điện tử Bộ GTVT
75 p | 50 | 8
-
Luận văn Thạc sĩ Công nghệ thông tin: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
72 p | 62 | 8
-
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu và đề xuất giải pháp xây dựng cơ sở tri thức liên quan thông tin thư viện số
118 p | 42 | 7
-
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu mô hình kiểm soát truy xuất cho dữ liệu lớn
106 p | 43 | 6
-
Luận văn Thạc sĩ Công nghệ thông tin: Ứng dụng Gis phục vụ công tác quản lý cầu tại TP. Hồ Chí Minh
96 p | 46 | 5
-
Luận văn Thạc sĩ Công nghệ thông tin: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
69 p | 48 | 5
-
Luận văn Thạc sĩ Công nghệ thông tin: Ứng dụng bộ lọc Kalman xử lý nhiễu tín hiệu cảm biến lực trong thiết bị kéo cột sống tự động
90 p | 20 | 4
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác tập mục lợi ích cao bảo toàn tính riêng tư
65 p | 47 | 4
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu được cập nhật
60 p | 49 | 4
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác mẫu tuần tự nén
59 p | 31 | 4
-
Luận văn Thạc sĩ Công nghệ thông tin: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
70 p | 41 | 4
-
Luận văn Thạc sĩ Công nghệ thông tin: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
69 p | 21 | 4
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác Top-rank K cho tập đánh trọng trên cơ sở dữ liệu có trọng số
64 p | 48 | 4
-
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Tự động phân tích các nội dung giống nhau trong hệ thống tổng hợp ý kiến góp ý trong hội nghị
26 p | 72 | 3
-
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu và ứng dụng Hadoop để khai thác tập phổ biến
114 p | 51 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn