intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Khoa học: Nghiên cứu hệ thống kiểm tra chiết rót chai tự động

Chia sẻ: Sơ Dương | Ngày: | Loại File: PDF | Số trang:67

13
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Đề tài "Nghiên cứu hệ thống kiểm tra chiết rót chai tự động" nghiên cứu về các thuật toán xử lý ảnh nói cung để đưa ra một phương án tối ưu nhất trong hệ thống đảm bảo được tính chính xác của hệ thống và cải thiện được thời gian nhận diện các lỗi của sản phẩm. Nghiên cứu đó kết hợp với các thuật toán trong DeepLearning để phát hiện hệ thống trong tương lai.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học: Nghiên cứu hệ thống kiểm tra chiết rót chai tự động

  1. TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu hệ thống kiểm tra chiết rót chai tự động TRẦN THIÊN NAM thiennam.tran2009@gmail.com Chuyên ngành Kỹ thuật Cơ Điện Tử Giảng viên hướng dẫn: GVCC. TS. Nguyễn Trọng Doanh Chữ ký của GVHD Bộ môn: Cơ Điện Tử Viện: Cơ Khí HÀ NỘI, 3/2020 1
  2. ĐỀ TÀI LUẬN VĂN Đề tài tên tiếng Việt “Nghiên cứu hệ thống kiểm tra chiết rót chai tự động”. Đề tài tên tiếng Anh “Research of automatic vision system for bottle filling inspection”. Giáo viên hướng dẫn: GVCC.TS. Nguyễn Trọng Doanh Giáo viên hướng dẫn Ký và ghi rõ họ tên 2
  3. LỜI CẢM ƠN Đầu tiên em xin chân thành cảm ơn GVCC.TS. Nguyễn Trọng Doanh và TS. Hoàng Hồng Hải – người đã trực tiếp hướng dẫn và định hướng giúp em có thể nhanh chóng tiếp cận, nắm bắt kiến thức và hoàn thành đề tài luận văn. Em xin gửi lời cảm ơn tới toàn thể thầy cô giáo khoa bộ môn Cơ điện tử – Viện Cơ khí trường Đại học Bách Khoa – Hà Nội, đã tận tình giảng dạy trang bị cho em những kiến thức quý báu trong những năm học vừa qua. Mặc dù em đã cố gắng hoàn thành tốt đề tài nhưng cũng không thể tránh khỏi những sai sót nhất định, rất mong nhận được đóng góp ý kiến của thầy cô giáo và các bạn. TÓM TẮT NỘI DUNG LUẬN VĂN Nội dung nghiên cứu: Nghiên cứu sơ lược về hệ thống kiểm tra chiết rót chai tự động Nghiên cứu tổng quan về hệ thống xử lý ảnh Nghiên cứu về các kĩ thuật thuật toán nhận dạng và phát hiện đối tượng Nghiên cứu về mô hình YOLO trong bài toán nhận dạng đối tượng Nghiên cứu và tối ưu hóa thuật toán phát hiện và nhận dạng lỗi chai Kết quả nghiên cứu: Bằng phương pháp kết hợp sử dụng mạng nơ-ron (YOLO) và phương pháp tìm biên cạnh truyền thống, thuật toán phát hiện lỗi đạt được hai mục tiêu chính: nâng cao độ chính xác và khả năng kiểm tra trực tuyến đảm bảo tính ổn đinh và tiết kiệm thời gian xử lý của hệ thống. Một hệ thống kiểm tra trên chai Cocacola được thực nghiệm. Kết quả thực nghiệm thu được chỉ ra với thuật toán phát triển độ chính xác có thể đạt được 95% và có thể được ứng dụng trong sản xuất tự động. Giáo viên hướng dẫn Học viên Ký và ghi rõ họ tên Ký và ghi rõ họ tên 3
  4. MỤC LỤC ĐỀ TÀI LUẬN VĂN 2 LỜI CẢM ƠN 3 TÓM TẮT NỘI DUNG LUẬN VĂN 3 MỤC LỤC 4 DANH MỤC HÌNH VẼ 6 DANH MỤC BẢNG 8 CHƯƠNG 1. MỞ ĐẦU 9 1.1 Đặt vấn đề 9 1.2 Tính cấp thiết của đề tài 9 1.3 Mục tiêu đề tài 9 1.4 Nội dung của luận văn 10 CHƯƠNG 2. TỔNG QUAN VỀ XỬ LÝ ẢNH 11 2.1 Cơ bản về xử lý ảnh 11 2.2 Các kĩ thuật lọc nhiễu trong ảnh 12 2.2.1 Nguyên tắc chung của lọc ảnh 12 2.2.2 Một số bộ lọc làm mịn ảnh:13 2.3 Các kĩ thuật dò cạnh 17 2.3.1 Khái quát về dò cạnh 17 2.3.2 Các phương pháp dò cạnh 17 2.4 Kĩ thuật hình thái học (Morphological technique) 21 CHƯƠNG 3. MỘT SỐ KĨ THUẬT THUẬT TOÁN PHÁT HIỆN VÀ NHẬN DẠNG ĐỐI TƯỢNG 25 3.1 Tổng quát chung khái niệm nhận dạng đối tượng 25 3.2 Các thuật toán chính để phát hiện và nhận dạng đối tượng 26 3.2.1 Lớp các mô hình họ R-CNN 26 3.2.2 Lớp các mô hình họ YOLO31 3.2.3 SSD máy dò Multi-Box 32 CHƯƠNG 4. MÔ HÌNH YOLO TRONG BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG 34 4.1 Giới thiệu khái quát thuật toán 34 4.2 Tổng quát mô hình của thuật toán 35 4.2.1 Grid System 35 4.2.2 CNN cho YOLO object detection: 37 4.2.3 Hàm lỗi Loss Function: 38 a, Classification Loss 38 b, Localization Loss: 39 4
  5. c, Confidence Loss: 40 4.2.4 Dự đoán lớp và tọa độ boundary box sau quá trình training 40 CHƯƠNG 5. THUẬT TOÁN NHẬN DẠNG LỖI CHAI 43 5.1 Cấu trúc phần cứng của hệ thống: 43 5.1.1 Tổng quan hệ thống 43 5.1.2 Hệ xử lý ảnh trong hệ thống 44 5.2 Xây dựng thuật toán phân loại chai coca 46 5.2.1 Phương pháp 1: (Sử thuật thuật toán Template Matching) 47 5.2.2 Phương pháp 2: Thuật toán sử dụng Edge Detection (tìm biên cạnh)……… 52 5.2.3 Phương pháp 3 được đề xuất trong bài toàn của luận văn (kết hợp giữa thuật toán YOLO trong neural network và edge detection sử dụng trong phương pháp 2) 56 5.3 Phân tích kết quả đã đạt được của phương pháp đề xuất 62 CHƯƠNG 6. KẾT LUẬN CHUNG VÀ HƯỚNG PHÁT TRIỂN CỦA LUẬN VĂN 66 6.1 Kết luận chung 66 6.2 Hướng phát triển của luận văn 66 5
  6. DANH MỤC HÌNH VẼ Hình 2.1 Các giai đoạn của một quá trình xử lý ảnh 11 Hình 2.2 Quy tắc nhân chập ma trận lọc kernel 13 Hình 2.3 Kết quả sau khi lọc trung bình [8] 14 Hình 2.4 Sơ đồ phân phối Gauss [8] 15 Hình 2.5 Kết quả sau khi lọc Gauss [8] 16 Hình 2.6 Kết quả sau khi lọc trung vị [8]17 Hình 2.7 Lọc biên theo phương pháp Robert Cross [8] 18 Hình 2.8 Lọc biên theo phương pháp [8] 19 Hình 2.9 Lọc biên theo phương pháp Canny 21 Hình 2.10 Quá trình chập trong phép toán Giãn nở 23 Hình 2.11 Quá trình chập trong phép toán co 24 Hình 3.1 Sơ đồ tổng hợp các tác vụ Vision [9] 26 Hình 3.2 Quá trình phát triện của thuật toán phát hiện và nhận dạng đối tượng [9] 26 Hình 3.3 Kiến trúc mô hình R-CNN [9] 27 Hình 3.4 Kiến trúc mô hình Fast R-CNN [9] 28 Hình 3.5 Kiến trúc single model Fast R-CNN [9] 29 Hình 3.6 Kiến trúc mô hình Faster R-CNN [9] 30 Hình 3.7: Các kích thước tỉ lệ của mô hình [9] 31 Hình 3.8 Quá trình nhận dạng đối tượng mô hình họ YOLO [9] 31 Hình 3.9 Cấu trúc mạng của SSD [9] 33 Hình 4.1 Kết quả nhận dạng các đối tượng trong khung hình 34 Hình 4.2 Xác định tâm của bounding box thuộc đối tượng 36 Hình 4.3 Dự đoán độ lệch của 2 box chứa object 37 Hình 4.4 Quá trình hoạt động của mô hình CNN với đối tượng đã cho [7] 38 Hình 4.5 Dự đoán box của đối tượng [7] 39 Hình 4.6 Một ví dụ về phát hiện biển báo Stop từ hình ảnh [7] 41 Hình 4.7 Công thức tính tỉ lệ IoU [7] 41 Hình 4.8 Các đánh giá tỉ lệ IoU [7] 42 Hình 5.1 Hệ thống cấu trúc phần cứng 43 Hình 5.2 Sơ đồ các phần cấu trúc chính của hệ thống nhận dạng 43 Hình 5.3 Camera Basler 44 Hình 5.4 Vùng làm việc Field of View 45 Hình 5.5 Các thông số hoạt động của Camera trong hệ thống 46 Hình 5.6 Sơ đồ thuật toán của phương pháp Template Matching 49 Hình 5.7 (a) Ảnh mẫu thu được (b) Ảnh nhị phân (c) Ảnh lấy phần bù (d) Ảnh sau lọc nhiễu 50 6
  7. Hình 5.8 (a) Ảnh thu được bị thiếu (thiếu nắp) (b) Ảnh nhị phân (c) Ảnh lấy phần bù (d) Ảnh sau lọc nhiễu 51 Hình 5.9 (a) Ảnh thu dược bị thiếu ( thiếu tamper) (b) Ảnh nhị phân (c) Ảnh lấy phần bù (d) Ảnh sau lọc nhiễu 51 Hình 5.10 (a) Ảnh thu được bị thiếu (Nắp và phần tem bị tách khỏi nhau) (b) Ảnh nhị phân (c) Ảnh lấy phần bù (d) Ảnh sau lọc nhiễu 51 Hình 5.11: Ảnh thu nhận bị từ chối do lỗi 51 Hình 5.12 Sơ đồ thuật toán Edge Detection 52 Hình 5.13 Kết quả chương trình báo đạt khi nhận diện thành công nắp chai và mực nước 54 Hình 5.14 Kết quả chương trình báo lỗi nhận được nắp chai nhưng mực nước không chính xác 54 Hình 5.15 Kết quả chương trình báo lỗi khi không tồn tại nắp chai và mực nước không chính xác 55 Hình 5.16 Kết quả chương trình báo lỗi khi nắp chai bị lắp lệch và mực nước không chính xác 55 Hình 5.17 Sơ đồ thuật toán được sử dụng trong luận văn 56 Hình 5.18 Kết quả kiểm tra chai coca lần 1 (Chai 1 chính xác, Chai 2 thiếu nắp) 58 Hình 5.19 Kết quả kiểm tra chai coca lần 2 (Chai 1 chính xác, Chai 2 thiếu nhãn dán) 58 Hình 5.20 Vùng roi cắt từ bbox chai 59 Hình 5.21 Ảnh sau khi cắt ROI chưa dùng Filter 59 Hình 5.22 Ảnh sau khi cắt ROI dùng Median Filer 59 Hình 5.23 Chai sau khi sử dụng bộ lọc Canny (chưa điều chỉnh Threshold) 60 Hình 5.24 Chai sau khi sử dụng bộ lọc Canny (đã điều chỉnh Threshold) 60 Hình 5.25 Đường thẳng tìm được 61 Hình 5.26 Kết quả hai đường mực nước và đường chuẩn 61 Hình 5.27 Chương trình GUI hoàn thiện hoạt động trong thực tế 62 Hình 5.28 Biểu đồ kết quả thực nghiệm đo liên tiếp các chai trên dây chuyền sản xuất mô phỏng 63 Hình 5.29 Biểu đồ kết quả đo thực nghiệm đo 1 chai 10 lần 64 7
  8. DANH MỤC BẢNG Bảng 5.1 Nhận xét đưa ra kết luận chung của hai Phương pháp 1 và 2 56 Bảng 5.2 Kết quả thực nghiệm đo liên tiếp các chai trên dây chuyền sản xuất mô phỏng 63 Bảng 5.3 Kết quả thực nghiệm đo 1 chai lần lượt 10 lần 64 Bảng 5.4 Đưa ra kết luận chung và so sánh giữa ba phương pháp 65 8
  9. MỞ ĐẦU Đặt vấn đề Các dây chuyền công nghệ sản xuất hiện đại hiện nay gần như là hoàn toàn tự động hoặc bán tự động. Đặc biệt với các ngành nghề đòi hỏi độ chính xác cao và khử trùng tuyệt đối thì việc tham gia 100% của máy móc trong quá trình sản xuất sẽ đáp ứng được các tiêu chí về yêu cầu công nghệ. Trong đó có ngành sản xuất nước ngọt đóng chai với đặc thù được sản xuất trên dây chuyền khép kín, đảm bảo vệ sinh. Với các công nghệ cân đo định lường kiểm tra chính xác, khâu đóng gói, chiết rót chai, thùng thành phẩm đảm bảo khử trùng. Một hệ thống sản xuất các chất lỏng đóng chai thường được phân chia thành nhiều khâu nối tiếp nhau. Trong đó khâu kiểm tra chất lượng của chai sau quá trình chiết rót là một quy trình rất quan trọng của hệ thống. Chính vì vậy trong luận văn này, ta sẽ đi vào nghiên cứu về các giải pháp kiểm tra của hệ thống mà xử lý ảnh sẽ là một công cụ quan trọng để hướng đến các nhiệm vụ phân tích và nhận dạng các lỗi của hệ thống. Tính cấp thiết của đề tài Xử lý ảnh là một lĩnh vực khoa học đã xuất hiện từ lâu và được ứng dụng nhiều trong y học, khoa học vũ trụ và dự báo thời tiết. Ngày nay, sự phát triển của kỹ thuật điện tử đã cho ra đời nhiều loại camera và cảm biến hình ảnh có độ phân giải cao và tốc độ lấy ảnh nhanh, với giá cả phù hợp tùy hãng sản xuất và tùy mức độ thông minh của thiết bị, chất lượng hình ảnh. Từ đó đã cho phép xử lý ảnh được ứng dụng nhiều hơn vào công nghiệp, nhất là trong lĩnh vực quản lý chất lượng, nhận dạng lỗi sản phẩm và phân loại sản phẩm dựa vào các đặc tính có thể nhận dạng được bằng mắt thường và những đặc điểm bề ngoài không thể nhận dạng bằng mắt thường. Với những đặc tính không thể nhận dạng bằng mắt thường do đặc điểm cần nhận dạng quá nhỏ hoặc hình dạng quá phức tạp, hoặc yêu cầu nhận diện nhiều vị trí ở cùng một thời điểm, xử lý ảnh là một công cụ vô cùng hiệu quả với độ chính xác và độ tin cậy cao. Thực tế, ở Việt Nam hiện nay, xử lý ảnh trong công nghiệp vẫn còn là một lĩnh vực khá mới mẻ và đang trên đà phát triển. Do đó, việc nghiên cứu, khai thác các ứng dụng của xử lý ảnh sẽ mở ra nhiều cơ hội cho việc nghiên cứu và phát triển các hệ thống mới. Các vấn đề tự động hóa trong điều khiển và giám sát các thiết bị nói chung là một trong những giải pháp hàng đầu trong sự nghiệp công nghiệp hóa và hiện đại hóa ở Việt Nam hiện nay. Do đó, luận văn này đưa ra một mô hình điều khiển hệ thống nhận dạng và phân loại chai bị lỗi trong dây chuyền sản xuất cocacola bằng phần xử lý ảnh sử dụng công nghệ học sâu mạng nơron để đáp ứng yêu cầu điều khiển thực tế nêu trên. Mục tiêu đề tài 9
  10. Trong phạm vi của luận văn, tôi sẽ nghiên cứu về các thuật toán xử lý ảnh nói cung để đưa ra một phương án tối ưu nhất trong hệ thống đảm bảo được tính chính xác của hệ thống và cải thiện được thời gian nhận diện các lỗi của sản phẩm. Nghiên cứu đó kết hợp với các thuật toán trong DeepLearning để phát hiện hệ thống trong tương lai. Nội dung của luận văn Nội dung luận văn gồm 6 chương: Chương 1: Mở đầu Chương 2: Tổng quan về xử lý ảnh Chương 3: Một số kĩ thuật thuật toán phát hiện và nhận dạng đối tượng Chương 4: Mô hình YOLO trong bài toán nhận dạng đối tượng Chương 5: Thuật toán nhận dạng lỗi chai Chương 6: Kết luận chung và hướng phát triển của luận văn 10
  11. TỔNG QUAN VỀ XỬ LÝ ẢNH Cơ bản về xử lý ảnh Các giai đoạn của một quá trình xử lý ảnh Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh trong nghiên cứu, các bước cần thiết trong xử lý ảnh được xem xét như sau. Thu nhận Tách các Xử lý trước Phân đoạn Phân loại ảnh đặc tính Hình 2.1 Các giai đoạn của một quá trình xử lý ảnh Thu nhận ảnh Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng hay ảnh, tranh được quét trên scanner. Sau đó được lưu trữ trong máy tính. Gồm có 2 quá trình: - Biến đổi năng lượng quang học sang năng lượng điện - Biến đổi năng lượng điện sang các ma trận. Xử lí trước Quá trình xử lí trước thực ra bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc (trạng thái trước khi ảnh bị biến dạng). Nhằm các mục đích phục vụ cho các bước tiếp theo. Những mục đích riêng biệt có thể đặt ra cho quá trình xử lý trước là: + Thực hiện điều chỉnh độ chiếu sáng để khắc phục hậu quả của sự chiếu sáng không đồng đều. + Giảm nhỏ thành phần nhiễu. + Cải thiện độ tương phản của ảnh màu do khuôn màu không tốt. + Hiệu chỉnh độ méo giá trị xám + Loại bỏ tính không đồng thể của ảnh gây nên từ tính không đồng bộ của lớp nhạy quang của hệ thống thu nhận ảnh. + Chuẩn hóa độ lớn, dạng và màu. + Điều chỉnh bộ lọc để khuyếch đại các tần số với những thông tin quan trọng được khuyếch đại và nén đi các tần số khác. 11
  12. Phân đoạn Là quá trình phân chia các đối tượng cần khảo sát ra khỏi phần nội dung còn lại của ảnh, phân tách các đối tượng tiếp giáp nhau và phân tách những đối tượng riêng biệt thành những đối tượng con. Một phương pháp phân đoạn ảnh là sử dụng một ngưỡng giá trị xám để phân tách ảnh thành đối tượng và nền (những điểm dưới ngưỡng xám thuộc về nền, ngược lại thuộc về đối tượng). Tách ra các đặc tính Dựa trên các thông tin thu nhận được qua quá trình phân đoạn, kết hợp với các kỹ thuật xử lý để đưa ra các đặc trưng, đối tượng ảnh cũng như các thông tin cần thiết trong quá trình xử lý. Nhờ các đặc tính có được từ ảnh ta có thể phân loại các đối tượng khác nhau của ảnh. Phân loại ảnh Thực hiện công việc sắp xếp một đối tượng vào một lớp đối tượng cho trước. Để giải quyết bài toán này thì các đặc tính có ý nghĩa phải được lựa chọn. Ta tìm thấy các đặc tính có ý nghĩa khi ta phân tích các mẫu được lựa chọn từ những đối tượng khác nhau. Các kĩ thuật lọc nhiễu trong ảnh Nguyên tắc chung của lọc ảnh Nguyên tắc chung của các phương pháp lọc là cho ma trận ảnh nhân với một ma trận lọc (Kernel). Trong đó ma trận lọc lọc (Kernel) còn có thể được gọi là cửa số chập (trong phép nhân chập), cửa sổ lọc, mặt nạ…. Việc nhân ảnh với ma trận lọc giống như việc trượt ma trận lọc theo hàng trên ảnh và nhân với từng vùng của ảnh, cộng các kết quả lại tạo thành kết quả của điểm ảnh trung tâm. 12
  13. Hình 2.2 Quy tắc nhân chập ma trận lọc kernel Ma trận đầu vào I được nhân với ma trận lọc (phần xám ở hình trái) để tạo thành ma trận đầu ra O. Trên thực tế, hai phép lọc ảnh là tương quan (correlation) và tích chập (convolution). Với phép tương quan, ma trận lọc sẽ được trượt đi và nhân với từng vùng của ảnh như trên. Tuy nhiên với phép tích chập, ma trận lọc sẽ được xoay 180 độ (theo cả chiều ngang và dọc) trước khi thực hiện nhân. 2 phép toán này là tương đương khi ma trận lọc đối xứng. Với mỗi phép lọc ta có những ma trận lọc (Kernel) khác nhau, không có một quy định cụ thể nào cho việc xác định M. Kích thước ma trận M là một số lẻ. Ví dụ: 3x3, 5x5. Khi nhân các phần tử tương ứng với nhau (giữa pixel, các điểm lân cận – các thành phần trong kernel), đối với các phần tử ở cạnh thì sẽ có một số pixel bị khuyết, lúc này, có nhiều cách giải quyết như bỏ qua, chèn thêm một (một số) hàng, cột mang giá trị 0 hoặc bằng giá trị gần nhất, hoặc tạo một đối xứng gương ở cạnh ảnh. Một số bộ lọc làm mịn ảnh: a, Lọc trung bình (Normanlize Box Filter): Đây là bộ lọc đơn giản nhất. Nó được xây dựng dựa trên ý tưởng tính giá trị một điểm ảnh bằng trung bình cộng các điểm ảnh xung quanh nó. Ma trận lọc của lọc trung bình có dạng: 1 1 1 ... 1  1 1 1 ... 1  1   K = K _width .K_height . . . ... 1    1 1 1 ... 1  (2.1) Cách lọc này thường được áp dụng cho làm trơn ảnh vẫn muốn giữ lại biên không bị mờ. 13
  14. Hình 2.3 Kết quả sau khi lọc trung bình [8] Ưu điểm: +Đơn giản trong tính toán +Ảnh đạt độ trơn mịn Khuyết điểm: +Không hoàn toàn loại bỏ được nhiễu, các pixel đơn lẻ (nhiễu sẽ ảnh hướng đến giá trị trung bình của các pixel lân cận. +Độ sắc nét của ảnh kém +Độ tương phản thấp b, Lọc Gauss (Gaussian Filter): Bộ lọc Gauss được cho là bộ lọc hữu ích nhất, được thực hiện bằng cách nhân chập ảnh đầu vào với một ma trận lọc Gauss sau đó cộng chúng lại để tạo thành ảnh đầu ra. Ý tưởng chung là giá trị mỗi điểm ảnh sẽ phụ thuộc nhiều vào các điểm ảnh ở gần hơn là các điểm ảnh ở xa. Trọng số của sự phụ thuộc được lấy theo hàm Gauss (cũng được sử dụng trong quy luật phân phối chuẩn). 14
  15. Hình 2.4 Sơ đồ phân phối Gauss [8] Giả sử ảnh là một chiều. Điểm ảnh ở trung tâm sẽ có trọng số lớn nhất. Các điểm ảnh ở càng xa trung tâm sẽ có trọng số giảm dần khi khoảng cách từ chúng tới điểm trung tâm tăng lên. Như vậy điểm càng gần trung tâm sẽ càng đóng góp nhiều hơn vào giá trị điểm trung tâm. Trên thực tế, việc lọc ảnh dựa trên hàm Gauss 2 chiều (ngang và dọc). Phân phối chuẩn 2 chiều có thể biểu diễn dưới dạng: 2 −( x − µ _ x ) 2 − ( y − µ _y ) + 2σ 2 _ x 2σ 2y G _ 0( x, y) = Ae (2.2) Trong đó μ là trung bình (đỉnh), σ2 là phương sai của các biến số x và y Tham số μ quyết định tác dụng của bộ lọc Gauss lên ảnh. Độ lớn của ma trận lọc (kernel) cần được lựa chọn cho đủ rộng. 15
  16. Hình 2.5 Kết quả sau khi lọc Gauss [8] c, Lọc trung vị (Median Filter): Phép lọc trung vị cũng được thực hiện với các ma trận lọc. Tuy nhiên nó tính trung vị tất cả các giá trị điểm ảnh trong vùng ma trận lọc và sử dụng trung vị này cho giá trị điểm trung tâm. Một điều khá thú vị là với các cách lọc ở trên, giá trị điểm trung tâm được tính mới (có thể bằng hoặc khác với giá trị một điểm trong vùng ma trận lọc), còn với phép lọc trung vị, giá trị điểm trung tâm luôn được thay bằng một giá trị điểm ảnh trong bức ảnh đầu vào. Do vậy, phương pháp lọc này có khả năng loại bỏ nhiễu muối tiêu (salt-and-pepper noise) khá tốt. Có một điểm cũng cần được chú ý là phép lọc trung bình và lọc Gauss là phép lọc tuyến tính, nhưng phép lọc trung vị không phải là một phép lọc tuyến tính. 16
  17. Hình 2.6 Kết quả sau khi lọc trung vị [8] Các kĩ thuật dò cạnh Khái quát về dò cạnh Các cạnh là những vùng ảnh mà có độ tương phản cao. Vì thế các cạnh thường xuyên xuất hiện tại những vị trí được thấy như là những đường bao quanh vật trên hình ảnh, xác định cạnh thường được dùng phổ biến trên những hình ảnh có nhiều vật thể khác nhau khi ta muốn chia hình ảnh thành những vùng khác nhau có chứa vật thể. Biểu diễn một hình ảnh bằng các cạnh thì có nhiều thuận lợi hơn là làm giảm được dữ liệu ảnh trong khi vẫn đảm bảo giữ được những thông tin về vật thể trên ảnh. Các cạnh chủ yếu có tần số cao nên theo lý thuyết, dò cạnh sử dụng lọc tần số cao bằng phương pháp Fourier hay bằng cách nhân chập hình ảnh với những Kernel thích hợp trong miền không gian Fourier. Trên thực tế, dò cạnh được thực hiện trong miền không gian vì thực hiện dễ dàng hơn và thường cho ra kết quả tốt hơn. Cách xác định cạnh: vì các cạnh tương ứng với sự chiếu sáng mạnh, từ đó có thể làm nổi bật lên bằng cách tính toán đạo hàm của hình ảnh. Có thể thấy rằng vị trí của cạnh có thể được ước lượng với giá trị lớn nhất của đạo hàm bậc nhất hay với điểm uốn của đạo hàm bậc 2. Vì thế sẽ tìm một kĩ thuật để tính toán đạo hàm của một hình ảnh 2 chiều. Những Kernel dùng cho việc xác định cạnh được tính dựa theo công thức trên cho phép tính toán đạo hàm bậc một và bậc hai của một hình ảnh 2 chiều. Có 2 tiến trình chung tính đạo hàm bậc một trong một hình ảnh hai chiều, dò cạnh Pretwitt compass và dò cạnh gradient. Các phương pháp dò cạnh a, Phương pháp Robert Cross: 17
  18. Theo Roberts, để xác định cạnh ta cần dựa vào các tính chất sau: cạnh được tạo ra cần được xác định rõ, nền của ảnh có ít nhiễu và cường độ của cạnh được xác định bằng mắt thường. Với những đặc tính đó, Roberts đưa ra phương trình sau: ,= ,   ,=   , ,  + , ,  (2.3) . Với x là cường độ sáng ban đầu của ảnh, z là đạo hàm tính được và i, j là tọa độ của điểm ảnh. Kết quả tính được sẽ thay đổi cường độ sáng theo đường chéo. Phương pháp này đơn giản, nhân kernel nhỏ và chỉ chứa giá trị nguyên, tuy nhiên, phương pháp này nhạy cảm với nhiễu Để dò cạnh sử dụng phương pháp Robert Cross, ta nhân ma trận ảnh gốc với 2 nhân kernel: 1 0  0 1   −  −  0 1 và 1 0  Đặt (, ) là điểm ảnh gốc và (, ) là điểm ảnh được thu được khi nhân ma trận ảnh với nhân kernel 1, (, ) là điểm ảnh thu được khi nhân ma trận ảnh với nhân kernel 2. Gradient có thể được xác định bằng công thức: ( , ) = (, ) =  +   (2.4) Hướng của gradient được xác định theo công thức:  ( ,)   , ) =  (     (2.5)  ( ,)  Hình 2.7 Lọc biên theo phương pháp Robert Cross [8] b, Phương pháp Sobel: Sobel đưa ra ý tưởng nhân ảnh với ma trận đẳng hướng 3x3 dùng để tính xấp xỉ sự thay đổi giá trị của hàm tính cường độ sáng. ở từng điểm ảnh, kết quả của phương pháp Sobel gồm có hướng và độ lớn của vector. Phương pháp này dựa vào việc nhân ma trận ảnh với từng ma trận chỉ hướng dó đó không yêu cầu hiệu năng tính 18
  19. toán cào. Mặt khác, tính toán xấp xỉ hướng đưa ra kết quả thô, đặc biệt là với những ảnh có sự thay đổi cường độ ánh sáng mạnh. Phương pháp này sử dụng ma trận 3x3 nhân với ma trận ảnh gốc để tính toán xấp xỉ sự thay đổi theo phương ngang hoặc phương dọc. Ta coi A là ảnh gốc, Gx và Gy là ảnh sau khi nhân từng điểm ảnh với các phép tính xấp xỉ theo chiều ngang và dọc tương ứng. 1 0 −1  1 2 1  2 0 −2  0 0 0      Gx = 1 0  −1   *A và Gy =  1 2 1   *A Nhân kernel của Sobel có thể được tách thành tích của phép nhân trung bình và nhân xấp xỉ.  có thể được viết lại như sau: 1 0 −1   −2  2 0  1 0  −1  = [1 2 1] [1 0 -1] Tại mỗi điểm ảnh, kết quả tính gradient xấp xĩ có thể được kết hợp để tính giá trị gradient sử dụng công thức:  =  +  (2.6) Từ đó, ta tính được hướng của gradient:   = (2.7)  Với công thức này, khi  = 0 thì phía bên phải của cạnh dọc sẽ sáng hơn phía bên trái. Hình 2.8 Lọc biên theo phương pháp [8] c, Phương pháp Canny: Phương pháp dò cạnh Canny là kĩ thuật tách dữ liệu cấu trúc từ ảnh và giảm lượng dữ liệu cần xử lí. Nó được sử dụng rộng rãi trong nhiều hệ thống thị giác máy tính. Với những hệ thống khác thị giác máy tính khác nhau, việc áp dụng phương pháp này không có nhiều khác biệt. Do đó, phương pháp dò cạnh này có thể giải quyết được nhiều lĩnh vực khác nhau. Phương pháp dò cạnh này có một vài đặc tính sau: Xác định cạnh với sai số thấp, tức là xác định hết tất cả các cạnh có trong ảnh 19
  20. Điểm ảnh thuộc cạnh dò được sẽ nằm ở trung tâm của cạnh. Cạnh của ảnh sẽ chỉ được đánh dấu một lần và nhiễu trong ảnh sẽ không được xác định là cạnh. Thuật toán dò cạnh Canny được chia thành 5 bước sau: Dùng lọc Gaussian làm mịn ảnh để loại bỏ nhiễu Kết quả dò cạnh rất nhạy với nhiễu, do đó việc lọc nhiễu của ảnh là cần thiết để tránh sự xác định nhầm. Lọc Gaussian được dùng để làm mịn ảnh nhằm làm giảm ảnh hướng của nhiễu lên việc dò cạnh. Dưới đây là phép nhân làm mờ: 2 4 5 4 2  4 9 12 9 4  1   5 12 15 12 5  159   4 9 12 9 4   2 4 5 4 2   B= *A (2.8) Tìm hướng cường độ sáng của ảnh Cạnh trong ảnh có thể chỉ bất kì hướng nào, dó đó thuật toán Canny sử dụng 4 ma trận lọc để xác định hướng ngang, dọc và chéo của ảnh sau khi làm mờ. Từ gradient của cạnh tìm được ta có thể xác định hướng và độ lớn: = +   =  ,  2  (2.9) Với G có thể tính bằng cách sử dụng hàm hypot và atan2 là hàm artangent. Góc chỉ hướng của cạnh được làm tròn thành 4 giá trị: 0o, 45o, 90o hoặc 135o. Áp dụng giá trị lớn nhất không cố định để xác định cạnh. Bước này dùng để làm nhỏ cạnh. Sau khi tính toán hướng, cạnh dò được vẫn còn mờ, do đó, cần xác định giá trị lớn nhất tại từng vị trí khác nhau để chỉ ra vị trí này có sự thay đổi lớn nhất về giá trị cường độ. Thuật toán cho từng điểm ảnh là: So sánh độ rõ của cạnh ở điểm ảnh hiện tại với điểm ảnh ở hướng dương và hướng âm. Nếu độ rõ của cạnh ở điểm ảnh hiện tại là lớn nhất khi so sánh với các điểm ảnh khác trong mặt nạ cùng hướng, thì giá trị này được giữ nguyên, nếu không thì giá trị sẽ bị thay đổi. Áp dụng ngưỡng trên và dưới để xác định cạnh. Sau các bước kể trên, điểm ảnh biểu diễn cạnh thể hiện rõ hơn trên ảnh. Tuy nhiên, một vài điểm ảnh bị gây ra bởi nhiễu và sự thay đổi màu sắc vẫn còn. Để giải quyết vấn đề này, ta cần lọc ra những điểm ảnh có giá trị gradient nhỏ và giữ lại những điểm ảnh có giá trị lớn. Việc này được thực hiện bằng cách áp dụng ngưỡng trên và dưới. Nếu giá trị gradient của điểm ảnh lớn hơn ngưỡn cao hơn, nó được đánh dấu là điểm ảnh mạnh. Nếu giá trị đó nằm giữa ngưỡng trên và ngưỡng dưới, nó 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2