BÀI TOÁN DÒ CẠNH

TS. NGÔ QUỐC VIỆT TPHCM-2014

1. Các toán tử dò cạnh dựa trên gradient bậc nhất,

bậc hai

1. Robert, Sobel, Prewitt 2. Laplacian operator

2. Dò cạnh tối ưu dựa trên phương pháp Canny 3. Dò cạnh sử dụng OpenCV

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 2

 Trang bị cho sinh viên nền tảng lý thuyết để thực

hiện bài toán dò cạnh

 Trang bị các toán tử phổ biến (mặt nạ) dùng để dò

cạnh

 Trình bày các trở ngại (nhiễu, cạnh dầy) và hướng

giải quyết cho bài toán dò cạnh

 Cung cấp các kỹ năng cần thiết sử dụng OpenCV để

thực hiện dò cạnh

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 3

 Nhằm biến đổi ảnh thành tập các curve.  Thể hiện được đặc trưng nổi bật trong ảnh  Cạnh mang lại nhiều thông tin hơn pixel. Cạnh và vùng là

hai thông tin hữu ích cho các bài toán dựa trên ảnh.

 Đối sánh các cạnh dễ hơn đối sánh tập các pixel giữa hai

ảnh (cạnh hình dáng, kích cỡ, vị trí đối tượng)

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 4

 Cạnh có thể được biểu hiện bởi một số thay đổi có

surface normal discontinuity

depth discontinuity

surface color discontinuity

illumination discontinuity

trong ảnh

 Cạnh là nơi xảy ra sự thay đổi đột ngột hay không liên tục (discontinuity) về độ sáng, bề mặt, màu sắc

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 5

 Sự thay đổi có thể đo bằng đạo hàm bậc nhất

hoặc

 Thay đổi cực đại, đạo hàm có có biên độ cực đại

hay đạo hàm bậc hai bằng zero

 Thông tin biên được phát hiện bởi pixel trung tâm

và các pixel lân cận.

 Nếu cường độ sáng các điểm ảnh lân cận xấp xỉ cường độ sáng điểm ảnh trung tâm, thì điểm ảnh đó không là điểm thuộc cạnh

 Nếu các lân cận của điểm ảnh trung tâm đang xét thay đổi mạnh, điểm ảnh đó có thể là thuộc cạnh.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 6

 Phương pháp đạo hàm bậc nhất hay Gradient

 Roberts Operator  Sobel Operator  Prewitt Operator  Đạo hàm bậc hai

 Laplacian  Laplacian of Gaussian  Difference of Gaussian

 Dò cạnh tối ưu  Dò cạnh Canny

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 7

 Kỹ thuật chủ yếu dùng để phát hiện cạnh dựa vào sự

biến đổi cường độ xám theo hướng

 Cách tiếp cận theo đạo hàm bậc nhất của ảnh dựa

trên kỹ thuật Gradient

 Tiếp cận dựa trên gradient hiệu quả khi cường độ sáng thay đổi rõ nét trên biên. Nghĩa là biến thiên độ sáng là đột ngột.

 Tại điểm có thay đổi nhiều nhất (độ dốc lớn nhất),

đạo hàm bậc nhất có giá trị cực đại.

 Điểm trên cạnh có cực trị biên độ gradient  Phương pháp gradient dựa trên so sánh biên độ

với một ngưỡng

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 8

 Gradient của ảnh:

 Điểm gradient theo hướng thay đổi cường độ sáng nhiều nhất

Hướng gradient xác định bởi: Độ đo cạnh xác định bởi biên độ gradient

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 9

 Gradient rời rạc được xấp xỉ bởi đạo hàm bậc nhất

 Đạo hàm bậc hai

 Làm cách nào chuyển từ gradient sang dạng mặt nạ

để thực hiện toán tử chập H?

 Thực hiện tổng hợp đạo hàm theo hai hướng X và Y

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 10

 Chỉ kiểm tra điểm ảnh thuộc cạnh hay không  Làm việc tốt với ảnh nhị phân. Mục tiêu là để dò

cạnh nhanh.

 Làm việc không tốt với cạnh nhiễu.  Dạng của toán tử Roberts chéo

 Mục tiêu là xác định gradient theo các hướng chéo

so với pixel hiện hành

 Differences được tính tại điểm [r+1/2, c+1/2],

không phải tại [r, c]

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 11

 Xét khác biệt theo hai hướng ngang và dọc, sau đó kết hợp cả hai nhằm xác định biên độ hay hướng

 Biên độ cạnh =

 Hướng cạnh =

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 12

 Xấp xỉ đạo hàm tồn tại tốt hơn  Tương tự toán tử Prewit, nhưng sử dụng các hệ số

mặt nạ khác:

• Dạng chuẩn của Sobel không có phân số 1/8 • Giá trị 1/8 nhằm lấy được

 Biên độ cạnh =

gradient đúng

 Hướng cạnh =

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 13

Mặt nạ Prewitt dò cạnh xéo

Mặt nạ Sobel dò cạnh xéo

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 14

Thêm cột và hàng zero vào các biên ảnh khi chập - zero padding

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 15

Duplicate mở rộng cột và hàng ở các biên ảnh khi chập

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 16

Duplicate mở rộng cột và hàng ở các biên ảnh khi chập

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 17

Duplicate mở rộng cột và hàng ở các biên ảnh khi chập

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 18

 Cho một mặt nạ và quay nó theo 8 hướng chính: N,

NW, W, SW, S, SE, E, và NE.

 Biên độ cạnh = Giá trị lớn nhất được tìm thấy khi

chập (convolution) 8 mặt nạ với ảnh.

 Hướng được xác định theo mặt nạ cho biên độ cạnh

lớn nhất.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 19

 Các mặt nạ Kirsch được xác định như sau:

 Ví dụ: Nếu NE tạo biên độ cạnh lớn nhất, thì hướng

cạnh là NE (Northeast)

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 20

 Tương tự như mặt nạ Kirsch, nhưng các hệ số là 0, -

1, 1, -2, và 2

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 21

 Nhiễu – các toán tử dò cạnh dựa trên đạo hàm bậc nhất bị ảnh hưởng bởi nhiễu– có thể dùng các bộ lọc làm trơn ảnh trước.

 Cạnh dày – cạnh sẽ có nhiều pixel với toán tử Sobel – tuy nhiên cạnh có thể bị nhòe và không định vị chính xác

 Toán tử Roberts không làm việc tốt cho ảnh

nhiễu

 Toán tử Sobel có xu hướng tính trung bình và tập trung vào pixel gần tâm của nhân chập. Toán tử này ít bị ảnh hưởng bởi nhiễu hơn, và được dùng phổ biến để dò cạnh.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 22

 Xét hình sau. Cạnh ở đâu trong hình, làm cách nào

để dò cạnh

Cạnh ở đâu?

Nguồn: S.Sietz

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 23

 Zero crossing của đạo hàm bậc hai xác định sự tồn

tại của cực trị

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 24

 Xấp xỉ đạo hàm bậc hai

 Mặt nạ được định nghĩa

0 1 0

0 1 -4 1 0 1

 Toán tử nhạy với nhiễu  ảnh hưởng dò cạnh.

 Sử dụng Laplacian Gaussian

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 25

 Còn gọi bộ dò cạnh Marr-Hildreth  Các bước thực hiện

 Làm trơn ảnh với Gaussian filter  Nâng cấp cạnh với Laplacian operator  Kiểm tra Zero crossings để xác định điểm trên

cạnh.

 Sử dụng nội suy tuyến tính để xác định vị trí sub-

pixel của cạnh.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 26

 Được định nghĩa bởi

 Giá trị  càng lớn, lọc Gaussian càng rộng,

hiệu ứng làm trơn càng nhiều.

 Làm trơn quá nhiều sẽ ảnh hưởng đến dò

cạnh

 Bài tập: viết code (C++/C#/JAVA/MATLAB)

phát sinh nhân chập LoG.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 27

 Hình dạng hàm lọc có dạng Mexican Hat (nên

còn gọi là toán tử Mexican Hat)

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 28

 Nhân chập Mexican Hat với giá trị  = 1.4

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 29

 LoG cần nhiều tính toán khi kích thước nhân chập

dò cạnh lớn

 Để giảm bớt tính toán, xấp xỉ LoG bởi hiệu của hai

LoG DoG

 Độ rộng của cạnh có thể điều chỉnh bằng cách thay

đổi 1 and 2.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 30

function h = d2dgauss(n1,sigma1,n2,sigma2,theta) r=[cos(theta) -sin(theta); sin(theta) cos(theta)]; for i = 1 : n2 for j = 1 : n1 u = r * [j-(n1+1)/2 i-(n2+1)/2]'; h(i,j) = gauss(u(1),sigma1)*dgauss(u(2),sigma2); end end h = h / sqrt(sum(sum(abs(h).*abs(h)))); function y = gauss(x,std) y = exp(-x^2/(2*std^2)) / (std*sqrt(2*pi)); function y = dgauss(x,std) y = -x * gauss(x,std) / std^2;

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 31

 Một số mặt nạ dò cạnh theo DoG

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 32

Laplacian*I

Laplacian

Duplicate boundary row & cols trước khi chập

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 33

 Đạo hàm bậc hai, cụ thể là phương pháp dựa trên Laplacian, vẫn còn ảnh hưởng nhiều bởi nhiễu.

 Khả năng dò cạnh sai và mất cạnh vẫn còn  Tuy nhiên, định vị cạnh chính xác hơn so với

các phương pháp dựa trên gradient

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 34

Cạnh thật

Bị tác động bởi nhiễu Poor robustness To noise

Vị trí sai Poor Localization

Dư quá nhiều Multiple Responses

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 35

Dò cạnh tối ưu phụ thuộc vào các yếu tố  Tỉ lệ lỗi thấp – cạnh không bị thiếu và không

được có điểm sai.

 Vị trí đúng – khoảng cách giữa điểm cạnh dò được và tâm thật sự của cạnh phải nhỏ nhất  Single response – không dư pixel khi dò cạnh

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 36

 Các tiêu chuẩn có thể định lượng bằng công thức

RMS of Filter to edge

 Tỉ lệ lỗi nhiễu

RMS of Filter to noise

 Localization:

 Mục tiêu là cần tìm min biểu thức

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 37

 Phát triển bởi John F. Canny (1986)  Bước 1

 Khử nhiễu– dùng lọc Gaussian  Chú ý chọn độ rộng thích hợp cho bộ lọc Gaussian

 Bước 2

 Cường độ cạnh được xác định thông qua gradient

của image

 Sử dụng mặt nạ Sobel hoặc Prewitt

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 38

 Bước 3: xác định hướng cạnh

 Bước 4: tìm hướng cạnh đúng trong các

hướng đã xác định

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 39

 Bước 5: khử những non-maxima– theo vết dọc theo hướng cạnh và loại bỏ pixel không được xem nằm trên cạnh. Nhằm tạo ra cạnh mịn

 Bước 6: dùng ngưỡng double / hysteresis (ngưỡng kép hoặc ngưỡng trễ) để loại bỏ streaking (sọc trên cạnh)

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 40

 Ước lượng hướng chính theo nguyên tắc

2

3

1

Xấp xỉ hướng

0

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 41

 Loại bỏ các pixel có |G| không là cực trị cục bộ

(x’, y’) và (x’’, y’’) là lân cận của (x, y) dọc theo hướng của gradient tại (x, y).

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 42

Hướng chính 90 độ. Các pixel khoanh trắng được giữ lại sau bước Non-Max Suppession.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 43

Cho trước cặp giá trị (High, Low), nếu biên độ của

gradient tại pixel:

 Lớn hơn “High”, pixel được gán nhãn ‘edge

pixel’

 Nhỏ hơn “Low”, pixel được gán nhãn“non-

edge-pixel”

 Giữa “Low” và “High”

 Kiểm tra các lân cận của pixel, nếu tồn tại một điểm ảnh có biên độ gradient lớn hơn “High” thì gán pixel đó nhãn “edge pixel” ngược lại gán “non-edge- pixel”.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 44

 cvSobel( const CvArr* src, CvArr* dst, int xorder, int

yorder, int aperture_size=3 )

 cvLaplace( const CvArr* src, CvArr* dst,

int

aperture_size=3 )

 cvCanny( const CvArr* image, CvArr* edges, double threshold1, double threshold2, int aperture_size=3 );

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 45

Tham khảo: openCV_Canny(x)

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 46

 Thuật giải dò cạnh được phát triển dựa trên đạo

hàm bậc một hoặc hai.

 Các toán tử Prewitt, Sobel (đạo hàm bậc nhất), hoặc các toán tử dựa trên Laplacian (đạo hàm bâc hai) như LoG hoặc DoG đều bị nhạy với ảnh nhiễu

 Thuật giải Canny được phát triển dựa trên đạo hàm bậc nhất (dùng toán tử Sobel hoặc Prewitt), nhưng thêm một số bước để dò cạnh được tối ưu

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 47

1. Cài đặt chương trình minh họa dò cạnh với các

toán tử Prewitt, Sobel, Log, DoG

2. Cài đặt lại dò cạnh Canny trên ảnh tĩnh với các tham số High, Low và kiểu và kích thước mặt nạ thay đổi.

Bài giảng Xử lý ảnh - TS. Ngô Quốc Việt 48