Chương 5

Cơ bản về xử lý ảnh số trong Matlab

5.1 Giới thiệu

Trong Matlab, mỗi hình ảnh thường được biểu diễn

bằng một ma trận hai chiều.

Mỗi một phần tử của ma trận tương ứng với 1 pixel (một phân tử ảnh – picture element – biểu diễn bằng 1 điểm trên màn hình). Điểm ảnh ở góc trên bên trái ứng với hàng 1, cột 1.

Matlab lưu giữ các hình ảnh dưới một trong các kiểu dữ

liệu sau: logical, uint8, uint16, double.

Người dùng có thể sử dụng các phép toán và các thao tác cơ bản trên ma trận để tác động lên dữ liệu hình ảnh với điều kiện các thao tác này chấp nhận các kiểu dữ liệu trên.

25/05/2014 Lập trình tính toán 2

5.2 Các kiểu hình ảnh trong Matlab

Ảnh chỉ số (indexed images)

Ảnh được biểu diễn bởi hai ma trận:

- Ma trận dữ liệu X: thuộc kiểu uint8, uint16 hoặc double.

- Ma trận màu (bản đồ màu) map: kích thước m×3, các phần tử có kiểu double có giá trị thuộc khoảng [0,1]. Mỗi hàng của ma trận xác định các thành phần red, green, blue trong tổng số m màu được sử dụng trong ảnh.

Giá trị của một phần tử trong ma trận dữ liệu cho biết màu của điểm ảnh đó là màu nằm ở hàng nào trong ma trận màu. 25/05/2014

Lập trình tính toán 3

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Ảnh chỉ số (indexed images) (tt.)

X(143,219) = 124 map(124,:) = 0.8392 0.9373 1.0000

25/05/2014 Lập trình tính toán 4

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Ảnh độ sáng (intensity images)

Ảnh được biểu diễn bởi một ma trận hai chiều, trong đó giá trị của mỗi phần tử cho biết độ sáng (hay mức xám) của điểm ảnh đó.

- Ma trận thuộc kiểu uint8, uint16 hoặc double.

- Giá trị nhỏ nhất (0) ứng với màu đen.

- Giá trị lớn nhất (255 hoặc 65535 hoặc 1 tùy kiểu dữ liệu là uint8, uint16 hay double) ứng với màu trắng.

Ảnh biểu diễn theo kiểu này còn gọi là ảnh “trắng đen” hoặc ảnh grayscale.

25/05/2014 Lập trình tính toán 5

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Ảnh độ sáng (intensity images) (tt.)

I(143,219) = 0.9151

25/05/2014 Lập trình tính toán 6

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Ảnh nhị phân (binary images)

Ảnh được biểu diễn bởi một ma trận hai chiều, thuộc kiểu logical.

- 0 ứng với màu đen.

- 1 ứng với màu trắng.

BW(143,219) = 1

25/05/2014 Lập trình tính toán 7

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Ảnh RGB (RGB images)

Ảnh được biểu diễn bởi một ma trận ba chiều m × n × 3.

- m × n: kích thước ảnh theo pixels.

- Ma trận này định nghĩa các thành phần màu red, green, blue cho mỗi điểm ảnh, các phần tử có thể thuộc kiểu uint8, uint16 hay double.

Ảnh biểu diễn theo kiểu này còn gọi là ảnh “truecolor”. Các file ảnh hiện nay thường sử dụng 8 bit cho một thành phần màu, nghĩa là mất 24 bit cho mỗi điểm ảnh (khoảng 16 triệu màu)

25/05/2014 Lập trình tính toán 8

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Ảnh RGB (RGB images) (tt.)

RGB(143,219,1) = 0.8392 RGB(143,219,2) = 0.9373 RGB(143,219,3) = 1.0000

25/05/2014 Lập trình tính toán 9

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Chuyển đổi giữa các kiểu ảnh

Tên hàm

Cú pháp

Mô tả

dither

dither(RGB,map) dither(I)

Tạo ảnh nhị phân từ ảnh trắng đen I hoặc tạo ảnh indexed từ ảnh RGB và ma trận màu map bằng phương pháp dithering

gray2ind

[X, map] = gray2ind(I,n) [X, map] = gray2ind(BW,n)

Chuyển ảnh nhị phân BW hoặc ảnh intensity I thành ảnh indexed thông qua ma trận tuyến tính gray(n)

grayslice

X = grayslice(I,n) X = grayslice(I,v)

Chuyển ảnh trắng đen I thành ảnh indexed X bằng cách lấy ngưỡng. Các giá trị ngưỡng được xác định bởi vector v hoặc bởi n (khi đó các giá trị ngưỡng là 1/n, 2/n, …, (n-1)/n)

25/05/2014 Lập trình tính toán 10

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Chuyển đổi giữa các kiểu ảnh (tt.)

Tên hàm

Cú pháp

Mô tả

im2bw

BW = im2bw(I,level) BW = im2bw(X,map,level) BW = im2bw(RGB,level)

Chuyển ảnh trắng đen, ảnh indexed hoặc ảnh RGB thành ảnh nhị phân BW bằng cách lấy ngưỡng bởi level

ind2gray

I = ind2gray(X,map)

Chuyển ảnh indexed X với ma trận màu map thành ảnh trắng đen I

ind2rgb RGB = ind2rgb(X,map)

Chuyển ảnh indexed X với ma trận màu map thành ảnh RGB

25/05/2014 Lập trình tính toán 11

5.2 Các kiểu hình ảnh trong Matlab (tt.)

Chuyển đổi giữa các kiểu ảnh (tt.)

Tên hàm

Cú pháp

Mô tả

mat2gray

I = mat2gray(A,[amin amax])

Tạo ảnh trắng đen từ ma trận A; amin, amax thuộc [0 (đen), 1 (trắng)].

rgb2gray

I = rgb2gray(RGB)

Chuyển ảnh RGB thành ảnh trắng đen I

rgb2ind

[X, map] = rgb2ind(RGB,n) X = rgb2ind(RGB,map) [X, map] = rgb2ind(RGB,tol)

Chuyển ảnh RGB thành ảnh indexed [X, map]: TH1: n<=65535 TH2: mỗi pixel được xấp xỉ đến màu gần giống nhất trong bản màu map TH3: tol ∈ [0,1]

25/05/2014 Lập trình tính toán 12

5.3 Đọc và ghi các dữ liệu ảnh

Đọc dữ liệu ảnh

Hàm imread đọc các file ảnh với bất kỳ các định dạng ảnh đã biết hiện nay và lưu lại dưới dạng một ma trận biểu diễn ảnh trong Matlab.

Cú pháp:

A = imread(filename,fmt)

[X,map] = imread(filename,fmt)

filename: chuỗi xác định tên file cần đọc cùng với đường dẫn (nếu file này không nằm trong thư mục hiện hành)

fmt: chuỗi cho biết định dạng của ảnh, VD: ‘bmp’, ‘gif’, ‘jpg’,…

25/05/2014 Lập trình tính toán 13

5.3 Đọc và ghi các dữ liệu ảnh (tt.)

Ghi dữ liệu ảnh

Hàm imwrite lưu một ảnh biểu diễn bằng một ma trận trong Matlab thành một file ảnh dưới một trong các định dạng ảnh đã biết.

Cú pháp:

imwrite(A,filename,fmt)

imwrite(X,map,filename,fmt)

25/05/2014 Lập trình tính toán 14

5.3 Đọc và ghi các dữ liệu ảnh (tt.)

Xem thông số một file ảnh

>> info = imfinfo(filename,fmt)

Các thông tin của ảnh được lưu dưới dạng cấu trúc (struct)

Các thuộc tính (field) có được khi gọi hàm imfinfo.

Tên thuộc tính

Mô tả

Filename

Chuỗi chứa tên file

FileModDate Chuỗi cho biết ngày hiệu chỉnh file gần đây nhất

FileSize

Một số nguyên chỉ kích thước file (đơn vị byte)

25/05/2014 Lập trình tính toán 15

5.3 Đọc và ghi các dữ liệu ảnh (tt.)

Xem thông số một file ảnh (tt.)

Tên thuộc tính

Mô tả

Format

Chuỗi cho biết định dạng của ảnh

FormatVersion

Chuỗi hoặc số cho biết tên phiên bản của định dạng

Width

Số nguyên chỉ chiều rộng ảnh (pixels)

Height

Số nguyên chỉ chiều cao ảnh (pixels)

BitDepth

Số nguyên cho biết số bits trên một pixel

ColorType

Chuỗi cho biết kiểu ảnh: ‘truecolor’, ‘grayscale’ hoặc ‘indexed’

25/05/2014 Lập trình tính toán 16

5.4 Chuyển đổi giữa các kiểu dữ liệu

Sử dụng các hàm chuyển kiểu cho các ma trận biểu diễn ảnh:

im2double

im2uint8

im2uint16

Lưu ý:

- Khi chuyển từ kiểu dữ liệu nhiều bit sang kiểu dữ liệu ít bit hơn, một số thông tin chi tiết về bức ảnh ban đầu sẽ bị mất.

- Không phải lúc nào cũng có thể chuyển kiểu dữ liệu đối với kiểu ảnh indexed. Để chuyển, phải dùng hàm imapprox để giảm số màu cần biểu diễn ảnh xuống.

25/05/2014 Lập trình tính toán 17

5.5 Các phép toán số học cơ bản trên ảnh

Tên hàm

Cú pháp

Mô tả

imabsdiff

z = imabsdiff(x,y)

Trừ mỗi phần tử của y từ phần tử tương ứng của x, sau đó trả về trị tuyệt đối của hiệu

imadd

z = imadd(x,y,out_class)

Cộng hai ảnh hoặc cộng một số, với một hằng ảnh out_class là chuỗi xác định kiểu dữ liệu của tổng

imcomplement im2 = imcomplement(im) Lấy bù của ảnh im

Imdivide

z = imdivide(x,y)

Chia các phần tử của ảnh x cho phần tử tương ứng của y, các giá trị phân số được làm tròn.

25/05/2014 Lập trình tính toán 18

5.5 Các phép toán số học cơ bản (tt.)

Tên hàm

Cú pháp

Mô tả

imlincomb

imlincomb(k1,a1, kn,an,

z = k2,a2, …, k,out_class)

Lấy tổ hợp tuyến tính của các ảnh: z=k1*a1+k2*a2+…+kn*an+k

immultiply

z = immultiply(x,y)

Nhân hai ảnh hoặc nhân một ảnh với một hằng số, nếu kết quả bị tràn thì sẽ được giới hạn lại trong tầm cho phép

imsubstract

im2 = imsubstract(x,y)

Trừ hai ảnh hoặc trừ một ảnh với một hằng số, nếu kết quả bị tràn thì sẽ được giới hạn lại trong tầm cho phép

25/05/2014 Lập trình tính toán 19

5.5 Các phép toán số học cơ bản (tt.)

Ví dụ 1: Chồng lẫn hai ảnh trên một nền chung

I = imread(‘rice.png’); J = imread(‘cameraman.tif’); K = imadd(I,J); imshow(I) imshow(J) imshow(K)

% Đọc ảnh thứ nhất % Đọc ảnh thứ hai % Cộng hai ảnh % Hiển thị ảnh thứ nhất % Hiển thị ảnh thứ hai % Hiển thị ảnh tổng

25/05/2014 Lập trình tính toán 20

5.5 Các phép toán số học cơ bản (tt.)

Ví dụ 2: Làm tăng độ sáng ảnh bằng phép cộng với hằng số

I = imread('peppers.png'); J = imadd(I,50); subplot(1,2,1), imshow(I) subplot(1,2,2), imshow(J)

25/05/2014 Lập trình tính toán 21

5.5 Các phép toán số học cơ bản (tt.)

Ví dụ 3: Làm tăng độ sáng ảnh bằng phép nhân với hằng số

I = imread('peppers.png'); J = immultiply(I,1.5); subplot(1,2,1), imshow(I) subplot(1,2,2), imshow(J)

25/05/2014 Lập trình tính toán 22

5.6 Các hàm hiển thị hình ảnh

 Hàm image(x, y, C): hiển thị hình ảnh biểu diễn bởi ma trận Cm× n lên trục tọa độ hiện hành; x, y là vector xác định vị trí của các pixel C(1,1) và C(m,n) trong hệ trục hiện hành. Ví dụ: load mandrill image(X) colormap(map)

25/05/2014 Lập trình tính toán 23

5.6 Các hàm hiển thị hình ảnh (tt.)

 Hàm imagesc: tương tự hàm image, ngoài trừ việc dữ liệu ảnh sẽ co giãn (scale) để sử dụng toàn bộ bản đồ màu hiện hành. Ví dụ: I = imread('eight.tif'); subplot(2,2,1); imagesc(I); axis([0 400 0 400]); colormap(gray); subplot(2,2,2); imagesc(100,100,I); axis([0 400 0 400]); colormap(gray); subplot(2,2,3); imagesc(I);

25/05/2014 Lập trình tính toán 24

5.6 Các hàm hiển thị hình ảnh (tt.)

 Hàm imshow: tạo đối tượng đồ họa thuộc loại image và hiển thị ảnh trên một figure tự động thiết lập các giá trị của các đối tượng image, axes và figure để thể hiện hình ảnh. Sử dụng hàm này trong các trường hợp cần các công cụ chú giải, hỗ trợ in ấn có sẵn trong figure.  Hàm imtool: hiển thị hình ảnh trên Image Tool, là một môi trường tích hợp để hiển thị hình ảnh và biểu diễn một số tác vụ xử lý hình ảnh phổ biến.

25/05/2014 Lập trình tính toán 25

5.6 Các hàm hiển thị hình ảnh (tt.)

Ví dụ:

imshow('board.tif')

imtool('board.tif')

Hiển thị ảnh bằng imtool

25/05/2014

Hiển thị ảnh bằng imshow Lập trình tính toán

26

5.7 Các phép biến đổi hình học

Phép nội suy ảnh Nội suy là quá trình ước lượng giá trị của ảnh tại một điểm nằm giữa hai pixels có giá trị đã biết.

Các phương pháp nội suy: (Nearest-neighbor lân cận gần nhất - Phương pháp interpolation): pixel mới sẽ được gán giá trị của pixel chứa điểm tương ứng của nó trong ảnh ban đầu. - Phương pháp song tuyến tính (Bilinear interpolation): pixel mới sẽ được gán là trung bình có trọng số của các pixel trong một lân cận kích thước 2×2.

25/05/2014 Lập trình tính toán 27

5.7 Các phép biến đổi hình học (tt.)

Phép nội suy ảnh (tt.) - Phương pháp bicubic (Bicubic interpolation): pixel mới sẽ được gán là trung bình có trọng số của các pixel trong một lân cận kích thước 4×4.

Phép nội suy là cơ sở để thực hiện các phép biến đổi hình học khác như: thay đổi kích thước ảnh, quay ảnh, ...

25/05/2014 Lập trình tính toán 28

5.7 Các phép biến đổi hình học (tt.)

Thay đổi kích thước ảnh

>>B = imresize(A,m,method)

Tạo ảnh B có kích thước gấp m lần ảnh gốc A. Method: phương pháp nội suy sẽ dùng: ‘nearest’, ‘bilinear’, ‘bicubic’; mặc định là ‘nearest’.

>>B = imresize(A,[mrows mcols],method)

mrows, mcols: số hàng, số cột của ảnh mới.

25/05/2014 Lập trình tính toán 29

5.7 Các phép biến đổi hình học (tt.)

Thay đổi kích thước ảnh (tt.) Ví dụ:

[X,map] = imread('trees.tif'); [Y,newmap] = imresize(X,map,0.5); imshow(Y,newmap); imshow(X,map);

25/05/2014 Lập trình tính toán 30

5.7 Các phép biến đổi hình học (tt.)

Phép quay ảnh

>>B = imrotate(A,angle,method,bbox)

A: ảnh gốc.  angle: góc quay  method: phương pháp nội suy, mặc định là 'nearest'  bbox: kích thước của ảnh mới: 'crop' hoặc 'loose'. Mặc định là 'loose' (tăng kích thước nếu cần)

25/05/2014 Lập trình tính toán 31

5.7 Các phép biến đổi hình học (tt.)

Phép quay ảnh (tt.) Ví dụ: [X,map] = imread('trees.tif'); I = ind2rgb(X,map); J = imrotate(I,45); K= imrotate(I,45,'crop'); imshow(I) imshow(J) imshow(K)

25/05/2014 Lập trình tính toán 32

5.7 Các phép biến đổi hình học (tt.)

Trích xuất ảnh

Cách 1:

>>X2 = imcrop(X,map,rect) %Ảnh indexed

%Ảnh grayscale hoặc RGB

>>A2 = imcrop(A,rect)

 rect = [xmin ymin width height] với (xmin,ymin) là tọa độ góc trên bên trái của phần ảnh cần trích, width và height là chiều rộng và chiều cao của phần ảnh cần trích.

25/05/2014 Lập trình tính toán 33

5.7 Các phép biến đổi hình học (tt.)

Trích xuất ảnh (tt.)

Cách 2:

>>[X2,rect] = imcrop(X,map) %Ảnh indexed

%Ảnh grayscale hoặc RGB

>>[A2,rect] = imcrop(A)

Dùng con trỏ chuột để chọn phần ảnh cần trích xuất.

Ví dụ:

[I2,rect]=imcrop(I) imshow(I) imshow(I2)

34 25/05/2014 Lập trình tính toán

5.7 Các phép biến đổi hình học (tt.)

Phép biến đổi hình học tổng quát

>>B = imtransform(A,TFORM,interp) >>[B,XData,YData]=imtransform(...,param1,val1,param2,val2,...)

 interp: phương pháp nội suy.

 (XData,YData): vị trí của ảnh B trong hệ trục X-Y.  TFORM: cấu trúc của phép biến đổi, được xác định bằng cách sử dụng hàm maketform và cp2tform.

25/05/2014 Lập trình tính toán 35

5.7 Các phép biến đổi hình học (tt.)

Phép biến đổi hình học tổng quát (tt.)

Hàm maketform:

>>T = maketform(TFORM_type,...)

 TFORM_type: dạng cấu trúc biến đổi hình học: 'affine',

'projective', 'custom', box', 'composite'.

25/05/2014 Lập trình tính toán 36

5.7 Các phép biến đổi hình học (tt.)

Phép biến đổi hình học tổng quát (tt.)

Hàm cp2tform:

'linear conformal',

'affine',

>>T = cp2tform(input_points,base_points,TFORM_type,order)  input_points, base_points: các ma trận M×2 xác định tọa độ (X,Y) của M điểm điều khiển trong ảnh biến đổi và trong ảnh gốc.  TFORM_type: 'projective'. 'polynomial', 'piecewise linear', 'lwm'. Nếu là 'polynomial' thì cần cung cấp thêm thông số order cho biết bậc của đa thức (mặc định là 3).

25/05/2014 Lập trình tính toán 37

5.7 Các phép biến đổi hình học (tt.)

Phép biến đổi hình học tổng quát (tt.)

Ví dụ:

T = maketform('affine',[1 0 0; .5 1 0; 0 0 1]);

J = imtransform(I,T);

imshow(I), figure, imshow(J)

25/05/2014 Lập trình tính toán 38