Chương 3: CƠ SỞ TOÁN
Võ Quang Hoàng Khang TPHCM - 2016
1. Hàm ảnh - Image function
2. Tích chập - Convolution
3. Biến đổi Cosine rời rạc
4. Biến đổi Fourier
5. Biến đổi Wavelet
2
Mô tả được hàm ảnh, tích chập
Mô tả được phép biến đổi Cosine rời rạc
Mô tả được biến đổi Fourier.
Mô tả được biến đổi Wavelet.
3
Input image
Input image
Enhancement technique
Miền không gian
Miền tần số
Xử lý trực tiếp trên pixel
Xử lý trên biến đổi Cosine - Fourier
4
Ảnh số có thể được định nghĩa là hàm hai biến: f(x,y),
với x và y là các tọa độ nguyên, giá trị của f tại cặp tọa
độ (x,y) được gọi là cường độ sáng hoặc mức xám của
ảnh tại điểm đó.
Giá trị của f(x,y) và miền xác định của x và y rời rạc và
hữu hạn
Liên tục: Tích chập của 2 hàm f(x) và h(x) được định
nghĩa bởi:
Rời rạc:
6
Liên tục: Tích chập của 2 hàm f(x) và h(x) hai chiều
được định nghĩa bởi:
Rời rạc
7
Kích thước kernel mxn, ảnh kích thước MxN, tích
chập được định nghĩa bởi
Thông thường, nhân chập có dạng vuông (m=n),
với m và n là số lẻ.
Chú ý: tâm của nhân chập thường ở giữa cửa sổ
chập.
Tại một vị trí bất kỳ, pixel đích sẽ bằng tổng các tích giữa pixel nguồn với các phần tử tương ứng trong nhân
8
Tích chập giữa f(M1xN1) và nhân h(M2xN2) có thể tạo ra các ma trận có kích thước như sau, tùy thuộc vào kiểu chập.
Giữ nguyên kích thước: M1xN1 (same convolution) : Tăng kích thước
(full
(M1+M2-1)x(N1+N2-1)
convolution)
Giảm kích thước:
(valid
(M1-M2+1)x(N1-N2+1)
convolution)
9
Giữ nguyên kích thước
10
Tăng kích thước Tâm ma trận chập nằm ngoài ảnh
Giảm kích thước Ma trận chập nằm gọn trong ảnh
11
for(int y = 0; y < height; ++y)
for(int x = 0; x < width; ++x)
{ {
sum = 0; for(int i = 0; i < kHeight-1; i++) { for(int j = 0; j < kWidth-1; j++) {
if((y+(i-kMiddleHeight)) < 0 || (y+(i-kMiddleHeight)) >= height
|| (x+(j-kMiddleWidth)) < 0 || (x+(j-kMiddleWidth)) >= width) { result = 0;
} else { result = input[y+(i-kMiddleHeight), x+(j-kMiddleWidth)] * kernel[I, j]; } sum += result;
}
} result[y, x] = sum;
}
}
12
Input image
Input image
Enhancement technique
Miền không gian
Miền tần số
Xử lý trực tiếp trên pixel
Xử lý trên biến đổi Cosine - Fourier
13
y
v
x
u
Là một công cụ toán học xử lý các tín hiệu như ảnh
hay video.
Chuyển đổi các tín hiệu từ miền không gian sang
miền tần số và biến đổi ngược lại từ miền tần số
quay trở lại miền không gian
Không ảnh hưởng đến chất lượng ảnh.
15
16
17
Biến đổi thuận: chuyển sự biểu diễn từ không gian
thực sang không gian tần số
f(x)
F(w)
Fourier Transform
Biến đổi ngược: chuyển đổi sự biểu diễn của đối
tượng từ không gian Fourrier sang không gian thực.
F(w)
f(x)
Inverse Fourier Transform
The one-dimensional Fourier transform and its inverse
The two-dimensional Fourier transform and its inverse
Biến đổi Fourier – ví dụ
original image x-blurred image
Fourier transform Fourier transform
Biến đổi Fourier – ví dụ
original image
Fourier transform
Code matlab:
f = imread(‘lena.jpg’); subplot(1,2,1), imshow(f); f = double(f); F = fft2(f); Fc = fftshift(F); S = log(1+abs(Fc)); subplot(1,2,2),imshow(S,[]);
original image reconstructed “inverse FT” image
Fourier transform
truncated Fourier transform
Lowpass filter
original image reconstructed “inverse FT” image
Fourier transform
truncated Fourier transform
Highpass filter
original image reconstructed “inverse FT” image
Fourier transform
truncated Fourier transform
Filter_coeffs
original image reconstructed “inverse FT” image
Fourier transform
truncated Fourier transform
Reduce noise
Sinh viên nghiên cứu và báo cáo kết quả vào buổi học sau
28
Minh họa các phép biến đổi đã học bằng Matlab
29