Bài giảng Xử lý ảnh - Chương 19: Nhận dạng mẫu: Kích thước đối tượng

Chia sẻ: Lão Lão | Ngày: | Loại File: PDF | Số trang:21

Thêm vào BST

Báo xấu

61
lượt xem 8
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong chương 18, chúng ta đã giới thiệu về nhận dạng mẫu và đã đề cập đến sự tách và trích các đối tượng từ một cảnh phức tạp. Trong chương này, chúng ta sẽ chỉ ra những vấn đề về đo lường các đối tượng, để có thể nhận biết chúng thông qua các số đo của chúng. Vấn đề này đã tốn rất nhiều giấy mực và ở đây chúng ta chỉ có thể giới thiệu các khái niệm cơ bản mà thôi. Để nghiên cứu chi tiết hơn, độc giả nên tham khảo tài liệu về phân tích ảnh.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Bài giảng Xử lý ảnh - Chương 19: Nhận dạng mẫu: Kích thước đối tượng

Ch¬ng 19 NHẬN DẠNG MẪU: KÍCH THƯỚC ĐỐI TƯỢNG 19.1. GIỚI THIỆU Trong chương 18, chúng ta đã giới thiệu về nhận dạng mẫu và đã đề cập đến sự tách và trích các đối tượng từ một cảnh phức tạp. Trong chương này, chúng ta sẽ chỉ ra những vấn đề về đo lường các đối tượng, để có thể nhận biết chúng thông qua các số đo của chúng. Vấn đề này đã tốn rất nhiều giấy mực và ở đây chúng ta chỉ có thể giới thiệu các khái niệm cơ bản mà thôi. Để nghiên cứu chi tiết hơn, độc giả nên tham khảo tài liệu về phân tích ảnh. (Phụ lục 2) 19.2. ĐO LƯỜNG KÍCH THƯỚC Trong phần này, chúng ta sẽ xem xét một vài đặc tính hữu dụng phản ảnh kích thước một đối tượng. Những đặc tính này đã trở nên phổ biến vì chúng quan trọng trong các bài toán nhận dạng mẫu khác nhau và chúng rất thích hợp cho phân tích ảnh số. Thứ nhất nó rất thuận tiện để tính giới hạn không gian dưới dạng các điểm ảnh và giới hạn quang trắc (photometric) dưới dạng mức xám. Sau đó, chiều dài diện tích có thể được xác định bằng cách nhân chúng với khoảng cách điểm ảnh hay diện tích một điểm ảnh thích hợp. Đường cong xác định quang trắc của bộ số hoá có tác dụng như một phương tiện chuyển đổi mức xám thành đơn vị quang trắc. Thường thì đây là một biểu thức tuyến tính đơn giản. Các phép toán điểm bất kỳ (chương 6) được thực hiện trên ảnh cũng phải được sáng tỏ trong sự xác định quang trắc. 19.2.1. Diện tích và chu vi Diện tích của một đối tượng nói chung là một phép đo kích thước đối tượng thích hợp. Tuỳ thuộc vào đường bao của đối tượng mà một phép đo diện tích thường không để ý đến những thay đổi mức xám bên trong. Chu vi của một đối tượng rất hữu dụng trong việc phân biệt hình dạng đơn giản và phức tạp giữa các đối tượng. Một đối tượng có hình dạng đơn giản sử dụng chu vi nhỏ hơn để bao quanh diện tích của nó. Các phép đo diện tích và chu vi được tính toán dễ dàng trong suốt quá trình trích một đối tượng từ một ảnh phân đoạn. Định nghĩa đường bao. Trước khi chúng ta có thể chỉ rõ một thuật giải để đo lường diện tích hay chu vi một đối tượng, chúng ta phải thiết lập một định nghĩa về đường bao đối tượng. Đặc biệt, chúng ta phải đảm bảo rằng chúng ta sẽ không đo lường chu vi một đa giác này và diện tích của đa giác khác. Vấn đề cần phải giải quyết là, các điểm ảnh bao quanh hoàn toàn hay chỉ bao quanh từng phần của đối tượng? Nói cách khác, đường bao thực sự của một đối tượng nối liền tâm các điểm ảnh hay bao quanh các biên bên ngoài của chúng? Diện tích tổng số điểm ảnh. Phép đo diện tích đơn giản nhất là đếm số lượng điểm ảnh bên trong (và kể cả) đường bao. Chu vi tương ứng với định nghĩa này là 380
khoảng cách xung quanh phía ngoài tất cả các điểm ảnh. Bình thường, phép đo khoảng cách này bao gồm một lượng lớn các chỗ rẽ ngoặt 900, do đó tạo ra một giá trị chu vi quá mức. Chu vi đa giác. Có lẽ một phương pháp tiếp cận thích hợp hơn để đo chu vi một đối tượng là thiết lập đường bao đối tượng đa giác có đỉnh nằm tại tâm của từng điểm ảnh bao quanh. Chu vi là tổng của các đoạn bên (p = 1) và các đoạn chéo ( p  2 ). Tổng này có thể được tích luỹ trong khi trích đối tượng bằng cách mã hoá phân doạn dòng (Xem phần 18.8.3) hay đi qua vòng quanh đường bao trong khi xây dựng mã chuỗi (Xem phần 18.8.2). chu vi của một đối tượng là p  N e  2N o (1) trong đó Ne là số các đoạn chẵn và No là số các đoạn lẻ trong chuỗi mã đường bao khi sử dụng quy ước của hình 18-30. Chu vi cũng được tính đơn giản từ các tệp phân đoạn đối tượng bằng tổng khoảng cách tâm đến tâm các điểm ảnh liên tiếp nhau trên đường bao. Diện tích đa giác. Diện tích đa giác được định nghĩa theo tam điểm ảnh là tổng số điểm ảnh trừ đimột nửa lượng điểm ảnh đường bao cộng thêm một; tức là N  A  N o   b  1 (2)  2  trong đó No và Nb là số lượng các điểm ảnh tương ứng thuộc đối tượng (bao gồm cả các điểm ảnh bao) và trên đường bao. Chỗ đúng này của diện tích tổng số điểm ảnh thừa nhận, tính trung bình, một nửa điểm ảnh bao nằm trong, một nửa ngoài đối tượng. Hơn thế nữa, khi một đường cong kín quay bị ngang, một giá trị nữa của điểm ảnh thuộc vùng nằm bên ngoài, là do độ lồi thực của đối tượng. Người ta có thể hiệu chỉnh phép đo diện tích gần đúng xuất phát từ tổng số điểm ảnh bằng cách trừ đi một nửa chu vi. 19.2.1.1. Tính diện tích và chu vi Có một phương pháp đơn giản để tính diện tích và chu vi một đa giác theo một đường đi của đa giác. Hình 19-1 minh hoạ trường hợp diện tích đa giác là tổng của diện tích tất cả các tam giác do các đường nối các đỉnh với điểm (x0, y0) tuỳ ý tạo ra. Không mất tính tổng quát, chúng ta có thể chọn điểm (x0, y0) là gốc hệ toạ độ của ảnh. Hình 19-2 giúp chúng ta có được một biểu thức diện tích một tam giác có một đỉnh nằm tại gốc toạ độ. Các đường ngang và dọc chia khu vực thành những hình chữ nhật. Một số hình nhận có đường chéo là các cạnh của tam giác. Vì thế, nửa diện tích của mối hình chữ nhật như vậy nằm ngoài tam giác. Nhìn vào hình, ta có thể viết 1 1 1 dA  x 2 y1  x1 y1  x 2 y 2   x 2  x1  y1  y 2  (3) 2 2 2 381
HÌNH 19-1 Hình 19-1 Tính diện tích đa giác HÌNH 19-2 Hình 19-2 Tính diện tích tam giác Khai triển và nhóm các số hạn, biểu thức này được đơn giản hoá thành 1 dA  x1 y 2  x2 y1  (4) 2 Và diện tích tổng cộng trở thành 1 Nb A  xi yi1  xi 1 yi  2 i 1 (5) Trong đó Nb là số lượng các điểm biên. Lưu ý rằng, nếu gốc toạ độ nằm ngoài đối tượng thì một tam giác đặc biệt nào đó bao gồm cả một số vùng không thuộc đa giác. Cũng cần lưu ý rằng diện tích của mọt tam giác đặc biệt có thể dương hay âm, tuỳ thuộc vào chiều đi của đường bao. Khi một vòng kín bao quanh đường bao được tạo ra, tất cả những vùng nằm ngoài đối tượng đều bị loại trừ ra. Một tiếp cận đơn giản hơn cũng mang lại kết quả như vậy chính là nhờ định lý Green. Định lý này xuất phát từ phép tính tích phân và phát biểu rằng diện tích được bao bởi một đường cong kín trong mặt phẳng x, y được cho bởi tích phân kín 1 A xdy  ydx (6) 2 Trong đó tích phân được lấy theo đường cong kín. đối với các đoạn rời, biểu thức (6) trở thành 382
1 Nb A  xi  yi1  yi   yi xi1  xi  2 i 1 (7) Biểu thức này có dạng của biểu thức (5). Chu vi tương ứng là tổng chiều dài các cạnh của đa giác. Nếu tất cả các điểm biên của đa giác được coi như là các đỉnh, thì chu vi sẽ là tổng tất cả các số đo bên và chéo. 19.2.1.2. Làm trơn đường bao Thường thường, số đo chu vi cao một cách giả tạo vì nhiễu và vì các điểm biên bị lưới lấy mẫu hình chữ nhật hạn chế. Làm trơn đường bao bằng xử lý ảnh nhị phân (Phần 18.7) có thể giảm nhiễu, nhưng không thể làm giảm bớt những đường bọc quanh mẫu. Tuy nhiên, làm trơn đường bao có thể được xây dựng thêm thành phép đo diện tích và chu vi bằng cách chỉ sử dụng một tập con các điểm ảnh bao như các đỉnh. Đặc biệt trong các vùng có độ cong ít, ta có thể bỏ qua các điểm ảnh bao. Tuy nhiên, có quá nhiều vùng như vậy có thể làm mất đi hình dạng thật sự của đối tượng và làm giảm độ chính xác của phép đo. Làm trơn đường bao cũng có thể bị tác động bởi việc biểu diễn đường bao theo tham số. Nếu đối tượng có dạng lồi thì đường bao có thể được biểu diễn trong toạ độ cực xung quanh một điểm nào đó trong đối tượng (hình 19-3a). Trong trường hợp này, đường bao được chỉ rõ bằng một hàm dạng (). Yêu cầu duy nhất là  chỉ có một giá trị với mọi . HÌNH 19-3 Hình 19-3 Biểu diễn đường bao tham số: (a) hàm đường bao cực; (b) hàm đường bao phức Nếu hình dạng phức tạp đến nỗi không tồn tại một điểm nào như vậy, thì đường bao có thể được biểu diễn bởi một hàm đường bao phức tổng quát hơn B pi   x i  jy i (8) Trong đó pi là quãng đường dọc theo đường bao từ một điểm tuỳ ý đến điểm biên thứ i và i = 1, …, Nb là chỉ số của các điểm biên (hình 19-3b). Trong cả hai trường hợp, hàm đường bao tham số đều tuần hoàn. Trong một chu kỳ, nó có thể được lọc thông thấp trong miền tần số bằng (1) một biến đổi Fourier, (2) bằng cách nhân với một hàm truyền đạt thông thấp không pha (chẵn hoặc lẻ) và (3) bằng một biến đổi Fourier ngược. 383
Các điểm thuộc hàm đường bao đã làm trơn không bị lưới lấy mẫu hạn chế nữa. có thể sử dụng tất cả hoặc một tập con các điểm nói trên như các đỉnh trong các phép tính diện tích và chu vi. Ngoài ra, ta phải sử dụng các đỉnh đã chọn trên đường bao để đảo ngược độ cong. 19.2.2. Mật độ trung bình và mật độ tích hợp IOD (Integrated Optical Density) là tổng mức xám của tất cả các điểm ảnh trong đối tượng. Nó phản ánh “khối lượng” hay “trọng lượng” đối tượng và về mặt số lượng, nó bằng diện tích nhân với mức xám bên trong đối tượng. Sự tính toán IOD đã được trình bày trong chương 5. mật độ trung bình đơn thuần chỉ là IOD chia cho diện tích. 19.2.3. Chiều dài và chiều rộng Đây là phương pháp dễd dàng để tính phạm vi chiều ngang và chiều dọc một đối tượng trích ra từ một ảnh. Chỉ cần chỉ số hàng nhỏ nhất và lớn nhất, cũng như chỉ số cột nhỏ nhất và lớn nhất cho phép tính này. Tuy nhiên, đối với những đối tượng có hướng ngẫu nhiên, thì chiều ngang và chiều dọc không thể là các chiều để xem xét. Trong trường hợp này, cần phải định vị trục chính của đối tượng và đo lường chiều dài và chiều rộng liên quan đến nó. Có nhiều cách thiết lập trục chính cho một đối tượng một khi đã biết được đường bao của nó. Ta có thể tính đường thẳng (hay cong) đúng nhất thông qua các điểm trên đối tượng. Trục chính cũng có thể được tính từ các mô men, như đề cập ở phần tiếp theo. Cách thứ ba sử dụng hình chữ nhật bao quanh tối thiểu (Minimum Enclose Rectangle-MER) bọc lấy đối tượng. Với kỹ thuật MER, đường bao của đối tượng được quay 900 theo nhiều bước, mỗi bước 30 một. Sau mỗi phép quay tăng dần, MER nằm ngang sẽ phù hợp với đường bao. Về phương diện tính toán, điều này chỉ đơn giản là giữ lại vết các giá trị x và y của các điểm trên đường bao đã quay nhỏ nhất và lớn nhất. Kỹ thuật này đặc biệt có lợi cho các đối tượng hình chữ nhật, nhưng nó cũng sinh ra các kết quả vừa ý đối với các hình dạng tổng quát hơn. 19.3. PHÂN TÍCH HÌNH DẠNG Thường thường, có thể phân biệt các đối tượng trong một lớp với các đối tượng khác bằng hình dạng của chúng. Các đặc trưng hình dạng có thể sử dụng độc lập với, hay kết hợp với các số đo kích thước. Trong phần này, chúng ta sẽ xem xét một vài tham số hình dạng thường dùng. 19.3.1. Tính hình chữ nhật Một số đo phản ảnh tính hình chữ nhật của một đối tượng là hệ số khít hình chữ nhật Ao R (9) AR Trong đó Ao là diện tích đối tượng và AR là diện tích MER của đối tượng. R thể hiện mức độ đầy một đối tượng điền vào MER của nó. Nó có giá trị cực đại là 1.0 đối với các đối tượng hình chữ nhật, nhận giá trị /4 đối với đối tượng hình tròn và càng nhỏ hơn đối với các đối tượng cong, mảnh. Hệ số khít hình chữ nhật nằm giữa 0 và 1. 384
Một đặc tíh hình dạng có liên quan khác là tỷ lệ co W A (10) L Là tỷ lệ giữa chiều rộng và chiều dài của MER. Đặc tính này có thể phân biệt các đối tượng mảnh với các đối tượng hình vuông hay hình tròn. 19.3.2. Tính tròn Một nhóm các đặc tính hình dạng được gọi là các tiêu chuẩn tính tròn bởi vì chúng được tối thiểu hoá theo dạng hình tròn. Độ lớn của chúng có xu hướng phản ánh sự phức tạp của đường bao đang được đánh giá. Tiêu chuẩn tính tròn được dùng phổ biến nhất là P2 C (11) A Là tỷ lệ giữa bình phương chu vi và diện tích. Đặc tính này nhận giá trị nhỏ nhất là 4 đối với dạng hình tròn. Các dạng phức tạp hơn nhận các giá trị cao hơn. Số đo tính tròn C có liên quan đến khái niệm chủ quan về sự phức tạp của đường bao. Một phép số đo tính tròn liên quan là năng lượng đường bao (boundary energy). Giả sử một đối tượng có chu vi là P và chúng ta xác định quãng đường vòng quanh đường bao từ điểm xuất phát nào đó với biến p. Tại một điểm bất kỳ, đường bao có một bán kính cong tức thời r(p). Đó là bán kính của đường tròn tiếp xúc đường bao tại điểm đó (hình 14-9). Hàm độ cong tại p là 1 K  p  (12) r p Hàm K(p) tuần hoàn với chu kỳ P. Ta có thể tính năng lượng trung bình trên một đơn vị chiều dài của đường bao như sau 1 P 2 E  K  p  dp (13) P 0 đối với vùng cố định, đường tròn có năng lượng đường bao nhỏ nhất là 2 2  2  1 E0       (14)  P  R trong đó R là bán kính đường tròn. Do đó, độ cong và năng lượng đường bao được tính dễ dàng từ chuỗi mã. Young đã chứng minh rằng năng lượng đường bao phản ánh khái niệm về sự phức tạp theo cảm giác tốt hơn tiêu chuẩn tính tròn của biểu thức (11). Tiêu chuẩn tính tròn thứ ba thực hiện công dụng của khoảng cách trung bình từ một điểm bên trong đến đường bao đối tượng. Khoảng cách này là N 1 d N xi 1 i (15) Trong đó xi là khoảng cách từ điểm ảnh thứ i đến điểm biên gần nhất trong một đối tượng có N điểm. Tiêu chuẩn hình dạng là 385
A N3 g 2  (16) d  N    xLi   i 1  Tổng trong mẫu số của biểu thức (16) là IOD của ảnh đã biến đổi khoảng cách. Phép biến đổi khoảng cách đã được trình bày trong phần 18.7.5. Giá trị mức xám của một điểm ảnh trong một ảnh biến đổi khoảng cách phản ánh khoảng cách từ điểm ảnh đó đến đường bao gần nhất. Hình 19-5 trình bày một ảnh nhị phân và biến đổi khoảng cách của nó. HÌNH 19-5 Hình 19-5 Biến đổi khoảng cách Đối với các hình tròn và các đa giác cân đối, biểu thức (16) cho cùng một giá trị như biểu thức (11); tuy nhiên, khả năng phân biệt của biểu thức (16) có thể tốt hơn đối với các hình dạng phức tạp hơn. 19.3.3. Mô men bất biến Các mô men của một hàm thường được dùng trong lý thuyết xác suất. Tuy nhiên, một vài tính chất khác xuất phát từ các mô men cũng có thể áp dụng để phân tích hình dạng. Định nghĩa. Tập các mô men của một hàm đường bao f(x, y) hai biến được định nghĩa bởi   M jk    x j y k f  x, y dxdy (17)   Trong đó j và k nhận các giá trị không âm bất kỳ. Mô men của các PDF được sử dụng rộng rãi trong lý thuyết xác suất. Khi j và k nhận các giá trị không âm, chúng sinh ra một tập vô hạn các mô men. Hơn nữa, tập này có khả năng xác định hàm f(x, y) một cách đầy đủ. Nói cách khác, tập {Mjk}là duy nhất đối với hàm f(x, y) và chỉ hàm f(x, y) có tập mô men riêng biệt đó mà thôi. Với mục đích miêu tả hình dạng, giả sử f(x, y) nhận giá trị 1 trong đối tượng và giá trị 0 ngoài đối tượng. Hàm hình chiếu này chỉ phản ánh hình dạng đối tượng và bỏ qua chi tiết mức xám bên trong. Mỗi hình dạng duy nhất tương ứng với một hình chiếu duy nhất và, hơn thế nữa, với một tập mô men duy nhất. Tham số j + k gọi là bậc của mô men. Chỉ có duy nhất một mô men bậc 0, 386
  M 00    f  x, y dxdy (18)   Và rõ ràng đây là diện tích của đối tượng. Có hai mô men bậc nhất và cứ như vậy, có nhiều mô men bậc cao hơn. Ta có thể khiến cho tất cả các mô men bậc nhất và bậc cao hơn bất biến mà không ảnh hưởng đến kích thước đối tượng bằng cách chia chúng cho M00. 19.3.3.1. Mô men trung tâm Các toạ độ trọng tâm của đối tượng là M 10 M 01 x y (19) M 00 M 00 Cái gọi là mô men trung tâm được tính bằng cách sử dụng trọng tâm như ban đầu  x  x  y  y    j k M jk   f  x, y dxdy (20)   Các mô men trung tâm không thay đổi vị trí. 19.3.3.2. Trục chính Góc quay  làm cho mô men trung tâm bậc hai 11 triệt tiêu có thể thu được từ 2 11 tan 2  (21)  20   02 Các trục toạ độ x’, y’ nằm lệch một góc  so với các trục x, y gọi là trục chính của đối tượng. Vấn đề nhập nhằng 900 trong biểu thức (21) có thể được giải quyết nếu chúng ta chỉ rõ rằng  20   20  30  0 (22) Nếu quay đối tượng đi một góc  trước khi tính mô men, hay nếu các mô men được tính liên quan đến các trục x’, y’ thì các mô men là bất biến quay. 19.3.3.3. Mô men bất biến Các mô men trung tâm đã tính liên quan đến trục chính không thay đổi dưới các phép phóng đại, tính tiến và quay đối tượng. Chỉ các mô men bậc ba và cao hơn là quan trọng sau phép đơn giản hoá như trên. Độ lớn của các mo men này phản ánh hình dạng đối tượng và có thể sử dụng trong nhận dạng mẫu. Các mô men bất biến và các phép kết hợp mô men bất biến đã được ứng dụng để nhận dạng chữ viết và phân tích nhiễm sắc thể. Trong khi các mô men bất biến có một vài tính chất mà các đặc trưng hình dạng cần phải có, thì trong một trường hợp đặc biệt nào đó có thể có tất cả hoặc một vài tính chất đó. Tính duy nhất của hình dạng đối tượng được trải rông ra trên một tập vô hạn các mô men. Vì thế, để phân biệt những hình dạng giống nhau có thể đòi hỏi một tập lớn các đặc trưng. Bộ phân loại có thứ nguyên cao có thể trở nên rất nhạy cảm với nhiễu và những thay đổi bên trong lớp. Trong một vài trường hợp, một vài mô men có bậc tương đối thấp có thể phân biệt các đặc tính hình dạng của đối tượng. Một thử nghiệm sẽ cho thấy rằng các đặc trưng hình dạng của các mô men bất biến là chắc chắn và sáng suốt. 387
Ảnh mức xám. Nếu ta đặt f(x, y) là ảnh mức xám của một đối tượng, chứ không phải là hàm hình chiếu nhị phân, chúng ta có thể tính tính mô men bất biến như trước đây. Mô men bậc 0 [biểu thức (18)] trở thành mật độ quang học tích hợp, thay vì là diện tích. Tuy nhiên, phát triển trước đây sẽ được áp dụng theo một kiểu tương tự. Với các ảnh mức xám, mô men bất biến phản ánh không chỉ hình dạng đối tượng, mà còn mật độ phân bố bên trong đó. Giống như trên, nó phải được chứng tỏ, cho từng bài toán nhận dạng đối tượng, rằng một lượng mô men bất biến nhỏ vừa phải có thể phân biệt chính xác các đối tượng khác nhau. 19.3.4. Miêu tả hình dạng Đôi khi nó được dùng để miêu tả hình dạng một đối tượng theo cách chi tiết hơn khi đưa ra bằng một tham số đơn nhưng đầy đủ hơn đẻ phản ánh bản thân ảnh đối tượng. Một miêu tả hình dạng là sự biểu diễn đầy đủ hình dạng một đối tượng. 19.3.4.1. Chuỗi mã vi phân Một miêu tả hình dạng là một chuỗi mã đường bao đã đề cập trong chương trước. Hình 19-6 cho thấy một đối tượng đơn giản với chuối mã đường bao của nó và đạo hàm chuỗi mã đường bao. Chuỗi mã đường bao cho biết độ cong của đường bao, tính lồi và tính lõm xuất hiện như các đỉnh nhọn, trong khi chuỗi mã đường bao đưa góc tiếp tuyến với đường bao như hàm quãng đường xung quanh đối tượng. Có thể phân tích cả hai hàm hơn nữa để thu được số đo hình dạng. Những hình dạng đa giác có một độ lồi dễ nhận biết nhờ đỉnh và vì thế có thể phân ra khỏi chuỗi mã vi phân. Ví dụ, một số đo mang tính chất tam giác có thể là biên độ hàm điều hoà thứ ba của một khai triển chuỗi Fourier của chuỗi mã vi phân. Sau đó ta có thể phân biệt các tam giác và các hình vuông nhờ sử dụng tỷ số biên độ hàm điều hoà thứ ba và thứ tư. Làm trơn chuỗi mã đường bao thường được thực hiện trước phép vi phân. HÌNH 19-6 Hình 19-6 Chuỗi mã và đạo hàm của nó 19.3.4.2. Miêu tả Fourier Chúng ta đã nghiên cứu ba hàm tuần hoàn khác nhau, chúng miêu tả đầy đủ hình dạng một đối tượng: chuỗi mã đường bao, hàm đường bao cực (hình 19-3a) và hàm đường bao phức (hình 19-3b). Vì hàm nào cũng tuần hoàn nên biến đổi Fourier một chu kỳ của một hàm nào đó là biểu diễn luân phiên hình dạng đối tượng kết hợp lại. 388
Cũng vì nó tuần hoàn nên mỗi hàm đường bao có một phổ (lấy mẫu) rời rạc. Cường độ xung trong phổ tương ứng với các hệ số khai triển chuỗi Fourier của hàm (tuần hoàn). Trong nhiều trường hợp, ta có thể lọc thông thấp phổ hàm đường bao mà không phá hỏng hình dạng đặc trưng của đối tượng. Nghĩa là chỉ có biên độ và pha của xung tần số thấp trong phổ (chẳng hạn các hệ số Fourier bậc thấp) mới cần để mô tả đặc điểm đối tượng. Các giá trị này sẽ đại diện cho miêu tả hình dạng. 19.3.4.3. Biến đổi trục trung vị Một kỹ thuật làm giảm dữ liệu mà vẫn giữ nguyên thông tin hình dạng là biến đổi trục trung vị (Medial Axis Transform) đã đề cập trong chương trước. Một điểm bên trong đối tượng thuộc đường trung vị nếu và chỉ nếu nó là tâm đường tròn tiếp xúc với đường bao đối tượng tại hai điểm cách biệt nhau. Giá trị của mỗi điểm thuộc trục trung vị là bán kính của một đường tròn vừa đề cập. Nó biểu diễn khoảng cách ngắn nhất thừ điểm đó đến đường bao. Có mộtt phương pháp tìm trục trung vị là phép co. Phương pháp này liên tục loại bỏ chu vi ngoài cùng của các điểm theo cách giống như bóc vỏ một củ hành. Nếu viẹc loại bỏ một điểm nào đó làm mất liên kết đối tượng thì điểm đó thuộc trục trung vị. Giá trị của nó đơn giản là số lớp bị bóc đi trước đó. Đối với ảnh nhị phân, trục trung vị vẫn có hình dạng đối tượng ban đầu. Nghĩa là phép biến đổi có thể đảo ngược và có thể khôi phục lại đối tượng từ biến đổi trục trung vị của nó. Khi lập trình trên ảnh số sử dụng lưới lấy mẫu hình chữ nhật, phép đảo có thể cho kết quả hơi khác đối tượng ban đầu. Hình 19-7a là ảnh của một nhiễm sắc thể, hình 19-7b cho thấy biến đổi trục trung vị của nó. Ảnh trong hình (a) được tính bằng thuật toán R. J. Wall. Hình 19-7c trình bày mức độ phụ thuộc của biến đổi trục trung vị vào hướng của đối tượng khi có sử dụng lưới lấy mẫu. Biến đổi trục trung vị cũng có thể được tính cho ảnh mức xám. Biến đổi trục trung vị thường được dùng để tìm trục trung tâm của các đối tượng dài, hẹp, cong như các nhiễm sắc thể. Thường thì nó chỉ được sử dụng như một đồ thị và các giá trị mà nó tạo ra đều bị bỏ qua. Các miêu tả hình dạng khác, ví dụ như số nhánh mà đối tượng có và tổng chiều dài đối tượng, có thể được tính từ đồ thị của chính nó. HÌNH 19-7 Hình 19-7 Biến đổi trục trung vị: (a) ảnh số; (b) biến đổi trục trung vị; (c) tác động của sự định hướng 389
19.4. PHÂN TÍCH KẾT CẤU Nếu bạn hỏi 10 người xem họ có biết kết cấu là gì không, đa số sẽ nói rằng họ biết. Tuy nhiên, bạn sẽ nhận được ở họ 10 định nghĩa khác nhau hoàn toàn. 19.4.1. Định nghĩa Từ kết cấu nguyên thuỷ là để chỉ vẻ bề ngoài của vải dệt, nhưng một định nghĩa tổng quát là “sự tổ chức sắp xếp hay các đặc điểm của các phần tử cấu tạo, đặc biệt là về bề mặt bên ngoài hay chất lượng đích thực”. Một định nghĩa xác đáng hơn đối với vấn đề của chúng ta là “một thuộc tính thể hiện sự sắp xếp về mặt không gian các mức xám của các điểm ảnh trong một khu vực”. Do đó, chúng ta đã quan tâm đến việc xác định kết cấu của một đối tượng có trong một ảnh. Nếu các mức xám ở khắp nơi đều là hằng số, hoặc gần như vậy, thì chúng ta nói rằng đối tượng không có kết cấu. Nếu các mức xám thay đổi đáng kể trong đối tượng-ngoại trừ hình dạng đơn giản-thì đối tượng là có kết cấu. Khi chúng ta theo đuổi để xác định kết cấu, chúng ta cố gắng xác định số lượng mức xám thay đổi bên trong một đối tượng. Nhiễu điện từ được sinh ra bởi camera và nhiễu hạt phim là các ví dụ cho kết cấu ngẫu nhiên. Trong các trường hợp đó, sự biến thiên mức xám trong đối tượng rất khó có thể nhận biết được. Ngược lại, việc khắc đường chéo (cross-hatching) là một mẫu kết cấu biểu lộ tính cân đối có khả năng nhìn thấy. Kết cấu ngẫu nhiên có đặc điểm phổ biến nhất là các tính chất thống kê như độ lệch tiêu chuẩn của mức xám (đối với vệc xác định kích thước kết cấu). Các kết cấu mẫu có thể được mô tả đặc điểm thêm bằng cách trích chọn các số đo xác định số lượng tự nhiên và tính định hướng của mẫu. Một đặc trưng kết cấu là một giá trị, được tính từ ảnh của một đối tượng, xác định số lượng mức xám đặc trưng nào đó thay đổi trong đối tượng. Bình thường, một đặc trưng kết cấu là độc lập với vị trí, hướng, kích thước, hình dạng và mức xám trung bình (độ sáng) của đối tượng. 19.4.2. Phân đoạn kết cấu Đôi khi các đối tượng khác với nên xung quanh, và khác nhau, về kết cấu nhưng không khác nhau về độ sáng trung bình. Trong trường hợp đó, phân đoạn ảnh phải dựa trên cơ sở kết cấu. Điều này đầu tiên được thực hiện bằng việc tính kết cấu ảnh mà tại nơi đó mức xám của mỗi điểm ảnh tác động đến một tính chất nào đó của kết cấu trong vùng chứa điểm ảnh đó. Trong ảnh này, các đối tượng khác nhau về mức xám và có thể phân đoạn ảnh bằng phương pháp thông thường. Các kỹ thuật xác định kết cấu được đề cập trong phần này sẽ ánh xạ những đặc điểm kết cấu thành những giá trị mức xám và vì thế có thể cũng được sử dụng cho phân đoạn ảnh. 19.4.3. Các đặc trưng kết cấu thống kê Các số đo thông kê dự biến thiên mức xám đơn giản bao gồm độ lệch tiêu chuẩn, độ biến thiên, độ nghiêng. Chúng có thể được tính như các mô men lược đồ mức xám của đối tượng, N Hi  M / N I  (23) i 1 H i 1  H i / M   M 1  1 / N  N 390
Trong đó M là số các điểm ảnh trong đối tượng và N là số các mức xám trong thang xám. Nghiên cứu cho thấy rằng mắt người không nhạy cảm với các độ chênh lệch kết cấu có bậc cao hơn hai (chẳng hạn độ biến thiên). Tuy nhiên, điều này không ngăn ngừa được những đặc trưng kết cấu từ việc lợi dụng các độ chênh lệch có thể xác định nếu chúng tồn tại trong các đối tượng riêng biệt. 19.4.3.1. Ma trận đồng thời xuất hiện (Co-Occurrence Matrix) Giả sử rằng chúng ta thiết lập một hướng (ngang, dọc, …) và một khoảng cách (một điểm ảnh, hai điểm ảnh, …) trong một ảnh. Khi đó phần tử thứ i, j của ma trận đồng thời xuất hiện P đối với một đối tượng là số lần, chia cho M, mà các mức xám i và j xuất hiện trong hai điểm ảnh riêng biệt theo khoảng cách và hướng đó trong đối tượng, trong đó M là số cặp điểm ảnh đóng góp vào P. Ma trận P là N  N, trong đó thang xám có N sắc thái xám. Các ma trận đồng thời xuất hiện khác nhau có thể được thiết lập cho từng kết hợp khoảng cách và hướng. Tổng số cặp điểm ảnh, M, góp phần vào ma trận ít hơn số các điểm ảnh trong đối tượng, và nó suy giảm theo việc tăng khoảng cách. Vì thế, ma trận có thể là rất thưa thớt đối với các đối tượng nhỏ. Do nguyên nhân này, thang xám N thường bị giảm-từ 256 xuống còn 8 mức xám-đối với sự tính toán ma trận đồng thời xuất hiện. Một khi ma trận đồng thời xuất hiện được thực hiện, các đặc trưng kết cấu có thể được tính từ đó. Một số lượng các đặc trưng dựa trên ma trậ đồng thời xuất hiện đã được định nghĩa và thử nghiệm. Các ví dụ kể cả entropy, N N H   Pij log Pij (24) i 1 j 1 Quán tính N N 2 I   i  j  Pij (25) i 1 j 1 Và entropy N N E   Pij   2 (26) i 1 j 1 Một vài đặc trưng kết cấu trên cơ sở ma trận đồng thời xuất hiện tương ứng với các đặc điểm mà mắt có thể nhận thấy, nhưng nhiều đặc trưng không phải như vậy. Nói chung, ta phải xác định bằng thực nghiệm những đặc trưng có khả năng phân biệt. 19.4.4. Các đặc trưng kết cấu khác Đặc trưng phổ. Đối với một ảnh đã cho, tất nhiên biến đổi Fourier chứa thông tin đầy đủ về kết cấu của ảnh. Vì thế, có thể nó sẽ hữu dụng để nhận được các đặc trưng kết cấu từ phổ, cũng như từ chính đối tượng. Người ta có thể tính trung bình phổ hai chiều theo các vòng hình khuyên để tạo ra một hàm một chiều có tần số bỏ qua tính định hướng. Tương tự, ta có thể lấy trung bình phổ theo các phần xuyên tâm để tạo ra một hàm có góc mà tính định hướng của mẫu kết cấu là duy nhất. Mỗi một hàm có thể giảm hơn nữa xuống thành các đặc trưng vô hướng xuất hiện khả năng phân biệt cần thiết. Bình thường, ta kiểm tra các 391
hàm đã giảm chiều từ các lớp khác nhau để xác định cách giảm chúng thành các vô hướng như thế nào. Đối với một đối tượng có hình dạng kỳ quặc, nhỏ, nó có thể là một sự thách thức để tính phổ hai chiều. Người ta có thể biến đổi một hay nhiều hình vuông hoàn toàn kín trong đối tượng, bằng cách lấy trung bình phổ của chúng với nhau. Mặt khác người ta có thể đệm thêm ảnh vuông, rộng với dữ liệu giả bên ngoài đối tượng đẻ khiến cho nó hoàn chỉnh. Đặc trưng cấu trúc. Tiếp cận cấu trúc với phân tích kết cấu giả thiết rằng mẫu kết cấu được tổng hợp từ sự sắp xếp không gian của các nguyên mẫu kết cấu. Chúng là những đối tượng nhỏ tạo thành một khối mẫu được lặp đi lặp lại. sau đó sự trích chọn đặc tính trở thành nhiệm vụ của việc định vị các nguyên mẫu và việc xác định số lượng sắp xếp không gian của chúng. Xem xét ảnh của một phần mô gan mà trong đó tế bào nhân đã xơ cứng như một ví dụ. Các nguyên mẫu là các nhân và chúng được phân bố khá đồng bộ khắp các mô khoẻ mạnh. Tuy nhiên, các quá trình bệnh tật nào đó làm cho tế bào ngẫu nhiên bị chết, phá vỡ tổ chức không gian của các tế bào. Vì thế, độ lệch trung bình và độ lệch tiêu chuẩn của khoảng cách phân tách các tế bào lân cận được coi là các đặc trưng kết cấu có cấu trúc. 19.5. ĐƯỜNG CONG VÀ ĐIỀU CHỈNH BỀ MẶT Đôi khi trong phân tích ảnh nó được sử dụng để điều chỉnh hàm một chiều, ví dụ như một đa thức hay hàm Gauss, thông qua tập các điểm dữ liệu. Biến đổi đa thức (phần 8.3.4) đòi hỏi điều đó. Ví dụ, rõ ràng là ta có thể tìm thấy tiêu điểm bàng cách điều chỉnh một parabol hay hàm Gauss thông qua một đồ thị có tham số tiêu điểm với vị trí trục z và vì thế giải quyết được vấn đề xác định vị trí đỉnh nhọn. Thỉnh thoảng nó cũng được dùng để điều chỉnh mặt hai chiều, ví dụ như một đa thức hai chiều hay hàm Gauss, thông qua một ảnh hay một phần ảnh. Có thể thực hiện điều này đối với việc loại bỏ nhiễu khi ảnh cơ sở (không có nhiễu) có dạng hàm đã biết hay cho trước. Quá trình điều chỉnh xác định các tham số của biểu thức hàm sao cho có thể tính toán ảnh trong dạng không có nhiễu. Điều chỉnh bề mặt cũng có thể dùng để loại trừ nhiễu khi một trong các thành phần nhiễu (ví dụ như sắc thái mẫu) có thể được điều chỉnh, tính toán và trừ đi. Điều chỉnh bề mặt cũng có thể thực hiện với cá mục đích đo lường khi đối tượng quan tâm có một dạng hàm đã biết hay đã cho trước. Ví dụ, có thể mô phỏng các ngôi sao trong một ảnh vũ trụ như các hàm Gauss hai chiều. bởi vì thủ tục điều chỉnh xác định giá trị các tham số đặc trưng cho từng đối tượng (chẳng hạn như vị trí, kích thước, hình dạng, biên độ), nên nó cũng thoả mãn hàm xác định kích thước. 19.5.1. Điều chỉnh sai số bình phương trung bình tối thiểu Cho một tập các điểm (xi, yi), một kỹ thuật thường sử dụng là tìm hàm f(x) để tối thiểu hoá sai số bình phương trung bình. Hàm này được cho bởi N MSE    y i  f  xi  2 (27) i 1 Trong đó (xi, yi) là các điểm dữ liệu, i = 1,…, N. Nếu f(x) là đường parabol thì biểu thức của nó là f  x   c 0  c1 x  c 2 x 2 (28) 392
Và thủ tục điều chỉnh đường cong được sử dụng để xác định giá trị các hệ số c0, c1 và c2 một cách tốt nhất. Tức là, chúng ta muốn xác định giá trị các hệ số sao cho các hệ số này làm cho parabol bỏ qua các điểm đã cho với sai số nhỏ nhất, theo nghĩa bình phương trung bình. 19.5.2. Công thức ma trận Thật thuận tiện khi dùng ma trận đại số để giải bài toán trước đây. chúng ta bắt đầu bằng việc tạo các ma trận B chứa các giá trị x đã cho, Y chứa các giá trị y và C chứa các hệ số như sau:  y1  1 x1 x12   y2    c 0  1 x2 x 22  Y   B C   c1  (29)            c 2   yN  1 x N x N2  Bây giờ vec tơ cột chứa các giá trị sai số (một phần tử cho mỗi điểm dữ liệu) có thể viết lại như sau E  Y  BC (30) Trong đó ma trận tích BC là vec tơ cột của các giá trị y tính từ biểu thức (28). Biểu thức (27) đối với sai số bình phương trung bình bây giờ được cho bởi 1 T MSE  E E (31) N Thay biểu thức (30) vào biểu thức (31), lấy vi phân theo các phần tử của C và cho đạo hàm bằng 0 để giải  C  BT B  B Y  1 T (32) Là vec tơ các hệ số tối thiểu hoá sai số bình phương trung bình. Ma trận vuông [B B]-1BT gọi là ma trận giả ngược (pseudoinverse) của B và cách giải quyết này gọi T là phương pháp giả ngược. Chú ý rằng nếu số các điểm bằng số các hệ số thì B là ma trận vuông và có thể lấy nghịch đảo trực tiếp (chứng tỏ nó không duy nhất). Trong trường hợp này, biểu thức (32) rút gọn còn lại C  B 1Y (33) Và chúng ta phải giải bài toán quen thuộc về tập các biểu thức tuyến tính nhiều ẩn. 19.5.3. Điều chỉnh parabol một chiều Chúng ta coi việc điều chỉnh một parabol nhờ một tập năm điểm, như một ví dụ cụ thể. Các giá trị là 393
 0. 9  1.8  1 0.9 0.81  2.2 3 1 2.2 4.84       X  3  Y  2.5 B  1 3 9  (34)        4 3 1 4 16   5   2  1 5 25  Và hình 19-8 cho thấy cụm các điểm và parabol phù hợp nhất, được xác định bằng phương pháp này. Các phép tính tạo ra  5 15 56   12.3   0.747  B B  15 56 227 T B Y   37.7  T vµ C   1.415  (35) 56 227 986  136.5  .230 Chúng ta có thể so sánh những giá trị đã tính với dữ liệu và vec tơ sai số quan sát: 1.8  1.83    .03 3   2.75   .25       Y   2. 5 BC   2.92 E    .42  (36)       3   2.73   .27   2  2.07   .07  Ví dụ, nếu đây là một ứng dụng tìm đỉnh parabol, đặt đạo hàm của biểu thức (28) bằng 0 cho phép ta giải với -c2 x max   3.076 vµ f  x max   2.923 (37) 2c 3 Nếu các nghiệm là các mức xám thuộc một dòng quét thì các xi’ được đặt cách những khoảng bằng nhau, nhưng nói chung không có hạn chế về sự sắp xếp các điểm. Chúng có thể là một cụm điểm rải rác bất kỳ. Thực tế, có một sự hạn chế duy nhất đó là f(x) là hàm của x và vì thế nó có giá trị duy nhất với mọi x. Tức là, f() không thể chống lại chính nó để điều chỉnh dữ liệu. Thừa số thứ nhất của vế phải biểu thức (32) biểu diễn một phép nghịch đảo ma trận và đây là một chướng ngại vật trong tính toán. Tuy nhiên, ma trận này chỉ là 33, cho nên vấn đề có bao nhiêu điểm được dùng để điều chỉnh không quan trọng lắm. Vì thế, sự phức tạp về tính toán không quá mức nặng nề. HÌNH 19-8 394
Hình 19-8 Điều chỉnh một parabol bằng 5 điểm dữ liệu 19.5.4. Điều chỉnh đường bậc ba hai chiều Ta có thể tổng quát hoá kỹ thuật trước đây cho các đa thức có bậc lớn hơn hai cũng như các hàm hai chiều. Một kỹ thuật san phẳng nền hiệu quả có được từ việc điều chỉnh đa thức hai chiều nhờ vào sự tập hợp các điểm nền có mức xám thấp đã được chọn. Sau đó đem ảnh trừ đi hàm kết quả để san phẳng nền. chúng ta minh hoạ kỹ thuật này bằng trường hợp điều chỉnh đường bậc ba hai chiều. Hàm có 10 số hạng: f  x, y   c0  c1 x  c 2 y  c3 xy  c 4 x 2  c5 y 2  c6 x 2 y  c7 xy 2  c8 x 3  c9 y 3 (38) Ma trận B là N  10: 1 x1 y1 x1 y1 x12 y12 x12 y1 x1 y12 x13 y13  B  (39)           Do đó, phép nghịch đảo ma trận 10  10 cần cho biểu thức (32). Hình 19-9 trình bày một ví dụ trừ nền sử dụng điều chỉnh đường bậc ba hai chiều. HÌNH 19-9 Hình 19-9 Điều chỉnh đường bậc ba hai chiểu thông qua nền của một ảnh: (a) ảnh chứa một vệt nhiễu, nền nhạt hơn; (b) đường bậc ba điều chỉnh bằng các điểm nền; (c) ảnh sau khi trừ nền 19.5.5. Điều chỉnh Gauss hai chiều Người ta có thể đo đối tượng hình tròn hay hình elip trong một ảnh bằng cách điều chỉnh một bề mặt Gauss hai chiều khắp ảnh. Biểu thức Gauss hai chiều là   x  x 2  y  y 2    i 2o  i 2o   2 x 2 y  z t  Ae (40) Trong đó A là biên độ, (x0, y0) là vị trí còn x và y là các độ lệch tiêu chuẩn (các bán kính) hai chiều. Nếu lấy logarit hai vế, khai triển bình phương và nhóm số hạng, ta được một phương trình bậc hai theo x và y. Nhân cả hai vế với z1, ta được 395
 x o2 y o2  x y 1 2 1 2 z i ln  z i   ln  A  2  z  o2 x i z i   o2  y i z i   2 i 2 x 2 y  x y 2 2 x  xi z i   2 y2   yi z i  (41) Nó được viết dưới dạng ma trận như sau Q  CB (42) Trong đó Q là véc tơ N  1 với các phần tử qi  z i ln  z i  (43) C là một vec tơ 5 phần tử gồm toàn bộ các tham số Gauss  xo2 y o2 x o y o 1 1  C  ln  A  2  T  (44)  2 x 2 2y  x2  y2 2 x2 2 y2  Và B là ma trận N  5 có hàng thứ i bi   z i z i xi z i y i z i xi2 z i y i2  (45) Ma trận C được tính bằng biểu thức (32) như trước đây, từ đó ta có thể khôi phục các tham số Gauss bằng 1 1  x2   y2  2c 4 2c 5 (46) 2 2 x o  c 2 x y o  c3 y Và  x y   c1  o  o   2 x 2 2y  2 Ae (47) Chỉ ma trận 5  5 phải lấy nghịch đảo, bất chấp N, số điểm sử dụng điều chỉnh. Hình 19-10a cho thấy một hàm Gaus đã được điều chỉnh với một đỉnh nhiễu bằng phương pháp này. Ảnh thô là một hàm Gauss được tính bằng nhiễu cộng ngẫu nhiên. Bảng 19-1 so sánh các tham số có được sau điều chỉnh với những tham số tạo ra ảnh. Không thể khôi phục chính xác hàm Gauss ban đầu do nhiễu. Tuy nhiên, các tham số trong bảng được đáng giá là khá tốt, hình 19-10b là một bản sao có thể chấp nhận dạng không nhiễu của nó. HÌNH 19-10 396
Hình 19-10 Điều chỉnh Gauss hai chiều với mộ đỉnh nhiễu: (a) ảnh thô; (b) điều chỉnh Gauss. Sai số RMS là 6% so với biên độ đỉnh BẢNG 19-1 CÁC THAM SỐ GAUSS THỰC TẾ VÀ ĐÃ ĐIỀU CHỈNH BẢNG 19-1 19.5.6. Điều chỉnh Elip Trong nhiều loại ảnh, các đối tượng quan tâm là hình tròn, hay ít ra cũng là hình elip. Vì thế, đây là cách rất có ích để có thể điều chỉnh một elip có kích thước, hình dạng và hướng tuỳ ý thành tập hợp các điểm biên. Biểu thức tổng quát cho phần hình nón là ax 2  bxy  cy 2  dx  ey  f  0 (49) Và nó sẽ là elip nếu b 2  4ac  0 (50) Một elip được xác định bằng 5 tham số: toạ độ tâm x, y của nó, chiều dài các bán trục lớn và bán trục nhỏ và góc giữa trục chính của nó tạo thành với trục ngang. Ta có thể điều chỉnh một elip qua 5 điểm bằng cách thay thế toạ độ của chúng vào biểu thức (49) và giải năm phương trình cùng một lúc. Ta có thể nhận được một cách điều chỉnh tốt nhất qua nhiều điểm hơn bằng cách điều chỉnh các elip qua các tập con năm điểm và lấy trung bình (hay lấy giá trị nằm giữa) các tham số của chúng. Không mất tính tổng quát, chúng ta có thể đơn giản hoá biểu thức (49) bằng cách đặt a = 1. Sau đó, viết lại tổng các sai số bình phương như sau  2   xi2  bx i y i  cy 2y  dx i  ey i  f  2 (51) i Nếu ta đạo hàm từng phần biểu thức (51) theo các hệ số a, b, c, d và đặt từng hệ số bằng 0, ta sẽ thu được năm biểu thức dạng tổng của các luỹ thừa và các tích theo xi và yi mà có thể giải đồng thời với các hệ số này. Thủ tục có thể được thực hiện bằng phép nghịch đảo ma trận 5  5 như trước đây. 19.5.7. Nghiên cứu thực tiễn Nếu ta điều chỉnh các đa thức lặp đi lặp lại với các dòng quát liên tiếp trong một ảnh, thì ma trận B sẽ không thay đổi từ dòng này sang dòng khác và việc lấy nghịch đảo ma trận chỉ cần thực hiện một lần. Đây là vấn đề qua trọng để lựa chọn các điểm sử dụng trong thủ tục điều chỉnh sao cho chúng có thể khôi phục toàn bộ vùng mà ta quan tâm. Hành vi của hàm bên ngoài vùng, mà trên đó nó bị ép buộc để điều chỉnh dữ liệu thực tế, có thể rất khó đoán trước. Khi điều chỉnh một ảnh, đó cũng là một điều quan trọng để khôi phục toàn bộ ảnh bằng các điểm mẫu, thậm chí cả khi thưa thớt (N nhỏ). Nếu N là nhỏ và các điểm dữ liệu không bị rải rác nhiều trên toàn bộ ảnh, thì ta có thể bắt gặp những vấn đề trong tình trạng tồi tệ trong khi nghịch đảo ma trận. Số các điểm ít nhất phải bằng số cột trong ma trận B và tốt nhất là gấp hai đến ba lần số cột. Ta có thể điều chỉnh một đường cong bằng một nhóm điểm trong không gian hai chiều. Một ví dụ về điều chỉnh trục bằng khung làm mảnh của một đối tượng cong 397
tuyến tính. Tuy nhiên, trong thực tế sự điều chỉnh bị giới hạn do f(x) chỉ có một giá trị đơn với mọi x. Điều này có thể ngăn cản đường cong được chấp nhận thông qua nhóm điểm. Ví dụ. nếu các điểm được sắp xếp thẳng hay không thẳng hơn thì sẽ không thích hợp để có được một sự điều chỉnh có thể chấp nhận với y = f(x). Trong trường hợp đó, tốt hơn là nên điều chỉnh x = f(y) đối với dữ liệu. Nói chung, đó có thể là một điều đáng giá để xác định trục chính của một nhóm điểm dữ liệu và quay chúng sao cho trục nằm ngang trước khi áp dụng thủ tục điều chỉnh đường cong. Người ta có thể lựa chọn việc điều chỉnh các điểm dữ liệu với một hàm đã định nghĩa theo một hệ toạ độ quay. Với điều chỉnh Gauss hai chiều, điều cần thiết là các điểm mẫu phải nằm tản ra xung quanh đỉnh. Việc cố gắng điều chỉnh một hàm Gauss hai chiều vào một mặt của đỉnh chỉ chuốc lấy tai hoạ. Nếu các điểm dữ liệu xác định một độ dốc, thay vì một đỉnh, thì hàm Gauss được điều chỉnh là bề mặt bên dưới, c4 và c5 là dương, và độ lệch tiêu chuẩn (biểu thức (46)) là ảo. Tình huống này có thể xảy ra bất ngờ khi hàm được điều chỉnh với các điểm dữ liệu không phân bó đều ra xung quanh tất cả các mặt của đỉnh. Khi điều chỉnh một elip năm điểm, ta có thể thấy rằng các điểm dữ liệu điều chỉnh một parabol hay một hypecbol thay vì elip. Vì thế, đó là điều quan trọng để tác động tính logic vào bài tập điều chỉnh. 19.6. TỔNG KẾT NHỮNG ĐIỂM QUAN TRỌNG 1. Kích thước đối tượng được phản ánh trong các số đo diện tích, IOD, chiều dài, chiều rộng và chu vi trong số các đặc trưng khác. 2. Hình dạng đối tượng được phản ánh trong các số đo của hình chữ nhật điều chỉnh và tính hình tròn và trong các mô men bất biến. 3. Có thể mã hoá hình dạng đối tượng theo chuỗi mã, hàm đường bao cực, hàm đường bao phức và biến đổi trục trung vị. 4. Kết cấu có thể xác định được bằng các tiêu chuẩn thống kê, bằng các đặc trưng tính từ ma trận đồng thời xuất hiện và bằng các phương pháp tiếp cận cấu trúc và phổ. 5. Có thể việc điều chỉnh đường cong để đánh giá hàm cơ sở cho quan sát nhiễu, chứng tỏ rằng dạng hàm là đã biết hay đã được cho trước. 6. Một đa thức hay một hàm Gauss có thể được điều chỉnh với dữ liệu một hoặc hai chiều. Một ma trận nghịch đảo thường có kích thước tương đối nhỏ và hoạt động khá hiệu quả. 7. Khi điều chỉnh một đường cong hay một bề mặt, cần thiết phải sử dụng một tập các điểm dữ liệu nối toàn bộ vùng quan tâm. 8. Việc điều chỉnh bề mặt có thể được sử dụng để trích chọn một đối tượng quan tâm từ một ảnh hay để đánh giá biên độ, kích thước và các tham số hình dạng của đối tượng. Việc điều chỉnh bề mặt cũng có thể đánh giá một thành phần không cần thiết, ví dụ như sắc thái nền để có thể trừ nó ra. BÀI TẬP 1. Chứng minh rằng biểu thức (7) dẫn đến biểu thức (5). 2. Chứng minh rằng biểu thức (3) dẫn đến biểu thức (4). 3. Dưới đây là các toạ độ điểm biên của một đối tượng. Tính p2/A để xác định đối tượng có phải là hình tròn hay hình vuông không. x: [97 85 66 42 22 10 9 21 40 64 84 96] y: [78 98 110 111 99 80 56 36 24 23 35 54] 398
4. Dưới đây là các toạ độ điểm biên của một đối tượng. Tính p2/A để xác định đối tượng có phải là hình tròn hay hình vuông không. x: [460 580 560 540 520 380 240 100 120 140 160 300] y: [160 180 320 480 600 580 560 540 400 260 120 140] 5. Điều chỉnh một đường thẳng qua tập các điểm dưới đây và xác định giá trị x của chéo 0. Vẽ các điểm và đường đã điều chỉnh. x = [0 1 2 3] y = [.5 .8 2.2 2.8 ] 6. Dưới đây là các giá trị tham số tiêu điểm tại một vài vị trí trục z khác nhau. (Xem chương 15) Điều chỉnh một parabol qua các điểm và xác định vị trí trục z của tiêu điểm chính. Vẽ các điểm và phác hoạ parabol đã điều chỉnh. z = [0 2 3 5 7] f = [445 620 710 580 390] 7. Dưới đây là các giá trị tham số tiêu điểm tại một vài vị trí trục z khác nhau. (Xem chương 15) Điều chỉnh một hàm Gauss qua các điểm và xác định vị trí trục z của tiêu điểm chính. Vẽ các điểm và phác hoạ parabol đã điều chỉnh. z = [-8 –3 2 6 12] f = [41 62 58 60 38] 8. Dưới đây là một vài điểm nền từ một ảnh f(x, y) 480  512 có vấn đề về sắc thái. điều chỉnh một mặt phẳng qua các điểm, trừ nó từ các điểm đó và tính giá trị RMS của nhiễu còn lại. (Tuỳ chọn: Vẽ các điểm bag bề mặt đã điều chỉnh) x: [1 100 200 300 1 100 200 300 1 100 200 300 1 100 200 300] y: [1 1 1 1 100 100 100 100 200 200 200 200 300 300 300 300] f: [18 26 39 47 37 36 39 40 58 48 43 44 75 63 53 39] 9. Làm lại bài 8, sử dụng mặt bậc hai (song tuyến) g(x, y) = c0 + c1x + c2y + c3xy Nhiễu RMS giảm bao nhiêu với việc điều chỉnh mặt phẳng? Nếu vậy, theo hệ số bao nhiêu? (Tuỳ chọn: Vẽ các điểm và mặt đã điều chỉnh) 10. Dưới đây là mức xám tại một số điểm ảnh trên một dòng quét đơn (dòng ngang) trong một ảnh chụp bằng camera có vấn đề sắc thái từ trái sang phải. Điều chỉnh đường thẳng qua các điểm và vẽ các điểm cùng với đường đã điều chỉnh. Lấy các điểm đó trừ đi đường đã điều chỉnh và tính giá trị RMS của nhiễu còn lại. Kỹ thuật này đáng giá bao nhiêu trong phần mềm số hoá ảnh của bạn? Giả sử rằng sẽ phức tạp thêm chỉ khi nhiễu nền RMS có thể loại bỏ đi một nửa hay nhiều hơn. x = [1 100 200 300 400 500] f = [27 46 63 69 68 63] 11. Làm lại bài 10, sử dụng điều chỉnh bậc hai (parabol). Kỹ thuật này đáng giá bao nhiêu trong phần mềm số hoá ảnh của bạn? Giả sử rằng sẽ phức tạp thêm (xung quanh điều chỉnh tuyến tính) chỉ khi nhiễu nền RMS có thể loại bỏ đi một nửa hay nhiều hơn. 12. Làm lại bài 11, sử dụng điều chỉnh bậc ba (cubic). Kỹ thuật này đáng giá bao nhiêu trong phần mềm số hoá ảnh của bạn? Giả sử rằng sẽ phức tạp thêm (xung quanh điều chỉnh parabol) chỉ khi nhiễu nền RMS có thể loại bỏ đi một nửa hay nhiều hơn. Có phát sinh thêm các thủ tục điều chỉnh bậc cao hơn không? Tại sao có và tại sao không? 13. Làm lại bài 10, sử dụng các dữ liệu dưới đây: x = [1 100 200 300 400 500] f = [24 39 32 18 15 27] 399