
350
Ch¬ng 18
NHẬN DẠNG MẪU:
PHÂN ĐOẠN ẢNH
18.1. GIỚI THIỆU
Từ trước đến nay, trong cuốn sách này, chúng ta đã xem xét những phương pháp
chủ yếu để cải thiện ảnh hiển thị. Trong chương 16, tham vọng chúng ta là đạt được
một ảnh gần giống hơn so với ảnh ban đầu, ảnh không suy biến.
Trong chương này và hai chương tiếp theo, chúng ta sẽ đưa ra một vài hướng
phân tích nội dung của một ảnh. Nghĩa là chúng ta cố gắng tìm ra những gì có trong
ảnh. Chúng ta sẽ xem xét hai cách tiếp cận, nhận dạng mẫu thống kê và mạng nơ ron,
mỗi một phương pháp đều có thể áp dụng vào ảnh số. Các cuốn sách đã viết nhiều
về cả hai phương pháp này, giúp độc giả những người mong muốn tiếp tục tìm hiểu
với những giới thiệu về lĩnh vực này rất nhiều.
Trong 3 chương về nhận dạng mẫu này, chúng ta sẽ đưa ra một tập các chủ đề về
lĩnh vực này. Trong thực tế, chúng ta nghiên cứu nhận dạng mẫu thống kê, được thực
hiện bằng các kỹ thuật xử lý ảnh số. Việc này trước hết bao gồm việc định vị và cô
lập các đối tượng trong một ảnh và sau đó nhận biết (phân loại) những đối tượng đó
sử dụng kỹ thuật dựa trên lý thuyết quyết định thống kê. Chúng ta cũng xem qua việc
sử dụng mạng nơ ron nhân tạo cho việc nhận dạng mẫu.
18.1.1. Nhận dạng mẫu thống kê
Chi nhánh thị giác máy của lĩnh vực trí tuệ nhân tạo được nghiên cứu bằng cách
phát triển các thuật giải phân tích nội dung ảnh. Một sự đa dạng của những phương
pháp tiếp với mục đích hiểu ảnh đã được dùng, nhưng việc hiểu nó là nền tảng cho
sự nhận thức toàn bộ quá trình nhận dạng mẫu, tuy nhiên nó có thể được thực hiện.
Nhận dạng mẫu thống kê giả thiết rằng ảnh có thể chứa một hay nhiều đối tượng
và mỗi đối tượng đó thuộc một trong các kiểu, các loại hay các lớp mẫu đã định
nghĩa trước đây. Trong khi có thể thực hiện nhận dạng mẫu bằng nhiều cách, chúng
ta chỉ quan tâm tới việc thực hiện nó bằng các kỹ thuật xử lý ảnh số.
Cho một ảnh số có chứa một vài đối tượng, quá trình nhận dạng mẫu gồm có 3
pha chính. (Xem Hình 18-1) Pha đầu tiên được gọi là phân đoạn ảnh hay cô lập đối
tượng, trong đó mỗi đối tượng được tìm ra và ảnh của nó tách ra khỏi cảnh còn lại.
Pha thứ hai gọi là trích chọn đặc trưng. Đây là pha mà các đối tượng được đo
lường. Một số đo là giá trị của một tính chất nào đó có thể xác định số lượng của một
đối tượng. Một đặc trưng là một hàm của một hay nhiều số đo, được tính toán sao
cho nó có thể nó xác định được một tính chất quan trọng nào đấy của đối tượng. Quá
trình trích chọn đặc trưng tạo ra một tập các đặc trưng, cùng nhận được, bao gồm vec
tơ đặc trưng. Điều này đã làm giảm khối lượng thông tin (so với ảnh ban đầu) biểu
diễn mọi tin tức mà các quyết định thống kê phải dựa vào đó. Thật là hữu ích để nhận
thức hoá một không gian n chiều mà trong đó mọi vec tơ đặc trưng n phần tử có thể
có đều tập trung vào. Vì thế, một đối tượng riêng biệt bất kỳ đều tương ứng với một
điểm trong không gian đặc trưng.
Pha thứ ba trong nhận dạng mẫu là phân loại, đầu ra của nó chỉ đơn thuần là một
quyết định về lớp các đối tượng. Mỗi đối tượng được coi như thuộc một loại cụ thể,
và sự nhận dạng được thực hiện như một quá trình phân loại. Từng đối tượng được