350
Ch¬ng 18
NHẬN DẠNG MẪU:
PHÂN ĐOẠN NH
18.1. GIỚI THIỆU
T trước đến nay, trong cun sách này, chúng ta đã xem t nhng phương pháp
ch yếu đ ci thin nh hin th. Trong chương 16, tham vng chúng ta là đạt được
mt nh gn ging hơn so vi nh ban đầu, nh không suy biến.
Trong chương này hai chương tiếp theo, chúng ta s đưa ra mt vài hưng
phân tích ni dung ca mt nh. Nghĩa chúng ta c gng tìm ra nhng gì có trong
nh. Chúng ta s xem xét hai cách tiếp cn, nhn dng mu thng kê và mng nơ ron,
mi mt phương pháp đều th áp dng vào nh s. Các cun sách đã viết nhiu
v c hai phương pháp này, giúp độc gi nhng người mong mun tiếp tc tìm hiu
vi nhng gii thiu v lĩnh vc này rt nhiu.
Trong 3 chương v nhn dng mu này, chúng ta s đưa ra mt tp các ch đề v
lĩnh vc này. Trong thc tế, chúng ta nghiên cu nhn dng mu thng kê, được thc
hin bng các k thut x nh s. Vic này trước hết bao gm vic đnh v
lp các đối tượng trong mt nh và sau đó nhn biết (phân loi) nhng đối tượng đó
s dng k thut da trên thuyết quyết đnh thng kê. Chúng ta cũng xem qua vic
s dng mng nơ ron nhân to cho vic nhn dng mu.
18.1.1. Nhn dng mu thng kê
Chi nhánh th giác máy ca lĩnh vc ttu nhân to được nghiên cu bng cách
phát trin c thut gii phân tích ni dung nh. Mt s đa dng ca nhng phương
pháp tiếp vi mc đích hiu nh đã được dùng, nhưng vic hiu nn tng cho
s nhn thc toàn b quá trình nhn dng mu, tuy nhiên nó có th được thc hin.
Nhn dng mu thng gi thiết rng nh th cha mt hay nhiu đối tưng
và mi đối tượng đó thuc mt trong các kiu, các loi hay các lp mu đã đnh
nghĩa trưc đây. Trong khi th thc hin nhn dng mu bng nhiu cách, chúng
ta ch quan tâm ti vic thc hin nó bng các k thut x nh s.
Cho mt nh s cha mt vài đối tượng, qtrình nhn dng mu gm 3
pha chính. (Xem Hình 18-1) Pha đầu tiên được gi phân đon nh hay lp đi
tượng, trong đó mi đối tượng đưc tìm ra nh ca nó tách ra khi cnhn li.
Pha th hai gi trích chn đặc trưng. Đây pha c đối tưng được đo
lường. Mt s đo là giá tr ca mt tính cht nào đó th xác định s lượng ca mt
đối tượng. Mt đặc trưng là mt hàm ca mt hay nhiu s đo, được tính toán sao
cho nó có th nó xác định được mt tính cht quan trng nào đy ca đối tượng. Quá
trình trích chn đc trưng to ra mt tp các đặc trưng, cùng nhn được, bao gm vec
tơ đặc trưng. Điu này đã làm gim khi lượng thông tin (so vi nh ban đu) biu
din mi tin tc mà các quyết đnh thng kê phi da vào đó. Tht là hu ích để nhn
thc hoá mt không gian n chiu mà trong đó mi vec tơ đặc trưng n phn t có th
đều tp trung vào. Vì thế, mt đối tượng riêng bit bt k đu tương ng vi mt
đim trong không gian đặc trưng.
Pha th ba trong nhn dng mu phân loi, đầu ra ca ch đơn thun mt
quyết đnh v lp các đi tượng. Mi đối tượng được coi như thuc mt loi c th,
và s nhn dng được thc hin như mt quá trình phân loi. Tng đối tưng được
351
n đnh vào mt trong nhiu nhóm (lp) đã thiết lp trước đó biu din cho tt c các
loi đi tượng th trong nh. Mt li không phân loi nhm s xy ra nếu đi
tượng b n định vào mt lp không thích hp. Kh năng để xy ra điu này là t s
li phân loi nhm.
S phân loi ch da vào vec tơ đặc trưng. Trong hai chương tiếp theo, chúng ta
s xem xét k thut phân loi xut phát t c phm trù trong lý thuyết quyết đnh
thngvà mng nơ ron.
HÌNH 18-1
Hình 18-1 Ba pha nhn dng mu
18.1.2. Ví d v nhn dng mu
Các khái nim cơ bn v nhn dng mu thng có th được minh ho tt nht
bng mt d. Gi s chúng ta mun thc hin mt h thng sp xếp ti y đ
xung trên mt băng truyn. Vic sp xếp thc s th b nh hưng bi các phn
có th di chuyn t trên xung làm chch hướng đi ca các loi tiy khác nhau
ra khi băng truyn rơi o trong các hp chuyên ch tch hp, như minh ho
trong nh 18-2.y gi s rng đó là các qu là các trái anh đào, các qu táo, chanh
và các qu nho. Nhng chúng ta cn mt h thng x lý nh mà th quan sát
các qu đang đến gn, phân ra tng loi th phn đã phân loi thích hp đúng lúc
vào hp đựng trái cây tương ng.
HÌNH 18-2
Hình 18-2 H thng sp xếp trái cây
Chúng ta th cài đặt mt camera truyn hình s trên băng truyn thc hin
quyết đnh phân loi bng mt máy tính. Vi ví d này, hãy xác đnh hai tham s cho
tng mu ti cây: đờng kính màu sc ca nó. Chương trình máy tính s x lý
352
tng nh s hoá và tính đưng kính trái cây theo đơn v milimet và mt tham s biu
thu sc.
Gi s chúng ta s dng mt camera TV màu chương trình tính độ sáng ca
tng đối tượng theo các nh đ, lc lam. (Xem chương 21) Sau đó th nhn
được mt đặc trưng (d t l độ ng đỏ-lc) nhn c gtr thp cho qu màu
vàng các giá tr cao cho qu màu đỏ. Chúng ta có th gi tham s này là độ đo sc
đỏ.
Hình 18-3 cho thy không gian hai đc trưng chiu định nghĩa bng hai tham s,
đường kính và sc đỏ, các nhóm được đưa ra tương ng vi mi mt trong bn
lp qu. Bng cách đặt các đường quyết định xp x trong không gian đặc trưng,
chúng ta th phân chia ra tnh mi vùng thuc mt lp và thiết lp mt quy
tc phân loi.
Khi mt qu nào đó đến gn camera TV, s được xác định, các đặc trưng
xác đnh mt đim trong không gian hai chiu. Tu thuc vào nơi mà đim này nm
trong không gian, trái y được n định o mt trong bn lp. Ngay khi quyết
định pn loi được thc hin, cơ chế b vào phn sau đó s được làm lch
hưng đi để đẩy quo trong thùng cha thích hp.
HÌNH 18-3
Hình 18-3 Không gian đặc trưng
Trong khi h thng tin x không được s dng rng rãi trong ngành ng
nghip đóng i trái cây, nhưng đáp ng được vic minh ho nhn dng mu
thng kê. Vai trò ca thng trong thiết kế hot động ca h thng s tr nên
ràng hơn hai chương tiếp theo. Bây gi đủ điu kin đ nói rng mi lp qu to ra
mt PDF trong không gian đc trưng. Các dòng quyết định th được xác đnh, t
tác đng qua li gia các PDF đó, theo cách để tránh hay có ít ra là ti thiu hoá, các
li phân loi nhm.
18.1.3. Thiết kế h thng nhn biết mu
Thiết kế mt h thng nhn biết mu thường được thc hin theo năm bước lit
trong bng 18.1: thiết kế b định đi tượng, chn la đặc trưng, thiết kế b phân loi
và thc hin vic đánh giá.
B định v đối tượng là thut toán tách nh ca đối tưng riêng bit trong mt nh
phc hp. Vic phân ch các đi tưng được gi phân đon nh hay phân đon
cnh, s được trình bày trong chương y. Chn la đặc trưng tác dng quyết
định thuc tính ca đối tượng (kích thc, hình dng,…). đim khác bit nht gia các
lp đối tượng cn phi tính toán. Thiết kế b phân loi bao gm vic thiết lp mt cơ
s toán hc cho th tc phân loi. c tham s th điu chnh (ngưỡng quyết
định) ca chính b phân loi bt buc phi trong ng đon hun luyn b lc.
353
Cui cùng, thường cn được thiết lp các t l li phân loi khi h thng hot
động. Đâybước thc hin vic đánh giá.
18.2. QUÁ TRÌNH PHÂN ĐOẠN ẢNH
Chúng ta có th định nghĩa quá trình phân đon nh như là vic phân chia mt nh
s thành các vùng ri nhau (không chm lên nhau). Đi vi mc đích ca chúng ta,
mt ng mt tp liên thông ca các đim nh-tc là, mt tp trong đó tt c các
đim nh gn k hay t nhau. Đnh nghĩa chun ca tính liên thông như sau: gia
hai đim nh bt k trong mt tp liên thông, tn ti mt đường liên thông trong
phm vi tp, đó mt đường liên thông là mt đường luôn luôn di chuyn gia các
đim nh lân cn. Do đó, trong mt tp liên thông, bn th tìm thy mt đường
liên thông gia hai đim nh bt k trong tp.
BẢNG 18-1 THIẾT K H THỐNG NHẬN DẠNG MU
Bước Hàm
1. Thiết kế b định v đối tưng Chn thut gii phân đon nh đ phân
ch các đối tượng riêng bit trong nh.
2. La chn đc trưng Quyết định các tính cht đối tượng mà có
th phân bit các loi đối tượng tt nht
làm thế nào để đo lường chúng.
3. Thiết kế b phân loi Thiết lp cơ s toán hc cho thut gii
phân loi, la chn kiu cu trúc ca
b phân loi để s dng.
4. Hun luyn b phân loi C định các tham s điu chnh khác
nhau (các đường biên quyết đnh,…)
trong b phân loi cho phù hp vi đối
tượng được phân loi.
5. Đánh giá hiu sut Đánh giá t s các li phân loi nhm
th nhn được khác nhau.
hai quy tc liên thông, mt trong s đó th chp nhn. Nếu ch các đim
lân cn bên (trên, dưới, trái, phi) được coi thuc liên kết, thì đây liên thông 4
và các đối tưng liên kết 4. Vì thế, mi đim nh ch 4 lân cn để th liên
kết. Thêm vào đó, nếu c đim nh lân cn chéo (lân cn 450) cũng đưc tính đến
trong liên kết t chúng ta liên thông 8, và các đối tượng là liên kết 8. Mi đim
nh 8 lân cn để có th liên kết. Cũng có th s dng quy tc liên thông kia, min
là thích hp. Thông thường liên thông 8 mang li kết qu được coi là gn vi trc
giác ca con người hơn c.
Khi mt người quan sát mt cnh, quá trình x đặt trong h thng th giác s
phân đon cnh đó cho người đó. Vic này được thc hin hiu qu đến ni ta trông
nó không như mt cnh phc tp, nhưng đúng hơn người ta coi điu đó như là tp
hp cáca đối tượng. Tuy nhiên, bng xs, chúng ta phi táchc đối tưng trong
mt nh bng cách phân chia nh thành tp các đim nh, mi tp là nh ca mt đối
tượng. Trong khi công vic phân đon nh hu như không bn sao trong kinh
nghim nhìn nhn ca con người, t đây mt ng vic không tm thường trong
phân tích nh s.
Phân đon nh có th tiếp cn t ba thuyết phi cnh khác nhau. Trong trường
hp chúng ta tiếp cn vùng, ta n định mi đim nh cho mt đối tượng hay vùng c
th. Trong phương pháp tiếp cn đường biên, ta ch th định v các đường biên đã có
gia các vùng. Trong phương pháp tiếp cn đỉnh, ta th tìm cách nhn biết các
đim biên và sau đó liên kết chúng vi nhau to thành đưng biên cn . Tt c ba
cách tiếp cn đều hu dng trong vic nhìn nhn vn đề.
354
Trong chương này, chúng ta xem xét mt vài k thut phân tách các đối tượng
trong mt nh s. Mi ln phân ch, các đối tượng th được đo lường và phân
loi. Các k thut cho nhng hot động này được ch ra trong hai chương tiếp theo.
18.3. PHÂN ĐOẠN ẢNH BẰNG PHÂN NGƯỠNG
Phân ngưỡng mt k thut ph biến để tiếp cn vùng, hu ích đi vi nhng
cnh cha nhng đối tưng đồng màu trên nn tương phn. Mc đích đ đơn
gin trong tính toán ln xác định được nhng vùng các đường biên đóng
liên thông.
Khi s dng qui tc phân ngưỡng để phân vùng nh, người ta n định tt c nhng
đim nh nm n trên mc xám ngưỡng thuc v đối tưng. Còn tt c nhng đim
nh không nm trên mc xám ngưỡng s nm ngoài đi tượng. Đường bao tp tt
c nhng đim nm bên trong và mi đim ít nht mt đim lân cn nm ngoài
đối tượng.
Phân ngưỡng s được thc hin hoàn ho nếu đối tượng được xét có mc xám bên
trong đồng nhtnm trên nn mc m đồng nht khác. Nếu mt vài tính cht
(ngoài mc xám, tính kết cu chng hn) ca các đối tượng khác nn ca chúng, thì
đầu tiên người ta có th chuyn đổi tính cht đó thành mc xám. Sau đó tiến hành
phân ngưỡng mc xám để có th phân vùng nh.
18.3.1. Phân ngưỡng tng th
Trong quá trình xác đnh đường biên bng phân ngưỡng đơn gin nht, giá tr mc
xám ngưng hng s được s dng trong toàn b nh. Nếu mc xám nn là hng
s hp và nếu các đối tượng đều độ tương phn xp x bng nhau, t mt
ngưỡng tng th c định thưng được ng để qui đnh mc xám ngưng hp lý
được chn.
18.3.2. Phân ngưỡng thích nghi
Trong nhiu trường hp mc xám nn không phi hng s và đ tương phn
ca các đối tượng trong nh hoàn toàn khác nhau, thưng xy ra trường hp mt
ngưỡng áp dng thích hp cho mt ng nh này nhưng li không thích hp cho
nhng vùng khác. Trong nhng trường hp đó, thun tin nht là s dng mc xám
ngưỡng là mt hàm biến thiên chm theo v trí trong nh.
Hình 18-4 cho thy nh hin vi ca các nhim sc th t mt tế o máu người.
Trong nhy, mc xám nn thay đổi do s chiếung không đồng đều độ tương
phn thay đổi t nhim sc th này sang nhim sc th khác. Trong hình 18-4a, mt
mc m ngưng không đổi được s dng cho toàn b nh để phân tách các nhim
sc th. Mi nhim sc th được bao bi mt đường và mt dãy s. Trong nh 18-
4b, ngưỡng được thay đổi t nhim sc th này sang nhim sc th kc tương xng
vi nn cc bđộ tương phn ca nhim sc th. Điu này đã to ra mt vài sai s
phân đon-trong đó nhiu nhim sc th b dính vào nhau hay các nhim sc th
riêng bit b phá v. Mt nghiên cu tương t cho thy rng độ chính xác ca phép
đo din tích các nhim sc th đã được ci tiến bng phân ngưỡng thích nghi. Trong
nh 18-4b, ngưỡng đối vi mi nhim sc th đưc đặt xp x mc trung nh gia
mc xám trung bình ca đối tượng và mc xám nn cc b.
18.3.3. La chn ngưỡng ti ưu
Tr phi đối tượng trong nh có các mt cc k dc đng, còn t giá tr chính xác
ca mc xám ngưỡng th tác đng đáng k lên v trí đường biên toàn b
ch thước đối tượng được tch chn. Nghĩa các s đo ch thưc liên tiếp-khu
vc riêng bit-nhy cm vi mc xám ngưỡng. Vì do đó chúng ta cn s ti ưu
hay ít ra cũng là phương pháp thiết lp ngưỡng.