MÔ HÌNH PHÂN LP FCM
TRONG PHÂN ĐON NH VÀ THUT TOÁN DCA
TS. NGUYN TRNG PHÚC
B môn Công ngh phn mm
Khoa Công ngh thông tin
Trường Đại hc Giao thông Vn ti
Tóm tt: Trong bài báo này, chúng tôi gii thiu mt thut toán nhanh và mm do trong
bài toán phân đon nh thông qua mô hình phân lp Fuzzy C-Means. Cách tiếp cn ca
chúng tôi da trên lý thuyết DC (hiu hai hàm li) vi thut toán DCA tương ng. DC và thut
toán DCA đã xut hin t năm 1986 được phát trin đến nay và được áp dng trong nhiu lĩnh
vc khoa hc liên quan đến các bài toán ti ưu như trong Machine Learning… Vi mt cách
tiếp cn mm do, mô hình FCM ban đầu ca bài toán được biến đổi thành mô hình mi mà
DC có th áp dng được vi thut toán DCA đơn gin tương ng. Để ci thin tc độ ca
thut toán chúng tôi kết hp thut toán DCA và thut toán FCM theo các cách khác nhau.
Hơn na, chúng tôi xét đến mi quan h gia các đim nh trong không gian để đưa thêm
thông tin vào trong mô hình bài toán ban đầu nhm x lý các nh trong thc tế, các nh
nhiu. Thông qua các kết qu thc tế, chúng tôi thy được ưu đim ca phương pháp tiếp cn
trong vic tăng tc độ, cht lượng nh phân đon vi các nh khác nhau, đặc bit là nh trong
y hc.
Summary: We present a fast and robust algorithm for image segmentation problems via
Fuzzy C-Means (FCM) clustering model. Our approach is based on DC (Difference of Convex
functions) programming and DCA (DC Algorithms) that have been successfully applied in a
lot of various fields of Applied Sciences, including Machine Learning. In an elegant way, the
FCM model is reformulated as a DC program for which a very simple DCA scheme is
investigated. For accelerating the DCA, an alternative FCM-DCA procedure is developed.
Moreover, in the case of noisy images, we propose a new model that incorporates spatial
information into the membership function for clustering. Experimental results on noisy images
have illustrated the effectiveness of the proposed algorithm and its superiority with respect to
the standard FCM algorithm in both running-time and quality of solutions.
CNTT-
CB
I. GII THIU CHUNG
Phân đon nh gi mt vai trò rt quan trng trong nhiu ng dng như các bài toán nhn
dng hay các bài toán xnh trong y hc ([2]; [3]). Phân đon nh là mt bước cơ bn để
th thc hin vic phân tích các nh thu được. Mt cách tng quát, phân đon nh được định
nghĩa như vic chia hình nh thành các đối tượng độc lp vi nhau da trên các đặc tính ca nh
như mc xám hay kết cu ca nh. Có rt nhiu các thut toán phân đon nh được đề xut,
chúng ta có th chia ra làm 4 loi sau đây ([9]):
- Phương pháp cơ bn: phân ngưỡng, phát trin vùng, tách biên…
- Phương pháp thng kê: Maximum Likelihood Classifier (MLC)…
- Phương pháp da trên mng Neural.
- Phương pháp da trên logic m (Fuzzy Clustering).
Bài báo này đề cp đến thut toán phân đon nh da trên mô hình Fuzzy C-Means (FCM)
vi vic áp dng lý thuyết DC và thut toán DCA tương ng để gii quyết bài toán. Mc đích
ca chúng tôi là đưa ra mt thut toán nhanh và mm do để gii quyết bài toán bi vì mô hình
phân lp trong bài toán phân đon nh là mt mô hình ln, nhiu hướng và cn có mt thut
toán hiu qu. Hơn na, vi vic xem xét mi quan h liên thông gia các đim nh, chúng tôi
đã áp dng thut toán để thc hin phân đon các nh nhiu.
Bài báo bao gm 4 chương. Chương 1 gii thiu chung v bài toán và các tiếp cn thc tế.
Chương 2 trình bày v mô hình FCM cũng như mô hình FCM khi quan tâm đến tính liên thông
ca các đim nh. Chương 3 gii thiu v cách phân rã mô hình theo DC và các thut toán DCA
kết hp FCM. Chương cui đề cp đến các kết qu thu nhn được khi thc hin các thut toán
trên các nh thc tin và các nhn xét v các thut toán.
II. MÔ HÌNH FCM CA BÀI TOÁN
2.1. Mô hình FCM ca bài toán
Phân lp Fuzzy C-Means (CFM) là mt trong nhng phương pháp được ng dng rng rãi
nht trong Logic m. Được đưa ra bi Bezdek ([2]) bi s m rng ca thut toán Dunn năm
1973, FCM là mt trong nhng thut toán hiu qu trong bài toán phân lp và đặc bit là trong
các bài toán phân đon nh. Vi cách tiếp cn này, mi hình nh vi nhiu đặc trưng s được
phân lp thành các nhóm mà ti đó các đim nh có cùng đặc trưng vi nhau. Như vy, bài toán
phân lp s dn đến vic gii bài toán xác định giá tr min ca tng khong cách ca các đim
nh đến tâm ca mi phân đon trên min đặc trưng ca nh.
CNTT-CB
Gi s rng X:= {x1, x2, ..., xn} định nghĩa tp các đim nh ca mt nh cn phi phân
thành c (0<c<n) phân đon {C1, x2, ..., Cc} trong đó xk d vi k=1,2...n biu din các đặc
tính ca đim nh. Trong các nh thông thường, chúng ta thường hay xét đến giá tr mc xám
ca các đim nh, khi đó k = 1 và bài toán phân đon s da trên duy nht mt đặc tính là mc
xám.
Xét ma trn phân lp m (Fuzzy Partition Matrix) U = (ui,k)cn trong đó mi phn t ui,k
ch ra kh năng thuc phân lp i ca mt đim nh xk. Khi đó, bài toán phân lp chính là ti ưu
hoá hàm mc tiêu:
2
ik
n
1k
c
1i
m
k,im vxu)V,U(J = ∑∑
==
(1)
trong đó ||.|| chính là giá tr chun Euclidean trên không gian tương ng và ma trn Vcd
biu din tp hp các đim tâm ca các phân lp trong không gian này còn tham s m được gi
là tham s m ca các tp d liu. Khi đó, mô hình ca bài toán phân đon nh được biu din:
[]
====
=
∑∑
=
==
n,..1k1uc..1i;n,..1k1,0u
vxu)V,U(Jmin
c
1i
k,ik,i
2
ik
n
1k
c
1i
m
k,im
(2)
Mt trong nhng nhược đim ca các thut toán FCM là không xét đến đặc tính liên thông
ca các đim nh trên mt hình nh, như vy kết qu thu nhn được thường b nh hưởng vì các
nh thông thường là luôn có nhiu. đây, khi xét đến các đim nh, chúng ta biết rng các đim
nh thường có mi liên h vi các đim xung quanh. Thông thường, các đim nh xung quanh
mi đim nh thường có cùng các đặc tính (ví d như mc xám) vi đim nh đó và kh năng
chúng có cùng phân lp là rt cao. Hin nay, có mt s bài báo đề cp đến mi quan h gia các
đim nh như mt đặc tính ca nh trong vic phân lp theo mô hình FCM ([1]; [7]; [8]).
2.2. Mô hình FCM vi quan h liên thông gia các đim nh
Trong bài báo này, chúng tôi xét đến quan h ca mi đim nh vi các đim xung quanh
thông qua giá tr mc xám ca chúng. Điu này có nghĩa là, kh năng đim nh và các đim
xung quanh có cùng mc xám là ln. Nếu xét theo tính liên thông, mt đim nh s có 8 đim
liên thông xung quanh nó. Như vy, trên mô hình ca bài toán, mi đim nh s có 2 đặc tính:
mc xám ca đim nh và mc xám trung bình ca các đim nh xung quanh xk = (xk1, xk2)
2d vi xk1 biu din mc xám ca đim nh xk và xk2 là giá tr trung bình xk2 = (xk1 +
iNkxi)/9 trong đó Nk là tp các đim xung quanh ca xk. Khi xét đến đặc tính này, mô hình
bài toán không thay đổi tuy nhiên độ phc tp đã thay đổi bi s lượng biến tăng lên 2 ln.
CNTT-
CB
III. GII THUT FCM DA TRÊN DC VÀ THUT TOÁN DCA
D dàng nhn thy mô hình ca bài toán chính là bài toán ti ưu trên min không li và đây
là mt bài toán NP-Complete. Để gii bài toán này, chúng tôi dùng phương pháp DC bng cách
phân rã hàm mc tiêu thành hiu hai hàm li, sau đó áp dng thut toán DCA để gii bài toán.
Phương pháp DC và thut toán DCA được đưa ra bi Pham D.T. năm 1985 và được áp dng
trên nhiu bài toán thc tin ([6]).
3.1. DC và thut toán DCA
Lý thuyết chung ca DC trong vic tính giá tr ca hàm mc tiêu không li là phân tích nó
thành hiu hai hàm li trên không gian
p. Mt cách đơn gin, chúng ta có th thy được mô
hình ca bài toán:
{
}
)P(x:)x(h)x(g:)x(finf dc
p
==α
trong đó: f là hàm mc tiêu và g, h là các hàm li na liên tc trên min
p.
Xét bài toán đối ngu (Ddc):
{
}
)D(y:)y(g)y(hinf dc
p**
D=α
trong đó h* và g* là các hàm liên hp ca hàm h và g vi
{
}
p* x:)x(gy,xsup:)y(g =
Bng cách gii đồng thi bài toán (Pdc) và bài toán đối ngu (Ddc), người ta chng minh
được rng sau hu hn các bước, chúng ta có th xác định được đim ti ưu cc b ca bài toán
ban đầu khi mà xk hi t v giá tr MIN. Thut toán DCA được mô t như sau:
Thut toán DCA-1:
Chn xo
∈ℜ
p
Thc hin tính toán theo mi bước giá tr xk
o Tính yk
h(xk)
o Tính xk+1
argmin
{
g(x) – h(xk) - <x-xk, yk> : x
∈ℜ
p
}
o k <= k+1
Kim tra s hi t ca xk.
Các đặc tính hi t ca thut toán được chng minh trong [6].
3.2. Phân tích DC ca mô hình FCM
Theo như các phân tích trên, để gii được bài toán, chúng ta s xác định mt phân rã hàm
mc tiêu thành hiu ca hai hàm li.
Xét biến ti,k sao cho ui,k = t2i,k. Khi đó
.1t
c
1i
k,i
2=
=
Mô hình bài toán s được biu din dưới dng
==
=
==
==
∑∑
i
1i
c
k
1k
n
2
ik
n
1k
c
1i
k,i
m2
m2
R:CVS:ST
vxt)V,T(Jmin (3)
Như vy chúng ta có: J2m(T,V) = G(T,V) – H(T,V)
vi: )V,T(J)V,T(
2
)V,T(HV
2
n
2
)V,T(G m2
22
ρ
=
ρ
+
ρ
= (4)
Chng minh được rng G và H là hai hàm li trên min không gian ca bài toán.
3.3. Thut toán DCA trên mô hình FCM
CNTT-CB
Áp dng thut toán DCA trên bng cách tính các giá tr xk ( đây chính là (Tk,Vk)) và yk
ca hai bài toán đối ngu, chúng ta có:
()
()
ρ
++ BxC)V,T(:Z,Y,V,TV
2
minarg)V,T(
)V,T(H)Z,Y(
kk
2
1k1k
kkkk
Giá tr trên được xác định tường minh bi vic tính đạo hàm ca các hàm, ta có:
)Z
1
(ojPrVand)Y(ojPrT
)t)xv(2,vxtm2()V,T()Z,Y(
k
C
1kk
B
1k
n
1k k,i
m2
ki
2
ik
k,i
1m2kkkk
ρ
==
ρ=
++
=
(5)
(6)
Thut toán DCA-2:
Chn (To
,Vo)
(
cn,
cp)
Thc hin tính toán theo mi bước giá tr (Tk,Vk)
o Tính (Yk,,Zk) theo (5).
o Tính (Tk+1
,Vk+1) theo (5).
o k <= k+1
Kim tra s hi t ca (Tk,,Vk).
3.4. Kết hp thut toán FCM và thut toán DCA
Điu chú ý trong thut toán DCA trên đây chính là vic xác định giá tr ban đầu xo ca
thut toán. T các bài toán thc tế, người ta thy rng vic xác định giá try nh hưởng khá
ln đến giá tr ti ưu ca bài toán tìm được.
Qua kinh nghim thc tế, chúng ta có th kết hp các bước ca thut toán DCA vi các
bước ca thut toán FCM để thc hin gii bài toán hoc có th thc hin mt s bước ca FCM
để xác định giá tr xo ban đầu cho thut toán DCA.
Thut toán DCA-3:
CNTT-
CB
Chn (Uo
,Vo) ban đầu ca bài toán FCM.
Thc hin tính toán theo mi bước giá tr
o Tính (Uk,,Vk) theo thut toán FCM.
o Đặt Tk = sqrt(Uk), tính (Tk+1
,Vk+1) theo thut toán DCA-2.
o k <= k+1
Kim tra s hi t ca (Uk,,Vk).
Thut toán DCA-4: