intTypePromotion=1

Đánh giá hiệu năng của thuật toán phân cụm mờ bán giám sát cho bài toán phân đoạn ảnh nha khoa

Chia sẻ: Lavie Lavie | Ngày: | Loại File: PDF | Số trang:14

0
35
lượt xem
2
download

Đánh giá hiệu năng của thuật toán phân cụm mờ bán giám sát cho bài toán phân đoạn ảnh nha khoa

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Đánh giá hiệu năng của thuật toán phân cụm mờ bán giám sát cho bài toán phân đoạn ảnh nha khoa trình bày tổng quan các kỹ thuật phân cụm mờ bán giám sát và đề xuất một lược đồ tổng quát mới cho việc áp dụng các kỹ thuật này cho bài toán phân đoạn ảnh nha khoa.

Chủ đề:
Lưu

Nội dung Text: Đánh giá hiệu năng của thuật toán phân cụm mờ bán giám sát cho bài toán phân đoạn ảnh nha khoa

Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015<br /> <br /> ĐÁNH GIÁ HIỆU NĂNG CỦA THUẬT TOÁN PHÂN CỤM MỜ BÁN<br /> GIÁM SÁT CHO BÀI TOÁN PHÂN ĐOẠN ẢNH NHA KHOA<br /> Trần Mạnh Tuấn1, Phạm Huy Thông2, Lê Hoàng Sơn2, Nguyễn Đình Hóa3<br /> 1<br /> <br /> Trường Đại học Công nghệ thông tin và truyền thông, Đại học Thái Nguyên<br /> 2<br /> Trường Đại học Khoa học tự nhiên, Đại học Quốc gia Hà Nội<br /> 3<br /> Viện Công nghệ thông tin, Đại học Quốc gia Hà Nội<br /> tmtuan@ictu.edu.vn, thongph@vnu.edu.vn, sonlh@vnu.edu.vn, hoand@vnu.edu.vn<br /> TÓM TẮT - Phân đoạn ảnh nha khoa là bước xử lý quan trọng trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán một<br /> cách hiệu quả các bệnh quanh răng như viêm chân răng, bệnh nha chu, viêm túi răng, v.v. Đối với bài toán này, các kỹ thuật xử lý<br /> ảnh thông thường hay phân cụm rõ thường gặp vấn đề về xác định tham số ngưỡng hay biên chung của các mẫu răng. Khi đó kỹ<br /> thuật phân cụm mờ cụ thể là phân cụm mờ bán giám sát là một công cụ tương đối hiệu quả trong việc xử lý các vấn đề liên quan<br /> đến chất lượng cụm mà trong đó một số thông tin đã được phân loại sẽ định hướng cho quá trình xử lý về sau.<br /> Trong bài báo này, chúng tôi sẽ tổng quan các kỹ thuật phân cụm mờ bán giám sát và đề xuất một lược đồ tổng quát mới<br /> cho việc áp dụng các kỹ thuật này cho bài toán phân đoạn ảnh nha khoa. Tiếp theo, trên cơ sở thực nghiệm với dữ liệu gồm 8 bệnh<br /> nhân được thu thập trong giai đoạn 2014-2015 tại trường Đại học Y Hà Nội, hiệu năng của các thuật toán được đánh giá theo các<br /> độ đo khác nhau được khảo sát kỹ lưỡng. Kết luận của bài báo chỉ ra thuật toán phân cụm mờ bán giám sát có hiệu năng tốt nhất<br /> cho bài toán phân đoạn ảnh nha khoa.<br /> Từ khóa – Phân cụm mờ bán giám sát, ảnh nha khoa, phân đoạn ảnh, hiệu năng thuật toán.<br /> <br /> I. GIỚI THIỆU<br /> Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai trò rất quan trọng [16, 24] trong quá<br /> trình này. Phân đoạn ảnh cũng là công việc khó khăn nhất của xử lý ảnh. Trong đó, phân đoạn ảnh nha khoa là bước xử<br /> lý then chốt trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu quả các bệnh về răng như viêm chân<br /> răng, bệnh nha chu, viêm túi răng [19, 20]. Đối với bài toán này, các nghiên cứu trước đây đã đưa ra các kỹ thuật phân<br /> đoạn như: phân đoạn dựa trên phân ngưỡng [8, 13], phân đoạn dựa trên các thuật toán phân cụm [21, 32]. Tuy nhiên<br /> các phương pháp này thường gặp vấn đề khi xác định tham số ngưỡng hay biên chung của các mẫu răng [26]. Do vậy<br /> phương pháp phân cụm mờ cụ thể là phân cụm mờ bán giám sát là một công cụ tương đối hiệu quả trong việc xử lý các<br /> vấn đề liên quan đến chất lượng cụm mà trong đó một số thông tin đã được phân loại sẽ định hướng cho quá trình phân<br /> cụm về sau.<br /> Trong phân cụm không mờ, dữ liệu được chia vào các nhóm, trong đó mỗi điểm dữ liệu thuộc vào chính xác<br /> một cụm [2]. Trong phân cụm mờ, các điểm dữ liệu có thể thuộc vào nhiều hơn một cụm và tương ứng với các điểm dữ<br /> liệu là ma trận độ thuộc, với giá trị của các phần tử chỉ ra mức độ các điểm dữ liệu thuộc vào các cụm khác nhau [2].<br /> Các phương pháp phân cụm mờ được sử dụng nhiều trong các bài toán nhận dạng mẫu, phát hiện tri thức từ các cơ sở<br /> dữ liệu, đánh giá rủi ro và nó có ứng dụng nhiều trong phân đoạn ảnh. Trong các nghiên cứu gần đây việc sử dụng các<br /> thông tin bổ trợ cung cấp bởi người dùng được gắn với đầu vào trong phân cụm mờ để hướng dẫn, giám sát và điều<br /> khiển quá trình phân cụm. Khi đó các thuật toán phân cụm mờ kết hợp với các thông tin bổ trợ hình thành nên nhóm<br /> các thuật toán gọi là phân cụm mờ bán giám sát [7].<br /> Một số nghiên cứu gần đây cho thấy các thuật toán phân cụm mờ bán giám sát rất hiệu quả trong nhiều lĩnh vực<br /> như xử lý ảnh [5, 14, 24], nhận dạng mẫu, nhận dạng khuôn mặt [1, 17], đánh giá rủi ro [4], dự báo phá sản [18]. Đặc<br /> biệt là trong xử lý ảnh với các ảnh màu và ảnh y học. Trong các nghiên cứu này, chưa có kết quả nào của phân cụm mờ<br /> bán giám sát được áp dụng cho các ảnh X-quang nói chung và ảnh X-quang nha khoa nói riêng.<br /> Do vậy đóng góp chính của bài báo này là trình bày tổng quan các phương pháp phân cụm mờ bán giám sát. Sau<br /> đó, đưa ra lược đồ áp dụng phân cụm mờ bán giám sát cho bài toán phân đoạn ảnh nha khoa. Việc đánh giá hiệu năng<br /> của thuật toán thực hiện dựa trên bộ dữ liệu thực tế gồm 8 ảnh X-quang nha khoa của các bệnh nhân trong giai đoạn<br /> 2014-2015 tại trường Đại học Y Hà Nội để phục vụ việc chẩn đoán hình ảnh. Cuối cùng, bài báo đưa ra một số kết luận<br /> liên quan đến việc sử dụng thuật toán với các bộ dữ liệu khác.<br /> Ý nghĩa của nghiên cứu này là tìm ra một thuật toán có hiệu quả trong việc phân đoạn ảnh X-quang nha khoa.<br /> Để thực hiện điều này, chúng tôi xây dựng một mô hình toán học dưới dạng bài toán tối ưu và sử dụng các thông tin bổ<br /> trợ để cải thiện chất lượng phân đoạn ảnh. Dựa trên tập mẫu về các ảnh X-quang nha khoa thực tế, mô hình được đánh<br /> giá một cách cụ thể kết quả là sự phân biệt giữa cấu trúc răng và các mô trong ảnh. Việc phân đoạn chính xác này có ý<br /> nghĩa trong quá trình xử lý ảnh tiếp theo.<br /> Phần tiếp theo của bài báo được tổ chức như sau: trong phần II, chúng tôi tổng quan lại các phương pháp phân<br /> cụm mờ bán giám sát. Phần III đưa ra lược đồ áp dụng cho phân đoạn ảnh nha khoa dựa trên phân cụm mờ bán giám<br /> sát. Phần IV là một số kết quả được thực hiện trên bộ dữ liệu thực và đánh giá hiệu năng của các thuật toán đã trình<br /> bày. Cuối cùng là kết luận và các hướng phát triển trong thời gian tới.<br /> <br /> Trần Mạnh Tuấn, Phạm Huy Thông, Lê Hoàng Sơn, Nguyễn Đình Hóa<br /> <br /> 131<br /> <br /> II. TỔNG QUAN VỀ PHÂN CỤM MỜ BÁN GIÁM SÁT<br /> Trong phần này, mục 2.1 sẽ trình bày thuật toán cơ sở của phân cụm mờ bán giám sát (Fuzzy C-means - FCM).<br /> Mục 2.2 sẽ trình bày về các loại thông tin bổ trợ được sử dụng trong phân cụm mờ bán giám sát và trong phân đoạn<br /> ảnh. Mục 2.3 trình bày về một số thuật toán phân cụm mờ bán giám sát sử dụng thông tin bổ trợ về độ thuộc được xác<br /> định trước trong phân đoạn ảnh.<br /> 2.1. Thuật toán Fuzzy C-means<br /> Thuật toán phân cụm mờ được Bezdek [2] đề xuất dựa trên độ thuộc ukj của phần tử dữ liệu Xk từ cụm j. Hàm<br /> mục tiêu được xác định như sau:<br /> N<br /> <br /> C<br /> <br /> m<br /> J = ∑∑ u kj X k − V j<br /> <br /> 2<br /> <br /> → min<br /> <br /> (1)<br /> <br /> k =1 j =1<br /> <br /> + m là số mờ hóa<br /> + C là số cụm, N là số phần tử dữ liệu, r là số chiều của dữ liệu.<br /> + ukj là độ thuộc của phần tử dữ liệu Xk từ cụm j.<br /> + X k ∈ R là phẩn tử thứ k của X = {X 1 , X 2 ,..., X N }.<br /> r<br /> <br /> + Vj là tâm của cụm j.<br /> Khi đó ràng buộc của (1) là:<br /> C<br /> <br /> ∑u<br /> <br /> kj<br /> <br /> = 1;<br /> <br /> j =1<br /> <br /> u kj ∈ [0,1];<br /> <br /> ∀k = 1, N<br /> <br /> (2)<br /> <br /> Sử dụng phương pháp Lagrange, xác định được tâm của cụm dựa vào (3) và độ thuộc dựa vào (4) từ hàm mục<br /> tiêu (1):<br /> C<br /> <br /> Vj =<br /> <br /> ∑u<br /> k =1<br /> C<br /> <br /> m<br /> kj<br /> <br /> ∑u<br /> <br /> Xk<br /> <br /> (3)<br /> <br /> m<br /> kj<br /> <br /> k =1<br /> <br /> (4)<br /> <br /> 1<br /> <br /> u kj =<br /> <br /> ⎛ X k −Vj ⎞<br /> ⎟<br /> X k − Vi ⎟<br /> i =1<br /> ⎝<br /> ⎠<br /> C<br /> <br /> ∑⎜<br /> ⎜<br /> <br /> 1<br /> m −1<br /> <br /> Khi đó thuật toán Fuzzy C-means như sau (xem bảng 1)<br /> Bảng 1. Thuật toán Fuzzy C-means<br /> <br /> Input<br /> <br /> Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; mờ hóa m; ngưỡng ԑ; số lần lặp lớn<br /> nhất MaxStep>0.<br /> <br /> Output<br /> <br /> Ma trận U và tâm cụm V.<br /> <br /> FCM<br /> 1<br /> <br /> t=0<br /> <br /> 2<br /> <br /> (<br /> u kjt ) ← random;<br /> <br /> 3<br /> <br /> Repeat<br /> <br /> 4<br /> <br /> t=t+1<br /> <br /> 5<br /> <br /> Tính V j ; j = 1, C bởi công thức (3)<br /> <br /> 6<br /> <br /> Tính<br /> <br /> (<br /> )<br /> u ( ) ; (k = 1, N ; j = 1, C ) bởi công thức (4)<br /> <br /> 7<br /> <br /> Until<br /> <br /> U (t ) − U (t −1) ≤ ε hoặc t > MaxStep<br /> <br /> (k = 1, N ; j = 1, C ) thỏa mãn điều kiện (2)<br /> <br /> (t )<br /> t<br /> kj<br /> <br /> 132<br /> <br /> ĐÁNH GIÁ HIỆU NĂNG CỦA THUẬT TOÁN PHÂN CỤM MỜ BÁN GIÁM SÁT CHO BÀI TOÁN PHÂN ĐOẠN ẢNH NHA KHOA<br /> <br /> 2.2. Thông tin bổ trợ trong phân cụm mờ bán giám sát<br /> Các thuật toán phân cụm mờ bán giám sát xây dựng dựa trên các thuật toán phân cụm mờ kết hợp với các thông<br /> tin bổ trợ được người dùng cung cấp. Các thông tin bổ trợ nhằm mục đích hướng dẫn, giám sát và điều khiển quá trình<br /> phân cụm. Thông tin bổ trợ thường được xây dựng dựa trên 3 loại cơ bản [31] là:<br /> + Các ràng buộc Must-link và Cannot-link: Ràng buộc Must-link yêu cầu 2 phần tử phải thuộc vào cùng 1 cụm,<br /> ngược lại ràng buộc Cannot-link chỉ ra 2 phần tử không thuộc cùng 1 cụm (mà phải thuộc 2 cụm khác nhau).<br /> + Các nhãn lớp của một phần dữ liệu: Một phần của dữ liệu được gán nhãn và phần còn lại không được gán<br /> nhãn.<br /> + Độ thuộc được xác định trước.<br /> Một số nghiên cứu về phân đoạn ảnh sử dụng phân cụm bán giám sát thường dùng loại thông tin bổ trợ là giá trị<br /> hàm độ thuộc bổ sung. Với loại thông tin bổ trợ này, Zhang [30] đã áp dụng quy tắc entropy để giảm số chiều và đề<br /> xuất một tiếp cận mới với ý tưởng là kết hợp một thành phần theo quy tắc entropy vào hàm mục tiêu. Bên cạnh đó,<br /> Yasunori [29] đã đề xuất thuật toán phân cụm mờ bán giám sát trên cơ sở của FCM bổ sung thêm hàm độ thuộc bổ trợ<br /> sử dụng trong quá trình phân cụm. Bouchachia và Pedryzc [3] sử dụng thông tin bổ trợ vào việc xác định các thành<br /> ~<br /> phần u kj thông qua giá trị trung gian uik . Trong bài báo này nhóm chúng tôi đề xuất việc sử dụng thông tin hàm độ<br /> thuộc là giá trị hàm độ thuộc nhận được sau khi sử dụng thuật toán phân cụm FCM. Các thuật toán này lần lượt được<br /> trình bày trong mục 2.3 dưới đây.<br /> 2.3. Các thuật toán phân cụm mờ bán giám sát sử dụng thông tin bổ trợ về độ thuộc<br /> 2.3.1. Phân cụm mờ bán giám sát tiêu chuẩn (SEMI-SUPERVISED STANDARD FUZZY CLUSTERING)<br /> Yasunori et al. [29] đã đề xuất một thuật toán phân cụm mờ bán giám sát với thông tin bổ trợ là hàm độ thuộc<br /> bổ sung trong hàm mục tiêu của FCM để cải thiện hiệu quả trong quá trình phân cụm của thuật toán. Khi đó hàm mục<br /> tiêu [29] được xác định như sau<br /> N<br /> <br /> C<br /> <br /> J (U , V ) = ∑∑ | ukj − ukj |m || X k − V j ||2 → min<br /> k =1 j =1<br /> <br /> (5)<br /> <br /> X k với cụm C j là ukj ∈ [0,1] đồng thời<br /> <br /> Với điều kiện ràng buộc (2), khi đó hàm độ thuộc bổ trợ của phần tử<br /> thỏa mãn<br /> <br /> {<br /> <br /> C<br /> <br /> } ∑u<br /> <br /> U = ukj | ukj ∈ [0,1], k = 1, N , j = 1, C ,<br /> <br /> j =1<br /> <br /> kj<br /> <br /> (<br /> <br /> ≤ 1 , ∀k = 1, N<br /> <br /> )<br /> <br /> Khi đó dựa vào điều kiện (2) và hàm mục tiêu (5) chúng ta có<br /> N<br /> <br /> Vj =<br /> <br /> ∑u<br /> <br /> kj<br /> <br /> − ukj<br /> <br /> k =1<br /> N<br /> <br /> ∑u<br /> <br /> kj<br /> <br /> m<br /> <br /> − ukj<br /> <br /> Xk<br /> m<br /> <br /> , j = 1, C<br /> <br /> k =1<br /> <br /> (6)<br /> <br /> Và u kj được xác định theo 2 trường hợp sau<br /> -<br /> <br /> m >1 :<br /> 2<br /> <br /> -<br /> <br /> m =1:<br /> <br /> ⎛<br /> ⎞ m −1<br /> 1<br /> ⎜<br /> ⎟<br /> ⎜ X k − Vj ⎟<br /> C<br /> ⎛<br /> ⎞<br /> ⎠<br /> , k = 1, N , j = 1, C .<br /> ukj = ukj + ⎜1 − ∑ ukj ⎟ ⎝<br /> 2<br /> ⎝ i =1 ⎠ C ⎛<br /> ⎞ m −1<br /> 1<br /> ⎜<br /> ∑⎜ X − V ⎟<br /> ⎟<br /> i =1 ⎝<br /> k<br /> i ⎠<br /> <br /> C<br /> ⎧<br /> 2<br /> ⎪ukj + 1 − ∑ ukj , k = arg min X k − Vi<br /> i<br /> j =1<br /> , k = 1, N , j = 1, C .<br /> ukj = ⎨<br /> ⎪u<br /> , otherwise.<br /> ⎩ kj<br /> <br /> Thuật toán Semi-Supervised Standard Fuzzy Clustering (SSSFC) như sau (xem bảng 2)<br /> <br /> (7)<br /> <br /> (8)<br /> <br /> Trần Mạnh Tuấn, Phạm Huy Thông, Lê Hoàng Sơn, Nguyễn Đình Hóa<br /> <br /> 133<br /> <br /> Bảng 2. Thuật toán Semi-Supervised Standard Fuzzy Clustering<br /> Input<br /> <br /> Tập dữ liệu X gồm N phần tử , số cụm C, ma trận độ thuộc bổ trợ<br /> maxStep > 0.<br /> <br /> Output<br /> <br /> Ma trận U và tâm cụm V.<br /> <br /> U , ngưỡng ε , số lần lặp tối đa<br /> <br /> SSSFC<br /> 1:<br /> <br /> t=0<br /> <br /> 2:<br /> <br /> Khởi tạo ngẫu nhiên Vj ; ( j = 1, C )<br /> <br /> 3:<br /> <br /> Repeat<br /> <br /> (t)<br /> <br /> 4:<br /> <br /> t=t+1<br /> <br /> 5:<br /> <br /> Tính u kj ( k = 1, N ; j = 1, C ) bới công thức (7) với<br /> <br /> 6:<br /> <br /> Tính<br /> <br /> 7:<br /> <br /> Until V<br /> <br /> Vj<br /> <br /> ( t +1)<br /> <br /> (t )<br /> <br /> m > 1 hoặc công thức (8) với m = 1 .<br /> <br /> ( j = 1, C ) bởi công thức (6)<br /> <br /> − V (t −1) ≤ ε or t > maxStep<br /> <br /> 2.3.2. Phân cụm mờ bán giám sát đã hiệu chỉnh (SEMI-SUPERVISED ENTROPY REGULARIZED FUZZY<br /> CLUSTERING)<br /> Thuật toán semi-supervised entropy regularized fuzzy clustering được Yasunori và cộng sự [29] đề xuất năm<br /> 2009, đến năm 2012 Yin [30] có đề xuất hiệu chỉnh hệ số Entropy và khi đó thuật toán phân cụm mờ bán giám sát dựa<br /> trên thuật toán Entropy Regularized Fuzzy Clustering (eSFCM), sử dụng độ thuộc bổ trợ<br /> <br /> ukj để tăng hiệu suất phân<br /> <br /> cụm với điều kiện<br /> C<br /> <br /> ∑u<br /> <br /> kj<br /> <br /> ukj ∈ [0,1];<br /> <br /> ≤ 1;<br /> <br /> j =1<br /> <br /> ∀k = 1, N<br /> <br /> (9)<br /> <br /> Với tâm cụm ban đầu được xác định theo công thức<br /> N<br /> <br /> vj =<br /> <br /> ∑u<br /> k =1<br /> N<br /> <br /> 2<br /> kj<br /> <br /> Xk<br /> <br /> ∑u<br /> <br /> 2<br /> kj<br /> <br /> ; j = 1,..., C<br /> <br /> (10)<br /> <br /> k =1<br /> <br /> Để sử dụng khoảng cách Mahalanobis, ma trận hiệp phương sai của các mẫu được tính như sau<br /> <br /> A=<br /> <br /> 1 C N 2<br /> T<br /> ∑∑ ukj (x k − v j )(x k − v j )<br /> N j =1 k =1<br /> <br /> Sau đó, khoảng cách được tính bởi công thức (với<br /> <br /> (11)<br /> <br /> A = P −1 )<br /> <br /> 2<br /> d A ( x1 , x2 ) = (x1 − x2 ) A(x1 − x2 )<br /> <br /> T<br /> <br /> (12)<br /> <br /> Khi đó hàm mục tiêu [29, 30] của eSFCM được xác định như sau<br /> N<br /> <br /> C<br /> <br /> J (U ,V ) = ∑∑ ukj X k − V j<br /> k =1 j =1<br /> <br /> 2<br /> A<br /> <br /> N<br /> <br /> C<br /> <br /> (<br /> <br /> )<br /> <br /> + λ−1 ∑∑ ukj − ukj ln ukj − ukj → min<br /> k =1 j =1<br /> <br /> (13)<br /> <br /> Với điều kiện ràng buộc (8) và hàm mục tiêu (13) ta có các công thức xác định ma trận độ thuộc<br /> <br /> ukj = ukj +<br /> <br /> e<br /> C<br /> <br /> − λ X k −V j<br /> <br /> ∑e<br /> <br /> 2<br /> A<br /> <br /> − λ X k −V i<br /> <br /> 2<br /> A<br /> <br /> i =1<br /> <br /> Trong đó X k − V j<br /> <br /> 2<br /> A<br /> <br /> = d A( k , j ) và tâm cụm<br /> <br /> C<br /> ⎛<br /> ⎞<br /> ⎜1 − ∑ uki ⎟ , k = 1, N , j = 1, C<br /> ⎝ i =1 ⎠<br /> <br /> (14)<br /> <br /> 134<br /> <br /> ĐÁNH GIÁ HIỆU NĂNG CỦA THUẬT TOÁN PHÂN CỤM MỜ BÁN GIÁM SÁT CHO BÀI TOÁN PHÂN ĐOẠN ẢNH NHA KHOA<br /> <br /> ∑<br /> =<br /> ∑<br /> N<br /> <br /> u Xk<br /> <br /> k =1 kj<br /> N<br /> <br /> Vj<br /> <br /> ; j = 1, C<br /> <br /> u<br /> k =1 kj<br /> <br /> (15)<br /> <br /> Thuật toán Semi-Supervised Entropy Regularized Fuzzy Clustering (eSFCM) như sau (xem bảng 3)<br /> Bảng 3. Thuật toán Semi-Supervised Entropy Regularized Fuzzy Clustering<br /> <br /> Input<br /> Output<br /> eSFCM<br /> 1:<br /> <br /> Tập dữ liệu X gồm N phần tử , số cụm C, độ thuộc bổ trợ<br /> Ma trận U và tâm cụm V.<br /> Tính ma trận P theo công thức (11) với ma trận độ thuộc<br /> <br /> 2:<br /> 3:<br /> 4:<br /> 5:<br /> <br /> Tính<br /> <br /> 7:<br /> <br /> Until U<br /> <br /> U đã cho và các tâm cụm v j ban đầu;<br /> <br /> t = 1;<br /> Repeat<br /> t=t+1<br /> <br /> 6:<br /> <br /> U , ngưỡng ε , số lần lặp tối đa maxStep > 0.<br /> <br /> Tính u kj ( k = 1, N ; j = 1, C ) bới công thức (14)<br /> <br /> Vj<br /> <br /> ( t +1)<br /> <br /> (t )<br /> <br /> ( j = 1, C ) bởi công thức (15)<br /> <br /> − U ( t −1) ≤ ε or t > maxStep<br /> <br /> 2.3.3. Thuật toán Semi-Supervised Fuzzy C-Mean của Bouchachia và Pedrycz<br /> Bouchachia và Pedrycz [3] đã đề xuất phương pháp phân cụm mờ bán giám sát với thông tin bổ trợ là độ thuộc<br /> bổ trợ<br /> <br /> ukj cho trước, khi đó hàm mục tiêu [3] được xác định bởi<br /> C<br /> <br /> N<br /> <br /> C<br /> <br /> L<br /> <br /> C<br /> <br /> 2 2<br /> 2<br /> J (U ,V , λ ) = ∑∑ u ik d ik + α ∑∑ (u ik − u ik ) 2 d ik − λ ∑ (u ik − 1)<br /> <br /> Tham số<br /> <br /> λ<br /> <br /> i =1 k =1<br /> <br /> i =1 k =1<br /> <br /> (16)<br /> <br /> i =1<br /> <br /> được xác định bởi công thức<br /> C<br /> <br /> N<br /> <br /> α<br /> 1 − 1+α ∑∑ u ik<br /> <br /> λ=<br /> <br /> i =1 k =1<br /> <br /> C<br /> <br /> N<br /> <br /> (17)<br /> <br /> 1<br /> <br /> ∑∑ 2(1 + α )d<br /> i =1 k =1<br /> <br /> 2<br /> ik<br /> <br /> với các phần tử của ma trận độ thuộc U được tính như sau<br /> <br /> α u ik<br /> +<br /> u ik =<br /> 1+α<br /> <br /> 1−<br /> <br /> α<br /> <br /> C<br /> <br /> ∑u<br /> <br /> 1 + α l =1<br /> C<br /> d<br /> ∑ d ik<br /> l =1<br /> lk<br /> <br /> ik<br /> <br /> (18)<br /> <br /> H<br /> <br /> Với H là số lớp, mỗi lớp h chứa một số các cụm C h thỏa mãn<br /> <br /> (t )<br /> <br /> = u ik<br /> <br /> ( t −1)<br /> <br /> h<br /> <br /> = C và π h là tập các cụm thuộc vào<br /> <br /> h =1<br /> <br /> ~<br /> lớp h thì các giá trị uik được cho bởi công thức (t là số bước lặp)<br /> u ik<br /> <br /> ∑C<br /> <br /> H ⎛<br /> ⎞ ⎧1,<br /> (<br /> + 2 βδ k ∑ ⎜ f hk − ∑ u ikt −1) ⎟ * ⎨<br /> ⎜<br /> ⎟ 0,<br /> h =1 ⎝<br /> i∈π h<br /> ⎠ ⎩<br /> <br /> k ∈π h<br /> k ∉π h<br /> <br /> (19)<br /> <br /> Tâm cụm i được xác định bởi<br /> <br /> ∑ (u<br /> N<br /> <br /> vi =<br /> <br /> 2<br /> ij<br /> <br /> )<br /> <br /> + α (u ij − u ik ) 2 x j<br /> <br /> j =1<br /> <br /> ∑ (u<br /> N<br /> <br /> j =1<br /> <br /> 2<br /> ij<br /> <br /> + α (u ij − u ik )<br /> <br /> 2<br /> <br /> )<br /> <br /> Thuật toán được thực hiện theo các bước như sau (xem bảng 4)<br /> <br /> (20)<br /> <br />
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2