YOMEDIA
ADSENSE
Sử dụng mạng nơron min - max mờ trong chẩn đoán bệnh ung thư
14
lượt xem 3
download
lượt xem 3
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bài viết Sử dụng mạng nơron min - max mờ trong chẩn đoán bệnh ung thư trình bày ứng dụng mô hình FMN cải tiến học bán giám sát kết hợp với việc sử dụng các thông tin bổ trợ cho phép giải quyết đồng thời cả hai vấn đề giảm số lượng hyper box và khả dụng cho các tập dữ liệu mà 100% số lượng mẫu chưa được gán nhãn. Mô hình sử dụng được gọi là SCFMM-D (Semi-clustering and Fuzzy Min Max neural network in Diagnosis).
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Sử dụng mạng nơron min - max mờ trong chẩn đoán bệnh ung thư
- Tuyển tập Hội nghị Khoa học thường niên năm 2018. ISBN: 978-604-82-2548-3 SỬ DỤNG MẠNG NƠRON MIN - MAX MỜ TRONG CHẨN ĐOÁN BỆNH UNG THƯ Trần Thị Ngân, Trần Mạnh Tuấn Khoa Công nghệ thông tin, Trường Đại học Thủy lợi, email: ttngan@tlu.edu.vn 1. GIỚI THIỆU thông qua hàm thuộc mờ. Tuy nhiên độ chính xác phân loại mẫu trong một số trường hợp Thời gian gần đây, ung thư là một trong các còn hạn chế. Do đó, để nâng cao khả năng bệnh phổ biến nhất trên thế giới. Các bệnh ứng dụng của FMN, nhiều tác giả đã đề xuất viện trở lên quá tải với số lượng bệnh nhân các cải tiến FMN với mục tiêu nâng cao độ lớn và cơ sở vật chất còn hạn chế. Hơn nữa, chính xác phân loại mẫu của nó. nếu phát hiện ung thư sớm thì việc điều trị sẽ Trong bài báo này, chúng tôi ứng dụng mô hiệu quả và chi phí thấp hơn nhiều. Quá trình hình FMN cải tiến học bán giám sát kết hợp chẩn đoán bệnh thủ công có một số nhược với việc sử dụng các thông tin bổ trợ cho điểm. Thứ nhất, với số lượng lớn các bệnh phép giải quyết đồng thời cả hai vấn đề giảm nhân, thường các bác sĩ phải làm việc nhiều số lượng hyper box và khả dụng cho các tập và quá tải. Thứ hai các bác sĩ đặc biệt với dữ liệu mà 100% số lượng mẫu chưa được những người có nhiều kinh nghiệm còn hạn gán nhãn. Mô hình sử dụng được gọi là chế trong khi kinh phí để tra lương cho các SCFMM-D (Semi-clustering and Fuzzy Min bác sĩ còn hạn chế. Thứ ba, quá trình này mất Max neural network in Diagnosis). nhiều thời gian của bệnh viện và sự chờ đợi Trong các phần tiếp theo chúng tôi cấu của các bệnh nhân đến khám và điều trị. Vì truc như sau: phần 2 trình bày chi tiết về vậy, một hệ thống hỗ trợ quyết định có thể tự phương pháp SFCMN, phần 3 trình bày về động đưa ra các chẩn đoán các bệnh nhân. Nó các kết quả thực nghiệm, phần 4 là kết luận. còn có giá trị hơn nữa khi hệ thống hỗ trợ ra quyết định có thể cung cấp các kết quả chính 2. PHƯƠNG PHÁP SFCMN xác, nâng cao chất lượng chăm sóc và giảm thời gian khám và điều trị của bệnh nhân. D là tập dữ liệu vào của thuật toán học, Tự động chẩn đoán ung thư sớm của bệnh Ah=(ah1, ah2, ..., ahn) In là mẫu vào thứ h (h = nhân có thể coi như bài toán về nhập dạng và 1, 2,…, m) của tập D. Thuật toán học tạo ra phân loại mẫu. Bài toán nhận dạng và phân các hyper box, gán nhãn cho các hyper box loại mẫu có thể được giải quyết bằng nhiều và gán nhãn cho các mẫu đầu vào. Thuật toán mô hình khác nhau như mạng nơron học sử dụng 3 tập hyper box: (ANN)[2], hệ chuyên gia, logic mờ, các máy - Tập B: gồm các hyper box có kích thước hỗ trợ vectơ [3], cây hồi quy (CART) [1]. lớn chứa các mẫu dữ liệu gần tâm cụm. Trong số đó, mạng nơron nhân tạo min-max - Tập G: gồm các hyper box có kích thước mờ (FMN) [5] là một mô hình dự báo tốt và nhỏ, các hyper box này nằm trong hyper box đầy tiềm năng cho các ứng dụng dữ báo y tế B (GB). [4]. Ưu thế của FMN là khả năng học trực - Tập L: gồm các hyper box có kích thước tuyến, nó có khả năng học từ các mẫu đào tạo nhỏ, chứa các dữ liệu nằm vùng danh giới, mới kết hợp với các thông tin đã học trước vùng nhiễu. Tập L gồm các hyper box đưa đó. Hơn nữa, FMN cung cấp quyết định mềm vào cắt tỉa dựa trên chỉ số CF. 160
- Tuyển tập Hội nghị Khoa học thường niên năm 2018. ISBN: 978-604-82-2548-3 Thuật toán gồm 2 pha: bởi nhãn của hyper box gần nhất lớn hơn - Pha 1: thuật toán học FMN không giám ngưỡng mà được cung cấp bởi người dùng và sát thực hiện một lần duyệt qua các mẫu vào nó được coi là giới hạn tối thiểu. Ngược lại, tạo ra tập B=(B1, B2,..., Bk) gồm k hyper box nếu giá trị đó nhỏ hơn, không có hyper box khác nhau, với mỗi hyper box như thế là một nào được tạo ra. Trong trường hợp này, mẫu cụm. Thuật toán học tách tập D thành hai tập nhập được bỏ qua và nó sẽ được xem như là D1 và D2. Tập dữ liệu D1 gồm các mẫu nằm mẫu mới trong lần duyệt dữ liệu tiếp theo trong các hyper box Bj và được gán nhãn (Hình 2). theo chỉ số của Bj. Tập D2 là các mẫu còn lại Begin không được gán nhãn (Hình 1). Dữ liệu vào AhD1 Begin Chọn mẫu vào AhD Có hyperbox nào y Mở rộng hyperbox chứa được Ah? y Có hyperbox nào n n Có chồng Mở rộng hyperbox chứa được Ah? Tạo và gán nhãn cho lấn hyperbox? hyperbox n n Có chồng y Tạo và gán nhãn lấn hyperbox? Co lại hyperbox cho hyperbox y n Dữ liệu vào Co lại hyperbox đã hết? y n Dữ liệu vào Dữ liệu vào AhD2 đã hết? y Ah có y Dữ liệu vào AhD thuộc vào hyperbox có trước? Ah có n y thuộc hyperbox nào có Có hyperbox y trước? Mở rộng hyperbox nào chứa được Ah? n Gán nhãn Ah theo Bj D1=D1{Ah} n D2=D2{Ah} Có chồng n Độ lấn hyperbox? n thuộc của Ah vào n Dữ liệu vào y hyperbox gần nhất đã hết? lớn hơn Co lại hyperbox y β? y End Tạo và gán nhãn cho hyperbox Hình 1. Thuật toán học bổ trợ thêm thông tin bằng cách gán nhãn cho một số mẫu đầu vào Gán nhãn cho Ah - Pha 2: thuật toán học FMN có giám sát thực hiện một lần duyệt qua các mẫu trong n Tất cả dữ liệu tập dữ liệu D1 tạo ra tập các hyper box đã có nhãn? G (G1 ,G 2 ,...,G j ) . Với tập dữ liệu D2, thuật y toán học duyệt qua các mẫu để gán nhãn cho End các mẫu theo nhãn của các hyper box thuộc tập G. Thuật toán SCFMN tìm ra hyper box Hình 2. Thuật toán học gán nhãn gần nhất bằng cách sử dụng hàm thuộcTrong cho các mẫu dữ liệu dựa vào nhãn trường hợp này, mẫu đầu vào được gắn nhãn của các mẫu được bổ trợ thông tin ở pha 1 161
- Tuyển tập Hội nghị Khoa học thường niên năm 2018. ISBN: 978-604-82-2548-3 3. KẾT QUẢ THỰC NGHIỆM 4. KẾT LUẬN Trong thực nghiệm với bộ dữ liệu Breast Trong bài báo này, chúng tôi đề xuất mô Cancer Wisconsin (Diagnostic) với 569 mẫu hình kết hợp giữa học bán giám sát và mạng và 32 thuộc tính, trong đó có 10 thuộc tính nơron min max mờ (SCFMM-D) áp dụng cho giá trị thực. Tất cả các mẫu đầu vào của tập bài toán chẩn đoán bệnh ung thư. Mô hình dữ liệu được gán nhãn đối bằng các thuật này được đánh giá bằng thực nghiệm trên bộ toán FMNN [5], FMN-CF [6]. Trong khi với dữ liệu ung thư vú của Wisconsin (BCWD). SCFMM-D (với các tham số: CF = 0.45, = Các kết quả thực nghiệm chứng minh rằng 20, = 0.8) các mẫu đầu vào không có nhãn phương pháp đề xuất đạt được kết quả tốt đi kèm. Các thực nghiệm được lặp lại 30 lần, hơn trên các tiêu chí đặt ra với khả năng thiết mỗi lần với một chuỗi dữ liệu huấn luyện là lập một cơ sở quy tắc. Để tiếp tục công việc, ngẫu nhiên. Trong các thực nghiệm, phương cần phải điều tra thông tin cụ thể về bệnh pháp đánh giá các kết quả theo thống kê để nhân trong tập dữ liệu để cải thiện độ chính tính trung bình bao gồm các chỉ số: Acc xác dự đoán. (Accuracy – Độ chính xác), NoH (Number of Hyper boxes - Số hyper box tạo ra trong quá 5. TÀI LIỆU THAM KHẢO trình thực hiện thuật toán). [1] Breiman, L. (2017). Classification and Bảng 1. Bảng kết quả thực nghiệm regression trees. Routledge. [2] Haykin, S. (1994). Neural networks: a FMNN FMN-CF SCFMN-D comprehensive foundation. Prentice Hall PTR. [3] Nasrabadi, N. M. (2007). Pattern Acc NoH Acc NoH Acc NoH recognition and machine learning. Journal 0.10 68.63 362 67.73 78 83.52 48 of electronic imaging, 16(4), 049901. 0.20 72.44 287 70.67 62 84.31 37 [4] Patil, P., & Waghole, S. (2014). Cancer Diagnosis Using Fuzzy Min-Max Neural 0.30 74.42 210 75.17 43 86.73 30 Network WithRule Extraction. International 0.40 73.62 154 72.72 34 84.53 20 Journal of Engineering Research and 0.50 67.28 121 70.39 21 83.34 16 Applications, 4(2), 11-15. [5] Simpson, P. K. (1993). Fuzzy min-max 0.60 66.08 80 65.28 17 83.03 12 neural networks-part 2: Clustering. IEEE 0.70 63.45 40 60.76 10 82.02 8 Transactions on Fuzzy systems, 1(1), 32-45. [6] Singh, A., & Pandey, B. (2014). Intelligent 0.80 58.55 20 56.24 7 80.02 6 techniques and applications in liver 0.90 54.54 16 53.45 6 79.89 5 disorders: a survey. International Journal of Biomedical Engineering and Dựa trên kết quả về độ chính xác và số Technology, 16(1), 27-70. lượng Hyper box tạo ra, mô hình đề xuất đều có kết quả tốt hơn với các giá trị khác nhau của tham số ngưỡng . Dựa vào bảng 1 ta thấy, giá trị của Acc tốt nhất trong lân cận của = 0.3. 162
ADSENSE
CÓ THỂ BẠN MUỐN DOWNLOAD
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn