1
BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÕNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
-----------------------
VŨ ĐÌNH MINH
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN
PHÂN CỤM BÁN GIÁM SÁT
SỬ DỤNG MẠNG NƠRON MIN-MAX MỜ VÀ ỨNG DỤNG
Chuyên ngành:
Mã số:
C sở to n học cho tin học
9 46 01 10
TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC
Hà Nội - 2019
2
Công trình được hoàn thành tại:
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
BỘ QUỐC PHÒNG
Người hướng dẫn khoa học:
1. PGS. TS. Lê Bá Dũng
2. TS. Nguyễn Doãn Cường
Phản biện 1: PGS.TS Bùi Thu Lâm
Học viện Kỹ thuật quân sự
Phản biện 2: PGS.TS Phùng Trung Nghĩa
Đại học Thái Nguyên
Phản biện 3: TS Nguyễn Đỗ Văn
Viện Khoa học và Công nghệ quân sự
Luận án được bảo vệ trước Hội đồng đánh giá luận án cấp
Viện họp tại Viện KH&CN quân sự vào hồi ….. ngày …..
tháng ….. năm 2019.
Có thể tìm hiểu luận án tại thư viện:
- Thư viện Viện KH&CN quân sự
- Thư viện Quốc gia Việt nam
1
MỞ ĐẦU
1. Tính cấp thiết của luận n
Phân cụm bán giám sát mờ một mở rộng của phân cụm mờ bằng
cách sử dụng các thông tin biết trước làm tăng chất lượng của cụm. Các
thông tin biết trước hay còn gọi các thông tin bổ trợ nhằm mục đích
hướng dẫn, giám sát và điều khiển quá trình phân cụm.
hình mạng nơron min-max mờ (FMNN) do giáo Patrick K.
Simpson đề xuất dựa trên những ưu điểm của việc kết hợp logic mờ,
mạng nơron nhân tạo, lý thuyết min-max mờ để giải quyết bài toán phân
lớp phân cụm. FMNN hình học gia tăng dựa trên các tập siêu
hộp mờ cho khả năng xử lý các bộ dữ liệu quy mô lớn.
Chẩn đoán bệnh gan dựa trên số liệu của kết quả xét nghiệm men
gan thể được hình thành như một vấn đề nhận dạng mẫu. Việc sử
dụng FMNN được coi một cách tiếp cận hiệu quả. Một trong
những lý do để FMNN được sử dụng trong y tế là khả năng sinh các luật
quyết định if .. then rất đơn giản. Mỗi siêu hộp của FMNN chuyển thành
một luật được tả bằng cách định lượng các giá trị min max của
các thuộc tính dữ liệu.
Tuy nhiên, bản thân FMNN vẫn còn tồn tại nhiều nhược điểm dẫn
tới những khó khăn khả năng ứng dụng thực tiễn bị hạn chế. Các
nghiên cứu chính cải tiến FMNN thường tập trung vào các hướng chính
như cải tiến cấu trúc mạng, tối ưu hóa các tham số, hàm thuộc, giảm
thiểu số siêu hộp trong mạng, cải tiến phương pháp học hay kết hợp với
phương thức khác để cải thiện chất lượng.
Trên cơ sở nghiên cứu quá trình phát triển của FMNN, để nâng cao
hiệu năng của FMNN, đề tài luận án tập trung vào việc đề xuất, cải tiến
phương pháp học bằng phương pháp học bán giám sát. Trong các
phương pháp mới trình bày trong luận án, thông tin bổ trợ được xác
định nhãn được gán cho một phần dữ liệu để hướng dẫn giám sát
2
quá trình phân cụm. Đây một cách tiếp cận mới các phương pháp
trước đó chưa đề cập đến.
2. Mục tiêu nghiên cứu
- Xây dựng thuật toán cải tiến phân cụm bán giám sát mờ dựa trên
lan truyền nhãn. Thông tin bổ trợ một tỷ lệ phần trăm nhỏ của các
mẫu được dán nhãn.
- Đề xuất hình phân cụm bán giám sát mờ kết hợp, thuật toán
học tự xác định thông tin bổ trnhãn của một phần mẫu cho thuật
toán phân cụm bán giám sát mờ.
- Phát triển thuật toán phân cụm mờ có tính đến yếu tố phân bố dữ
liệu.
- Ứng dụng mạng nơron min-max mờ với kết xuất luật quyết định
if...then mtrong thiết kế hệ hỗ trợ chẩn đoán bệnh gan từ dữ liệu số
liệu các kết quả xét nghiệm men gan của bệnh nhân.
3. Đối tượng và phạm vi nghiên cứu
Đề tài luận án tập trung nghiên cứu các vấn đề sau:
- Nghiên cứu tổng quan về mạng nơron min-max mcác biến
thể của mạng nơron min-max mờ.
- Phân tích các hạn chế và giải pháp đã được các nhà nghiên cứu sử
dụng để khắc phục những hạn chế này.
- Ứng dụng mạng nơron min-max mờ với kết xuất luật quyết định
if...then mờ trong chẩn đoán Y tế.
4. Phư ng ph p nghiên cứu
Luận án sử dụng phương pháp nghiên cứu thuyết, cụ thể là luận
án đã nghiên cứu mô hình FMNN cho phân lớp phân cụm dữ liệu. Từ
đó, luận án tập trung nghiên cứu đề xuất thuật toán phân cụm bán giám
sát. Luận án cũng sử dụng phương pháp thực nghiệm mô phỏng kết hợp
với phân tích, thống kê, đánh giá số liệu thực nghiệm.
5. Đóng góp của luận n
- Xây dựng thuật toán SS-FMM cải tiến phân cụm bán giám sát mờ
dựa trên lan truyền nhãn.
3
- Đề xuất hình phân cụm bán giám sát mờ kết hợp FMNN
SS-FMM, thuật toán học tự xác định thông tin bổ trợ cho thuật toán
phân cụm bán giám sát mờ.
- Phát trin thut toán pn cm mcó nh đến yếu tố phân bdữ liệu.
6. Cấu trúc của luận n
Ngoài phần phần mở đầu kết luận, bố cục của luận án gồm ba
chương:
- Chương 1 trình bày nghiên cứu tổng quan của luận án, bao gồm
các nội dung bản về FMNN các mở rộng của FMNN. Đặc điểm
chung của các mở rộng, các hạn chế từ đó đưa ra các hướng nghiên cứu
tiếp theo. Thông qua chương này, luận án đưa ra được cái nhìn tổng
quan về bài toán nghiên cứu, các khái niệm thuật toán bản sử
dụng trong nghiên cứu của luận án.
- Chương 2 trình bày các đề xuất cải tiến về phương pháp học trong
FMNN, bao gồm hình học bán giám t cho phân cụm dữ liệu sử
dụng thông tin bổ trợ một phần mẫu trong tập dữ liệu huấn luyện
được gán nhãn, sau đó lan truyền nhãn cho các mẫu dữ liệu không
nhãn. Mô hình phân cụm bán giám sát mờ kết hợp, thuật toán học tự xác
định thông tin bổ trợ nhãn của một phần mẫu trong tập dữ liệu huấn
luyện. đây cũng chính đầu vào cho thuật toán phân cụm bán giám
sát mờ. hình phân cụm dữ liệu trong mạng nơron min-max mờ
tính đến yếu tố phân bố dữ liệu. Tiếp theo trình bày kết quả thực nghiệm
của các đề xuất trên các tập dữ liệu Benchmark so sánh với một số
phương thức liên quan.
- Chương 3 trình bày hình ứng dụng FMNN với kết xuất luật
quyết định if...then mờ trong thiết kế hệ hỗ trợ chẩn đoán bệnh gan từ
dữ liệu là số liệu các kết quả xét nghiệm men gan của bệnh nhân.
Cuối cùng, kết luận nêu những đóng góp, hướng phát triển, những
vấn đề quan tâm và các công trình đã được công bố của luận án.