BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
LÊ THỊ CẨM BÌNH
MỘT SỐ PHƯƠNG PHÁP
PHÂN CỤM MỜ THEO NHÓM CHO BÀI TOÁN
DỮ LIỆU ĐA NGUỒN, NHIỀU ĐẶC TRƯNG
Ngành: Cơ sở toán học cho tin học
Mã số: 9 46 01 10
TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI- 2023
CÔNG TRÌNH ĐƯC HOÀN THÀNH TI
VIN KHOA HC VÀ CÔNG NGH QUÂN S - B QUC PNG
Người hướng dẫn khoa học:
1. PGS.TS. Ngô Thành Long
2. TS. Lê Xuân Đức
Phản biện 1: PGS.TS Nguyễn Long Giang
Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Phản biện 2: PGS. TS Nguyễn Hoàng Phương
Đại học Thăng Long
Phản biện 3: TS Đỗ Việt Bình
Viện Khoa học và Công nghệ Quân sự
Luận án được bảo vệ tại Hội đồng đánh giá luận án tiến cấp Viện, họp
tại Viện KH-CNQS vào hồi giờ ngày tháng năm 20....
Có thể tìm hiểu luận án tại:
- Thư viện Viện Khoa học và Công nghệ quân sự
- Thư viện Quốc gia Việt Nam
1
M ĐẦU
1. Tính cấp thiết của đề tài luận án
Tốc đ phát trin ca khoa hc công ngh đã phát sinh một lượng d liu
ngày càng ln phc tp. Trong s đó, d liệu được thu thp t nhiu ngun
khác nhau hoc nhiều đặc trưng những đặc điểm rt khác bit so vi d
liu truyn thng. Các ngun d liu này cung cp các thông tin hu ích nếu
đưc khai thác mt cách hiu qu.
Hin nay phân cm d liu mt trong nhng k thut quan trng trong
lĩnh vc khai phá d liệu, được s dng rng rãi trong nhiu ng dng. Tuy
nhiên, các k thut phân cm ch yếu được áp dng đối vi d liu đơn nguồn,
ít đặc trưng. vậy, vấn đ nghiên cu hoàn thin k thut phân cm phù
hp cho d liệu đa nguồn nhiều đặc trưng luôn bài toán cn thiết
phm vi nh hưởng mnh mẽ, có ý nghĩa khoa hc và thc tin.
2. Mục tiêu nghiên cứu
Trên sở nghiên cu phát trin các thut toán phân cm m, lun án tp
trung ci tiến để đưa ra một s gii pháp bao gm: Ci tiến nâng cao hiu sut
của đồng phân cm m d liu nhiều đặc trưng, đ xut các hình, thut toán
phân cm m theo nhóm tiếp cận theo hướng ng dng phân tích d liệu đa
ngun.
3. Đối tượng phm vi nghiên cu
Đối tượng nghiên cu
Lun án tập trung vào đối tượng nghiên cu là m rng các thut toán phân
cm m thích nghi vi d liệu đa nguồn và d liu có nhiều đặc trưng. Trong đó
tp trung vào nghiên cu k thuật đồng phân cm m cùng các k thut phân
cm m theo nhóm để ci tiến nâng cao hiu sut phân cm.
Phm vi nghiên cu
Phm vi nghiên cu ca lun án tp trung nghiên cu bao gm: Các thut
toán phân cm mờ, đồng phân cm m, hình phân cm m theo nhóm đối
vi d liệu đa nguồn, nhiu đặc trưng.
4. Nội dung nghiên cứu
- Nghiên cu tổng quan và cơ s toán hc ca các mô hình, thut toán phân
cm m đưc s dng trong lun án.
2
- Nghiên cu phát triển và đ xut mt vài thut toán phân cm d liu tiếp
cận theo hướng ng dng phân tích d liu đa ngun, nhiều đặc trưng.
- Nghiên cu phát triển đề xut mt vài hình phân cm m theo
nhóm tiếp cận theo hướng ng dng phân tích d liệu đa ngun.
5. Phương pháp nghiên cứu
Căn cứ vào mc tiêu ca lun án tp trung nghiên cu tổng quan đề
xut mt vài hình, thut toán phân cm m theo nhóm. Do đó, phương pháp
nghiên cu ca lun án là thc hin nghiên cu lý thuyết, trin khai thc nghim
và đánh giá kết qu. C th là:
- Trên cơ sở lý thuyết v các thut toán phân cm m và mô hình phân cm
m theo nhóm hiện đề xut mt s hình, thut toán phân cm m theo
nhóm ci tiến theo hướng tiếp cn ng dng phân tích d liệu đa nguồn, nhiu
đặc trưng.
- phng thc nghim trên máy tính s dng các b d liu mu chun,
d liu thc các ch s đánh giá chất lượng cm d liu nhm minh ha c
kết qu thc nghiệm để so sánh khẳng định tính đúng đắn ca các thut toán
đã được đề xut trong lun án.
- Kết hp gia tài liệu hướng dn ca giáo viên, t nghiên cu tìm kiếm
tài liu và trao đổi kết qu vi nhóm nghiên cu. Từng bước công b các kết qu
nghiên cu, thc nghim trên các tạp chí quy định thông qua các Hi tho, các
tạp chí trong nước nước ngoài. Tiếp thu đầy đủ nhng thành tu mi trong
c và trên thế giới để m rng và ng dng trong lun án.
6. Ý nghĩa khoa học và thực tiễn
Ý nghĩa khoa học
Luận án đề xuất các phương pháp góp phn nâng cao chất lượng da trên
các k thut phân cm m hình phân cm m theo nhóm cho bài toán d
liệu đa nguồn, nhiều đặc trưng được chng minh là phân cm d liu tốt hơn.
Ý nghĩa thực tin
Kết qu ca lun án góp phn hoàn thin các gii pháp nâng cao hiu qu
các bài toán phân cm d liệu đa nguồn, d liệu đa biến có kích thưc và s đặc
trưng lớn trong các ng dng thc tế, đáp ng nhu cầu trong lĩnh vực phân cm
d liu đa dạng hin nay.
3
7. Bố cục của luận án
Ngoài các phn m đầu, kết lun, danh mc các công trình khoa học đã
công b ca tác gi, danh mc tài liu tham kho, lun án b cc chính gm
ba chương như sau:
Chương 1: Trình bày tng quan v phân cm d liu khái quát các vn
đề nghiên cứu liên quan đến lun án bao gm: D liệu đa nguồn, d liu nhiu
đặc trưng, thuật toán đng phân cm m, thut toán tối ưu bầy đàn PSO, thut
toán đồng phân cm m, thut toán phân cm m theo nhóm và tri thc n trong
phân cm d liu, mt s công trình nghiên cứu liên quan đến lun án.
Chương 2: Trình bày hai đề xut bao gm: hình gii pháp tâm cm ti
ưu cho thuật toán đồng phân cm m ci tiến thut toán phân cm m theo
nhóm tiếp cận theo hướng phân tích d liệu đa nguồn.
Chương 3: Đề xut hình phân cm m theo nhóm tiếp cận theo hướng
phân tích d liệu đa nguồn, gi hình ci tiến phân cm m theo nhóm đa
hàm mc tiêu.