B GIÁO DỤC VÀ ĐÀO TẠO B QUC PHÒNG
HC VIN K THUT QUÂN S
ĐẶNG TRNG HP
PHÁT TRIN MT SHÌNH
PHÂN CM M CNG TÁC
Chuyên ngành: Cơ sở toán hc cho tin hc
Mã s: 9460110
TÓM TT LUN ÁN TIẾN SĨ TOÁN HC
HÀ NI - 2019
ng tnh đưc hoàn thành ti
HỌC VIỆN KTHUẬT QN S
Ngườiớng dẫn khoa học
PGS. TS Ngô Thành Long
Phn bin 1: PGS.TSKH NGUYN CÁT H
VIN CNTT - VIN HÀN LÂM KHCN VIT NAM
Phn bin 2: PGS.TS TRN NGUYÊN NGC
HC VIN K THUT QUÂN S
Phn bin 3: PGS.TS LÊ TRỌNG VĨNH
ĐH KHTN - ĐH QUỐC GIA HÀ NI
Luận án được bo v ti Hội đồng đánh giá luận án cp Hc vin theo
quyết định s 2110/-HV, ngày 14 tháng 06 năm 2019 của Giám đốc
Hc vin K thut Quân s, hp ti Hc vin K thut Quân s vào hi
gi ngày tháng năm 2019.
Có th tìm hiu lun án ti:
- Thư viện Hc vin K thut Quân s.
- Thư viện Quc gia.
1
MỞ ĐẦU
1. Tính cp thiết ca ni dung nghiên cu.
Trong thc tế, d liu phân cụm thường s không chc chn
và có nhiu, nhiu d liu có s chia tách các cm không tuyến tính,
nhiu loi d liu s chiều kích thước ln. Hin nay nhiu
nhà khoa học quan tâm đến bài toán phân cm cng tác, tuy nhiên
nhng vấn đề trên vẫn chưa các nghiên cu gii pháp mt
cách triệt để.
2. Mc tiêu nghiên cu ca lun n
Nghiên cu bài toán phân cm m cng tác, các vấn đề còn tn
ti ca phân cm m cng tác khi ng dng trong các bài toán thc
tế đề ra các mô hình, gii pháp nâng cao hiu qu phân cm:
- Gii pháp cho vấn đề không ràng, không chc chn ca d
liu thc tế cn phân cm.
- Gii pháp cho vấn đề d liu phc tp, hình dng và s chia tách
các cm không tuyến tính.
- Gii pháp cho vấn đề d liu nhiu chiều, kích thước lớn, độ
phc tạp tính toán cao thường gp trong thc tế hin nay.
3. Đối tượng nghiên cu
Các thut toán phân cm m, tp m loi 1, loi 2 loi 2 giá tr
khong; nh thut toán phân cm cng tác; Phương pháp
nhân và các thut toán phân cm dựa trên phương pháp nhân và tính
toán hạt siêu đim nh; Phương pháp giảm chiu da trên phép
chiếu ngu nhiên và ng dng trong bài toán phân cm.
4. Phm vi nghiên cu
- Nghiên cu lý thuyết tp m loi 1, 2.
- Nghiên cu các thut toán phân cm d liu mt s vấn đề
2
liên quan trong bài toán phân cm d liu.
- Nghiên cu mô hình và thut toán phân cm m cng tác.
- Nghiên cu và phát trin các k thut phân cm m cng tác trên
sở ng dng tp loi 2 giá tr khoảng, phương pháp nhân, tính
toán hạt siêu điểm nh và k thut gim chiu d liu
5. Cu trúc ca lun án
Chương 1. Tổng quan v phân cm m cng tác
Chương 2. Phân cụm m giá tr khong cng tác
Chương 3. Một s ci tiến thut toán phân cm m cng tác
Kết lun nêu tóm tt vấn đề nghiên cu, các mô hình phân cm
m cộng tác được để xuất cũng như các hướng nghiên cu m rng.
CHƯƠNG 1. TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU
1.1 Gii thiu phân cm m cng tác và mt s kiến thức cơ sở
1.1.1 Phân cm m FCM (Fuzzy C Means)
Hàm mc tiêu m được Dunn định nghĩa như sau:
𝐽𝑚(𝑈,𝑣)= 𝑢𝑖𝑘𝑑𝑖𝑘
2𝑐
𝑖=1
𝑛
𝑘=1
Bezdek khái quát hóa hàm mc tiêu m bằng cách đưa ra trọng s
1m
, là s thực như sau :
𝐽𝑚(𝑈,𝑣)= 𝑢𝑖𝑘
𝑚𝑑𝑖𝑘
2𝑐
𝑖=1
𝑛
𝑘=1
Bezdek chng minh hàm mục tiêu đạt giá tr ti thiu cc b khi:
𝑢𝑖𝑘 =1
(𝑑𝑖𝑘
𝑑𝑗𝑘)2
𝑚−1
𝑐
𝑗=1
(1.4)
𝑣𝑖=𝑢𝑖𝑘
𝑚𝑥𝑘
𝑛
𝑘=1
𝑢𝑖𝑘
𝑚
𝑛
𝑘=1 (1.5)
𝑉ớ𝑖 1𝑖𝑐,1𝑘𝑛
Thut toán phân cm m FCM được mô t như sau :
Thut toán 1.6. Phân cm m FCM
Đầu vào: Tp d liu 𝑋 ={𝑥1,𝑥2,,𝑥𝑛}𝑅𝑝, s cm c (1<c<n),
h s m m (1<m<+) và sai s
, s ln lp tối đa
max.
Đầu ra: Kết qu phân cm
Khi to:
3
Tâm cm V;
τ=0. //Đếm s vòng lp.
REPEAT
Tính toán giá tr tâm cm v theo công th (1.5);
Cp nht giá tr ma trn hàm thcuci theo công thc
(1.4);
τ=τ+1;
UNTIL ((
( ) ( 1)nn
JJ

) hoc (
max))
1.1.2 Phân cm m cng tác
Bài toán phân cm m cng tác có hàm mc tiêu cn tối ưu là:
Min
][][]|[][= 2
1=1,=
][
1=
2
1=
][
1=
][ jjdiiujjiidiiuQ ik
m
ik
c
i
P
iijjjj
iiN
k
ik
m
ik
c
i
iiN
k
ii
S dụng phương pháp Lagrange để tối ưu hàm mục tiêu trên s
được công thc tính ma trn phân hoch và tâm cụm như sau:
1))((1
]|[
~
1))((1
]|[
~
1
/
1
=][ 1,=1,=
1=
22
1=
P
jjiiu
P
jjiiu
dd
iiu
rs
P
iijjjj
js
P
iijjjj
c
j
jsrs
c
j
rs
2
][
1=1,=
2
][
1=
2
][
1=1,=
2
][
1=
])|[
~
][(][
])|[
~
][(][
=][
jjiiuiiuiiu
xjjiiuiiuxiiu
iiv
rkrk
iiN
k
P
iijjjj
rk
iiN
k
ktrkrk
iiN
k
P
iijjjj
ktrk
iiN
k
rt
1.1.3 Tp m
1.1.3.1 Tp m loi 1 (Type 1 Fuzzy Sets - FS)
1.1.2.2 Tp m loi 2 (Type 2 Fuzzy Sets - T2FS)
1.1.2.3 Tp m loi 2 khong (Interval Type 2 Fuzzy Sets - IT2FS)
1.1.2.4 Tp m giá tr khong (Interval valued Fuzzy Sets)
1.1.4 Khong cách trong phân cm
Có hai cách đo phổ biến là đo khoảng cách và do độ ơng tự.
1.1.4.1 Độ đo khoảng cách