
I HÅC THI NGUYN
TR×ÍNG I HÅC KHOA HÅC
HONG THÀ KHUYN
LUN VN THC S TON HÅC
.
LÞ
THUYT
TP
MÍ
V
ÙNG
DÖNG
TRONG
PHN
LÎP
DÚ
LIU

I HÅC THI NGUYN
TR×ÍNG I HÅC KHOA HÅC
HONG THÀ KHUYN
LÞ THUYT TP MÍ
V
ÙNG DÖNG TRONG PHN LÎP DÚ LIU
Chuy¶n ngnh:
TON ÙNG DÖNG
M¢ sè
: 60.46.36
LUN VN THC S TON HÅC
NG×ÍI H×ÎNG DN KHOA HÅC
TS. VÔ MNH XUN
th¡i nguy¶n - N«m 2011
.

i
Möc
löc
Mð
¦u
1
1
Tªp
mí
v
quan
h»
mí
3
1.1
Tªp
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
1.2
C¡c
ph²p
to¡n
tr¶n
tªp
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
1.2.1
Giao
cõa
hai
tªp
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
1.2.2
Hñp
cõa
hai
tªp
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
1.2.3
Ph¦n
bò
cõa
mët
tªp
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
1.2.4
T½ch
·
c¡c
cõa
hai
tªp
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12
1.3
Quan
h»
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14
1.3.1
Kh¡i
ni»m
quan
h»
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14
1.3.2
Hñp
thnh
c¡c
quan
h»
mí
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
1.3.3
C¡c
t½nh
ch§t
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
2
Ph¥n
lîp
dú
li»u
düa
tr¶n
quan
h»
mí
21
2.1
Bi
to¡n
ph¥n
lîp
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
2.2
Ph¥n
lîp
nhí
quan
h»
t֓ng
֓ng
kinh
iºn
.
.
.
.
.
.
.
.
22
2.3
Ph¥n
lîp
dú
li»u
sû
döng
lþ
thuy¸t
tªp
mí
.
.
.
.
.
.
.
.
.
23
2.4
Mët
sè
bi
to¡n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
K¸t
luªn
37
.

ii
39Ti li»u tham kh£o
.

1
Mð ¦u
Trong nhúng n«m g¦n ¥y, ph¡t hi»n tri thùc tø cì sð dú li»u ¢ trð
thnh mët trong nhúng h÷îng nghi¶n cùu lîn nh§t cõa l¾nh vüc khoa håc
m¡y t½nh v cæng ngh» tri thùc. Khai ph¡ dú li»u l mët kh¥u quan trång
trong qu¡ tr¼nh ph¡t hi»n tri thùc tø cì sð dú li»u. Khai ph¡ dú li»u gçm
nhi·u h÷îng ti¸p cªn, c¡c kÿ thuªt ch½nh ph¦n lîn ÷ñc k¸ thøa tø c¡c
l¾nh vüc cì sð dú li»u, m¡y håc (machine learning), tr½ tu» nh¥n t¤o (arti-
ficialintellgence), lþ thuy¸t thæng tin (information theory), x¡c su§t thèng
k¶ (probability
&
statics) v c¡c kÿ thuªt t½nh to¡n m·m. C¡c bi to¡n
chõ y¸u trong khai th¡c dú li»u l khai th¡c chuéi, khai th¡c wed, ph¡t
hi»n luªt k¸t hñp, v§n · gom cöm, ph¥n lîp (classification) dú li»u.
Vîi sü ra íi v ph¡t triºn cõa lþ thuy¸t tªp mí, tin håc ¢ câ c¡i nh¼n g¦n
vîi thüc ti¹n hìn, c¡c cæng cö cõa logic mí cho ph²p sû lþ nhúng thæng tin
khæng ¦y õ, khæng ch½nh x¡c, ch¯ng h¤n vi»c t¼m tái èi t÷ñng "gièng
nhau" chù khæng ph£i "b¬ng nhau" nh÷ vîi c¡ch t¼m ki¸m thæng th÷íng.
Ch½nh v¼ nhúng þ ngh¾a â m em ¢ lüa chån · ti "Lþ thuy¸t tªp mí
v ùng döng trong ph¥n lîp dú li»u" lm · ti cho luªn v«n cõa m¼nh.
Möc ½ch cõa · ti
Möc ½ch cõa · ti ny nh¬m nghi¶n cùu lþ thuy¸t tªp mí, quan h» mí,
so s¡nh vîi lþ thuy¸t tªp hñp kinh iºn. Nghi¶n cùu mët sè ph÷ìng ph¡p
ph¥n lîp dú li»u v t¼m c¡ch ùng döng tªp mí v quan h» mí trong bi
to¡n ph¥n lîp dú li»u çng thíi minh håa tr¶n mët sè bi to¡n cö thº.
.