
1
Mð ¦u
Trong nhúng n«m g¦n ¥y, ph¡t hi»n tri thùc tø cì sð dú li»u ¢ trð
thnh mët trong nhúng h÷îng nghi¶n cùu lîn nh§t cõa l¾nh vüc khoa håc
m¡y t½nh v cæng ngh» tri thùc. Khai ph¡ dú li»u l mët kh¥u quan trång
trong qu¡ tr¼nh ph¡t hi»n tri thùc tø cì sð dú li»u. Khai ph¡ dú li»u gçm
nhi·u h÷îng ti¸p cªn, c¡c kÿ thuªt ch½nh ph¦n lîn ÷ñc k¸ thøa tø c¡c
l¾nh vüc cì sð dú li»u, m¡y håc (machine learning), tr½ tu» nh¥n t¤o (arti-
ficialintellgence), lþ thuy¸t thæng tin (information theory), x¡c su§t thèng
k¶ (probability
&
statics) v c¡c kÿ thuªt t½nh to¡n m·m. C¡c bi to¡n
chõ y¸u trong khai th¡c dú li»u l khai th¡c chuéi, khai th¡c wed, ph¡t
hi»n luªt k¸t hñp, v§n · gom cöm, ph¥n lîp (classification) dú li»u.
Vîi sü ra íi v ph¡t triºn cõa lþ thuy¸t tªp mí, tin håc ¢ câ c¡i nh¼n g¦n
vîi thüc ti¹n hìn, c¡c cæng cö cõa logic mí cho ph²p sû lþ nhúng thæng tin
khæng ¦y õ, khæng ch½nh x¡c, ch¯ng h¤n vi»c t¼m tái èi t÷ñng "gièng
nhau" chù khæng ph£i "b¬ng nhau" nh÷ vîi c¡ch t¼m ki¸m thæng th÷íng.
Ch½nh v¼ nhúng þ ngh¾a â m em ¢ lüa chån · ti "Lþ thuy¸t tªp mí
v ùng döng trong ph¥n lîp dú li»u" lm · ti cho luªn v«n cõa m¼nh.
Möc ½ch cõa · ti
Möc ½ch cõa · ti ny nh¬m nghi¶n cùu lþ thuy¸t tªp mí, quan h» mí,
so s¡nh vîi lþ thuy¸t tªp hñp kinh iºn. Nghi¶n cùu mët sè ph÷ìng ph¡p
ph¥n lîp dú li»u v t¼m c¡ch ùng döng tªp mí v quan h» mí trong bi
to¡n ph¥n lîp dú li»u çng thíi minh håa tr¶n mët sè bi to¡n cö thº.
.