HHệệ
chuyên gia chuyên gia
Expert System)) ((Expert System
PGS.TS. Phan Huy Kháánhnh PGS.TS. Phan Huy Kh khanhph@vnn.vn
Chương 11 Chương
MMởở đ đầầu vu vềề
chuyên gia chuyên gia
hhệệ
1.21.2
HHệệ
chuyên gia (HCG) làà chuyên gia (HCG) l
??
ggìì
chuyên gia làà llĩĩnh vnh vựực c ứứng dng dụụng cng củủa a trtríítutuệệnhân tnhân tạạoo
a HCG : nh nghĩĩa HCG :
(cid:97)(cid:97) HHệệ chuyên gia l (cid:97)(cid:97) CCóó nhinhiềều cu cáách đch địịnh ngh (cid:86)(cid:86) E. Feigenbaum :
chuyên gia (Expert System) lààmmộột t
nh thông minh sửửddụụng tri th
inference procedures) c suy luậận (n (inference procedures) khăn đòi hỏỏi nhi nhữững ng
n tương đốối khi khóó khăn đòi h
chuyên gia làà mmộột ht hệệ ththốống tin h
ng tin họọc cc cóó ththểể mô phmô phỏỏng ng n (decision) vàà hhàành đnh độộng ng
c quyếết đot đoáán (decision) v t chuyên gia (con ngư
E. Feigenbaum : ««HHệệchuyên gia (Expert System) l ng tri thứức c chương trìình mnh mááy ty tíính thông minh s chương tr (knowledge) vààccáác thc thủủttụục suy lu (knowledge) v đđểểgigiảải nhi nhữững bng bàài toi toáán tương đ chuyên gia mớới gii giảải đưi đượợcc»» chuyên gia m (cid:86)(cid:86) HHệệ chuyên gia l năng lựực quy (emulates) năng l (emulates) (making abilily) củủa ma mộột chuyên gia ( (making abilily) c (cid:86)(cid:86) MMộột ht hệệ chuyên gia s
chuyên gia sửử ddụụng tri th
con ngườời)i) ng tri thứức cc củủa ma mộột lt lĩĩnh vnh vựực cc cụụ ththểể ng chuyên i quyếết vt vấấn đn đềề vvớới i ““chchấất lưt lượợng chuyên
đđểể cung c giagia”” trong l
cung cấấp vip việệc gic giảải quy trong lĩĩnh vnh vựực đc đóó..
2/2/5757
What is an Expert System? What is an Expert System?
Expert System: (cid:97)(cid:97) Expert System: A computer program that: A computer program that: (cid:86)(cid:86) Attempts to code the
(cid:86)(cid:86) Emulates the
making ability of a human expert of a human expert
knowledge of human experts Attempts to code the knowledge of human experts (i.E. A rule of thumb) form of heuristics (i.E. A rule of thumb) in the form of heuristics in the Emulates the decision decision--making ability in a restricted domain in a restricted domain
to solve problems that inference procedures to solve problems that
Edward Feigenbaum: ““An intelligent computer program that An intelligent computer program that (cid:86)(cid:86) Edward Feigenbaum: and inference procedures uses knowledge and uses knowledge are difficult enough to require significant human expertise are difficult enough to require significant human expertise for their solutions”” for their solutions
A computer program which: (cid:97)(cid:97) A computer program which: Encapsulates knowledge (cid:86)(cid:86) Encapsulates from a human expert from a
from some domain, normally obtained knowledge from some domain, normally obtained
in that domain human expert in that domain
3/3/5757
KhKháái ni
chuyên gia i niệệm m chuyên gia
rong cuộộc sc sốống ng ttrong cu i quyếết vt vấấn đn đềề ởở mmộột mt mứức c
(cid:97)(cid:97) TTrong cu đđộộ cao v
rong cuộộc sc sốống, c c chuyên gia cóó ththểể gigiảải quy
ng, cáác chuyên gia c t nhiềều tri th cao vìì hhọọ ccóó rrấất nhi u tri thứức vc vềề llĩĩnh vnh vựực hc họọ hohoạạt đt độộngng
y bao gồồm lý thuy m lý thuyếết đt đếến cn cảả ccáác kinh nghi c kinh nghiệệm, km, kỹỹ xxảảo, o,
c heuristic đã tíích lch lũũy đưy đượợc cc củủa ca cáác c
(cid:97)(cid:97) NhNhữững tng tri thri thứức nc nàày bao g phương phááp lp lààm tm tắắt, chi phương ph chuyên gia con ngườời qua qu chuyên gia con ngư chuyên môn chuyên môn
(cid:97)(cid:97) TTừừ tri th
t, chiếến lưn lượợc heuristic đã t i qua quáá trtrìình lnh lààm vim việệc cc củủa ha họọ trong m trong mộột lt lĩĩnh vnh vựực c
tri thứức nc nàày, y, ngưngườời ta c ththốống cng cóó ththểể mô phmô phỏỏng theo c i ta cốố ggắắng cng càài đi đặặt cht chúúng vng vàào ho hệệ ththốống đng đểể hhệệ ch thứức cc cáác chuyên gia l ng theo cáách th c chuyên gia lààm vim việệcc
i con ngườời, ci, cáác chương tr c chương trìình hi i không nh hiệện tn tạại không
(cid:86)(cid:86) TTri thri thứức phc phảải đưi đượợc lc lấấy ty từừ con ngư
Tuy nhiên, không giốống vng vớới con ngư (cid:97)(cid:97) Tuy nhiên, không gi ttựự hhọọc lc lấấy kinh nghi y kinh nghiệệmm ::
(cid:86)(cid:86) ĐưĐượợc mã h
con ngườờii
(cid:97)(cid:97) Đây lĐây làà nhinhiệệm vm vụụ chchíính mnh màà ccáác nhc nhàà thithiếết kt kếế HCG ph
HCG phảải đương đ
i đương đầầuu
c mã hóóa a trong m trong mộộtt ngôn ng ngôn ngữữ hhìình th nh thứứcc đ đểể khai th khai tháácc
4/4/5757
Bách khoa toàn thư mở
Wikipedia
(cid:97) HCG, còn gọi là hệ thống dựa tri trức, là một chương
trình máy tính chứa một số tri thức đặc thù của một hoặc nhiều chuyên gia con người về một chủ đề cụ thể nào đó
(cid:97) Các chương trình thuộc loại này đã được phát triển từ các thập kỷ 1960 và 1970, và trở thành ứng dụng thương mại từ thập kỷ 1980
(cid:97) Nhiều HCG đã được thiết kế và xây dựng để phục vụ các lĩnh vực kế toán, y học, điều khiển tiến trình (process control), dịch vụ tư vấn tài chính (finalcial service), tài nguyên con người (human resources), v.v...
5/5/5757
Bách khoa toàn thư mở
Wikipedia
(cid:97)(cid:97) DDạạng ph
ng phổổ bibiếến nhn nhấất ct củủa HCG l
a HCG làà ::
ch thông tin (thưhườờng ng
(cid:86)(cid:86) MMộột chương tr đưđượợc cung c (cid:86)(cid:86) NhNhữững phân t (cid:86)(cid:86) TTùùy theo thi
t chương trìình gnh gồồm mm mộột tt tậập lup luậật phân t i NSD hệệ ththốống) v c cung cấấp bp bởởi NSD h ng phân tíích vch vềề ccáác vc vấấn đn đềề đã x t phân tíích thông tin (t ng) vềề mmộột lt lớớp vp vấấn đn đềề ccụụ ththểể đã xáác đc địịnhnh
y theo thiếết kt kếế chương tr chương trìình mnh màà đưa l đưa lờời khuyên v i khuyên vềề trtrìình tnh tựự ccáác c
(cid:97)(cid:97) HCG s
HCG sửử ddụụng cng cáác tri th quyquyếết ct cáác vc vấấn đn đềề (b(bàài toi toáán) kh
c tri thứức cc củủa nha nhữững chuyên gia đ n) kháác nhau thu
ng chuyên gia đểể gigiảải i c nhau thuộộc mc mọọi li lĩĩnh vnh vựựcc
(cid:97)(cid:97) LLàà mmộột ht hệệ ththốống sng sửử ddụụng cng cáác khc khảả năng l
năng lậập lup luậận đn đểể đ đạạt tt tớới i
ccáác kc kếết lut luậậnn
(cid:97)(cid:97) CCáác thu
c thuậật ngt ngữữ ccóó ccùùng ngh
ng nghĩĩa :a :
hhàành đnh độộng cng cầần thn thựực hic hiệện đn đểể gigiảải quy i quyếết vt vấấn đn đềề
(cid:86)(cid:86) HHệệ chuyên gia chuyên gia (cid:86)(cid:86) HHệệ ththốống dng dựựa trên tri th HCG dựựa trên tri th (cid:86)(cid:86) HCG d
a trên tri thứức (knowledge based system) c (knowledge−−based system)
a trên tri thứức (knowledge based expert system) c (knowledge−−based expert system)
6/6/5757
LLớớp vp vấấn đn đềề
1.1.
a HCG_1 ccủủa HCG_1 nhnhữững tng tậập hp hợợp dp dữữ
2.2.
u thô liliệệu thô
3.3.
nh huốốngng xxảảy ra khi cho trư hihiểểu tu từừ y ra khi cho trướớc mc mộột tt tìình hu ththểể
a trên cáác tri
nh nguyên nhân củủa nha nhữững sng sựự nh huốống ph ng phứức tc tạạp p
ththểể
4.4.
trong cáác tc tìình hu ccốố trong c quan sáát đưt đượợcc quan s
ng đượợc cc cáác mc mụục c
5.5.
ch (planning) hohoạạch (planning)
ththốống,ng, đ đááp p ứứng đư ng buộộc vc vềề a mãn mộột tt tậập hp hợợp cp cáác rc rààng bu thithiếết kt kếế
i (interpretation) DiDiễễn gin giảải (interpretation) ddễễ n hay mô tảả Đưa ra kếết lut luậận hay mô t Đưa ra k n (prediction) DDựự đo đoáán (prediction) ccóó Đưa ra nhnhữững hng hậậu quu quảả Đưa ra ChChẩẩn đon đoáán (diagnosis) n (diagnosis) XXáác đc địịnh nguyên nhân c c triệệu chu chứứng cng cóó ddựựa trên c (design) ThiThiếết kt kếế (design) ttììm ra cm ra cấấu hu hìình cho c nh phầần hn hệệ nh cho cáác thc thàành ph tiêu trong khi vẫẫn thn thỏỏa mãn m tiêu trong khi v LLậập kp kếế t chuỗỗi ci cáác hc hàành đnh độộng đng đểể đ đạạt đưt đượợc mc mộột tt tậập hp hợợp cp cáác mc mụục c TTììm ra mm ra mộột chu c cho trướớc cc cáác đi ng buộộc c c điềều kiu kiệện khn khởởi đi đầầu vu vàà tiêu, khi đư đượợc cho trư tiêu, khi time) y (run--time) trong thờời gian ch trong th
nhnhữững rng rààng bu
i gian chạạy (run
7/7/5757
LLớớp vp vấấn đn đềề
a HCG_2 ccủủa HCG_2
6.6.
nh vi quan sáát đưt đượợc cc củủa ha hệệ
nh vi ththốống vng vớới hi hàành vi
hhàành vi quan s
Theo dõi (monitoring) Theo dõi (monitoring) SSo so sáánhnh nhnhữữngng mong đợợii mong đ
7.7.
BBắắt lt lỗỗi vi vàà CChhỉỉ đ địịnh vnh vàà
a (debuging and repair) ssửửa cha chữữa (debuging and repair) t phương phááp chp chữữa tra trịị ccàài đi đặặt phương ph
cho cáác c ssựự cho c
ccốố, r, rủủi roi ro
8.8.
t hiệện vn vàà
n (instruction) HưHướớng dng dẫẫn (instruction) PPhháát hi niniệệm cm củủa ha họọc viên v
llĩĩnh vnh vựực nc nàào đo đóó
ssửửa cha chữữa nha nhữững thi ng thiếếu su sóót trong quan t trong quan mmộột cht chủủ đ đềề c viên vềề
9.9.
n (control) u khiểển (control)
ĐiĐiềều khi CChhỉỉ đ đạạo ho hàành vi
trong nh vi trong
t môi trườờng ph
ng phứức tc tạạpp
mmộột môi trư
8/8/5757
TTổổ
a HCG chchứức hoc hoạạt đt độộng cng củủa HCG
chuyên gia gồồm ba th (cid:97)(cid:97) MMộột ht hệệ chuyên gia g
m ba thàành ph knowledge base) nơi ch
a HCG a tri thứức cc củủa HCG
nh phầần chn chíính :nh : nơi chứứa tri th (inference engine) môtơ suy diễễnn(inference engine)
y suy diễễnn hay hay môtơ suy di
(user interface) ng giao tiếếp vp vớới ngưi ngườời si sửửddụụngng(user interface)
Ngườời si sửử ddụụng (Ung (User)
ser) đ đặặt câu h
t câu hỏỏii
(cid:86)(cid:86) Cơ sCơ sởởtri thtri thứứcc ( (knowledge base) (cid:86)(cid:86) MMááy suy di (cid:86)(cid:86) HHệệththốống giao ti Khai tháác HCG : (cid:97)(cid:97) Khai th (truy vấấn) HCG b (truy v (cid:86)(cid:86) Cung c
đã biếết,t, đã c
ng tri thứức cc cóó íích (lu
(facts) làà nhnhữững gng gìì đã bi ch (luậậtt--rules) cho h
t hay đã cóó ththậật hay chuyên gia, vàà nhnhậận n
rules) cho hệệ chuyên gia, v
n khai tháác cơ s
(cid:86)(cid:86) MMááy suy di
c cơ sởở tri th
tri thứức đc đểể ttạạo ra câu tr
o ra câu trảả llờời li làà
expertise) cho i ý đúúng đng đắắn (n (expertise) cho
c HCG : Ngư n) HCG bằằng cng cáách :ch : Cung cấấp p ssựựkikiệệnn(facts) l nhnhữững tri th đưđượợc nhc nhữững câu tr ng câu trảả llờờii a HCG : (cid:97)(cid:97) HoHoạạt đt độộng cng củủa HCG : y suy diễễn khai th nhnhữững lng lờời khuyên hay nh ngưngườời si sửử ddụụng qua h
i khuyên hay nhữững gng gợợi ý đ ng qua hệệ ththốống giao ti
ng giao tiếếpp
9/9/5757
Knowledge Engineering in a Nutshell Knowledge Engineering in a Nutshell
Human Human Expert Expert
Dialog
Knowledge Knowledge Engineer Engineer Knowledge Refinement
Explicit Knowledge
Knowledge base Knowledge base (In ES) (In ES)
10/10/5757
SE overviews SE overviews
solving s problem--solving
Problem Domain Problem Domain
Knowledge Knowledge Domain Domain
Relies on internally represented knowledge to perform tasks (cid:97)(cid:97) Relies on internally represented knowledge to perform tasks Utilizes reasoning methods to derive appropriate new knowledge (cid:97)(cid:97) Utilizes reasoning methods to derive appropriate new knowledge problem domain Usually restricted to a specific problem domain (cid:97)(cid:97) Usually restricted to a specific knowledge--based system The term knowledge is often used synonymously based system is often used synonymously (cid:97)(cid:97) The term Two distinctions from Decision Support System (DSS): Decision Support System (DSS): (cid:97)(cid:97) Two distinctions from has the potential to extend the manager’’s problem 1.1. has the potential to extend the manager ability beyond his or her normal capabilities ability beyond his or her normal capabilities the ability to explain how the solution was reached the ability to explain how the solution was reached 2.2.
11/11/5757
NhiNhiềều cu cáách nh
ch nhììn nhn nhậận khn kháác nhau v
c nhau vềề
HCGHCG
Loại người sửdụng Vấn đề đặt ra
Người quản trị
Tôi có
thể
dùng nó để
làm gì
?
tôi vận hành nó
tốt
Kỹ
thuật viên
Làm cách nào để nhất ?
Nhà
nghiên cứu
Làm sao để
tôi có
mở
rộng nó
?
thể
Người sử
dụng cuối
Nó Nó Nó
sẽ có có đáng tin cậy không ?
giúp tôi cái gì đây ? tốn kém không ? rắc rối và
12/12/5757
ĐĐặặc trưng c
c trưng củủa ha hệệ
chuyên gia chuyên gia
(cid:97)(cid:97) CCóó bbốốn đn đặặc trưng cơ b
chuyên gia : c trưng cơ bảản cn củủa ma mộột ht hệệ chuyên gia : (high performance). Khảả năng tr
(cid:86)(cid:86) HiHiệệu quu quảảcao cao (high performance). Kh ng hoặặc cao hơn so v
tinh thông bằằng ho
năng trảả llờời vi vớới mi mứức c i chuyên gia (ngưngườời) i)
c cao hơn so vớới chuyên gia (
đđộộ tinh thông b trong cùùng lng lĩĩnh vnh vựực.c. trong c (cid:86)(cid:86) ThThờời gian tr
i gian trảảllờời thoi thoảả đ đááng ng (adequate response time). Th
ng hoặặc nhanh hơn so v
p lý, bằằng ho đi đếến cn cùùng mng mộột quy
(adequate response time). Thờời i i chuyên gia c nhanh hơn so vớới chuyên gia chuyên gia làà mmộột t
t quyếết đt địịnh. Hnh. Hệệ chuyên gia l
gian trảả llờời hi hợợp lý, b gian tr (n(ngưgườời)i) đ đểể đi đ hhệệ ththốống th
ng thờời gian th
c (real time system). i gian thựực (real time system).
(good reliability). Không thểể xxảảy ra s
y ra sựự ccốố hohoặặc c
gigiảảm sm súút đt độộ tin c
(cid:86)(cid:86) ĐĐộộtin ctin cậậy cao y cao (good reliability). Không th tin cậậy khi s
(cid:86)(cid:86) DDễễhihiểểuu(understandable). H
chuyên gia giảải thi thíích cch cáác bưc bướớc c
ng như n, không giốống như
y khi sửử ddụụng.ng. (understandable). Hệệ chuyên gia gi suy luậận mn mộột ct cáách dch dễễ hihiểểu vu vàà nhnhấất qut quáán, không gi suy lu ccáách tr
ch trảả llờời bi bíí ẩẩn cn củủa ca cáác hc hộộp đen
(black box) p đen (black box)
13/13/5757
Ưu điểểm cm củủa ha hệệ Ưu đi
chuyên gia_1 chuyên gia_1
(cid:97) Những ưu điểm của hệ chuyên gia :
(cid:86) Phổcập(increased availability). Là sản phẩm chuyên gia, được
(cid:86) Giảm giáthành (reduced cost).
(cid:86) Giảm rủi ro (reduced dangers). Giúp con người tránh được trong
phát triển không ngừng với hiệu quả sử dụng không thể phủ nhận.
(cid:86) Tính thường trực (Permanance). Bất kể lúc nào cũng có thể khai thác sử dụng, trong khi con người có thể mệt mỏi, nghỉ ngơi hay vắng mặt.
(cid:86) Đa lĩnh vực (multiple expertise). chuyên gia về nhiều lĩnh vực khác
các môi trường rủi ro, nguy hiểm.
nhau và được khai thác đồng thời bất kể thời gian sử dụng
14/14/5757
Ưu điểểm cm củủa ha hệệ Ưu đi
chuyên gia_2 chuyên gia_2
(cid:97) Những ưu điểm của hệ chuyên gia :
(cid:86) Độtin cậy (increased relialility)
(cid:86) Khả năng giảng giải (explanation). Câu trả lời với mức độ tinh
Luôn đảm bảo độ tin cậy khi khai thác.
(cid:86) Khả năng trảlời(fast reponse). Trả lời theo thời gian thực, khách
thông được giảng giải rõ ràng chi tiết, dễ hiểu.
(cid:86) Tính ổn định, suy luận cólý và đầy đủmọi lúc mọi nơi (steady, une
quan.
(cid:86) Trợgiúp thông minh như một người hướng dẫn (intelligent -tutor).
(cid:86) Cóthểtruy cập như làmột cơ sởdữliệu thông minh (intelligent
motional, and complete response at all times).
database)
15/15/5757
1
LLịịch sch sửử
phpháát tri
a HCG t triểển cn củủa HCG
Năm Các sự kiện
1943 Dịch vụ bưu điện ; mô hình Neuron của (Mc Culloch and Pitts Model)
1954 Thuật toán Markov (Markov Algorithm) điều khiển thực thi các luật
1956 Hội thảo Dartmouth ; lý luận logic ; tìm kiếm nghiệm suy (heuristic search) ; thống nhất thuật ngữ (AI: Artificial Intelligence) nhân tạo tuệ trí
1957 Rosenblatt phát minh khả năng nhận thức ; Newell, Shaw và Simon đề xuất giải bài toán tổng quát (GPS: General Problem Solver)
1958 Mc Carthy đề xuất ngôn ngữ trí tuệ nhân tạo LISA (LISA AI language)
chức năng thần kinh trong nhận thức 1962 Nguyên lý Rosenblatt’s về (Rosenblatt’s Principles of Neurodynamicdynamics on Perceptions)
(fuzzy logic) trong suy
1965 các đối tượng mờ (fuzzy object) của Zadeh. Xây dựng hệ chuyên
Phương pháp hợp giải Robinson. Ưng dụng logic mờ luận về gia đầu tiên về nha khoa DENDRAL (Feigenbaum , Buchanan , et.al)
nghĩa (semantic nets), mô hình bộ nhớ kết hợp (associative 1968
Mạng ngữ memory model) của Quillian
16/16/5757
2
LLịịch sch sửử
phpháát tri
a HCG t triểển cn củủa HCG
Năm Các sự kiện
chuyên gia về
1969 Hệ 1970 Ưng dụng ngôn ngữ Toán học MACSYMA (Martin and Moses) PROLOG (Colmerauer, Roussell, et, al.)
chuyên gia HEARSAY I về nhận dạng tiếng nói (speech recognition).
1971
Hệ Xây dựng các luật giải bài toán con người (Human Problem Solving popularizes rules (Newell and Simon)
1973 Hệ chuyên gia MYCIN về chẩn trị y học (Shortliffe, et,al.)
1975
1976 under uncertainty). Ứng
Lý thuyết khung (frames), biểu diễn tri thức (knowledge representation) (Minsky) Toán nhân tạo (AM: Artificial Mathematician) (Lenat). Lý thuyết tính hiển nhiên của lập luận không chắc chắn Dempster−Shafer về (Dempster−Shafer theory of Evidence for reason dụng hệ chuyên gia PROSPECTOR trong khai thác hầm mỏ (Duda, Har)
chuyên gia OPS (OPS expert system shell) trong hệ dụng ngôn ngữ 1977 Sử chuyên gia XCON/R1 (Forgy)
17/17/5757
3
LLịịch sch sửử
phpháát tri
a HCG t triểển cn củủa HCG
Năm Các sự kiện
bảo trì hệ thống máy tính 1978
so khớp nhanh (rete algorithm for fast pattern 1979 Hệ chuyên gia XCON/R1 (McDermott, DEC) để DEC (DEC computer systems) Thuật toán mạng về matching) của Forgy ; thương mại hoá các ứng dụng về trí tuệ nhân tạo
1980 Ký hiệu học (symbolics), xây dựng các máy LISP (LISP machines) từ LMI.
chuyên gia về Toán học (SMP math expert system) ;
1982 Nhật bản 5 ở hệ
công cụ phục vụ hệ 1983
chuyên gia CLIPS phục vụ công cụ hệ 1985 Hệ mạng nơ-ron Hopfield (Hopfield Neural Net) ; án xây dựng máy tính thông minh thế Dự (Japanese Fifth Generation Project to develop intelligent computers) chuyên gia KEE Bộ (KEE expert system tool) (intelli Corp) Bộ (CLIPS expert system tool (NASA)
18/18/5757
CCáác lc lĩĩnh vnh vựực c ứứng dng dụụng cng củủa ha hệệ
chuyên gia chuyên gia
chuyên gia đã đượợc xây d
(cid:97)(cid:97) Cho đ
n nay, hààng trăm h
ng trăm hệệ chuyên gia đã đư o thườờng xuyên trong c
c xây dựựng ng ng xuyên trong cáác tc tạạp chp chíí, s, sáách, ch,
Cho đếến nay, h vvàà đã đư đã đượợc bc bááo co cááo thư bbááo vo vàà hhộội thi thảảo khoa h
o khoa họọcc i ra còn cáác hc hệệ chuyên gia đư
chuyên gia đượợc sc sửử ddụụng trong c không đượợc công b c quân sựự mmàà không đư
ng trong cáác c c công bốố vvìì lý lý
(cid:97)(cid:97) NgoNgoàài ra còn c công ty, cáác tc tổổ chchứức quân s công ty, c do bdo bảảo mo mậậtt
19/19/5757
MMộột st sốố
llĩĩnh vnh vựực c ứứng dng dụụngng
Lĩnh vực
Cấu hình (Configuration)
Chẩn đoán (Diagnosis)
nào (how?) và cái gì Truyền đạt (Instruction) quan sát được hỏi thể nếu (what
Ứng dụng diện rộng Tập hợp thích đáng những thành phần của một hệ thống theo cách riêng Lập luận dựa trên những chứng cứ Dạy học kiểu thông minh sao cho sinh viên có vì sao (why?), như thế if?) giống như hỏi một người thầy giáo liệu thu nhận được
Giải thích (Interpretation) Giải thích những dữ
liệu chuyên Kiểm tra (Monitoring) liệu thu lượm được với dữ hiệu quả So sánh dữ môn để đánh giá
Lập kế hoạch (Planning) Lập kế hoạch sản xuất theo yêu cầu
một tình huống xảy ra
Dự đoán (Prognosis) Chữa trị (Remedy) từ lý một vấn đề
Điều khiển (Control) Dự đoán hậu quả Chỉ định cách thụ Điều khiển một quá đoán, kiểm tra, lập kế trình, đòi hỏi diễn giải, chẩn chữa trị hoạch, dự đoán và
20/20/5757
Một số
chuyên gia 1
hệ
CRYSALIS
Interpret a protein’n 3-D structure
DENDRAL
Interpret molecular structure
Remedy Triple Quadruple Mass Spectrometer (keep
TQMSTUNE
it tuned)
CLONER
Design new biological molecules
MOLGEN
Design gene -
cloning experiments
SECS
Design complex organic molecules
SPEX
Plan molecular biology experiments
Bảng 1Ngành hoáhọc (Chemistry)
21/21/5757
Một số
chuyên gia 2
hệ
Bảng 2Ngành điện tử(Electronics)
ACE
Diagnosis telephone network faults
IN -ATE
Diagnosis oscilloscope faults
NDS
Diagnosis national communication net
EURISKO
Design 3-D micro-electronics
PALLADIO Design and test new VLSI cicuits
REDESIGN Redesign digital circuits to new
CADHELP
Instruct for computer aided design
SOPHIE
Instruct circuit fault diagnosis
22/22/5757
Một số
chuyên gia 3
hệ
Bảng 3 Ngành địa chất (Geology)
DIPMETER Interpret dipmeter logs
LITHO Interpret oil well log data
MUD Diagnosis / remedy drilling problems
PROSPECTOR Interpret geologic data for minerals
(Engineering) Bảng 4 Công nghệ
REACTOR Diagnosis / remedy reactor accidents
DELTA Diagnosis / remedy GE locomotives
STEAMER Instruct operation - steam power-plant
23/23/5757
Một số
chuyên gia 5
hệ
Bảng 5 Ngành y học (Medicine)
PUFF Diagnosis lung disease
VM Monitors intensive - care patients
ABEL Diagnosis acid - base / electrolytes
AI/COAG Dianosis blood disease
AI/ RHEUM Diagnosis rheumatoid disease
CADUCEUS Diagnosis internal medicine disease
ANNA Monitor digitalis therapy
BLUE BOX Diagnosis / remedy depression
MYCIN Diagnosis / remedy bacterial infections
ONCOCIN Remedy / manage chemotherapy patient
ATTENDING Instruct in anesthetic manegement
GUIDON Instruct in bacterial infections
24/24/5757
Một số
chuyên gia 6
hệ
Bảng 6
Máy tính điện tử
(Computer systems)
PTRANS
Prognosis for managing DEC computers
BDS
Diagnosis bad parts in switching net
XCON
Configune DEC computer systems
XSEL
Configure DEC computer sales order
XSITE
Configure customer site for DEC computers
YES/MVS Monitor / control IBM MVS opeating system
TIMM
Diagnosis DEC computer
25/25/5757
Example of ES Example of ES
usually sees an expert system through an usually sees an expert system through an
The The endend--useruser interactive dialog:: interactive dialog
Do you know to which restaurant you want to go? Do you know to which restaurant you want to go? No No Is there any kind of food you would particularly like? Is there any kind of food you would particularly like?
Unknown Unknown
Q.Q. A.A. Q.Q. A.A. Q.Q. A.A. Q.Q. A.A. Q.Q. A.A.
Do you like spicy food? Do you like spicy food? No No Do you usually drink wine with meals? Do you usually drink wine with meals? Yes Yes When you drink wine, is it French wine? When you drink wine, is it French wine? Why Why
26/26/5757
Example of ES Example of ES
27/27/5757
ES Problems ES Problems
Limited knowledge (cid:97)(cid:97) Limited knowledge (cid:86)(cid:86) ““Shallow
common--sense
the ES knows only what it has been explicitly ““toldtold”” it doesn’’t know what it doesn
(cid:86)(cid:86) some Lack of trust (cid:97)(cid:97) Lack of trust users may not want to leave critical decisions to machines (cid:86)(cid:86) users may not want to leave critical decisions to machines
knowledge Shallow”” knowledge understanding of the concepts and their relationships (cid:153)(cid:153) no no ““deepdeep”” understanding of the concepts and their relationships knowledge sense”” knowledge (cid:86)(cid:86) no no ““common no knowledge from possibly relevant related domains (cid:86)(cid:86) no knowledge from possibly relevant related domains closed world”” (cid:86)(cid:86) ““closed world (cid:153)(cid:153) the ES knows only what it has been explicitly t know t know what it doesn’’t know (cid:153)(cid:153) it doesn Mechanical reasoning (cid:97)(cid:97) Mechanical reasoning may not have or select the most appropriate method for a (cid:86)(cid:86) may not have or select the most appropriate method for a particular problem particular problem problems are computationally very expensive some ““easyeasy”” problems are computationally very expensive
28/28/5757
ES Design + Development ES Design + Development
Which are the major steps in the Linear Model (cid:97)(cid:97) Which are the major steps in the Linear Model of ES Development? of ES Development?
What do you have to take into account (cid:97)(cid:97) What do you have to take into account when you plan an ES project? when you plan an ES project?
What can you say about the delivery phase (cid:97)(cid:97) What can you say about the delivery phase of an ES project? of an ES project?
What kind of errors can occur (cid:97)(cid:97) What kind of errors can occur (during the development) of an ES? (during the development) of an ES?
29/29/5757
ES Design + Development ES Design + Development
(cid:153)(cid:153) Conceptualization
(cid:153)(cid:153) Formalization
(cid:153)(cid:153) Implementation
Major basic steps in ES development (cid:97)(cid:97) Major basic steps in ES development Identification:: (cid:153)(cid:153) Identification Determine problem and project requirements Determine problem and project requirements Conceptualization: Extract knowledge and construct a : Extract knowledge and construct a conceptual model for solving problems using the knowledge conceptual model for solving problems using the knowledge : Map the conceptual model to available Formalization: Map the conceptual model to available representation and control paradigms representation and control paradigms : Construct/extend the implementation of Implementation: Construct/extend the implementation of the formalized model the formalized model : Evaluate the system Testing: Evaluate the system
(cid:153)(cid:153) Testing Software Engineering models (cid:97)(cid:97) Software Engineering models Project phases (cid:97)(cid:97) Project phases Linear Model of ES Development (cid:97)(cid:97) Linear Model of ES Development Sources of error in ES (cid:97)(cid:97) Sources of error in ES
30/30/5757
The linear model of ES development life cycle The linear model of ES development life cycle
31/31/5757
Các phần tử
của HCG
(cid:97) Môt HCG gồm 3 thành phần cơ bản :
c (Knowledge Base) tri thứức (Knowledge Base) n (Inference Engine) y duy diễễn (Inference Engine)
Giao diệện ngư
(User Interface) n ngườời si sửử ddụụngng (User Interface)
(cid:97) Ngoài ra, tuỳ theo mức độ tiếp cận, mà người ta
c (Agenda) ch công việệc (Agenda)
ch (Explanation Facility) năng giảải thi thíích (Explanation Facility) c (Explanation Facility) n tri thứức (Explanation Facility) năng thu nhậận tri th
bổ sung các thành phần khác, chẳng hạn : (cid:137)(cid:137) LLịịch công vi c (Working Memory) (cid:137)(cid:137) BBộộ nhnhớớ llààm vim việệc (Working Memory) (cid:137)(cid:137) KhKhảả năng gi (cid:137)(cid:137) KhKhảả năng thu nh (cid:137)(cid:137) ……
(cid:137)(cid:137) Cơ sCơ sởở tri th (cid:137)(cid:137) MMááy duy di (cid:137)(cid:137) Giao di
32/32/5757
General Architecture of SE General Architecture of SE
End-User
Knowledge Base Knowledge Base
Facts / Information
Inference Engine Inference Engine
Expertise
Expert System
33/33/5757
Expert system model -- Expert system model
main parts main parts
Knowledge Base (rules)
Knowledge Acquisition Facility
Inference Engine
Agenda
e c a f r e t n I r e s U
Explanation Facility
Working Memory (facts)
34/34/5757
Knowledge
Instructions & information
Solutions & explanations
User
User interface
Problem Domain
Inference engine Know- ledge base
Development engine
Expert system
An Expert An Expert System Model System Model
Expert and knowledge engineer
35/35/5757
Một số
mô hình khác
Knowledge Knowledge Base Base Knowledge Knowledge Base editor Base editor
UserUser Inference Inference Engine Engine
Preceptors Preceptors World World Model Model
Explanation Explanation Subsystem Subsystem
36/36/5757
Mô hình J. L. Ermine
Cơ sở Cơ sở
tri thức tri thức
dụng
Giao Giao diện diện
Người sử yêu cầu
thống Hệ thống Hệ thu nhận thu nhận tri thức tri thức
Dữ liệu vấn đề cần giải quyết
nhớ Bộ nhớ Bộ làm việc làm việc
Tri thức mới
37/37/5757
Mô hình C. Ernest
Tri thức Tri thức
Cơ sở Cơ sở tri thức tri thức
Cấu trúc Cấu trúc máy suy diễn máy suy diễn
Dữ Dữ
liệu liệu
Máy Máy suy diễn suy diễn
Chuyên Chuyên giagia
•Lời giải •Lời giải •Giải thích •Giải thích •Theo dõi •Theo dõi
NgưNgườời i ssửử ddụụngng
38/38/5757
Mô hình E. V. Popov
Khả năng Khả năng giải thích giải thích
Chuyên Chuyên gia gia
Diễn dịch Diễn dịch Cơ sở Cơ sở tri thức tri thức Giao diện Giao diện người người dụng sử dụng sử nhớ Bộ nhớ Bộ làm việc làm việc
Người Người dụng sử dụng sử
hữu Sở Sở hữu tri thức tri thức
39/39/5757
Tri thứức vc vàà Cơ s Tri th
Cơ sởở
tri thứứcc tri th
(cid:97)(cid:97) Tri th
trong HCG : Tri thứứcc trong HCG :
tinh thông đượợc tc tíích tch tụụ ttừừ ssáách vch vởở, t, tạạp chp chíí,,
(cid:86)(cid:86) PhPhảản n áánh snh sựự tinh thông đư ttừừ ccáác chuyên gia hay c
c chuyên gia hay cáác nhc nhàà bbáác hc họọcc
(cid:97)(cid:97) Cơ sCơ sởở tri th
tri thứứcc ggồồm :m :
(cid:86)(cid:86) CCáác phc phầần tn tửử ( (hay đơn v
hay đơn vịị) tri th
) tri thứức đưc đượợc tc tổổ chchứức như m
t CSDL c như mộột CSDL
(cid:86)(cid:86) TuTuỳỳ theo phương ph
t triểển HCG m
n HCG màà ccáác phc phầần tn tửử ccóó đ đặặc c
theo phương phááp php pháát tri c nhau nh chấất kht kháác nhau
trưng, t, tíính ch trưng
(cid:86)(cid:86) ChChẳẳng hng hạạn trong c
n trong cáác HCG d
c HCG dựựa theo lu
a theo luậật (Rules
Based ES) : t (Rules--Based ES) :
(cid:153)(cid:153) MMỗỗi phi phầần tn tửử tri th
(cid:153)(cid:153) Cơ sCơ sởở tri th
tri thứức lc làà mmộột t luluậậtt
tri thứứcc như v như vậậy còn đư y còn đượợc gc gọọi li làà bbộộ nhnhớớ ssảản xun xuấất t
(Production Memeory) (Production Memeory)
40/40/5757
Phân loạại tri th Phân lo
i tri thứứcc
(cid:97)(cid:97) NgưNgườời ta thư
i ta thườờng phân lo
ng phân loạại tri th
i tri thứức theo nhi
c theo nhiềều cu cááchch
(cid:97)(cid:97) Theo phân lo
hai loạại tri th
i tri thứức :c :
Theo phân loạại chi chứức năng c năng, c, cóó hai lo (Assertion Knowledge) : (cid:86)(cid:86) Tri thTri thứức phc pháán đon đoáánn(Assertion Knowledge) : ng đã đượợc thi nh huốống đã đư
mô tmô tảả ccáác tc tìình hu c thiếết lt lậập hop hoặặc sc sẽẽ đư đượợc thi c thiếết lt lậậpp
t ra hay nhữững thao t
(cid:86)(cid:86) Tri thTri thứức thc thựực hc hàànhnh(Operating Knowledge) (Operating Knowledge) ththểể hihiệện nhn nhữững hng hậậu quu quảả rrúút ra hay nh thithiệện khi m ng đã đượợc thi n khi mộột tt tìình hu trong lĩĩnh vnh vựực đang x trong l
nh huốống đã đư ng thao táác cc cầần phn phảải hoi hoààn n c thiếết lt lậập p c thiếết lt lậập hop hoặặc sc sẽẽ đư đượợc thi
(cid:97)(cid:97) Tri th
Tri thứức thc thựực hc hàành :nh :
(cid:86)(cid:86) ThưThườờng đư
c+Lôgic ng đượợc thc thểể hihiệện bn bởởi ci cáác bic biểểu thu thứức Toc Toáán hn họọc+Lôgic
n khai ddễễ hihiểểu, du, dễễ tritriểển khai
(cid:86)(cid:86) NSD c
NSD cóó ththểể thao t
thao táác vc vớới tri th
i tri thứức như khai th
t CSDL c như khai tháác mc mộột CSDL
c đang xéétt
41/41/5757
Phân loạại tri th Phân lo
i tri thứức theo bi
c theo biểểu hiu hiệệnn
Theo phân loạại theo bi
i theo biểểu hiu hiệện, cn, cũũng cng cóó hai lo
hai loạại :i :
(cid:97)(cid:97) Theo phân lo (cid:97)Tri thức hiện, rõ (explicit knowledge)
(cid:86) Diễn đạt bằng ngôn ngữ hình thức, dễ trao đổi giữa các cá nhân (cid:86) Có thể biểu diễn bằng các công thức khoa học, các thủ tục tường
(cid:86) Bao gồm thông tin, dữ liệu, sách báo, văn bản, tài liệu đã được hệ
minh, hoặc nhiều cách khác
(cid:97)Tri thức ngầm, ẩn (tacit knowledge)
(cid:86) Có được và ẩn chứa trong kinh nghiệm của từng cá nhân, mang tính chủ quan, bao gồm những hiểu biết riêng thấu đáo, trực giác, linh cảm, kỹ năng, …
(cid:86) Khó trao đổi hoặc chia sẻ với người khác (cid:86) Chỉ có thể học được từ người khác nhờ quan hệ gần gũi trong một
thống bằng nhiều phương tiện
khoảng thời gian nào đó
42/42/5757
Knowledge-base may really include many things
Heuristics Heuristics
Events Events
Hypothesis Hypothesis
Definitions Definitions
Facts Facts
Knowledge
Base
Rules Rules
Relationships Relationships
Attributes Attributes
Processes Processes
Objects Objects
43/43/5757
Quản trị
tri thức
KhKháái ni
i niệệm vm vềề
(cid:97)(cid:97) NgưNgườời ta thư (cid:86)(cid:86) Tri th
i : i ta thườờng nng nóói : Tri thứức lc làà ssứức mc mạạnhnh Tri thứức lc làà ccủủa ca cảải i
(cid:86)(cid:86) Tri th
(cid:97)(cid:97) CCáác tc tổổ chchứức cc củủa LHQ r
a LHQ rúút ra k
t ra kếết lut luậận rn rằằng :ng :
(cid:86)(cid:86) Kinh t
Kinh tếế ththếế gigiớới phi pháát tri
t triểển mn mạạnh mnh mẽẽ do bi
do biếết dt dựựa va vàào tri th
o tri thứứcc (cid:97) Làm thế nào để sáng tạo và sử dụng đúng đắn các tri thức
(cid:97) Quản trị tri thức (Knowledge Management)
44/44/5757
ES Elements: Mááy duy di ES Elements: M
y duy diễễnn
(cid:97)(cid:97) MMááy duy di (cid:86)(cid:86) Công c
nh, hay bộộ xxửử lý) t
o ra sựự suy lu
chương trìình, hay b nh xem nhữững lu
ch quyếết đt địịnh xem nh
lý) tạạo ra s ng luậật nt nàào so sẽẽ llààm thm thỏỏa mãn c
suy luậận bn bằằng ng a mãn cáác sc sựự
(inference engine) : y duy diễễnn(inference engine) : Công cụụ ( (chương tr ccáách quy kikiệện, cn, cáác đc đốối tưi tượợngng
a mãn n ưu tiên cáác luc luậật tht thỏỏa mãn
(cid:86)(cid:86) ChChọọn ưu tiên c (cid:86)(cid:86) ThThựực hic hiệện cn cáác luc luậật ct cóó ttíính ưu tiên cao nh
nh ưu tiên cao nhấấtt
45/45/5757
ES Elements : Giao diệện ngư ES Elements : Giao di
n ngườời si sửử
ddụụngng
(user interface) : (cid:97)(cid:97) Giao diGiao diệện ngưn ngườời si sửửddụụngng(user interface) :
(cid:86)(cid:86) LLàà nơi ngư
nơi ngườời si sửử ddụụng vng vàà hhệệ chuyên gia trao đ
i nhau chuyên gia trao đổổi vi vớới nhau
46/46/5757
ES Elements : Cáác thc thàành ph ES Elements : C
nh phầần khn kháácc
(agenda) : ch công việệcc(agenda) : (cid:97)(cid:97) LLịịch công vi (cid:86)(cid:86) Danh s
o ra thoảả mãn mãn
Danh sáách cch cáác luc luậật ưu tiên do m t ưu tiên do mááy suy di ccáác sc sựự kikiệện, cn, cáác đc đốối tưi tượợng cng cóó mmặặt trong b
y suy diễễn tn tạạo ra tho t trong bộộ nhnhớớ llààm vim việệc.c.
(working memory) : (cid:97)(cid:97) BBộộnhnhớớllààm vim việệcc(working memory) :
(cid:86)(cid:86) Cơ sCơ sởở ddữữ liliệệu tou toààn cn cụục chc chứứa ca cáác sc sựự kikiệện phn phụục vc vụụ cho c
cho cáác luc luậậtt
(explanation facility) : năng giảải thi thííchch(explanation facility) :
(cid:97)(cid:97) KhKhảả năng gi (cid:86)(cid:86) GiGiảải ngh
ng cho ngườời si sửử ddụụngng
(cid:97)(cid:97) KhKhảả năng thu nh
p NSD bổổ sung tri th
i nghĩĩa ca cáách lch lậập lup luậận cn củủa ha hệệ ththốống cho ngư (explanation facility) : năng thu nhậận tri thn tri thứứcc(explanation facility) : Cho phéép NSD b (cid:86)(cid:86) Cho ph (cid:86)(cid:86) KhKhảả năng thu nh
sung tri thứức vc vàào ho hệệ ththốốngng n tri thứức lc làà yyếếu tu tốố mmặặc nhiên c
năng thu nhậận tri th
c nhiên củủa nhi
a nhiềều hu hệệ
chuyên gia chuyên gia
47/47/5757
PhPháát hi
t hiệện tri th
n tri thứức vc vàà
khai pháá khai ph
liliệệuu
t hiệện tri th
n tri thứức (PHTT) v
c (PHTT) vàà khai ph
ddữữ u (KPDL) khai pháá ddữữ liliệệu (KPDL)
(cid:97)(cid:97) PhPháát hi (cid:97)(cid:97) BBốối ci cảảnh :nh : (cid:86)(cid:86) SSựự phpháát tri
t triểển nhanh ch
n nhanh chóóng cng củủa la lĩĩnh vnh vựực CNTT v
ng CNTT trong đờời i
c CNTT vàà ứứng dng dụụng CNTT trong đ n nay c phòng…… hihiệện nay
i, quốốc phòng
ssốống, kinh t
, xã hộội, qu ng, kinh tếế, xã h (cid:86)(cid:86) KhKhốối lưi lượợng dng dữữ liliệệu thu th
u thu thậập, xp, xửử lý, khai th
lý, khai tháác vc vàà lưu tr
ch luỹỹ lưu trữữ ngngàày cy cààng tng tíích lu
ý nghĩĩa sa sửử ddụụng ng
nhinhiềều lênu lên Tuy nhiên, chỉỉ ccóó khokhoảảng tng từừ 5 5% % đđếến 1n 10% 0% lưlượợng dng dữữ liliệệu cu cóó ý ngh (cid:86)(cid:86) Tuy nhiên, ch ng kê theo thốống kê theo th (cid:86)(cid:86) RRấất nhi
u chưa đượợc sc sửử ddụụng hi
ng hiệệu quu quảả nhưng v
nhưng vẫẫn phn phảải ti
i lo sợợ bbỏỏ ssóót dt dữữ liliệệu quan tr nh tranh, nhu cầầu cu cóó nhinhiềều thông tin v
(cid:86)(cid:86) Trong môi trư
c thu i tiếếp tp tụục thu u quan trọọng cng cóó ththểể ccầần đn đếến sau n n sau nàày)y) nhanh u thông tin vớới ti tốốc đc độộ nhanh nh chấất đt địịnh nh u câu hỏỏi mang t
i mang tíính ch
p ra quyếết đt địịnh vnh vàà ngngàày cy cààng cng cóó nhinhiềều câu h
t nhiềều du dữữ liliệệu chưa đư ththậập rp rấất tt tốốn kn kéém (nm (nỗỗi lo s Trong môi trườờng cng cạạnh tranh, nhu c đđểể trtrợợ gigiúúp ra quy ttíính cnh cầần phn phảải tri trảả llờời di dựựa trên m
a trên mộột kht khốối lưi lượợng dng dữữ liliệệu khu khổổng lng lồồ đã c
đã cóó
khai tháác cơ s
c cơ sởở ddữữ liliệệu truy
u truyềền thn thốống ng
ng ngàày cy cààng ng
(cid:86)(cid:86) CCáác phương ph
c phương phááp qup quảản trn trịị vvàà khai th ng đượợc thc thựực tc tếế
không đááp p ứứng đư không đ ra đờời ki kỹỹ thuthuậật t ““PhPháát hi (cid:97)(cid:97) SSựự ra đ
t hiệện tri th
n tri thứức vc vàà khai ph
khai pháá ddữữ liliệệuu””
48/48/5757
TTìình hnh hìình nghiên c
nh nghiên cứứu PHTT v
u PHTT vàà
KPDL KPDL
(cid:97)(cid:97) ThuThuậật ngt ngữữ ::
(cid:86)(cid:86) PhPháát hi
(cid:86)(cid:86) Khai ph
t hiệện tri th c (Knowledge Discovery) n tri thứức (Knowledge Discovery)
đang đượợc nghiên c
ng trong nhiềều lu lĩĩnh nh
(cid:97)(cid:97) Đã vĐã vàà đang đư vvựực khc kháác nhau
c nhau ởở ccáác nưc nướớc trên th
c nghiên cứứu, u, ứứng dng dụụng trong nhi c trên thếế gigiớớii
(cid:97)(cid:97) TTạại Vi
t Nam : i Việệt Nam :
(cid:86)(cid:86) KKỹỹ thuthuậật nt nàày vy vẫẫn còn tương đ
n còn tương đốối mi mớới mi mẻẻ
(cid:86)(cid:86) Đang đư
Đang đượợc nghiên c
c nghiên cứứu u
(cid:86)(cid:86) Đang d
Đang dầần đưa v
n đưa vàào o ứứng dng dụụng th
ng thựực tic tiễễnn
u (Data Mining) Khai pháá ddữữ liliệệu (Data Mining)
49/49/5757
KhKháái ni
i niệệm m ““Khai ph
Khai pháá
ddữữ
liliệệuu””
(cid:97)(cid:97) Khai ph
nh tríích xu
n bên c thông tin cóó gigiáá trtrịị titiềềm m ẩẩn bên
c lưu trữữ trong c
c CSDL, trong cáác CSDL,
(Data Mining) : Khai pháá ddữữ liliệệu u (Data Mining) : ququáá trtrìình tr ch xuấất ct cáác thông tin c trong lượợng lng lớớn dn dữữ liliệệu đưu đượợc lưu tr trong lư kho dữữ liliệệuu…… kho d (cid:97)(cid:97) HiHiệện nay, ngo
i thuậật ngt ngữữ khai ph
n nay, ngoàài thu
i ta còn khai pháá ddữữ liliệệuu, n, ngưgườời ta còn
ý nghĩĩa tương t
a tương tựự như như ::
ddùùng mng mộột st sốố thuthuậật ngt ngữữ khkháác cc cóó ý ngh CSDL tri thứức tc từừ CSDL Khai pháá tri th (cid:86)(cid:86) Khai ph (Knowlegde Mining From Databases) (Knowlegde Mining From Databases) u (Knowlegde Extraction) (cid:86)(cid:86) TrTríích lch lọọc dc dữữ liliệệu (Knowlegde Extraction)
u (Data/Pattern Analysis) Phân tíích dch dữữ liliệệu/mu/mẫẫu (Data/Pattern Analysis)
(cid:86)(cid:86) Phân t (cid:86)(cid:86) KhKhảảo co cổổ ddữữ liliệệu (Data Archaeology) u (Data Archaeology) u (Data Dredging) (cid:86)(cid:86) NNạạo vo véét dt dữữ liliệệu (Data Dredging)
50/50/5757
Qui trìình 5 Qui tr
nh 5 bưbướớc PHTT v
c PHTT vàà
1.1.
KPDL KPDL p khai pháá
c phương phááp khai ph
ddữữ
liliệệu thu thíích ch
liliệệuu
nh thàành bnh bàài toi toáánn hhìình th nh cho phéép chp chọọn cn cáác phương ph
bbảản chn chấất ct củủa da dữữ lý dlý dữữ
ng nhiềều thu thờời gian trong to
i gian trong toààn bn bộộ
qui trìình nh qui tr
2.2. TTììm him hiểểu lu lĩĩnh vnh vựực c ứứng dng dụụng vng vàà Đây lĐây làà bư bướớc quy c quyếết đt địịnh cho ph hhợợp vp vớới mi mụục đc đíích ch ứứng dng dụụng vng vàà xxửử Thu thậập vp vàà Thu th lý thô (hay tiềền xn xửử lý thô (hay ti liliệệu)u)
ng chiếếm dm dụụng nhi u, hay nóói ci cáách kh
p thông minh sẽẽ đư đượợc c ááp p
trong đóó
ch xuấất ra c
3.3. c mô ch ra cáác mc mẫẫu vu vàà/ho/hoặặc cc cáác mô trtríích ra c ch kháác lc làà
c phương phááp thông minh s ccáác phương ph hay tri thứức hc hữữu u ííchch hay tri th :: llààm sm sááng tng tỏỏ
ccáác mô t
c mô tảả
vvàà
ddựự đo đoáán, n, đđáánh nh
n tri thứức dc dựựa va vàào mo mộột st sốố
phphéép đop đo
4.4.
5.5.
trtrựực quan ho
ddữữ
liliệệu đu đểể
bibiểểu diu diễễn tri th
n tri thứức c
nh diễễn dn dữữ ddụụng cng cáác kc kĩĩ
nh diễễn vn vàà ddụụngng
BưBướớc nc nàày thư y thườờng chi Khai pháá ddữữ liliệệu, hay n Khai ph hhìình nh ẩẩn dưn dướới ci cáác dc dữữ liliệệuu giai đoạạn thi Đây Đây llàà giai đo n thiếết yt yếếu, u, trong đ liliệệuu trtríích xu t ra cáác mc mẫẫu du dữữ ddụụng đng đểể u (pattern evaluation) mmẫẫu (pattern evaluation) nh giáá ĐĐáánh gi c đã tììm đưm đượợc,c, đ đặặc bic biệệt lt làà HiHiểểu tri th u tri thứức đã t hhữữu u íích cch củủa ca cáác mc mẫẫu biu biểểu diu diễễn tri th ssựự gigiáá TrTrìình di ssửử khai pháá đư đượợc cho ngư khai ph
liliệệu (knowlegde presentation): u (knowlegde presentation): c quan hoáá thuthuậật trt trìình di c cho ngườời si sửử
51/51/5757
XXửử
lý thô dữữ lý thô d
liliệệuu
u (data cleaning) ::
loloạại bi bỏỏ
u không thíích hch hợợpp
liliệệu không th u (data integration) ::
(cid:97)(cid:97) LLààm sm sạạch dch dữữ liliệệu (data cleaning) nhinhiễễu hou hoặặc cc cáác dc dữữ (cid:97)(cid:97) TTíích hch hợợp dp dữữ liliệệu (data integration) liliệệu tu từừ
c nhau như c nguồồn khn kháác nhau như
ttíích hch hợợp dp dữữ CSDL, Kho dữữ CSDL, Kho d
:: i văn bảản khn kháác nhau
c nhau......
ccáác ngu liliệệu, u, ccáác loc loạại văn b u (data selection) ::
(cid:97)(cid:97) ChChọọn dn dữữ liliệệu (data selection)
y, nhữững dng dữữ
liliệệu liên quan tr
n nhiệệm vm vụụ
ssẽẽ
c thu thậập tp từừ
ởở bư bướớc nc nàày, nh đưđượợc thu th
liliệệu ban đ
c nguồồn dn dữữ
u liên quan trựực tic tiếếp đp đếến nhi ccáác ngu u ban đầầuu u (data transformation) :: (cid:97)(cid:97) ChuyChuyểển đn đổổi di dữữ liliệệu (data transformation) liliệệu su sẽẽ đư đượợc chuy
c chuyểển đn đổổi vi vềề
hhợợp p
bbằằng cng cáách th
ch thựực hic hiệện cn cáác thao t
ng phùù ddạạng ph c thao táác nhc nhóóm hom hoặặc c
c khai pháá
trong bướớc nc nàày, dy, dữữ trong bư cho việệc khai ph cho vi ttậập hp hợợpp
52/52/5757
Qui trìình PHTT v Qui tr
nh PHTT vàà
KPDL KPDL
(cid:97)(cid:97) CCáác bưc bướớc trong quy tr
(cid:97)(cid:97) KKếết qut quảả thu đư
c trong quy trìình cnh cóó ththểể llặặp đi l p đi lặặp lp lạại mi mộột st sốố llầầnn
thu đượợc cc cóó ththểể đư đượợc lc lấấy trung b y trung bìình tnh từừ ssốố llầần thn thựực hic hiệệnn
53/53/5757
CCáác phương ph
c phương phááp PHTT v
p PHTT vàà
KPDL KPDL
(cid:97)(cid:97) NhNhằằm hai m
m hai mụục đc đíích ch
ch chíính :nh :
n (Prediction) (cid:86)(cid:86) DDựự đo đoáán (Prediction)
p sau : c phương phááp sau :
(cid:86)(cid:86) Phân lo
(Description) (cid:86)(cid:86) Mô tMô tảả (Description) (cid:97)(cid:97) ThưThườờng sng sửử ddụụng cng cáác phương ph
i (Classification) Phân loạại (Classification)
(cid:86)(cid:86) Phân nh
i qui (Regression) (cid:86)(cid:86) HHồồi qui (Regression)
m (Clustering) Phân nhóóm (Clustering)
(cid:86)(cid:86) Mô hMô hìình rnh rààng bu
p (Summarization) (cid:86)(cid:86) TTổổng hng hợợp (Summarization)
c (Dependency modeling) ng buộộc (Dependency modeling)
(cid:86)(cid:86) BiBiểểu diu diễễn mô h
ch (Change and Deviation Dectection) (cid:86)(cid:86) Dò tDò tììm bim biếến đn đổổi vi vàà đ độộ llệệch (Change and Deviation Dectection)
(cid:86)(cid:86) KiKiểểm đm địịnh mô h
nh (Model Representation) n mô hìình (Model Representation)
(cid:86)(cid:86) Phương ph
odel Evaluation) nh mô hìình (Mnh (Model Evaluation)
m (Search Method) Phương phááp tp tììm kim kiếếm (Search Method)
54/54/5757
CCáác lc lĩĩnh vnh vựực liên quan đ
c liên quan đếến PHTT v
n PHTT vàà
KPDL KPDL
(cid:97)(cid:97) PHTT v
KPD liên quan đếến nhi
n nhiềều ngu ngàành, nhi
nh, nhiềều lu lĩĩnh vnh vựực :c :
PHTT vàà KPD liên quan đ ng kê (cid:86)(cid:86) ThThốống kê
(cid:86)(cid:86) TrTríí tutuệệ nhân t
(cid:86)(cid:86) Cơ sCơ sởở ddữữ liliệệuu
(cid:86)(cid:86) ThuThuậật tot toáán hn họọcc
(cid:86)(cid:86) TTíính to
nhân tạạoo
(cid:86)(cid:86) Thu th
nh toáán song song v n song song vàà ttốốc đc độộ caocao
Thu thậập tri th p tri thứức cho c chuyên gia c cho cáác hc hệệ chuyên gia
(cid:97)(cid:97) PHTT v
KPD rấất gt gầần gn gũũi vi vớới ci cáác lc lĩĩnh vnh vựực :c : c phương phááp thp thốống kê đ
Quan sáát dt dữữ liliệệu... u...
(cid:86)(cid:86) Quan s PHTT vàà KPD r (cid:86)(cid:86) ThThốống kê, s vvàà phpháát hi
ng kê, sửử ddụụng cng cáác phương ph ng kê đểể mô hmô hìình dnh dữữ liliệệu u
t hiệện cn cáác mc mẫẫu, luu, luậật...t...
u (Data Warehousing) vàà ccáác công c c công cụụ phân t phân tíích ch
Ngân hààng dng dữữ liliệệu (Data Warehousing) v (cid:86)(cid:86) Ngân h trtrựực tuy n (OLAP) c tuyếến (OLAP)
55/55/5757
ỨỨng dng dụụng PHTT v
ng PHTT vàà
KPDL KPDL
(cid:97)(cid:97) Thông tin thương m
u marketing, kháách hch hààngng
Thông tin thương mạại :i : (cid:86)(cid:86) Phân t
(cid:86)(cid:86) Phân t
Phân tíích dch dữữ liliệệu marketing, kh Phân tíích đch đầầu tưu tư t cho vay vốốnn Phê duyệệt cho vay v n gian lậậnn…… t hiệện gian l
u khiểển vn vàà llậập lp lịịch tr
ch trììnhnh
(cid:86)(cid:86) Phê duy (cid:86)(cid:86) PhPháát hi Thông tin kỹỹ thuthuậật :t : (cid:97)(cid:97) Thông tin k (cid:86)(cid:86) ĐiĐiềều khi (cid:86)(cid:86) QuQuảản trn trịị mmạạngng
Phân tíích cch cáác kc kếết qut quảả ththíí nghi
nghiệệmm……
(cid:97)(cid:97) Thông tin khoa h
(cid:86)(cid:86) Phân t Thông tin khoa họọcc nhân... Thông tin cáá nhân...
(cid:97)(cid:97) Thông tin c
56/56/5757
CCáác thc tháách th
ch thứức cc củủa PHTT v
a PHTT vàà
KPDL KPDL
c CSDL thườờng rng rấất lt lớớn, n, thưthườờng xuyên bi
ng xuyên biếến đn đổổii
t triểển không ng
n không ngừừngng
(cid:97)(cid:97) CCáác CSDL thư vvàà phpháát tri c điểểm :m :
(cid:97)(cid:97) ĐĐặặc đi
(cid:86)(cid:86) CCáác CSDL thư
c CSDL thườờng cng cóó ssốố chichiềều lu lớớn n
tri thứức cc cóó ththểể llààm cho c
m cho cáác mc mẫẫu đã ph
u đã pháát t
(cid:86)(cid:86) Thay đ
Thay đổổi di dữữ liliệệu vu vàà tri th n không còn phùù hhợợpp hihiệện không còn ph (cid:86)(cid:86) DDữữ liliệệu bu bịị thithiếếu hou hoặặc nhi
c nhiễễuu
Quan hệệ gigiữữa ca cáác trưc trườờng dng dữữ liliệệu phu phứức tc tạạpp
(cid:86)(cid:86) Quan h (cid:97)(cid:97) VVấấn đn đềề giao ti
i ngườời si sửử ddụụngng
giao tiếếp vp vớới ngư vvàà kkếết ht hợợp vp vớới ci cáác tri th
c tri thứức đã c
c đã cóó
(cid:97)(cid:97) KhKhảả năng t
năng tíích hch hợợp vp vớới ci cáác hc hệệ ththốống kh
ng kháác...c...