HHệệ

chuyên gia chuyên gia

Expert System)) ((Expert System

PGS.TS. Phan Huy Kháánhnh PGS.TS. Phan Huy Kh khanhph@vnn.vn

Chương 11 Chương

MMởở đ đầầu vu vềề

chuyên gia chuyên gia

hhệệ

1.21.2

HHệệ

chuyên gia (HCG) làà chuyên gia (HCG) l

??

ggìì

chuyên gia làà llĩĩnh vnh vựực c ứứng dng dụụng cng củủa a trtríítutuệệnhân tnhân tạạoo

a HCG : nh nghĩĩa HCG :

(cid:97)(cid:97) HHệệ chuyên gia l (cid:97)(cid:97) CCóó nhinhiềều cu cáách đch địịnh ngh (cid:86)(cid:86) E. Feigenbaum :

chuyên gia (Expert System) lààmmộột t

nh thông minh sửửddụụng tri th

inference procedures) c suy luậận (n (inference procedures) khăn đòi hỏỏi nhi nhữững ng

n tương đốối khi khóó khăn đòi h

chuyên gia làà mmộột ht hệệ ththốống tin h

ng tin họọc cc cóó ththểể mô phmô phỏỏng ng n (decision) vàà hhàành đnh độộng ng

c quyếết đot đoáán (decision) v t chuyên gia (con ngư

E. Feigenbaum : ««HHệệchuyên gia (Expert System) l ng tri thứức c chương trìình mnh mááy ty tíính thông minh s chương tr (knowledge) vààccáác thc thủủttụục suy lu (knowledge) v đđểểgigiảải nhi nhữững bng bàài toi toáán tương đ chuyên gia mớới gii giảải đưi đượợcc»» chuyên gia m (cid:86)(cid:86) HHệệ chuyên gia l năng lựực quy (emulates) năng l (emulates) (making abilily) củủa ma mộột chuyên gia ( (making abilily) c (cid:86)(cid:86) MMộột ht hệệ chuyên gia s

chuyên gia sửử ddụụng tri th

con ngườời)i) ng tri thứức cc củủa ma mộột lt lĩĩnh vnh vựực cc cụụ ththểể ng chuyên i quyếết vt vấấn đn đềề vvớới i ““chchấất lưt lượợng chuyên

đđểể cung c giagia”” trong l

cung cấấp vip việệc gic giảải quy trong lĩĩnh vnh vựực đc đóó..

2/2/5757

What is an Expert System? What is an Expert System?

Expert System: (cid:97)(cid:97) Expert System: A computer program that: A computer program that: (cid:86)(cid:86) Attempts to code the

(cid:86)(cid:86) Emulates the

making ability of a human expert of a human expert

knowledge of human experts Attempts to code the knowledge of human experts (i.E. A rule of thumb) form of heuristics (i.E. A rule of thumb) in the form of heuristics in the Emulates the decision decision--making ability in a restricted domain in a restricted domain

to solve problems that inference procedures to solve problems that

Edward Feigenbaum: ““An intelligent computer program that An intelligent computer program that (cid:86)(cid:86) Edward Feigenbaum: and inference procedures uses knowledge and uses knowledge are difficult enough to require significant human expertise are difficult enough to require significant human expertise for their solutions”” for their solutions

A computer program which: (cid:97)(cid:97) A computer program which: Encapsulates knowledge (cid:86)(cid:86) Encapsulates from a human expert from a

from some domain, normally obtained knowledge from some domain, normally obtained

in that domain human expert in that domain

3/3/5757

KhKháái ni

chuyên gia i niệệm m chuyên gia

rong cuộộc sc sốống ng ttrong cu i quyếết vt vấấn đn đềề ởở mmộột mt mứức c

(cid:97)(cid:97) TTrong cu đđộộ cao v

rong cuộộc sc sốống, c c chuyên gia cóó ththểể gigiảải quy

ng, cáác chuyên gia c t nhiềều tri th cao vìì hhọọ ccóó rrấất nhi u tri thứức vc vềề llĩĩnh vnh vựực hc họọ hohoạạt đt độộngng

y bao gồồm lý thuy m lý thuyếết đt đếến cn cảả ccáác kinh nghi c kinh nghiệệm, km, kỹỹ xxảảo, o,

c heuristic đã tíích lch lũũy đưy đượợc cc củủa ca cáác c

(cid:97)(cid:97) NhNhữững tng tri thri thứức nc nàày bao g phương phááp lp lààm tm tắắt, chi phương ph chuyên gia con ngườời qua qu chuyên gia con ngư chuyên môn chuyên môn

(cid:97)(cid:97) TTừừ tri th

t, chiếến lưn lượợc heuristic đã t i qua quáá trtrìình lnh lààm vim việệc cc củủa ha họọ trong m trong mộột lt lĩĩnh vnh vựực c

tri thứức nc nàày, y, ngưngườời ta c ththốống cng cóó ththểể mô phmô phỏỏng theo c i ta cốố ggắắng cng càài đi đặặt cht chúúng vng vàào ho hệệ ththốống đng đểể hhệệ ch thứức cc cáác chuyên gia l ng theo cáách th c chuyên gia lààm vim việệcc

i con ngườời, ci, cáác chương tr c chương trìình hi i không nh hiệện tn tạại không

(cid:86)(cid:86) TTri thri thứức phc phảải đưi đượợc lc lấấy ty từừ con ngư

Tuy nhiên, không giốống vng vớới con ngư (cid:97)(cid:97) Tuy nhiên, không gi ttựự hhọọc lc lấấy kinh nghi y kinh nghiệệmm ::

(cid:86)(cid:86) ĐưĐượợc mã h

con ngườờii

(cid:97)(cid:97) Đây lĐây làà nhinhiệệm vm vụụ chchíính mnh màà ccáác nhc nhàà thithiếết kt kếế HCG ph

HCG phảải đương đ

i đương đầầuu

c mã hóóa a trong m trong mộộtt ngôn ng ngôn ngữữ hhìình th nh thứứcc đ đểể khai th khai tháácc

4/4/5757

Bách khoa toàn thư mở

Wikipedia

(cid:97) HCG, còn gọi là hệ thống dựa tri trức, là một chương

trình máy tính chứa một số tri thức đặc thù của một hoặc nhiều chuyên gia con người về một chủ đề cụ thể nào đó

(cid:97) Các chương trình thuộc loại này đã được phát triển từ các thập kỷ 1960 và 1970, và trở thành ứng dụng thương mại từ thập kỷ 1980

(cid:97) Nhiều HCG đã được thiết kế và xây dựng để phục vụ các lĩnh vực kế toán, y học, điều khiển tiến trình (process control), dịch vụ tư vấn tài chính (finalcial service), tài nguyên con người (human resources), v.v...

5/5/5757

Bách khoa toàn thư mở

Wikipedia

(cid:97)(cid:97) DDạạng ph

ng phổổ bibiếến nhn nhấất ct củủa HCG l

a HCG làà ::

ch thông tin (thưhườờng ng

(cid:86)(cid:86) MMộột chương tr đưđượợc cung c (cid:86)(cid:86) NhNhữững phân t (cid:86)(cid:86) TTùùy theo thi

t chương trìình gnh gồồm mm mộột tt tậập lup luậật phân t i NSD hệệ ththốống) v c cung cấấp bp bởởi NSD h ng phân tíích vch vềề ccáác vc vấấn đn đềề đã x t phân tíích thông tin (t ng) vềề mmộột lt lớớp vp vấấn đn đềề ccụụ ththểể đã xáác đc địịnhnh

y theo thiếết kt kếế chương tr chương trìình mnh màà đưa l đưa lờời khuyên v i khuyên vềề trtrìình tnh tựự ccáác c

(cid:97)(cid:97) HCG s

HCG sửử ddụụng cng cáác tri th quyquyếết ct cáác vc vấấn đn đềề (b(bàài toi toáán) kh

c tri thứức cc củủa nha nhữững chuyên gia đ n) kháác nhau thu

ng chuyên gia đểể gigiảải i c nhau thuộộc mc mọọi li lĩĩnh vnh vựựcc

(cid:97)(cid:97) LLàà mmộột ht hệệ ththốống sng sửử ddụụng cng cáác khc khảả năng l

năng lậập lup luậận đn đểể đ đạạt tt tớới i

ccáác kc kếết lut luậậnn

(cid:97)(cid:97) CCáác thu

c thuậật ngt ngữữ ccóó ccùùng ngh

ng nghĩĩa :a :

hhàành đnh độộng cng cầần thn thựực hic hiệện đn đểể gigiảải quy i quyếết vt vấấn đn đềề

(cid:86)(cid:86) HHệệ chuyên gia chuyên gia (cid:86)(cid:86) HHệệ ththốống dng dựựa trên tri th HCG dựựa trên tri th (cid:86)(cid:86) HCG d

a trên tri thứức (knowledge based system) c (knowledge−−based system)

a trên tri thứức (knowledge based expert system) c (knowledge−−based expert system)

6/6/5757

LLớớp vp vấấn đn đềề

1.1.

a HCG_1 ccủủa HCG_1 nhnhữững tng tậập hp hợợp dp dữữ

2.2.

u thô liliệệu thô

3.3.

nh huốốngng xxảảy ra khi cho trư hihiểểu tu từừ y ra khi cho trướớc mc mộột tt tìình hu ththểể

a trên cáác tri

nh nguyên nhân củủa nha nhữững sng sựự nh huốống ph ng phứức tc tạạp p

ththểể

4.4.

trong cáác tc tìình hu ccốố trong c quan sáát đưt đượợcc quan s

ng đượợc cc cáác mc mụục c

5.5.

ch (planning) hohoạạch (planning)

ththốống,ng, đ đááp p ứứng đư ng buộộc vc vềề a mãn mộột tt tậập hp hợợp cp cáác rc rààng bu thithiếết kt kếế

i (interpretation) DiDiễễn gin giảải (interpretation) ddễễ n hay mô tảả Đưa ra kếết lut luậận hay mô t Đưa ra k n (prediction) DDựự đo đoáán (prediction) ccóó Đưa ra nhnhữững hng hậậu quu quảả Đưa ra ChChẩẩn đon đoáán (diagnosis) n (diagnosis) XXáác đc địịnh nguyên nhân c c triệệu chu chứứng cng cóó ddựựa trên c (design) ThiThiếết kt kếế (design) ttììm ra cm ra cấấu hu hìình cho c nh phầần hn hệệ nh cho cáác thc thàành ph tiêu trong khi vẫẫn thn thỏỏa mãn m tiêu trong khi v LLậập kp kếế t chuỗỗi ci cáác hc hàành đnh độộng đng đểể đ đạạt đưt đượợc mc mộột tt tậập hp hợợp cp cáác mc mụục c TTììm ra mm ra mộột chu c cho trướớc cc cáác đi ng buộộc c c điềều kiu kiệện khn khởởi đi đầầu vu vàà tiêu, khi đư đượợc cho trư tiêu, khi time) y (run--time) trong thờời gian ch trong th

nhnhữững rng rààng bu

i gian chạạy (run

7/7/5757

LLớớp vp vấấn đn đềề

a HCG_2 ccủủa HCG_2

6.6.

nh vi quan sáát đưt đượợc cc củủa ha hệệ

nh vi ththốống vng vớới hi hàành vi

hhàành vi quan s

Theo dõi (monitoring) Theo dõi (monitoring) SSo so sáánhnh nhnhữữngng mong đợợii mong đ

7.7.

BBắắt lt lỗỗi vi vàà CChhỉỉ đ địịnh vnh vàà

a (debuging and repair) ssửửa cha chữữa (debuging and repair) t phương phááp chp chữữa tra trịị ccàài đi đặặt phương ph

cho cáác c ssựự cho c

ccốố, r, rủủi roi ro

8.8.

t hiệện vn vàà

n (instruction) HưHướớng dng dẫẫn (instruction) PPhháát hi niniệệm cm củủa ha họọc viên v

llĩĩnh vnh vựực nc nàào đo đóó

ssửửa cha chữữa nha nhữững thi ng thiếếu su sóót trong quan t trong quan mmộột cht chủủ đ đềề c viên vềề

9.9.

n (control) u khiểển (control)

ĐiĐiềều khi CChhỉỉ đ đạạo ho hàành vi

trong nh vi trong

t môi trườờng ph

ng phứức tc tạạpp

mmộột môi trư

8/8/5757

TTổổ

a HCG chchứức hoc hoạạt đt độộng cng củủa HCG

chuyên gia gồồm ba th (cid:97)(cid:97) MMộột ht hệệ chuyên gia g

m ba thàành ph knowledge base) nơi ch

a HCG a tri thứức cc củủa HCG

nh phầần chn chíính :nh : nơi chứứa tri th (inference engine) môtơ suy diễễnn(inference engine)

y suy diễễnn hay hay môtơ suy di

(user interface) ng giao tiếếp vp vớới ngưi ngườời si sửửddụụngng(user interface)

Ngườời si sửử ddụụng (Ung (User)

ser) đ đặặt câu h

t câu hỏỏii

(cid:86)(cid:86) Cơ sCơ sởởtri thtri thứứcc ( (knowledge base) (cid:86)(cid:86) MMááy suy di (cid:86)(cid:86) HHệệththốống giao ti Khai tháác HCG : (cid:97)(cid:97) Khai th (truy vấấn) HCG b (truy v (cid:86)(cid:86) Cung c

đã biếết,t, đã c

ng tri thứức cc cóó íích (lu

(facts) làà nhnhữững gng gìì đã bi ch (luậậtt--rules) cho h

t hay đã cóó ththậật hay chuyên gia, vàà nhnhậận n

rules) cho hệệ chuyên gia, v

n khai tháác cơ s

(cid:86)(cid:86) MMááy suy di

c cơ sởở tri th

tri thứức đc đểể ttạạo ra câu tr

o ra câu trảả llờời li làà

expertise) cho i ý đúúng đng đắắn (n (expertise) cho

c HCG : Ngư n) HCG bằằng cng cáách :ch : Cung cấấp p ssựựkikiệệnn(facts) l nhnhữững tri th đưđượợc nhc nhữững câu tr ng câu trảả llờờii a HCG : (cid:97)(cid:97) HoHoạạt đt độộng cng củủa HCG : y suy diễễn khai th nhnhữững lng lờời khuyên hay nh ngưngườời si sửử ddụụng qua h

i khuyên hay nhữững gng gợợi ý đ ng qua hệệ ththốống giao ti

ng giao tiếếpp

9/9/5757

Knowledge Engineering in a Nutshell Knowledge Engineering in a Nutshell

Human Human Expert Expert

Dialog

Knowledge Knowledge Engineer Engineer Knowledge Refinement

Explicit Knowledge

Knowledge base Knowledge base (In ES) (In ES)

10/10/5757

SE overviews SE overviews

solving s problem--solving

Problem Domain Problem Domain

Knowledge Knowledge Domain Domain

Relies on internally represented knowledge to perform tasks (cid:97)(cid:97) Relies on internally represented knowledge to perform tasks Utilizes reasoning methods to derive appropriate new knowledge (cid:97)(cid:97) Utilizes reasoning methods to derive appropriate new knowledge problem domain Usually restricted to a specific problem domain (cid:97)(cid:97) Usually restricted to a specific knowledge--based system The term knowledge is often used synonymously based system is often used synonymously (cid:97)(cid:97) The term Two distinctions from Decision Support System (DSS): Decision Support System (DSS): (cid:97)(cid:97) Two distinctions from has the potential to extend the manager’’s problem 1.1. has the potential to extend the manager ability beyond his or her normal capabilities ability beyond his or her normal capabilities the ability to explain how the solution was reached the ability to explain how the solution was reached 2.2.

11/11/5757

NhiNhiềều cu cáách nh

ch nhììn nhn nhậận khn kháác nhau v

c nhau vềề

HCGHCG

Loại người sửdụng Vấn đề đặt ra

Người quản trị

Tôi có

thể

dùng nó để

làm gì

?

tôi vận hành nó

tốt

Kỹ

thuật viên

Làm cách nào để nhất ?

Nhà

nghiên cứu

Làm sao để

tôi có

mở

rộng nó

?

thể

Người sử

dụng cuối

Nó Nó Nó

sẽ có có đáng tin cậy không ?

giúp tôi cái gì đây ? tốn kém không ? rắc rối và

12/12/5757

ĐĐặặc trưng c

c trưng củủa ha hệệ

chuyên gia chuyên gia

(cid:97)(cid:97) CCóó bbốốn đn đặặc trưng cơ b

chuyên gia : c trưng cơ bảản cn củủa ma mộột ht hệệ chuyên gia : (high performance). Khảả năng tr

(cid:86)(cid:86) HiHiệệu quu quảảcao cao (high performance). Kh ng hoặặc cao hơn so v

tinh thông bằằng ho

năng trảả llờời vi vớới mi mứức c i chuyên gia (ngưngườời) i)

c cao hơn so vớới chuyên gia (

đđộộ tinh thông b trong cùùng lng lĩĩnh vnh vựực.c. trong c (cid:86)(cid:86) ThThờời gian tr

i gian trảảllờời thoi thoảả đ đááng ng (adequate response time). Th

ng hoặặc nhanh hơn so v

p lý, bằằng ho đi đếến cn cùùng mng mộột quy

(adequate response time). Thờời i i chuyên gia c nhanh hơn so vớới chuyên gia chuyên gia làà mmộột t

t quyếết đt địịnh. Hnh. Hệệ chuyên gia l

gian trảả llờời hi hợợp lý, b gian tr (n(ngưgườời)i) đ đểể đi đ hhệệ ththốống th

ng thờời gian th

c (real time system). i gian thựực (real time system).

(good reliability). Không thểể xxảảy ra s

y ra sựự ccốố hohoặặc c

gigiảảm sm súút đt độộ tin c

(cid:86)(cid:86) ĐĐộộtin ctin cậậy cao y cao (good reliability). Không th tin cậậy khi s

(cid:86)(cid:86) DDễễhihiểểuu(understandable). H

chuyên gia giảải thi thíích cch cáác bưc bướớc c

ng như n, không giốống như

y khi sửử ddụụng.ng. (understandable). Hệệ chuyên gia gi suy luậận mn mộột ct cáách dch dễễ hihiểểu vu vàà nhnhấất qut quáán, không gi suy lu ccáách tr

ch trảả llờời bi bíí ẩẩn cn củủa ca cáác hc hộộp đen

(black box) p đen (black box)

13/13/5757

Ưu điểểm cm củủa ha hệệ Ưu đi

chuyên gia_1 chuyên gia_1

(cid:97) Những ưu điểm của hệ chuyên gia :

(cid:86) Phổcập(increased availability). Là sản phẩm chuyên gia, được

(cid:86) Giảm giáthành (reduced cost).

(cid:86) Giảm rủi ro (reduced dangers). Giúp con người tránh được trong

phát triển không ngừng với hiệu quả sử dụng không thể phủ nhận.

(cid:86) Tính thường trực (Permanance). Bất kể lúc nào cũng có thể khai thác sử dụng, trong khi con người có thể mệt mỏi, nghỉ ngơi hay vắng mặt.

(cid:86) Đa lĩnh vực (multiple expertise). chuyên gia về nhiều lĩnh vực khác

các môi trường rủi ro, nguy hiểm.

nhau và được khai thác đồng thời bất kể thời gian sử dụng

14/14/5757

Ưu điểểm cm củủa ha hệệ Ưu đi

chuyên gia_2 chuyên gia_2

(cid:97) Những ưu điểm của hệ chuyên gia :

(cid:86) Độtin cậy (increased relialility)

(cid:86) Khả năng giảng giải (explanation). Câu trả lời với mức độ tinh

Luôn đảm bảo độ tin cậy khi khai thác.

(cid:86) Khả năng trảlời(fast reponse). Trả lời theo thời gian thực, khách

thông được giảng giải rõ ràng chi tiết, dễ hiểu.

(cid:86) Tính ổn định, suy luận cólý và đầy đủmọi lúc mọi nơi (steady, une

quan.

(cid:86) Trợgiúp thông minh như một người hướng dẫn (intelligent -tutor).

(cid:86) Cóthểtruy cập như làmột cơ sởdữliệu thông minh (intelligent

motional, and complete response at all times).

database)

15/15/5757

1

LLịịch sch sửử

phpháát tri

a HCG t triểển cn củủa HCG

Năm Các sự kiện

1943 Dịch vụ bưu điện ; mô hình Neuron của (Mc Culloch and Pitts Model)

1954 Thuật toán Markov (Markov Algorithm) điều khiển thực thi các luật

1956 Hội thảo Dartmouth ; lý luận logic ; tìm kiếm nghiệm suy (heuristic search) ; thống nhất thuật ngữ (AI: Artificial Intelligence) nhân tạo tuệ trí

1957 Rosenblatt phát minh khả năng nhận thức ; Newell, Shaw và Simon đề xuất giải bài toán tổng quát (GPS: General Problem Solver)

1958 Mc Carthy đề xuất ngôn ngữ trí tuệ nhân tạo LISA (LISA AI language)

chức năng thần kinh trong nhận thức 1962 Nguyên lý Rosenblatt’s về (Rosenblatt’s Principles of Neurodynamicdynamics on Perceptions)

(fuzzy logic) trong suy

1965 các đối tượng mờ (fuzzy object) của Zadeh. Xây dựng hệ chuyên

Phương pháp hợp giải Robinson. Ưng dụng logic mờ luận về gia đầu tiên về nha khoa DENDRAL (Feigenbaum , Buchanan , et.al)

nghĩa (semantic nets), mô hình bộ nhớ kết hợp (associative 1968

Mạng ngữ memory model) của Quillian

16/16/5757

2

LLịịch sch sửử

phpháát tri

a HCG t triểển cn củủa HCG

Năm Các sự kiện

chuyên gia về

1969 Hệ 1970 Ưng dụng ngôn ngữ Toán học MACSYMA (Martin and Moses) PROLOG (Colmerauer, Roussell, et, al.)

chuyên gia HEARSAY I về nhận dạng tiếng nói (speech recognition).

1971

Hệ Xây dựng các luật giải bài toán con người (Human Problem Solving popularizes rules (Newell and Simon)

1973 Hệ chuyên gia MYCIN về chẩn trị y học (Shortliffe, et,al.)

1975

1976 under uncertainty). Ứng

Lý thuyết khung (frames), biểu diễn tri thức (knowledge representation) (Minsky) Toán nhân tạo (AM: Artificial Mathematician) (Lenat). Lý thuyết tính hiển nhiên của lập luận không chắc chắn Dempster−Shafer về (Dempster−Shafer theory of Evidence for reason dụng hệ chuyên gia PROSPECTOR trong khai thác hầm mỏ (Duda, Har)

chuyên gia OPS (OPS expert system shell) trong hệ dụng ngôn ngữ 1977 Sử chuyên gia XCON/R1 (Forgy)

17/17/5757

3

LLịịch sch sửử

phpháát tri

a HCG t triểển cn củủa HCG

Năm Các sự kiện

bảo trì hệ thống máy tính 1978

so khớp nhanh (rete algorithm for fast pattern 1979 Hệ chuyên gia XCON/R1 (McDermott, DEC) để DEC (DEC computer systems) Thuật toán mạng về matching) của Forgy ; thương mại hoá các ứng dụng về trí tuệ nhân tạo

1980 Ký hiệu học (symbolics), xây dựng các máy LISP (LISP machines) từ LMI.

chuyên gia về Toán học (SMP math expert system) ;

1982 Nhật bản 5 ở hệ

công cụ phục vụ hệ 1983

chuyên gia CLIPS phục vụ công cụ hệ 1985 Hệ mạng nơ-ron Hopfield (Hopfield Neural Net) ; án xây dựng máy tính thông minh thế Dự (Japanese Fifth Generation Project to develop intelligent computers) chuyên gia KEE Bộ (KEE expert system tool) (intelli Corp) Bộ (CLIPS expert system tool (NASA)

18/18/5757

CCáác lc lĩĩnh vnh vựực c ứứng dng dụụng cng củủa ha hệệ

chuyên gia chuyên gia

chuyên gia đã đượợc xây d

(cid:97)(cid:97) Cho đ

n nay, hààng trăm h

ng trăm hệệ chuyên gia đã đư o thườờng xuyên trong c

c xây dựựng ng ng xuyên trong cáác tc tạạp chp chíí, s, sáách, ch,

Cho đếến nay, h vvàà đã đư đã đượợc bc bááo co cááo thư bbááo vo vàà hhộội thi thảảo khoa h

o khoa họọcc i ra còn cáác hc hệệ chuyên gia đư

chuyên gia đượợc sc sửử ddụụng trong c không đượợc công b c quân sựự mmàà không đư

ng trong cáác c c công bốố vvìì lý lý

(cid:97)(cid:97) NgoNgoàài ra còn c công ty, cáác tc tổổ chchứức quân s công ty, c do bdo bảảo mo mậậtt

19/19/5757

MMộột st sốố

llĩĩnh vnh vựực c ứứng dng dụụngng

Lĩnh vực

Cấu hình (Configuration)

Chẩn đoán (Diagnosis)

nào (how?) và cái gì Truyền đạt (Instruction) quan sát được hỏi thể nếu (what

Ứng dụng diện rộng Tập hợp thích đáng những thành phần của một hệ thống theo cách riêng Lập luận dựa trên những chứng cứ Dạy học kiểu thông minh sao cho sinh viên có vì sao (why?), như thế if?) giống như hỏi một người thầy giáo liệu thu nhận được

Giải thích (Interpretation) Giải thích những dữ

liệu chuyên Kiểm tra (Monitoring) liệu thu lượm được với dữ hiệu quả So sánh dữ môn để đánh giá

Lập kế hoạch (Planning) Lập kế hoạch sản xuất theo yêu cầu

một tình huống xảy ra

Dự đoán (Prognosis) Chữa trị (Remedy) từ lý một vấn đề

Điều khiển (Control) Dự đoán hậu quả Chỉ định cách thụ Điều khiển một quá đoán, kiểm tra, lập kế trình, đòi hỏi diễn giải, chẩn chữa trị hoạch, dự đoán và

20/20/5757

Một số

chuyên gia 1

hệ

CRYSALIS

Interpret a protein’n 3-D structure

DENDRAL

Interpret molecular structure

Remedy Triple Quadruple Mass Spectrometer (keep

TQMSTUNE

it tuned)

CLONER

Design new biological molecules

MOLGEN

Design gene -

cloning experiments

SECS

Design complex organic molecules

SPEX

Plan molecular biology experiments

Bảng 1Ngành hoáhọc (Chemistry)

21/21/5757

Một số

chuyên gia 2

hệ

Bảng 2Ngành điện tử(Electronics)

ACE

Diagnosis telephone network faults

IN -ATE

Diagnosis oscilloscope faults

NDS

Diagnosis national communication net

EURISKO

Design 3-D micro-electronics

PALLADIO Design and test new VLSI cicuits

REDESIGN Redesign digital circuits to new

CADHELP

Instruct for computer aided design

SOPHIE

Instruct circuit fault diagnosis

22/22/5757

Một số

chuyên gia 3

hệ

Bảng 3 Ngành địa chất (Geology)

DIPMETER Interpret dipmeter logs

LITHO Interpret oil well log data

MUD Diagnosis / remedy drilling problems

PROSPECTOR Interpret geologic data for minerals

(Engineering) Bảng 4 Công nghệ

REACTOR Diagnosis / remedy reactor accidents

DELTA Diagnosis / remedy GE locomotives

STEAMER Instruct operation - steam power-plant

23/23/5757

Một số

chuyên gia 5

hệ

Bảng 5 Ngành y học (Medicine)

PUFF Diagnosis lung disease

VM Monitors intensive - care patients

ABEL Diagnosis acid - base / electrolytes

AI/COAG Dianosis blood disease

AI/ RHEUM Diagnosis rheumatoid disease

CADUCEUS Diagnosis internal medicine disease

ANNA Monitor digitalis therapy

BLUE BOX Diagnosis / remedy depression

MYCIN Diagnosis / remedy bacterial infections

ONCOCIN Remedy / manage chemotherapy patient

ATTENDING Instruct in anesthetic manegement

GUIDON Instruct in bacterial infections

24/24/5757

Một số

chuyên gia 6

hệ

Bảng 6

Máy tính điện tử

(Computer systems)

PTRANS

Prognosis for managing DEC computers

BDS

Diagnosis bad parts in switching net

XCON

Configune DEC computer systems

XSEL

Configure DEC computer sales order

XSITE

Configure customer site for DEC computers

YES/MVS Monitor / control IBM MVS opeating system

TIMM

Diagnosis DEC computer

25/25/5757

Example of ES Example of ES

usually sees an expert system through an usually sees an expert system through an

The The endend--useruser interactive dialog:: interactive dialog

Do you know to which restaurant you want to go? Do you know to which restaurant you want to go? No No Is there any kind of food you would particularly like? Is there any kind of food you would particularly like?

Unknown Unknown

Q.Q. A.A. Q.Q. A.A. Q.Q. A.A. Q.Q. A.A. Q.Q. A.A.

Do you like spicy food? Do you like spicy food? No No Do you usually drink wine with meals? Do you usually drink wine with meals? Yes Yes When you drink wine, is it French wine? When you drink wine, is it French wine? Why Why

26/26/5757

Example of ES Example of ES

27/27/5757

ES Problems ES Problems

Limited knowledge (cid:97)(cid:97) Limited knowledge (cid:86)(cid:86) ““Shallow

common--sense

the ES knows only what it has been explicitly ““toldtold”” it doesn’’t know what it doesn

(cid:86)(cid:86) some Lack of trust (cid:97)(cid:97) Lack of trust users may not want to leave critical decisions to machines (cid:86)(cid:86) users may not want to leave critical decisions to machines

knowledge Shallow”” knowledge understanding of the concepts and their relationships (cid:153)(cid:153) no no ““deepdeep”” understanding of the concepts and their relationships knowledge sense”” knowledge (cid:86)(cid:86) no no ““common no knowledge from possibly relevant related domains (cid:86)(cid:86) no knowledge from possibly relevant related domains closed world”” (cid:86)(cid:86) ““closed world (cid:153)(cid:153) the ES knows only what it has been explicitly t know t know what it doesn’’t know (cid:153)(cid:153) it doesn Mechanical reasoning (cid:97)(cid:97) Mechanical reasoning may not have or select the most appropriate method for a (cid:86)(cid:86) may not have or select the most appropriate method for a particular problem particular problem problems are computationally very expensive some ““easyeasy”” problems are computationally very expensive

28/28/5757

ES Design + Development ES Design + Development

Which are the major steps in the Linear Model (cid:97)(cid:97) Which are the major steps in the Linear Model of ES Development? of ES Development?

What do you have to take into account (cid:97)(cid:97) What do you have to take into account when you plan an ES project? when you plan an ES project?

What can you say about the delivery phase (cid:97)(cid:97) What can you say about the delivery phase of an ES project? of an ES project?

What kind of errors can occur (cid:97)(cid:97) What kind of errors can occur (during the development) of an ES? (during the development) of an ES?

29/29/5757

ES Design + Development ES Design + Development

(cid:153)(cid:153) Conceptualization

(cid:153)(cid:153) Formalization

(cid:153)(cid:153) Implementation

Major basic steps in ES development (cid:97)(cid:97) Major basic steps in ES development Identification:: (cid:153)(cid:153) Identification Determine problem and project requirements Determine problem and project requirements Conceptualization: Extract knowledge and construct a : Extract knowledge and construct a conceptual model for solving problems using the knowledge conceptual model for solving problems using the knowledge : Map the conceptual model to available Formalization: Map the conceptual model to available representation and control paradigms representation and control paradigms : Construct/extend the implementation of Implementation: Construct/extend the implementation of the formalized model the formalized model : Evaluate the system Testing: Evaluate the system

(cid:153)(cid:153) Testing Software Engineering models (cid:97)(cid:97) Software Engineering models Project phases (cid:97)(cid:97) Project phases Linear Model of ES Development (cid:97)(cid:97) Linear Model of ES Development Sources of error in ES (cid:97)(cid:97) Sources of error in ES

30/30/5757

The linear model of ES development life cycle The linear model of ES development life cycle

31/31/5757

Các phần tử

của HCG

(cid:97) Môt HCG gồm 3 thành phần cơ bản :

c (Knowledge Base) tri thứức (Knowledge Base) n (Inference Engine) y duy diễễn (Inference Engine)

Giao diệện ngư

(User Interface) n ngườời si sửử ddụụngng (User Interface)

(cid:97) Ngoài ra, tuỳ theo mức độ tiếp cận, mà người ta

c (Agenda) ch công việệc (Agenda)

ch (Explanation Facility) năng giảải thi thíích (Explanation Facility) c (Explanation Facility) n tri thứức (Explanation Facility) năng thu nhậận tri th

bổ sung các thành phần khác, chẳng hạn : (cid:137)(cid:137) LLịịch công vi c (Working Memory) (cid:137)(cid:137) BBộộ nhnhớớ llààm vim việệc (Working Memory) (cid:137)(cid:137) KhKhảả năng gi (cid:137)(cid:137) KhKhảả năng thu nh (cid:137)(cid:137) ……

(cid:137)(cid:137) Cơ sCơ sởở tri th (cid:137)(cid:137) MMááy duy di (cid:137)(cid:137) Giao di

32/32/5757

General Architecture of SE General Architecture of SE

End-User

Knowledge Base Knowledge Base

Facts / Information

Inference Engine Inference Engine

Expertise

Expert System

33/33/5757

Expert system model -- Expert system model

main parts main parts

Knowledge Base (rules)

Knowledge Acquisition Facility

Inference Engine

Agenda

e c a f r e t n I r e s U

Explanation Facility

Working Memory (facts)

34/34/5757

Knowledge

Instructions & information

Solutions & explanations

User

User interface

Problem Domain

Inference engine Know- ledge base

Development engine

Expert system

An Expert An Expert System Model System Model

Expert and knowledge engineer

35/35/5757

Một số

mô hình khác

Knowledge Knowledge Base Base Knowledge Knowledge Base editor Base editor

UserUser Inference Inference Engine Engine

Preceptors Preceptors World World Model Model

Explanation Explanation Subsystem Subsystem

36/36/5757

Mô hình J. L. Ermine

Cơ sở Cơ sở

tri thức tri thức

dụng

Giao Giao diện diện

Người sử yêu cầu

thống Hệ thống Hệ thu nhận thu nhận tri thức tri thức

Dữ liệu vấn đề cần giải quyết

nhớ Bộ nhớ Bộ làm việc làm việc

Tri thức mới

37/37/5757

Mô hình C. Ernest

Tri thức Tri thức

Cơ sở Cơ sở tri thức tri thức

Cấu trúc Cấu trúc máy suy diễn máy suy diễn

Dữ Dữ

liệu liệu

Máy Máy suy diễn suy diễn

Chuyên Chuyên giagia

•Lời giải •Lời giải •Giải thích •Giải thích •Theo dõi •Theo dõi

NgưNgườời i ssửử ddụụngng

38/38/5757

Mô hình E. V. Popov

Khả năng Khả năng giải thích giải thích

Chuyên Chuyên gia gia

Diễn dịch Diễn dịch Cơ sở Cơ sở tri thức tri thức Giao diện Giao diện người người dụng sử dụng sử nhớ Bộ nhớ Bộ làm việc làm việc

Người Người dụng sử dụng sử

hữu Sở Sở hữu tri thức tri thức

39/39/5757

Tri thứức vc vàà Cơ s Tri th

Cơ sởở

tri thứứcc tri th

(cid:97)(cid:97) Tri th

trong HCG : Tri thứứcc trong HCG :

tinh thông đượợc tc tíích tch tụụ ttừừ ssáách vch vởở, t, tạạp chp chíí,,

(cid:86)(cid:86) PhPhảản n áánh snh sựự tinh thông đư ttừừ ccáác chuyên gia hay c

c chuyên gia hay cáác nhc nhàà bbáác hc họọcc

(cid:97)(cid:97) Cơ sCơ sởở tri th

tri thứứcc ggồồm :m :

(cid:86)(cid:86) CCáác phc phầần tn tửử ( (hay đơn v

hay đơn vịị) tri th

) tri thứức đưc đượợc tc tổổ chchứức như m

t CSDL c như mộột CSDL

(cid:86)(cid:86) TuTuỳỳ theo phương ph

t triểển HCG m

n HCG màà ccáác phc phầần tn tửử ccóó đ đặặc c

theo phương phááp php pháát tri c nhau nh chấất kht kháác nhau

trưng, t, tíính ch trưng

(cid:86)(cid:86) ChChẳẳng hng hạạn trong c

n trong cáác HCG d

c HCG dựựa theo lu

a theo luậật (Rules

Based ES) : t (Rules--Based ES) :

(cid:153)(cid:153) MMỗỗi phi phầần tn tửử tri th

(cid:153)(cid:153) Cơ sCơ sởở tri th

tri thứức lc làà mmộột t luluậậtt

tri thứứcc như v như vậậy còn đư y còn đượợc gc gọọi li làà bbộộ nhnhớớ ssảản xun xuấất t

(Production Memeory) (Production Memeory)

40/40/5757

Phân loạại tri th Phân lo

i tri thứứcc

(cid:97)(cid:97) NgưNgườời ta thư

i ta thườờng phân lo

ng phân loạại tri th

i tri thứức theo nhi

c theo nhiềều cu cááchch

(cid:97)(cid:97) Theo phân lo

hai loạại tri th

i tri thứức :c :

Theo phân loạại chi chứức năng c năng, c, cóó hai lo (Assertion Knowledge) : (cid:86)(cid:86) Tri thTri thứức phc pháán đon đoáánn(Assertion Knowledge) : ng đã đượợc thi nh huốống đã đư

mô tmô tảả ccáác tc tìình hu c thiếết lt lậập hop hoặặc sc sẽẽ đư đượợc thi c thiếết lt lậậpp

t ra hay nhữững thao t

(cid:86)(cid:86) Tri thTri thứức thc thựực hc hàànhnh(Operating Knowledge) (Operating Knowledge) ththểể hihiệện nhn nhữững hng hậậu quu quảả rrúút ra hay nh thithiệện khi m ng đã đượợc thi n khi mộột tt tìình hu trong lĩĩnh vnh vựực đang x trong l

nh huốống đã đư ng thao táác cc cầần phn phảải hoi hoààn n c thiếết lt lậập p c thiếết lt lậập hop hoặặc sc sẽẽ đư đượợc thi

(cid:97)(cid:97) Tri th

Tri thứức thc thựực hc hàành :nh :

(cid:86)(cid:86) ThưThườờng đư

c+Lôgic ng đượợc thc thểể hihiệện bn bởởi ci cáác bic biểểu thu thứức Toc Toáán hn họọc+Lôgic

n khai ddễễ hihiểểu, du, dễễ tritriểển khai

(cid:86)(cid:86) NSD c

NSD cóó ththểể thao t

thao táác vc vớới tri th

i tri thứức như khai th

t CSDL c như khai tháác mc mộột CSDL

c đang xéétt

41/41/5757

Phân loạại tri th Phân lo

i tri thứức theo bi

c theo biểểu hiu hiệệnn

Theo phân loạại theo bi

i theo biểểu hiu hiệện, cn, cũũng cng cóó hai lo

hai loạại :i :

(cid:97)(cid:97) Theo phân lo (cid:97)Tri thức hiện, rõ (explicit knowledge)

(cid:86) Diễn đạt bằng ngôn ngữ hình thức, dễ trao đổi giữa các cá nhân (cid:86) Có thể biểu diễn bằng các công thức khoa học, các thủ tục tường

(cid:86) Bao gồm thông tin, dữ liệu, sách báo, văn bản, tài liệu đã được hệ

minh, hoặc nhiều cách khác

(cid:97)Tri thức ngầm, ẩn (tacit knowledge)

(cid:86) Có được và ẩn chứa trong kinh nghiệm của từng cá nhân, mang tính chủ quan, bao gồm những hiểu biết riêng thấu đáo, trực giác, linh cảm, kỹ năng, …

(cid:86) Khó trao đổi hoặc chia sẻ với người khác (cid:86) Chỉ có thể học được từ người khác nhờ quan hệ gần gũi trong một

thống bằng nhiều phương tiện

khoảng thời gian nào đó

42/42/5757

Knowledge-base may really include many things

Heuristics Heuristics

Events Events

Hypothesis Hypothesis

Definitions Definitions

Facts Facts

Knowledge

Base

Rules Rules

Relationships Relationships

Attributes Attributes

Processes Processes

Objects Objects

43/43/5757

Quản trị

tri thức

KhKháái ni

i niệệm vm vềề

(cid:97)(cid:97) NgưNgườời ta thư (cid:86)(cid:86) Tri th

i : i ta thườờng nng nóói : Tri thứức lc làà ssứức mc mạạnhnh Tri thứức lc làà ccủủa ca cảải i

(cid:86)(cid:86) Tri th

(cid:97)(cid:97) CCáác tc tổổ chchứức cc củủa LHQ r

a LHQ rúút ra k

t ra kếết lut luậận rn rằằng :ng :

(cid:86)(cid:86) Kinh t

Kinh tếế ththếế gigiớới phi pháát tri

t triểển mn mạạnh mnh mẽẽ do bi

do biếết dt dựựa va vàào tri th

o tri thứứcc (cid:97) Làm thế nào để sáng tạo và sử dụng đúng đắn các tri thức

(cid:97) Quản trị tri thức (Knowledge Management)

44/44/5757

ES Elements: Mááy duy di ES Elements: M

y duy diễễnn

(cid:97)(cid:97) MMááy duy di (cid:86)(cid:86) Công c

nh, hay bộộ xxửử lý) t

o ra sựự suy lu

chương trìình, hay b nh xem nhữững lu

ch quyếết đt địịnh xem nh

lý) tạạo ra s ng luậật nt nàào so sẽẽ llààm thm thỏỏa mãn c

suy luậận bn bằằng ng a mãn cáác sc sựự

(inference engine) : y duy diễễnn(inference engine) : Công cụụ ( (chương tr ccáách quy kikiệện, cn, cáác đc đốối tưi tượợngng

a mãn n ưu tiên cáác luc luậật tht thỏỏa mãn

(cid:86)(cid:86) ChChọọn ưu tiên c (cid:86)(cid:86) ThThựực hic hiệện cn cáác luc luậật ct cóó ttíính ưu tiên cao nh

nh ưu tiên cao nhấấtt

45/45/5757

ES Elements : Giao diệện ngư ES Elements : Giao di

n ngườời si sửử

ddụụngng

(user interface) : (cid:97)(cid:97) Giao diGiao diệện ngưn ngườời si sửửddụụngng(user interface) :

(cid:86)(cid:86) LLàà nơi ngư

nơi ngườời si sửử ddụụng vng vàà hhệệ chuyên gia trao đ

i nhau chuyên gia trao đổổi vi vớới nhau

46/46/5757

ES Elements : Cáác thc thàành ph ES Elements : C

nh phầần khn kháácc

(agenda) : ch công việệcc(agenda) : (cid:97)(cid:97) LLịịch công vi (cid:86)(cid:86) Danh s

o ra thoảả mãn mãn

Danh sáách cch cáác luc luậật ưu tiên do m t ưu tiên do mááy suy di ccáác sc sựự kikiệện, cn, cáác đc đốối tưi tượợng cng cóó mmặặt trong b

y suy diễễn tn tạạo ra tho t trong bộộ nhnhớớ llààm vim việệc.c.

(working memory) : (cid:97)(cid:97) BBộộnhnhớớllààm vim việệcc(working memory) :

(cid:86)(cid:86) Cơ sCơ sởở ddữữ liliệệu tou toààn cn cụục chc chứứa ca cáác sc sựự kikiệện phn phụục vc vụụ cho c

cho cáác luc luậậtt

(explanation facility) : năng giảải thi thííchch(explanation facility) :

(cid:97)(cid:97) KhKhảả năng gi (cid:86)(cid:86) GiGiảải ngh

ng cho ngườời si sửử ddụụngng

(cid:97)(cid:97) KhKhảả năng thu nh

p NSD bổổ sung tri th

i nghĩĩa ca cáách lch lậập lup luậận cn củủa ha hệệ ththốống cho ngư (explanation facility) : năng thu nhậận tri thn tri thứứcc(explanation facility) : Cho phéép NSD b (cid:86)(cid:86) Cho ph (cid:86)(cid:86) KhKhảả năng thu nh

sung tri thứức vc vàào ho hệệ ththốốngng n tri thứức lc làà yyếếu tu tốố mmặặc nhiên c

năng thu nhậận tri th

c nhiên củủa nhi

a nhiềều hu hệệ

chuyên gia chuyên gia

47/47/5757

PhPháát hi

t hiệện tri th

n tri thứức vc vàà

khai pháá khai ph

liliệệuu

t hiệện tri th

n tri thứức (PHTT) v

c (PHTT) vàà khai ph

ddữữ u (KPDL) khai pháá ddữữ liliệệu (KPDL)

(cid:97)(cid:97) PhPháát hi (cid:97)(cid:97) BBốối ci cảảnh :nh : (cid:86)(cid:86) SSựự phpháát tri

t triểển nhanh ch

n nhanh chóóng cng củủa la lĩĩnh vnh vựực CNTT v

ng CNTT trong đờời i

c CNTT vàà ứứng dng dụụng CNTT trong đ n nay c phòng…… hihiệện nay

i, quốốc phòng

ssốống, kinh t

, xã hộội, qu ng, kinh tếế, xã h (cid:86)(cid:86) KhKhốối lưi lượợng dng dữữ liliệệu thu th

u thu thậập, xp, xửử lý, khai th

lý, khai tháác vc vàà lưu tr

ch luỹỹ lưu trữữ ngngàày cy cààng tng tíích lu

ý nghĩĩa sa sửử ddụụng ng

nhinhiềều lênu lên Tuy nhiên, chỉỉ ccóó khokhoảảng tng từừ 5 5% % đđếến 1n 10% 0% lưlượợng dng dữữ liliệệu cu cóó ý ngh (cid:86)(cid:86) Tuy nhiên, ch ng kê theo thốống kê theo th (cid:86)(cid:86) RRấất nhi

u chưa đượợc sc sửử ddụụng hi

ng hiệệu quu quảả nhưng v

nhưng vẫẫn phn phảải ti

i lo sợợ bbỏỏ ssóót dt dữữ liliệệu quan tr nh tranh, nhu cầầu cu cóó nhinhiềều thông tin v

(cid:86)(cid:86) Trong môi trư

c thu i tiếếp tp tụục thu u quan trọọng cng cóó ththểể ccầần đn đếến sau n n sau nàày)y) nhanh u thông tin vớới ti tốốc đc độộ nhanh nh chấất đt địịnh nh u câu hỏỏi mang t

i mang tíính ch

p ra quyếết đt địịnh vnh vàà ngngàày cy cààng cng cóó nhinhiềều câu h

t nhiềều du dữữ liliệệu chưa đư ththậập rp rấất tt tốốn kn kéém (nm (nỗỗi lo s Trong môi trườờng cng cạạnh tranh, nhu c đđểể trtrợợ gigiúúp ra quy ttíính cnh cầần phn phảải tri trảả llờời di dựựa trên m

a trên mộột kht khốối lưi lượợng dng dữữ liliệệu khu khổổng lng lồồ đã c

đã cóó

khai tháác cơ s

c cơ sởở ddữữ liliệệu truy

u truyềền thn thốống ng

ng ngàày cy cààng ng

(cid:86)(cid:86) CCáác phương ph

c phương phááp qup quảản trn trịị vvàà khai th ng đượợc thc thựực tc tếế

không đááp p ứứng đư không đ ra đờời ki kỹỹ thuthuậật t ““PhPháát hi (cid:97)(cid:97) SSựự ra đ

t hiệện tri th

n tri thứức vc vàà khai ph

khai pháá ddữữ liliệệuu””

48/48/5757

TTìình hnh hìình nghiên c

nh nghiên cứứu PHTT v

u PHTT vàà

KPDL KPDL

(cid:97)(cid:97) ThuThuậật ngt ngữữ ::

(cid:86)(cid:86) PhPháát hi

(cid:86)(cid:86) Khai ph

t hiệện tri th c (Knowledge Discovery) n tri thứức (Knowledge Discovery)

đang đượợc nghiên c

ng trong nhiềều lu lĩĩnh nh

(cid:97)(cid:97) Đã vĐã vàà đang đư vvựực khc kháác nhau

c nhau ởở ccáác nưc nướớc trên th

c nghiên cứứu, u, ứứng dng dụụng trong nhi c trên thếế gigiớớii

(cid:97)(cid:97) TTạại Vi

t Nam : i Việệt Nam :

(cid:86)(cid:86) KKỹỹ thuthuậật nt nàày vy vẫẫn còn tương đ

n còn tương đốối mi mớới mi mẻẻ

(cid:86)(cid:86) Đang đư

Đang đượợc nghiên c

c nghiên cứứu u

(cid:86)(cid:86) Đang d

Đang dầần đưa v

n đưa vàào o ứứng dng dụụng th

ng thựực tic tiễễnn

u (Data Mining) Khai pháá ddữữ liliệệu (Data Mining)

49/49/5757

KhKháái ni

i niệệm m ““Khai ph

Khai pháá

ddữữ

liliệệuu””

(cid:97)(cid:97) Khai ph

nh tríích xu

n bên c thông tin cóó gigiáá trtrịị titiềềm m ẩẩn bên

c lưu trữữ trong c

c CSDL, trong cáác CSDL,

(Data Mining) : Khai pháá ddữữ liliệệu u (Data Mining) : ququáá trtrìình tr ch xuấất ct cáác thông tin c trong lượợng lng lớớn dn dữữ liliệệu đưu đượợc lưu tr trong lư kho dữữ liliệệuu…… kho d (cid:97)(cid:97) HiHiệện nay, ngo

i thuậật ngt ngữữ khai ph

n nay, ngoàài thu

i ta còn khai pháá ddữữ liliệệuu, n, ngưgườời ta còn

ý nghĩĩa tương t

a tương tựự như như ::

ddùùng mng mộột st sốố thuthuậật ngt ngữữ khkháác cc cóó ý ngh CSDL tri thứức tc từừ CSDL Khai pháá tri th (cid:86)(cid:86) Khai ph (Knowlegde Mining From Databases) (Knowlegde Mining From Databases) u (Knowlegde Extraction) (cid:86)(cid:86) TrTríích lch lọọc dc dữữ liliệệu (Knowlegde Extraction)

u (Data/Pattern Analysis) Phân tíích dch dữữ liliệệu/mu/mẫẫu (Data/Pattern Analysis)

(cid:86)(cid:86) Phân t (cid:86)(cid:86) KhKhảảo co cổổ ddữữ liliệệu (Data Archaeology) u (Data Archaeology) u (Data Dredging) (cid:86)(cid:86) NNạạo vo véét dt dữữ liliệệu (Data Dredging)

50/50/5757

Qui trìình 5 Qui tr

nh 5 bưbướớc PHTT v

c PHTT vàà

1.1.

KPDL KPDL p khai pháá

c phương phááp khai ph

ddữữ

liliệệu thu thíích ch

liliệệuu

nh thàành bnh bàài toi toáánn hhìình th nh cho phéép chp chọọn cn cáác phương ph

bbảản chn chấất ct củủa da dữữ lý dlý dữữ

ng nhiềều thu thờời gian trong to

i gian trong toààn bn bộộ

qui trìình nh qui tr

2.2. TTììm him hiểểu lu lĩĩnh vnh vựực c ứứng dng dụụng vng vàà Đây lĐây làà bư bướớc quy c quyếết đt địịnh cho ph hhợợp vp vớới mi mụục đc đíích ch ứứng dng dụụng vng vàà xxửử Thu thậập vp vàà Thu th lý thô (hay tiềền xn xửử lý thô (hay ti liliệệu)u)

ng chiếếm dm dụụng nhi u, hay nóói ci cáách kh

p thông minh sẽẽ đư đượợc c ááp p

trong đóó

ch xuấất ra c

3.3. c mô ch ra cáác mc mẫẫu vu vàà/ho/hoặặc cc cáác mô trtríích ra c ch kháác lc làà

c phương phááp thông minh s ccáác phương ph hay tri thứức hc hữữu u ííchch hay tri th :: llààm sm sááng tng tỏỏ

ccáác mô t

c mô tảả

vvàà

ddựự đo đoáán, n, đđáánh nh

n tri thứức dc dựựa va vàào mo mộột st sốố

phphéép đop đo

4.4.

5.5.

trtrựực quan ho

ddữữ

liliệệu đu đểể

bibiểểu diu diễễn tri th

n tri thứức c

nh diễễn dn dữữ ddụụng cng cáác kc kĩĩ

nh diễễn vn vàà ddụụngng

BưBướớc nc nàày thư y thườờng chi Khai pháá ddữữ liliệệu, hay n Khai ph hhìình nh ẩẩn dưn dướới ci cáác dc dữữ liliệệuu giai đoạạn thi Đây Đây llàà giai đo n thiếết yt yếếu, u, trong đ liliệệuu trtríích xu t ra cáác mc mẫẫu du dữữ ddụụng đng đểể u (pattern evaluation) mmẫẫu (pattern evaluation) nh giáá ĐĐáánh gi c đã tììm đưm đượợc,c, đ đặặc bic biệệt lt làà HiHiểểu tri th u tri thứức đã t hhữữu u íích cch củủa ca cáác mc mẫẫu biu biểểu diu diễễn tri th ssựự gigiáá TrTrìình di ssửử khai pháá đư đượợc cho ngư khai ph

liliệệu (knowlegde presentation): u (knowlegde presentation): c quan hoáá thuthuậật trt trìình di c cho ngườời si sửử

51/51/5757

XXửử

lý thô dữữ lý thô d

liliệệuu

u (data cleaning) ::

loloạại bi bỏỏ

u không thíích hch hợợpp

liliệệu không th u (data integration) ::

(cid:97)(cid:97) LLààm sm sạạch dch dữữ liliệệu (data cleaning) nhinhiễễu hou hoặặc cc cáác dc dữữ (cid:97)(cid:97) TTíích hch hợợp dp dữữ liliệệu (data integration) liliệệu tu từừ

c nhau như c nguồồn khn kháác nhau như

ttíích hch hợợp dp dữữ CSDL, Kho dữữ CSDL, Kho d

:: i văn bảản khn kháác nhau

c nhau......

ccáác ngu liliệệu, u, ccáác loc loạại văn b u (data selection) ::

(cid:97)(cid:97) ChChọọn dn dữữ liliệệu (data selection)

y, nhữững dng dữữ

liliệệu liên quan tr

n nhiệệm vm vụụ

ssẽẽ

c thu thậập tp từừ

ởở bư bướớc nc nàày, nh đưđượợc thu th

liliệệu ban đ

c nguồồn dn dữữ

u liên quan trựực tic tiếếp đp đếến nhi ccáác ngu u ban đầầuu u (data transformation) :: (cid:97)(cid:97) ChuyChuyểển đn đổổi di dữữ liliệệu (data transformation) liliệệu su sẽẽ đư đượợc chuy

c chuyểển đn đổổi vi vềề

hhợợp p

bbằằng cng cáách th

ch thựực hic hiệện cn cáác thao t

ng phùù ddạạng ph c thao táác nhc nhóóm hom hoặặc c

c khai pháá

trong bướớc nc nàày, dy, dữữ trong bư cho việệc khai ph cho vi ttậập hp hợợpp

52/52/5757

Qui trìình PHTT v Qui tr

nh PHTT vàà

KPDL KPDL

(cid:97)(cid:97) CCáác bưc bướớc trong quy tr

(cid:97)(cid:97) KKếết qut quảả thu đư

c trong quy trìình cnh cóó ththểể llặặp đi l p đi lặặp lp lạại mi mộột st sốố llầầnn

thu đượợc cc cóó ththểể đư đượợc lc lấấy trung b y trung bìình tnh từừ ssốố llầần thn thựực hic hiệệnn

53/53/5757

CCáác phương ph

c phương phááp PHTT v

p PHTT vàà

KPDL KPDL

(cid:97)(cid:97) NhNhằằm hai m

m hai mụục đc đíích ch

ch chíính :nh :

n (Prediction) (cid:86)(cid:86) DDựự đo đoáán (Prediction)

p sau : c phương phááp sau :

(cid:86)(cid:86) Phân lo

(Description) (cid:86)(cid:86) Mô tMô tảả (Description) (cid:97)(cid:97) ThưThườờng sng sửử ddụụng cng cáác phương ph

i (Classification) Phân loạại (Classification)

(cid:86)(cid:86) Phân nh

i qui (Regression) (cid:86)(cid:86) HHồồi qui (Regression)

m (Clustering) Phân nhóóm (Clustering)

(cid:86)(cid:86) Mô hMô hìình rnh rààng bu

p (Summarization) (cid:86)(cid:86) TTổổng hng hợợp (Summarization)

c (Dependency modeling) ng buộộc (Dependency modeling)

(cid:86)(cid:86) BiBiểểu diu diễễn mô h

ch (Change and Deviation Dectection) (cid:86)(cid:86) Dò tDò tììm bim biếến đn đổổi vi vàà đ độộ llệệch (Change and Deviation Dectection)

(cid:86)(cid:86) KiKiểểm đm địịnh mô h

nh (Model Representation) n mô hìình (Model Representation)

(cid:86)(cid:86) Phương ph

odel Evaluation) nh mô hìình (Mnh (Model Evaluation)

m (Search Method) Phương phááp tp tììm kim kiếếm (Search Method)

54/54/5757

CCáác lc lĩĩnh vnh vựực liên quan đ

c liên quan đếến PHTT v

n PHTT vàà

KPDL KPDL

(cid:97)(cid:97) PHTT v

KPD liên quan đếến nhi

n nhiềều ngu ngàành, nhi

nh, nhiềều lu lĩĩnh vnh vựực :c :

PHTT vàà KPD liên quan đ ng kê (cid:86)(cid:86) ThThốống kê

(cid:86)(cid:86) TrTríí tutuệệ nhân t

(cid:86)(cid:86) Cơ sCơ sởở ddữữ liliệệuu

(cid:86)(cid:86) ThuThuậật tot toáán hn họọcc

(cid:86)(cid:86) TTíính to

nhân tạạoo

(cid:86)(cid:86) Thu th

nh toáán song song v n song song vàà ttốốc đc độộ caocao

Thu thậập tri th p tri thứức cho c chuyên gia c cho cáác hc hệệ chuyên gia

(cid:97)(cid:97) PHTT v

KPD rấất gt gầần gn gũũi vi vớới ci cáác lc lĩĩnh vnh vựực :c : c phương phááp thp thốống kê đ

Quan sáát dt dữữ liliệệu... u...

(cid:86)(cid:86) Quan s PHTT vàà KPD r (cid:86)(cid:86) ThThốống kê, s vvàà phpháát hi

ng kê, sửử ddụụng cng cáác phương ph ng kê đểể mô hmô hìình dnh dữữ liliệệu u

t hiệện cn cáác mc mẫẫu, luu, luậật...t...

u (Data Warehousing) vàà ccáác công c c công cụụ phân t phân tíích ch

Ngân hààng dng dữữ liliệệu (Data Warehousing) v (cid:86)(cid:86) Ngân h trtrựực tuy n (OLAP) c tuyếến (OLAP)

55/55/5757

ỨỨng dng dụụng PHTT v

ng PHTT vàà

KPDL KPDL

(cid:97)(cid:97) Thông tin thương m

u marketing, kháách hch hààngng

Thông tin thương mạại :i : (cid:86)(cid:86) Phân t

(cid:86)(cid:86) Phân t

Phân tíích dch dữữ liliệệu marketing, kh Phân tíích đch đầầu tưu tư t cho vay vốốnn Phê duyệệt cho vay v n gian lậậnn…… t hiệện gian l

u khiểển vn vàà llậập lp lịịch tr

ch trììnhnh

(cid:86)(cid:86) Phê duy (cid:86)(cid:86) PhPháát hi Thông tin kỹỹ thuthuậật :t : (cid:97)(cid:97) Thông tin k (cid:86)(cid:86) ĐiĐiềều khi (cid:86)(cid:86) QuQuảản trn trịị mmạạngng

Phân tíích cch cáác kc kếết qut quảả ththíí nghi

nghiệệmm……

(cid:97)(cid:97) Thông tin khoa h

(cid:86)(cid:86) Phân t Thông tin khoa họọcc nhân... Thông tin cáá nhân...

(cid:97)(cid:97) Thông tin c

56/56/5757

CCáác thc tháách th

ch thứức cc củủa PHTT v

a PHTT vàà

KPDL KPDL

c CSDL thườờng rng rấất lt lớớn, n, thưthườờng xuyên bi

ng xuyên biếến đn đổổii

t triểển không ng

n không ngừừngng

(cid:97)(cid:97) CCáác CSDL thư vvàà phpháát tri c điểểm :m :

(cid:97)(cid:97) ĐĐặặc đi

(cid:86)(cid:86) CCáác CSDL thư

c CSDL thườờng cng cóó ssốố chichiềều lu lớớn n

tri thứức cc cóó ththểể llààm cho c

m cho cáác mc mẫẫu đã ph

u đã pháát t

(cid:86)(cid:86) Thay đ

Thay đổổi di dữữ liliệệu vu vàà tri th n không còn phùù hhợợpp hihiệện không còn ph (cid:86)(cid:86) DDữữ liliệệu bu bịị thithiếếu hou hoặặc nhi

c nhiễễuu

Quan hệệ gigiữữa ca cáác trưc trườờng dng dữữ liliệệu phu phứức tc tạạpp

(cid:86)(cid:86) Quan h (cid:97)(cid:97) VVấấn đn đềề giao ti

i ngườời si sửử ddụụngng

giao tiếếp vp vớới ngư vvàà kkếết ht hợợp vp vớới ci cáác tri th

c tri thứức đã c

c đã cóó

(cid:97)(cid:97) KhKhảả năng t

năng tíích hch hợợp vp vớới ci cáác hc hệệ ththốống kh

ng kháác...c...

57/57/5757