Hà Ni 2020
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-------------------------------
Bùi Thị Hồng Nhung
KỸ THUẬT KHAI PHÁ MẪU DẪY VÀ MẪU THỨ TỰ
BỘ PHẬN TRONG KHAI PHÁ QUY TRÌNH
Chuyên ngành: Hệ thống Thông tin
Mã số: 9480104.01
TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN
2
Công trình được hoàn thành tại: Trưng Đại hc Công ngh,
Đại hc Quc gia Hà Ni
Ngưi hướng dẫn khoa hc: PGS.TS. Nguyễn Trí Thành
PGS.TS. Nguyễn Cẩm Tú
Phản biện: PGS.TS. Đỗ Trung Tuấn
Phản biện: PGS.TS. Nguyễn Long Giang
Luận án sẽ được bảo vệ trước Hi đồng cấp Đại hc Quốc gia
chấm luận án tiến sĩ hp tại ...................................................................
vào hồi gi ngày tháng năm 2020.
Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện, Đại hc Quốc gia Hà Ni
1
M đầu
D liệu đã được chng minh là tài nguyên mi và quan trng
trong nn công nghiệp tương lai, đặc bit là nn công nghip
4.0. Vic khai thác các d liệu đã trở thành mt khâu tác
động đến li thế cnh tranh ca doanh nghip. Các h thng
thông tin hiện đại ngày nay đã đang tích lũy được mt
ng d liu khng l v các quá trình thc hin nghip v
trên nhiu miền lĩnh vực khác nhau. Nhng d liu v các s
kin xy ra trong quá trình thc hin ca h thống được thu
thập u trữ trong c tp d liu nht s kin. Khai phá
quy trình (process mining) lĩnh vc cho phép s dng d
liu nht ký s ki n để phân tích và ci tiến các quy trình.
hai yếu t chính làm cho khai phá quy trình ngày càng nhn
đưc nhiu s quan tâm ca các hc gi trong lĩnh vực hàn
lâm ng dng. Th nht, ngày càng nhiu d liu s
kiện được ghi nhn li trong các h thống thông ti n (như
Hoạch định ngun lc doanh nghip - ERP; Qun lung
công vic - WFM; Qun lý quan h khách hàng - CRM; Qun lý
chui cung ng - SCM; Qun d liu sn phm PDM…)
giúp cung cp tốt hơn các thông tin chi tiết v quy trình thc
tế. Th hai, xut hin ngày càng nhiu các yêu cầu đặt ra đối
vi các nhà qun v cách các quy trình ca h hoạt động
trong thế gii thc nhm h tr ci tiến các quy trình
nghip v trong môi trường kinh doanh tính cnh tranh
cao vi nhiều thay đổi nhanh chóng. Trong qun lý quy trình
nghip v (BPM) các nhà quản lý đã và đang được h tr bi
các công c kinh doanh thông minh (BI), nhưng chúng chưa
đáp ứng được k vng ca các nhà quản lý trong môi trường
kinh doanh hin nay. Trng tâm ca BI là truy vn và báo cáo
các thông tin tng hp ca doanh nghiệp dưới dng bảng điều
khin (dashboard) s dng các k thut trực quan đơn giản
thay hiu biết sâu sc v bn cht thc s ca quy trình khi
được đưa vào thc thi trong thc tế. Mt s h thống đã hỗ
tr kh năng khai phá d liu (Data mining) hoc h tr x
phân tích trc tuyến (Online Analytical Processing - OLAP)
th xem d liệu đa chiều t các góc nhìn khác nhau
2
th tng hp d liệu để to báo cáo c p cao đồng thi có th
đi sâu vào dữ liệu để tìm thông tin chi tiết. Nhưng chúng thiếu
kh năng cung cấp cái nhìn v nguyên nhân gc ca s không
hiu qu hoc sai sót của quy trình. Khai phá quy trình đưc
xây dng da trên tiếp cn gia hc máy và khai phá d liu
vi mô hình hóa và phân tích quy trình, cùng vi s kết hp
cht ch các k thut, công c phương pháp riêng nhằm
thu nhn tri thc t tp nht ký s kin mô t các bước thc
hin thc tế ca các quy trình nghip v trong các h thng
thông tin hin thời để phân tích quy trình, phát hin nhng
vấn đề sai lch t đó đ xuất điều chnh, thiết kế li quy trình
một cách chính xác hơn mang lại hiu qu công tác cao hơn.
Khai phá quy trình th đưc nhúng vào các công c BI để
cung cp cái nhìn sâu sc v ng nghĩa hoạt động thc s ca
các quy trình kinh doanh, góp phn thi s sng o các
hình quy trình tĩnh với lưng d liu s kin khng lồ. Do đó,
các xu hướng quản lý liên quan đến ci tiến quy trình hay to
ra các quy trình thông minh th đưc gii quyết bi khai
phá quy trình. Vi nhng li ích mà mang li, khai phá quy
trình đang trở thành mt trong những hướng nghiên cu thu
hút được s quan tâm ca các nhà nghiên cứu trong lĩnh vực
qun lý quy trình nghip v khoa hc máy tính. Hin nay,
khai phá quy trình đã được áp dng trong các h thng BPM
thương mại khác nhau.
Ti Việt Nam cũng không nằm ngoài xu hướng phát trin
ca thế gii, ca󰈖 i tie󰈘 n quy trinh nghie 󰈨p vu󰈨 nha󰈢 m ru t nga󰈠 n thơ i
gian hoa n tha nh di󰈨ch vu󰈨 công la mo 󰈨t mu󰈨 c tiêu đươ󰈨 c đa 󰈨t ra
trong bo󰈘 n nghi󰈨 quye󰈘 t cu󰈖 a Chinh phu󰈖 ve󰈚 ci thiện môi trường
kinh doanh, nâng cao năng lực cnh tranh quc gia trong bo󰈘 n
năm vư a qua. Như va 󰈨y, vie 󰈨c nghiên cư u va trie󰈜 n khai ve󰈚 khai
pha quy trinh không chi󰈖 phu hơ󰈨 p vơ i xu the󰈘 nghiên cư u trie󰈜 n
khai ve󰈚 khai pha quy trinh trên the󰈘 giơ i ma co n phu hơ󰈨 p vơ i
chu󰈖 trương ca󰈖 i tie󰈘 n quy trinh nghie 󰈨p vu󰈨 cu󰈖 a Chinh phu󰈖 ta hie 󰈨n
nay va đây la mo 󰈨t công vie 󰈨c he󰈘 t sư c ca󰈚 n thie󰈘 t.
Mc tiêu nghiên cu: Thư nha󰈘 t, lun án cung cp mt kho
sát kha i qua t v Khai phá quy trình. Thư hai, lua 󰈨n a n đề xut
3
các phương pháp biểu din vết và phương pháp tính khoảng
cách gia các vết cp nht nhng kết qu nghiên cu hiện đại
trên thế gii nhm nâng cao hiu qu ca gii pháp phân cm
vết ci thin chất ng hình quy trình. Nghiên cư u, đề
xut thut toán phân cm vết khai thác được các đặc trưng
riêng trong lĩnh vực khai phá quy trình la mu󰈨 c tiêu thư ba cu󰈖 a
lua 󰈨n a n. Cuo󰈘 i cu ng, lun án xây dng các phn mm th
nghim thc thi ca c gii pháp biu din vết, tính khong cách
gia các vết va thua 󰈨t toa n phân cm vết đưc luận án đề xut
để kim chng tính hiu qu của các đề xuất đo .
Đối tượng nghiên cu ca lun án c phương pháp biểu
din vết, các phương pháp tính khoảng cách vết các thut
toán phân cm vết.
Phm vi nghiên cu ca lun án tp trung vào gii pháp
Phân cm vết nâng cao chất lượng hình quy trình trong
bài toán Phát hin hình quy trình vi ba vấn đề gm (i)
Các phương pháp biểu din vết; (ii) Các độ đo trong phân cụm
vết; (iii) Các thut toán phân cm vết.
Phương pháp nghiên cứu ca lun án nghiên cu
thuyết kết hp vi nghiên cu thc nghiệm để kim chng
đánh giá các đề xut ca lun án.
Chương 1. Phát hin hình quy trình trong Khai phá
quy trình và các thách thc
1.1 Khai phá quy trình-Một lĩnh vực nghiên cu mi
Khai phá quy trình là mt chuyên ngành nghiên cu mi ni,
đưc phát trin mnh m trong mt thp niên gần đây. Theo
Van der Aalst, khai phá quy trình là một lĩnh vực nghiên cu
liên kết gia hc máy khai phá d liu (machine learning
and data mining) vi hình hóa phân tích quy trình
(process modeling and analysing), nhm chiết xut các tri
thc có gtr liên quan đến quy trình nghip v (business
process) t các nht s kin (event log), b sung các
phương pháp tiếp cn qun quy trình nghip v (bussiness
process management: BPM).
1.2. Mt s khái niệm cơ bản v nht ký s kin