ĐẠI HC QUC GIA HÀ NI
TRƢỜNG ĐẠI HC CÔNG NGH
Phạm Huy Thành
CÁC ĐỘ ĐO TRONG PHÂN CỤM VÀ ÁP DỤNG
VÀO PHÁT HIỆN MÔ HÌNH TỔ CHỨC
TRONG KHAI PHÁ QUÁ TRÌNH
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HCHÍNH QUY
Nnh:ng nghệ thông tin
Hà Nội - 2014
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGH
Phạm Huy Thành
CÁC ĐỘ ĐO TRONG PHÂN CỤM VÀ ÁP DỤNG
VÀO PHÁT HIỆN MÔ HÌNH TỔ CHỨC
TRONG KHAI PHÁ QUÁ TRÌNH
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HCHÍNH QUY
Nnh: Công nghệ thông tin
n bộ ng dn: PGS. TS. Hà Quang Thụy
Cán bộ đồng hƣớng dẫn: ThS. Lê Hoàng Quỳnh
Hà Nội - 2014
VIETNAM NATIONAL UNIVERSITY, HANOI
UNIVERSITY OF ENGINEERING AND TECHNOLOGY
Huy Thanh Pham
EVALUATION MEASURES FOR CLUSTERING
AND USING TO DISCOVER ORGANIZATIONAL
MODEL IN PROCESS MINING
Major: InformationTechnology
Supervisor: Assoc. Prof. Quang Thuy Ha
Co-Supervisor: Master. Hoang Quynh Le
HA NOI - 2014
LỜI CẢM ƠN
Trước tiên, tôi xin y t lòng biết ơn chân thành sâu sc nht ti Thy giáo
PGS. TS. Quang Thy ThS. Hoàng Qunh, những người đã tn tình ch bo,
hướng dẫn, động viên và giúp đ tôi trong sut quá trình thc hiện đề tài khóa lun.
Tôi xin gi li cm ơn sâu sc ti các thy cô trong Khoa Công nghthông tin đã
truyền đạt kiến thc quý báu cho tôi trong suốt bn năm vừa qua, những kiến thức tôi
nhận được trên giảng đường sẽ hành trang quan trọng giúp tôi vững bước trong tương
lai.
Tôi cũng xin gi li cm ơn ti các thy cô, các anh ch, các bn các em sinh
viên trong phòng thí nghim KT-Sis lab đã giúp tôi rt nhiu trong vic h tr kiến thc
chuyên môn để hoàn thành tt nghip khóa lun.
Tôi gửi lời cảm ơn tới tập thể lớp K55CD K55CLC đã ủng hộ, khích lệ luôn
sát cánh bên tôi trong suốt quá trình học tập và rèn luyện tại trường.
Cui cùng,tôi muốn gi lời cảm ơn sâu sắc tới bạn , người thân đặc biệt cha
mẹ và em gái tôi, những nời luôn ng hộ con đường tôi đã lựa chọn, gp đvà động
viên tôi vượt qua những khó khăn trong cuộc sống.
Tôi xin chân thành cm ơn!
Hà Nội, ngày 13 tháng 05 năm 2014
Sinh viên
Phạm Huy Thành
TÓM TẮT
Theo W.M.P Van der Aalst, 2011 [10], khai phá quá trình trong những năm gần đây đang
nổi lên như một lĩnh vực khoa học mới tập trung vào việc phân ch các qtrình bằng việc sử
dụng dữ liệu sự kiện. Lĩnh vựcy đang thu hút được sự quan tâm từ rất nhiều các nhà khoa học
trên thế giới. Tuy nhiên hầu hết những tiếp cận này mới chỉ quan tâm tập trung vào việc phát
hiện khía cạnh luồng điều khiển mà bỏ qua một số khía cạnh quan trọng khác trong đó nổi bật
khía cạnh tổ chức [9]. Một trong những bài toán quan trọng trong khai phá khía cạnh tổ chức
bài toán phát hiện mô hình tổ chức.
Dựa trên quá trình tìm hiểu một số nghiên cứu về việc phát hiện hình tổ chức [4, 9, 10,
12], kết hợp với việc tìm hiểu một số thuật toán phân cụm quan trọng các phương pháp đánh
giá phân cụm [1, 2, 5, 6, 7, 8], khóa luận trình bày về các độ đo trong phân cụm việc áp dụng
chúng vào bài toán phát hiện hình tổ chức trong khai phá quá trình. Đồng thời, khóa luận
cũng đưa ra mô hình giải quyết bài toán với một số độ đo phân cụm được đề cập và tiến hành cài
đặt thực nghiệm trên bộ dữ liệu mẫu từ ProM. Kết quả thực nghiệm cho thấy nh tổ chức
ứng với giá trị K = 8 phù hợp nhất. Khi đó giá trị các độ đo Silhouette, Dunn, Modularity
CPLw đạt giá tr tương ứng là 0.84327, 1.90155, 0.010750.04619.
Từ khóa: Khai phá quá trình, phát hiện mô hình tổ chức, độ đo chất lượng phân cụm