
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Ngô Quang Hiểu
PHÂN TÍCH VÀ TRỰC QUAN HÓA CHUỖI SỰ KIỆN
DẠNG HỆ THỐNG LIFEFLOW
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
HÀ NỘI - 2013
Ộ

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Ngô Quang Hiểu
PHÂN TÍCH VÀ TRỰC QUAN HÓA CHUỖI SỰ KIỆN
DẠNG HỆ THỐNG LIFEFLOW
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
Cán bộ hướng dẫn: PGS.TS Hà Quang Thụy
Cán bộ đồng hướng dẫn: ThS. Vũ Ngọc Trình

i
Lời cảm ơn
Trước tiên, tôi xin gửi lời cảm ơn chân thành và sâu sắc nhất đến PGS.TS Hà
Quang Thụy, ThS. Vũ Tiến Trình, những người đã tận tình hướng dẫn, chỉ bảo tôi trong
suốt quá trình thực hiện khóa luận tốt nghiệp.
Tôi xin cảm ơn các thầy cô và cán bộ của trường Đại học Công Nghệ đã dạy bảo
cũng như tạo điều kiện cho tôi học tập và nghiên cứu tại đây.
Tôi cũng xin cảm ơn các anh chị, các bạn trong phòng thí nghiệm công nghệ tri
thức KT-Lab đã giúp đỡ tôi rất nhiều trong việc hỗ trợ các vấn đề chuyên môn trong học
tập và trong quá trình thực hiện khóa luận.
Tôi xin gửi lời cảm ơn đến các bạn trong lớp K54CD đã ủng hộ, khích lệ, giúp đỡ
tôi rất nhiều trong quá trình học tập và rèn luyện tại trường.
Cuối cùng, tôi muốn gửi lời biết ơn vô hạn tới gia đình, bạn bè, người thân, đặc
biệt là bố mẹ và em gái tôi, những người luôn dành cho tôi sự yêu thương, tin tưởng, luôn
sát cánh bên tôi, hỗ trợ về mọi mặt, khuyến khích và ủng hộ để tôi có thể vượt qua những
khó khăn và đạt được những thành công trong học tập và cuộc sống.
Tôi xin chân thành cảm ơn!
Hà Nội, ngày 10 tháng 5 năm 2013
Sinh viên
Ngô Quang Hiểu

ii
TÓM TẮT NỘI DUNG
Phân tích và trích chọn chuỗi sự kiện là quá trình trích chọn thông tin trong các
văn bản có chứa sự kiện, nhóm các văn bản cùng nói về một sự kiện thành chuỗi theo thứ
tự thời gian. Đây là một bài toán có tính ứng dụng thực tiễn cao nên nó đã và đang nhận
được sự quan tâm nghiên cứu của nhiều nhà khoa học, chẳng hạn tại các hội nghị khoa
học quốc tế có uy tín như MUC (Message Understand Conference), chương trình TDT
(Topic Detection Tracking), chương trình ACE (Automatic Content Extraction), tại các
trung tâm nghiên cứu IBM, Microsoft…
Đi cùng với bài toán trích chọn chuỗi sự kiện là việc trực quan hóa các chuỗi sự
kiện trích chọn được. LifeFlow là một hệ thống trực quan hóa chuỗi sự kiện do Guerra-
Gómez J. và cộng sự (Đại học Maryland) nghiên cứu phát triển [1]. Hệ thống cho phép
biểu diễn theo thời gian, thống kê, và theo vết các chuỗi sự kiện rất hiệu quả.
Khóa luận tốt nghiệp với đề tài “Phân tích và trực quan hóa chuỗi sự kiện dạng hệ
thống LifeFlow” nghiên cứu các vấn đề liên quan đến phân tích và trích chọn chuỗi sự
kiện đồng thời thực hiện trực quan hóa các chuỗi sự kiện này. Khóa luận trình bày một
số hướng tiếp cận để giải quyết bài toán phân tích và trích chọn chuỗi sự kiện, sau đó, đề
xuất một phương pháp nhằm trích chọn chuỗi sự kiện áp dụng trên miền tin tức tiếng
Việt. Phần cuối của khóa luận mô tả quá trình thực nghiệm với phương pháp đánh giá độ
tương đồng kết hợp thông tin thời gian, địa điểm sau đó trực quan hóa bằng hệ thống
LifeFlow.
Từ khóa: chuỗi sự kiện, trích chọn chuỗi sự kiện, nhận dạng chuỗi sự kiện, phân tích
chuỗi sự kiện, trực quan hóa chuỗi sự kiện

iii
Lời cam đoan
Tôi xin cam đoan rằng, khóa luận tốt nghiệp với đề tài “Phân tích và trực quan
hóa chuỗi sự kiện dạng hệ thống LifeFlow” là công trình nghiên cứu của mình với sự
giúp đỡ của giảng viên hướng dẫn là PGS.TS. Hà Quang Thụy. Các nội dung và kết quả
trong khóa luận này hoàn toàn là trung thực, được viết lại theo cách hiểu của bản thân sau
quá trình nghiên cứu, thực nghiệm, không hề sao chép từ bất kì nguồn có sẵn nào. Tất cả
các tài liệu tham khảo liên quan đều được trích dẫn trong danh sách các tài liệu tham khảo
của khóa luận.
Nếu phát hiện có bất kì sự gian lận nào, tôi xin hoàn toàn chịu trách nhiệm trước
hội đồng, cũng như kết quả khóa luận tốt nghiệp của mình.
Hà Nội, ngày 10 tháng 5 năm 2013
Sinh viên
Ngô Quang Hiểu

