ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br />
***<br />
<br />
TRẦN THANH TÙNG<br />
<br />
TỰ ĐỘNG PHÂN TÍCH CÁC NỘI DUNG<br />
GIỐNG NHAU TRONG HỆ THỐNG TỔNG HỢP<br />
Ý KIẾN GÓP Ý TRONG HỘI NGHỊ<br />
<br />
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN<br />
<br />
HÀ NỘI - 2016<br />
<br />
ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
TRẦN THANH TÙNG<br />
<br />
TỰ ĐỘNG PHÂN TÍCH CÁC NỘI DUNG<br />
GIỐNG NHAU TRONG HỆ THỐNG TỔNG HỢP<br />
Ý KIẾN GÓP Ý TRONG HỘI NGHỊ<br />
Ngành: Công nghệ thông tin<br />
Chuyên ngành: Hệ thống thông tin<br />
Mã số: 60480104<br />
<br />
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN<br />
<br />
Người hướng dẫn khoa học<br />
Cán bộ hướng dẫn chính: TS. Bùi Quang Hưng<br />
Cán bộ hướng dẫn phụ: PGS.TS. Vũ Duy Lợi<br />
<br />
HÀ NỘI - 2016<br />
<br />
LỜI CAM ĐOAN<br />
<br />
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm nghiên<br />
cứu, tìm hiểu của riêng cá nhân tôi. Trong toàn bộ nội dung của luận văn,<br />
những điều được trình bày hoặc là của cá nhân tôi hoặc là được tổng hợp<br />
từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có xuất xứ rõ<br />
ràng và được trích dẫn hợp pháp.<br />
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo<br />
quy định cho lời cam đoan của mình.<br />
<br />
Hà Nội, ngày 26 tháng 10 năm 2016<br />
Ngƣời cam đoan<br />
<br />
Trần Thanh Tùng<br />
<br />
4<br />
<br />
LỜI CẢM ƠN<br />
<br />
Tôi xin chân thành cảm ơn PGS.TS. Vũ Duy Lợi, chuyên viên cao cấp Văn<br />
phòng Trung ương Đảng và TS. Bùi Quang Hưng, giảng viên trường Đại học<br />
Công nghệ, Đại học Quốc gia Hà Nội đã tận tình giúp đỡ tôi về chuyên môn,<br />
định hướng phát triển trong suốt quá trình làm luận văn.<br />
Tôi xin gửi lời cám ơn tới các Thầy, Cô giáo của Khoa Công nghệ thông<br />
tin, vì đã truyền dạy những kiến thức bổ ích, hiện đại về lĩnh vực Hệ thống<br />
thông tin. Tôi đã được tiếp cận một môi trường học thuật cao, hiểu được sự vất<br />
vả cũng như thành quả đạt được khi tham gia nghiên cứu khoa học.<br />
Tôi xin cảm ơn các bạn trong nhóm Data Mining thuộc Trung tâm Công<br />
nghệ tích hợp liên ngành giám sát hiện trường (FIMO center), Đại học Công<br />
nghệ Hà Nội, TS. Nguyễn Việt Anh và Nhóm Giải pháp dữ liệu, Viện Công<br />
nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam.<br />
Cuối cùng, với gia đình, tôi xin gửi lời biết ơn sâu sắc vì gia đình đã luôn ở<br />
bên cạnh tôi, mang lại cho tôi nguồn động viên tinh thần to lớn và tạo mọi điều<br />
kiện thuận lợi cho tôi trong quá trình học tập và hoàn thành luận văn này.<br />
Mặc dù đã rất cố gắng nhưng luận văn sẽ không tránh khỏi những thiếu sót.<br />
Rất mong nhận được ý kiến đóng góp quý báu của Thầy, Cô giáo và các bạn để<br />
luận văn được hoàn thiện hơn.<br />
Xin trân trọng cảm ơn!<br />
<br />
5<br />
<br />
MỤC LỤC<br />
LỜI CAM ĐOAN ............................................................................................................ 3<br />
LỜI CẢM ƠN .................................................................................................................. 4<br />
MỤC LỤC ....................................................................................................................... 5<br />
BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................................................ 7<br />
DANH MỤC CÁC HÌNH VẼ ......................................................................................... 8<br />
MỞ ĐẦU ....................................................................................................................... 10<br />
CHƢƠNG 1: BÀI TOÁN TỔNG HỢP Ý KIẾN GÓP Ý TRONG HỘI NGHỊ .......... 14<br />
1. Tổng quan về bài toán tổng hợp ý kiến góp ý trong Hội nghị.............................. 14<br />
2. Giới thiệu phần mềm Hỗ trợ tổng hợp ý kiến thảo luận tổ tại Hội nghị Trung<br />
ƣơng ........................................................................................................................... 15<br />
2.1. Quy trình tổng hợp ý kiến thảo luận .............................................................. 16<br />
2.2. Phần mềm Hỗ trợ tổng hợp ý kiến thảo luận Tổ ........................................... 19<br />
3. Xác định bài toán cần giải quyết .....................................................................23<br />
CHƢƠNG 2: CÁC PHƢƠNG PHÁP TÍNH ĐỘ TƢƠNG ĐỒNG CÂU ............... 25<br />
1. Khái niệm độ tƣơng đồng câu ..........................................................................25<br />
2. Các phƣơng pháp tính độ tƣơng đồng câu .....................................................25<br />
2.1. Phương pháp tính độ tương đồng câu dựa vào WordNet .............................. 25<br />
2.2. Phương pháp tính độ tương đồng câu dựa vào Wikipedia ............................ 30<br />
2.3. Phương pháp tính độ tương đồng câu dựa vào chủ đề ẩn (Latent Dirichlet<br />
Allocation) ..................................................................................................................... 34<br />
2.4. Phương pháp tính độ tương đồng dựa vào phân tích ngữ nghĩa tiềm ẩn<br />
(Latent Semantic Analysis) ............................................................................................ 37<br />
3. Đánh giá và lựa chọn phƣơng pháp ................................................................ 45<br />
<br />