ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br />
***<br />
TRẦN THANH TÙNG<br />
<br />
TỰ ĐỘNG PHÂN TÍCH CÁC NỘI DUNG<br />
GIỐNG NHAU TRONG HỆ THỐNG TỔNG HỢP<br />
Ý KIẾN GÓP Ý TRONG HỘI NGHỊ<br />
<br />
TÓM TẮT LUẬN VĂN THẠC SĨ<br />
CÔNG NGHỆ THÔNG TIN<br />
<br />
HÀ NỘI - 2016<br />
<br />
1<br />
MỤC LỤC<br />
MỤC LỤC…………………………………………………………….1<br />
MỞ ĐẦU………………………………………………………………2<br />
CHƢƠNG 1: BÀI TOÁN TỔNG HỢP Ý KIẾN GÓP Ý TRONG HỘI<br />
NGHỊ……………………………………………………………………...4<br />
1. Tổng quan về bài toán tổng hợp ý kiến góp ý trong Hội nghị……4<br />
2. Giới thiệu phần mềm Hỗ trợ tổng hợp ý kiến thảo luận tổ tại Hội<br />
nghị Trung ƣơng………………………………………………………4<br />
3. Xác định bài toán cần giải quyết…………………………….6<br />
CHƢƠNG 2: CÁC PHƢƠNG PHÁP TÍNH ĐỘ TƢƠNG ĐỒNG<br />
CÂU……………………………………………………………………7<br />
1. Khái niệm độ tƣơng đồng câu………………………………..7<br />
2. Các phƣơng pháp tính độ tƣơng đồng câu………………….7<br />
3. Đánh giá và lựa chọn phƣơng pháp………………………..17<br />
CHƢƠNG 3: ĐỀ XUẤT GIẢI PHÁP PHÁT HIỆN NỘI DUNG<br />
GIỐNG NHAU TRONG HỆ THỐNG TỔNG HỢP Ý KIẾN GÓP<br />
Ý TRONG HỘI NGHỊ…………………………………………….17<br />
1. Đề xuất giải pháp phát hiện nội dung giống nhau trong phần<br />
mềm Hỗ trợ tổng hợp ý kiến thảo luận tổ………………………18<br />
2. Xử lý dữ liệu………………………………………………….18<br />
3. Thực nghiệm…………………………………………………19<br />
4. Đánh giá kết quả thực nghiệm………………………………21<br />
<br />
KẾT LUẬN………………………………………………22<br />
Tài liệu tham khảo……………………………………….23<br />
<br />
2<br />
MỞ ĐẦU<br />
1. Đặt vấn đề<br />
Trong một nhiệm kỳ hoạt động, Ban Chấp hành Trung ương<br />
Đảng tổ chức các Hội nghị Trung ương với nhiều nội dung quan trọng<br />
được đưa ra bàn thảo, xin ý kiến các Ủy viên Trung ương trước khi<br />
thông qua chính thức. Những nhiệm vụ quan trọng của Văn phòng<br />
Trung ương Đảng là chuẩn bị, tổ chức, phục vụ về cơ sở vật chất và nội<br />
dung, tổng hợp tất cả các ý kiến góp ý của các Hội nghị Trung ương<br />
Đảng. Hiện nay, ở Văn phòng Trung ương Đảng sử dụng phần mềm hỗ<br />
trợ tổng hợp ý kiến thảo luận tổ tại các Hội nghị Trung ương. Nhưng phần<br />
mềm này chưa có chức năng phát hiện, đánh dấu các ý kiến giống nhau.<br />
Với mong muốn nâng cao chất lượng phần mềm, luận văn nghiên cứu các<br />
giải pháp nhằm giải quyết vấn đề trên.<br />
2. Mục tiêu và nhiệm vụ nghiên cứu của luận văn<br />
* Mục tiêu: Nghiên cứu các phương pháp tính toán độ tương<br />
đồng câu. Trên cơ sở đó, đề xuất giải pháp xây dựng chức năng phát<br />
hiện, đánh dấu những câu, đoạn văn giống nhau về ngữ nghĩa trong các<br />
ý kiến góp ý vào cùng một nội dung của chủ đề được đưa ra bàn thảo<br />
tại Hội nghị Trung ương Đảng.<br />
* Nhiệm vụ:<br />
- Giới thiệu bài toán tổng hợp ý kiến trong hội nghị.<br />
- Tìm hiểu các phương pháp tính độ tương đồng câu.<br />
- Đề xuất giải pháp phát hiện nội dung giống nhau trong hệ thống<br />
tổng hợp ý kiến góp ý trong Hội nghị<br />
3. Tổng quan nghiên cứu vấn đề<br />
<br />
3<br />
Trên thế giới, các công trình nghiên cứu về tính toán độ tương<br />
đồng giữa các từ, các câu hoặc đoạn văn ngắn đã được nghiên cứu rộng<br />
rãi. Tại Việt Nam, các thuật toán tính toán độ tương đồng giữa các câu<br />
để áp dụng vào bài toán tóm tắt văn bản cũng đã được nhiều tác giả tìm<br />
hiểu, nghiên cứu. Đã có tác giả nghiên cứu về bài toán phân lớp ý kiến<br />
góp ý trong tổng hợp ý kiến trong Hội nghị [3]. Tuy nhiên việc phát<br />
hiện nội dung góp ý giống nhau trong một nội dung thảo luận để cảnh<br />
báo, lược bỏ thì chưa được nghiên cứu áp dụng.<br />
5. Phƣơng pháp nghiên cứu<br />
Các phương pháp nghiên cứu: phương pháp khảo sát; tổng hợp;<br />
phân tích, đánh giá; thực nghiệm.<br />
6. Nội dung của luận văn<br />
Ngoài phần mở đầu và kết luận, luận văn được bố cục thành 3<br />
chương:<br />
- Chương 1. Bài toán tổng hợp ý kiến góp ý trong hội nghị.<br />
- Chương 2. Các phương pháp tính độ tương đồng câu.<br />
- Chương 3. Đề xuất giải pháp phát hiện nội dung giống nhau<br />
trong hệ thống tổng hợp ý kiến góp ý trong Hội nghị<br />
<br />
4<br />
CHƢƠNG 1<br />
BÀI TOÁN TỔNG HỢP Ý KIẾN GÓP Ý TRONG HỘI NGHỊ<br />
1. Tổng quan về bài toán tổng hợp ý kiến góp ý trong Hội nghị<br />
Trong luận văn, cụm từ “tổng hợp ý kiến” được hiểu theo khía<br />
cạnh là tập hợp các ý kiến góp ý riêng lẻ để thể hiện xu hướng của đại<br />
biểu góp ý vào một nội dung của vấn đề. Ví dụ như: Đa số ý kiến cho<br />
rằng…, Một số ý kiến cho rằng…, Có ý kiến cho rằng….<br />
Có những bài toán được hiểu tương tự bài toán tổng hợp ý kiến<br />
theo một khía cạnh nào đó: Bài toán về “khai phá quan điểm”, Bài toán<br />
Tóm tắt văn. Trong luận văn về “Hệ thống tự động tổng hợp ý kiến góp<br />
ý trong Hội nghị” [3], tác giả có đưa ra mô hình phân lớp ý kiến tổng<br />
hợp. Nhu cầu đặt ra là cần xây dựng một hệ thống hỗ trợ tổng hợp ý<br />
kiến có chức năng tập hợp các ý kiến góp ý, có các tính năng giúp cho<br />
người sử dụng tổng hợp nhanh hơn như việc phát hiện, đánh dấu các<br />
nội dung giống nhau để qua đó người sử dụng quyết định việc tổng hợp<br />
ý kiến.<br />
2. Giới thiệu phần mềm Hỗ trợ tổng hợp ý kiến thảo luận tổ tại Hội<br />
nghị Trung ƣơng<br />
Hiện tại Văn phòng Trung ương Đảng đang sử dụng phần mềm<br />
Hỗ trợ tổng hợp ý kiến thảo luận Tổ tại các Hội nghị Trung ương. Phầm<br />
mềm đang được sử dụng này có chức năng cơ bản là từ các bản tổng<br />
hợp ý kiến thảo luận của Trung ương tại mỗi tổ, phần mềm đã gộp các<br />
ý kiến này theo từng nội dung. Kết quả là phần mềm đã giúp cho các<br />
chuyên viên tránh được tổng hợp thiếu, sót các ý kiến trong quá trình<br />
tổng hợp.<br />
<br />