intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Công nghệ thông tin: Tự động phân tích các nội dung giống nhau trong hệ thống tổng hợp ý kiến góp ý trong hội nghị

Chia sẻ: Nguyễn Văn H | Ngày: | Loại File: PDF | Số trang:62

63
lượt xem
8
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục đích nghiên cứu của luận văn nhằm nêu ra các phương pháp tính toán độ tương đồng câu dựa trên các thuật toán về xử lý ngôn ngữ tự nhiên. Trên cơ sở đó, đề xuất giải pháp xây dựng chức năng phát hiện, đánh dấu những câu, đoạn văn giống nhau về ngữ nghĩa trong các ý kiến góp ý vào cùng một nội dung của chủ đề được đưa ra bàn thảo tại Hội nghị Trung ương Đảng.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Công nghệ thông tin: Tự động phân tích các nội dung giống nhau trong hệ thống tổng hợp ý kiến góp ý trong hội nghị

ĐẠI HỌC QUỐC GIA HÀ NỘI<br /> TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br /> ***<br /> <br /> TRẦN THANH TÙNG<br /> <br /> TỰ ĐỘNG PHÂN TÍCH CÁC NỘI DUNG<br /> GIỐNG NHAU TRONG HỆ THỐNG TỔNG HỢP<br /> Ý KIẾN GÓP Ý TRONG HỘI NGHỊ<br /> <br /> LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN<br /> <br /> HÀ NỘI - 2016<br /> <br /> ĐẠI HỌC QUỐC GIA HÀ NỘI<br /> TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br /> <br /> TRẦN THANH TÙNG<br /> <br /> TỰ ĐỘNG PHÂN TÍCH CÁC NỘI DUNG<br /> GIỐNG NHAU TRONG HỆ THỐNG TỔNG HỢP<br /> Ý KIẾN GÓP Ý TRONG HỘI NGHỊ<br /> Ngành: Công nghệ thông tin<br /> Chuyên ngành: Hệ thống thông tin<br /> Mã số: 60480104<br /> <br /> LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN<br /> <br /> Người hướng dẫn khoa học<br /> Cán bộ hướng dẫn chính: TS. Bùi Quang Hưng<br /> Cán bộ hướng dẫn phụ: PGS.TS. Vũ Duy Lợi<br /> <br /> HÀ NỘI - 2016<br /> <br /> LỜI CAM ĐOAN<br /> <br /> Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm nghiên<br /> cứu, tìm hiểu của riêng cá nhân tôi. Trong toàn bộ nội dung của luận văn,<br /> những điều được trình bày hoặc là của cá nhân tôi hoặc là được tổng hợp<br /> từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có xuất xứ rõ<br /> ràng và được trích dẫn hợp pháp.<br /> Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo<br /> quy định cho lời cam đoan của mình.<br /> <br /> Hà Nội, ngày 26 tháng 10 năm 2016<br /> Ngƣời cam đoan<br /> <br /> Trần Thanh Tùng<br /> <br /> 4<br /> <br /> LỜI CẢM ƠN<br /> <br /> Tôi xin chân thành cảm ơn PGS.TS. Vũ Duy Lợi, chuyên viên cao cấp Văn<br /> phòng Trung ương Đảng và TS. Bùi Quang Hưng, giảng viên trường Đại học<br /> Công nghệ, Đại học Quốc gia Hà Nội đã tận tình giúp đỡ tôi về chuyên môn,<br /> định hướng phát triển trong suốt quá trình làm luận văn.<br /> Tôi xin gửi lời cám ơn tới các Thầy, Cô giáo của Khoa Công nghệ thông<br /> tin, vì đã truyền dạy những kiến thức bổ ích, hiện đại về lĩnh vực Hệ thống<br /> thông tin. Tôi đã được tiếp cận một môi trường học thuật cao, hiểu được sự vất<br /> vả cũng như thành quả đạt được khi tham gia nghiên cứu khoa học.<br /> Tôi xin cảm ơn các bạn trong nhóm Data Mining thuộc Trung tâm Công<br /> nghệ tích hợp liên ngành giám sát hiện trường (FIMO center), Đại học Công<br /> nghệ Hà Nội, TS. Nguyễn Việt Anh và Nhóm Giải pháp dữ liệu, Viện Công<br /> nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam.<br /> Cuối cùng, với gia đình, tôi xin gửi lời biết ơn sâu sắc vì gia đình đã luôn ở<br /> bên cạnh tôi, mang lại cho tôi nguồn động viên tinh thần to lớn và tạo mọi điều<br /> kiện thuận lợi cho tôi trong quá trình học tập và hoàn thành luận văn này.<br /> Mặc dù đã rất cố gắng nhưng luận văn sẽ không tránh khỏi những thiếu sót.<br /> Rất mong nhận được ý kiến đóng góp quý báu của Thầy, Cô giáo và các bạn để<br /> luận văn được hoàn thiện hơn.<br /> Xin trân trọng cảm ơn!<br /> <br /> 5<br /> <br /> MỤC LỤC<br /> LỜI CAM ĐOAN ............................................................................................................ 3<br /> LỜI CẢM ƠN .................................................................................................................. 4<br /> MỤC LỤC ....................................................................................................................... 5<br /> BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................................................ 7<br /> DANH MỤC CÁC HÌNH VẼ ......................................................................................... 8<br /> MỞ ĐẦU ....................................................................................................................... 10<br /> CHƢƠNG 1: BÀI TOÁN TỔNG HỢP Ý KIẾN GÓP Ý TRONG HỘI NGHỊ .......... 14<br /> 1. Tổng quan về bài toán tổng hợp ý kiến góp ý trong Hội nghị.............................. 14<br /> 2. Giới thiệu phần mềm Hỗ trợ tổng hợp ý kiến thảo luận tổ tại Hội nghị Trung<br /> ƣơng ........................................................................................................................... 15<br /> 2.1. Quy trình tổng hợp ý kiến thảo luận .............................................................. 16<br /> 2.2. Phần mềm Hỗ trợ tổng hợp ý kiến thảo luận Tổ ........................................... 19<br /> 3. Xác định bài toán cần giải quyết .....................................................................23<br /> CHƢƠNG 2: CÁC PHƢƠNG PHÁP TÍNH ĐỘ TƢƠNG ĐỒNG CÂU ............... 25<br /> 1. Khái niệm độ tƣơng đồng câu ..........................................................................25<br /> 2. Các phƣơng pháp tính độ tƣơng đồng câu .....................................................25<br /> 2.1. Phương pháp tính độ tương đồng câu dựa vào WordNet .............................. 25<br /> 2.2. Phương pháp tính độ tương đồng câu dựa vào Wikipedia ............................ 30<br /> 2.3. Phương pháp tính độ tương đồng câu dựa vào chủ đề ẩn (Latent Dirichlet<br /> Allocation) ..................................................................................................................... 34<br /> 2.4. Phương pháp tính độ tương đồng dựa vào phân tích ngữ nghĩa tiềm ẩn<br /> (Latent Semantic Analysis) ............................................................................................ 37<br /> 3. Đánh giá và lựa chọn phƣơng pháp ................................................................ 45<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
5=>2