Trang chủ » Luận Văn - Báo Cáo » Công nghệ thông tin

51 trang

50 lượt xem

0

0

Khóa luận tốt nghiệp: Phát hiện kế thừa văn bản tiếng Việt dựa trên từ vựng và từ điển đồng nghĩa

Khóa luận tập trung nghiên cứu bài toán và các phương pháp phát hiện kế thừa văn bản tại các hội nghị khoa học quốc tế RTE. Trên cơ sở tìm hiểu và so sánh các hướng tiếp cận, khóa luận tập trung vào hướng tiếp cận xác định kế thừa văn bản dựa trên từ vựng và tri thức miền.

Chủ đề:

Đồ án công nghệ thông tin

Đồ án khoa học dữ liệu

/

51

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Hà Thị Oanh

PHÁT HIỆN KẾ THỪA VĂN BẢN TIẾNG VIỆT

DỰA TRÊN TỪ VỰNG VÀ TỪ ĐIỂN ĐỒNG NGHĨA

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHÍNH QUY

Ngành: Công nghệ Thông tin

Hà Nội – 2012

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Hà Thị Oanh

PHÁT HIỆN KẾ THỪA VĂN BẢN TIẾNG VIỆT

DỰA TRÊN TỪ VỰNG VÀ TỪ ĐIỂN ĐỒNG NGHĨA

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHÍNH QUY

Ngành: Công nghệ Thông tin

Cán bộ hướng dẫn: PGS.TS Hà Quang Thụy

Cán bộ đồng hướng dẫn: ThS Phạm Quang Nhật Minh

Hà Nội – 2012

VIETNAM NATIONAL UNIVERSITY, HANOI

UNIVERSITY OF ENGINEERING AND TECHNOLOGY

Ha Thi Oanh

RECOGNIZING VIETNAMESE TEXTUAL

ENTAILMENT BASED ON LEXICAL AND

SYNONYM DICTIONARY

Major: Information Technology

Supervisor: Assoc. Prof. Ha Quang Thuy

Co-Supervisor: Masters. Pham Quang Nhat Minh

HA NOI – 2012

i

LỜI CẢM ƠN

Lời đầu tiên, em xin gửi lời cảm ơn sâu sắc nhất tới PGS.TS. Hà Quang Thụy,

ThS Phạm Quang Nhật Minh đã tận tình chỉ bảo và hướng dẫn em thực hiện khóa luận

tốt nghiệp.

Em xin cảm ơn các thầy, cô trong trường Đại học Công nghệ đã giảng dạy và cho

em những kiến thức quý báu, làm nền tảng để em hoàn thành khóa luận, cũng như

trong công việc tương lai.

Em xin gửi lời cảm ơn tới các anh chị, các bạn sinh viên trong phòng thí nghiệm

KTLab: TS. Phan Xuân Hiếu, CN Lê Đức Trọng, CN Trần Xuân Tứ, Nguyễn Thị

Thùy Linh, … đã hỗ trợ em rất nhiều trong suốt quá trình làm khóa luận.

Em cũng xin được gửi lời tri ân tới các bạn trong lớp K53CLC, K53CC đã luôn

bên cạnh và ủng hộ em trong suốt quá trình học tập tại trường.

Cuối cùng, em muốn gửi lời cảm ơn sâu sắc tới gia đình và bạn bè - những người

thân yêu luôn ở bên yêu thương che chở em để em vượt qua những khó khăn trong

cuộc sống cũng như trong học tập.

Em xin chân thành cảm ơn!

Hà Nội, tháng 5 năm 2012

Sinh viên

Hà Thị Oanh

ii

PHÁT HIỆN KẾ THỪA VĂN BẢN DỰA TRÊN

TỪ VỰNG VÀ TỪ ĐIỂN ĐỒNG NGHĨA

Hà Thị Oanh

Khóa QH-2008-I/CQ, Ngành Công nghệ thông tin

Tóm tắt Khóa luận tốt nghiệp

Phát hiện quan hệ ngữ nghĩa (semantic relation) là một bài toán quan trọng trong lĩnh

vực xử lý ngôn ngữ tự nhiên và khai phá dữ liệu văn bản. Phát hiện kế thừa văn bản

(Recognizing Textual Entailment: RTE) là bài toán tìm mối quan hệ “kế thừa ngữ nghĩa” của

một văn bản T từ một văn bản giả thuyết H, là một bài toán có ý nghĩa khoa học – công nghệ

thời sự thu hút sự quan tâm của nhiều nhóm nghiên cứu trên thế giới. Nhiều công trình nghiên

cứu về RTE được công bố trên các tạp chí, tại các hội nghị khoa học quốc tế mà điển hình là

nhánh hội nghị khoa học về RTE trong dãy hội nghị thường niên về phân tích văn bản (Text

Analysis Conference: TAC) do Viện Tiêu chuNn và Công nghệ quốc gia Mỹ chủ trì.

Khóa luận tập trung nghiên cứu bài toán và các phương pháp phát hiện kế thừa văn

bản ti tại các hội nghị khoa học quốc tế RTE. Trên cơ sở tìm hiểu và so sánh các hướng tiếp

cận, khóa luận tập trung vào hướng tiếp cận xác định kế thừa văn bản dựa trên từ vựng và tri

thức miền.

Các nghiên cứu theo hướng tiếp cận này (Valentin Jijkoun và Maarten de Rijke, 2006

[20], Ken-ichi Yokote và cộng sự, 2012 [22]) cho thấy giá trị ngưỡng phán quyết kế thừa có ý

nghĩa quan trọng. Khóa luận đề xuất giải pháp xác định và tinh chỉnh ngưỡng phán quyết kế

thừa trong tiếp cận phát hiện kế thừa văn bản dựa trên từ vựng và đề nghị một mô hình phát

hiện kế thừa văn bản có tích hợp giải pháp xác định và tinh chỉnh ngưỡng phán quyết nói trên.

Thực nghiệm mô hình đề xuất trên dữ liệu tiếng Việt chứng tỏ giải pháp đề xuất có

tính hiệu quả: độ đo F1 của phán quyết sau khi tinh chỉnh trung bình tăng 3% so với chưa tinh

chỉnh...

Từ khóa: Kế thừa ngữ nghĩa, RTE, từ điển đồng nghĩa

Tài liệu liên quan

Khóa luận tốt nghiệp: Nghiên cứu một số kỹ thuật khai thác dữ liệu, ứng dụng trong thị trường chứng khoán

Khóa luận tốt nghiệp: Nghiên cứu một số kỹ thuật khai thác dữ liệu, ứng dụng trong thị trường chứng khoán

Nhận dạng thực thể trong văn bản tiếng Việt: Khóa luận tốt nghiệp sử dụng mô hình học sâu suốt đời mức ký tự

Khóa luận tốt nghiệp: Nhận dạng thực thể trong văn bản tiếng Việt sử dụng mô hình học sâu suốt đời mức ký tự

Mô hình giải quyết vấn đề khởi đầu nguội trong tư vấn xã hội dựa trên phương pháp ma trận nhân tử: Khóa luận tốt nghiệp

Khóa luận tốt nghiệp: Một mô hình giải quyết vấn đề khởi đầu nguội trong tư vấn xã hội dựa trên phương pháp ma trận nhân tử

Phát hiện điểm thay đổi trôi khái niệm trong khai phá quy trình: Khóa luận tốt nghiệp

Khóa luận tốt nghiệp: Phát hiện điểm thay đổi trôi khái niệm trong khai phá quy trình

Phát hiện bất thường trên phương tiện xã hội: Khóa luận tốt nghiệp về kỹ thuật khai phá dữ liệu

Khóa luận tốt nghiệp: Phát hiện bất thường trên phương tiện xã hội dựa trên kỹ thuật khai phá dữ liệu

Các độ đo trong phân cụm: Khóa luận tốt nghiệp và áp dụng phát hiện mô hình tổ chức trong khai phá quá trình

Khóa luận tốt nghiệp: Các độ đo trong phân cụm và áp dụng vào phát hiện mô hình tổ chức trong khai phá quá trình

Thuật toán phân cụm trong khai phá khía cạnh tổ chức: Khóa luận tốt nghiệp về phát hiện quá trình

Khóa luận tốt nghiệp: Thuật toán phân cụm trong khai phá khía cạnh tổ chức trong phát hiện quá trình

Dự báo nhiễm malware trên thiết bị di động: Khóa luận tốt nghiệp bằng khai phá dữ liệu

Khóa luận tốt nghiệp: Dự báo nhiễm malware trên thiết bị di động bằng khai phá dữ liệu

Tối ưu hóa ảnh hưởng đối tượng trên mạng xã hội: Khóa luận tốt nghiệp

Khóa luận tốt nghiệp: Tối ưu hóa ảnh hưởng của đối tượng trên mạng xã hội

Kiểm tra sự phù hợp mô hình quá trình và nhật ký sự kiện: Khóa luận tốt nghiệp bằng phƣơng pháp phát lại

Khóa luận tốt nghiệp: Kiểm tra sự phù hợp mô hình quá trình và nhật ký sự kiện bằng phƣơng pháp phát lại

Tài liêu mới

Nâng cấp hệ thống mạng cho Công ty TECAPRO chi nhánh Vũng Tàu: Đồ án tốt nghiệp

Đồ án tốt nghiệp: Nâng cấp hệ thống mạng cho Công ty TNHH MTV Ứng dụng Kỹ thuật và Sản xuất (TECAPRO) chi nhánh Vũng Tàu

Xây dựng website quản lý khách sạn: Đồ án tốt nghiệp chi tiết

Đồ án tốt nghiệp: Xây dựng website quản lý khách sạn

Hệ thống quản lý chung cư: Đồ án tốt nghiệp

Đồ án tốt nghiệp: Hệ thống quản lý chung cư

Hệ thống đặt món ăn cho nhân viên nhà hàng: Đồ án tốt nghiệp xây dựng chi tiết

Đồ án tốt nghiệp: Xây dựng hệ thống đặt món ăn cho nhân viên tại nhà hàng

Phát triển website cho thuê xe Việt Key: Đồ án tốt nghiệp [Chuẩn SEO]

Đồ án tốt nghiệp: Phát triển website cho thuê xe việt key

Xây dựng website bán hàng và cung cấp dịch vụ hosting: Đồ án tốt nghiệp [Chuẩn SEO]

Đồ án tốt nghiệp: Xây dựng website bán hàng và cung cấp dịch vụ hosting

Phân tích và thiết kế UI/UX: Đồ án tốt nghiệp hệ thống cửa hàng điện tử Greentech

Đồ án tốt nghiệp: Phân tích và thiết kế UI/UX cho hệ thống cửa hàng điện tử Greentech

Ứng dụng kết nối doanh nghiệp BKL: Đồ án tốt nghiệp xây dựng

Đồ án tốt nghiệp: Xây dựng ứng dụng kết nối doanh nghiệp BKL

Ứng dụng khảo sát có thưởng OSurvey: Đồ án tốt nghiệp xây dựng chi tiết

Đồ án tốt nghiệp: Xây dựng ứng dụng khảo sát có thưởng OSurvey

Phát triển ứng dụng chia sẻ video ngắn ShortVibe: Đồ án tốt nghiệp

Đồ án tốt nghiệp: Phát triển ứng dụng chia sẻ video ngắn – ShortVibe

Website bán sim số đẹp: Đồ án tốt nghiệp xây dựng

Đồ án tốt nghiệp: Xây dựng website bán sim số đẹp

Xây dựng website quản lý bán hàng cho cửa hàng NT Flowers: Khoá luận tốt nghiệp

Khoá luận tốt nghiệp: Xây dựng website quản lý bán hàng cho cửa hàng NT Flowers

Website quản lý bán hàng Công ty TNHH thời trang Star: Khóa luận tốt nghiệp

Khoá luận tốt nghiệp: Xây dựng website quản lý bán hàng Công ty TNHH thời trang Star

Xây dựng Web Site Quản Lý Bán Điện Thoại ChungPhone: Khoá Luận Tốt Nghiệp

Khoá luận tốt nghiệp: Xây dựng web site quản lý bán điện thoại ChungPhone

Website bán thủy sinh tích hợp chatbot AI: Khóa luận tốt nghiệp tại HQ Aquarium

Khoá luận tốt nghiệp: Xây dựng website bán thủy sinh tích hợp chatbot AI hỗ trợ tư vấn sản phẩm tại Công ty TNHH HQ Aquarium

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 38/GP-BVHTTDL cấp ngày 09/3/2026