Đại học Quốc gia Hà Nội
Khoa Công nghệ thông tin
BÁO CÁO ĐỀ TÀI
SINH NGÔN NGỮ TỰ NHIÊN
GVHD: tiến sĩ Lê Anh Cường
BÁO CÁO
SINH NGÔN NGỮ TỰ NHIÊN
Nhóm 8:
Nguyễn Trung Hiếu
Trương Quý Quỳnh
Hoàng Đình Tiến
Giảng viên: Anh Cường
LỜI MỞ ĐẦU
Trong những năm gần đây, công nghệ thông tin phát triển như vũ bão, đóng vai t
ngày ng quan trọng trong đời sống hội.Trí tuệ nhân tạo đặc biệt xử lý
ngôn ngữ tự nhiên được nghiên cứu rộng rãi mang lại nhiều ứng dụng quan trọng
trong đời sống. Trong đó sinh ngôn ngữ tnhiên là một lĩnh vực nổi bật khả
năng tạo ra những hệ thống đáp ứng người sử dụng như chính ngôn ngữ con người
ra. Chính những lợi ích to ln mang li, trong bài tập lớn môn xử
ngôn ngữ tự nhiên, nhóm 8 đã chọn chủ đnày nhằm làm những kiến thức
bản để xây dựng một hệ thống sinh ngôn ngữ tự nhiên sử dụng những kiến thức
đã đạt được để xây dựng một chương trình sinh ngôn ngữ tự nhiên vtổng kết
đánh giá của những người sử dụng điện thoại.
Nhóm 8 xin gửi lời cảm ơn chân thành nhất tới thầy giáo tiến sĩ Anh Cường,
thy ging viên môn Xử ngôn ngữ tự nhiên , Khoa ng nghệ thông tin Đại
học ng ngh- Đại học Quốc gia Nội. Trong suốt qtrình thực hiện i tập
ln y, thy đã những chỉ dẫn tận tình, hết lòng chỉ bảo để cả nhóm thể
hoàn thành được bài tập lớn này.
MỤC LỤC
Chương I: Tổng quan về sinh ngôn ngữ tự nhiên
1. Bài toán sinh ngôn ngữ tự nhiên
1.1. Khái niệm
1.2. Ứng dụng
Chương II: Cu trúc hệ thống sinh ngôn ngữ tự nhiên
2. Cấu trúc hệ thống sinh ngôn ngữ tự nhiên
2.1. Document planning
2.1.1. Cấu trúc của document planning
2.1.1.1. Cấu trúc của document planning
2.1.1.2. Nhiệm vụ của document planning
2.1.1.3. Input và Output của document planning
2.1.2. Biu diễn thông tin
2.1.2.1. Mô hình biểu din thông tin
2.1.2.2. Định nghĩa các thông điệp
2.1.2.3. Phương pháp mô hình hóa thông tin và định nghĩa các thông điệp
2.1.2.4. Quyết định nội dung (Content Determination)
2.1.2.5. Thu thập các luật để quyết định nội dung
2.1.3. Cấu trúc văn bản từ các thông điệp
2.1.3.1. Quan hệ din ngôn (Discourse Relation)
2.1.3.2. Tiếp cận giản đồ (Schema)
2.2. Micro Planning
2.2.1. Từ vựng hóa (Lexicalisation)
2.2.2. Ghép câu (Sentence Aggregation)
2.3. Trìnhy văn bản (Surface Realisation)
Chương III: Thử nghiệm xây dng hệ thống sinh ngôn ngữ tự nhiên
Chương I: Tổng quan về sinh ngôn ngữ tự nhiên
1. Bài toán sinh ngôn ngữ tự nhiên
1.1. Khái niệm
Sinh ngôn ngữ tự nhiên (Natural Language Generation viết tắt NLG)
mt lĩnh vực con của trí tuệ nhân tạo và ngôn ngữ học máy tính liên quan tới việc
xây dng mt hệ thống máy tính thsản sinh ra văn bản bằng tiếng Anh hoặc
những ngôn ngữ loài người khác từ những biểu diễn phi ngữ nghĩa của thông tin.
Mục tiêu của hệ thống sinh ngôn ngữ tự nhiên là tạo ra các văn bản thể
hiu được bằng ngôn ngữ li người bởi vậy, cần nguồn tri thức tloại ngôn
ngữ mà hệ thống sử dụng cũng như những kiến thức thuộc lĩnh vực hệ thống sẽ
sản sinh. Đầu vào của hthống sinh ngôn ngữ tự nhiên là các dạng phi ngữ nghĩa
của tng tin: mu tin, bảng biu, số liu. Đầu ra là những u, văn bản ý nghĩa
nhất định bằng ngôn ngữ con người, chứa thông tin ở đầu vào.
1.2. Ứng dụng
Sinh ngôn ngữ tự nhiên cần thiết trong các hệ thống tương tác người máy, một vài
ứng dụng quan trọng có thể kể đến:
- Ứng dụng sinh ra tài liệu tđộng. Ví dụ: dự báo thời tiết, báo cáo phỏng,
thư tín,...
- Ứng dụng biểu diễn thông tin tới người dùng bằng cách thể hiểu được. Ví
dụ: bản ghi y khoa, lập luận hệ thống chuyên gia….