ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐI HỌC CÔNG NGHỆ THÔNG TIN
1
CS431 CÁC KỸ THUẬT HỌC SÂU
VÀ ỨNG DỤNG
TS. Nguyễn Vinh Tiệp
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
Bài 08
Mô hình Sequence-to-Sequence
08/11/2023
NỘI DUNG
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
1. Dịch máy (Machine Translation)
2. Mô hình ngôn ngữ điều kiện (Conditional Language
Model)
3. Kiến trúc hình hóa-giải (Encoder-Decoder
Architecture)
08/11/2023
Dịch máy
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
08/11/2023 3
Đầu vào: Một đoạn văn bản với ngôn ngữ ban đầu
Đầu ra: Một đoạn văn bản với ngôn ngữ cần dịch sang
Vấn đề điển hình trong xử lý ngôn ngữ tự nhiên (Understanding và
Generation)
Nhu cầu dịch văn bản giữa các ngôn ngữ rất lớn
Google Translate translates >100 billion words every day
Facebook có hệ thống dịch máy riêng của mình
eBay sử dụng dịch máy để phát triển thương mại xuyên biên giới
Các phương pháp Dịch máy hiện tại sử dụng kho dữ liệu ngôn ngữ
song song để huấn luyện
NỘI DUNG
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 4
1. Dịch máy (Machine Translation)
2. Mô hình ngôn ngữ điều kiện (Conditional Language
Model)
3. Kiến trúc hình hóa-giải (Encoder-Decoder
Architecture)
08/11/2023
Mô hình ngôn ngữ điều kiện
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
08/11/2023 5
Phân phối xác suất có điều kiện trên chuỗi (câu) đầu vào:
Hàm chi phí cần phải tối ưu (minimize):