
NGÔN NGỮ HỌC TÍNH TOÁN: NHỮNG XU HƯỚNG MỚI, TRIỂN VỌNG VÀ THÁCH THỨC | 225
...................................................................................................................................................................................
SO SÁNH CÁC KẾT QUẢ DỊCH TỰ ĐỘNG
VÀ DỊCH TRUYỀN THỐNG VIỆT - HÀN
HOÀNG NGUYÊN PHƯƠNG*
Tóm tắt: Bài viết này đã áp dụng hệ thống dịch tự động là Google Translate và Chat
GPT để dịch cho nội dung quảng bá của trường đại học Ngoại ngữ - Tin học TP.HCM. Bài
viết dùng kết quả dịch tự động để phân tích từng câu và chỉ ra các các loại câu có kết quả dịch
tiếng Hàn khó hiểu, sau đó trình bày lại theo dạng câu tiếng Hàn chuẩn xác bằng cách dịch
truyền thống, và cuối cùng là đưa ra ưu khuyết điểm qua các cách dịch. Kết quả nghiên cứu
này có thể góp phần nhận diện các lỗi dịch cơ bản và cải thiện hiệu suất của hệ thống dịch tự
động Việt - Hàn, tạo thêm nguồn tư liệu cho việc dịch thuật.
Từ khóa: Google Translate, Chat GPT, dịch tự động, dịch truyền thống, lỗi dịch tự
động
1. GIỚI THIỆU
Google đã phát triển và ra mắt Google dịch (hay còn gọi tên tiếng Anh là Google
Translate, viết tắt: GT) lần đầu tiên vào tháng 4 năm 2006 như một công cụ dịch trực tuyến
miễn phí và luôn được cải tiến đến ngày nay.
Vào thời kỳ đầu Google Translate sử dụng “dịch máy thống kê” nên không thể dịch
trực tiếp từ ngôn ngữ nguồn sang ngôn ngữ đích mà phải chuyển ngôn ngữ nguồn sang tiếng
Anh trong những trường hợp ngôn ngữ cần chuyển dịch không phải là tiếng Anh. Sau 10 năm,
vào tháng 11 năm 2016, Google thông báo đã cải tiến Google Translate sang dạng “dịch máy
mô phỏng dây thần kinh” (GNMT - Google Neural Machine Translation) nên có thể dịch trực
tiếp giữa ngôn ngữ nguồn và ngôn ngữ đích mà không cần sử dụng ngôn ngữ trung gian là
tiếng Anh.
Hiện tại, từ tháng 7 năm 2024 trở đi, Google Translate đã có tổng cộng 243 ngôn ngữ
dịch trên trang web https://translate.google.com với sự trợ giúp của mô hình ngôn ngữ lớn
PaLM 2 (Pathways Language Model). Google tiết lộ rằng PaLM 2 đã được đào tạo bằng hơn
20 ngôn ngữ lập trình và hơn 100 ngôn ngữ để giúp nó hiểu sâu hơn về toán học, logic, khoa
học, tăng khả năng dịch thuật và tổng hợp văn bản.
Ngoài dịch tự động bằng Google Translate, ChatGPT cũng là một công cụ dịch tự động
được nhiều người biết đến. ChatGPT cũng được đào tạo đa ngôn ngữ với hàng trăm tỷ từ nên
có khả năng tạo ra các bản dịch trong vòng vài giây nhiều ngôn ngữ khác nhau mà không bị
giới hạn chỉ ở một cặp ngôn ngữ. Vì ChatGPT là một AI có thể tự học qua các cuộc trò truyện
với con người nên khả năng lựa chọn từ vựng và phong cách dịch có thể mạch lạc và tự nhiên
* TS, Trường Đại học Ngoại ngữ - Tin học TP. HCM; Email: phuongnh@huflit.edu.vn