
NGÔN NGỮ HỌC TÍNH TOÁN: NHỮNG XU HƯỚNG MỚI, TRIỂN VỌNG VÀ THÁCH THỨC | 225
...................................................................................................................................................................................
SO SÁNH CÁC KẾT QUẢ DỊCH TỰ ĐỘNG
VÀ DỊCH TRUYỀN THỐNG VIỆT - HÀN
HOÀNG NGUYÊN PHƯƠNG*
Tóm tắt: Bài viết này đã áp dụng hệ thống dịch tự động là Google Translate và Chat
GPT để dịch cho nội dung quảng bá của trường đại học Ngoại ngữ - Tin học TP.HCM. Bài
viết dùng kết quả dịch tự động để phân tích từng câu và chỉ ra các các loại câu có kết quả dịch
tiếng Hàn khó hiểu, sau đó trình bày lại theo dạng câu tiếng Hàn chuẩn xác bằng cách dịch
truyền thống, và cuối cùng là đưa ra ưu khuyết điểm qua các cách dịch. Kết quả nghiên cứu
này có thể góp phần nhận diện các lỗi dịch cơ bản và cải thiện hiệu suất của hệ thống dịch tự
động Việt - Hàn, tạo thêm nguồn tư liệu cho việc dịch thuật.
Từ khóa: Google Translate, Chat GPT, dịch tự động, dịch truyền thống, lỗi dịch tự
động
1. GIỚI THIỆU
Google đã phát triển và ra mắt Google dịch (hay còn gọi tên tiếng Anh là Google
Translate, viết tắt: GT) lần đầu tiên vào tháng 4 năm 2006 như một công cụ dịch trực tuyến
miễn phí và luôn được cải tiến đến ngày nay.
Vào thời kỳ đầu Google Translate sử dụng “dịch máy thống kê” nên không thể dịch
trực tiếp từ ngôn ngữ nguồn sang ngôn ngữ đích mà phải chuyển ngôn ngữ nguồn sang tiếng
Anh trong những trường hợp ngôn ngữ cần chuyển dịch không phải là tiếng Anh. Sau 10 năm,
vào tháng 11 năm 2016, Google thông báo đã cải tiến Google Translate sang dạng “dịch máy
mô phỏng dây thần kinh” (GNMT - Google Neural Machine Translation) nên có thể dịch trực
tiếp giữa ngôn ngữ nguồn và ngôn ngữ đích mà không cần sử dụng ngôn ngữ trung gian là
tiếng Anh.
Hiện tại, từ tháng 7 năm 2024 trở đi, Google Translate đã có tổng cộng 243 ngôn ngữ
dịch trên trang web https://translate.google.com với sự trợ giúp của mô hình ngôn ngữ lớn
PaLM 2 (Pathways Language Model). Google tiết lộ rằng PaLM 2 đã được đào tạo bằng hơn
20 ngôn ngữ lập trình và hơn 100 ngôn ngữ để giúp nó hiểu sâu hơn về toán học, logic, khoa
học, tăng khả năng dịch thuật và tổng hợp văn bản.
Ngoài dịch tự động bằng Google Translate, ChatGPT cũng là một công cụ dịch tự động
được nhiều người biết đến. ChatGPT cũng được đào tạo đa ngôn ngữ với hàng trăm tỷ từ nên
có khả năng tạo ra các bản dịch trong vòng vài giây nhiều ngôn ngữ khác nhau mà không bị
giới hạn chỉ ở một cặp ngôn ngữ. Vì ChatGPT là một AI có thể tự học qua các cuộc trò truyện
với con người nên khả năng lựa chọn từ vựng và phong cách dịch có thể mạch lạc và tự nhiên
* TS, Trường Đại học Ngoại ngữ - Tin học TP. HCM; Email: phuongnh@huflit.edu.vn

226 | KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2024
...................................................................................................................................................................................
hơn Google Translate. Bản dịch cũng có thể được cải thiện nhiều hơn nếu người cần dịch trò
chuyện qua lại với ChatGPT để xác định nghĩa bản dịch mà ChatGPT đưa ra, đây cũng chính
là điều mà Google Translate không thực hiện được.
Mặc dù không thể đánh giá thấp những lợi ích thiết thực của Google Translate,
ChatGPT và các công nghệ tương tự mang lại nhưng tỷ lệ dịch chính xác của Google Translate,
ChatGPT đối với ngôn ngữ nguồn và ngôn ngữ đích, đặc biệt là những cặp ngôn ngữ có hệ
chữ và cú pháp khác nhau như tiếng Việt và tiếng Hàn vẫn cần phải tìm hiểu thêm. Những
trường hợp bản dịch cần có kiến thức về văn hóa, cấu trúc ngữ pháp, đòi hỏi kinh nghiệm và
các yếu tố về ngữ cảnh thì có thể gây khó khăn cho việc tạo ra một sản phẩm hoàn thiện. Sẽ
có những trường hợp Google Translate hoặc ChatGPT dịch không chính xác các loại thì (quá
khứ, tương lai, hiện tại), dùng sai trợ từ, hiểu sai đại từ nhân xưng, hoặc chỉ xử lý các từ và
dòng chữ, xử lý nhanh các đoạn chữ cái mà không hiểu ý nghĩa cơ bản của chúng. Vì vậy,
ngay cả những hệ thống dịch thuật dựa trên công nghệ AI tiên tiến cũng có thể không chính
xác hoặc sai sót do máy tính không thể hiểu được nghĩa tiềm ẩn (ẩn giấu) của từ ngữ.
Nghiên cứu này sử dụng nội dung quảng bá trường đại học Ngoại ngữ - Tin học
TP.HCM (HUFLIT) thử nghiệm và phân tích hệ thống dịch tự động Việt - Hàn để khảo sát
những thiếu sót và đưa ra câu dịch chuẩn xác nhằm cải thiện kết quả dịch thuật của bản dịch
tự động. Bản dịch tự động bị tối nghĩa, hoặc ý nghĩa của câu gốc bị thay đổi gây hiểu lầm và
hiểu sai ý sẽ được dịch giả (con người) tinh chỉnh và nâng cao chất lượng các bản dịch, đồng
thời bổ sung thêm vào phần “gửi ý kiến phản hồi” trên GT để các nội dung dịch sau này được
hoàn thiện hơn.
2. CƠ SỞ LÝ LUẬN
1) Nghiên cứu về dịch tự động có sử dụng Google Translate và dịch trên các phần mềm
tuy đã được quan tâm từ những năm 2010 đến nay nhưng các bài nghiên cứu về đề tài này
không nhiều. Có thể điểm qua một vài bài viết liên quan đến ngôn ngữ dịch tự động trong và
ngoài nước như sau:
- “Những lỗi ngôn ngữ phần mềm Google Translate khi dịch tự động Anh - Việt các
hợp đồng kinh tế” [1] là luận án dùng 3.387 cặp câu song ngữ Anh Việt có trong các văn bản
hợp đồng kinh tế để khảo sát dịch tự động ra ngôn ngữ đích là tiếng Việt. Luận án đã đối chiếu
và phân loại các loại lỗi phổ biến sau khi sử dụng chương trình dịch tự động là Google
Translate và công cụ BLAST (công cụ phân tích và xử lý lỗi), nêu bật vai trò quan trọng của
người quan sát trong việc phân loại và xử lý các loại lỗi trong dịch tự động. Luận án cũng đã
nhấn mạnh những ưu điểm và những mặt hạn chế của chương trình dịch tự động để những
chuyên gia về ngôn ngữ học và công nghệ máy tính có hướng cải tiến cho hệ thống được tốt
hơn. - Gookhyung Jho và Aesun Yoon đã thực hiện việc phân loại các biểu hiện không tự
nhiên và các câu dịch không chính xác trong bản dịch tiếng Hàn, bằng cách áp dụng khoảng

NGÔN NGỮ HỌC TÍNH TOÁN: NHỮNG XU HƯỚNG MỚI, TRIỂN VỌNG VÀ THÁCH THỨC | 227
...................................................................................................................................................................................
50.000 câu tiếng Pháp được trích xuất từ nhiều phương tiện truyền thông khác nhau của Pháp
vào hệ thống dịch tự động hiện tại. Sau đó nhóm tác giả đã nghiên cứu đặc điểm xây dựng
mẫu của hệ thống dịch tự động Pháp-Hàn bằng cách xem xét các đặc điểm cú pháp và ngữ
nghĩa của câu tiếng Pháp, và đề xuất các mẫu dịch tự động cho các câu có động từ gián tiếp,
các câu có động từ đại danh, các câu có chủ ngữ phi nhân xưng, v.v., dựa trên đặc điểm của
động từ tiếng Pháp [2].
- Nhóm tác giả Phạm Thị Thúy Hồng và Hoàng Thu Hà đã dùng dữ liệu danh từ chỉ
người trong lĩnh vực báo chí với 25 từ tiếng Việt và 42 từ tiếng Anh có trong từ điển làm đối
tượng nghiên cứu tính chính xác của Google Translate khi chuyển dịch Anh - Việt, Việt - Anh.
Bài viết đã chỉ ra được những lỗi sai về nghĩa của từ và lỗi sai về cấu trúc khi dùng Google
Translate chuyển dịch 67 từ vựng chuyên ngành báo chí có sẵn trong từ điển [3]. Kết quả của
bài viết “Khảo sát cách dịch máy danh từ chỉ người thuộc lĩnh vực báo chí” đã bổ sung thêm
vào nguồn học liệu tiếng Anh nói chung và chuyên ngành báo chí nói riêng các từ chuyên
ngành về báo chí - truyền thông.
2) Những nét cơ bản trong tiếng Việt và tiếng Hàn
- Tiếng Việt thuộc loại hình ngôn ngữ đơn lập, từ không biến đổi hình thái, tiếng là
đơn vị cơ sở của ngữ pháp nên trật từ thay đổi thì ý nghĩa câu có thể thay đổi, có loại từ/danh
từ đơn vị, có hệ thống từ xưng hô phong phú, cú pháp câu cơ bản theo thứ tự “chủ ngữ -
động/tính từ - tân ngữ” C-V-O, cách biểu thị ý nghĩa ngữ pháp là sắp đặt từ theo thứ tự trước
sau và sử dụng các hư từ (nhóm hư từ tình thái cuối câu phong phú). Thì trong tiếng Việt
không nhất thiết phải thể hiện rõ ràng bằng những từ “đã, đang, sẽ”.
- Tiếng Hàn: thuộc loại hình ngôn ngữ chấp dính, cú pháp câu cơ bản theo thứ tự “chủ
ngữ - tân ngữ - động/tính từ” C-O-V. Cấu trúc câu trong tiếng Hàn được chia cụ thể như bảng
sau:
Bảng 1. Cấu trc câu cơ bản trong tiếng Hàn
Cấu trúc
Câu ví dụ
Chủ ngữ + vị ngữ (danh từ + “là”)
“이다”: là
- 이것은 연필입니다. (Cái này là bút chì)
- 저는 학생입니다. (Tôi là học sinh)
Chủ ngữ + vị ngữ (tính từ)
- 꽃이 예뻐요. (Hoa đẹp.)
- 사람이 많아요. (Người đông.)
Chủ ngữ + vị ngữ (động từ tĩnh)
- 비가 와요. (Trời mưa.)
- 동생이 앉아요. (Đứa em đang ngồi.)
Chủ ngữ + Tân ngữ + vị ngữ (động từ động)
- 아빠가 아침을 드십니다. (Ba ăn sáng.)
- 엄마가 드라마를 보십니다. (Mẹ xem phim truyền hình.)
Chủ ngữ + Tân ngữ (có bổ ngữ) + Vị ngữ
- 내가 착한 친구를 좋아합니다. (Tôi thích bạn hiền.)

228 | KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2024
...................................................................................................................................................................................
Chủ ngữ (có định ngữ) + vị ngữ (danh từ +
“là”) “이다”: là
- 흰 치마를 입는 여자 분이 우리 담임 선생님이십니다.
(Cô gái mặc váy trắng là giáo viên chủ nhiệm của tôi.)
Chủ ngữ + vị ngữ (trạng từ + động từ)
- 비가 많이 와요. (Trời mưa to.)
- 학생들이 열심히 공부해요. (Các học sinh chăm học.)
Chủ ngữ + vị ngữ (phó từ + tính từ)
- 꽃이 아주 예뻐요. (Hoa rất đẹp.)
Chủ ngữ + Trạng ngữ chỉ nơi chốn + Tân ngữ
+ vị ngữ (động từ động)
- 엄마가 안방에서 드라마를 보십니다. (Mẹ xem phim
truyền hình trong phòng.)
Chủ ngữ + Trạng ngữ chỉ thời gian + Tân ngữ
+ vị ngữ (động từ động)
- 아빠가 7시에 아침을 드십니다. (Ba ăn sáng lúc 7 giờ.)
Trạng ngữ chỉ thời gian + Chủ ngữ + Trạng
ngữ chỉ thời gian + Tân ngữ + vị ngữ (động
từ động)
- 매일 아빠가 7 시에 아침을 드십니다. (Mỗi ngày ba ăn
sáng lúc 7 giờ.)
Một số điểm khác biệt chung trong cấu trúc câu tiếng Hàn so với tiếng Việt.
- Cuối câu tiếng Hàn luôn là động từ hoặc tính từ được chia đuôi từ.
- Đuôi từ kết thúc câu trong tiếng Hàn thể hiện được thì của câu, ý đồ của người nói,
dạng kính ngữ/ngang hàng/trung lập, thể bị động/thể truyền khiến.
- Tiếng Hàn có các trợ từ nằm sau các từ loại như đại từ, danh từ, trạng từ, số từ để chỉ
từ đó đóng vai trò gì trong câu (Vd: trợ từ “이/가” đứng sau danh từ để chỉ danh từ đó là
chủ ngữ; trợ từ “을/를” đứng sau danh từ để chỉ danh từ đó là tân ngữ).
- Trạng ngữ chỉ thời gian và nơi chốn có thể đặt ở đầu câu, giữa câu nhưng không được
đặt ở cuối câu.
- Câu có thể không có chủ ngữ và không có các trường hợp viết hoa đầu câu hay tên
riêng.
3. PHƯƠNG PHÁP NGHIÊN CỨU
Đối tượng nghiên cứu: bản dịch tiếng Hàn bài quảng bá trường ĐH Ngoại ngữ - Tin
học TP. HCM
Phạm vi nghiên cứu: các lỗi từ vựng, lỗi trợ từ, lỗi ngữ pháp (cấu trúc câu, đuôi từ liên
kết câu, đuôi từ kết thúc câu) phát sinh khi dùng Google Translate và ChatGPT để dịch bài
quảng bá.
Phương pháp so sánh đối chiếu: dùng kết quả của bản dịch (dịch tự động và dịch truyền
thống) thực hiện trên bình diện cú pháp, bình diện ngữ nghĩa. Kết hợp với phương pháp miêu
tả để xác định vị trí của lỗi trong câu tiếng Hàn khi dịch tự động từ Việt sang Hàn.
Nguồn dữ liệu cơ sở: nội dung quảng bá bằng video clip của HUFLIT.
Ý nghĩa khoa học - thực tiễn: 1. Về mặt ngôn ngữ: tạo thêm nguồn tài liệu tham khảo
liên quan đến các lỗi từ vựng/ngữ pháp trong dịch tự động và dịch truyền thống (người dịch

NGÔN NGỮ HỌC TÍNH TOÁN: NHỮNG XU HƯỚNG MỚI, TRIỂN VỌNG VÀ THÁCH THỨC | 229
...................................................................................................................................................................................
trực tiếp). 2. Về mặt thực tiễn: hỗ trợ cải thiện các lỗi và nâng cao chất lượng trong dịch tự
động, là ví dụ thực tế cho học phần dịch thuật.
4. ĐỐI CHIẾU NỘI DUNG DỊCH
Quá trình dịch và đối chiếu diễn ra qua 4 bước, thời gian thực hiện dịch tự động từ
ngày 8 đến 15/7/2024.
Bước 1: cho ngôn ngữ nguồn (nội dung quảng bá bằng tiếng Việt) vào GT.
Bước 2: cho ngôn ngữ nguồn (nội dung quảng bá bằng tiếng Việt) vào ChatGPT
Bước 3: dịch truyền thống (người viết tự dịch và nhờ người Hàn biết tiếng Việt kiểm
tra)
Bước 4: lấy nội dung dịch truyền thống làm chuẩn để so sánh, rà soát, truy vấn lỗi sai
hoặc cách dùng từ chưa chính xác của ngôn ngữ đích được dịch tự động.
Ngôn ngữ
nguồn (1)
Con người sinh ra với nhiều sự lựa chọn, có người chọn thành thị, có người chọn
nông thôn. Có người chọn văn hóa truyền thống, có người chọn cuộc sống hiện
đại. Có người chọn sống một cuộc đời rực rỡ, có người chọn sự tĩnh lặng.
Google
Translate
사람들은 많은 선택권을 갖고 태어나며, 어떤 사람은 도시 지역을 선택하고,
어떤 사람은 시골 지역을 선택합니다. 어떤 사람은 전통 문화를 선택하고,
어떤 사람은 현대 생활을 선택합니다. 어떤 사람은 화려한 삶을 선택하고,
어떤 사람은 침묵을 선택합니다.
Lỗi về logic: “Con người sinh ra với nhiều sự lựa chọn” thì chuyển sang tiếng Hàn
thành “Con người có nhiều sự lựa chọn rồi sinh ra” 사람들은 많은 선택권을
갖고 태어나며
Lỗi thừa từ vựng: Sau từ “thành thị/thành phố” (도시) và từ nông thôn (시골)
không cần thêm từ khu vực (지역)
Lỗi từ vựng: từ “침묵” nghĩa là “sự im lặng (không nói)”
ChatGPT
사람은 많은 선택지를 가지고 태어납니다. 어떤 사람은 도시를 선택하고,
어떤 사람은 시골을 선택합니다. 어떤 사람은 전통 문화를 선택하고, 어떤
사람은 현대 생활을 선택합니다. 어떤 사람은 화려한 인생을 선택하고, 어떤
사람은 고요함을 선택합니다.
Lỗi về logic: tương tự như Google Translate
Dịch truyền
thống
모든 사람들은 태어날 때부터 선택의 자유가 있습니다. 어떤 사람은 도시를
선택하고, 어떤 사람은 시골을 선택합니다. 어떤 사람은 전통 문화를