NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 87
...................................................................................................................................................................................
KH NĂNG HIỂU CA GOOGLE TRANSLATE
KHI DỊCH CÂU MƠ HỒ TING VIT SANG TING HÀN
TRẦN VĂN TIẾNG* - NGUYN TH KIM NGC**
Tóm tt: Google translate là phn mm dch thut trc tuyến do Google phát trin, h
tr dch t động t mt ngôn ng t nhiên sang mt ngôn ng khác tương đương. Hiện ti,
Google translate được nhiu ngưi, nhiu gii s dng trong hc tp, dch thut do tính cht
nhanh l, cp thi ca nó. Tuy nhiên, đối vi mt ngôn ng t nhiên như tiếng Vit, vic dch
những câu mơ hồ tiếng Vit sang tiếng Hàn không mang li kết qu như mong muốn. Chính vì
vy, yêu cu làm mất hồ (câu tr nên đơn nghĩa) t ngôn ng ngun (tiếng Vit) để đạt được
kết qu chính xác ngôn ng đích (tiếng Hàn) là yêu cu cn thiết.
T khóa: Câu mơ hồ, cấu trúc, mơ hồ cu trúc, ngôn ng ngun, ngôn ng đích.
1. GII THIU
Trong tiếng Vit, thnh thong chúng ta đọc được trên báo nhng câu sau:
(1) Mt bnh vin thưởng tết cho h lý bng giám đốc [1].
(2) Bùi Tiến Dũng th l vic v có bu vi cu HLV trưởng đội tuyn Vit Nam
ti sân Hàng Đẫy [2].
(3) Lái xe container đè ô tô, 3 người t vong Long Biên khai gì vi công an [3].
(4) Biu tình ln Berlin phản đối vin tr Ukraine và chng Nga [4].
Nhng câu trên có nhng cách hiu khác nhau trong mi câu.
Vi (1), ta có cu trúc thưởng - cho A - bng B”; trong đó “thưởngvi nghĩa Cho
tin, hin vt, v.v…để t ý khen ngi và khuyến khích v đ có công, có vic làm tt, ví d:
thưởng tin, thưởng huân chương,...[5, tr.943]; trong khi bnglà mt kết t biu th điều
sp nói ra là phương tiện, phương php ca hot động được nói đến, ví dụ: Đi bằng my bay,
Tr bng mt gi rt đắt [5, tr.43], cho nên câu (1) đã cho ta cách hiu th 1: gim đốc phn
thưởng cho h .
(1a) Mt bnh viện thưởng tết cho h lý mà phần thưởng là giám đốc.
Trong khi, ng ý ca người viết câu này không phi thế, mà là mức thưởng tết ca h
lý bng mức thưởng ca gim đốc, đây là cách hiều th 2.
(1b) Mt bnh viện thưởng tết cho h lý bng mc (ca) giám đốc.
Với trường hp (2), do cu trúc th l - vic [X vi A]cho nên đã cho ta cách hiu:
(2a) Bùi Tiến Dũng th l vic v có bu vi cựu HLV trưởng đội tuyn Vit Nam ti
sân Hàng Đẫy.
Đồng thi, câu (2) li còn có cách hiu khác: th l - vi A - (v) [vic X]”:
* TS, Trường Đi hc Ngoi ng - Tin hc TP. H Chí Minh; Email: tiengtv@huflit.edu.vn
** ThS, Trường Đi hc Ngoi ng - Tin hc TP. H Chí Minh; Email: ngocntk@huflit.edu.vn
88 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
(2b) Bùi Tiến Dũng th l vi cựu HLV trưởng đi tuyn Vit Nam ti sân Hàng Đẫy
(v) vic v có bu.
Riêng câu (3), do cm khai gì vi công anđặt ngay sau “3 người t vong Long
Biênkhiến câu này có 2 cách hiu:
(3a) Lái xe container đè ô tô, 3 người t vong Long Biên khai g vi công an.
(3b) Xe container đè ô tô, 3 người t vong Long Biên, li xe khai g vi công an.
Do cu trúc phn đối X - và - Y”, trong đó X - và - Y mt cấu trúc đng lp,
nếuphn đốitác động lên c X và Y thì ta có cách hiu (4a):
(4a) Biu tình ln Berlin phản đối vin tr Ukraine và [phản đối vic] chng Nga.
Tuy nhiên, câu (4) cũng có th hiểu như (4b); khi mà phản đốich tác động lên X
không tác động lên Y. Lúc này Biu tình ln Berlin2 mục đích: phản đối vin tr
Ukrainevà chng Nga”.
(4b) Biu tình ln Berlin phản đối vin tr Ukraine và/ [cùng vi] chng Nga.
Nhng trưng hp trên được gi là câu mơ hồ (Ambiguous sentence) trong tiếng Vit.
Theo Nguyn Đức Dân Một câu mơ hồ là một câu trong khi có một biểu hiện duy nhất ở cấp
độ ngôn ngữ này lại có ít nhất hai cch biểu hiện ở cấp độ ngôn ngữ khc” [6, tr.65]. Thc tế,
trong khi viết, do không chú ý, vô tình chúng ta đã to ra những câu mơ hồ; đó là nhng câu
có 2 hoặc hơn 2 cách hiu khác nhau. Nguyễn Đức Dân cũng cho rng ngôn ng t nhiên nào
cũng có hiện tượng mơ h, và nghiên cu v tính mơ hồ trong ngôn ng còn thêm mt ý nghĩa
thc tế quan trng trong lĩnh vc trí tu nhân to (Artificial intelligence), các máy thông minh
khi giao tiếp với con người cn hiu chính xác nhng gì mà con người truyền đạt (…).
Ngay t khi xut hin s ng dng máy tính điện t để dch t động (dch máy), các nhà ngôn
ng hc và tin học đã thy nghĩa thc tin quan trng ca nghiên cu v tính hồ
trong các ngôn ng t nhiên [6, tr.66].
Cũng theo theo Nguyn Đức Dân và Trn Th Ngọc Lang, mơ hồ là mt hin ng tt
yếu ca ngôn ng t nhiên. Trong mt câu, các t đưc đứng theo mt th t tuyến tính nhưng
chúng li có kh năng kết hp vi nhau mt cách không tuyến tính (kết hp bt liên tc) do đó
s lượng các kh năng y rt ln. Tt yếu vì thế s dn ti những trường hp mt chui t có
th hiểu theo hơn một kiu kết hp. Lúc đó chui t được gi là hồ cu trúc hoặc h
logic [7, tr.91]. Ví d như câu (4) trên, c t kết hp theo trt t tuyến tính đúng vi trt t
cú pháp tiếng Vit. Tuy nhiên, kh năng kết hp gia phản đốivi X - Y (trong mt cu trúc
đẳng lp "X và Y”) là kết hp "bt liên tc”, do vy khi "phản đối" không tác động lên Y ta s
có thêm cách hiu th 2 là (4b).
Căn cứ nhng điều trình bày trên, bài viết này th xem xét kết qu dch ca Google
translate những câu mơ hồ tiếng Vit sang tiếng Hàn và đề xut gii pháp khc phc.
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 89
...................................................................................................................................................................................
2. NHNG HN CH CA GOOGLE TRANSLATE KHI DCH NHNG CÂU
MƠ HỒ TING VIT SANG TING HÀN
2.1. Mt s kết qu dịch câu mơ hồ ca Google translate
Theo mt kết qu kho sát gn đây, với câu hỏi đặt ra cho 100 sinh viên 4 lp tiếng
Anh ti Đại hc Quc gia Hà Ni: Nhng ng dng ca ngôn ng hc máy tính thường được
sinh viên s dng trong các lp hc ngoi ngthì nhn được câu tr li là 100% sinh viên
dùng Google dch sau đó mới đến các ng dng khác như Translator Online, Foreign Word,
Web Trance [8, tr.73-74]. Điều này cho thy Google translate (GT) là la chọn ưu tiên của
nhiu người khi cn phi dch cp thi một văn bản. Tuy nhiên, kh năng hiểu và dch nhng
câu mơ hồ t ngôn ng ngun (source language) sang ngôn ng đích (target language) ca GT
còn nhiu điều đáng nói. Chng hn vi 4 câu trên, GT dch sang tiếng Hàn s là:
(1) Mt bnh viện thưởng tết cho h lý bng giám đốc.
=> , 원장 간호사에게 지급.
[Hiu là: Bnh viện thưởng Tết cho y tá cp gim đốc]
(2) Bùi Tiến Dũng th l vic v có bu vi cu HLV trưởng đội tuyn Vit Nam
ti sân Hàng Đẫy.
=> 부이띠엔둥 (Bui Tien Dung) 데이 경기장에서 베트 에게 아내
임신 백했.
[Hiu là: Bùi Tiến Dũng th nhận vi cu HLV tuyn Vit Nam rng v anh có thai
trên sân Hàng Đẫy]
(3) Lái xe container đè ô tô, 3 người t vong Long Biên khai gì vi công an.
=> 에서 컨테 트럭 운전사가 승용 3 명이 망했는데,
라고 말했나요?
[Hiu là: Tài xế xe container tông xe Long Biên, 3 người chết, nói gì vi công an?]
(4) Biu tình ln Berlin phản đối vin tr Ukraine và chng Nga.
=> 에서는 라이나 대한 지원과 시아에 반대하는 시위
습니다.
[Hiu là: Các cuc biu tình rm r đ diễn ra Berlin để ng h Ukraine chng
li Nga]
Phân tích kết qu dch ca GT nhng câu trên, ta thy vic dch t động ca GT rt
máy móc. câu (1), GT đã không hiu bng giám đốccho nên đã dch thành "원장급" (cp
giám đốc). Đối vi câu (2), GT có th đã hiumt chút, đã làm rõ nghĩa v anh (Bùi Tiến
Dũng) có thai ch không phi có thai vi cựu HLV trưởngnhưng GT lại to ra mt cách
hiu khác: có thai trên sân Hàng Đẫy. Câu (3) giống như câu (2), kh năng hiu ca GT có
khá hơn; GT đã làm rõ tài xế nói (khai) gì vi công anch không phi “3 người t vong nói
gì vi công an. Tuy nhiên, cũng như câu (2), GT đã không xóa được mơ hồ ch Tài xế xe
90 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
container tông xe Long Biên”. Cui cùng với câu (4), GT đã gp rc rikhi dch thành:
에서는 라이나에 대한 원과 러시아 반대하는
습니다 (Các cuc biu tình rm r đ diễn ra Berlin để ng h Ukraine và chng li
Nga). GT đã hiu sai cho nên t ch phản đối vin tr Ukraine đã tr thành “ủng h
Ukraine”, và chng li Ngalà mc tiêu th hai ca các cuc biu tình rm r Berlin”.
2.2. Th nghim dch mt s cu trúc mơ hồ tiếng Vit sang tiếng Hàn ca GT
ới đây, chúng tôi th cho GT dch mt s câu hồ thuc nhng cu trúc khác
nhau t tiếng Vit sang tiếng Hàn để xem kh năng hiểu của GT đến mức độ nào.
2.2.1. Câu có cu trc X- Y- ca - N
Ví d: (5) Robot có cm xúc ca chàng trai gc Vit.
Trong (5), nếu X (Robot) tác động lên N (chàng trai gc Vit) theo quan h s hu "X
ca N", thì ta có cách hiu th 1:
(5a) Robot ca chàng trai gc Vit, [có cm xúc].
Tuy nhiên, nếu hiu Y thuc v N (theo quan h s hu "Y ca N"), thì lúcy ta
cách hiu th 2 (5b), cách hiu này nhn mnh: có cm xúc ca chàng trai gc Vit.
(5b) Robot có cm xc ca chàng trai gc Vit.
GT đã dch u (5) sang tiếng Hàn là: 베트 남자의 감정을 가지
있습니다.
Hiu là: Robot nhng cm xúc ca một người đàn ông Vit Nam. GT đã hiu câu
(5) theo (5b).
Ví d khác:
(6) Quyết định không thi nồng độ cn với người th xây ca giám đốc công an
Hà Tĩnh [9].
Câu này có 2 cách hiu, nếu X (quyết định) tác động lên N (giám đốc công an Tĩnh)
thì ta có cách hiu (6a) :
(6a) Quyết định [không thi nồng độ cn (…)] ca giám đốc công an Hà Tĩnh.
Và nếu hiu “Y của N” thì ta có cách hiểu (6b), lúc này “quyết định”của ai đó chứ
không phi của giám đốc công an Hà Tĩnh:
(6b) [Quyến định không thi nồng độ cn với] người th xây ca giám đốc công an Hà
Tĩnh.
GT đã dịch câu (6) như sau: 하띤 (Ha Tinh) 찰청장이 동자에게 알코올
도를 폭파하지 기로 .
Hiu là: Cảnh st trưởng Tĩnh quyết định không dùng rượu n công nhân xây dng.
Như vậy GT tm hiu theo (6a), GT cũng không hiểu thi nồng độ cn”.
2.2.2. Câu có cu trc X - A - vi - B
Ví d:
(7) Em s không nói chuyn ca ch vi anh Ba [6, tr.84].
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 91
...................................................................................................................................................................................
Câu (7) s2 cách hiu: khi vi trong A vi B mt liên t kết ni A-B đồng
đẳng, lúc y vitương đương như trong mt cấu trúc đẳng lập A và B, ta cách
hiu (7a):
(7a) Em s không nói chuyn ca ch và anh Ba [cho ai đó biết].
Đồng thi, nếu “vi trong A vi Bmt liên t biu th ý hướng tới đối tượng cn
tác động thì lúc này vi” tương đương với “cho, ta có cách hiu (7b):
(7b) Em s không nói chuyn ca ch cho anh Ba [biết].
"Anh Ba" lúc này tr thành đối tượng tiếp nhn "chuyn ca ch".
GT đã dch câu (7): 나는 바씨 신에 대해 야기하 입니.
Hiu là: Tôi s không nói v bn vi anh Ba. Câu vẫn hồ, không rõ hiu theo (7a)
hay (7b).
2.2.3. Câu có cu trc: X - Y - P
Trong cu trúc này, P là thành phn ph, thường là trng ng ch địa điểm, X và Y là
các t/ cm t bt kỳ. Mơ hồ xy ra do phm vi tác động ca P lên X hoc Y. Ví d :
(8) Tôi đã thấy người đàn ông trên đường [6, tr.70].
Câu này có 2 cách hiu:
(8a) Tôi đã thy người đàn ông, người đàn ông trên đường [P tác động lên Y].
(8b) Tôi đã thấy người đàn ông, khi tôi trên đường [P tác động lên X].
GT đã dch câu (8) như sau: 나는 에서 남자 았다.
Hiu là: Tôi nhìn thấy người đàn ông trên đường ph. Câu vẫn mơ hồ.
(9) Các n nhân viên quán cà phê có hành vi bán dâm tại cơ quan công an.
Hai cách hiu ca câu (9) là:
(9a) Các n nhân viên (…) tại cơ quan công an [P tác động lên X].
(9b) Các n nhân viên (…) bán dâm tại cơ quan công an [P tác động lên Y].
GT đã dịch câu (9) như sau: 커피전문점 직원 서에서 성매매를 .
Hiu là: V n nhân viên quán phê bán dâm ti đồn công an. Vy GT hiu theo
(9b).
hồ cũng xy ra trong cu trúc X Y P khi P là mt cm t b tr, b tr ngay
trên Y. Ví d :
(10) Vit Nam giành huy chương ng môn kiếm chém đồng đội (THTV,
06/12/2019).
đây “đồng đội là P đã tác động ngay lên t hp lin k là môn kiếm chém (Y),
to ra cách hiu Vit Nam giành huy chương ng môn kiếm chm đồng đội(10a), trong
khi, l ra P phi tác động lên X đ có cách hiểu đúng là Vit Nam giành huy chương ng
đồng đội môn kiếm chém (10b).
GT đã dch câu (10): 베트남이 단체전에서 달을 획득했습니.