
434 | KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2024
...................................................................................................................................................................................
BƯỚC ĐẦU TÍCH HỢP TRI THỨC NHỊP THƠ
VÀO MÔ HÌNH DỊCH NGHĨA TỰ ĐỘNG
THƠ CHỮ HÁN VIỆT NAM SANG TIẾNG VIỆT HIỆN ĐẠI
THÁI HOÀNG LÂM* - ĐINH ĐIỀN**
Tóm tắt: Thơ chữ Hán Việt Nam là những thi phẩm được các thi gia Việt Nam sáng
tác bằng chữ Hán trong những thế kỷ trước. Với thế hệ người Việt hiện nay, giải mã những
tác phẩm này sang tiếng Việt hiện đại là một trong những nhiệm vụ cấp thiết nhằm bảo tồn và
phát huy những cái hay, cái đẹp của các bậc tiền nhân khi mà văn tự Hán cổ đã không còn là
hệ chữ viết chính thức ở Việt Nam. Đứng trước nhiệm vụ này, các nhà nghiên cứu ngôn ngữ
học máy tính đang dần đưa ra những mô hình tự động hoá việc giải mã từ tác vụ số hoá, phiên
âm cho đến dịch nghĩa, trong đó dịch nghĩa vẫn là một bài toán thách thức nhất. Trong nghiên
cứu này, dựa trên tri thức về nhịp – một trong những đặc trưng cơ bản của thơ, chúng tôi bước
đầu đưa ra phương pháp tích hợp tri thức nhịp vào mô hình dịch nghĩa tự động với kiến trúc
Transformer. Kết quả nghiên cứu cho thấy, tri thức về nhịp có nhiều tác động đến đến tác vụ
dịch nghĩa thông qua việc cải thiện chất lượng dịch. Đây sẽ là động lực để thực hiện các nghiên
cứu sâu hơn cho việc ngắt nhịp thơ tự động để hỗ trợ cho bài toán dịch nghĩa tự động Hán thi
Việt Nam sang tiếng Việt hiện đại.
Từ khóa: Thơ chữ Hán Việt Nam, dịch nghĩa tự động, nhịp thơ, tri thức ngôn ngữ,
Transformer.
1. GIỚI THIỆU
Từ giữa thế kỷ XX về trước, cùng sử dụng chữ Hán để sáng tác văn chương nhưng
Hán văn Việt Nam lại mang những nét đặc thù so với Hán văn của Trung Quốc và các nước
từng đồng văn khác. Bởi lẽ, ánh sáng văn hoá, truyền thống của người Việt đã khiến những
áng thơ chữ Hán ấy mang trong hình hơi thở của ngôn ngữ Việt, dáng vóc của non sông Việt
Nam và đồng thời phản ánh những biến đổi thăng trầm của xã hội Việt Nam trong quá khứ
[1]. Nói cách khác, văn học chữ Hán Việt Nam chất chứa những “cái riêng” giữa “cái chung”
của nền văn học văn tự Hán, như cách Trần Ngọc Vương [2] nói về văn học Việt Nam, đó là
“dòng riêng giữa nguồn chung”. Lấy ví dụ nét riêng về mặt ngôn ngữ, ngoài vốn từ Hán chung,
người Việt chúng ta còn sáng tạo ra những từ Hán Việt không có trong từ điển tiếng Hán và
sử dụng làm chất liệu cho tác phẩm văn chương chữ Hán như thủy triều (水潮), phù sa (浮沙
)[3]…Ngoài ra, hệ thống danh từ riêng chỉ nhân danh, địa danh của Việt Nam cũng là những
đặc trưng riêng trong ngôn ngữ thơ chữ Hán Việt Nam.
* Trường Đại học Khoa học Tự nhiên, ĐHQG TP. HCM; Email: lamhoangthai.work@gmail.com
** PGS. TS, Trường Đại học Khoa học Tự nhiên, ĐHQG TP. HCM; Email: ddien@fit.hcmus.edu.vn