
14 | KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2024
...................................................................................................................................................................................
NHỮNG VẤN ĐỀ ĐẶT RA ĐỐI VỚI VIỆC XÂY DỰNG
VÀ PHÁT TRIỂN MẠNG TỪ TIẾNG VIỆT
PHẠM VĂN LAM*
Tóm tắt: Báo cáo cung cấp một bức tranh khái quát về lịch sử phát triển của Mạng từ,
Mạng từ tiếng Việt, và đồng thời giới thiệu những vấn đề ngôn ngữ học quan trọng cần được
đặt ra trong quá trình xây dựng, phát triển và hoàn thiện Mạng từ tiếng Việt. Để phát triển và
hoàn thiện Mạng từ tiếng Việt, báo cáo đã đặt ra và sơ bộ thảo luận về các vấn đề như: cấu
trúc vĩ mô của Mạng từ tiếng Việt, các dấu hiệu hình thức được sử dụng để xác định các quan
hệ ngữ nghĩa, mối quan hệ giữa cơ chế từ pháp và quan hệ ngữ nghĩa trong Mạng từ tiếng Việt.
Bên cạnh đó, báo cáo cũng đã đề cập đến vấn đề từ Hán Việt và sự xuất hiện của các từ thuộc
trường hợp và đặc trưng văn hóa Việt Nam trong Mạng từ tiếng Việt.
Từ khoá: Mạng từ, Mạng từ tiếng Việt, quan hệ ngữ nghĩa, dấu hiệu hình thức, cơ chế
từ pháp, từ Hán Việt, từ thuộc trường hợp.
1. Khái quát về lịch sử mạng từ
1.1. Mng t l g?
Mạng từ (WordNet) là một sản phẩm liên ngành chủ yếu của ngôn ngữ học, tâm lí học
và khoa học máy tính. Mạng từ là một cơ sở ngữ liệu lớn, được thiết kế cho một hay nhiều
ngôn ngữ, trong đó các từ được nhóm lại thành các loạt đồng nghĩa/loạt đồng nghĩa tri nhận;
mỗi loạt đồng nghĩa này thể hiện một khái niệm/nghĩa riêng biệt; các loạt đồng nghĩa khác
nhau có gắn kết với nhau nhờ vào các quan hệ ngữ nghĩa. Loạt đồng nghĩa là một nhóm các
từ cùng từ loại và có thể thay thế cho nhau trong một số ngữ cảnh nhất định [6]. Các quan hệ
ngữ nghĩa chủ yếu có tác dụng kết nối các loạt đồng nghĩa lại với nhau là quan hệ bao thuộc
(hyponymy/hypernymy), quan hệ tổng phân (meronymy/holonymy), quan hệ cách
(troponymy), quan hệ trái nghĩa, quan hệ nhân quả (causonomy), quan hệ suy ra (entailment),
quan hệ vai (semantic role), quan hệ thuộc tính (attribute). Cần lưu ý là quan hệ đồng nghĩa là
quan hệ trong nội tại của các từ đồng nghĩa trong loạt đồng nghĩa; quan hệ đồng nghĩa không
nối kết các loạt đồng nghĩa với nhau; các loạt đồng nghĩa tồn tại trong Mạng từ với tư cách là
những thực thể.
Nói đơn giản hơn, chúng ta có thể hình dung Mạng từ giống như là một đồ thị rời rạc
khổng lồ trong đó mỗi nút là một loạt từ đồng nghĩa và mỗi cạnh là một quan hệ ngữ nghĩa
nối cc nt là loạt đồng nghĩa khc nhau lại với nhau. Hoặc để dễ hiểu hơn chúng ta có thể
diễn giải như thế này: Nếu một hệ thống có 2 phần tử, chúng ta có hai quan hệ; nếu có 3 phần
tử, chúng ta có 3 quan hệ; nếu có 5 phần tử, chúng ta có 10 quan hệ,…; có n phần tử, chúng ta
* TS, Viện Ngôn ngữ học; Email: phamvanlam1999@gmail.com