
NGÔN NGỮ HỌC TÍNH TOÁN: NHỮNG XU HƯỚNG MỚI, TRIỂN VỌNG VÀ THÁCH THỨC | 455
...................................................................................................................................................................................
KHÁM PHÁ NỀN TẢNG PHÂN LOẠI NGỮ NGHĨA
TRÊN CÁC HỆ THỐNG NHÃN NGỮ NGHĨA
DANH TỪ TIẾNG ANH
PHAN THỊ MỸ TRANG* - ĐINH ĐIỀN**- TRẦN THỊ MINH PHƯỢNG***
Tóm tắt: Sự tồn tại của các hệ thống nhãn ngữ nghĩa đã tạo điều kiện thuận lợi cho
việc tìm kiếm thông tin theo trường ngữ nghĩa. Nghiên cứu này sử dụng phương pháp mô tả
và so sánh đối chiếu nhằm khám phá nền tảng lý thuyết về phân loại ngữ nghĩa trên các hệ
thống như Longman Lexicon of Contemporary English (LLOCE) (McArthur, 1988), UCREL
Semantic Analysis System (USAS) (Rayson và các tác giả khác, 2004) và WordNet (Miller
và các tác giả khác, 1990), đồng thời tìm ra điểm tương đồng và dị biệt cũng như ưu điểm và
hạn chế của chúng. Các phát hiện cho thấy hệ thống nhãn ngữ nghĩa LLOCE và UCREL chủ
yếu dựa trên nghĩa chủ đề, trong khi WordNet dựa trên nghĩa ý niệm. Kết quả nghiên cứu giúp
hiểu sâu hơn về phân loại ngữ nghĩa, từ đó đề xuất loại nghĩa và số tầng phân loại phù hợp
trong xây dựng hệ thống nhãn ngữ nghĩa cho danh từ tiếng Việt dưới góc độ ngôn ngữ học,
góp phần ứng dụng trong xử lý ngữ nghĩa tự động, giảng dạy và nghiên cứu ngữ nghĩa học từ
vựng.
Từ khóa: phân loại ngữ nghĩa, hệ thống nhãn ngữ nghĩa, LLOCE, UCREL, WordNet.
1. GIỚI THIỆU
Phân loại ngữ nghĩa đóng vai trò quan trọng trong việc tổ chức các khái niệm theo
trường nghĩa. Sự phát triển của các hệ thống nhãn ngữ nghĩa đã mở ra những hướng tiếp cận
mới như hỗ trợ tìm kiếm thông tin, cung cấp công cụ phân tích và xử lý ngữ nghĩa tự động.
Trong tiếng Anh, ba hệ thống phổ biến là Longman Lexicon of Contemporary English
(LLOCE), UCREL Semantic Analysis System (USAS) và WordNet; mỗi hệ thống có cách
tiếp cận riêng về phân loại ngữ nghĩa, tạo nên sự đa dạng trong xử lý ngữ nghĩa. Đối với tiếng
Việt, việc triển khai hệ thống nhãn ngữ nghĩa từ góc độ ngôn ngữ học còn hạn chế. Các hệ
thống hiện tại thường dựa trên việc chuyển dịch ngôn ngữ từ tiếng Anh sang tiếng Việt, dẫn
đến một số khó khăn như: chỉ dịch được một nghĩa của từ và bỏ sót các nghĩa khác; hoặc có
những khái niệm có trong ngôn ngữ này nhưng không có trong ngôn ngữ kia do sự khác biệt
* NCS, Trường Đại học Khoa học xã hội và Nhân văn - ĐHQG TP. HCM; ThS, Trường Đại học
Công nghệ Sài Gòn; Email: mytrang779@gmail.com
** PGS.TS, Trường Đại học Khoa học Tự nhiên, ĐHQG TP. HCM; Email: ddien@fit.hcmus.edu.vn
*** TS, Trường Đại học Khoa học xã hội và Nhân văn, ĐHQG TP. HCM; Email:
minhphuongtrn@hcmussh.edu.vn