
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN NHO TÚY
ÀNG THỊ MỸ LỆ
Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số : 62.48.01.01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Đà Nẵng, năm 2020

i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN NHO TÚY
NGHIÊN CỨU NGỮ NGHĨA VÀ HIỆN TƯỢNG NHẬP NHẰNG
TRONG TIẾNG VIỆT, TIẾP CẬN XỬ LÝ VẤN ĐỀ VIẾT TẮT TIẾNG VIỆT
Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số : 62.48.01.01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người hướng dẫn khoa học:
PGS.TS. PHAN HUY KHÁNH
Đà Nẵng, năm 2020

ii
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi, dưới sự hướng dẫn trực tiếp
của PGS. TS. Phan Huy Khánh, hiện là cán bộ giảng dạy tại Đại học Bách Khoa, Đại
học Đà Nẵng.
Tôi cam đoan các kết quả được trình bày trong luận án là trung thực,
không sao chép từ bất kỳ luận án hay nguồn tài liệu nào khác và chưa từng được ai công
bố trong bất kỳ công trình nào khác. Mọi trích dẫn tài liệu tham khảo đều có ghi nguồn
gốc xuất xứ rõ ràng.
Nếu có gì không trung thực, tác giả xin chịu hoàn toàn trách nhiệm.
Tác giả,
Nguyễn Nho Túy

iii
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. ii
DANH MỤC CÁC CHỮ VIẾT TẮT ................................................................. vii
DANH MỤC HÌNH ẢNH .................................................................................... ix
DANH MỤC BẢNG BIỂU .................................................................................. xi
MỞ ĐẦU ................................................................................................................1
1. ĐẶT VẤN ĐỀ ................................................................................................1
2. MỤC TIÊU, ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU .........................5
2.1. Mục tiêu ........................................................................................................5
2.2. Đối tượng ......................................................................................................5
2.3. Phạm vi .........................................................................................................6
3. PHƯƠNG PHÁP NGHIÊN CỨU .................................................................6
4. BỐ CỤC CỦA LUẬN ÁN .............................................................................7
5. ĐÓNG GÓP CỦA LUẬN ÁN .......................................................................8
CHƯƠNG 1. VẤN ĐỀ CHỮ VIẾT TẮT TIẾNG VIỆT .................................... 11
1.1. NGÔN NGỮ VÀ XỬ LÝ NGÔN NGỮ TỰ NHIÊN .................................... 11
1.1.1. Ngôn ngữ và xử lý ngôn ngữ ................................................................ 11
1.1.2. Âm, chữ viết và vấn đề cải tiến chữ viết ............................................... 12
1.1.3. Các loại hình ngôn ngữ........................................................................ 13
1.1.4. Xử lý ngôn ngữ tự nhiên ....................................................................... 14
1.1.5. Vấn đề xử lý tiếng Việt ......................................................................... 16
1.2. NGỮ NGHĨA VÀ NHẬP NHNG NGỮ NGHĨA TIẾNG VIỆT ............... 18
1.2.1. Ngữ ngha và ngữ ngha học ................................................................ 18
1.2.2. Phân tích ngha của từ ......................................................................... 19
1.2.3. Sự biến đổi của từ vựng và ngữ ngha .................................................. 20
1.2.4. Nhập nhng ngữ ngha trong tiếng Việt ............................................... 22
1.3. CHỮ VIẾT TẮT TRONG CUỘC SỐNG .................................................... 25
1.3.1. Chữ viết tt là gì .................................................................................. 25
1.3.2. Lịch sử hình thành chữ Quốc ngữ ........................................................ 26
1.3.3. Tìm hiểu về lịch sử chữ viết tt ............................................................ 27
1.3.4. Sử dụng chữ viết tt ............................................................................. 28
1.3.5. Chữ viết tt trong tiếng Việt ................................................................. 31
1.4. NGỮ NGHĨA CHỮ VIẾT TẮT ................................................................... 32

iv
1.4.1. Khái niệm ngữ ngha chữ viết tt ......................................................... 32
1.4.2. Biến đổi ngữ ngha chữ viết tt ............................................................ 33
1.4.3. Nhập nhng chữ viết tt ....................................................................... 34
1.4.4. Xử lý nhập nhng chữ viết tt .............................................................. 35
1.4.5. Đề xuất nghiên cứu chữ viết tt tiếng Việt ............................................ 36
1.5. TÓM TẮT CHƯƠNG 1 ................................................................................ 37
CHƯƠNG 2. XÂY DỰNG HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG
VIỆT ..................................................................................................................... 38
2.1. CÁC TÌNH HUỐNG HÌNH THÀNH CHỮ VIẾT TẮT ............................. 38
2.1.1. Mô hình sự hình thành chữ viết tt ....................................................... 38
2.1.2. Đc điểm hình thành chữ viết tt tiếng Việt ......................................... 40
2.1.3. Quy tc hình thành chữ viết tt tiếng Việt ............................................ 41
2.1.4. Những yếu tố khác ảnh hưởng đến thành lập chữ viết tt ..................... 44
2.2. TÌM HIỂU HỆ SINH THÁI PHẦN MỀM .................................................. 47
2.2.1. Hệ sinh thái phần mềm là gì ................................................................ 47
2.2.2. Mô hình hóa hệ sinh thái phần mềm .................................................... 48
2.2.3. Đc điểm một hệ sinh thái phần mềm................................................... 50
2.2.4. Lợi ích ứng dụng hệ sinh thái phần mềm .............................................. 51
2.3. HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG VIỆT (AMES) ...... 51
2.3.1. Hệ thống khai thác phần mềm .............................................................. 51
2.3.2. Đề xuất xây dựng hệ thống khai thác chữ viết tt ................................. 52
2.3.3. Mô hình hệ thống khai thác chữ viết tt ............................................... 53
2.4. THỰC NGHIỆM XÂY DỰNG AMES ........................................................ 54
2.4.1. Xây dựng nguồn tài nguyên chữ viết tt tiếng Việt ............................... 55
2.4.2. Xây dựng công cụ khai thác chữ viết tt ............................................... 55
2.4.3. Xây dựng giải pháp xử lý nhập nhng chữ viết tt ............................... 55
2.5. TÓM TẮT CHƯƠNG 2 ................................................................................ 56
CHƯƠNG 3. XÂY DỰNG NGUỒN TÀI NGUYÊN CHỮ VIẾT TẮT ............. 57
3.1. XÂY DỰNG CƠ SỞ DỮ LIỆU CHỮ VIẾT TẮT ...................................... 57
3.1.1. Mô hình quan hệ dữ liệu ...................................................................... 57
3.1.2. Triển khai cài đt ................................................................................. 59
3.2. GIẢI PHÁP THU THẬP DỮ LIỆU CHỮ VIẾT TẮT ................................ 60
3.2.1. Thu thập dữ liệu thủ công .................................................................... 60
3.2.2. Thu thập dữ liệu tự động ...................................................................... 61

