BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN NHO TÚY
ÀNG THỊ MỸ L
Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số : 62.48.01.01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Đà Nẵng, năm 2020
i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN NHO TÚY
NGHIÊN CỨU NGỮ NGHĨA VÀ HIỆN TƯỢNG NHẬP NHẰNG
TRONG TIẾNG VIỆT, TIẾP CẬN XỬ LÝ VẤN ĐỀ VIẾT TẮT TIẾNG VIỆT
Chuyên ngành : KHOA HỌC MÁY TÍNH
số : 62.48.01.01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người ng dẫn khoa học:
PGS.TS. PHAN HUY KHÁNH
Đà Nẵng, năm 2020
ii
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi, dưới sự hướng dẫn trực tiếp
của PGS. TS. Phan Huy Khánh, hiện cán bộ giảng dạy tại Đại học Bách Khoa, Đại
học Đà Nẵng.
Tôi cam đoan các kết quả được trình bày trong luận án trung thực,
không sao chép từ bất kỳ luận án hay nguồn tài liệu nào khác và chưa từng được ai công
bố trong bất kỳ công trình nào khác. Mọi trích dẫn tài liệu tham khảo đều có ghi nguồn
gốc xuất xứ rõ ràng.
Nếu có gì không trung thực, tác giả xin chịu hoàn toàn trách nhiệm.
Tác giả,
Nguyễn Nho Túy
iii
MC LC
LỜI CAM ĐOAN .................................................................................................. ii
DANH MỤC CÁC CHỮ VIẾT TẮT ................................................................. vii
DANH MỤC HÌNH ẢNH .................................................................................... ix
DANH MỤC BẢNG BIỂU .................................................................................. xi
MỞ ĐẦU ................................................................................................................1
1. ĐẶT VẤN ĐỀ ................................................................................................1
2. MỤC TIÊU, ĐỐI TƯỢNGPHẠM VI NGHIÊN CỨU .........................5
2.1. Mục tiêu ........................................................................................................5
2.2. Đối tượng ......................................................................................................5
2.3. Phạm vi .........................................................................................................6
3. PHƯƠNG PHÁP NGHIÊN CỨU .................................................................6
4. BỐ CỤC CỦA LUẬN ÁN .............................................................................7
5. ĐÓNG GÓP CỦA LUẬN ÁN .......................................................................8
CHƯƠNG 1. VẤN ĐỀ CHỮ VIẾT TẮT TIẾNG VIỆT .................................... 11
1.1. NGÔN NGVÀ XỬ LÝ NGÔN NGỮ TỰ NHIÊN .................................... 11
1.1.1. Ngôn ngữ và xử lý ngôn ngữ ................................................................ 11
1.1.2. Âm, ch viết và vấn đề cải tiến chữ viết ............................................... 12
1.1.3. Các loi hình ngôn ngữ........................................................................ 13
1.1.4. X lý ngôn ngữ tự nhiên ....................................................................... 14
1.1.5. Vấn đề x lý tiếng Vit ......................................................................... 16
1.2. NGỮ NGHĨA NHP NHNG NG NGHĨA TIẾNG VIỆT ............... 18
1.2.1. Ng ngha và ng ngha học ................................................................ 18
1.2.2. Phân tích ngha ca t ......................................................................... 19
1.2.3. Sự biến đổi của từ vựng và ngữ ngha .................................................. 20
1.2.4. Nhp nhng ng ngha trong tiếng Vit ............................................... 22
1.3. CHỮ VIẾT TẮT TRONG CUỘC SỐNG .................................................... 25
1.3.1. Ch viết tt là gì .................................................................................. 25
1.3.2. Lịch sử hình thành chữ Quốc ngữ ........................................................ 26
1.3.3. Tìm hiểu về lch s chữ viết tt ............................................................ 27
1.3.4. Sử dụng chữ viết tt ............................................................................. 28
1.3.5. Chữ viết tt trong tiếng Việt ................................................................. 31
1.4. NGỮ NGHĨA CHỮ VIẾT TẮT ................................................................... 32
iv
1.4.1. Khái niệm ngữ ngha chữ viết tt ......................................................... 32
1.4.2. Biến đổi ngữ ngha chữ viết tt ............................................................ 33
1.4.3. Nhp nhng ch viết tt ....................................................................... 34
1.4.4. X lý nhp nhng chữ viết tt .............................................................. 35
1.4.5. Đề xuất nghiên cứu chữ viết tt tiếng Việt ............................................ 36
1.5. TÓM TẮT CHƯƠNG 1 ................................................................................ 37
CHƯƠNG 2. XÂY DỰNG HỆ THỐNG KHAI THÁC CHỮ VIT TẮT TIẾNG
VIỆT ..................................................................................................................... 38
2.1. CÁC TÌNH HUỐNG HÌNH THÀNH CHỮ VIẾT TẮT ............................. 38
2.1.1. Mô hình s hình thành ch viết tt ....................................................... 38
2.1.2. Đc điểm hình thành ch viết tt tiếng Vit ......................................... 40
2.1.3. Quy tc hình thành chữ viết tt tiếng Việt ............................................ 41
2.1.4. Những yếu tố khác ảnh hưởng đến thành lập chữ viết tt ..................... 44
2.2. TÌM HIỂU HỆ SINH THÁI PHẦN MỀM .................................................. 47
2.2.1. Hệ sinh thái phần mềm là gì ................................................................ 47
2.2.2. Mô hình hóa hệ sinh thái phần mềm .................................................... 48
2.2.3. Đc điểm một hệ sinh thái phần mềm................................................... 50
2.2.4. Lợi ích ứng dụng hệ sinh thái phần mềm .............................................. 51
2.3. HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG VIỆT (AMES) ...... 51
2.3.1. Hệ thống khai thác phần mềm .............................................................. 51
2.3.2. Đề xuất xây dựng hệ thống khai thác chữ viết tt ................................. 52
2.3.3. Mô hình hệ thống khai thác chữ viết tt ............................................... 53
2.4. THỰC NGHIỆM XÂY DỰNG AMES ........................................................ 54
2.4.1. Xây dựng nguồn tài nguyên chữ viết tt tiếng Việt ............................... 55
2.4.2. Xây dựng công cụ khai thác chữ viết tt ............................................... 55
2.4.3. Xây dựng giải pháp xử lý nhập nhng chữ viết tt ............................... 55
2.5. TÓM TẮT CHƯƠNG 2 ................................................................................ 56
CHƯƠNG 3. XÂY DỰNG NGUỒN TÀI NGUYÊN CH VIT TT ............. 57
3.1. XÂY DỰNG CƠ SỞ DỮ LIỆU CHỮ VIẾT TẮT ...................................... 57
3.1.1. Mô hình quan hệ dữ liệu ...................................................................... 57
3.1.2. Triển khai cài đt ................................................................................. 59
3.2. GIẢI PHÁP THU THẬP DỮ LIỆU CHỮ VIẾT TẮT ................................ 60
3.2.1. Thu thập dữ liệu thủ công .................................................................... 60
3.2.2. Thu thập dữ liệu tự động ...................................................................... 61