
v
TÓM TẮT LUN VĂN
Tên đề tài: Phát triển ứng dụng phát hiện lỗi chính tả Tiếng Việt sử dụng mô hình
ngôn ngữ.
Ngành: Hệ Thống Thông Tin.
Họ và tên học viên: Trần Huỳnh Nhựt Nam.
Người hướng dẫn khoa học: PGS. TS. Quản Thành Thơ.
Cơ sở đào tạo: Trường Đại học Thủ Dầu Một.
Tóm tắt nội dung: Luận văn trình bày ứng dụng các kỹ thuật của học máy là
phương pháp phổ biến nhất hiện nay trong lĩnh vực nghiên cứu trí tuệ nhân tạo, để áp
dụng vào ngôn ngữ cụ thể là Tiếng Việt, đi vào thực tế giải quyết bài toán kiểm tra lỗi
chính tả đồng thời sửa lỗi chính tả cho Tiếng Việt.
Đầu vào: là một câu văn bản Tiếng Việt được viết sai chính tả.
Đầu ra: là câu Tiếng Việt đã được kiểm tra và sửa lỗi chính tả.
Các mô hình áp dụng trong bài toán: Mô hình ngôn ngữ, phương pháp token các
từ, mô hình dạng nơ-ron hồi quy RNN và LSTM, kỹ thuật Word Embedding.
Kết quả thu được của Luận văn là hoàn thành huấn luyện được mô hình ngôn
ngữ, cũng như hiện thực được bản giới thiệu, demo, nhập vào một câu không dấu và cho
ra câu đã kiểm tra và sửa lỗi.
==> Input: nguon cao đài tu điên
<== Output: nguồn cao đài tự điển
Sau cùng, Luận văn đưa ra nhận xét và hướng mở rộng cho đề tài để có thể đạt
kết quả tốt hơn về đa dạng hoá xử lý ngôn ngữ cho Tiếng Việt bằng cách vận dụng kết
quả của nghiên cứu này.