Y BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HC TH DU MT
TRN HUNH NHT NAM
PHÁT TRIN NG DNG
PHÁT HIN LI CHÍNH T TING VIT
S DNG MÔ HÌNH NGÔN NG
CHUYÊN NGÀNH: H THNG THÔNG TIN
MÃ S: 8480104
LUN VĂN THẠC SĨ
BÌNH DƯƠNG – 2022
ii
U BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HC TH DU MT
TRN HUNH NHT NAM
PHÁT TRIN NG DNG
PHÁT HIN LI CHÍNH T TING VIT
S DNG MÔ HÌNH NGÔN NG
CHUYÊN NGÀNH: H THÔNG THÔNG TIN
MÃ S: 8480104
LUN VĂN THẠC SĨ
NGƯỜI HƯNG DN KHOA HC:
PGS. TS. QUN THÀNH THƠ
BÌNH DƯƠNG – 2022
iii
LI CAM ĐOAN
Tên tôi là: Trn Hunh Nht Nam
Sinh ngày: 09/11/1992
Hc viên lp cao hc CH18HT01 Trường Đại hc Th Du Mt
Xin cam đoan: Đề tài Phát trin ng dng phát hin li chính t Tiếng Vit
s dng hình ngôn ngdo Thầy PGS. TS. Quản Thành Thơ ng dn công
trình nghiên cu ca riêng tôi. Tt c tài liu tham kho đu có ngun gc, trích dn
ràng.
Tác gi xin cam đoan tt c nhng ni dung trong luận văn đúng như nội dung
trong đề cương yêu cầu ca thầy giáo hướng dn. Nếu sai tôi hoàn toàn chu trách
nhiệm trước hi đng khoa hc.
Bình Dương, 19 tháng 01 năm 2022
Tác gi luận văn
Trn Hunh Nht Nam
iv
LI CM ƠN
Sau mt thi gian nghiên cu làm việc nghiêm túc, được s động viên, giúp
đỡ và hướng dn tn tình ca Thầy ng dn PGS. TS. Quản Thành Thơ, luận văn Cao
học “Phát trin ng dng phát hin li chính t Tiếng Vit s dng mô hình ngôn
ng” đã hoàn thành.
Tôi xin bày t lòng biết ơn sâu sắc đến:
Thầy hướng dn PGS. TS. Quản Thành Thơ đã tận tình ch dẫn, giúp đỡ tôi
hoàn thành luận văn này. Đồng thi tôi gi li cm ơn đến các thy, đã ging dy
truyền đạt kiến thc quý báo cho tôi trong sut thi gian hc tp và nghiên cu.
Tôi chân thành cảm ơn bạn bè, đồng nghiệp gia đình đã động viên, khích l,
tạo điều kiện giúp đỡ tôi trong sut quá trình hc tp, thc hin và hoàn thành luận văn
này.
v
TÓM TT LUN VĂN
Tên đề tài: Phát trin ng dng phát hin li chính t Tiếng Vit s dng hình
ngôn ng.
Ngành: H Thng Thông Tin.
H và tên hc viên: Trn Hunh Nht Nam.
Ngưi hưng dn khoa hc: PGS. TS. Quản Thành Thơ.
Cơ sở đào tạo: Trường Đại hc Th Du Mt.
Tóm tt ni dung: Luận văn trình bày ng dng các k thut ca hc y
phương pháp phổ biến nht hiện nay trong lĩnh vực nghiên cu trí tu nhân tạo, để áp
dng vào ngôn ng c th Tiếng Việt, đi o thc tế gii quyết bài toán kim tra li
chính t đồng thi sa li chính t cho Tiếng Vit.
Đầu vào: là một câu văn bản Tiếng Vit đưc viết sai chính t.
Đầu ra: là câu Tiếng Vit đã đưc kim tra và sa li chính t.
Các mô hình áp dng trong bài toán: Mô hình ngôn ngữ, phương pháp token các
t, mô hình dạng nơ-ron hi quy RNN và LSTM, k thut Word Embedding.
Kết qu thu được ca Luận văn hoàn thành hun luyện được hình ngôn
ngữ, cũng như hiện thực được bn gii thiu, demo, nhp vào mt câu không du cho
ra câu đã kim tra và sa li.
==> Input: nguon cao đài tu điên
<== Output: nguồn cao đài tự điển
Sau cùng, Luận văn đưa ra nhận xét ng m rộng cho đề tài để th đạt
kết qu tốt hơn về đa dng hoá x lý ngôn ng cho Tiếng Vit bng cách vn dng kết
qu ca nghiên cu này.