Y BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HC TH DU MT
NGUYN TH THANH HƯƠNG
XÂY DNG H THNG TR LI T ĐỘNG
CHATBOT BNG TING VIT
S DỤNG PHƯƠNG PHÁP HỌC SÂU
CHUYÊN NGÀNH: H THNG THÔNG TIN
MÃ S: 8480104
LUẬN VĂN THC S
GIẢNG VIÊN HƯỚNG DN
TS. Bùi Thanh Hùng
BÌNH DƯƠNG - 2019
ii
LỜI CAM ĐOAN
Tôi Nguyn Th Thanh Hương, hc viên lp CH16HT01, ngành H thng
thông tin, trường Đại hc Th Du Mt. Tôi xin cam đoan luận văn y dng h
thng tr li t động chatbot bng tiếng vit s dựng phương pháp hc sâu là do tôi
nghiên cu, tìm hiu phát trin dưới s hướng dn ca TS. Bùi Thanh Hùng, không
phi s sao chép t các tài liu, công trình nghiên cu của ngưi khác mà không ghi
rõ trong tài liu tham kho. Tôi xin chu trách nhim v lời cam đoan này.
Bình Dương, ngày 31 tháng 1 năm 2019
Tác gi
Nguyn Th Thanh Hương
iii
LI CẢM ƠN
Để hoàn thành luận n này, tôi xin gi li cảm ơn đến tt c các Thy cô
trường Đại hc Th Du Một đã tn tình ging dy và truyền đạt cho tôi nhng kiến
thc hu ích trong sut quá trình hc tp tại trường. Tôi cũng xin cm ơn các anh chị,
các bn, các em trong lp cao học đã chia sẻ, h tr cho tôi để tôi có th thc hin tt
luận văn của mình.
Hơn hết, tôi xin chân thành cảm ơn thy hướng dn TS. Bùi Thanh Hùng,
người đã tận tình truyền đt, ch dy cho tôi nhng kiến thc b ích v y hc và
hc tp sâu, cảm ơn thầy đã nhit tình hướng dn, ch bo cho tôi trong sut quá trình
tôi nghiên cu, xây dng và hoàn thin luận văn này.
Xin gi li cảm ơn sâu sc tới gia đình, các anh ch em đồng nghip và bn bè
đã luôn động viên, chia s kinh nghim, cung cp các tài liu hu ích cho tôi để tôi
thc hin tt luận văn ca mình.
iv
TÓM TT LUẬN VĂN
Cùng vi s phát trin ca công ngh, con người ngoài giao tiếp trc tiếp vi
nhau bng ngôn ng t nhiên, chúng ta còn thưng xuyên liên lc và kết ni vi nhau
mi lúc mọi nơi thông qua mạng xã hi. Mt h thng tr li t đng thông minh có
th giúp con người trò chuyn, nhc nh hay làm tr lý công vic có th theo dõi
tình trng sc khe bn thân, đã được nhiu nhà nghiên cu bng ch s dng các
k thut trong học máy để xây dng phát trin. Đối thoi thông minh là mt nhim
v quan trng trong bài toán hiu x ngôn ng t nhiên. Những phương pháp
tiếp cận trước đây ch gii hạn trong vài lĩnh vực nhưng hiu qu đạt được chưa cao,
khó m rng mô hình ng dng rộng rãi. Hướng nghiên cu da trên Deep
Learning kết hp vi ttu nhân to mt trong những xu hướng phát trin hin
nay.
Đề tài luận văn dựa trên nhng nghiên cứu trước đây để đề xut nghiên cu
phát trin mt h thng tr li t động dựa trên hai hướng tiếp cn theo hướng dch
máy trích xuất thông tin, hai ớng này đều s dng mng hc sâu LSTM bng
cách áp dụng phương pháp học chui liên tiếp (sequence-to-sequence) thuật
attention đ sinh ra câu tr li t động t mt chuỗi đầu vào tương ng. Mô hình dch
máy bng mạng -ron nhân to ca Google (Google’s Neural Machine Translation)
hình phân loi câu hỏi theo hướng mạng -ron sâu được áp dụng để hun
luyn trên b d liu chun và b d liu tiếng Việt được thu thp, sau đó so sánh kết
qu thc nghim trên hai b d liu này.
B d liu thu thp s phân tách thành hai b câu hi và câu tr lời tương ứng,
sau đó tiến hành tách t để tiến hành thiết lp biu din các t dưới dng các véc-tơ
và các b t vựng để tiến hành hun luyn và kết hp với các phương pháp đánh giá
để cho ra mô hình d đoán đưa ra các câu tr li tối ưu.
Luận văn cũng đề xut y dng mt ng dng web h tr vấn tr li t
động các câu hi của sinh viên liên quan đến chương trình đào tạo, tuyn sinh, thông
tin v giảng viên và các văn bản thường gp ca trường Đại hc Th Du Mt.
v
Kết qu thc nghim cho thấy hình đề xuất đạt đưc kết qu tt trên hai
độ đo: Độ chính xác (Accuracy) đánh giá BLEU da trên các b d liệu được s
dụng để hun luyện và đánh giá.