ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH

NH BO VŨ
XÂY DỰNG MÔ HÌNH ĐỐI THOI CHO TING VIT
TRÊN MIN M DỰA VÀO PHƯƠNG PHÁP HC CHUI
LIÊN TIP
Ngành: Công ngh thông tin
Chuyên ngành: H thng thông tin
Mã s: 60480104
TÓM TT LUN VĂN THẠC SĨ CÔNG NGH THÔNG TIN
NGƯỜI HƯỚNG DN KHOA HC: TS. Nguyn Văn Nam
HÀ NI 2016
LỜI CAM ĐOAN
Tôi Nh Bảo , hc viên khóa K21, ngành Công ngh thông tin, chuyên
ngành H Thng Thông Tin. Tôi xin cam đoan luận văn “Xây dng mô hình đối
thoi cho tiếng Vit trên min m dựa vào phương pháp hc chui liên tiếp” là do
tôi nghiên cu, tìm hiu phát triển dưới s ng dn ca TS. Nguyễn Văn
Nam. Luận văn không phi s sao chép t các tài liu, công trình nghiên cu ca
ngưi khác không ghi rõ trong tài liu tham kho. Tôi xin chu trách nhim v
lời cam đoan này.
Nội, ngày tháng năm 2016
MC LC
LỜI CAM ĐOAN ............................................................................................................ 2
MC LC ....................................................................................................................... 3
DANH MC KÝ HIU VÀ CÁC CH VIT TT ..................................................... 4
DANH MC HÌNH V VÀ Đ TH ............................................................................. 5
TÓM TT ........................................................................................................................ 6
1. CHƯƠNG 1: TNG QUAN V H THNG TR LI T ĐỘNG ..................... 7
1.1 Động lc nghiên cu và tính cp thiết ca bài toán thc tế .....................................................7
1.2 Tình hình nghiên cứu trong và ngoài nước ..............................................................................7
1.3 Phân loi các mô hình tr li t động .......................................................................................8
2. CHƯƠNG 2: CƠ SỞ MẠNG NƠ RON NHÂN TO ............................................. 9
2.1 Kiến trúc mạng nơ ron nhân tạo ...............................................................................................9
2.3 Mạng nơ-ron tái phát và ng dng .........................................................................................10
2.3.1 Mạng nơ-ron tái phát ......................................................................................................10
2.3.2 Các ng dng ca mng RNN ........................................................................................10
2.4 Mng Long Short Term Memory (LSTM) .............................................................................10
2.4.1 Vấn đề ph thuc quá dài ...................................................................................................10
3. CHƯƠNG 3: HÌNH ĐỐI THOI VI MNG NƠ-RON ............................. 12
3.1 H thống đối thoại người máy ................................................................................................12
3.2 Mô hình ngôn ng ..................................................................................................................12
3.3 Mô hình chui liên tiếp seq2seq .............................................................................................13
3.4 Mô hình đối thoi Seq2seq .....................................................................................................13
3.5 Nhng thách thc chung khi xây dựng mô hình đối thoi .....................................................15
3.5.1 Ph thuc bi cnh .............................................................................................................15
3.5.2 Kết hp tính cách ...............................................................................................................15
4. CHƯƠNG 4: THC NGHIM XÂY DỰNG HÌNH ĐỐI THOI CHO TING
VIT .............................................................................................................................. 16
4.1 D liu và công c thc nghim.............................................................................................16
4.2 Tách t tp d liu tiếng Vit .................................................................................................17
4.3 Thc nghim xây dựng mô hình đối thoi tiếng Vit.............................................................18
KT LUN ................................................................................................................... 21
TÀI LIU THAM KHO ............................................................................................. 22
DANH MC KÝ HIU VÀ CÁC CH VIT TT
T viết tt
T chun
Din gii
NLP
Natural Languague Processing
X lý ngôn ng t nhiên
ANN
Artificial Nerual Network
Mạng nơ ron nhân to
RNN
Recurrent Neural Network
Mạng nơ ron tái phát
CNN
Convolutional Neural
Networks
Mạng nơ ron tích chp
LSTM
Long short-term memory
Mng ci tiến đ gii quyết vấn đề ph thuc
quá dài
VNTK
Vietnamese Languague Toolkit
B công c x lý ngôn ng tiếng Vit
NLTK
Natural Language Toolkit
B công c x ngôn ng t nhiên bng
Python
Python
Python
Ngôn ng lp trình python
Nodejs
Nodejs
Nn tng lp trình phía Server s dng ngôn
ng lp trình javascript
SDK
Support Development Kit
B công c h tr phát trin
CPU
Central Processing Unit
B x lý trung tâm
GPU
Graphics Processing Unit
B vi x chuyên dng nhn nhim v tăng
tc, x đồ ha cho b vi x trung tâm
CPU
API
Application Programming
Interface
Giao din lp trình ng dng
QA
Question Answering
Các cp câu hi đáp
BLEU
Bilingual Evaluation
Understudy
Thuật toán để đánh giá chất lượng ca mt
văn bản được sinh ra t mt hình ngôn
ng t nhiên
DANH MC HÌNH V VÀ Đ TH
Hình 2.1: Kiến trúc mạng nơ-ron nhân to ...................................................................... 9
Hình 2.2: RNN ph thuc long-term. ............................................................................ 11
Hình 3.1: Mô hình đi thoi seq2seq............................................................................. 14
Hình 3.2: Thách thc ph thuc bi cnh tính cách khi y dng hình đối thoi.
....................................................................................................................................... 15