ĐI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Thị Hợp
HỌC SÂU SUỐT ĐỜI TƯƠNG TÁC VÀ
ỨNG DỤNG VÀO CHATBOT
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Hệ thống thông tin
HÀ NỘI – 2020
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Thị Hợp
HỌC SÂU SUỐT ĐỜI TƯƠNG TÁC VÀ
ỨNG DỤNG VÀO CHATBOT
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Hệ thống thông tin
Cán bộ hướng dẫn: PGS-TS Hà Quang Thụy
Cán bộ đồng hướng dẫn: ThS.NCS. Lê Hoàng Quỳnh
HÀ NỘI - 2020
i
TÓM TẮT
Tóm tắt: Trong những năm gần đây, với tính tiện dụng, sự thông minh độ sẵn có, hệ thống
chatbot hầu như mặt mọi lĩnh vực, thực hiện việc vấn, giải đáp thắc mắc cũng như t
chuyện giải trí với con người. Hạn chế lớn nhất của chatbot hiện nay “đthông minh” còn
thấp trong một “thế giới đóng” (closed world) của một cơ sở tri thức được cố định ngay từ khi
khởi tạo cho nên phạm vi trả lời của rất hạn chế. Tiếp cận “thế giới mở” (open world), mở
rộng sở tri thức của chatbot trong khi hoạt động hay “học khi làm việc” (on-the-job
learning) nhờ tương tác giữa chatbot người dùng, thu hút sự quan tâm đặc biệt của nhiều
nhóm nghiên cứu, trong đó nhóm nghiên cứu của Bing Liu cộng sự tại Đại học Iilinois
tại Chicago (University of Illinois at Chicago) từ năm 2018 tới nay. Cách thức chatbot đưa ra
được các câu tương tác để nhận được tri thức mới của người dùng, hỗ trợ trực tiếp câu trả lời
với người dùng đó và bổ sung tri thức mới vào cơ sở tri thức là một thành phần cốt lõi của học
khi làm việc.
Thông qua việc khảo sát công phu hai mô hình học khi làm việc của chatbot LILI và CILK do
S. Mazumder cộng sự đề xuất, khóa luận phát biểu một bài toán học khi làm việc qua
tương tác của chatbot đề xuất một hình giải quyết bài toán khóa luận, tập trung vào
thành phần đưa ra câu tương tác để nhận được tri thức mới (các dữ kiện hỗ trợ: support facts)
từ người dùng. Cài đặt phần mềm do nhóm tác giả cung cấp, tiến hành thực nghiệm trên hai
kho ngữ liệu Wordnet (18 quan hệ với trên 300 bộ ba dữ kiện cho một quan hệ) một phần
ngữ liệu Freebase (60 quan hệ với số lượng ít các dữ kiện cho một quan hệ), khóa luận đã thu
được các kết quả phù hợp với Wordnet.
Từ khóa: chatbots, lifelong meachine learning, học suốt đời, học thông qua tương tác
ii
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của tôi và không sao chép của bất kỳ ai.
Những nội dung được trình bày trong khóa luận y do tôi tìm hiểu, nghiên cứu
trình y lại theo cách hiểu dưới sự hướng dẫn của PGS.TS. Quang Thụy ThS.
Hoàng Quỳnh. Tất cả những kiến thức tham khảo từ các nghiên cứu liên quan đều
được nêu nguồn gốc một cách rõ ràng ở danh mục tài liệu tham khảo trong khóa luận.
Hà Nội, ngày … tháng … năm 2020
SINH VIÊN
Nguyễn Thị Hợp
iii
LỜI CẢM ƠN
Lời đầu tiên, tôi xin gửi lời biết ơn sâu sắc đến thầy giáo PGS-TS Quang Thụy và
ThS. Hoàng Qunh đã tận tình chỉ bảo, hướng dẫn, giúp đỡ tôi trong suốt quá
trình tôi thực hiện khóa luận.
Tôi xin gửi lời cảm ơn chân thành đến các thầy, trong khoa Công nghệ thông tin,
trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã truyền đạt cho tôi những kiến
thức bổ ích để tôi đủ hành trang, kiến thức phục vụ công việc sau này. Tôi xin cảm
ơn tập thể sinh viên K61T - Trường Đại học Công Nghệ đã ủng hộ khuyến khích tôi
trong quá trình nghiên cứu và thực hiện khóa luận y. Tôi cũng xin gửi lời cảm ơn tới
các thầy cô, anh chị và các bạn trong phòng thí nghiệm Công nghệ tri thức và khoa học
dữ liệu KT-Lab đã cùng trao đổi, thảo luận để tôi có thể hoàn thành đề tài y một
cách tốt nhất. Tôi chân thành cám ơn tác giả Sahisnu Mazumder (University of Illinois
at Chicago) đã cung cấp tài nguyên hỗ trợ để tôi hoàn thành bản khóa luận này.
Cuối cùng, tôi muốn gửi lời cảm ơn tới gia đình bạn bè, những người thân luôn bên
cạnh, tin tưởng và động viên tôi trong suốt quá trình thực hiện đề tài này.
Hà Nội, ngày … tháng … năm 2020
SINH VIÊN
Nguyễn Thị Hợp