1
Thành ph ng Tàu, ngày 01 tháng 04 năm 2024
Trình độ đào tạo:
Đại hc chính quy
Ngành:
Công ngh thông tin
Chuyên ngành:
Lp trình ng dụng di động &
Game
Giảng viên hướng dn:
TS. Lê Th Vĩnh Thanh
Sinh viên thc hin:
Lê Quc Khánh
Mã s sinh viên:
19034508
Lp:
DH20LT
ĐỒ ÁN TT NGHIP
XÂY DNG NG DNG CHATBOT TRUY XUT
THÔNG TIN S DNG K THUT RAG
TRƯỜNG ĐẠI HC BÀ RA VŨNG TÀU
KHOA K THUT CÔNG NGH
2
LI NÓI ĐU
Trí tu nhân to và công ngh thông tin đang ngày càng phát triển và đóng
vai trò quan trng trong nhiều lĩnh vực ca cuc sng. Trong xu thế đó, các h
thống ChatBot đã tr thành mt công c hu ích, giúp t động hóa nâng cao
hiu qu trong giao tiếp và h tr người dùng. Đồ án tt nghip ca tôi với đề tài
"Xây dng ng dng chatbot truy xut thông tin s dng k thut rag"
đưc thc hin nhm nghiên cu phát trin mt h thng ChatBot thông
minh, h tr ng dẫn người dùng th trò chuyn vi Chatbot bng d liu
riêng ca mình.
Vi s h tr ca công ngh các mô hình ngôn ng ln (LLM) và kĩ thuật
truy vn RAG, kết hp c hai cùng vi LangChain, ChatBot RAG không ch
đơn thuần mt công c tr li câu hi còn kh năng hc hi t các d
liệu riêng và người dùng ti lên để ci thin chất lượng truy vn. Trong sut quá
trình thc hiện đồ án, tôi đã đi mt vi nhiu th thách, t vic phân tích và x
ngôn ng t nhiên, thiết kế giao diện người dùng, đến vic tích hp các thut
RAG trong học máy để nâng cao kh năng tương tác của ChatBot.
Đồ án này không ch kết qu ca quá trình hc tp nghiên cu,
còn minh chng cho s n lực đam của tôi trong lĩnh vc công ngh
thông tin. Tôi hy vng rng sn phm này s góp phn vào vic phát trin các
ng dng ChatBot thông minh, phc v tt hơn nhu cu của người dùng
mang li nhng giá tr thiết thc cho xã hi.
3
LI CM ƠN
Trước hết, tôi xin gi li cảm ơn chân thành và sâu sc nhất đến Ban
Giám hiu, các thy giáo toàn th cán bộ, nhân viên Trường Đại hc
Ra Vũng Tàu đã tạo điều kin tt nht cho tôi trong sut quá trình hc tp
nghiên cu. Nhng kiến thc và kinh nghiệm mà tôi đã thu nhận được tại đây
nn tng vng chắc giúp tôi hoàn thành đồ án này.
Tôi xin bày t lòng biết ơn sâu sắc đến ging viên ng dn đồ án tt
nghip TS. Th Vĩnh Thanh. đã tận tâm ch bo h tr tôi trong sut
quá trình nghiên cu và hoàn thiện đồ án. S tn tâm và kiên nhn của cô đã cho
tôi động lực cũng như cơ hội đểth hoàn thành đồ án này.
Tôi cũng xin cảm ơn quý thy trong Khoa Công ngh thông tin, nhng
người đã luôn nhiệt tình ging dy chia s nhng kiến thc quý báu, giúp tôi
m rng tm nhìn và nâng cao k năng trong suốt thi gian hc tp tại trường.
Mặc đã c gng rt nhiều, nhưng đ án vn không tránh khi nhng
thiếu sót. Rt mong nhận được s thông cm, ch dn góp ý ca quý thy
và các bạn để đ án được hoàn thiện hơn.
Xin chân thành cảm ơn!
Thành ph ng Tàu, ngày 10 tháng 06 năm 2024
Sinh viên thc hin
Lê Quc Khánh
4
NHN XÉT CA GING VIÊN
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
Thành ph ng Tàu, ngày … tháng … năm 202…
Ging viên xác nhn
5
MC LC
LI NÓI ĐU ................................................................................................................. 2
LI CẢM ƠN .................................................................................................................. 3
NHN XÉT CA GING VIÊN ...................................................................................... 4
MC LC ....................................................................................................................... 5
MC LC HÌNH NH .................................................................................................. 7
CHƯƠNG 1. GIỚI THIU ........................................................................................... 10
1.1. Lý do chọn đề tài ................................................................................................. 10
1.1.1. Nhu cu truy xut thông tin hiu qu trong thi đi s ................................ 10
1.1.2. Gii pháp Chatbot ng dng Large Language Model .................................. 10
1.1.3. La chn Chatbot RAG ................................................................................ 10
1.1.4. Lý do la chn .............................................................................................. 11
1.2. Mc tiêu và phm vi ca đề tài ........................................................................... 11
1.3. Tm quan trng ca Chatbot trong thi đi s .................................................... 11
CHƯƠNG 2. KIẾN THC CƠ S............................................................................... 14
2.1. Large Language Model(LLM) và Chatbot:......................................................... 14
2.1.1. Large Language Model (LLM): .................................................................... 14
2.1.2. Chatbot .......................................................................................................... 15
2.2. Các công ngh và công c được s dng ............................................................ 17
2.2.1. LangChain ..................................................................................................... 17
2.2.2. HuggingFace và Transformers ...................................................................... 22
2.2.3. Flask .............................................................................................................. 31
2.2.4. Gradio ........................................................................................................... 33
2.3. K Thut RAG (Retrieval Augmented Generation) ........................................... 36
CHƯƠNG 3. PHÂN TÍCH THIẾT K H THNG .................................................... 48
3.1. Phân tích h thng ............................................................................................... 48
3.1.1. Các tác nhân .................................................................................................. 50
3.1.2. Sơ đồ Usecase tng quát ............................................................................... 50
3.1.3. Các Usecase chi tiết ...................................................................................... 50
3.2. Phân Tích Các Ngun D Liu ........................................................................... 58
3.3. Mô T Quá Trình Chun B và Tin X Lý D Liu: ........................................ 58