
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Nguyễn Thị Quỳnh Như
XÂY DỰNG HỆ KHUYẾN NGHỊ VỀ SẢN
PHẨM VAY CHO KHÁCH HÀNG Ở CÔNG
TY TÀI CHÍNH SỬ DỤNG DEEP
REINFORCEMENT LEARNING
Chuyên ngành: Hệ thống thông tin
Mã số: 8.48.01.04
TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ
(Theo định hướng ứng dụng)
THÀNH PHỐ HỒ CHÍ MINH – 2025

Đề án tốt nghiệp được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học:
TS. NGUYỄN HỒNG SƠN
Phản biện 1: …………………………….
Phản biện 2: …………………………….
Đề án tốt nghiệp sẽ được bảo vệ trước Hội đồng chấm đề
án tốt nghiệp thạc sĩ tại Học viện Công nghệ Bưu chính
Viễn thông
Vào lúc: … Giờ … ngày … tháng … năm 2025
Có thể tìm hiểu đề án tốt nghiệp tại:
-Thư viện của Học viện Công nghệ Bưu chính Viễn thông

1
MỞ ĐẦU
1. Lý do chọn đề tài
Hệ thống khuyến nghị (Recommender System - RS) là
công cụ quan trọng giúp cá nhân hóa trải nghiệm người
dùng và hỗ trợ đề xuất thông tin hiệu quả. Với sự phát triển
của trí tuệ nhân tạo và phân tích dữ liệu, RS không chỉ cung
cấp các gợi ý chính xác mà còn hiểu sâu hơn về sở thích và
hành vi của người dùng. Tuy nhiên, sự gia tăng nhanh
chóng của dữ liệu và đa dạng người dùng đặt ra thách thức
trong việc đảm bảo độ chính xác và hiệu quả, đòi hỏi các
phương pháp tiên tiến nâng cao khả năng dự đoán, cá nhân
hóa và tương tác.
Học tăng cường (Reinforcement Learning - RL) nổi bật
với khả năng mô phỏng cách con người học từ trải nghiệm
để đưa ra quyết định tối ưu. Khi kết hợp với RS, RL, đặc
biệt là Deep RL (DRL), giúp cải thiện đáng kể chiến lược
đề xuất, tăng cường cá nhân hóa và linh hoạt đáp ứng nhu
cầu người dùng. Các nghiên cứu cho thấy DRL mang lại
hiệu quả vượt trội trong việc xử lý dữ liệu khan hiếm, cải

2
thiện tương tác người dùng và nâng cao độ chính xác trong
hệ thống gợi ý.
Trong bối cảnh khó khăn về kinh tế, việc sử dụng sản
phẩm vay như một tài nguyên tài chính trở nên quan trọng
hơn, đóng vai trò quan trọng trong việc thúc đẩy phát triển
kinh tế cá nhân và doanh nghiệp. Đối mặt với sự đa dạng
của các sản phẩm vay trên thị trường, cạnh tranh ngày càng
trở nên khốc liệt. Để nổi bật và đáp ứng đúng nhu cầu của
khách hàng, tổ chức cần sử dụng các công cụ hiệu quả để
đề xuất sản phẩm vay phù hợp.
Như vậy, thấy được tầm quan trọng của RS trong việc cá
nhân hóa nội dung và dịch vụ, góp phần cải thiện trải
nghiệm của người dùng và tăng sự hài lòng khi sử dụng
dịch vụ tại công ty tài chính cũng như vai trò của DRL trong
việc ứng dụng điều này. Đây cũng chính là lý do em lựa
chọn đề tài.
2. Tổng quan về vấn đề nghiên cứu
Trong quá trình khảo sát, nhận thấy việc nghiên cứu về
việc xây dựng hệ thống khuyến nghị tại Việt Nam cũng đã
được tiến hành trong những năm gần đây. Đề án của Phạm
Ngọc Nam, tập trung xây dựng RS trên cơ sở dữ liệu thực

3
tế để gợi ý sản phẩm vay tại công ty tài chính. Đề án cung
cấp kiến thức tổng quan về RS, các phương pháp lọc dữ liệu
và thuật toán khuyến nghị, đạt được kết quả khả quan trong
thực tiễn ứng dụng.
Học tăng cường (RL) đã được áp dụng sớm trong các hệ
thống khuyến nghị, điển hình như nghiên cứu của Lihong
và cộng sự về contextual bandit, một thuật toán lựa chọn
tuần tự dựa trên thông tin ngữ cảnh. Thuật toán này đã được
kiểm chứng với dữ liệu Yahoo!, cho thấy hiệu suất vượt trội,
tăng 12,5% lượt nhấp chuột.
Ngoài ra, M. Mehdi Afsar và cộng sự đã phân loại
RLRSs thành hai nhóm: RL và DRL, đề xuất một khung lý
thuyết với bốn thành phần (trạng thái, chính sách, phần
thưởng, môi trường) và thảo luận về các thách thức quan
trọng như thiếu minh bạch, thiếu dữ liệu, và tính đa dạng.
Google Research đã phát triển RecSim - nền tảng nghiên
cứu mạnh mẽ cho hệ thống khuyến nghị. RecSim cung cấp
môi trường linh hoạt để thử nghiệm, thúc đẩy áp dụng RL
trong các RS thực tế, góp phần định hình kiến thức và chiến
lược triển khai hiệu quả.

