
TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
TRƯỜNG CÔNG NGHỆ
----------------
KHÓA LUẬN TỐT NGHIỆP
Đề tài: Phân tích dữ liệu học tập và xây dựng bài
toán dự báo kết quả học tập của sinh viên
Tên sinh viên : Vũ Đức Tùng
Giảng viên hướng dẫn : ThS. Nguyễn Trung Kiên
Hà Nội, 5/2025
2024.2 KHOA HỌC MÁY TÍNH VŨ ĐỨC TÙNG 11218435

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
TRƯỜNG CÔNG NGHỆ
----------------
KHÓA LUẬN TỐT NGHIỆP
Đề tài: Phân tích dữ liệu học tập và xây dựng bài
toán dự báo kết quả học tập của sinh viên
Tên sinh viên : Vũ Đức Tùng
Mã sinh viên : 11218435
Lớp : Khoa học máy tính K63
Ngành : Khoa học máy tính
Khoa : Công nghệ thông tin
Giảng viên hướng dẫn : ThS. Nguyễn Trung Kiên
(Chữ ký GVHD)
Hà Nội, 5/2025

i
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................ iii
LỜI CẢM ƠN ...................................................................................................... iv
DANH MỤC CÁC TỪ VIẾT TẮT ..................................................................... v
DANH MỤC BẢNG, BIỂU ĐỒ ......................................................................... vi
DANH MỤC HÌNH ............................................................................................ vii
MỞ ĐẦU ............................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN VỀ ĐỀ TÀI .................................................... 2
1.1. Lý do chọn đề tài: .................................................................................... 2
1.2. Mục tiêu đề tài: ........................................................................................ 3
1.2.1. Mục tiêu tổng quát: .......................................................................... 3
1.2.2. Mục tiêu cụ thể: ............................................................................... 3
1.3. Đối tượng nghiên cứu: ............................................................................. 3
1.4. Phạm vi nghiên cứu: ................................................................................ 3
1.5. Ý nghĩa của đề tài: ................................................................................... 4
1.5.1. Ý nghĩa khoa học: ............................................................................ 4
1.5.2. Ý nghĩa thực tiễn: ............................................................................. 4
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT ............................................................. 5
2.1. Phân tích khám phá dữ liệu (Exploratory Data Analysis – EDA): ......... 5
2.1.1. Tổng quan về EDA: ......................................................................... 5
2.1.2. Mục đích của EDA: ......................................................................... 6
2.1.3. Các kỹ thuật chủ yếu trong EDA: .................................................... 6
2.1.4. Các công cụ thực hiện EDA: ......................................................... 13
2.2. Lý thuyết về học máy: ........................................................................... 14
2.2.1. Khái niệm học máy: ....................................................................... 14
2.2.2. Quy trình hoạt động của học máy: ................................................. 14
2.2.3. Phân loại các mô hình học máy: .................................................... 15
2.2.4. Một số khái niệm liên quan:........................................................... 16
2.2.5. Các phương pháp đánh giá mô hình học máy: .............................. 17
2.2.6. Ứng dụng của học máy trong thực tiễn:......................................... 21
2.2.7. Lợi ích và thách thức của học máy: ............................................... 22
2.2.8. Một số mô hình học máy tiêu biểu: ............................................... 24
CHƯƠNG 3. THU THẬP DỮ LIỆU VÀ THỰC NGHIỆM MÔ HÌNH 28

ii
3.1. Thu thập dữ liệu: ................................................................................... 28
3.2. Thực nghiệm mô hình: .......................................................................... 29
3.2.1. Trực quan hóa các bước thực hiện: ................................................ 29
3.2.2. Phân tích khám phá dữ liệu: ........................................................... 30
3.2.3. Ứng dụng mô hình học máy: ......................................................... 48
CHƯƠNG 4. KẾT QUẢ VÀ THẢO LUẬN .............................................. 56
4.1. Kết quả Phân tích Khám phá dữ liệu:.................................................... 56
4.2. Kết quả ứng dụng mô hình học máy: .................................................... 56
4.3. Thảo luận kết quả: ................................................................................. 57
KẾT LUẬN ......................................................................................................... 58
TÀI LIỆU THAM KHẢO ................................................................................. 59
KẾT QUẢ TURNITIN ...................................................................................... 60

iii
LỜI CAM ĐOAN
Em xin cam đoan rằng toàn bộ nội dung trong khóa luận tốt nghiệp với đề
tài “Phân tích dữ liệu học tập và xây dựng bài toán dự báo kết quả học tập
của sinh viên” là kết quả nghiên cứu do chính em thực hiện dưới sự hướng dẫn
khoa học của ThS. Nguyễn Trung Kiên.
Các số liệu, hình ảnh, bảng biểu, trích dẫn và nội dung trình bày trong khóa
luận đều được thu thập, xử lý và trình bày trung thực, có trích dẫn rõ ràng nguồn
gốc theo đúng quy định. Em hoàn toàn chịu trách nhiệm về tính xác thực và trung
thực của nội dung được trình bày trong khóa luận.
Tôi xin cam kết khóa luận này chưa từng được công bố hoặc nộp tại bất kỳ
cơ sở đào tạo nào khác để xét cấp bằng hoặc chứng chỉ, và không sao chép từ bất
kỳ công trình nghiên cứu nào.
Hà nội, ngày tháng năm 2025
Sinh viên
Vũ Đức Tùng

