TRƯỜNG ĐẠI HC KINH T QUC DÂN
TRƯỜNG CÔNG NGH
----------------
KHÓA LUN TT NGHIP
Đề tài: Phân tích d liu hc tp và xây dng bài
toán d báo kết qu hc tp ca sinh viên
Tên sinh viên : Vũ Đức Tùng
Giảng viên hướng dn : ThS. Nguyn Trung Kiên
Hà Ni, 5/2025
2024.2 KHOA HC MÁY TÍNH VŨ ĐỨC TÙNG 11218435
TRƯỜNG ĐẠI HC KINH T QUC DÂN
TRƯỜNG CÔNG NGH
----------------
KHÓA LUN TT NGHIP
Đề tài: Phân tích d liu hc tp và xây dng bài
toán d báo kết qu hc tp ca sinh viên
Tên sinh viên : Vũ Đức Tùng
Mã sinh viên : 11218435
Lp : Khoa hc máy tính K63
Ngành : Khoa hc máy tính
Khoa : Công ngh thông tin
Giảng viên hướng dn : ThS. Nguyn Trung Kiên
(Ch ký GVHD)
Hà Ni, 5/2025
i
MC LC
LỜI CAM ĐOAN ................................................................................................ iii
LI CM ƠN ...................................................................................................... iv
DANH MC CÁC T VIT TT ..................................................................... v
DANH MC BNG, BIU Đ ......................................................................... vi
DANH MC HÌNH ............................................................................................ vii
M ĐẦU ............................................................................................................... 1
CHƯƠNG 1. TNG QUAN V ĐỀ TÀI .................................................... 2
1.1. Lý do chọn đ tài: .................................................................................... 2
1.2. Mc tiêu đ tài: ........................................................................................ 3
1.2.1. Mc tiêu tng quát: .......................................................................... 3
1.2.2. Mc tiêu c th: ............................................................................... 3
1.3. Đối tưng nghiên cu: ............................................................................. 3
1.4. Phm vi nghiên cu: ................................................................................ 3
1.5. Ý nghĩa của đề tài: ................................................................................... 4
1.5.1. Ý nghĩa khoa hc: ............................................................................ 4
1.5.2. Ý nghĩa thc tin: ............................................................................. 4
CHƯƠNG 2. CƠ S LÝ THUYT ............................................................. 5
2.1. Phân tích khám phá d liu (Exploratory Data Analysis EDA): ......... 5
2.1.1. Tng quan v EDA: ......................................................................... 5
2.1.2. Mc đích ca EDA: ......................................................................... 6
2.1.3. Các k thut ch yếu trong EDA: .................................................... 6
2.1.4. Các công c thc hin EDA: ......................................................... 13
2.2. Lý thuyết về học máy: ........................................................................... 14
2.2.1. Khái niệm học máy: ....................................................................... 14
2.2.2. Quy trình hot đng ca hc máy: ................................................. 14
2.2.3. Phân loi các mô hình hc máy: .................................................... 15
2.2.4. Mt s khái nim liên quan:........................................................... 16
2.2.5. Các phương pháp đánh giá mô hình hc máy: .............................. 17
2.2.6. ng dng ca hc máy trong thc tin:......................................... 21
2.2.7. Li ích và thách thc ca hc máy: ............................................... 22
2.2.8. Mt s mô hình hc máy tiêu biu: ............................................... 24
CHƯƠNG 3. THU THP D LIU VÀ THC NGHIM MÔ HÌNH 28
ii
3.1. Thu thp d liu: ................................................................................... 28
3.2. Thc nghim mô hình: .......................................................................... 29
3.2.1. Trc quan hóa các bưc thc hin: ................................................ 29
3.2.2. Phân tích khám phá d liu: ........................................................... 30
3.2.3. ng dng mô hình hc máy: ......................................................... 48
CHƯƠNG 4. KT QU VÀ THO LUN .............................................. 56
4.1. Kết qu Phân tích Khám phá d liu:.................................................... 56
4.2. Kết qu ng dng mô hình hc máy: .................................................... 56
4.3. Tho lun kết qu: ................................................................................. 57
KT LUN ......................................................................................................... 58
TÀI LIU THAM KHO ................................................................................. 59
KẾT QUẢ TURNITIN ...................................................................................... 60
iii
LỜI CAM ĐOAN
Em xin cam đoan rằng toàn b ni dung trong khóa lun tt nghip với đề
tài Phân tích d liu hc tp xây dng bài toán d báo kết qu hc tp
ca sinh viên kết qu nghiên cu do chính em thc hiện i s hướng dn
khoa hc ca ThS. Nguyn Trung Kiên.
Các s liu, hình nh, bng biu, trích dn và ni dung trình bày trong khóa
luận đều được thu thp, x trình bày trung thc, trích dn ràng ngun
gốc theo đúng quy định. Em hoàn toàn chu trách nhim v tính xác thc và trung
thc ca nội dung được trình bày trong khóa lun.
Tôi xin cam kết khóa luận này chưa từng được công b hoc np ti bt k
cơ sở đào tạo nào khác để xét cp bng hoc chng ch, không sao chép t bt
k công trình nghiên cu nào.
ni, ngày tháng năm 2025
Sinh viên
Vũ Đc Tùng