BỘ GIÁO DỤC VÀ ĐÀO TO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN
BÀI TẬP LỚN PHÂN TÍCH DỮ LIỆU XU HƯỚNG
THAM GIA TNG HỌC CỦA SINH VN
NGÀNH: KHOA HỌC MÁY TÍNH
CHUYÊN NGÀNH: TRÍ TUỆ NHÂN TẠO VÀ KHOA HỌC DỮ LIỆU
SINH VIÊN: GIANG TUẤN HÙNG
MÃ LỚP: 12422TN
NGƯỜI HƯỚNG DẪN: TS. HOÀNG QUỐC VIỆT
HƯNG YÊN – 2024
NHẬN XÉT
Nhận xét của giáo viên hướng dẫn
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
...........................................................................................................................................
GIÁO VIÊN HƯỚNG DẪN
Hoàng Quốc Việt
PHÂN TÍCH DỮ LIỆU XU NG THAM GIA TRƯỜNG HỌC CỦA SINH VIÊN DỮ LIỆU XU HƯỚNG THAM GIA TRƯỜNG HỌC CA SINH VIÊN
LỜI CAM ĐOAN
Em xin cam đoan bài tập lớn môn lập trình Python nâng cao tên “Phân
tích dữ liệu về bộ dữ liệu xu hướng tham gia học tập của sinh viên sản phẩm của
bản thân em.
Những phần sử dụng tài liệu tham khảo trong bài tập lớn đã được nêu trong
phần tài liệu tham khảo. Các kết quả trình bày trong bài tập lớn hoàn toàn là kết quả do
bản thân em thực hiện.
Nếu vi phạm lời cam đoan này, em xin chịu hoàn toàn trách nhiệm trước khoa
và nhà trường.
Hưng Yên, ngày … tháng 06 năm 2024
Sinh viên
Giang Tuấn Hùng
PHÂN TÍCH DỮ LIỆU XU NG THAM GIA TRƯỜNG HỌC CỦA SINH VIÊN DỮ LIỆU XU HƯỚNG THAM GIA TRƯỜNG HỌC CA SINH VIÊN
LỜI CẢM ƠN
Để thể hoàn thành bài tập lớn này, lời đầu tiên em xin phép gửi lời cảm ơn
tới bộ môn Khoa học máy tính, Khoa Công nghệ thông tin – Trường Đại học phạm
Kỹ thuật Hưng Yên đã tạo điều kiện thuận lợi cho em thực hiện bài tập lớn môn học
này.
Đặc biệt em xin chân thành cảm ơn thầy Hoàng Quốc Việt đã rất tận tình hướng
dẫn, chỉ bảo em trong suốt thời gian thực hiện bài tập lớn vừa qua.
Em cũng xin chân thành cảm ơn tất cả các Thầy, các trong Trường đã tận
tình giảng dạy, trang bị cho em những kiến thức cần thiết, quý báu để giúp em thực
hiện được bài tập lớn này.
Mặc dù em đã có cố gắng, nhưng với trình độ còn hạn chế, trong quá trình thực
hiện đề tài không tránh khỏi những thiếu sót. Em hy vọng snhận được những ý kiến
nhận xét, góp ý của các Thầy cô về những kết quả triển khai trong bài tập lớn.
Em xin trân trọng cảm ơn!
PHÂN TÍCH DỮ LIỆU XU NG THAM GIA TRƯỜNG HỌC CỦA SINH VIÊN DỮ LIỆU XU HƯỚNG THAM GIA TRƯỜNG HỌC CA SINH VIÊN
5
MỤC LỤC
CHƯƠNG 1: GIỚI THIỆU BÀI TOÁN.......................................................................2
1.1
Bài tn..............................................................................................................2
1.3
Tiền xử lý dữ liệu...............................................................................................5
1.3.1 Xoá các cột dư thừa...................................................................................................................5
1.3.2 Kiểm tra dữ liệu bị thiếu hoặc giá trị “null”...............................................................................6
1.3.3 Điều chỉnh dữ liệu......................................................................................................................7
1.4
Thống kê dữ liệu.................................................................................................8
1.5
Trực quan hoá dữ liệu.........................................................................................9
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT...........................................................................10
2.1
Pandas..............................................................................................................10
2.1.1 Giới thiệu về Pandas................................................................................................................10
2.1.2 Cài đặt và sử dụng Pandas.......................................................................................................10
2.1.3 Cấu trúc dữ liệu trong Pandas..................................................................................................10
2.1.4 Xử lí dữ liệu khuyết thiếu........................................................................................................12
2.1.5 Sắp xếp dữ liệu trong DataFrame.............................................................................................12
2.1.6 Thống kê dữ liệu......................................................................................................................12
2.2
Matplotlib.........................................................................................................13
2.2.1 Giới thiệu vê matplotlib...........................................................................................................13
2.2.2 Biểu đồ Line......................................................................................................................14
2.2.3 Biểu đồ phân phối (Histogram)................................................................................................14
CHƯƠNG 3. GIẢI PHÁP.............................................................................................14
3.1.
Mã nguồn tiền xử lý dữ liệu.............................................................................14
3.2.
Mã nguồn chức năng Thống kê dữ liệu............................................................15
3.3.
Mã nguồn chức năng Trực quan hóa dữ liệu....................................................21
TÀI LIỆU THAM KHẢO.............................................................................................27