MỤC LỤC
CHƯƠNG 1: GIỚI THIỆU BÀI TOÁN.......................................................................2
1.1
Bài toán..............................................................................................................2
1.3
Tiền xử lý dữ liệu...............................................................................................5
1.3.1 Xoá các cột dư thừa...................................................................................................................5
1.3.2 Kiểm tra dữ liệu bị thiếu hoặc giá trị “null”...............................................................................6
1.3.3 Điều chỉnh dữ liệu......................................................................................................................7
1.4
Thống kê dữ liệu.................................................................................................8
1.5
Trực quan hoá dữ liệu.........................................................................................9
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT...........................................................................10
2.1
Pandas..............................................................................................................10
2.1.1 Giới thiệu về Pandas................................................................................................................10
2.1.2 Cài đặt và sử dụng Pandas.......................................................................................................10
2.1.3 Cấu trúc dữ liệu trong Pandas..................................................................................................10
2.1.4 Xử lí dữ liệu khuyết thiếu........................................................................................................12
2.1.5 Sắp xếp dữ liệu trong DataFrame.............................................................................................12
2.1.6 Thống kê dữ liệu......................................................................................................................12
2.2
Matplotlib.........................................................................................................13
2.2.1 Giới thiệu vê matplotlib...........................................................................................................13
2.2.2 Biểu đồ Line......................................................................................................................14
2.2.3 Biểu đồ phân phối (Histogram)................................................................................................14
CHƯƠNG 3. GIẢI PHÁP.............................................................................................14
3.1.
Mã nguồn tiền xử lý dữ liệu.............................................................................14
3.2.
Mã nguồn chức năng Thống kê dữ liệu............................................................15
3.3.
Mã nguồn chức năng Trực quan hóa dữ liệu....................................................21
TÀI LIỆU THAM KHẢO.............................................................................................27