LOGO
LẬPTRÌNH CHO KHOA HỌC DỮ LIỆU
Bài 9. Thư viện Pandas
Nội dung
Gii thiệu cài đặt pandas
1
Cu trúc dữ liu trong pandas
2
2
Làm vic với series
3
Làm vic vi dataframe
4
Làm việc với panel
5
Chọn nhóm phần tử
6
Giới thiệu Pandas
3
pandas là t vin m rng từnumpy, chuyên đ
x lý d liu cấu tc dạng bảng
Tên pandas là dạng số nhiu của panel data
Giới thiệu Pandas
4
Đc d liu từ nhiu đnhdạng
Liên kết d liu tích hợp xử lý d liu bịthiếu
Xoay chuyển đổi chiu của d liu dễ dàng
Tách, đánh ch mc chia nhỏ các tp d liu ln
da trên nhãn
Có th nhóm d liu cho các mc đích hợp nhất và
chuyển đổi
Lọc d liu thc hin query trên dữliu
X lý d liu chui thời gian lymu
Đặc điểm nổi bật của pandas
Cấu trúc dữ liệu trong pandas
5
D liu ca pandas 3 cấu tc chính:
Series (lot): cu trúc 1 chiu, mng d liu đồngnhất
Dataframe (khung): cu trúc 2 chiu, dữ liu tn các
ct đồng nhất (có phn ging như table trong SQL,
nhưng vi các dòng đưc đặt tên)
Panel (bng): cu trúc 3 chiu, có th xem như mộttp
các dataframe vi thông tin bổsung
D liu series gần ging kiu array trong numpy,
nhưng 2 đim khác biệt quan trng:
Chấp nhận d liu thiếu (NaN không xácđnh)
Hệ thng ch mc phong phú (gingdictionary?)