Trịnh Tấn Đạt
Đại Học Sài Gòn
trinhtandat@sgu.edu.vn
http://sites.google.com/site/ttdat88
Nội Dung
Giới thiệu cài đặt
Cấu trúc dữ liệu của pandas
Series Dataframe
Bài tập
Cài đặt
pandas thư viện mở rộng từ numpy, chuyên để xử dữ liệu cấu trúc dạng
bảng ( thể dùng để đọc file excel hoặc csv)
Tên “pandas” là viết tt từpanel data”
Để cài đặt module pandas dùng lệnh:
pip install pandas
https://pandas.pydata.org/docs/user_guide/index.html
https://pandas.pydata.org/docs/reference/index.html
Đặc điểm
Đọc dữ liệu từ nhiều định dạng
Liên kết dữ liệu tích hợp xử dữ liệu bị thiếu
Xoay chuyển đổi chiều của dữ liệu dễ dàng
Tách, đánh chỉ mục chia nhỏ các tập dữ liệu lớn dựa trên nhãn
thể nhóm dữ liệu cho các mục đích hợp nhất chuyển đổi
Lọc dữ liệu thực hiện query trên dữ liệu
Xử dữ liệu chuỗi thời gian lấy mẫu