LOGO
LẬPTRÌNH CHO KHOA HỌC DỮ LIỆU
Bài 7. Thư viện numpy
Nội dung
Mtsố gói trongpython choKHDL
1
Giới thiệu về numpy
2
2
Khi to mng chỉ số
3
Các phép toántrênmng
4
Mtsố thaotác bản
5
Một số gói trong python cho KHDL
3
Ngôn ng python hệ thng các gói rt phong
phú, h tr nhiu lĩnh vc khác nhau, từxây dng
ng dng, x lý web, x lý text, x nh,
S dụng pip để tải các gói mi v từ internet
Mt số gói dành cho lp trình thôngthưng:
os: x lý file và tương tác vi hệ điuhành
networkx và igraph: làm vic vi d liu đồ thị,có th
làm vic vi dữ liu rt ln (đ th hàng triệu đnh)
regular expressions: tìmkiếm mu trong d liu text
BeautifulSoup: trích xut d liu từ fileHTML hoc từ
website
Một số gói trong python cho KHDL
4
NumPy (Numerical Python): là gói chuyên về x lý
d liu số (nhiu chiu); gói cũng cha các hàm đi
số tuyến tính bn, biến đi fourier, sinh số ngu
nhiên nâng cao,
SciPy (Scientific Python): da trên Numpy, cung cp
các công cụ mnh cho khoa học kỹ ngh, chng
hạn như biến đổi fourier ri rc, đi số tuyến tính,
tối ưu hóa ma trn thưa
Matplotlib: chuyên s dụng để vẽ biu đ, hỗtrợ
rt nhiu loi biu đồ khácnhau
Một số gói trong python cho KHDL
5
Pandas: chuyên s dng cho quản lý tương tác
vi d liu cấu trúc, đưc s dụng rng rãi trong
vic thu thp tin x lý dữliu
Scikit Learn: chuyên về học máy, da tn NumPy,
SciPy matplotlib; thư vin này sẵn nhiu công
cụ hiu quả cho học máy thiết lp mô hìnhthng
chng hn như các thut toán phân lp, hi quy,
phân cm gim chiu dữ liu
Statsmodels: cho phép ngưi s dụng khám phá d
liu, ưc lưng mô hình thng kim đnh