intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:63

2
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP, trình bày các nội dung chính như sau: Phép toán OLAP; Truy vấn OLAP: SQL99, MDX. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP

  1. KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH Bài 7: Phép toán và truy vấn OLAP
  2. Nội dung  Phép toán OLAP  Truy vấn OLAP: SQL99, MDX 2
  3. Truy vấn DW • Truy vấn DW là các truy vấn lớn – Phần lớn dữ liệu – Thường là truy vấn đọc • Sự dư thừa là cần thiết – Materialized views, special-purpose indexes, denormalized schemas • Dữ liệu được cập nhật theo các chu kỳ – Hàng ngày hay hàng tuần • Mục đích là để phân tích dữ liệu – OLAP (OnLine Analytical Processing) 3
  4. Truy vấn DW • OLAP được sử dụng trong các lĩnh vực – Quản lý thông tin • Bán hàng theo nhóm sản phẩm/vùng/năm – Chính phủ • Điều tra dân số – CSDL khoa học • Tin học địa chất, tin học sinh học – V.v... • Mục đích: Thời gian đáp ứng là vài giây hay vài phút 4
  5. 1. Các phép toán OLAP • Các phép toán OLAP chuẩn tắc – Roll-up – Drill-down – Slice and dice – Pivot (rotate) • Các phép toán khác – Aggregate functions – Ranking and comparing – Drill-across – Drill-through 5
  6. 1.1. Roll-up • Roll-up (drill-up) – Dùng các giá trị tổ hợp hiện thười của bảng fact và thực hiện các phép tổ hợp thêm – Tổng hợp dữ liệu bằng cách • Leo tiếp lên mức cao của cây phân cấp (hierarchical roll-up) • Giảm số chiều • Hay tổng hợp của cả 2 kỹ thuật trên – Sử dụng để tăng thêm tính tổng hợp • Thí dụ từ Time.Week sang Time.Year 6
  7. 1.1. Roll-up • Leo lên mức cao hơn của cây phân cấp – Performed on the fact table and some dimension tables by climbing up the attribute hierarchies • E.g., climbed the Time hierarchy to Quarter and Article hierarchy to Prod. group 7
  8. 1.1. Roll-up • Giảm số chiều – Are done solely on the fact table by dropping one or more dimensions • E.g., drop the Client dimension 8
  9. 1.1. Roll-up • Leo lên đỉnh cao nhất của cây phân cấp chính là một phép giảm số chiều 9
  10. 1.2. Drill-down • Khoan xuống – Ngược của cuộn lên – Thực hiện việc “giải tổ hợp” • Từ mức tổng hợp cao xuống mức tổng hợp thấp – Thêm chiều mới – Yêu cầu có dữ liệu của mức chi tiết hơn • Không thể khoan xuống thêm nếu không có dữ liệu 10
  11. 1.2. Thí dụ roll-up và drill-down 11
  12. 1.3. Slice • Lát cắt/slice: là tập con của mảng nhiều chiều tương ứng với giá trị đơn ở một chiều nào đó và phép chiếu ở các chiều còn lại – E.g., project on Geo (store) and Time from values corresponding to Laptops in the product dimension 12
  13. 1.3. Slice • Là phép toán chọn theo điều kiện bằng • Mệnh đề WHERE trong SQL – Thí dụ lát cắt cho sản phẩm là laptops 13
  14. 1.4. Dice • Khúc cắt: là tập con của mảng nhiều chiều mà được chọn theo dải trên 1 chiều hoặc chọn bằng trên nhiều chiều – Thí dụ 14
  15. 1.4. Dice 15
  16. 1.5. Pivot • Pivot: tổ chức lại dữ liệu cho mục đích hiển thị – Pivot đơn giản nhất là chọn 2 chiều và thực hiện tổ hợp các giá trị đo • Các giá trị tổ hợp thường được trình bày theo một lưới (bảng) mỗi vị trí/ô (x,y) tương ứng với giá trị tổ hợp của giá trị đo • x,y là các giá trị trên 2 chiều được chọn – Kết quả cũng được gọi là cross–tabulation 16
  17. 1.5. Pivot • Pivot dữ liệu sau 17
  18. 1.5. Pivot • Pivot trên City và Day 18
  19. Các yêu cầu phân tích chính • Các phép toán OLAP thường khó thể hiện bằng các ngôn ngữ truy vấn – Đại đa số các nhà phân tích và ra quyết định không thích dạng ngôn ngữ truy vấn SELECT f.region, z.month, sum(a.price * a.volume) FROM Order a, Time z, PoS f WHERE a.pos = f.name AND a.date = z.date GROUP BY f.region, z.month - Phần mềm OLAP thường cho phép thực hiện các phép toán qua giao diện đồ họa 19
  20. Trực quan hóa dữ liệu OLAP • Thí dụ về 2 chiều Products và Store 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2