intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 4: Mô hình hóa dữ liệu

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:63

1
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 4: Mô hình hóa dữ liệu, trình bày các nội dung chính như sau: Mô hình hóa logic; Mô hình hóa vật lý. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 4: Mô hình hóa dữ liệu

  1. KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH Bài 4: Mô hình hóa dữ liệu
  2. Nội dung Mô hình hóa logic Các phần tử Các phép toán Sự thay đổi  Mô hình hóa vật lý 2
  3. Mô hình hóa DW • Mô hình hóa dữ liệu – Mô hình hóa logic Cubes, Dimensions, Hierarchies – Mô hình hóa vật lý Array storage, Star, Snowflake 3
  4. Mô hình hóa logic • Các phần tử của mô hình logic – Dimensions và cubes • Các phép toán cơ bản trên mô hình đa chiều – Cube selection, projection, join • Hỗ trợ thay đổi mô hình logic 4
  5. Mô hình logic • Mục đích của mô hình logic – Sàng lọc các facts và dimensions của các chủ đề đã được xác định trong mô hình khái niệm – Quyết định mức chi tiết/granularity cho các chiều – Thí dụ cubes: sales, purchase, price, inventory dimensions: product, time, geography, client 5
  6. Dimensions • Chiều là các thực thể – Được chọn trong mô hình dữ liệu liên quan tới mục đích phân tích – Mỗi chiều có thể được sử dụng trong nhiều cube – Được tổ chức thành cây phân cấp 6
  7. Dimensions • Chiều được tổ chức thành các mức phân lớp/classification levels hay mức chi tiết/granularities (thí dụ: ngày, tháng,…) – Phụ thuộc giữa các mức phân lớp được mô tả bằng lược đồ phân lớp/classification schema sử dụng các phụ thuộc hàm Thuộc tính B được gọi là phụ thuộc hàm vào thuộc tính A, ký hiệu nếu với mọi tồn tại duy nhất một tương ứng với nó 7
  8. Dimensions • Lược đồ phân lớp – Lược đồ phân lớp của chiều D là tập bán thứ tự/semi-ordered set của các mức phân lớp – Với một phần tử nhỏ nhất 8
  9. Dimensions • Tập con thứ tự/fully-ordered set các mức phân lớp được gọi là Path – Thí dụ lược đồ của chiều thời gian có những Path sau: – T.Day -> T.Week – T.Day -> T.Month -> T.Quarter -> T.Year – T.Day là phần tử nhỏ nhất/smallest element 9
  10. Dimensions • Cây phân cấp lớp – Nếu là một path trong lược đồ phân lớp của chiều D thì cây phân lớp gắn với path này là cây cân bằng với • Có các nodes thuộc • Và các cạnh của nó thể hiện các phụ thuộc hàm 10
  11. Dimensions • Cây phân lớp đối với path chiều sản phẩm 11
  12. Cubes • Cubes thể hiện đơn vị cơ bản của mô hình đa chiều – Lưu trữ nhiều giá trị đo/measure (thí dụ doanh thu bán hàng) ở dạng thô hay dạng đã tổ hợp (raw or pre-aggregated) • Cube C là tập của các cube cells với là tập các mức chi tiết và là tập các số đo/measures – Thí dụ Sales((Article, Day, Store, Client), (Turnover)) 12
  13. Cubes • Các tổ hợp được sử dụng để tăng tốc độ truy vấn – Với cube sales 3 chiều ((item, city, year), (turnover)) ta có • 3 aggregates with 2 dimensions e.g. (*, city, year) • 3 aggregates with 1 dimension e.g. (*, *, year) • 1 aggregate with no dimension (*,*,*) 13
  14. Cubes • Trong mô hình logic, cubes (bao gồm các tổ hợp) được thể hiện như mạng tinh thể/lattice of cuboids – Khối đỉnh cao nhất, 0-D, là mức tổng hợp cao nhất và được gọi là khối đỉnh/apex cuboid – Khối n-D chứa các giá trị đo không tổ hợp được gọi là khối cơ bản 14
  15. Cubes • Độ phức tạp tăng nhanh khi tăng số chiều 15
  16. Các phép toán cơ bản • Các phép toán cơ bản trên mô hình đa chiều mức logic: – Chọn/selection – Chiếu/projection – Liên kết/cube join – Tổ hợp/Aggregation 16
  17. Các phép toán cơ bản • Chọn đa chiều – Lựa chọn trong khối đa chiều với điều kiện P được xác định như nếu tất cả các biến trong P • Các mức phân lớp K phụ thuộc hàm vào mức phân lớp nhỏ nhất của K, • Các giá trị đo từ – Thí dụ 17
  18. Các phép toán cơ bản • Phép chiếu đa chiều – Phép chiếu một hàm hàm với một số giá trị đo F(M) của cube C được xác định như sau – Thí dụ 18
  19. Các phép toán cơ bản • Phép toán liên kết giữa các cube – Thí dụ nếu không có giá trị đo turnover, có thể tính toán nó từ giá trị đo unit_price từ cube price – 2 cube và chỉ có thể được kết nối nếu chúng có cùng mức chi tiết ( ) 19
  20. Các phép toán cơ bản • So sánh mức chi tiết – Mức chi tiết là chi tiết hơn khi và chỉ khi với mọi sao cho 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2