Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 4: Mô hình hóa dữ liệu
lượt xem 0
download
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 4: Mô hình hóa dữ liệu, trình bày các nội dung chính như sau: Mô hình hóa logic; Mô hình hóa vật lý. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 4: Mô hình hóa dữ liệu
- KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH Bài 4: Mô hình hóa dữ liệu
- Nội dung Mô hình hóa logic Các phần tử Các phép toán Sự thay đổi Mô hình hóa vật lý 2
- Mô hình hóa DW • Mô hình hóa dữ liệu – Mô hình hóa logic Cubes, Dimensions, Hierarchies – Mô hình hóa vật lý Array storage, Star, Snowflake 3
- Mô hình hóa logic • Các phần tử của mô hình logic – Dimensions và cubes • Các phép toán cơ bản trên mô hình đa chiều – Cube selection, projection, join • Hỗ trợ thay đổi mô hình logic 4
- Mô hình logic • Mục đích của mô hình logic – Sàng lọc các facts và dimensions của các chủ đề đã được xác định trong mô hình khái niệm – Quyết định mức chi tiết/granularity cho các chiều – Thí dụ cubes: sales, purchase, price, inventory dimensions: product, time, geography, client 5
- Dimensions • Chiều là các thực thể – Được chọn trong mô hình dữ liệu liên quan tới mục đích phân tích – Mỗi chiều có thể được sử dụng trong nhiều cube – Được tổ chức thành cây phân cấp 6
- Dimensions • Chiều được tổ chức thành các mức phân lớp/classification levels hay mức chi tiết/granularities (thí dụ: ngày, tháng,…) – Phụ thuộc giữa các mức phân lớp được mô tả bằng lược đồ phân lớp/classification schema sử dụng các phụ thuộc hàm Thuộc tính B được gọi là phụ thuộc hàm vào thuộc tính A, ký hiệu nếu với mọi tồn tại duy nhất một tương ứng với nó 7
- Dimensions • Lược đồ phân lớp – Lược đồ phân lớp của chiều D là tập bán thứ tự/semi-ordered set của các mức phân lớp – Với một phần tử nhỏ nhất 8
- Dimensions • Tập con thứ tự/fully-ordered set các mức phân lớp được gọi là Path – Thí dụ lược đồ của chiều thời gian có những Path sau: – T.Day -> T.Week – T.Day -> T.Month -> T.Quarter -> T.Year – T.Day là phần tử nhỏ nhất/smallest element 9
- Dimensions • Cây phân cấp lớp – Nếu là một path trong lược đồ phân lớp của chiều D thì cây phân lớp gắn với path này là cây cân bằng với • Có các nodes thuộc • Và các cạnh của nó thể hiện các phụ thuộc hàm 10
- Dimensions • Cây phân lớp đối với path chiều sản phẩm 11
- Cubes • Cubes thể hiện đơn vị cơ bản của mô hình đa chiều – Lưu trữ nhiều giá trị đo/measure (thí dụ doanh thu bán hàng) ở dạng thô hay dạng đã tổ hợp (raw or pre-aggregated) • Cube C là tập của các cube cells với là tập các mức chi tiết và là tập các số đo/measures – Thí dụ Sales((Article, Day, Store, Client), (Turnover)) 12
- Cubes • Các tổ hợp được sử dụng để tăng tốc độ truy vấn – Với cube sales 3 chiều ((item, city, year), (turnover)) ta có • 3 aggregates with 2 dimensions e.g. (*, city, year) • 3 aggregates with 1 dimension e.g. (*, *, year) • 1 aggregate with no dimension (*,*,*) 13
- Cubes • Trong mô hình logic, cubes (bao gồm các tổ hợp) được thể hiện như mạng tinh thể/lattice of cuboids – Khối đỉnh cao nhất, 0-D, là mức tổng hợp cao nhất và được gọi là khối đỉnh/apex cuboid – Khối n-D chứa các giá trị đo không tổ hợp được gọi là khối cơ bản 14
- Cubes • Độ phức tạp tăng nhanh khi tăng số chiều 15
- Các phép toán cơ bản • Các phép toán cơ bản trên mô hình đa chiều mức logic: – Chọn/selection – Chiếu/projection – Liên kết/cube join – Tổ hợp/Aggregation 16
- Các phép toán cơ bản • Chọn đa chiều – Lựa chọn trong khối đa chiều với điều kiện P được xác định như nếu tất cả các biến trong P • Các mức phân lớp K phụ thuộc hàm vào mức phân lớp nhỏ nhất của K, • Các giá trị đo từ – Thí dụ 17
- Các phép toán cơ bản • Phép chiếu đa chiều – Phép chiếu một hàm hàm với một số giá trị đo F(M) của cube C được xác định như sau – Thí dụ 18
- Các phép toán cơ bản • Phép toán liên kết giữa các cube – Thí dụ nếu không có giá trị đo turnover, có thể tính toán nó từ giá trị đo unit_price từ cube price – 2 cube và chỉ có thể được kết nối nếu chúng có cùng mức chi tiết ( ) 19
- Các phép toán cơ bản • So sánh mức chi tiết – Mức chi tiết là chi tiết hơn khi và chỉ khi với mọi sao cho 20
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Giới thiệu chung về kho dữ liệu
129 p | 274 | 27
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Chương 5: Khai phá dữ liệu trong kinh doanh (P2)
128 p | 122 | 17
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 2 - Tiền xử lý dữ liệu
77 p | 146 | 13
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 2 - Nguyễn Hoàng Ân (2018)
19 p | 58 | 6
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương mở đầu - Nguyễn Ngọc Duy
4 p | 32 | 6
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 1 - Nguyễn Hoàng Ân (2018)
22 p | 59 | 5
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 4 - Nguyễn Ngọc Duy
114 p | 26 | 3
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 2 - Nguyễn Ngọc Duy
125 p | 44 | 3
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 1 - Nguyễn Ngọc Duy
30 p | 33 | 3
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Nguyễn Ngọc Duy
55 p | 34 | 2
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 6: Tối ưu hóa
64 p | 2 | 1
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 1: Giới thiệu chung
34 p | 1 | 0
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 2: Kho dữ liệu
31 p | 0 | 0
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 3: Kiến trúc kho dữ liệu
65 p | 1 | 0
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 5: Lập chỉ mục
58 p | 1 | 0
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 7: Phép toán và truy vấn OLAP
63 p | 1 | 0
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 8: Xây dựng DW
69 p | 2 | 0
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn