intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 5

Chia sẻ: Nguyen Nhi | Ngày: | Loại File: PDF | Số trang:0

159
lượt xem
33
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Kỹ thuật mô hình hoá các chiều cơ sở Giới thiệu Các bước mô hình kho dữ liệu Độ thô dữ liệu (Data Granularity) Lưu trữ dữ liệu Các phân cấp thuộc tính Truy vấn KDL và OLAP Các lỗi thường gặp khi xây dựng 1 KDL Ví dụ

Chủ đề:
Lưu

Nội dung Text: Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 5

  1. Chương 5: Kỹ thuật mô hình hoá Chương 5: các chiều cơ sở
  2. Giới thiệu Gi Các bước mô hình kho dữ liệu • Độ thô dữ liệu (Data Granularity) • Lưu trữ dữ liệu • Các phân cấp thuộc tính • Truy vấn KDL và OLAP • Các lỗi thường gặp khi xây dựng 1 KDL • Ví dụ •
  3. Các tầng • Tầng khái niệm Conceptual layer – dữ liệu và xử lí dữ liệu • Tầng logic Logical layer – dữ liệu và xử lí kinh doanh • Tầng vật lý Physical layer – cấu trúc bên trong • Các chủ thể, dữ kiện và mối quan hệ
  4. Tầng trong hệ thống thông tin Conceptual Layer Logical Layer Logical Layer Physical Layer Physical Layer Operational systems Warehouse
  5. Các thành phần chính • Phân cấp thuộc tính của các chiều • Mối quan hệ Location Dimension • Dữ kiện Region Product Dimension Time Dimension District Manufacturer Account Year Store Brand Account Week Product_key Product Store_key Acct_Week_key Sales Data
  6. Các tiến trình mô hình hóa • Xác định yêu cầu của người dùng • Hướng dẫn người dùng hiểu về công nghệ KDL
  7. Các tiến trình mô hình hóa • Định nghĩa mô hình kinh doanh • Mô hình hóa các chiều • Chọn mô hình lưu trữ Conceptual Model Logical Model Physical Model
  8. Các công cụ và phương pháp • Chọn các công cụ với giao diện đồ họa – Tạo lập tài liệu – Định nghĩa các liên kết và ràng buộc • Phương pháp luận • Mô hình hoá • Xây dựng sản phẩm
  9. Tóm lược các lược dồ – Sao – Bông tuyết – Đa sao
  10. Mô hình hóa các chiều Mô • Mô hình dựa vào nội dung của dữ liệu • Mô hình với các tổng hợp cần thiết • Mô hình phải đáp ứng yêu cầu phân tích sâu, và tổng hợp • Có thể không chuẩn hóa - star • Có thể chuẩn hóa - snowflake • Xây dựng các phân cấp
  11. Mô hình các bảng tóm tắt Mô • Định nghĩa các bảng tóm tắt trước khi thiết kế • Dùng các bảng riêng để chứa các tổng hợp/tóm tắt SALES BY MONTH/REGION Month Region Tot_Sales$ SALES FACTS Jan 97 North 41,000 Sales$ Region Month Jan 97 East 10,000 10,000 North Jan 97 Feb 97 South 40,000 12,000 South Feb 97 Mar 97 West 17,000 11,000 North Jan 97 15,000 West Mar 97 18,000 South Feb 97 20,000 North Jan 97 SALES BY MONTH 10,000 East Jan 97 Month Tot_Sales 2,000 West Mar 97 Jan 97 51,000 Feb 97 40,000 Mar 97 17,000
  12. Khi nào thì tóm tắt dữ liệu Khi • Phân tích và đưa ra quyết định để truy cập trực tiếp các tổng hợp có sẵn hay tính toán tại thời điểm thực hiện câu hỏi. • Việc tính toán các tỉ số nén cho phép quyết định nên chọn phương án nào Queried Rows Displayed Rows Calculation Ratio 1,341 22 22/11341 0.0164 234 22 22/234 0.09 30 22 22/30 0.73 20 22 22/20 1.1
  13. Các công cụ • Logic Works • Micro Strategy • Oracle Designer/2000 Data Mart Designer • Prism Solutions • Smart Corporation
  14. Ví dụ Kho dữ liệu: Grocery Store • Một dây chuyền các cửa hàng tạp phẩm nằm rãi rác 3 bang ở Mỹ • Các kho: các siêu thị với các cửa hàng như tạp phẩm, bơ sữa, thịt, thức ăn lạnh, bánh mỳ, đồ uống, .. • Khoảng 60.000 sản phẩm tại mỗi kho Ví dụ điển hình của KDL trích từ KIM 96
  15. Cơ sở Cơ • Dữ liệu sẵn sàng cho việc xây dựng KDL – Dữ liệu từ các hệ thống nguồn: OLTP – Được làm sạch • Xây dựng kho DL: Mô hình các tiến trình kinh doanh nào ? – Định nghĩa độ thô của dữ liệu để phù hợp với KDL – Mô hình hoá cấu trúc KDL – Biến đổi dữ liệu theo cấu trúc Kho DL – Tính toán các tổng hợp và các dữ kiện suy dẫn –
  16. Các tiến trình mô hình • KDL miêu tả khung nhìn của một tiến trình kinh doanh • Sự quyết định mô hình tiến trình kinh doanh nào có tác động quan trọng – Nhằm vào các vấn đề gì ? – Các câu hỏi được đặt ra ? – Các thông tin cần thiết – KDL trung tâm hay các chợ dữ liệu
  17. Tiến trình kinh doanh Ti • Dữ liệu OLTP Point of sales (POS) data: Dữ liệu bán hàng – Dữ liệu nhà cung cấp – Dữ liệu kế toán – Dữ liệu khách hàng – Sự quảng cáo – Mục đích: Xây dựng một CSDL hoạt động hàng ngày
  18. Ví dụ về độ thô • Độ thô nào cho dữ liệu POS? Các khả năng ? – Toàn tác đơn theo từng khách hàng từng sản phẩm tại từng kho – Toàn tác nhóm theo từng khách hàng từng sản phẩm tại từng kho – Toàn tác nhóm hàng ngày theo từng kho từng sản ph ẩ m – Toàn tác nhóm hàng tuần theo từng kho từng sản ph ẩ m – Toàn tác nhóm hàng ngày từng sản phẩm tại từng vùng
  19. Độ thô • Toàn tác nhóm hàng ngày theo từng kho từng sản phẩm – Dữ kiện theo từng khách hàng từng sản phẩm tại từng kho không phù hợp cho việc phân tích thị trường – Dữ kiện theo từng tuần, hay tháng cũng không phù hợp vì sẽ không phân tích được sự khác nhau giữa các ngày • Sự quyết định độ thô nào phụ thuộc vào tiến trình kinh doanh và các câu hỏi cần trả lời
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2