Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 5
lượt xem 33
download
Kỹ thuật mô hình hoá các chiều cơ sở Giới thiệu Các bước mô hình kho dữ liệu Độ thô dữ liệu (Data Granularity) Lưu trữ dữ liệu Các phân cấp thuộc tính Truy vấn KDL và OLAP Các lỗi thường gặp khi xây dựng 1 KDL Ví dụ
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 5
- Chương 5: Kỹ thuật mô hình hoá Chương 5: các chiều cơ sở
- Giới thiệu Gi Các bước mô hình kho dữ liệu • Độ thô dữ liệu (Data Granularity) • Lưu trữ dữ liệu • Các phân cấp thuộc tính • Truy vấn KDL và OLAP • Các lỗi thường gặp khi xây dựng 1 KDL • Ví dụ •
- Các tầng • Tầng khái niệm Conceptual layer – dữ liệu và xử lí dữ liệu • Tầng logic Logical layer – dữ liệu và xử lí kinh doanh • Tầng vật lý Physical layer – cấu trúc bên trong • Các chủ thể, dữ kiện và mối quan hệ
- Tầng trong hệ thống thông tin Conceptual Layer Logical Layer Logical Layer Physical Layer Physical Layer Operational systems Warehouse
- Các thành phần chính • Phân cấp thuộc tính của các chiều • Mối quan hệ Location Dimension • Dữ kiện Region Product Dimension Time Dimension District Manufacturer Account Year Store Brand Account Week Product_key Product Store_key Acct_Week_key Sales Data
- Các tiến trình mô hình hóa • Xác định yêu cầu của người dùng • Hướng dẫn người dùng hiểu về công nghệ KDL
- Các tiến trình mô hình hóa • Định nghĩa mô hình kinh doanh • Mô hình hóa các chiều • Chọn mô hình lưu trữ Conceptual Model Logical Model Physical Model
- Các công cụ và phương pháp • Chọn các công cụ với giao diện đồ họa – Tạo lập tài liệu – Định nghĩa các liên kết và ràng buộc • Phương pháp luận • Mô hình hoá • Xây dựng sản phẩm
- Tóm lược các lược dồ – Sao – Bông tuyết – Đa sao
- Mô hình hóa các chiều Mô • Mô hình dựa vào nội dung của dữ liệu • Mô hình với các tổng hợp cần thiết • Mô hình phải đáp ứng yêu cầu phân tích sâu, và tổng hợp • Có thể không chuẩn hóa - star • Có thể chuẩn hóa - snowflake • Xây dựng các phân cấp
- Mô hình các bảng tóm tắt Mô • Định nghĩa các bảng tóm tắt trước khi thiết kế • Dùng các bảng riêng để chứa các tổng hợp/tóm tắt SALES BY MONTH/REGION Month Region Tot_Sales$ SALES FACTS Jan 97 North 41,000 Sales$ Region Month Jan 97 East 10,000 10,000 North Jan 97 Feb 97 South 40,000 12,000 South Feb 97 Mar 97 West 17,000 11,000 North Jan 97 15,000 West Mar 97 18,000 South Feb 97 20,000 North Jan 97 SALES BY MONTH 10,000 East Jan 97 Month Tot_Sales 2,000 West Mar 97 Jan 97 51,000 Feb 97 40,000 Mar 97 17,000
- Khi nào thì tóm tắt dữ liệu Khi • Phân tích và đưa ra quyết định để truy cập trực tiếp các tổng hợp có sẵn hay tính toán tại thời điểm thực hiện câu hỏi. • Việc tính toán các tỉ số nén cho phép quyết định nên chọn phương án nào Queried Rows Displayed Rows Calculation Ratio 1,341 22 22/11341 0.0164 234 22 22/234 0.09 30 22 22/30 0.73 20 22 22/20 1.1
- Các công cụ • Logic Works • Micro Strategy • Oracle Designer/2000 Data Mart Designer • Prism Solutions • Smart Corporation
- Ví dụ Kho dữ liệu: Grocery Store • Một dây chuyền các cửa hàng tạp phẩm nằm rãi rác 3 bang ở Mỹ • Các kho: các siêu thị với các cửa hàng như tạp phẩm, bơ sữa, thịt, thức ăn lạnh, bánh mỳ, đồ uống, .. • Khoảng 60.000 sản phẩm tại mỗi kho Ví dụ điển hình của KDL trích từ KIM 96
- Cơ sở Cơ • Dữ liệu sẵn sàng cho việc xây dựng KDL – Dữ liệu từ các hệ thống nguồn: OLTP – Được làm sạch • Xây dựng kho DL: Mô hình các tiến trình kinh doanh nào ? – Định nghĩa độ thô của dữ liệu để phù hợp với KDL – Mô hình hoá cấu trúc KDL – Biến đổi dữ liệu theo cấu trúc Kho DL – Tính toán các tổng hợp và các dữ kiện suy dẫn –
- Các tiến trình mô hình • KDL miêu tả khung nhìn của một tiến trình kinh doanh • Sự quyết định mô hình tiến trình kinh doanh nào có tác động quan trọng – Nhằm vào các vấn đề gì ? – Các câu hỏi được đặt ra ? – Các thông tin cần thiết – KDL trung tâm hay các chợ dữ liệu
- Tiến trình kinh doanh Ti • Dữ liệu OLTP Point of sales (POS) data: Dữ liệu bán hàng – Dữ liệu nhà cung cấp – Dữ liệu kế toán – Dữ liệu khách hàng – Sự quảng cáo – Mục đích: Xây dựng một CSDL hoạt động hàng ngày
- Ví dụ về độ thô • Độ thô nào cho dữ liệu POS? Các khả năng ? – Toàn tác đơn theo từng khách hàng từng sản phẩm tại từng kho – Toàn tác nhóm theo từng khách hàng từng sản phẩm tại từng kho – Toàn tác nhóm hàng ngày theo từng kho từng sản ph ẩ m – Toàn tác nhóm hàng tuần theo từng kho từng sản ph ẩ m – Toàn tác nhóm hàng ngày từng sản phẩm tại từng vùng
- Độ thô • Toàn tác nhóm hàng ngày theo từng kho từng sản phẩm – Dữ kiện theo từng khách hàng từng sản phẩm tại từng kho không phù hợp cho việc phân tích thị trường – Dữ kiện theo từng tuần, hay tháng cũng không phù hợp vì sẽ không phân tích được sự khác nhau giữa các ngày • Sự quyết định độ thô nào phụ thuộc vào tiến trình kinh doanh và các câu hỏi cần trả lời
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Đề cương môn học: hệ quản trị cơ sở dữ liệu ngành may
79 p | 653 | 91
-
Hệ thống Hoạch định Nguồn lực Doanh nghiệp (ERP)
53 p | 292 | 85
-
Kho dữ liệu và Hệ hỗ trợ quyết định
313 p | 381 | 81
-
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 4
0 p | 215 | 38
-
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 3
0 p | 180 | 36
-
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 6
0 p | 131 | 33
-
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 1
0 p | 164 | 30
-
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 7
0 p | 146 | 29
-
Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 2
0 p | 116 | 27
-
Thủ thuật nén dữ liệu văn bản hiệu quả nhất
2 p | 122 | 12
-
Tìm hiểu về các hệ thống thông minh: Phần 2 - Hồ Cẩm Hà
86 p | 20 | 8
-
Về mô hình chuyển đổi và tích hợp dữ liệu công dân ( Data Hub công dân )
6 p | 71 | 4
-
Xây dựng cơ sở dữ liệu phục vụ quản lý chất thải rắn sinh hoạt tại thành phố Thái Nguyên, Tỉnh Thái Nguyên
5 p | 89 | 3
-
Mô tả công việc nhân viên quản trị Database
1 p | 129 | 3
-
Mô tả công việc Trưởng nhóm quản trị CSDL
1 p | 92 | 3
-
Làm giàu thông tin kho dữ liệu tài sản thông qua dữ liệu tri thức trực tuyến
3 p | 52 | 3
-
Một phương pháp xây dựng dữ liệu cho hệ thống học sâu trong chẩn đoán một số bệnh thông thường ở trẻ em
6 p | 28 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn