intTypePromotion=1

Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 6

Chia sẻ: Nguyen Nhi | Ngày: | Loại File: PDF | Số trang:0

0
102
lượt xem
31
download

Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 6

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Siêu dữ liệu Siêu dữ liệu là gì • Dữ liệu về dữ liệu data about other data • Tập các thuộc tính, hay phần tử cần thiết cho việc miêu tả nguồn thông tin • Ví dụ: một tập các bản ghi với các phần tử mô tả một cuốn sách: tác giả author tên sách title ngày xuất bản date of publication Miêu tả description

Chủ đề:
Lưu

Nội dung Text: Kho dữ liệu và Hệ hỗ trợ quyết định ( Nguyễn Thanh Bình ) - Chương 6

  1. Chương 6: Siêu dữ liệu Chương 6: Siêu
  2. Siêu dữ liệu là gì Siêu • Dữ liệu về dữ liệu data about other data • Tập các thuộc tính, hay phần tử cần thiết cho việc miêu tả nguồn thông tin • Ví dụ: một tập các bản ghi với các phần tử mô tả một cuốn sách: tác giả author tên sách title ngày xuất bản date of publication Miêu tả description
  3. Siêu dữ liệu – Khái niệm Siêu • Siêu dữ liệu là thành phần cơ bản để xây dựng và quản lí một kho dữ liệu • Trước khi một kdl có thể được truy cập một cách có hiệu quả, thực sự là cần thiết để hiểu, dữ liệu gì sẵn có trong kdl, và chúng lưu trữ ở đâu. • Dữ liệu miêu tả quá trình xây dựng, quản lí và hoạt động của KDL • Siêu dữ liệu được lưu trữ trong một kho chứa và được truy cập bởi tất cả các thành phần của kdl
  4. Siêu dữ liệu Siêu
  5. Khái niệm siêu dữ liệu Kh • Là một lưu trữ dùng để: Miêu tả KDL tổng thể – Nhận dạng kiểu kho dữ liệu – Quản lí quá trình tích hợp dữ liệu – Quản lí quá trình cập nhật KDL – Quản lí bảo mật – • Hiệp hội chuyên nghiên cứu về siêu dữ liệu Metadata Coalition đã đưa ra đặc tả của siêu dữ liệu vào năm 1996 MDIS Metadata Interchange Specification
  6. Sự quan trọng của siêu dữ liệu • Rất quan trọng trong kho dữ liệu • Không phải là dữ kiện phân tích • Là chìa khóa quyết định sự thành công của kho dữ liệu • Là thành phần luôn được thay đổi, cấp nhật theo sự phát triển của kho dữ liệu • Dùng để quản lý, điều khiển kho dữ liệu Metadata External External Repository Sources Sources Operational Data Sources Warehouse
  7. Chất lượng của siêu dữ liệu Ch • Quản lý được sự tích hợp • Thể hiện được tính lịch sử của dữ liệu • Quản lý được các thay đổi
  8. Sự hình thành siêu dữ liệu • Trong quá trình xây dựng kdl: – Sản sinh một cách tự động – Được tạo ra trong quá trình xây dựng kdl • ứng dụng: – Miêu tả Kdl và các thành phần – Tạo điều kiện cho việc truy cập KDL ở mọi cấp • Bảo trì: – Phục vụ cho các mục đích bảo mật – Lưu trữ thông tin về người dùng
  9. Các bước tạo lập siêu dữ liệu • Định nghĩa các chức năng chính của siêu dữ liệu trong hệ thống kho dữ liệu • Xác định các vấn đề trong tích hợp dữ liệu. • Xác định siêu dữ liệu có thể được tạo như thế nào, ai tạo ra và được lưu trữ ở đâu • Miêu tả nội dung của siêu dữ liệu
  10. Chiến lược cho siêu dữ liệu Chi • Đưa ra một chiến lược cho việc tiến hành xây dựng và sử dụng kho dữ liệu • Phải đảm bảo được siêu dữ liệu có chất lượng cao • Cung cấp cho người dùng thông tin có chất lượng cao • Đảm bảo việc quản lí dữ liệu tích hợp Nhằm vào mục đích đến là gì – Nguồn và thông tin về nguồn – Bảo trì và quản lí – Các chuẩn hóa – Truy cập và các công cụ – Tích hợp và phát triển –
  11. Phân tích mục đích Phân • Các ý định • Các yêu cầu • Quản lý sự truy cập, ai sẽ truy cập và truy cập như thế nào • Xác định các nguồn • Các hướng tích hợp • Quản lí sự thay đổi và tiến triển của KDL
  12. Các loại nguồn của siêu dữ liệu Xác định ai là người dùng kho dữ liệu ? • Họ cần cái gì ? • Siêu dữ liệu chứa cái gì ? • Sẽ sử dụng công cụ gì để xây dựng kho • dữ liệu ?
  13. Các kỹ thuật Các công cụ mô hình hóa • Định nghĩa các lược đồ CSDL • Các công cụ hỗ trợ cho ETT • Các công cụ cho người dùng cuối • Các công cụ để tạo tài liệu kĩ thuật •
  14. Vị trí siêu dữ liệu • Lưu tại máy chủ chứa kho dữ liệu • Có thể được lưu tại các csdl nguồn • Tại máy PC có công cụ quản lí siêu dữ liệu • Quản lý bởi người quản lí siêu dữ liệu • Các chuẩn hóa được sinh ra bởi cấu trúc siêu dữ liệu
  15. Các công cụ và việc truy cập • Ai truy cập ? • Khi nào? • Với mục đích gì ? • Công cụ cho việc quản lí • Công cụ quản lí câu hỏi • Công cụ cho việc xây dựng kho dữ liệu
  16. Các loại siêu dữ liệu chi tiết • Hệ tương tác Operational – Các tiến trình nạp, quản lý và lập lịch cho việc cập nhập kdl • ETT – Quản lý các cấu trúc, ánh xạ – Thông tin nguồn và đích – Quản lý việc chuyển đổi • Người dùng cuối (End user ) – Hỗ trợ việc sử dụng kho dữ liệu – Hỗ trợ việc khảo sát kdl – Hỗ trợ việc cung cấp thông tin cho kdl
  17. Siêu dữ liệu hệ thống tương tác Siêu • Siêu dữ liệu cho hệ tương tác miêu tả phạm vi, giới hạn môi trường của kdl • Xác định những dữ liệu nào cho phép hay không cho phép kdl truy cập • Điều khiển quá trình truyền dữ liệu từ nguồn vào kdl • Cung cấp các thông tin cho các nhà phát triển trong quá trình xây dựng cũng như mở rộng kdl • No data nothing
  18. Siêu dữ liệu cho ETT Siêu Browser: Cu http://st Hollywood om X e+s r: Operational of a recor Cu Browser: Browser: as s http:// http:// tome+ X rs: Hollywood + data Hollywood X Data Warehouse sources Data Model 100% ABC CO 12345.00 External External 110% GMBH LTD 12780.00 2345787.00 230% GBUK INC 200% FFR ASSOC 87877.98 -10% MCD CO 5678.00 sources sources Metadata Repository Internal Warehouse sources ánh xạ dữ liệu từ các nguồn vào kdl
  19. Siêu dữ liệu cho việc chiết (1) Siêu Các luật kinh doanh • Các khóa, trường và bảng nguồn • Quản lí việc sở hữu dữ liệu • Chuyển đổi giữa các trường • Các bản tra cứu • External External Thay đổi tên • Sources Sources Staging Các thay đổi giá trị khóa • File Extraction Các giá trị mặc định • Quản lý đa nguồn • Operational Data Các thuật toán • Sources Nhãn thời gian •
  20. Siêu dữ liệu cho việc chiết (2) Siêu • Các yêu cầu về lưu trữ • Thông tin về vị trí các nguồn External External • Sự khác nhau giữa các Sources Sources nguồn • Thông tin truy cập Extraction • Bảo mật • Các liên hệ, liên hệ với ai Operational để có dữ liệu Data Sources • Các tên chương trình • Các thông tin quản lý tính chất của dữ liệu
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2