intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 2: Kho dữ liệu

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:31

1
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 2: Kho dữ liệu, trình bày các nội dung chính như sau: Data Warehouse là gì; Ứng dụng và người dùng; Tiến trình phát triển DW. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 2: Kho dữ liệu

  1. KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH Bài 2: Kho dữ liệu
  2. Nội dung  Data Warehouse là gì?  Ứng dụng và người dùng  Tiến trình phát triển DW 2
  3. Nội dung  Data Warehouse là gì?  Ứng dụng và người dùng  Tiến trình phát triển DW 3
  4. Kho dữ liệu là gì? • Cơ sở dữ liệu rất lớn – Không phải mọi CSDL lớn là DW, nhưng tất cả các DW là các CSDL tương đối lớn – DW thường khoảng TB tới PB – Thường nằm trên vài máy chủ và cần năng lực tính toán lớn 4
  5. Kho dữ liệu là gì? • Là kho chứa các tập dữ liệu – Chứa dữ liệu lịch sử – Đạt được qua tiến trình làm sạch dữ liệu (ETL) – Dùng cho việc phân tích 5
  6. Kho dữ liệu là gì? • Tập trung vào chiến thuật/chiến lược • Số nhỏ các giao dịch • Các giao dịch lớn trải dài theo thời gian 6
  7. Một số định nghĩa • Ralph Kimball: “a copy of transaction data specifically structured for query and analysis” • Bill Inmon: “A data warehouse is a: – Subject oriented – Integrated – Non-volatile – Time variant collection of data in support of management’s decisions.” 7
  8. Định nghĩa của Inmon • Hướng chủ đề – Dữ liệu trong DW được tổ chức sao cho các dữ liệu liên quan tới cùng một đối tượng hay sự kiện thực tế được liên kết với nhau • Các chủ đề cơ bản của DW là: Khách hàng, Sản phẩm, Đơn đặt hàng, Đánh giá, Tài khoản 8
  9. Định nghĩa của Inmon • Hướng chủ đề – Thí dụ: Khách hàng là chủ đề chính trong một số DW • DW được tổ chức quanh Khách hàng • Chứa hàng trăm bảng dữ liệu liên quan 9
  10. Định nghĩa của Inmon • Tích hợp – DW chứa dữ liệu từ hầu hết hay tất cả các hệ thống hoạt động của doanh nghiệp và các dữ liệu này phải nhất quán với nhau – Thí dụ: nhất quán về mô tả giới tính, phép đo, từ khóa… 10
  11. Định nghĩa của Inmon • Bền vững – Dữ liệu trong DW không bị sửa đổi hay xóa – Dữ liệu được tải vào kho nhưng không cập nhật 11
  12. Định nghĩa của Inmon • Dữ liệu theo thời gian – Các thay đổi của dữ liệu được ghi nhật trong DW theo đó các báo cáo sẽ phản ánh các thay đổi theo thời gian này – DW thường quản lý dữ liệu từ 5 tới 10 năm trong khi các hệ thống hoạt động quản lý dữ liệu từ 60 tới 90 ngày. 12
  13. Định nghĩa tổng quát • DW là: – Kho dữ liệu lớn của một tổ chức – Được thiết kế đặc biệt cho việc lập báo cáo và phân tích 13
  14. OLTP (OnLine Transaction Processing) • Truy cập dữ liệu và xử lý giao dịch • Làm việc trên các kho dữ liệu hoạt động (ODS) và thể hiện các hoạt động kinh doanh hàng ngày – Như mua hàng, bán hàng, phân phối sản phẩm • Phản ánh trạng thái dữ liệu hiện tại 14
  15. OLAP (OnLine Analytical Processing) • Cung cấp thông tin cho các hoạt động như: – Lập kế hoạch nguồn lực doanh nghiệp, lập phân bổ ngân sách, chiến dịch kinh doanh – Thể hiện phân tích front-end dựa trên các DW – Sử dụng để lập báo cáo và định hướng ra quyết định 15
  16. ODS vs. DW • Các đặc điểm của hệ thống dữ liệu hoạt động và DW 16
  17. ODS vs. DW • Cân nhắc việc chuẩn hóa CSDL – Lược đồ thường như sau: 17
  18. ODS vs. DW • DW thường có lược đồ như sau: 18
  19. ODS vs. DW • Những câu hỏi sau được trả lời bởi OLAP – How much did sales unit A earn in January? – How much did sales unit B earn in February? – What was their combined sales amount for the first quarter? • Truy vấn SQL khó trả lời các câu hỏi này vì: – Câu truy vấn phức tạp – Tốc độ chậm bởi dùng nhiều kết nối (join) 19
  20. ODS vs. DW • Các câu hỏi được trả lời nhanh hơn với DW vì: – Dữ liệu được tổ chức lại và được tiền tổ hợp – Các bảng dữ liệu được tổ chức theo chủ đề và thường dùng lược đồ hình sao 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2