intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 1: Giới thiệu chung

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:34

1
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 1: Giới thiệu chung, trình bày các nội dung chính như sau: Xử lý giao dịch và phân tích dữ liệu; Giới thiệu Data Warehousing; Giới thiệu Business Intelligence. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Kho dữ liệu và kinh doanh thông minh - Bài 1: Giới thiệu chung

  1. MI4214 KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH Giới thiệu
  2. Mục tiêu • Trang bị kiến thức về: – Phân tích thiết kế kho dữ liệu phục vụ các hệ hỗ trợ quyết định – Xây dựng các hệ thống kinh doanh thông minh • Vận dụng các kiến thức vào việc phát triển các ứng dụng thực tế 2
  3. • chưa học CSDL 3
  4. Tài liệu tham khảo • [1] Kimball, R., & Ross, M. (2013). The data warehouse toolkit: The definitive guide to dimensional modeling. John Wiley & Sons. • [2] Inmon, W. H. (2005). Building the data warehouse. John wiley & sons. 4
  5. Bài 1: Giới thiệu chung Data Business Warehousing ??? Intelligence??? Xử lý giao dịch Phân tích dữ liệu 5
  6. Nội dung  Xử lý giao dịch và phân tích dữ liệu  Giới thiệu Data Warehousing  Giới thiệu Business Intelligence 6
  7. Hệ thống thông tin • 4 cấp độ của hệ thống thông tin 7
  8. Xử lý giao dịch và phân tích dữ liệu • Giao dịch: – là 1 sự trao đổi hàng hóa hay dịch vụ giữa người mua và người bán (theo nghĩa trong kinh doanh) – là tập các bước trao đổi thông tin, công việc mà được xem như một đơn nguyên (theo nghĩa trong khoa học máy tính) • Ví dụ về các giao dịch: – Rút tiền, chuyển tiền, đặt hàng, xuất kho, xuất hóa đơn 8
  9. Xử lý giao dịch và phân tích dữ liệu • Phân tích dữ liệu: – mổ xẻ (tổng hợp) dữ liệu để tìm ra thông tin – Thông tin mô tả, thông tin ẩn • Thí dụ: – Có được thông tin gì từ dữ liệu sau 1.67, 1.80, 1.71, 1.73, 1.72, 1.70, 1.75, 1.74, 1.81 - Có được thông tin gì từ tập dữ liệu hóa đơn bán hàng 9
  10. Nội dung  Xử lý giao dịch và phân tích dữ liệu  Giới thiệu Data Warehousing  Giới thiệu Business Intelligence 10
  11. Giới thiệu Data Warehousing • Các quyết định không chính xác có thể dẫn đến thảm họa – Data Warehousing là cơ sở cho những hệ thống hỗ trợ quyết định 11
  12. Giới thiệu kho dữ liệu • Data warehouse là tập dữ liệu hướng chủ đề, tích hợp, chiều thời gian và bền vững hỗ trợ ra quyết định. • Phân tách với cơ sở dữ liệu tác nghiệp • Cung cấp dữ liệu quá khứ và hợp nhất tổ chức chặt chẽ phục vụ cho việc phân tích • Data warehousing: Tiến trình xây dựng và sử dụng Data warehouses 12
  13. Hướng chủ đề (Subject-Oriented) • Được tổ chức quanh các chủ đề như: customer, product, sales. • Tập trung vào việc mô hình và phân tích dữ liệu cho việc ra quyết định chứ không phải xử lý các giao dịch hay tác nghiệp hàng ngày. • Cung cấp một góc nhìn đơn giản và xúc tích quanh một chủ đề cụ thể bằng cách loại bỏ các dữ liệu không hữu dụng trong tiến trình hỗ trợ quyết định. 13 13
  14. Tích hợp (Integrated) • Tích hợp dữ liệu từ nhiều nguồn dữ liệu không đồng nhất – Các cơ sở dữ liệu, các cấu trúc file hay các bản ghi giao dịch trực tuyến • Áp dụng các kỹ thuật làm sạch và tích hợp dữ liệu – Đảm bảo sự nhất quán giữa các nguồn dữ liệu trong việc đặt tên, cấu trúc mã hóa, các thuộc tính đo đạc … • Thí dụ đơn vị tiền tệ, khối lượng – Chuyển đổi dữ liệu khi thu thập dữ liệu. 14 14
  15. Dữ liệu theo thời gian (Time Variant) • Thời gian của dữ liệu trong data warehouse dài hơn đáng kể so với thời gian của dữ liệu trong cơ sở dữ liệu tác nghiệp. – CSDL tác nghiệp: dữ liệu có giá trị hiện tại. – Dữ liệu Data warehouse: cung cấp thông tin lịch sử (thí dụ dữ liệu trong từ 5 tới 10 năm qua) • Các cấu trúc dữ liệu chính trong data warehouse: – Chứa thông tin thời gian (ẩn hay tường minh) – Trong khi dữ liệu của cơ sở dữ liệu tác nghiệp có thể không chứa thông tin thời gian 15 15
  16. Bền vững (Non-Volatile) • Lưu trữ tách biệt với cơ sở dữ liệu tác nghiệp. • Không xảy ra việc sửa chữa dữ liệu trong môi trường data warehouse. – Không đòi hỏi xử lý giao dịch, không phục và cơ chế điều khiển truy cập đồng thời – Đòi hỏi chỉ 2 thao tác: • Nạp dữ liệu và truy cập dữ liệu. 16 16
  17. Mô hình dữ liệu nhiều chiều • Dữ liệu bán hàng như một hàm của sản phẩm, thời gian và vùng kinh doanh Dimensions: Product, Location, Time Hierarchical summarization paths Industry Region Year Category Country Quarter Product Product City Month Week Office Day Month 17 17
  18. Thí dụ dữ liệu khối Total annual sales Date of TV in U.S.A. 1Qtr 2Qtr 3Qtr 4Qtr sum TV PC U.S.A VCR Country sum Canada Mexico sum 18
  19. Các hoạt động OLAP chính • Roll up (drill-up): summarize data – by climbing up hierarchy or by dimension reduction • Drill down (roll down): reverse of roll-up – from higher level summary to lower level summary or detailed data, or introducing new dimensions • Slice and dice: – project and select • Pivot (rotate): – reorient the cube, visualization, 3D to series of 2D planes. • Other operations – drill across: involving (across) more than one fact table – drill through: through the bottom level of the cube to its back-end relational tables (using SQL) 19 19
  20. A Starnet Query Model Customer Orders Shipping Method Customer CONTRACTS AIR-EXPRESS ORDER TRUCK PRODUCT LINE Time Product ANNUALY QTRLY DAILY PRODUCT ITEM PRODUCT GROUP CITY SALES PERSON COUNTRY DISTRICT REGION DIVISION Location Each circle is called a footprint Promotion Organization 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2