Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 1 - Nguyễn Hoàng Ân (2018)
lượt xem 5
download
Bài giảng "Khai phá dữ liệu - Chương 1: Tổng quan về kho dữ liệu và khai phá dữ liệu" cung cấp cho người học các kiến thức: Giới thiệu về kho dữ liệu, các đặc tính của kho dữ liệu, mối quan hệ giữa kho dữ liệu và khai phá dữ liệu, ứng dụng của kho dữ liệu và khai phá dữ liệu. Mời các bạn cùng tham khảo.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 1 - Nguyễn Hoàng Ân (2018)
- Kho dữ liệu và khai phá dữ liệu Chương 1: Tổng quan về kho dữ liệu và khai phá dữ liệu Nguyễn Hoàng Ân 1
- Nội dung Giới thiệu về kho dữ liệu Các đặc tính của kho dữ liệu Mối quan hệ giữa kho dữ liệu và khai phá dữ liệu Ứng dụng của kho dữ liệu và khai phá dữ liệu Nguyễn Hoàng Ân 3
- 1. Giới thiệu về kho dữ liệu Có nhiều các định nghĩa khác nhau về KDL, nhưng không có cách nào là nghiêm ngặt: Một cơ sở dữ liệu hỗ trợ quyết định được bảo trì tách biệt từ cơ sở dữ liệu hoạt động của tổ chức Hỗ trợ xử lí thông tin bằng cách cung cấp một nền tảng vững chắc cho việc hợp nhất và dữ liệu lịch sử để phân tích Theo W. H. Inmon: “Kho dữ liệu là tập dữ liệu hướng chủ đề, tích hợp, gắn với thời gian và ít thay đổi để hỗ trợ quá trình ra quyết định của nhà quản lí” Nguyễn Hoàng Ân 7
- Kiến trúc cơ bản của kho dữ liệu Oracle9 i. Data Warehousing Guide, Release 2 (9.2) Nguyễn Hoàng Ân 8
- 2. Các đặc tính của KDL Hướng chủ đề (Subject-Oriented) Có tính tích hợp (Integrated) Gắn với thời gian (Time Variant) Ít thay đổi (Non-Volatile) Nguyễn Hoàng Ân 9
- 2. Các đặc tính của KDL (tt) Hướng chủ đề Nguyễn Hoàng Ân 10
- 2. Các đặc tính của kho dữ liệu Tích hợp Nguyễn Hoàng Ân 11
- Tích hợp Nguyễn Hoàng Ân 12
- 2. Các đặc tính của kho dữ liệu Gắn với thời gian • Thời gian 60–90 ngày • Thời gian 5-10 năm • Cập nhật bản ghi • Những hình ảnh phức tạp của • Cấu trúc khóa có thể có hoặc dữ liệu không chứa khóa thời gian • Cấu trúc khóa chứa phần tử thời Nguyễn gian Hoàng Ân 14
- 2. Các đặc tính của kho dữ liệu (tt) Ít thay đổi Nguyễn Hoàng Ân 15
- OLTP vs. OLAP OLTP (on-line transaction processing): Xử lí giao dịch trực tuyến Nhiệm vụ chính của Hệ quản lí cơ sở dữ liệu quan hệ (relational DBMS) truyền thống. Dùng cho các tác nghiệp hằng ngày (Day-to-day operations): mua sắm, quản lí tồn kho, ngân hàng, quản lí lương, đăng ký, kế toán,… OLAP (on-line analytical processing): Quá trình phân tích trực tuyến Nhiệm vụ chính của hệ thống kho dữ liệu Phân tích dữ liệu và làm quyết định (decision making) Nguyễn Hoàng Ân 16
- OLTP vs OLAP OLTP OLAP Người dùng Thư lý, chuyên viên Chuyên viên tri thức CNTT Chức năng Tác nghiệp hàng ngày Hỗ trợ quyết định Thiết kế CSDL Hướng ứng dụng Hướng chủ đề Dữ liệu Hiện thời, cập nhật Lịch sử, tóm tắt, tích hợp đa chi tiết, quan hệ phẳng chiều, hợp nhất biệt lập Sử dụng Lặp Dò tìm (ad-hoc) Truy cập Đọc/ghi Nhiều duyệt Chỉ mục/băm theo khóa chính Đơn vị thao tác Giao dịch ngắn,đơn giản Câu hỏi phức tạp # bản ghi truy cập Chục Triệu #người dùng Nghìn Trăm Kích thước CSDL 100MB-GB 100GB-TB Đơn vị đo Thông lượng giao dịch Thông lượng truy vấn, đáp ứng Data Warehouse and Business Intelligence
- Data mart Hệ thống tập tất cả dữ liệu được yêu cầu bởi một phòng ban chuyên biệt trong công ty (như tiếp thị, hậu cần,…) Được sử dụng để phân tích BI Một kho dữ liệu mức phòng ban (departmental data warehouse) Data warehouses và data marts có khung công nghệ giống nhau 18 Nguyễn Hoàng Ân
- Data Warehouse and Business Intelligence 19
- Công cụ ETL ETL: Rút trích (Extraction), Chuyển đổi (Transformation), tải (Loading) Rút trích: Rút trích từ những nguồn sẵn có bên trong hoặc ngoài Những phiên bản phụ thuộc thời gian của dữ liệu Chọn lựa dữ liệu: Dựa trên thiết kế DW Chuyển đổi: Chuyển đổi dữ liệu từ các hệ thống cũ, các định dạng khác thành định dạng của KDL Tải: Sắp xếp, tóm tắt, hợp nhất, tính toán, kiểm tra toàn vẹn, xây dựng chỉ mục và phân hoạch Nguyễn Hoàng Ân 20
- Khai phá dữ liệu Nguyễn Hoàng Ân 21
- 1. Giới thiệu chung về khai phá dữ liệu 1.1 Khái niệm về khai phá dữ liệu 1.2 Quá trình khám phá tri thức 1.3 Khai phá dữ liệu trong kinh doanh thông minh 1.4 Quá trình khám phá tri thức 1.5 Các lĩnh vực có ảnh hưởng đến khai phá dữ liệu
- 1.1. Khái niệm về khai phá dữ liệu Khai phá dữ liệu một quá trình trích xuất tri thức từ lượng lớn dữ liệu • “extracting or mining knowledge from large amounts of data” • “knowledge mining from data” một quá trình không dễ trích xuất thông tin ẩn, hữu ích, chưa được biết trước từ dữ liệu • “the nontrivial extraction of implicit, previously unknown, and potentially useful information from data” Các thuật ngữ thường được dùng tương đương: knowledge discovery/mining in data/databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence
- 1.2. Quá trình khám phá tri thức Pattern Evaluation/ Presentation Data Mining Patterns Task-relevant Data Data Warehouse Selection/Transformation Data Cleaning Data Integration Data Sources
- 1.3 Khai phá dữ liệu trong kinh doanh thông minh Increasing potential to support business decisions End User Decision Making Data Presentation Business Analyst Visualization Techniques Data Mining Data Information Discovery Analyst Data Exploration Statistical Summary, Querying, and Reporting Data Preprocessing/Integration, Data Warehouses DBA Data Sources Paper, Files, Web documents, Scientific experiments, Database Systems
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Giới thiệu chung về kho dữ liệu
129 p | 270 | 27
-
Bài giảng môn học Kho dữ liệu và khai phá dữ liệu
41 p | 203 | 19
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Chương 5: Khai phá dữ liệu trong kinh doanh (P2)
128 p | 122 | 17
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 2 - Tiền xử lý dữ liệu
77 p | 146 | 13
-
Bài giảng Kho dữ liệu và khai phá dữ liệu (2014): Phần 1
79 p | 56 | 12
-
Bài giảng Kho dữ liệu và kinh doanh thông minh - Chương 2: Quy trình phát triển kho dữ liệu
52 p | 136 | 11
-
Bài giảng Kho dữ liệu và khai phá dữ liệu (2014): Phần 2
97 p | 37 | 8
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 2 - Nguyễn Hoàng Ân (2018)
19 p | 58 | 6
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương mở đầu - Nguyễn Ngọc Duy
4 p | 31 | 6
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 5 - Nguyễn Hoàng Ân (2018)
172 p | 52 | 6
-
Bài giảng Kho dữ liệu và kỹ thuật khai phá: Phần 2
112 p | 22 | 5
-
Bài giảng Kho dữ liệu và kỹ thuật khai phá: Phần 1
85 p | 22 | 5
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Nguyễn Hoàng Ân (2018)
40 p | 43 | 5
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 1 - Nguyễn Ngọc Duy
30 p | 33 | 3
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 2 - Nguyễn Ngọc Duy
125 p | 42 | 3
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 4 - Nguyễn Ngọc Duy
114 p | 26 | 3
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Nguyễn Ngọc Duy
55 p | 34 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn