Bài giảng Cơ sở dữ liệu Web và XML: Chương 2 - GV. Hồ Văn Phi

Chia sẻ: Nguyễn Hà | Ngày: | Loại File: PDF | Số trang:43

0
54
lượt xem
11
download

Bài giảng Cơ sở dữ liệu Web và XML: Chương 2 - GV. Hồ Văn Phi

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chương 2 Cơ sở dữ liệu Web thuộc bài giảng cơ sở dữ liệu Web và XML, cùng nắm kiến thức trong chương này thông qua việc tìm hiểu các kiến thức sau: cở sở dữ liệu Web, khai phá dữ liệu và Web, kiến trúc cơ sở dữ liệu web, mối quan hệ với XML.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Cơ sở dữ liệu Web và XML: Chương 2 - GV. Hồ Văn Phi

  1. CƠ SỞ DỮ LIỆU WEB & XML CHƯƠNG 2 CƠ SỞ DỮ LIỆU WEB Chương 2. Cơ sở dữ liệu web 2 - 1/43
  2. Chương 2: Cơ sở dữ liệu web 2.1 Cở sở dữ liệu Web 2.2 Khai phá dữ liệu và Web 2.3 Kiến trúc cơ sở dữ liệu web 2.4 Mối quan hệ với XML Chương 2. Cơ sở dữ liệu web 2 - 2/43
  3. CƠ SỞ DỮ LIỆU WEB  MỤC TIÊU - Trình bày được: + Các khái niệm về web, csdl web + Thu thập và khai phá các loại dữ liệu + Các kiến trúc csdl trên web + Quan hệ giữa csdl web và xml.. Chương 2. Cơ sở dữ liệu web 2 - 3/43
  4. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.1 Trình bày dữ liệu và mô hình dữ liệu - Cần có lược đồ trình bày dữ liệu thích hợp:  mô hình dữ liệu web được nghiên cứu năm 1996  sự phát triển xml (1998) đã hỗ trợ cho web  XML mở rộng cho nhiều ứng dụng khác. Chương 2. Cơ sở dữ liệu web 2 - 4/43
  5. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.1 Trình bày dữ liệu và mô hình dữ liệu SGML, HTML, Data Models for ODA Models Database W3C systems XML Specifications by W3C Models for web and other Extensions Mô hình dữ liệu cho Web.. Chương 2. Cơ sở dữ liệu web 2 - 5/43
  6. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.2 Chức năng quản lý cơ sở dữ liệu Cơ sở dữ liệu web là csdl cho các website trên internet. - quản lý cơ sở dữ liệu web bao gồm:  xử lý vấn tin  cập nhật dữ liệu  quản lý siêu dữ liệu  bảo mật và toàn vẹn dữ liệu Chương 2. Cơ sở dữ liệu web 2 - 6/43
  7. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.2 Chức năng quản lý cơ sở dữ liệu - xử lý vấn tin  là chức năng chính để lấy thông tin từ cơ sở dữ liệu web. - Cập nhật dữ liệu  làm thay đổi thông tin trong csdl  ai có quyền cập nhật  phân quyền cập nhật (read only, write,…) Chương 2. Cơ sở dữ liệu web 2 - 7/43
  8. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.2 Chức năng quản lý cơ sở dữ liệu - Quản lý siêu dữ liệu  mô tả các thông tin liên quan đến cơ sở dữ liệu (người dùng, điều khiển truy cập và các chính sách...)  môi trường động Chương 2. Cơ sở dữ liệu web 2 - 8/43
  9. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.2 Chức năng quản lý cơ sở dữ liệu - Quản lý lưu trữ  chỉ mục thích hợp  phương thức truy cập  tích hợp công nghệ quản lý csdl với lưu trữ khối Chương 2. Cơ sở dữ liệu web 2 - 9/43
  10. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.2 Chức năng quản lý cơ sở dữ liệu - An ninh và bảo mật  ai là người sở hữu dữ liệu, bản quyền dữ liệu gốc? Ai có quyền chỉnh sửa thông tin?  một cơ chế bảo vệ bản quyền và chống ăn cắp là cần thiết - Duy trì tính toàn vẹn  dữ liệu từ nhiều nguồn khác nhau  duy trì tính toàn vẹn, chất lượng dữ liệu là cần thiết.. Chương 2. Cơ sở dữ liệu web 2 - 10/43
  11. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.3 Cơ sở dữ liệu bán cấu trúc - Dữ liệu có cấu trúc là dữ liệu có một cấu trúc hoàn toàn xác định, mỗi phần tử có kiểu cụ thể như interger, string, real,... - Dữ liệu không có cấu trúc là dữ liệu không có một cấu trúc nhất định (dữ liệu đa phương tiện, văn bản, hình ảnh,…) - Dữ liệu bán cấu trúc là dữ liệu có cấu trúc không đầy đủ nhưng có cấu trúc từng phần (phân đoạn tiêu đề, tác giả) Chương 2. Cơ sở dữ liệu web 2 - 11/43
  12. CƠ SỞ DỮ LIỆU WEB 2.1 Cở sở dữ liệu Web 2.1.3 Cơ sở dữ liệu bán cấu trúc - nghiên cứu phát triển mô hình để trình bày dữ liệu bán cấu trúc  mô hình đầu tiên dựa trên cơ sở đối tượng  mô hình đối tượng quan hệ  lược đồ trình bày phổ biến là XML  XML không phải là mô hình dữ liệu, nhưng thay vào đó là siêu mô hình để trình bày nhiều tài liệu khác nhau.. Chương 2. Cơ sở dữ liệu web 2 - 12/43
  13. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web - Khai phá dữ liệu là việc trích rút tri thức một cách tự động và hiệu quả từ một khối lượng dữ liệu rất lớn và có tiềm năng mang lại lợi ích.  thông tin trên web ngày càng lớn khai thác dữ liệu, chiết xuất mẫu và tìm kiếm thông tin cho người dùng là cần thiết.  khai phá dữ liệu còn gọi là phát hiện tri thức trong cơ sở dữ liệu Chương 2. Cơ sở dữ liệu web 2 - 13/43
  14. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web Web mining Mining Data Source on Mining Usage Patterns the web on the web Extract Patterns from Give advice to Users Data Source while browsing Khai phá dữ liệu web Chương 2. Cơ sở dữ liệu web 2 - 14/43
  15. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web Giao diện đồ hoạ cho người dùng Đánh giá mẫu Máy khai mỏ dữ liệu Cơ sở tri thức Máy chủ cơ sở dữ liệu hay kho dữ liệu Làm sạch và tích hợp Lọc Cơ sở dữ liệu Kho dữ liệu Kiến trúc hệ thống khai mỏ dữ liệu Chương 2. Cơ sở dữ liệu web 2 - 15/43
  16. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web - Cơ sở dữ liệu, kho dữ liệu:  lưu trữ thông tin. các kỹ thuật làm sạch dữ liệu và tích hợp dữ liệu có thể được thực hiện tại đây. - Máy chủ cơ sở dữ liệu hay kho dữ liệu: lấy dữ liệu thích hợp dựa trên những yêu cầu khai phá của người dùng - Cơ sở tri thức: miền tri thức được dùng để tìm kiếm hay đánh giá độ quan trọng của các mẫu kết quả. Chương 2. Cơ sở dữ liệu web 2 - 16/43
  17. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web - Máy khai phá dữ liệu: một tập các module chức năng  đặc trưng hóa, phân lớp, phân cụm  phân tích sự tiến hóa và sự chệch hướng - Đánh giá mẫu :  duyệt tìm các mẫu đáng được quan tâm  có thể được tích hợp vào module khai phá Chương 2. Cơ sở dữ liệu web 2 - 17/43
  18. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web - Giao diện đồ hoạ cho người dùng:  người dùng giao tiếp với hệ thống  đặc tả yêu cầu khai phá, cung cấp thông tin trợ giúp cho việc tìm kiếm và thực hiện khai phá  xem các lược đồ cơ sở dữ liệu, kho dữ liệu, đánh giá mẫu và hiển thị các mẫu trong các khuôn dạng khác nhau. Chương 2. Cơ sở dữ liệu web 2 - 18/43
  19. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web - Quá trình khai phá tri thức gồm các bước sau:  Làm sạch dữ liệu  Tích hợp dữ liệu  Lựa chọn dữ liệu  Chuyển đổi dữ liệu  Khai phá dữ liệu  Đánh giá mẫu  Biểu diễn tri thức.. Chương 2. Cơ sở dữ liệu web 2 - 19/43
  20. CƠ SỞ DỮ LIỆU WEB 2.2 Khai phá dữ liệu và Web 2.2.1 Khai phá dữ liệu trên web  thông tin trên web rất nhiều  làm thế nào để chuyển dữ liệu thành thông tin và sau đó là tri thức để người dùng lấy đúng những thông tin họ muốn.  tích hợp công cụ khai thác dữ liệu vào trong dữ liệu web. Chương 2. Cơ sở dữ liệu web 2 - 20/43

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản