CƠ SỞ DỮ LIỆU WEB & XML

CHƯƠNG 6

Chương 5

NGỮ NGHĨA WEB

Chương 6: Ngữ nghĩa Web

6.1 Khái niệm ngữ nghĩa Web

6.2 RDF

6.3 Giới thiệu bản thể học

6.4 Tác tử và chương trình DAML

6.5 XML, RDF và sự tương tác

Chương 5

6.6 Web và ngữ nghĩa Web

6.1 Khái niệm ngữ nghĩa Web

- Là một chuỗi dữ liệu phức tạp; không phải chỉ có một thực thể mà là một tập hợp các tài liệu XML, cơ sở dữ liệu bán cấu trúc và hàng ngàn đối tượng trên web.

- Các định dạng thông dụng cho sự tích hợp và kết hợp

dữ liệu rút ra từ nhiều nguồn khác nhau.

- Ngôn ngữ để ghi lại mối quan hệ giữa dữ liệu với các

đối tượng trong thế giới thực như thế nào.

Chương 5

- Ngữ nghĩa web có hai vấn đề chính:

6.1 Khái niệm ngữ nghĩa Web

Chương 5

- Ngữ nghĩa web bao gồm RDF (Resource Description Framework), bản thể học, tác tử và cơ sở dữ liệu.

6.2 RDF

- RDF là cơ sở của ngữ nghĩa web và xử lý siêu dữ liệu; cung cấp khả năng thao tác chung giữa các ứng dụng trao đổi thông tin trên web mà máy tính có thể hiểu được.

- Cùng một kết quả, RDF cung cấp sự hỗ trợ tốt hơn XML về các lĩnh vực như thao tác từng phần, tìm kiếm và phân loại.

- RDF mô tả nội dung tài liệu cũng như các mối quan hệ

giữa các thực thể bên trong tài liệu.

- Trong khi XML cung cấp cú pháp và ký hiệu thì RDF bổ sung bằng cách cung cấp thông tin ngữ nghĩa trong một phương pháp chuẩn hóa.

Chương 5

6.2 RDF

- Một tài nguyên là bất kỳ một thực thể nào được mô tả bởi biểu thức RDF. Nó có thể là một trang web hay một tập hợp các trang web.

- Đặc tính là một thuộc tính xác định dùng để mô tả một

tài nguyên.

- Câu lệnh RDF là các tài nguyên cùng với tên thuộc tính và giá trị thuộc tính. Các thành phần câu lệnh gồm chủ ngữ, vị ngữ và bổ ngữ.

Chương 5

- Mô hình RDF cơ bản có ba loại: tài nguyên, đặc tính và câu lệnh.

6.2 RDF

Khái niệm RDF

Basic Model: Resource, Properties, statements

Container Model: Bag, Sequence Alternative

Hình 6.1 Khái niệm RDF

Chương 5

- Một mục tiêu của RDF là làm cho nó có thể xác định ngữ nghĩa cho dữ liệu trên cơ sở XML chuẩn hóa. RDF dựa trên sự hỗ trợ của XML, do đó nó có thể hiểu cú pháp XML. Mục tiêu chung của RDF là định nghĩa một cơ chế mô tả tài liệu.

6.3 Giới thiệu bản thể học

Chương 5

- Bản thể học (Ontologies) mô tả các thực thể và quan hệ giữa các thực thể với nhau. - Khái niệm siêu dữ liệu đã tiến hóa trong nhiều năm bắt đầu từ từ điển dữ liệu đến lược đồ cơ sở dữ liệu và hiện nay là bản thể học, XML, lược đồ XML, RDF và lược đồ RDF. - Bản thể học có thể mô tả các đối tượng như xe cộ, con người, động vật cũng như mối quan hệ giữa các đối tượng với nhau, sự kiện và nhiều vấn đề khác. - Để trình bày bản thể học thì RDF hoàn thiện hơn XML bởi vì XML có nhiều hạn chế và ngữ nghĩa yếu.

6.3 Giới thiệu bản thể học

Chương 5

- Có thể sử dụng mạng ngữ nghĩa, khung, mô hình đối tượng, mô hình dữ liệu siêu ngữ nghĩa và bất kỳ lược đồ trình bày nào cho bản thể học.

6.4 Tác tử và chương trình DAML

Chương 5

- DAML (Defense Advanced Projects Research Agency Agents Markup Language). - Nhiều nhà nghiên cứu trong chương trình DAML đang nghiên cứu nhiều phương diện khác nhau bao gồm RDF, mô hình dữ liệu, bản thể học, logic học cho RDF và xử lý siêu dữ liệu. - RDF được nghiên cứu độc lập bởi tổ chức W3C, tuy nhiên kết quả nghiên cứu của DAML hiện nay do tổ chức W3C đánh giá, vì vậy DAML có ảnh hưởng đến sự phát triển của RDF

Intergration Manager

Ontologies

XML

XML

XML

RDF

RDF

Data source A

Data source C

XML

XML

Data source B

Hình 6.3 XML, RDF và sự tương tác

Hình 6.4 XML tương tác với CSDL

Chương 5

6.5 XML, RDF và sự tương tác

6.6 Web và ngữ nghĩa Web

- Một số cho rằng web là một hệ thống mà con người có thể đọc các trang web, trong khi đó ngữ nghĩa web là một hệ thống mà máy có thể đọc và hiểu được các trang web

- Một số khác cho rằng web ngày nay là ngữ nghĩa web của hôm qua và web ngày mai là ngữ nghĩa web của hôm nay.

- Có nhiều buổi thảo luận về sự khác nhau giữa Web và ngữ nghĩa web.

Chương 5

- Trước đây là HTML, hiện nay là XML, trong tương lai sẽ là RDF và có thể là một ngôn ngữ nào đó sẽ phát triển. Vấn đề lớn nhất là phải xây dựng được web ban đầu.

Web in 2009 HTML, XML, RDF (semantics)

Web in 2000 HTML, XML (more semantics)

Web in 1995 HTML (less semantics)

Hình 6.5 web và ngữ nghĩa web

Chương 5

6.6 Web và ngữ nghĩa Web