9/10/2011

Chủ đề chính

(cid:132) RDF (cid:132) RDFS RDFS

Ngôn ngữ miêu tả RDF

2

Siêu dữ liệu

Ứng dụng Web thông minh (cid:132) Mô tả

(cid:132) Ví dụ 1

(cid:133) thuộc tính ngữ nghĩa của một tài nguyên Web (cid:133) quan hệ ngữ nghĩa giữa chúng (cid:133) quan hệ ngữ nghĩa giữa chúng

trang chủ

(cid:133) Cổ vật Địa điểm khai quật (cid:133) Cổ vật – Địa điểm khai quật (cid:133) Người – Ngày sinh

của John

(cid:132) Ví dụ 2

là Giám đốc

Yêu Yê

Ả h ố

(cid:133) Bài báo khoa học – ngày xuất bản (cid:133) Bản đồ - Tỷ lệ (cid:133) File audio - tần số lấy mẫu (cid:133) Ảnh số - máy ảnh á ả h (cid:133) Mục dữ liệu trong CSDL - Người nhập liệu (cid:133) Trang Web - chủ đề

là Thư ký

3

4

Trang chủ của Mary

1

9/10/2011

RDF - Resource Description Framework

Siêu dữ liệu

(cid:132) Công nghệ nền móng xử lý siêu dữ liệu Web; (cid:132) Giúp tạo ra sự liên tác giữa các ứng dụng trên (cid:132) Giúp tạo ra sự liên tác giữa các ứng dụng trên Web trao đổi thông tin diễn dịch được bởi máy tính

(cid:132) Ngôn ngữ biểu diễn thông tin về một

(cid:133) TÀI NGUYÊN (resource) Web (cid:133) thông tin về một thứ gì đó có thể được định danh trên (cid:133) thông tin về một thứ gì đó có thể được định danh trên Web, ngay cả khi nó không thể được lấy về trực tiếp từ Web

5

6

Mục đích

Nguyên lý cơ bản

(cid:132) Phân tách rạch ròi

(cid:132) Tạo ra một mô hình dữ liệu đơn giản (cid:132) biểu diễn ngữ nghĩa hình thức – có thể có thể (cid:132) biểu diễn ngữ nghĩa hình thức

suy diễn

(cid:132) Sử dụng các từ vựng dựa URI – cú pháp

(cid:133)Cấu trúc của Mô hình (đồ thị RDF) ủ Mô hì h (đồ thị RDF) (cid:133)Cấ t ú (cid:133)Ngữ nghĩa diễn dịch (cid:133)Cú pháp cụ thể (XML, TN, N3, …)

XML

(cid:132) Hai kiểu dữ liệu duy nhất

(cid:132) Cho phép sử dụng các kiểu dữ liệu trong

lược đồ XML l đồ XML

(cid:133)URI/URIref: (cid:133)URI/URIref: (cid:133)Literal

(cid:132) Cho phép tạo ra thông tin về bất cứ tài

(cid:132) String hoặc kiểu dữ liệu XSD

nguyên nào

7

8

2

9/10/2011

Mô hình dữ liệu RDF

Các đối tượng chính

(cid:133)Subject của một tuyên bố RDF là một tài (cid:133)S bj ột tài

ột t ê bố RDF là

(cid:132) Tài nguyên t ủ

(cid:132) Bộ ba: subject, predicate, object (cid:132) Một diễn tả: Tập các bộ ba

Một diễ tả Tậ

á bộ b

nguyên (cid:132) Thuộc tính

(cid:133) Predicate của một tuyên bố RDF là thuộc tính

của một tài nguyên

(cid:132) Phát biểu

(cid:133) Object : giá trị của thuộc tính đó

9

10

Ràng buộc

Tài nguyên và URI

(cid:132) Subject chỉ có thể là

(cid:132) Tài nguyên là bất cứ thứ gì có định danh

IDID

(cid:133)tham chiếu URI – node trắng (cid:133)th

hiế URI

d t ắ

(cid:132) Uniform Resource Identifiers (URI) – công

(cid:132) Predicate

(cid:133)tham chiếu URI

cụ đơn giản cho phép xác định 1 tài nguyên

(cid:132) Object

(cid:133)tham chiếu URI, hằng giá trị, node trắng (cid:133)tham chiếu URI hằng giá trị node trắng

11

12

3

9/10/2011

Ví dụ về tuyên bố RDF

Thuộc tính có giá trị cấu trúc

p

Ora Lassila is the creator of the resource g http://www.w3.org/Home/Lassila.

The individual whose name is Ora Lassila, email , is the creator of http://www.w3.org/Home/Lassila. http://www w3 org/Home/Lassila

Subject (resource) http://www.w3.org/Home/Lassila

Predicate (property) Creator

Object (literal) “Ora Lassila”

Thuộc tính có giá trị cấu trúc

Thuộc tính có giá trị cấu trúc

Subject (resource) http://www.w3.org/Home/Lassila

Predicate (property) Creator

Object (literal) SOMETHING

Subject (resource) SOMETHING

Predicate (property) Name

Object (literal) “Ora Lassila”

Subject (resource) SOMETHING

The individual referred to by employee id 85740 is named Ora Lassila and has the email address lassila@w3.org. The resource http://www.w3.org/Home/Lassila was created by this individual.

Predicate (property) Email

4

Object (literal) lassila@w3.org

9/10/2011

Thông tin trong bộ ba

Thuộc tính có giá trị cấu trúc

Subject (resource) http://www.w3.org/Home/Lassila

Predicate (property) Creator

Object (resource) http://www.w3.org/staffid/85740

Subject (resource) http://www.w3.org/staffid/85740

Predicate (property) Name

Object (literal) “Ora Lassila”

Subject (resource) http://www.w3.org/staffid/85740

Predicate (property) Email

18

Object (literal) lassila@w3.org

Sự khác nhau

Ví dụ

(cid:132) Các bảng trong CSDL Quan hệ:

(cid:133) Số cột bất kỳ (cid:133) Số ột bất kỳ

(cid:132) Vị từ trong logic bậc một:

(cid:133) Nhiều đối số

(cid:132) Bộ ba RDF:

(cid:133) Một Subject, 1 Object (cid:133) Một Subject 1 Object

19

20

5

9/10/2011

Ví dụ

RDF Graph (cid:132) 1 Triple – bộ ba (cid:132) Tuyên bố RDF – nhiều bộ ba: Một đồ thị

22

URI

URI > URL

(cid:132) Biểu diễn 1 nút (subject hoặc object) (cid:133) Các thể hiện: Eric Miller, xác định bởi (cid:133) Các thể hiện: Eric Miller xác định bởi

(cid:132) URL = uniform resource locator (cid:133)xác định – lấy vể tài nguyên web lấy vể tài nguyên web (cid:133)xác định (cid:132) URI = uniform resource identifier

http://www.w3.org/People/EM/contact#me (cid:133) Loại thực thể (lớp): Person, xác định bởi

http://www.w3.org/2000/10/swap/pim/contact#Per son

(cid:133)Tổng quát hơn (cid:133)Xác định các tài nguyên không có địa chỉ

mạng

(cid:132) Biểu diễn vị từ Predicates

t

(cid:133) giá trị thuộc tính: mailto:em@w3.org Biể diễ ị từ P di (cid:133) thuộc tính: mailbox

(cid:133)Các tổ chức – cá nhân có thể tự tạo ra các (cid:133)Các tổ chức cá nhân có thể tự tạo ra các URI và dùng chúng để xác định các sự vật (cụ thể hoặc trừu tượng)

(cid:132) http://www.w3.org/2000/10/swap/pim/contact#mailbox

23

24

6

9/10/2011

URI Ref , URI Fragment

Tiếp

(cid:132) Một tham chiếu URI là một URI có thể có

định danh bộ phận ở cuối: định danh bộ phận ở cuối:

h

(cid:132) URIref = URI reference (cid:132) (cid:198) nhiều tài nguyên khác nhau (cid:198) hiề tài ê khá (cid:133)Tham chiếu URI của một file RDF với nhiều

định nghĩa

(cid:133) Để xác định một "bộ phận" của URI, sử dụng

# (cid:132) Ví dụ: http://example.org/index#person

25

26

Cú pháp RDF/XML

Cú pháp RDF/XML

Eric Miller Dr.

27

28

7

9/10/2011

Namespace

Một số Qname thông dụng

ế

(cid:132) Tránh phải sử dụng URI đầy đủ (cid:132) XML Qualified Names (Qnames- tiếp đầu

(Q

XML Q lifi d N ngữ) (cid:133)Gắn một tiền tố (prefix) với một URI; (cid:133)(:) + tên địa phương

@prefix rdf: http://www.w3.org/1999/02/22-rdf-syntaxns# @prefix rdfs: http://www.w3.org/2000/01/rdf-schema# @prefix rdfs: http://www.w3.org/2000/01/rdf schema# @prefix dc: @prefix ex: @prefix exterms: @prefix exstaff: @prefix ex2:

29

30

Ví dụ

g

whose value is August 16, 1999.

Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila.

(cid:132) http://www.example.org/index.html has a creation-date

whose value is English.

(cid:132) http://www.example.org/index.html has a language

"http://www.w3.org/Home/Lassila">

Ora Lassila

8

xmlns:s="http://description.org/schema/"

9/10/2011

Ví dụ

.

"August 16, 1999" .

"en".

RDF containers

Bag.

(cid:132) Sử dụng khi giá trị của một thuộc tính là

(cid:132) Danh sách không sắp xếp các tài nguyên

hoặc hằng giá trị.

(cid:132) Dùng để khai báo một thuộc tính đa giá trị và thứ tự các giá trị không mang ý nghĩa.

tập hợp tập hợp (cid:133) bag (cid:133) sequence (cid:133) alternative

(cid:132) Cho phép các giá trị trùng nhau.

35

9

9/10/2011

Ví dụ

Ví dụ Các sinh viên tham gia khóa học số 6.001 là Amy, Tim, John, Mary, và Sue

Ví dụ

Các sinh viên tham gia khóa học số 6.001 là Amy, Tim, John, Mary, và Sue

Sequence

(cid:131) Danh sách có thứ tự (cid:131) Danh sách có thứ tự (cid:131) Thứ tự các giá trị của 1 thuộc tính mang ý

nghĩa.

(cid:131) Ví dụ thứ tự từ điển. (cid:131) Cho phép giá trị trùng nhau. (cid:131) Cho phép giá trị trùng nhau

/ d ag

10

9/10/2011

Ví dụ

Alternative

(cid:131) Danh sách tài nguyên và hằng giá trị thay

Source code của X11 có thể được tìm thấy tại ftp.x.org, ftp.cs.purdue.edu, hoặc ftp.eu.net

thế cho một giá trị thuộc tính. thế cho một giá trị thuộc tính

(cid:131) Chỉ chọn một trong danh sách các giá trị.

Ví dụ

Source code của X11 có thể được tìm thấy tại ftp.x.org, ftp.cs.purdue.edu, hoặc ftp.eu.net

Thuộc tính bộ chứa vs lặp thuộc tính

Sue đã viết các ấn phẩm "Anthology of Time", "Zoological Reasoning", "Gravitational Reflections" Gravitational Reflections .

11

Các ấn phẩm không có mối liên hệ nào ngoài việc cùng có một tác giả

9/10/2011

Tiếp

Tuyên bố về tuyên bố khác

(cid:132) Tuyên bố:

Hội đồng gồm Fred, Wilma, Dino đồng ý với nghị quyết.

“Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila”. “O L il ”

f th

htt

/H

/L

th

3

//

il

t

i

(cid:132) RDF coi đây như một sự thật (fact). Xét tuyên bố:

“Ralph Swick says that Ora Lassila is the creator of the resource

http://www.w3.org/Home/Lassila”

(cid:132) Không có nghĩa nói về chủ thể Lassila mà là về à là ề

ói ề hủ thể L

il

Khô ó tuyên bố của Ralph

Ba người như một chủ thể. Không cần thiết phân tách

Tiếp

Tuyên bố về tuyên bố

(cid:133) subject

(cid:132) Chỉ định tài nguyên được mô tả bởi tuyên bố. Giá trị của thuộc tính à t ê bố ói ề (

(cid:132) Sử dụng các thuộc tính sau: “Ralph Swick says that Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila”

(cid:133) predicate

(cid:132) Chỉ định thuộc tính ban đầu

(cid:133) object

(cid:132) Giá trị

(cid:133) type

(cid:132) Giá trị của thuộc tính này mô tả kiểu của tài nguyên mới tạo ra. (cid:132) Giá trị của thuộc tính này mô tả kiểu của tài nguyên mới tạo ra

t là tài bj subject là tài nguyên mà tuyên bố nói về (e.g., ê http://www.w3.org/Home/Lassila).

12

RDF:Statement.

9/10/2011

Tiếp

Bài tập: diễn tả bằng RDF

“Ralph Swick says that Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila”

(cid:132) Oracle Corporation (NASDAQ: ORCL) and Sun Microsystems (NASDAQ: JAVA) announced today they have entered into a definitive agreement under which Oracle will acquire Sun definitive agreement under which Oracle will acquire Sun common stock for $9.50 per share in cash.

(cid:132) Sun Microsystems, Inc. (NASDAQ: JAVA) develops the

technologies that power the global marketplace. Sun can be found in more than 100 countries and on the Web at http://www.sun.com.

xmlns:rdf="http://w3.org/TR/1999/PR-rdf-syntax-19990105#" 1999010 #" xmlns:a="http://description.org/schema/">

(NASDAQ ORCL) i

(cid:132) Oracle (NASDAQ: ORCL) is the world's largest enterprise

ld'

th

t

t

i

l

O l software company. For more information about Oracle, please visit our Web site at http://www.oracle.com.

50

Ora Lassila Ralph Swick Ralph Swick

Từ vựng RDF

FOAF

(cid:132) Tập các URI (không phải các từ)

(cid:132) Dự án FOAF (http://www.foaf-project.org/): định

(cid:132) Mỗi tổ chức định nghĩa từ vựng riêng cho mình sử dụng các

ì h ử d

từ

h

á

á hâ

t

Mỗi tổ hứ đị h tiền tố URI riêng.

nghĩa thuật ngữ (bởi RDF) cho các trang homepage cá nhân, tổ chức, cty mà máy tính có à á tí h ó tổ hứ h thể hiểu..

(cid:132) ví dụ: Dublin Core (dc:title, dc:creator, dc:date, …).

(cid:132) Tập trung mô tả người, liên kết giữa người và mọi

(cid:132) RDF không phân tích URIs và không diễn dịch cho bất cứ tiền

tố chung nào.

(cid:132) URI thường chỉ đến vị trí mà nội dung thông tin về tài nguyên

thứ khác trên Web: (cid:133) tạo ra tài liệu, (cid:133) tham dự các cuộc họp (cid:133) tham dự các cuộc họp, (cid:133) có trong các bức ảnh, vv

có thể được tìm thấy.

(cid:132) FOAF Vocabulary: http://xmlns.com/foaf/0.1/

51

52

13

9/10/2011

Bài tập tìm hiểu

Bài tập tìm hiểu

(cid:132) Recent Dublin Core enhancement: DCMI

//d bli

t /d

/d

Metadata Terms Metadata Terms (cid:133)Specification:

(cid:132) Dublin Core (cid:133) đặ tả htt (cid:133) đặc tả: http://dublincore.org/documents/dces/ / (cid:133)Namespace:

http://dublincore.org/documents/dcmi-terms/

xmlns:dc="http://purl.org/dc/elements/1.1/"

(cid:133)Namespace:

(cid:132) FOAF

xmlns:dcterms=http://purl.org/dc/terms/

p

p

(cid:132) RSS 1.0

(cid:133)đặc tả: http://xmlns.com/foaf/spec/ (cid:133)Namespace:

(cid:133)http://en.wikipedia.org/wiki/RSS_(file_format)

xmlns:foaf="http://xmlns.com/foaf/0.1/"

53

54

Nút trắng

Ví dụ

(cid:132) Đôi khi trong quá trình chi tiết hóa việc mô

tả các quan hệ tả các quan hệ (cid:133) Thêm nút mới (cid:133) Nếu nút này không bao giờ được tham chiếu tới ngoài đồ thị RDF hiện tại (cid:198) không nhất thiết phải có tên.

exstaff:85740 exterms:address exaddressid:85740 . exaddressid:85740 exterms:street "1501 Grant Avenue" . exaddressid:85740 exterms:city "Bedford" . exaddressid:85740 exterms:state "Massachusetts" . exaddressid:85740 exterms:postalCode "01730" .

55

56

14

9/10/2011

Ví dụ

exterms:street "1501 Grant Avenue" . exterms:city "Bedford" . exterms:state "Massachusetts" .

exstaff:85740 exterms:address _:joaddress. _:joaddress _:joaddress _:joaddress _:joaddress exterms:postalCode "01730" .

57

15