9/10/2011
Chủ đề chính
(cid:132) RDF
(cid:132) RDFS
RDFS
Ngôn ngữ miêu tả
RDF
2
Siêu dữ liệu
Ứng dụng Web thông minh
(cid:132) Mô tả
(cid:132) Ví dụ 1
(cid:133) thuộc tính ngữ nghĩa của một tài nguyên Web
(cid:133) quan hệ ngữ nghĩa giữa chúng
(cid:133) quan hệ ngữ nghĩa giữa chúng
trang chủ
(cid:133) Cổ vật Địa điểm khai quật
(cid:133) Cổ vật – Địa điểm khai quật
(cid:133) Người – Ngày sinh
của John
(cid:132) Ví dụ 2
là Giám
đốc
Yêu
Yê
Ả h ố
(cid:133) Bài báo khoa học – ngày xuất bản
(cid:133) Bản đồ - Tỷ lệ
(cid:133) File audio - tần số lấy mẫu
(cid:133) Ảnh số - máy ảnh
á ả h
(cid:133) Mục dữ liệu trong CSDL - Người nhập liệu
(cid:133) Trang Web - chủ đề
là Thư ký
3
4
Trang chủ
của Mary
1
9/10/2011
RDF - Resource Description Framework
Siêu dữ liệu
(cid:132) Công nghệ nền móng xử lý siêu dữ liệu Web;
(cid:132) Giúp tạo ra sự liên tác giữa các ứng dụng trên
(cid:132) Giúp tạo ra sự liên tác giữa các ứng dụng trên
Web trao đổi thông tin diễn dịch được bởi máy
tính
(cid:132) Ngôn ngữ biểu diễn thông tin về một
(cid:133) TÀI NGUYÊN (resource) Web
(cid:133) thông tin về một thứ gì đó có thể được định danh trên
(cid:133) thông tin về một thứ gì đó có thể được định danh trên
Web, ngay cả khi nó không thể được lấy về trực tiếp
từ Web
5
6
Mục đích
Nguyên lý cơ bản
(cid:132) Phân tách rạch ròi
(cid:132) Tạo ra một mô hình dữ liệu đơn giản
(cid:132) biểu diễn ngữ nghĩa hình thức – có thể
có thể
(cid:132) biểu diễn ngữ nghĩa hình thức
suy diễn
(cid:132) Sử dụng các từ vựng dựa URI – cú pháp
(cid:133)Cấu trúc của Mô hình (đồ thị RDF)
ủ Mô hì h (đồ thị RDF)
(cid:133)Cấ t ú
(cid:133)Ngữ nghĩa diễn dịch
(cid:133)Cú pháp cụ thể (XML, TN, N3, …)
XML
(cid:132) Hai kiểu dữ liệu duy nhất
(cid:132) Cho phép sử dụng các kiểu dữ liệu trong
lược đồ XML
l
đồ XML
(cid:133)URI/URIref:
(cid:133)URI/URIref:
(cid:133)Literal
(cid:132) Cho phép tạo ra thông tin về bất cứ tài
(cid:132) String hoặc kiểu dữ liệu XSD
nguyên nào
7
8
2
9/10/2011
Mô hình dữ liệu RDF
Các đối tượng chính
(cid:133)Subject của một tuyên bố RDF là một tài
(cid:133)S bj
ột tài
ột t ê bố RDF là
(cid:132) Tài nguyên
t ủ
(cid:132) Bộ ba: subject, predicate, object
(cid:132) Một diễn tả: Tập các bộ ba
Một diễ tả Tậ
á bộ b
nguyên
(cid:132) Thuộc tính
(cid:133) Predicate của một tuyên bố RDF là thuộc tính
của một tài nguyên
(cid:132) Phát biểu
(cid:133) Object : giá trị của thuộc tính đó
9
10
Ràng buộc
Tài nguyên và URI
(cid:132) Subject chỉ có thể là
(cid:132) Tài nguyên là bất cứ thứ gì có định danh
IDID
(cid:133)tham chiếu URI – node trắng
(cid:133)th
hiế URI
d t ắ
(cid:132) Uniform Resource Identifiers (URI) – công
(cid:132) Predicate
(cid:133)tham chiếu URI
cụ đơn giản cho phép xác định 1 tài
nguyên
(cid:132) Object
(cid:133)tham chiếu URI, hằng giá trị, node trắng
(cid:133)tham chiếu URI hằng giá trị node trắng
11
12
3
9/10/2011
Ví dụ về tuyên bố RDF
Thuộc tính có giá trị cấu trúc
p
Ora Lassila is the creator of the resource
g
http://www.w3.org/Home/Lassila.
The individual whose name is Ora Lassila, email , is the creator of http://www.w3.org/Home/Lassila.
http://www w3 org/Home/Lassila
Subject (resource) http://www.w3.org/Home/Lassila
Predicate (property) Creator
Object (literal) “Ora Lassila”
Thuộc tính có giá trị cấu trúc
Thuộc tính có giá trị cấu trúc
Subject (resource) http://www.w3.org/Home/Lassila
Predicate (property) Creator
Object (literal) SOMETHING
Subject (resource) SOMETHING
Predicate (property) Name
Object (literal) “Ora Lassila”
Subject (resource) SOMETHING
The individual referred to by employee id 85740 is named
Ora Lassila and has the email address lassila@w3.org.
The resource http://www.w3.org/Home/Lassila was
created by this individual.
Predicate (property) Email
4
Object (literal) lassila@w3.org
9/10/2011
Thông tin trong bộ ba
Thuộc tính có giá trị cấu trúc
Subject (resource) http://www.w3.org/Home/Lassila
Predicate (property) Creator
Object (resource) http://www.w3.org/staffid/85740
Subject (resource) http://www.w3.org/staffid/85740
Predicate (property) Name
Object (literal) “Ora Lassila”
Subject (resource) http://www.w3.org/staffid/85740
Predicate (property) Email
18
Object (literal) lassila@w3.org
Sự khác nhau
Ví dụ
(cid:132) Các bảng trong CSDL Quan hệ:
(cid:133) Số cột bất kỳ
(cid:133) Số ột bất kỳ
(cid:132) Vị từ trong logic bậc một:
(cid:133) Nhiều đối số
(cid:132) Bộ ba RDF:
(cid:133) Một Subject, 1 Object
(cid:133) Một Subject 1 Object
19
20
5
9/10/2011
Ví dụ
RDF Graph
(cid:132) 1 Triple – bộ ba
(cid:132) Tuyên bố RDF – nhiều bộ ba: Một đồ thị
22
URI
URI > URL
(cid:132) Biểu diễn 1 nút (subject hoặc object)
(cid:133) Các thể hiện: Eric Miller, xác định bởi
(cid:133) Các thể hiện: Eric Miller xác định bởi
(cid:132) URL = uniform resource locator
(cid:133)xác định – lấy vể tài nguyên web
lấy vể tài nguyên web
(cid:133)xác định
(cid:132) URI = uniform resource identifier
http://www.w3.org/People/EM/contact#me
(cid:133) Loại thực thể (lớp): Person, xác định bởi
http://www.w3.org/2000/10/swap/pim/contact#Per
son
(cid:133)Tổng quát hơn
(cid:133)Xác định các tài nguyên không có địa chỉ
mạng
(cid:132) Biểu diễn vị từ Predicates
t
(cid:133) giá trị thuộc tính: mailto:em@w3.org
Biể diễ
ị từ P di
(cid:133) thuộc tính: mailbox
(cid:133)Các tổ chức – cá nhân có thể tự tạo ra các
(cid:133)Các tổ chức
cá nhân có thể tự tạo ra các
URI và dùng chúng để xác định các sự vật
(cụ thể hoặc trừu tượng)
(cid:132) http://www.w3.org/2000/10/swap/pim/contact#mailbox
23
24
6
9/10/2011
URI Ref , URI Fragment
Tiếp
(cid:132) Một tham chiếu URI là một URI có thể có
định danh bộ phận ở cuối:
định danh bộ phận ở cuối:
h
(cid:132) URIref = URI reference
(cid:132) (cid:198) nhiều tài nguyên khác nhau
(cid:198) hiề tài
ê khá
(cid:133)Tham chiếu URI của một file RDF với nhiều
định nghĩa
(cid:133) Để xác định một "bộ phận" của URI, sử dụng
#
(cid:132) Ví dụ: http://example.org/index#person
25
26
Cú pháp RDF/XML
Cú pháp RDF/XML
Eric Miller
Dr.
27
28
7
9/10/2011
Namespace
Một số Qname thông dụng
ầ
ế
(cid:132) Tránh phải sử dụng URI đầy đủ
(cid:132) XML Qualified Names (Qnames- tiếp đầu
(Q
XML Q lifi d N
ngữ)
(cid:133)Gắn một tiền tố (prefix) với một URI;
(cid:133)(:) + tên địa phương
@prefix rdf: http://www.w3.org/1999/02/22-rdf-syntaxns#
@prefix rdfs: http://www.w3.org/2000/01/rdf-schema#
@prefix rdfs: http://www.w3.org/2000/01/rdf schema#
@prefix dc:
@prefix ex:
@prefix exterms:
@prefix exstaff:
@prefix ex2:
29
30
Ví dụ
g
whose value is August 16, 1999.
Ora Lassila is the creator of the resource
http://www.w3.org/Home/Lassila.
(cid:132) http://www.example.org/index.html has a creation-date
whose value is English.
(cid:132) http://www.example.org/index.html has a language
"http://www.w3.org/Home/Lassila">
Ora Lassila
8
xmlns:s="http://description.org/schema/"
9/10/2011
Ví dụ
.
"August 16, 1999" .
"en".
RDF containers
Bag.
(cid:132) Sử dụng khi giá trị của một thuộc tính là
(cid:132) Danh sách không sắp xếp các tài nguyên
hoặc hằng giá trị.
ằ
(cid:132) Dùng để khai báo một thuộc tính đa giá trị
và thứ tự các giá trị không mang ý nghĩa.
tập hợp
tập hợp
(cid:133) bag
(cid:133) sequence
(cid:133) alternative
(cid:132) Cho phép các giá trị trùng nhau.
35
9
9/10/2011
Ví dụ
Ví dụ
Các sinh viên tham gia khóa học số 6.001 là Amy,
Tim, John, Mary, và Sue
Ví dụ
Các sinh viên tham gia khóa học số 6.001 là Amy, Tim, John, Mary, và Sue
Sequence
(cid:131) Danh sách có thứ tự
(cid:131) Danh sách có thứ tự
(cid:131) Thứ tự các giá trị của 1 thuộc tính mang ý
nghĩa.
(cid:131) Ví dụ thứ tự từ điển.
(cid:131) Cho phép giá trị trùng nhau.
(cid:131) Cho phép giá trị trùng nhau
/ d ag
10
9/10/2011
Ví dụ
Alternative
(cid:131) Danh sách tài nguyên và hằng giá trị thay
Source code của X11 có thể được tìm thấy tại
ftp.x.org, ftp.cs.purdue.edu, hoặc ftp.eu.net
thế cho một giá trị thuộc tính.
thế cho một giá trị thuộc tính
(cid:131) Chỉ chọn một trong danh sách các giá trị.
Ví dụ
Source code của X11 có thể được tìm thấy tại ftp.x.org, ftp.cs.purdue.edu, hoặc
ftp.eu.net
Thuộc tính bộ chứa vs lặp thuộc
tính
Sue đã viết các ấn phẩm "Anthology of Time", "Zoological Reasoning",
"Gravitational Reflections"
Gravitational Reflections .
11
Các ấn phẩm không
có mối liên hệ nào
ngoài việc cùng có
một tác giả
9/10/2011
Tiếp
Tuyên bố về tuyên bố khác
(cid:132) Tuyên bố:
Hội đồng gồm Fred, Wilma, Dino đồng ý với nghị
quyết.
“Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila”.
“O L
il ”
f th
htt
/H
/L
th
3
//
il
t
i
(cid:132) RDF coi đây như một sự thật (fact). Xét tuyên bố:
“Ralph Swick says that Ora Lassila is the creator of the resource
http://www.w3.org/Home/Lassila”
(cid:132) Không có nghĩa nói về chủ thể Lassila mà là về
à là ề
ói ề hủ thể L
hĩ
il
Khô
ó
tuyên bố của Ralph
Ba người như một chủ
thể.
Không cần thiết
phân tách
Tiếp
Tuyên bố về tuyên bố
(cid:133) subject
(cid:132) Chỉ định tài nguyên được mô tả bởi tuyên bố. Giá trị của thuộc tính
à t ê bố ói ề (
(cid:132) Sử dụng các thuộc tính sau: “Ralph Swick says that Ora Lassila is the creator of the resource
http://www.w3.org/Home/Lassila”
(cid:133) predicate
(cid:132) Chỉ định thuộc tính ban đầu
(cid:133) object
(cid:132) Giá trị
(cid:133) type
(cid:132) Giá trị của thuộc tính này mô tả kiểu của tài nguyên mới tạo ra.
(cid:132) Giá trị của thuộc tính này mô tả kiểu của tài nguyên mới tạo ra
t là tài bj subject là tài nguyên mà tuyên bố nói về (e.g.,
ê
http://www.w3.org/Home/Lassila).
12
RDF:Statement.
9/10/2011
Tiếp
Bài tập: diễn tả bằng RDF
“Ralph Swick says that Ora Lassila is the creator of the resource
http://www.w3.org/Home/Lassila”
(cid:132) Oracle Corporation (NASDAQ: ORCL) and Sun Microsystems
(NASDAQ: JAVA) announced today they have entered into a
definitive agreement under which Oracle will acquire Sun
definitive agreement under which Oracle will acquire Sun
common stock for $9.50 per share in cash.
(cid:132) Sun Microsystems, Inc. (NASDAQ: JAVA) develops the
technologies that power the global marketplace. Sun can be
found in more than 100 countries and on the Web at
http://www.sun.com.
xmlns:rdf="http://w3.org/TR/1999/PR-rdf-syntax-19990105#"
1999010 #"
xmlns:a="http://description.org/schema/">
(NASDAQ ORCL) i
(cid:132) Oracle (NASDAQ: ORCL) is the world's largest enterprise
ld'
th
t
t
i
l
O l
software company. For more information about Oracle, please
visit our Web site at http://www.oracle.com.
50
Ora Lassila
Ralph Swick
Ralph Swick
Từ vựng RDF
FOAF
(cid:132) Tập các URI (không phải các từ)
(cid:132) Dự án FOAF (http://www.foaf-project.org/): định
(cid:132) Mỗi tổ chức định nghĩa từ vựng riêng cho mình sử dụng các
ì h ử d
từ
hĩ
iê
h
á
á hâ
t
Mỗi tổ hứ đị h
tiền tố URI riêng.
nghĩa thuật ngữ (bởi RDF) cho các trang
homepage cá nhân, tổ chức, cty mà máy tính có
à á tí h ó
tổ hứ
h
thể hiểu..
(cid:132) ví dụ: Dublin Core (dc:title, dc:creator, dc:date, …).
(cid:132) Tập trung mô tả người, liên kết giữa người và mọi
(cid:132) RDF không phân tích URIs và không diễn dịch cho bất cứ tiền
tố chung nào.
(cid:132) URI thường chỉ đến vị trí mà nội dung thông tin về tài nguyên
thứ khác trên Web:
(cid:133) tạo ra tài liệu,
(cid:133) tham dự các cuộc họp
(cid:133) tham dự các cuộc họp,
(cid:133) có trong các bức ảnh, vv
có thể được tìm thấy.
(cid:132) FOAF Vocabulary: http://xmlns.com/foaf/0.1/
51
52
13
9/10/2011
Bài tập tìm hiểu
Bài tập tìm hiểu
(cid:132) Recent Dublin Core enhancement: DCMI
//d bli
t /d
/d
Metadata Terms
Metadata Terms
(cid:133)Specification:
(cid:132) Dublin Core
(cid:133) đặ tả htt
(cid:133) đặc tả: http://dublincore.org/documents/dces/
/
(cid:133)Namespace:
http://dublincore.org/documents/dcmi-terms/
xmlns:dc="http://purl.org/dc/elements/1.1/"
(cid:133)Namespace:
(cid:132) FOAF
xmlns:dcterms=http://purl.org/dc/terms/
ặ
p
p
(cid:132) RSS 1.0
(cid:133)đặc tả: http://xmlns.com/foaf/spec/
(cid:133)Namespace:
(cid:133)http://en.wikipedia.org/wiki/RSS_(file_format)
xmlns:foaf="http://xmlns.com/foaf/0.1/"
53
54
Nút trắng
Ví dụ
(cid:132) Đôi khi trong quá trình chi tiết hóa việc mô
tả các quan hệ
tả các quan hệ
(cid:133) Thêm nút mới
(cid:133) Nếu nút này không bao giờ được tham chiếu
tới ngoài đồ thị RDF hiện tại (cid:198) không nhất
thiết phải có tên.
exstaff:85740 exterms:address exaddressid:85740 .
exaddressid:85740 exterms:street "1501 Grant Avenue" .
exaddressid:85740 exterms:city "Bedford" .
exaddressid:85740 exterms:state "Massachusetts" .
exaddressid:85740 exterms:postalCode "01730" .
55
56
14
9/10/2011
Ví dụ
exterms:street "1501 Grant Avenue" .
exterms:city "Bedford" .
exterms:state "Massachusetts" .
exstaff:85740 exterms:address _:joaddress.
_:joaddress
_:joaddress
_:joaddress
_:joaddress exterms:postalCode "01730" .
57
15