
Công nghệ XML và WEB ngữ nghĩa
Introduction to The Semantic WEB
1Trần Nguyên Ngọc - HVKTQS - 2012

Thông tin và internet
•World Wide Web (WWW) là môi trường tốt
cho việc biểu diễn và truy cập thông tin dạng
số.
•Thông tin trên WWW được biểu diễn chủ
yếu dưới dạng ngôn ngữ tự nhiên (các
trang Web trên ngôn ngữ HTML).
•Máy tính và người hiểu khác nhau!
•Mong muốn: machine-readable & machine
analysis
Trần Nguyên Ngọc - HVKTQS - 2012 2

Bài toán tìm kiếm thông tin
Information Retrieval
•Information retrieval (IR)
là quá trình tìm kiếm dữ
liệu (thường là tìm dưới
dạng một đoạn văn bản)
từ một tập hợp lớn các
đối tượng không có cấu
trúc tường minh (thường
là text lưu trữ trong máy
tính) nhằm đáp ứng một
nhu cầu về thông tin
Trần Nguyên Ngọc - HVKTQS - 2012 3

Công cụ tìm kiếm trực tuyến
Trần Nguyên Ngọc - HVKTQS - 2012 4

Thực chất google làm gì?
•Gửi đi một yêu cầu (query)như sau
•http://www.google.com.vn/#sclient=psy-
ab&hl=vi&source=hp&q=seantic+web+l%C3%
A0+gi%3F&pbx=1&oq=seantic+web+l%C3%A0
+gi%3F&aq=f&aqi=&aql=&gs_sm=e&gs_upl=9
10l13129l0l14005l24l20l3l0l0l1l827l4892l0.13
.3.2.0.1.1l23l0&bav=on.2,or.r_gc.r_pw.,cf.osb
&fp=2b8791cc67af876b&biw=1280&bih=683
Trần Nguyên Ngọc - HVKTQS - 2012 5

