
Tìm hiểu ngôn ngữ XML - Một số ứng dụng trong lĩnh vực Thông tin - Thư viện
Phùng Thanh Vân. K50 Thông tin - Thư viện
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Trong xã hội thông tin ngày nay, thông tin là yếu tố quan trọng bậc
nhất trong mọi hoạt động của đời sống, mọi ngành nghề trong xã hội. Sự bùng
nổ thông tin khiến cho thông tin trở thành nguồn tài nguyên khổng lồ mà con
người cần nỗ lực để có thể làm chủ. Một trong những yếu tố thúc đẩy việc sản
sinh thông tin với khối lượng ngày càng lớn như vậy chính là mạng Internet,
đồng thời mạng Internet cũng là công cụ hữu hiệu để lưu trữ và truyền tải
thông tin. Với hệ thống World Wide Web khổng lồ, con người có thể dễ dàng
tìm kiếm, nắm bắt, trao đổi thông tin từ khắp nơi trên thế giới.
World Wide Web (hiểu ngắn gọn là “Web”) là tập hợp các tài liệu siêu
văn bản được liên kết với nhau và truy cập thông qua mạng Internet. Với một
trình duyệt Web, ta có thể xem được các trang Web chứa đầy đủ văn bản,
hình ảnh, âm thanh,… và có thể di chuyển qua lại sử dụng các siêu liên kết
(hyperlinks). Các trang Web như vậy được tạo lập nên nhờ các ngôn ngữ đánh
dấu, mà được biết đến nhiều nhất là ngôn ngữ đánh dấu siêu văn bản - HTML
(HyperText Markup Language). HTML là phương tiện để mô tả cấu trúc của
thông tin văn bản trong một tài liệu bằng cách hiển thị văn bản dưới dạng
đường link, đầu mục, đoạn văn, danh sách,… HTML được viết dưới dạng các
thẻ (tags) đặt trong cặp dấu ngoặc nhọn < >.
Tuy nhiên, HTML có những hạn chế nhất định. Với HTML, người sử
dụng chỉ dừng lại ở việc xem tài liệu chứ họ không thể thao tác với chúng, tạo
lập chúng theo định dạng mong muốn. Với thực tế là HTML thì có nhiều hạn
chế, trong khi SGML lại quá phức tạp không thể ứng dụng, vào cuối những
năm 90, các nhà nghiên cứu đã sáng tạo ra ngôn ngữ đánh dấu mở rộng -
XML (eXtensible Markup Language). Tính linh hoạt và khả năng ứng dụng
cao giúp cho XML nhanh chóng được chấp nhận bởi các nhà chuyên môn