
XML-ngôn ng Web thữ ế
h k ti pệ ế ế
……….., tháng … năm …….

XML - ngôn ng Web th h k ti pữ ế ệ ế ế
XML (Extensible Markup Language - ngôn ngữ
đánh d u m r ng) đã tr thành thu t ng thôngấ ở ộ ở ậ ữ
d ng trong lĩnh v c Internet, song có th b n cònụ ự ể ạ
ch a hi u th u đáo v nó cùng nh ng l i ích màư ể ấ ề ữ ợ
nó mang l i. Đ ng cho r ng XML là công nghạ ừ ằ ệ
khó lĩnh h i vì đ ng sau nh ng l i khoa tr ngộ ằ ữ ờ ươ
liên quan t i ngôn ng này là c thu n l i l n choớ ữ ả ậ ợ ớ
quá trình c ng tác.ộ
Quá trình phát tri n c a XMLể ủ
XML là ngôn ng xây d ng c u trúc tài li uữ ự ấ ệ
văn b n, d a theo chu n SGML (Standardả ự ẩ
Generalized Markup Language: siêu ngôn ng cóữ
kh năng sinh ngôn ng khác). SGML đ c phátả ữ ượ
tri n cho vi c đ nh c u trúc và n i dung tài li uể ệ ị ấ ộ ệ
đi n t , do t ch c ISO (Internationalệ ử ổ ứ
Organization for Standards) chu n hoá năm 1986.ẩ
SGML là do IBM đ a ra, song không th khôngư ể
k đ n nh ng đóng góp c a các công ty khác.ể ế ữ ủ
XML đ c W3C (World Wide Web Consortium:ượ
t ch c đ c l p đ nh ra tiêu chu n cho trình duy tổ ứ ộ ậ ị ẩ ệ
Web, máy ch và ngôn ng ) phát tri n, nh ngủ ữ ể ư
đ c t XML l i do Netscape, Microsoft và cácặ ả ạ
thành viên c a d án Text Encoding Initiativeủ ự

(TEI) xây d ng. T ch c W3C XML Specialự ổ ứ
Interest Group có đ i di n t h n 100 công tyạ ệ ừ ơ
cùng nhi u chuyên gia đ c m i khác.ề ượ ờ
Hình 1: W3C - T ch c đi đ u trong vi c phátổ ứ ầ ệ
tri n XML (Web site: http://www.w3c.org)ể
W3C chính th c thông qua chu n XML vào thángứ ẩ
Hai năm 1998. Th c ch t, XML phát tri n khôngự ấ ể
ph i v i m c đích trang trí trang Web mà là trả ớ ụ ợ
giúp c u trúc cho tài li u và d li u đ chúng cóấ ệ ữ ệ ể
th trao đ i gi a các phòng ban, khách hàng vàể ổ ữ
nhà cung c p. Cho dù XML v n ch a ph bi n,ấ ẫ ư ổ ế
song đang đ c nhi u đ i t ng quan tâm b i nóượ ề ố ượ ở

cho phép chia s và s d ng thông tin phân tánẻ ử ụ
trên các h th ng khác nhau.ệ ố
XML h tr ng i dùng thông qua kh năng t oỗ ợ ườ ả ạ
n i dung đ ng, phát tri n ng d ng và tích h pộ ộ ể ứ ụ ợ
trên qui mô xí nghi p. Khi vi c h tr nh ng hệ ệ ỗ ợ ữ ệ
th ng cũ g p nhi u khó khăn và các doanh nghi pố ặ ề ệ
đang c g ng h p nh t d li u, XML có thố ắ ợ ấ ữ ệ ể
"gi m b t gánh n ng" nh ng n i d li u phânả ớ ặ ở ữ ơ ữ ệ
tán trên các h th ng cũ.ệ ố
á
XML là gì?
Đ hi u đúng v XML và phân bi t v i HTMLể ể ề ệ ớ
(Hypertext Markup Language ngôn ng đánhố ữ
d u siêu văn b n), cách đ n gi n nh t là b t đ uấ ả ơ ả ấ ắ ầ
b ng m t ví d HTML. HTML s d ng t p thằ ộ ụ ử ụ ậ ẻ
(tag) h u h n đ đ nh ra thông tin c b n v c uữ ạ ể ị ơ ả ề ấ
trúc tài li u. Do là ngôn ng đánh d u nên HTMLệ ữ ấ
r t d s d ng, b t kỳ ai cũng có th xây d ng tấ ễ ử ụ ấ ể ự ừ
đ u trang Web c b n theo yêu c u riêng.ầ ơ ả ầ
XML khá gi ng HTML, hai ngôn ng này có cùngố ữ
lu t cú pháp. Tuy nhiên, tính linh ho t c a XMLậ ạ ủ
cho phép b n t o và s d ng t p th và thu cạ ạ ử ụ ậ ẻ ộ
tính riêng đ nh n bi t các ph n t c u trúc vàể ậ ế ầ ử ấ
n i dung tài li u. XML không ch đ n thu n làộ ệ ỉ ơ ầ

ngôn ng đánh d u, nó có ph ng pháp đ nh raữ ấ ươ ị
n i dung tài li u, t ng t nh HTML đ nh hìnhộ ệ ươ ự ư ị
th c tài li u trên Web. V i HTML, ng i thi tứ ệ ớ ườ ế
k đánh d u văn b n, hình nh cùng các thànhế ấ ả ả
ph n khác c a trang Web b ng t p th mà khôngầ ủ ằ ậ ẻ
liên quan gì t i ý nghĩa tài li u; đo n mã HTMLớ ệ ạ
ch nói lên cách hi n th n i dung tài li u qua trìnhỉ ể ị ộ ệ
duy t. XML không ch đ nh ra hình th c mà cònệ ỉ ị ứ
c n i dung tài li u.ả ộ ệ
Hình 2: Interleaf phát tri n công c đ ho t oể ụ ồ ạ ạ
XML s d ng XSLử ụ
XML đ c xem là công c m nh h n HTML doượ ụ ạ ơ
nó mang l i thông tin đ y đ v d li u. XMLạ ầ ủ ề ữ ệ
cung c p "siêu d li u" (meta-data) hay d li uấ ữ ệ ữ ệ
v d li u, giúp vi c tìm ki m thông tin đ c dề ữ ệ ệ ế ượ ễ
dàng h n. Ví d , trong HTML, t "apple" có thơ ụ ừ ể
đ c gán th "bold" đ mô t hình d ng trái táo.ượ ẻ ể ả ạ
Tuy nhiên, XML bao g m các th mô t v t thồ ẻ ả ậ ể
nh "fruit" hay "apple" hay "red".ư
M t s t ch c chuyên môn đã xây d ng ngônộ ố ổ ứ ự
ng XML riêng, bao g m các th nh n di n đ cữ ồ ẻ ậ ệ ặ

