intTypePromotion=1

XML-ngôn ngữ Web thế hệ kế tiếp

Chia sẻ: Nguyễn Quang Thạch | Ngày: | Loại File: DOC | Số trang:94

0
216
lượt xem
108
download

XML-ngôn ngữ Web thế hệ kế tiếp

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

XML-đã trở thành thuật ngữ thông dụng trong lĩnh vực Internet, song có thể bạn còn chưa hiểu thấu đáo về nó cũng như những lợi ích mà nó mang lại... trong lĩnh vực Internet, song có thể bạn còn chưa hiểu thấu đáo về nó cùng những lợi ích mà nó mang lại. Đừng cho rằng XML là công nghệ khó lĩnh hội vì đằng sau những lời khoa trương liên quan tới ngôn Language: siêu ngôn ngữ có khả năng sinh ngôn ngữ khác). SGML được phát triển cho việc định cấu trúc và nội dung tài liệu...

Chủ đề:
Lưu

Nội dung Text: XML-ngôn ngữ Web thế hệ kế tiếp

  1. XML-ngôn ngữ Web thế hệ kế tiếp ……….., tháng … năm …….
  2. XML - ngôn ngữ Web thế hệ kế tiếp XML (Extensible Markup Language - ngôn ngữ đánh dấu mở rộng) đã trở thành thuật ngữ thông dụng trong lĩnh vực Internet, song có thể bạn còn chưa hiểu thấu đáo về nó cùng những lợi ích mà nó mang lại. Đừng cho rằng XML là công nghệ khó lĩnh hội vì đằng sau những lời khoa trương liên quan tới ngôn ngữ này là cả thuận lợi lớn cho quá trình cộng tác. Quá trình phát triển của XML XML là ngôn ngữ xây dựng cấu trúc tài liệu văn bản, dựa theo chuẩn SGML (Standard Generalized Markup Language: siêu ngôn ngữ có khả năng sinh ngôn ngữ khác). SGML được phát triển cho việc định cấu trúc và nội dung tài liệu điện tử, do tổ chức ISO (International Organization for Standards) chuẩn hoá năm 1986. SGML là do IBM đưa ra, song không thể không kể đến những đóng góp của các công ty khác. XML được W3C (World Wide Web Consortium: tổ chức độc lập định ra tiêu chuẩn cho trình duyệt Web, máy chủ và ngôn ngữ) phát triển, nhưng đặc tả XML lại do Netscape, Microsoft và các thành viên của dự án Text Encoding Initiative
  3. (TEI) xây dựng. Tổ chức W3C XML Special Interest Group có đại diện từ hơn 100 công ty cùng nhiều chuyên gia được mời khác. Hình 1: W3C - Tổ chức đi đầu trong việc phát triển XML (Web site: http://www.w3c.org) W3C chính thức thông qua chuẩn XML vào tháng Hai năm 1998. Thực chất, XML phát triển không phải với mục đích trang trí trang Web mà là trợ giúp cấu trúc cho tài liệu và dữ liệu để chúng có thể trao đổi giữa các phòng ban, khách hàng và nhà cung cấp. Cho dù XML vẫn chưa phổ biến, song đang được nhiều đối tượng quan tâm bởi nó
  4. cho phép chia sẻ và sử dụng thông tin phân tán trên các hệ thống khác nhau. XML hỗ trợ người dùng thông qua khả năng tạo nội dung động, phát triển ứng dụng và tích hợp trên qui mô xí nghiệp. Khi việc hỗ trợ những hệ thống cũ gặp nhiều khó khăn và các doanh nghiệp đang cố gắng hợp nhất dữ liệu, XML có thể "giảm bớt gánh nặng" ở những nơi dữ liệu phân tán trên các hệ thống cũ. á XML là gì? Để hiểu đúng về XML và phân biệt với HTML (Hypertext Markup Language ố ngôn ngữ đánh dấu siêu văn bản), cách đơn giản nhất là bắt đầu bằng một ví dụ HTML. HTML sử dụng tập thẻ (tag) hữu hạn để định ra thông tin cơ bản về cấu trúc tài liệu. Do là ngôn ngữ đánh dấu nên HTML rất dễ sử dụng, bất kỳ ai cũng có thể xây dựng từ đầu trang Web cơ bản theo yêu cầu riêng. XML khá giống HTML, hai ngôn ngữ này có cùng luật cú pháp. Tuy nhiên, tính linh hoạt của XML cho phép bạn tạo và sử dụng tập thẻ và thuộc tính riêng để nhận biết các phần tử cấu trúc và nội dung tài liệu. XML không chỉ đơn thuần là
  5. ngôn ngữ đánh dấu, nó có phương pháp định ra nội dung tài liệu, tương tự như HTML định hình thức tài liệu trên Web. Với HTML, người thiết kế đánh dấu văn bản, hình ảnh cùng các thành phần khác của trang Web bằng tập thẻ mà không liên quan gì tới ý nghĩa tài liệu; đoạn mã HTML chỉ nói lên cách hiển thị nội dung tài liệu qua trình duyệt. XML không chỉ định ra hình thức mà còn cả nội dung tài liệu. Hình 2: Interleaf phát triển công cụ đồ hoạ tạo XML sử dụng XSL XML được xem là công cụ mạnh hơn HTML do nó mang lại thông tin đầy đủ về dữ liệu. XML cung cấp "siêu dữ liệu" (meta-data) hay dữ liệu về dữ liệu, giúp việc tìm kiếm thông tin được dễ dàng hơn. Ví dụ, trong HTML, từ "apple" có thể được gán thẻ "bold" để mô tả hình dạng trái táo. Tuy nhiên, XML bao gồm các thẻ mô tả vật th ể như "fruit" hay "apple" hay "red". Một số tổ chức chuyên môn đã xây dựng ngôn ngữ XML riêng, bao gồm các thẻ nhận diện đặc
  6. tả công nghiệp. Ví dụ, ngành công nghiệp hoá đã phát triển ngôn ngữ Chemical Markup Language (CML)... Tháng Hai năm 1998, hơn 40 nhà sản xuất cùng các công ty đã thông báo kế hoạch hoàn thành ngôn ngữ Commerce Extensible Markup Language (CXML) - tập con của XML. CXML định ra các tập dữ liệu chuẩn dùng cho thương mại điện tử trên Internet. Phiên bản thu nhỏ, đơn giản hơn của Electronic Data Interchange (EDI), tập thẻ d ữ liệu CXML và bản thử nghiệm được công bố vào tháng Ba. Bản chính thức được hoàn thành trong vòng sáu tháng sau. XML cho phép các nhà phát triển và quản trị công nghệ thông tin mô tả thông tin có liên hệ tới các nguồn thông tin khác. Đây là phương pháp khai thác thông tin nghiệp vụ lý tưởng trong môi trường trao đổi thông tin từ server đến server, từ server đến ứng dụng hay từ ứng dụng đến ứng dụng. Hình 3: Kenya của General Magic sử dụng XML
  7. Cấu trúc mã chặt chẽ của XML (nội dung được đặt giữa các ký hiệu mã chuẩn hay còn gọi là thẻ) cho phép các ứng dụng khác dễ dàng tìm kiếm và sử dụng nội dung đã tạo. Mỗi tài liệu XML trở thành một kho dữ liệu hỏi đáp (query data repository) tương tự như cơ sở dữ liệu (CSDL). Hiện tại, không có hệ thống quy tắc quản lý các "gói" dữ liệu Web hay định ra phương pháp vận hành trên dữ liệu này. Kết quả là Internet trở thành bộ sưu tập khổng lồ của HTML, JavaScript và Java trên máy client và "mớ" ngôn ngữ kịch bản và ngôn ngữ biên dịch trên server. XML giải quyết sự lộn xộn này bằng cách tổ chức tất cả các ngôn ngữ lập trình theo một cấu trúc thống nhất. Trước đây, dữ liệu được lưu trữ không theo thứ tự trong các trang HTML, nhưng giờ đây chúng được đặt trong các trang XML theo cấu trúc chặt chẽ. Cả hai trình duyệt của Netscape và Microsoft phiên bản 5.x đều thông hiểu XML và quản lý hiệu quả dữ liệu này. Độc lập với server XML giúp bạn tạo tài liệu sử dụng độc lập với server. Tài liệu nằm ngay trên máy khi người
  8. dùng tải về và tiếp tục được sử dụng không phụ thuộc server. Ví dụ, bạn tải tài liệu xuống máy tính xách tay, sau đó có thể sử dụng hiệu quả tài liệu này trong khi máy tính không nối mạng. Sở dĩ đạt được điều này là do tài liệu XML được lập trình thông minh trên chính nó: tài liệu tồn tại độc lập với server. Thậm chí, tài liệu có thể được gửi tới người dùng khác dùng ứng dụng có hỗ trợ XML. Những ứng dụng nhận biết được XML (không phải trình duyệt) cũng có thể quản lý dữ liệu gán thẻ XML. Mặt khác, XML mang tính chặt chẽ của SGML, không ảnh hưởng tới cơ sở cài đặt khổng lồ của các trang HTML đã tồn tại trên Internet, nghĩa là chỉ cần điều chỉnh chút ít trang HTML để tương thích với XML.
  9. Hình 4: Lasso 3.5 Web Data Engine của Blue World hỗ trợ XML Đây là một dòng mã HTML định ra nguồn hình ảnh: , tương ứng trong XML là: . Rõ ràng, sự khác biệt giữa hai dòng mã là không lớn, những thay đổi như đặt thuộc tính ("/img/ fig1.jpg/" nhận biết tập tin fig1.jpg như một hình ảnh) trong cặp nháy kép và thêm dấu gạch chéo kết thúc câu lệnh đã chuyển câu lệnh HTML thành câu lệnh XML và được biên dịch bình thường. Một trang XML là một CSDL do các trường đều
  10. được nhận diện hay biên dịch, và chứa dữ liệu đặc tả để ứng dụng khác có thể truy cập. Các ứng dụng XML Nhiều nhà sản xuất đã công bố các chuẩn và ứng dụng XML, tiêu biểu là Document Object Model Level 2 cung cấp tập chuẩn gồm các đối tượng để trình bày tài liệu HTML và XML, đồng thời bổ sung các giao tiếp kiểu đối tượng Cascading Style Sheets (CSS), giao tiếp kiểu s ự kiện và truy vấn. Cũng là một trở ngại khi mãi tới năm 1998, các công cụ tạo XML, DTD (Document Type Definition ố định nghĩa loại tài liệu: một kiểu tập tin kết hợp với tài liệu đánh dấu để định ra cách thông dịch tài liệu bằng ứng dụng thông qua thẻ đánh dấu) mới được đưa ra. Tuy nhiên đông đảo các nhà sản xuất đã và sẽ hỗ trợ XML trong những sản phẩm sắp tới. Ngoài ra, XML hứa hẹn mở rộng khả năng định dạng tài liệu Web thông qua việc bổ sung các DTD. Trên cơ sở sự quan tâm và chấp nhận XML, trong năm nay, các nhà sản xuất sẽ đưa ra thị trường những sản phẩm hỗ trợ XML mang tính chất "chào hàng".
  11. Interleaf Composer/Styler là công cụ đồ hoạ tạo XML sử dụng XSL (Extensible StyleSheet Language) (www.interleaf.com). XSL là đặc tả phân biệt mẫu tài liệu thông qua nội dung khi tạo trang HTML hay XML. Đặc tả có tác dụng tương tự mẫu định dạng (template), cho phép nhà thiết kế áp dụng cùng một mẫu cho nhiều trang. XSL là đặc tả kiểu thứ hai được W3C đưa ra sau CSS (Cascading Style Sheet ố hệ thống qui định "kiểu dáng" trang Web). Interleaf Composer/Styler là một phần trong bộ sản phẩm BladeRunner được Interleaf công bố vào tháng Sáu. BladeRunner có thể định dạng cùng dữ liệu XML theo nhiều kiểu khác nhau, phụ thuộc mẫu trang được áp dụng. RightDoc (http://www.rightdoc.com) đưa ra phiên bản RightDoc 2.0, đây là trình soạn thảo văn bản XML, sử dụng XML và CSS như các định dạng tập tin và cũng có thể xuất ra các định dạng HTML, PDF (Portable Document Format) và Postscript. Trình này sử dụng Query Designer để tích hợp dữ liệu thông minh vào tài liệu dùng ODBC (Open Database Connectivity), cho phép nhập trực tiếp dữ liệu mới vào tài liệu. General Magic (http://www. generalmagic.com) sử dụng XML trong công nghệ xử lý tiếng nói
  12. mang tên Kenya. Kenya dùng XML để lưu tham số người dùng vào chương trình. Sau đó, chương trình sẽ sử dụng những tham số này để gọi tới người dùng và thông báo thông tin quan trọng trên Web. Ví dụ, Kenya có thể gọi và báo cho người thắng cuộc trên site bán đấu giá. Sqribe Technologies (http://www. sqribe.com) công bố sẽ sử dụng XML trong sản phẩm ReportMart Enterprise Information Portal để tích hợp các ứng dụng thứ ba (third-party applications) và các nguồn dữ liệu trên qui mô xí nghiệp. Sản phẩm đầu tiên sử dụng định dạng này là
  13. RM/QuickConnect của Sqribe cho PeopleSoft. RM/QuickConnect cung cấp một điểm truy nhập duy nhất cho các báo biểu PeopleSoft cùng những thông tin khác. IPNet Solution (http://www.ipnetsolution.com) sử dụng XML trong các sản phẩm thương mại điện tử xí nghiệp IPNet.Suite 3.0. Bộ sản phẩm này có khả năng nhập, xuất dữ liệu XML, chuyển qua lại giữa định dạng XML và các định dạng khác, hỗ trợ DTD và dịch tự động XML thành HTML. Cuối cùng là Blue World Communicarion (http://www. blueworld.com) đã hỗ trợ XML trong sản phẩm Lasso 3.5 Web Data Engine - sản phẩm xây dựng ứng dụng Web hướng cơ sở dữ liệu. Các thẻ Lasso sẽ được mã hoá theo cú pháp XML trong phiên bản sắp tới. Tìm thông tin về XML trên Web http://www.xml.com - Các bài báo và tin tức • về XML http://www.w3c.org - World Wide Web • Consortium ố tổ chức đi đầu trong tiến trình chuẩn hoá XML
  14. http://www.microsoft .com/xml - Web site • XML của Microsoft http://developer.netscape • .com/tech/metadata/index .html - trung tâm phát triển meta-data và XML của Netscape http://www.software .ibm.com/xml - Web site • XML của IBM http://www.xmlrepository .com - Web site sưu • tập công nghệ XML, trang thử nghiệm XML và có thể tải xuống miễn phí. Quốc Hùng PCW Hồng Kông 08/1999 PcLeHoan 1996 - 2002 Mirror : http://www.pclehoan.com Mirror : http://www.lehoanpc.net Mirror : http://www.ktlehoan.com | Translations Học XML với 10 điểm ghi nhớ XML, XLink, Namespace, DTD, Schema, CSS, XHTML ... Nếu bạn hoàn toàn chưa biết về XML, bạn sẽ thấy khó vì không biết bắt đầu từ đâu. Bản tóm tắt sau là 10 điểm giúp bạn nắm được
  15. đầy đủ những khái niệm cơ bản cho phép người mới học có khái niệm chung trước khi đi vào chi tiết. Và nếu bạn nào đang chuẩn bị trình bày một bài tham luận về XML, vậy thì tại sao lại không bắt đầu với 10 điểm này ? 1. XML được dùng để tạo cấu trúc dữ liệu Dữ liệu này bao gồm bảng công tác, sổ địa chỉ, các tham số cấu hình, giao dịch tài chính và vẽ kỹ thuật. XML là một hệ thống các luật (có thể coi là những hướng dẫn hay quy ước) dùng cho việc thiết kế các format cho văn bản giúp bạn tạo cấu trúc cho dữ liệu. XML không phải là ngôn ngữ lập trình và bạn cũng không cần phải là một lập trình viên để có thể học và sử dụng nó thành thạo. XML giúp cho máy tính của bạn dễ dàng tạo dữ liệu, đọc dữ liệu và làm cho cấu trúc dữ liệu của bạn trở nên rõ ràng dễ hiểu. XML còn giúp bạn tránh được những bẫy thông thường trong thiết kế ngôn ngữ: nó có thể mở rộng, có platform hoàn toàn độc lập và hỗ trợ tính quốc tế hoá và nội địa hoá. XML hỗ trợ hoàn toàn Unicode.
  16. 2. XML có một số điểm giống với HTML Tương tự HTML, XML cũng sử dụng các tags (các từ được đặt trong ngoặc với '') và dùng thuộc tính (với mẫu name="value"). Trong khi HTML đặc biệt chú ý tới từng tag và attribute có ý nghĩa gì, và phần văn bản giữa các tag đó s ẽ hiển thị như thế nào trong trình duyệt thì XML sử dụng các tag chỉ để phân định ranh giới giữa các mẩu dữ liệu, và coi việc đọc và xử lý dữ liệu đó hoàn toàn là nhiệm vụ của ứng dụng. Nói cách khác, nếu bạn thấy "" trong một file XML, đừng cho rằng đó là ký hiệu của một đoạn. Tuỳ thuộc vào văn cảnh, nó có thể là giá (price), m ột tham số (a parameter), một người (a person), hay một cái gì đó bắt đầu bằng chữ cái 'p' trong tiếng Anh. 3. XML là một văn bản, nhưng không giống những loại văn bản thông thường mà ta có thể đọc được
  17. Các chương trình dùng để tạo bảng công tác, sổ địa chỉ, và các dữ liệu được cấu trúc hóa thông thường lưu dữ liệu trên đĩa, sử dụng khuôn dạng text hay nhị phân. Một thuận lợi của khuôn dạng văn bản là cho phép người ta, nếu cần thiết, có thể xem dữ liệu mà không cần phải có chương trình đã tạo ra dữ liệu đó; nói cách khác, bạn có thể đọc nó với bất kì bộ soạn thảo văn bản nào mà bạn thích. Các khuôn dạng văn bản cũng cho phép người ta tìm lỗi dễ dàng hơn trong các ứng dụng. Giống như HTML, các file XML là những file văn bản được tạo ra không phải với mục đích để đọc, nhưng cũng không loại trừ trường hợp nếu cần thì vẫn có thể đọc được. Tuy nhiên XML lại có điểm không bằng HTML, các luật dùng trong file XML rất hạn chế. Chỉ cần quên một tag, hay một thuộc tính không đi kèm với nội dung (quots) sẽ làm cho toàn bộ file XML đó ngừng hoạt động, trong khi ở HTML những lỗi này có thể được bỏ qua. Bản ghi XML chính thức không cho phép các ứng dụng tìm hiểu đến lần thứ 2 nguyên nhân gây lỗi file XML; nếu file bị lỗi ứng dụng đó ngừng hoạt động ngay lập tức và báo lỗi.
  18. 4. XML is verbose by design Vì XML là định dạng văn bản và nó sử dụng tag để phân định từng chức năng trong dữ liệu nên file XML hầu như luôn lớn hơn định dạng nhị phân. Đó là chủ ý của người tạo ra XML. Những điểm mạnh của định dạng văn bản đã được nêu rõ (ở điểm 3), và những bất cập có thể được đền bù ở mức độ khác. Đĩa với dung lượng lớn ngày nay rẻ hơn trước kia, và các chương trình nén như zip và gzip có thể nén file rất nhanh chóng và chất lượng. Thêm vào đó, giao thức truyền thông như HTTP/1.1, giao thức chính dùng trong web, có thể nén dữ liệu nhanh chóng và ghi lại dải tần hiệu quả như định dạng nhị phân. 5. XML is a family of technologies XML 1.0 là một bản ghi định nghĩa về "tags" và "thuộc tính". Trên XML 1.0, "the XML family" là một bộ các module cung cấp các dịch vụ hữu dụng để hoàn thành những nhiệm vụ yêu
  19. cầu có tính chất thường xuyên và quan trọng. Xlink được coi như một phương thức chuẩn để đưa các liên kết siêu văn bản vào file XML. XPointer and XFragments là những cú pháp để phát triển các phần trong văn bản XML . XPointer có đôi chỗ giống URL, nhưng thay vì tập trung vào văn bản trên mạng, nó lại tập trung vào từng đoạn dữ liệu trong file XML. CSS, the style sheet language, có thể áp dụng được đối với XML giống như HTML. XSL là một loại ngôn ngữ rất tiến bộ dùng cho style sheets. Nó dựa trên XSLT, một loại ngôn ngữ chuyển đổi sử dụng trong việc sắp xếp lại, thêm vào và xoá đi một số tag và thuộc tính. DOM là một bộ các chức năng chuẩn dùng cho thao tác file XML (và HTML) từ một ngôn ngữ lập trình. XML Schemas 1 và 2 giúp các nhà thiết kế định nghĩa chính xác cấu trúc định dạng trên của chính họ. Ngoài ra còn có một số module và công cụ khác hay vẫn còn đang được phát triển. Xin các bạn đọc thêm W3C's technical reports page. 6. XML is new, but not that new
  20. Việc phát triển XML được bắt đầu năm 1996 và đã được W3C khuyến cáo sử dụng từ tháng 2 năm 1998. Điều này có thể khiến bạn nghĩ rằng, XML là công nghệ mới . Trên thực tế, công nghệ này không còn là mới lạ. Trước XML cũng đã có SGML, thiết kế vào đầu những năm 80, đạt tiêu chuẩn ISO từ năm 1986 và được người ta sử dụng rộng rãi trong những dự án lớn. HTML bắt đầu được xây dựng từ năm 1990. Người tạo ra XML đơn giản chỉ tận dụng những điểm mạnh của SGML, cùng với kinh nghiệm có được từ HTML đã tạo ra sản phẩm không thua kém gì SGML, thêm vào đó nó rất thông dụng và dễ dùng. Tuy nhiên có những phát triển trong công nghệ khiến người ta khó phân biệt với cuộc cách mạng công nghệ... Và phải nói rằng trong khi SGML được sử dụng chủ yếu trong các văn bản kỹ thuật, và cả trong một số ít các loại dữ liệu khác thì XML lại hoàn toàn ngược lại. 7. XHTML là sự kết hợp giữa XML và HTML
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2