Chương 2:
Tạo một tài liệu XML hợp khuôn dạng
Ý nghĩa của việc tạo một tài liệu XML hợp khuôn dạng
Việc tạo một tài liệu XML hợp khuôn dạng là rất quan trọng bởi các lý do sau:
-Tổ chức W3C không xem một tài liệu thuộc dạng XML trừ khi nó hợp
khuôn dạng quy định.
-Trình xử lý XML không đọc được tài liệu XML trừ khi những tài liệu này hợp
khuôn dạng.
Một tài liệu XML được gọi là hợp khuôn dạng khi nó tuân theo các quy tắc và
cú pháp của tài liệu XML. Theo W3C, tính hợp khuôn dạng được xem xét như
sau:
-Tổng thể phải phù hợp với các gọi là sản phẩm tài liệu.
-Thỏa mãn tất cả ràng buộc nêu trong đặc tả về XML.
Phù hợp với một sản phẩm tài liệu:
Một tài liệu XML gồm 3 phần:
-Phần mở đầu (có thể rỗng).
-Phần tử gốc (có thể chứa phần tử khác).
-Phần tử còn lại (đây là phần tử tùy chọn).
Thỏa mãn các ràng buộc: Tài liệu XML phải thoải mãn các ràng buộc hợp
khuôn dạng trong đặc tả XML.
Tạo một tài liệu XML mẫu
Trước hết, cần tạo phần khai báo XML, đây là khai báo đơn giản nhất
<?xml version=“1.0”?>
Bởi vì tất cả các tài liệu chúng ta thấy là tự chứa (không tham khảo hoặc bao
gồm các thực thể bên ngoài) nên ta tạo thuộc tính standalone là “yes” và để
biểu diễn được mọi ngôn ngữ ta dùng bộ mã UTF-8.
<?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
Tiếp theo, them phần tử gốc vào tài liệu, ví dụ phần tử gốc <document>
<?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
<document>
…..
</document>
Phần tử gốc chứa các phần tử khác, ví dụ có phần tử <employee>
<?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
<document>
<employee>
</employee>
</document>
Mỗi phần tử <employee> chứa phần tử <name>, phần tử <name> chứa hai
phần tử <firstname> <lastname>:
<?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
<document>
<employee>
<name>
<firstname>Tieu</firstname>
<lastname>Phong</lastname>
</name>
</employee>
</document>
Các ràng buộc hợp khuôn dạng
Các ràng buộc hợp khuôn dạng được đề cập rất ít trong đặc tả XML 1.0, vì
vậy một số ràng buộc phải thực hiện với DTD và tham khảo các thực thể.
-Bắt đầu tài liệu là khai báo XML: Ràng buộc cấu trúc hợp khuôn dạng đầu
tiên là phần khai báo XML.
-Chỉ sử dụng các tham khảo ký tự hợp lệ: Ràng buộc thứ hai là chỉ sử dụng
các tham khảo ký tự được hỗ trợ trong đặc tả XML.
-Có ít nhất một phần tử: Để được xem là một tài liệu hợp lệ thì tài liệu XML
phải bao gồm một hoặc nhiều phần tử. Đầu tiên phải là phần tử gốc.
-Các phần tử phải có cấu trúc đúng: Phải tạo thẻ mở và thẻ đóng, Ngoài ra
cặp thẻ phải có vị trí phù hợp (đúng cấp) và cùng tên.
-Sử dụng phần tử gốc chứa các phần tử khác: Một ràng buộc khác là phần
tử gốc phải chứa tất cả các phần tử khác trong tài liệu XML.
-Các phần tử phải lồng nhau đúng cấp.
-Tên thuộc tính phải là duy nhất: Không thể sử dụng cùng tên thuộc tính
nhiều