Chuyển đổi XML thành dữ liệu quan hệ
lượt xem 11
download
Quản trị mạng – Trong hướng dẫn này chúng tôi sẽ giới thiệu cho các bạn một số phương pháp chuyển đổi các tài liệu XML thành các hàng trong các bảng quan hệ, công việc vẫn được biết đến như việc băm nhỏ hay phân tách các tài liệu XML. Phương pháp chuyển đổi các tài liệu XML thành các hàng trong các bảng dữ liệu quan hệ hay được biết đến như việc shred (băm nhỏ) hay decompose (phân tách) các tài liệu XML. Một trong những lý do chính cho việc shred là các ứng dụng SQL...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Chuyển đổi XML thành dữ liệu quan hệ
- Chuyển đổi XML thành dữ liệu quan hệ Quản trị mạng – Trong hướng dẫn này chúng tôi sẽ giới thiệu cho các bạn một số phương pháp chuyển đổi các tài liệu XML thành các hàng trong các bảng quan hệ, công việc vẫn được biết đến như việc băm nhỏ hay phân tách các tài liệu XML. Phương pháp chuyển đổi các tài liệu XML thành các hàng trong các bảng dữ liệu quan hệ hay được biết đến như việc shred (băm nhỏ) hay decompose (phân tách) các tài liệu XML. Một trong những lý do chính cho việc shred l à các ứng dụng SQL đang tồn tại vẫn cần truy cập v ào dữ liệu dưới định dạng quan hệ. Cho ví dụ, các ứng dụng kế thừa, các ứng dụng doanh nghiệp đ ược đóng gói hoặc phần mềm báo cáo không phải lúc n ào cũng làm việc với XML. Chính vì vậy đôi khi bạn sẽ thấy khá hữu dụng trong việc băm nhỏ (shred) tất cả hoặc một số giá trị dữ liệu của một tài liệu XML được chỉ định vào các cột và các hàng nằm trong các bảng dữ liệu quan hệ. Hướng dẫn này chúng tôi sẽ giới thiệu cho các bạn về: Những ưu điểm và nhược điểm của việc băm nhỏ và các phương pháp băm nhỏ khác. Cách băm nhỏ dữ liệu XML thành các bảng quan hệ bằng lệnh INSERT có chứa hàm XMLTABLE. Cách sử dụng các chú thích XML Schema để bản đồ v à băm nhỏ các tài liệu XML thành các bảng quan hệ. Ưu điểm và nhược điểm của việc băm nhỏ Khái niệm của việc băm nhỏ được minh chứng trong hình 1. Trong ví dụ này, các tài liệu XML có các thông tin về customer name, address, và phone được bản đồ hóa thành hai bảng quan hệ. Các t ài liệu có thể chứa nhiều thành phần phone vì mối quan hệ giữa khách hàng và số điện thoại của họ l à mối quan hệ 1-n. Do đó, các số điện thoại sẽ được băm nhỏ vào một bảng riêng. Mỗi một thành phần lặp, chẳng hạn như phone, sẽ dẫn đến một bảng bổ sung trong giản đồ mục tiêu quan hệ. Giả dụ các thông tin khách hàng có thể chứa nhiều địa chỉ email, nhiều tài khoản, danh sách các đơn đặt hàng gần đây, nhiều sản phẩm trong mỗi đơn hàng và các m ục lặp lại khác. Khi đó số các bảng đ ược yêu cầu trong giản đồ mục tiêu quan hệ có thể tăng rất nhanh. Tuy nhiên việc băm nhỏ XML thành m ột số lớn các bảng có thể dẫn đến sự phức tạp của các đối t ượng logic doanh nghiệp và làm cho sự phát triển ứng dụng trở nên khó khăn hay rất dễ gây lỗi. Việc truy vấn dữ liệu đ ã được băm nhỏ hoặc việc lắp ráp lại
- (reassembling) các tài li ệu gốc có thể cần đến nhiều mối ghép (join) phức tạp. Hình 1: Việc băm nhỏ (shred) một tài liệu XML Phụ thuộc vào sự phức tạp và khả năng thay đổi, mục đích của các tài liệu XML, việc băm nhỏ (shred) có hoặc không thể là một tùy chọn bắt buộc. Bảng 1 tóm tắt các ưu điểm và nhược điểm của việc băm nhỏ (shred) dữ liệu XML thành các bảng quan hệ. Là lựa chọn thích hợp khi… Là lựa chọn không thích hợp khi… Dữ liệu XML được chỉ định đang Dữ liệu XML của bạn phức tạp, cung cấp cho một cơ sở dữ liệu xếp chồng và khó cho việc bản quan hệ đang tồn tại. đồ hóa thành một giản đồ quan hệ. Các tài liệu XML không thể hiện Việc bản đồ hóa định dạng được các đối t ượng logic doanh XML của bạn thành giản đồ nghiệp cần được duy trì. quan hệ dẫn đến một số l ượng lớn các bảng. Mục đích chính của bạn là cho XML Schema của bạn hay thay phép các ứng dụng quan hệ đang đổi tồn tại có thể truy cập vào dữ liệu XML Bạn ưng thuận với giản đồ quan Mục tiêu của bạn là quản lý các hệ của mình và thích sử dụng nó tài liệu XML như các đối tượng
- nếu có thể. doanh nghiệp nguyên vẹn. Cấu trúc của dữ liệu XML của Bạn thường cần xây dựng lại các bạn dễ dàng được bản đồ hóa tài liệu được băm nhỏ hoặc một thành các bảng dữ liệu quan hệ. phần trong chúng. Định dạng XML của bạn t ương Sử dụng dữ liệu XML trong một đối ổn định và ít thay đổi. cơ sở dữ liệu với tốc độ cao cho ứng dụng của bạn. Bạn ít khi cần xây dựng lại các tài liệu được băm nhỏ. Việc truy vấn hoặc nâng cấp dữ liệu với SQL quan trọng hơn chèn. Bảng 1. Khi việc băm nhỏ là hay không là m ột lựa chọn thích hợp Trong nhiều kịch bản ứng dụng XML, cấu trúc và cách sử dụng dữ liệu XML không thích ứng với việc băm nhỏ. Nguy ên nhân xảy ra điều này là do DB2 hỗ trợ các cột XML có thể cho phép bạn đánh chỉ số v à truy vấn dữ liệu m à không cần đến quá trình chuyển đổi. Đôi khi bạn sẽ thấy các yêu cầu ứng dụng của mình có thể đáp ứng tốt nhất với partial shredding hoặc hybrid XML storage. Ở đây: Partial shredding có nghĩa rằng chỉ một tập nhỏ các thành phần hoặc các thuộc tính từ mỗi một tài liệu XML đi vào được băm nhỏ thành các bảng quan hệ. Điều này khá hữu dụng nếu ứng dụng quan hệ không yêu cầu tất cả giá trị dữ liệu từ mỗi tài liệu XML. Trong các trường hợp, nơi việc băm nhỏ toàn bộ mỗi một tài liệu diễn ra khó khăn và yêu cầu một giản đồ quan hệ phức tạp, partial shre dding có thể đơn giản hóa việc bản đồ hóa sang giản đồ quan hệ một cách đáng kể. Hybrid XML storage có nghĩa trong lúc chèn một tài liệu XML vào một cột XML, thành phần được chọn hoặc các giá trị của thuộc tính đ ược trích rút và thành phần dự trữ được lưu trong các c ột quan hệ. Nếu bạn muốn băm nhỏ các tài liệu XML, toàn bộ hoặc một phần, DB2 cung cấp cho bạn một tập các tính năng phong phú để thực hiện một số hoặc tất cả
- những vấn đề dưới đây: Thực hiện các phép biến đổi giá trị dữ liệu tr ước khi chèn vào các cột quan hệ. Băm nhỏ cùng một giá trị thuộc tính hoặc thành phần vào nhiều cột của các bảng giống hay khác nhau. Băm nhỏ nhiều thành phần khác hay thuộc tính khác nhau vào cùng một cột trong một bảng. Chỉ định các điều kiện chi phối cho các thành phần nào đó được hay không được băm nhỏ. Cho ví dụ, băm nhỏ địa chỉ của một t ài liệu khách hàng chỉ khi country l à Canada. Hợp lệ hóa các tài liệu XML với một XML Schema trong suốt quá trình băm nhỏ. Lưu tài liệu XML đầy đủ c ùng với dữ liệu được băm. DB2 9 cho z/OS và DB2 9.x cho Linux, UNIX, và Windows h ỗ trợ hai phương pháp băm nhỏ: Các câu lệnh INSERT của SQL sử dụng hàm XMLTABLE. Hàm này sẽ điều hướng vào một tài liệu đầu vào và sinh ra m ột hoặc nhiều hàng quan hệ dùng để chèn vào bảng quan hệ. Phân tách với một XML Schema được chú thích. Do XML Schema định nghĩa cấu trúc của các tài liệu XML nên các chú thích có thể được bổ sung vào giản đồ để định nghĩa cách các thành phần và thuộc tính được bản đồ hóa thành các bảng quan hệ như thế nào. Bảng 2 và bảng 3 sẽ giới thiệu về những ưu điểm và nhược điểm của phương pháp XMLTABLE và phương pháp gi ản đồ được chú thích. Ưu điểm của phương pháp Nhược điểm của phương pháp XMLTABLE XMLTABLE Cho phép bạn băm nhỏ dữ liệu Mỗi một bảng mục tiê u mà bạn thậm chí không có XML Schema. muốn băm nhỏ vào, bạn phải cần đến một câu lệnh INSERT Không yêu cầu bạn hiểu ngôn ngữ Bạn có thể phải kết hợp nhiều XML Schema hoặc hiểu các chú câu lệnh INSERT trong một thích của giản đồi cho việc phân thủ tục được lưu. tách.
- Thường dễ sử dụng hơn các giản Không có hỗ trợ giao diện đồ có chú thích vì được dựa trên người dùng cho việc thực thi các câu lệnh INSERT và các SQL và Xpath. Bạn có thể sử dụng các hàm và hàm XMLTABLE cần thiết. các biểu thức quen thuộc của Bạn cần phải biết về XPath và XPath, XQuery, hoặc SQL để SQL/XML. trích rút và điều chỉnh các giá trị dữ liệu. Thường yêu cầu đến ít khối l ượng công việc trong quá trình phát triển XML Schema. Quá trình băm nhỏ có thể cần đến dữ liệu từ nhiều nguồn quan hệ và XML nếu cần, chẳng hạn như các giá trị từ các chuỗi DB2 hoặc dữ liệu tra cứu từ các bảng quan hệ khác. Có thể cung cấp hiệu suất tốt hơn phương pháp phân tách giản đồ chú thích. Bảng 2. Phương pháp XMLTABLE Ưu điểm của phương pháp Nhược điểm của phương pháp Việc bản đồ hóa từ XML vào các Không cho phép bạn băm bảng quan hệ có thể được định nghĩa nhỏ khi không có XML bằng một GUI trong IBM Data Studio Schema. Developer. Nếu bạn băm nhỏ dữ liệu XML phức Bạn có thể phải tự copy các tạp vào một số lượng lớn các bảng, chú thích khi bắt đầu sử cần ít nỗ lực trong việc viết m ã hơn dụng một phiên bản mới so với phương pháp XMLTABLE của XML Schema. Cung cấp số lượng lớn những thông Mặc dù có giao diện hỗ trợ tin chuẩn đoán chi tiết nếu một số t ài người dùng nhưng bạn vẫn liệu bị băm nhỏ thất bại. cần biết ngôn ngữ XML Schema. Việc chú thích một XML
- Schema có thể sẽ phức tạp nếu một giản đồ bản thân nó là phức tạp. Bảng 3: Phương pháp phân tách giản đồ chú thích
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Chuyển đổi XML thành dữ liệu quan hệ sử dụng trong DB2
14 p | 163 | 54
-
Dịch vụ Web dữ liệu của IBM Data Studio, Phần 3: Sử dụng máy chủ Web
20 p | 111 | 10
-
Thực hiện thiết kế đáp ứng bằng jQuery Mobile và CSS3
7 p | 114 | 9
-
Cách chuyển đổi XML thành dữ liệu quan hệ sử dụng trong DB2
25 p | 83 | 8
-
Chuyển đổi XML thành dữ liệu quan hệ.
20 p | 75 | 6
-
Cách chuyển đổi XML thành những dữ liệu quan hệ sử dụng trong DB2
15 p | 77 | 5
-
Giới thiệu MicroXML, Phần 1: Khám phá những nguyên tắc cơ bản của MicroXML
8 p | 68 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn