intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Báo cáo khoa học: " ỨNG DỤNG KHUNG NHÌN THỰC ĐỂ NÂNG CAO TỐC ĐỘ THỰC THI TRUY VẤN"

Chia sẻ: Nguyễn Phương Hà Linh Nguyễn Phương Hà Linh | Ngày: | Loại File: PDF | Số trang:7

137
lượt xem
13
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Khung nhìn thực (materialized view, KNT) có thể cho phép thực thi các truy vấn phức tạp trên các cơ sở dữ liệu với dung lượng hàng terabytes trong vài giây hoặc phần nhỏ của giây, nhưng nó ít đư biết đến và ít được ứng dụng. Dù KNT có thể giúp nâng cao đáng k ợc ể năng suất của hệ thống, nhưng không phả i trong mọi trường hợp.

Chủ đề:
Lưu

Nội dung Text: Báo cáo khoa học: " ỨNG DỤNG KHUNG NHÌN THỰC ĐỂ NÂNG CAO TỐC ĐỘ THỰC THI TRUY VẤN"

  1. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 ỨNG DỤNG KHUNG NHÌN THỰC ĐỂ NÂNG CAO TỐC ĐỘ THỰC THI TRUY VẤN APPLICATION OF THE MATERIALIZED VIEWS TO IMPROVE THE QUERY EXECUTION SPEED Nguyễn Trần Quốc Vinh Trường Đại học Kinh tế, Đại học Đà Nẵng TÓM T ẮT Khung nhìn thực (materialized view, KNT) có thể cho phép thực thi các truy vấn phức tạp trên các cơ sở dữ liệu với dung lượng hàng terabytes trong vài giây hoặc phần nhỏ của giây, nhưng nó ít đư biết đến và ít được ứng dụng. Dù KNT có thể giúp nâng cao đáng k ợc ể năng suất của hệ thống, nhưng không phả i trong mọi trường hợp. Bài viết này giới thiệu về KNT và đề nghị giải pháp thực hiện một phần ý tưởng KNT trong các hệ quản trị cơ sở dữ liệu không hỗ trợ KNT, cũng như khắc phục nhược điểm không có khả năng thực hiện cập nhật gia tăng một số KNT trong một số hệ quản trị cơ sở dữ liệu có hỗ trợ KNT. ABSTRACT Materialized views can allow to execute the complex queries upon the large database in a few seconds or less, they are not well known and that application is not popular. Even though materialized views can help to significantly improve the performance of the systems, but not for all cases. This paper introduces the materialized views, and offers the useful solution to carry out a part of the idea of the materialized views in the database management systems not supporting the materialized views, and to overcome the weakness of the inability to increase undates on some systems supported by the materialized views. 1. Đặt vấn đề KNT không cho phép nâng cao năng sut trong tất cả các trường hợp, hiệu quả ấ ứng dụng chúng có thể giảm đi rõ rệt nếu thường xuyên xảy ra thay đổi dữ liệu trong các bảng gốc sử dụng để tạo KNT (hay KNT sử dụng). Nghĩa là, lợi ích sử dụng KNT thể hiện ở sự chênh lệch tổng chi phí duy trì KNT và tổng chi phí thực thi các truy vấn trên các bảng gốc ; hoặc là tổng chi phí duy trì cao hơn nhưng được dàn trải theo thời gian và không gâyảnh hưởng đến hoạt động của hệ thống, trong khi chi phí thực thi truy vấn giảm đi rõ rệt. Năng suất của hệ thống thông tin có thể bị giảm, thậm chí khả năng phản hồi các truy vấn bị mất đi nếu số lượng truy vấn sử dụng một tập hợp dữ liệu ít và trị số các truy vấn thấp, trong khi các phần tử của tập hợp dữ liệu đó được cập nhật với tần suất cao. Có ba phương pháp ập nhật KNT, đó là hoàn toàn (COMPLETE), gia tăng c (FAST hay còn g là INCREMENTAL) và ép buộc (FORCE) [1, 2]. Cập nhật hoàn ọi toàn thực tế là tạo lại KNT. Cập nhật gia tăng, chỉ sửa đổi nội dung KNT tương ứng với các thay đ trong các bảng gốc. Thông thường, cập nhật gia tăng đòi hỏi chi phí tài ổi 59
  2. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 nguyên rất nhỏ so với cập nhật hoàn toàn. Cập nhật ép buộc nghĩa là khi có khả năng thì thực hiện cập nhật gia tăng, còn nếu không thì sử dụng cập nhật hoàn toàn. Trong quá trình ứng dụng KNT trong các hệ quản trị cơ sở dữ liệu (HQT CSDL) hỗ trợ KNT như SQL Server và Oracle nảy sinh vấn đề HQT CSDL không thể thực hiện cập nhật gia tăng cho nhiều KNT được tạo ra trên cơ sở các truy vấn khác nhau, đặc biệt trong số đó nhiều t ruy vấn đòi hỏi nhiều tài nguyên. Khi đó, việc buộc phải cập nhật hoàn toàn làm cho vi c ứng dụng KNT trở nên không còn hiệu quả, thậm chí, KNT có ệ thể trở thành “gánh nặng” đối với hệ thống. Trong khi đó, trong nhiều trường hợp, kết quả thực thi các truy vấn đó có thể cần phải có trong chế độ thời gian thực. Ngoài ra, sử dụng KNT là một ý tưởng rất tốt để nâng cao năng suất hệ thống, nhưng chúng chưa được hỗ trợ trong tất cả các HQT CSDL nguồn mở và miễn phí như mySQL, PostgreSQL, FireBird,… kể cả thương mại như Interbase,… Bài viết đề nghị giải pháp ứng dụng một phần ý tưởng KNT trong các HQT CSDL đó, cũng như khắc phục nhược điểm không thể thực hiện cập nhật gia tăng trong nhiều trường hợp đối với các HQT CSDL có hỗ trợ KNT, bằng cách xây dựng các bẫy sự kiện (trigger) để thực hiện cập nhật gia tăng các bảng KNT. 2. KNT trong các HQT CSDL Ý tưởng ứng dụng KNT – kết quả thực thi được giữ lại của các truy vấn, xuất hiện từ những năm 80 của thế kỷ trước, nhưng KNT chỉ được triển khai thực tế cách đây không lâu trong các phiên b cuối cùng của một số HQT CSDL thương mại như ản Oracle, MS SQL Server, IBM DB2. KNT được tạo ra với ý tưởng ban đầu là một công cụ hỗ trợ cho các kho dữ liệu và các hệ thống hỗ trợ ra quyết định . Tuy nhiên, nó có thể được ứng dụng cho bất kỳ CSDL nào. Một ví dụ điển hình về tính hiệu quả của việc ứng dụng KNT. Một tập đoàn có nhiều đại diện tại nhiều vùng thuộc nhiều quốc gia cung cấp cho nhiều khách hàng khác nhau một số lượng lớn các sản phẩm. Như vậy, CSDL trung tâm của tập đoàn này có thể chứa hàng triệu hoặc hơn bản ghi về chi tiết bán hàng. Bây giờ, người ta cần thống kê số lượng sản phẩm được bán cũng như tổng doanh thu cho từng loại sản phẩm tại mỗi vùng theo quốc gia. Truy vấn được thực thi và kết quả được trả lại sau một khoảng một thời gian T 1 nào đó. Kết quả này được lưu lại trong một bảng – KNT bao gồm 200 bản ghi. Sau này, mỗi khi xuất hiện truy vấn đó, thay vì thực thi lại từ đầu bằng việc quét và xử lý hàng triệu bản ghi, HQT CSDL đọc bảng KNT chứa chỉ 200 bản ghi và trả lại kết quả trong khoảng thời gian T 2 (thường rất nhỏ so với T 1 ), thường là vài ms. Thậm chí, KNT có thể được dùng để trả lời các truy vấn tương tự nhưng cho trường hợp cả thế giới, hoặc một vài vùng nào đó, hoặc trường hợp chỉ cần tính hoặc doanh thu hoặc số lượng sản phẩm. Tính năng này được gọi là viết lại truy vấn (query rewrite) [1]. Trong các HQT CSDL thương mại, các truy vấn được so sánh và viết lại như thế nào là điều hầu như không được phổ biến. Bài viết [3] đưa ra một số kỹ thuật so sánh truy vấn để xác định sự tương đồng, cũng như sự bao phủ giữa các truy vấn với nhau. Các kỹ thuật đó có thể được sử dụng để triển khai kỹ thuật KNT. Có những thống kê rất hiếm khi được thực hiện, và chúng rất “nặng” trên khối lượng dữ liệu lớn, chúng có thể được thực hiện trong chế độ trì hoãn. Nhưng có những 60
  3. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 bộ phận kết quả thống kê luôn luôn cần thiết hoặc được yêu cầu trong chế độ thời gian thực. Các thống kê đó cần phải được thực hiện ngay tức khắc, và việc thực hiện chúng có thể kiềm h ãm công vi c của cả tổ chức, ví d ụ, quyết toán kế toán, thống kê tồn ệ kho,… KNT cho phép gi i quyết các vấn đề đó. Nó có thể giúp tăng tốc nhiều lần các ả truy vấn phức tạp trên các CSDL với số lượng bản ghi rất lớn, cho phép thực thi các truy vấn phức tạp trên các CSDL dung lượng hàng terab ytes trong vài giây ho phầnặc nhỏ của giây [1]. HQT CSDL thực hiện việc đó bằng cách sử dụng các thống kê hoặc các phép nối đã được tính trước của dữ liệu – kết quả thực thi các truy vấn, để trả lời các truy vấn một cách trong suốt đối với người dùng. Thông thường, các thống kê được tính trước đó có kích thước rất nhỏ so với nguồn dữ liệu gốc là các bảng, mà nếu không có KNT, truy vấn sẽ được thực thi trên các bảng đó. Nếu như dữ liệu cần để trả lời một truy vấn có trong KNT, thì chúng sẽ được truy xuất bằ ng cách quét các b KNT khi xuất hiện truy vấn. Khi đó các chi phí bao ảng gồm trong việc xét khả năng sử dụng KNT và quét các bảng KNT đó, và không bao gồm chi phí cho các thao tác đắt giá như quét các bảng gốc và các thao tác như nối (JOIN), thống kê (SUM, COUNT, AVG, MIN, MAX), nhóm (GROUP BY). Hình ẽ 1 cho thấy v nguyên tắc sử d ụ n các KNT: g Các bảng gốc được sử dụng để trả lời các truy vấn Z1, Z2, Z5,… trong khi kết quả thực thi các truy vấn Z3, Z6,… được lấy Hình 1. Nguyên tắc ứng dụng KNT từ các KNT. Sử dụng KNT vi phạm một số yêu cầu của lý thuyết thiết kế CSDL, chẳng hạn, vi phạm tính dư thừa và các bất thường, và nó đ h ỏi chi phí duy trì. Tuy nhiên, một òi khi các “tác hại” của nó là rất nhỏ so với “lợi ích” do nó mang lại, thì chúng ta có thể chấp nhận các “tác hại” đó. Các ưu điểm ứ ng dụng KNT bao hàm trong việc nâng cao năng suất hệ thống thông tin nhờ: - Rút ngắn thời gian thực thi các truy vấn; - Giảm số lượng các lần đọc/ghi vật lý, bởi vì khối lượng dữ liệu cần xử lý giảm; - Giảm tải bộ vi xử lý trung tâm và tài nguyên nói chung; - Giảm khối lượng thao tác nối, sắp xếp cũng như tính các hàm tổng hợp. Vấn đề sử dụng các KNT để trả lời các truy vấn [4, 5] nhận được sự quan tâm đáng kể dưới dạng ứng dụng chúng trong nhiều ứng dụng quản trị dữ liệu, chẳng hạn như trong liên k dữ liệu, tron g các kho d liệu, trong thiết kế web, trong tối ưu hoá ết ữ truy vấn và thậm chí, KNT được ứng dụng trong bài toán cập nhật các KNT. Khi ứng dụng KNT, HQT CSDL phải giải quyết bài toán được định dạng như sau: cho một truy vấn trên một lược đồ CSDL và tập hợp các KNT trên chính lược đồ CSDL đó, có thể sử dụng các KNT để trả lời truy vấn đó hay không. 61
  4. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 Truy vấn tính tổng doanh thu cho từng khách hàng theo từng vùng trên CSDL trong SQL Server 2005 sau đây ph nào minh hoạ sức mạnh của KNT ( gọi là indexed ần view trong SQL Server 2005) thông qua việc giảm rất mạnh thời gian thực thi truy vấn, trong khi thời gian thực hiện cập nhật bảng gốc tăng không đáng kể. Tạm gọi truy vấn này là Q_TongTheoVung: SELECT a.HoTen, b.KhachHangID, COUNT_BIG(*) as CNT, SUM(d.SoLuong * d.DonGia) AS TongTien FROM Sales.VungLanhTho a INNER JOIN Sales.KhachHang b ON a.LanhThoID = b. LanhThoID INNER JOIN Sales.BanHang c ON a. LanhThoID = c. LanhThoID AND b.KhachHangID = c.KhachHangID INNER JOIN Sales.ChiTietBanHang d ON c.BanHangID = d.BanHangID GROUP BY a.Name, b.KhachHangID. Các bảng VungLanhTho, KhachHang, BanHang và ChiTietBanHang được sử dụng trong truy vấn có số lượng bản ghi tương ứng là 10, 19.185, 31.465 và 121.217. Khi không sử dụng KNT, truy vấn này có thời gian thực thi trung bình 750 ms – một tốc độ ấn tượng trên một số lượng bản ghi tương đối lớn nhờ các chỉ mục liên cung đã được tạo ra cho một số cột của các bảng KhachHang, BanHang, ChiTietBanHang. Thời gian thực th i truy vấn n ày được đ o bằng cách dùng SET STATISTICS TIME ON ho ặc getdate (để đo chính xác đến ms hoặc với độ chính xác cao hơn như được nêu trong [6]) trên hệ thống với bo mạch chủ DQ965GF, CPU E6800, 2GB RAM và SATA2 RAID 5 với một người dùng. Kế hoạch thực thi do công cụ Query Analyzer cung cấp như sau: quét d – 27%, quét c – 14%, nối c d – 9%, quét b – 1%, nối (c d) b – 34%, tổng hợp – 14%, nối (kết quả tổng hợp) a – 0%, chọn kết quả – 0%. Tuy nhiên, sau khi tạo KNT V_TongTheoVung cho truy vấn trên, thời gian thực thi của nó đo đư ợc xấp xỉ 0 ms. Kế hoạch thực thi ước lượng của truy vấn Q_TongTheoVung trên sẽ là: quét V_ TongTheoVung – 100%, chọn kết quả – 0%. Vì lệnh CREATE UNIQUE CLUSTERED INDEX đã thực hoá khung nhìn, kết quả thực thi truy vấn trên đã có sẵn trong KNT và bao gồm chỉ 6 bản ghi, nên thời gian thực thi truy vấn trên xấp xỉ 0 ms là điều dễ hiểu. Thậm chí, bây giờ thời gian thực thi truy vấn tính tổng doanh thu toàn c cũng xấp xỉ 0 ms, bởi vì SQL Server 2005 cũng sử dụng một cách ầu linh hoạt KNT để trả lời. Phân tích kế hoạch thực thi việc cập nhật bảng ChiTietBanHang, chẳng hạn cập nhật số lượn g đã b á – SoLuong, cho ấy SQL Server 2005 cập nhật KNT n th V_TongTheoVung theo phương pháp cp nhật gia tăng trong quá trình cập nhật bảng ậ gốc. Thời gian cập nhật bảng ChiTietBanHang lúc này giao động từ 2 – 3ms, so với xấp xỉ 1ms khi chưa có KNT. Tuy nhiên, SQL Server không th thực hiện cập nhật gia tăng ể cho mọi KNT. Khi không thể thực hiện cập nhật gia tăng, HQT CSDL sẽ thực hiện cập nhật toàn phần. Chẳng hạn, Oracle 11g chỉ có thể cập nhật theo phương pháp cập nhật hoàn toàn KNT trên cơ sở truy vấn để tính tổng thành tiền cho từng khách hàng theo từng vùng (tạm gọi là Q_TongTheoKhachHang): SELECT a.QuocGia_Vung, b.KhachHang_ID, SUM(c.SoLuong*d.DonGia) AS Total FROM SH.QUOCGIA a INNER JOIN SH.KHACHHANG b ON a. QuocGia_ID = b.QuocGia_ID 62
  5. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 INNER JOIN SH.BANHANG c ON b.KhachHang_ID = c.KhachHang_ID INNER JOIN SH.BANGGIA d ON c.SanPham_ID = d.SanPham_ID AND c.ThoiGian_ID = d.ThoiGian_ID GROUP BY a.QuocGia_Vung, b.KhachHang_ID. Các bảng QUOCGIA, KHACHHANG, BANHANG và BANGGIA có số lượng bản ghi tương ứng là 23, 55.500, 918.843 và 82.112. Thời gian thực thi truy vấn là 5.42s (đo thời gian thực thi bằng lệnh SET TIMER ON). Thời gian cần thiết để cập nhật một bản ghi trong bảng BANHANG xấp xỉ 1ms. Khi KNT được tạo ra với thông số REFRESH ON COMMIT, Oracle thực hiện việc cập nhật KNT giống như một phần của giao tác thực thi cập nhật bảng gốc. Thời gian thực hiện lệnh sửa đổi dữ liệu trong các bảng gốc sẽ bằng thời gian cập nhật KNT, xấp xỉ 5.4s. Điều đó chứng tỏ KNT này được Oracle cập nhật theo phương p háp cập nhật hoàn toàn. Một khi KNT được cập nhật sau khi có ựs thay đổi dữ liệu trong các bảng gốc, thời gian thực thi truy vấn Q_TongTheoKhachHang xấp xỉ 0ms. Khi KNT đã được cập nhật , Oracle có th sử dụng nó để trả lời các truy vấn, ể chẳng hạn các truy vấn tương đương với truy vấn Q_TongTheoKhachHang nhưng có cách vi t khác ; hoặc truy vấn Q_TongTheoKhachHang có thêm đi kiện WHERE ế ều a.QuocGia_Vung = ‘Americas’; hoặc truy vấn tính tổng thành tiền theo từng vùng sẽ có thời gian thực thi xấp xỉ 0 ms. Đó là kết quả làm việc của chức năng viết lại truy vấn. 3. “KNT” trong các HQT CSDL không hỗ trợ KNT Nếu HQT CSDL không hỗ trợ KNT, chúng ta vẫn có thể áp dụng ý tưởng KNT để tăng tốc độ thực thi truy vấn bằng cách sử dụng các bẫy sự kiện (trigger). Chẳng hạn, cho trường hợp truy vấn Q_TongTheoKhachHang trên đây chúng ta có thể thực hiện theo sơ đồ ba bước sau đây. Bước 1. Tạo một bảng có các cột và kiểu dữ liệu tương ứng chứa kết quả thực thi truy vấn Q_TongTheoKhachHang, sau đó tạo các chỉ mục nếu cần: CREATE TABLE TMV_TongTheoKhachHang as Q_TongTheoKhachHang. Bước 2. Tạo các bẫy sự kiện thêm mới (ON INSERT), cập nhật (ON UPDATE) và xoá (ON DELETE) cho mỗi bản ghi cho mỗi bảng trong các bảng gốc liên quan QUOCGIA, KHACHHANG, BANHANG, BANGGIA. Các b sự kiện này s ẽ điều ẫy chỉnh giá trị các bản ghi trong bảng TMV_TongTheoKhachHang tương ứng với sự thay đổi dữ liệu trong các bảng gốc. Ví dụ, bẫy sự kiện thêm mới đơn giản cho bảng BANHANG có thể được xây dựng theo kịch bản sau đây. CREATE OR REPLACE TRIGGER TRG_BanHang_AI ON BANHANG AFTER INSERT FOR EACH ROW DECLARE Gia number(10, 2); BEGIN --Đọc giá trị DonGia từ BANGGIA tương ứng với SanPham_ID và ThoiGian_ID vừa --được thêm mới; Giả sử new.KhachHang_ID đã có trong bảng TMV_TongTheoKhachHang SELECT DonGia INTO Gia FROM SH.BANGGIA WHERE SanPham_ID = :new.SanPham_ID AND ThoiGian_ID = :new.ThoiGian_ID; --Cập nhật bản ghi trong bảng TMV_TongTheoKhachHang có KhachHang_ID tương ứng UPDATE TMV_TongTheoKhachHang SET Total = Total + :new.SoLuong * :Gia WHERE KhachHang_ID = :new.KhachHang_ID; END; Các bẫy sự kiện này sẽ đảm bảo cho thông tin chứa trong bảng 63
  6. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 TMV_TongTheoKhachHang – kết quả thực thi truy vấn Q_TongTheoKhachHang luôn luôn tương ứng với các thay đổi dữ liệu trong các bảng gốc. Vì thời gian thực thi các bẫy sự kiện này là rất nhỏ, nên thời gian thực thi việc cập nhật dữ liệu trong các bảng gốc cũng rất nhỏ, và thường người dùng không nhận thấy sự khác biệt so với khi không có chúng. Trong trường hợp này, có thể nói “KNT” TMV_TongTheoKhachHang của chúng ta được cập nhật gia tăng trong chế độ ON COMMIT. Bước 3. Vì các HQT CSDL này thông th ờng không có chức năng viết lại truy ư vấn, rõ ràng, các cách viết khác nhau của một truy vấn sẽ được HQT CSDL hiểu là các truy vấn khác nhau. Lập trình viên phải thực hiện công việc viết lại truy vấn. Chỉ những truy vấn nào được viết lại hướng tới các bảng KNT một cách rõ ràng mới có thể sử dụng KNT. Trong các chương ứng dụng, thay vì sử dụng truy vấn ình tr Q_TongTheoKhachHang, chúng ta sử dụng truy vấn sau đây: SELECT QuocGia_Vung, KhachHang_ID, Total FROM TMV_TongTheoKhachHang. Và truy vấn tính tổng thành tiền theo từng vùng sẽ là: SELECT QuocGia_Vung, SUM(Total) AS SUM_Total FROM TMV_TongTheoKhachHang GROUP BY QuocGia_Vung. Cũng giống như trường hợp các truy vấn Q_TongTheoKhachHang được thực thi một khi KNT trên cơ sở truy vấn đó ã đư ợc cập nhật, các truy ấn trên bảng đ v TMV_TongTheoKhachHang sẽ được thực thi trong thời gian xấp xỉ 0ms. Tuy nhiên, trong trường hợp này thời gian thực thi cập nhật “KNT” nhỏ hơn nhiều, hầu như không đáng kể. Trên đây tác giả đã chỉ ra, các HQT CSDL Oracle và MS SQL Server không thể thực hiện cập nhật gia tăng đối với nhiều truy vấn, chẳng hạn trường hợp truy vấn Q_TongTheoKhachHang. KNT tương ứng được cập nhật hoàn toàn với thời gian cập nhật KNT xấp xỉ thời gian thực thi lại truy vấn. Cho dù truy vấn có phức tạp bao nhiêu và thực thi trên các bảng lớn bao nhiêu chăng nữa, với giải pháp sử dụng các bẫy sự kiện, lập trình viên có thể thực hiện cập nhật gia tăng cho bất kỳ “KNT” nào. Việc cập nhật gia tăng này chiếm không đáng kể tài nguyên của hệ thống. Cách thức này có thể được áp dụng để khắc phục hạn chế thời gian cập nhật cao tương đương thời gian thực thi truy vấn khi buộc phải thực thi cập nhật hoàn toàn trong các HQT CSDL Oracle 11g và MS SQL Server 2005. Tuy nhiên, khi đó tính năng vi lại truy vấn của chúng sẽ bị ết mất đi, vì HQT CSDL không biết rằng, một KNT cho truy vấn đã được tạo ra. Thêm một ví dụ minh hoạ. Tại một cơ sở đào tạo có gần 20.000 học viên thuộc hơn 40 ngành đào tạo thông qua các hệ đào tạo khác nhau tại 13 khoa đào tạo trình đ ộ đại học và hai trường cao đẳng trực thuộc. Học viên học theo nhiều diện khác nhau: Kinh phí nhà nước, tự túc, hợp đồng giữa sơ sở đào tạo và các tổ chức kinh tế xã hội. Học viên có thể đóng tiền theo nhiều đợt trong năm. Với HQT CSDL PostgreSql trên một máy chủ tương đối yếu, việc thực hiện thủ tục tính số học viên, tính tổng số tiền và phần trăm số tiền sinh viên đã đóng theo t ừng khoa, ngành và hệ đào tạo chiếm xấp xỉ 13 phút, thậm chí khi chỉ có một phiên bản của nó xuất hiện trong hệ thống. Thủ tục này thường làm ngưng trệ công việc của các ứng dụng khác. Sau khi ứng dụng kỹ thuật bẫy sự kiện viết bằng ngôn ngữ C++ để cập nhật bảng chứa kết quả thực thi thủ tục trên (từ đầu năm 2004), thay ìvph ải thực thi thủ tục, các ứng dụng được hướng đến bảng “KNT”, thời gian truy cập đến bảng được tính với đơn vị ms. Năng suất làm việc của hệ thống tăng vượt bậc, trong khi người dùng không nhận ra sự khác biệt khi cập nhật dữ liệu trong các bảng gốc liên quan. Một kịch bản thành công ngoài mong đợi tương tự cũng xẩy ra với thủ tục tính toán các thống kê liên quan đến thu nhập của hơn 3.000 công nhân viên làm việc tại cơ sở đào tạo đó. 64
  7. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(30).2009 4. Kết luận Thông qua nghiên cứu vấn đề, chúng ta nhận thấy: - Tuy KNT có th cho phép thực thi các truy vấn phức tạp trên các CSDL với ể dung lượng hàng terabytes trong vài giây hoặc phần nhỏ của giây, nhưng nó ít được biết đến và ít được ứng dụng. - KNT được hỗ trợ khá mạnh nhưng cũng chỉ giới hạn ở các HQT CSDL thương mại nổi tiếng như Oracle, MS SQL Server, IBM DB2. Việc cập nhật KNT trong Oracle và MS SQL Server còn nhi hạn chế, đặc biệt khả năng cập nhật gia ều tăng còn yếu dẫn đến tính kém hiệu quả của kỹ thuật này. - Bài viết đề nghị khả năng ứng dụng ý tưởng KNT trong các HQT CSDL chưa hỗ trợ KNT bằng cách sử dụng các bẫy sự kiện. Thậm chí, cách thức này có thể được áp dụng để khắc phục hạn chế của các HQT CSDL Oracle và MS SQL Server trong thời gian cập nhật cao tương đương thời gian thực thi truy vấn. Tuy nhiên, khi đó tính năng vi lại truy vấn của chúng sẽ bị mất đi , lập trình viên ết phải thực hiện chức năng viết lại truy vấn thay cho HQT CSDL. TÀI LIỆU THAM KHẢO [1] T. Kyte. Expert one-on-one Oracle. Apress, 2003. [2] T. Rizzo, A. Machanic, J. Skinner, L. Davidson, R. Dewson, J. Narkiewicz, J. Sack, R. Walters. Pro SQL Server 2005. Apress, 2006. [3] Quoc Vinh Nguyen Tran, A.B. Kungurtsev, Blashko A.A. Comparison of queries in relational databases to construct materialized views. Праці УНДІРТ. Одеса, 2004. – 3(39). – с. 35-38. [4] A.Y. Levy. Answering Queries Using Views: A Survey // www.cs.washington.edu/homes/alon/site/files/view-survey.ps. (17/01/2009). [5] A.Y. Levy, A.O. Mendelzon, Y. Sagiv. Answering Queries Using Views // www.cs.washington.edu/homes/alon/site/files/pods95-views.ps. (17/01/2009). [6] High precision time measuring in SQL Server 2005 with the help from CLR and unsafe code. http://weblogs.sqlteam.com/mladenp/archive/2006/11/29/ 35688.aspx. (11/12/2008). 65
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0