intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Khoa học máy tính: Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán và ứng dụng

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:78

29
lượt xem
20
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bố cục của luận văn phần Mở đầu và Kết luận, nội dung có 3 chương: Chương 1. Tổng quan về cơ sở dữ liệu và cơ sở dữ liệu phân tán; Chương 2 - Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán; Chương 3 - Xây dựng hệ thống quản lý hóa đơn điện tử ngành điện cho CHDC ND Lào. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học máy tính: Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán và ứng dụng

  1. i ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG [ OUTSA PHOMPHIPHAK MỘT SỐ KỸ THUẬT XỬ LÝ TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái nguyên – 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  2. ii ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG [ OUTSA PHOMPHIPHAK [ MỘT SỐ KỸ THUẬT XỬ LÝ TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 Ngƣời hƣớng dẫn khoa học: PGS.TS PHẠM VIỆT BÌNH Thái nguyên – 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  3. iii ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG [ MỘT SỐ KỸ THUẬT XỬ LÝ TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học Học viên thực hiện PGS.TS PHẠM VIỆT BÌNH Outsa PHOMPHIPHAK Thái nguyên – 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  4. iv MỤC LỤC DANH MỤC CÁC HÌNH ẢNH TRONG LUẬN VĂN........................................... vi DANH SÁCH CÁC BẢNG TRONG LUẬN VĂN ................................................ vii BẢNG DANH MỤC CÁC CHỮ VIẾT TẮT ......................................................... viii MỞ ĐẦU .....................................................................................................................1 CHƢƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆUVÀ CƠ SỞ DỮ LIỆU PHÂN TÁN .............................................................................................................................4 1.1. Khái niệm cơ sở dữ liệu ...................................................................................4 1.2. Nguyên tắc của hệ thống xử lý phân tán ..........................................................5 1.2.1. Khái niệm xử lý phân tán ..........................................................................5 1.2.2. Hệ thống phân tán .....................................................................................5 1.3. Cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung ...........................................6 1.4. Kiến trúc Mô hình cơ sở dữ liệu phân tán ........................................................8 1.4.1. Điểm mạnh của cơ sở dữ liệu phân tán .....................................................9 1.4.2. Hệ quản trị cơ sở dữ liệu phân tán ..........................................................10 1.4.3. Các mức của cơ sở dữ liệu phân tán .......................................................13 1.5. Yêu cầu về quản trị cơ sở dữ liệu phân tán ....................................................17 1.5.1. Quản lý bảng danh mục trong cơ sở dữ liệu phân tán ............................18 1.5.2. Nội dung của bảng danh mục ..................................................................18 1.5.3. Phân tán bảng danh mục .........................................................................19 1.5.4. Quản trị và bảo vệ ...................................................................................21 1.5.5. Áp đặt luật phân quyền ...........................................................................22 1.5.6. Phân lớp ngƣời sử dụng: .........................................................................23 CHƢƠNG 2: MỘT SỐ KỸ THUẬT XỬ LÝ TRONGCƠ SỞ DỮ LIỆU PHÂN TÁN ...........................................................................................................................25 2.1. Kỹ thuật phân mảnh ngang ............................................................................25 2.1.1. Thuật toán phân mảnh ngang nguyên thủy .............................................27 2.1.2. Thuật toán xác định tập vị từ đầy đủ và cực tiểu ....................................29 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  5. v 2.1.3 Phân mảnh ngang dẫn xuất ......................................................................31 2.2. Kỹ thuật phân Mảnh dọc ................................................................................33 2.2.1. Thuật toán tụ nhóm .................................................................................34 2.2.2. Thuật toán phân mảnh .............................................................................38 2.3. Kỹ thuật phân mảnh hỗn hợp: ........................................................................42 2.4. Kỹ thuật trộn ..................................................................................................43 2.4.1. Thuật toán trộn tập trung .........................................................................43 2.4.2. Thuật toán trộn phân tán .........................................................................45 2.5. Đánh giá một số kỹ thuật xử lý trong CSDL phân tán ...................................46 2.5.1. Đánh giá kỹ thuật phân mảnh dữ liệu: ....................................................46 2.5.2. Đánh giá kỹ thuật trộn .............................................................................49 CHƢƠNG 3: XÂY DỰNG HỆ THỐNG QUẢN LÝ HÓA ĐƠN ĐIỆN TỬ NGÀNH ĐIỆN CHO CỘNG HÒA DÂN CHỦ NHÂN DÂN LÀO........................50 3.1. Phát biểu bài toán ...........................................................................................50 3.2 Các yếu tố tác động đến sự cần thiết xây dựng hệ thống ...............................51 3.3. Phân tích nghiệp vụ các yêu cầu hệ thống .....................................................52 3.3.1. Các yêu cầu phi chức năng......................................................................52 3.3.2 Phân tích các yêu cầu chức năng của hệ thống ........................................55 3.4. Thiết kế mô hình dữ liệu ................................................................................64 3.5. Xây dựng ứng dụng và đánh giá hiệu năng...................................................66 3.5.1. Lựa chọn các công nghệ ..........................................................................66 3.5.2. So sánh hiệu năng và phân tích kết quả đầu ra .......................................67 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................69 TÀI LIỆU THAM KHẢO .........................................................................................70 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  6. vi DANH MỤC CÁC HÌNH ẢNH TRONG LUẬN VĂN Hình 1.1: Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu thƣơng mại (Truy cập từ xa trực tiếp) .......................................................................11 Hình 1.2: Cách thức truy cập csdl của ứng dụng ......................................................12 Hình 1.3 Cách thức truy cập gián tiếp của chƣơng trình ứng dụng vào csdl ............13 Hình 1.4: Sơ đồ các mức của cơ sở dữ liệu phân tán ................................................14 Hình 2.1: Đồ thị kết nối.............................................................................................32 Hình 2.2 Định vị một điểm tách ................................................................................39 Hình 2.3: Phân đoạn hỗn hợp ....................................................................................42 Hình 2.4. Tính tái thiết đƣợc của phân mảnh hỗi hợp ..............................................43 Hình 2.5: Danh sách nhân viên công ty ....................................................................44 Hình 2.6 Kết quả trộn tập trung ................................................................................44 Hình 2.7: Danh sách nhân viên của công ty tại các chi nhánh..................................45 Hình 2.8: Gộp nhóm theo phƣơng pháp trộn phân tán .............................................46 Hình 3.1: Hóa đơn điện tử .........................................................................................50 Hình 3.2: Yêu cầu về siêu liên kết ............................................................................54 Hình 3.3: Sơ đồ thiết kế tổng thể ..............................................................................55 Hình 3.4: Cấu trúc XML của hóa đơn điện tử ..........................................................57 Hình 3.5: Biểu đồ Actor ............................................................................................58 Hình 3.6: Biểu đồ Use Case ......................................................................................59 Hình 3.7: Biểu đồ trình tự ca sử dụng download hóa đơn điện tử ............................60 Hình 3.8: Biểu đồ trình tự ca sử dụng xác thực hóa đơn ..........................................61 Hình 3.9: Biểu đồ hoạt động ca sử dụng kí số hóa đơn ............................................63 Hình 3.10: Mô hình logic phân tán ...........................................................................65 Hình 3.11: Mô hình thực thể dữ liệu .........................................................................65 Hình 3.12: Mô hình trƣờng dữ liệu bảng Hóa đơn ...................................................66 Hình 3.13: Bảng chỉ mục hóa đơn.............................................................................66 Hình 3.14: Indexer database proccess .......................................................................67 Hình 3.15: Biểu đồ so sánh hiệu năng ......................................................................68 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  7. vii DANH SÁCH CÁC BẢNG TRONG LUẬN VĂN Bảng 3.1: Danh sách các tác nhân .............................................................................57 Bảng 3.2: Danh sách các ca sử dụng .........................................................................59 Bảng 3.3 Mô tả biểu đồ hoạt động UC kí lên hóa đơn điện tử .................................62 Bảng 3.4:Mô tả biểu đồ hoạt động UC Import dữ liệu .............................................64 Bảng 3.5: Hiệu năng tìm kiếm bản ghi đƣợc đánhchỉ mục primary cluster (khóa chính) .........................................................................................................................67 Bảng 3.6: Tốc độ xuất báo cáo ..................................................................................68 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  8. viii BẢNG DANH MỤC CÁC CHỮ VIẾT TẮT Thuật ngữ Chi tiết Ý nghĩa CSDL Cơ sở dữ liệu DBMS Database management system Hệ quản trị cơ sở dữ liệu DB Data base Cơ sở dữ liệu UC Use case Ca sử dụng DC Data Communication Phần truyền thông dữ liệu DD Data Dictionary Từ điển dữ liệu DDB Distributed Database Phần cơ sở dữ liệu phân tán DN Doanh nghiệp HĐĐT Hóa đơn điện tử CNTT Công nghệ thông tin SSL Secure socket layer Giao thức mạng an toàn PKI Public key infrastructure Hạ tầng khóa công khai Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  9. 1 MỞ ĐẦU 1. Đặt vấn đề Ngày nay, xu thế công nghệ thông tin toàn cầu cũng nhƣ sự phát triển mạng internet, cả thể giới đã đƣợc kết nối không khoảng cách. Nhƣ một tất yếu, chính phủ và các doanh nghiệp cần có những hệ thống, ứng dụng và cơ sở dữ liệu khổng lồ, chứa hàng tỉ bản ghi để phục phụ các nhu cầu đặc thù. Các bài toán mang tầm vóc quốc gia hay các hệ thống hoạt động trong thời gian dài đều có số bản ghi lên đến hàng triệu, hàng tỉ. Khi hệ thống dữ liệu bùng nổ, các cơ chế lƣu trữ và quản lý dữ liệu tập trung đã bộc lộ nhiều điểm yếu, nhƣ khả năng tìm kiếm, cập nhật dữ liệu chậm, hệ thống hay xuất hiện lỗi tràn bộ nhớ, các lỗi về tƣơng tranh câu truy vấn khi vận hành hệ thống. Ngoài ra, sự quản lý dữ liệu tập trung rất dễ gặp rủi ro sau các sự cố và khả năng vận hành liên tục không hiệu quả. Để khác phục các điểm yếu của cơ chế dữ liệu tập trung, các chuyên gia đã đƣa ra mô hình dữ liệu phân tán. Theo đó, mỗi một đặc thù hệ thống cần cân nhắc đến khả năng phân tán, cách thức phân tán và cƣờng độ phân tán dữ liệu. Trong luận văn này, tôi tập trung nghiên cứu các kĩ thuật phân tán dữ liệu, tính hiệu quả của kĩ thuật đó và khả năng áp dụng bài toán đặc thù thực tế. Bài toán cụ thể ở trong luận văn là xây dựng hệ thống quản lý hóa đơn điện tử của CHDCND Lào, phân tích đặc thù hệ thống để đƣa ra kĩ thuật phân tán phù hợp, đánh giá mức độ hiệu quả của kĩ thuật phân tán áp dụng trong đó Do đó, “Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán và ứng dụng” đƣợc tôi chọn làm đề tài. 2. Đối tƣợng và phạm vi nghiên cứu - Đối tƣợng nghiên cứu:  Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán  Ứng dụng quản lý hóa đơn đặc thù ngành điện - Phạm vi nghiên cứu:  Nguyên tắc của hệ thống phân tán Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  10. 2  Kiến trúc mô hình cơ sở dữ liệu phân tán  Các kĩ thuật xử lý trong cơ sở dữ liệu phân tán  Nghiệp vụ quản lý tiền điện, nghiệp vụ của hóa đơn điện tử, nguyên tắc bảo mật trong trao đổi hóa đơn điện tử, mô hình áp dụng và kết quả thực nghiệm 3. Hƣớng nghiên cứu của đề tài - Xu thế của dữ liệu phân tán - Các nguyên tắc thiết kế cơ bản, kiến trúc mô hình dữ liệu phân tán - Các kĩ thuật áp dụng trong việc xử lý cơ sở dữ liệu phân tán - Tổng quát hóa lớp bài toán áp dụng, kiến trúc có thể áp dụng trên cơ sở dữ liệu phân tán - Đƣa ra những đề xuất, thiết kế ứng dụng, phân tích ƣu nhƣợc điểm, so sánh với hệ thống không áp dụng kiến trúc cơ sở dữ liệu phân tán 4. Bố cục của luận văn - Mở đầu - Chƣơng 1. Tổng quan về cơ sở dữ liệu và cơ sở dữ liệu phân tán - Chƣơng 2. Một số kĩ thuật xử lý trong cơ sở dữ liệu phân tán - Chƣơng 3. Xây dựng hệ thống quản lý hóa đơn điện tử ngành điện cho CHDC ND Lào - Kết luận 5. Phƣơng pháp nghiên cứu - Nghiên cứu lý thuyết: Tìm hiểu lý thuyết về cơ sở dữ liệu phân tán trên các sách, bài báo, luân văn và các diễn đàn - Thực nghiệm: Nghiên cứu bài toán hóa đơn điện tử, áp dụng kĩ thuật xử lí đã nghiên cứu trong lí thuyết vào bàn toán cụ thể 6. Ý nghĩa khoa học của đề tài - Ý nghĩa khoa học  Tổng hợp, phân tích ƣu nhƣợc điểm các kĩ thuật xử lý trong cơ sở dữ liệu phân tán Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  11. 3  Phân tích, đánh giá hiệu năng với việc không áp dụng kĩ thuật phân tán trong các bài toán lớn - Ý nghĩa thực tiễn Xây dựng đƣợc ứng dụng quản lý hóa đơn điện tử nghành điện, thực nghiệm với lƣợng dữ liệu khổng lồ. Qua đó kết luận tính khả dụng của một hình dữ liệu phân tán đối với bài toán quốc gia này. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  12. 4 CHƢƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆUVÀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.Khái niệm cơ sở dữ liệu Cơ sở dữ liệu (Database) là tập hợp dữ liệu đƣợc lƣu trữ một cách có tổ chức để phục vụ cho công việc sử dụng thuận tiện nhất. Dữ liệu là số liệu, hình ảnh... cần đƣợc lƣu trữ dƣới dạng file, record...tiện lợi cho ngƣời dùng đối với việc tham khảo, xử lý... Mỗi cơ sở dữ liệu cần có chƣơng trình quản lý, xắp xếp, duy trì....dữ liệu gọi là hệ quản trị cơ sở dữ liệu (DBMS - Database Management System). Hệ quản trị cơ sở dữ liệu đƣợc coi là bộ diễn dịch ngôn ngữ bậc cao để dịch các công việc ngƣời sử dụng thao tác trên dữ liệu mà ngƣời dùng không cần quan tâm đến thuật toán. Về mặt kiến trúc, cơ sở dữ liệu đƣợc phân chia thành các mức khác nhau. Một cơ sở dữ liệu cơ bản có ba phần chính là mức vật lý, mức khái niệm và mức thể hiện. Tuy nhiên với cơ sở dữ liệu cấp cao thì có thể có nhiều mức phân hoá hơn. Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ liệu đƣợc tổ chức dƣới nhiều cấp khác nhau nhƣ bản ghi, file... Mức khái niệm: là sự biểu diễn trừu tƣợng của cơ sở dữ liệu vật lý và có thể nói mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu ở mức khái niệm. Mức thể hiện: khi cơ sở dữ liệu đƣợc thiết kế, những gì thể hiện (giao diện, chƣơng trình quản lý, bảng...) gần gũi với ngƣời sử dụng với cơ sở dữ liệu ở mức khái niệm gọi là khung nhìn. Nhƣ vậy sự khác nhau giữa khung nhìn và mức khái niệm không lớn. Mô hình phổ biến nhất của cơ sở dữ liệu là mô hình quan hệ: trong mô hinh quan hệ xét tập con của tích Decard của các miền D (Domain) với miền là một tập các giá trị. Gọi D1, D2, D3,...Dn là n miền. Tích Decard của các miền D1 D2 D3 ... Dn là tập tất cả n bộ (v1,v2,v3...,vn) sao cho vi Di với i=1,..,n. Mỗi hàng của quan hệ là một bộ (tuples). Quan hệ là tập con của tích Decard D1 D2 D3 ... Dn gọi là quan hệ n ngôi. Khi đó mỗi bộ có n thành phần ( n cột ), mỗi cột của quan hệ gọi là thuộc tính. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  13. 5 1.2. Nguyên tắc của hệ thống xử lý phân tán 1.2.1. Khái niệm xử lý phân tán Xử lý phân tán là phƣơng pháp thiết kế các hệ thống phân tán có các tính chất: chịu lỗi, xuyên dụng, mở rộng đƣợc, mở. Phƣơng pháp này là kết quả tự nhiên của việc dùng máy tính để lập nên các hệ thống phân tán. Có hai khái niệm xử lý phân tán liên quan với nhau. − Khái niệm liên quan đến việc tính toán trên Client/Server. Trong đó ứng dụng đƣợc chia ra thành hai phần, phần của Server và phần của Client và đƣợc vận hành ở hai nơi. Trong tính toán phân tán này cho phép truy nhập trực tiếp dữ liệu và xử lý dữ liệu trên Server và Client. − Khái niệm thứ hai là việc thực hiện các tác vụ xử lý phức tạp trên nhiều hệ thống. Không gian nhớ và bộ xử lý của nhiều máy cùng hoạt động chia nhau tác vụ xử lý. Máy trung tâm sẽ giám sát và quản lý các tiến trình này. Có trƣờng hợp thông qua Internet, hàng nghìn máy cùng xử lý một tác vụ. Có thể định nghĩa hệ xử lý phân tán nhƣ sau: Hệ xử lý phân tán là một tập hợp các phần tử xử lý tự trị (không nhất thiêt đồng nhất) đƣợc kết nối với nhau bởi một mạng máy tính và cùng phối hợp thực hiện những công việc gán cho chúng. Phần tử xử lý ở đây để chỉ một thiết bị tính toán có khả năng thực hiện chƣơng trình trên nó. 1.2.2. Hệ thống phân tán Hệ thống phân tán là tập hợp các máy tính độc lập kết nối với nhau thành một mạng máy tính đƣợc cài đặt các hệ cơ sở dữ liệu và các phần mềm hệ thống phân tán tạo khả năng cho nhiều ngƣời sử dụng truy nhập chia sẻ nguồn thông tin chung. Các máy tính trong hệ thống phân tán có kết nối phần cứng lỏng lẻo, có nghĩa là không chia sẻ bộ nhớ, chỉ có một hệ điều hành trong toàn bộ hệ thống phân tán. Các mạng máy tính đƣợc xây dựng dựa trên kỹ thuật Web, ví dụ nhƣ mạng Internet, mạng Intranet… là các mạng phân tán. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  14. 6 1.3. Cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung Cơ sở dữ liệu tập trung cùng với cơ sở dữ liệu không qua thiết kế hình thành trƣớc khi có cơ sở dữ liệu phân tán. Hai hình thức này phát triển trên cơ sở tự phát và hệ thống tập trung. Nhƣ vậy hai hình thức này không đáp ứng đƣợc yêu cầu tổ chức và công việc trên phạm vi lớn. Cơ sở dữ liệu phân tán đƣợc thiết kế khác cơ sở dữ liệu tập trung. Do đó cần đối sánh các đặc trƣng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy đƣợc lợi ích của cơ sở dữ liệu phân tán. Đặc trƣng mô tả cơ sở dữ liệu tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dƣ thừa, cơ cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiển tƣơng tranh, biệt lập và an toàn dữ liệu. Điều khiển tập trung: Điều khiển tập trung các nguồn thông tin của công việc hay tổ chức. Có ngƣời quản trị đảm bảo an toàn dữ liệu. Trong cơ sở dữ liệu phân tán: không đề cập đến vấn đề điều khiển tập trung. Ngƣời quản trị cơ sở dữ liệu chung phân quyền cho ngƣời quản trị cơ sở dữ liệu địa phƣơng. Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc cơ sở dữ liệu để tổ chức dữ liệu chuyển cho chƣơng trình ứng dụng. Tiện lợi chính của độc lập dữ liệu là các chƣơng trình ứng dụng không bị ảnh hƣởng khi thay đổi cấu trúc vật lý của dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng cũng nhƣ trong cơ sở dữ liệu truyền thống. Khái niệm cơ sở dữ liệu trong suốt mô tả hoạt động chƣơng trình trên cơ sở dữ liệu phân tán đƣợc viết nhƣ làm việc trên cơ sở dữ liệu tập trung. Hay nói cách khác tính đúng đắn của chƣơng trình không bị ảnh hƣởng bởi việc di chuyển dữ liệu từ nơi này sang nơi khác trong mạng máy tính. Tuy nhiên tốc độ làm việc bị ảnh hƣởng do có thời gian di chuyển dữ liệu. Giảm dư thừa dữ liệu: Trong cơ sở dữ liệu tập trung, tính dƣ thừa hạn chế đƣợc càng nhiều càng tốt vì: -Dữ liệu không đồng nhất khi có vài bản sao của cùng cơ sở dữ liệu logic; để tránh đƣợc nhƣợc điểm này giải pháp là chỉ có một bản sao duy nhất. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  15. 7 -Giảm không gian lƣu trữ. Giảm dƣ thừa có nghĩa là cho phép nhiều ứng dụng cùng truy cập đến một cơ sở dữ liệu mà không cần đến nhiều bản sao ở những nơi chƣơng trình ứng dụng cần . Trong cơ sở dữ liệu truyền thống tính dƣ thừa dữ liệu cũng cần quan tâm vì: -Tính cục bộ của chƣơng trình ứng dụng sẽ tăng nếu dữ liệu đặt ở mọi nơi mà chƣơng trình ứng dụng cần. -Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong hệ thống thì không cản trở hoạt động của chƣơng trình ứng dụng. Nói chung, nguyên nhân đối lập với tính dƣ thừa đƣa ra trong môi trƣờng truyền thống vẫn còn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ tốt của tính dƣ thừa đòi hỏi định giá lại công việc lựa chọn mức độ dƣ thừa dữ liệu. Cơ sở dữ liệu phân tán khắc phục đƣợc hai nhƣợc điểm này vì dữ liệu đƣợc chia ra thành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu. Cấu trúc vật lý và khả năng truy cập: ngƣời sử dụng truy cập đến cơ sở dữ liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đƣờng truyền... Trong cơ sở dữ liệu phân tán, cấu trúc truy cập phức tạp không phải là công cụ chính để truy cập hiệu quả đến cơ sở dữ liệu. Hiệu quả có nghĩa là thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất. Mỗi cách thức truy cập cơ sở dữ liệu phân tán viết bởi ngƣời lập trình hoặc tạo ra bởi một bộ tối ƣu. Công việc viết ra một cách thức truy cập cơ sở dữ liệu phân tán cũng giống nhƣ viết chƣơng trình duyệt trong cơ sở dữ liệu tập trung. Công việc mà chƣơng trình duyệt này làm là xác định xem có thể truy cập đến đƣợc bao nhiêu cơ sở dữ liệu. Tính toàn vẹn, hồi phục và điều khiển tương tranh: Mặc dù trong cơ sở dữ liệu, tính toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn nhau. Mở rộng hơn vấn đề này là việc cung cấp các giao tác. Giao tác là Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  16. 8 đơn vị cơ bản của việc thực hiện: giao tác cụ thể là bó công việc đƣợc thực hiện toàn bộ hoặc không đƣợc thực hiện. Trong cơ sở dữ liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp. Nhƣ vậy giao tác tự trị là phƣơng tiện đạt đƣợc sự toàn vẹn trong cơ sở dữ liệu Có hai mối nguy hiểm của giao tác tự trị là lỗi và tƣơng tranh. Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, ngƣời quản trị hệ thống có quyền điều khiển tập trung, ngƣời sử dụng có chắc chắn đƣợc phân quyền mới truy cập vào đƣợc dữ liệu. Điểm quan trọng là trong cách tiếp cận cơ sở dữ liệu tập trung, không cần thủ tục điều khiển chuyên biệt. Trong cơ sở dữ liệu phân tán, những ngƣời quản trị địa phƣơng cũng phải giải quyết vấn đề tƣơng tự nhƣ ngƣời quản trị cơ sở dữ liệu truyền thống. Tuy nhiên, hai vấn đề đặc biệt sau đây của cơ sở dữ liệu phân tán có ý nghĩa quan trọng khi đề cập đến: -Thứ nhất trong cơ sở dữ liệu phân tán với cấp độ tự trị cao ở mỗi điểm, ngƣời có dữ liệu địa phƣơng sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu của mình thay vì phụ thuộc vào ngƣời quản trị hệ thống tập trung. -Thứ hai, vấn đề an toàn thực chất với hệ thống phân tán không giống nhƣ các hệ thống thông thƣờng khác mà còn liên quan đến mạng truyền thông. Nhƣ vậy trong cơ sở dữ liệu phân tán vấn đề an toàn cơ sở dữ liệu phức tạp hơn và đòi hỏi nhiều kỹ thuật bảo vệ. Nguyên nhân gây ra là hệ thống này có tính mở và nhiều ngƣời dùng trong cùng hệ thống sử dụng nhiều cơ sở dữ liệu. 1.4.Kiến trúc Mô hình cơ sở dữ liệu phân tán Vì yêu cầu của công ty, doanh nghiệp, đơn vị kinh doanh... về vấn đề tổ chức sao cho kinh doanh có hiệu quả nhất và nắm bắt thông tin nhanh nhất, khi các cơ sở của công ty hiện ở những địa điểm xa nhau cho nên xây dựng một hệ thống làm việc trên cơ sở dữ liệu phân tán là phù hợp xu hƣớng hiện nay vì hệ thống này thoả mãn đƣợc những yêu cầu tổ chức của đơn vị. Lợi điểm về tổ chức và kỹ thuật của xu hƣớng phát triển cơ sở dữ liệu phân tán là: giải quyết đƣợc những hạn chế của cơ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  17. 9 sở dữ liệu tập trung và phù hợp xu hƣớng phát triển tự nhiên với cơ cấu không tập trung của các tổ chức, công ty doanh nghiệp... Nói một cách đơn giản, cơ sở dữ liệu phân tán là tập hợp dữ liệu logic thuộc về cùng một hệ thống nhƣng trải rộng ra nhiều điểm trên mạng máy tính. Nhƣ vậy có hai vấn đề của cơ sở dữ liệu phân tán với tầm quan trọng tƣơng đƣơng nhau: Việc phân tán: Trong thực tế dữ liệu không đặt trên cùng một vị trí vì vậy đây là đặc điểm để phân biệt cơ sở dữ liệu phân tán với cơ sở dữ liệu tập trung và cơ sở dữ liệu đơn lẻ. Liên quan logic: Trong cơ sở dữ liệu phân tán, dữ liệu có một số đặc tính liên kết chặt chẽ với nhau nhƣ tính kết nối, tính liên quan logíc.. Trong cơ sở dữ liệu tập trung, mỗi vị trí quản lý một cơ sở dữ liệu và ngƣời sử dụng phải truy cập đến cơ sở dữ liệu ở những vị trí khác nhau để lấy thông tin tổng hợp. 1.4.1. Điểm mạnh của cơ sở dữ liệu phân tán Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân tán nhƣng tựu trung lại chỉ gồm những điểm sau đây: Lợi điểmvề tổ chức và tínhkinh tế: tổ chức phân tán nhiều chi nhánh và dùng cơ sở dữ liệu phân tán phù hợp với các tổ chức kiểu này. Với vai trò là động lực thúc đẩy kinh tế thƣơng mại phát triển rộng hơn, thì việc phát triển các trung tâm máy tính phân tán ở nhiều vị trí trở thành nhu cầu cần thiết. Tận dụng những cơ sở dữ liệu sẵn có: Hình thành cơ sở dữ liệu phân tán từ các cơ sở dữ liệu tập trung có sẵn ở các vị trí địa phƣơng. Thuận lợi cho nhu cầu phát triển: Xu hƣớng dùng cơ sở dữ liệu phân tán sẽ cung cấp khả năng phát triển thuận lợi hơn và giảm đƣợc xung đột về chức năng giữa các đơn vị đã tồn tại và giảm đƣợc xung đột giữa các chƣơng trình ứng dụng khi truy cập đến cơ sở dữ liệu. Với hƣớng tập trung hoá, nhu cầu phát triển trong tƣơng lai sẽ gặp khó khăn. Giảm chi phí truyền thông: Trong cơ sở dữ liệu phân tán chƣơng trình ứng dụng đặt ở địa phƣơng có thể giảm bớt đƣợc chi phí truyền thông khi thực hiện bằng cách khai thác cơ sở dữ liệu tại chỗ. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  18. 10 Tăng số công việc thực hiện: Hệ cơ sở dữ liệu phân tán có thể tăng số lƣợng công việc thực hiện qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm. Tuy nhiên cơ sở dữ liệu phân tán cũng có tiện lợi trong việc phân tán dữ liệu nhƣ tạo ra các chƣơng trình ứng dụng phụ thuộc vào tiêu chuẩn mở rộng vị trí làm cho các nơi xử lý có thể hỗ trợ lẫn nhau. Do đó tránh đƣợc hiện tƣợng tắc nghẽn cổ chai trong mạng truyền thông hoặc trong các dịch vụ thông thƣờng của toàn bộ hệ thống. Tính dễ hiểu và sẵn sàng: Hƣớng phát triển cơ sở dữ liệu phân tán cũng nhằm đạt đƣợc tính dễ hiểu và tính sẵn sàng cao hơn. Tuy nhiên để đạt đƣợc mục tiêu này không phải là dễ làm và đòi hỏi sử dụng kỹ thuật phức tạp. Khả năng xử lý tự trị của các điểm làm việc khác nhau không đảm bảo tính dễ sử dụng. Hai nguyên nhân về mặt kỹ thuật đáp ứng cho sự phát triển hệ cơ sở dữ liệu phân tán: -Công nghệ tạo ra máy tính nhỏ và nền tảng phần cứng có khả năng phục vụ xây dựng hệ thống thông tin phân tán. -Kỹ thuật thiết kế hệ cơ sở dữ liệu phân tán đƣợc phát triển vững chắc dựa trên hai kỹ thuật thiết kế chính là Top-down và Bottom-up từ những năm thập kỷ 60. Kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhƣng hệ cơ sở dữ liệu phân tán cũng cần thiết cho xu hƣớng phát triển kinh tế hiện nay. 1.4.2. Hệ quản trị cơ sở dữ liệu phân tán Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ nhƣ tạo lập và quản lý cơ sở dữ liệu phân tán. Phân tích đặc điểm của hệ thống quản trị cơ sở dữ liệu phân tán nhƣ dƣới đây để phân biệt hệ thống phát triển theo kiểu thƣơng mại có sẵn và kiểu mẫu phân tán. Hệ thống phát triển theo kiểu thương mại có sẵn đƣợc phát triển bởi những ngƣời cung cấp hệ cơ sở dữ liệu tập trung. Hệ cơ sở dữ liệu tập trung mở rộng bằng cách thêm vào những phần bổ xung qua cách cung cấp thêm đƣờng truyền và điều khiển giữa các hệ quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  19. 11 trên mạng máy tính. Những phần mềm cần thiết cho việc xây dựng cơ sở dữ liệu phân tán là: Phần quản lý cơ sở dữ liệu ( Database Management - DB ). Phần truyền thông dữ liệu (Data Communication - DC ). Từ điển dữ liệu đƣợc mở rộng để thể hiện thông tin về phân tán dữ liệu trong mạng máy tính (Data Dictionary - DD). Phần cơ sở dữ liệu phân tán (Distributed Database DDB). Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu thƣơng mại (Truy cập từ xa trực tiếp). DB DC Cơ sở dữ DDB liệu địa phƣơng 1 DD DD Cơ sở dữ DDB liệu địa phƣơng 2 DB DC Hình 1.1: Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu thương mại (Truy cập từ xa trực tiếp) Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp: -Cách thức truy cập dữ liệu từ xa: bằng chƣơng trình ứng dụng. -Lựa chọn một cấp độ trong suốt phân tán thích hợp: cho phép mở rộng hệ thống theo nhiều cách khác nhau theo từng hoàn cảnh (phải cân nhắc giữa cấp độ trong suốt phân tán và phân chia công việc thực hiện để công việc quản trị hệ thống đơn giản hơn). -Quản trị và điều khiển cơ sở dữ liệu bao gồm công cụ quản lý cơ sở dữ liệu, tập hợp thông tin về các thao tác trên cơ sở dữ liệu và cung cấp thông tin tổng thể về file dữ liệu đặt ở các nơi trong hệ thống. -Điều khiển tƣơng tranh và điều khiển hồi phục dữ liệu của giao tác phân tán. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
  20. 12 Phƣơng Truy thức cơ sởcập cập truy dữ liệu dữ liệu Chƣơng trình ứng Hệ quản trị cơ dụng sở dữ liệu 1 Hệ quản trị cơ Cơ sở dữ sở dữ liệu 2 liệu Hình 1.2: Cách thức truy cập csdl của ứng dụng Cách thức truy cập cơ sở dữ liệu từ xa qua chƣơng trình ứng dụng theo hai cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp. Ở mô hình trực tiếp, chƣơng trình ứng dụng đƣa ra yêu cầu truy cập đến cơ sở dữ liệu từ xa, yêu cầu này đƣợc hệ quản trị cơ sở dữ liệu tự động tìm nơi đặt dữ liệu và thực hiện yêu cầu tại điểm đó. Kết quả đƣợc trả lại cho chƣơng trình ứng dụng. Đơn vị chuyển đổi giữa hai hệ quả trị cơ sở dữ liệu là phƣơng thức truy cập cơ sở dữ liệu và kết quả nhận đƣợc (thông qua việc thực hiện phƣơng thức truy cập này). Với cách thức truy cập từ xa nhƣ vậy cấp độ trong suốt phân tán đƣợc xây dựng bằng cách tạo ra tên file toàn bộ để đánh địa chỉ thích hợp cho những điểm lƣu trữ dữ liệu ở xa. Mô hình dƣới đây mô tả cách thức truy cập phức tạp hơn (truy cập gián tiếp): Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2