Bài giảng Cơ sở dữ liệu phân tán nhằm giới thiệu tổng quan, kiến trúc khách/chủ (client/server), các khái niệm căn bản của DDB, quản trị giao tác phân tán, xử lý truy vấn phân tán, an tòan và bảo mật, khôi phục sau sự cố.
AMBIENT/
Chủ đề:
Nội dung Text: Bài giảng Cơ sở dữ liệu phân tán - TS. Hồ Bảo Quốc
- Cơ sở dữ liệu phân tán
TS. Hồ Bảo Quốc
Đại học khoa học tự nhiên TP.HCM
- Nội dung
n Giới thiệu tổng quan
n Kiến trúc khách/chủ (client/server)
n Các khái niệm căn bản của DDB
n Quản trị giao tác phân tán
n Xử lý truy vấn phân tán
n An tòan và bảo mật
n Khôi phục sau sự cố
- Tài liệu tham khảo
n Nguyên lý các hệ cơ sở dữ liệu phân tán
M. Tamer Özsu, Patrick Valduriez
Biên dịch: Trần Đức Quang
n Principles of Distributed Database Systems
M. Tamer ozsu, Patrick Valduriez
n Database systems (Design, implementation, and
management
Peter Rob, Carlos Coronel
n An introduction to Database systems
C. J. Date
- Giới thiệu tổng quan
- Lịch sử phát triển
n 1970 : Hệ thống quản lý dữ liệu tập trung
n 1980 : Nhu cầu phân tán
n Xã hội
n Doanh nghiệp phân tán
n Công nghệ
n Máy tính trở thành công cụ quen thuộc
n Thông tin trở thành hàng hóa (Data WareHouse, Data Mining)
n Hàng tỉ khách (clients) (cố định/di động) và hàng triệu chủ (server)
n Sự phát triển của bộ nhớ : càng lớn, càng nhanh, càng rẽ
n Sự phát triển của máy tính
n Sự phát triển của mạng
- Sự phát triển của các hệ DBMS
Mô Hiệu Câu truy Tính mở
hình suất vấn rộng
Mạng (70) Kém Tốt kém Không
Quan hệ (80) Tốt Kém ? Tốt Không
Đối tượng (90) Tốt Tốt Tốt Có
Đối tượng – Tốt Tốt Tốt có
Quan hệ (00)
- Sự phát triển của các ứng dụng
n Transactional : OLTP : On Line Transaction
Processing
n Database Server : OLCP : On line Complex
Processing
n Data WareHouse : OLAP (On Line Analytical
Processing)
- Tại sao cần các hệ phân tán
n Các đặc trưng chính
n Phântán dữ liệu trên các máy tính độc lập
n Truyền thông qua mạng (hữu tuyến/vô tuyến)
n Ưu điểm
n Tương tác
n Hợp tác và chia sẻ tài nguyên
n Ích lợi
n Giảm chi phí
n Tăng hiệu suất và tính đáp ứng
- Hệ CSDL phân tán là gì ?
n CSDL phân tán là một tập hợp nhiều CSDL có
liên hệ logic và được phân bổ trên một mạng máy
tính
n Cơ sở dữ liệu + mạng máy tính
n Nguyên lý căn bản : Đối với người dùng, một hệ
thống phân tán có vẽ giống như một hệ tập trung với
một server logic
- Các đặc trưng
1. Độc lập cục bộ
2. Không phụ thuộc vào một nút trung tâm
3. Tính đáp ứng cao
4. Độc lập vị trí vật lý
5. Độc lập phân mảnh (fragment)
6. Độc lập nhân bản (replica)
7. Xử lý câu truy vấn phân tán
8. Quản lý giao tác phân tán
9. Độc lập phần cứng
10. Độc lập hệ điều hành
11. Độc lập mạng
12. Độc lập hệ quản trị cơ sở dữ liệu
- Các vấn đề cần giải quyêt
n Điều khiển dữ liệu ngữ nghĩa
(Semantic Data Control)
n Quản lý giao tác phân tán
(Distributed Transaction Management)
n Xử lý câu truy vấn phân tán
(Distributed Query Process)
n Điều khiển truy xuất đồng thời
(Concurrence Control)
n Điều khiển khôi phục sau sự cố (Recovery)
- Kiến trúc Client/Server
- Kiến trúc khách/chủ (client/server)
n Định nghĩa :
Kiến trúc tính tóan trong đó các xử lý được phân bổ
trên máy chủ (server) và các máy khách/trạm (client)
một cách hợp lý nhằm khai thác tối đa khả năng của
hệ thống và tăng tính bảo mật của dữ liệu trên server
n Phân chia chức năng
n Chức năng cho « khách »
n Chức năng của « chủ »
n Mô hình hai lớp/nhiều lớp ( two level/ n-tier)
- Kiến trúc 2 lớp
Giao diện người Chương trình ứng
Hệ dùng dụng
điều
hành
DBMS ở máy khách
Phần mềm truyền thông
Quan hệ
Câu truy vấn SQL kết quả
Phần mềm truyền thông
Quản lý tự điển dữ liệu
Hệ
điều Tối ưu hóa câu truy vấn
hành
Quản lý giao tác
Quản lý khôi phục sau sự cố
- Phân lớp chương trình ứng dụng
n Chương trình liên quan đến giao diện (interface)
n Thể hiện và kiểm sóat Form màn hình
n Tạo báo cáo (report)
n Hội thọai người – máy
n Chương trình tính tóan chức năng
n Chương trình truy cập dữ liệu của CSDL
- Các giải pháp khách chủ
n Giải pháp 1
Tính tóan
SQL chức năng
Giao diện
Truy cập dữ liệu
KQ
Client Server
- Các giải pháp khách/chủ
n Giải pháp 2
SQL
Giao diện Truy cập dữ liệu
Tính tóan KQ
Server
client
- Các giải pháp khách chủ
n Giải pháp 3
SQL
Giao diện Tính tóan 2
Tính tóan 1 KQ Truy cập dữ liệu
Server
Client
- Các giải pháp phần mềm
n Microsoft
n Windows Server
n SQL – Server
n Visual Studio
n IBM
n OS2
n DB2
n Java
n Open Source
n Linux
n MySQL
n Java