Nhập môn cơ sở dữ liệu

Đại cương về các hệ CSDL

Vũ Tuyết Trinh trinhvt@it-hut.edu.vn

Bộ môn Các hệ thống thông tin, Khoa Công nghệ thông tin Đại học Bách Khoa Hà Nội

Đặt vấn đề

(cid:123) CSDL là gì? (cid:123) Tại sao phải sử dụng CSDL? (cid:123) Tại sao phải tìm hiểu về các hệ CSDL?

2

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 1

Nhập môn cơ sở dữ liệu

Ví dụ: quản lý đào tạo

(cid:123) Thông tin cần quan tâm

(cid:122) Khoá học, lớp học, sinh viên, môn học, giáo viên, ... (cid:122) Thông tin về sinh viên: thông tin cá nhân, thông tin

học tập

(cid:122) Thông tin về môn học: khối lượng học tập, giáo viên,

lịch học

(cid:122) ...

(cid:190) Cần lưu trữ những thông tin đa dạng

(cid:190) Cơ sở dữ liệu

3

Ví dụ: khai thác thông tin

(cid:123) Sinh viên

(cid:122) Các môn học của khoa CNTT? (cid:122) Điểm thi môn « Nhập môn CSDL »?

(cid:123) Giáo viên

(cid:122) Danh sách sinh viên lớp Tin 1? (cid:122) Thời khoá biểu của lớp Tin 1?

(cid:123) Giáo vụ

(cid:122) Danh sách sinh viên khoá K47? (cid:122) Tỷ lệ sinh viên thi đạt của từng môn học?

(cid:190) Cần xây dựng một phần mềm cho phép khai thác một

CSDL

(cid:190) Phần mềm ứng dụng

4

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 2

Nhập môn cơ sở dữ liệu

«Hình dung» về xây dựng một CSDL

(cid:123) Yêu cầu:

(cid:122) Lưu trữ thông tin cần thiết một cách chính xác (cid:122) Truy xuất thông tin hiệu quả

(cid:123) Thực hiện

(cid:122) Xác định yêu cầu nghiệp vụ (cid:122) Xác định những thông tin cần lưu trữ (cid:122) Xác định cách thức lưu trữ

(cid:190) Cần công cụ trợ giúp xây dựng một CSDL

(cid:190) Phần mềm quản trị CSDL (QTCSDL)

5

Các khái niệm cơ bản

ứng dụng

hệ CSDL

CSDL

Hệ QTCSDL

6

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 3

Nhập môn cơ sở dữ liệu

Cơ sở dữ liệu

(cid:123) Một tập hợp các dữ liệu

(cid:122) Biểu diễn một vài khía cạnh của thế giới thực (cid:122) Có liên hệ logic thống nhất (cid:122) Được thiết kế và bao gồm những dữ liệu phục vụ một mục

đích nào đó

Ví dụ: CSDL về quản lý đào tạo gồm thông tin về

7

- giáo viên - sinh viên - môn học - lớp học - điểm thi - ...

Hệ quản trị cơ sở dữ liệu

(cid:123) Một phần mềm cho phép

(cid:122) Định nghĩa

xác định kiểu, cấu trúc, ràng buộc dữ liệu

(cid:122) Tạo lập

lưu trữ dữ liệu trên các thiết bị nhớ

(cid:122) Thao tác

truy vấn, cập nhật, kết xuất, ...

các CSDL cho các ứng dụng khác nhau

Ví dụ: MS. Access, MS. SQL Server, ORACLE,

IBM DB2, ...

8

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 4

Nhập môn cơ sở dữ liệu

Hệ cơ sở dữ liệu

(cid:123) Một hệ thống gồm 4 thành phần :

(cid:122) Hệ QTCSDL (cid:122) Phần cứng (cid:122) CSDL và phần mềm ứng dụng (cid:122) Những người sử dụng

Ví dụ: hệ quản lý đào tạo, quản lý nhân sự, ...

9

Môi trường hệ CSDL

Ứng dụng

Hệ CSDL

Hệ QTCSDL

CSDL

CSDL

10

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 5

Nhập môn cơ sở dữ liệu

Chức năng của hệ QTCSDL

(cid:123) Quản lý dữ liệu tồn tại lâu dài

(cid:122) Định nghĩa dữ liệu (cid:122) Quản lý lưu trữ

(cid:123) Truy xuất dữ liệu một cách hiệu quả

(cid:122) Biểu diễn các thao tác dữ liệu (cid:122) Xử lý câu hỏi (cid:122) Quản trị giao dịch

11

Các ngôn ngữ

(cid:123) Ngôn ngữ định nghĩa dữ liệu (Data Definition Language -

DLL) (cid:122) Cấu trúc dữ liệu (cid:122) Mối liên hệ giữa các dữ liệu và các quy tắc, ràng buộc áp

đặt lên dữ liệu

(cid:123) Ngôn ngữ thao tác dữ liệu (Data Manipulation Language -

DML) (cid:122) Tìm kiếm, thêm, xoá, sửa dữ liệu trong CSDL

(cid:123) Ngôn ngữ điều khiển dữ liệu (Data Control Language -

DCL) (cid:122) Thay đổi cấu trúc của các bảng dữ liệu (cid:122) Khai báo bảo mật thông tin (cid:122) Quyền hạn của người dùng trong khai thác CSDL

12

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 6

Nhập môn cơ sở dữ liệu

Sự trừu tượng hoá dữ liệu

...

Khung nhìn 1

Khung nhìn n

Mức khung nhìn (ngoài)

mô tả cách mà người sử dụng có thể nhìn thấy dữ liệu

Sơ đồ khái niệm (logic)

Mức quan niệm (logic)

định nghĩa cấu trúc logic của dữ liệu, dữ liệu nào được lưu trữ và mối quan hệ giữa các dữ liệu

Sơ đồ trong (vật lý)

định nghĩa cấu trúc các tệp và chỉ dẫn được sử dụng trong cơ sở dữ liệu (cách lưu trữ dữ liệu như thế nào)

Mức lưu trữ (trong)

13

Ví dụ

Tin1 = {

ma_lop=1 ten=« CNTT1_K47 » heDT=« chinh quy » dia_diem=« DHBKHN »

(cid:123) Mức quan niệm type lop = record ma_lop : string; ten: string; heDT: string; dia_diem: string;

}

end;

NVA = {

type sinh_vien = record

maSV : string; ten: string; nam: boolean; ngay_sinh: date; dia_chi: string ; ma_lop: string;

maSV=« SV001 » ten=« Nguyễn Văn A » nam=1; ngay_sinh=« 1/4/1983 » dia_chi=«1 Tạ Quang Bửu» ma_lop=1

end;

}

14

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 7

Nhập môn cơ sở dữ liệu

Ví dụ (2)

(cid:123) Mức khung nhìn

CN_NVA = {

type ds_sinhvien = record

ten: string; nam: boolean; ngay_sinh: date;

ten=« Nguyễn Văn A » nam=1; ngay_sinh=« 1/4/1983 » }

end;

15

Sơ đồ và thể hiện (schema vs. instance)

Sơ đồ

Thể hiện

-cấu trúc/kiểu dữ liệu

- giá trị/đối tượng dữ liệu

-ít thay đổi -thay đổi phức tạp

-thường xuyên thay đổi -dễ dàng thay đổi

16

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 8

Nhập môn cơ sở dữ liệu

Các module chính của hệ QTCSDL

Ứng dụng

Bộ xử lý câu hỏi

Bộ quản lý Giao dịch

Hệ QTCSDL

Bộ quản lý lưu trữ

DL

DL

17

Bộ xử lý câu hỏi

Bộ quản lý Giao dịch

Bộ quản lý lưu trữ

Quản lý lưu trữ

(cid:123) Yêu cầu

Bộ quản lý lưu trữ

lưu trữ và truy xuất dữ liệu trên các thiết bị nhớ (ngoài)

Quản lý buffer

(cid:123) Thực hiện

(cid:122) Tổ chức tối ưu dữ liệu

Quản lý giao dịch

Quản lý tệp

trên thiết bị nhớ (ngoài)

(cid:122) Tương tác hiệu quả với bộ quản lý tệp

Data & index

Metadata & Data dictionary

18

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 9

Bộ xử lý câu hỏi

Bộ quản lý Giao dịch

Bộ quản lý lưu trữ

Nhập môn cơ sở dữ liệu

Xử lý câu hỏi

Bộ xử lý câu hỏi

(cid:123) Yêu cầu:

Bộ biên dịch

Bộ tối ưu

Bộ đánh giá

Tìm kiếm dữ liệu trả lời cho một yêu cầu truy vấn (cid:123) Thực hiện

Bộ quản lý lưu trữ

(cid:122) Biến đổi truy vấn biểu diễn ở một mức cao thành các yêu cầu có thể hiểu được bởi hệ CSDL

(cid:122) Lựa chọn một kế

Data & index

hoạch tốt nhất để trả lời truy vấn này

Metadata & Data dictionary

19

Bộ xử lý câu hỏi

Bộ quản lý Giao dịch

Bộ quản lý lưu trữ

Quản lý giao dịch

(cid:123) Yêu cầu

(cid:122) Đ/n giao dịch: một tập các thao tác được xử

lý như một đơn vị không chia cắt được (cid:122) Đảm bảo tính nhất quán và tính đúng đắn

của dữ liệu

(cid:123) Thực hiện

(cid:122) Quản lý điều khiển tương tranh (cid:122) Phát hiện lỗi và phục hồi cơ sở dữ liệu

20

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 10

Ứng dụng

Hệ CSDL

Hệ QTCSDL

CSDL

CSDL

Nhập môn cơ sở dữ liệu

Người dùng

(cid:123) Người thiết kế và cài đặt hệ QTCSDL: chịu trách nhiệm thiết kế và cài đặt các module của hệ QTCSDL và các giao diện dưới hình thức các gói phần mềm

(cid:123) Người phát triển công cụ: chịu trách nhiệm thiết kế và cài đặt các gói phần mềm hỗ trợ cho việc thiét kê, sử dụng cũng như tăng cường hiệu năng của các hệ CSDL.

21

Ứng dụng

Hệ CSDL

Hệ QTCSDL

CSDL

CSDL

Người dùng

(cid:123) Người phân tích hệ thống và phát triển ứng dụng:

chịu trách nhiệm xác định yêu cầu của người dung cuối, xác định các giao dịch cần thiết để đáp ứng các yêu cầu người dùng. Người lập trình ứng dụng cài đặt những yêu cầi này trong chương trình, kiêm thử, gỡ rối, lập tài liệu cho chương trình

(cid:123) Người thiết kế CSDL: chịu trách nhiệm xác định dữ liệu

lưu trữ trong CSDL và cấu trúc biểu diễn và lưu trữ những dữ liệu này

22

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 11

Ứng dụng

Hệ CSDL

Hệ QTCSDL

CSDL

CSDL

Nhập môn cơ sở dữ liệu

Người dùng

(cid:123) Người sử dụng cuối: là người khai thác các hệ CSDL

(cid:123) Người quản trị CSDL: chịu trách nhiệm cho phép truy nhập CSDL, điều phối và kiểm tra sử dụng CSDL, quản lý tài nguyên phần cứng và phân mềm khi cần thiết

(cid:123) Người bảo trì hệ thống: là những người quản trị hệ thống chịu trách nhiệm việc hoạt động và bảo trì môi trường (phần cứng và phần mềm) cho hệ CSDL

23

Hệ thống xử lý tệp

Sinh viên

Giáo viên

Học tập

Sinh viên

Giáo viên

Môn học

Lớp học

Điểm thi

24

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 12

Nhập môn cơ sở dữ liệu

Hạn chế

(cid:123) Mức độ diễn tả ngữ nghĩa hạn chế (cid:123) Dữ liệu riêng lẻ, rời rạc (cid:123) Quản lý, khai thác ở mức thấp

25

Hệ cơ sở dữ liệu

Giáo viên

CSDL CSDL

hệ QTCSDL hệ QTCSDL

Học tập

Giáo viên Giáo viên Sinh viên Sinh viên Lớp học Lớp học Môn học Môn học Điểm thi Điểm thi

Sinh viên

26

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 13

Nhập môn cơ sở dữ liệu

Ưu điểm của cách tiếp cận CSDL

(cid:123) Tính trừu tượng hoá của dữ liệu (cid:123) Hỗ trợ nhiều khung nhìn dữ liệu (cid:123) Chia sẻ dữ liệu giữa nhiều người dùng và hỗ

trợ quản lý giao dịch

27

Đặc điểm của cách tiếp cận CSDL

(cid:123) Biểu diễn ngữ nghĩa phong phú và những quan hệ phức

tạp của các dữ liệu

(cid:123) Kiểm soát tính dư thừa và đảm bảo các ràng buộc toàn

vẹn dữ liệu

(cid:123) Hỗ trợ lưu trữ và truy vấn dữ liệu một cách hiệu quả

(cid:123) Chia sẻ dữ liệu giữa nhiều người dùng (cid:123) Phân quyền người dùng và kiểm soát tính hợp lệ của các

truy xuất dữ liệu

(cid:123) Hỗ trợ dịch vụ sao lưu và phục hồi dữ liệu

28

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 14

Nhập môn cơ sở dữ liệu

Phân loại hệ CSDL

(cid:123) Mô hình dữ liệu

(cid:122) Mạng vs. phân cấp vs. quan hệ vs. hướng đối tượng

vs. ...

(cid:123) Số người sử dụng

(cid:122) Một người dùng vs. nhiều người dùng

(cid:123) Tính phân tán của CSDL (cid:122) Tập trung vs. Phân tán

(cid:123) Tính thống nhất của dữ liệu

(cid:122) Đồng nhất vs. Không đồng nhất

(cid:123) ...

29

Kết luận

(cid:123) CSDL cho phép lưu trữ và khai thác dữ liệu một cách thống nhất và hiệu quả (đặc biệt trong trường hợp khối lượng dữ liệu lớn)

(cid:123) Sự trừu tượng về dữ liệu và tính độc lập dữ liệu

cho phép phát triển ứng dụng « dễ dàng »

(cid:123) Hệ QTCSDL cung cấp các công cụ hữu hiệu trợ giúp việc tạo lập CSDL và phát triển ứng dụng

‘‘More than 80 % of real world computer applications are associated with databases’’*

30

* Korth & Silberschatz. Database System Concepts.

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 15

Nhập môn cơ sở dữ liệu

Trọng tâm của môn học này

Ứng dụng

Hệ CSDL

Hệ QTCSDL

CSDL

CSDL

31

Sử dụng kiến thức của môn học này trong tương lai

(cid:123) Phát triển ứng dụng

(cid:123) Nghiên cứu và phát triển (R&D)

(cid:123) Nghiên cứu

32

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 16

Nhập môn cơ sở dữ liệu

Các điểm cần lưu ý

(cid:123) Cách tiếp cận tệp vs. cách tiếp cận CSDL

(cid:123) CSDL vs. hệ QTCSDL vs. hệ CSDL

(cid:123) Kiến trúc ANSI/SPARC (hay 3 mức) của hệ CSDL

(cid:123) Sơ đồ vs. thể hiện

(cid:123) Các chức năng chính của một hệ QTCSDL

(cid:123) Người sử dụng trong một hệ CSDL

(cid:123) Đặc điểm của hệ CSDL

33

34

Vũ Tuyết Trinh, b/m Các hệ thống thông tin, khoa CNTT, ĐHBKHN 17