14/01/2019
Sở Tài nguyên Môi trường
Bài giảng
Cơ s d liu đt đai
Chương 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
Trường Đại học Tài nguyên và Môi trường TP.HCM
Mục tiêu bài học hôm nay
Giải thích khái niệm, thông tin, dữ liệu và cơ sở dữ liệu
(CSDL)
Các phương pháp tiếp cận quản lý dữ liệu và ưu
điểm, nhược điểm.
Kiến trúc của một cơ sở dữ liệu
Giải thích các mô hình dữ liệu khác nhau
Hệ quản trị CSDL (DBMS) và hệ quản trị CSDL quan hệ
(RDBMS)
Tổng quan về CSDL 2
Tổng quan về CSDL 3
I. DỮ LIỆU VÀ CSDL
1. Thông tin gì?
Thông tin (Information)
Kinh doanh
Ngân hàng và tài chính
Giáo dục
Hành chính
Giải trí
Dữ liệu (data)
Là các thông tin của đối tượng (ví dụ: người, vật, một khái niệm,
sự việc…) được lưu trữ trên thiết bị lưu trữ (máy tính hoặc giấy).
Có thể truy nhập vào dữ liệu để trích xuất ra các thông tin.
Dữ liệu được tả dưới nhiều dạng khác nhau (các tự,
số, hình ảnh, hiệu, âm thanh…). Mỗi cách tả như
vậy gắn với một ngữ nghĩa nào đó.
Tổng quan về CSDL 4
I. DỮ LIỆU VÀ CSDL
2. Dữ liệu là gì?
Dữ liệu về đối tượng có thể khác nhau, tùy thuộc vào ngữ
cảnh.
Ví dụ: dữ liệu về đối tượng sinh viên có thể khác nhau tùy
vào mục đích quản lý:
Quản lý điểm: Tên, mã sinh viên, điểm môn 1, điểm môn 2, điểm
môn 3
Quản lý nhân thân: Tên, địa chỉ, ngày sinh, quê quán, lớp
Tổng quan về CSDL 5
I. DỮ LIỆU VÀ CSDL
1. Dữ liệu là gì?
CSDL (Database) = Tập hợp dữ liệu được tổ chức có cấu
trúc chặt chẽ liên quan với nhau nhm phc v(chia s)
cho nhiu mc tiêu khác nhau mt cách có chn lc.
CSDL được thiết kế, xây dựng được lưu trữ trong máy
tính cho phép người dùng lưu trữ dữ liệu, truy xuất
thông tin hoặc cập nhật dữ liệu
sdữ liệu
Lưu trữ thông tin
Người dùng
Cho phép truy nhập
thông tin
Tổng quan về CSDL 6
I. DỮ LIỆU VÀ CSDL
3. Cơ sở dữ liệu
1 2
3 4
5 6
14/01/2019
CSDL được tổ chức có cấu trúc:
Các dữ liệu lưu trữ có cấu trúc thành các bản ghi (
record)
, các
trường dữ liệu (field).
Các dữ liệu lưu trữ có mối quan hệ (relational) với nhau.
Khả năng truy xuất thông tin t CSDL:
CSDL được cấu trúc để dễ dàng truy cập, quản lý và cập nhật dữ
liệu
Tổng quan về CSDL 7
I. DỮ LIỆU VÀ CSDL
3. Cơ sở dữ liệu
Ví dụ một CSDL:
Kho dữ liệu về từng cuốn sách gồm:
Dữ liệu là các
cuốn sách
CSDL lưu
-
Tên sách
- Tên tác giả
- Nhà xuất bản
- Năm xuất bản
- Giá sách...
trữ thông
tin các cuốn
sách
Truy cập CSDL để tìm
các cuốn sách theo tên
tác giả, theo nhà xuất
bản…
Tổng quan về CSDL 8
I. DỮ LIỆU VÀ CSDL
3. Cơ sở dữ liệu
Quản lý dữ liệu: là quản lý một số lượng lớn dữ liệu, bao
gồm cả việc lưu trữ và cung cấp cơ chế cho phép Thao
tác (thêm, sửa, xóa dữ liệu) và Truy vấn dữ liệu.
Tổng quan về CSDL
9
I. DỮ LIỆU VÀ CSDL
5. Quản lý dữ liệu
Phòng Kinh
doanh
Phòng Kinh
doanh
Phòng
Kế toán
Phòng
nhân sự
Thông
tin NV
2 phương pháp quản dữ liệu:
Hệ thống quản bằng file
Hệ thống quản bằng CSDL
10
Chương trình ứng dụng 1
Chương trình ứng dụng 2
Chương trình ứng dụng 3
Tập
tin
Tập
tin
Tập
tin
Hệ
Thống
Quản
Tập
Tin
Dữ liệu
I. DỮ LIỆU VÀ CSDL
5. Quản lý dữ liệu
Tổng quan về CSDL 10
Mỗi ứng dụng có 1 hệ thống tập tin riêng
Quản lý dữ liệu bằng tập tin
11
QUẢN LÝ NHÂN SỰ
QUẢN LÝ TIỀN LƯƠNG
QUẢN LÝ DỰ ÁN
I. DỮ LIỆU VÀ CSDL
5. Quản lý dữ liệu
Tổng quan về CSDL 11
Ví dụ:
Quản lý dữ liệu bằng tập tin
..)
NHÂN VIÊN (TênNV,
năm sinh, trình độ, hệ
số lương...)
ƠNG (TênNV, hệ số
lương, lương…
gian thực hiện…
DỰ ÁN (Tên Dự án,
đơn vị thực hiện, Tên
NV thực hiện, thời
gian thực hiện…
Ưu và nhược điểm của việc quản lý dữ liệu
theo dạng tập tin?
Tổng quan về CSDL 12
7 8
9 10
11 12
14/01/2019
Tổng quan về CSDL 13
I. DỮ LIỆU VÀ CSDL
Dữ liệu tách biệt và không chia sẻ
Mỗi ứng dụng có 1 hệ thống tập tin riêng
Việc chia sẻ dữ liệu giữa các ứng dụng vô cùng khó
khăn do khác nhau về cấu trúc.
Dữ liệu bị trùng lặp
Tốn không gian lưu trữ
Có thể dẫn tới tình trạng không nhất quán dữ liệu
khi cập nhật trên các hệ thống khác nhau
Tính bảo mật thấp
5. Quản lý dữ liệu
Quản lý dữ liệu bằng tập tin
Tổng quan về CSDL 14
I. DỮ LIỆU VÀ CSDL
Phụ thuộc dữ liệu
Thuật toán xử lý phụ thuộc vào cấu trúc tập tin (đã
được định nghĩa) Khi thay đổi cấu trúc dữ liệu, khi
nâng cấp dữ liệu thì phải thay đổi chương trình theo
đó
Định dạng không tương thích
Các tập tin được định nghĩa theo ngôn ngữ lập trình
nào đó khó chia sẻ
Câu truy vấn bị cố định trước
Là hệ quả của việc phụ thuộc dữ liệu.
Mỗi chương trình truy xuất được phát triển cố định
cho một cấu trúc dữ liệu bên dưới.
5. Quản lý dữ liệu
Quản lý dữ liệu bằng tập tin
15
Hệ
Quản
Trị
CSDL
Chương trình ứng dụng 1
Chương trình ứng dụng 2
Chương trình ứng dụng 3
CSDL
I. DỮ LIỆU VÀ CSDL Quản lý dữ liệu bằng CSDL
Tổng quan về CSDL 15
Quản lý dữ liệu bằng CSDL giúp dữ liệu được lưu trữ một cách hiệu quả
và có tổ chức, cho phép quản lý dữ liệu nhanh chóng và hiệu quả
Dữ liệu độc lập với chương trình
Dữ liệu được quản lý tập trung
Dữ liệu được chia sẻ cho nhiều ứng dụng
Dữ liệu được đảm bảo an toàn
Dữ liệu ít dư thừa
Quan điểm cũ (theo Files)
Personal
data
Project
Project
data
Tax
data
Personal
data
Payroll
system
Project
Management System
Ví dụ về dư thừa dữ liệu
Đánh giá hai hình thức quản lý dữ liệu:
I. DỮ LIỆU VÀ CSDL Quản lý dữ liệu bằng CSDL
Tiếp cận mới (theo CSDL)
Tax
data
Personal
data
Payroll
system
Project
Management System
Project
Project
data
Ví dụ về quản lý dữ liệu bằng CSDL
I. DỮ LIỆU VÀ CSDL Quản lý dữ liệu bằng CSDL
Lợi ích của hệ thống quản lý bằng CSDL?
CSDL
Tổng quan về CSDL 18
I. DỮ LIỆU VÀ CSDL 5. Quản lý dữ liệu bằng CSDL
Tránh thừa, trùng lắp dữ liệu
Đảm bảo sự nhất quán trong CSDL
Các dữ liệu lưu trữ thể được chia sẻ
thể thiết lập c chuẩn trên dữ liệu
Duy trì tính toàn vẹn dữ liệu
Đảm bảo bảo mật dữ liệu
13 14
15 16
17 18
14/01/2019
Tổng quan về CSDL 19
I. DỮ LIỆU VÀ CSDL 5. Quản lý dữ liệu bằng CSDL
Tính chủ quyền của dữ liệu:
Do tính chia sẻ của CSDL cho nhiều người dùng nên tính
chủ quyền của dữ liệu thể bị lu mờ (có nghĩa người
dùng thể xem, sửa xóa). Điều này, CSDL cần phải
chế phân quyền, ai được làm mọi thao tác trên csdl
phải được ghi log.
Tính bảo mật quyền khai thác thông tin của người s
dụng.
Do nhiều người được phép khai thác CSDL một ch đồng thời
nên cần phải một chế bảo mật phân quyền hạn khai thác
CSDL.
Tuy nhiên, để đạt được các ưu điểm trên, CSDL đặt ra những vấn đ
cần phải giải quyết. Đó là:
Tổng quan về CSDL 20
I. DỮ LIỆU VÀ CSDL 5. Quản lý dữ liệu bằng CSDL
Tranh chấp dữ liệu:
Nhiều người được phép truy nhập o cùng một tài nguyên dữ
liệu (Data Source) của CSDL với những mục đích khác nhau (Vi
dụ: rút tiền t ngân hàng). Cần phải một chế ưu tiên truy
nhập dữ liệu. Cơ chế ưu tiên thể được thực hiện bằng việc cấp
quyền (hay mức độ) ưu tiên cho từng người khai thác...
Đảm bảo dữ liệu khi sự cố:
Việc quản lý dữ liệu tập trung th làm tăng khả năng mất t
hoặc sai lệch thông tin khi s c như mất điện đột xuất, một
phần đĩa lưu trữ CSDL bị v.v
CSDL cung cấp khả năng trừu tượng hóa dữ liệu thông qua các lớp. Bao gồm
3 lớp: Lớp trong (còn gọi là mức vật lý Physical), Lớp quan niệm
(Conception hay Logical) và Lớp ngoài.
Tổng quan về CSDL 2
1
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
Lớp vật :
Lớp vật lý chứa toàn bộ các file dữ liệu
Người dùng CSDL không nhất thiết phải nắm được
cấu trúc tổ chức của các file dữ liệu vật lý khi sử dụng
một cơ sở dữ liệu.
Tổng quan về CSDL 22
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
Lớp quan niệm (Logic):
CSDL mức quan niệm là một sự biểu diễn trừu tượng CSDL
mức vật ; hoặc ngược lại, CSDL vật sự cài đặt cụ thể
của CSDL mức quan niệm.
Tổng quan về CSDL 23
Tại mức này sẽ giải quyết cho câu hỏi CSDL cần phải
lưu giữ bao nhiêu loại dữ liệu ? đó là những dữ liệu gì
? Mối quan hệ giữa các loại dữ liệu này như thế nào ?
Tổng quan về CSDL
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
Lớp bên ngoài:
Bao gồm các khung nhìn (view) và được gọi chung là
subschema
Khung nhìn: là khái niệm cho phép nhiều người dùng quan sát
dữ liệu theo nhiều cách khác nhau trong khi dữ liệu lưu bên dưới
tầng vật lý là duy nhất.
Tổng quan về CSDL 24
Tổng quan về CSDL
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
19 20
21 22
23 24
14/01/2019
Tổng quan về CSDL 25
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
Tổng quan về CSDL 2
6
Mức khung nhìn/ngoài: các góc nhìn khác nhau của các
nhóm người sử dụng về CSDL. Mỗi nhóm người dùng một
góc nhìn (view) khác nhau về CSDL
Mức quan niệm (Conceptual level): mức nhìn tổng thể về
CSDL, đây góc nhìn của người trách nhiệm quản trị
CSDL.
Mức vật / trong (Physical / Internal level): mức tổ chức
vật của dữ liệu trong CSDL, đây góc nhìn của những nhà
phát triển (deverlopers) CSDL
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
Sự phân biệt giữa 3 lớp tạo nên 2 tầng độc lập: Độc lập dữ
liệu vật và Độc lập dữ liệu logic
Tổng quan về CSDL 2
7
II. KIẾN TRÚC CỦA CƠ SỞ DỮ LIỆU
Độc lập logic: Các thay đổi
lược đồ quan niệm (thêm/xóa
thực thể) thì không làm ảnh
hưởng tới lược đồ ngoài hay
phải viết lại chương trình ứng
dụng
Độc lập vật lý: Các thay đổi
của lược đồ vật (vd: thay đổi
cách thức tổ chức dữ liệu)
không làm thay đổi lược đồ
quan niệm.
Các CSDL có thể khác nhau về chức
năng và mô hình dữ liệu (data
model).
Mô hình dữ liệu sẽ quyết định cách
thức lưu trữ và truy cập dữ liệu.
Tùy từng ngữ cảnh quan hệ giữa các
thành phần dữ liệu trong CSDL, mô
hình phức hợp được áp dụng để việc
lưu trữ và truy xuất dữ liệu đạt hiệu
quả cao nhất.
Tổng quan về CSDL 28
III. CÁC MÔ HÌNH CSDL
Tổng quan về CSDL 29
Định nghĩa mô hình dữ liệu:
hình trừu tượng dùng để tả dữ liệu phương
thức (phép toán) truy xuất dữ liệu
nhiều loại hình dữ liệu khác nhau (để mô tả dữ
liệu trong CSDL), mỗi loại đặt trưng cho một cách tiếp
cận khác nhau của các nhà phân tích
Các loại mô hình dữ liệu
hình phân cấp (Hierarchical model)
hình mạng (network model)
nh quan hệ (relation model)
hình hướng đối tượng (object oriented model)
III. CÁC MÔ HÌNH CSDL
Tổng quan về CSDL
30
III. CÁC MÔ HÌNH CSDL
1. Mô hình dữ liệu phân cấp
Tổ chức theo hình cây, mỗi t biểu diễn một thực thể dữ liệu.
Liên hệ d liệu thể hiện trên liên h giữa nút cha t con. Mỗi
nút cha thể một hoặc nhiều nút con, nhưng mỗi t con ch
thể một t cha.
Do đó hình phân cấp thể hiện các kiểu quan hệ:
1-1
1-N
25 26
27 28
29 30