1
Chương 4
Lưu tr d liu vt lý &Lưu tr d liu vt lý &
Các phương pháp truy xutCác phương pháp truy xut
1
Ni dung
1. Mt s khái nim
2. Cách t chc file và phương pháp truy
xut
3. Index
2
2
Các phương tin lưu tr DL
Cache (RAM)
Main memor
y
(
DRAM
)
Primary storage
Volatile storage:
mt thông tin khi
mt ngun
CPU s dng để thi hành CT nhanh
CPU dùng DRAM để làm nơi load
C
y( )
Flash memory (MP3, USB)
Magnetic disk
Secondary storage/
On-line storage
Nonvolatile
storage
CT
+
DL
, t
hi
n
h
CT
3
Optical disk (CD-ROM)
Magnetic tapes
Tc độ
Giá thành
Tertiary storage/
Off-line storage
Storage Capacity
1015
nearline
tape &
optical
offline
tape
)
1013
1011
109
107
electronic
main
electronic
secondary
magnetic
optical
disks
online
tape
disks
c
al capacity (bytes
)
fG&Rt
4
10-9 10-6 10-3 10-0 103
access time (sec)
105
103
cache
typi
c
f
rom
G
ray
&
R
eu
t
e
r
3
Storage Cost
104cache
electronic
li
from Gray & Reuter
102
100
10-2
mainelectronic
secondary
magnetic
optical
disks
on
li
ne
tape
nearline
tape &
optical
disks
offline
dollars/MB
5
10-9 10-6 10-3 10-0 103
access time (sec)
10-4
tape
Đĩa t (Magnetic disk)
6
4
V cách qun lý đĩa
•1 mt đĩa chia thành nhiu track, 1 track chia
thành nhiu block (page). 1 cluster = n block.
Dùng đĩa t (magnetic disk) để lưu cơ s d liu
vì:
Khil l t l(khô thlbh h)
Khi
l
ượng
l
ưu
t
r
l
n
(khô
ng
th
l
ưu
b
n
h
c
n
h)
–Lưu mt cách bn b, lâu dài, phc v cho truy cp và
x lý lp li (b nh chính không đáp ng được)
Chi phí cho vic lưu tr r.
•D liu trên đĩa phi được chép vào b nh chính
khi cn x lý. Nếu d liu này có thay đổi thì s
được ghi trlivàođĩa.
7
được
ghi
tr
li
vào
đĩa.
•B điu khin đĩa (disk controller - DC): giao tiếp
gia đĩa và máy tính, nhn 1 lnh I/O, định v
đầu đọc và làm cho hành động R/W din ra.
Block cũng là đơn v để lưu tr và chuyn d liu.
Chuyn d liu
–Thi gian trung bình để tìm và chuyn 1 block
= s + rd + btt
Seek time (s): để DS định v đầu đọc/ ghi đúng
10 msec (destop) 3
8
,
-
10
msec
(destop)
,
3
-
8
msec (server).
Rotational delay/latency (rd): để đầu đọc v trí
block cn đọc, ph thuc rpm, trung bình khang 2
msec.
Block transfer time (btt): để chuyn d liu, ph
th àbl ki t ki à
8
th
u
c v
à
o
bl
oc
k
s
i
ze,
t
rac
k
s
i
ze, v
à
rpm.
Khi truy xut đến các block liên tiếp thì tiết
kim được thi gian.
–Mt s k thut tìm kiếm khai thác điu này.
5
Mt s nguyên tc
DBS gim thiu s lượng block được
chuyn gia đĩa và MM (main memory)
g
im s ln tru
y
xut đĩa
g y
–Lưu li càng nhiu càng tt các block d liu
trên MM, tăng cơ hi tìm thy block cn truy
xut trên MM.
Buffer là thành phn ca MM dùng để cha
các bn sao (version mi hơn) ca các
9
block được đọc lên/ lưu xu
ng đĩa, do
Buffer manager qun lý.
Lưu tp tin trên đĩa
•CSDL được t chc trên đĩa thành mt/nhiu
tp tin, mi tp tin gm nhiu mu tin, mi mu
tin gm nhiu trường.
Mti hiđl t đĩ hkhi
M
u
ti
n p
hi
đ
ược
l
ưu
t
r
t
r
ê
n
đĩ
a sao c
h
o
khi
cn thì có th truy cp được và truy cp mt
cách hiu qu.
Cách t chc file chính (Primary file organization):
cho biết các mu tin định v mt cách vt lý như thế
nào trên đĩa
,
t đó biết cách tru
y
xut chún
g
.
10
, y g
Cách t chc ph (secondary organization/ auxiliary
access structure): để truy cp các mu tin trên file
hiu qu.