CHƯƠNG V:
CHUN HÓA CSDL
Data normalization
Cơ sở dữ liệu 3
I. Mt s khái nim cơ bn
¡Phép tách ợc đồ quan hệ R= {A1, A2,.. An}
việc thay thế lược đồ quan hệ Rbằng tập
các lược đồ con {R1, R2,.., Rk}, trong đó
RiÌR, i = 1,..,k -Ri các ợc đồ con
(Rigồm một số thuộc tính từ R)
R = R1ÈR2È... ÈRk
Không đòi hỏi các Riphải phân biệt
Mục đích:Loại bỏ các dị thường dữ liệu
Cơ sở dữ liệu 4
Ví d
MSKH NKH TP PVC MSMH TÊNMH ĐG SL
S1
S1
S1
S2
S2
S3
S4
An
An
An
Hòa
Hoà
Thanh
Trang
HCM
HCM
HCM
HN
HN
NT
NT
01
01
01
02
02
03
03
P1
P2
P3
P1
P3
P2
P2
Táo
Cam
Chanh
Táo
Chanh
Cam
Cam
650
500
450
650
450
500
500
300
200
400
100
300
200
210
MSKH TÊNKH TP
S1
S2
S3
S4
An
Hoà
Bình
Trang
HCM
HN
NT
NT
TP PVC
HCM
HN
NT
01
02
03
MSMH TÊNMH ĐG
P1
P2
P3
Táo
Cam
Chanh
650
500
450
MSKH MSMH SL
S1
S1
S1
S2
S2
S3
S4
P1
P2
P3
P1
P3
P2
P2
300
200
400
100
300
200
210
Phép ch-Kết ni không mt mát thông tin
¡Nói rằng phép ch Rthành các lược đồ con R1,
R2, , Rk phép ch -kết nối không mất
mát thông tin đối với Fnếu với mỗi quan hệ r
trên Rthoả Fthì
r = PR1(r) *PR2 (r) *... *PRk(r)
tức rđược tạo n từ phép kết nối tự nhiên
của các hình chiếu của trên các Ri,i= 1..,k
Cơ sở dữ liệu 5
Ph thuc hàm đầy đủ
¡Cho lược đồ quan hệ (U,F) tập X, YÍU.
¡PTH X
®
Yđược gọi PTH đầy đủ nếu không tồn tại X’
tập con thực sự của X X’
®
Y,tức :
-X®Y
-
"
X’
Ì
Xthì X’ /
®
Y, mọi tập con thực sự của Xđều
không thể xác định hàm Y
¡VD:F = { A ®BCD;BCD ®E; CD ®EI }
BCD
®
E mt phthuc m không đầy đ CD
®
E
A
®
BCD CD
®
EI phụ thuộc đầy đủ
Cơ sở dữ liệu 6