
Trường Đại học Công nghệ Sài gòn
Khoa Công nghệ Thông tin
CHƯƠNG 6
CHUẨN HOÁ DỮ LiỆU
(DATA NORMALIZATION)

Trường Đại học Công nghệ Sài gòn
Khoa Công nghệ Thông tin
CƠ SỞ DỮ LiỆU
153
Giới thiệu
nLà một công cụ cơ bản để kiểm tra và cải tiến một thiết kế
CSDL luận lý để thỏa mãn các ràng buộc toàn vẹn giúp tránh
sự trùng lắp dữ liệu (data duplication) không cần thiết.
nLà quá trình phân rã các quan hệ không bình thường (anomaly)
thành các quan hệ có cấu trúc tốt (well-structured) nhỏ hơn
¡Quan hệ có cấu trúc tốt
nCó sự dư thừa dữ liệu tối thiểu
nCho phép người dùng thêm vào, xoá đi và cập nhật các
hàng (row) mà không gây ra sự mâu thuẫn dữ liệu nào
Chương 6. Chuẩn hoá dữ liệu

Trường Đại học Công nghệ Sài gòn
Khoa Công nghệ Thông tin
CƠ SỞ DỮ LiỆU
154
Giới thiệu (tt)
nMục tiêu để tránh sự dị thường
¡Dị thường khi thêm vào (Insertion anomaly) – thêm các
hàng mới đòi hỏi người dùng tạo ra các dữ liệu trùng lắp
¡Dị thường khi xoá (Deletion anomaly) – xoá các hàng đã có
gây ra sự mất dữ liệu cần thiết cho các hàng khác
¡Dị thường khi hiệu chỉnh (Modification anomaly) – thay đổi
dữ liệu ở một hàng đòi hỏi thay đổi dữ liệu của các hàng
khác vì trùng lắp
nLuật cơ bản: một bảng không nên thuộc về nhiều hơn 1 kiểu
thực thể
Chương 6. Chuẩn hoá dữ liệu

Trường Đại học Công nghệ Sài gòn
Khoa Công nghệ Thông tin
CƠ SỞ DỮ LiỆU
155
Giới thiệu (tt)
Hỏi: Đây có phải là một quan hệ không?
Đáp: Phải: các hàng là duy nhất và
không có các thuộc tính đa trị
Hỏi: Khóa chính là gì?
Đáp: Tổ hợp: Emp_ID,
Course_Title
Sự bất thường ở bảng này
nThêm vào – không thể thêm vào 1 nhân viên mới mà không tham gia lớp nào
nXoá đi – nếu xoá bỏ nhân viên 140, ta sẽ mất thông tin về lớp Tax Acc
nHiệu chỉnh – để tăng lương cho nhân viên 100, đòi hỏi phải cập nhật 2 hàng
Chương 6. Chuẩn hoá dữ liệu

Trường Đại học Công nghệ Sài gòn
Khoa Công nghệ Thông tin
CƠ SỞ DỮ LiỆU
156
Phụ thuộc hàm
nPhụ thuộc hàm (function dependency - FD)
¡Là một ràng buộc giữa hai (tập) thuộc tính: Trong quan hệ
R, B là phụ thuộc hàm vào A nếu với mọi thể hiện đúng của
A, giá trị của nó xác định duy nhất giá trị của B
¡Biểu diễn là AàB
¡A là yếu tố xác định (determinant)
¡Ví dụ:
nEmp_ID, Course_Name àDate_Completed
nSS# àName, Address, Birthday
nISBN àTitle, First_Author_Name
Chương 6. Chuẩn hoá dữ liệu

