
2
CHƯƠNG 1: TỔNG QUAN
1. Đặt vấn đề:
Cơ sở dữ liệu quan hệ được xây dựng theo lý thuyết do E.F.Codd giới thiệu năm
1970. Mô hình quan hệ có nhiều ưu điểm hơn hẳn các mô hình trước nó và từ năm
1980 đã trở thành mô hình được dùng rộng rãi để phát triển hệ quản trị CSDL.
Cùng với sự phát triển của mô hình dữ liệu quan hệ, có nhiều vấn đề lý thuyết và
thực nghiệm nảy sinh và được giải quyết . Khi thiết kế CSDL quan hệ ta thường đứng
trước vấn đề lựa chọn giữa các lược đồ quan hệ: lược đồ nào tốt hơn? Tại sao? …
Có thể nói tổng quát một lược đồ quan hệ có cấu trúc tốt là lược đồ không chứa
đựng các vấn đề liệt kê sau đây:
a. Dư thừa dữ liệu
Là sự trùng lặp thông tin trong CSDL.
Ví dụ: Xét lược đồ quan hệ NHACC(Ten_NCC, Hang, DonGia, Diachi_NCC).
Nếu một nhà cung cấp cung cấp nhiều mặt hàng thì địa chỉ nhà cung cấp phải lặp lại
nhiều lần kéo theo dư thừa dữ liệu.
Ngoài việc gây lãng phí dung lượng lưu trữ, sự dư thừa dữ liệu có thể gây ra những hậu
quả nghiêm trọng đối với dữ liệu khi người dùng cập nhật dữ liệu làm cho dữ liệu không
tương thích, thiếu nhất quán.
Ví dụ: Xét lại lược đồ NHACC trên. Ta có thể sửa địa chỉ một nhà cung cấp tại một bộ
nào đó mà không sửa ở một bộ khác gây ra địa chỉ không nhất quán của cùng một nhà cung
cấp.
b. Dị thường do thêm dữ liệu
Không thể chèn bộ mới vào quan hệ nếu không có đầy đủ dữ liệu.
Ví dụ: Ta không thể ghi nhận địa chỉ một nhà cung cấp nếu nhà cung cấp đó không
cung cấp mặt hàng nào cả vì Ten_NCC, Hang tạo thành một khoá cho quan hệ.
c. Dị thường do xóa dữ liệu