
KHO DỮ LIỆU VÀ
KINH DOANH THÔNG MINH
Bài 5: Lập chỉ mục

2
Nội dung
Chỉ mục dựa trên cây
Chỉ mục bitmap

3
Chỉ mục
• Tại sao phải lập index?
– Xem xét một bảng dữ liệu 100 GB; với tốc độ
đọc 100 MB/s, cần 17 phút để quét qua toàn
bảng
– Câu truy vấn về số lượng máy S500 bán
được ở Đức tháng trước
• Áp dụng ràng buộc (sản phẩm, vị trí) khối lượng
phải chọn sẽ giảm mạnh
– Nếu bảng có 30 vị trí, 10000 sản phẩm và 24 tháng, khối
lượng lựa chọn là 1/30 * 1/ 10000 * 1/24 = 0,00000014
– Như vậy chúng ta đọc 100 GB để lấy ra
1,4KB

4
Chỉ mục
• Giảm số lượng các khối (trang/page) phải
đọc với chỉ mục

5
Chỉ mục dựa trên Tree
• B-Tree
– Cấu trúc dữ liệu để lưu trữ dữ liệu được sắp
xếp
– Cấu trúc gồm các node

