KHO DỮ LIỆU
KINH DOANH THÔNG MINH
Bài 5: Lập chỉ mục
2
Nội dung
Chỉ mc dựa trên cây
Chỉ mc bitmap
3
Chỉ mục
Tại sao phải lập index?
Xem xét một bng dữ liệu 100 GB; với tốc độ
đọc 100 MB/s, cần 17 phút để quét qua toàn
bảng
Câu truy vấn về số lượng máy S500 bán
được Đức tháng trưc
Áp dụng ràng buộc (sản phẩm, vị trí) khối lượng
phải chọn sẽ giảm mạnh
Nếu bảng có 30 vtrí, 10000 sản phẩm và 24 tng, khối
lượng lựa chọn là 1/30 * 1/ 10000 * 1/24 = 0,00000014
Như vậy chúng ta đọc 100 GB để lấy ra
1,4KB
4
Chỉ mục
Giảm số lượng các khi (trang/page) phải
đọc với chmục
5
Chỉ mục dựa trên Tree
B-Tree
Cấu trúc dữ liệu để lưu trữ dữ liệu được sắp
xếp
Cấu trúc gồm các node