Bng băm (Hash table)
B
Bng băm
ng băm (Hash table)
(Hash table)
Chương 5
Phương pháp giải quyết đụng độ
4
Bảng băm
1
Định nghĩa hàm băm
2
Phương pháp xây dựng hàm băm
3
Ni dung
N
N
i dung
i dung
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Các thuật toán tìm kiếm đều dựa vào việc
so sánh giá trị khoá (Key)
Phụ thuộc kích thước của tập các phần tử
Thời gian tìm kiếm không nhanh do phải thực hiện
nhiều phép so sánh có thể không cần thiết ( O(n),
O(logn), …)
=> Có phương pháp lưu trữ nào cho phép
thực hiện tìm kiếm với hiệu suất cao hơn
không ( độ phức tạp hằng số)?
Bả
Bảng băm
ng băm (Hash Table)
(Hash Table)
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Bảng gồm m phần tử được
lưu tr dưới dạng bảng chỉ
mục
Phần tử giá trị khoá k
được lưu trtương ứng tại v
trí thứ k
Tìm kiếm bằng cách tra trong
bảng chỉ mục
Thời gian tìm kiếm là O(1)
Đây là dạng bảng băm cơ bản
Bả
Bảng truy xu
ng truy xu
t tr
t tr
c ti
c tiế
ếp
p
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
K: tập các giá trị khoá (set
of keys) cần lưu trữ
A: tập các địa chỉ (set of
addresses) trong bảng băm
HF(k): hàm băm dùng để
ánh xạ một khoá k từ tập
các khoá K thành một địa
chỉ tương ứng trong tập
các địa chỉ A
C
C
u t
u t
c b
c b
ng băm
ng băm
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Bảng băm đóng :
Số phần tử cố định
Mỗi khóa ứng với một địa chỉ
Không thể thực hiện các thao tác thêm, xóa trên bảng băm
thời gian truy xuất là hằng số
Bảng băm mở :
Số phần tử không cố định
Một số khóa có thể có cùng địa chỉ
thể thực hiện các thao tác thêm, xóa phần tử
Thời gian truy xuất có thể bị suy giảm đôi chút
Phân lo
Phân lo
i b
i b
ng băm
ng băm
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
hàm biến đổi giá trị kh (số, chuỗi…) thành địa chỉ, chỉ mục
trong bảng băm
dụ : hàm băm biến đổi khóa chuỗi thành 1 địa chỉ (số nguyên)
int hashfunc( char *s, int n )
{ int sum = 0;
while( n-- ) sum = sum + *s++;
return sum % 256;
}
Tính địa chỉ của khoá “AB” : hashfunc(“AB”,2) 131
Tính địa chỉ của khoá “BA” : hashfunc(“BA”,2) 131
Khi hàm băm 2 kh vào cùng 1 địa chỉ gọi là đụng đ
(Collision)
m băm
m băm (Hash function)
(Hash function)
Giá trị khoá m băm Địa chỉ, chỉ mục
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Tiêu chuẩn đánh giá hàm băm
Tính toán nhanh.
Các khoá được phân bố đều trong bảng.
Ít xảy ra đụng độ .
m băm
m băm (Hash function)
(Hash function)
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Hàm băm dạng bảng tra
Hàm băm dùng phương pháp chia
Hàm băm dùng phương pháp nhân
Phương
Phương phá
pháp xây d
p xây d
ng h
ng hà
àm băm
m băm
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Hàm băm dạng bảng tra
Phương
Phương phá
pháp xây d
p xây d
ng h
ng hà
àm băm
m băm
Khoá Địa chKhóa Địa chKhóa Địa chKhóa Địa ch
a 0 h 7 o 14 v 21
b 1 i 8 p 15 w 22
c 2 j 9 q 16 x 23
d 3 k 10 r 17 y 24
e 4 l 11 s 18 z 25
f 5 m 12 t 19 / /
g 6 n 13 u 20 / /
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Hàm băm dùng phương pháp chia
Sử dụng số dư của phép chia để làm địa chỉ:
h(k) = kmod m
k khoá, m kích thước (số địa chỉ) của bảng.
vấn đề chọn giá trị m
Nếu chọn m= 2n, h(k) = k mod 2nsẽ dùng n bits thấp
của k để làm địa chỉ
Nếu chọn m= 10n, h(k) = k mod 10nsẽ dùng n số cuối
của k để làm địa chỉ
nên chọn m nguyên tố gần với 2nhoặc 10n
Phương
Phương phá
pháp xây d
p xây d
ng h
ng hà
àm băm
m băm
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
dụ: Ta tập khoá các giá trị số gồm 3 chữ
số, vùng nh cho bảng địa chỉ khoảng 100
mục, như vậy ta s lấy hai s cuối của khoá để
làm địa chỉ theo phép chia dư cho 100.
Vd: 325 Mod 100 = 25, 125 Mod 100=25...
Phương
Phương phá
pháp xây d
p xây d
ng h
ng hà
àm băm
m băm
M=100
Khoá Địa ch
325 25
125 25
147 47
M=97 (nguyên t)
Khoá Địa ch
325 34
125 28
147 50
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Hàm băm dùng phương pháp nhân
Sử dụng công thức:
h(k) = floor(m (k A mod 1))
với k là khóa, m là kích thước bảng
A là hằng số: 0 < A < 1
Vấn đề chọn m và A
Ta thường chọn m = 2nhoặc m = 10n
Theo Knuth chọn A = 1/2(sqrt(5) -1) 0.618033987
được xem là tốt
Phương
Phương phá
pháp xây d
p xây d
ng h
ng hà
àm băm
m băm
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
dụ: Ta tập khoá các giá trị số gồm 3 chữ
số, vùng nh cho bảng địa chỉ khoảng 100
mục, chọn hằng số A=0.61803
Tính địa ch cho khóa 325
h(325) = floor(100 (325*0.61803 mod 1))=86
Phương
Phương phá
pháp xây d
p xây d
ng h
ng hà
àm băm
m băm
M=100, A=0.52173
Khoá Địa ch
325 56
125 21
147 69
M=100, A=0.61803
Khoá Địa ch
325 86
125 25
147 85
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Khởi tạo (Initialize)
Kiểm tra rỗng (Empty)
Lấy kích thước của bảng băm (Size)
Tìm kiếm (Search)
Thêm mới phần tử (Insert)
Loại bỏ (Remove)
Sao chép (Copy)
Duyệt (Traverse)
C
Cá
ác thao t
c thao tá
ác trên b
c trên b
ng băm
ng băm
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Phương pháp nối kết
Phương pháp dò tuyến tính
Phương pháp dò bậc hai
Phương pháp dùng hàm băm kép
C
Cá
ác phương
c phương phá
pháp gi
p gi
i quy
i quyế
ết đ
t đ
ng đ
ng đ
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Phương ph
Phương phá
áp n
p n
i k
i kế
ết
t
Các phần tử bị đụng độ được gom thành một danh
sách liên kết (gọi là một bucket).
C
Cá
ác phương
c phương phá
pháp gi
p gi
i quy
i quyế
ết đ
t đ
ng đ
ng đ
Một
Bucket
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Khai báo cấu trúc bảng băm:
#define M 100
struct node
{ int key;
struct node *next;
};
Khai báo kiểu con trỏ chỉ nút
typedef struct nodes *nodeptr;
Khai báo mảng bucket chứa M con trỏ đầu của M bucket
nodeptr bucket[M];
C
Cà
ài đ
i đ
t b
t b
ng băm phương ph
ng băm phương phá
áp n
p n
i k
i kế
ết
t
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Hàm băm
int hashfunc (int key)
{ return (key % M); }
Phép toán khởi tạo (initbuckets)
void initbuckets( )
{ int b;
for (b=0;b<M;b++) bucket[b]=NULL;
}
Phép toán kiểm tra bucket rỗng (isemptybucket)
int isemptybucket (int b)
{ return(bucket[b] ==NULL ?TRUE :FALSE); }
C
Cà
ài đ
i đ
t b
t b
ng băm phương ph
ng băm phương phá
áp n
p n
i k
i kế
ết
t
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Phép toán kiểm tra bảng băm rỗng isempty:
int isempty( )
{ int b;
for (b=0;b<M;b++)
if(bucket[b] !=NULL) return(FALSE);
return(TRUE);
}
Phép toán chèn phần tử khóa k vào bảng băm:
void insert(int k)
{ int b;
b=hashfunc(k);
place(b,k); //chen k vao danh sach lien ket
}
C
Cà
ài đ
i đ
t b
t b
ng băm phương ph
ng băm phương phá
áp n
p n
i k
i kế
ết
t
3/11/2010 www.lhu.edu.vn
Chương
Chương 5 B
5 B
ng băm
ng băm
Phép toán hủy mục có khóa k trong bảng băm
void remove(int k)
{ int b;
nodeptr q, p;
b = hashfunc(k); p = bucket[b];
while(p!=NULL && p->key !=k)
{ q=p; p=p->next; }
if (p == NULL)
printf("\n khong co nut co khoa %d" ,k);
else if (p==bucket[b]) pop(b);
else delafter(q); //xoa nut
}
C
Cà
ài đ
i đ
t b
t b
ng băm phương ph
ng băm phương phá
áp n
p n
i k
i kế
ết
t