C Programming
C Programming
Basic – week 13
Basic – week 13
2
Nội dung
Nội dung
Các giải thuật so khớp chuỗi
Giải thuật ngây thơ
Giải thuật Knuth-Morris-Pratt
Giải thuật Boyer-Moore
Bài tập
a b a c a a b
a b a c a b
1
a b a c a b
432
3
Bài toán so khớp chuỗi
Bài toán so khớp chuỗi
Có P là chuỗi có kích thước m
Chuỗi con P[i .. j] của P bao gồm các kí tự từ vị trí i tới
vị trí j
Tiền tố của P là chuỗi con có dạng P[0 .. i]
Hậu tố của P là chuỗi con có dạng P[i ..m − 1]
Cho các chuỗi T (text) và P (pattern), bài toán so
khớp chuỗi yêu cầu tìm chuỗi con của T bằng với
P
Các ứng dụng:
Soạn thảo văn bản, máy tìm kiếm, nghiên cứu sinh học
4
Brute Force Matching
Brute Force Matching
Giải thuật brute-force matching so sánh P với T
với mỗi khả năng của T cho tới khi
tìm thấy một chuỗi con hoặc
đã thử tất cả các khả năng
Độ phức tạp: O(nm)
Trường hợp tệ nhất:
T = aaa … ah
P = aaah
có thể gặp trong ảnh hoặc chuỗi DNA
ít gặp trong văn bản tiếng Anh
5
Giải thuật
Giải thuật
Algorithm BruteForceMatch(T, P)
// Input text T of size n and pattern P of size m
// Output starting index of a substring of T equal to P or
−1
if no such substring exists
for i ← 0 to n − m {
test shift i of the pattern
}
j ← 0
while j < m T[i + j] = P[j]
j ← j + 1
if j = m
return i {match at i}
else
break while loop {mismatch}
return -1 {no match anywhere}