
5
MỤC LỤC
LỜI CAM ĐOAN ..................................................................................................... 3
LỜI CẢM ƠN ........................................................................................................... 4
DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT ....................................................... 7
GIỚI THIỆU ............................................................................................................ 8
CHƢƠNG 1. TỔNG QUAN VỀ CÁC THUẬT TOÁN TÌM KIẾM CHUỖI
DNA .........................................................................................................................13
1.1. Phƣơng pháp tìm kiếm chuỗi DNA sử dụng mô hình Markov ẩn ............ 13
1.2. Phƣơng pháp liên kết nhạy cảm đầy đủ....................................................... 15
1.3. Phƣơng pháp tìm kiếm tƣơng tự nhanh ...................................................... 21
1.4. Phƣơng pháp sử dụng mô hình phù hợp gần đúng .................................... 25
1.5. Phƣơng pháp sử dụng mô hình kết hợp chính xác và gần chính xác ........ 31
CHƢƠNG 2. N-GRAM VÀ PHƢƠNG PHÁP TÌM KIẾM CHUỖI TƢƠNG
TỰ NHANH ÁP DỤNG N-GRAM. ......................................................................35
2.1. Mô hình N-Gram ............................................................................................ 35
2.1.1. Một số khái niệm ...................................................................................................... 35
2.1.2. Mô hình ngôn ngữ N-gram ....................................................................................... 36
2.1.3. Khó khăn khi xây dựng mô hình ngôn ngữ N-gram : ............................................... 37
2.1.4. Các phương pháp khắc phục cụm N-Gram phân bố không đều ............................... 38
2.2. Phƣơng pháp tƣơng tự nhanh áp dụng N-gram tìm kiếm chuỗi DNA. .... 39
2.2.1. Phân đoạn DNA ........................................................................................................ 39
2.2.2. Các “từ DNA” ........................................................................................................... 40
2.2.3. Quá trình tìm kiếm chuỗi và hiển thị kết quả............................................................ 40
2.3. Bảng kết quả các lần thử phƣơng pháp tìm kiếm chuỗi tƣơng tự nhanh áp
dụng N-Gram ............................................................................................................ 48
2.3.1. Định dạng chuỗi cơ sở dữ liệu .................................................................................. 48