
3/26/2013
1
Chƣơng 3
SẮP XẾP THẲNG HÀNG TRÌNH TỰ
(SEQUENCE ALIGNMENT)
TRƢỜNG ĐH CÔNG NGHIỆP THỰC PHẨM TPHCM
KHOA CNSH & KTMT
ThS. Nguyễn Thành Luân Email: luannt@cntp.edu.vn
BÀI GIẢNG TIN SINH HỌC
HỆ ĐẠI HỌC
NỘI DUNG BÀI HỌC
•Khái niệm về sắp xếp trình tự
• Tại sao phải nghiên cứu sắp xếp trình tự?
•Phân loại PP sắp xếp trình tự
•Các biểu hiện của phương pháp sắp xếp
trình tự
•Các phương pháp so sánh trình tự thông
dụng
• Ứng dụng của sắp xếp trình tự thẳng
hàng

3/26/2013
2
KHÁI NIỆM
•Theo tin sinh học, sắp xếp thẳng hàng trình
tự là 1 cách sắp xếp các trình tự của DNA,
RNA hay protein để xác định hay so sánh
các vùng tương đồng của các mối quan hệ
chức năng, cấu trúc hay tiến hóa của trình tự
cần nhận biết.
• Sắp xếp thẳng hàng trình tự là phương pháp
sắp xếp hai hoặc nhiều trình tự nhằm đạt
được sự giống nhau tối đa.
KHÁI NIỆM
Các trình tự sắp xếp thường là các nucleotide hay
amino acid được diễn tả theo các hàng với một thuật
ngữ nhất định.
Các khoảng trắng (gaps) được diễn ra như là các
ký tự tương đồng hoặc xác định (thêm vào hoặc mất
đi) được sắp xếp theo dạng cột
Ý nghĩa của sắp xếp thẳng hàng trình tự
•Quá trình tạo ra sự sắp xếp nhằm tìm ra
các cách sắp xếp tốt nhất trong CSDL gồm
các trình tự riêng biệt.
• Nhằm nêu bật sự giống nhau giữa các
trình tự

3/26/2013
3
Ý nghĩa của sắp xếp thẳng hàng trình tự
• Được dùng để nghiên cứu & giải thích sự
tiến hóa của các trình tự từ một tổ tiên
chung
•Tính toán các bắt cặp không chính xác
trong trình tự tương ứng với các đột biến.
VÌ SAO PHẢI SẮP XẾP TRÌNH TỰ
“Tôi tin rằng, sẽ có một ngày, mặc dù tôi sẽ
không còn sống để chứng kiến điều đó,
chúng ta sẽ có những cây tiến hóa chính xác
về các loài sinh giới trong tự nhiên này”
-Charles Darwin-
VÌ SAO PHẢI SẮP XẾP TRÌNH TỰ
•Nhu cầu tìm hiểu mối quan hệ tiến hóa của
các loài sinh giới
•Làm sáng tỏ các lý giải sinh học về các
protein: dựa trên các vùng bảo toàn sinh
học quan trọng (proteomics)
•Xây dựng giả thiết về cấu trúc 3-D của
protein
•Xây dựng giả thiết về chức năng của protein

3/26/2013
4
Phƣơng pháp nhận diện
•Làm thế nào để các biểu hiện về loài
khác nhau trong sinh giới được phân
tích?
SẮP XẾP TRÌNH TỰ
–So sánh trình tự toàn bộ (Global) vs khu
vực (Local Alignment)
–So sánh cặp (Pairwise) vs so sánh đa
trình tự (Multiple Alignment)
Phân loại sắp xếp trình tự
• Được chia thành 2 dạng:
–Sắp xếp theo trình tự cặp (PAIRWISE
ALIGNMENT)
–Sắp xếp theo nhiều trình tự (MULTIPLE
ALIGNMENT)
Sắp xếp trình tự theo cặp
(Pairwise alignment)
• Sắp xếp trình tự theo cặp là phương pháp so
sánh & tìm kiếm cách khả dĩ nhất của một
trình tự của gen (protein hay nucleotide)
chưa biết trùng khớp nhất của 1 chuỗi
protein (amino acid) hay DNA (nucleic acid)
đã biết.
•Mục đích: Tìm ra mối quan hệ đồng đẳng
của một gene hay một sản phẩm-gen trong
một cơ sở dữ liệu các thông tin mẫu đã có
sẵn.

3/26/2013
5
So sánh trình tự theo cặp
Khám phá các thông
tin về:
-Chức năng
-Cấu trúc chuỗi
-Quan hệ tiến hóa
Bắt cặp trình tự
•Các trình tự này có thể được xen bằng các
khoảng trống (gạch ngang) tại các vị trí có
thể để biểu diễn các cột xác định
(identical) hoặc tương tự nhau (similar).
TCCTCTGCCTCTGCCATCAT---CAACCCCAAAGT
| | | | | | | | | | | | | | | | | | | | | | | | | | | | |
CCTGTGCATCTGCAATCATGGGCAACCCCAAAGT
Sắp xếp trình tự toàn bộ
(Global Alignment)
•Tìm ra các trình tự toàn phần tốt nhất
(total sequence)