3/26/2013
1
Chƣơng 3
SẮP XẾP THẲNG HÀNG TRÌNH TỰ
(SEQUENCE ALIGNMENT)
TRƢỜNG ĐH CÔNG NGHIỆP THỰC PHẨM TPHCM
KHOA CNSH & KTMT
ThS. Nguyễn Thành Luân Email: luannt@cntp.edu.vn
BÀI GIẢNG TIN SINH HỌC
HỆ ĐẠI HỌC
NỘI DUNG BÀI HỌC
Khái niệm về sắp xếp trình tự
Tại sao phải nghiên cứu sắp xếp trình tự?
Phân loại PP sắp xếp trình tự
Các biểu hiện của phương pháp sắp xếp
trình tự
Các phương pháp so sánh trình tự thông
dụng
Ứng dụng của sắp xếp trình tự thẳng
hàng
3/26/2013
2
KHÁI NIỆM
Theo tin sinh học, sắp xếp thẳng hàng trình
tự 1 cách sắp xếp các trình tự của DNA,
RNA hay protein để xác định hay so sánh
các vùng tương đồng của các mối quan hệ
chức năng, cấu trúc hay tiến hóa của trình tự
cần nhận biết.
Sắp xếp thẳng hàng trình tự phương pháp
sắp xếp hai hoặc nhiều trình tự nhằm đạt
được sự giống nhau tối đa.
KHÁI NIỆM
Các trình tự sắp xếp thường các nucleotide hay
amino acid được diễn tả theo các hàng với mt thuật
ngữ nhất định.
Các khoảng trắng (gaps) được diễn ra như các
tự tương đồng hoặc xác định (thêm vào hoặc mt
đi) được sắp xếp theo dạng cột
Ý nghĩa của sắp xếp thẳng hàng trình tự
Quá trình tạo ra sự sắp xếp nhằm tìm ra
các cách sắp xếp tốt nhất trong CSDL gồm
các trình tự riêng biệt.
Nhằm nêu bật sự giống nhau giữa các
trình tự
3/26/2013
3
Ý nghĩa của sắp xếp thẳng hàng trình tự
Được dùng để nghiên cứu & giải thích sự
tiến hóa của các trình tự từ một tổ tiên
chung
Tính toán các bắt cặp không chính xác
trong trình tự tương ứng với các đột biến.
VÌ SAO PHẢI SẮP XẾP TRÌNH TỰ
Tôi tin rằng, sẽ một ngày, mặc tôi sẽ
không còn sống để chứng kiến điều đó,
chúng ta sẽ những cây tiến hóa chính xác
về các loài sinh giới trong tự nhiên này
-Charles Darwin-
VÌ SAO PHẢI SẮP XẾP TRÌNH TỰ
Nhu cầu tìm hiểu mối quan hệ tiến hóa của
các loài sinh giới
Làm sáng tỏ các giải sinh học về các
protein: dựa trên các vùng bảo toàn sinh
học quan trọng (proteomics)
Xây dựng giả thiết về cấu trúc 3-D của
protein
Xây dựng giả thiết về chức năng của protein
3/26/2013
4
Phƣơng pháp nhận diện
Làm thế nào để các biểu hiện về loài
khác nhau trong sinh giới được phân
tích?
SẮP XẾP TRÌNH TỰ
So sánh trình tự toàn bộ (Global) vs khu
vực (Local Alignment)
So sánh cặp (Pairwise) vs so sánh đa
trình tự (Multiple Alignment)
Phân loại sắp xếp trình tự
Được chia thành 2 dạng:
Sắp xếp theo trình tự cặp (PAIRWISE
ALIGNMENT)
Sắp xếp theo nhiều trình tự (MULTIPLE
ALIGNMENT)
Sắp xếp trình tự theo cặp
(Pairwise alignment)
Sắp xếp trình tự theo cặp phương pháp so
sánh & tìm kiếm cách khả nhất của một
trình tự của gen (protein hay nucleotide)
chưa biết trùng khớp nhất của 1 chuỗi
protein (amino acid) hay DNA (nucleic acid)
đã biết.
Mục đích: Tìm ra mối quan hệ đồng đẳng
của một gene hay một sản phẩm-gen trong
một sở dữ liệu các thông tin mẫu đã
sẵn.
3/26/2013
5
So sánh trình ttheo cặp
Khám phá các thông
tin về:
-Chức năng
-Cấu trúc chuỗi
-Quan hệ tiến hóa
Bắt cặp trình tự
Các trình tự này thể được xen bằng các
khoảng trống (gạch ngang) tạic vị t
thể để biểu diễn các cột xác định
(identical) hoặc tương tự nhau (similar).
TCCTCTGCCTCTGCCATCAT---CAACCCCAAAGT
| | | | | | | | | | | | | | | | | | | | | | | | | | | | |
CCTGTGCATCTGCAATCATGGGCAACCCCAAAGT
Sắp xếp trình tự toàn bộ
(Global Alignment)
Tìm rac trình tự toàn phần tốt nhất
(total sequence)