
1
n to
SO SÁNH CÁC TRÌNH T SINH Ự
H C B NG BLAST VÀ CLUTALXỌ Ằ

M c tiêu c a bài h cụ ủ ọ
N m đ c nh ng nguyên t c so sánh các trình t ắ ượ ữ ắ ự
sinh h cọ
S d ng ch ng trình BLAST giúp chúng ta nhanh ử ụ ươ
chóng tìm ra nh ng trình t sinh h c t ng đ ng ữ ự ọ ươ ồ
(n u có trong các CSDL l n nh NCBI, EMBL, ế ớ ư
DDPJ…) v i trình t yêu c u. ớ ự ầ
Cung c p nh ng s li u v t l t ng đ ng, ấ ữ ố ệ ề ỉ ệ ươ ồ
ngu n g c các trình t t ng đ ng,…ồ ố ự ươ ồ
Tìm kim trình t sinh h cế ự ọ 2

B t c p trình tắ ặ ự
S p x p th ng hàng trình tắ ế ẳ ự là ph ng pháp s p ươ ắ
x p hai ho c nhi u trình t nh m đ t đ c s gi ng ế ặ ề ự ằ ạ ượ ự ố
nhau t i đa.ố
Các trình t này có th đ c xen b ng các ự ể ượ ằ
kho ng tr ngả ố (th ng đ c di n t b ng các g ch n i ườ ượ ễ ả ằ ạ ố
ngang) t i các v trí có th đ làm sao t o thành các ạ ị ể ể ạ
c t gi ng nhau (identical) ho c t ng t nhau (similar).ộ ố ặ ươ ự
tcctctgcctctgccatcat---caaccccaaagt
|||| ||| ||||| ||||| ||||||||||||
tcctgtgcatctgcaatcatgggcaaccccaaagt
Gi i thiu môn h cớ ệ ọ 3

Ph ng pháp này th ng đ c dùng đ nghiên c u s ươ ườ ượ ể ứ ự
ti n hóaế c a các trình t t m t t tiên chung, đ c bi t ủ ự ừ ộ ổ ặ ệ
là các trình t sinh h cự ọ nh trình t ư ự protein ho c trình ặ
t ựDNA.
Các b t c p không đúng trong trình t t ng ng v i ắ ặ ự ươ ứ ớ
các đ t bi n và các kho ng tr ngộ ế ả ố t ng ng v i ph n ươ ứ ớ ầ
thêm vào ho c xóa đi. ặ
Thu t ng "s p x p th ng hàng trình t " cũng ch quá ậ ữ ắ ế ẳ ự ỉ
trình t o ra s s p x p này hay tìm ra các cách s p ạ ự ắ ế ắ
x p t t nh t trong c s d li u g m các trình t riêng ế ố ấ ơ ở ữ ệ ồ ự
bi t.ệ
Gi i thiu môn h cớ ệ ọ 4

S p gióng c t đôi m t (Pairwise alignment)ắ ộ ộ
S p gióng c t đôi m t là ph ng pháp ph c v cho ắ ộ ộ ươ ụ ụ
vi c tìm ki m m t trình t s p gióng c t toàn b hay ệ ế ộ ự ắ ộ ộ
(c c b ) mà trùng kh p nh t c a các chu i ụ ộ ớ ấ ủ ỗ protein (
amino acid) hay DNA (nucleic acid).
Thông th ng, m c đích c a nó là tìm ra (m i quan ườ ụ ủ ố
h ) ệđ ng đ ngồ ẳ c a m t ủ ộ gene hay m t s n ph m-gộ ả ẩ en
trong m t ộc s d li uơ ở ữ ệ các thông tin m u đã có s n. ẫ ẵ
Thông tin này là h u ích đ tr l i m t lo t các câu h i ữ ể ả ờ ộ ạ ỏ
sinh h cọ khác nhau.
Gi i thiu môn h cớ ệ ọ 5

