ự
Th c hành bioinformatics (Bài th c hành 1 và 2)
ự
L u ý:ư 1. Th c hành t ự ạ i phòng máy tính c a Khoa Tin h c, t ng 1 nhà B. Th i gian b t đ u t ọ ầ ắ ầ ừ ủ ờ
ự ng ng v i 4 bu i cho m i nhóm) ổ ỗ ướ ề ẫ ỗ ự ổ 8h00 đ n 11h30 ế 2. Có 4 bài th c hành (t ươ ứ 3. Đ ngh các nhóm i n tài li u h ị 4. Bài th c hành 1 và 2 s đ ẽ ượ 5. K t thúc m i bu i th c hành, n p ngay câu tr l ự ỗ ớ ng d n th c hành tr ự ệ ướ ế ộ c m i bu i th c t p ự ậ ổ c ti n hành trong 2 bu i. M i bu i làm 2 ph n. ầ ỗ ổ i l p. i t ả ờ ạ ớ ế ổ
Làm quen v i Genome browser
Ph n 1. ầ
ớ
b sau: ế ố ậ
S d ng máy tính k t n i Internet truy c p vào các trang we UCSC genome browser (http://genome.ucsc.edu/) Ensembl genome browser (http://www.ensembl.org) NCBI MapViewer (http://www.ncbi.nlm.nih.gov/mapview/) ECR Browser (http://ecrbrowser.dcode.org) ử ụ i. ii. iii. iv.
Câu h iỏ : trên hãy gi i thích th nào là genome browser ? ả ế ụ ủ t có bao nhiêu genome đã đ các genome browser ? ế ượ SC genome browser, hãy cho bi 1. Sau khi tìm hi u các trang web ở ể 2. M c đích c a genome browser ? 3. Cho bi 4. S d ng UC ử ụ c xác đ nh trình t ị ự ở ủ : t ý nghĩa c a ế
BLAT Gene Sorter Insilico PCR Micribial genomes ử ụ ế : t ng (primates) đã đ ưở ượ ộ ự c xác đ nh trình t ị iườ ? ? 5. S d ng Ensembl genome browser, hãy cho bi Có bao nhiêu loài trong b linh tr Có bao nhiêu gene mã hóa cho enzym amylase trong genome ng Các enzym này n m trên NST nào ằ 6. S d ng Map Viewer, hãy cho bi t: ử ụ ế
ề ậ ể ủ ậ Asperginus niger có bao nhiêu NST? Genome ti th c a sinh v t này có chi u dài bao nhiêu? (tính theo Kilobase_Kb) Đ n th i đi m hi n nay có bao nhiêu gene trong genome ti th c a sinh v t này ế đã đ ể ủ ờ ệ ể c xác đ nh? ượ ị
Hình 1. UCSC genome browser
Hình 2. Ensembl genome browser
Làm quen v i c s d li u c a các ngân hàng gen
Ph n 2. ầ
ớ ơ ở ữ ệ ủ
Truy c p vào các trang web sau:
http://www.ncbi.nlm.nih.gov/ http://www.ebi.ac.uk/embl/ http://www.ddbj.nig.ac.jp/ http://www.ebi.ac.uk/uniprot/ http://expasy.org/ http://www.pdb.org/pdb/home/home.do ậ i. ii. iii. iv. v. vi.
Câu h i:ỏ t tên và ý nghĩa c a các trang web trên? ủ ế 1. Hãy cho bi 2. Truy c p vào các trang web i, ii, iii và iv trên. Hãy k tên nh ng CSDL chính và ý nghĩa ậ ở ữ ể c a chúng. ủ 3. Truy c p vào trang web ậ t c bao t có t http://www.ncbi.nlm.nih.gov/ ế ụ ấ ả ế ủ ừ ụ ọ ể
• Trong m c tìm ki m Search, tìm m c All database. Hãy cho bi nhiêu CSDL? K tên và nói ng n g n ý nghĩa c a t ng CSDL. ắ t có bao nhiêu gene mã hóa cho enzyme amylase đã ế t c các loài có trong CSDL) • Trong CSDL gene, hãy cho bi t cho t i nay? ( t c bi đ ượ ế ớ ở ấ ả 4. Gene mã hóa cho enzyme alpha amylase ở Bacillus subtilis 168 có gene ID là 938356, ậ ố
locus tag là: BSU03040, s truy c p trong NCBI là AL009126, NCBI Reference Sequence là NC_000964.3, GI:255767013. Hãy s d ng CSDL c a ngân hàng gene NCBI đ tr l i các câu h i sau: ể ả ờ ỏ ử ụ t v gene này? (bao g m gene symbol, gene description, locus tag, ồ ủ • Thông tin tóm t ắ ề gene type, RefSeq status, organism, lineage). c c a gene (coding sequence)? ướ ủ
enzyme do gene đó mã hóa ướ ở ế ẩ B. subtilis? i các • Kích th • Có bao nhiêu amino acid trong phân t ử • Gene mã hóa cho amylase trên n m tr ằ • Gene ng chuy n hóa nào c a vi khu n trên liên quan đ n con đ ườ ở • Trên c s các k t qu đã tìm đ c, tìm hi u thêm các thông tin đ tr l ượ ơ ở c và sau gene nào trên NST? ủ ể ể ế ả ể ả ờ câu h i:ỏ ướ ủ B. subtilis ? c genome c a ụ ể ể ể ể ủ ế ế ữ ố ờ upstream (đ u 5’) c a gene này. ả ầ ủ coding sequence (CDS) và trình t ự ự i trên máy tính cho các bài t p ti p theo. i d ng FASTA và l u l d i. Kích th ii. S d ng công c Graphic đ hi n th v trí c a gene trên NST. Cho bi t v ế ị ử ụ ị ị trí c a gene đó trên NST? (đi m b t đ u và k t thúc). Tìm hi u các gene ủ ắ ầ lân c n và các kho ng tr ng gi a các gene. N u có th i gian hãy phân tích ậ trình t ự iii. Copy trình t ướ ạ amino acid c a gene này ủ ế ư ạ ậ
Ph n 3. Làm quen v i các công c phân tích CSDL
ụ
ớ
ầ
Truy c p vào các trang web sau:
http://www.ncbi.nlm.nih.gov/ http://www.ebi.ac.uk/embl/ ậ vii. viii.
ix. x. xi. xii. http://www.ddbj.nig.ac.jp/ http://www.ebi.ac.uk/uniprot/ http://expasy.org/ http://www.pdb.org/pdb/home/home.do
Câu h i:ỏ ủ 1. Cho k tên m t s công c phân tích c b n có trong các trang web trên. Nêu ý nghĩa c a ộ ố ơ ả ụ
2. Truy c p vào trang web (EMBL) http://www.ebi.ac.uk/embl/ ể chúng? ậ ụ ể ắ ọ nghĩa c a m t s công c phân tích c b n (ít nh t 5 nhóm công c ) ụ ủ ấ ộ ố ầ ẫ Homology. Hãy cho bi • Hãy quan sát các công c phân tích có trong m c Tools. K tên và nói ng n g n ý ơ ả • V n trong ph n Tools c a EMBL, tìm hi u nhóm công c phân tích Similarity & ể ụ ụ ụ ủ t ý nghĩa và m c đích s d ng c a các công c sau: ử ụ ụ ủ ụ ế
http://www.ncbi.nlm.nih.gov/Tools/ BLAST2-WU Protein BLAST2-WU Nucleotide BLAST2-NCBI BLAST2-NCBI Nucleotide BLAST2-NCBI EVEC PSI-BLAST (old version) PSI-BLAST (new version) PHI-BLAST FASTA Nucleotide FASTA Protein FASTA-Proteome Server FASTA-Genome Server FASTA-WGS Server ủ ị ỉ Hãy li i. ii. iii. iv. v. vi. vii. viii. ix. x. xi. xii. xiii. ậ t kê các công c phân tích và nêu ý nghĩa c a chúng ệ 3. Truy c p vào trang web c a NCBI theo đ a ch sau: ủ ụ
4. Truy c p vào trang web (ExPASy) http://expasy.org/ ầ ọ ụ ụ t có bao nhiêu nhóm công c phân tích proteomic? Trong m i nhóm công c , ế ậ Trong ph n Tools and Software, ch n m c ExPASy Proteomics tools. Hãy cho bi ỗ ụ hãy k ra ít nh t 2 công c phân tích và nêu ý nghĩa c a chúng? ụ ủ ể ấ
Ph n 4. Làm quen v i vi c phân tích CSDL trình t
sinh h c
ớ ệ
ầ
ự
ọ
4.1. Phân tích b n đ gi i h n ả ồ ớ ạ
ị ỉ ị
Truy c p vào các đ a ch sau: ậ Đ a ch Tên trang web ỉ NEB Cutter http://tools.neb.com/NEBcutter2/index.php Restriction/Mapper http://arbl.cvmbs.colostate.edu/molkit/mapper/index.html http://www.restrictionmapper.org/ http://www.ccsi.com/firstmarket/cutter/cut2.html insilico.ehu.es Webcutter In Silico Restriction
WatCut EnzymeX Silent http://watcut.uwaterloo.ca/watcut/watcut/ http://mekentosj.com/enzymex/ http://bioweb.pasteur.fr/seqanal/interfaces/silent.html
: t ý nghĩa c a các trang web trên ế ủ
ủ ề ả ặ ố ố ớ 3. Áp d ng t i. Cho bi Câu h iỏ 1. Hãy cho bi 2. Truy c p vào trang web NEB Cutter. Hãy paste trình t c a gene mã hóa cho enzym amylase ự ủ ồ ủ bài t p trên vào ô tr ng ho c đi n đ a ch ID c a gene. Quan sát b n đ c a ỉ ị ậ ớ ạ ự ớ ụ ạ i h n đ i v i gene trên. v i các công c trong các trang web còn l ấ ụ i h n cho k t qu t ồ ớ ạ t website nào cung ế ế t nh t (d thao tác, thu n ti n, k t ả ố ế ễ ệ ả ậ ậ c a ủ B. subtilis ở các enzym c t gi ắ ng t ươ c p công c phân tích b n đ gi ụ ấ qu hi n th rõ ràng). ị ả ể
Hình 3. K t qu phân tích b n đ gi i h n c a enzym alpha amylase c a ồ ớ ạ ủ ủ B. subtilis ế ả ả
4.2. Tìm ki m khung đ c m (ORF) ở ọ ế
Câu h iỏ 1. S d ng công c tìm ki m (search engine), tìm : ử ụ ụ ế ụ ọ ở ộ ố i tên và đ a ch c a các trang web đó. m t s công c phân tích khung đ c m ỉ ủ (open reading frame). Hãy vi 2. Truy c p vào trang web NCBI ậ ị ỉ : http://www.ncbi.nlm.nih.gov/gorf/gorf.html gene ho c đi n s GI c a gene vào ô tr ng sau đó Click vào ủ ố t l ế ạ theo đ a ch ị ề ố ặ ỏ
Copy và paste trình t OrfFind. Hãy tr l ả ờ • Có t • Gi ả ự i các câu h i sau. i đa bao nhiêu khung đ c m ? ố ở ọ i thích k t qu phân tích ORF ả ế
4.3. ng đ ng Tìm ki m ế trình t t ự ươ ồ :
nucleotide c a 1 gene có s ID: 9223824. ự ủ ố
Truy c p vào NCBI, hãy tìm trình t ậ Câu h i.ỏ Hãy cho bi tế : ng đ c s d ng làm gì ? ườ ượ ử ụ
t có bao nhiêu gene có trình t ử ụ ế t ự ươ ớ ng đ ng v i ồ 1. gene đó mã hóa cho protein, enzym gì ? Enzym này th 2. Tên loài sinh v t mang gene đó ậ 3. S d ng công c BLAST, hãy cho bi ụ trên. gene đã nêu ế ế ả ươ ấ ớ ấ trên ? c a các ở t gene nào cho k t qu t ữ ồ t s l i các ID c a nh ng gene đó? Cho bi ế ố ượ ở ự ủ ạ ự ệ ệ ự ng gaps và m c đ t 4. Hãy cho bi và ghi l gene này ? (ch tr ng khi th c hi n vi c alignment gi a 2 trình t ). Có th nh n xét gì v m i liên h gi a s l ề ố ng đ ng cao nh t và th p nh t v i gene ấ ng gaps khi so sánh trình t ữ ậ ồ ể ng đ ng gi a các trình t . ự ữ ủ ỗ ố ệ ữ ố ượ ứ ộ ươ