TIN SINH HỌC - CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC

Chia sẻ: Trần Anh Phuong | Ngày: | Loại File: PPT | Số trang:39

0
29
lượt xem
11
download

TIN SINH HỌC - CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

1.1. Khái quát chung về cơ sở dữ liệu sinh học Cơ sở dữ liệu sinh học (CSDL) trong chương này chủ yếu đề cập đến các thông tin về trình tự Axit nucleic (ADN, ARN), trình tự axit amin của các phân tử Protein, thông tin về cấu trúc và giải phẫu của một số Genom, mô hình cấu trúc không gian của các đại phân tử.

Chủ đề:
Lưu

Nội dung Text: TIN SINH HỌC - CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC

  1. Người hướng dẫn: TS.VÕ VĂN TOÀN Người thực hiện: TRẦN THỊ PHƯƠNG ANH
  2. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh học Cơ sở dữ liệu sinh học (CSDL) trong chương này chủ yếu đề cập đến các thông tin về trình tự Axit nucleic (ADN, ARN), trình tự axit amin của các phân tử Protein, thông tin về cấu trúc và giải phẫu của một số Genom, mô hình cấu trúc không gian của các đại phân tử.
  3. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh học 1.2. Cơ sở dữ liệu về các trình tự
  4. 1.2. Cơ sở dữ liệu về các trình tự Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự Nucleotide và Protein: - The EMBL Nucleotide Sequence Database - The GenBank sequence database - The DNA Data Bank of Japan (DDBJ) - The Swiss-Prot - Protein Information Resource (PIR)
  5. 1.2. Cơ sở dữ liệu về các trình tự Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự nucleotide và protein: a.EMBL Cơ sở dữ liệu trình tự nucleotide (còn được gọi là ngân hàng EMBL) cấu thành tài nguyên trình tự nucleotide chính của châu Âu.
  6. CSDL của EMBL/EBI
  7. 1.2. Cơ sở dữ liệu về các trình tự Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự nucleotide và protein: a. EMBL Cơ sở dữ liệu trình tự nucleotide (còn được gọi là ngân hàng EMBL) cấu thành tài nguyên trình tự nucleotide chính của châu Âu. b. GenBank là một phần của chương trinh hợp tác quốc ̀ tế về cơ sở dữ liệu trình tự nucleotide, bao gồm ngân hàng dữ liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinh học phân tử châu Âu (EMBL), và GenBank tại NCBI.
  8. b. GenBank là một phần của chương trinh hợp tác quốc ̀ tế về cơ sở dữ liệu trình tự nucleotide, bao gồm ngân hàng dữ liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinh học phân tử châu Âu (EMBL), và GenBank tại NCBI. GenBank là một bộ sưu tập của tất cả các trình tự DNA được công khai. Trong GenBank các cá nhân, các nhà khoa học từ khắp nơi trên thế giới, cũng như từ các trung tâm lớn tham gia vào dự án nghiên cứu bộ gen con người. Số lượng các trình tự DNA được lưu trữ trong cơ sở dữ liệu GenBank, từ tất cả các sinh vật, gần đây đã đạt đến số lượng khổng lồ và tiếp tục phát triển với một tốc độ nhanh chóng.
  9. 1.2. Cơ sở dữ liệu về các trình tự Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự nucleotide và protein: a. EMBL b. GenBank c. DDBJ Ngân hàng dữ liệu DNA của Nhật Bản là ngân hàng dữ liệu về các trình tự nucleotide duy nhất ở châu Á, đó là nơi chính thức thu thập trình tự nucleotide được tim ra bởi các ̀ nhà nghiên cứu .Cơ sở dữ liêu nay trao đổi các dữ liệu thu ̣ ̀ thập với Cơ sở dữ liêu EMBL viên tin sinh hoc châu âu ̣ ̣ ̣ và GenBank / NCBI trên cơ sở hàng ngày, ba cơ sở dữ liêu ̣ chia sẻ dữ liệu hầu như tât cả dữ liệu tại bất kỳ thời gian ́ ̀ nao.
  10. CSDL của DDBJ
  11. 1.2. Cơ sở dữ liệu về các trình tự Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự nucleotide và protein: a. EMBL b. GenBank c. DDBJ d. Swiss-Prot là một cơ sở dữ liệu protein. Cơ sở dữ liệu này cố gắng để cung cấp những thông tin ở mức độ cao bao gồm: các mô tả về chức năng của các protein và cấu trúc của nó, sự cải biến sau phiên mã, các dạng biến đổi và những thông tin khác.
  12. 1.2. Cơ sở dữ liệu về các trình tự Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự nucleotide và protein: a. EMBL b. GenBank c. DDBJ d. Swiss-Prot e. The Protein Information Resource (PIR) được tích hợp tài nguyên sinh học công cộng để hỗ trợ nghiên cứu di truyền, protein và nghiên cứu khoa học. Hiên nay, PIR cung cấp các nguồn lực hàng đầu thế ̣ giới để hỗ trợ cac dữ liệu protein và di truyền. ́
  13. CSDL của PIR
  14. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh 1.2.ọcơ sở dữ liệu về các trình hC Trong thập niên 70, các phương pháp cô lập trình tự ADN đã tự được thành lập và ý tưởng về lập bản đồ toàn bộ bộ gen được hình thành. Một số loài sinh vật (virút, E.coli, nấm men, ruồi giấm) đã nhanh chóng được nghiên cứu. Một danh sách cập nhật của tất cả các trình tự bộ gen hoàn toàn có sẵn tại http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=genomeprj. Thông tin về bộ gen của một số loài (con người, cây Arabidopsis, Saccharomyces cerevisiae) được cung cấp bởi MIPS (http://mips.gsf.de ) The Munich Information Center Protein Sequences.
  15. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh 1.2.ọcơ sở dữ liệu về các trình hC NCBI thành lập vào ngày 04 Tháng Mười Một 1988, như tự một bộ phận của Thư viện Y khoa Quốc gia (NLM ) tại Viện Y tế Quốc gia (NIH). NLM đã được lựa chọn do kinh nghiệm của họ trong việc tạo ra và duy trì cơ sở dữ liệu y sinh học. NIH là cơ sở nghiên cứu y sinh học lớn nhất trên thế giới.
  16. CSDL của NCBI
  17. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh 1.2.ọcơ sở dữ liệu về các trình hC Trình tự DNA tự GenBank http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html Cơ sở dữ liệu Nucleotide EMBL http://www.ebi.ac.uk/embl/index.html DDBJ (ngân hàng dữ liệu DNA Nhật Bản) http://www.ddbj.nig.ac.jp/
  18. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh 1.2.ọcơ sở dữ liệu về các trình hC tự Trình tự Protein UniProt (Universal Resource Protein) http://www.expasy.uniprot.org bao gồm SWISS-PROT, TrEMBL, PIR Cơ sở dữ liệu protein (NCBI) http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein
  19. Trình tự Protein : UniProt (Universal Resource Protein) http://www.expasy.uniprot.org
  20. CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC 1. CƠ SỞ DỮ LIỆU SINH HỌC 1.1. Khái quát chung về cơ sở dữ liệu sinh 1.2.ọcơ sở dữ liệu về các trình hC tự Protein cấu trúc Ngân hàng dữ liệu protein (PDB) http://www.rcsb.org/pdb/ cơ sở dữ liệu Mô hình hóa phân tử (NCBI) http://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.html
Đồng bộ tài khoản