ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Văn Sáu
NGHIÊN CỨU SỰ PHÁT TRIỂN CỦA VIRUT CÚM
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: khoa học máy tính
HÀ NỘI 2009
1
Mc lc
Mc lc..................................................................................................................... 1
Lời nói đầu................................................................................................................ 3
Chương I. Giới thiu vsinh hc phân tvà tin-sinh hc ....................................... 4
1. Gii thiu vsinh hc phân t.............................................................................. 4
2. Gii thiu vtin-sinh hc ..................................................................................... 5
2.1. Sắp hàng đa chuỗi ......................................................................................... 5
2.2. Cây tiến hóa ................................................................................................... 7
Chương II. Virut cúm ............................................................................................... 8
1.Sơ lược vvirut cúm ............................................................................................. 8
2. Các loi virut cúm ................................................................................................ 8
3. Cu trúc và tính cht............................................................................................ 9
4. Mt sthng kê và slây lan ca virut cúm...................................................... 10
4.1. Mt sthng kê vdch cúm ...................................................................... 10
4.2. Slây lan ca virut cúm ............................................................................. 12
Chương III. Ngân hàng gene virut cúm.................................................................. 13
1. Gii thiu tng quan ........................................................................................... 13
2. Các chức năng đã xây dng................................................................................ 13
2.1. Quá trình xây dng ngân hàng gene ............................................................ 14
2.1.1. Quá trình thu thp dliu chi tiết cho Vit Nam .................................. 15
Nghiên cứu sự phát triển của virut cúm
2
2.1.2. Xây dựng cơ sở dliu.......................................................................... 16
2.2. Tìm kiếm các chui...................................................................................... 21
2.3. Tin ích ti chui.......................................................................................... 23
2.4. Tiện ích sắp hàng đa chuỗi........................................................................... 23
2.5. Tiện ích xây dng cây tiến hóa .................................................................... 24
2.6. Bản đồ phân bca virut cúm ..................................................................... 25
2.6. Biểu đồ thng kê vvirut cúm ..................................................................... 28
Tài liu tham kho .................................................................................................. 31
Các hình nh tham kho ......................................................................................... 33
Các bng tham kho ............................................................................................... 35
Nghiên cứu sự phát triển của virut cúm
3
Li nói đu
Tin-sinh hc (Bioinformatics) mt lĩnh vực nghiên cứu đang phát trin rt
mnh m. Tin-sinh hc áp dng những phương pháp trong tin hc để gii quyết
các bài toán trong sinh hc phân t. Vi sphát trin mnh mca công nghsinh
hc, mt khối lượng ln dliu sinh hc phân t(gene, protein, genome) đã được
thu thập, lưu trữ chia sti các ngân hàng dliu thếgiới như NCBI (National
Center for Biotechnology Information). Tin sinh hc hiện đang được ng dng
phbiến trong sinh hc phân t, y-dược hc, nông nghip, công nghthc phm,
môi trường và kim soát bnh.
Hin nay, tin-sinh học đang được ng dng rng trong vic phát hin
kim soát bnh. Mt trong các ng dng cth kim soát bnh cúm, vi các
dch bệnh đang lây lan như cúm gia cầm H5N1, cúm H1N1. Để góp phn vào vic
cung cp thông tin, cũng như các công cụ phân tích cho vic kim soát bnh cúm
Vit Nam, đề tài tp trung vào nhng mc tiêu chính sau: (1) cung cp dliu v
cúm trên thếgii và Vit Nam, (2) cung cp các công c phân tích cơ bản như tìm
kiếm, sắp hàng đa chuỗi, xây dng cây tiến hóa, (3) cung cp dliu vvirut cúm
chi tiết ti tng tnh thành ca Vit Nam, (4) cung cp bản đồ phân tán ca virut
cúm trên thếgii và cho các tnh thành Vit Nam, (5) cung cp biểu đồ thng kê
virut cúm cho các vùng ca Vit Nam, và trên thếgii”.
Đề tài hy vng sgóp phn vào vic nghiên cu kim soát các dch bnh
liên quan đến virut cúm Vit Nam.
Nghiên cứu sự phát triển của virut cúm
4
Chương I. Giới thiệu về sinh hc phân tử và tin-sinh học
1. Giới thiệu về sinh học phân tử
Mọi thể sống đều cu to tcác tếbào.
Tếbào có cu to gm v và nhân, trong đó
nhân tếbào cha ADN (hoc ARN). Hình
1 mô tcu to ca tếbào.
ADN (acid deoxyribo nucleic) mang
thông tin di truyn, được cu to t4 thành
phn bản (gọi các nucleotide
Brown, 2000) Adenine (A), Cytosine (C),
Guanine (G), Thymine (T) như hình 2.
Trong các chuỗi ADN, một số đoạn được
gọi là gene mang thông tin di truyn ca các
loài sinh vt. Các nucleotide trong gene s
kết hp với nhau để tng hp ra protein. C
thlà, mt bba nucleotide liên tiếp sto
ra 1 axit amin. 20 loi axit amin khác
nhau (Brown, 2002) Phe (Phenylalanine),
Leu (Leucine), Ser (Serine), Tyr (Tyrosine),
Cys (Cysteine), Trp (Tryptophan), Pro (Pro-
line), His (Histidine), Gln (Glutamine), Arg
(Arginine), Ile (Isoleucine), Thr (Threonine), Asn (Asparagine), Lys (Lysine), Val
(Valine), Ala (Alanine), Asp (Aspartic Acid), Glu (Glutamic Acid), Gly (Glycine).
Hình 3 tskết hp ca các ADN để to ra các axit amin. Tcác axit amin
này to nên các protein bng cách liên kết vi nhau. Ssp xếp khác nhau s
lượng khác nhau ca các axit amin to thành vô scác protein khác nhau.