• GEN VÀ GENOME CỦA SINH VẬT
HAI HỆ THỐNG SINH VẬT
• Dựa trên cơ sở cấu trúc và thành phần tế bào:
– Sinh vật tiền nhân (Prokaryote) đại diện là các vi
khuẩn (Bacteria) và tảo lam (Cyanobacteria);
– Sinh vật nhân chuẩn (Eukaryote).
PROKARYOTE
• Chưa có nhân hoàn chỉnh •
•
Không có phần lớn các bào quan và màng nhân, có vùng tương tự nhân gọi là nucleoid; Bộ gen gồm DNA cấu trúc sơ khai và cuộn với protein histone gọi là nhiễm sắc thể sơ khai.
• Prokaryote phân chia tế bào theo kiểu phân đôi, không
có trung thể, không hình thành sợi tơ vô sắc và không có ty thể.
• DNA vòng nhỏ gọi là plasmid; • Các yêú tố di truyền ngoài nhiễm sắc khác.
EUKARYOTE
• Cấu trúc nhân hoàn chỉnh với màng nhân kép bao quanh,
thỉnh thoảng bên trên có chứa các lỗ nhân.
• Hệ thống màng phức tạp, chứa mạng lưới nội chất (nhẵn
và hạt), bộ máy Golgi, lysosome, ty thể và lục lạp (ở sinh vật quang hợp).
• Nhiễm sắc thể của eukaryote thẳng, có cấu trúc phức tạp
giữa DNA, RNA và các protein histone.
• Gene di truyền
– Thời Mendel (1865), gen là yếu tố quyết định sự hình thành và phát triển một tính trạng bên ngoài. Có thể nói mỗi gen Mendel là một nhiễm sắc thể
– Morgan (1926) cho rằng: không phải một gen mà nhiều gen cùng nằm trên một nhiễm sắc thể và là các đơn vị không thể chia nhỏ hơn được nữa.
– Theo giả thuyết ”một gen – một enzym” của G.Beadle và E.Tatum (1940) cho rằng mỗi gen quyết định sự tồn tại và hoạt tính của một enzym.
• Gene phân tử: là trình tự trên DNA cần thiết để tổng hợp 1 sản phẩm chức năng có thể là polypepDt hoặc RNA – Gene tổng hợp mRNA mang thông Dn qui định
chuỗi polypepDt
– Gene tổng hợp tRNA, rRNA tham gia quá trình
dịch mã tổng hợp protein
DNA và gene ở prokaryote
Plasmid trong tế bào chất
Lông roi
NST trần, dạng vòng
- Prokaryote không có cấu trúc nhân hoàn chỉnh, DNA được cô đặc trong vùng nhân. Ngoài ra, còn có DNA khác là các plasmid, nó cũng có dạng vòng nhưng nhỏ hơn DNA nhiễm sắc thể
-‐ Phân tử DNA ở prokaryote không cuộn xoắn với protein histon và nhiễm sắc thể là một phân tử DNA trần dạng vòng.
Cấu trúc 1 gene ở prokaryote
- Các gene nằm trong một nhóm gọi là Operon.
- 1 operon mang thông tin qui định sự tổng hợp, điều hòa một số protein chức năng.
Operon mang gene tổng hợp Triptophan ở vi khuẩn E.coli
Trình tự khởi động (promoter) của prokaryote
Bắt đầu phiên mã
Hộp Pribnov
3’
5’
DNA
TATAAT
TTGACA
+1 -‐35 -‐10
Cấu trúc Operon ở vi khuẩn P
Transcription
Operator region
c
a
b
-10
-35
+1
-35 -10 +1 5’
T 3’
mRNA
RNA polymerase
A
B
C
10
Cấu trúc gen ở sinh vật Eukaryote (nhân chuẩn, nhân thật)
Khung đọc mã
Promoter
Kết thúc
Bắt đầu phiên mã 5UTR
phiên mã
Hộp AGGA/CAAT
Intron
Kết thúc dịch mã UAA, UAG, UGA
(-75)
3UTR
Bắt đầu dịch mã AUG
3’
5’
Exon
Tín hiệu chuyển peptit
Hộp TATA (-25)
AATAAA Tín hiệu poly A hóa
Vị trí gắn riboxom
Vùng upstream
Vùng downstream
Cấu trúc gen của sinh vật nhân chuẩn
• Exon là trình tự mang thông tin di truyền, nằm ở 3 vùng nhất
định của gen, thường được mã hóa sang protein. – Vùng không dịch mã thành protein, làm tín hiệu bắt đầu phiên mã
tạo RNA và chứa trình tự định hướng mRNA vào ribosome để dịch mã tạo protein.
– Vùng hai gồm các exon chứa thông tin di truyền dịch mã thành trình
tự amino acid của protein.
của các gen khác nhau, nhưng chúng đều có một số nucleotide nằm ở 2 đầu các intron rất giống nhau, các nucleotide này tham gia vào quá trình cắt intron.
– Vùng ba được phiên mã thành một phần của mRNA chứa tín hiệu để kết thúc phiên mã và cho phép gắn thêm đuôi poly A vào mRNA. Intron hay trình tự ‘câm’’,không mang thông tin di truyền. • • Có rất ít trình tự tương đồng giữa các intron của một gen và
Cấu trúc gen của sinh vật nhân chuẩn
• Trình tự không dịch mã đầu 5’ UTR (untranslation region) được tính từ nucleotide phiên mã đầu tiên đến bộ 3 nucleotide khởi đầu dịch mã AUG hoặc GUG.
• Trình tự không dịch mã đầu 3’ UTR được tính từ một trong 3 codon dừng dịch mã đến hết trình tự kết thúc phiên mã.
• Trình tự kết thúc phiên mã của nhiều gen có trình
tự như sau: – 5’-CCCAGCCCGCCTAATGAGCGGGCTTTTTTT- 3’
Cấu trúc gen của sinh vật nhân chuẩn VÙNG KHỞI ĐỘNG
• - Vùng khởi động (promoter) của nhiều
gen sinh vật eukaryote đều có chung một số trình tự ở hộp CAAT (- 75) và TATA (-25).
Bắt đầu phiên mã
Vùng trình tự của gen điều khiển
Hộp CAAT
Hộp TATA
3’
5’
DNA
TATAAAA
GGCCAATCT
-75
+1
-25
Cấu trúc gen của sinh vật nhân chuẩn (Tiếp)
• -Các dấu hiệu gắn chuỗi poly A của mRNA có trình tự 5’- AAUAAA-3’
• Vùng này nằm ở ngay trước đầu 3’nơi bắt đầu gắn polyA, dài từ 10 đến 30 nu, tiếp theo là vùng CA, rồi đến vùng giầu GU.
Cấu trúc gen của sinh vật nhân chuẩn (Tiếp)
• Khung đọc mở hay khung đọc mã (open reading frame, ORF): bắt đầu từ một codon khởi đầu AUG và kết thúc bằng một trong 3 mã kết thúc là UAA/UAG/UGA.
• Mỗi bộ 3 nucleotide của khung đọc mở tương
ứng với một codon mã hóa cho một amino acid. Khung đọc mở được đọc từ đầu 5’ - 3’ dọc theo phân tử mRNA, đọc từng mã một, đọc không chồng chéo và đọc cho đến tận mã kết thúc thì dừng lại.
Gồm 3 vùng chính
1. Vùng khởi động (promoter): ở nhiều gen của sinh vật nhân chuẩn đều có chung một số trình tự ở hộp CAAT (-75) và TATA (-25)
2. Khung đọc mã (khung đọc mở): các bộ 3 nu kế tiếp nhau gồm các đoạn exon (mang thông tin di truyền) xen kẽ các đoạn intron (không mang thông tin di truyền)
3. Trình tự kết thúc phiên mã: trình tự 5’ – CCCAGCCCGCCTAATGAGCGGGCTTTTTT-3’ Chứa 2 đoạn dài 7 nu có trình tự bổ sung . Khi phiên mã tạo mRNA, ở đó hình thành cấu trúc kiểu “kẹp tóc” làm dừng quá trình phiên mã
Vùng khởi động
Có thể: - mỗi gen có một trình tự promoter nhất định
- nhiều gen có một trình tự promoter giống nhau
Khung đọc mã
Bắt đầu bằng một codon khởi đầu: AUG hoặc GUG Kết thúc bằng một trong 3 mã kết thúc; UAA/UAG/ UGA
Chức năng của gene phân tử
1. Tái bản 2. Phiên mã tạo RNA 3. Dịch mã = sinh tổng hợp protein
dựa trên khuôn mRNA
Structure of a gene (prokaryote and eukaryote)
Upstream vs Downstream
Downstream Upstream
Gene Sense strand
3'
5'
5'
3' Promoter region
Antisense strand
5'
3'
Transcription direction
Typical gene structure of prokaryote
Promoter region • Shine-Dalgarno box (AGGAGG) • Pribnow box (TATAAT) • Position-35 (TTGACA)
5’
3’
ORF
Start codon
Stop codon
23
Terminator
Typical gene structure of prokaryote
+1
-10
-35
3‘
5‘
Pribnow box
Shine- Dalgarno
TTGACA
TATAT
AGGAGG
ATG AUG
TAG/TAA/TGA UAG/UAA/UGA
Start codon
Stop codon
RNA pol binding position
Positon for recognization of RNA pol
Promoter region
24
Genome là gì???
Photo of intracellular bacterium courtesy of Gregory P. Henderson and Grant J. Jensen, California InsDtute of Technology
Photo of free-‐living bacterium courtesy of Karl O. Steper, Universität Regensburg
Photo of unicellular eukaryote courtesy of Eishi Noguchi, Drexel University College of Medicine
Photo of mulDcellular eukaryote courtesy of Carolyn B. Marks and David H. Hall, Albert Einstein College of Medicine, Bronx, NY
Genome là gì???
Photo of higher plant courtesy of Keith Weller/USDA
Photo of mammal © Photodisc
GENOME
1. Khái niệm: Genome là một khái niệm dùng để chỉ toàn bộ các gen có trong một giao tử đơn bội. Lượng DNA của genome có trong một tế bào sinh vật, bao gồm tất cả các gen và các đoạn DNA giữa các gen.
• Genome của Eukaryote rất phức tạp về cấu trúc và chức năng. Hầu hết các Eukaryote đều chứa thông tin di truyền nằm trong các tổ chức khác nhau như: nhân, ty thể, lục lạp (có ở các sinh vật quang hợp).
• Thông tin di truyền còn có ở trong một số virus,
viroid, vi khuẩn sống ký sinh.
09_25_Chromosome22.jpg
Số lượng gen
6000 genes ở nấm men; 18,500 ở giun; 13,600 ở ruồi dấm; 25,000 ở cây Arabidopsis; và khoảng 20,000 tới 25,000 ở chuột và người; ở lúa lại có tới 40 000 gene.
Số lượng gen ở một số sinh vật nhân chuẩn
Số gen và NST trong một số sinh vật
Loài
DNA tổng số (bp)
Số lượng gen
Số nhiễm sắc thể (2x)
4.639.221
1
4.405
Vi khuẩn (Escherichia coli)
12.068.000
16
6.200
Nấm men (Saccharomyces cerevisiae)
97.000.000
12
19.000
Tuyến trùng(Caenorhabditis elegans)
125.000.000
10
25.500
Thực vật (Arabidopsis thaliana)
180.000.000
18
13.600
Ruồi dấm (Drosophila melanogaster)
480.000.000
24
57.000
Lúa nước (Oryza sativa)
2.500.000.000
40
30.000-35.000
Chuột (Mus musculus)
46
3.200.000.000
30.000-35.000
Người (Homo sapiens)
Kích thước genome
Ở người: chiều dài trung bình của 1 gen là 27kb.
Ý nghĩa của việc xen kẽ các vùng intron và exon?
Genome là toàn bộ các gen có trong một giao tử đơn bội của loài
Genome nhân
-‐ Genome của nhân được cấu trúc từ bộ nhiễm sắc thể gồm các cặp tương đồng - Genome ở nhân của các loài khác nhau chứa hàm lượng DNA khác nhau. - Bộ nhiễm sắc thể trong nhân có số lượng, kích thước và hình dạng xác định khác nhau đặc trưng theo từng loài
Các loại DNA trong genome nhân
(1) Loại DNA lặp lại ở mức độ cao:
•
Thường chiếm khoảng 10% DNA của mỗi tế bào Trình tự ngắn dưới 10 cặp bazơ
• • Có từ 105 – 107 bản sao cho mỗi genome. • Những trình tự này thường không mã hoá và thường gắn các vùng chuyên biệt trên nhiễm sắc thể
Các loại DNA trong genome nhân
2. Loại DNA có trình tự lặp lại thấp hoặc trung bình: - -
chiếm khoảng 20%. chứa các đoạn lặp lại có kích thước lớn hơn (100 cặp bazơ, được lặp lại từ một vài đến hàng ngàn lần
- Một số trong chúng có chức năng mã hoá tạo ra rRNA,
mRNA hay rRNA 5S.
- Ví dụ 2 gen tạo histone và RNA ribosome là các gen lặp lại nhiều lần trong genome nhân. Genome nhân của V.faba có khoảng 4750 gen tạo ra rRNA trong khi đó genome của V.sativa chỉ có khoảng 1875
Các loại DNA trong genome nhân
(3) Loại DNA chứa trình tự duy nhất: - chiếm khoảng 70%. - Chỉ có một bản và những trình tự này chỉ lặp lại
đôi lần, mã hoá cho các protein.
- Trong hầu hết các cây trồng, chỉ có khoảng 20 - 40% của bộ genome là có chứa trình tự DNA chỉ lặp lại một lần.
The Repetitive DNA Content of Genomes
Các loại DNA trong genome nhân
• DNA mã hóa • DNA không mã hóa
– Nhóm lặp lại nhiều lần – Nhóm ít lặp – Nhóm không lặp
Genome ty thể
Genome ty thể
Chức năng/ Sản phẩm
Gen
Bộ máy dịch mã
RNA ribosome
rrn5, rrn18, rrn26
Protein ribosome
rps1,rps3, rps7, rps12
Bán phân tử nhỏ
rps13, rps14, rps19
Bán phân tử lớn
rp12, rp15, rp116
RNA vận chuyển
Ít nhất là 16
Các bán phân tử của các chuỗi hô hấp
NADH dehydrogenase
nad1, nad2, nad3, nad4, nad41, nad5, nad6, nad7, nad9
Cytochrome b
Cob
Cytochrome c oxidase
cox I, coxII, coxIII
ATP synthase
atp1, atp16, atp9
Cytochrome c biogenesis
Ít nhất là 4 gen
Khung đọc mã bảo thủ
Ít nhất đã biết 10 gen
(conserved open reading frames)
Genome ty thể
• Số lượng bản sao của genome ty thể còn chưa được biết rõ: - có từ 5 – 10 genome/ty thể. - Ví dụ: Mỗi ty thể của người có khoảng 10 phân tử giống nhau (khoảng 8000/tế bào), trong khi ở S. cerevisiae số lượng này là khoảng 6500, gần 100 genome /1 ty thể
• DNA ty thể tồn tại chủ yếu ở dạng mạch vòng kép, đôi khi có xuất hiện dạng mạch thẳng như: nấm men, Paramecium, Chlamydomonas.
Genome ty thể
• Thông tin di truyền trong genome ty thể: genome ty thể chứa các gen mã hóa cho rRNA của ty thể và một số enzyme protein tham gia vào chuỗi hô hấp. • Ngoài ra, ty thể còn chứa các gen mã hóa tRNA, protein ribosome và một số protein khác liên quan đến quá trình phiên mã, dịch mã, và vận chuyển các protein khác vào ty thể từ tế bào chất.
Genome lục lạp
Genome lục lạp
Genome lục lạp
• Lục lạp chứa DNA ở dạng các phân tử kép có cấu
trúc vòng. Mỗi lục lạp chứa nhiều phân tử DNA, tuy nhiên mỗi phân tử DNA đều chứa các gen giống nhau.
• Thông tin di truyền chứa trong genome lục lạp: hầu hết genome của lục lạp có khoảng 200 gen. Các gen này mã hoá cho các RNA ribosome và vận chuyển đồng thời mã hoá cho các protein của ribosome và các protein cần cho hoạt động quang hợp.
Các gen của lục lạp và chức năng
Gen Số Intron Chức năng Ghi chú
tRNA trnL – UAA 1
tRNA TrnI - GAU 1
tRNA TrnA - UGC 1
tRNA TrnV - UAC 1
tRNA TrnG - UCC 1
tRNA TrnK - UUU 1
Rps12 3 exon Protein ribosome Gắn Trans
AtpF1 1 Bán phân tử của ATP synthase
Rps16 1 Protein ribosome
NdhA 1 Bán phân tử NADH dehydrogenase
NdhB 1 Bán phân tử NADH dehydrogenase
1 23 Sr ADN 23S rRNA
Genome của vi khuẩn
• Có rất ít trình tự DNA lặp lại • Phần lớn các vi khuẩn chỉ có một nhiễm sắc thể/tế bào. DNA của vi khuẩn cũng ở dạng vòng, chuỗi kép • Vi khuẩn còn chứa dạng DNA khác được gọi là plasmid có kích thước bé hơn, dạng vòng, có khả năng tự nhân bản. Các plasimid thường chứa một số gen có tính đặc thù cao.
Vi khuẩn (tiếp..)
• Có 2 dạng gen nhảy
– Dạng gồm trình tự di truyền vận động TG
(transposase gene) nằm giữa 2 đoạn lặp cùng chiều IR (inverted repeat) còn gọi là đoạn xen IS (insert sequence dài 800-1500bp). Đoạn IS có thể gắn vào DNA NST hoặc plasmid làm thay đổi trình tự gene và có thể tách ra, trình tự đoạn gen trở lại như cũ. – Gen nhảy kết hợp với gen mã hóa chất kháng sinh àcó thể sử dụng đặc trưng về kích thước, trình tự đoạn IS để chẩn đoán bệnh nhiễm khuẩn bằng kỹ thuật PCR
Plasmid
• Kích thước 1 - 200 Kb. Mỗi plasmid có chứa
một trình tự gốc tái bản DNA (ORI).
• Một số plasmid có mặt khoảng từ 10 - 100 bản sao trong một tế bào ký chủ, đây là những plasmid có số lượng bản sao lớn. • Một số plasmid khác chỉ chứa từ 1 - 4 bản
sao trong một tế bào và được gọi là plasmid có số lượng bản sao thấp.
• Lượng DNA plasmid trong một tế bào vi
khuẩn rất ít khi vượt quá 0,1 đến 5% DNA
tổng số vi khuẩn.
Virus
• Virus chưa có cấu tạo tế bào,
bộ gen virus có cấu trúc tương đối đơn giản, số lượng gen ít.
• Các họ virus khác nhau có cấu trúc vật chất di truyền khác nhau là RNA hoặc DNA
• Có các nhóm
– RNA sợi đơn: là dạng phổ biến – RNA sợi kép: ít gặp (Reovirus – gây bệnh sốt
lưỡi xanh ở cừu)
– DNA sợi đơn: phage M 13, phage ϕ X174
Virus (tiếp)
• Trong bộ gen virus có những vùng thay đổi mạnh (hypervariable region), tính chất này giúp virus thích ứng nhanh với điều kiện thay đổi của môi trường.
• Virus RNA tái bản nhờ hoạt động của enzyme phiên mã ngược reverse transcriptase, từ RNA tạo cDNA dùng làm khuôn cho quá trình phiên mã.
Genome virus
Virus Độ lớn của DNA virus (bp) Chiều dài của DNA virus (nm) Đường kính chiều dài của thể virus (nm)
5.386 1.939 25 φX174
T7 39.936 14.377 78
Kích cỡ DNA của một số virus
48.502 17.460 λ(lambda)
Thể thực khuẩn -‐ Phage
+ Genome thể sống ký sinh
• Một số tế bào, mô ở một số sinh vật có thể còn
có các thể sống ký sinh bên trong.
• Thể sống ký sinh có thể có lợi nhưng đa phần là
có hại đó là virus, viroid, nấm, sán, giun, vi khuẩn…và chúng cũng có genome riêng và cũng có chứa các gen mang thông tin di truyền tạo ra polypeptide.
• Nếu các gen hoạt động thì cũng biểu hiện hoặc đóng góp vào sự biểu hiện nên tính trạng của sinh vật.
Đặc điểm
Prokaryote
Eukaryote
Kích thước Genome (bp)
104-‐107
108-‐1011
Các trình tự DNA lặp lại
Một số
Nhiều
Đoạn DNA không mã hóa xen với đoạn mã hóa
Hiếm
Phổ biến
Không
có
Quá trình phiên mã và dịch mã diễn ra riêng biệt DNA tách nhau ra trong nhân
Không
có
DNA liên kết với protein
Chỉ một số ít
Nhiều loại
Vùng khởi động
Có
có
Vùng tăng cường/ức chế trên DNA
Hiếm
Phổ biến
Sự gắn mũ và đuôi polyA vào mRNA
Không
Có
Sự cắt, nối mRNA
Hiếm
Phổ biến
Số nhiễm sắc thể
Một
Nhiều
DNA lặp lại trong genome
Các loại DNA lặp lại trong hệ gen
DNA di động và cơ chế chuyển vị
Các loại DNA lặp lại trong hệ gen
Trình tự lặp lại liền kề (Tandemly repeated DNA)
Trình tự lặp lại phân bố rải rác trong genome
Trình tự lặp lại liền kề (Tandemly repeated DNA)
Đoạn DNA chứa những trình tự lặp lại liền nhau hình thành nên các băng vệ tinh khi phân tích DNA bằng phương pháp ly tâm chênh lệch tỷ trọng
Trình tự DNA lặp lại liền kề trên NST ruồi giấm
Một gen có thể chứa nhiều loại DNA vệ tinh với đơn vị lặp lại khác nhau
Kích thước đơn vị lặp lại: <5bp hay >200bp
Minisatellite
Là đoạn DNA có đơn vị lặp lại <25bp, chiều dài khoảng 20 kb
hpp://flylib.com/books/en/2.643.1.51/1/
Microsatellite Đơn vị lặp lại ngắn: 4bp hoặc ngắn hơn, chiều dài <150 bp
orchid.or.jp
Trình tự lặp lại phân bố rải rác trong genome
Các yếu tố di truyền có khả năng di động giữa các vị trí khác nhau trong một hay nhiều gen đã tạo ra các trình tự lặp lại phân bố rải rác trong genome
DNA di động (transposon)
Cấu trúc chung
Trình tự lặp lại ngược chiều (IR)
Chuyển vị qua RNA
Retroposon
Phiên mã
Phiên mã ngược
cDNA
Tái tổ hợp
Retroposon(mới)
Retroposon (cũ)
RNA
Chuyển vị không qua RNA
Vị trí cho
Vị trí nhận
Cơ chế tự tái bản, số lượng transposon tăng lên sau mỗi lần sao chép
Cơ chế bảo tồn, số lượng transposon không tăng lên
Vị trí nhận Vị trí cho
Vị trí nhận Vị trí cho
Trình tự chèn (IS)
IS1 ở E.coli
Xác định gene trong genome?
• Tìm kiếm gene hoặc dự đoán gene là quá trình xác định gene trong chuỗi trình tự DNA hoặc trong toàn bộ genome
Where am I?
72
Lập bản đồ genome
• Lập bản đồ gene (genome mapping) là việc chỉ ra vị trí và các thông tin sinh học vào của những đoạn DNA trên NST.
• Bản đồ di truyền: sử dụng các kỹ thuật di truyền kinh điển (lai, nghiên cứu phả hệ) để xác định các gene, vùng DNA liên quan đến tính trạng, kiểu hình. Khoảng cách giữa các gene được xác định thông qua tần số trao đổi chéo.
• Bản đồ vật lý: sử dụng các kỹ thuật SHPT hiện đại để xác định trình tự và khoảng cách của các gene, DNA theo chiều dài vật lý.
Bản đồ gene
Footprinting technique
Sequence alignment of the promoter sequenes in E.coli
77
• The promoter sequence is variable • RNA pol can recognize many different promoters
Hoạt động của gen
• Một gen - đơn vị DNA tái bản quyết định
hoặc tạo nên tính trạng.