Giải trình tự gen thế hệ mới và ứng dụng chuẩn đoán bệnh
T H . S N G U Y Ễ N T H Á I Q U Ỳ N H A N H 0 4 / 2 0 1 4
Giải mã bộ gen người
2
10
2001: Giải mã bộ gen người 2.7G$, 11năm
8
) e c
6
2007: 454 1M$, 3 tháng
2008: ABI SOLiD 60K$, 2 tuần 2001: Celera 100M$, 3 năm
4
i r p ( 0 1 g o L
2010: 5K$, vài ngày?
2
2009: Illumina, Helicos 40-50K$
2012: 100$, <24 vài giờ?
2010
2000
2005 Year
Giải trình tự DNA
Mục đích:
Xác định thứ tự của các nucleotide (A,C,G và T) trên mạch
DNA của bộ gen
Ứng dụng trong công nghệ sinh học: nghiên cứu, khám
phá, chuẩn đoán và điều tra
Vấn đề
Phương pháp giải trình tự DNA hiện tại chỉ hữu hiệu trên
mạch DNA (1-2 Kbp)
Giải pháp
o Giải trình tự và lắp ráp những đoạn nhỏ bằng máy tính
Sanger Sequencing
1977
454 Sequencing
2005
Illumina sequencing
2006
ABI solid Sequencing
2007
Chiến lược chung
5
TG..GT
TC..CC
AC..GC
CG..CA
TT..TC
TG..AC
AC..GC
GA..GC
CT..TG
GT..GC
AC..GC AC..GC
AA..GC
AT..AT
TT..CC
Genome
Những đoạn DNA ngắn
Trình tự DNA ngắn
ACGTGGTAA CGTATACAC TAGGCCATA GTAATGGCG CACCCTTAG TGGCGTATA CATA…
ACGTGACCGGTACTGGTAACGTACA CCTACGTGACCGGTACTGGTAACGT ACGCCTACGTGACCGGTACTGGTAA CGTATACACGTGACCGGTACTGGTA ACGTACACCTACGTGACCGGTACTG GTAACGTACGCCTACGTGACCGGTA CTGGTAACGTATACCTCT...
ACGTGGTAATGGCGTATACACCCTTAGGCCATA
Trình tự genome
5
Phương pháp của Sanger (1977)
Ưu điểm
Đọc đoạn dài (~900bps) Các nghiên cứu nhỏ
Khuyết điểm
Công nghệ Đắt
Sanger
NGS Các mảnh DNA
Các mảnh DNA
Nối với các adaptor in vitro
Tạo dòng in vivo và nhân bản
Giải trình tự chu kì Hình thành polony array
Giải trình tự cyclic array >106 đầu đọc/array) Điện di 1 đầu đọc/ống mao dẫn
454 sequensing/Roche
Tiến trình: Chuẩn bị thư viện DNA Emulsion PCR Pyrosequencing
Emulsion PCR
1. Biến tính mảnh DNA
4. Biến tính: mạch ngược “gốc” biến tính từ hạt bead; mạch xuôi được nối với bead bởi khung phosphate đường DNA
5. Bám dính: mạch ngược bám lên bead, primer bám lên mạch xuôi
2. Bám dính: MỘT mảnh DNA (ngược) với adaptor trên bead
Kéo
6. Kéo dài: polymerase khuếch đại mạch xuôi từ hạt bead đến primersite; và mạch ngược từ primer đến bead
3. dài: Polymerase khếch đại mạch xuôi từ bead đến vị trí primer
7. Lặp lại 4-5-6 (30 -60 chu kì)
Pyrosequencing
Cơ sở:
Ánh sáng được phát ra tỉ lệ với số lượng nucleotide kếp hợp
1pmol DNA = 6*1011 ATP = 6*109 photons at 560nm
pyrophospate
Từ đom đóm, oxi hóa luciferin và tạo ra ánh sáng
Khuyết điểm
Ưu điểm
Khó
tích các
phân homopolymer
Chi phí cao => hạn chế với
Chiều dài đọc 400 base (độ chính xác 99% tại base thứ 400 và cao hơn ở các base phía trước) Công nghệ cao so với
Sanger sequencing
so re-sequencing SOLID sequencing
Không cần lặp lại cloning Thư viện DNA có thể được mã hóa và tách trong suốt quá riêng trình phâ tích kết quả.
Ilumina sequencing
Tiến trình: Chuẩn bị thư viện DNA Khuếch đại bắt cầu Giải trình tự đầu ngược (reversible termination)
Khuếch đại bắt cầu và giải trình tự bằng sinh tổng hợp
Khuếch đại bắt cầu x 35 chu kì Terminal transferase bổ sung ddNTP blocker
Kéo dài bởi Phusion DNA Polymerase Cắt periodate của một của những oligo Giải trình tự bằng sinh tổng hợp
Polony PCR
Solid sequencing
Tiến trình: Chuẩn bị thư viện DNA Emulsion/Wildfire PCR Giải trình tự ligation
Wildfire PCR
26
Sequencing: Fluorescently Labeled Nucleotides (ABI SOLiD)
Complementary strand elongation: DNA Ligase
27
Sequencing: Fluorescently Labeled Nucleotides (ABI SOLiD)
5 reading frames, each position is read twice
2009
Helicos single molecule sequencer
2011
Ion Torrent next generation Sequencer
2011
Pacific Bioscience single molecule sequencer
2012
Oxford nanopore technology
Helicos sequecing
Next next generation sequencing
32
Technology Summary
Read length
Cost (1mbp)*
Sequencing Technology
Throughput (per run)
Sanger
~800bp
Sanger
400kbp
500$
454
~400bp
Polony
500Mbp
60$
Solexa
75bp
Polony
20Gbp
2$
SOLiD
75bp
Polony
60Gbp
2$
Helicos
30-35bp
25Gbp
1$
Single molecule
*Source: Shendure & Ji, Nat Biotech, 2008
1. Giải trình tự gene hay bộ gen cho các nghiên cứu có liên
quan
2. Phát hiện các đột biến gene (liên quan đến ung thư, kháng thuốc), các SNP (trong cá nhân hóa các liệu pháp điều trị), các kiểu gene (genotype của virus gây bệnh)…
3. Định danh vi khuẩn hay vi nấm dựa trên giải trình tự DNA của gene qui định RNA của ribosome (16S của vi khuẩn và 28S của vi nấm) đặc biệt là các tác nhân khó định danh hay thất bại nuôi cấy từ mẫu thử
4. Phân tích đoạn xét nghiệm dấu vân tay DNA (DNA finger printing) để nhận dạng cá nhân và mối quan hệ cá nhân (pháp y), trong chẩn đoán tiền sanh, trong phát hiện đa dạng loài…
Qui trình chuẩn đoán gen IX factor gây bệnh hemophilia B
Bệnh di truyền lặn liên kết nhiễm sắc thể giới tính X, gây ra do đột biến gen yếu tố IX.
Đột biến điểm nằm rải rác khắp chiều dài của gen, chủ yếu ở nam do có 1 NST X. Chuẩn đoán được đột biến gen yếu tố IX ở bệnh nhân là nền tảng để phát hiện kiểu gen dị hợp tử của người nữ
=> chuẩn đoán tiền sinh, phát hiện thai nhi mắc bệnh
Gen FIX (8 exon, 7 intron) thiết kế primer cho các vùng promoter, exon, vùng polyA của gen FIX
DNA máu ngoại vi PCR=> giải trình tự từng đoạn
Đột biến T thành C => thay đổi acid amin 23 Leucin thành Prolin
Xác định khả năng gây bệnh của bất thường T >C ở gen FIX làm thay Leucin > Prolin bằng phần mền polyphene2
Khả năng gây bệnh của bất thường cao 0.98/1, độ nhạy 0.74, độ đặc hiệu 0.96
Xuất hiện 1 đỉnh tại vị trí c68 tương ứng với T => mang kiểu gen 2 allen bình thường nucleotide T
Xuất hiện 2 đỉnh tại vị trí c68 tương ứng với T và C => mang kiểu gen dị hợp, 1 allen bình thường nucleotide T và 1 allen đột biến nucleotide C
Chuẩn đoán, xác định genotype HCV: vùng 5’NC =>
xác định nguồn gốc nhiễm trùng
Phát hiện đột biến kháng thuốc HBV (lamivudine): đoạn 550 bp trên gen preS => 204, 204 + 207, 204+180, 204+207+180
Giải trình tự phát hiện đột biến promoter
Định danh vi khuẩn
E.Coli 16S T. thermophilus 16S
Synechococsucs sp 16S
Nuôi cấy vi khuẩn từ mẫu bệnh phẩm Thu nhận dich đun sôi của vi khuẩn Primer 16-F và 16-R chứa trình tự đặt hiệu loài trên vi khuẩn (527bp) PCR – điện di – tinh sạch => giải trình tự NCBI
Định danh vi nấm
Vi nấm viêm xoang
Mẫu bệnh phẩm DNA toàn phần Primer 28-F và 28-R chứa trình tự đặt hiệu loài trên vi nấm trên gen 26s rDNA (200 bp) PCR – điện di – tinh sạch => giải trình tự NCBI
Tình trạng phân hủy của mẫu mitDNA sequencing Mẫu DNA cổ đại: gấu hang động, mamut, Neanderthal (106 bp )
Trở ngại: nhiễm DNA của con người hiện đại và bacteria
Ưu điểm
Giải trình tự bộ gene, thậm chí 24h cho bộ gene
người
Lôi ra ánh sáng bất cứ một trình tự nucleic acid của bất cứ tác nhân gì có mặt trong mẫu thử lấy từ vật chủ hay bệnh nhân
Công cụ nhạy cảm nhất để có thể phát hiện các đột biến cho dù tỷ lệ đột biến hiện diện trong mẫu thử là rất thấp
Chẩn đoán tiền sanh phát hiện dị bội của thai nhi bằng phân tích DNA của bào thai hiện diện trong máu mẹ dựa trên ưu điểm độ nhạy cao của kỹ thuật
THANK-YOU!
Photo by Douglas Macdonald Jeju Olle Trail -Korea