Giải trình tự gen thế hệ mới và ứng dụng chuẩn đoán bệnh

T H . S N G U Y Ễ N T H Á I Q U Ỳ N H A N H 0 4 / 2 0 1 4

Giải mã bộ gen người

2

10

2001: Giải mã bộ gen người 2.7G$, 11năm

8

) e c

6

2007: 454 1M$, 3 tháng

2008: ABI SOLiD 60K$, 2 tuần 2001: Celera 100M$, 3 năm

4

i r p ( 0 1 g o L

2010: 5K$, vài ngày?

2

2009: Illumina, Helicos 40-50K$

2012: 100$, <24 vài giờ?

2010

2000

2005 Year

Giải trình tự DNA

 Mục đích:

 Xác định thứ tự của các nucleotide (A,C,G và T) trên mạch

DNA của bộ gen

 Ứng dụng trong công nghệ sinh học: nghiên cứu, khám

phá, chuẩn đoán và điều tra

 Vấn đề

 Phương pháp giải trình tự DNA hiện tại chỉ hữu hiệu trên

mạch DNA (1-2 Kbp)

 Giải pháp

o Giải trình tự và lắp ráp những đoạn nhỏ bằng máy tính

Sanger Sequencing

1977

454 Sequencing

2005

Illumina sequencing

2006

ABI solid Sequencing

2007

Chiến lược chung

5

TG..GT

TC..CC

AC..GC

CG..CA

TT..TC

TG..AC

AC..GC

GA..GC

CT..TG

GT..GC

AC..GC AC..GC

AA..GC

AT..AT

TT..CC

Genome

Những đoạn DNA ngắn

Trình tự DNA ngắn

ACGTGGTAA CGTATACAC TAGGCCATA GTAATGGCG CACCCTTAG TGGCGTATA CATA…

ACGTGACCGGTACTGGTAACGTACA CCTACGTGACCGGTACTGGTAACGT ACGCCTACGTGACCGGTACTGGTAA CGTATACACGTGACCGGTACTGGTA ACGTACACCTACGTGACCGGTACTG GTAACGTACGCCTACGTGACCGGTA CTGGTAACGTATACCTCT...

ACGTGGTAATGGCGTATACACCCTTAGGCCATA

Trình tự genome

5

Phương pháp của Sanger (1977)

 Ưu điểm

 Đọc đoạn dài (~900bps)  Các nghiên cứu nhỏ

 Khuyết điểm

 Công nghệ  Đắt

Sanger

NGS Các mảnh DNA

Các mảnh DNA

Nối với các adaptor in vitro

Tạo dòng in vivo và nhân bản

Giải trình tự chu kì Hình thành polony array

Giải trình tự cyclic array >106 đầu đọc/array) Điện di 1 đầu đọc/ống mao dẫn

454 sequensing/Roche

Tiến trình: Chuẩn bị thư viện DNA Emulsion PCR Pyrosequencing

Emulsion PCR

1. Biến tính mảnh DNA

4. Biến tính: mạch ngược “gốc” biến tính từ hạt bead; mạch xuôi được nối với bead bởi khung phosphate đường DNA

5. Bám dính: mạch ngược bám lên bead, primer bám lên mạch xuôi

2. Bám dính: MỘT mảnh DNA (ngược) với adaptor trên bead

Kéo

6. Kéo dài: polymerase khuếch đại mạch xuôi từ hạt bead đến primersite; và mạch ngược từ primer đến bead

3. dài: Polymerase khếch đại mạch xuôi từ bead đến vị trí primer

7. Lặp lại 4-5-6 (30 -60 chu kì)

Pyrosequencing

 Cơ sở:

 Ánh sáng được phát ra tỉ lệ với số lượng nucleotide kếp hợp

1pmol DNA = 6*1011 ATP = 6*109 photons at 560nm

pyrophospate

Từ đom đóm, oxi hóa luciferin và tạo ra ánh sáng

Khuyết điểm

Ưu điểm

 Khó

tích các

phân homopolymer

 Chi phí cao => hạn chế với

 Chiều dài đọc 400 base (độ chính xác 99% tại base thứ 400 và cao hơn ở các base phía trước)  Công nghệ cao so với

Sanger sequencing

so re-sequencing SOLID sequencing

 Không cần lặp lại cloning  Thư viện DNA có thể được mã hóa và tách trong suốt quá riêng trình phâ tích kết quả.

Ilumina sequencing

Tiến trình: Chuẩn bị thư viện DNA Khuếch đại bắt cầu Giải trình tự đầu ngược (reversible termination)

Khuếch đại bắt cầu và giải trình tự bằng sinh tổng hợp

Khuếch đại bắt cầu x 35 chu kì Terminal transferase bổ sung ddNTP blocker

Kéo dài bởi Phusion DNA Polymerase Cắt periodate của một của những oligo Giải trình tự bằng sinh tổng hợp

Polony PCR

Solid sequencing

Tiến trình: Chuẩn bị thư viện DNA Emulsion/Wildfire PCR Giải trình tự ligation

Wildfire PCR

26

Sequencing: Fluorescently Labeled Nucleotides (ABI SOLiD)

Complementary strand elongation: DNA Ligase

27

Sequencing: Fluorescently Labeled Nucleotides (ABI SOLiD)

5 reading frames, each position is read twice

2009

Helicos single molecule sequencer

2011

Ion Torrent next generation Sequencer

2011

Pacific Bioscience single molecule sequencer

2012

Oxford nanopore technology

Helicos sequecing

Next next generation sequencing

32

Technology Summary

Read length

Cost (1mbp)*

Sequencing Technology

Throughput (per run)

Sanger

~800bp

Sanger

400kbp

500$

454

~400bp

Polony

500Mbp

60$

Solexa

75bp

Polony

20Gbp

2$

SOLiD

75bp

Polony

60Gbp

2$

Helicos

30-35bp

25Gbp

1$

Single molecule

*Source: Shendure & Ji, Nat Biotech, 2008

1. Giải trình tự gene hay bộ gen cho các nghiên cứu có liên

quan

2. Phát hiện các đột biến gene (liên quan đến ung thư, kháng thuốc), các SNP (trong cá nhân hóa các liệu pháp điều trị), các kiểu gene (genotype của virus gây bệnh)…

3. Định danh vi khuẩn hay vi nấm dựa trên giải trình tự DNA của gene qui định RNA của ribosome (16S của vi khuẩn và 28S của vi nấm) đặc biệt là các tác nhân khó định danh hay thất bại nuôi cấy từ mẫu thử

4. Phân tích đoạn xét nghiệm dấu vân tay DNA (DNA finger printing) để nhận dạng cá nhân và mối quan hệ cá nhân (pháp y), trong chẩn đoán tiền sanh, trong phát hiện đa dạng loài…

Qui trình chuẩn đoán gen IX factor gây bệnh hemophilia B

 Bệnh di truyền lặn liên kết nhiễm sắc thể giới tính X, gây ra do đột biến gen yếu tố IX.

 Đột biến điểm nằm rải rác khắp chiều dài của gen, chủ yếu ở nam do có 1 NST X.  Chuẩn đoán được đột biến gen yếu tố IX ở bệnh nhân là nền tảng để phát hiện kiểu gen dị hợp tử của người nữ

=> chuẩn đoán tiền sinh, phát hiện thai nhi mắc bệnh

 Gen FIX (8 exon, 7 intron) thiết kế primer cho các vùng promoter, exon, vùng polyA của gen FIX

 DNA máu ngoại vi  PCR=> giải trình tự từng đoạn

Đột biến T thành C => thay đổi acid amin 23 Leucin thành Prolin

Xác định khả năng gây bệnh của bất thường T >C ở gen FIX làm thay Leucin > Prolin bằng phần mền polyphene2

Khả năng gây bệnh của bất thường cao 0.98/1, độ nhạy 0.74, độ đặc hiệu 0.96

Xuất hiện 1 đỉnh tại vị trí c68 tương ứng với T => mang kiểu gen 2 allen bình thường nucleotide T

Xuất hiện 2 đỉnh tại vị trí c68 tương ứng với T và C => mang kiểu gen dị hợp, 1 allen bình thường nucleotide T và 1 allen đột biến nucleotide C

 Chuẩn đoán, xác định genotype HCV: vùng 5’NC =>

xác định nguồn gốc nhiễm trùng

 Phát hiện đột biến kháng thuốc HBV (lamivudine): đoạn 550 bp trên gen preS => 204, 204 + 207, 204+180, 204+207+180

 Giải trình tự phát hiện đột biến promoter

Định danh vi khuẩn

E.Coli 16S T. thermophilus 16S

Synechococsucs sp 16S

Nuôi cấy vi khuẩn từ mẫu bệnh phẩm Thu nhận dich đun sôi của vi khuẩn Primer 16-F và 16-R chứa trình tự đặt hiệu loài trên vi khuẩn (527bp) PCR – điện di – tinh sạch => giải trình tự NCBI

Định danh vi nấm

Vi nấm viêm xoang

Mẫu bệnh phẩm DNA toàn phần Primer 28-F và 28-R chứa trình tự đặt hiệu loài trên vi nấm trên gen 26s rDNA (200 bp) PCR – điện di – tinh sạch => giải trình tự NCBI

 Tình trạng phân hủy của mẫu mitDNA sequencing  Mẫu DNA cổ đại: gấu hang động, mamut, Neanderthal (106 bp )

Trở ngại: nhiễm DNA của con người hiện đại và bacteria

Ưu điểm

 Giải trình tự bộ gene, thậm chí 24h cho bộ gene

người

 Lôi ra ánh sáng bất cứ một trình tự nucleic acid của bất cứ tác nhân gì có mặt trong mẫu thử lấy từ vật chủ hay bệnh nhân

 Công cụ nhạy cảm nhất để có thể phát hiện các đột biến cho dù tỷ lệ đột biến hiện diện trong mẫu thử là rất thấp

 Chẩn đoán tiền sanh phát hiện dị bội của thai nhi bằng phân tích DNA của bào thai hiện diện trong máu mẹ dựa trên ưu điểm độ nhạy cao của kỹ thuật

THANK-YOU!

Photo by Douglas Macdonald Jeju Olle Trail -Korea