ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN ---    ---

Ngô Kim Ngân

ỨNG DỤNG PHƯƠNG PHÁP GIẢI TRÌNH TỰ THẾ HỆ MỚI (NGS)

ĐỂ PHÂN TÍCH GEN HBB Ở NGƯỜI NGHI NGỜ MANG ĐỘT BIẾN

GÂY BỆNH β-THALASSEMIA

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2020

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN ---    ---

Ngô Kim Ngân

ỨNG DỤNG PHƯƠNG PHÁP GIẢI TRÌNH TỰ THẾ HỆ MỚI (NGS)

ĐỂ PHÂN TÍCH GEN HBB Ở NGƯỜI NGHI NGỜ MANG ĐỘT BIẾN

GÂY BỆNH β-THALASSEMIA

Chuyên ngành: Di truyền học

Mã số: 8420101.21

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. DƯƠNG QUỐC CHÍNH

TS. TRẦN ĐỨC LONG

Hà Nội – 2020

Lời cảm ơn

Để thực hiện thành công khóa luận tốt nghiệp này, em xin gửi lời cảm ơn sâu

sắc đến Tiến sĩ Dương Quốc Chính, Trưởng khoa Di truyền - Sinh học phân tử,

Viện Huyết học – Truyền máu Trung ương cùng với Tiến sĩ Trần Đức Long người

đã hướng dẫn, chỉ bảo tận tình trong suốt thời gian em thực hiện luận văn.

Em xin gửi lời cảm ơn đến Thạc sĩ Nguyễn Lê Anh, Thạc sĩ Trần Tuấn Anh

cùng toàn thể nhân viên khoa Di truyền - Sinh học phân tử, Viện Huyết học –

Truyền máu Trung ương đã luôn giúp đỡ chia sẻ những kiến thức chuyên môn,

thường xuyên động viên về tinh thần giúp em vững tin trong suốt quá trình thực

hiện luận văn.

Em cũng xin gửi lời cảm ơn tới các thầy cô giáo Khoa Sinh học đã giảng dạy

cho em nhiều kiến thức quý báu. Em xin cảm ơn Bộ môn Di truyền học, Phòng sau

đại học, Phòng công tác chính trị Học sinh - Sinh viên đã tạo điều kiện thuận lợi

cho em hoàn thành luận văn thạc sỹ.

Xin cảm ơn dự án “Nghiên cứu sản xuất chip sinh học trên nền DNA

microarray để chẩn đoán một số bệnh ở người” mã số 01/2017/CNC_HDKHCN

của công ty BIMEDTECH đã hỗ trợ tôi thực hiện nghiên cứu này.

Cuối cùng em xin gửi lòng biết ơn tới gia đình, bạn bè thân thiết đã động

viên, bên cạnh em trong thời gian em thực hiện luận văn này.

Em xin chân thành cảm ơn!

Hà Nội, ngày 30 tháng 12 năm 2020

Sinh viên

Ngô Kim Ngân

BẢNG KÝ HIỆU VÀ CHỮ VIẾT TẮT

Viết tắt Tên đầy đủ và ý nghĩa

bp Base pair

DNA Deoxyribonucleic Acid

Cluster Cụm khuếch đại của DNA khuôn được gắn trên bề mặt flowcell.

Mỗi cụm được khuếch đại từ một sợi DNA khuôn ban đầu cho đến khi có khoảng 1000 bản sao. Mỗi cluster sẽ tạo ra một trình tự đọc duy nhất.

Hemoglobin A HbA

HbA2 Hemoglobin A2

HbE Hemoglobin E

HbF Hemoglobin F

Index Là trình tự DNA tag được gắn vào các trình tự đích, cho phép

kết hợp nhiều mẫu trong một bể thư viện và phân tách dữ liệu

sau khi đã hoàn thành lần chạy

kb kilobase = 1000 bp

MCH Mean Cell Hemoglobin: lượng hemoglobin trung bình hồng cầu

MCV Mean Corpuscular Volume: thể tích trung bình hồng cầu

PCR Polymerase Chain Reaction

RNA Ribonucleic Acid

WHO World Health Organization: Tổ chức Y tế thế giới

MỤC LỤC

Chương 1. TỔNG QUAN TÀI LIỆU ..................................................................... 2

1.1. Đại cương về β-thalassemia ....................................................................... 2

1.1.1. Đặc điểm và cơ chế sinh bệnh Thalassemia ............................................ 2

1.1.2. Đặc điểm và phân loại bệnh β-thalassemia ............................................. 3

1.1.3. Dịch tễ học bệnh β-thalassemia ............................................................... 5

1.1.4. Cơ sở phân tử bệnh β-thalassemia ........................................................... 6

1.1.5. Các phương pháp chẩn đoán bệnh β-thalassemia.................................. 11

1.2. Các kỹ thuật sinh học phân tử chẩn đoán bệnh β-thalassemia ................ 13

1.2.1. Kỹ thuật ARMS-PCR (Amplification Refractory Mutation System) ... 13

1.2.2. Kỹ thuật lai điểm ngược (Reverse hybridization - kit Strip Assay) ...... 15

1.2.3. Giải trình tự ........................................................................................... 16

1.3. Hệ thống giải trình tự thế hệ mới của Illumina - MiSeq . ....................... 20

1.3.1. Lịch sử phát triển ................................................................................... 20

1.3.2. Nguyên tắc hoạt động ............................................................................ 21

1.4. Các nghiên cứu về các đột biến gây bệnh β-thalassemia ở Việt Nam ..... 24

1.4.1. Nghiên cứu sử dụng kỹ thuật multiplex ARMS- PCR .......................... 24

1.4.2. Nghiên cứu sử dụng kỹ thuật lai phân tử .............................................. 25

Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP ................................................... 28

2.1. Đối tượng, hóa chất và thiết bị ................................................................ 28

2.1.1. Đối tượng ............................................................................................... 28

2.1.2. Hóa chất ................................................................................................. 28

2.1.3. Trình tự mồi sử dụng ............................................................................. 29

2.1.4. Thiết bị ................................................................................................... 29

2.2. Phương pháp nghiên cứu ......................................................................... 29

2.2.1. Sơ đồ nghiên cứu ................................................................................... 29

2.2.2. Quy trình thí nghiệm ............................................................................. 30

Chương 3. KẾT QUẢ VÀ BÀN LUẬN ............................................................... 37

3.1. Kết quả tối ưu quy trình giải trình tự gen HBB trên hệ thống NGS ........ 37

i

3.1.1. Thiết kế mồi và tối ưu phản ứng PCR ................................................... 37

3.1.2. Tối ưu quy trình chuẩn hóa mẫu............................................................ 40

3.2. Kết quả phân tích đột biến trên gen HBB ở các mẫu nghiên cứu ............ 42

3.2.1. Thông tin lần chạy máy MiSeq. ............................................................ 42

3.2.2. Kết quả phân tích đột biến gen HBB ..................................................... 42

3.2.3. Kết quả phân tích đột biến trên gen HBB kiểm chứng lại bằng phương

pháp giải trình tự gen Sanger ........................................................................... 46

3.2.4. Giá trị của các chỉ số sàng lọc trong nghiên cứu ................................... 48

KẾT LUẬN VÀ KIẾN NGHỊ................................................................................... 50

PHỤ LỤC 1: KẾT QUẢ PHẢN ỨNG PCR KHUẾCH ĐẠI GEN HBB ................... a

PHỤ LỤC 2: KẾT QUẢ XÉT NGHIỆM CẬN LÂM SÀNG CỦA ĐỐI TƯỢNG

NGHIÊN CỨU ............................................................................................................ b

ii

DANH MỤC HÌNH

Hình 1: Cấu trúc của gen HBB, vị trí và mức độ nghiêm trọng của các đột biến gây

ra bệnh β-thalassemia [7]. ........................................................................................... 7

Hình 2: Tên và vị trí trên gen HBB của 9 đột biến gây bệnh β-thalassemia thường

gặp ở Việt Nam. .......................................................................................................... 9

Hình 3: Mô tả đột biến tạo vị trí cắt nối intron – exon mới [48]. ............................. 11

Hình 4: Sơ đồ sàng lọc bệnh β-thalassemia [2], [16]. ............................................... 12

Hình 5: Sơ đồ mô tả nguyên lý kỹ thuật ARMS-PCR .............................................. 14

Hình 6: Quy trình giải trình tự thế hệ mới của Illumina ........................................... 21

Hình 7: Thông tin lần chạy trên phần mềm Sequencing Analysis Viewer ............... 23

Hình 8: Kết quả phân tích đột biến trên Miseq Reporter .......................................... 24

Hình 9: Kết quả phân tích đột biến trên phần mềm IGV .......................................... 24

Hình 10: Sơ đồ nghiên cứu ....................................................................................... 30

Hình 11: Chu trình nhiệt phản ứng PCR khuếch đại gen HBB chưa tối ưu ............. 31

Hình 12: Kết quả blast cặp mồi HBB trên NCBI ...................................................... 37

Hình 13: Kết quả điện di sản phầm PCR trước tối ưu trên gel agarose 1,5%........... 38

Hình 14: Kết quả tối ưu nhiệt độ gắn mồi điện di trên gel agarose 1.5% ................. 38

Hình 15: Chu trình nhiệt phản ứng PCR khuếch đại gen HBB sau tối ưu................ 39

Hình 16: Kết quả điện di sản phẩm sau tối ưu trên gel agarose 1,5%. ..................... 39

Hình 17: Kết quả chất lượng giải trình tự NGS gen HBB trước khi tối ưu .............. 40

Hình 18: Kết quả chất lượng giải trình tự NGS gen HBB sau khi tối ưu ................. 41

Hình 19: Kết quả giải trình tự NGS mẫu đột biến codon 26 .................................... 45

Hình 20: Kết quả so sánh đột biến tại codon 26(G→T) và codon 26 (G→A) với ... 46

Hình 21: Kết quả kiểm chứng bằng phương pháp giải trình tự Sanger .................... 47

iii

DANH MỤC BẢNG

Bảng 1: Đặc điểm của các thể bệnh β–thalassemia [3], [31]. ..................................... 3

Bảng 2: Đặc điểm của các thể HbE phối hợp β-thalassemia [3] [31]. ........................ 4

Bảng 3: Trình tự mồi HBB ........................................................................................ 29

Bảng 4: Thành phần phản ứng PCR khuếch đại gen HBB ....................................... 31

Bảng 5: Kết quả phân tích đột biến gen HBB ........................................................... 42

Bảng 6: Tỷ lệ các loại đột biến phổ biến ở Việt Nam ............................................... 43

Bảng 7: Tỷ lệ các dạng đột biến HbE ....................................................................... 43

Bảng 8: Tỷ lệ các dạng đột biến ít gặp ở Việt Nam .................................................. 44

Bảng 9: Kết quả giải trình tự NGS và Sanger ........................................................... 47

Bảng 10: Tỷ lệ phát hiện đột biến của MCH và MCV ............................................. 49

Bảng 11: Tỷ lệ phát hiện đột biến ở các chỉ số Hb ................................................... 49

iv

ĐẶT VẤN ĐỀ

Beta thalassemia (β-thalassemia) là bệnh thiếu máu, tan máu di truyền gây ra

do giảm hoặc mất tổng hợp hoàn toàn chuỗi β-globin, thành phần chính của

hemoglobin do gen HBB nằm trên cánh ngắn nhiễm sắc thể số 11 quy định. Ở Việt

Nam, đây là một trong những nguyên nhân hàng đầu gây ra tình trạng thiếu máu,

tan máu nặng ở trẻ em. Người mắc bệnh β-thalassemia thể nặng đòi hỏi phải được

điều trị bằng truyền hồng cầu thay thế suốt đời và thải sắt định kỳ. Việc điều trị này

khá tốn kém và lâu dài, là gánh nặng lớn cho gia đình, xã hội và làm tăng chi tiêu

ngân sách nhà nước cho lĩnh vực y tế. Đến nay, trên thế giới đã phát hiện hơn 200

đột biến gây bệnh β-thalassemia [11], [17], [43]. Vì vậy, rất cần có một chương

trình tầm soát bệnh β-thalassemia trong cộng đồng nhằm hạn chế sự phổ biến của

gen bệnh, trong đó việc sử dụng các kỹ thuật sinh học phân tử giúp xác định chính

xác loại đột biến và kiểu gen của bệnh

Giải trình tự gen được coi là tiêu chuẩn vàng trong việc phát hiện nhiều đột

biến. Next-Generation Sequencing (NGS) là phương pháp giải trình tự thế hệ mới

có ưu thế về hiệu suất, cho phép phát hiện nhiều đột biến cùng lúc và đang dần trở

thành công cụ trong chẩn đoán thường quy [21]. Năm 2011, hãng Illumina đưa ra

thị trường hệ thống giải trình tự thế hệ mới – MiSeq và được sử dụng trong nhiều

phòng xét nghiệm sinh học phân tử với ưu điểm cho phép phân tích ít mẫu hơn

trong mỗi lần chạy, giảm giá thành, thuận lợi hơn cho các xét nghiệm.

Vì vậy, để tăng cường hiệu quả trong việc chẩn đoán bệnh β-thalassemia

chúng tôi thực hiện đề tài “Ứng dụng phương pháp giải trình tự thế hệ mới

(NGS) để phân tích gen HBB ở người nghi ngờ mang đột biến gây bệnh β-

thalassemia”. Đề tài được thực hiện tại khoa Di truyền và Sinh học phân tử - Viện

Huyết học - Truyền máu Trung ương với 2 mục tiêu:

1. Tối ưu quy trình “ứng dụng phương pháp giải trình tự thế hệ mới (Next

Generation Sequencing – NGS) để phân tích gen HBB”.

2. Ứng dụng quy trình NGS để phân tích đột biến gen HBB ở một số người

nghi ngờ mang đột biến gây bệnh β-thalassemia.

1

Chương 1. TỔNG QUAN TÀI LIỆU

1.1. Đại cương về β-thalassemia

1.1.1. Đặc điểm và cơ chế sinh bệnh Thalassemia

Thalassemia là nhóm bệnh tan máu di truyền, xảy ra do đột biến gen quy

định việc sản xuất hemoglobin – thành phần chính trong hồng cầu, đảm nhiệm việc

vận chuyển oxy trong cơ thể. Cấu trúc của một phân tử Hb bình thường bao gồm 2

chuỗi α-globin liên kết với 2 chuỗi β-globin (α2β2) và bốn nhân Hem, phân tử này

có khả năng vận chuyển được bốn phân tử oxy. Bệnh thalassemia gây ra do sự mất

cân bằng tổng hợp giữa chuỗi α-globin và chuỗi β-globin. Nguyên nhân là do rối

loạn quá trình tổng hợp một trong hai chuỗi dẫn đến gây thiếu hụt một loại chuỗi và

thừa lượng chuỗi còn lại làm thay đổi tỷ lệ của các phân tử huyết sắc tố dẫn đến tình

trạng bệnh lý. Số lượng chuỗi globin thừa sẽ trùng hợp tạo nên các thể vùi huyết sắc

tố. Những thể vùi này không có tác dụng vận chuyển oxy mà chúng lắng xuống

màng hồng cầu và nguyên sinh chất của hồng cầu. Với hồng cầu ở máu ngoại vi, thể

vùi huyết sắc tố làm thay đổi tính thấm, tính mềm dẻo của màng cùng với sự gia

tăng diện tích tiếp xúc, dễ bị phá hủy bởi các tác nhân oxi hóa, từ đó dẫn đến hồng

cầu bị vỡ sớm gây nên hiện tượng tan máu. Còn ở tủy xương, các thể vùi trên gắn

lên nguyên sinh chất và màng của các hồng cầu non, làm hồng cầu bị chết trước khi

trưởng thành, dẫn đến tăng sinh mạnh các hồng cầu non trong tủy xương làm cho

xương bị biến dạng, tăng hấp thụ sắt gây ra nhiễm sắt cho cơ thể [13], [14].

Thalassemia là bệnh di truyền phổ biến nhất trên thế giới với ước tính khoảng 7%

dân số mang gen bệnh [31]. Theo thống kê, ở nước ta, ước tính có khoảng 12 triệu

người đang mang gen bệnh (chiếm khoảng 12% dân số Việt Nam), mỗi năm có trên

8.000 trẻ sinh ra bị bệnh, trong đó có hơn 2.000 trẻ mắc bệnh ở mức độ nặng cần

được điều trị cả đời và hơn 20.000 bệnh nhân đang cần được điều trị theo loại gen

nào bị ảnh hưởng mà phân biệt thành bệnh alpha thalassemia (α-thalassemia) và

beta thalassemia (β-thalassemia) [52].

2

1.1.2. Đặc điểm và phân loại bệnh β-thalassemia

Bệnh β-thalassemia xảy ra do đột biến gen HBB dẫn đến không tổng hợp chuỗi globin β (β0-thalassemia, ký hiệu β0) hoặc giảm tổng hợp (β+-thalassemia, ký hiệu β+) hoặc giảm rất ít (β++-thalassempia ký hiệu β++).

Theo tổ chức y tế thế giới WHO, hiện nay có tới 1,5% dân số thế giới mang

gen bệnh β-thalassemia [20]. Căn cứ vào đặc điểm lâm sàng, cận lâm sàng và số

lượng alen bị đột biến, bệnh β-thalassemia được chia thành ba thể: thể nặng, thể

trung bình và thể nhẹ. Đặc điểm của các thể này được mô tả trong bảng 1.

Bảng 1: Đặc điểm của các thể bệnh β–thalassemia [3], [31].

Triệu chứng Chẩn đoán Huyết đồ Đặc điểm Hb Kiểu gen đột biến đặc trưng

Bệnh nặng, thiếu Hb < 7g/dL HbA2 tăng máu, phụ thuộc β-thalassemia MCV 50-60 fL HbF 70-90% thể nặng truyền máu lâu MCH 14-20 pg β+/β+ β0/β0 β+/β0 dài

HbA2 tăng Hb 6-10g/dL Bệnh vừa, mức β-thalassemia HbF tăng đến MCV 55-70 fL độ phụ thuộc thể trung 100% MCH 15-23 pg bình truyền máu thay

đổi β+/β++ β+/β0 β0/β0+ yếu tố ảnh hưởng

Hb nam 9-15 g/dL

HbA2> 3,2% Hb nữ 9-13 g/dL β-thalassemia

HbF 0,5-6% MCV 55-75 fL thể nhẹ Thiếu máu nhẹ β++/ β β+/ β β0/ β MCH 19 - 25 pg

β-thalassemia thể nặng: bệnh thường xuất hiện trong vòng 2 năm đầu đời

với tình trạng thiếu máu nặng, cần phải truyền hồng cầu thường xuyên. Biểu hiện ở

những người không được điều trị hoặc truyền máu là chậm phát triển, xanh xao,

vàng da, cơ bắp kém, viêm gan, loét chân, biến dạng hộp sọ và mặt [20].

3

β-thalassemia thể trung gian: người bệnh có biểu hiện lâm sàng nhẹ hơn và

thường xuất hiện muộn hơn thể nặng, không yêu cầu hoặc chỉ thỉnh thoảng truyền

máu [20].

β-thalassemia thể nhẹ: người mắc β-thalassemia thể nhẹ thường không có

triệu chứng lâm sàng hoặc đôi khi bị thiếu máu nhẹ. Khi cả hai cha mẹ đều là người

mắc β-thalassemia thể nhẹ, có nguy cơ 25% ở mỗi lần mang thai có con mắc bệnh

β-thalassemia đồng hợp tử [20].

Ngoài ra, còn có các thể β-thalassemia khác như: thể phối hợp Hemoglobin E

(HbE) và β-thalassemia; thể phối hợp β-thalassemia và α-thalassemia.

Thể phối hợp β-thalassemia và Hemoglobin E (HbE): HbE là 1 biến thể

của hemoglobin khi gen HBB bị đột biến ở codon thứ 26 (GAG→AAG), làm thay

đổi acid amin thứ 26 là Glutamic thành Lysin. Người có kiểu gen dị hợp tử hoặc

đồng hợp tử HbE mà không phối hợp với β-thalassemia chỉ có biểu hiện thiếu máu

nhẹ, chậm phát triển ở mức vừa phải. Ở thể phối hợp, tùy vào thể β-thalassemia mà

mức độ biểu hiện của bệnh trở nên đa dạng và được mô tả trong bảng 2.

Bảng 2: Đặc điểm của các thể HbE phối hợp β-thalassemia [3] [31].

Triệu chứng Thể bệnh Kiểu gen Huyết đồ Đặc điềm Hb đặc trưng

HbE + HbA2:

25-80% Thiếu máu Hb thấp HbE/β+ HbE phối hợp β+-thalassemia HbF 6-50% nhược sắc vừa

HbA 5-60%

HbE tăng đến Giống Hb <8 g/dL 85% β-thalassemia MCV < 60fL HbE/β0 HbA2 < 5% HbE phối hợp β0-thalassemia thể nặng MCH < 22pg HbF 15-25%

4

Thể phối hợp β-thalassemia và α-thalassemia: người có kiểu gen đồng

hợp tử hoặc dị hợp tử β-thalassemia khi kết hợp với α-thalassemia làm giảm chuỗi

α-globin dư thừa làm giảm mức độ nghiêm trọng của β-thalassemia từ thể nặng

sang thể trung gian [8].

1.1.3. Dịch tễ học bệnh β-thalassemia

a. β-thalassemia trên thế giới

β -thalassemia là loại bệnh di truyền liên quan chặt chẽ với nguồn gốc dân

tộc, phân bố khắp toàn cầu, song mang tính chất địa dư rõ rệt, số người mang gen

bệnh trên thế giới rất lớn [59]

Những trường hợp thalassemia phát hiện đầu tiên năm 1925 là βthalassemia

ở bờ Địa Trung Hải, là người có nguồn gốc Hy Lạp và Italia. Sau đó bệnh đã được

phát hiện ở rất nhiều nước trên thế giới. Gen bệnh β-thalassemia phân bố rất rộng

trên thế giới, từ vùng Địa Trung Hải, qua khu vực Trung Đông, tới Đông Nam Châu

Á và Bắc Phi. Theo Liên đoàn Thalassemia quốc tế (2005) ước tính có 1,5% dân số

thế giới mang gen β-thalassemia, ít nhất có từ 80-90 triệu người mang gen bệnh, và

cứ mỗi năm có tới 60.000 trường hợp mới sinh mang gen bệnh. Toàn Châu Á có

trên 60 triệu người mang gen β-thalassemia. Riêng khu vực Đông Nam Châu Á

trong đó có Việt Nam, ước tính số người mang gen βthalassemia chiếm tới 50%

người mang gen toàn cầu, khoảng 40 triệu người. Còn ở các nước phát triển, Châu

Âu và Châu Mỹ, ước tính người mang gen βthalasemia chỉ chiếm 10-13% người

mang gen trên thế giới [51][55].

Tần số mang gen β-thalassemia rất cao ở nhiều nước ở bờ Địa Trung Hải,

Châu Âu, như ở Cyprus là 10%, Hy Lạp là 8%, Albania là 8%, Italia là 4,8%. Ở

Châu Mỹ, tỷ lệ mang gen β-thalassemia ở Guyana tới 10% dân số. Ở khu vực Châu

Á tần số mang gen β-thalassemia ở Ấn Độ từ 3-17% dân số, ở Lào là 9,6%, ở Thái

Lan từ 3-9%, ở Indonesia là 4% [56] [57].

Do gen β-thalassemia phân bố rất rộng rãi trên toàn cầu, đồng thời cùng với

việc lưu hành nhiều bệnh hemoglobin khác như HbE, HbS do đó hàng năm sinh ra

một số lớn trẻ bị thể đồng hợp tử β-thalassemia cũng như thể dị hợp tử kép, phối

5

hợp với một hemoglobin bệnh khác như HbE/β-thalassemia, HbS/β-thalassemia.

Đây là những thể bệnh nặng của β-thalassemia, đòi hỏi phải điều trị suốt đời, số

đông phải phụ thuộc vào truyền máu [50] [58].

b. β-thalassemia ở Việt Nam

Bệnh hemoglobin nói chung và thalassemia nói riêng đã được chú ý khá sớm

ở Việt Nam. Những nghiên cứu ban đầu từ thập kỷ 70, 80 và 90 ở thế kỷ XX, đều

hướng về nghiên cứu dịch tễ học và lâm sàng. Tiếp theo những năm gần đây đã

có một số nghiên cứu tiếp về điều trị, về đột biến gen thalassemia. Các nghiên

cứu cho đến nay ở Việt Nam đều thống nhất bệnh hemoglobin khá phổ biến, phổ

biến là α-thalasemia, β-thalassemia và HbE. Bệnh phát hiện thấy ở tất cả các tỉnh

thành trong cả nước, ở nhiều dân tộc khác nhau [52]. Bệnh phổ biến nhiều hơn ở

dân tộc ít người, ở các tỉnh miền núi và cao nguyên, so với người Kinh và vùng

đồng bằng [5]. β -thalassemia phổ biến ở người dân tộc ít người miền Bắc hơn.

Hemoglobin E phổ biến ở miền Trung và miền Nam hơn [53] [54]. Ở Việt Nam,

β0 - thalassemia phổ biến hơn β+ -thalassemia [52]

1.1.4. Cơ sở phân tử bệnh β-thalassemia

1.1.4.1. Vị trí, cấu trúc gen HBB

HBB là gen mã hóa phân tử β-globin, nó nằm trên cụm gen dài 70kb trên

cánh ngắn NST 11 [10]. Cụm gen bao gồm các gen chức năng 5’- ε – Gγ – Aγ – ψβ

– δ – β – 3’ được sắp xếp theo thứ tự biểu hiện trong quá trình phát triển của cơ thể

[24], [36].

Gen HBB dài 1600bp, mã hóa cho 146 acid amin gồm vùng 5’ không dịch

mã, 3 exon xen kẽ là 2 intron và kết thúc là vùng 3’ không dịch mã (hình 1) [7]

[36], [46]. Exon đầu tiên dài 89bp, exon 2 dài 221bp, exon 3 dài 123bp. Intron 1 có

kích thước nhỏ dài khoảng 130bp nằm giữa nucleotide thứ hai và nucleotide thứ ba

của codon 30, intron 2 có kích thước lớn hơn, dài khoảng 850bp nằm giữa codon

104 và 105 [7], [18].

6

Hình 1: Cấu trúc của gen HBB, vị trí và mức độ nghiêm trọng của các đột biến

gây ra bệnh β-thalassemia [7].

Trình tự bảo thủ quy định sự biểu hiện của gen HBB được tìm thấy ở các

vùng promoter, vị trí nối intron- exon, vùng 5’ và 3’ không dịch mã.

• Promoter của HBB bao gồm 3 trình tự bảo thủ: TATA box (vị trí

−28 đến −31), CCAAT box (vị trí −72 đến −76) và các trình tự CACCC lặp lại (ở vị

trí từ −86 đến −90 và từ −101 đến −105) [7], [23], [46].

• Vùng 5’ không dịch mã (5′ UTR) là vùng dài 50bp nằm giữa vị trí

CAP – vị trí bắt đầu phiên mã và codon mở đầu (ATG). Có hai trình tự được bảo ‐ thủ nổi bật là CTTCTG và CACC [7], [46].

• Vùng 3’-UTR dài 132bp nằm giữa codon kết thúc (TAA) và đuôi

poly (A) chứa một trình tự mang tín hiệu để gắn đuôi poly A là ATAAA [7], [46].

Một số đột biến tại các trình tự này là nguyên nhân gây ra β-thalassemia.

1.1.4.2. Cơ chế đột biến trên gen HBB gây bệnh β-thalassemia

Cho đến nay, có khoảng hơn 200 đột biến đã tìm thấy trên gen HBB chủ yếu

là đột biến điểm, rất ít đột biến mất đoạn [7], [36]. Các đột biến này xảy ra ở các

trình tự exon, intron, promoter hoặc vùng 3’-5’ không dịch mã. Những đột biến này

gây ảnh hưởng tới khả năng biểu hiện của chuỗi β-globin, do vậy người ta chia các

đột biến này thành 3 nhóm:

 Đột biến ảnh hưởng tới quá trình phiên mã:

7

• Đột biến điểm tại vùng khởi động (promoter): đột biến

thay thế nucleotide tại vị trí TATA hoặc CACCC dẫn đến giảm tổng hợp 10 - 25% lượng chuỗi β-globin so với bình thường, gây β+-thalassemia [48]. Ví dụ: -90

(C→T), -88 (C→T), -28 (A→G); -29 (A→G).

• Đột biến vùng 5’ không dịch mã: làm giảm hiệu suất quá

trình dịch mã [48]. Ví dụ: đột biến tại vị trí +33 (C→G) làm giảm tổng hợp mRNA

33% so với bình thường [41].

 Đột biến ảnh hưởng tới quá trình cải biến mARN

• Đột biến tại vị trí cắt- nối intron – exon: quá trình cắt nối

intron và exon xảy ra sau phiên mã cần các nucleotide GT (vị trí cho nối) đầu 5’,

AG (vị trí nhận nối) ở đầu 3’ của các intron và vùng bảo thủ xung quanh, gây cản trở việc nối exon, do đó không tạo được mARN β-globin nên gây β0-thalassemia

[48] như IVS1-1 (G→T).

• Đột biến tạo vị trí ghép nối giả tại vùng intron và exon: Dọc

các exon và intron đều chứa những trình tự giống với trình tự bảo thủ ở vùng biên

intron- exon nhưng thường không được sử dụng cho quá trình cắt nối. Các đột biến

này xảy ra tại các vị trí trên tạo ra các trình tự gần giống với trình tự cắt nối bình

thường. Ví dụ: IVS2-654 (C→T), IVS2-705 (T→G) và IVS2-745 (C→G).

• Đột biến tại vị trí poly A và vùng 3’ không dịch mã: vị trí

AATAAA tại vùng không dịch mã là vị trí gắn poly Adenin cần thiết cho mARN di

chuyển từ nhân ra tế bào chất để tham gia vào quá trình dịch mã tạo sản phẩm protein. Các đột biến điểm xảy ra tại vị trí AATAAA sẽ gây β+-thalassemia, như:

AATAAA → AATGAA, AATAAA → CATAAA.

 Đột biến ảnh hưởng tới quá trình dịch mã mARN

• Đột biến codon mở đầu: là những đột biến liên quan tới

codon ATG mang tín hiệu mở đầu dịch mã.

• Đột biến vô nghĩa: những đột biến thay thế hoặc thêm, mất

một vài nucleotide tạo ra codon mang tín hiệu kết thúc làm kết thúc sớm chuỗi và tạo sản phẩm β-globin không bền bị phá hủy ngay trong tế bào, gây β0-thalassemia

8

như: codon17 (AAG→TAG), codon 35 (TAC→TAA), codon 39 (CAG→TAG)

[45].

• Đột biến dịch khung: những đột biến thêm hoặc mất một vài

nucleotide làm thay đổi khung đọc mở, làm kết thúc sớm hoặc thay đổi trình tự các codon 41/42 (–TTCT), codon 71/72 (+A) gây β0-thalassemia [48].

1.1.4.3. Một số dạng đột biến thường gặp ở Việt Nam

Ở Việt Nam, có 9 đột biến gây ra 95% các trường hợp β-thalassemia gồm:

-28 (A→G), codon 17 (AAG→TAG), codon 26 (GAG→AAG), IVS1-1 (G→T),

IVS1-5 (G→C), codon 41/42(-TCTT), codon 71/72 (+A), codon 95 (+A), IVS2-654

(C→T) được mô tả ở hình 2 [43]. Những đột biến này được chia làm 2 nhóm như

sau:

Hình 2: Tên và vị trí trên gen HBB của 9 đột biến gây bệnh β-thalassemia

thường gặp ở Việt Nam.

 Nhóm đột biến gây β0-thalassemia:

• Đột biến codon 17 (AAG→TAG): đột biến làm thay đổi bộ ba mã hóa acid amin lysin (AAG) thành bộ ba kết thúc (TAG) gây β0-thalassemia [15],

[48].

• Đột biến codon 41/42 (-TCTT): đột biến gây mất 4 nucleotide (- TCTT) làm thay đổi khung đọc tạo ra bộ ba kết thúc ở bộ ba thứ 59, gây β0-

thalassemia [43], [48].

9

• Đột biến codon 95 (+A): thêm 1 nucleotide A dẫn đến sự thay đổi

khung đọc tạo ra bộ ba kết thúc ở bộ ba thứ 101 mới gây β0-thalassemia [49].

• Đột biến codon 71/72 (+A): thêm 1 nucleotide A ở giữa codon 71 và 72 làm thay đổi khung đọc tạo thành bộ ba kết thúc ở vị trí 72 gây β0-thalassemia

[48].

• Đột biến IVS1 -1 (G→T): đột biến ở intron 1 tại vị trí 1 gây biến đổi

G thành T, làm bất hoạt hoàn toàn vị trí mối nối nên không tạo được mRNA, gây β0-thalassemia [47].

 Nhóm đột biến gây β+- thalassemia:

• Đột biến -28 (A→G): đột biến thay thế nucleotide ở vị trí -28 biến

đổi A thành G làm giảm sự biểu hiện của gen HBB, biểu hiện giảm mức mARN từ 3

đến 5 lần so với mức bình thường, hậu quả làm giảm tổng hợp chuỗi β globin gây β+-thalassemia [43].

• Đột biến IVS1-5 (G→C): đột biến ở intron 1 tại vị trí thứ 5 biến đổi

G thành C, dẫn tới giảm khả năng nối ARN chính xác nhưng còn tổng hợp được chuỗi β-globin, gây đột biến β+-thalassemia.

• Đột biến IVS2-564 (C→T): đột biến ở intron 2 tại vị trí 654, C đổi

thành T (AAGGCAATA→AAGGTAATA), tạo ra vị trí ghép nối mới, gây đột biến β+-thalassemia [43].

• Đột biến codon 26 (GAG→AAG): tại vị trí codon thứ 26 thuộc exon

1 xảy ra đột biến GAG→AAG, sự thay thế một nucleotide này gây ra 2 biểu hiện:

- Quá trình cắt intron nối exon xảy ra bình thường, tạo nên chuỗi β-

globin có sự thay đổi ở acid amin thứ 26 là glutamic thành lysin hình thành nên

Hemoglobin E [48].

- Kích hoạt một vị trí cắt- nối mới trên phân tử tiền mRNA làm ngắn

chuỗi β-globin gây nên β+-thalassemia (hình 3) [48].

10

Đột biến tại codon 26 kích hoạt mối nối mới giữa vị trí cho nối GT của codon 25

trên exon 1 với vị trí nhận nối AG của codon 30 thuộc exon 2 làm mất 16 nucleotide trên phân tử mRNA, làm ngắn chuỗi β–globin gây ra β+-thalassemia. Đột biến này vừa tạo nên biến thể HbE vừa gây β+-thalassemia. Chính vì vậy

Hình 3: Mô tả đột biến tạo vị trí cắt nối intron – exon mới [48].

đột biến tại codon 26 gây bệnh HbE là một thể β-thalassemia đặc biệt.

1.1.5. Các phương pháp chẩn đoán bệnh β-thalassemia

Những phương pháp trong sàng lọc và chẩn đoán bệnh thalassemia được chia

làm 3 nhóm chính tương ứng với 3 giai đoạn trong quá trình sàng lọc. Một là nhóm

phương pháp sàng lọc ban đầu bao gồm những kỹ thuật đơn giản, dễ thực hiện, chi

phí thấp, thời gian thao tác nhanh, áp dụng với lượng mẫu ít và có thể dễ dàng áp

dụng ở cả các cơ sở y tế. Hai là nhóm phương pháp phân tích và định lượng

hemoglobin cho phép phân loại bệnh thalassemia với 2 kỹ thuật là điện di mao quản

và sắc ký lỏng hiệu năng cao. Ba là nhóm phương pháp sử dụng các kỹ thuật sinh

học phân tử nhằm xác định cụ thể những đột biến gây bệnh. Sơ đồ sàng lọc cụ thể

được mô tả ở hình 4.

11

Hình 4: Sơ đồ sàng lọc bệnh β-thalassemia [2], [16].

1.1.5.1. Phân tích tế bào máu ngoại vi

Hầu hết các quy trình chẩn đoán bệnh nhân thalassemia hiện nay đều sử

dụng phương pháp phân tích các chỉ số hồng cầu để để sàng lọc người mang gen

bệnh thalassemia. Hai chỉ số cần quan tâm là thể tích trung bình hồng cầu (MCV)

và lượng hemoglobin trung bình hồng cầu. MCV < 80 fL trong trường hợp thiếu

máu thiếu sắt hoặc bị thalassemia, MCH < 27pg có nghĩa là hồng cầu nhược sắc.

Khi MCH < 27 pg kết hợp với MCV < 80fL sẽ có đặc điểm thiếu máu nhược sắc,

đây là biểu hiện đặc trưng của bệnh thalassemia (hình 4) [16]. Tuy nhiên ở một số

nơi có tỷ lệ mắc bệnh cao nhưng nguồn lực còn hạn chế và cơ sở vật chất không đầy

đủ như khu vực nông thôn ở Đông Nam Á, Ấn Độ và các quốc gia Nam Á thì việc

sử dụng xét nghiệm tủa HbE (Dichlorophenol Indophenol)- DCIP để sàng lọc HbE

là lựa chọn thay thế đơn giản và chi phí thấp để sàng lọc sơ bộ β-thalassemia [13].

12

Tuy vậy, DCIP lại có tỉ lệ dương tính giả rất cao, những người dương tính sẽ phải

tiếp tục tầm soát bằng huyết đồ.

1.1.5.2. Điện di huyết sắc tố

Tất cả những mẫu có kết quả xét nghiệm tế bào máu ngoại vi MCV < 80fL,

MCH < 27 pg phải tiếp tục kiểm tra bằng điện di huyết sắc tố. Kết quả điện di huyết

sắc tố cho biết lượng huyết sắc tố bình thường cũng như sự xuất hiện của các huyết

sắc tố bất thường trong máu.

Hemoglobin trong hồng cầu thay đổi tùy từng giai đoạn phát triển của cơ thể.

Hemoglobin thời kì bào thai (từ tháng thứ 3 đến khi sinh) là HbF, được tạo thành từ

2 chuỗi alpha globin và gamma globin (α2γ2). Sau khi sinh, chuỗi γ không được

tổng hợp, thay thế vào đó là chuỗi β tạo hemoglobin ở người trưởng thành gồm

HbA1 (α2β2) và HbA2 (α2δ2) [3]. Trong bệnh β-thalassemia, chuỗi β-globin không

được tổng hợp đầy đủ, làm tăng sản xuất các chuỗi γ, δ, α dẫn tới tình trạng giảm

HbA1, tăng HbF và HbA2. HbA2 ≥ 4.0% là chỉ số thường được dùng để chẩn đoán

β-thalassemia. Trường hợp có HbA2 ≥ 4,0% và các chỉ số hồng cầu MCH, MCV

đều giảm sẽ nghi ngờ mang gen bệnh β-thalassemia [13]. Còn khi HbA2 > 4.0%

nhưng chỉ số hồng cầu bình thường thì có thể gặp trong trường hợp thiếu vitamin

B12/folate, trong bệnh gan hoặc nhiễm HIV. Các trường hợp có HbA2 từ 3.3-3.9%

cần khẳng định thêm bằng các kỹ thuật sinh học phân tử. Đối với các trường hợp có

đột biến codon 26 (G→A) gây thể HbE sẽ xuất hiện HbE ≥ 25%. Do đó, HbA1,

HbF, HbA2 và HbE được coi là các tiêu chuẩn sàng lọc trong điện di hemoglobin

đóng vai trò quyết định để chẩn đoán bệnh β-thalassemia (hình 4) [3].

1.2. Các kỹ thuật sinh học phân tử chẩn đoán bệnh β-thalassemia

1.2.1. Kỹ thuật ARMS-PCR (Amplification Refractory Mutation System)

1.2.1.1. Nguyên lý kỹ thuật ARMS-PCR

ARMS-PCR là PCR đặc hiệu alen hay PCR khuếch đại alen đặc hiệu, được

sử dụng hiệu quả trong việc phát hiện đột biến điểm [33], [42], [44].

13

Kỹ thuật này dựa trên đặc tính DNA polymerase yêu cầu nucleotide ở đầu 3’

của mồi bắt cặp với nucleotide trên sợi khuôn. Nếu nucleotide ở đầu 3’ của trình tự

mồi không bổ sung với trình tự đích thì Taq polymerase không thể kéo dài để tổng

hợp sợi mới được. Do đó, kỹ thuật này đòi hỏi nucleotide đầu 3’ phải mang tính đặc

hiệu [33]. Mồi sử dụng cho một phản ứng ARMS-PCR bao gồm mồi bình thường

và mồi đột biến. Mồi bình thường đặc hiệu cho trình tự DNA bình thường, không

khuếch đại được trình tự DNA đột biến và ngược lại (hình 5). Sự có mặt của đột

biến được thể hiện bằng sản phẩm DNA được khuếch đại với các kích thước đã biết

trước. Trong phản ứng ARMS-PCR còn có một cặp mồi nội chuẩn nhằm khuếch đại

vùng gen đích không có đột biến để tránh trường hợp âm tính giả do các nguyên

nhân như: quá ít hoặc quá nhiều khuôn DNA, chất lượng DNA không tốt, không có

mồi, không có Taq DNA polymerase hay các thành phần khác hoặc có mặt chất ức

chế phản ứng PCR [33], [39].

Hai cặp mồi được thiết kế để khuếch đại kiểu đột biến và kiểu bình thường có một mồi chung

Forward (F) và hai mồi Reverse riêng biệt (Rm và Rw). Sự khác nhau của hai mồi này nằm ở vị trí

đánh dấu X. Mồi dành cho đột biến chỉ khuếch đại được DNA có chứa đột biến X và ngược lại.

Hình 5: Sơ đồ mô tả nguyên lý kỹ thuật ARMS-PCR

1.2.1.2. Ưu điểm

− Phù hợp để phát hiện các đột biến điểm.

− Cho phép phát hiện thể thường với thể đột biến đồng hợp đột biến và dị hợp.

14

Nhanh, ít tốn kém, không yêu cầu mồi phải đánh dấu hay hệ thống phát hiện −

phức tạp [33].

1.2.1.3. Nhược điểm

− Kỹ thuật này chỉ có thể phát hiện được các đột biến và đa hình đã biết. Do đó,

muốn phát hiện một đột biến hoặc đa hình chưa biết cần kết hợp với các

phương pháp chẩn đoán phân tử khác như giải trình tự.

− Đối với phản ứng đơn ARMS-PCR, trong một lần thực hiện phản ứng chỉ có

thể phát hiện được một đột biến, dẫn tới chi phí khá tốn kém. Để giải quyết

vấn đề này, kỹ thuật multiplex ARMS-PCR đã được phát triển cho phép phát

hiện nhiều đột biến trong cùng một phản ứng [33].

1.2.2. Kỹ thuật lai điểm ngược (Reverse hybridization - kit Strip Assay)

1.2.2.1. Nguyên lý:

Các bazơ nitơ giữa hai mạch đơn của sợi DNA liên kết với nhau theo nguyên

tắc bổ sung (A liên kết với T và G liên kết với C) thông qua các mối liên kết hydro

để tạo nên chuỗi DNA mạch kép. Dưới các yếu tố biến tính như: nhiệt độ cao,

kiềm... liên kết hydro có thể bị phá vỡ, phân tử DNA sợi kép có thể tách thành các

sợi đơn. Khi các yếu tố biến tính bị loại bỏ, hai mạch đơn có thể tái liên kết thành

dạng sợi đôi. Hiện tượng các sợi đơn DNA từ các nguồn khác nhau và có trình tự

tương đồng, chúng có thể bắt cặp với nhau được gọi là hiện tượng lai [50].

Kỹ thuật lai điểm ngược thường được dùng để đột biến điểm. Các cặp đầu dò

(probe) là các oligonucleotide đặc hiệu có trình tự bổ sung với trình tự DNA thường

và DNA đột biến được gắn cố định trên màng. DNA khuôn bao gồm DNA thường

và DNA đột biến được khuếch đại bằng phản ứng PCR sử dụng các cặp mồi đánh

dấu bằng biotinylate. Sản phẩm PCR được lai với các oligonucleotide trên màng.

Khi bổ sung streptavidin- horseradish peroxidase lên màng, chất này sẽ tạo màu với

biotinylate và dễ dàng nhận thấy bằng mắt thường [32].

Strip assay là bộ kit xây dựng dựa trên hai kỹ thuật Multiplex PCR và lai

DNA ngược (Reverse hybridization), sử dụng thanh test strip có đính nhiều đầu dò

để phát hiện đồng thời nhiều đột biến và xác định tính đồng hợp/ dị hợp tử của đột

15

biến. Các dầu dò đặc hiệu (Alen specific oligonucleotit –ASO probes) cho alen bình

thường và đầu dò cho alen đột biến được gắn cố định trên các dải nitrocenlullose có

màng nilon. Sản phẩm DNA được đánh dấu bằng biotin-16-dUTP trong phản ứng

khuyếch đại (PCR). Các sản phẩm này được lai với các đầu dò đặc hiệu alen đột

biến (mutant) và alen bình thường (wild type). Sau khi rửa, sản phẩm lai đặc hiệu ở

trên các băng vạch của thanh test trip có thể được phát hiện bằng mắt thường [4].

1.2.2.2. Ưu điểm [4], [38]:

− Dễ thực hiện, có thể cùng lúc phát hiện được nhiều đột biến điểm, đột biến

mất đoạn, xác định được các đột biến đồng hợp tử hay dị hợp tử. Thời gian

nhanh chóng (6 - 8 giờ).

− Lượng mẫu cần ít (10 – 50 ng DNA cho 1 phản ứng PCR duy nhất).

− Phương tiện máy móc đơn giản: phân tích kết quả đơn giản từ các băng vạch

trên thanh phản ứng bằng mắt thường hoặc qua máy đọc tự động.

− Độ chính xác cao.

1.2.2.3. Nhược điểm:

Chỉ xác định được những đột biến đã biết được xây dựng trong bộ kit.

1.2.3. Giải trình tự

1.2.3.1. Nguyên lý chung

Phân tử DNA là một chuỗi xoắn kép của 2 mạch đơn được cấu tạo từ 4 loại

nucleotide khác nhau: A, T, G, C. Các nucleotide này sắp xếp theo 1 trình tự xác

định. Giải trình tự có nghĩa là xác định trình tự sắp xếp của 4 loại nucleotide này

trên phân tử DNA.

1.2.3.2. Các phương pháp giải trình tự

a. Phương pháp giải trình tự Sanger

Giải trình tự DNA theo phương pháp Sanger được phát triển bởi nhà hoá

sinh học người Anh Fred Sanger và cộng sự vào năm 1977 [35]. Phương pháp này

thường được sử dụng để giải trình tự các đoạn DNA ngắn dưới 1kb.

 Giải trình tự Sanger cổ điển

16

Giải trình tự DNA theo Sanger thực hiện các bước gần giống kỹ thuật PCR

tuy nhiên giải trình tự chỉ sử dụng một mồi đơn thay vì sử dụng một cặp mồi để

khuếch đại trong PCR. Do đó thành phần của phản ứng cũng bao gồm những chất

cần thiết để nhân bản DNA bao gồm:

− Mạch đơn DNA cần giải trình tự.

− Một primer: là một đoạn DNA sợi đơn ngắn kết hợp với DNA, là trình tự

khởi đầu cho polymerase.

− Enzyme DNA polymerase.

− 4 loại deoxynucleotide (dNTP): dATP, dTTP, dCTP, dGTP.

− 4 loại dideoxynucleotide (ddNTP): ddATP, ddTTP, ddCTP, ddGTP được

đánh dấu đồng vị phóng xạ.

Các ddNTP khác với dNTP tương ứng của chúng ở chỗ tại vị trí C- 3’ của

phân tử đường của các ddNTP chỉ có gốc –H thay cho gốc –OH bình thường dẫn

đến không thể hình thành liên kết phosphodiester với nucleotide tiếp theo. Do vậy,

nếu ddNTP gắn vào chuỗi polynucleotide thì phản ứng kéo dài chuỗi sẽ không thể

thể diễn ra. Theo nguyên tắc đó, mỗi khi ddNTP được thêm vào chuỗi

polynucleotide đang kéo dài thì phản ứng tổng hợp chuỗi DNA sẽ dừng lại tại đó

tạo ra 1 loạt các mạch mới có độ dài khác nhau [37]. Do khác nhau về kích thước và

khối lượng, các mạch mới này sẽ tách khỏi nhau trên gel điện di. Trình tự

nucleotide được đọc theo chiều từ đáy bảng điện di tương ứng với chiều 5’-3’ trên

mạch DNA được tổng hợp mới và đây là trình tự bổ sung với mạch cần giải trình tự

ban đầu [26], [37], [40].

 Giải trình tự Sanger cải tiến

Dựa trên nền tảng của kỹ thuật Sanger, ngày nay, người ta sử dụng các máy

giải trình tự động để thay thế cho kỹ thuật này. Kỹ thuật Sanger cải tiến sử dụng các

ddNTP có đánh dấu huỳnh quang thay cho việc đánh dấu phóng xạ như trước đây

đã giúp cho việc sắp xếp trình tự DNA trở nên nhanh chóng và hiệu quả hơn. Mỗi

loại ddNTP được gắn một màu có bước sóng phát xạ huỳnh quang khác nhau cho

phép thực hiện giải trình tự trong một phản ứng duy nhất. Hệ thống điện di mao

17

quản được sử dụng để đọc trình tự DNA một cách tự động. Cấu tạo của máy gồm

16 mao quản chứa gel polyacrylamide cho phép phân tích nhiều mẫu trong một lần

điện di. Hệ thống phát hiện gồm các camera có chùm tia laser đi qua nó để ghi nhận

tín hiệu huỳnh quang một cách chính xác. Nguyên tắc hoạt động của máy là trong

suốt quá trình điện di, khi có một vạch điện di đi qua chùm tia laser thì vạch điện di

sẽ phát sáng và được camera ghi nhận và lưu lại thành một cường độ đỉnh sáng

(peak) trong biểu đồ. Từ biểu đồ của các đỉnh cường độ sáng này, máy sẽ so dòng

của các đỉnh tương ứng với nhau và phân tích thành trình tự của đoạn DNA [37].

• Tiến bộ:

Khắc phục được nhược điểm của phương pháp Sanger cổ điển: có thể dùng 4

màu huỳnh quang khác nhau để đánh dấu 4 loại ddNTP, nhờ vậy phản ứng giải

trình tự có thể thực hiện chỉ trong một ống nghiệm và khi giải trình tự chỉ cần điện

di trên một hàng mà không cần phải trên 4 hàng khác nhau như trước đây. Tăng

công suất: tùy thuộc vào từng số lượng mao quản có thể chạy được một lần.

• Hạn chế

Phương pháp này thường được sử dụng để giải trình tự các đoạn DNA có

kích thước dưới 1kb [26]. Với những đoạn gen kích thước trên 1kb (HBB dài 1.6kb)

thì cần tăng số lượng phản ứng khuếch đại gen vì thế làm giảm số lượng mẫu trong

một lần chạy. Không phù hợp với việc phân tích những gen có nhiều đột biến như

HBB.

b. Giải trình tự thế hệ mới (Next- generation sequencing)

Next- generation sequencing là thuật ngữ được sử dụng để mô tả một số

công nghệ giải trình tự hiện đại khác nhau bao gồm: Pyrosequencing - Roche 454;

SOLiD; Solexa của Illumina; Ion torrent: giải trình tự Proton / PGM [9].

Năm 2005, Roche giới thiệu hệ thống giải trình tự hệ genome 454 – là hệ

thống giải trình tự dữ liệu đầu ra lớn theo phương pháp pyrosequencing đầu tiên

trên thế giới. Hệ thống này có thể tạo ra 200.000 đoạn đọc có độ dài khoảng 110 bp.

Thay vì sử dụng các ddNTP để chấm dứt khuếch đại chuỗi, công nghệ này dựa vào

18

việc phát hiện pyrophosphate được giải phóng trong quá trình kết hợp nucleotide

tạo ra một tín hiệu ánh sáng [34].

Năm 2007, Applied Biosystems (ABI) giới thiệu hệ thống giải trình tự

SOLiD dựa trên công nghệ nối các đoạn oligonucleotide. Dựa trên nguyên lý ghép

nối, toàn bộ genome được cắt thành các đoạn DNA ngắn, sau đó từng đoạn được

gắn với các adapter rồi cố định vào các hạt từ. Quá trình giải trình tự được thực hiện

thông qua các oligonucleotide được đánh dấu huỳnh quang. Độ dài đọc của SOLiD

ban đầu là 35 bp lần đọc và dữ liệu đầu ra là 3G sau mỗi lần chạy. SOLiD có thể đạt

độ chính xác cao 99.85% sau khi lọc. Năm 2010, hệ thống đã cải thiện được độ dài

đoạn đọc là 85 bp và độ chính xác là 99.99%, dữ liệu đầu ra vẫn là 30 Gb mỗi lần

chạy [34].

Cũng trong năm 2007, Illumina cho ra mắt hệ thống giải trình tự Solexa. Hệ

thống này đơn giản hóa phương pháp xây dựng thư viện và đảo đầu bằng phương

pháp huỳnh quang dẫn dến việc tạo ra các đoạn đọc có độ dài 35 bp. Công nghệ giải

trình tự bằng tổng hợp SBS sử dụng 4 nucleotide đánh dấu huỳnh quang để giải

trình tự hàng chục triệu cluster đồng thời trên bề mặt flow-cell. Trong mỗi chu trình

giải trình tự, một deoxynucloside triphosphate đánh dấu (dNTP) được thêm vào

chuỗi acid nucleic. Tín hiệu huỳnh quang của nucleotide đóng vai trò như một khóa

dừng phản ứng polymer hóa, do đó sau khi mỗi dNTP được tích hợp, dye huỳnh

quang được ghi lại để xác định nucleotide và sau đó bị cắt bỏ để tổng hợp

nucleotide tiếp theo. Vì cả 4 loại dNTP gắn khóa dừng tổng hợp thuận nghịch có

mặt đồng thời dưới dạng đơn phân tử, sự cạnh tranh ngẫu nhiên giúp giảm thiểu

việc tổng hợp mất cân đối [34].

Năm 2010, một hệ thống giải trình tự nhanh hơn, chi phí thấp hơn dựa trên

công nghệ bán dẫn Ion Torrent được giới thiệu. Đây là hệ thống duy nhất xác định

trình tự không dựa vào tín hiệu huỳnh quang mà dựa vào việc đo sự thay đổi pH do việc giải phóng ra ion H+ khi gắn nucleotide bằng công nghệ bán dẫn [9], [34].

Công nghệ giải trình tự thế hệ mới có hiệu suất cao, giảm chi phí đã phát

triển nhanh chóng trong những năm gần đây và trở thành một công cụ phân tích

19

quan trọng cho nhiều nhà di truyền học. Hàng triệu hoặc hàng tỉ phân tử DNA có

thể được giải trình tự đồng thời. Do đó, làm tăng đáng kể hiệu suất của quá trình

giải trình tự và giảm thiểu việc phải tách dòng trình tự đích giống như phương pháp

Sanger trước đó [34].

 Tiến bộ

Tất cả những phương pháp giải trình tự mới đã dẫn tới ba cải tiến đáng kể so

với công nghệ truyền thống:

− Các công nghệ này không yêu cầu tách dòng các đoạn DNA, mà thay vào đó

dựa vào việc chuẩn bị của các thư viện NGS.

− Thay vì hàng trăm phản ứng giải trình tự thì những công nghệ mới này có thể

đồng thời thực hiện được hàng triệu phản ứng giải trình tự.

− Trình tự được xuất ra trực tiếp mà không cần phải điện di. Số lần đọc của

NGS là vô cùng lớn, cho phép quá trình giải trình tự toàn bộ hệ gen trong thời

gian ngắn và được ứng dụng rộng rãi trong nhiều lĩnh vực khoa học và đời

sống

 Hạn chế

Hạn chế của các hệ thống giải trình tự thế hệ mới này là độ dài đoạn đọc

tương đối ngắn, dẫn đến những khó khăn trong việc cắt nối các trình tự, lắp ráp, chú

thích và phân tích tin sinh học.

1.3. Hệ thống giải trình tự thế hệ mới của Illumina - MiSeq .

1.3.1. Lịch sử phát triển

Vào năm 1998, Solexa, tiền thân của hệ thống giải trình tự của Illumina,

được thành lập bởi Shankar Balasubramanian và David Klenerman. Trải qua nhiều

giai đoạn nghiên cứu và phát triển, năm 2006, hệ thống máy giải trình tự Solexa đầu

tiên, the Genome Analyzer, được ra mắt và có khả năng giải trình tự 1Gb dữ liệu

cho một lần chạy. Đến năm 2007, Illumia tiến hành mua lại Solexa và tiếp tục phát

triển để đạt được những thành quả như ngày nay [34].

20

1.3.2. Nguyên tắc hoạt động

Hệ thống máy giải trình tự của Illumina sử dụng công nghệ giải trình tự theo

phương pháp tổng hợp (Sequencing by Synthesis, SBS), kết hợp với việc sử dụng

các nucleotide có gắn tín hiệu huỳnh quang và khóa dừng thuận nghịch để đọc và

nhận biết trình tự một cách trực tiếp. Trong mỗi chu trình, tại nucleotide có sự kết

hợp sẽ được phát hiện bằng các bức xạ huỳnh quang. Công nghệ giải trình tự bằng

phương pháp tổng hợp (SBS) sẽ đưa ra kết quả có sự chính xác cao, tăng tỉ lệ đọc

được của các đoạn DNA [34].

1.3.2.1. Quy trình thực hiện

Quy trình giải trình tự thế hệ mới gồm có 4 bước (hình 6) [29]:

Hình 6: Quy trình giải trình tự thế hệ mới của Illumina

a. Chuẩn bị thư viện (Library Preparation) [28], [29].

 Phản ứng cắt và gắn index

Các đoạn DNA cần giải trình tự sẽ được cắt thành những đoạn DNA nhỏ

(khoảng 200- 600bp), các đoạn này được gắn các trình tự vào đầu 5’ và 3’. Các

trình tự được thêm vào vào gồm phần trình tự để nhận biết các mẫu riêng biệt phần

trình tự để gắn lên flowcell và mang tín hiệu giải trình tự. Sau khi các đoạn DNA

21

được gắn hoàn thiện sẽ được khuếch đại sử dụng phản ứng PCR và tinh sạch sản

phẩm trước khi đưa vào giải trình tự

 Chuẩn hóa thư viện:

Các mẫu được đưa về cùng một nồng độ như nhau bằng phương pháp

Normalization theo kit của hãng Illumina. Sau đó, tất cả các mẫu được trộn chunglại

trong 1 ống nghiệm để biến tính bằng NaOH và đưa vào máy giải trình tự.

b. Tạo Cluster

Thư viện sau khi biến tính thành các mạch đơn và được máy đưa tự động lên

flow cell – nơi có các giếng phủ đầy các mồi bổ sung với P5 và P7, đã cố định đầu

5’ trên mặt giếng. Mỗi đoạn sẽ khuếch đại riêng biệt và tách thành từng nhóm

cluster thông qua việc tạo cầu (hình 6). Cắt và rửa trôi loại bỏ mạch bổ sung và giữ

lại mạch chính để toàn bộ các trình tự trên cluster là 1 chiều sẵn sàng cho việc giải

trình tự chiều thứ nhất.

Sau khi giải trình tự lần thứ nhất (read 1), các đoạn mạch này tiếp tục tạo cầu

với mồi P5, P7 bên bên cạnh để tạo thành mạch mới và thực hiện bước giải trình tự

thứ 2 (read 2) tương tự như read 1.

c. Giải trình tự

 Lần đọc thứ nhất:

- Thả DNA polymerase và mồi Read1 Seq primer vào cùng với 4 loại

nucleotide gắn huỳnh quang mang gốc khóa ở nhóm 3’-OH. Khi nucleotide này

được gắn vào cũng là lúc phản ứng ngừng lại. Tia Laser chiếu vào để kích thích

phát huỳnh quang và một camera ghi lại tín hiệu huỳnh quang đó (hình 6). Gốc

khóa được cắt ra, tín hiệu huỳnh quang cũng bị loại bỏ và rửa trôi cùng các

nucleotide không gắn. Chu trình này được lặp lại đến hết một nửa độ dài trình tự

thứ nhất. Sản phẩm đọc chiểu 1 được rửa đi.

- Tiếp tục bổ sung Index1 primer và các thành phần PCR, cơ chế giải trình tự

tương tự như trên đến khi hết phần Index, sản phầm đọc được rửa đi.

 Lần đọc thứ hai:

22

- Tạo cụm và giữ lại trình tự bổ sung. Thả DNA polymerase và mồi Read2

Seq primer vào với 4 loại nucleotide gắn huỳnh quang. Quy trình giải trình tự được

tiếp tục tương tự như lần đọc thứ nhất.

d. Phân tích kết quả

 Thông tin kết quả lần chạy:

Sử dụng phần mềm Sequencing Analysis Viewer (hình 7) để biết thông tin

mẻ chạy và chất lượng mẻ chạy. Một số thông số cần quan tâm để có một mẻ chạy

đạt yêu cầu:

- Mật độ cụm: Cluster density nằm trong khoảng 800 – 1200 K/mm2.

- Tỷ lệ cụm đạt chuẩn: Cluster passing filter: ≥ 90%.

- Độ tin cậy: Qscore (Q30) ≥ 90%.

- Tỉ lệ số sợi DNA có hiện tượng 1 nucleotide giải trình tự chậm hơn 1 chu

kì: phasing < 0,25%.

- Tỉ lệ số sợi DNA có hiện tượng 1 nucleotide giải trình tự nhanh hơn 1 chu

kì: pre-phasing < 0,25%.

Hình 7: Thông tin lần chạy trên phần mềm Sequencing Analysis Viewer

 Các phần mềm phân tích kết quả:

23

- Miseq Reporter cho biết chất lượng của xét nghiệm giải trình tự và phân

tích dữ liệu NGS ở mức cơ bản (hình 8).

Hình 8: Kết quả phân tích đột biến trên Miseq Reporter

- IGV (Integrative Genomics Viewer) là công cụ tin sinh học mạnh mẽ cho phép

khai thác thông tin sâu hơn như loại bỏ các đoạn đọc ngắn, không đảm bảo chất

lượng, loại bỏ các adapter dư thừa, các biến đổi (variant) có độ tin cậy thấp… (hình

9).

Hình 9: Kết quả phân tích đột biến trên phần mềm IGV

1.4. Các nghiên cứu về các đột biến gây bệnh β-thalassemia ở Việt Nam

1.4.1. Nghiên cứu sử dụng kỹ thuật multiplex ARMS- PCR

Tại Việt Nam, theo nghiên cứu của Svasti cho thấy có 9 đột biến thường gặp,

chiếm khoảng 95% các trường hợp β-thalassemia bao gồm: -28 (A→G), codon 17

24

(AAG→TAG), c odon 26 (GAG→AAG), IVS1-1 (G→T), IVS1-5 (G→C), codon

41/42(-TCTT), codon 71/72 (+A), codon 95 (+A), IVS2-654 (C→T) [43].

Năm 2008, Nguyễn Khắc Hân Hoan và cs. đã xây dựng kỹ thuật multiplex

ARMS-PCR ứng dụng vào chẩn đoán trước sinh đột biến gây bệnh β-thalassemia

cho các cặp vợ chồng có con mắc β-thalassemia khám thai tại Bệnh viện Từ Dũ.

Kết quả cho thấy, kỹ thuật ARMS-PCR có chi phí thấp, thời gian chẩn đoán nhanh

và độ chính xác 100% [1].

Năm 2014, Trần Vân Khánh và cs đã áp dụng multiplex ARMS- PCR để xác

định đồng thời 9 đột biến phổ biến trên gen HBB ở bệnh nhân β-thalassemia cho kết

quả 39/52 trường hợp mang đột biến chiếm tỷ lệ 75% [6].

Với ưu điểm thời gian thực hiện nhanh, chi phí thấp, kỹ thuật này đang được

ứng dụng nhiều trong các phòng xét nghiệm sinh học phân tử để chẩn đoán bệnh β-

thalassemia. Tuy nhiên, kỹ thuật này chỉ có thể phát hiện được các đột biến và đa

hình đã biết. Do đó, muốn phát hiện một đột biến hoặc đa hình chưa biết cần kết

hợp với các phương pháp chẩn đoán phân tử khác như giải trình tự.

1.4.2. Nghiên cứu sử dụng kỹ thuật lai phân tử

Với ưu điểm nổi bật cho phép phát hiện được nhiều đột biến trong cùng một

lần thực hiện, phương pháp lai điểm ngược đã được sử dụng trong nhiều nghiên cứu

để phát hiện đột biến β-thalassemia. Cho tới nay, lai điểm ngược là kỹ thuật duy

nhất được các hãng phát triển thành các kit thương mại để chẩn đoán đột biến β-

thalassemia. Bộ kit StripAssay của ViennaLab cho phép phát hiện đồng thời 21 đột

biến α-thalassaemia và 22 đột biến β-thalassaemia. Kit Strip Asay (ViennaLab, Áo)

có bộ kít α-globin Strip Assay cho phép sàng lọc được 21 đột biến α-thalassemia và

bộ kít β-globin Strip Assay cho phép sàng lọc được 22 đột biến β-thalasemia phổ

biến trong khu vực Đông Nam Á. Những bộ kít này đạt tiêu chuẩn chứng nhận IVD

(In Vitro Diagnostics) cho chẩn đoán bệnh, được phép lưu hành tại Châu Âu và đã

được sử dụng ở nhiều nước trên thế giới như Malaysia, Iran, Iraq, Thổ Nhĩ Kỳ, Ai

Cập [4], [38].

25

Trong nghiên cứu của Nguyễn Thị Thu Hà (2017) sử dụng bộ kít β-globin

Strip assaycủa ViennaLab trong tổng số 63 alen đột biến được xác định gồm có 9

kiểu đột biến gồm codon 26 (33,3%), codon 17 (17,5%), codon 41/42 (15,9%),

IVS1-1 (11,1%), -28 (7,9%), IVS2-654 (6,4%), codon 71/72 (4,8%), codon 95

(1,6%) và codon 8/9 (1,6%) [4].

Tuy nhiên, kit thương mại này vẫn chỉ cho phép xác định được những đột

biến đã biết được xây dựng trong bộ kit.

26

Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP

2.1. Đối tượng, hóa chất và thiết bị

2.1.1. Đối tượng

Trong nghiên cứu này, chúng tôi sử dụng bảy mươi năm mẫu máu của người

nghi ngờ mang đột biến gen HBB cung cấp bởi Viện Huyết học - Truyền máu

Trung ương. Hầu hết các đối tượng nghiên cứu được sàng lọc dựa trên phân tích

công thức máu ngoại vi, phân tích thành phần huyết sắc tố và sử dụng kỹ thuật

Multiplex ARMS-PCR phát hiện 9 đột biến gây bệnh β-thalassemia thường gặp ở

Việt Nam bao gồm: -28 (A→G), codon 17 (AAG→TAG), codon26 (GAG→AAG),

IVS-I-1 (G→T), IVS-I-5 (G→C), codon 41/42 (-TCTT), codon 71/72 (+A), codon

95 (+A), IVS-II-654 (C→T). Trong đó mười một mẫu có xuất hiện HbE trong kết

quả điện di huyết sắc tố và sáu mươi tư mẫu âm tính với 9 đột biến gây bệnh β-

thalassemia nói trên.

2.1.2. Hóa chất

- Hóa chất tách chiết và PCR: E.Z.N.A.® Blood DNA Mini Kit (Omega); KAPA

HiFi HotStart ReadyMix; DMSO (Dimethyl sulfoxide); - Hóa chất điện di: Agarose LE Biotechnology Grade; RedSafeTM Nucleic Acid

Staining Solution; ExactMark 1kb DNA Ladder (250-10,000bp); Zymoclean Gel

DNA recovery kit (Zymo research); TBE Buffer;

- Hóa chất kiểm tra nồng độ DNA: Quibit dsDNA HS assay kit (Life

technologies); Agencourt Apure XP (Beckman coulter);

- Hóa chất giải trình tự trên hệ thống Miseq: MiSeq Reagent Nano Kit v2- 300

Cycles; Nextera XT library prep kit 24 samples (box 1, box 2) (Illumina); Miseq

reagent kit v2-300 cycles PE (box 1, box 2) (Illumina); Nextera XT index kit 24

indices – 96 samples (Illumina); Tween 20; NaOH 1N.

Và các hóa chất cần thiết khác đạt đủ chất lượng sử dụng trong sinh học phân

tử.

28

2.1.3. Trình tự mồi sử dụng

Bảng 3: Trình tự mồi HBB

Tên mồi Trình tự Kích thước

HBB-F1 CAGTGCCAGAAGAGCCAAG 1817bp HBB-R1 CTGACCTCCCACATTCCCT

2.1.4. Thiết bị

Máy PCR Gradient 2 chiều (Eppendoft); Máy giải trình tự thế hệ mới Miseq

Illumina; Máy giải trình tự Sanger 3500 Genetic Analyzers (Thermo Fisher

Scientific). Máy ly tâm 5427R (Eppendoft); máy vortex (Dlab); máy spin (Dlab);

máy đo nồng độ DNA/RNA Qubit 3.0 Fluorometer (Invitrogen). Tủ an toàn sinh

học cấp II; bộ micropipet (Eppendoft) và các thiết bị sinh học phân tử đạt chuẩn sử

dụng khác. Các máy móc, thiết bị trên thuộc khoa Di truyền và Sinh học phân tử -

Viện Huyết học và Truyền máu Trung ương.

2.2. Phương pháp nghiên cứu

2.2.1. Sơ đồ nghiên cứu

Chúng tôi thực hiện nghiên cứu theo sơ đồ minh họa ở hình 10 với các bước

như sau: tách DNA từ mẫu máu của đối tượng nghiên cứu; kiểm tra chất lượng và

nồng độ DNA bằng phương pháp đo mật độ quang học; tối ưu hóa phản ứng khuếch

đại gen HBB ở những mẫu đạt tiêu chuẩn sử dụng cặp mồi HBB-F1/R1; kiểm tra

sản phẩm PCR bằng điện di sau đó tinh sạch sản phẩm; tạo thư viện và chạy giải

trình tự NGS; phân tích kết quả NGS; kiểm chứng một vài mẫu bằng phương pháp

giải trình tự Sanger.

29

Hình 10: Sơ đồ nghiên cứu

2.2.2. Quy trình thí nghiệm

2.2.2.1. Tách DNA tổng số

Theo hướng dẫn của nhà sản xuất kít E.Z.N.A.® Blood DNA Mini Kit

(Omega) chúng tôi thực hiện quy trình tách chiết DNA tổng số từ mẫu máu theo

quy trình: hút vào mỗi ống 250µl máu toàn phần. Thêm 25 µl OB protease Solution

và 250 µl BL Buffer, vortex mạnh 10 giây, ủ 65ºC, lắc 300 rpm trong 10 phút.

Thêm 260 µl EtOH 96%, invert đều 10 giây. Chuyển toàn bộ dịch lên cột, ly tâm

13.000 rpm trong 1 phút, loại bỏ dịch qua cột. Thêm 500 µl HBC Buffer, ly tâm

13.000 rpm trong 1 phút, loại bỏ dịch qua cột. Thêm 700 µl HBC Buffer. Ly tâm

13.000 rpm trong 3 phút. Loại bỏ dịch qua cột. Chuyển cột sang ống hứng 2ml mới.

Chuyển cột sang ống 1.5ml mới, thêm 50µl Elution Buffer, ủ ở nhiệt độ phòng 5

phút, ly tâm 14.000 rpm trong 1 phút. Dung dịch thu được là DNA có thể sử dụng

cho phản ứng PCR hoặc bảo quản ở -20ºC.

30

2.2.2.2. Đo nồng độ DNA bằng phương pháp đo độ hấp thu quang phổ ở

bước sóng A260nm (sử dụng máy Nanodrop)

Để kiểm tra chất lượng và xác định nồng độ DNA, trong nghiên cứu

này chúng tôi sử dụng phương pháp đo quang phổ nhằm xác định nồng độ và độ

sạch của DNA (1,8 < A260/A280 < 2). Phương pháp này dựa trên nguyên lý hấp

phụ ánh sáng cực đại của DNA tại bước sóng 260 nm.

2.2.2.3. Thực hiện phản ứng PCR

Những mẫu có nồng độ trên 50 ng/µl và độ tinh sạch nằm trong khoảng từ

1.8-2.0 được coi là đạt yêu cầu. Những mẫu không đạt yêu cầu sẽ tiến hành tách

chiết lại hoặc tinh sạch nếu cần. Những mẫu đạt yêu cầu được tiến hành khuếch đại

gen HBB theo thành phần phản ứng và điều kiện phản ứng như bàng 4 và hình 11.

Bảng 4: Thành phần phản ứng PCR khuếch đại gen HBB

Thành phần

Nồng độ Thể tích (µl) 5

10nM H2O HBB- F1 0.5

10nM HBB- R1 0.5

DMSO 0.5

1x KAPA HiFi HotStart ReadyMix 7.5

DNA 1

Tổng thể tích: 15 µl

Hình 11: Chu trình nhiệt phản ứng PCR khuếch đại gen HBB chưa tối ưu

2.2.2.4. Kiểm tra sản phẩm bằng điện di và tinh sạch sản phẩm

a. Kiểm tra sản phẩm sau PCR bằng điện di:

31

Điện di là phương pháp phổ biến để phân tách các phân tử axit nucleic. Dưới

tác dụng của điện trường một chiều, DNA sẽ di chuyển từ cực âm sang cực dương

nhờ có nhóm phosphat tích điện âm. Các phân tử DNA được phân tách dựa vào

kích thước và cấu hình phân tử trên giá thể gel agarose. Quá trình phân tách DNA

được thực hiện trong đệm TBE 1x (Tris base, Axit boric, EDTA). Các băng DNA

được phát hiện dưới tia tử ngoại sau khi nhuộm với ethidium bromide. Trong

nghiên cứu này chúng tôi sử dụng gel agarose 1% để phát hiện sản phẩm có kích

thước 1817 bp.

b. Tinh sạch sản phầm:

Sản phẩm PCR sau khi đã xuất hiện băng điện di có kích thước 1817 bp sẽ

được tiến hành tinh sạch sản phẩm trước khi chuẩn bị thư viện theo quy trình sau:

Chuẩn bị: làm ấm hạt bead AmPure XP ở nhiệt độ phòng, pha Ethanol 80%

từ Ethanol tuyệt đối. Ly tâm sản phẩm PCR ở 280g trong 1 phút ở 20ºC. Thêm 40µl

nuclease free water vào mỗi ống chứa 10 µl sản phẩm PCR còn lại sau điện di và

trộn đều. Trộn đều AMPure XP, thêm 50 µl AMPure XP vào mỗi ống chứa mẫu,

hút nhả 10 lần để đảm bảo hạt bead được hoàn toàn trộn đều. Ủ ở nhiêt độ phòng 5

phút để DNA bám vào hạt bead. Đặt ống lên giá từ 2 phút để đảm bảo lực từ giữ

chặt hạt bead cùng DNA bám trên đó, hút toàn bộ dịch nổi trên ống, tránh chạm vào

bead. Giữ nguyên ống trên giá từ, thêm 200 µl Ethanol 80% vào các ống, để trong

30 giây, loại bỏ toàn bộ dịch nổi, tránh chạm vào hạt bead. Lặp lại thêm 1 lần nữa.

Giữ nguyên ống trên giá từ, để khô tự nhiên trong 15 phút. Nhấc các ống ra khỏi giá

từ, thêm 50 µl RSB vào từng ống, hút nhả pipet 10 lần, thay đầu côn sau mỗi lần

thao tác. Để ở nhiệt độ phòng 2 phút để đảm bảo DNA được thôi hết ra khỏi hạt

bead. Đặt các ống lên giá từ trong 2 phút, để lực từ hút hết các hạt bead, lúc này

phần dịch nổi là phần có chứa DNA, chuyển 50 µl dịch nổi sang ống mới và bảo

quản ống sản phẩm sau tinh sạch ở -15 đến -25ºC trong 1 tuần.

Tiến hành đo nồng độ sản phẩm sau tinh sạch bằng Quibit để đảm bảo phản

ứng PCR thành công.

32

2.2.2.5. Chuẩn bị thư viện giải trình tự

Đo và chuẩn hóa nồng độ DNA: chúng tôi thực hiện chuẩn bị thư viện cho

giải trình tự theo bộ kít Nextera® XT DNA Library Prep của hãng Illumina [30] với

các bước như sau:

a. Kiểm tra nồng độ DNA:

Sự phân mảnh DNA bằng bộ kít Nextera® XT DNA Library Prep có yêu cầu

định lượng chính xác DNA hơn so với sự phân mảnh cơ học. Vì vậy, cần sử dụng

phương pháp dựa trên fluorometric để định lượng DNA đầu vào. Tránh các phương

pháp đo lường tổng acid nucleic như NanoDrop hoặc các phương pháp hấp thụ tia

cực tím khác [30].

Nồng độ sản phẩm khuếch đại được tính bằng cách đo nồng độ của mẫu sản

phẩm pha loãng sau đó nhân với hệ số pha loãng. Các sản phẩm sau PCR được pha

loãng tỷ lệ 1:10 trước khi tiên hành đo. Chuẩn bị dung dịch Quibit working solution

theo tỷ lệ 1 µl reagent (dye): 199 µl buffer. Bổ sung 190µl dung dịch Quibit

working solution vào các ống 0.5ml đã chuẩn bị trước đó. Tiếp tục thêm 10 µl chất

chuẩn 1 và 2 vào 2 ống 0,5ml chứa 190 µl dung dịch Quibit working solution. Các

ống còn lại được bổ sung thêm 10 µl mẫu đã pha loãng tương ứng. Trộn đều các

ống và ly tâm nhanh. Chuẩn máy đo Quibit sử dụng 2 ống chất chuẩn vừa chuẩn bị

và đo các mẫu rồi ghi lại nồng độ các mẫu.

b. Cắt DNA thành các đoạn ngắn (Nextera XT sample Prep kit):

Sản phẩm của quá trình tinh sạch được đưa về nồng độ 0,2 ng/µl trước khi

tiến hành bước chuẩn bị thư viện. Chuẩn bị đĩa PCR mới kí hiện VTA (Veriseq

Tagment Amplicon Plate). Thêm 10 µl TD (Tagment DNA buffer) vào mỗi giếng

trên đĩa VTA sau đó bổ sung 5 µl Amplicon Tagment Mix vào các giếng đã chứa

TD. Cuối cùng thêm 5 µl DNA của từng mẫu đã pha loãng đến nồng độ 0,2 ng/µl,

vào mỗi ống. Hút nhả để trộn đều. Đậy nắp các ống và ly tâm 280 g trong 1 phút để

đảm bảo các hóa chất tập trung ở phần đáy ống. Đưa các ống vào máy PCR và chạy

chương trình sau để kích hoạt enzyme: 55ºC trong 5 phút và giữ ở 10ºC.

33

Ngay sau khi đạt đến 10ºC, lấy đĩa VTA ra khỏi máy PCR đem ly tâm và tiến

hành bước tiếp theo. Thêm 5 µl NT buffer vào từng ống để vô hiệu hóa enzyme,

hút nhả pipet 5 lần để trộn đều. Đậy nắp và ly tâm 280 g trong 1phút. Ủ các ống

ở nhiệt độ phòng trong 5 phút để đảm bảo cho enzyme bị bất hoạt hoàn toàn.

 Tổng thể tích ống NTA: 25µl.

c. Chuẩn bị PCR (Nextera XT index kit, 24 index)

Rã đông hóa chất NPM (Nextera PCR Master Mix) và các Index ở nhiệt độ

phòng trong khoảng 20 phút, nhẹ nhàng đảo ngược ống 3-5 lần để trộn đều. Do

Index được gắn và 2 đầu các sợi đơn DNA, theo bộ kit 2 index, sắp xếp các ốn

index trên đĩa TruSeq Index Plate Fixture như sau (ghi lại thứ tự các index này): sắp

xếp các index 1 (mồi I7 có nắp màu cam) để theo chiều ngang, sắp xếp các index 2

(mồi I5 có nắp màu trắng) theo thứ tự theo chiều dọc. Lần lượt thêm: 15 µl Master

mix NPM, 5 µl Index 2 (nắp trắng), 5 µl Index 1 (nắp cam) vào từng ống. Đậy nắp

ống và ly tâm 280g trong 1 phút ở 20ºC để đảm bảo tất cả các hóa chất tập trung ở

đáy ống. Tiến hành phản ứng PCR để gắn Index theo chu trình nhiệt sau: 75ºC trong

3 phút, 95ºC trong 30 giây, 12 chu kỳ 95ºC trong 10 giây, 55ºC trong 30 giây, 72ºC

trong 30 giây; 72ºC trong 5 phút và giữ ở 4ºC.

d. Tinh sạch sản phẩm PCR:

Làm ấm hạt bead AmPure XP ở nhiệt độ phòng, pha Ethanol 80% từ Ethanol

tuyệt đối. Vortex đều AMPure XP, thêm 50µl AMPure XP vào mỗi ống chứa sản

phẩm sau PCR, hút nhả 10 lần để đảm bảo hạt bead được hoàn toàn trộn đều. Ủ ở

nhiêt độ phòng 5 phút để DNA bám vào hạt bead. Đặt ống lên giá từ 2 phút để đảm

bảo lực từ giữ chặt hạt bead cùng DNA bám trên đó, hút toàn bộ dịch nổi trên ống,

tránh chạm vào bead. Giữ nguyên ống trên giá từ, thêm 200µl Ethanol 80% vào các

ống, để trong 30 giây, loại bỏ toàn bộ dịch nổi, tránh chạm vào hạt bead. Lặp lại

thêm 1 lần nữa. Giữ nguyên ống trên giá từ, để khô tự nhiên trong 15 phút. Nhấc

các ống ra khỏi giá từ, thêm 50 µl RSB vào từng ống, hút nhả pipet 10 lần, thay đầu

côn sau mỗi lần thao tác. Để ở nhiệt độ phòng 2 phút để đảm bảo DNA được thôi

hết ra khỏi hạt bead. Đặt các ống lên giá từ trong 2 phút, để lực từ hút hết các hạt

34

bead, lúc này phần dịch nổi là phần có chứa DNA, chuyển 50µl dịch nổi sang ống

mới và bảo quản ống sản phẩm sau tinh sạch ở -15 đến -25ºC trong 1 tuần. Tiến

hành đo nồng độ sản phẩm sau tinh sạch bằng Quibit để đảm bảo phản ứng PCR

thành công. Tiến hành đo nồng độ sản phẩm sau tinh sạch bằng Quibit để đảm bảo

phản ứng PCR thành công. Tiến hành đo nồng độ sản phẩm sau tinh sạch bằng

Quibit để đảm bảo phản ứng PCR thành công.

Chuẩn bị hỗn hợp dung dịch LNB1 (Library Normalization Beads 1) và

LNA1 (Library Normalization Additives 1). Cho 24 mẫu: 1,1ml LNA1 và 200 µl

LNB1 (đảm bảo rằng đã được trộn đều). Chuyển 45 µl dung dịch LNA1/ LNB1 vào

mỗi giếng trên đĩa mới kí hiệu LNP. Thêm 20 µl sản phẩm PCR đã tinh sạch vào

các giếng trên LNP. Đậy nắp đĩa và lắc ở 1800rpm trong 30 phút rồi chuyển đĩa lên

giá từ trong 2 phút sau đó loại bỏ dịch nổi ở các giếng, nhấc plate ra khỏi giá từ và

tiến hành rửa với LNW1 (Library Normalization Wash 1): thêm 45 µl LNW1 vào

mỗi giếng đã chứa mẫu, đậy nắp và lắc ở 1800 rpm trong 5 phút sau đó ly tâm

nhanh ở 280g, đặt đĩa lên giá từ trong 2 phút, loại bỏ dịch nổi ở các giếng. Lặp lại 2

lần bước này. Thêm 30 µl NaOH 0,1N vào các giếng rồi đóng nắp và lắc ở 1800

rpm trong 5 phút. Sau đó ly tâm nhanh ở 280g rồi ngay lập tức đặt lên giá từ trong 2

phút. Chuyển 25 µl dịch nổi từ các giếng trên đĩa LNP sang đĩa mới đã hút sẵn 25

µl LNS1 (Library Normalization Storage Buffer 1) ở mỗi giếng. Trộn đều và ly tâm

ở 280g trong 1 phút.

2.2.2.6. Chạy giải trình tự

Chuyển 5 µl từng mẫu ở các giếng vào ống eppendorf 1,5ml mới kí hiệu

POOL. Chuyển 15 µl thư viện DNA từ ống POOL sang ống PCR mới. Thêm 85 µl

HT1 vào ống PCR này sau đó trộn đều và ly tâm nhanh. Chuyển ống DNA/ HT1

trên ủ trong máy PCR ở 96ºC trong 3 phút, 4ºC trong 5 phút và giữ ở 4ºC. Thêm

600 µl HT1 vào một ống eppendorf 1,5ml mới và bảo quản trên đâ. Bổ sung 100 µl

thư viện đã ủ và ống chứa 600 µl HT1 đã chuẩn bị. Sau đó chuyển toàn bộ 700 µl

thư viện này vào khay MiSeq reagent cartridge theo vị trí Load Samples trên khay.

Đưa vào thao tác để giải trình tự trên máy MiSeq.

35

2.2.2.7. Phân tích kết quả

Sử dụng các phần mềm tin sinh chuyên dụng cho NGS là Sequencing

Analysis Viewer, Miseq Reporter và IGV (Integrative Genomics Viewer). Trong

suốt quá trình giải trình tự, phần mềm Real-time Analysis sẽ tạo ra các file dữ liệu

bao gồm các thông số sử dụng cho phần mềm Sequencing Analysis Viewer và

Miseq Reporter. Sequencing Analysis Viewer cho biết chất lượng của xét nghiệm

giải trình tự. Các chỉ số bao gồm: các cluster đạt yêu cầu, chất lượng trình tự

nucleotide đạt độ chính xác 99,99% (Q30), giá trị phasing và pre-phasing của lần

giải trình tự.

Phần mềm Miseq Reporter 2.5.1 được dùng để phân tích dữ liệu giải trình tự.

Quá trình này bao gồm: phân tách dữ liệu của các mẫu trong cùng 1 lần chạy thành

các file dữ liệu riêng sử dụng trình tự Index được gắn vào các mẫu trong quá trình

chuẩn bị thư viện. Chuyển dữ liệu ảnh chụp thành file trình tự có dạng FASTQ file:

file dữ liệu chữ được tạo ra khi loại bỏ các đoạn trình tự Index ở các mẫu và loại bỏ

các trình tự không đạt độ tin cậy và độ chính xác. Các dữ liệu xuất ra đều phải đạt

độ chính xác 99,99%. So sánh và căn chỉnh trình tự tham chiếu (mã GeneBank:

ENSG00000244734) của các mẫu và những biến đổi đơn nucleotide (SNV), các

chèn đoạn, mất đoạn ngắn (indels) sẽ được nhận diện cùng với tần suất xuất hiện

của từng biến đổi. Với những biến đổi gây bệnh đã biết được tra cứu và đối chiếu

trên cơ sở dữ liệu đột biến ở người là: cơ sở dữ liệu đột biến gen HBB của HbVar

(http://globin.cse.psu.edu/). Integrative Genomics Viewer (IGV) là công cụ tin sinh

học mạnh mẽ cho phép khai thác thông tin sâu hơn như loại bỏ các đoạn đọc ngắn,

không đảm bảo chất lượng, loại bỏ các adapter dư thừa, các biến đổi (variant) có độ

tin cậy thấp…

2.2.2.8. Kiểm chứng những mẫu dương tính bằng phương pháp Sanger

Chúng tôi lựa chọn ngẫu nhiên bảy trong tổng số 44 mẫu dương tính trong

phương pháp NGS để tiến hành kiểm chứng lại bằng phương pháp giải trình tự

Sanger bằng quy trình đã tối ưu tại khoa Di truyền- Sinh học phân tử - Viện Huyết

học- Truyền máu Trung ương.

36

Chương 3. KẾT QUẢ VÀ BÀN LUẬN

3.1. Kết quả tối ưu quy trình giải trình tự gen HBB trên hệ thống NGS

3.1.1. Thiết kế mồi và tối ưu phản ứng PCR

3.1.1.1. Thiết kế mồi

Trong phương pháp giải trình tự, việc khuếch đại gen đích để giải trình tự là

vô cùng quan trọng. Gen đích sử dụng ở nghiên cứu này là gen HBB có kích thước

1600 bp. Chúng tôi sử dụng phần mềm Blast primer design để thiết kế cặp mồi

khuếch đại gen hemoglobin subunit beta trình tự như bảng 4. Sản phẩm PCR thu

được có chiều dài 1817 bp từ vị trí 5225408 đến 5227224 trên nhiễm sắc thể số 11

(Homo sapiens chromosome 11, GRCh38.p12 Primary Assembly).

Blast cặp mồi trên NCBI để kiểm tra chất lượng (hình 12):

Hình 12: Kết quả blast cặp mồi HBB trên NCBI

3.1.1.2. Tối ưu phản ứng PCR

DNA được tách chiết từ mẫu bệnh máu ngoại vi theo quy trình của kit

E.Z.N.A.® Blood DNA Mini Kit (Omega). DNA thu được được đo nồng độ và độ

tinh sạch bằng phương pháp đo độ hấp phụ ở bước sóng 260 nm và 280nm.

Sau đó dựa vào đặc điểm và kích thước gen cần nhân lên, chúng tôi thực hiện

phản ứng PCR theo thành phần phản ứng như bảng 4 và điều kiện như hình 11.

37

4.5 kb

1.8 kb

1.5 kb

1.5 kb

Hình 13: Kết quả điện di sản phầm PCR trước tối ưu trên gel agarose 1,5%

Giếng M: marker 1kb (Thermo), giếng 1-9: sản phẩm PCR

Sản phẩm PCR được điện di kiểm tra (Hình 13). Ngoài sản phẩm PCR mong

đợi có kích thước ~1,8 kb, còn có hai sản phẩm PCR đặc hiệu kích thước 4,5 kb và

1,5 kb. Do đó cần tối ưu phản ứng PCR để thu được sản phẩm đặc hiệu hơn.

Để tối ưu hóa PCR, chúng tôi tiến hành PCR ở một số nhiệt độ gắn mồi khác

nhau là 62,1ºC; 62,6ºC; 63,2ºC; 64ºC; 64,8ºC; 65,6ºC; 66,4ºC; 67,1ºC; 67,7ºC và

68ºC cùng với giảm bớt thời gian các bước trong chu trình nhiệt theo hình 15. Điện

di kiểm tra cho thấy phản ứng PCR với nhiệt độ gắn mồi 64.8ºC cho sản phẩm đặc

hiệu nhất (Hình 14).

Hình 14: Kết quả tối ưu nhiệt độ gắn mồi điện di trên gel agarose 1.5%

Giếng M: marker 1kb (Biolabs),

38

Để khẳng định lại, chúng tôi tiến hành khuếch đại 9 mẫu theo điều kiện phản

ứng như bảng 4 và chu trình nhiệt như hình 15. Kết quả điện di thu được ở hình 16.

Hình 15: Chu trình nhiệt phản ứng PCR khuếch đại gen HBB sau tối ưu

1.8kb

1.5kb

Hình 16: Kết quả điện di sản phẩm sau tối ưu trên gel agarose 1,5%.

Giếng M: marker 1kb (Thermo), giếng 1-5: sản phẩm PCR

Sản phẩm sau tối ưu cho một băng sáng rõ và duy nhất có kích thước khoảng

1,8kb. Như vậy nhiệt độ gắn mồi 65ºC cho sản phẩm đặc hiệu. Chúng tôi tiến hành

thực hiện trên 75 mẫu nghiên cứu với chu trình nhiệt mới (Hình 15) có nhiệt độ gắn

mồi là 65ºC. Kết quả điện di trong phụ lục 1 cho thấy phản ứng PCR đã khuếch đại

thành công, 75/75 mẫu đều thu được sản phẩm sáng rõ và duy nhất. Điều này chứng

tỏ chúng tôi đã thực hiện khuếch đại gen HBB thành công, có thể sử dụng cho bước

chuẩn bị thư viện tiếp theo.

39

3.1.2. Tối ưu quy trình chuẩn hóa mẫu

Khi đã có thư viện DNA đạt tiêu chuẩn thì chất lượng giải trình tự gen NGS

được thể hiện qua các chỉ số: độ tin cậy (Q30), mật độ cụm (cluster density); tỷ lệ

cụm đạt chuẩn (cluster passing filter).

Hình 17: Kết quả chất lượng giải trình tự NGS gen HBB trước khi tối ưu

Chú thích: Mật độ cụm (Cluster density): 1381 K/mm2; tỷ lệ cụm đạt chuẩn

(cluster passing filter): 35.7%; độ tin cậy (Q30): 68.4%

Khi chuẩn hóa mẫu cho mẻ NGS theo hướng dẫn của nhà sản xuất [30], kết

quả giải trình tự thu được trong hình 17 có độ tin cậy (Q30) 68,4%; mật độ cụm 1381 K/mm2; tỷ lệ cụm đạt chuẩn 35,7%. Tuy nhiên theo khuyến cáo của Illumina,

một mẻ chạy giải trình tự trên Miseq thành công khi: độ tin cậy (Q30) ≥ 90%; mật độ cụm 800 – 1200 K/mm2; tỷ lệ cụm đạt chuẩn ≥ 90% [27]. Như vậy, kết quả của

lần thử nghiệm đầu tiên không đáp ứng được tiêu chí kỹ thuật. Vì mật độ cụm quá cao (1381 K/mm2) nên camera huỳnh quang không thu được hình ảnh rõ ràng; cho

nên độ tin cậy cũng như tỷ lệ cụm đạt chuẩn đều thấp. Chúng tôi xác định nguyên

nhân mật độ cụm cao là do nồng độ mẫu đưa vào chưa được chuẩn hóa đạt yêu cầu.

Phương pháp chuẩn hóa mẫu theo hướng dẫn của nhà sản xuất sử dụng hạt từ giúp

loại bỏ các enzyme và các thành phần khác của phản ứng PCR, nhưng không loại

bỏ được mồi và DNA khuôn. Vì vậy, lượng DNA thư viện thực tế đưa vào giải trình

tự không được định lượng chính xác do còn mồi và DNA khuôn. Do đó, để tính

toán chính xác lượng DNA thư viện đầu vào, thư viện DNA cần được chuẩn hóa

theo một phương pháp khác. Tham khảo ý kiến của các chuyên gia hãng Illumina,

40

chúng tôi thực hiện chuẩn hóa mẫu theo phương pháp Standard normalization.

Phương pháp này tính toán nồng độ theo số lượng phân tử và kích thước phân tử

(nM) thay vì nồng độ tính theo độ hấp thụ ở bước sóng 260nm (ng/µl).

Quy đổi nồng độ các mẫu từ đơn vị ng/µl sang đơn vị nM theo công thức

sau:

Trong đó: X: Nồng độ (nM); Y: Nồng độ (ng/µl) của mẫu; M: Kích thước

đoạn DNA.

Nồng độ các mẫu được đưa về 4 nM sau đó được trộn chung lại theo tỷ lệ

như nhau và biến tính bằng NaOH 0,2 N trước khi đưa vào giải trình tự.

Hình 18: Kết quả chất lượng giải trình tự NGS gen HBB sau khi tối ưu

Chú thích: Mật độ cụm (Cluster density): 1164 K/mm2; tỷ lệ cụm đạt chuẩn

(cluster passing filter): 91,34%; độ tin cậy (Q30): 90,7%

Kết quả giải trình tự với phương pháp chuẩn hóa mẫu Standard

normalization được thể hiện trong hình 18 cho thấy chỉ số lượng đã đáp ứng các tiêu chí kỹ thuật với: độ tin cậy (Q30) 90,7%; mật độ cụm 1164 K/mm2; tỷ lệ cụm đạt

chuẩn 91,34%.

Như vậy, bằng việc thiết kế cặp mồi, tối ưu phản ứng PCR khuếch đại gen

HBB và thay đổi phương pháp chuẩn hóa mẫu chúng tôi đã hoàn thiện được quy

41

trình giải trình tự NGS phân tích gen HBB trong những trường hợp nghi ngờ mang

đột biến gây bệnh β- thalassemia.

3.2. Kết quả phân tích đột biến trên gen HBB ở các mẫu nghiên cứu

3.2.1. Thông tin lần chạy máy MiSeq.

Lần chạy máy MiSeq trong nghiên cứu này được thể hiện trong hình 18 có

mật độ cluster (cluster density) là 1164 K/mm2. Tổng số cluster qua được bộ lọc

(cluster passing filter) là 91,3%. Những giá trị này chỉ ra những cluster chất lượng

cao đã đi qua bộ lọc, cho phép làm giảm những dữ liệu thô không đáng tin cậy.

Những kết quả này cho phép tin tưởng những kết quả thu nhận được [27]. Trong

một cụm cluster, có tỷ lệ phasing và pre- phasing đều nhỏ hơn 0,25%. Độ tin cậy

(Q30) là 90,7%. Thông qua các chỉ số đánh giá chất lượng lần chạy theo khuyến cáo

của hãng, lần chạy máy cung cấp các dữ liệu đáng tin cậy và đảm bảo chất lượng để

thực hiện những phân tích tiếp theo [27].

3.2.2. Kết quả phân tích đột biến gen HBB

Sau khi có dữ liệu giải trình tự đạt tiêu chuẩn, chúng tôi sử dụng phần mềm

Miseq Reporter 2.5.1 và phần mềm Integrative Genomics Viewer (IGV) để phân

tích đưa ra kết quả (Phụ lục 2).

Bảng 5: Kết quả phân tích đột biến gen HBB

Kiểu gen Số lượng Tỷ lệ %

β/β 41,33 31

β0/β 32 24

β+/β 4 3

βE/β 6,67 5

βE/βE 5,33 4

βE/β0 2,67 2

Tạo biến thể khác hoặc không rõ ràng 8 6

Tổng số 100 75

42

Kết quả phân tích đột biến trên gen HBB ở bảng 5 cho thấy có 31/75 (chiếm

41,33%) số mẫu nghiên cứu không phát hiện đột biến; 44/75 mẫu (chiếm 58,67%) phát hiện đột biến, Trong đó, 24 mẫu có kiểu gen β0/β chiếm tỷ lệ cao nhất là 32%. Các kiểu gen β+/β, βE/β, βE/βE và βE/β0 chiếm tỷ lệ lần lượt là 4%; 6,67%; 5,33%; và

2,67%.

Bảng 6: Tỷ lệ các loại đột biến phổ biến ở Việt Nam

Đột biến phát hiện Kiểu gen Số lượng Vị trí đột biến Tỷ lệ/ 64 mẫu (%)

promoter β+/β 1 1,5 -28 (A→G)

Exon 1 β0/β 1 1,5 Codon 41/42 (-CTTT)

Intron 1 β0/β 1 1,5 IVS-I-1 (G→T)

Trong số 64 mẫu đã sàng lọc âm tính bằng kỹ thuật multiplex ARMS- PCR 9

loại đột biến phổ biến ở Việt Nam phát hiện có 3 mẫu mang đột biến nằm trong 9

loại đột biến này. Đó là các mẫu 6, 17, 41 mang kiểu gen dị hợp tử đột biến -28

(A→G), codon 41/42 (-CTTT), IVS1-1 (G→T). Đây là 3 trường hợp âm tính giả

của kỹ thuật multiplex ARMS- PCR. Nguyên nhân gây âm tính giả có thể là do: quá

ít hoặc quá nhiều khuôn DNA, chất lượng DNA không tốt, không có mồi, không có

Taq DNA polymerase hay các thành phần khác hoặc có mặt chất ức chế phản ứng

PCR. Đây là ưu thế của giải trình tự trong việc phát hiện đột biến so với kỹ thuật

multiplex PCR đang được sử dụng.

Bảng 7: Tỷ lệ các dạng đột biến HbE

Số lượng Tỷ lệ / 11 mẫu (%)

Kiểu gen βE/β 5 45,5

βE/βE 4 36,4

βE/β0 2 18,1

43

Mười một mẫu (chiếm 14,7%) phát hiện đột biến tại codon 26 (G→A) tạo

Hemoglobin E. Trong đó kiểu gen dị hợp tử HbE chiếm 45,5%, đồng hợp tử HbE chiếm 36,4% và kiểu gen dị hợp tử kép HbE/ β0- thalassemia chiếm 18,1%.

Bảng 8: Tỷ lệ các dạng đột biến ít gặp ở Việt Nam

Đột biến phát hiện Số lượng Tỷ lệ (%) Vị trí đột biến Dạng đột biến

Exon 1 β0 18 24 Codon 26 (G→T)

Exon 1 β0 6 8 Codon 15 (G→A)

Exon 2 Hb Hope 3 4 Hb Hope

Promoter 3 4 -30 (T→C) β0 hoặc không rõ ràng

Promoter β+ 1 1,3 -29 (A→G)

Intron 2 β+ 1 1,3 IVS-II-848 (C→G)

Ngoài những đột biến phổ biến ở Việt Nam, chúng tôi còn phát hiện thêm 6

đột biến khác chiếm 42,6% tổng số mẫu như đột biến tại các vị trí: codon 26 (G→T) gây β0-thalasemia [19] ; -30 (T→C) gây β+-thalasemia [12]; -29 (A→G) β+- thalasemia [12]; codon 15 (G→A) [22]; IVSII-848 (C→G) β+- thalasemia [25] và

đột biến tạo Hemoglobin Hope với tỷ lệ lần lượt là 24%; 4%; 1,3%; 8%; 1,3% và

4%. 6 đột biến này là những đột biến ít gặp ở Việt Nam nhưng lại có đóng góp lớn

trong việc giải thích nguyên nhân thiếu máu của một số bệnh nhân mà không tìm ra

đột biến bằng phản ứng multiplex PCR thường sử dụng.

Đặc biệt, trong đó có hai mẫu 27 và 29 phát hiện đột biến trên hai alen của vị

trí codon 26 G→T và G→A (hình 19). 2 mẫu này kết quả HbE lần lượt là 62,8% và

41,8% trên kết quả điện di huyết sắc tố (Phụ lục 2).

44

(a)

(b)

(a): kết quả phân tích bằng phần mềm Miseq Reporter; (b): kết quả phân tích bằng phần mềm IGV

Hình 19: Kết quả giải trình tự NGS mẫu đột biến codon 26

Theo hình 19a, phần mềm Miseq Reporter cho thấy ở vị trí 1580 trên gen

tham chiếu xuất hiện 2 alen đột biến trên mẫu phân tích với tần suất (Frequency)

mỗi loại xấp xỉ 0,5. Mỗi biến đổi C thành T hay C thành A được đọc 4198 lần trên

4198 đoạn đọc khác nhau. Do các nucleotide được đọc thông qua các tín hiệu huỳnh

quang gắn trên các nucleotide bổ sung vì thế đây chính là đột biến gây biến đổi G

thành A và G thành T. Đối chiếu với database để chỉ ra vị trí trên chromosome 11

và tham khảo dbSNP trên NCIB và trên HBVar để gọi tên đột biến. Kết quả trên

phần mềm IGV (hình 19b) cho thấy vị trí đột biến và tên đột biến giống như trên

phần mềm Miseq Reporter.

45

Hình 20: Kết quả so sánh đột biến tại codon 26(G→T) và codon 26 (G→A) với

cơ sở dữ liệu HbVar.

Trong trình tự phát hiện thấy có 2 đột biến SNP (khoanh đỏ trên hình 19) đều

nằm trên codon 26. Đột biến ở codon 26 (G→A) thuộc exon 1, làm thay đổi acid

amin Glutamate thành Lysin, tham khảo trên HbVar, đây chính là đột biến tạo biến

thể Hemoglobin E (hình 20). Ngoài ra trong mẫu này còn phát hiện thêm 1 đột biến

cũng ở codon 26 (G→T), làm biến đổi GAG (Glutamate) thành TAG (stop codon), làm dừng dịch mã tại codon 26, tham khảo trên HbVar đây là loại đột biến β0-

thalassemia. Ở thể HbE, với kiểu gen dị hợp tử chỉ gây ra thiếu máu nhẹ, kiểu gen

đồng hợp tử là rối loạn lành tính. Tuy nhiên trong trường khi HbE kết hợp với thể β0-thalassemia gây hiện tượng thiếu máu nặng ở bệnh nhân [31].

3.2.3. Kết quả phân tích đột biến trên gen HBB kiểm chứng lại bằng phương

pháp giải trình tự gen Sanger

Để đánh giá độ tương đồng giữa kết quả thực hiện giữa hệ thống giải trình tự

thế hệ mới và phương pháp điện di mao quản truyền thống, chúng tôi cũng đã chọn

bảy mẫu DNA để thực hiện đồng thời giải trình tự Sanger trên máy điện di mao

quản ABI-3500 của hãng Applied Biosystem. Bảy mẫu chúng tôi thực hiện đều thu

được kết quả hoàn toàn có sự tương đồng trong kết quả thu được (Bảng 9 và Hình

21).

46

Bảng 9: Kết quả giải trình tự NGS và Sanger

Tên mẫu KQ giải trình tự NGS KQ giải trình tự Sanger

6 -28 (A→G) -28 (A→G)

15 -29 (A→G) -29 (A→G)

19 -30 (T→C) -30 (T→C)

31 Codon 26 (G→T); Codon 26 (G→T)

41 IVS-I-1 (G→T) IVS-I-1 (G→T)

60 IVS-II-848 (C→G) IVS-II-848 (C→G)

64 Codon 15 (G→A) Codon 15 (G→A)

(a): đột biến codon 26(G→T); (b): đột biến -30 (T→C)

Hình 21: Kết quả kiểm chứng bằng phương pháp giải trình tự Sanger

47

Trong phương pháp giải trình tự Sanger, việc gọi tên các nucleotide dựa vào

cường độ đỉnh sáng (peak) phát ra khi điện di, sau đó máy sẽ so dòng của các đỉnh

tương ứng với nhau và phân tích thành trình tự của đoạn DNA. Còn trong phương

pháp NGS, mỗi chu kì các nucleotide được đọc thông qua các tín hiệu huỳnh quang

gắn trên các nucleotide bổ sung. Sự khác biệt quan trọng là thay vì giải trình tự từng

đoạn DNA đơn lẻ, có trình tự ngắn thì NGS nâng cấp lên thành thực hiện trên hàng

triệu đoạn đọc trong cùng một thời điểm với độ chính xác cao, dữ liệu đầu ra lớn và

khả năng đọc các nucleotide đạt Qscore 30 (tức là trong 1000 nucleotide thì khả

năng gọi tên sai là 1 nucleotide). Thông qua hệ thống phần mềm phân tích, những

sai khác này sẽ được chỉ rõ với tần suất xuất hiện tương ứng để người phân tích có

thể phát hiện được. Bên cạnh đó, khi giải trình tự nhiều mẫu bằng Sanger việc phân

tích kết quả giải trình tự là thủ công và tốn rất nhiều thời gian. Với NGS, dữ liệu

đưa ra được phân tích bằng phần mềm chuyên dụng của hãng cho phép phân tích

đồng thời hàng trăm mẫu với các thông số như: vị trí biến đổi, tên biến đổi, tần

suất… từ đó rút ngắn thời gian phân tích và cho kết quả đáng tin cậy.

3.2.4. Giá trị của các chỉ số sàng lọc trong nghiên cứu

3.2.4.1. Giá trị của chỉ số MCH và MCV

Xét nghiệm tổng phân tích tế bào máu ngoại vi dựa vào hai chỉ số là MCV <

80 fl cho biết hồng cầu nhỏ và MCH < 27 pg cho biết hồng cầu nhược sắc. Trong

nghiên cứu của chúng tôi sử dụng 69/75 mẫu có chỉ số MCV < 80 fl, trong đó có 43

trường hợp phát hiện đột biến (chiếm 58.6%). Tỷ lệ phát hiện đột biến ở nhóm đối

tượng có MCH <27 pg là 58.6%, tỷ lệ này thấp hơn ở nhóm đối tượng có cả MCH <

27 pg và MCV < 80 fl và nhóm đối tượng có MCV< 80 fl. Tỷ lệ phát hiện đột biến

ở nhóm đối tượng có MCV > 80fl, MCH > 27 pg lần lượt là 16.7% và 25% (Bảng

10). Điều này phù hợp với sơ đồ sàng lọc trong bệnh β-thalassemia [15].

48

Bảng 10: Tỷ lệ phát hiện đột biến của MCH và MCV

Đặc điểm Số mẫu Số mẫu phát hiện đột biến % phát hiện đột biến

MCV < 80fl 60,8 42 69

MCH < 27pg 58,6 43 71

MCH < 27pg và MCV < 80fl 60,8 42 69

MCV > 80fl 16,7 1 6

MCH > 27pg 25 1 4

3.2.4.2. Giá trị của các thành phần Hb

Trong xét nghiệm điện di huyết sắc tố, nếu tỷ kệ HbA2 > 4% hoặc HbF > 2%

thì được chẩn đoán là β-thalassemia.

Trong nghiên cứu của chúng tôi có 35/75 mẫu có HbA2 > 4% trong đó có

30/37 mẫu phát hiện đột biến chiếm 85.7%, 39/75 mẫu có HbF > 1% trong đó có

18/39 mẫu phát hiện đột biến chiếm 46.1%. 11 mẫu có xuất hiện HbE trong kết quả

điện di huyết sắc tố đều phát hiện đột biến (Bảng 11).

Bảng 11: Tỷ lệ phát hiện đột biến ở các chỉ số Hb

Đặc điểm Số mẫu Số mẫu phát hiện đột biến % phát hiện đột biến

HbA2 > 4% 85,7 30 35

HbF > 1% 46,1 18 39

Có xuất hiện HbE 100 11 11

49

KẾT LUẬN VÀ KIẾN NGHỊ

KẾT LUẬN

Từ những kết quả thu được trong quá trình nghiên cứu này chúng tôi có một

số kết luận như sau:

1. Đã tối ưu thành công quy trình “ứng dụng phương pháp giải trình tự thế hệ

mới (NGS) để phân tích gen HBB”.

2. Sử dụng quy trình đã tối ưu, chúng tôi đã phân tích 75 mẫu nghi ngờ mang

đột biến gây bệnh β-thalassemia phát hiện 44 mẫu (chiếm 58,6%) mang 10 loại đột

biến trong đó 4 loại đột biến phổ biến và 6 loại đột biến ít gặp ở Việt Nam. Phát

hiện tỷ lệ âm tính giả của kỹ thuật multiplex PCR 9 loại đột biến phổ biến ở Việt

Nam là 4,68%.

KIẾN NGHỊ

Với những kết quả thu được về việc tối ưu phương pháp giải trình tự NGS để

phân tích gen HBB và áp dụng thành công trên 75 mẫu bệnh phẩm. Chúng tôi đề

xuất một số hướng nghiên cứu tiếp theo như sau:

1. Ứng dụng quy trình đã tối ưu để phân tích gen HBB của người nghi ngờ

mắc β-thalassemia ở Viện Huyết học - Truyền máu trung ương hoặc cơ sở y tế khác

có nhiều người nghi ngờ mắc bệnh, hỗ trợ cho chẩn đoán và điều trị β-thalassemia.

2. Ứng dụng quy trình đã thiết lập để phân tích gen HBB của người nghi ngờ

mắc beta thalassemia để phát hiện các loại đột biến và tỉ lệ các đột biến ở người

Việt Nam.

50

TÀI LIỆU THAM KHẢO

Tiếng Việt 1. Nguyễn Khắc Hân Hoan, Quách Thị Hoàng Oanh, Phạm Việt Thanh & Trương Đình Kiệt, (2008),"Chẩn đoán di truyền phân tử bệnh beta thalassemia tại Bệnh viện Từ Dũ", Y học Thành phố Hồ Chí Minh, tập 12 (phụ bản số 1) pp. tr.341- 347.

2. Lê Thị Thu Hà, (2017), Phát hiện các đột biến trên gen Beta globin bằng kỹ thuật ARMS-PCR và lai điểm ngược (Reverse dot blot) Đại học Khoa học tự nhiên, Đại học quốc gia Hà Nội, Luận văn thạc sĩ.

3. Nguyễn Khắc Hân Hoan, (2013), Nghiên cứu tầm soát và chẩn đoán trước sinh bệnh alpha và bêta thalassemia, Đại học Y Dược Thành phố Hồ Chí Minh, Luận án Tiến sĩ y học.

4. Nguyễn Thị Thu Hà, (2017), Nghiên cứu đặc điểm đột biến gen globin và theo dõi điều trị thải sắt ở bệnh nhân thalassemia tại Viện Huyết học - Truyền máu Trung Ương giai đoạn 2013 - 2016, Đại học Y Hà Nội, Luận án Tiến sĩ Y học.

5. Trần Thị Thuý Minh, (2015), Tỷ lệ mắc và kiểu hình gen bệnh alpha và beta thalassemia ở trẻ em dân tộc Ê đê và M’nông tỉnh Đắk Lắk, Đại học Y dược Thành phố Hồ Chí Minh, Luận án Tiến sĩ Y học.

6. Trần Vân Khánh, Phạm Thanh Loan, Hồ Cẩm Tú, Trần Thị Oanh, Nguyễn Đức Hinh, Trần Huy Thịnh, Tạ Thành Văn, (2014),"Phát hiện đột biến gen gây bệnh beta thalassemia bằng kỹ thuật multiplex ARMS-PCR", Tạp chí Nghiên cứu Y học, 90 (5) pp.17-25. Tiếng Anh 7. Birgens Henrik and Ljung Rolf, (2007),"The thalassaemia syndromes", Scandinavian journal of clinical and laboratory investigation, 67 (1), pp.11-26.

8. BORGNA

PIGNATTI Caterina, Cappellini M.D., De Stefano P., Del Vecchio G.C., Forni G.L., Gamberini M.R., Ghilardi R., Origa R., Piga A. and Romeo M.A., (2005),"Survival and complications in thalassemia", Annals of the New York Academy of Sciences, 1054 (1), pp.40-47.

9. Buermans HPJ and Den Dunnen JT, (2014),"Next generation sequencing technology: advances and applications", Biochimica et Biophysica Acta (BBA)- Molecular Basis of Disease, 1842 (10), pp.1932-1941.

10. Bulger Michael, Bender MA, Van Doorninck J Hikke, Wertman Brett, Farrell Catherine M, Felsenfeld Gary, Groudine Mark and Hardison Ross, (2000),"Comparative structural and functional analysis of the olfactory receptor genes flanking the human and mouse β-globin gene clusters", Proceedings of the National Academy of Sciences, 97 (26), pp.14560-14565.

11. Cai Liuhong, Bai Hao, Mahairaki Vasiliki, Gao Yongxing, He Chaoxia, Wen Chuan, Wang You, Pan Rachel L and Qasba Armaan, (2018),"A Yanfei, Jin You universal approach to correct various HBB gene mutations in human stem cells for gene therapy of beta thalassemia and sickle cell disease", Stem cells translational medicine, 7 (1), pp.87-97. ‐

51

12. Cai SP, Zhang JZ, Doherty M and Kan YW, (1989),"A new TAT3A box mutation detected at prenatal diagnosis for beta-thalassemia", American journal of human genetics, 45 (1), pp.112.

13. Capellini M., Cohen A., Eleftheriou A., Piga A., Porter J. and Taher A., (2008),"Guidelines for the clinical management of thalassemia", Thalassaemia International Federation (TIF) April 2000,

14. Cappellini Maria-Domenica, Cohen A., Porter J., Taher A. and Viprakasit V., (2014), Guidelines for the management of transfusion dependent thalassaemia (TDT), Thalassaemia International Federation Nicosia, Cyprus,

15. Chang Judy C and Kan Yuet Wai, (1979),"beta 0 thalassemia, a nonsense mutation in man", Proceedings of the National Academy of Sciences, 76 (6), pp.2886-2889.

16. Colah Roshan, Gorakshakar Ajit and Nadkarni Anita, (2010),"Global burden, distribution and prevention of β-thalassemias and hemoglobin E disorders", Expert review of hematology, 3 (1), pp.103-117.

17. Edison Eunice S, Venkatesan Rajkumar S, Govindanattar Sankari Devi, George Biju and Shaji Ramachandran V, (2012),"A novel 26 bp deletion [HBB: c. 20_45del26bp] in exon 1 of the β-globin gene causing β-thalassemia major", Hemoglobin, 36 (1), pp.98-102.

18. Efstratiadis Argiris, Posakony James W, Maniatis Tom, Lawn Richard M, O'Connell Catherine, Spritz Richard A, Deriel Jon K, Forget Bernard G, Weissman Sherman M and Slightom Jerry L, (1980),"The structure and evolution of the human β-globin gene family", Cell, 21 (3), pp.653-668.

19. Fucharoen Goonnapa, Fucharoen Supan, Jetsrisuparb Arunee and Fukumaki Yasuyuki, (1990),"Molecular basis of HbE-β-thalassemia and the origin of HbE in northeast Thailand: Identification of one novel mutation using amplified DNA from buffy coat specimens", Biochemical and biophysical research communications, 170 (2), pp.698-704.

20. Galanello Renzo and Origa Raffaella, (2010),"Beta-thalassemia", Orphanet journal of rare diseases, 5 (1), pp.11.

21. Goodwin Sara, McPherson John D and McCombie W Richard, (2016),"Coming of age: ten years of next-generation sequencing technologies", Nature Reviews Genetics, 17 (6), pp.333. 22. Gray GR, Manson HE, Gu L

β° ‐

‐ ‐ H, Ye. Leonova J and Huisman THJ, (1995),"Hb lulu island (α2β2107 [G9] Gly→ Asp) thalassemia (codon 15; TGG→ TAG), a form of thalassemia intermedia", American journal of hematology, 50 (1), pp.26-29. Izzo P., 23. Grosso M., Sessa R., Puzone S., Storino M. R. and (2012),"Molecular basis of Thalassemia", Anemia,

24. Grosveld Frank, van Assendelft Greet Blom, Greaves David R and Kollias George, (1987),"Position-independent, high-level expression of the human β-globin gene in transgenic mice", Cell, 51 (6), pp.975-985.

52

25. Hattori Y, Yamamoto Ku, Yamashiro Y, Ohba Y, Miyamura S, Yamamoto Ki, Matsuno Y, Morishita M, Miyaji T and Era T, (1992),"Three β-Thalassemia Mutations in the Japanese: IVS-II-1 (G→ A). IVS-II-848 (C→ G), and Cooon 90 (GAG→ TAG)", Hemoglobin, 16 (1-2), pp.93-97.

26. Heather James M and Chain Benjamin, (2016),"The sequence of sequencers:

the history of sequencing DNA", Genomics, 107 (1), pp.1-8. 27. Illumina, (2014),"MiSeq® System User Guide", 28. illumina, (2012),"Nextera®XT DNA Sample Preparation Guide", 29. Illumina, An introduction to Next-Generation Sequencing Technology", 30. Illumina, (2016),"Nextera®XT DNA Library Prep Reference Guide", V01 31. Kohne Elisabeth, (2011),"Hemoglobinopathies: clinical manifestations, diagnosis, and treatment", Deutsches Ärzteblatt International, 108 (31-32), pp.532.

32. Li Dongzhi, Liao Can, Li Jian, Huang Yining, Xie Xingmei, Wei Jiaxue and Wu Shaoqing, (2006),"Prenatal diagnosis of β-thalassemia by reverse dot-blot hybridization in southern China", Hemoglobin, 30 (3), pp.365-370.

33. Little Stephen, (1995),"Amplification

‐ refractory mutation system (ARMS) analysis of point mutations", Current protocols in human genetics, 7 (1), pp.9.8. 1- 9.8. 12.

34. Liu Lin, Li Yinhu, Li Siliang, Hu Ni, He Yimin, Pong Ray, Lin Danni, Lu Lihua and Law Maggie, (2012),"Comparison of next-generation sequencing systems", BioMed Research International, 2012

35. Maxam Allan M and Gilbert Walter, (1977),"A new method for sequencing DNA", Proceedings of the National Academy of Sciences, 74 (2), pp.560-564.

36. Olivieri Nancy F, (1999),"The β-thalassemias", New England journal of medicine, 341 (2), pp.99-109.

37. Passarge Eberhard, (1995), Color atlas of genetics, Georg Thieme Verlag, 38. PK Menon, Nimmakayalu M, Bylappa SK, Kumar M and Abdalhaleem HM, A comparison of in-house Hemoglobin DNA Mutation analysis for β thalassemia by ARMS PCR with a Commercial Line Probe Assay", President’s Message, pp.79. 39. Punia P and Saunders NA, (2009),"The Quantitative amplification refractory mutation system", Real-time PCR: current technology and applications. Norfolk (VA): Horizon Scientific Press, Inc,

40. Sanger Frederick, Nicklen Steven and Coulson Alan R, (1977),"DNA sequencing with chain-terminating inhibitors", Proceedings of the national academy of sciences, 74 (12), pp.5463-5467.

41. Sgourou Argyro, Routledge Samantha, Antoniou Michael, Papachatzopoulou Adamantia, Psiouri Lambrini and Athanassiadou Aglaia, (2004),"Thalassaemia mutations within the 5′ UTR of the human β globin gene disrupt transcription", British journal of haematology, 124 (6), pp.828-835. ‐

42. Steensma David P, (2006),"JAK2 V617F in myeloid disorders: molecular diagnostic techniques and their clinical utility: a paper from the 2005 William Beaumont Hospital Symposium on Molecular Pathology", The Journal of Molecular Diagnostics, 8 (4), pp.397-411.

53

43. Svasti ML Saovaros, Hieu Tran Minh, Munkongdee Thongperm, Winichagoon Pranee, Van Be Tran, Van Binh Tran and Fucharoen Suthat, thalassemia in South Vietnam", American journal (2002),"Molecular analysis of β of hematology, 71 (2), pp.85-88. ‐

44. Teimourian Shahram, Khatibi Talayeh, Pourfarzad Farzin, Jalil-Nejad Sayeh and Azad Maryam, (2001),"Amplification Refractory Mutation System (ARMS) and reverse hybridization in the detection of beta-thalassemia mutations", Archives of Iranian Medicine, 4 (4), pp.165.

45. Thein Swee Lay, (2013),"The molecular basis of β-thalassemia", Cold Spring Harbor perspectives in medicine, 3 (5), pp.a011700.

46. Thein Swee Lay, (2004),"Genetic insights into the clinical diversity of β thalassaemia", British journal of haematology, 124 (3), pp.264-274.

47. Treisman Richard, Orkin Stuart H and Maniatis Tom, (1983),"Specific transcription and RNA splicing defects in five cloned β-thalassaemia genes", Nature, 302 (5909), pp.591.

48. Winichagoon Pranee, Fucharoen Suthat, Wilairat Prapon, Chihara Kazuo, Fukumaki Yasuyuki and Wasi Prawase, (1992),"Identification of five rare mutations including a novel frameshift mutation causing β0-thalassemia in Thai patients with β0-thalassemia/hemoglobin E disease", Biochimica et Biophysica Acta (BBA)-Molecular Basis of Disease, 1139 (4), pp.280-286.

49. Wolcott Mark J, (1992),"Advances in nucleic acid-based detection methods", Clinical microbiology reviews, 5 (4), pp.370-386.

50. Nguyễn Công Khanh (2008). Thalassemia-Huyết học lâm sàng Nhi khoa. Xuất bản lần 2. Nhà xuất bản Y học: 132-146.

51. Galanello R, Eleftheriou A, Old. J.,Petrou M, Angastinictis M. (2005). Prevention of Thalassemia and other Hemoglobin Disorders. Thalassemia International Federation Publications. V 1: 10.

52. Nguyễn Công Khanh, Dương Bá Trực, Lý Tuyết Minh và cs (1987). Sự lưu hành bệnh huyết sắc tố ở một số người dân tộc miền bắc. Y học Việt Nam, 4: 9-15.

53. Nguyễn Công Khanh, Dương Bá Trực (1993). Β-thalassemia và hemoglobin E tại Viện Bảo vệ Sức khỏa Trẻ em: Y học Việt Nam 174 (8): 23-30.

54. Nguyễn Công Khanh (2008). Hemoglobin bình thường và phân loại bệnh hemoglobin. Huyết học lâm sàng Nhi khoa, XB lần 2, NXB Y học: 124-132.

55. Weatherall DJ, Clegg JB (2001). The Thalassemia syndromes. Oxford Blackwell Science: 191.

56. Brown JM, Thein SL, Mar KM, Weatherall DJ (1989). The spectrum of β- thalassemia in Burma. Hemoglobin Switching: 161-169.

57. Laig M, Sanguasermesri T, Wiangnon S (1989). The spectrum of βthalassemia mutation in Northern Thailand. Human Genetics 84:47-50.

58. Kenvin TM, Arthur WN (1993). The Thalassemia. In : Nathan DG., Oski FA (eds). Hematology of Infancy and Childhood, 4th ed. Saunders Company : 785-805 59. Modell B (2008). Global epidemiology of haemoglobin disorders and derived service indicators. Public health reviews. Bulletin of WHO: 480-487.

54

PHỤ LỤC 1: KẾT QUẢ PHẢN ỨNG PCR KHUẾCH ĐẠI GEN HBB

Ghi chú: Kết quả điện di 75 mẫu nghiên cứu khuếch đại gen HBB bằng quy trình

PCR đã tối ưu; 1-75: kí hiệu mẫu; M: marker 1kb (ThermoFisher)

PHỤ LỤC 2: KẾT QUẢ XÉT NGHIỆM CẬN LÂM SÀNG CỦA ĐỐI TƯỢNG NGHIÊN CỨU

ĐIỆN DI HUYẾT SẮC TỐ

GIẢI TRÌNH TỰ NGS

TỔNG PHÂN TÍCH TẾ BÀO MÁU

STT

MCV (fL) MCH (pg)

Tên đột biến

Kiểu gen

HbA2 (%)

HbE (%)

HbF (%)

HbA1 (%)

1

72.2

KHÔNG PHÁT HIỆN ĐỘT BIẾN

23.2

80.7

4.7

14.60

2

72.0

23.0

71.3

4.1

24.60

KHÔNG PHÁT HIỆN ĐỘT BIẾN

3

68.7

20.6

90.1

2.7

7.10

KHÔNG PHÁT HIỆN ĐỘT BIẾN

4

92.2

27.8

97.8

2.2

KHÔNG PHÁT HIỆN ĐỘT BIẾN

5

82.2

27.5

96.4

3.6

KHÔNG PHÁT HIỆN ĐỘT BIẾN

6

73.0

22.8

92.8

4.8

2.40

-28 (A->G)

Dị hợp tử

7

79.9

26.0

95.7

4.3

KHÔNG PHÁT HIỆN ĐỘT BIẾN

8

76.4

23.2

95.4

4.6

KHÔNG PHÁT HIỆN ĐỘT BIẾN

9

62.3

18.2

62.5

2.6

34.90

Hb Hope

Dị hợp tử

10

66.8

20.3

2.7

3.2

94.10

Hb Hope

Đồng hợp tử

11

78.9

25.0

81.3

2.0

16.70

KHÔNG PHÁT HIỆN ĐỘT BIẾN

12

86.4

27.2

56.3

2.8

40.90

Hb Hope

Dị hợp tử

13

72.6

22.8

39.8

42.00

18.2

Hb E

Dị hợp tử

14

82.4

25.4

72.6

3.1

24.30

KHÔNG PHÁT HIỆN ĐỘT BIẾN

15

77.7

24.1

91.5

4.9

3.60

Dị hợp tử

-29 (A→G)

16

73.0

24.8

76.6

3.3

20.10

KHÔNG PHÁT HIỆN ĐỘT BIẾN

17

64.4

19.2

94.9

5.1

Dị hợp tử

Codons 41/42 (-TTCT); TTCTTT(Phe-Phe)

18

73.8

23.3

78.2

3.0

18.80

KHÔNG PHÁT HIỆN ĐỘT BIẾN

Dị hợp tử

19

73.1

23.6

96.0

4.0

-30 (T→C)

20

78.4

24.8

95.7

4.3

Dị hợp tử

-30 (T→C)

Dị hợp tử

21

82.3

26.2

95.7

4.3

-30 (T→C)

22

65.0

19.3

95.0

5.0

Dị hợp tử

Codon 26 (G->T); GAG(Glu)- >TAG(stop codon)

23

55.1

13.2

11.8

0.8

65.0

22.40

Hb E

Dị hợp tử

Dị hợp tử

24

58.5

16.2

95.1

4.9

Codon 26 (G→T); GAG(Glu→TAG(stop codon)

25

62.5

17.4

95.5

4.5

Dị hợp tử

Codon 26 (G→T); GAG(Glu) →TAG(stop codon)

Dị hợp tử

26

69.1

18.9

90.6

5.2

4.20

Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

HbE

Dị hợp tử

27

55.1

12.4

12.0

62.8

25.20

Dị hợp tử

Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

Dị hợp tử

28

58.7

16.2

94.4

5.6

Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

Dị hợp tử

62.3

16.8

5.9

41.8

51.60

0.7

29

Dị hợp tử

30

64.1

17.8

95.6

4.4

Dị hợp tử

31

60.4

17.8

95.8

4.2

Dị hợp tử

HbE Codon 26 (G→T); GAG(Glu)→TAG(stop codon) Codon 26 (G→T); GAG(Glu)→TAG(stop codon) Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

32

75.7

22.8

68.9

1.7

KHÔNG PHÁT HIỆN ĐỘT BIẾN

33

78.2

24.6

59.6

3.3

26.5

Dị hợp tử

34

66.7

19.5

95.7

4.3

Dị hợp tử

35

69.5

20.5

95.5

4.5

Dị hợp tử

36

59.0

17.9

95.1

4.9

Dị hợp tử

Hb E Codon 26 (G→T); GAG(Glu)→TAG(stop codon) Codon 26 (G→T); GAG(Glu)→TAG(stop codon) Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

37

59.7

17.2

97.6

2.4

38

61.7

18.5

94.4

5.6

Dị hợp tử

39

59.4

17.2

95.1

4.9

Dị hợp tử

40

70.0

20.7

95.2

4.8

Dị hợp tử

41

71.6

21.9

92.3

4.5

Dị hợp tử

3.20

42

63.2

19.4

94.9

5.1

Dị hợp tử

KHÔNG PHÁT HIỆN ĐỘT BIẾN Codon 26 (G→T); GAG(Glu)→TAG(stop codon) Codon 26 (G→T); GAG(Glu)→TAG(stop codon) Codon 26 (G→T); GAG(Glu)→TAG(stop codon) IVS-I-1 (G→T); AG^GTTGGT→AGTTTGGT Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

43

81.4

27.1

97.4

2.6

KHÔNG PHÁT HIỆN ĐỘT BIẾN

44

66.0

19.6

95.0

5.0

Dị hợp tử

Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

45

73.3

21.4

95.1

4.9

Dị hợp tử

Codon 26 (G→T); GAG(Glu)→TAG(stop codon)

46

70.2

16.3

79.9

11.6

Hb E

Dị hợp tử

2.50

47

68.6

16.9

71.0

10.7

Hb E

Dị hợp tử

7.90

48

77.1

24.8

75.7

1.8

KHÔNG PHÁT HIỆN ĐỘT BIẾN

22.50

49

71.7

22.3

82.5

2.2

KHÔNG PHÁT HIỆN ĐỘT BIẾN

15.30

50

71.0

23.3

85.6

1.9

KHÔNG PHÁT HIỆN ĐỘT BIẾN

12.50

51

76.4

23.6

82.7

2.3

KHÔNG PHÁT HIỆN ĐỘT BIẾN

15.00

52

65.2

21.6

6.7

45.7

Hb E

Đồng hợp tử

47.60

53

73.5

23.0

84.1

1.9

KHÔNG PHÁT HIỆN ĐỘT BIẾN

14.00

54

70.0

21.1

87.5

2.1

KHÔNG PHÁT HIỆN ĐỘT BIẾN

10.40

55

71.6

22.3

87.1

2.5

KHÔNG PHÁT HIỆN ĐỘT BIẾN

10.40

56

70.4

21.4

83.5

2.1

KHÔNG PHÁT HIỆN ĐỘT BIẾN

14.40

57

64.8

20.5

6.2

Hb E

Đồng hợp tử

46.60

47.2

58

71.3

22.2

81.8

2.4

KHÔNG PHÁT HIỆN ĐỘT BIẾN

15.80

59

69.8

22.6

6.8

Hb E

Đồng hợp tử

41.00

52.2

60

58.1

17.2

95.6

4.4

Dị hợp tử

IVS-II-848 (C→G); beta+

61

67.9

18.5

95.0

5.0

KHÔNG PHÁT HIỆN ĐỘT BIẾN

62

78.0

23.6

78.4

3.6

18.00

KHÔNG PHÁT HIỆN ĐỘT BIẾN

63

71.6

21.8

84.5

1.8

13.70

KHÔNG PHÁT HIỆN ĐỘT BIẾN

64

64.3

19.7

95.1

4.9

Dị hợp tử

Codon 15 (G→A); TGG(Trp) →TAG(stop codon)

65

69.0

19.4

95.6

4.4

Dị hợp tử

Codon 15 (G→A); TGG(Trp) →TAG(stop codon) beta0

Dị hợp tử

66

66.7

19.0

91.9

5.5

2.60

Codon 15 (G→A); TGG(Trp) →TAG(stop codon) beta0

Dị hợp tử

67

63.3

17.8

95.1

4.9

Codon 15 (G→A); TGG(Trp)- >TAG(stop codon) beta0

68

65.1

19.7

95.5

4.5

Dị hợp tử

Codon 15 (G→A); TGG(Trp) →TAG(stop codon) beta0

69

75.7

23.7

79.2

1.7

19.10

KHÔNG PHÁT HIỆN ĐỘT BIẾN

70

56.3

17.1

95.2

4.8

Dị hợp tử

Codon 15 (G→A); TGG(Trp) →TAG(stop codon) beta0

71

77.6

25.0

5.7

51.60

42.7

Hb E

Đồng hợp tử

72

74.2

23.2

78.2

1.8

20.00

KHÔNG PHÁT HIỆN ĐỘT BIẾN

73

75.2

24.6

86.1

2.1

11.80

KHÔNG PHÁT HIỆN ĐỘT BIẾN

74

79.8

24.7

75.2

1.1

KHÔNG PHÁT HIỆN ĐỘT BIẾN

75

72.9

22.8

79.0

0.9

KHÔNG PHÁT HIỆN ĐỘT BIẾN