Khảo sát biến dị di truyền gene chuyển hóa thuốc ở người Kinh Việt Nam

Ngày nhận bài: 27-03-2025 / Ngày chấp nhận đăng bài: 24-04-2025 / Ngày đăng bài: 05-05-2025

*Tác giả liên hệ: Nguyễn Hoàng Khuê Tú. Khoa Công nghệ Sinh học, Trường Đại học Quốc tế, Đại học Quốc gia Thành phố Hồ Chí Minh,

Thành phố Hồ Chí Minh, Việt Nam. E-mail: nhktu@hcmiu.edu.vn

https://www.tapchiyhoctphcm.vn 41

ISSN: 1859-1779

Nghiên cứu Y học

Tạp chí Y học Thành phố Hồ Chí Minh;28(5):41-48

https://doi.org/10.32895/hcjm.m.2025.05.06

Khảo sát biến dị di truyền của các gene chuyển hoá

thuốc ở người Kinh Việt Nam

Tống Thị Hằng1,3, Phan Võ Thu Nga1,3, Nguyễn Minh Hiền2,3, Nguyễn Hoàng Khuê Tú1,3,*, Lê

Thị Lý1,3

1Khoa Công nghệ Sinh học, Trường Đại học Quốc tế, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ

Chí Minh, Việt Nam

2Trường Đại học khoa học sức khỏe, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam

3Đại học Quốc Gia thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam

Tóm tắt

Đặt vấn đề: Dược di truyền (Pharmacogenomics) là lĩnh vực nghiên cứu về các gene mã hoá các enzyme chuyển hoá

và phản ứng thuốc. Biến dị của các gene nói chung và các gene thuốc nói riêng có tính đặc trưng chủng tộc. Do đó, dữ

liệu dược di truyền của quần thể ngẫu nhiên có ý nghĩa trong việc đánh giá sự liên quan giữa phân bố biến dị di truyền

và khả năng thay đổi chuyển hoá thuốc trong quần thể đặc trưng. Dữ liệu là nguồn tham khảo cho các nghiên cứu trên

nhóm bệnh nhân.

Mục tiêu: Xây dựng bộ dữ liệu về biến dị của các gene quan trọng trong chuyển hoá thuốc trên nhóm người Kinh ở thành

phố Hồ Chí Minh.

Đối tượng và phương pháp nghiên cứu: Nghiên cứu mô tả cắt ngang trên một trăm người khoẻ mạnh từ 18 tuổi trở lên (18-

47), tỉ lệ nam: nữ là 1:1, không có bệnh mãn tính tại thời điểm nghiên cứu, và được xác định là người Kinh thông qua bảng

câu hỏi tự khai. DNA của các tình nguyện viên được thu thập, giải trình tự 100 gene chuyển hoá thuốc và phân tích biến dị.

Kết quả: Vùng mã hoá của 100 gene chuyển hoá thuốc ở người Kinh chỉ ra 689 biến dị bao gồm 652 biến dị SNP (single

nucleotide polymorhism) và 37 biến dị indel (insertion/deletion), trong đó 59 biến dị là mới xuất hiện trên 39 gene. Hai mươi

tám biến dị quan trọng liên quan đến các bệnh chuyển hoá thuốc được tìm thấy trên vùng mã hoá này. Phân bố của các

biến dị có độ tương đồng với người Đông Á và khác biệt rõ rệt so với người châu Phi.

Kết luận: Dữ liệu về phân bố của các biến dị di truyền của các gene chuyển hoá thuốc ở người Kinh được xây dựng. Dữ

liệu có thể dùng để tham khảo cho các nghiên cứu về dược di truyền ở bệnh nhân.

Từ khóa: dược di truyền; biến dị; người Kinh; biến dị quan trọng

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5* 2025

42 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.05.06

Abstract

GENETIC VARIATION OF DRUG METABOLIZING GENES IN VIETNAMESE KINH

PEOPLE

Tong Thi Hang, Phan Vo Thu Nga, Nguyen Minh Hien, Nguyen Hoang Khue Tu, Le Thi Ly

Background: Pharmacogenomics is the study of structure and variation of genes involved in drug metabolism and

responses. Genetic variation of these genes is proven to be ethnic specific. Therefore, pharmacogenomic data of

general population is valuable to evaluate the association of genetic distribution and potential changes in drug

metabolism. The dataset could serve as the reference resource for studies in various patient groups.

Objective: To generate the dataset of genetic variation of drug-metabolizing genes for Vietnamese Kinh people at Ho

Chi Minh City.

Methods: The cross-sectional study was conducted on 100 healthy adult volunteers from 18 to 47, years of age without

any chronic disease at the time of study, and the sampling process were implemented with gender ratio of 1:1. All

participants confirmed their ethnicity through the self administered questionnaire. DNAs of volunteers were collected

and sequenced at the target regions of 100 genes for drug metabolism. Sequences were analyzed for genetic variation.

Results: We obtained from the coding region of genes for drug metabolism with 689 variants consisting of 652 SNPs

and 37 indels, in which 59 variants were novel present in 39 genes. There were 28 very important variants found in

these regions. The distribution of the variants was similar to that in East Asian and significantly different from African

people.

Conclusion: The dataset on genetic variation and distribution of genes for drug metabolism in Kinh people was

generated. This data can be used as reference for upcoming research in different groups of patients.

Keywords: pharmacogenomic; variant; Kinh people; very important pharmacogenes

1. ĐẶT VẤN ĐỀ

Dược di truyền là một lĩnh vực mới của di truyền y học

nhằm tìm ra các biến dị di truyền liên quan đến sự thay đổi

chuyển hoá thuốc ở người bệnh. Có hai nhóm gene chủ yếu

được nghiên cứu. Nhóm 1 bao gồm các gene mã hoá cho các

thụ thể tiếp nhận thuốc trên màng tế bào, các enzyme trong

con đường chuyển hoá, các enzyme vận chuyển và đào thải

thuốc. Biến dị di truyền của các gene này có thể làm thay đổi

tốc độ chuyển hoá thuốc và gây độc tế bào dẫn đến các phản

ứng có hại [1]. Nhiều nghiên cứu đã chỉ ra rằng các phản ứng

có hại gây ra bởi gene trong nhóm 1 có thể dự đoán được và

có thể kiểm soát nhờ thay đổi liều thuốc [2,3]. Nhóm thứ 2

bao gồm các gene mã hoá cho các protein của hệ miễn dịch

như HLA (human leukocyte antigen) hay IL (interleukin) [4].

Các phản ứng có hại gây ra bởi gene trong nhóm 2 thường

không dự đoán được.

Các nghiên cứu dược di truyền hiện nay tập trung tìm ra

các biến dị di truyền có liên quan đến các phản ứng có hại do

thuốc. Nghiên cứu có thể ở dạng phân tích lặp lại (replication

method), nhằm phân tích sự phân bố của biến dị trên các

nhóm bệnh nhân khác nhau, hoặc các nhóm chủng tộc khác

nhau; hoặc phân tích liên kết di truyền trên toàn bộ hệ gene

của bệnh nhân có sự dụng cùng loại thuốc nhằm tìm ra tìm

ra biến dị có độ liên kết cao nhất với kiểu hình chuyển hoá

nghiên cứu (genome wide association study) [5]. Sự phân bố

của các biến dị này trên quần thể ngẫu nhiên có thể được

dùng để đánh giá được mức độ nguy cơ xảy ra các phản ứng

có hại của thuốc đặc thù đồng thời tạo cơ sở dữ liệu tham

khảo trong các nghiên cứu bệnh chứng.

Với độ phân bố khoảng 86% dân số, người Kinh là chủng

tộc lớn nhất và phân bố rộng nhất ở Việt Nam. Do đó các

nghiên cứu di truyền được thực hiện chủ yếu trên nhóm

chủng tộc này. Các nghiên cứu về đa hình gene chuyển hoá

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5 * 2025

https://doi.org/10.32895/hcjm.m.2025.05.06 https://www.tapchiyhoctphcm.vn

thuốc đã được thực hiện trên người Kinh ở các khu vực khác

nhau. Việc kết hợp khảo sát nhiều gene trên nhóm mẫu người

Kinh ở Thành phố Hồ Chí Minh cung cấp thêm các thông tin

đối chứng tổng quát về biến dị của các gene chuyển hoá

thuốc trên quần thể người Kinh Việt Nam.

Các gene quan trọng trong Nhóm 1 được xác định dựa vào

mức độ tham gia và ảnh hưởng của enzyme lên các con

đường chuyển hoá thuốc. Cơ sở dữ liệu về thông tin dược di

truyền PharmGKB đã tổng hợp và thống kê các con đường

chuyển hoá thuốc có sự tham gia của các enzyme từ các

nghiên cứu độc lập [6]. Các gene này bao gồm gene của hệ

thống ôxy hoá khử cytochrome P450, các enzyme liên hợp

như N-acetyltransferase (NAT), UDP-

glucuronosyltransferase (UGT), Glutathione S-transferase

(GST), các enzyme vận chuyển và bài tiết thuốc như SLC

transporter hay ABC transporter. Ví dụ, enzyme CYP1A1

được ghi nhận tham gia vào 15 con đường chuyển hoá thuốc

trong khi đó CYP2C19 tham gia vào 59 con đường và

CYP2D6 tham gia vào 68 con đường trong tổng số 263 con

đường chuyển hoá thuốc được ghi nhận trên hệ thống thông

tin của cơ sở dữ liệu này (https://www.pharmgkb.org). Trong

một nghiên cứu của Hiệp hội dược di truyền

(Pharmacogenomic Research Network, PGRN), 84 gene đã

được lựa chọn khảo sát dựa trên ảnh hưởng của chúng tới

kiểu hình chuyển hoá được báo cáo bởi Liên hiệp dược di

truyền lâm sàng quốc tế (Clinical Pharmacogenomic

Implementaation Consortium, CPIC) [7]. Nghiên cứu trên

1710 người được lấy mẫu ngẫu nhiên từ 11 quần thể châu

Âu sử dụng 231 gene trong đó 7 dấu ấn sinh học được tìm

thấy có sự khác biệt di truyền giữa các quần thể và ảnh hưởng

tới hiệu quả và độc tính của thuốc trong 51 phác đồ chuẩn

[8]. Danh sách 100 gene sử dụng trong nghiên cứu này có sự

tham khảo và chọn lọc từ các gene trong các nghiên cứu diện

rộng trước đây.

Mục tiêu

Khảo sát các biến dị di truyền trong vùng mã hoá của 100

gene quan trọng trong chuyển hoá thuốc ở người Kinh ở

thành phố Hồ Chí Minh, Việt Nam.

2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP

NGHIÊN CỨU

2.1. Đối tượng nghiên cứu

Người Việt Nam khoẻ mạnh tuổi từ 18 trở lên, không có

các bệnh mãn tính tại thời điểm nghiên cứu. Các tình nguyện

viên tham gia trả lời bảng câu hỏi khảo sát về bệnh sử và

nguồn gốc chủng tộc trong vòng 3 thế hệ.

2.1.1. Tiêu chuẩn chọn

Người được chọn tham gia nghiên cứu phải đảm bảo 3 thế

hệ trong gia đình đều là người Kinh. Trước khi lấy mẫu, các

tình nguyện viên được phổ biến về nghiên cứu và ký bảng

đồng thuận.

2.2. Phương pháp nghiên cứu

2.2.1. Thiết kế nghiên cứu

Nghiên cứu cắt ngang.

2.2.2. Cỡ mẫu

Cỡ mẫu được tham khảo từ dự án 1000 hệ gene người với

kỳ vọng phát hiện tất cả các biến dị phổ biến trong quần thể,

do đó cỡ mẫu được tính với khoảng tin cậy 95%, biên độ sai

số 5% và ước tính 95% dân số của quần thể mang các biến

dị có có tần số alen MAF (minor allele frequency) ≥ 5%.

2.2.3. Phương pháp thực hiện

Nghiên cứu thực hiện với trình tự các nội dung: tuyển tình

nguyện viên đủ diều kiện tham gia nghiên cứu, thu thập mẫu

máu của người tham gia, tách chiết DNA tổng số, giải trình

tự thế hệ mới tại các vùng mã hoá của 100 gene mục tiêu,

phân tích biến dị và phân tích thống kê.

Tách chiết DNA: 3 ml máu ngoại vi của người tham gia

nghiên cứu được thu và lưu trữ trong ống EDTA sau khi

người cho ký văn bản đồng thuận nghiên cứu. DNA tổng số

được tách chiết bằng kit tách chiết QIAamp DNA Blood

Mini Kit (Qiagen, GmbH, Germany). Nồng độ và độ tinh

sạch của mẫu DNA được kiểm tra bằng phương pháp điện di

agarose và phương pháp quang phổ kế. Các mẫu DNA được

chọn để giải trình tự phải đạt nồng độ tối thiểu là 50ng/µl và

tỉ số hấp thụ A260/280 nằm trong khoảng 1,8 đến 2, đảm bảo

độ tinh sạch.

Chuẩn bị thư viện và Kỹ thuật giải trình tự thế hệ mới:

DNA bộ gene từ các cá thể tham gia nghiên cứu được dùng

cho phản ứng mulltiplex PCR nhằm khuếch đại vùng mã hoá

của 100 gene mục tiêu bao gồm: các gene vận chuyển thuốc,

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5* 2025

44 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.05.06

cytochrome P450, uridine diphosphate

glucuronosyltransferase (UGT), flavin-containing

monooxygenase (FMO), glutathione S-transferase (GST),

sulfotransferase (SULT), và một số gene khác. Các gene

được chọn lọc dựa trên mức độ tham gia của chúng vào các

quá trình chuyển hoá của nhiều thuốc khác nhau [9]. Sản

phẩm PCR được gắn barcode để đánh dấu từng cá thể, sau

đó được tinh sạch và giải trình tự 2 chiều sử dụng kit Miseq

Reagent Kit v2 (Illumina, San Diego, CA, USA) trên máy

bench top Next generation Sequencer với sản phẩm đầu ra

2x250 bp.

Phân tích biến dị: Trình tự thu được dưới các đoạn đọc

ngắn khoảng 250 bp được đối chiếu với trình tự hệ gene tham

chiếu của người bằng công cụ Burrows-Wheeler Aligner

(0.7.17), sau đó được phân tích và tìm biến dị theo quy trình

tìm biến dị GATK 4.2 (Genome analyis toolkits- Broad

Institute). Các biến dị sau đó được chấm điểm bằng các thuật

toán (Variant Quality Score Recalibration) khi hiệu chỉnh

bằng các cơ sở dữ liệu chuẩn (Hapmap, Omni, 1000G,

DbSNP), trên cơ sở đó, các thang điểm được sử dụng kết hợp

để đánh giá từng biến dị là đạt (true positive) hay dương giả

(false positive) [10]. Các biến dị đạt chất lượng được giữ lại

để phân tích chức năng, mức độ ảnh hưởng lên protein

enzyme khi đối chiếu với cơ sở dữ liệu Ensembl/GENCODE.

Các công cụ dùng để thao tác trên dữ liệu bao gồm: Bcftools

11.10.2, Vcftools 0.1.16, Plink 1.9, PGDSpider 3 và R

software.

2.2.4. Xử lý và phân tích dữ liệu

Phần mềm Excel (Microsoft) và SPSS 20 được sử dụng

để so sánh tần số alen của các gene nghiên cứu với tần số

alen tương ứng của các quần thể Châu Á, Châu Âu, Châu

Mỹ và Châu Phi trong cơ sở dữ liệu mở của Dự án 1000 hệ

gene người bằng kiểm định Chi bình phương và kiểm định

Fisher, giá trị p hai chiều được tính theo hiệu chỉnh Boferroni

với p <0,000154 (0,05/(26C2) được xác định là khác biệt có

ý nghĩa thống kê.

3. KẾT QUẢ

Các tình nguyện viên tham gia nghiên cứu có độ tuổi từ 18

– 47 (trung bình ± độ lệch chuẩn: 23,6±0,6) với tỉ lệ nam: nữ

là 1:1. Các đặc điểm khác của mẫu bao gồm: BMI 16,4-29,3

(22,1±0,3), cân nặng 42-98 kg (59,6±1,2) và chiều cao 1,50-

1,83 m (1,64±0,8). Các câu trả lời từ bảng khảo sát xác định

nguồn gốc 3 thế hệ trong gia đình là người Kinh và hiện tại

người tham gia nghiên cứu không có bệnh mãn tính nào. Mẫu

máu ngoại vi được thu thập và tách chiết DNA với chất lượng

đạt tiêu chuẩn cho giải trình tự sau khi kiểm tra bằng phương

pháp diện di agarose và phương pháp quang phổ.

Các đoạn đọc ngắn thu được từ máy giải trình tự có chỉ số

read-depth trung bình là 317X trong đó 98,3% vùng trình tự

này có read-depth từ 20X trở lên. Chỉ số read-depth trong giải

trình tự đoạn đọc ngắn (short read sequencing) được dùng để

đánh giá khả năng các đoạn đọc có thể phủ được hết vùng giải

trình tự được lựa chọn. Trong các phân tích, read-depth được

đề nghị tối thiểu là 15X. Sau khi lọc bỏ các vị trí có read-depth

<20 và p <1,0 x e-50 trong kiểm định cân bằng quần thể

Hardy-Weinberg, chúng tôi thu được 689 biến dị bao gồm 652

SNP và 37 indel, trong đó có 371 biến dị là đột biến sai nghĩa,

266 biến dị đột biến đồng nghĩa, 30 biến dị đột biến lệch khung,

14 biến dị thêm mã kết thúc, 2 biến dị mất mã kết thúc, 3 biến

dị chèn Nu không thay đổi khung đọc, 2 biến dị mất Nu không

thay đổi khung đọc và 1 biến dị protein. Năm mươi chín biến

dị trong các vùng gene này đươc xác định là mới trong đó 13

biến dị được dự đoán (trên thuật toán của SIFT và Polyphen)

có kiểu hình suy giảm chức năng của protein (Bảng 1).

Tần số của các biến dị thu được cho biết thông tin phân bố

của biến dị trong quần thể. Trong dữ liệu thu được, nhiều biến

dị có cùng tần số, tuy nhiên nhiều biến dị có độ phân bố khác

biệt so với quần thể khác (dữ liệu chưa công bố). Để tính sự

khác biệt di truyền giữa người Kinh và các chủng tộc khác,

chúng tôi sử dụng tần số của toàn bộ 689 biến dị để tính chỉ số

so sánh khoảng cách di truyền (Fst) giữa quần thể nghiên cứu

và 26 quần thể trong dữ liệu 1000 hệ gene người. Hai mươi

sáu quần thể được phân tích bao gồm CHB (Han Chinese in

Beijing, China), CHS (Southern Han Chinese), CDX (Chinese

Dai in Xishuangbanna, China), JPT (Japanese in Tokyo,

Japan), CEU (Utah residences with Northern and Western

European ancestry), TSI (Toscani in Italia), GBR (British in

England and Scotland), FIN (Finish in Finland), IBS (Iberian

population in Spain), YRI (Yoruba in Ibadan, Nigeria), LWK

(Luhya in Webuye, Kenya), GWD (Gambian in Western

Division, Gambia), MSL (Mende in Sierra Leone), ESN (Esan

in Nigeria), ASW (African ancestry in Southwest US), ACB

(African Caribbean in Barbados), MXL (Mexican ancestry in

Los Angeles, California), PUR (Puerto Rican in Puerto Rico),

CLM (Colombian in Medellin, Colombia), PEL (Peruvian in

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5 * 2025

https://doi.org/10.32895/hcjm.m.2025.05.06 https://www.tapchiyhoctphcm.vn

Lima, Peru), GIH (Gujarati Indian in Houston, Texas), PJL

(Punjabi in Lahore, Pakistan), BEB (Bengali in Bangladesh),

STU (Srilankan Tamil in The UK), ITU (Indian Telugu in The

UK). Mẫu nghiên cứu cũng được so sánh với mẫu của 99

người Kinh tại Thành phố Hồ Chí Minh có trong cơ sở dữ liệu

này. Fst càng nhỏ thể hiện sự khác biệt di truyền càng thấp.

Hai mẫu nghiên cứu trên người Kinh ở thành phố Hồ Chí

Minh (KHV99: mẫu thuộc dữ liệu hệ gene người, và

KHV100: mẫu thuộc nghiên cứu này) không có khác biệt di

truyền (Fst =0) cho thấy mẫu được thu ngẫu nhiên và phân bố

di truyền như nhau trong 2 lần thu thập. Kết quả so sánh di

truyền cho thấy người Kinh Việt Nam có sự tương đồng lớn

nhất với người Đài phân bố ở khu vực Nam Vân Nam Trung

Quốc gần biên giới Việt Nam, Lào và Myanma (Fst 0,005),

sau đó là người Hán Trung Quốc (Fst: 0,012 CHB, 0,007

CHS) và người Nhật (Fst 0,016). Người Kinh có sự khác biệt

di truyền lớn nhất với các chủng tộc châu Phi (Fst: MSL 0,081,

ESN 0,076, GWD 0,079). Mức độ khác biệt di truyền của các

quần thể nghiên cứu được thể hiện trên Hình 1.

Bảng 1. Các biến dị mới có kiểu hình tiên lượng nguy hiểm đối với chức năng protein

Vị trí trên genome Alen GENE

Vị trí

axit

amin

Thay

đổi

axit

amin

Codon SIFT (score1) PolyPhen (score2)

1:109689097-

1096890975 C GSTM1 76 I/T aTc/aCc deleterious_low_confidence3

(0,01) probably_damaging4 (1)

1:109689228-

109689228 A GSTM1 88 G/E gGg/gAg deleterious_low_confidence

(0,02)

probably_damaging

(0,999)

2:38074670-

38074670 G CYP1B1 240 L/P cTg/cCg Deleterious (0) probably_damaging (1)

2:233682025-

233682025 A UGT1A7 30 V/I Gta/Ata deleterious_low_confidence

(0,01)

probably_damaging

(0,982)

4:69096575-

69096575 T UGT2B7 19 S/C Agc/Tgc deleterious_low_confidence

(0)

possibly_damaging

(0,9)

10:71362456-

71362456 G SLC29A3 426 N/D Aac/Gac deleterious(0) probably_damaging

(0,991)

10:95037292-

95037292 G CYP2C8 437 G/R Gga/Cga deleterious_low_confidence

(0)

probably_damaging

(0,998)

11:63373715-

63373715 G SLC22A9 193 A/G gCt/gGt deleterious(0) probably_damaging

(0,974)

12:21176778-

21176778 G SLCO1B1 121 Y/C tAc/tGc deleterious(0) probably_damaging(1)

16:16068157-

16068157 C ABCC1 560 V/A gTg/gCg deleterious_low_confidence

(0)

probably_damaging

(0,999)

16:16068172-

16068172 C ABCC1 565 F/S tTt/tCt deleterious_low_confidence

(0)

probably_damaging

(0,999)

19:15673578-

15673578 C CYP4F12 17 S/P Tcc/Ccc deleterious_low_confidence

(0,01)

probably_damaging

(0,958)

19:41016712-

41016712 G CYP2B6 454 L/R cTc/cGc deleterious(0) probably_damaging

(0,995)

1,2thang điểm SIFT và Polyphen được tính từ 0-1. Thang điểm SIFT càng nhỏ và điểm Polyphen lớn tương ứng với khả năng xảy ra kiểu hình càng cao.

3,4kiểu hình gây suy giảm chức năng protein

5Thay đổi từ T  C ở vị trí 109689097 của gene GSTM1 (Glutathione S-transferase M1) trên nhiễm săc thể 1 làm thay đổi codon ATC thành ACC dẫn đến thay đổi

axit amin thứ 76 từ Isoleucine thành Threonine. Đột biến được dự đoán làm thay đổi chức năng enzyme GSTM1 với giá trị điểm có ý nghĩa từ thuật toán của SIFT

(0,03) và Polyphen [1]