Ngày nhận bài: 27-03-2025 / Ngày chấp nhận đăng bài: 24-04-2025 / Ngày đăng bài: 05-05-2025
*Tác giả liên hệ: Nguyễn Hoàng Khuê Tú. Khoa Công nghệ Sinh học, Trường Đại học Quốc tế, Đại học Quốc gia Thành phố Hồ Chí Minh,
Thành phố Hồ Chí Minh, Việt Nam. E-mail: nhktu@hcmiu.edu.vn
© 2025 Bản quyền thuộc về Tạp chí Y học Thành phố Hồ Chí Minh.
https://www.tapchiyhoctphcm.vn 41
ISSN: 1859-1779
Nghn cứu Y học
Tạp chí Y học Thành phố Hồ Chí Minh;28(5):41-48
https://doi.org/10.32895/hcjm.m.2025.05.06
Khảo sát biến dị di truyền của các gene chuyển hoá
thuốc ở người Kinh Việt Nam
Tng ThHằng1,3, Phan Thu Nga1,3, Nguyễn Minh Hiền2,3, Nguyễn Hng Khuê Tú1,3,*, Lê
Thị Lý1,3
1Khoa Công nghệ Sinh học, Trường Đại học Quốc tế, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ
Chí Minh, Việt Nam
2Trường Đại học khoa học sức khỏe, Đại học Quốc gia Thành phố HChí Minh, Thành phHồ Chí Minh, Việt Nam
3Đại học Quốc Gia thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam
Tóm tắt
Đặt vấn đề: ợc di truyền (Pharmacogenomics) là lĩnh vực nghiên cứu về các gene mã hoá các enzyme chuyển hoá
và phản ứng thuốc. Biến dị của các gene nói chung c gene thuốc nói riêng tính đặc tng chủng tộc. Do đó, d
liệu dược di truyền của quần thể ngẫu nhn có ý nghĩa trong việc đánh gsự liên quan giữa phân bố biến dị di truyền
và khảng thay đổi chuyển h thuốc trong quần thể đặc trưng. Dữ liệu là nguồn tham khảo cho các nghiên cứu trên
nm bệnh nhân.
Mc tu: Xây dựng bdữ liệu vbiến dị của các gene quan trng trong chuyn h thuốc trên nhóm người Kinh thành
phố HChí Minh.
Đối tượng pơng pháp nghiên cu: Nghiên cứu tcắt ngang trên một trăm nời khomạnh t18 tuổi trn (18-
47), tỉ lệ nam: n là 1:1, kng bệnhn nh tại thời điểm nghn cứu, và được xác định người Kinh thông qua bảng
u hỏi t khai. DNA của c nh nguyện viên được thu thập, gii tnh tự 100 gene chuyển h thuốc pn ch biến dị.
Kết quả: ng mã h của 100 gene chuyển hoá thuốc ở nời Kinh chỉ ra 689 biến dị bao gồm 652 biến dị SNP (single
nucleotide polymorhism) và 37 biến dị indel (insertion/deletion), trong đó 59 biến dị là mi xuất hiện trên 39 gene. Hai ơi
tám biến dị quan trọng ln quan đến các bệnh chuyển h thuốc đưc tìm thy trên vùng mã h này. Phân b của c
biến d đơng đồng với nời Đông Á và khác biệt rt so với người châu Phi.
Kết luận: Dữ liệu về phân bố ca các biến dị di truyền của các gene chuyển h thuốc người Kinh đưc xây dựng. Dữ
liệu thng đtham khảo cho c nghiên cu v ợc di truyền bệnh nn.
T khóa: c di truyền; biến dị; ni Kinh; biến dị quan trọng
Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5* 2025
42 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.05.06
Abstract
GENETIC VARIATION OF DRUG METABOLIZING GENES IN VIETNAMESE KINH
PEOPLE
Tong Thi Hang, Phan Vo Thu Nga, Nguyen Minh Hien, Nguyen Hoang Khue Tu, Le Thi Ly
Background: Pharmacogenomics is the study of structure and variation of genes involved in drug metabolism and
responses. Genetic variation of these genes is proven to be ethnic specific. Therefore, pharmacogenomic data of
general population is valuable to evaluate the association of genetic distribution and potential changes in drug
metabolism. The dataset could serve as the reference resource for studies in various patient groups.
Objective: To generate the dataset of genetic variation of drug-metabolizing genes for Vietnamese Kinh people at Ho
Chi Minh City.
Methods: The cross-sectional study was conducted on 100 healthy adult volunteers from 18 to 47, years of age without
any chronic disease at the time of study, and the sampling process were implemented with gender ratio of 1:1. All
participants confirmed their ethnicity through the self administered questionnaire. DNAs of volunteers were collected
and sequenced at the target regions of 100 genes for drug metabolism. Sequences were analyzed for genetic variation.
Results: We obtained from the coding region of genes for drug metabolism with 689 variants consisting of 652 SNPs
and 37 indels, in which 59 variants were novel present in 39 genes. There were 28 very important variants found in
these regions. The distribution of the variants was similar to that in East Asian and significantly different from African
people.
Conclusion: The dataset on genetic variation and distribution of genes for drug metabolism in Kinh people was
generated. This data can be used as reference for upcoming research in different groups of patients.
Keywords: pharmacogenomic; variant; Kinh people; very important pharmacogenes
1. ĐT VẤN Đ
ợc di truyền là một nh vực mới của di truyền y học
nhằm m ra các biến dị di truyền liên quan đến sự thay đổi
chuyển hthuốc ở người bệnh. Có hai nhóm gene chủ yếu
được nghiên cứu. Nhóm 1 bao gồm các gene hoá cho các
thụ th tiếp nhận thuốc trên màng tế bào, các enzyme trong
con đường chuyển hoá, c enzyme vận chuyển và đào thải
thuốc. Biến ddi truyền của c gene này có thể làm thay đổi
tốc đchuyển hthuốc y độc tế bào dẫn đến các phản
ứng hại [1]. Nhiều nghiên cứu đã chra rằng các phản ứng
hại gây ra bởi gene trong nhóm 1 có thdự đoán được
thể kiểm soát nhờ thay đổi liều thuốc [2,3]. Nhóm thứ 2
bao gồm c gene mã hoá cho các protein của hệ miễn dịch
như HLA (human leukocyte antigen) hay IL (interleukin) [4].
Các phản ứng có hại gây ra bởi gene trong nhóm 2 thường
không dự đoán được.
Các nghiên cứu dược di truyền hiện nay tập trung tìm ra
c biến ddi truyền liên quan đến các phản ứng hại do
thuốc. Nghn cứu th dạng phân tích lặp lại (replication
method), nhằm phân tích sự phân bố của biến dị trên c
nhóm bệnh nhân khác nhau, hoc các nhóm chủng tộc khác
nhau; hoc phân tích ln kết di truyền trên toàn bộ hgene
của bệnh nhân có sự dụng cùng loại thuốc nhằm tìm ra tìm
ra biến dị có độ liên kết cao nhất với kiểu hình chuyển h
nghiên cứu (genome wide association study) [5]. Sự phân bố
của các biến dị này trên quần thể ngẫu nhiên thđưc
ng để đánh gđược mc độ nguy xảy rac phảnng
hại của thuốc đặc thù đồng thời tạo sở dữ liệu tham
khảo trong c nghiên cứu bệnh chứng.
Với độ phân bố khoảng 86% dân số, nời Kinh chủng
tộc lớn nhất phân bố rộng nhất Việt Nam. Do đó c
nghiên cứu di truyền được thực hiện chủ yếu trên nhóm
chủng tộc này. Các nghn cứu về đa hình gene chuyển hoá
Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5 * 2025
https://doi.org/10.32895/hcjm.m.2025.05.06 https://www.tapchiyhoctphcm.vn
|
43
thuốc đã được thực hiện trên người Kinh các khu vực khác
nhau. Việc kết hợp khảo t nhiều gene trên nhóm mẫu người
Kinh Thành phHồ Chí Minh cung cấp thêm c thông tin
đối chứng tổng quát v biến dị của các gene chuyển hoá
thuốc trên quần thể nời Kinh Việt Nam.
Các gene quan trọng trong Nhóm 1 được xác định dựa vào
mức độ tham gia ảnh ởng của enzyme lên các con
đường chuyển h thuốc. sở dữ liệu vthông tin dược di
truyền PharmGKB đã tổng hợp thống kê các con đường
chuyển hthuốc stham gia của các enzyme từ c
nghiên cứu độc lp [6]. Các gene này bao gồm gene của hệ
thống ôxy hkhcytochrome P450, c enzyme liên hợp
như N-acetyltransferase (NAT), UDP-
glucuronosyltransferase (UGT), Glutathione S-transferase
(GST), c enzyme vận chuyển bài tiết thuốc n SLC
transporter hay ABC transporter. dụ, enzyme CYP1A1
được ghi nhận tham gia o 15 con đường chuyển hthuốc
trong khi đó CYP2C19 tham gia o 59 con đường và
CYP2D6 tham gia vào 68 con đường trong tổng s263 con
đường chuyển hoá thuốc được ghi nhận trên hệ thống thông
tin của sở dữ liệu y (https://www.pharmgkb.org). Trong
một nghiên cứu của Hiệp hội c di truyền
(Pharmacogenomic Research Network, PGRN), 84 gene đã
được lựa chọn khảo sát dựa trên ảnh ởng của chúng tới
kiểu nh chuyển h được báo o bởi Liên hip dược di
truyền lâm sàng quốc tế (Clinical Pharmacogenomic
Implementaation Consortium, CPIC) [7]. Nghiên cứu trên
1710 người được lấy mẫu ngẫu nhiên từ 11 quần thể châu
Âu sử dụng 231 gene trong đó 7 dấu ấn sinh học được m
thấy sự khác biệt di truyền giữa các quần thể ảnh ởng
tới hiệu qu và độc tính của thuốc trong 51 phác đồ chuẩn
[8]. Danh sách 100 gene sử dụng trong nghiên cứu này có sự
tham khảo và chọn lọc tc gene trong c nghiên cứu diện
rộng trước đây.
Mục tu
Khảo t các biến dị di truyền trongng mã hcủa 100
gene quan trọng trong chuyển hoá thuốc người Kinh
tnh phố Hồ Chí Minh, Việt Nam.
2. ĐỐI ỢNG PHƯƠNG PHÁP
NGHIÊN CỨU
2.1. Đối tượng nghiên cứu
Người Việt Nam kho mạnh tuổi từ 18 trở lên, không
c bệnh n nh tại thời điểm nghiên cứu. c tình nguyện
vn tham gia trlời bảng u hỏi khảo sát về bệnh sử
nguồn gốc chủng tộc trong vòng 3 thế hệ.
2.1.1. Tu chuẩn chọn
Người được chọn tham gia nghiên cứu phải đảm bảo 3 thế
htrong gia đình đều là người Kinh. Trước khi lấy mẫu, các
tình nguyện viên được phbiến vnghiên cứu bảng
đồng thuận.
2.2. Phương pháp nghiên cứu
2.2.1. Thiết kế nghiên cứu
Nghn cứu cắt ngang.
2.2.2. Cỡ mẫu
Cmẫu được tham khảo từ dự án 1000 hệ gene người với
kỳ vọng phát hiện tất cả các biến dị phổ biến trong quần thể,
do đó cỡ mẫu được nh với khoảng tin cậy 95%, biên độ sai
số 5% và ước nh 95% dân số của quần thể mang các biến
dị có tần số alen MAF (minor allele frequency) 5%.
2.2.3. Phương pháp thực hiện
Nghn cứu thực hiện với trình tự các nội dung: tuyển tình
nguyện viên đủ diều kiện tham gia nghiên cứu, thu thập mẫu
máu của người tham gia, tách chiết DNA tổng số, giải tnh
tthế hệ mới tại các vùng mã hoá của 100 gene mục tiêu,
phân tích biến dị phân ch thống kê.
Tách chiết DNA: 3 ml máu ngoại vi của người tham gia
nghiên cứu được thu lưu trữ trong ống EDTA sau khi
người cho kýn bản đồng thuận nghiên cứu. DNA tổng số
được ch chiết bằng kit ch chiết QIAamp DNA Blood
Mini Kit (Qiagen, GmbH, Germany). Nồng độ độ tinh
sch của mẫu DNA được kiểm tra bằng phương pháp điện di
agarose phương pháp quang phổ kế. c mẫu DNA được
chọn để giải trình tự phải đạt nồng đtối thiểu là 50ng/µl và
tsố hấp thụ A260/280 nằm trong khoảng 1,8 đến 2, đảm bảo
độ tinh sạch.
Chuẩn bị thư viện và Kỹ thuật giải trình tự thế hệ mới:
DNA bộ gene từ các cá thể tham gia nghiên cứu được dùng
cho phản ứng mulltiplex PCR nhằm khuếch đại vùng hoá
của 100 gene mục tiêu bao gồm: c gene vận chuyển thuốc,
Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5* 2025
44 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.05.06
cytochrome P450, uridine diphosphate
glucuronosyltransferase (UGT), flavin-containing
monooxygenase (FMO), glutathione S-transferase (GST),
sulfotransferase (SULT), và một s gene khác. Các gene
được chọn lọc dựa trên mức độ tham gia của chúngo các
quá trình chuyển hcủa nhiều thuốc khác nhau [9]. Sản
phẩm PCR được gắn barcode để đánh dấu từng th, sau
đó được tinh sạch và giải trình tự 2 chiều sử dụng kit Miseq
Reagent Kit v2 (Illumina, San Diego, CA, USA) trên máy
bench top Next generation Sequencer với sản phẩm đầu ra
2x250 bp.
Phân tích biến dị: Tnh tự thu đưc dưới c đoạn đọc
ngắn khoảng 250 bp được đối chiếu với trình tự hgene tham
chiếu của người bằng công cụ Burrows-Wheeler Aligner
(0.7.17), sau đó được phânch tìm biến dị theo quy trình
tìm biến dị GATK 4.2 (Genome analyis toolkits- Broad
Institute). Các biến dị sau đó được chấm điểm bằng các thuật
tn (Variant Quality Score Recalibration) khi hiệu chỉnh
bằng các sở dữ liệu chuẩn (Hapmap, Omni, 1000G,
DbSNP), trên sở đó, c thang điểm được sử dụng kết hợp
để đánh gtừng biến dịđạt (true positive) hayơng giả
(false positive) [10]. Các biến dị đạt chất lượng được giữ lại
để phân tích chức năng, mức độ ảnh ởng lên protein
enzyme khi đối chiếu với sở dữ liệu Ensembl/GENCODE.
Các công cụ ng đthao c trên dữ liệu bao gồm: Bcftools
11.10.2, Vcftools 0.1.16, Plink 1.9, PGDSpider 3 và R
software.
2.2.4. Xử lý và phân tích dữ liệu
Phần mềm Excel (Microsoft) SPSS 20 được sử dụng
để so sánh tần salen của các gene nghiên cứu với tần số
alen tương ứng của c quần thChâu Á, Châu Âu, Châu
Mỹ Châu Phi trong sở dữ liệu mở của Dự án 1000 hệ
gene người bằng kiểm định Chi bình phương kiểm định
Fisher, g trị p hai chiều được tính theo hiệu chỉnh Boferroni
với p <0,000154 (0,05/(26C2) đượcc định là khác biệt có
ý nga thống kê.
3. KẾT QUẢ
Các tình nguyện viên tham gia nghn cứu có độ tuổi từ 18
47 (trung bình ± độ lệch chuẩn: 23,6±0,6) với tỉ lệ nam: nữ
là 1:1.c đặc điểm khác của mẫu bao gồm: BMI 16,4-29,3
(22,1±0,3), cân nặng 42-98 kg (59,1,2) và chiều cao 1,50-
1,83 m (1,64±0,8). Các câu trli từ bảng khảo t xác định
nguồn gốc 3 thế hệ trong gia đình là người Kinh và hiện tại
người tham gia nghn cu không có bệnh mãn nh nào. Mẫu
máu ngoại vi được thu thập tách chiết DNA với chất lượng
đt tu chuẩn cho giải trình tự sau khi kiểm tra bằng phương
pháp diện di agarose và phương pháp quang phổ.
Các đoạn đọc ngắn thu được từ máy giải trình t ch s
read-depth trung bình 317X trong đó 98,3% vùng trình t
này có read-depth t20X trlên. Chs read-depth trong giải
trình tự đoạn đọc ngắn (short read sequencing) đượcng để
đánh giá khng c đoạn đọc thể phủ được hết vùng giải
trình t đưc la chọn. Trong các phânch, read-depth được
đ ngh tối thiểu là 15X. Sau khi lọc bỏ các v trí read-depth
<20 và p <1,0 x e-50 trong kiểm định n bằng quần th
Hardy-Weinberg, chúng i thu được 689 biến dị bao gồm 652
SNP và 37 indel, trong đó có 371 biến d đột biến sai nga,
266 biến dị đột biến đồng nga, 30 biến d đột biến lệch khung,
14 biến dthêm mã kết thúc, 2 biến d mất mã kết tc, 3 biến
d chèn Nu không thay đổi khung đọc, 2 biến dị mất Nu không
thay đổi khung đọc và 1 biến dprotein. Năm mươi chín biến
d trong cng gene này đươc xác định là mới trong đó 13
biến dị được d đoán (tn thuật toán ca SIFT Polyphen)
có kiểunh suy giảm chức năng của protein (Bảng 1).
Tần số của c biến dị thu được cho biết thông tin phân bố
của biến dị trong quần thể. Trong dữ liệu thu đưc, nhiều biến
d cóng tần số, tuy nhn nhiều biến dcó đphân bố khác
biệt so với quần thể khác (dữ liệu chưa công bố). Đnh sự
khác biệt di truyền giữa nời Kinh và các chủng tộc kc,
chúng tôi sử dụng tần scủa tn bộ 689 biến dị để nh chsố
so sánh khoảng ch di truyền (Fst) giữa quần thnghiên cứu
và 26 quần thể trong dliệu 1000 hgene nời. Hai ơi
sáu quần thể được phân tích bao gồm CHB (Han Chinese in
Beijing, China), CHS (Southern Han Chinese), CDX (Chinese
Dai in Xishuangbanna, China), JPT (Japanese in Tokyo,
Japan), CEU (Utah residences with Northern and Western
European ancestry), TSI (Toscani in Italia), GBR (British in
England and Scotland), FIN (Finish in Finland), IBS (Iberian
population in Spain), YRI (Yoruba in Ibadan, Nigeria), LWK
(Luhya in Webuye, Kenya), GWD (Gambian in Western
Division, Gambia), MSL (Mende in Sierra Leone), ESN (Esan
in Nigeria), ASW (African ancestry in Southwest US), ACB
(African Caribbean in Barbados), MXL (Mexican ancestry in
Los Angeles, California), PUR (Puerto Rican in Puerto Rico),
CLM (Colombian in Medellin, Colombia), PEL (Peruvian in
Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5 * 2025
https://doi.org/10.32895/hcjm.m.2025.05.06 https://www.tapchiyhoctphcm.vn
|
45
Lima, Peru), GIH (Gujarati Indian in Houston, Texas), PJL
(Punjabi in Lahore, Pakistan), BEB (Bengali in Bangladesh),
STU (Srilankan Tamil in The UK), ITU (Indian Telugu in The
UK). Mẫu nghn cứu ng được so nh với mẫu của 99
người Kinh tại Thành phHồ Chí Minh trong sdữ liệu
này. Fst càng nhth hiện s khác bit di truyền ng thấp.
Hai mẫu nghiên cứu trên người Kinh thành phHồ C
Minh (KHV99: mẫu thuộc dữ liệu hệ gene người, và
KHV100: mẫu thuộc nghiên cứu này) không có khác biệt di
truyền (Fst =0) cho thấy mẫu được thu ngẫu nhiên và phân bố
di truyền như nhau trong 2 lần thu thp. Kết quso sánh di
truyền cho thấy nời Kinh Việt Nam có sự ơng đồng lớn
nhất với người Đài phân b khu vực Nam Vân Nam Trung
Quốc gần biên giới Việt Nam, Lào Myanma (Fst 0,005),
sau đó là nời Hán Trung Quốc (Fst: 0,012 CHB, 0,007
CHS) và ni Nhật (Fst 0,016). Nời Kinh có skhác biệt
di truyền lớn nhất với c chủng tộc châu Phi (Fst: MSL 0,081,
ESN 0,076, GWD 0,079). Mức đkhác biệt di truyền ca các
quần th nghn cứu được thhiện tn nh 1.
Bảng 1. c biến dmới có kiu nh tiên lượng nguy hiểm đối với chức năng protein
Vtrí trên genome Alen GENE
Vtrí
axit
amin
Thay
đổi
axit
amin
Codon SIFT (score1) PolyPhen (score2)
1:109689097-
1096890975 C GSTM1 76 I/T aTc/aCc deleterious_low_confidence3
(0,01) probably_damaging4 (1)
1:109689228-
109689228 A GSTM1 88 G/E gGg/gAg deleterious_low_confidence
(0,02)
probably_damaging
(0,999)
2:38074670-
38074670 G CYP1B1 240 L/P cTg/cCg Deleterious (0) probably_damaging (1)
2:233682025-
233682025 A UGT1A7 30 V/I Gta/Ata deleterious_low_confidence
(0,01)
probably_damaging
(0,982)
4:69096575-
69096575 T UGT2B7 19 S/C Agc/Tgc deleterious_low_confidence
(0)
possibly_damaging
(0,9)
10:71362456-
71362456 G SLC29A3 426 N/D Aac/Gac deleterious(0) probably_damaging
(0,991)
10:95037292-
95037292 G CYP2C8 437 G/R Gga/Cga deleterious_low_confidence
(0)
probably_damaging
(0,998)
11:63373715-
63373715 G SLC22A9 193 A/G gCt/gGt deleterious(0) probably_damaging
(0,974)
12:21176778-
21176778 G SLCO1B1 121 Y/C tAc/tGc deleterious(0) probably_damaging(1)
16:16068157-
16068157 C ABCC1 560 V/A gTg/gCg deleterious_low_confidence
(0)
probably_damaging
(0,999)
16:16068172-
16068172 C ABCC1 565 F/S tTt/tCt deleterious_low_confidence
(0)
probably_damaging
(0,999)
19:15673578-
15673578 C CYP4F12 17 S/P Tcc/Ccc deleterious_low_confidence
(0,01)
probably_damaging
(0,958)
19:41016712-
41016712 G CYP2B6 454 L/R cTc/cGc deleterious(0) probably_damaging
(0,995)
1,2thang điểm SIFT Polyphen được nh từ 0-1. Thang điểm SIFT càng nhỏ điểm Polyphen lớn ơng ứng với khng xảy ra kiểu nh ng cao.
3,4kiểu hình gây suy gim chức năng protein
5Thay đổi từ T C vị t 109689097 của gene GSTM1 (Glutathione S-transferase M1) trên nhiễm săc th 1 m thay đổi codon ATC thành ACC dẫn đến thay đổi
axit amin thứ 76 tIsoleucine thành Threonine. Đột biến được dự đoán làm thay đổi chc năng enzyme GSTM1 với giá trị điểm ý nghĩa từ thuật tn ca SIFT
(0,03) Polyphen [1]