
Ngày nhận bài: 27-03-2025 / Ngày chấp nhận đăng bài: 24-04-2025 / Ngày đăng bài: 05-05-2025
*Tác giả liên hệ: Nguyễn Hoàng Khuê Tú. Khoa Công nghệ Sinh học, Trường Đại học Quốc tế, Đại học Quốc gia Thành phố Hồ Chí Minh,
Thành phố Hồ Chí Minh, Việt Nam. E-mail: nhktu@hcmiu.edu.vn
© 2025 Bản quyền thuộc về Tạp chí Y học Thành phố Hồ Chí Minh.
https://www.tapchiyhoctphcm.vn 41
ISSN: 1859-1779
Nghiên cứu Y học
Tạp chí Y học Thành phố Hồ Chí Minh;28(5):41-48
https://doi.org/10.32895/hcjm.m.2025.05.06
Khảo sát biến dị di truyền của các gene chuyển hoá
thuốc ở người Kinh Việt Nam
Tống Thị Hằng1,3, Phan Võ Thu Nga1,3, Nguyễn Minh Hiền2,3, Nguyễn Hoàng Khuê Tú1,3,*, Lê
Thị Lý1,3
1Khoa Công nghệ Sinh học, Trường Đại học Quốc tế, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ
Chí Minh, Việt Nam
2Trường Đại học khoa học sức khỏe, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam
3Đại học Quốc Gia thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam
Tóm tắt
Đặt vấn đề: Dược di truyền (Pharmacogenomics) là lĩnh vực nghiên cứu về các gene mã hoá các enzyme chuyển hoá
và phản ứng thuốc. Biến dị của các gene nói chung và các gene thuốc nói riêng có tính đặc trưng chủng tộc. Do đó, dữ
liệu dược di truyền của quần thể ngẫu nhiên có ý nghĩa trong việc đánh giá sự liên quan giữa phân bố biến dị di truyền
và khả năng thay đổi chuyển hoá thuốc trong quần thể đặc trưng. Dữ liệu là nguồn tham khảo cho các nghiên cứu trên
nhóm bệnh nhân.
Mục tiêu: Xây dựng bộ dữ liệu về biến dị của các gene quan trọng trong chuyển hoá thuốc trên nhóm người Kinh ở thành
phố Hồ Chí Minh.
Đối tượng và phương pháp nghiên cứu: Nghiên cứu mô tả cắt ngang trên một trăm người khoẻ mạnh từ 18 tuổi trở lên (18-
47), tỉ lệ nam: nữ là 1:1, không có bệnh mãn tính tại thời điểm nghiên cứu, và được xác định là người Kinh thông qua bảng
câu hỏi tự khai. DNA của các tình nguyện viên được thu thập, giải trình tự 100 gene chuyển hoá thuốc và phân tích biến dị.
Kết quả: Vùng mã hoá của 100 gene chuyển hoá thuốc ở người Kinh chỉ ra 689 biến dị bao gồm 652 biến dị SNP (single
nucleotide polymorhism) và 37 biến dị indel (insertion/deletion), trong đó 59 biến dị là mới xuất hiện trên 39 gene. Hai mươi
tám biến dị quan trọng liên quan đến các bệnh chuyển hoá thuốc được tìm thấy trên vùng mã hoá này. Phân bố của các
biến dị có độ tương đồng với người Đông Á và khác biệt rõ rệt so với người châu Phi.
Kết luận: Dữ liệu về phân bố của các biến dị di truyền của các gene chuyển hoá thuốc ở người Kinh được xây dựng. Dữ
liệu có thể dùng để tham khảo cho các nghiên cứu về dược di truyền ở bệnh nhân.
Từ khóa: dược di truyền; biến dị; người Kinh; biến dị quan trọng

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5* 2025
42 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.05.06
Abstract
GENETIC VARIATION OF DRUG METABOLIZING GENES IN VIETNAMESE KINH
PEOPLE
Tong Thi Hang, Phan Vo Thu Nga, Nguyen Minh Hien, Nguyen Hoang Khue Tu, Le Thi Ly
Background: Pharmacogenomics is the study of structure and variation of genes involved in drug metabolism and
responses. Genetic variation of these genes is proven to be ethnic specific. Therefore, pharmacogenomic data of
general population is valuable to evaluate the association of genetic distribution and potential changes in drug
metabolism. The dataset could serve as the reference resource for studies in various patient groups.
Objective: To generate the dataset of genetic variation of drug-metabolizing genes for Vietnamese Kinh people at Ho
Chi Minh City.
Methods: The cross-sectional study was conducted on 100 healthy adult volunteers from 18 to 47, years of age without
any chronic disease at the time of study, and the sampling process were implemented with gender ratio of 1:1. All
participants confirmed their ethnicity through the self administered questionnaire. DNAs of volunteers were collected
and sequenced at the target regions of 100 genes for drug metabolism. Sequences were analyzed for genetic variation.
Results: We obtained from the coding region of genes for drug metabolism with 689 variants consisting of 652 SNPs
and 37 indels, in which 59 variants were novel present in 39 genes. There were 28 very important variants found in
these regions. The distribution of the variants was similar to that in East Asian and significantly different from African
people.
Conclusion: The dataset on genetic variation and distribution of genes for drug metabolism in Kinh people was
generated. This data can be used as reference for upcoming research in different groups of patients.
Keywords: pharmacogenomic; variant; Kinh people; very important pharmacogenes
1. ĐẶT VẤN ĐỀ
Dược di truyền là một lĩnh vực mới của di truyền y học
nhằm tìm ra các biến dị di truyền liên quan đến sự thay đổi
chuyển hoá thuốc ở người bệnh. Có hai nhóm gene chủ yếu
được nghiên cứu. Nhóm 1 bao gồm các gene mã hoá cho các
thụ thể tiếp nhận thuốc trên màng tế bào, các enzyme trong
con đường chuyển hoá, các enzyme vận chuyển và đào thải
thuốc. Biến dị di truyền của các gene này có thể làm thay đổi
tốc độ chuyển hoá thuốc và gây độc tế bào dẫn đến các phản
ứng có hại [1]. Nhiều nghiên cứu đã chỉ ra rằng các phản ứng
có hại gây ra bởi gene trong nhóm 1 có thể dự đoán được và
có thể kiểm soát nhờ thay đổi liều thuốc [2,3]. Nhóm thứ 2
bao gồm các gene mã hoá cho các protein của hệ miễn dịch
như HLA (human leukocyte antigen) hay IL (interleukin) [4].
Các phản ứng có hại gây ra bởi gene trong nhóm 2 thường
không dự đoán được.
Các nghiên cứu dược di truyền hiện nay tập trung tìm ra
các biến dị di truyền có liên quan đến các phản ứng có hại do
thuốc. Nghiên cứu có thể ở dạng phân tích lặp lại (replication
method), nhằm phân tích sự phân bố của biến dị trên các
nhóm bệnh nhân khác nhau, hoặc các nhóm chủng tộc khác
nhau; hoặc phân tích liên kết di truyền trên toàn bộ hệ gene
của bệnh nhân có sự dụng cùng loại thuốc nhằm tìm ra tìm
ra biến dị có độ liên kết cao nhất với kiểu hình chuyển hoá
nghiên cứu (genome wide association study) [5]. Sự phân bố
của các biến dị này trên quần thể ngẫu nhiên có thể được
dùng để đánh giá được mức độ nguy cơ xảy ra các phản ứng
có hại của thuốc đặc thù đồng thời tạo cơ sở dữ liệu tham
khảo trong các nghiên cứu bệnh chứng.
Với độ phân bố khoảng 86% dân số, người Kinh là chủng
tộc lớn nhất và phân bố rộng nhất ở Việt Nam. Do đó các
nghiên cứu di truyền được thực hiện chủ yếu trên nhóm
chủng tộc này. Các nghiên cứu về đa hình gene chuyển hoá

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5 * 2025
https://doi.org/10.32895/hcjm.m.2025.05.06 https://www.tapchiyhoctphcm.vn
|
43
thuốc đã được thực hiện trên người Kinh ở các khu vực khác
nhau. Việc kết hợp khảo sát nhiều gene trên nhóm mẫu người
Kinh ở Thành phố Hồ Chí Minh cung cấp thêm các thông tin
đối chứng tổng quát về biến dị của các gene chuyển hoá
thuốc trên quần thể người Kinh Việt Nam.
Các gene quan trọng trong Nhóm 1 được xác định dựa vào
mức độ tham gia và ảnh hưởng của enzyme lên các con
đường chuyển hoá thuốc. Cơ sở dữ liệu về thông tin dược di
truyền PharmGKB đã tổng hợp và thống kê các con đường
chuyển hoá thuốc có sự tham gia của các enzyme từ các
nghiên cứu độc lập [6]. Các gene này bao gồm gene của hệ
thống ôxy hoá khử cytochrome P450, các enzyme liên hợp
như N-acetyltransferase (NAT), UDP-
glucuronosyltransferase (UGT), Glutathione S-transferase
(GST), các enzyme vận chuyển và bài tiết thuốc như SLC
transporter hay ABC transporter. Ví dụ, enzyme CYP1A1
được ghi nhận tham gia vào 15 con đường chuyển hoá thuốc
trong khi đó CYP2C19 tham gia vào 59 con đường và
CYP2D6 tham gia vào 68 con đường trong tổng số 263 con
đường chuyển hoá thuốc được ghi nhận trên hệ thống thông
tin của cơ sở dữ liệu này (https://www.pharmgkb.org). Trong
một nghiên cứu của Hiệp hội dược di truyền
(Pharmacogenomic Research Network, PGRN), 84 gene đã
được lựa chọn khảo sát dựa trên ảnh hưởng của chúng tới
kiểu hình chuyển hoá được báo cáo bởi Liên hiệp dược di
truyền lâm sàng quốc tế (Clinical Pharmacogenomic
Implementaation Consortium, CPIC) [7]. Nghiên cứu trên
1710 người được lấy mẫu ngẫu nhiên từ 11 quần thể châu
Âu sử dụng 231 gene trong đó 7 dấu ấn sinh học được tìm
thấy có sự khác biệt di truyền giữa các quần thể và ảnh hưởng
tới hiệu quả và độc tính của thuốc trong 51 phác đồ chuẩn
[8]. Danh sách 100 gene sử dụng trong nghiên cứu này có sự
tham khảo và chọn lọc từ các gene trong các nghiên cứu diện
rộng trước đây.
Mục tiêu
Khảo sát các biến dị di truyền trong vùng mã hoá của 100
gene quan trọng trong chuyển hoá thuốc ở người Kinh ở
thành phố Hồ Chí Minh, Việt Nam.
2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
NGHIÊN CỨU
2.1. Đối tượng nghiên cứu
Người Việt Nam khoẻ mạnh tuổi từ 18 trở lên, không có
các bệnh mãn tính tại thời điểm nghiên cứu. Các tình nguyện
viên tham gia trả lời bảng câu hỏi khảo sát về bệnh sử và
nguồn gốc chủng tộc trong vòng 3 thế hệ.
2.1.1. Tiêu chuẩn chọn
Người được chọn tham gia nghiên cứu phải đảm bảo 3 thế
hệ trong gia đình đều là người Kinh. Trước khi lấy mẫu, các
tình nguyện viên được phổ biến về nghiên cứu và ký bảng
đồng thuận.
2.2. Phương pháp nghiên cứu
2.2.1. Thiết kế nghiên cứu
Nghiên cứu cắt ngang.
2.2.2. Cỡ mẫu
Cỡ mẫu được tham khảo từ dự án 1000 hệ gene người với
kỳ vọng phát hiện tất cả các biến dị phổ biến trong quần thể,
do đó cỡ mẫu được tính với khoảng tin cậy 95%, biên độ sai
số 5% và ước tính 95% dân số của quần thể mang các biến
dị có có tần số alen MAF (minor allele frequency) ≥ 5%.
2.2.3. Phương pháp thực hiện
Nghiên cứu thực hiện với trình tự các nội dung: tuyển tình
nguyện viên đủ diều kiện tham gia nghiên cứu, thu thập mẫu
máu của người tham gia, tách chiết DNA tổng số, giải trình
tự thế hệ mới tại các vùng mã hoá của 100 gene mục tiêu,
phân tích biến dị và phân tích thống kê.
Tách chiết DNA: 3 ml máu ngoại vi của người tham gia
nghiên cứu được thu và lưu trữ trong ống EDTA sau khi
người cho ký văn bản đồng thuận nghiên cứu. DNA tổng số
được tách chiết bằng kit tách chiết QIAamp DNA Blood
Mini Kit (Qiagen, GmbH, Germany). Nồng độ và độ tinh
sạch của mẫu DNA được kiểm tra bằng phương pháp điện di
agarose và phương pháp quang phổ kế. Các mẫu DNA được
chọn để giải trình tự phải đạt nồng độ tối thiểu là 50ng/µl và
tỉ số hấp thụ A260/280 nằm trong khoảng 1,8 đến 2, đảm bảo
độ tinh sạch.
Chuẩn bị thư viện và Kỹ thuật giải trình tự thế hệ mới:
DNA bộ gene từ các cá thể tham gia nghiên cứu được dùng
cho phản ứng mulltiplex PCR nhằm khuếch đại vùng mã hoá
của 100 gene mục tiêu bao gồm: các gene vận chuyển thuốc,

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5* 2025
44 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.05.06
cytochrome P450, uridine diphosphate
glucuronosyltransferase (UGT), flavin-containing
monooxygenase (FMO), glutathione S-transferase (GST),
sulfotransferase (SULT), và một số gene khác. Các gene
được chọn lọc dựa trên mức độ tham gia của chúng vào các
quá trình chuyển hoá của nhiều thuốc khác nhau [9]. Sản
phẩm PCR được gắn barcode để đánh dấu từng cá thể, sau
đó được tinh sạch và giải trình tự 2 chiều sử dụng kit Miseq
Reagent Kit v2 (Illumina, San Diego, CA, USA) trên máy
bench top Next generation Sequencer với sản phẩm đầu ra
2x250 bp.
Phân tích biến dị: Trình tự thu được dưới các đoạn đọc
ngắn khoảng 250 bp được đối chiếu với trình tự hệ gene tham
chiếu của người bằng công cụ Burrows-Wheeler Aligner
(0.7.17), sau đó được phân tích và tìm biến dị theo quy trình
tìm biến dị GATK 4.2 (Genome analyis toolkits- Broad
Institute). Các biến dị sau đó được chấm điểm bằng các thuật
toán (Variant Quality Score Recalibration) khi hiệu chỉnh
bằng các cơ sở dữ liệu chuẩn (Hapmap, Omni, 1000G,
DbSNP), trên cơ sở đó, các thang điểm được sử dụng kết hợp
để đánh giá từng biến dị là đạt (true positive) hay dương giả
(false positive) [10]. Các biến dị đạt chất lượng được giữ lại
để phân tích chức năng, mức độ ảnh hưởng lên protein
enzyme khi đối chiếu với cơ sở dữ liệu Ensembl/GENCODE.
Các công cụ dùng để thao tác trên dữ liệu bao gồm: Bcftools
11.10.2, Vcftools 0.1.16, Plink 1.9, PGDSpider 3 và R
software.
2.2.4. Xử lý và phân tích dữ liệu
Phần mềm Excel (Microsoft) và SPSS 20 được sử dụng
để so sánh tần số alen của các gene nghiên cứu với tần số
alen tương ứng của các quần thể Châu Á, Châu Âu, Châu
Mỹ và Châu Phi trong cơ sở dữ liệu mở của Dự án 1000 hệ
gene người bằng kiểm định Chi bình phương và kiểm định
Fisher, giá trị p hai chiều được tính theo hiệu chỉnh Boferroni
với p <0,000154 (0,05/(26C2) được xác định là khác biệt có
ý nghĩa thống kê.
3. KẾT QUẢ
Các tình nguyện viên tham gia nghiên cứu có độ tuổi từ 18
– 47 (trung bình ± độ lệch chuẩn: 23,6±0,6) với tỉ lệ nam: nữ
là 1:1. Các đặc điểm khác của mẫu bao gồm: BMI 16,4-29,3
(22,1±0,3), cân nặng 42-98 kg (59,6±1,2) và chiều cao 1,50-
1,83 m (1,64±0,8). Các câu trả lời từ bảng khảo sát xác định
nguồn gốc 3 thế hệ trong gia đình là người Kinh và hiện tại
người tham gia nghiên cứu không có bệnh mãn tính nào. Mẫu
máu ngoại vi được thu thập và tách chiết DNA với chất lượng
đạt tiêu chuẩn cho giải trình tự sau khi kiểm tra bằng phương
pháp diện di agarose và phương pháp quang phổ.
Các đoạn đọc ngắn thu được từ máy giải trình tự có chỉ số
read-depth trung bình là 317X trong đó 98,3% vùng trình tự
này có read-depth từ 20X trở lên. Chỉ số read-depth trong giải
trình tự đoạn đọc ngắn (short read sequencing) được dùng để
đánh giá khả năng các đoạn đọc có thể phủ được hết vùng giải
trình tự được lựa chọn. Trong các phân tích, read-depth được
đề nghị tối thiểu là 15X. Sau khi lọc bỏ các vị trí có read-depth
<20 và p <1,0 x e-50 trong kiểm định cân bằng quần thể
Hardy-Weinberg, chúng tôi thu được 689 biến dị bao gồm 652
SNP và 37 indel, trong đó có 371 biến dị là đột biến sai nghĩa,
266 biến dị đột biến đồng nghĩa, 30 biến dị đột biến lệch khung,
14 biến dị thêm mã kết thúc, 2 biến dị mất mã kết thúc, 3 biến
dị chèn Nu không thay đổi khung đọc, 2 biến dị mất Nu không
thay đổi khung đọc và 1 biến dị protein. Năm mươi chín biến
dị trong các vùng gene này đươc xác định là mới trong đó 13
biến dị được dự đoán (trên thuật toán của SIFT và Polyphen)
có kiểu hình suy giảm chức năng của protein (Bảng 1).
Tần số của các biến dị thu được cho biết thông tin phân bố
của biến dị trong quần thể. Trong dữ liệu thu được, nhiều biến
dị có cùng tần số, tuy nhiên nhiều biến dị có độ phân bố khác
biệt so với quần thể khác (dữ liệu chưa công bố). Để tính sự
khác biệt di truyền giữa người Kinh và các chủng tộc khác,
chúng tôi sử dụng tần số của toàn bộ 689 biến dị để tính chỉ số
so sánh khoảng cách di truyền (Fst) giữa quần thể nghiên cứu
và 26 quần thể trong dữ liệu 1000 hệ gene người. Hai mươi
sáu quần thể được phân tích bao gồm CHB (Han Chinese in
Beijing, China), CHS (Southern Han Chinese), CDX (Chinese
Dai in Xishuangbanna, China), JPT (Japanese in Tokyo,
Japan), CEU (Utah residences with Northern and Western
European ancestry), TSI (Toscani in Italia), GBR (British in
England and Scotland), FIN (Finish in Finland), IBS (Iberian
population in Spain), YRI (Yoruba in Ibadan, Nigeria), LWK
(Luhya in Webuye, Kenya), GWD (Gambian in Western
Division, Gambia), MSL (Mende in Sierra Leone), ESN (Esan
in Nigeria), ASW (African ancestry in Southwest US), ACB
(African Caribbean in Barbados), MXL (Mexican ancestry in
Los Angeles, California), PUR (Puerto Rican in Puerto Rico),
CLM (Colombian in Medellin, Colombia), PEL (Peruvian in

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 5 * 2025
https://doi.org/10.32895/hcjm.m.2025.05.06 https://www.tapchiyhoctphcm.vn
|
45
Lima, Peru), GIH (Gujarati Indian in Houston, Texas), PJL
(Punjabi in Lahore, Pakistan), BEB (Bengali in Bangladesh),
STU (Srilankan Tamil in The UK), ITU (Indian Telugu in The
UK). Mẫu nghiên cứu cũng được so sánh với mẫu của 99
người Kinh tại Thành phố Hồ Chí Minh có trong cơ sở dữ liệu
này. Fst càng nhỏ thể hiện sự khác biệt di truyền càng thấp.
Hai mẫu nghiên cứu trên người Kinh ở thành phố Hồ Chí
Minh (KHV99: mẫu thuộc dữ liệu hệ gene người, và
KHV100: mẫu thuộc nghiên cứu này) không có khác biệt di
truyền (Fst =0) cho thấy mẫu được thu ngẫu nhiên và phân bố
di truyền như nhau trong 2 lần thu thập. Kết quả so sánh di
truyền cho thấy người Kinh Việt Nam có sự tương đồng lớn
nhất với người Đài phân bố ở khu vực Nam Vân Nam Trung
Quốc gần biên giới Việt Nam, Lào và Myanma (Fst 0,005),
sau đó là người Hán Trung Quốc (Fst: 0,012 CHB, 0,007
CHS) và người Nhật (Fst 0,016). Người Kinh có sự khác biệt
di truyền lớn nhất với các chủng tộc châu Phi (Fst: MSL 0,081,
ESN 0,076, GWD 0,079). Mức độ khác biệt di truyền của các
quần thể nghiên cứu được thể hiện trên Hình 1.
Bảng 1. Các biến dị mới có kiểu hình tiên lượng nguy hiểm đối với chức năng protein
Vị trí trên genome Alen GENE
Vị trí
axit
amin
Thay
đổi
axit
amin
Codon SIFT (score1) PolyPhen (score2)
1:109689097-
1096890975 C GSTM1 76 I/T aTc/aCc deleterious_low_confidence3
(0,01) probably_damaging4 (1)
1:109689228-
109689228 A GSTM1 88 G/E gGg/gAg deleterious_low_confidence
(0,02)
probably_damaging
(0,999)
2:38074670-
38074670 G CYP1B1 240 L/P cTg/cCg Deleterious (0) probably_damaging (1)
2:233682025-
233682025 A UGT1A7 30 V/I Gta/Ata deleterious_low_confidence
(0,01)
probably_damaging
(0,982)
4:69096575-
69096575 T UGT2B7 19 S/C Agc/Tgc deleterious_low_confidence
(0)
possibly_damaging
(0,9)
10:71362456-
71362456 G SLC29A3 426 N/D Aac/Gac deleterious(0) probably_damaging
(0,991)
10:95037292-
95037292 G CYP2C8 437 G/R Gga/Cga deleterious_low_confidence
(0)
probably_damaging
(0,998)
11:63373715-
63373715 G SLC22A9 193 A/G gCt/gGt deleterious(0) probably_damaging
(0,974)
12:21176778-
21176778 G SLCO1B1 121 Y/C tAc/tGc deleterious(0) probably_damaging(1)
16:16068157-
16068157 C ABCC1 560 V/A gTg/gCg deleterious_low_confidence
(0)
probably_damaging
(0,999)
16:16068172-
16068172 C ABCC1 565 F/S tTt/tCt deleterious_low_confidence
(0)
probably_damaging
(0,999)
19:15673578-
15673578 C CYP4F12 17 S/P Tcc/Ccc deleterious_low_confidence
(0,01)
probably_damaging
(0,958)
19:41016712-
41016712 G CYP2B6 454 L/R cTc/cGc deleterious(0) probably_damaging
(0,995)
1,2thang điểm SIFT và Polyphen được tính từ 0-1. Thang điểm SIFT càng nhỏ và điểm Polyphen lớn tương ứng với khả năng xảy ra kiểu hình càng cao.
3,4kiểu hình gây suy giảm chức năng protein
5Thay đổi từ T C ở vị trí 109689097 của gene GSTM1 (Glutathione S-transferase M1) trên nhiễm săc thể 1 làm thay đổi codon ATC thành ACC dẫn đến thay đổi
axit amin thứ 76 từ Isoleucine thành Threonine. Đột biến được dự đoán làm thay đổi chức năng enzyme GSTM1 với giá trị điểm có ý nghĩa từ thuật toán của SIFT
(0,03) và Polyphen [1]