
91
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG Tập 11, Số 2 (2025): 91 - 103
*Email: hiephoangphu@tnue.edu.vn
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ
TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG
Tập 11, Số 2 (2025): 91 - 103
HUNG VUONG UNIVERSITY
JOURNAL OF SCIENCE AND TECHNOLOGY
Vol. 11, No. 2 (2025): 91 - 103
Email: tapchikhoahoc@hvu.edu.vn Website: www.jst.hvu.edu.vn
ĐA DẠNG DI TRUYỀN VÀ QUAN HỆ PHÁT SINH LOÀI
CỦA HỌ APOCYNACEAE DỰA TRÊN PHÂN TÍCH in silico
GEN matK VÀ trnH-psbA
Hoàng Phú Hiệp1*, Nguyễn Minh Phương1
1Khoa Sinh học, Trường Đại học Sư phạm, Đại học Thái Nguyên
Ngày nhận bài: 23/05/2025; Ngày chỉnh sửa: 21/06/2025; Ngày duyệt đăng: 23/06/2025
DOI: https://doi.org/10.59775/1859-3968.306
Tóm tắt
Phương pháp in silico là một công cụ mạnh mẽ được ứng dụng rộng rãi và đạt được nhiều thành tựu trong các
lĩnh vực sinh học, đặc biệt trong bảo tồn đa dạng sinh học và phân loại. Họ Apocynaceae (họ Trúc đào) là
một nhóm thực vật có sự đa dạng cao, nổi bật với độc tính đối với động vật và con người (đặc biệt là trẻ nhỏ),
nhưng đồng thời cũng sở hữu giá trị sử dụng đa dạng, bao gồm các ứng dụng tiềm năng trong y học, chẳng hạn
như một số loài chứa hoạt chất được sử dụng trong điều trị ung thư. Việc áp dụng phương pháp in silico để phân
tích phát sinh loài trong họ Apocynaceae có thể cung cấp dữ liệu quý giá về đa dạng di truyền và mối quan hệ
tiến hóa giữa các loài. Trong nghiên cứu này, phương pháp in silico đã được sử dụng để phân tích phát sinh loài
và mối quan hệ di truyền dựa trên hai chỉ thị DNA barcode là matK và trnH-psbA của họ Apocynaceae. Toàn bộ
các trình tự gen được thu thập từ cơ sở dữ liệu NCBI. Sau đó, các trình tự được căn chỉnh bằng các phần mềm
chuyên dụng như BioEdit và MAFFT. Cuối cùng, MEGA11 được sử dụng để xây dựng và phân tích cây phát
sinh loài. Nghiên cứu này tập trung vào đánh giá 24 loài thuộc họ Apocynaceae thông qua phân tích in silico với
hai trình tự matK và trnH-psbA. Kết quả phân tích cho thấy mức độ đa dạng di truyền trong họ Apocynaceae ở
mức tương đối thấp với các giá trị đa dạng nucleotide (π) là khoảng 0,05798 cho matK và 0,34059 cho trnH-
psbA. Các loài trong họ này được phân nhóm theo từng chi với giá trị bootstrap cao, khẳng định độ tin cậy của
các mối quan hệ phát sinh loài. Cụ thể, hai loài Plumeria lanata và P. pudica thể hiện mối quan hệ gần gũi (với
giá trị bootstrap 100%), trong khi Hoya liangii và Tassadia propinqua được phân tách xa hơn, gợi ý sự phân
hóa tiến hóa sâu sắc hơn. Những kết quả này có thể cung cấp tài liệu tham khảo quan trọng để hỗ trợ các chương
trình nhân giống và bảo tồn cho họ Apocynaceae trong tương lai.
Từ khóa: Apocynaceae, mã vạch DNA, phân tích in silico, phát sinh loài, matK, trnH-psbA.
1. Đặt vấn đề
Họ Trúc đào (Apocynaceae), với hơn
5.000 loài đa dạng sinh thái từ rừng mưa đến
vùng khô hạn, gồm nhiều loài có giá trị dược
liệu như Catharanthus roseus nhưng cũng
chứa alkaloid độc [1]. Do sự phức tạp phân
loại và tiềm năng y học, các công cụ phân
tử như mã vạch DNA ngày càng được ứng
dụng để xác định loài và phân tích phát sinh
loài [2]. Trên thế giới, các chỉ thị như matK,
rbcL, trnH-psbA và ITS đã chứng minh hiệu
quả trong nghiên cứu tiến hóa Apocynaceae
[3], ví dụ như xác định SNP đặc trưng [4]
hay phân tích sự đa dạng hóa tại châu Phi

92
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG Hoàng Phú Hiệp và Nguyễn Minh Phương
và tân nhiệt đới [1, 5]. Tại Việt Nam, một số
nghiên cứu đã xác thực hợp chất dược liệu và
gen liên quan từ các loài trong họ này [6-8],
đóng góp vào cơ sở dữ liệu phân tử và bảo
tồn nguồn gen bản địa.
Mã vạch DNA, với khả năng chuẩn hóa
và tính phân giải cao, là công cụ hiệu quả cho
xác định loài thực vật phức tạp [9, 10]. Trong
đó, gen matK (maturase K) và vùng không
mã hóa trnH-psbA thuộc hệ gen lục lạp được
ưu tiên do độ biến thiên cao và hiệu quả phân
biệt loài tốt, đặc biệt trong các họ có hoa như
Apocynaceae [11]. Việc kết hợp hai chỉ thị
này giúp tăng cường độ chính xác trong phân
tích phát sinh loài và đa dạng di truyền [2].
Dù đã có nghiên cứu áp dụng mã vạch
DNA trên một số loài Apocynaceae [2], phạm
vi vẫn còn hạn chế. Do đó, nghiên cứu này mở
rộng phân tích di truyền học và quan hệ tiến
hóa trong chi thuộc họ Apocynaceae sử dụng
phương pháp in silico dựa trên dữ liệu trình
tự matK và trnH-psbA, nhằm tận dụng lợi thế
của các công cụ tin sinh học hiện đại [12].
2. Phương pháp nghiên cứu
2.1. Thu thập dữ liệu
Trình tự matK và trnH-psbA của 24 loài
thuộc họ Trúc đào (Apocynaceae) được thu
thập ngẫu nhiên từ trang web GenBank của
NCBI (www.ncbi.nlm.nih.org/nucleotide).
Các thông tin được trình bày ở Bảng 1.
Thu thập trình tự gen matK và trnH-psbA
của 24 loài đại diện cho họ Trúc đào từ ngân
hàng gen NCBI (www.ncbi.nlm.nih.org/
nucleotide). Các thông tin được trình bày ở
Bảng 1.
Bảng 1. Trình tự matK và trnH-psbA của 24 loài được sử dụng trong nghiên cứu
STT Tên loài Chi Mã số
Kích thước (bp)
matK trnH-
psbA Kết hợp
1Allamanda schottii Allamanda MG963232.1 1.524 405 1.929
2Alstonia scholaris Alstonia NC_057091.1 1.518 405 1.923
3Alstonia yunnanensis NC_068670.1 1.509 449 1.958
4Asclepias nivea Asclepias NC_022431.1 1.536 395 1.931
5Asclepias syriaca JF433943.1 1.536 378 1.914
6Catharanthus roseus Catharanthus NC_021423.1 1.524 404 1.928
7Cerbera manghas Cerbera NC_051546.1 1.518 541 2.059
8Dyera costulata Dyera MG963246.1 1.518 491 2.009
9Hoya carnosa
Hoya
NC_045868.1 1.548 291 1.839
10 Hoya liangii NC_042245.1 1.548 378 1.926
11 Hoya lockii NC_085235.1 1.548 361 1.909
12 Hunteria zeylanica Hunteria MG963243.1 1.518 388 1.906
13 Lacmellea panamensis Lacmellea MG963264.1 1.518 404 1.922
14 Landolphia dawei Landolphia MG963265.1 1.518 435 1.953
15 Periploca chrysantha Periploca NC_086731.1 1.518 250 1.768
16 Periploca floribunda NC_086730.1 1.524 265 1.789
17 Plumeria lanata
Plumeria
MW392094.1 1.518 435 1.953
18 Plumeria pudica MW392100.1 1.518 421 1.939
19 Plumeria tuberculata MW392099.1 1.518 449 1.967
20 Rauvolfia tetraphylla Rauvolfia PQ260791.1 1.497 510 2.007
21 Secamone afzelii Secamone KF539845.2 1.521 273 1.794
22 Secamone elliptica OP133598.1 1.521 324 1.845

93
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG Tập 11, Số 2 (2025): 91 - 103
STT Tên loài Chi Mã số
Kích thước (bp)
matK trnH-
psbA Kết hợp
23 Tassadia propinqua Tassadia MG963257.1 1.536 276 1.812
24 Thevetia peruviana Thevetia OQ376289.1 1.524 489 2.013
25 Gentiana lutea
(outgroup)
Gentiana
(Gentianaceae) MN199129.1 1.590 359 1.949
2.2. Căn chỉnh nhiều chuỗi
Tất cả các bộ dữ liệu trình tự của matK
và trnH-psbA của Apocynaceae thu thập
theo định dạng FASTA. Trình tự của từng
gen (matK và trnH-psbA) được căn chỉnh
đa chuỗi (multiple sequence alignment)
bằng thuật toán MAFFT trên nền tảng web
tại mafft.cbrc.jp [13]. Sau đó, kết quả căn
chỉnh được kiểm tra và điều chỉnh thủ công
bằng phần mềm BioEdit. Mục đích của
bước này là để xác định các đoạn bảo tồn
(conserved regions) - những vị trí có tính
bảo toàn cao giữa các loài, và các vị trí đa
hình đặc hiệu (polymorphic sites) - những
vị trí có sự khác biệt về nucleotide giữa các
trình tự, vốn rất quan trọng cho việc phân
tích phát sinh loài.
2.3.Tính toán đa dạng nucleotide và khoảng
cách di truyền
Đa dạng nucleotide (π): Được tính toán
để đánh giá mức độ đa dạng di truyền
trong quần thể nghiên cứu bằng phần mềm
MEGA11 [14].
Ma trận khoảng cách di truyền: Được tính
toán dựa trên phương pháp p-distance (tỷ lệ
các vị trí nucleotide khác biệt giữa hai trình
tự). Các phép tính này thường được thực hiện
trực tiếp trong phần mềm MEGA11 trước
khi xây dựng cây phát sinh loài [14].
2.4. Xây dựng cây phát sinh loài
Tiến hành xây dựng cây phát sinh loài bằng
phương pháp Maximum Likelihood (ML).
Trước khi xây dựng cây, mô hình tiến hóa
tối ưu nhất cho từng gen đã được xác định:
với gen matK áp dụng mô hình General Time
Reversible (GTR), với trình tự trnH-psbA
áp dụng mô hình Hasegawa-Kishino-Yano
(HKY). Việc lựa chọn mô hình tiến hóa phù
hợp là rất quan trọng để đảm bảo tính chính
xác của cây phát sinh loài. Độ tin cậy của
các nút phân nhánh (node support) trên cây
phát sinh loài được đánh giá bằng phân tích
bootstrap với 1.000 lần lặp [15, 16]. Giá trị
bootstrap cao (ví dụ: >70%) cho thấy độ tin
cậy lớn đối với sự phân nhánh đó.
2.5. Ước tính thời gian phân kỳ
Thời gian phân kỳ (divergence time) của
họ thực vật Apocynaceae được xác định bằng
cách sử dụng công cụ trực tuyến TimeTree
(http://www.timetree.org/). Công cụ này
tổng hợp dữ liệu, cung cấp một ước tính về
thời điểm các nhánh phát sinh loài khác nhau
tách ra.
3. Kết quả nghiên cứu và thảo luận
Phân tích trình tự gen matK và trnH-psbA
của họ Apocynaceae (Hình 1 và Bảng 2) cho
thấy sự khác biệt đáng kể về mức độ đa hình
nucleotide. Gen matK với độ dài từ 1.497 bp
đến 1.590 bp, cho thấy đây là một vùng ổn
định. Sự đồng nhất này cho thấy matK là một
vùng gen ít biến động về kích thước, tạo điều
kiện thuận lợi cho việc căn chỉnh trình tự và
so sánh liên loài. Ngược lại, vùng trnH-psbA
biểu hiện sự biến động lớn hơn nhiều về độ

94
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG Hoàng Phú Hiệp và Nguyễn Minh Phương
dài, từ 250 bp đến 541 bp. Sự dao động rộng
này thường là do sự hiện diện của các yếu tố
chèn, mất đoạn hoặc các vùng lặp trong trình
tự, phản ánh tính linh hoạt cao hơn của vùng
này. Đối với đa dạng nucleotide trung bình
(π), gen matK có giá trị π thấp (0,05798),
điều này chỉ ra rằng đây là một vùng gen
tương đối bảo tồn với ít biến đổi nucleotide
giữa các loài trong họ Apocynaceae. Do
đặc tính bảo tồn này, matK thường được ưu
tiên sử dụng để nghiên cứu các mối quan hệ
phát sinh loài ở cấp độ chi hoặc họ trở lên,
nơi yêu cầu các tín hiệu tiến hóa sâu hơn.
Ngược lại, vùng trnH-psbA có giá trị π cao
hơn đáng kể (0,34059). Giá trị π cao này cho
thấy trnH-psbA là một vùng gen có tốc độ
tích lũy đột biến cao hơn, dẫn đến mức độ đa
dạng di truyền lớn hơn giữa các loài. Do đó,
trnH-psbA đặc biệt hữu ích trong việc cung
cấp thông tin phân loại và giải quyết các mối
quan hệ phát sinh loài ở cấp độ loài hoặc dưới
loài, nơi đòi hỏi khả năng phân giải cao hơn.
Bảng 2. Thông tin di truyền của matK, trnH-psbA và trình tự kết hợp của Apocynaceae
Thông số Chuỗi
matK trnH-psbA Kết hợp
Phạm vi độ dài chuỗi (bp) 1.497-1.590 250-541 1.768-2.059
Đa dạng nucleotide trung bình giữa các loài (π) 0,05798 0,34059 0,26901
Hình 1. Kết quả so sánh trình tự chỉ thị matK của 24 loài thuộc họ Apocynaceae

95
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG Tập 11, Số 2 (2025): 91 - 103
Phân tích trình tự gen matK đã tiết lộ sự
khác biệt rõ rệt giữa các vùng bảo tồn và
vùng biến đổi cao, phản ánh vai trò chức
năng và lịch sử tiến hóa của chúng. Các
vị trí bảo tồn trong matK thể hiện mức độ
đồng nhất nucleotide cao, nhấn mạnh tầm
quan trọng chức năng của chúng. Cụ thể,
các đoạn 1-30 và 370-400 cho thấy mức
độ đồng nhất nucleotide vượt 90% giữa
các loài Apocynaceae, đặc biệt là trong các
chi như Hoya (khoảng cách cặp 0,00323-
0,01550) và Plumeria (0,00329-0,00593).
Đoạn 1-30 được xác định là vị trí chứa start
codon, đóng vai trò thiết yếu trong quá trình
mã hóa enzyme lục lạp, trong khi đoạn
370-400 là một vùng mã hóa trung tâm,
nổi bật với sự ổn định qua quá trình tiến
hóa. Ngược lại, các vùng biến đổi cao như
35-50, 160-180 và 1.300-1.500 cho thấy
sự khác biệt đáng kể về trình tự, với tỷ lệ
nucleotide khác nhau từ 40-70%. Các đột
biến cụ thể đã được ghi nhận: vị trí 35-50 có
đột biến C→T ở Dyera costulata; 160-180
ghi nhận đột biến A→T ở Plumeria lanata
và G→C ở Hunteria zeylanica. Đặc biệt,
vùng 1.300-1.500 thể hiện khoảng cách
cặp lớn (0,09420 giữa Thevetia peruviana
và Asclepias syriaca), phản ánh sự phân
hóa di truyền đáng kể giữa các chi. Kết quả
này nhất quán với nghiên cứu của Wang và
cộng sự (2023), những người đã xác định
matK là một trong sáu gen mã hóa có mức
độ biến đổi cao trong 101 bộ gen lục lạp của
Apocynaceae [17]. Trong khi matK cung
cấp thông tin quý giá về cả vùng bảo tồn
và biến đổi, nghiên cứu của Bitencourt và
cộng sự (2021) tập trung vào đa dạng hình
thái và phân bố của Apocynaceae cũng chỉ
ra rằng vùng trnH-psbA phản ánh tốt hơn
sự phân hóa giữa các chi [5]. Điều này cho
thấy vai trò bổ trợ của trnH-psbA trong việc
giải quyết các mối quan hệ phát sinh loài ở
cấp độ thấp hơn, bổ sung cho những thông
tin thu được từ matK.
Hình 2. Kết quả so sánh trình tự chỉ thị trnH-psbA của 24 loài thuộc họ Apocynaceae

