
TNU Journal of Science and Technology
230(05): 239 - 245
http://jst.tnu.edu.vn 239 Email: jst@tnu.edu.vn
STUDY ON rpoC1 GENE SEQUENCE CHARACTERISTICS IN
ANCIENT TEA TREES (Camellia sinensis var. assamica) IN
THE NORTHERN PROVINCES OF VIETNAM
Bui Thuy Lien1,2, Tran Gia Huy3, Ong Xuan Phong1, Chu Duc Ha4, Le Chi Toan1, La Viet Hong1*
1Hanoi Pedagogical University 2, 2Hoa Lu University,
3Can Tho University, 4VNU University of Engineering and Technology
ARTICLE INFO
ABSTRACT
Received:
04/10/2024
Tea plant (Camellia sinensis), a species of the Theaceae family, contains
many natural antioxidant compounds such as EGCG, flavanol, and
phenolic acid. In the North of Vietnam, ancient Shan tea populations are
considered endemic genetic resources. This study aims to investigate the
genetic characteristics of the rpoC1 gene region of four Shan tea
individuals collected in three provinces of Lao Cai, Yen Bai, and Ha
Giang. The amplicon size of the rpoC1 gene was approximately 500 bp
in length. The DNA sequences were trimmed using the Bioedit program
and compared for genetic similarity with species of the Theaceae family
by using the MEGA-X software. All four tea samples were completely
similar to other species of the genus Camellia on the NCBI database,
illustrating that rpoC1 is a highly conserved sequence region of the
genus Camellia. In addition, the results of variant analysis identified 7
SNPs compared with other genera in the Theaceae family. The
phylogenetic diagram shows two clusters with a genetic distance of 0.02,
in which tea samples belonging to the genus Camellia are in the same
clade, revealing that the rpoC1 gene region reflects the genetic
characteristics of the genus Camellia.
Revised:
06/02/2025
Published:
07/02/2025
KEYWORDS
Ancient tea
Camellia sinensis
rpoC1
SNPs
Theaceae
NGHIÊN CỨU ĐẶC ĐIỂM TRÌNH TỰ GENE
rpoC1
Ở CÂY CHÈ SHAN CỔ THỤ
(Camellia sinensis var. assamica) TẠI CÁC TỈNH PHÍA BẮC VIỆT NAM
Bùi Thùy Liên1,2, Trần Gia Huy3, Ong Xuân Phong1, Chu Đức Hà4, Lê Chí Toàn1, La Việt Hồng1*
1Trường Đại học Sư phạm Hà Nội 2, 2Trường Đại học Hoa Lư
3Trường Đại học Cần Thơ, 4Trường Đại học Công nghệ - ĐH Quốc gia Hà Nội
THÔNG TIN BÀI BÁO
TÓM TẮT
Ngày nhận bài:
04/10/2024
Cây chè (Camellia sinensis), một loài thuộc họ Chè chứa nhiều hợp chất
chống oxy hóa tự nhiên như EGCG, flavanol, phenolic acid. Ở phía Bắc
Việt Nam, các quần thể chè Shan cổ thụ được xem là nguồn gene đặc
hữu. Nghiên cứu này được thực hiện nhằm khảo sát đặc điểm di truyền
vùng gene rpoC1 của bốn cá thể chè Shan thu thập tại ba tỉnh Lào Cai,
Yên Bái và Hà Giang. Kết quả PCR khuếch đại đoạn gene rpoC1 có kích
thước khoảng 500 bp. Trình tự DNA được hiệu chỉnh bằng chương trình
Bioedit và so sánh mức độ tương đồng di truyền với các loài thuộc họ
Theaceae bằng chương trình MEGA-X. Cả bốn mẫu chè đều có sự tương
đồng hoàn toàn với các loài khác thuộc chi Camellia trên cơ sở dữ liệu
NCBI, cho thấy rpoC1 là vùng trình tự có tính bảo tồn cao của chi Chè.
Bên cạnh đó, kết quả phân tích biến thể đã xác định 7 SNPs so với các
chi khác trong họ Theaceae. Giản đồ phả hệ thể hiện 2 nhóm chính với
khoảng cách di truyền là 0,02, trong đó các mẫu chè thuộc chi Camellia
ở cùng một phân nhóm cho thấy vùng gene rpoC1 phản ảnh đặc điểm di
truyền đặc trưng của chi Camellia.
Ngày hoàn thiện:
06/02/2025
Ngày đăng:
07/02/2025
TỪ KHÓA
Chè cổ thụ
Camellia sinensis
rpoC1
SNPs
Họ Chè
DOI: https://doi.org/10.34238/tnu-jst.11243
* Corresponding author. Email: laviethong@hpu2.edu.vn

TNU Journal of Science and Technology
230(05): 239 - 245
http://jst.tnu.edu.vn 240 Email: jst@tnu.edu.vn
1. Đặt vấn đề
Lá và hoa của cây chè hay trà (Camellia sinensis var., họ Chè) là nguyên liệu chính làm nên trà,
loại thức uống không cồn sử dụng phổ biến thứ hai thế giới, đem lại giá trị kinh tế cao cho các
nước sản xuất. Hàm lượng polyphenol trong chè từ 20 - 30%, chủ yếu là flavonoid, catechin,
phenolic acid và anthocyanin đem lại nhiều lợi ích về mặt sức khỏe [1]. Các hợp chất như
epicatechin (EC), epigallocatechin (EGC), epicatechin gallate (ECG), and epigallocatechin gallate
(EGCG) trong lá chè cho thấy khả năng dọn gốc tự do DPPH (IC50 =0, 0,005 μg/mL) và gốc oxy
hóa toàn phần (TOSC), mang lại hiệu quả chống ung thư, kháng virus, kháng oxy hóa tự nhiên cao
[2] - [7].
Trước đây, dựa trên đặc điểm hình thái lá C. sinensis chỉ gồm C. sinensis (var. sinensis) - lá nhỏ
có nguồn gốc từ miền Đông và Đông Nam Trung Quốc, và C. sinensis (var. assamica) - lá rộng có
nguồn gốc vùng Assam (Ấn Độ), bắc Myanmar và Việt Nam [8]. Hiện tại, có nhiều hơn hai phân
nhóm kể trên đã được mô tả gồm: C. sinensis var. microphylla, C. sinensis var. assamica, C.
sinensis var. pubilimba [9], C. sinensis var. dulcamara phát hiện đầu tiên ở tỉnh Bắc Kạn [10] và
trà Mã Dọ (C. sinensis var. madoensisis) phát hiện đầu tiên ở tỉnh Phú Yên. Với mức độ đa dạng
như hiện nay, việc phân loại dựa trên đặc điểm hình thái không còn hiệu quả và dễ xảy ra sự nhầm
lẫn đặc biệt là ở cấp độ dưới loài [11]. Trong khi đó, các dấu phân tử như matK, rbcL, rpoC1, v.v.
cho thấy hiệu quả nhận diện cao, chính xác ở mọi cấp độ phân loại [12], đóng vai trò quan trọng
trong nghiên cứu tiến hóa, xác định nguồn gene chè và nhân giống cây chè tốt [13]. Vì vậy, mục
đích của nghiên cứu này nhằm xác định mối quan hệ di truyền của giống chè Shan cổ thụ (C.
sinensis var. assamica) phân bố tại Lào Cai, Yên Bái và Hà Giang dựa trên đặc điểm trình tự vùng
rpoC1. Kết quả thu được có thể cung cấp thông tin hữu ích cho các nghiên cứu nguồn gốc phát
sinh và bảo tồn loài chè cổ thụ ở miền Bắc Việt Nam.
2. Phương pháp nghiên cứu
2.1. Đối tượng nghiên cứu
Bốn mẫu lá chè Shan cổ thụ sử dụng trong nghiên cứu được thu tại ba tỉnh Yên Bái, Hà Giang
và Lào Cai (Bảng 1). Mẫu lá nguyên vẹn, không bị sâu bệnh và không tổn thương cơ học. Ngoài
ra, 16 trình tự vùng rpoC1 có độ tương đồng cao với mẫu nghiên cứu, 5 trình tự khác chi trong
cùng họ và 1 trình tự khác họ cũng được lấy từ cơ sở dữ liệu NCBI sử dụng làm mẫu đối chứng.
Bảng 1. Danh sách mẫu lá chè Shan cổ thụ thu tại Lào Cai, Yên Bái và Hà Giang
Tên mẫu
Địa điểm thu mẫu
Tọa độ
Decimal Degrees Lat
Decimal Degrees Long
LCTT5
Lào Cai
22.59266667
104.17344444
LCTT12
Lào Cai
22.59358333
104.17286111
YB3
Yên Bái
21.57047222
104.64766667
HG13
Hà Giang
22.77322222
104.86736111
2.2. Phương pháp tách chiết DNA
Mẫu lá chè sau khi thu về được khử trùng bề mặt bằng ethanol 70%. Sau đó, DNA được tách
chiết bằng quy trình CTAB của Rogers và Bendich [14]. Nồng độ và độ tinh sạch của DNA tổng
số được kiểm tra bằng máy quang phổ Nanodrop One (Thermo scientific).
2.3. Phương pháp khuếch đại PCR và giải trình tự
Mẫu DNA chè có nồng độ và độ tinh sạch cao được chọn để thực hiện phản ứng PCR khuếch
đại vùng rpoC1 có kích thước khoảng 500 bp [15], sử dụng cặp mồi: mồi xuôi rpoC1-2F
(5’GGCAAAGAGGGAAGATTTCG3)’ và mồi ngược rpoC1-4R
(5’CCATAAGCATATCTTGAGTTGG3’) [16]. Thể tích phản ứng là 30 𝜇𝐿 với thành phần gồm:
BiH2O (15 𝜇𝐿), 2X PCR SuperMix (Bio-Helix) (12 𝜇𝐿), rpoC1-2F/rpoC1-4R (1 𝜇𝐿), DNA (2 𝜇𝐿).

TNU Journal of Science and Technology
230(05): 239 - 245
http://jst.tnu.edu.vn 241 Email: jst@tnu.edu.vn
Chu kỳ nhiệt sử dụng là: biến tính ban đầu 95°C (2 phút); tiếp theo là 30 chu kỳ, biến tính ở 95 °C
(30 giây), ủ ở 52 °C (30 giây), kéo dài ở 72 °C (1 phút); và giai đoạn ổn định sản phẩm ở 72 °C (5
phút) [16].
Sản phẩm PCR được phân tích bằng kỹ thuật điện di trên gel agarose 2%, sử dụng dung dịch
đệm TAE 1X với hiệu điện thế là 50V, thang BH 100 bp (Bio-Helix), thuốc nhuộm DNA là
safeview 10.000X (ABM) và hệ thống chụp hình gel BIORAD UV 2000. Mẫu DNA sau đó được
tinh sạch và giải trình tự bằng kỹ thuật Sanger.
2.4. Phân tích dữ liệu
Trình tự vùng rpoC1 của bốn mẫu chè sau khi giải được loại bỏ tín hiệu nhiễu bằng phần mềm
Bioedit. Sau đó, xác định các trình tự tương đồng bằng công cụ BLAST trên cơ sở dữ liệu NCBI. Tất
cả các trình tự được dóng hàng để so sánh và phát hiện SNPs bằng chương trình MEGA-X với thuật
toán ClustalW Multiple alignment [17]. Giản đồ mối quan hệ di truyền các mẫu phân tích cũng được
vẽ bằng phần mềm MEGA-X sử dụng phương pháp phân tích Maximum Likelihood [18].
3. Kết quả và bàn luận
3.1. Kết quả kiểm tra mẫu DNA sau khi trích
Mẫu DNA lá sau khi trích được hòa tan trong dung dịch TE 0,1X, sau đó được kiểm tra nồng
độ và độ tinh sạch bằng cách đo trên máy quang phổ Nanodrop.
Bảng 1. Kết quả đo hàm lượng DNA bằng máy đo quang phổ Nanodrop
STT
Tên Mẫu
Nồng độ (𝒏𝒈/𝝁𝑳)
A260 /A280
1
LCTT5
38,90
1,92
2
LCTT12
66,90
2,00
3
YB3
72,90
2,01
4
HG13
92,50
2,05
Kết quả Bảng 1 cho thấy rằng DNA của bốn mẫu chè có hàm lượng cao, dao động từ 38 - 92,50
𝑛𝑔/𝜇𝐿. Tuy hai mẫu YB3 và HG13 có giá trị A260/A280 dao động trong khoảng từ 1,8 - 2,0 nhưng
cũng không vượt quá nhiều. Vì vậy, cả bốn mẫu LCTT5, LCTT1, YB3, và HG13 đều đủ điều kiện
để thực hiện phản ứng PCR.
3.2. Kết quả khuếch đại vùng rpoC1
Sản phẩm PCR khuếch đại trình tự vùng rpoC1 của các mẫu chè được phân tích trên gel agarose
2%, kết quả thể hiện trong Hình 1.
Hình 1. Hình ảnh điện di sản phẩm PCR trình tự gene rpoC1 từ 4 mẫu chè thu được
Chú thích: M. Marker, 1. Mẫu chè (Lào Cai), 2. Mẫu chè (Lào Cai), 3. Mẫu chè (Yên Bái), 4. Mẫu chè (Hà
Giang), (-). Đối chứng.
Quan sát hình gel thấy rằng, các băng sản phẩm PCR sáng rõ và không có băng phụ. So với
thang chuẩn, sản phẩm khuếch đại có kích thước khoảng 500 bp, tương đối phù hợp với kết quả
M 1 2 3 4 (-)
500

TNU Journal of Science and Technology
230(05): 239 - 245
http://jst.tnu.edu.vn 242 Email: jst@tnu.edu.vn
phân tích của Xie và cộng sự [15]. Vì vậy, các mẫu DNA chè đủ điều kiện để tiến hành tinh sạch
và giải trình tự.
3.3. Kết quả xác định trình tự tương đồng
Sau khi giải trình tự đoạn gene rpoC1 của bốn mẫu chè, các trình tự này được loại bỏ tín hiệu
nhiễu. Kết quả dóng hàng cho thấy trình tự rpoC1 bảo tồn hoàn toàn ở 4 mẫu nghiên cứu, do đó
chỉ chọn 1 trình tự đại diện để so sánh mức độ tương đồng với cơ sở dữ liệu NCBI bằng công cụ
BLAST, kết quả trình bày trong Bảng 2.
Bảng 2. Kết quả BLAST trình tự vùng gene rpoC1 của bốn mẫu chè Shan cổ thụ thu tại Lào Cai, Yên Bái
và Hà Giang
Tên loài
Độ phủ (%)
E-value
Độ tương đồng (%)
Mã truy cập
Camellia sinensis
100%
0.0
100%
LC488797.1
Camellia euryoides
100%
0.0
100%
OP580978.1
Camellia nitidissima
100%
0.0
100%
NC_039645.1
Camellia gymnogyna
100%
0.0
100%
MH394405.1
Camellia huulungensis
100%
0.0
100%
NC_088067.1
Camellia piquetiana
100%
0.0
100%
NC_087752.1
Camellia oblata
100%
0.0
100%
NC_087751.1
Camellia salicifolia
100%
0.0
100%
NC_087749.1
Camellia pyxidiacea
100%
0.0
100%
OR413569.1
Camellia liberistyloides
100%
0.0
100%
NC_087748.1
Camellia oleifera
100%
0.0
100%
MF541730.2
Camellia sasanqua
100%
0.0
100%
NC_041473.1
Camellia japonica
100%
0.0
100%
MK353211.1
Camellia granthamiana
100%
0.0
100%
NC_038181.1
Camellia ptilophylla
100%
0.0
100%
NC_038198.1
Camellia euryoides
100%
0.0
100%
OP580978.1
Pyrenaria jonquieriana subsp.
multisepala
100%
0.0
99,78%
KY406772.1
Polyspora dalgleishiana
100%
0.0
99,78%
NC_035648.1
Apterosperma oblata
100%
0.0
99,78%
NC_035641.1
Stewartia obovata
100%
0.0
98,92%
NC_041472.1
Hartia laotica
100%
0.0
98,92%
NC_041509.1
Bảng 2 cho thấy đoạn gene rpoC1 của bốn mẫu chè Shan cổ thụ thu tại Hà Giang, Yên Bái và
Lào Cai tương đồng cao với các trình tự chè đã công bố trên cơ sở dữ liệu NCBI. Độ tương đồng
cao nhất đạt 100% với giá trị E-value là 0.0, thấp nhất là 98,92% ở các mẫu khác chi với mã
GenBank là NC041472.1 và NC041509.1. Kết quả BLAST cũng cho thấy, ở cấp độ loài không có
sự khác biệt tại vùng gene rpoC1 của bốn mẫu chè trong nghiên cứu so với các loài khác.
3.4. Kết quả phân tích trình tự vùng rpoC1
Từ kết quả BLAST, 16 trình tự đầu tiên có độ tương đồng cao nhất được chọn, sau đó chọn
thêm 5 trình tự không thuộc chi Camellia (cùng họ Chè) và có độ tương đồng thấp hơn. Các trình
tự được chọn sẽ trở thành nguồn dữ liệu phân tích đặc điểm trình tự vùng rpoC1 của các mẫu chè
trong nghiên cứu, kết quả thể hiện trong Bảng 3.
Bảng 3. Đa hình các nucleotide tại vùng gene rpoC1
Mẫu
Vị trí nucleotide
14
41
139
309
315
372
454
Camellia sinensis
C
G
G
T
T
C
C
HG13
⚫
⚫
⚫
⚫
⚫
⚫
⚫
LC5
⚫
⚫
⚫
⚫
⚫
⚫
⚫
LC12
⚫
⚫
⚫
⚫
⚫
⚫
⚫

TNU Journal of Science and Technology
230(05): 239 - 245
http://jst.tnu.edu.vn 243 Email: jst@tnu.edu.vn
Mẫu
Vị trí nucleotide
14
41
139
309
315
372
454
YB3
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Pyrenaria jonquieriana
⚫
⚫
⚫
⚫
G
⚫
⚫
Camellia oleifera
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia gymnogyna
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia japonica
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Apterosperma oblata
⚫
⚫
⚫
⚫
G
⚫
⚫
Polyspora dalgleishiana
⚫
⚫
⚫
⚫
⚫
T
⚫
Camellia granthamiana
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia ptilophylla
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia nitidissima
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Stewartia obovata
G
A
A
G
⚫
⚫
A
Camellia sasanqua
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Hartia laotica
G
A
A
G
⚫
⚫
A
Camellia liberistyloides
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia salicifolia
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia oblata
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia piquetiana
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia huulungensis
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia euryoides
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia euryoides
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Camellia pyxidiacea
⚫
⚫
⚫
⚫
⚫
⚫
⚫
Từ kết quả alignment, không tìm thấy sự biến đổi của bất kì nucleotide nào giữa bốn trình tự
chè trong nghiên cứu so với các trình tự khác trong chi Camellia, cho thấy rpoC1 là vùng gene có
sự bảo tồn cao. Khi so sánh rộng hơn, tại vùng gene này phát hiện thấy có khác biệt giữa các chi
trong họ Theaceae. Có 7 vị trí biến đổi nucleotide được ghi nhận khi alignment trình tự bốn mẫu
HG13, LC5, LC12, YB3 (chi Camellia) với 5 chi khác trong cùng loài (Bảng 3). Trong đó, 3 loài
P. jonquieriana, A. oblata và P. dalgleishiana chỉ có duy nhất một đột biến điểm, S. obovata và H.
laotica có 5 đột biến điểm chiếm 1,08% trên tổng chiều dài đoạn rpoC1. Tuy nhiên, khi so sánh bộ
gene lục lạp của Camellia sinensis var. assamica cv. Duntsa với các giống khác như C. sinensis
var. sinensis, cvs. anhua [19] nhận thấy rpoC1 là vùng xuất hiện nhiều biến thể. Có thể thấy gene
rpoC1 có sự biến động lớn về số lượng biến thể nucleotide nhưng chưa đặc trưng cho loài hoặc các
giống dưới loài. Do đó, cần có thêm các marker khác để bổ sung như ycf1b, matK, rbcL, ndhF,…
nhằm tăng độ tin cậy của khả năng phân biệt loài [20].
3.5. Đa dạng mối quan hệ di truyền của bốn mẫu chè Shan cổ thụ thu tại Lào Cai, Yên Bái và
Hà Giang
Mối quan hệ di truyền của các mẫu chè trong nghiên cứu được phân tích dựa trên giản đồ phả
hệ trình bày trong Hình 2.
Qua kết quả phân tích ở Hình 2 cho thấy, giản đồ phả hệ được chia thành 2 nhóm chính với
khoảng cách di truyền là 0,02. Nhóm I gồm 25 mẫu, phân thành 2 nhóm phụ với khoảng cách di
truyền là 0,0109. Nhóm phụ 1 gồm mẫu có mã gene NC035648.1 (Polyspora dalgleishiana),
KY406772.1 (Pyrenaria jonquieriana), NC035641.1 (Apterosperma oblata) và 20 mẫu chè
(Camellia sp.), tuy các mẫu khác chi nhưng cùng họ Chè và độ tương đồng giữa các trình tự
nucleotide cao, do đó được xếp chung một phân nhóm. Nhóm phụ 2 gồm mẫu NC041472.1
(Stewaria obovata) và NC041509.1 (Hartia laotica) tuy cùng họ Chè, nhưng có 5 vị trí nucleotide
khác, do đó được chia thành một phân nhóm phụ. Nhóm II chỉ gồm mẫu đối chứng có mã gene
MF359957.1 (Eschweilera caudiculta) thuộc họ Lecythidaceae, khác họ so với các mẫu nhóm 1,
có khoảng cách di truyền khá xa và tách thành một nhóm riêng biệt. Điều này cho thấy tính chính
xác cao khi phân tích di truyền dựa vào vùng gene rpoC1.