TẠP CHÍ KHOA HỌC<br />
Khoa học Tự nhiên và Công nghệ, Số 10 (9/2017) tr 47 - 54<br />
<br />
XÁC ĐỊNH, XẾP LOẠI VÀ KHẢO SÁT SỰ BIỂU HIỆN<br />
CỦA CÁC GEN MÃ HÓA DEHYDRIN (DHN)<br />
Ở CÂY ĐẬU TƢƠNG (Glycine max (L.) Merr.)<br />
BẰNG PHÂN TÍCH IN SILICO<br />
Vũ Thị Nự, Nguyễn Thị Sơn, Hà Mạnh Linh6<br />
Trường Đại học Tây Bắc<br />
Tóm tắt: Bằng phân tích in silico, chúng tôi đã xác định được 11 gen mã hóa cho các protein Dehydrin<br />
(DHN) trong hệ gen của cây đậu tương. Các protein suy diễn của các gen này đều có mang trình tự bảo thủ đặc<br />
hiệu cho DHN là phân mảnh K đã được báo cáo ở nhiều loài. Phân tích cây phát sinh chủng loại cho thấy, các<br />
DHN của cây đậu tương nằm trên ba nhánh khác nhau, có một số hiện tượng nhân gen xảy ra sau quá trình biệt hóa<br />
loài. Kết quả phân tích RNAseq cho thấy có 7 trong 11 gen DHN biểu hiện ở ít nhất một loại mô của cây đậu tương,<br />
chỉ hai gen GmDHN1 và GmDHN9 biểu hiện ở tất cả các loại mô nghiên cứu, đồng thời hai gen này cũng biểu hiện<br />
mạnh hơn các gen khác ở hầu hết các mô. Hai gen GmDHN1 và GmDHN9 biểu hiện mạnh ở mô hoa, mô vỏ quả, rễ<br />
và biểu hiện yếu hơn ở mô hạt, lá non và nốt sần. Gen GmDHN6 và GmDHN8, biểu hiện mạnh hơn so với các gen<br />
còn lại ở hạt trong giai đoạn phát triển muộn, các gen GmDHN2, GmDHN3, GmDHN5 và GmDHN11 không biểu<br />
hiện ở các loại mô được nghiên cứu.<br />
Từ khóa: Biểu hiện gen, cây di truyền, Dehydrin (DHN), đậu tương.<br />
<br />
1. Mở đầu<br />
Cây đậu tương (Glycine max (L.) Merr) là một trong những cây trồng quan trọng, có<br />
lịch sử trồng trọt lâu đời, được trồng ở nhiều nước trên thế giới từ châu Âu, châu Á, châu Phi,<br />
châu Mỹ, nhất là ở vùng nhiệt đới và á nhiệt đới. Hạt đậu tương là loại sản phẩm có giá trị<br />
đồng thời cả về protein và lipit [3]. Thành phần dinh dưỡng trong hạt đậu tương rất cao, với<br />
hàm lượng protein từ 38 - 40%, lipit từ 15 - 20%, hyđratcacbon từ 15 - 16% và muối khoáng<br />
quan trọng cho sự sống. Ở nước ta, trong những thập niên gần đây diện tích trồng đậu tương<br />
không ngừng tăng lên [9]. Nhờ giá trị cao, hệ gen của đậu tương đã được giải trình tự vào<br />
năm 2010 bởi tập thể các nhà khoa học dẫn đầu bởi G. Stacey, R. Shoemaker, S. Jackson, J.<br />
Schmutz, và D. Rokhsar. Phiên bản hệ gen của cây đậu tương hiện có kích thước xấp xỉ 975<br />
Mb, gồm có 20 nhiễm sắc thể [15]. Đối với một loài sinh vật có hệ gen được giải trình tự, việc<br />
nghiên cứu về cấu trúc và chức năng hệ gen (genomics) có ý nghĩa rất quan trọng. Ở Việt<br />
Nam, có nhiều nguyên nhân làm giảm diện tích cũng như năng suất đậu tương như ánh sáng,<br />
độ ẩm, nhiệt độ, kĩ thuật, mùa vụ, hạn hán, đặc điểm di truyền của các giống. Trong đó, hạn<br />
hán là nguyên nhân chủ yếu làm giảm diện tích và năng suất của đậu tương do đó việc xác<br />
định và nghiên cứu sự biểu hiện của các gen liên quan đến tính chịu hạn của cây đậu tương là<br />
việc làm cần thiết.<br />
Dehydrin (DHN) là một họ bao gồm nhiều loại protein có số lượng lớn trong giai đoạn<br />
phát triển phôi muộn, đóng vai trò quan trọng trong khả năng thích nghi của thực vật với các<br />
điều kiện bất lợi [5, 8]. DHN gồm các protein được xếp vào nhóm II (LEA2-D11) của họ Late<br />
6<br />
<br />
Ngày nhận bài: 03/01/2017. Ngày nhận kết quả phản biện: 10/5/2017. Ngày nhận đăng: 20/9/2017<br />
Liên lạc: Vũ Thị Nự, e - mail: vuthinu09@gmail.com<br />
47<br />
<br />
Embryogenesis Abundant protein (LEA) [5]. Các DHN được xác định đều có ái lực cao với<br />
nước, tính chất này giúp chúng giữ được nước ngay cả trong điều kiện tế bào mất nước mạnh.<br />
DHN bền với nhiệt và có thể giữ nguyên vẹn cấu trúc không bị thay đổi trong dung dịch nước ở<br />
nhiệt độ đến 100C, nhóm này có 3 đoạn bảo thủ kí hiệu là Y, S, K [5, 8]. Dựa vào cấu trúc<br />
DHN được chia thành 6 nhóm: Kn, SKn, KnS, YnKn và YnSKn và SKS [11]. DHN phân bố trong<br />
nhiều mô tế bào ở nhiều giai đoạn phát triển khác nhau: Mô sinh dưỡng và mô sinh thực. Một<br />
số DHN như protein RAB18 của Arabidopsis và RAB (response to abscisic acid) của ngô tìm<br />
thấy trong hạt; ở hầu hết các mô của mầm và lá mầm [8]. Trong tế bào, DHN được phát hiện ở<br />
tế bào chất, nhân, màng tế bào và ty thể. Phần lớn các DHN được tìm thấy trong cây khi bị tác<br />
động của điều kiện bất lợi, tác động của abscisic acid (ABA), hạn, lạnh, độ mặn cao [10]. Hiện<br />
nay, đã có hơn 800 trình tự gen DHN đã được phân lập và hơn 700 trình tự protein DHN đã<br />
được xác định từ nhiều loài thực vật khác nhau (hạt kín, hạt trần và thực vật bậc thấp) [8]. Trên<br />
cây đậu tương, một số gen DHN cũng đã được tách dòng và xác định trình tự [12, 18]. Trong<br />
nghiên cứu này, bài báo sử dụng phương pháp In Silico để xác định trình tự của các DHN trong<br />
hệ gen của cây đậu tương, xây dựng cây phát sinh chủng loại và phân loại các DHN, đồng thời<br />
khảo sát sự biểu hiện của các gen DHN ở loài cây này.<br />
2. Vật liệu và phƣơng pháp nghiên cứu<br />
2.1. Cơ sở dữ liệu về các trình tự hệ gen và RNAseq ở cây đậu tương<br />
Các trình tự được khai thác từ cơ sở dữ liệu trên ngân hàng gen (NCBI). Trong đó, trình<br />
tự hệ gen của cây đậu tương theo công bố của Schmutz và cs. (2010), dữ liệu RNAseq theo<br />
Severin và cs. (2010), các trình tự DHN của cây Arabidopsis theo Hundertmark và Hincha<br />
(2008) [6, 15, 16].<br />
2.2. Xác định các gen thuộc họ DHN ở cây đậu tương<br />
Mười protein DHN của cây Arabidopsisthaliana (AT1G20440, AT1G20450,<br />
AT1G54410, AT1G76180, AT2G21490, AT3G50970, AT3G50980, AT4G38410,<br />
AT4G39130, AT5G66400) [6] được dùng làm khuôn dò để tìm kiếm các gen tương đồng trên<br />
dữ liệu nucleotide của toàn hệ gen của cây đậu tương nhờ chương trình TBLASTN theo Cao<br />
Phi Bằng và Trần Thị Thanh Huyền (2015) [1].<br />
2.3. Các đặc điểm hóa - lí<br />
Các đặc điểm vật lí, hóa học của các gen/protein nghiên cứu được khảo sát nhờ các<br />
công cụ của ExPASy (Expert Protein Analysis System) [3].<br />
2.4. Xây dựng cây phả hệ<br />
Cây phả hệ được xây dựng từ các trình tự protein nghiên cứu của các loài Arabidopsis,<br />
dương và quýt đường đã được sắp xếp nhờ phần mềm MEGA5 bằng sử dụng phương pháp<br />
Maximum Likelihood và tuân theo các tham biến: mẫu Jones-Taylor-Thornton (JTT), dữ liệu<br />
được xử lí là tất cả các vị trí và phương pháp Bootstrap với 1.000 lần lặp lại [17].<br />
48<br />
<br />
2.5. Khảo sát sự biểu hiện gen<br />
Bảng 1. Đặc điểm gen dehydrin của cây đậu tƣơng<br />
Kích thước Khối lượng<br />
protein<br />
phân tử<br />
Chỉ số Chỉ số<br />
suy diễn<br />
protein<br />
ưa nước béo<br />
(aa)<br />
suy diễn (KD)<br />
<br />
Số<br />
itron<br />
<br />
Gen<br />
<br />
Tên locus<br />
<br />
Chiều dài<br />
gen/ đoạn<br />
mã hóa<br />
<br />
GmDHN1<br />
<br />
Glyma04g01130<br />
<br />
1375/645<br />
<br />
214<br />
<br />
24,16<br />
<br />
-1,509<br />
<br />
50,09 5,53<br />
<br />
1<br />
<br />
GmDHN2<br />
<br />
Glyma04g01181<br />
<br />
657/501<br />
<br />
166<br />
<br />
17,32<br />
<br />
-0,971<br />
<br />
51,81 9,22<br />
<br />
1<br />
<br />
GmDHN3<br />
<br />
Glyma06g01171<br />
<br />
540/400<br />
<br />
132<br />
<br />
13,34<br />
<br />
-1,36<br />
<br />
51,17 5,22<br />
<br />
2<br />
<br />
GmDHN4<br />
<br />
Glyma07g10030<br />
<br />
1730/732<br />
<br />
243<br />
<br />
26,55<br />
<br />
-1,211<br />
<br />
39,58 6,18<br />
<br />
2<br />
<br />
GmDHN5<br />
<br />
Glyma08g05361<br />
<br />
276/276<br />
<br />
91<br />
<br />
9,90<br />
<br />
-1,062<br />
<br />
55,71 6,64<br />
<br />
0<br />
<br />
GmDHN6<br />
<br />
Glyma09g31740<br />
<br />
1218/762<br />
<br />
253<br />
<br />
26,63<br />
<br />
-1,244<br />
<br />
27,79 6,29<br />
<br />
2<br />
<br />
GmDHN7<br />
<br />
Glyma12g36430<br />
<br />
1650/408<br />
<br />
135<br />
<br />
14,69<br />
<br />
-1,066<br />
<br />
62,15 5,54<br />
<br />
1<br />
<br />
GmDHN8<br />
<br />
Glyma13g27120<br />
<br />
1815/420<br />
<br />
139<br />
<br />
15,13<br />
<br />
-1,186<br />
<br />
51,22 5,52<br />
<br />
1<br />
<br />
GmDHN9<br />
<br />
Glyma16g04190<br />
<br />
1406/339<br />
<br />
112<br />
<br />
12,59<br />
<br />
-1,874<br />
<br />
31,34 6,24<br />
<br />
1<br />
<br />
GmDHN10 Glyma16g04200<br />
<br />
1351/255<br />
<br />
84<br />
<br />
9,44<br />
<br />
-1,942<br />
<br />
32,50 6,21<br />
<br />
1<br />
<br />
GmDHN11 Glyma17g24193<br />
<br />
3231/498<br />
<br />
165<br />
<br />
18,89<br />
<br />
-1,623<br />
<br />
46,06 6,92<br />
<br />
2<br />
<br />
pI<br />
<br />
Sự biểu hiện của các gen được phân tích thông qua ngân hàng RNAseq của cây đậu<br />
tương được xây dựng bởi Severin và cs. (2010) [16]. Các gen được khảo sát bằng cách đếm số<br />
lượng trình tự biểu hiện trong các cơ sở dữ liệu tồn tại trên trang web NCBI nhờ chương trình<br />
TBLASTN [1].<br />
3. Kết quả và thảo luận<br />
3.1. Số lượng và đặc điểm các gen dehydrin của cây đậu tương<br />
Sử dụng mười protein dehydrin của cây Arabidopsis thaliana làm khuôn dò, đã tìm thấy<br />
tổng số 11 gen mã hóa cho các dehydrin ở trong toàn bộ hệ gen của cây đậu tương. Các locus<br />
gen tìm được tương ứng với các protein khuôn dò như sau: Protein AT1G20440 tìm được 4<br />
gen (Glyma09g31740, Glyma06g01171, Glyma04g01181 và Glyma04g01130); AT1G20450<br />
tìm được 1 gen (Glyma16g04190); AT1G54410 tìm được 2 gen (Glyma17g24193 và<br />
Glyma16g04200); AT1G76180 tìm được 4 gen (Glyma12g36430, Glyma13g27120,<br />
Glyma08g05361 và Glyma07g10030); các protein còn lại không tìm được gen tương ứng.<br />
Phân tích cấu trúc bậc một suy diễn các protein DHN của cây đậu tương, cho thấy các<br />
protein này đều mang các vùng bảo thủ đặc hiệu (Hình 1) cho các DHN đã được báo cáo ở<br />
nhiều loài khác là phân mảnh K.<br />
Các gen DHN của cây đậu tương có độ dài từ 276 tới 3231 nucleotide, kích thước của<br />
trình tự mã hóa của các gen là từ 255 đến 762 nucleotide. Trình tự các protein suy diễn có<br />
kích thước từ 84 tới 253 amino acid, tương ứng với khối lượng phân tử từ 9,44 KD tới 26,63<br />
49<br />
<br />
KD. Hầu hết các dehydrin của cây đậu tương đều có tính axit yếu, pI của các protein này nằm<br />
trong khoảng 5,22 tới 6,92. Riêng GmDHN2 có tính bazơ, pI bằng 9,22 (Bảng 1). Các DHN<br />
cây đậu tương có tính ưa nước tương đối cao, chỉ số ưa nước từ -0,971 đến -1,942 trong đó<br />
cao nhất là GmDHN10. Tính ưa nước của các DHN ở cây đậu tương cũng tương đương với<br />
tính ưa nước của các DHN của cây quýt đường (Citrus clementina) đã được báo cáo [2]. Các<br />
gen này có chỉ số béo khác nhau dao động từ 31,34 đến 62,15 cao hơn so với các DHN ở cây<br />
quýt đường (Citrus clementina) [2].<br />
<br />
Hình 1. Kết quả sắp dãy các protein DHN của cây đậu tƣơng<br />
Ghi chú: Dấu đánh dấu các amino acid bảo thủ, các kí tự được đóng khung thể hiện vùng bảo thủ.<br />
<br />
50<br />
<br />
3.2. Phân tích cây phả hệ<br />
Cây phả hệ được xây dựng từ các DHN của cây đậu tương và các loài cây khác<br />
(Arabidopsis, dương, quýt) được thể hiện ở Hình 2.<br />
<br />
Hình 2. Cây phả hệ đƣợc xây dựng từ các DHN của các loài A.thaliana (At),<br />
đậu tƣơng (Gm), dƣơng (Ptr) và quýt (Ccl)<br />
<br />
Các DHN của cây đậu tương nằm trên ba nhánh khác nhau. Nhánh thứ nhất gồm<br />
GmDHN2, GmDHN7 và GmDHN8. Ba trình tự này nằm trên cùng nhánh với PtrDHN2 và<br />
PtrDHN8 của cây dương. Hai trình tự này của cây dương được xếp vào nhóm YnSKn hay<br />
51<br />
<br />