````````TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2

KHOA SINH–KTNN

----------

LÊ MINH TUẤN

PHÂN TÍCH VAI TRÒ CỦA GỐC METHIONINE

TRONG CẤU TRÚC NHÂN TỐ PHIÊN MÃ Ở CÂY

ĐẬU TƢƠNG (Glycine max (L.) Merr.1917)

KHÓA LUẬN TỐT NGHIỆP

Chuyên ngành: Tin sinh học

HÀ NỘI, 2019

TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2

KHOA SINH – KTNN

----------

LÊ MINH TUẤN

PHÂN TÍCH VAI TRÒ CỦA GỐC METHIONINE

TRONG CẤU TRÚC NHÂN TỐ PHIÊN MÃ Ở CÂY

ĐẬU TƢƠNG (Glycine max (L.) Merr.1917)

KHÓA LUẬN TỐT NGHIỆP

Chuyên ngành: Tin sinh học

Ngƣời hƣớng dẫn khoa học

TS. Chu Đức Hà

HÀ NỘI, 2019

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của tôi đƣợc thực hiện dƣới

sự hƣớng dẫn của TS. Chu Đức Hà. Các nội dung nghiên cứu, kết quả trong

đề tài này là trung thực và chƣa từng đƣợc ai công bố dƣới bất kỳ hình thức

nào.

Khóa luận sử dụng thông tin, số liệu, hình ảnh từ các bài báo và nguồn

tài liệu của các tác giả khác đều đƣợc chú thích và trích dẫn đầy đủ.

Tôi xin chịu trách nhiệm hoàn toàn về nội dung của khóa luận.

Hà Nội, ngày tháng năm 2019

Sinh viên

Lê Minh Tuấn

LỜI CẢM ƠN

Lời đầu tiên tôi xin đƣợc gửi lời cảm ơn tới TS. Chu Đức Hà - Viện Di

truyền Nông nghiệp đã tận tình hƣớng dẫn và tạo mọi điều kiện thuận lợi,

giúp đỡ tôi trong suốt quá học tập, làm việc và hoàn thành khóa luận.

Xin gửi lời cảm ơn tới các cán bộ phòng Sinh học phân tử, Viện Di

truyền Nông nghiệp đã tạo mọi điều kiện thuận lợi và giúp đỡ tôi trong suốt

quá trình thực hiện khóa luận tại đây.

Tôi cũng xin gửi lời cảm ơn tới TS. La Việt Hồng, Khoa Sinh - Kỹ

thuật Nông nghiệp, trƣờng Đại học Sƣ phạm Hà Nội 2 đã tận tình giúp đỡ,

hƣớng dẫn và tạo điều kiện cho tôi đƣợc tham gia vào nhóm nghiêm cứu khoa

học từ rất sớm.

Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình và bạn bè đã giúp đỡ và

chia sẻ, động viên trong suốt quá trình học tập cũng nhƣ thực hiện khóa luận.

Hà Nội, ngày tháng năm 2019

Sinh viên

Lê Minh Tuấn

DANH MỤC BẢNG

Bảng 1. 1: Diện tích và sản lƣợng đậu tƣơng của 5 nƣớc dẫn đầu và toàn

thế giới (FAO, 2016) ........................................................................................ 8

Bảng 2. 1: Th ng tin về c c TF giàu Met đƣợc hai th c trong nghi n

cứu. .................................................................................................................. 15

Bảng 3. 1: Đặc tính của nhóm protein họ bHLH ở đậu tƣơng ................. 20

Bảng 3. 2: Đặc điểm protein nhóm bZIP ở cây đậu tƣơng ....................... 22

DANH MỤC HÌNH

Hình 1. 1: Đặc điểm Hình th i cây đậu tƣơng .............................................. 5

Hình 1. 2: Diện tích và sản lƣợng đậu tƣơng trong ni n vụ 2010 - 2016 . 10

Hình 2. 1: Giao diện trang web ExPASy protparam tool ......................... 16

Hình 2. 2: Cơ sở dữ liệu TargetP ................................................................. 16

Hình 3. 1: Tỉ lệ phân bố Methionine ngoài vùng bảo thủ c c họ TF ........ 27

Hình 3. 2: Sự biểu hiện của c c gene bHLH, bZIP, SRF của cây đậu

tƣơng trong c c m ở điều iện thƣờng .................................... 28

Hình 3. 3: Sự biểu hiện của c c gene bHLH, bZIP, SRF của cây đậu

tƣơng trong c c m ở điều iện mặn ........................................ 30

DANH MỤC VIẾT TẮT VÀ KÝ HIỆU

Ký hiệu Thuật ngữ Tiếng Anh Thuật ngữ Tiếng Việt

bHLH Basic Helix Loop Helix Basic Helix Loop Helix

bZIP Basic Leucine Zipper Basic Leucine Zipper

DNA Deoxyribonucleic acid Axít đêôxyribônuclêic

FAO Food and Agriclture Tổ chức lƣơng thực thế

organization giới

GRAVY Grand average of Độ ƣa nƣớc trung bình

hydropathicity

GEO Gene expression Cơ sở dữ liệu của dữ liệu

omnibus biểu hiện gen

Kilo dalton Kilô daltơn kDa

Instability Index Chỉ số bất ổn định II

Methionine Methionin Met

Myeloblastosis Myeloblastosis MYB

NAM/ATAF1/CUC2 NAM/ATAF1/CUC2 NAC

Isoelectric point Điểm đẳng điện pI

Ribonucleic Acid Axít Ribônuclêic RNA

Serum - Response Factor Yếu tố phiên mã đáp ứng SRF

serum

TF Transcription factor Nhân tố phiên mã

MỤC LỤC

MỞ ĐẦU ........................................................................................................... 1

1. Tính cấp thiết của đề tài ................................................................................ 1

2. Mục tiêu nghiên cứu của đề tài ..................................................................... 2

3. Nội dung nghiên cứu ..................................................................................... 2

4. Ý nghĩa khoa học và ý nghĩa thực tiễn .......................................................... 2

4.1. Ý nghĩa khoa học ........................................................................................ 2

4.2. Ý nghĩa thực tiễn ........................................................................................ 2

NỘI DUNG ....................................................................................................... 3

Chƣơng 1: TỔNG QUAN TÀI LIỆU ............................................................... 3

1.1. Tổng quan về cây đậu tƣơng ...................................................................... 3

1.1.1. Nguồn gốc và phân loại của cây đậu tương ........................................... 3

1.1.2. Đặc điểm sinh học của cây đậu tương .................................................... 4

1.1.2.1. Đặc điểm hình thái học của cây đậu tương ......................................... 4

1.1.2.2. Đặc điểm di truyền của cây đậu tương ................................................ 6

1.1.3. Vai trò của cây đậu tương ....................................................................... 6

1.1.4. Tình hình sản xuất đậu tương trên thế giới và Việt Nam ........................ 8

1.1.4.1. Tình hình sản xuất đậu tương trên thế giới.......................................... 8

1.1.4.2. Tình hình sản xuất đậu tương tại Việt Nam ......................................... 9

1.2. Tổng quan về các nhân tố phiên mã trong nghiên cứu ............................ 10

1.2.1. Nhân tố phiên mã bHLH (Basic Helix-Loop-Helix) ............................. 10

1.2.2. Nhân tố phiên mã bZIP (Basic Leucine Zipper) ................................... 11

1.2.3 Nhân tố phiên mã SRF (Serum-Response Factor) ................................. 11

1.3. Met và vai trò của Met trong đáp ứng điều kiện bất lợi ........................... 12

1.4. Lịch sử nghiên cứu ................................................................................... 13

1.4.1. Lịch sử nghiên cứu thế giới ................................................................... 13

1.4.2. Lịch sử nghiên cứu tại Việt Nam ........................................................... 14

Chƣơng 2: VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU ...................... 15

2.1.Vật liệu nghiên cứu ................................................................................... 15

2.2. Phƣơng pháp nghiên cứu .......................................................................... 15

2.2.1. Phương pháp phân tích đặc tính protein ở đậu tương .......................... 15

2.2.3. Phương pháp tính %Met ở ngoài vùng bảo thủ .................................... 16

2.2.4. Phương pháp xác định vị trí phân bố của protein trong tế bào ........... 16

2.2.5. Phương pháp phân tích mức độ biểu hiện của gen mã hóa trong điều

kiện thường và điều kiện mặn ......................................................................... 17

Chƣơng 3: KẾT QUẢ VÀ THẢO LUẬN ...................................................... 18

3.1. Phân tích đặc tính protein của ba nh m TF giàu Met ở đậu tƣơng.......... 18

3.1.1. Nhóm bHLH ở đậu tương ...................................................................... 18

3.1.2.Nhóm bZIP ở đậu tương ......................................................................... 22

3.1.3. Nhóm SRF ở đậu tương ......................................................................... 23

3.2. Phân tích mật độ phân bố Met ở ngoài vùng bảo thủ của các nhóm TF

giàu Met ở đậu tƣơng ...................................................................................... 26

3.3. Phân tích dữ liệu biểu hiện của gene mã h a TF giàu Met ở đậu tƣơng

trong các điều kiện .......................................................................................... 28

KẾT LUẬN VÀ KIẾN NGHỊ......................................................................... 32

1. Kết luận ..................................................................................................... 32

2. Đề xuất ...................................................................................................... 32

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ LIÊN QUAN ĐẾN LUẬN

VĂN ................................................................................................................ 33

TÀI LIỆU THAM KHẢO ............................................................................... 34

PHỤ LỤC

MỞ ĐẦU

1. Tính cấp thiết của đề tài

Cây đậu tƣơng (Glycine max) là một trong những đối tƣợng cây trồng

quan trọng trên thế giới. Đây là nguồn nguyên liệu quan trọng đối với các

ngành công nghiệp, đặc biệt là đối với sản xuất chế biến, sử dụng làm thức ăn

cho gia súc [6]. Tuy nhiên, tác động của biến đổi khí hậu diễn ra liên tục và

kéo dài đã ảnh hƣởng đến năng suất và sản lƣợng của đậu tƣơng [1]. Chính vì

vậy, các nghiên cứu về đậu tƣơng thƣờng hƣớng đến mục tiêu cải thiện tính

chống chịu bất lợi và nâng cao năng suất của giống nh m đáp ứng với biến

đổi khí hậu.

Trong genome của thực vật có khoảng 7% gene mã hóa cho các yếu tố

phiên mã (transcription factor, TF) [47], phần nhiều trong số đ đã đƣợc

chứng minh c đáp ứng với các bất lợi môi trƣờng [26]. Các TF là những

phân tử protein nhận biết trình tự đặc hiệu trên v ng promoter (yếu tố điều

h a cis- , từ đ điều h a sự biểu hiện của gene đích khi c tác động của điều

kiện bất lợi [26], vì vậy chúng tham gia vào đáp ứng các bất lợi môi trƣờng

[12,43]. Các họ TF lớn ở thực vật c thể đƣợc liệt kê nhƣ bZIP [51], NAC

[30], WRKY [50] và bHLH [20]. Trong nội dung kh a luận này, 3 họ TF lớn

ở thực vật gồm bHLH, bZIP và SRF đã đƣợc tập trung nghiên cứu.

Methionine (Met) là một gốc amino acid đ ng một vai trò vô cùng quan

trọng đối với đời sống của sinh giới [42]. Met là đơn vị cấu thành nên cấu trúc

của chuỗi protein, tham gia vào chu trình Yang, liên quan đến hàng loạt các

chu trình nội bào quan trọng nhƣ hình thành nên màng tế bào, tổng hợp diệp

lục và củng cố thành tế bào [9]. Tuy nhiên, cấu tạo mạch có chứa lƣu huỳnh

nên các gốc Met rất dễ bị ôxi h a, làm thay đổi cấu trúc hoặc dẫn đến thay đổi

hoặc mất chức năng của phân tử protein trong tế bào. Điều đáng chú ý nhất là

khoảng 68% phân tử bị ôxi hóa trong tế bào chính là protein [44], vì vậy đây

1

đƣợc xem là một đối tƣợng rất dễ bị tác động trong điều kiện bất lợi [27].

Xuất phát từ những lí do trên, chúng tôi đã thực hiện đề tài “Phân tích vai

trò của gốc methionine trong cấu trúc nhân tố phiên mã ở cây đậu tƣơng

(Glycine max (L.) Merr.1917)”.

2. Mục ti u nghi n cứu của đề tài

Mục đích của nghiên cứu này nh m làm r giả thuyết về vai tr bảo vệ

của các gốc Met trên các phân tử protein đ ng vai tr TF ở cây đậu tƣơng.

3. Nội dung nghi n cứu

 Phân tích đặc tính của 3 nh m TF giàu Met ở đậu tƣơng.

 Xác định mật độ phân bố Met ở ngoài vùng bảo thủ của 3 nhóm TF giàu

Met ở đậu tƣơng.

 Phân tích mức độ biểu hiện của các gene mã h a TF giàu ở đậu tƣơng trong

điều kiện thƣờng và điều kiện xử lí mặn.

4. Ý nghĩa hoa học và ý nghĩa thực tiễn

4.1. Ý nghĩa khoa học

 Nghiên cứu này nh m cung cấp những dẫn liệu quan trọng cho những

nghiên cứu tiếp theo nh m phân tích rõ vai trò của các gene mã hóa giàu

Met liên quan đến tính chống chịu bất lợi ở thực vật.

4.2. Ý nghĩa thực tiễn

 Kết quả của nghiên cứu này s cung cấp những gene ứng viên mã h a

bHLH, bZIP và SRF c đáp ứng với điều kiện ngoại cảnh bất lợi nh m

phục vụ công tác chọn tạo giống nh m nâng cao tính chống chịu ở cây đậu

tƣơng.

2

NỘI DUNG

Chƣơng 1

TỔNG QUAN TÀI LIỆU

1.1. Tổng quan về cây đậu tƣơng

1.1.1. Nguồn gốc và phân loại của cây đậu tương

Cây đậu tƣơng là một trong những cây trồng có lịch sử rất lâu đời và đ ng

vai trò quan trọng trong nền nông nghiệp cũng nhƣ công nghiệp của thế giới.

Theo những nghiên cứu gần đây các nhà khoa học đã chỉ ra r ng cây đậu

tƣơng c nguồn gốc từ châu Á và đƣợc trồng tại Trung Quốc vào khoảng

5000 năm trƣớc công nguyên [19]. Nghiên cứu khác của Hymowitz cho r ng

cây đậu tƣơng đã đƣợc thuần hóa và gieo trồng ở một phần phía đông và bắc

Trung Quốc vào thế kỉ XI trƣớc công nguyên, sau đ n đã đƣợc du nhập vào

Hàn Quốc, Nhật Bản và các nƣớc Đông Nam Á vào khoảng thế kỉ XI đến thế

kỉ XIII trƣớc công nguyên [18]. Sau chiến tranh thế giới thứ hai, cây đậu

tƣơng đƣợc trồng và phát triển mạnh ở Hoa Kỳ, Brazil và Canada. Theo sách

“Vân Đài loại ngữ” của Lê Quý Đôn, Việt Nam có lịch sử canh tác cây đậu

tƣơng vào khoảng thế kỉ thứ VI [4]. Trong một số ghi chép cho r ng cây đậu

tƣơng đã đƣợc canh tác ở nƣớc ta vào thời vua H ng trƣớc cả cây đậu xanh và

đậu đen [2]. Đậu tƣơng đƣợc trồng chủ yếu để lấy hạt, là loại cây thực phẩm

quan trọng sau lúa mì, lúa nƣớc và ngô. Ở Châu Mỹ là nơi c diện tích canh

tác đậu tƣơng lớn nhất lên tới 70% và tiếp ngay sau đ là Châu Á. Theo số

liệu năm 1993 Việt Nam đã hình thành 6 vùng sản xuất đậu tƣơng trọng điểm

trên cả nƣớc với diện tích lớn bao gồm: v ng Đông Nam Bộ (26,2%), miền

núi Bắc Bộ (24,7% , đồng b ng sông Cửu Long (12,4% , đồng b ng sông

Hồng (17,5%), hai vùng còn lại là đồng b ng ven biển miền Trung và Tây

Nguyên với diện tích canh tác thấp hơn [2].

Đậu tƣơng hay một số nơi c n gọi là đỗ tƣơng, đậu nành hoặc hoàng đậu

miêu thuộc bộ Phaseoleae, họ đậu Fabaceae, họ phụ cánh bƣớm

3

Papilionoideae, chi Glycine với tên khoa học là Glycine max. Dựa vào các

đặc điểm về hình thái, sự phân bố địa lý và số lƣợng nhiễm sắc thể do

Hymowit và Newell (1984) xây dựng thì ngoài chi Glycine còn có thêm chi

phụ Soja. Chi Glycine đƣợc chia ra thành 7 loài hoang dại lâu năm, chi phụ

Soja đƣợc chia ra làm 2 loài: loài đậu tƣơng trồng Glycine (L.) Merr và loài

hoang dại hàng năm G.Soja Sieb và Zucc. [6].

1.1.2. Đặc điểm sinh học của cây đậu tương

1.1.2.1. Đặc điểm hình thái học của cây đậu tương

Đậu tƣơng là cây hai lá mầm, thân thảo. Thân cây có hình tròn, trên thân

có nhiều lông nhỏ, màu trắng. Thân cây lúc còn non có màu xanh hoặc màu

tím, khi về già chuyển sang màu nâu nhạt. Màu sắc của thân non có thể cho ta

biết màu sắc của hoa sau này, nếu thân lúc còn non màu xanh thì hoa màu

trắng và nếu khi c n non thân c màu tím thì hoa c màu tím đỏ. Thân cây

đậu tƣơng thƣờng có chiều cao từ 0,3 - 1m tùy theo từng giống [6].

Cây đậu tƣơng c lá kép, mọc so le, gồm 3 lá chét có dạng hình bầu dục

hoặc hình trái xoan. Gốc lá tr n, đầu nhọn, dài từ 3 - 12cm, rộng từ 2 - 8cm.

Lá chét bên lệch, hai mặt có lông bao phủ, gân chính có 3 cuống chung dài từ

7 - 10cm, có lông bao phủ (Hình 1.1) [5]. Lá đa dạng về hình dạng phụ thuộc

vào giống, những giống có lá dài và nhỏ chịu hạn tốt nhƣng thƣờng cho năng

suất kém, những giống lá to thì thƣờng cho năng suất cao hơn nhƣng tính

chống chịu kém hơn. Số lƣợng lá nhiều, to và khỏe nhất vào thời kì đang ra

hoa rộ. Khi phiến lá phát triển to, rộng, mỏng phẳng và lá c màu xanh tƣơi

chứng tỏ cây đang sinh trƣởng khỏe và có khả năng cho năng suất cao [6].

Hoa thƣờng nhỏ, có màu tím hoặc màu trắng, hình chuông, phủ lông mềm.

Tràng hoa có cánh cờ mở rộng, không có tai, nhị một bó, bầu có lông (Hình

1.1)[5]. Hoa thƣờng mọc thành từng chùm, mỗi chùm có từ 3 - 5 hoa. Hoa

đậu tƣơng là hoa lƣỡng tính nên đây là cây tự thụ phấn, tỷ lệ giao phấn rất

thấp chỉ chiếm khoảng 0,5 - 1% [6].

4

Quả đậu tƣơng thẳng hoặc hơi cong, dài từ 2 - 7cm. Mỗi quả thƣờng có từ

2 - 3 hạt. Lúc quả còn non quả có màu xan, khi quả chín có màu nâu. Hạt có

hình tròn, hình bầu dục. Những giống có hạt màu vàng thƣơng c giá trị

thƣơng phẩm cao. Trong hạt, phôi thƣờng chiếm 2%, hai lá tử điệp chiếm

90% và 8% còn lại là vỏ hạt trên tổng khối lƣợng của hạt. Hình dạng và màu

sắc của rốn hạt đặc trƣng cho mỗi giống (Hình 1.1)[6].

Bộ rễ của đậu tƣơng gồm rễ chính và rễ phụ. Trên rễ có rất nhiều nốt sần,

đ là kết quả của sự cộng sinh giữa vi khuẩn Rhizobium jabonicum với rễ. Nốt

sần có thể dài tới 1cm, đƣờng kính từ 5 - 6mm, khi mới hình thành nó có màu

trắng sữa, khi phát triển tốt nhất nốt sần có màu hồng. Nốt sần tập trung nhiều

nhất ở tầng đất c độ sâu từ 0 - 20cm, có vai trò quan trọng trong việc cố định

từ nitơ trong không khí với lƣợng đạm cung cấp cho cây khoảng 30 - 60kg/ha

(Hình 1.1) [6].

Hình 1.1: Đặc điểm Hình thái cây đậu tƣơng

(Nguồn tài liệu tham khảo: https://www.croplan.com)

A: Hoa đậu tƣơng; B: Quả đậu tƣơng; C: Lá cây đậu tƣơng; D: Rễ cây đậu tƣơng.

5

1.1.2.2. Đặc điểm di truyền của cây đậu tương

Đậu tƣơng thuộc chi Glycine có tổ tiên là loài hoang dại Glycine soja.

Glycine là chi duy nhất trong bộ Phaseoleae mà các loài của nó có số nhiễm

sắc thể nhị bội 2n = 40 và 80 không phải là 20 [2]. Trong nghiên cứu của

Lackey số nhiễm sắc thể của Glycine có thể bắt nguồn từ loài nhị bội với số

nhiễm sắc thể gốc x = 11 trải qua quá trình đa bội lệch khuyết có gốc x = 10

và đa bội thể đã cho bộ nhiễm sắc thể lên đến 40 và 80 [29]. Theo Gurley, đậu

tƣơng là dạng tứ bội bền vững của bộ nhiễm nhị bội [15].

Cây đậu tƣơng có bộ nhiễm sắc thể lƣỡng bội 2n = 40 với kích thƣớc vào

khoảng 1115Mb bao gồm 1,115 triệu cặp bazơ trên mỗi nhiễm sắc thể đơn bội

[8]. Trong toàn bộ genome có khoảng 40 - 60% trình tự gen lặp lại [15,16].

Đậu tƣơng c bộ nhiễm sắc thể 2n = 40 với tỷ lệ G/C trung bình là 34,8%, số

lƣợng protein trung bình là 89 597 và số lƣợng gen trung bình là 56 680

(www.ncbi.nlm.nih.gov/genome/5).

1.1.3. Vai trò của cây đậu tương

Đậu tƣơng là cây trồng ngắn ngày đem lại giá trị kinh tế cao và có tác

dụng về nhiều mặt nhƣ: làm thực phẩm, thức ăn chăn nuôi, nguyên liệu trong

nhiều ngành công nghiệp, cải tạo đất. Vì thế cây đậu tƣơng đƣợc mệnh danh

là “ Ông hoàng trong các loại cây họ đậu” [6].

Đậu tƣơng đƣợc biết tới là một loại ngũ cốc c hàm lƣợng dinh dƣỡng rất

cao nhất là hàm lƣợng protein trung bình khoảng 35,5 - 40%. So với hàm

lƣợng protein trong gạo (6,2 - 12%), ngô (9,8 - 13,2%) hay các loại thịt nhƣ

thịt bò (21%), thịt gà (20%), cá (17 - 20% thì hàm lƣợng protein trong đậu

tƣơng ở mức cao, lipit khoảng 15 - 20%, carbohydrate khoảng 15 - 16% và

một số các khoáng chất khác cần cho sự sống [3]. Protein trong đậu tƣơng

đƣợc coi là loại protein thực vật có phẩm chất tốt, dễ tiêu h a hơn protein

trong thịt và đặc biệt là không có các thành phần tạo cholesterol. Hàm lƣợng

lipid trong đậu tƣơng cũng rất cao, chứa khoảng 60 - 70% các acid béo không

6

no rất tốt cho sức khỏe. Bên cạnh đ , trong hạt đậu tƣơng c chứa rất nhiều

các vitamin và khoáng chất nhƣ vitamin B1, vitamin B2, vitamin C, Ca, Fe, P

[6].

Ngoài đƣợc sử dụng để chế biến thành các loại thực phẩm cho con ngƣời,

đậu tƣơng c n đƣợc sử dụng làm thức ăn cho gia súc. Khoảng 1kg hạt đậu

tƣơng khô tƣơng đƣơng với 1,38 đơn vị thức ăn chăn nuôi. Toàn bộ cây đậu

tƣơng c chứa hàm lƣợng đạm khá cao có thể sử dụng làm thức ăn cho gia

súc hoặc nghiền khô để chế biến thức ăn tổng hợp rất tốt. Sản phẩm phụ công

nghiệp nhƣ khô dầu có thành phần dinh dƣỡng khá cao: N:

6,2%, P2O5: 0,7%, K2O: 2,4% có thế làm thức ăn bổ sung cho gia súc rất tốt

[2].

Hiện nay, những nguồn năng lƣợng hóa thạch nhƣ than đá, dầu mỏ có trữ

lƣợng ngày càng giảm kèm theo là hiện tƣợng biến đổi khí hậu và các vấn đề

môi trƣờng nên nhiên liệu sinh học là giải pháp thay thế tốt nhất. Biodiesel là

nhiên liệu sạch và tái tạo đƣợc coi là sự thay thế tốt nhất cho nhiên liệu diesel.

Trong đ dầu đƣợc chiết xuất từ hạt đậu tƣơng đƣợc coi là nguồn nguyên liệu

chính để sản xuất dầu diezel sinh học. Ngoài là nguyên liệu sản xuất dầu

diezel sinh học, dầu đậu tƣơng c thể sử dụng để sản xuất một dạng nhiên liệu

sinh học khác là bioethanol. Vỏ đậu tƣơng chứa lƣợng lớn carbohydrate sử

dụng để tạo ra bioethanol và có thể làm thức ăn cho động vật vì có chứa hàm

lƣợng protein cao. Kết quả kiểm tra khí thải động cơ cho thấy r ng chỉ sử

dụng dầu diesel sinh học đã tạo ra khí thải CO, HC, NOx và kh i ít hơn so với

petro-diesel [25].

Toàn bộ cây đậu tƣơng (thân, lá, quả, hạt) cả khi tƣơi và khô đều có thể

làm thức ăn cho gia súc. Đặc biệt cây đậu tƣơng c vai tr quan trọng trong

việc cải tạo đất do trên rễ có rất nhiều nốt sần (là kết quả của sự cộng sinh

giữa vi khuẩn Rhizobium jabonicum với rễ) c năng cố định đạm. Vậy cứ

trồng khoảng 1 ha đậu tƣơng sinh trƣởng tốt s tạo ra khoảng 30 - 60 kg nitơ

7

trong đất. Đối với thân và lá đậu tƣơng c chứa lƣợng lớn nitơ nên sau khi thu

hoạch có thể sử dụng nhƣ phân hữu cơ để b n cho đất hoặc các cây trồng

khác. Việc luân canh cây đậu tƣơng với một loại cây trồng khác đƣợc xem là

biện pháp cải tạo đất trồng rất tốt [6].

1.1.4. Tình hình sản xuất đậu tương trên thế giới và Việt Nam

1.1.4.1. Tình hình sản xuất đậu tương trên thế giới

Đậu tƣơng là cây trồng có giá trị kinh tế và dinh dƣỡng cao, đƣợc xem là

một trong những loại cây thực phẩm quan trọng bậc nhất thế giới sau cây lúa

mì, lúa nƣớc và ngô. Do có khả năng thích ứng rộng với các điều kiện khí hậu

khác nhau nên đậu tƣơng đƣợc canh trồng rộng rãi trên toàn thế giới, nhƣng

tập trung chủ yếu ở tại Hoa Kỳ, tiếp đến là Châu Á. Theo số liệu từ bảng 1.1

cho thấy tổng diện tích canh tác đậu tƣơng trên toàn thế giới khoảng 121,5

triệu ha, trong đ : Hoa Kỳ là 33,5 triệu ha (28% , Brazil đạt 33,2 triệu ha

(27,2%), Argentina là 19,5 triệu ha (16%), Ấn Độ là 11,5 triệu ha (9%) và

Trung Quốc là 6,6 triệu ha (5,5%). Số liệu từ bảng 1.1 cho thấy tổng sản

lƣợng của thế giới là 334,9 triệu tấn tăng khoảng 11,7 triệu tấn so với năm

2015. Tổng sản lƣợng thu hoạch của Hoa Kỳ năm 2016 khoảng hơn 117,2

triệu tấn chiếm gần 35% sản lƣợng của thế giới (FAO, 2016).

Bảng 1. 1: Diện tích và sản lƣợng đậu tƣơng của 5 nƣớc dẫn đầu và toàn thế

giới (FAO, 2016)

T n quốc gia Diện tích canh t c Sản lƣợng thu hoạch

(triệu ha) (triệu tấn)

33,5 117,2 Hoa Kỳ

33,2 96,3 Brazil

19,5 58,8 Argentina

11,5 14 Ấn Độ

6,6 11,9 Trung Quốc

121,5 334,9 Thế giới

8

1.1.4.2. Tình hình sản xuất đậu tương tại Việt Nam

Việt Nam là một đất nƣớc có nền nông nghiệp rất lâu đời, bên cạnh các

cây lƣơng thực nhƣ lúa, ngô và một số cây công nghiệp khác thì đậu tƣơng

cũng đ ng vai tr quan trọng đối với đối với đời sống của ngƣời dân Việt

Nam. Cả nƣớc có 28 tỉnh thành canh tác đậu tƣơng trong đ 70% là ở miền

Bắc và 30% ở các tỉnh phía Nam [6].

Theo số liệu chính thức của FAO thì diện tích và sản lƣợng trồng đậu

tƣơng ở nƣớc ta thì từ năm 2010 trở về các năm trƣớc thì phát triển rất mạnh

cả về diện tích gieo trồng cũng nhƣ là năng suất thu hoạch. Tuy nhiên với

những phƣơng thức canh tác truyền thống, bộ giống năng suất thấp, sản xuất

nhỏ lẻ, giá thành cao, lãi suất thấp, giá thành đậu tƣơng trong nƣớc không có

khả năng cạnh tranh với đậu tƣơng nhập khẩu cộng thêm sự bất lợi về điều

kiện khí hậu trong một vài năm gần đây là nguyên nhân dẫn đến việc nông

dân không còn mặn mà với cây đậu tƣơng đã dẫn đến diện tích và sản lƣợng

đậu tƣơng giảm mạnh trong 6 năm gần đây. Quan sát biểu đồ hình 1.2 có thể

thấy năm 2012 sản lƣợng đậu tƣơng nƣớc ta đã giảm 34,3% so với cùng kỳ

năm trƣớc xuống còn khoảng 175,2 nghìn tấn do điều kiện khí hậu bất lợi.

Diện tích trông đậu tƣơng năm 2016 ở nƣớc ta giảm mạnh chỉ b ng khoảng

50% diện tích của năm 2010 là 99,6 nghìn ha và sản lƣợng đạt ở mức 161

nghìn tấn giảm gần 138 nghìn tấn so với cùng kỳ năm 2010 (FAO, 2016).

9

Hình 1.2: Diện tích và sản lƣợng đậu tƣơng trong niên vụ 2010 - 2016

( FAO, 2010-2016)

1.2. Tổng quan về c c nhân tố phi n mã trong nghi n cứu

TF là một protein gắn đặc hiệu với trình tự DNA trong v ng điều khiển và

tham gia điều khiển quá trình phiên mã của gene [10][31]. Trong nghiên cứu

này, chúng tôi s tiến hành phân tích 3 nhóm TF phổ biến nhất ở thực vật là

bHLH, bZIP và SRF.

1.2.1. Nhân tố phiên mã bHLH (Basic Helix-Loop-Helix)

TF basic/helix-loop-helix (bHLH) và nhân tố tƣơng đồngcủa chúng đã tạo

thành một họ lớn trong genome của cả thực vật và động vật [36]. Từ khi tìm

ra TF bHLH có khả năng liên kết với DNA và khả năng nhị trùng hóa [36]

các thành viên trong siêu họ protein bHLH ngày càng phát hiện thêm nhiều

chức năng quan trọng trong quá trình sinh lí và sinh trƣởng ở động vật ở mức

độ thấp hơn so với thực vật [35][40]. bHLH chứa khoảng 60 acid amin với

hai vùng chức năng đ là v ng cơ bản (basic) và vùng chức năng (helix-loop-

helix . V ng cơ bản n m ở đầu amin (N-terminal) của miền bHLH và có chức

năng nhƣ một dạng gắn kết DNA, bao gồm khoảng 15 amino acid thƣờng

10

gồm sáu dƣ lƣợng cơ bản. Vùng HLH gồm hai phân tử α-helices phân cực với

một sự liên kết vòng lặp với chiều dài biến thiên. Các α-helices lƣỡng cực của

hai protein bHLH có thể tƣơng tác và hình thành hai cấu phần giống nhau

(homodimer) hoặc hai cấu phần khác nhau (heterodimer) [13][36][38]. Trong

các nghiên cứu gần đây đã cho thấy một số protein bHLH ở thực vật có khả

năng tƣơng tác với các protein bị thiếu đi một miền bHLH, đặc biệt là đối với

các phức hợp protein với protein MYB (Myeloblastosis), bHLH và WD40

đƣợc đƣa ra để bảo vệ tế bào và rễ tơ khác nhau [39].

1.2.2. Nhân tố phiên mã bZIP (Basic Leucine Zipper)

Protein bZIP (basic leucine zipper) là một họ lớn có khả năng điều chỉnh

quá trình phiên mã [46], đặc biệt là đối với thực vật nói chung và sinh vật

nhân thực n i riêng. Các protein bZIP thƣờng gồm một miền bZIP có hai

vùng là: vùng basic và vùng nhị trùng hóa. Vùng basic liên kết với DNA và

vùng nhị trùng hóa có dạng homo giống nhƣ các dị thể. Ở tại v ng cơ bản có

vùng tín hiệu bên trong dựa trên một dạng N-x7-R/K không đổi để liên kết

với DNA. Ngoài ra, sự lặp lại của một đoạn leucine tại vị trí chín amino acid

n m dọc theo v ng đầu cacboxyl (C-terminus) đã tạo ra một phân tử helix

phân cực. Các yếu tố phiên mã bZIP ở thực vật thì liên kết chặt ch với chuỗi

DNA của -ACGT- nhƣ G-box (-CACGTG-), C-box (-GACGTC-), A-box (-

TACGTA-) [23].

Các TF bZIP thƣờng phổ biến nhất ở thực vật nh m điều chỉnh các hiện

tƣợng nhƣ: nảy mầm, quang hóa, hình thành hoa, phát triển hoa và cũng c

vai trò quan trọng đối với cây trồng trong việc báo hiệu bất lợi và hormone.

Các protein bZIP ở thực vật đã đƣợc nghiên cứu rộng rãi và các chức năng

của chúng phức tạp hơn đối với các TF khác [49].

1.2.3 Nhân tố phiên mã SRF (Serum-Response Factor)

Họ TF SRF gồm khoảng 56 amino acid và đƣợc tìm thấy trong vùng liên

kết DNA của phần đông các TF ở sinh vật nhân thực. Vùng ở đầu amin (N-

11

terminal) của MADS-box gồm chủ yếu là đuôi kỵ nƣớc với tỷ lệ base cao

trong khi vùng ở đầu cacboxyl (C-terminal) chủ yếu là đuôi kỵ nƣớc. Ở phần

lớn các MADS-box, MADS-box n m ở phần cuối vùng N-terminal. Tuy

nhiên trong một số protein khác thì MADS-box n m ở gần vùng trung tâm

hoặc n m ở phía cuối vùng ở đầu cacboxyl (C-terminal). Trong trƣờng hợp

của SRF sự có mặt của một N-terminal mở rộng đến MADS-box có ảnh

hƣởng lớn đến tính đặc hiệu của liên kết DNA [45].

1.3. Met và vai trò của Met trong đ p ứng điều iện bất lợi

Methionine (Met) là một gốc amino acid có vai trò vô cùng quan trọng đối

với đời sống của sinh giới. Về cấu trúc, phân tử Met có chứa một gốc lƣu

huỳnh. Met là một phân tử kỵ nƣớc, hầu hết dƣ lƣợng Met trong protein có

hình cầu và đƣợc tìm thấy bên trong lõi kỵ nƣớc. Ở khoảng gian màng tế bào

thì Met thƣờng đƣợc tìm thấy trong trạng thái tƣơng tác với lớp lipit kép. Đối

với một số protein thì một phần dƣ lƣợng Met s đƣợc phân bố trên bề mặt.

Dƣ lƣợng Met dễ bị ôxi hóa thành methionine sulfoxide. Theo Levine cho

r ng dƣ lƣợng Met giống nhƣ là những chất chống ôxi hóa nội sinh trong

protein [32].

Vai trò của Met thƣờng đƣợc biết đến là chất chống ôxi hóa, chất xúc tác,

cấu trúc nên protein, có khả năng ôxi hóa-khử và điều chỉnh phù hợp. Trong

nghiên cứu gần đây của Vally đã xác định đƣợc r ng dƣ lƣợng Met trong

protein thƣờng đƣợc định vị để hình thành nên các liên kết kỵ nƣớc giữa các

nguyên tử lƣu huỳnh với các v ng thơm, bao gồm tryptophan, phenylalanine

và tyrosine [48]. Những liên kết kỵ nƣớc giữa lƣu huỳnh với v ng thơm rất

phổ biến và đ ng g p vào sự ổn định của cấu trúc protein với năng lƣợng liên

kết từ 1,0-1,5 kcal/mol. Những amino acid chứa v ng thơm là một trong

những chất dễ bị ôxi hóa nhất bởi các phản ứng, để tƣơng tác với Met thì cần

thiết lập vị trí tối ƣu để bảo vệ protein chống lại sự ôxi hóa. Quá trình chuyển

đổi Met thành MetO (methionine sulfoxide) s loại bỏ liên kết kỵ nƣớc và có

12

khả năng ảnh hƣởng đến cấu trúc không gian của phân tử protein (Kim et al.

,2014). Rinalducci đã chỉ ra r ng khoảng 68% phân tử bị ôxi hóa trong tế bào

là chính là protein [44], vì vậy đây đƣợc coi là một đối tƣợng rất dễ bị tác

động bởi các điều kiện bất lợi.

1.4. Lịch sử nghi n cứu

1.4.1. Lịch sử nghiên cứu thế giới

Trên thế giới tính đến nay đã c rất nhiều công trình nghiên cứu về vai trò

của các họ TF trong đáp ứng các điều kiện bất lợi trên đối tƣợng thực vật. Cụ

thể, 319 gene thuộc họ bHLH đã đƣợc xác định ở đậu tƣơng [20]. Đáng chú ý,

47% số gene đƣợc biểu hiện ở mô rễ, lá và các mô hạt, trong khi các gene còn

lại đƣợc biểu hiện mạnh ở mô cụ thể (một hoặc nhiều loại mô) [20]. Đối với

họ bZIP, đã tìm và xác định đƣợc 160 gene chia thành 12 phân họ và phân bố

đều trên 20 nhiễm sắc thể của đậu tƣơng [51]. Phân tích mức độ biểu hiện của

các gene mã h a họ bZIP ở đậu tƣơng đã chỉ ra r ng có 83,44% biểu hiện

mạnh ở các mô và 75,6% c mức độ phiên mã đáp ứng với xử lí hạn [51].

Tuy nhiên, chƣa c nhiều nghiên cứu đã ghi nhận về các gene mã h a họ TF

SRF ở thực vật.

Trong genome của cây đậu tƣơng, đã xác định đƣợc 152 thành viên của

họ NAC TF với 58 gene đáp ứng các điều kiện bất lợi [30]. Một nghiên cứu

khác đã xác định đƣợc 21 gene GmNFYA, 32 GmNF-YB và 15 gene GmNF-

YC trong genome đậu tƣơng c vai tr trong đáp ứng hạn [39]. Đối với TF

WRKY là một họ lớn tham gia vào quá trình sinh lí và đặc biệt là quá trình

đáp ứng điều kiện bất lợi của môi trƣờng. Trong nghiên cứu này, họ đã xác

định đƣợc 188 gene WRKY, chia thành 3 nhóm chính (I,II,III) [50]. Tuy

nhiên, chƣa c nghiên cứu nào ghi nhận về vai tr của các amino acid c thể

liên quan đến đáp ứng bất lợi ở các nh m TF ở thực vật.

13

1.4.2. Lịch sử nghiên cứu tại Việt Nam

Gần đây, 121 và 213 gene mã h a protein giàu Met đã đƣợc xác định một

cách c hệ thống trên cây mô hình Arabidopsis và đậu tƣơng [21]. Trong đ ,

phần lớn các gene đều tham gia vào những quá trình sinh học quan trọng diễn ra trong tế bào nhƣ phiên mã RNA, protein sửa đổi và tín hiệu Ca2+ [21]. Nhƣ

đã trình bày, Met là một amino acid rất dễ bị ôxi h a dƣới tác động của bất lợi

ngoại cảnh [27]. Chính vì vậy, câu hỏi đƣợc đặt ra là liệu r ng các phân tử

protein giàu Met này tham gia vào quá trình đáp ứng bất lợi ra sao Cụ thể

hơn, các gốc Met liệu c thể bảo vệ phân tử protein khi bị bất lợi tấn công hay

không?

14

Chƣơng 2

VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU

2.1.Vật liệu nghi n cứu

Trình tự protein và mã định danh của 21 TF giàu Met, bao gồm 11 TF

nh m bHLH, 3 TF nh m bZIP và 7 TF nh m SRF đƣợc khai thác từ nghiên

cứu trƣớc đây [21] (Bảng 2.1)..

Bảng 2. 1: Thông tin về các TF giàu Met đƣợc khai thác trong nghiên cứu.

TT Mã định danh

TF TT Mã định danh TF TT Mã định danh TF

01 Glyma01g15930

08 Glyma10g04890

15 Glyma10g40080

02 Glyma02g00980

09 Glyma11g17120

16 Glyma11g26260

03 Glyma03g04000

10 Glyma13g19250

17 Glyma11g30490

04 Glyma03g32740

11 Glyma20g22280

18 Glyma11g30620

H L H b

05 Glyma04g04190

12 Glyma02g01600

19 Glyma18g05930

06 Glyma05g19920

13 Glyma05g28960

20 Glyma18g05960

07 Glyma06g04380

14 Glyma08g12170

21 Glyma20g27320

H L H b

F R S

P I Z b

2.2. Phƣơng ph p nghi n cứu

2.2.1. Phương pháp phân tích đặc tính protein ở đậu tương

 Lấy trình tự của chuỗi protein cần từ cơ sở dữ liệu SOYBASE

(https://soybase.org dƣới định dạng FASTA.

 Một số đặc tính, bao gồm số lƣợng amino acid (L), trọng lƣợng phân tử

(molecular weight, mW , điểm đẳng điện (isoelectric point, pI), chỉ số bất ổn

định (Instability index), chỉ số béo (Aliphatic index), độ ƣa nƣớc (grand

average of hydropathicity, GRAVY đƣợc xác định b ng cách đƣa trình tự

amino acid của các protein thuộc 3 họ TF là bHLH, bZIP và SRF vào công cụ

Expasy [17].

15

Hình 2.1: Giao diện trang web ExPASy protparam tool

2.2.2. Phương pháp xây dựng cây phát sinh

Cây phân loại đƣợc xây dựng b ng phần mềm MEGA 7.0 dựa trên

thuật toán Neighbor-Joining [28].

2.2.3. Phương pháp tính %Met ở ngoài vùng bảo thủ

Các nh m TF đƣợc kiểm tra v ng bảo thủ b ng phần mềm MEGA (v. 7.0) [28]. Trình tự ngoại biên từ đầu 3 và 5 đến vị trí tiếp giáp v ng bảo thủ đƣợc tách biệt để xác định sự phân bố các gốc Met b ng công cụ BioEDIT [22]. 2.2.4. Phương pháp xác định vị trí phân bố của protein trong tế bào

Hình 2.2: Cơ sở dữ liệu TargetP

16

Vị trí cƣ trú của protein trong tế bào đƣợc dự đoán b ng cách đƣa trình tự mã

hóa DNA (ở định dạng FASTA) của 21 gene thành viên của 3 họ gene bHLH,

bZIP, SRF truy vấn vào chƣơng trình TargetP v1.1

(http://www.cbs.dtu.dk/services/TargetP/) [14].

2.2.5. Phương pháp phân tích mức độ biểu hiện của gen mã hóa trong điều

kiện thường và điều kiện mặn

Sự biểu hiện của các gene ở điều kiện thƣờng đƣợc phân tích thông qua

kết quả RNA-seq (giải trình tự tổng hợp ARN thông tin) của cây đậu tƣơng

trong nghiên cứu của Libault [42].

Nghiên cứu này, chúng tôi sử dụng dữ liệu từ cơ sở dữ liệu CEO của

NCBI với số hiệu GSE57252 [11] để phân tích sự biểu hiện của các gene mã

hóa thuộc các họ TF bHLH, bZIP, SRF trong điều kiện mặn qua kết quả

RNA-seq. Những hạt giống của G. max cv. Williams 82 đã nảy mầm trên

giấy ẩm và chờ chúng phát triển đến giai đoạn v1 (giai đoạn có 3 lá kép đầu tiên trong buồng sinh trƣởng duy trì ở 770F (250C) và độ ẩm 60% trong

suốt thí nghiệm. Nhiệt độ và độ ẩm liên tục đƣợc theo d i và duy trì trong

buồng tăng trƣởng. Việc xử lý muối đƣợc áp dụng b ng cách chuyển cây con

vào dung dịch NaCl 100 mM. Mô rễ s đƣợc thu sau 0, 1, 6 và 12 giờ điều trị

căng thẳng. Sử dụng 5 cây cho mỗi lần tại một thời điểm điều trị căng thẳng.

Sau khi thu mẫu mô rễ từ cây trong điều kiện mặn s tiến hành tinh sạch RNA

và giải trình tự, xử lí số dữ liệu và phân tích biển hiện của gene [11].

17

Chƣơng 3

KẾT QUẢ VÀ THẢO LUẬN

3.1. Phân tích đặc tính protein của ba nhóm TF giàu Met ở đậu tƣơng

3.1.1. Nhóm bHLH ở đậu tương

Trình tự protein và mã định danh của 21 TF giàu Met, bao gồm 11 TF

nh m bHLH, 3 TF nh m bZIP và 7 TF nh m SRF đƣợc khai thác từ nghiên

cứu trƣớc đây của Chu Đức Hà [21]. Một số đặc tính cơ bản của các họ TF

trong nghiên cứu đƣợc khai thác và tìm kiếm b ng cách tiến hành truy vấn

trình tự protein b ng các công cụ tin sinh học. Đặc tính của phân tử protein,

bao gồm kích thƣớc phân tử, trọng lƣợng phân tử, điểm đẳng điện, chỉ số bất

ổn định, chỉ số béo và độ ƣa nƣớc trung bình đƣợc xác định thông qua công

cụ Expasy [17]. Công cụ Expasy là cơ sở dữ liệu về hệ thống nghiên cứu phân

tích cấu trúc phiên mã [17]. Chính vì vậy, đây là cơ sở dữ liệu đƣợc hầu hết

nhà khoa học trên thế giới sử dụng để thu thập và khai thác các thông tin cơ

bản của phân tử protein, trong đ c kích thƣớc phân tử, trọng lƣợng phân tử,

điểm đẳng điện, chỉ số bất ổn định, chỉ số béo và độ ƣa nƣớc trung bình của

phân tử protein. Ngoài ra chúng tôi sử dụng công cụ TargetP để xác định vị trí

của các phân tử protein trong tế bào.

Từ kết quả thu đƣợc ở bảng 3.1 có thể thấy, kích thƣớc và trọng lƣợng của

các protein thuộc họ TF bHLH rất đa dạng, dao động trong khoảng từ 259 đến

491 amino acid. Trung bình kích thƣớc của các protin thuộc họ TF bHLH đạt

khoảng 380 amino acid. Chuỗi protein ngắn nhất là Glyma06g04380 đạt 258

amino acid, trong khi đ chuỗi dài nhất là Glyma10g04890 đƣợc cấu tạo từ

481 amino acid. Trọng lƣợng của protein tỷ lệ thuận với kích thƣớc, dao động

trong khoảng từ 29,2 (Glyma02g00980 đến 54,3 kDa (Glyma10g04890).

Khối lƣợng trung bình khoảng 42,4kDa. Với kích thƣớc và trọng lƣợng phân

tử khá cao dẫn đến các protein họ bHLH c độ linh hoạt thấp.

18

Mặt khác, giá trị điểm đẳng điện của các phân tử protein cũng đƣợc chứng

minh là có liên quan tới vị trí và chức năng của các protein trong tế bào [24].

Phân tích ba vị trí dƣới tế bào của các protein đ trong thấy r ng trong

plasmtid và proteome ty thể của thực vật c dƣ thừa một lƣợng protein có tính

acid. Tế bào chất và các proteome màng gồm có cả protein có tính acid và

protein basic, proteome nhân có tỷ lệ tƣơng đối của các protein có tính acid và

protein basic. Các protein có tính acid mạnh nhất không chỉ có ở tế bào chất

mà còn có trong các không bào, lysosome và nhiều protein acid tạo thành

khung tế bào [24]. Nhìn chung các protein c tính acid thƣờng đƣợc phân bố

ở tế bào chất, trong ty thể và một số bào quan c màng thƣờng chứa protein

c tính base. Kết quả cho thấy, các phân tử protein thuộc họ TF bHLH có giá

trị pI trong khoảng từ 5,84 (Glyma10g04890 đến 9,26 (Glyma02g00980).

Các protein n m trong khoảng từ 5,84 đến 6,84 bao gồm glyma10g04890,

glyma20g22280, glyma13g19250, glyma06g04380, glyma04g04190 là những

protein có tính acid. Chúng s đƣợc vận chuyển ra tế bào chất ngay sau khi

đƣợc tổng hợp trong nhân. Có 6 protein còn lại n m trong khoảng pI từ 7,2

đến 9,26 là những protein có tính base gồm glyma03g32740, glyma11g17120,

glyma01g15930, glyma05g19920, glyma03g04000, glyma02g00980. Chúng

có thể đƣợc bám trên ty thể hoặc các hệ thống có màng khác.

19

Bảng 3.1: Đặc tính của nhóm protein họ bHLH ở đậu tƣơng

STT Tên Protein %Met L(aa) mW (kDa) pI II Chỉ số béo GRAVY Vị trí

8,88 47,61 55,15 -0,549 Glyma01g15930 6,75 458 49,2 1

9,26 39,46 88,49 -0,098 C S Glyma02g00980 6,15 259 29,2 2

9,14 51,91 55,21 -0,695 _ Glyma03g04000 7,54 397 44,2 3

7,2 63,57 60,29 -0,511 M Glyma03g32740 6,22 481 52,6 4

6,84 68,89 57,31 -0,781 Glyma04g04190 7,17 264 30,2 5

8,63 46,28 51,63 -0,576 Glyma11g17120 7,73 465 49,9 6

6,03 65,52 49,1 -0,82 _ C M Glyma13g19250 6,29 476 52,6 7

5,92 62,84 51,6 -0,656 _ Glyma20g22280 6,79 426 44,8 8

8,93 52,3 64,25 -0,531 _ Glyma05g19920 6,2 273 30,4 9

6,63 59,36 59,07 -0,719 _ 7,34 258 29,4 10 Glyma06g04380

5,84 65,4 50,92 -0,845 _ 6,1 491 54,3 11 Glyma10g04890

Ghi chú: L(aa): Kích thước (amino acid), mW: Trọng lượng phân tử, C: Lục lạp, M: Ty thể, S: hệ thống bao gói, *: Độ

tin cậy cao.

20

Chỉ số bất ổn định (II cũng đƣợc đề cập tới và sử dụng để xác thời gian

bán hủy của protein trong ống nghiệm. Theo kết quả phân tích, chỉ có duy

nhất một phân tử protei có chỉ số II = 39,46 < 40 nên s có thời gian bán hủy

dài hay nói cách khác thì chúng s ổn định trong ống nghiệm. Còn lại 10 phân

tử protein có chỉ số II > 40 vậy nên s có thời gian bán hủy ngắn và kém ổn

định trong ống nghiệm.

Khi quan sát bảng 3.1 ta có thể thấy r ng các chỉ số về độ ƣa nƣớc trung

bình của các protein họ bHLH đều nhỏ hơn 0 (GRAVY < 0 chứng tỏ r ng

chúng đều c tính ƣa nƣớc.

Ngoài ra, trong nghiên cứu này chúng tôi cũng sử dụng chỉ số béo

Aliphatic để đánh giá các protein. Chỉ số này đƣợc coi là một yếu tố tích cực

để gia tăng khả năng chịu nhiệt của các protein hình cầu. Điều này c ý nghĩa

thật sự với những phân tử có khối lƣợng dƣới 100.

Nh m tăng độ tin cậy cho kết quả, chúng tôi đã sử dụng phần mềm

TagertP để xác định vị trí của những phân tử protein này trong tế bào. Kết quả

cho thấy có thể có 2 protein là Glyma01g15930 và Glyma11g17120 s n m

tại lục lạp. Đối với ty thể có thể có sự xuất hiện của 2 protein là

Glyma03g32740 và Glyma13g19250. Trong hệ thống bao gói của tế bào có

thể có sự hiện diện của protein Glyma02g00980. Đây đƣợc xem là dẫn liệu

quan trọng trong những nghiên cứu chức năng gene tiếp theo.

21

3.1.2.Nhóm bZIP ở đậu tương

Bảng 3.2: Đặc điểm protein nhóm bZIP ở cây đậu tƣơng

Glyma02g01600 Glyma08g12170 Glyma05g28960 Tên Protein

Nội dung

6,67 7,69 7,32 %Met

149 168 163 L(aa)

16,9 19,1 18,4 mW (kDa)

5,07 5,24 5,23 pI

55,4 44,66 43,56 II

68,19 65,71 68,34 Chỉ số béo

GRAVY

-0,664 C* -0,735 C* -0,645 C* Vị trí

Ghi chú: L(aa): Kích thước (amino acid), mW: Trọng lượng phân tử, C: Lục

lạp, M: Ty thể, S: Hệ thống bao gói, *: Độ tin cậy cao.

Phân tích kết quả bảng 3.2, kích thƣớc và trọng lƣợng của các phân tử

protein trong nhóm bZIP khá là nhỏ. Chiều dài phân tử dao động trong

khoảng 149 amino acid (Glyma02g01600 đến 169 amino acid

(Glyma08g12170). Khối lƣợng phân tử n m trong khoảng từ 16,9kDa

(Glyma02g01600 đến 19,1kDa (Glyma08g12170). Nhìn chung các phân tử

protein này c kích thƣớc và trọng lƣợng tƣơng đối nhỏ làm chúng c độ linh

hoạt cao và có thể dễ dàng đƣợc xuất hoặc nhập qua màng sinh học để đƣợc

thực hiện chức năng trong tế bào.

Tất cả ba phân tử protein gồm Glyma02g01600, Glyma08g12170,

Glyma05g28960 đều có giá trị pI n m trong 5,07 đến 5,24 và mang tính acid

rất cao. Cho nên những phân tử này s đƣợc vận chuyển ra tế bào chất ngay

sau khi đƣợc tổng hợp trong nhân.

22

Ngoài chỉ số pI thì chúng tôi còn phân tích thêm chỉ số béo, II và

GRAVY. Các chỉ số II của protein thuộc nh m bZIP đều lớn hơn 40 vậy nên

tính ổn dịnh trong ống nghiệm của chúng không cao. Nhìn chung đây là các

phân tử protein c tính ƣa nƣớc vì chỉ số GRAVY < 0. Chỉ số béo đƣợc coi là

một yếu tố tích cực để gia tăng khả năng chịu nhiệt của các protein hình cầu.

điều này c ý nghĩa thật sự với những phân tử có khối lƣợng dƣới 100.

Để tăng thêm độ tin cậy, chúng tôi đã sử dụng phần mềm Tagert P để xác

định vị trí của những phân tử protein này trong tế bào. Kết quả cho thấy tất cả

các protein trong nh m này đều có thể đƣợc phân bố ở lục lạp. Đây đƣợc xem

là dẫn liệu quan trọng trong những nghiên cứu chức năng gene tiếp theo.

3.1.3. Nhóm SRF ở đậu tương

Tiến hành phân tích đặc tính của các protein thuộc nhóm TF SRF qua

bảng 3.3, ta có thể thấy kích thƣớc và trọng lƣợng của nhóm này tƣơng đối là

nhỏ. Kích thƣớc của chúng n m trong khoảng 156 amino acid

(Glyma11g30490 và Glyma11g30620) đến 247 amino acid

(Glyma10g40080). Bên cạnh đ , trọng lƣợng protein cũng nhỏ dao động từ

17,9kDa (Glyma11g30490 đến 27,8kDa (Glyma10g40080). Khối lƣợng phân

tử trung bình chỉ vào khoảng 21kDa. Đối với những phân tử có trọng lƣợng

và kích thƣớc nhỏ thì các protein thuộc TF SRF c độ linh hoạt rất cao và có

thể dễ dàng xuất hoặc nhập qua màng tế bào để thực hiện chức năng sinh học

của chúng.

Bên cạnh đ , chỉ số pI của TF SRF cũng đƣợc chúng tôi đề cập tới trong

nghiên cứu này. Ở đây chỉ có duy nhất 1 protein có tính acid đ là

Glyma11g26260 (pI = 6,84). Còn lại 6 protein đều mang tính base với pI dao

động trong khoảng từ 9,26 (Glyma11g30490 đến 10 (Glyma18g05930). Rất

có thể những protein mang tính base này s bám trên ty thể hoặc các hệ thống

có màng khác của tế bào.

23

Khi tiến hành phân tích chỉ số ổn định của nhóm protein thuộc TF SRF kết

quả cho thấy tất cả các protein của nh m này đề có chỉ số II > 40. Từ đây c

thể nhận thấy r ng những protei này có thời gian bán hủy ngắn hay nói cách

khác độ ổn định của chúng trong ống nghiệm không cao. Chỉ số GRAVY của

nhóm này thể hiện đây là những phân tử protein đều c tính ƣa nƣớc

(GRAVY < 0 . Đối với chỉ số béo Aliphatic c liên quan đến độ chịu nhiệt

của protein hình cầu. Điều này c ý nghĩa thật sự với những phân tử có khối

lƣợng dƣới 100.

Để tăng cƣờng độ tin cậy của phép dự đoán, định khu dƣới tế bào của họ

TF SRF đƣợc phân tích b ng công cụ TargetP. Kết quả cho thấy là các protein

này chƣa đƣợc xác định vị trí rõ ràng trong tế bào và có thể chúng s đƣợc

phân bố tại các hệ thống bao gói trong tế bào. Đây đƣợc xem là dẫn liệu quan

trọng trong những nghiên cứu chức năng gene tiếp theo.

24

Bảng 3.3: Đặc tính protein nhóm SRF ở cây đậu tƣơng

STT Tên protein %Met L(aa) mW pI II Chỉ số béo GRAVY Vị trí

(kDa)

1 Glyma11g26260 6,79 18,7 6,84 55,54 161 84,04 -0,65 _

2 Glyma11g30490 7,69 17,9 9,26 57,12 156 76,22 -0,437 _

3 Glyma11g30620 7,69 18 9,37 55,52 156 80,58 -0,42 _

4 Glyma18g05930 10,12 19,7 10 58,23 168 67,98 -0,641 _

5 Glyma18g05960 7,55 18,2 9,13 59,28 159 71,13 -0,574 _

6 Glyma20g27320 6,67 26,7 9,79 55,34 239 63,35 -0,444 _

7 Glyma10g40080 6,45 27,8 9,76 46,27 247 67,49 -0,466 _

Ghi chú: L(aa): Kích thước (amino acid), mW: Trọng lượng phân tử, C: Lục lạp, M: Ty thể, S: Hệ thống bao gói,

*: Độ tin cậy cao.

25

3.2. Phân tích mật độ phân bố Met ở ngoài vùng bảo thủ của c c nhóm

TF giàu Met ở đậu tƣơng

Sau khi tiến hành phân tách các trình tự amino acid ở ngoài vùng bảo thủ

của các TF là bHLH, bZIP và SRF chúng tôi đã sử dụng phần mềm BioEdit

để tính hàm lƣợng Met và thu đƣợc kết quả nhƣ hình 3.1.

Kết quả cho thấy, trong tổng số 11 protein thuộc TF bHLH có 8 protein có

tỉ lệ Met tập trung ở ngoài vùng bảo thủ rất cao từ 10,14% (Glyma06g04380)

cho tới 21,05% (Glyma03g04000 . Đa phần các protein c tỉ lệ Met phân bố

ngoài v ng bảo thủ cao đều là các protein n m trong ty thể hoặc hệ thống bao

g i của tế bào. Trong tổng số 3 protein thuộc họ TF bZip chỉ duy nhất protein

Glyma02g01600 có tỉ lệ Met ở v ng thƣợng nguồn cao (10% . Protein này c

thể đƣợc phân bố ở lục lạp. Họ TF SRF, tất cả các protein c tỉ lệ Met ngoài

v ng bảo thủ cao đều là các protein c tính base. Chúng c thể đƣợc phân bố

trong ty thể hoặc hệ thống bao g i trong tế bào. Nhƣ vậy sau khi phân tích

chúng tôi đã tìm thấy 15 trong tổng số 21 gene c sự phân bố Met nhiều ở

quanh v ng bảo thủ, vì thế các gốc Met này c thể giúp các protein đáp ứng

lại với các điều kiện bất lợi từ ngoại cảnh.

26

Hình 3.1: Tỉ lệ phân bố Methionine ngoài vùng bảo thủ các họ TF

27

3.3. Phân tích dữ liệu biểu hiện của c c gene mã hóa TF giàu Met ở đậu

tƣơng trong c c điều iện

Dựa trên nghiên cứu của Libault, chúng tôi tiến hành phân tích biểu hiện

gene của các họ TF ở điều kiện thƣờng qua kết quả RNA-seq ở 9 mô khác

nhau của cây đậu tƣơng gồm tế bào lông rễ (RH sau khi gieo 84 giờ và 120

giờ (HAS , mô ch p rễ (RT , mô rễ (R , nốt sần (N , mô lá (L , mô phân sinh

đỉnh (SAM , mô hoa (F) và vỏ quả xanh (GP). Chúng đƣợc phân thành 4 mức

độ dựa vào biểu hiện đặc trƣng của từng mô: mức dƣới ngƣỡng phát hiện

(fold change < 3 , c biểu hiện (3 ≤ fold change ≤ 10 , c xu hƣớng biểu hiện

(10 ≤ fold change ≤ 100 , biểu hiện mạnh (100 ≤ fold change < 1000) [32].

Từ các dữ liệu đã c chúng tôi xây dựng biểu đồ thể hiện mức độ biểu hiện

của các mô nhƣ hình 3.2.

Hình 3.2: Sự biểu hiện của các gene bHLH, bZIP, SRF của cây đậu tƣơng

trong các mô ở điều kiện thƣờng

28

Kết quả trên cho thấy các gene thuộc 2 họ TF là bHLH và bZIP đều c

biểu hiện mạnh ở ít nhất là một mẫu mô. Trong họTF bHLH c 4 gene biểu

hiện mạnh ở hoa và lá gồm Glyma01g15930, Glyma11g17120,

Glyma03g32740 và Glyma13g19250 c thể tham gia vào quá trình sinh

trƣởng và phát triển của cây. Đáng chú ý là gene Glyma03g32740 và

Glyma13g19250 đƣợc phân bố tại ty thể, c thể đáp ứng lại những bất lợi ở

hoa và lá.

Quan sát các gene thuộc TF bZIP c thể thấy tất cả các gene đều hiện ở

hầu hết các mô, đặc biệt chúng biểu hiện mạnh nhất ở các bộ phận dƣới mặt

đất. Gene Glyma02g01600 biểu hiện mạnh nhất tại 4 mô là nốt sần, hoa, rễ và

lông rễ. Ngoài ra gene Glyma05g2896 cũng đặc biệt biểu hiện rất mạnh tại

mô nốt sần. Hầu nhƣ các gene thuộc họ TF SRF đều biểu hiện ở dƣới ngƣỡng

phát hiện ngoại trừ gene Glyma11g26260 c biểu hiện ở rễ.

Ngoài ra trong nghiên cứu này, yếu tố bất lợi đƣợc chúng tôi quan tâm đến

là độ mặn cao. Đây đƣợc coi là một trong những yếu tố ảnh hƣởng tới quá

trình sinh trƣởng và phát triển của cây trồng. Các yếu tố mặn giúp tăng cƣờng

sự điều chỉnh để đáp ứng các bất lợi của gene, ngƣợc lại điều kiện hạn s

giảm sự điều chỉnh của gene [11]. Trong một nghiên cứu của Belamkar năm

2014 về dữ liệu đặc điểm toàn diện và định dạng RNA-seq của họ TF HD-ZIP

ở cây đậu tƣơng trong điều kiện hạn và mặn cao [11]. Dữ liệu đƣợc thu thập

từ GEO đƣợc truy cập theo số hiệu GSE57252. Từ những dẫn liệu trên chúng

tôi đã thiết lập thành biểu đồ thể hiện mức độ biểu hiện của các gene mã hóa

trong điều kiện mặn nhƣ hình 3.3 dƣới đây:

29

Hình 3.3: Sự biểu hiện của các gene bHLH, bZIP, SRF của cây đậu tƣơng

trong các mô ở điều kiện mặn

(Na0hrR: mẫu rễ sau 0 giờ trong dung dịch NaCl, Na1hrR: mẫu rễ sau 1 giờ

trong dung dịch NaCl, Na6hrR: mẫu rễ sau 6 giờ trong dung dịch NaCl,

Na12hrR: mẫu rễ sau 12 giờ trong dung dịch NaCl)

Kết quả thu đƣợc 10 gene trên tổng số 21 gene c biểu hiện khi xử lí trong

điều kiện mặn cao. Họ TF bHLH c 6 gene biểu hiện gồm Glyma01g15930,

Glyma03g04000, Glyma20g22280, Glyma03g32740, Glyma13g19250,

Glyma10g04890. Trong điều kiện mặn 2 gene Glyma03g32740,

Glyma13g19250 c biểu hiện mạnh, c thể đáp ứng các bất lợi cho cây. Các

gene trong họ TF bZIP đều c biểu hiện rất mạnh trong điều kiện mặn. Gene

Glyma02g01600 c biểu hiện mạnh nhất ở cả 3 thời điểm thí nghiệm (xử lí

mặn sau 1 giờ, 6 giờ và 12 giờ . Chúng tôi không thể tìm thấy các dẫn liệu

biểu hiện trong điều kiện mặn của hầu hết các gene thuộc họ TF SRF ngoại

trừ gene Glyma11g26260 c biểu hiện. Nhƣ vậy, sau khi tiến hành phân tích

biểu hiện các TF trong điều kiện xử lí mặn c 5 gene đáp ứng rất mạnh gồm 1

gene bHLH (Glyma13g19250), 3 gene bZIP và 1 gene SRF (Glyma11g26260)

30

c biểu hiện đáp ứng phiên mã tăng mạnh khi xử lí mặn. Đặc biệt các gene

thuộc TF bZIP đều đều đƣợc tăng cƣờng biểu hiện mạnh ở rễ trong cả điều

kiện thƣờng và điều kiện xử lí mặn.

31

KẾT LUẬN VÀ KIẾN NGHỊ

1. Kết luận

Các phân tử protein thuộc họ bHLH c kích thƣớc trung bình khá lớn,

c độ linh hoạt thấp. Đối với họ bZIP và SRF c kích thƣớc và trọng lƣợng

nhỏ, c độ linh hoạt cao dễ dàng đƣợc xuất hoặc nhập qua màng tế bào để

thực hiện chức năng sinh học. Ngoài ra, các gene thuộc họ bHLH, bZIP, SRF

c thể cƣ trú ở rất nhiều vị trí để thực hiện chức năng điều h a trong tế bào.

Tất cả protein trong nghiên cứu đều là những proetin ƣa nƣớc và có khả năng

chịu nhiệt.

Trong nghiên cứu này chúng tôi đã xác định đƣợc 15 trên tổng số 21

protein thuộc 3 họ TF c hàm lƣợng Met phân bố nhiều quanh v ng bảo thủ.

Có 15 gene c biểu hiện ở ít nhất là một mô trong điều kiện thƣờng. Họ

bHLH có 4 gene biểu hiện mạnh ở hoa và lá, c thể tham gia vào quá trình

sinh trƣởng và phát triển. Họ bZIP thì biểu hiện rất mạnh ở các bộ phân dƣới

mặt đất. Các gene thuộc họ SRF hầu hết đều biểu hiện ở dƣới ngƣởng phát

hiện. Sau khi tiến hành xử lí mặn thì c 10 gene biểu hiện, trong đ c 5 gene

đáp ứng mạnh gồm 1 gene bHLH (Glyma13g19250), 3 gene bZIP và 1 gene

SRF (Glyma11g26260).

2. Đề xuất

Đề nghị cần tiếp tục phát triển nghiên cứu này trên thực nghiệm nh m

tăng độ tin cậy cho giả thuyết trên và đánh giá tính chống chịu mặn của một

số gene thuộc 3 họ TF đặc biệt là đối với TF bZIP gồm 3 gene

Glyma02g01600, Glyma08g12170, Glyma05g28960 đã đƣợc xác định là quan

trọng từ dẫn liệu đƣợc khai thác.

32

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ LIÊN QUAN ĐẾN

KHÓA LUẬN

Chu Đức Hà, La Việt Hồng, Lê Minh Tuấn, Phạm Phƣơng Thu, Phạm Thị Lý

Thu (2019 , “Phân tích vai tr của gốc methionine trong cấu trúc họ nhân tố

phiên mã ở cây đậu tƣơng (Glycine max ”, Tạp chí Khoa học Công nghệ Nông nghiệp Việt Nam (Chấp nhận đăng .

33

TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt

[1] Chu Hoàng Mậu (2013 , “ Đặc điểm của gen Expansin phân lập từ giống

đậu địa phƣơng Việt Nam”, Tạp chí sinh học số, 35(1), 99-104.

[2] Ngô Thế Dân (1999), Cây đậu tương, NXB Nông nghiệp Hà Nội.

[3] Nguyễn Thị Hiền và Vũ Thị Thƣ (2004 , Hóa Sinh học, NXB Đại học

Sƣ phạm.

[4] Lê Quý Đôn (2006 , Vân Đài loại ngữ, NXB Văn h a thông tin.

[5] Đỗ Huy Bích, Đặng Quang Trung (2004), Cây thuốc và động vật làm

thuốc ở Việt Nam, NXB Khoa hoc kỹ thuật Hà Nội.

[6] Trần Văn Điền (2007), Giáo trình cây đậu tương, NXB Nông nghiệp Hà

Nội.

Tài liệu tiếng Anh

[7] Atchley, W.R., Fitch, W.M., (1997), “ A natural classification of the

basic helix-loop-helix class of transcription factors”, Proc Natl Acad Sci

USA,( 94), 5172-5176.

[8] Arumuganathan, K., and Earle, E.D., (1991 , “Nuclear DNA content of

some important plant species”, Plant Molecular Biology Reporter, (9),

208-219.

[9] Brosnan, J.T., Brosnan, M.T., (2006 , “The sulfur-containing amino

acids: an overview”, J Nutr, 136 (6 Suppl): 1636s-1640s.

[10] Brivanlou, A.H., James, E., Darnell, Jr., (2002 , “Signal transduction and

the control of gene expression", Science, (295), 813.

[11] Belamkar, V., Weeks, T.M., Bharti, K.A., Farmer, D.A., Garham, A.M.,

and Cannon, B.S., (2014 , “Comprehensive characterization and RNA-

Seq profiling of the HD-Zip transcription factor family in soybean

(Glycine max during dehydration and salt stress”, BMC Genomics, 15,

950.

34

[12] Chen, L., Song, Y., Li, S., Zhang, L., Zou, C., Yu, D., (2012), “The role

of WRKY transcription factors in plant abiotic stresses”, Biochim

Biophys Acta, (1819), 120-128.

[13] Ellenberger, T., Fass, D., Arnaud, M., Harrison, S.C., (1994 , “Crystal

structure of transcription factor E47: E-box recognition by a basic region

helix-loophelix dimer”, Genes Dev, (8), 970–980.

[14] Emanuelsson, O., Brunak, S., Heijne, G.V., Nielsen, H., (2007),

“Locating proteins in the cell using TargetP, SignalP and related tools”,

Nat Protoc, 2(4), 953-971.

[15] Gurley, W.B., Hepburn, A.G., & Key, J.L., (1979 , “Sequence

organization of the soybean genome”, Biochim Biophys Acta, (561), 167-

183.

[16] Goldberg, R.B., (1978 , “ DNA sequence organization in the soybean

plant”, Biochem Genet, 16, 45-68.

[17] Gasteiger, E., Gattiker, A., Hoogland, C., Ivanyi, I., Appel, R. D.,

Bairoch, A., (2003), “ExPASy: The proteomics server for in-depth

protein knowledge and analysis”. Nucleic Acids Res, 31(13): 3784-3788.

[18] Hymowitz, T., (1970 , “On domestication of Soybean”, Econ Bot, (24),

408-421.

[19] Hymowitz, T., (2004), “Speciation and cytogenetics”. p. 97-136. In H.

R. Boerma, J. E. Specht (eds.).Soybeans: improvement, production, and

uses. American Society of Agronomy, Crop Science Society of America,

and Soil Science Society of America, Madison, WI, Agronomy Series, no.

16, 1180 p.

[20] Hudson, K.A., Hudson, M.E., (2015 , “A classification of basic helix-

loop-helix transcription factors of soybean”, Int J Genomics, (2015),

603-182.

35

[21] Ha, D.C., Quynh, N.L., Huy, Q.N., Dung, T.L., (2016), Genome-wide

analysis of genes encoding methionine-rich proteins in Arabidopsis and

Soybean suggesting their roles in the adaptation of plants to abiotic

stress, Int J Genomics, (2016),1-8.

[22] Hall, T.A., (1999), “BioEdit: A user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT”, Nucleic Acids Symp Ser, 41, 95-98.

[23] Jakoby, M., B. Weisshaar, W. Dröge-Laser, J. VicenteCarbajosa, J.

Tiedemann, T. Kroj and F. Parcy, (2002), bZIP transcription factors in

arabidopsis. Trends Plant Sci, (7),106-111.

[24] Kiraga, J., Mackiewicz, P., Mackiewicz, D., Kowalczuk, M., Biecek, P.,

Polak, N., Smolarczyk, K., Dudek, M.R., Cebrat, S., (2007), “The

relationships between the isoelectric point and: length of proteins,

taxonomy and ecology of organisms", BMC Genomics, (8), 163.

[25] Koc, A.B., Abdullah, M., Fereidouni, M., (2011 , “ Soybean -

Applications and Technology”, Published by InTech.

[26] Kilian, J., Peschke, F., Berendzen, K.W., Harter, K., Wanke, D., (2012)

“Prerequisites, performance and profits of transcriptional profiling the

abiotic stress response”, Biochim Biophys Acta, (1819), 166–175.

[27] Kim, G., Stephen, J.W., (2014), “Methionine oxidation and reduction in

proteins”, J Biol Chem, 293(19), 7355-7366.

[28] Kumar, S., Stecher, G., Tamura, K., (2016), “MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets”, Mol Biol Evol, 33(7),1870-1874.

[29] Lackey, J.A., (1980 , “Chromosome numbers in the phaseoleae

(Fabaceae:Faboideae and there relation to taxonomy”, Am J Bot, 67 (4),

595-602.

[30] Le, D.T., Nishiyama, R., Watanabe, Y., Mochida, K., Kazuko

Yamaguchi-Shinozaki, Shinozaki, K., and Tran, L.S.P., (2011),

36

“Genome-wide survey and expression analysis of the plant-specific NAC

transcription factor family in Soybean during development and

dehydration stres”, DNA Res, 18(4), 263-76.

[31] Latchman, D.S., (1997 , “Transcription factor : An overview”, Int J

Biochem Cell Biol, 29(12), 1305-1312.

[32] Levine, R.L., Mosoni, L., Berlett, B.S., Stadtman, E.R., (1996),

“Methionine residues as endogenous antioxidants in proteins”, Proc Natl

Acad Sci USA, 93(26), 15036-40.

[33] Li, X., Duan, X., Jiang, H., Sun, Y., Tang, Y., Yuan, Z., Guo, J.,

Liang, W., Chen, L., Yin, L., Ma, H., Wang, J., and Zhang, D., (2006),

“Genome-Wide analysis of basic/helix-loop-helix transcription factor

family in rice and arabidopsis”, Plant Physiol, (141), 1167–1184.

[34] Libault, M., Farmer, A., Joshi, T., Takahashi, K., Langley, J.R., Farnklin,

D.L., Xu, D., May, G., and Stacey, G., (2010 , “An integrated

transcriptome atlas of the crop model Glycine max, and its use in

comparative analyses in plants”, Plant J, (63), 86-99.

[35] Ledent, V., Vervoort, M., (2001 , “The basic helix – loop – helix protein

family: comparative genomeics and phylogenetic analysis”, Genome

Res, 11(5), 754-70.

[36] Murre, C., McCaw, P.S, Baltimore, D., (1989), “A new DNA binding

and dimerization motif in immunoglobulin enhancer binding,

daughterless, MyoD, and myc proteins”, Cell, (56), 777-783.

[37] Nakashima, K., Y. Ito and K. Yamaguchi-Shinozaki, (2009),

“Transcriptional regulatory networks in response to abiotic stresses in

Arabidopsis and grasses”, Plant Physiol (149), 88-95.

[38] Nesi, N., Debeaujon, I., Jond, C., Pelletier, G., Caboche, M., Lepiniec,

L., (2000), “The TT8 gene encodes a basic helix-loop-helix domain

37

protein required for expression of DFR and BAN genes in Arabidopsis

siliques”, Plant Cell, (12), 1863–1878.

[39] Quach, T.N., Nguyen, H.T.M., Valliyodan, B., Joshi, T., Xu, D.,

Nguyen, T.H., (2014 , “Genome-wide expression analysis of soybean

NF-Y genes reveals potential function in development and drought

response”, Mol Genet Genomics, 290(3),1095-115.

[40] Quail, P.H., Huq, E., (2002 , “PIF4, a phytochrome-interacting bHLH

factor, functions as a negative regulator of phytochrome B signaling in Arabidopsis”, EMBO J, 21(10), 2441-2450.

[41] Ramsay, N.A., Glover, B.J., (2005 , “ MYB-bHLH-WD40 protein

complex and the evolution of cellular diversity”, Trends Plant Sci, (10),

63–70.

[42] Ravanel, S., Gkière, B., Job, D., and Douce, R., (1998 , “The specific

features of methionine biosynthesis and metabolism in plants”, Proc Natl

Acad Sci USA, (95), 7805-7812.

[43] Rushton, D.L., Tripathi, P., Rabara, R.C., Lin, J., Ringler, P., Boken,

A.K., Langum, T.J., Smidt, L., Boomsma, D.D., Emme, N.J., Chen,

X., Finer, J.J., Shen, Q.J., Rushton, P.J., (2012 , “WRKY transcription

factors: Key components in abscisic acid signalling”, Plant Biotechnol.

J, (10), 2-11.

[44] Rinalducci, S., Murgiano, L., Zolla, L., (2008), “Redox proteomics: basic

principles and future perspectives for the detection of protein oxidation

in plants”, J Exp Bot, 59(14), 3781-3801.

[45] Shore, P., Andrew, D., Sharrocks, (1995 , “The MADS-box family of

transcription factors”, Eur J Biochem, (229), 1-13.

[46] Umezawa, T., M. Fujita, Y. Fujita, K. Yamaguchi-Shinozaki and K.

Shinozaki, (2006), “Engineering drought tolerance in plants: discovering

38

and tailoring genes to unlock the future”, Curr Opin Biotechnol, (17),

113-122.

[47] Udvardi, M.K., Kakar, K., Wandrey, M., Montanari, O., Murray, J.,

Andriankaja, A., Zhang, J.Y., Benedito, V., Hofer, J.M., Chueng, F.,

(2007), “Legume transcription factors: Global regulators of plant

development and response to the environment”, Plant Physiol, (144),

538–549.

[48] Valley, C.C., Cembran, A., Perlmutter, J.D., Lewis, A.K., Labello, N.P.,

Gao, J., Sachs, J.N., (2012 , “The methionine – aromatic motif plays a

unique role in stabilizing protein structure”, J Biol Chem, 287(42),

34979-91.

[49] Wei, L.Q., W.Y. Xu, Z.Y. Deng, Z. Su, Y. Xue and T. Wang., (2010),

“Genome-scale analysis and comparison of gene expression profiles in

developing and germinated pollen in Oryza sativa”, BMC Genomics,

(11), 338.

[50] Yu, Y., Wang, N., Hu, R., Xiang, F., (2016 , “Genome-wide

identification of soybean WRKY transcription factors in response to salt

stress”, SpringerPlus, (5),920.

[51] Zhang, M., Liu, Y., Shi, H., Guo, M., Chai M., He, Q.,Yan, K., Cao, D.,

Zhao, L., Cai, H., and Qin, Y., (2018 , “Evolutionary and expression

analyses of soybean basic Leucine zipper transcription factor family”,

BMC Genomics, (19), 159.

39

PHỤ LỤC

Trình tự protein của 21 gene trong nghiên cứu ở định dạng fasta:

>Glyma01g15930

MSQCVPSWDVEDNPPPSRVSLRSNSNSTAPDVPMLDYEVAELTWENGQLSMHGLGLPRVPVKPPTAVTNK

YTWEKPRASGTLESIVNQVTSFPHRGKPTPLNGGGGGGVYGNFRVPWFDPHATATTTNTVTMDALVPCSN

REQSKQGMESVPGGTCMVGCSTRVGSCCGGKGAKGHEATGRDQSVSGSATFGRDSKHVTLDTCDREFGV

GFTSTSINSLENTSSAKHCTKTTTVDDHDSVSHSKPVGEDQDEGKKKRANGKSSVSTKRSRAAAIHNQSER

KRRDKINQRMKTLQKLVPNSSKSDKASMLDEVIEYLKQLQAQLQMINRINMSSMMLPLTMQQQLQMSMM

SPMGMGLGMGMGMGMGMGMDMNSMNRAHIPGIPPVLHPSAFMPMAASWDAAAAAGGGDRLQGTPAN

VMPDPLSTFFGCQSQPMTIDAYSRLAAMYQQLHQPPPASGSKN*

>Glyma02g00980

VSFGCVLTSHLHSLFSFNSLCKKSTVDIHQMIRTILHLVNVLSFLWFMNDEEPEDVVKEKPAREGTGVKRSR

NAQVHNLCERKRRDKINKRMRILKELIPNCNKTDKASMLDDAIEYLKTLKLQIQMMSMDAGFCIPFMMLR

NAAHHMMNTPLLHQLMGLGMGFRPDTAIPCSLPQFPITPLPAITDNRVHFFGFPNQVPPMPISHAPFIPMLG

NPSTQTPLATSTAINLAENPASSQLTTLMASVPKNLYLTCQRQLL*

>Glyma03g04000

MSQRVPNCDVDDNNNIPTTTKIPLLPNFNFISHEVPMLGYQAAELPCKKGQPSTYKGSHGNLTSTWDKPRT

SGGTLESIVSQHVSENRYKLVTMDALVPCSEQQGTQKAVVSERLDACGKSRFPRVVAQEEVEKRAGVVAR

GTRGTTTLELGGCKDWSVSGSETCRRELSVTFNSATKGSPENTTSSGKQCTGTTTNDDRDSISHRISQGEVP

DEDYKATKVDRSSGSNKRIKANSVVHKQSERRRRDKINQRMKELQKLVPNSSKTDKASMLDEVIQYMKQ

LQAQVQMMNWMKMYTSMMLPITMQQQQQQQQLKMSMMMAQMGMGMGMSKDMVMNMNSMNIPGF

PPMLPFPSFMPMAPCGDQLQGTPEKSVTMDAYSTMASLYQQLFHPPASSSKN*

>Glyma03g32740

MELLWHNGQVVVQSQNQRSLRKLPPVTNSHDASPAGPSMTREIRPLVENFNQHLFMHEGEMASWLHYPID

DDEPAFMQTLGHTSQLTELRPMSANPRPPIPPPRRPEQRTPNFAYFSRHNTRAAEPSVKAAARESTVVDSCD

TEAAASRVSETVRSAAEGGAGVAAPSTSAGGGRSTMMYDLTMTSSPGGSSSCDEPVQVAAAEEDRKRKG

REAEEWECQSELQIPCTLVYANVRWVSDVGLREHSPRCCIYFGAVALCSFGTVITFTVVAAHVQAKKQVC

GSTSTKRSRAAEVHNLSERRRRDRINEKMKALQELIPRCNKSDKASMLDEAISYLKSLQLQVQMMSMGCG

MVPVMFPGIQQYMPAMGMGVGMGMGMEMGMNRPVMPFPNMLPGSALPAATAAAAHLGPRMQAANQS

DNNMVTSAGPPDPNQSRIPNFTDPYQQYLGPHQMQFQLIQNQAMNQPNVSKPSNNGGPANPENH*

>Glyma04g04190

MEQLKPEEYQMDVMTMMLQQLPQLSEPYTHTMEGFHPPEDHFYGNNTMPLADLIDNNNPHSSMPWSSSY

SFTHLPSSTISFSNNNPIMLQEQQQHSPSETYEDANANPYGGEKRSSMAAMREMIFRMAAMQPIHIDPESVK

QPKRRNVKISKDPQSVAARHRRERISERIRILQRLVPGGTKMDTASMLDEAIHYVKFLKTQVQSLQRASSAN

NNIRPLGTSTVNATGIGFPVAMSTTSNSTPYFPLPKPYQARHMENMHDRYD*

>Glyma11g17120

MSQCVPSWDVEDNPPPSRVSLRSNSNSTAPDVPMLDYEVAELTWENGQLSMHGLGLPRVPVKPPTAATNK

YTWEKPRGSGTLESIVNQATSFSHQEKPRPLNGDSGGGGGVYGNFMVPWFDPHAAATTTTTTTNTMTMD

ALVPCSNREQGKKKGMESGPGTCMVGCSTRVGSCCGGKGAKGHEASGRDQSVSGSATFGRDSKHVTLDT

CDREFGVAFTSTSINSLENTSYAKHCTKTTTIEEHDSVSHSKPMGEDGDEEKKKRANGKSSVSTKRSRAAAI

HNQSERKRRDKINQRMKTLQKLVPNSSKTDKASMLDEVIEYLKQLQAQVQMMNRINMSSMMLPLTMQQ

QLQMSMMSPMGMGLGMGMGMGMGMGMDMNSMNRANIPGIPPVLHPSAFMPMAASWDAAVAAAAGG

GDRLQGTPASVMPDPLSTIFGCQSQPMTMDAYSRLAAMYQQLHQPPTSGSKN*

>Glyma13g19250

MELLWQNGQVVMQSQNQRPFRKPPQPPEANGGDGAISAREIRSSEAENYNNSQHLFMQEDEMAAWLHYP

IHEDPPPFDHHDFGADIFYPPPNATASQNRGSAAVQSSFRTTELWHPAPRPPIPPPRRPEHAPSRIHNFAHFTK

HGNASSSSKAAAAAQPTVVDSCETPVATAEHAETGRARAAAGKTAVSDGGRETATCDVTVTSSPGDSSGS

AEPVEREPMADRKRKGREHEESEFQSEDVDFESPEAKKQVHGSTSTKRSRAAEVHNLSERRRRDRINEKM

KALQELIPRCNKSDKASMLDEAIEYLKSLQLQVQMMSMGYGMVPMMFPGIQQYMPPMGMGIGMGMGM

EMGMGMNRPVMPFTNMLASSTLPAATAAVHLGPRFPMPPFHMPHVAAPDSSRMQGANHPDNNMLNSLG

TLDPDQSRIPNFTDPYQQYLGLQQAQLQLMQTMNQQNVSKPSSSRGQENPEKHQSDET*

>Glyma20g22280

MEIKNKGAAATSSNPPESILVDSSGECSKEPTMQCQQVVEQSKPDVNSLQPKSVEQNAVPSKQSEPASKESA

TKIDQTPNQVLGDSGTKGQTAAEKSMEPAVASSSVCSGTGADQGSDEPNQNLKRKTKDTDDSECHSEDVE

EESAGAKKTAGGQGGAGSKRSRAAEVHNLSERRRRDRINEKMRALQELIPNCNKVDKASMLDEAIEYLKT

LQLQVQIMSMGAGLYMPPMMLPAGMQHMHAPHMAPFSPMGVGMHMGYGMGYGMGMPDMNGGSSRF

PMIQVPQMQGTHIPVAHMSGPTALHGMARSNPPGYGLPGQGYPMHMPPASVFPFSGGPLMNSPAQGLHA

RGSSGLVETVDSASASGLKDQMQNVDPQVKQSTGGCDSTSQMPTQCEAAAVGFEQSALAHSRGHASKAN

DNGAVNPDPGR*

>Glyma05g19920

MDVDIVKTSSNNNNMDVMAMMMQMEKFPELFCDPFYTTSYQETDLLSSGSSSTTSASTLFNNNSIVTTTPP

PTTTLVDPTPSNVVQFSKIDDLFQHQHQQQPMSQSLQPYPSEKKNSMAAMREMIFRIAVMQPVHIDPESIKP

PKRRNVKISKDPQSVAARHRRERISERIRILQRLVPGGTKMDTASMLDEAIHYVKFLKKQVQTLEQAGANT

SPHSNTNSPNNHVVGAAGFPLGMSSNYSNNSSVNYSSLLMKGGCQPCQMFGSTSKQLLS*

>Glyma06g04380

MEQQHMDMMTMMMLQHLPEFSEPYTHTMEGFHPPSEEFCGNNNNNIRNTMQLADLIDNNNPLSPIPWSSS

YSFTHLPASTTEISFSNNSHPTTPIMLQEHEQQYEGANANPYGGEKRNSMAAMREMIFRMAAMQPIHIDPES

VKAPKRRNVKISKDPQSVAARHRRERISERIRILQRLVPGGTKMDTASMLDEAIHYVKFLKTQVQSLERASS

ANNNIRPLNAAGQIGFPVASTPYFPLPSKPYQAPNMDNMHDTYH*

>Glyma10g04890

MDDDDEEYPIPVSKKPSTQNDEIMELLWQNGQVVMQNQNQRPFRKQPPTTDGDGPIPAREIRSSEAENYNS

QHLFMQEDEMASWLHYPIHEDPPPFDHHDFCADILYPPPNATASQNQSSASVQSSVRTTELQHPAPRPPIPPP

RRQEHTLSRIHNFTHFAKHGNASSSSKAAAPAQPTVATAEHVETGRASVSAAAGKTPASDGGRETATCDV

TVTSSPGGSSGSAEPVQREPVVNRKRKGREQEESEYQSEDVDFESPEAKKQVRGSTSTKRSHAAEVHNLSE

RRRRDRINEKMKALQELIPRCNKSDKASMLDEAIEYLKSLQLQVQMMSMGCGMVPMIFPGIQQYMPPMG

MGIGMGMGMGMEMGMGMNRSVMPFPNMLASSTLPAATATAHLGPRFPMPPFHMPHVATPDSSRMQGA

NHPDNNMLNSLGTLDPDQSCIPNFTDPYQQYLSLQQAQLQLMQTMNQPNVSKPSTSRGQENPEKHQSDKT

>Glyma02g01600

MASIQRPASSGSSEGGDPVMYERKRKRMESNRESARRSRMKKQKQLEDLTDEVSRLEGENARLAPSIKVK

EEAYVEMEAANDILRAQTMELADRLRFLNSIIEIADEVGGESFEIPQIPDPLFMPWQIPHPMMATPPDMFFHG

NEGLFA*

>Glyma08g12170

MASPGGSGTYSSGSSSLQNSGSEGDRDIMEQRKRKRMLSNRESARRSRMRKQQHLEGLSAQLDQLKKENT

QMNTNIGISTQLYLNVEAENAILRAQMEELSKRLNSLNEMISLINSTTTTNNCLMFDEAQETTTQLFNDCGF

MDAWNYGIPLNQQIMAYADNDMLMMY*

>Glyma05g28960

MASPGGSGTYSSGSSSLQNSGSEGDRDIMEQRKRKRMLSNRESARRSRIRKQQHLEGLSAQLDQLKKENA

QINTNISITTQMYLNVEAENAILRAQMGELSNRLNSLNEMISFINSTNNNCLMMFDEAQETTTQLFNDCGFM

DYAWNGIPIMASADNEMLIMY*

>Glyma11g26260

MKKMNEISTLCGIETCAIIYSPNDPQPEVWPSDSGVQRVLSRFMEMPEVRQSRKMLNQESFLRQMITKGQQ

QLTRQRNENRKKEMTNLMLQYLTAGKVVGNPSLVDLNDLSWLIDQNLNEIEKKITMLQIQEVVIPVIENEG

HMNHVQGLESNMDTKKKQH*

>Glyma11g30490

MAPGKLKLTFIGNDSKRKNVCKKRKQSLLKKTEELSMLCGVEACAIVYGPNDPRPVIWPSEFGVENVLRKF

MSMPHWEQSKKMVNQESFIAQSIMKSKEKLQKIVKENKDIEMSLFMAHCFKTGMFQPDINMTTADMNVL

ASIIEQNLKDIDKRME

>Glyma11g30620

MAPGKLKLTFIGNDFKRKNVCKKRKQSLLKKTEELSMLCGVEACAIVYGPNDPRPVIWPSELGVENVLRKF

MSMPQLEQSKKMVNQESFIAQRIMKSKEKLQKIVKENKEIEMSLFMAHCFKTGMFQPDINMTTADMNVLS

SIIEQNLKDIDKRME

>Glyma18g05930

MTRKKVQPAFISFDSARKLTYKKMKKGMLKKIDEPSTLCGIEACAIVYSPRILRQRVLEKFMSMPELEQSKK

MVNQESFTAQSIMKGNKQMMKLMKDNRRRSRARPDNNMTIANLNFLSRMVDQNLKDIDKRMETLKMQT

PALNYALGSDMNTAEPMQNLWFMDFLNN

>Glyma18g05960

MATGKLKLTFVANDSQRKTVCKKRKQSLLKKTEELSTLCGIEACAIVYGPNDHRPEIWPSESGVKNVLGKF

MNKPQWEQSKKMMNQESFIAQSIMKSKDKLQKVVKENKEIEMSLFMAQCFQTGMFQPDINMTAADMNV

LSSEIEQNLKDIDKRMEMLK

>Glyma20g27320

MSGPKKSRGRQKIEMKKMSNESNLQVTFSKRRSGLFKKASELCTLCGADVALIVFSPGEKVFSFGHPNVDA

VIDRYLERAPPTESFMEAHRMAHVRDLNAQLTQISNHLDAGRKRAEELNLMKKEAQAHLWWARPVDGM

SMAQMKQFKAALEELKKQVARLADRAMLQSVTNPTHEFFPAAGVSSSSSSNSNSNPLSPQVFSPHLIQPPM

LQNFMSMMPRHHGFNYMGMGGYGPAAGFF*

>Glyma10g40080

MSGPKKSRGRQKIEMKKMSNESNLQVTFSKRRNGLFKKASELCTLCGTDVALVVFSPGQKVFSFGHPNVD

AVIDRYLARPPPTDSGTMQIIEAHRMAHVHDLNVQLTQINNQLDHERKRTNELNLMNKEAQAQMWWARP

VDGMSMAQVKQFKAALEEMKKQVARLVDRAMLQSVTNPTLQFFPGVSSSSNSNLVHQPHPLPAPQVFTP

HLIQPPMLQNFMFHDGSMMRHHGFDNIGMGGYGPTAGFF*

PHÂN TÍCH VAI TRÒ CỦA GỐC METHIONINE TRONG CẤU TRÚC HỌ NHÂN

TỐ PHIÊN MÃ Ở ĐẬU TƢƠNG (Glycine max) Chu Đức Hà1, La Việt Hồng2, Lê Minh Tuấn1,2, Phạm Phƣơng Thu2, Phạm Thị Lý Thu1

1 Viện Di truyền Nông nghiệp, VAAS 2 Khoa Sinh - Kỹ thuật nông nghiệp, Đại học Sƣ phạm Hà Nội 2

Thông tin liên hệ: Chu Đức Hà. ĐT: 0983 766 070. Email: hachu_amser@yahoo.com

TÓM TẮT

Methionine (Met) là một axit amin đ ng vai tr thiết yếu ở thực vật. Các gốc Met cấu trúc đƣợc giả

thuyết là tham gia bảo vệ phân tử protein chống lại bất lợi ôxi h a xảy ra trong tế bào khi gặp điều kiện bất

lợi. Trong nghiên cứu này, 21 phân tử protein giàu Met (Met-rich protein, MRP , thuộc ba nh m nhân tố

phiên mã (transcription factor, TF lần lƣợt là Basic helix-loop-helix (bHLH , Basic leucine zipper (bZIP

và Serum response factor (SRF ở đậu tƣơng (Glycine max đã đƣợc phân tích nh m chứng tỏ giả thuyết

trên. Kết quả phân tích đã đƣa ra 15 MRP c sự phân bố dày đặc của gốc Met trên hai khoảng ngoại biên

quanh v ng bảo thủ. Thông qua các công cụ tin sinh học, các TF này đều ƣa nƣớc và hầu nhƣ không bền

vững trong ống nghiệm. Trong đ , một số TF c thể phân bố trong tế bào chất, ty thể hoặc trên hệ thống bao

g i. Dựa trên dữ liệu biểu hiện trong điều kiện thƣờng, phần lớn các gen mã h a họ bHLH và bZIP đều c xu

hƣớng tăng cƣờng biểu hiện ở ít nhất một cơ quan chính. Phân tích dữ liệu RNA-Seq cho thấy, một số gen

mã h a họ bHLH và SRF c mức độ phiên mã đáp ứng, trong khi các gen mã h a họ bZIP c đáp ứng tăng ở

rễ đậu tƣơng xử lý mặn. Nghiên cứu này s đƣợc tiếp tục nh m đánh giá thực nghiệm biểu hiện của các gen

mã h a 21 MRP này trong các điều kiện ngoại cảnh bất lợi.

T hóa: Bất lợi, đậu tƣơng, Methionine, nhân tố phiên mã, tin sinh học.

I. MỞ ĐẦU

Dƣới tác động của ngoại cảnh bất lợi, sự dƣ thừa của một số dạng chứa ôxi nguyên

tử hoạt động đã gây ra những tổn thƣởng đến các đại phân tử, ảnh hƣởng tiêu cực đến sinh

trƣởng và phát triển của tế bào thực vật. Khoảng 68 % đại phân tử bị tác động từ quá trình

này là các protein. Trong đ , các gốc Methionine (Met) trên phân tử protein, do có mạch

chứa lƣu huỳnh, nên rất dễ bị ôxi hóa, làm biến đổi cấu trúc dẫn đến thay đổi hoặc gây mất

chức năng của protein [1]. Đây là một axít amin đ ng vai tr thiết yếu trong đời sống của

thực vật, tham gia vào con đƣờng Yang, liên quan đến nhiều chu trình nội bào quan trọng

nhƣ hình thành màng tế bào, tổng hợp diệp lục và củng cố thành tế bào [2]. Giả thuyết đặt

ra là, liệu r ng các gốc Met liên kết trên chuỗi polypeptide có thực sự tham gia vào cơ chế

bảo vệ cấu trúc để duy trì chức năng của phân tử protein trong điều kiện bất lợi hay không?

Gần đây, 213 phân tử protein giàu Met (Met-rich protein, MRP đã đƣợc sàng lọc ở

đậu tƣơng (Glycine max) [3]. Các MRP này đã đƣợc xác định tham gia vào nhiều quá trình

quan trọng trong tế bào, trong đ , 20 % MRP liên quan đến điều h a phiên mã ở đậu tƣơng

[3]. Nhƣ đã biết, nhân tố phiên mã (transcription factor, TF là họ protein tham gia điều

h a sự biểu hiện của gen, vì vậy liên quan đến cơ chế đáp ứng và khả năng chống chịu với

điều kiện bất lợi.

Trong nghiên cứu này, 3 nh m TF giàu Met cơ bản ở đậu tƣơng, bao gồm Basic

helix-loop-helix' (bHLH), 'Basic leucine zipper (bZIP và Serum response factor (SRF

[3], đã đƣợc khai thác để chứng minh giả thuyết về vai tr của các gốc Met liên quan đến

cơ chế đáp ứng ở thực vật trên để phân tích đặc tính lý h a học của protein và khảo sát sự

phân bố của các gốc Met trên phân tử. Mức độ biểu hiện của gen mã h a các TF đƣợc phân

tích tại một số cơ quan chính trên đậu tƣơng. Kết quả của nghiên cứu này c thể cung cấp

những dẫn liệu quan trọng về vai tr của các gốc Met liên quan đến tính chống chịu điều

kiện bất lợi ở đậu tƣơng.

II. VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU

2.1. Vật liệu nghi n cứu

Trình tự protein và mã định danh của 21 TF giàu Met, bao gồm 11 TF nh m bHLH, 3 TF

nh m bZIP và 7 TF nh m SRF đƣợc khai thác từ nghiên cứu trƣớc đây [3] (Bảng 1 .

Bảng 1. Thông tin về các TF giàu Met đƣợc khai thác trong nghiên cứu này [3]

TT Mã định danh TF TT Mã định danh TF TT Mã định danh TF

01 Glyma01g15930

08 Glyma10g04890

15 Glyma10g40080

02 Glyma02g00980

09 Glyma11g17120

16 Glyma11g26260

03 Glyma03g04000

10 Glyma13g19250

17 Glyma11g30490

H L H b

04 Glyma03g32740

11 Glyma20g22280

18 Glyma11g30620

F R S

H L H b

05 Glyma04g04190

12 Glyma02g01600

19 Glyma18g05930

06 Glyma05g19920

13 Glyma05g28960

20 Glyma18g05960

P I Z b

07 Glyma06g04380

14 Glyma08g12170

21 Glyma20g27320

2.2. Phƣơng ph p nghi n cứu

- Phƣơng pháp phân tích v ng bảo thủ của protein: Các nh m TF đƣợc kiểm tra v ng bảo

thủ b ng phần mềm MEGA (v. 7.0 [4]. Trình tự ngoại biên từ đầu 3 và 5 đến vị trí tiếp

giáp v ng bảo thủ đƣợc tách biệt để xác định sự phân bố các gốc Met b ng công cụ

BioEDIT [5].

- Phƣơng pháp xác định đặc tính lý h a của protein: Trình tự axit amin (.fasta đƣợc phân

tích trên công cụ ExPASy Protparam [6] để đánh giá các đặc tính lý h a học của chuỗi truy

vấn. Một số chỉ tiêu đƣợc quan tâm, bao gồm điểm đẳng điện lý thuyết (Isoelectric point,

pI), chỉ số bất ổn định (Instability index, II , độ ƣa nƣớc (Grand average of hydropathicity,

GRAVY).

- Phƣơng pháp dự đoán vị trí phân bố nội bào của protein: Trình tự axít amin (.fasta của

các TF đƣợc sử dụng để tìm kiếm vị trí cƣ trú trong tế bào thông qua công cụ TargetP [7].

Trong đ , mức độ tin cậy của thuật toán đƣợc xác định theo thang điểm 5 [7].

- Phƣơng pháp phân tích in silico mức độ biểu hiện gen trong điều kiện thƣờng: Mức độ

phiên mã của gen mã h a các TF đƣợc xác định trong điều kiện thƣờng dựa trên dữ liệu

microarray đã công bố [8]. Trong đ , chín mẫu mô, bao gồm lông rễ thu ở thời điểm 84 và

120 h sau nảy mầm (84-, 120-hour-after-sprayed root hair, RH 84 HAS, RH 120 HAS , nốt

sần (Nodule, N , mô phân sinh đỉnh chồi (Shoot apical meristem, SAM), hoa (Flower, F ,

vỏ quả xanh (Green pod, GP , lá (Leaf, L , rễ (Root, R , ch p rễ (root tip, RT đƣợc khai

thác và phân tích [8]. Mã định danh của gen mã h a TF đƣợc truy vấn trên dữ liệu

microarray để tìm kiếm mức độ biểu hiện của gen tƣơng ứng ở các mô trong điều kiện

thƣờng.

- Phƣơng pháp phân tích in silico mức độ biểu hiện gen trong điều kiện bất lợi: Mức độ

phiên mã của gen mã h a các TF trong điều kiện hạn đƣợc khai thác trên dữ liệu RNA-Seq

đã ghi nhận gần đây (GSE57252 [9]. Trong đ , mẫu rễ xử lý với dung dịch NaCl 100 mM

trong 0 (đối chứng , 1, 6 vá 12 h đƣợc thu thập để phân tích RNA-Seq [9]. Mã định danh

của gen mã h a TF đƣợc truy vấn trên dữ liệu RNA-Seq để tìm kiếm mức độ biểu hiện của

gen tƣơng ứng ở rễ trong điều kiện xử lý mặn.

- Phƣơng pháp phân tích và mô hình h a dữ liệu biểu hiện gen: Số liệu thƣờng phân tích

b ng bản đồ nhiệt (heatmap trên công cụ Microsoft Excel và minh họa trên Adobe

Illustrator.

III. KẾT QUẢ VÀ THẢO LUẬN

3.1. Kết quả phân tích sự phân bố của gốc Met trong c c họ TF ở đậu tƣơng

Với giả thuyết đặt ra, v ng thƣợng nguồn (upstream region và hạ nguồn

(downstream region của các nh m TF đƣợc chọn lọc để xác định mức độ phân bố của các

gốc Met trên protein. Trƣớc tiên, v ng bảo thủ của các TF đƣợc xác định b ng công cụ

MEGA [4]. V ng bảo thủ của họ TF bHLH giàu Met ở đậu tƣơng c cấu tạo gồm bốn

domain, basic-helix-loop-helix , trong khi các thành viên của họ TF bZIP đều chia sẻ cấu

trúc bảo thủ gồm ba v ng, basic-hinge-leucine zipper (Hình 1 . Phân tích trình tự tƣơng

đồng cho thấy họ TF SRF c v ng bảo thủ MADS-box (Hình 1 .

Hình 1. Sự phân bố của các gốc Met trên trình tự polypeptide của ba nh m TF ở đậu tƣơng

Khảo sát hai v ng ngoài trình tự bảo thủ của ba nh m TF đã cho thấy sự mật độ

dày đặc của các gốc Met. Cụ thể, phần lớn các TF thuộc họ bHLH (tám trên tổng số 11 c

v ng thƣợng nguồn hoặc hạ nguồn quy tụ nhiều gốc Met (lớn hơn 10 % (Hình 1 . Chỉ c

một TF thuộc họ bZIP, Glyma02g10600, đƣợc xác định c sự phân bố dày dặc của gốc

Met ở hai v ng ngoại biên cận bảo thủ (Hình 1 . Trong khi đ , hai đoạn trình tự ngoài

v ng bảo thu của hầu hết các thành viên của họ SRF (sáu trên bảy đƣợc ghi nhận sự c

mặt của rất nhiều gốc Met (Hình 1 . Trƣớc đây, Luo và cộng sự (2009 đã chứng minh vai

tr của các gốc Met trên phân tử protein giúp chống lại các bất lợi ôxi h a b ng cách thay

thế Met với Norleucine [10]. Nhƣ vậy, kết quả của nghiên cứu này đã tìm ra đƣợc 15 trên

tổng số 21 TF c sự tập trung nhiều Met quanh v ng bảo thủ, vì thế, các gốc Met này c

thể giúp phân tử protein đáp ứng lại điều kiện ngoại cảnh bất lợi.

3.2. Kết quả phân tích đặc tính lý hóa của nhân tố phi n mã giàu Met ở đậu tƣơng

Đặc tính lý h a của phân tử protein đƣợc thể hiện ở giá trị pI, II và GRAVY thông

qua phân tích trên cổng thông tin ExPASy Protparam [6]. Kết quả đã chỉ ra r ng hầu hết

các TF, ngoại trừ Glyma02g00980 (một thành viên của họ TF bHLH c giá trị II lớn hơn

40, cho thấy chúng không ổn định trong điều kiện kiểm tra trong ống nghiệm (Bảng 2 .

Phân tích từ ExPASy Protparam [6] cũng ghi nhận tất cả các TF c chỉ số GRAVY nhỏ

hơn 0, suy ra 21 phân tử protein này đều ƣa nƣớc (Bảng 2 .

Bảng 2. Đặc tính lý h a của 3 nh m TF giàu Met đƣợc tìm thấy ở đậu tƣơng

TT

Tên protein

TF

pI

II

GRAVY BQ TT

Tên protein

TF

pI

II

01 Glyma01g15930

8,88 47,61

-0,55

12 Glyma02g01600

5,07 55,40

GRAVY BQ C3

-0,66

C5

02 Glyma02g00980

9,26 39,46

-0,10

13 Glyma05g28960

5,23 43,56

-0,64

C2

S5

03 Glyma03g04000

9,14 51,91

-0,69

14 Glyma08g12170

5,24 44,66

-0,73

C2

-

P I Z b

04 Glyma03g32740

7,20 63,57

-0,51 M3

15 Glyma10g40080

9,76 46,27

-0,47

-

05 Glyma04g04190

6,84 68,89

-0,78

16 Glyma11g26260

6,84 55,54

-0,65

-

-

06 Glyma05g19920

8,93 52,30

-0,53

17 Glyma11g30490

9,26 57,12

-0,44

-

-

H L H b

07 Glyma06g04380

6,63 59,36

-0,72

18 Glyma11g30620

9,37 55,52

-0,42

-

-

F R S

08 Glyma10g04890

5,84 65,40

-0,84

19 Glyma18g05930

10,0 58,23

-0,64

-

-

09 Glyma11g17120

8,63 46,28

-0,58

20 Glyma18g05960

9,13 59,28

-0,57

-

C5

10 Glyma13g19250

6,03 65,52

-0,82 M4

21 Glyma20g27320

9,79 55,34

-0,44

-

11 Glyma20g22280

5,92 62,84

-0,66

-

TT: Thứ tự, T : Nhân tố phiên mã, p : Điểm đ ng điện, : Ch số ất n định, R V :

Độ ưa nước, : ào quan, C: Lục lạp, : ệ thống ao gói, M: Ty thể.

Tiếp theo, giá trị pI của các TF dao động từ khoảng 5,07 (tính acid đến 10,00 (tính

base (Bảng 2 . Trong đ , các protein c tính acid c thể phân bố trong tế bào chất, trong

khi protein bám trên màng bào quan thƣờng c tính base [11]. Để tăng tính tin cậy về vị trí

cƣ trú của TF trong tế bào, trình tự amino acid của protein đƣợc truy vấn trên TargetP [7].

Kết quả cho thấy năm TF đƣợc tìm thấy ở tế bào chất, hai TF c thể cƣ trú ở ty thể, trong

khi một TF phân bố trên hệ thống bao g i trong tế bào (Bảng 2 . Trƣớc đ , ty thể đã đƣợc

chứng minh là bào quan tích lũy các dạng chứa ôxi nguyên tử hoạt động (reactive oxgen

species trong tế bào khi chịu bất lợi trong khi protein cƣ trú trong hệ thống bao g i c thể

đƣợc vận chuyển nội bào để tham gia vào quá trình sửa chữa trong tế bào [12].

3.3. Kết quả phân tích dữ liệu biểu hiện của gen mã hóa nhân tố phi n mã giàu Met ở

đậu tƣơng trong c c điều iện

Trong nghiên cứu này, mức độ biểu hiện của các gen mã h a 3 nh m TF ở đậu

tƣơng đƣợc phân tích in silico dựa trên dữ liệu phiên mã trong điều kiện thƣờng [8] và khi

xử lý mặn [9]. Cụ thể, biểu hiện của một gen trong điều kiện thƣờng ở chín mẫu mô c thể

đƣợc chia làm bốn mức độ, dƣới ngƣỡng phát hiện (fold-change < 3 , biểu hiện (3 ≤ fold-

change < 10 , c xu hƣớng biểu hiện mạnh (10 ≤ fold-change < 100 và biểu hiện mạnh

(fold-change ≥ 100 [8]. Trong khi đ , gen c mức độ phiên mã tăng hoặc giảm trong điều

kiện mặn khi giá trị fold-change ≥ 2 hoặc ≤ -2 [9]. Kết quả phân tích in silico mức độ biểu

hiện của các gen mã h a ba nh m TF đƣợc thể hiện ở Hình 2.

Hình 2. Mức độ biểu hiện của gen mã h a TF giàu Met ở cơ quan chính trong các điều kiện

Trong điều kiện thƣờng, phần lớn các gen mã h a hai nh m TF bHLH và bZIP đều

c xu hƣớng biểu hiển mạnh ở ít nhất một bộ phận chính trong cây đậu tƣơng, trong khi

mức độ phiên mã của bảy gen mã h a họ TF SRF ở chín mẫu mô cơ quan dƣới ngƣỡng

phát hiện (Hình 2 . Cụ thể, bốn gen, Glyma13g19250, Glyma03g32740, Glyma01g15930

và Glyma11g17120 đƣợc xác định biểu hiện mạnh ở hoa và lá nhƣng không c xu hƣớng

biểu hiện mạnh ở các cơ quan dƣới đất, chứng tỏ các gen này c thể liên quan và tham gia

một cách đặc th vào các quá trình sinh trƣởng và phát triển của hai bộ phận này trên đậu

tƣơng trong điều kiện thƣờng.

Đáng chú ý, Glyma03g32740 và Glyma12g19250 c thể phân bố ở ty thể (Bảng 2 ,

các gen mã h a 2 TF này biểu hiện đặc th ở hoa và lá (Hình 2 , gợi ý r ng chúng c thể

liên quan đến quá trình đáp ứng bất lợi ở lá hoặc hoa. Bên cạnh đ , gen mã h a hai thành

viên của nh m bZIP biểu hiện rất đặc th ở tất cả các bộ phận dƣới mặt đất, trong khi

Glyma02g01600 c mức độ phiên mã rất mạnh ở tất cả chín mẫu mô cơ quan chính trong

cây (Hình 2 . Kết quả này chứng tỏ Glyma02g01600 c thể đ ng vai tr thiết yếu liên quan

đến quá trình sinh trƣởng và phát triển của cây trong điều kiện thƣờng.

Khi xem xét trong điều kiện bất lợi, dữ liệu GSE57252 [9] đƣợc khai thác để đánh

giá mức độ biểu hiện của các gen mã h a TF ở mô rễ xử lý mặn. Kết quả đã tìm thấy dữ

liệu của 10 gen, bao gồm sáu gen mã h a TF bHLH, ba gen mã h a TF bZIP và một gen

mã h a TF SRF (Hình 2 . Trong đ , năm gen đã đƣợc xác định c đáp ứng phiên mã tăng

mạnh ở rễ khi xử lý mặn (fold-change ≥ 2 (Hình 2 . Đặc biệt, các gen mã h a TF bZIP

đều đƣợc tăng cƣờng biểu hiện ở rễ trong cả điều kiện thƣờng và khi xử lý mặn (Hình 2 ,

chứng tỏ các gen này c thể tham gia vào quá trình đáp ứng bất lợi ở rễ. Bên cạnh đ , một

gen mã h a cho thành viên thuộc họ TF SRF, Glyma11g26260, cũng c biểu hiện tăng ở rễ

khi xử lý mặn (Hình 2 . Trƣớc đ , khi xem xét dữ liệu phiên mã khi xử lý lá cây đậu tƣơng

V6 và R2 trong điều kiện hạn, Chu et al (2016 đã chỉ ra ba gen c đáp ứng [3]. Cụ thể, hai

gen Glyma01g15930 và Glyma03g32740 bị giảm biểu hiện, trong khi Glyma20g22280 c

mức độ phiên mã tăng ở cả mẫu lá V6 và R2 khi xử lý hạn [3]. Những kết quả này ph hợp

với nhận định về vai tr của gen Glyma03g32740 trong đáp ứng bất lợi ở lá.

IV. KẾT LUẬN VÀ ĐỀ NGHỊ

4.1. Kết luận

- Đã xác định đƣợc 15 trên tổng số 21 protein thuộc ba họ TF c sự tập trung nhiều Met

quanh v ng bảo thủ, đặt ra giả thuyết về vai tr của gốc Met trong việc giúp phân tử

protein đáp ứng lại điều kiện ngoại cảnh bất lợi.

- Phân tích đặc tính lý h a cho thấy các TF giàu Met đều ƣa nƣớc, hầu hết đều không ổn

định trong điều kiện in vitro. Các TF này c thể cƣ trú trong tế bào chất, ty thể hoặc trên

các hệ thống bao g i trong tế bào.

- Phân tích in silico dữ liệu phiên mã cho thấy hầu hết các gen mã h a họ TF bHLH và

bZIP c xu hƣớng biểu hiển mạnh ở ít nhất một bộ phận chính, trong khi họ TF SRF hoạt

động yếu trong điều kiện thƣờng. Trong điều kiện mặn, một số thành viên của họ TF

bHLH và SRF c đáp ứng ở rễ, trong khi tất cả các gen mã h a TF bZIP đều đƣợc tăng

cƣờng biểu hiện ở rễ xử lý mặn.

4.2. Đề nghị

- Nghiên cứu này s tiếp tục đƣợc thực hiện nh m kiểm chứng b ng thực nghiệm những

phân tích tin sinh học về mức độ đáp ứng của các gen mã h a TF trong điều kiện bất lợi ở

đậu tƣơng.

LỜI CẢM ƠN: Nghiên cứu này đƣợc thực hiện từ kinh phí của đề tài nghiên cứu cơ bản

mã số 08/HĐƢT-KHCN do Đại học Sƣ phạm Hà Nội 2 tài trợ.

TÀI LIỆU THAM KHẢO

[1]

G. Kim, S.J. Weiss, R.L. Levine (2014), "Methionine oxidation and reduction in

proteins", Biochim Biophys Acta, 1840(2): 901-905.

[2]

J.T. Brosnan, M.E. Brosnan (2006), "The sulfur-containing amino acids: an

overview", J Nut, 136(6 Suppl): 1636s-1640s.

[3]

H.D. Chu, Q.N. Le, H.Q. Nguyen, D.T. Le (2016), "Genome-wide analysis of

genes encoding methionine-rich proteins in Arabidopsis and soybean suggesting

their roles in the adaptation of plants to abiotic stress", Int J Genomics, 2016:

e5427062.

[4]

S. Kumar, G. Stecher, K. Tamura (2016), "MEGA7: Molecular evolutionary

genetics analysis version 7.0 for bigger datasets", Mol Biol Evol, 33(7): 1870-1874.

[5]

T.A. Hall (1999), "BioEdit: A user-friendly biological sequence alignment editor

and analysis program for Windows 95/98/NT", Nucleic Acids Symp Ser, 41: 95-98.

[6]

E. Gasteiger, A. Gattiker, C. Hoogland, I. Ivanyi, R.D. Appel, A. Bairoch (2003),

"ExPASy: The proteomics server for in-depth protein knowledge and analysis",

Nucleic Acids Res, 31(13): 3784-3788.

[7]

Emanuelsson, S. Brunak, G. von Heijne, H. Nielsen (2007), "Locating proteins in

the cell using TargetP, SignalP and related tools", Nat Protoc, 2(4): 953-971.

[8] M. Libault, A. Farmer, T. Joshi, K. Takahashi, R.J. Langley, L.D. Franklin, J. He,

D. Xu, G. May, G. Stacey (2010), "An integrated transcriptome atlas of the crop

model Glycine max, and its use in comparative analyses in plants", Plant J, 63(1):

86-99.

[9]

V. Belamkar, N.T. Weeks, A.K. Bharti, A.D. Farmer, M.A. Graham, S.B. Cannon

(2014), "Comprehensive characterization and RNA-Seq profiling of the HD-Zip

transcription factor family in soybean (Glycine max) during dehydration and salt

stress", BMC Genomics, 15(1): 1-25.

[10] S. Luo, R.L. Levine (2009), "Methionine in proteins defends against oxidative

stress", FASEB J, 23(2): 464-472.

[11]

J. Kiraga, P. Mackiewicz, D. Mackiewicz, M. Kowalczuk, P. Biecek, N. Polak, K.

Smolarczyk, M.R. Dudek, S. Cebrat (2007), "The relationships between the

isoelectric point and: length of proteins, taxonomy and ecology of organisms",

BMC Genomics, 8: 163.

[12] D.M. Rhoads, C.C. Subbaiah (2007), "Mitochondrial retrograde regulation in

plants", Mitochondrion, 7(3): 177-194.

ANALYSIS OF THE ROLE OF METHIONINE RESIDUES IN THE

TRANSCRIPTION FACTOR FAMILIES IN SOYBEAN (Glycine max) Chu Duc Ha1, La Viet Hong2, Le Minh Tuan1,2, Pham Phuong Thu2, Pham Thi Ly Thu1 1 Agricultural Genetics Institute, VAAS 2 Faculty of Biology - Agricultural technology, Hanoi Pedagogical University 2

SUMMARY

Methionine (Met) is considered as an important amino acid residue in the plant. The structural Met

residues were hypothesized to protect the structure of protein against the oxidative stress in the cell. In this

study, 21 Met-rich proteins, belonging to three transcription factor (TF) families, namely 'Basic helix-loop-

helix' (bHLH), 'Basic leucine zipper' (bZIP) and 'Serum response factor' (SRF), were analyzed to demonstrate

this hypothesis. As the result, the high accumulation of Met residues has been recorded in the upstream and

downstream regions close to the conserved domains of 15 MRPs. By using various bioinformatics tools, we

found that these TFs were hydrophilic and mostly unstable in the test tube. Interestingly, several TFs might

localize on the cytosol, mitochondrial or the secretory pathways. According to the public microarray

database, the majority of genes encoding TF bHLH and bZIP was up-regulated in at least one major organ in

soybean plant in the normal condition. By retrieving the previous RNA-Seq database, several genes encoding

TF bHLH and SRF were significantly altered, while all genes encoding TF bZIP were also induced in root

under the high salt stress. In the further study, the expression levels of genes encoding 21 MRPs under

various adverse environmental conditions would be validated by the experimental approach.

Keywords: Stress, soybean, Methionine, transcription factor, bioinformatics.