VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

HOÀNG THỊ HUYỀN TRANG

ỨNG DỤNG KĨ THUẬT METAGENIMICS TRONG NGHIÊN CỨU

HỆ VI SINH VẬT VÙNG RỄ CÂY CÀ PHÊ TẠI HUYỆN CƯM’GRA

TỈNH ĐĂK LĂK

LUẬN VĂN THẠC SĨ

Chuyên ngành: Sinh học thực nghiệm

Mã số: 60 42 01 14

HÀ NỘI, 2017

LỜI CAM ĐOAN

Tôi xin cam đoan bản luận văn là công trình nghiên cứu của tôi dưới sự

hướng dẫn của TS. Phạm Bích Ngọc. Các số liệu, kết quả nêu trong luận văn là

trung thực và chưa từng được công bố trong bất kỳ công trình nào khác.

Tác giả luận văn

Hoàng Thị Huyền Trang

i

LỜI CẢM ƠN

Với lòng biết ơn sâu sắc, tôi xin gửi lời cảm ơn tới TS. Phạm Bích Ngọc

đã tận tình hướng dẫn và tạo điều kiện thuận lợi, giúp đỡ tôi trong suốt quá

trình học tập, làm việc và hoàn thành luận văn.

Xin chân thành cảm ơn TS. Vũ Huyền Trang, Ths. Nguyễn Hồng Hà, Ths.

Nguyễn Khắc Hưng cùng tập thể cán bộ, nghiên cứu sinh, học viên phòng Công

nghệ tế bào thực vật, Viện Công nghệ Sinh học, Viện Hàn lâm Khoa học và công

nghệ Việt Nam đã nhiệt tình giúp đỡ, truyền đạt kinh nghiệm quý báu cho tôi

trong suốt thời gian thực hiện luận văn.

Xin chân thành cảm ơn đề tài : “Nghiên cứu metagenome của vi sinh vật

đất vùng rễ một số cây trồng ở Việt Nam: cây thuốc có củ (cây nghệ), cây công

nghiệp (cà phê) nhằm tăng năng suất và chất lượng cây trồng” do PGS. TS. Lê

Mai Hương chủ nhiệm đã hỗ trợ kinh phí và trang thiết bị trong quá trình thực

hiện luận văn.

Qua đây, tôi cũng xin gửi lời cảm ơn tới các thầy cô và ban đào tạo viện

Sinh thái và tài nguyên sinh vật đã hướng dẫn, truyền đạt kiến thức cho tôi trong

suốt thời gian học tập và nghiên cứu.

Cuối cùng tôi xin cảm ơn đến bạn bè và gia đình đã giúp đỡ, chia sẻ,

động viên tôi trong suốt quá trình học tập cũng như thực hiện luận văn.

Hà Nội, 1 tháng 11 năm 2017 Học viên Hoàng Thị Huyền Trang

ii

MỤC LỤC

MỞ ĐẦU ............................................................................................................... 1

CHƯƠNG 1: TỔNG QUAN TÀI LIỆU ............................................................... 3

1.1. Cây cà phê và tình hình sản xuất cà phê .................................................... 3

1.1.1. Nguồn gốc,phân bố cây cà phê ............................................................... 3

1.1.2. Tình hình sản xuất cây cà phê tại Việt Nam ....................................... 3

1.2. Hệ vi sinh vật đất và ý nghĩa đối với sinh trưởng, phát triển của cây trồng

........................................................................................................................... 5

1.2.1. Giới thiệu về hệ vi sinh vật ................................................................. 5

1.2.2. Vi sinh vật đất vùng rễ ........................................................................ 6

1.3. Công nghệ metagenomics và ứng dụng nghiên cứu đa dạng di truyền của

các hệ vi sinh vật đất ......................................................................................... 8

1.4. Các bước ứng dụng công nghệ Metagenomics trong nghiên cứu da dạng

khu hệ sinh vật từ môi trường ........................................................................... 9

1.5. Ứng dụng đọc trình tự gen thế hệ mới trong nghiên cứu metagenomics 14

1.5.1. Công nghệ đọc trình tự bán dẫn ion .................................................. 15

1.5.2. Công nghệ giải trình tự Illumina (Solexa) sequencing ..................... 17

1.6. Các nghiên cứu metagenomics trên thế giới và Việt Nam ...................... 21

1.6.1. Các nghiên cứu metagenomics trên thế giới ..................................... 21

1.6.2. Các nghiên cứu metagenomics tại Việt Nam .................................... 22

CHƯƠNG 2. VẬT LIỆU – PHƯƠNG PHÁP .................................................... 25

2.1. Vật liệu nghiên cứu .................................................................................. 25

2.2. Phương pháp nghiên cứu .......................................................................... 25

2.2.1. Phương pháp thu mẫu ....................................................................... 25

2.2.2. Phương pháp tách chiết DNA tổng số ............................................... 26

2.2.4. Khuếch đại vùng 16S rRNA ............................................................. 28

2.2.5. Tinh sạch sản phẩm PCR .................................................................. 29

2.2.6. Gắn Index (Nextera XT Index kit) .................................................... 29

iii

2.2.7. Tinh sạch sản phẩm gắn Index .......................................................... 31

2.2.8. Đánh giá thư viện .............................................................................. 31

2.2.9. Biến tính thư viện và giải trình tự trên máy Miseq ........................ 31

2.2.10. Phân tích dữ liệu .......................................................................... 33

2.2.11. Phương pháp xác định tuyến trùng ............................................. 35

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ...................................................... 36

3.1.

Phân tính đặc điểm lý hóa và sinh học chung của các mẫu ................ 36

3.2. Kết quả tách chiết DNA tổng số. ........................................................ 39

3.3. Chuẩn bị thư viện và gắn adapter ........................................................ 40

3.4. Kết quả phân tích dữ liệu trình tự ....................................................... 41

3.5. Kết quả phân tích mức độ đa dạng quần thể vi khuẩn đất vùng rễ cây

cà phê ............................................................................................................. 42

3.5.1. Kết quả đánh giá độ đa dạng ở mức phân loại nghành .................. 43

3.5.2. Kết quả phân tích cấu trúc thành phần vi khuẩn chiếm ưu thế trong

đất vùng rễ ở mức độ phân loại lớp và họ vi khuẩn. ................................... 44

3.5.3. Kết quả phân tích cấu trúc hệ vi khuẩn đất vùng rễ ở mức độ chi . 47

3.5.4. Kết quả phân tích thành phần một số loài vi khuẩn đặc trưng của hệ

vi sinh vật đất vùng rễ cây cà phê. .............................................................. 49

KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................. 51

1. Kết luận ....................................................................................................... 51

2. Kiến nghị ..................................................................................................... 51

TÀI LIỆU THAM KHẢO ................................................................................... 53

iv

DANH MỤC CÁC BẢNG

Bảng 3.1. Bảng thống kê thành phần hữu cơ của 4 mẫu đất nghiên cứu ............ 38

Bảng 3.2. Nồng độ và độ tinh sạch 4 mẫu DNA tách từ đất ............................... 40

Bảng 3.3: Thống kê dữ liệu trình tự thu được sau bước giải trình tự ................. 41

DANH MỤC CÁC HÌNH

Hình 1.1. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina .......... 20

giai đoạn 1: tổng hợp ........................................................................................... 20

Hình 1.2. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina .......... 20

Hình 2.1. Vị trí tiến hành thu mẫu tại một khu vực nghiên cứu ......................... 26

Hình 2.2. Quy trình khuếch đại và giải trình tự vùng 16S rRNA ....................... 28

Hình 2.3. Bố trí các ống mẫu .............................................................................. 30

Hình 2.4. Quy trình phân tích sử dụng công cụ QIIME ..................................... 34

Hình 3.1: Hình ảnh cây cà phê tái canh bệnh và cà phê kinh doanh tại khu vực

thu mẫu thí nghiệm. Cây cà phê tái canh bệnh (A) và mẫu rễ (C); Cây cà phê

kinh doanh (B) và mẫu rễ (D) ............................................................................. 36

Hình 3.2. Biểu đồ thể hiện thành phần loài tuyến trùng trong mẫu đất tại khu vực

nghiên cứu ........................................................................................................... 37

Hình 3.3. Kết quả điện di kiểm tra sản phẩm tách DNA tổng số ....................... 39

của 4 mẫuđất nghiên cứu ..................................................................................... 39

Hình 3.4. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm khuếch đại bằng cặp

mồi 16S ................................................................................................................ 40

Hình 3.4. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm gắn index ................ 41

Hình 3.5: Rarefaction curve dựa trên dữ liệu trình tự của bốn hệ vi sinh vậtcác

OTU 0,1 ............................................................................................................... 42

Hình 3.6: Cấu trúc quần thể vi sinh vật ở mức độ ngành.................................... 43

Hình 3.7. Cấu trúc quần thể vi sinh vật ở mức độ lớp ........................................ 45

v

Hình 3.8. Cấu trúc quần thể vi sinh vật ở mức độ họ ......................................... 46

Hình 3.9. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có lợiở mức độ chi ..... 47

Hình 3.10. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi .... 49

Hình 3.11. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài ... 49

Hình 3.12. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài ... 50

vi

DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT

TCT

: Tái canh tốt

TCB

: Tái canh bệnh

NSC

: Năng suất cao

NSTB

: Năng suất trung bình

OM

: Hữu cơ tổng số

Nts

: Nitơ tổng số

Pts

: Photpho tổng số

Kts

: Kali tổng số

Pdt

: Photpho dễ tiêu

Kdt

: Kali dễ tiêu

vii

MỞ ĐẦU

Quần thể sinh vật (archaeal, vi khuẩn, nấm, tuyến trùng) quanh hệ rễ thường tạo nên

sinh thái điển hình và đặc trưng cho từng loài thực vật, đóng vai trò quan trọng trong sinh

trưởng và phát triển của cây. Các sinh vật này có thể cung cấp các chất dinh dưỡng, các chất

kích thích cho việc tăng cường phát triển của cây và ngăn ngừa sâu bệnh hoặc giúp cây

chống chịu với các điều kiện bật lợi như nóng, lạnh, muối và hạn hán.

Cà phê là cây công nghiệp dài ngày, là một trong những cây chủ lực mang lại

hiệu quả kinh tế cao cho ngượi trồng và cho kinh tế chung cho cả nước. Năm 2012

Việt Nam đã vượt qua Brasil trở thành quốc gia đứng đầu thế giới về xuất khẩu cà phê.

Lượng cà phê xuất khẩu tăng liên tục hàng năm. Năm 2016, Việt Nam xuất khẩu 1,78

triệu tấn với kim ngạch 3,34 tỷ USD, tăng 32,8% về khối lượng và tăng 24,7% về giá

trị so với năm 2015. Tuy nhiên do tập trung vào tăng sản lượng nên các vùng đất trồng

cà phê đang bị khai thác quá mức, gây ô nhiễm nguồn nước, đất bị xói mòn, bạc màu,

phát sinh dịch bệnh, tạo điều kiện cho các vi sinh vật kháng thuốc trừ sâu…. Vấn đề

nghiên cứu có tính hệ thống các sinh vật (có lợi và có hại, cộng sinh và ký sinh…) và

nguồn gen của chúng trong đất và trên cây trồng ở các vùng canh tác hiệu quả sẽ là cơ

sở khoa học định hướng, xây dựng các giải pháp cải tạo hiệu quả khu hệ sinh vật, góp

phần thúc đẩy phát triển cây cà phê một cách bền vững.

Hiện nay, metagenomics (phân tích DNA của các vi sinh vật trong môi trường

mà không cần nuôi cấy) là công nghệ mới, kết hợp các kỹ thuật công nghệ sinh học

khác nhau từ công nghệ gen, giải trình tự đến đến tin sinh học để nghiên cứu thành

phần, chức năng và động học của quần thể vi sinh vật. Các dữ liệu thu được từ nghiên

cứu metagenomics có thể cho phép phát hiện các đối tượng vi sinh vật gây bệnh, dự

báo được dịch bệnh để có các biện pháp phòng trừ hiệu quả. Việc đánh giá được đa

dạng của quần thể vi sinh vật trong đất canh tác, xác định được các nhóm vi sinh vật

có lợi, có hại… sẽ làm cơ sở để nghiên cứu các chế phẩm sinh học nhằm cải tạo đất,

kích thích các vi sinh vật có lợi, tăng cường sức đề kháng chống chịu, tăng năng suất,

chất lượng của cây trồng.

1

Xuất phát từ những phân tích trên chúng tôi tiến hành đề tài nghiên cứu “Ứng

dụng kĩ thuật metagenomics trong nghiên cứu hệ vi sinh vật vùng rễ cây cà phê tại

huyện Cư M’gra tỉnh Đăk Lăk”.

Mục tiêu nghiên cứu

Đánh giá được cấu trúc hệ vi khuẩn đất vùng rễ cây cà phê và bước đầu

khảo sát tác động của hệ vi sinh vật đến sinh trưởng và phát triển của cây cà phê

tại tỉnh Đăk Lăk.

Nội dung nghiên cứu

- Tách chiết DNA tổng số từ các mẫu đất nghiên cứu.

- Giải trình tự phân đoạn 16S ribosome bằng kỹ thuật metagenomics

- Xác định và so sánh thành phần nghành, lớp, họ, chi, loài của hệ vi

khuẩn đất vùng rễ cây cà phê.

Địa điểm nghiên cứu

Phòng Công nghệ Tế bào Thực vật – Viện Công nghệ Sinh học – Viện

Hàn lâm và Khoa học Việt Nam

2

CHƯƠNG 1: TỔNG QUAN TÀI LIỆU

1.1. Cây cà phê và tình hình sản xuất cà phê

1.1.1. Nguồn gốc,phân bố cây cà phê

Cây cà phê có nguồn gốc từ châu Phi cận nhiệt đới và phía Nam châu Á, thuộc họ

Rubiaceae. Về hình thái, cây cà phê là cây bụi luôn xanh hoặc cây nhỏ có thể cao tới 5

m. Lá có màu xanh đậm và bóng, thường dài 10-15 cm và rộng 6,0 cm, hoa trắng,

thơm. Quả cà phê có hình oval, dài khoảng 1,5 cm, khi chưa chín có màu xanh, chín

dần thành màu vàng, sau đó đỏ thắm và đen . Mỗi quả thường có 2 hạt nhưng đến 5-

10% số quả chỉ có 1 hạt. Quả chín trong khoảng từ 7-9 tháng. Hai loài cà phê chính

được trồng phổ biến là Coffea canephora (thường được gọi là “robusta”) và C.

arabica. Trong các loài cà phê đang được trồng trên thế giới, C. arabica là loài được

đánh giá cao nhất, có nguồn gốc từ vùng cao nguyên phía tây nam của Ethiopia, cao

nguyên Boma ở phía đông nam Sudan, và Mount Marsabit ở phía bắc Kenya. C.

canephora có nguồn gốc Guinea Uganda và miền nam Sudan. Các loài cà phê phổ

biến hơn là C. liberica, C. excelsa, C. stenophylla, C. mauritiana, và C. racemosa

(vi.wikipedia.org/wiki/Cà_phê).

1.1.2. Tình hình sản xuất cây cà phê tại Việt Nam

Theo VIFOCA, niên vụ 2015-2016 (tính từ ngày 1/10/2015-30/9/2016), Việt Nam

xuất khẩu được gần 1,75 triệu tấn cà phê, đạt kim ngạch 3,16 tỷ USD, tăng 34,8% về

lượng và tăng 17,2% về kim ngạch. Đây là niên vụ có khối lượng xuất khẩu cao nhất

trong 3 năm qua. Đó cũng là nguồn thu nhập chủ yếu của 540.000 hộ nông dân với

hơn 1,6 triệu lao động ở vùng sâu, vùng xa, nhất là ở Tây Nguyên. Cà phê Việt Nam

được trồng chủ yếu tại Lâm Đồng, Đăk Lăk, Gia Lai và Đắc Nông.

Với ý nghĩa kinh tế to lớn từ xuất khẩu hàng năm tăng liên tục của các sản phẩm cà

phê đã đưa Việt Nam trở thành một trong những quốc gia xuất nông sản lớn nhất trên

thế giới. Tuy nhiên, do năng suất cà phê Việt Nam quá cao, khai thác quá mức nên cây

cà phê, quá trình đầu tư thâm canh quá mức trong điều kiện không có cây che bóng,

thoái hoá đất, sâu bệnh gây hại…làm cây cà phê nhanh chóng kiệt quệ, già cỗi. Theo

TS. Lê Ngọc Báu, Viện trưởng Viện Khoa học kỹ thuật nông lâm nghiệp Tây Nguyên,

năm 1980, cả nước có 22.500 ha cà phê, năng suất bình quân 0,78 tấn/ha, sản lượng

3

8.400 tấn; nhưng nay diện tích trên 600.000 ha, sản lượng 1,5 triệu tấn/năm, năng suất

từ 2,3 – 2,5 tấn/ha. So với năm 1980, sản lượng cà phê tăng trên 180 lần, năng suất

tăng 3 lần năm 2013. Theo thống kê của Cục Trồng Trọt năm 2013, cả nước có trên

80.000 ha cà phê trên 20 năm tuổi và khoảng 40.000 ha cà phê dưới 20 năm nhưng đã

có biểu hiện già cỗi, sinh trưởng kém, nhiều cành không cho quả; tổng diện tích cà phê

già cần phải trồng thay thế và chuyển đổi trong 5 – 10 năm tới khoảng 140.000 –

160.000 ha, chiến gần 30%, tập trung tại 2 tỉnh Đắk Lăk và Lâm Đồng (Theo Cục

Trồng trọt-Bộ Nông nghiệp và phát triển nông thôn; giacaphe.com, 2013). Tỉnh Đăk

Lăk có trên 185.000 ha cà phê, mỗi năm cho thu hoạch từ 380.000 tấn trở lên với trên

51% diện tích cà phê đã hơn 15 tuổi, cho năng suất thấp dần (theo ông Nguyễn Văn

Sinh, Phó giám đốc Sở NN&PTNT tỉnh Đăk Lăk).

Tương tự, tỉnh Lâm Đồng có khoảng hơn 40.000 ha cà phê có độ tuổi từ 15-30 năm,

(chiếm hơn 27% tổng diện tích cà phê của tỉnh) cần được tái canh. Theo Bộ NN-

PTNT, hiện nay, diện tích cà phê già cỗi cần phải trồng thay thế và chuyển đổi trong 5

– 10 năm tới khoảng 140 – 160 nghìn ha (chiếm trên 20% diện tích cà phê của toàn

vùng). Trong đó diện tích cà phê trên 20 năm tuổi hiện có trên 86 nghìn ha, chưa kể

khoảng 40 nghìn ha cà phê dưới 20 tuổi nhưng đã có biểu hiện già cỗi cho năng suất

và chất lượng thấp.

Việc đẩy mạnh tái canh, thay thế vườn cây già cỗi đang đứng trước không ít trở

ngại cho ngành cà phê Việt Nam do kỹ thuật và chi phí trong quá trình tái canh. Việc

tái canh cây cà phê chi phí rất cao, tỷ lệ sâu bệnh cũng rất lớn, đặc biệt nghiêm trọng là

bệnh tuyến trùng hại rễ - một trong những khó khăn chính ảnh hưởng nghiêm trọng

đến sản xuất cà phê trên thế giới. Các nhóm tuyến trùng phổ biến nhất và gây hại nhiều

nhất trên cà phê là Meloidogyne và Pratylenchus [10]. Tại Việt Nam các loài tuyến

trùng Pratylenchus coffea and Meloidogyne spp. and Radopholus arabocoffea được

biết đến là tác nhân chính gây hại cho 24%, 9% and 12% các mẫu rễ cà phê được phân

tích. Tại Việt Nam vào những năm 1970, tuyến trùng Pratylenchus coffeae đã làm suy

yếu và chết hàng loạt các vườn cà phê chè tại Phủ Quỳ - Nghệ An. Đến năm 1994,

hiện tượng vàng lá do các bệnh hại rễ xuất hiện phổ biến tại một số tỉnh trồng cà phê

của tỉnh Đăk Lăk và sau đó là các vùng trồng khác của Tây Nguyên, gây hại hàng trăm

4

ha cà phê tại Đăk Lăk. Năm 1997, ở Đăk Lăk có trên 3.000 ha cà phê bị vàng lá, trong

đó có gần 50% diện tích vàng lá do các bệnh hại rễ. Gần đây nhất, trong năm 2008 tại

vùng Phủ Quỳ - Nghệ An đã có gần 100 ha cà phê chè Catimor đưọc trồng lại trên đất

cà phê được thanh lý cũng đã bị tuyến trùng gây hại và chết hàng loạt. Tuyến trùng có

thể gây tác hại trong thời kỳ vườn ương nhưng chủ yếu là ở trên đồng ruộng. Cây cà

phê bị tuyến trùng thường sinh trưởng kém, mùa khô thường bị vàng héo, cây bị nặng

có thể chết khô ngay ở trên lô trồng. Triệu chứng của tuyến trùng gây vết thương là

làm cho rễ bị sưng u, có những đường nứt nẻ. Còn tuyến trùng gây nốt sần chỉ ở trên

các rễ phụ có những u dạng nốt sần.

Việc phòng trừ nhóm tuyến trùng gây hại rất khó khăn ngay cả khi sử dụng các biện

pháp hóa học, sinh học. Ngoài ra các biện pháp canh tác để hạn chế nhóm tuyến trùng

được sử dụng như việc để đất hoang hóa một thời gian dài trước khi canh tác mới hay

luân canh đều không mang lại hiệu quả cao do ảnh hưởng trực tiếp đến thu nhập kinh

tế của người trồng cà phê. Đây là vấn đề nan giải đòi hỏi các biện pháp giải quyết triệt

để nhằm đảm bảo sự phát triển ổn định và bền vững của ngành cà phê Việt Nam.

Các nghiên cứu gần đây cho thấy chất đất và hệ vi sinh vật tồn tại trong đất là một

trong những nguyên nhân cơ bản tác động đến sự phân bố của tuyến trùng. Số lượng

và thành phần của tuyến trùng khác nhau trong các mẫu đất có đặc điểm khác nhau.P.

Q. Trinh và đồng sự đã xác định rằng tuyến trùng thuộc nhóm Meloidogyne spp. được

tìm thấy nhiều trong đất sét, trong khi nhóm tuyến trùng R. arabocoffeaetập trung chủ

yếu trong đất cát và đất mùn và Pratylenchus spp. tồn tại với số lượng lớn trong đất cát

(P.Q.Trinh et al., 2009). Nhóm tác giả này cũng chỉ ra rằng trong điều kiện nhà kính vi

khuẩn Pasteuria penetrans có khả năng hạn chế đáng kể số lượng tuyến trùng trong

đất trồng cà phê (P.Q.Trinh et al., 2009).

1.2. Hệ vi sinh vật đất và ý nghĩa đối với sinh trưởng, phát triển của cây trồng

1.2.1. Giới thiệu về hệ vi sinh vật

Vi sinh vật (VSV) có vai trò quan trọng trong các chu trình sinh thái như hình thành

cấu trúc đất, phân hủy chất hữu cơ, tham gia chu trình chuyển hóa các nguyên tố, chất

quan trọng (C, N, P, K…) và các chất dinh dưỡng khác. Chúng cũng tham gia kìm

hãm sự phát triển bệnh ở cây, tăng sinh trưởng cho cây giúp cây thích ứng với môi

5

trường. Nhóm VSV sống tự do trong đất lại có vai trò đặc biệt quan trọng trong việc

tạo nên độ màu mỡ, độ phì của đất. Chúng đảm bảo trạng thái cân bằng cho cây trong

môi trường đất. Một số VSV thuộc nhóm này có khả năng chuyển hóa các chất trong

đá mẹ thành đất và cung cấp chất dinh dưỡng cho cây, trong đó có những loại chuyển

hóa lân (P) và kali (K). Nhóm VSV vùng rễ là đội ngũ "vệ sinh viên" đông đảo và cần

mẫn. Chúng giúp cây phân hủy các chất hữu cơ, các chất cặn bã do cây bài tiết ra, các

chất này thường là không cần thiết đối với cây, có độc cho cây. Các loại VSV này

phần lớn là các loại đối kháng, chúng luôn cạnh tranh với các loại VSV, tuyến trùng...

gây bệnh cho cây ở trong đất và do đó tránh cho cây được nhiều loại bệnh. Mặt khác

thông qua quá trình phân hủy các chất hữu cơ, chúng cung cấp cho cây những chất

dinh dưỡng cần thiết như P, Ca, Cu, Fe...

Hệ vi sinh vật tồn tại xung quanh cây trồng đóng vai trò hết sức quan trọng lên năng

suất và chất lượng cây trồng [35] [66]. Nhìn chung, trong mối quan hệ với cây trồng,

VSV có thể cộng sinh (có lợi) hoặc gây bệnh (hại) cho cây. Vi sinh vật cộng sinh có

thể sống chung với cây trồng trong những mối quan hệ rất khăng khít và là một phần

không thể thiếu giúp cây trồng sinh trưởng và phát triển tốt. Một ví dụ cho mối quan

hệ trên là các VSV Rhizobium sp. trong nốt sần rễ cây họ Đậu Fabaceae, có vai trò

quan trọng trong quá trình cố định nitơ cho cây.

Các VSV gây bệnh cho cây đã từ lâu được xác định là khá nhiều về số lượng và

thường gây ra nhiều thiệt hại cho nông nghiệp. Tuy nhiên, cho đến nay người ta còn

nhìn nhận nhóm VSV này tương đối phiến diện. Người ta chỉ thấy gây hại mà quên

mất vai trò của nó trong các chu trình chuyển hóa vật chất, trong cân bằng sinh thái.

Trong các hệ sinh thái, chính các mối quan hệ giữa các mối quan hệ giữa các loại VSV

trong nhiều trường hợp mang ý nghĩa quyết định đối với trạng thái cân bằng, với sự

tốn tại và phát triển của các hệ đó.

1.2.2. Vi sinh vật đất vùng rễ

Vi sinh vật vùng rễ nói chung và nấm rễ nói riêng có ý nghĩa rất quan trọng trong

đời sống của thực vật ở cạn. Tập hợp vi sinh vật bao gồm vi khuẩn và nấm trong vùng

rễ có thể có ích hoặc gây hại cho cây [2][60]. Chúng có vai trò thực tiễn trong nền kinh

tế, khoa học và các chu trình vật chất, năng lượng trong tự nhiên. Các nấm cộng sinh

6

hình thành rễ nấm (mycorrhiza) cộng sinh với thực vật có thể ứng dụng trong lâm

nghiệp, đặc biệt trong việc trồng rừng, như Pisolithus tinctorius hình thành rễ nấm

ngoại dinh dưỡng (ectomycorrhiza) cộng sinh với cây thông nhựa (chi Pinus) hoặc cây

bạch đàn (chi Eucalyptus), giúp gia tăng tỷ lệ sinh trưởng của cây P. tinctorius hình

thành rễ nấm cộng sinh chặt chẽ với rễ cây thông, giúp cây tăng cường sự hấp thụ vận

chuyển các yếu tố dinh dưỡng như: N, P, K, Ca... nên nó được ứng dụng trong các dự

án tái sinh hoặc trồng mới các rừng thông nhựa, bạch đàn ở các vùng đất nghèo dinh

dưỡng hay đất cát. Bởi vậy, chúng ta có thể chọn lọc các vi sinh vật có ích và chủ động

bón cho đất và vùng môi trường rễ nhằm mục đích tăng cường các hoạt động có lợi

cho nông nghiệp theo định hướng như cải thiện tính ổn định đất, kìm hãm sinh vật có

hại cho cây và giúp cây phát triển tốt [36] [38] [52].

Đất trồng tự nhiên đều có khả năng ngăn chặn các tác nhân gây bệnh trong một mức

độ nhất định, điều này được chứng minh bằng các so sánh mức độ nhiễm bệnh khi tiến

hành gây nhiễm bệnh nhân tạo trên đất tiệt trùng và đất không tiệt trùng. Quá trình ức

chế bệnh tự nhiên này được cho là có liên quan đến hoạt động của cộng đồng vi sinh

vật. Việc thay đổi hữu cơ có thể kích thích hoạt động của hệ vi sinh vật trong đất trồng

và kết quả là tăng cường khả năng ức chế bệnh tự nhiên của đất trồng. Ức chế chọn lọc

là quá trình xảy ra khi một số vi sinh vật nhất định trong đất ức chế một loại tác nhân

gây bệnh. Quá trình ức chế chọn lọc xảy ra đồng thời với ức chế tự nhiên của đất sẽ

làm tăng hiệu quả ức chế bệnh. Tuy nhiên có rất ít trường hợp các nhà khoa học có thể

phân lập từ đất các vi sinh vật có khả năng ức chế tác nhân gây bệnh. Sau nhiều thập

kỷ nghiên cứu, các nhà bệnh lý học thực vật đã phát hiện ra rằng các hệ vi sinh vật cực

kỳ phức tạp đóng vai trò ức chế tác nhân gây bệnh, các nghiên cứu chỉ ra rằng các

phức hệ vi sinh vật này có thể góp phần vô cùng hữu ích cho sản xuất nông nghiệp.

Không một vi sinh vật riêng lẻ nào được phân lập lại có khả năng tương tự, điều này

cho thấy tác động qua lại, hỗ trợ nhau trong quá trình ức chế tác nhân gây bệnh của các

thành viên trong hệ vi sinh vật đất. Qua đó có thể nhận thấy tiềm năng của hệ vi sinh

vật đất là rất lớn và nghiên cứu thành công hệ vi sinh vật này hứa hẹn mang lại nhiều

thành tựu to lớn trong lĩnh vực sản xuất các chế phẩm sinh học như phân bón vi sinh

hay tác động đến hệ vi sinh vật đất nhằm cải thiện và nâng cao chất lượng cây trồng.

7

Hệ vi sinh vật trong đất được đánh giá là có mức độ đa dạng loài phong phú nhất

trong các hệ vi sinh vật đã được nghiên cứu từ trước tới nay [16]. Trong 1 gam đất

vùng rễ có thể chứa tới 1011 tế bào vi sinh vật và hơn 30,000 loài prokaryote [40]. Hệ

genome của cộng đồng vi sinh vật này lớn hơn nhiều so với genome của thực vật và

còn được gọi là bộ gen thứ hai của thực vật. Thực tế đãc ho thấy, thực vật không thể

tồn tại và phát triển nếu thiếu hệ vi sinh vật đất. Trên một số môi trường đất, cây trồng

vẫn phát triển tốt ngay cả khi tồn tại các tác nhân gây bệnh ở mật độ cao. Tác động của

hệ vi sinh vật trong đất lên sinh trưởng và phát triển của thực vật được thể hiện rõ ràng

nhất qua quá trình ức chế tác nhân gây bệnh: khi đất được tiệt trùng, các tác nhân ức

chế bệnh cũng biến mất.

1.3. Công nghệ metagenomics và ứng dụng nghiên cứu đa dạng di truyền của các hệ vi sinh vật đất

Các nghiên cứu từ trước cho thấy rằng phần lớn các vi sinh vật tồn tại trong môi

trường xung quanh chúng ta không thể nuôi cấy trên môi trường nhân tạo trong phòng

thí nghiệm và do đó không thể xác định trình tự DNA cũng như nghiên cứu phân tích

[1]. Những nghiên cứu đầu tiên về metagenomics đã tập trung phân tích trình tự 16S

rRNA, những trình tự này thường ngắn, mang tính bảo thủ cao trong cùng một loài và

khác nhau giữa các loài [64][6]. Các nhà khoa học đã phát hiện nhiều trình tự 16S

rRNA được tìm thấy không thuộc về bất kỳ loài nào đã được phân lập trước đây. Điều

này cho thấy rằng đã có rất nhiều loài vi sinh vật bị bỏ sót không được nghiên cứu đến.

Phân tích trình tự các đoạn 16S rRNA thu trực tiếp từ môi trường tự nhiên cho thấy

rằng bằng phương pháp nuôi cấy truyền thống, chúng ta chỉ có thể nghiên cứu được

khoảng 1% số lượng các loài vi sinh vật tồn tại trong mẫu tự nhiên thu được [23].

Theo Amann và các đồng sự, bằng các phương pháp vi sinh truyền thông chỉ có thể

nuôi cấy khoảng 0.001–0.1% các loài vi sinh vật biển, 0.25% loài vi sinh vật nước

ngọt, 0.25% trong trầm tích và chỉ 0.3% sinh vật đất [1].

Việc phân lập và nuôi cấy trên môi trường nhân tạo là những phương pháp truyền

thống thường được sử dụng để nghiên cứu phân tích vi sinh vật, tuy nhiên hơn 99% vi

sinh vật không thể được phân lập và nuôi cấy theo các phương pháp này, do đó hiện

nay mới chỉ có một phần rất nhỏ các gen và các vi sinh vật được nghiên cứu đến. Để

khắc phục các hạn chế của các phương pháp trên, các nhà nghiên cứu đã đề xuất

8

phương pháp tách chiết và phân tích thông tin di truyền (chủ yếu là DNA) trực tiếp từ

mẫu đất. Theo lý thuyết, DNA tách chiết được từ một mẫu đất mang thông tin di

truyền của tất cả các vi sinh vật tồn tại trong hệ vi sinh vật mẫu đất đó. Do trong đất

thường tồn tại các hợp chất liên kết với phân tử DNA, cản trở các phản ứng hóa học

của phân tử này, việc tinh sạch loại bỏ các hợp chất này là một khâu cực kỳ quan trọng

cho các bước phân tích sau này [49][13]. Sau bước tinh sạch DNA việc phân loại các

vi sinh vật đất có thể thực hiện bằng cách nhân bản các đoạn gen 16S RNA nhờ phản

ứng PCR. Bằng cách này có thể phân tích mức độ đa dạng của hệ vi sinh vật đất, so

sánh các hệ vi sinh vật của các mẫu đất khác nhau, cũng như nghiên cứu sự thay đổi về

cấu trúc khi có tác động của các yếu tố bên ngoài. Ngoài 16S rRNA một số gen khác

cũng được sử dụng để nghiên cứu đánh giá đa dạng di truyền của vi sinh vất đất như

dnaK (HSP-70-type molecular chaperone) và amoA (ammonia monooxygenase).

“Metagenomics” xuất phát từ ý tưởng cho rằng nghiên cứu phân tích thông tin di

truyền của một hệ sinh vật (thường là vi sinh vật) có thể thực hiện tương tự như việc phân

tích thông tin di truyền của một cá thể đơn lẻ. Công nghệ metagenomics ra đời đã khắc

phục được những hạn chế của các phương pháp truyền thống, hướng sự tập trung nghiên

cứu vào các vi sinh vật chưa được chú ý đến. Bằng cách phân lập và nghiên cứu trực tiếp

genome của toàn bộ các vi sinh vật tồn tại trong một môi trường nghiên cứu, ta có thể có

thông tin di truyền của hệ vi sinh vật ở đó mà không cần phải phân lập và nuôi cấy từng tế

bào riêng lẻ.

1.4. Các bước ứng dụng công nghệ metagenomics trong nghiên cứu da dạng khu

hệ sinh vật từ môi trường

Các bước ứng dụng công nghệ metagenomics trong nghiên cứu da dạng khu hệ sinh

vật từ môi trường có thể chia thành ba phần chính như sau:

Phần 1: Giải trình tự

Từ những năm 70 của thế kỷ trước, trình tự DNA toàn bộ hệ gene của sinh vật đầu

tiên được giải mã là của thể thực khuẩn Bacteriophage fX174 trên vi khuẩn

Escherichia coli (dài chỉ 5,368 bp, gồm 11 gene). Đến đầu những năm 90, hệ gene của

Saccharomyces cerevisiae (nấm men, dài khoảng 12,5 triệu bp, gồm 5770 gene), sinh

vật đa bào đơn giản nhất được giải mã toàn bộ (kích thước lưu trữ 12,8 Mb), tạo tiền

9

đề cho chương trình giải mã hệ gene người (dài 3,3 tỷ bp, gồm khoảng 21,000 gene,

kích thước 3,000 Mb) thành công năm 2003.

Những tiến bộ về chi phí cho giải trình tự và thời gian giải trình tự trung bình (vd.

Theo thống kê của National Human Genome Research Institute, giải trình tự hệ gene

người cần 95 triệu USD (01/2001), đến tháng 01/2012 đã giảm xuống còn 7,666 USD)

được đánh giá là một trong những thành tựu khoa học lớn nhất trong lịch sử nhân loại,

mở ra một chương mới trong nghiên cứu sinh học, y học và dược học. Đến nay, những

dự án giải trình tự hàng nghìn hệ gene người hay các quần thể vi sinh vật đã trở nên rất

khả thi. Nghiên cứu metagenomics ra đời và phát triển được trước hết nhờ có những

kỹ thuật giải trình tự mới này.

Phần 2: Quản lý và phân tích metabase

Metabase được hiểu là hệ thống cơ sở dữ liệu metagenome bao gồm các thành phần

chính sau đây:

➢ Các tập dữ liệu metagenome (trình tự DNA, RNA, protein) thu được từ hệ vi sinh

vật trong mẫu.

➢ Tập dữ liệu tham chiếu: toàn bộ hệ gene của các loài vi khuẩn, virus, v.v.

➢ Các tập dữ liệu metagenome có chú giải về đa dạng phân loài, chức năng, v.v.

Metabase được lưu trữ và quản lý bởi một số viện, trung tâm nghiên cứu lớn của thế

giới. Phần lớn trong số đó cung cấp các dịch vụ miễn phí như: tiếp nhận lưu trữ, truy

vấn, thống kê, tổng kết, và môt số công cụ tính toán. Đặc điểm chung của các hệ thống

này là: (i) Dung lượng lưu trữ lớn; (ii) Dữ liệu được tổ chức theo chuẩn nhất định, sử

dụng cơ sở dữ liệu quan hệ (chuẩn thường được sử dụng nhất là của Genome

Standards Consortium (GSC)); (iii) Sử dụng những máy chủ mạnh, siêu máy tính, môi

trường tính toán song song hoặc đám mây cho các tác vụ tính toán trên dữ liệu lớn;

(iv) Phân quyền truy vấn đối với các tập dữ liệu, người dùng; (v) Cho phép tải các tập

dữ liệu lên và trả về kết quả phân tích qua Internet.

Sau đây là một số hệ thống tiêu biểu, có những điểm cần tham khảo khi thiết kế hệ

thống của Việt Nam:

10

➢ Intergrated Microbial Genomes (IMG), JGI bộ Năng lượng Mỹ: tập dữ liệu

metagenomics đất, nước biển, nước ngọt, suối nước nóng, vật chủ (cây công

nghiệp, ruột động vật), môi trường ô nhiễm.

➢ MetabioME, RIKEN, Nhật: Tập hợp các tập dữ liệu metagenomics, dữ liệu tham

chiếu (971 hệ gene vi khuẩn), v.v đã được công bố từ 10 nguồn khác nhau, như

ENZYME, Swiss-Prot, BRENDA, GenBank, v.v. và chú giải bằng tay bởi các

chuyên gia. Đặc biệt, cung cấp danh sách trên 500 enzymes có giá trị thương

mại đã được công bố quốc tế.

➢ MG-RAST, NIH, Mỹ: Lưu trữ 50,683 tập dữ liệu metagenomics (trong đó trên

10,095 miễn phí), 14.2 Tbp DNA.

➢ CAMERA, Calit2, Mỹ: Cổng thông tin hỗ trợ lưu trữ dữ liệu metagenomics thô,

đã chú giải, đã phân tích và các công cụ tin sinh mạnh được tổ chức thành một

giải pháp nhất định hoặc luồng công việc.

Phần 3: Tính toán và phân tích dữ liệu metagenome Phân tích dữ liệu metagenomics tuân theo một quy trình nhất định (analysis pipeline)

cho các loại dữ liệu khác nhau và tùy theo mục tiêu phân tích của bài toán sinh học.

Tuy nhiên, có một số tác vụ cơ bản chung, trong đó các đề tài nhánh của đề án yêu cầu

2 tác vụ đầu tiên, như sau:

➢ Sự đa dạng phân loài (taxonomic binning): Nhận diện thành phân vi sinh vật của

môi trường đang xét: nhóm sinh vật, số lượng, vị trí trên cây phân loài v.v.

➢ Sự đa dạng chức năng (functional binning): Nhận diện chức năng của các gene

có mặt trong quần thể vi sinh đang xét và vai trò của chúng trong các quá trình

sinh học như trao đổi chất (metabolic pathways) và tổng hợp (biosynthetic

pathways), v.v. Phát hiện gene mới cũng nằm trong nhóm bài toán này.

➢ Ghép hệ gene (genome assemly): Từ số lượng lớn chuỗi DNA ngắn kết quả của

quá trình giải trình tự, yêu cầu lắp ghép lại thành chromosome hoặc hệ gene gốc.

Bài toàn này đặc biệt khó do bản chất hỗn tạp và dư thừa của dữ liệu

metagenomics.

➢ So sánh các quần thể vi sinh vật (comparative metagenomics of microbial

communities): Đặc điểm của quần thể vi sinh trong các mẫu môi trường có thể

11

được so sánh, ví dụ đa dạng phân loài, chức năng, hay khả năng trao đổi chất

(metabolic capacities) nhằm tìm ra đặc trưng quy định tính chất của từng quần

thể. Do khó ghép hệ gene, các chuỗi trình tự gene có thể được so sánh trực tiếp

với nhau.

Về cơ bản, các phương pháp tính toán có thể thuộc một trong số hoặc kết hợp hai

hướng tiếp cận sau: Dựa vào đặc tính của chuỗi DNA (sequence-based): số lượng, tần

số của nucleotide, motifs v.v. là đầu vào cho các thuật toán phân loại; và Dựa vào tính

tương đồng của chuỗi DNA (homolog-based): tìm sự tương đồng với chuỗi đã được

chú giải trong cơ sở dữ liệu tham chiếu, cây phân loài (NCBI) hoặc cây/con đường

chức năng (KEGG, SEED) để gán phân nhóm hay chức năng gần nhất.

Như đã nêu trên, hai khó khăn lớn nhất cho việc tính toán trên dữ liệu metagenomics

là: độ dài chuỗi DNA đọc được và sự dư thừa trong phân loài. Do chuỗi trình tự đọc

được ngắn (short read), việc trích rút đặc tính không có nhiều ý nghĩa. Vì vậy cần thiết

phải ghép lại thành những chuỗi dài hơn (contig) với sai số nhất định. Khi giải trình tự

hệ vi sinh vật, khối trình tự thu về hỗn tạp và không biết được phân bố của các loài

(đôi khi lên đến 10,000 loài). Dư thừa (redundancy) là hệ quả của việc không thể giải

trình tự sâu quần thể vi sinh trên mẫu (lý do chi phí), thay vào đó chỉ giải trình tự ngẫu

nhiên một phần (subsample). Khi đó một số loài hiện diện với tỷ lệ quá lớn so (thường

là những loài không cần quan tâm) với số còn lại hoặc hoàn toàn bỏ qua những loài

thiểu số gây khó khăn cho cách thuật toán lắp ghép, tìm chức năng, v.v. dẫn đến kết

quả bị bóp méo (biased).

Các công cụ đã được phát triển và công bố cho metagenomics tương đối nhiều, chạy

qua giao diện web, dòng lệnh, hoặc giao diện đồ họa, v.v., có thể chia thành ba nhóm

sau:

➢ Nền tảng tính toán (platform): cung cấp khả năng đưa các công cụ, thuật toán v.v

vào dưới dạng các module chức năng, ghép nối thành các luồng giải pháp

(analysis pipeline) cho từng vấn đề cụ thể, ví dụ như: Galaxy, MG-Rast,

IMG/M, CAMERA.

12

➢ Gói phần mềm (package): tập hợp các công cụ, tiện ích trong phân tích

metagenomics, ví dụ như Qiime, MetaABC, MetabioME, MEGAN. Các gói

này được cài đặt trên nền Windows, Linux, v.v.

➢ Công cụ cho từng tác vụ riêng biệt: tìm đa dạng phân loài hoặc và đa dạng chức

năng, ví dụ như BLAST, BLASTX, BLAT, PhyloPythia, Tetra, v.v. Đây chủ

yếu là các thuật toán cơ bản được công bố quốc tế giải quyết một vấn đề nhất

định trong tính toán. Riêng BLAST và các biến thể là công cụ tìm kiếm đối

sánh quan trọng được sử dụng trong hầu hết các hệ thống và gói phần mềm.

Như vậy mặc dù gặp phải những trở ngại khó khăn ban đầu như quá trình tách DNA

khỏi các tạp chất, số lượng khổng lồ các vi sinh vật tồn tại trong môi trường đất, xây

dựng thư viện metagenomic, xác định chức năng của các gen mới v.v… nhưng cùng

với những bước phát triển đột phá trong phương pháp đọc trình tự và công cụ tin sinh

học công nghệ metagenomics hiện nay đã đạt được những thành tựu đáng kể và ngày

càng được quan tâm phát triển hơn. Ứng dụng công nghệ metagenomics đã xác định

được phần lớn các vi sinh vật có mặt trong môi trường đất, so sánh mức độ đa dạng

giữa các môi trường khác nhau, đánh giá sự thay đổi về cấu trúc thành phần của hệ vi

sinh vật dưới tác động của các tác nhân khác nhau lên môi trường. Ngày nay số lượng

lớn dữ liệu thu được từ công nghệ metagenomics đã được công bố rộng rãi, không

những tạo điều kiện thuận lợi cho các nhà khoa học nghiên cứu phân tích các gen mới

mà còn mở ra những hướng mới góp phần cải thiện nâng cao sản xuất nông nghiệp,

công nghiệp.

Nghiên cứu sử dụng kỹ thuật metagenomics và xây dựng thư viện metagenom cho

phép đánh giá đa dạng di truyền và phương pháp trao đổi chất của các vi sinh vật

không thể nuôi cấy trong quần thể vi sinh vật [19, 24].Các vector tách dòng thích hợp

cho nghiên cứu metagenomics bao gồm BAC, cosmid và plasmid. Phân tích các dòng

vô tính ở các bước tiếp theo có thể thực hiện bằng cách đọc trình tự hoặc thông qua

các công cụ sàng lọc chức năng. Việc phân tích dựa trên kết quả đọc trình tự có thể

tiến hành theo phương pháp shotgun metagenome hoặc touchdown PCR với các cặp

mồi đặc hiệu cho các gen quan tâm [24].

13

1.5. Ứng dụng đọc trình tự gen thế hệ mới trong nghiên cứu metagenomics

Đọc trình tự gen (DNA sequencing) là việc xác định thứ tự các nucleotide gắn kết với

nhau dọc theo chiều dài của gen (DNA), và trình tự gắn kết nhau của các nucleotide

được gọi là trình tự gen. Đọc trình tự có thể xác định trình tự các gen riêng lẻ, các

vùng gen lớn, các nhiễm sắc thể hoặc toàn bộ các bộ gen. Tùy theo phương pháp sử

dụng, kết quả cho biết trình tựcủa các nucleotide trong sợi DNA hoặc RNA tách chiết

từ các tế bào động thực vật hoặc các nguồn chứa thông tin di truyền khác.

Kết quả này có nhiều ứng dụng chính như sau:

(i) Biết được trình tự nucleotide của bất cứ một đoạn DNA nào đó và đây chính là cơ

sở để các nhà khoa học có thể đọc trình tự gene hay bộ gen cho các nghiên cứu

có liên quan

(ii) Phát hiện các thay đổi của trình tự nucleotide của một đoạn DNA, tạo cơ sở cho

phát hiện các đột biến gen, các SNP, các kiểu gene, …

(iii) Định danh vi khuẩn hay vi nấm dựa trên đọc trình tự DNA của RNA ribosome

(16S của vi khuẩn và 28S của vi nấm) đặc biệt là các đối tượng khó định danh

hay không thành công nuôi cấy.

(iv) Sự khác biệt nhau từng nucleotide của các đoạn DNA được sử dụng trong xét

nghiệm dấu vân tay DNA (DNA finger printing) để nhận dạng cá nhân và mối

quan hệ cá nhân, trong phát hiện đa dạng loài…

Đọc trình tự gen thế hệ mới theo 2 nguyên lý chính sau:

Thứ nhất, đọc trình tự bằng tổng hợp (sequencing by synthesis, SBS) thường

được các thế hệ máy Roche 454, Ion Torrent và Illumina sử dụng. SBS liên quan đến

việc sử dụng một hỗn hợp các dNTP được biến đổi tại vị trí 2’. Hỗn hợp này bao gồm

các dNTP bổ sung tự nhiên và các dNTP bổ sung có đánh dấu huỳnh quang. Quá trình

xác định trình tự sẽ diễn ra tương tự như phản ứng PCR thông thường. Đầu tiên một

đoạn trình tự mồi nằm trên đoạn adapter sẽ được gắn vào phần cuối của đoạn gDNA

khuôn cần đọc trình tự. Sau đó, việc xác định trình tự được thực hiện bằng cách gắn

lần lượt từng dNTP bổ sung có đánh dấu huỳnh quangvào phần cuối của trình tự mồi

trên theo chu trình 3 bước:

14

(i) Một polymerase kết hợp với một dNTP kết thúc có đánh dấu huỳnh quang và

gắn bổ sung với base trên đoạn gen cần đọc trình tự;

(ii) Thiết bị sẽ ghi lại hình ảnh, phần mềm sẽ phân tích hình ảnh thu được để xác

định phân tử dNTP nào được kết hợpvà từ đó tìm ra được trình tự của base bổ

sung.

(iii) Nhóm kết thúc đầu 3’ và tín hiệu huỳnh quang sẽ được cắt bỏ bằng phương

pháp hóa học. SBS xác định trình tự các đoạn genome theo chiều từ đầu 5’ đến

3’.

Nguyên lý thứ hai, đọc trình tự gắn nối (sequencing by ligation, SBL) được sử

dụng ở máy SOLiD. Phương pháp xác định trình tự bằng phản ứng ghép nối (SBL):

được phát minh bởi George Church. SBL đã được sử dụng để xác định trình tự

genome và là nền tảng cho các thiết bị đọc trình tự thế hệ mới. SBL là một chu trình

tuần hoàn gồm 4 bước:

➢ Đưa vào các primer neo được thiết kế trình tự bổ sung với trình tự trên adapter.

➢ Quá trình lai của nonamers ngẫu nhiên với nhau. Mỗi hỗn hợp nonamer gồm có 4

loại nonamers, mỗi loại có các base và vị trí đã được biết đến. Các chất phát

quang khác nhau được gắn ở cuối của mỗi loại nonamer sẽ cho phép xác định

base trên nonamer.

➢ Các nonamer lai với các primer neo. Sau đó, thiết bị ghi hình và phần mềm sẽ

xác định base ở vị trí query.

➢ Primer neo, phức hệ nonamer được đọc phóng và quá trình được lặp lại cho các

vị trí query trong hỗn hợp nonamer. SBL hoạt động trong cả hai chiều: chiều

xuôi (5 'đến 3') và chiều ngược (3 'đến 5').

1.5.1. Công nghệ đọc trình tự bán dẫn ion

Khác với các công nghệ đọc trình tự khác, công nghệ đọc trình tự ion torrent sử

dụngnucleotide không bị biến đổi hoặc không sử dụng các mắt đọc. Đọc trình tự bán

dẫn ion (ion semiconductor sequencing) còn được gọi là đọc trình tự giải phóng ion

(ion torrent sequencing),đọc trình tự thông qua pH (pH-mediated sequencing), đọc

15

trình tự silicon (silicon sequencing) hoặc đọc trình tự bán dẫn (semiconductor

sequencing).

Ứng dụng chính của công nghệ này gồm: Đọc trình tự của các mẫu có nhiều chỉ

thị barcode; Đọc trình tự các thư viện đã được gắn adapter; Đọc trình tự genome của vi

khuẩn và virus; Đọc trình tự các mẫu metagenomic, RNA ngắn; Đọc trình tự các dòng

BAC …

a) Nguyên lý của công nghệ

Trong tự nhiên, sự liên kết của một dNTP vào sợi DNA liên quan sự hình thành

liên kết cộng hóa trị, đọc phóng pyrophosphate và ion hydro (Rusk, 2011;

Purushothaman et al., 2006). Một dNTP chỉ liên kết được nếu nó bổ sung với nucleotid

trên sợi khuôn.

Trong hệ thống đọc trình tự, mỗi giếng chứa có một sợi DNA khuôn vàđược

đưa vào một loại dNTP. Nếu loại dNTP này bổ sung với nucleotide trên sợi khuôn thì

nó sẽ liên kết và kéo dài sợi tổng hợp. Điều này dẫn tới sự giải phóng một ion hydro,

tạo thành một cảm ứng ion ISFET (ion-sensitive field-effect transistor) và xác định

một phản ứng đã xảy ra. Nếu trình tự sợi khuôn có sự lặp lại của một loại nucleotide,

thì sẽ có nhiều phân tử dNTP kết hợp trong cùng một chu kỳ, dẫn tới số phân tử hydro

tương ứng được giải phóng và tín hiệu điện tử tăng lên một cách tỷ lệ thuận.

b) Ưu nhược điểm của máy Ion Torrent

Độ chính xác của Ion Torrent ion semiconductor sequencer năm 2011

là99.6%trên 50 base được đọc với 100 Mb /lần chạy. Chiều dài đọc năm 2011 là 100

cặp base.Độ chính xác cho các đoạn lặp lại của đoạn 5 lặp lại là 98% [33]

Ưu điểm chính của ion semiconductor sequencing là i) đọc tốc độ đọc nhanh, ii)

chi phí vận hành và đầu tư thấp [30],iii) không dùng nucleotide biến đổi và xác định

bằng quang học. Vì hệ thống ghi lại hiện tượng liên kết nucleotide tự nhiên nên đọc

trình tự trong một thời gian thực. Tốc độ đọc trình tự chỉ bị giới hạn bởi vòng quay

nucleotides trong hệ thống Ion Torrent Systems Inc., các nhà phát minh công nghệ đã

thông báo rằng mỗi liên kết đo mất 4 giây, và mỗi lần chạy khoảng 1 giờ đọc được

100-200bp [12]. Nếu chip được nâng cấp thì số lần đọc sẽ được tăng lên [12]. Nếu

16

đoạn DNA khuôn có nhiều lần lặp nucleotide cùng loại thì sau khi liên kết có nhiều

ion hydro được giải phóng trong cùng một chu kỳ. Như vậy sự thay đổi pH cực lớn

dẫn tới tín hiệu điện tử tăng lên tương ứng [12]. Điều này là một hạn chế vì rất khó để

xác định một đoạn lặp lại. Hạn chế này cũng gặp ở trong các công nghệ khác như

pyrosequencing [41]. Tín hiệu được tạo ra từ số lặp lại cao là khó khăn để phân biệt từ

sự lặp lại của một số khác nhau nhưng tương tự, ví dụ: lặp lại của đoạn 7 khó phân biệt

với đoạn 8.

Hạn chế khác của hệ thống này là chiều dài đọc ngắn hơn các phương pháp

khác như Sanger sequencing hoặc pyrosequencing. Chiều dài đọc dài là một lợi thế

cho quá trình lắp ráp genome de novo. Chiều dài đọc đã được nâng cao bởiIon Torrent

Systems Inc. là 400 cặp base cho lần chạy [43][51]. Lượng vật liệu đưa vào thấp hơn

so với công nghệ đọc trình tự khác, mặc dù các nhà phát triển hy vọng thay đổi điều

này bằng sự tăng mật độ của chip [51].

c) Ứng dụng của máy đọc trình tự ion torrent

Đối với máy ion semiconductor sequencing nhà sản xuất nhấn mạnh ưu điểm

làđọc trình tự nhanh, liên tục và kinh tế, máy có thể sử dụng trong đa số phòng thí

nghiệm như một máy để bàn [51]. Hoặc sẽ hoạt động ở ngoài các trung tâm đặc trưng,

trong các bệnh viện và các phòng thí nghiệm nhỏ.Công nghệ này phù hợp trong các

ứng dụng nhỏ như đọc trình tự của genom vi khuẩn, đọc trình tựtranscriptome vi

khuẩn, đọc trình tự gen đích amplicon, hoặc kiểm tra chất lượng của thư viện trình tự

[51][30]. Từ khi ra đời tới nay công nghệ đọc trình tự bán dẫn ion đã được ứng dụng

trong nhiều công trình nghiên cứu, như: Dựa trên đọc trình tự DNA của rRNA để định

danh vi khuẩn hay vi nấm [25][61][66] Đọc trình tự genome [3][20][39][47][48][62];

Nghiên cứu đột biến, chức năng của gen đích [4][9][18][22]. Các nghiên cứu cũng đưa

ra được ưu nhược điểm của công nghệ [63].

1.5.2. Công nghệ giải trình tự Illumina (Solexa) sequencing

a. Nguyên lý công nghệ:

Công nghệ giải trình tự của Illumina sử dụng các array đơn dòng và công nghệ

khóa dừng thuận nghịch cho việc giải trình tự trên diện rộng với độ chính các cao. Hệ

thống giải trình tự linh hoạt, hiện đại cho phép thực hiện một loạt các ứng dụng nghiên

17

cứu genomics, transcriptomics, và epigenomics. Các template giải trình tự được cố

đình trên bề mặt một flow cell (1 loại chip DNA) được thiết kế để tạo ra 1 dạng DNA

hỗ trợ hoạt động các enzyme trong khi đảm bảo độ bền của các template bám trên bề

mặt và mức độ bám trên bề mặt và mức độ bám không đặc hiệu thấp của các

nucleotide đánh dấu huỳnh quang. Quá trình nhân bản trên pha rắn tạo ra tới 1000 bản

copy giống hệt nhau của mỗi template trong trạn thái đứng sát nhai (trong đường kính

< 1 µm). Vì quá trình này không bao gồm việc ghi ảnh, thực hiện thao tác cơ học, hay

đặt các hạt bead vào các giếng, nên mật độ của các cluster trên đơn vị diện tích được

đảm bảo.

Công nghệ giải trình tự bằng tổng hợp (SBS) sử dụng 4 nucleotide đánh dấu

huỳnh quang để giải trình tự hàng chục triệu cluster đồng thời trên bề mặt flow-cell.

Trong mỗi chu trình giải trình tự, một deoxynucloside triphosphate đánh dấu (dNTP)

được thêm vào chuỗi acid nucleic. Nhãn huỳnh quang của nucleotide đóng vai trò như

một khóa dừng phản ứng polymer hóa, do đó sau khi mỗi dNTP được tích hợp, dye

huỳnh quang được ghi lại để xác định nucleotide và sau đó bị cắt bỏ để tổng hợp

nucleotide tiếp theo. Vì cả 4 loại dNTP gắn khóa dừng tổng hợp thuận nghịch có mặt

đồng thời dưới dạng đơn phân tử, sự cạnh tranh ngẫu nhiên giúp giảm thiểu việc tổng

hợp mất cân đối. Việc xác định các base dựa trực tiếp vào cường độ tín hiệu đo được

trong mỗi chu trình, từ đó giảm thiểu các sai số thô so với công nghệ khác. Kết quả

cuối cùng là trình tự được đọc từng base một với độ chính xác cao, loại bỏ được các

lỗi do đặc thù trình tự, cho phép quá trình giải trình tự mạnh mẽ trên toàn bộ genome,

bao gồm các trình tự lặp lại, các homopolymer.

b. Ưu nhược điểm của hệ thống

Phương pháp giải trình tự của Illumina dựa trên số lượng cực lớn các đoạn đọc

trình tự đồng thời. Khối lượng mẫu lớn và độ bao phủ đồng nhất được sử dụng để tạo

ra một tổng thể và một độ tin cậy cao được đảm bảo trong việc xác định các biến dị di

truyền. Khối lượng mẫu lớn cho phép sử dụng các công cụ thống kê và cho điểm,

tương tự như các phương pháp truyền thống trong việc xác định thể đồng hợp, dị hợp

và phân biệt các lỗi giải trình tự. Mỗi base đọc thô có một điểm số chất lượng do đó

18

phần mềm có thể sử dụng một số công cụ định lượng trong việc xác định sự sai khác

và cho điểm số tin cậy.

Phần mềm thu nhận dữ liệu của Illumina cho phép người dùng xếp các trình tự

vào một vùng tham chiếu (mẫu) của các ứng dụng giải trình tự. Được phát triển dựa

trên sự hợp tác của các nhà nghiên cứu, phần mềm bao gồm các module thu nhận dữ

liệu, xử lý và phân tích tạo thành một chuỗi thu nhận và xử lý dữ liệu với sự can thiệp

ít nhất từ người sử dụng. Định dạng mở của phần mềm cho phép dễ dàng truy nhập dữ

liệu tại nhiều giai đoạn của quá trình xử lý và phân tích dữ liệu sử dụng các giao duện

chương trình đơn giản.

Các hóa chất công nghệ TruSeq mang những tiến bộ mới nhất trong công nghệ

giải trình tự bằng tổng hợp. Từ quá trình chuẩn bị thư viện cho tới giải trình tự, các

hóa chất TruSeq cho phép việc giải trình tự với độ chính xác dữ liệu cao nhất trong tất

cả các ứng dụng. Với kết quả cao nhất các đoạn đọc không có lỗi, và hầu hết các base

với điểm số chất lượng lớn hơn Q30, các nhà nghiên cứu có thể đạt được độ tin cậy

cao nhất với dữ liệu cho đến các kết luận nghiên cứu của mình.

Một quy trình một chiều, khả năng tự đông hóa cao yêu cầu thời gian thao tác ít

nhất. Với khả năng tạo ra hàng Gb dữ liệu DNA trong một lần chạy, ngay cả các

genome lớn của các động vật có vú có thể giải trình tự trong một vài tuần thay vì một

vài năm như trước kia. Khả năng chạy nhiều mẫu trên 1 flow cell đồng nghĩa với việc

có thể thực hiện nhiều ứng dụng trong một lần chạy.

Một nhược điểm của hệ thống máy giải trình tự của Illumina đó là việc sử dụng các

hóa chất và các thiết bị có giá thành ở mức cao. Chính vì vậy, với nhưng nghiên cứu ở

quy mô nhỏ với kinh phí thấp sẽ ít có cơ hội được thực hiện trên hệ thống này.

19

Hình 1.1. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina

giai đoạn 1: tổng hợp

Hình 1.2. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina giai đoạn 2: xác định trình tự

c. Ứng dụng của công nghệ Illumina

Ứng dụng của hệ thống giải trình tự Illumina là rất đa dạng, hệ thống này cho

phép các nhà khoa học nghiên cứu nhiều lĩnh vực trong ngành khoa học sự sống.

Illumina cho phép giải mã một hệ gen hoàn chỉnh trong thời gian ngắn, so sánh với các

công nghệ trước đây. Cụ thể trong việc giải mã một hệ gen người hoàn chỉnh, với các

công nghệ trước đây chúng ta phải mất tới 10 năm, thì hiện nay với công nghệ

Illumina chúng ta chỉ mất tới 4 ngày. Công nghệ này cho phép ứng dụng trong lĩnh

20

vực y tế và bảo vệ sức khỏe cộng đồng, thông qua việc giải mã hệ gen của các vi sinh

vật, các virus, các tác nhân gây bệnh; phân tích, phát hiện các điểm đột biến; phân tích

các hệ gen phiên mã. Bên cạnh đó, với các nghiên cứu về biểu hiện gen phục vụ công

nghiệp dược đáp ứng thuốc, nghiên cứu sự tác động của thuốc tới tế bào, Ứng dụng

của Illumina cho phép thay thế các công cụ trước đây, cụ thể như microarray. Ngoài ra

các công nghệ hiện nay vẫn đang cải tiến liên tục, cho phép phát triển nhiều hơn nữa

các ứng dụng phục vụ trong đa dạng các lĩnh vực.

1.6. Các nghiên cứu metagenomics trên thế giới và Việt Nam

1.6.1. Các nghiên cứu metagenomics trên thế giới

Người đầu tiên đưa ra ý tưởng nhân bản trực tiếp các mẫu DNA từ môi trường

là Pace và cộng sự, họ đã chứng minh sự tồn tại của một hệ sinh vật phức tạp chưa

từng được nghiên cứu đến [26] . Năm 1991, Pace đã công bố nghiên cứu phân lập các

gen cấu trúc từ thư viện gen của hệ vi sinh vật phát triển trên cỏ khô trong điều kiện

phòng thí nghiệm [27]. Năm 2002, Breitbart và các đồng nghiệp sử dụng công nghệ

metagenomics cho thấy trong 200 lít nước biển chứa hơn 5000 loại virus khác nhau

[8]. Các nghiên cứu sau đó cho thấy rằng có hơn một nghìn loài virus trong phân của

con người và khoảng một triệu loại virus khác nhau cho mỗi kg trầm tích biển, bao

gồm cả thể thực khuẩn [50][54][55][56]. Về cơ bản tất cả các virus đã được phát hiện

trong các nghiên cứu này đều là những loài chưa từng được phát hiện. Năm 2004,

Tyson và các đồng nghiệp tại Đại học California, Berkeley đã xác định trình tự DNA

của hệ vi sinh vật có trong nước thải nhiễm acid [57]. Đây là một bước tiến quan trọng

xác định được bộ gen hoàn chỉnh, hoặc gần như hoàn chỉnh của một số vi khuẩn mà

trước đây chưa nuôi cấy thành công [23].

Từ năm 2003, Venter đã đi vòng quanh trái đất bằng đường biển nhằm thu thập

các mẫu và sử dụng công nghệ metagenomics với mục đích xác định các genome (và

theo đó là các sinh vật) mới.Dự án thí điểm, tiến hành trong vùng biển Sargasso, phát

hiện DNA của gần 2000 loài khác nhau, trong đó có 148 loài vi khuẩn chưa bao giờ

được xác định trước đây [60]. Phân tích hệ sinh vật đất sử dụng công nghệ

metagenomics xuất hiện chậm hơn so với những nghiên cứu phân tích hệ sinh vật biển

do trong đất thường tồn tại những hợp chất liên kết với DNA hoặc ức chế phản ứng

21

PCR, gây khó khăn cho việc nhân bản các mẫu DNA từ đất [11]. Tuy nhiên trong

những năm gần đây những tiến bộ đáng kể trong nghiên cứu hệ vi sinh vật đất, xây

dựng các thư viện gen của các vi sinh vật này đã giúp các nhà khoa học hiểu rõ hơn về

hệ sinh vật phức tạp này [32][28].

Các tiến bộ trong kỹ thuật đọc trình tự DNA đã mở ra phương pháp tiếp cận

mới cho công nghệ metagenomics. Năm 2006, các nhà khoa học tại Đại học Penn

State đã công bố các trình tự thu được từ một mẫu môi trường bằng phương pháp

pyrosequencing sử dụng kỹ thuật đọc trình tự 454 – kỹ thuật cho phép đọc tới 400-600

megabases DNA chỉ trong vòng 10 giờ. Kỹ thuật này ra đời cho phép đọc trình tự

nucleotit của hệ sinh vật ở quy mô lớn trong một thời gian ngắn [14]. Gần đây công

nghệ sinh học đã thay đổi cách tiếp cận trong việc xác định các gen mới, nghiên cứu

chức năng của các gen, phân tích thành phần loài và các hệ vi sinh vật... Kỹ thuật

metagenomics là một lĩnh vực nghiên cứu mới, đang phát triển mạnh mẽ trong hơn

một thập kỷ qua, đã giúp xác định hệ gen của các vi sinh vật không thể nuôi cấy, một

mặt hoàn thiện những hiểu biết của con người về các loài vi sinh vật trên trái đất, mặt

khác góp phần giải quyết nhu cầu tìm kiếm các enzyme và hợp chất sinh học có ích

[7][ 58]

Các nghiên cứu phân tích thành phần và hoạt động của các hệ vi sinh vật tự

nhiên cho thấy tiềm năng sản xuất từ các vi sinh vật này các hợp chất sinh học có giá

trị cao sử dụng trong y tế như thuốc kháng sinh, các chất chống ung thư và ức chế

miễn dịch. Sử dụng kỹ thuật metagenomic để đánh giá tiềm năng và hoạt tính sinh học

của quần thể vi sinh vật không thông qua nuôi cấy theo phương pháp cổ điển đã cho

thấy tiềm năng ứng dụng kỹ thuật metagenomic trong nghiên cứu khái thác đa dạng

sinh học vi sinh vật là rất lớn.

1.6.2. Các nghiên cứu metagenomics tại Việt Nam

Metagenomics là một lĩnh vực nghiên cứu tương đối mới mẻ tại Việt Nam.Tuy

nhiên, các trung tâm nghiên cứu cũng như các nhà khoa học Việt Nam đang từng bước

tiếp cận với công nghệ giải trình tự thế hệ mới. Viện nghiên cứu các hệ gen thuộc Viện

hàn lâm khoa học Việt Nam đã được thành lập để tiến hành các nghiên cứu về hệ gen.

22

Viện đang nghiên cứu triển khai một số dự án liên quan đến hệ gen người, hệ gen cá

tra cũng như các loài sinh vật khác.

Viện di truyền nông nghiệp Việt Nam kết hợp với các viện nghiên cứu tại

Vương Quốc Anh vừa tiến hành giải trình tự 36 giống lúa Việt Nam. Dữ liệu hệ gen

lúa sẽ cho phép chúng ta tiến hành các nghiên cứu liên quan đến bảo tồn các nguồn

gen quý, cũng như tìm ra các gen cho năng suất cao và có khả năng chống chịu được

với các điều kiện khí hậu khắc nghiệp như chịu rét, chịu hạn hay chịu mặn.

Các nhóm nghiên cứu về tin sinh học đã và đang tiếp tục được thành lập và phát

triển tại các viện nghiên cứu và các trường đại học lớn tại Việt Nam như Đại học công

nghệ, ĐHQGHN, Học viện bưu chính viên thông, Đại học sư phạm Hà Nội. Bộ khoa

học công nghệ đã tài trợ đề tài độc lập cấp nhà nước “Nghiên cứu các phương pháp

phân tích và phát triển các công cụ tin sinh học nhằm giải quyết các bài toán quan

trọng trong tin sinh học” từ năm 2009-2011 để phát triển đội ngũ cũng như các công

cụ tính toán tin sinh học phục vụ các nghiên cứu tại Việt Nam. Quỹ phát triển

Nafosted cũng đã và đang tài trợ nhiều đề tài nghiên cứu cơ bản trong lĩnh vực tin sinh

học như “phân tích mô hình biến đổi axit amin của vi rút”, “các phương pháp tính toán

hiệu quả giải quyết các bài toán lớn trong sinh học phân tử”. Các nghiên cứu trong các

năm gần đây của các nhóm đã được đăng tải trên các tạp chí và hội nghị có uy tin trên

thế giới về tin sinh học hay sinh học phân tử. Một số nhóm nghiên cứu tin sinh học

đang từng bước tìm hiểu và phát triển các phương pháp liên quan đến phân tích dữ liệu

hệ gen. Một số kết quả nghiên cứu đầu liên đã được công bố tại hội nghị quốc tế.

Các trung tâm tính toán hiệu năng cao đã được thành lập và trang bị các hệ

thống tính toán tương đối lớn và hiện đại như Trung tâm tính toán hiệu năng cao của

trường Đại học khoa học tự nhiên, ĐHQGHN, Trung tâm tính toán hiệu năng cao của

Đại học bách khoa Hà Nội, Trung tâm tính toán hiệu năng cao của Đại học sư phạm

Hà Nội.Các trung tâm này về cơ bản có thể tham gia vào việc phân tích các dữ liệu hệ

gen, kể cá các hệ gen có kích thước lớn như hệ gen người.

Việc áp dụng công nghệ metagenomics vào nghiên cứu hệ gen của vi sinh vật

đất, đã và sẽ đóng vai trò to lớn trong các nghiên cứu tiếp theo. Tuy nhiên, tại Việt

23

Nam chưa có nhiều các nghiên cứu ứng dụng kĩ thuật metagenomics trong nghiên cứu

hệ vi sinh vật đất nói chung cũng như hệ vi sinh vật vùng rễ cà phê nói riêng. Vì vậy,

nghiên cứu này tập trung đánh giá sự đa dạng, ảnh hưởng của hệ vi sinh vật vùng rễ

đến sự sinh trưởng và phát triển của cây cà phê thông qua kĩ thuật metagenomics.

24

CHƯƠNG 2. VẬT LIỆU – PHƯƠNG PHÁP

2.1. Vật liệu nghiên cứu

• Mẫu nghiên cứu:

Mẫu đất vùng rễ cây cà phê được thu thập tại Nông trường cà phê Eapok thuộc

huyện Cư M’gra, tỉnh Đắk Lắk. Tỉnh Đắk Lắk thuộc trung tâm cao nguyên Tây

Nguyên, trong khoảng tọa độ địa lý từ 107o28'57" đến 108o59'37" độ kinh Đông và từ

12o9'45"đến 13o25'06" độ vĩ Bắc, có độ cao trung bình 400 – 800 mét so với mặt nước

biển.

• Hóa chất

Bộ Kit PowerSoil® DNA Isolation (MO BIO) cho quá trình tách DNA từ đất,

Bộ kit KAPA2G Robust HotStart Ready Mix (Kapa Biosystems), Agencourt AMPure

XP DNA purification kit (Beckman Coulter), Nextera XT index kit (Illumina)

Hóa chất dùng trong điện di DNA: agarose, TAE 1X (Tris - Acetic acide -

EDTA), ethidium bromide.

• Máy móc, thiết bị

Máy PCR System 9700 (Appied Biosystem, Mỹ), máy điện di Powerpac300

(Bio-Rad, Mỹ), máy soi DNA (Mini-transllumminatior, Bio-Rad, Mỹ), máy chụp

ảnh (Amersham Pharmacia Biotech, Thuỵ Điển), máy vortex (Mimishaker, IKA,

Đức), máy ly tâm, Qubit (Invitrogen; LifeTechnologies Europe BV, Monza, Italy),

Agilent 2100 Bioanalyser (Agilent Technologies), cùng với các trang thiết bị khác

của phòng Công nghệ tế bào thực vật - Viện Công nghệ Sinh học.

2.2. Phương pháp nghiên cứu

2.2.1. Phương pháp thu mẫu

Mẫu đất được thu tại vùng rễ sâu từ 20-30 cm của các cây cà phê tái canh từ 2 đến 3 năm tuổi và các cây cà phê kinh doanh từ 10 đến 20 năm tuổi vào tháng 8 năm 2015.Tại mỗi khu vực 25 m2 gồm khoảng 3 cây cà phê, chúng tôi tiến hành lấy mẫu đất tại 9 vị trí nhưhình 2.1.

25

Hình 2.1. Vị trí tiến hành thu mẫu tại một khu vực nghiên cứu

Mẫu đất tại 9 vị trí trong 1 khu vực sau đó được gộp làm một, trộn đều, và chuyển vào các ống corning 50 ml. Mẫu đất được bảo quản trong điều kiện tối,ở -20oC tới khi tiến hành các thí nghiệm tiếp theo.

2.2.2. Phương pháp tách chiết DNA tổng số

Các mẫu đất thu tại các vùng trồng cà phê được tiến hành tách chiết DNA bằng bộ Kit PowerSoil® DNA Isolation theo quy trình như sau:

• B1: Thêm 0,25 gam mẫu đất vào ống PowerBead

• B2: Lắc hoặc vortex để trộn đều mẫu

• B3: Kiểm tra Giải dung dịch C1. Nếu C1 bị kết tủa, ủ ở 60  C cho đến khi tan

trước khi sử dụng

• B4: Thêm 60 l dung dịch C1 và đảo ngược nhiều lần hoặc lắc thời gian ngắn.

• B5: vortex 5-10p tốc độ tối đa

• B6: ly tâm 10.000g 30s ở nhiệt độ phòng, lưu ý nếu li tâm > 10.000g có thể ống sẽ vỡ

• B7: Chuyển nổi sang ống 2 ml, thể tích mong muốn khoảng 400-500 µl

• B8: Thêm 250 l đệm C2 và lắc trong 5 giây. Ủ ở 4  C trong 5 phút

• B9: Ly tâm ở nhiệt độ phòng trong 1 phút 10.000 x g

• B10: chuyển dịch nổi sang ống 2 ml nhưng không nhiều hơn 600 l

• B11: Thêm 200 l đệm C3 và vortex một thời gian ngắn. Ủ ở 4  C trong 5 phút

26

• B12: Ly tâm các ống ở nhiệt độ phòng trong 1 phút 10.000 x g

• B13: chuyển dich nổi vào ống 2 ml không nhiều quá 750 l

• B14: Lắc để trộn đệm C4 trước khi sử dụng. Thêm 1200 l đệm C4, lắc hoặc

vortex 5 giây

• B15: cho 675 l vào bộ lọc Spin và ly tâm ở 10.000 x g trong 1 phút ở nhiệt độ

phòng, đổ dich qua cột và lặp lại cho đến hết dung dịch

• B16: Thêm 500 l đệm C5 ly tâm ở nhiệt độ phòng trong 30 giây ở 10.000 x g

• B17: Loại bỏ các phần dung dịch qua qua cột

• B18: Ly tâm một lần nữa ở nhiệt độ phòng trong 1 phút ở 10.000 x g

• B19: chuyển thận đặt bộ lọc sang ống 2 ml sạch

• B20: Thêm 100 l đệm C6.

• B21: Ly tâm ở nhiệt độ phòng trong 30 giây ở 10.000 x g.

DNA sau khi tách thành công được tiến hành do nồng độ và độ tinh sach bằng máy nano drop, kiểm tra bằng điện di trên agarose 1% và bảo quản ở -20oC

2.2.3. Phương pháp khuếch đại và xác định trình tự các đoạn gen

a. Vùng 16S rRNA

Các loài vi sinh vật tách ra từ các mẫu thu thập được được phân loại dựa vào đa

hình của 9 vùng gen nằm trên gen 16S ribosome RNA (16S rRNA). Trong nghiên cứu

này, đa hình trên hai phân vùng V3 và V4 của vùng 16S rRNA sẽ được tập trung phân

tích. Các đoạn 16S rRNA tđược giải trình tự tự động thông qua hệ thống máy MiSeq.

b. Tóm tắt quy trình thiết kế theo hướng dẫn của hãng Ilumina

1. Thiết kế mồi

2. Chuẩn bị thư viện: các đoạn DNA sau khi được khuếch đại được gắn các

Illumina sequencing adapter và các vùng barcode index

3. Giải trình tự: Sử dụng bộ kit 300 bp để xác định trình tự các đoạn DNA với 65

giờ trong 1 lần chạy. dữ liệu đầu ra của hệ thống MiSeq xấp xỉ > 20 triệu đoạn

đọc (read)

4. Dữ liệu đầu ra của hệ thống được phân tích trên phần mềm MiSeq Sequencing

Reporter

27

Hình 2.2. Quy trình khuếch đại và giải trình tự vùng 16S rRNA

2.2.4. Khuếch đại vùng 16S rRNA

1. Thành phần phản ứng khuếch đại vùng 16S rRNA

Thể tích

DNA vi sinh vật (5 ng/µl) 2,5 µl

Mồi xuôi 16S Amplicon PCR 1 µM 5 µl

Mồi ngược 16S Amplicon PCR 1 µM 5 µl

2X KAPA HiFi HotStart Ready Mix 12,5 µl

Tổng 25 µl

2. Đậy chặt plate 96 giếng và tiến hành chạy PCR sử dụng chương trình sau:

25 chu kỳ

95oC

72oC

72oC

30 giây

95oC 3 phút

30 giây

5 phút

55oC 30 giây

4oC

3. Bổ sung 1 µl sản phẩm PCR vào Bioanalyzer DNA 1000 chip để kiểm định kích

thước. Kích thước dự kiến sau khuếch đại là 550 bp

28

2.2.5. Tinh sạch sản phẩm PCR

1. Ly tâm đĩa 96 giếng 3000 v/p trong 1 phút ở 20oC. để toàn bộ dịch dồn xuống đáy ống

2. Sử dụng Pipet đa kênh hút toàn bộ 25 µl sản phẩm PCR chuyển sang plate MIDI

3. Vortex các hạt AMPure XP trong 30 giây để đảm bảo các hạt được trộn đều.

4. Sử dụng Pipet đa kênh, bổ sung 20 µl các hạt AMPure XP vào mỗi giếng của plate MIDI

5. Trộn đều nhẹ nhàng toàn bộ các giếng khoảng 10 lần sau đó đậy chặt nắp và

lắc plate MIDI tại 1800 v/p trong 2 phút

6. Ủ ở nhiệt độ phòng trong điều kiện không lắc trong 5 phút

7. Đặt plate trên một giá nam châm trong 2 phút hoặc tới khi quan sát thấy toàn dung dịch chuyển hoàn toàn thành dạng trong suốt

8. Giữ nguyên plate trên giá nam châm, sử dụng pipet đa kênh loại bỏ toàn bộ dịch nổi.

9. Rửa 2 lần với 200 µl cồn 80%, ủ trên giá nam châm 30 giây sau đó loại bỏ toàn bộ dịch nổi

10. Làm khô các hạt tự nhiên trong 10 phút

11. Chuyển plate MIDI khỏi giá nam châm, bổ sung 52,5 µl Tris pH 8,5 ở nồng độ 10 mM vào mỗi giếng

12. Trộn đều nhẹ nhàng 10 lần bằng pipet

13. Ủ ở nhiệt độ phòng trong 2 phút

14. Đặt plate lên giá nam châmtrong 2 phút hoặc tới khi dung dịch chuyển sang trong suốt

15. Dùng pipet đa kênh thu 50 µl dịch nổi chuyển sang plate 96 giếng mới

2.2.6. Gắn Index (Nextera XT Index kit)

1. Sử dụng pipet đa kênh, chuyển 5 µl từ mỗi giếng sang một plate mới.

2. Sắp xếp các mồi Index 1 và 2 lên rack như trên hình 2.4:

29

Hình 2.3. Bố trí các ống mẫu

A: Mồi Index 2 (Nắp màu trắng)

B: Mồi Index 1 (Nắp màu cam)

C: Đĩa 96 giếng

3. Thành phần phản ứng

Thể tích

DNA 5 µl

Nextera XT Index Primer 1 5 µl

Nextera XT Index Primer 2 5 µl

25 µl 2x KAPA HiFi HotStart Ready Mix

Nước khử ion 10 µl

Tổng 50 µl

4. Trộn đều thành phần phản ứng 10 lần

5. Đậy nắp plate với Microseal A 6. Ly tâm plate 3000 v/p trong 1 phút ở 20oC

7. Chạy PCR với chu trình phản ứng

8 chu kỳ

95oC

95oC

72oC

72oC

30 giây

3 phút

30 giây

5 phút

55oC 30 giây

4oC

30

2.2.7. Tinh sạch sản phẩm gắn Index

1. Ly tâm plate 96 giếng 1000 v/p trong 1 phút ở 20oC. để toàn bộ dịch dồn xuống đáy ống

2. Sử dụng Pipet đa kênh hút toàn bộ 50 µl sản phẩm PCR chuyển sang plate MIDI

3. Vortex các hạt AMPure XP trong 30 giây để đảm bảo các hạt được trộn đều.

4. Sử dụng Pipet đa kênh, bổ sung 56 µl các hạt AMPure XP vào mỗi giếng của plate MIDI

5. Trộn đều nhẹ nhàng toàn bộ các giếng khoảng 10 lần sau đó đậy chặt nắp và

lắc plate MIDI tại 1800 v/p trong 2 phút

6. Ủ ở nhiệt độ phòng trong điều kiện không lắc trong 5 phút

7. Đặt plate trên một giá nam châm trong 2 phút hoặc tới khi quan sát thấy toàn dung dịch chuyển hoàn toàn thành dạng trong suốt

8. Giữ nguyên plate trên giá nam châm, sử dụng pipet đa kênh loại bỏ toàn bộ dịch nổi.

9. Rửa 2 lần với 200 µl cồn 80%, ủ trên giá nam châm 30 giây sau đó loại bỏ toàn bộ dịch nổi

10. Làm khô các hạt tự nhiên trong 10 phút

11. Chuyển plate MIDI khỏi giá nam châm, bổ sung 27,5 µl Tris pH 8,5 ở nồng độ 10 mM vào mỗi giếng

12. Trộn đều nhẹ nhàng 10 lần bằng pipet

13. Ủ ở nhiệt độ phòng trong 2 phút

14. Đặt plate lên giá nam châmtrong 2 phút hoặc tới khi dung dịch chuyển sang trong suốt

15. Dùng pipet đa kênh thu 25 µl dịch nổi chuyển sang plate 96 giếng mới

2.2.8. Đánh giá thư viện

1. Lấy 1 µl trong tổng thể tích dung dịch thư viện đã pha loãng 50 lần

2. Đưa lên Bioanalyser chip, lựa chọn quy trình V3 và V4 primer, kích thước tính toán trên máy là 630 bp

2.2.9. Biến tính thư viện và giải trình tự trên máy Miseq

Thư viện được biến tính sử dụng NaOH, pha loãng trong buffer, và sau đó biến tính bằng nhiệt trước khi đưa vào máy Miseq để giải trình tự. Mỗi một lượt chạy phải bao gồm tối thiểu 5% PhiX làm đối chứng đối với những thư viện có độ đa dạng thấp.

Chuẩn bị:

1. Đăt block nhiệt phù hợp với ống 1,7 ml lên 96oC

31

2. Đưa các thành phần phản ứng của máy Miseq từ các tủ -25oC ra ngoài và làm tan ở điều kiện nhiệt độ phòng

3. Trong một xô đá, chuẩn bị một bể nước đá bằng cách trộn 3 phần đá và 1 phần nước

a. Biến tính DNA

1. Trộn các thành phần thư viện DNA và NaOH0,2 N theo tỷ lệ thể tích như sau: 4nM thư viện DNA (5 µl) và 0,2N NaOH (5 µl)

2. Chuẩn bị đối chứng PhiX tương tự bằng cách trộn PhiX với NaOH 0,2N với tỉ lệ 1:1 (5 µl: 5 µl)

3. Trộn đều dung dịch phản ứng bằng vortex nhanh, và sau đó ly tâm ở 1000 v/p trong 1 phút ở 20oC

4. Ủ hỗn hợp dung dịch trong 5 phút ở nhiệt độ phòng để biến tính hoàn toàn các DNA sợi đôi thành sợi đơn

5. Bổ sung 10 µl sản phẩm DNA đã biến tính vào 990 µl Pre-chilled HT1

6. Đặt DNA biến tính trên đá cho tới khi bước pha loãng thư viện đã sẵn sang

b. Pha loãng thư viện DNA đã biến tính

1. Pha loãng DNA đã biến tính tới nồng độ mong muốn theo bảng sau: (Trong lần chạy đầu tiên, nồng độ thư viện được Illumina đề nghị là 4 pM, tùy thuộc vào khối lượng dữ liệu đầu ra, nồng độ thư viện trong các lần tiếp theo được điều chỉnh tăng giảm cho phù hợp)

Nồng độ cuối cùng 2 pM 4 pM 6 pM 8 pM 10 pM

60µl 120 µl 180 µl 240 µl 300 µl 20 pM Thư viện đã biến tính

Pre-chilled HT1 540 µl 480 µl 420 µl 360 µl 300 µl

2. Trộn đều hỗn hợp dung dịch bằng cách đảo ngược ống rồi đặt ống mẫu trên đá

c. Biến tính và pha loãng đối chứng PhiX

Sử dụng chỉ dẫn sau đây để biến tính và pha loãng 10 nM thư viện PhiX tới nồng độ tương tự như thư viện của mẫu phân tích. Thư viện trộn lẫn cuối cùng phải bao gồm ít nhất 5% PhiX.

1. Trộn các dung dịch theo tỷ lệ thể tích sau để nồng độ dung dịch cuối cùng đạt 4nM:

a. 10 nM thư viện PhiX (2 µl)

b. 10 nM Tris pH 8.5 (3 µl)

2. Pha loãng PhiX trong NaOH theo tỷ lệ thể tích sau:

a. 4 nM thư viện PhiX (5 µl)

b. 0,2 N NaOH (5 µl)

32

3. Trộn đều hỗn hợp dung dịch bằng vortex nhanh

4. Ủ hỗn hợp dung dịch ở nhiệt độ phòng trong 5 phút để biến tính thư viện DNA sợi đôi thành sợi đơn

5. Bổ sung 10 µl sản phẩm DNA đã biến tính vào 990 µl Pre-chilled HT1

6. Pha loãng 20 pM thư viện PhiX đã biến tính tới nồng độ giống với thư viện DNA của mẫu phân tích theo bảng sau:

Nồng độ cuối cùng 2 pM 4 pM 6 pM 8 pM 10 pM

60µl 120 µl 180 µl 240 µl 300 µl 20 pM Thư viện đã biến tính

Pre-chilled HT1 540 µl 480 µl 420 µl 360 µl 300 µl

7. Trộn đều hỗn hợp dung dịch bằng cách đảo ngược ống một vài lần sau đó ly tâm nhanh để toàn bộ dung dịch dồn xuống dưới đáy ống

8. Đặt các ống đã làm phản ứng trên đá

d. Hợp nhất thư viện DNA của mẫu phân tích và mẫu đối chứng

1. Hai thư viện được trộn lẫn theo tỉ lệ thể tích sau:

a. Hỗn hợp dung dịch đã biến tính và pha loãng của mẫu đối chứng PhiX

(30 µl)

b. Hỗn hợp dung dịch đã biến tính và pha loãng của mẫu phân tích (570 µl) 2. Sử dụng block nhiệt biến tính hỗn hợp dung dịch trộn lẫn hai thư viện ở 96oC trong 2 phút

3. Sau khi ủ, trộn đều hỗn hợp dung dịch bằng cách đảo ngược ống và ly tâm nhanh, sau đó giữ trong bể nước đá đã được chuẩn bị từ bước trước

4. Ủ hỗn hợp dung dịch trong bể nước đá trong 5 phút

5. Đưa hỗn hợp dung dịch trộn lẫn giữa 2 thư viện lên MiSeq v3 reagent cartridge

e. Giải trình tự trên máy Miseq

1. Khởi động máy Miseq

2. Sau khi mẫu được đưa lên cartridge, hệ thống yêu cầu khai báo các thông số chạy máy và các chuẩn phân tích mẫu. Khi đó, lựa chọn 16S Metagenomics workflow (quy trình phân tích 16S)

2.2.10. Phân tích dữ liệu

Các bước phân tích được thực hiện thông qua công cụ Qiime. Qiime là gói công

cụ mã nguồn mở, tích hợp nhiều kịch bản (script) được lập trình cho các nhà khoa học

nghiên cứu sự đa dạng của các hệ vi sinh vật thông qua phân tích trình tự bên trọng

hoặc giữa các vùng gen 16S rRNA và 18S rRNA. Qiime thích hợp cho tất cả các nền

33

tảng giải trình tự như: Illumina, 454, và giải trình tự dựa trên nguyên lý của Sanger.

Thiết kế của Qiime phù hợp cho nhiều đối tượng người sử dụng, từ sinh viên tới các

chuyên gia sinh phân tích, các câu lệnh được sử dụng dễ hiểu và không yêu cầu các kỹ

năng đặc biệt trong quá trình sử dụng. Trình tự vùng V3 và V4 của đoạn 16S rRNA

của một mẫu được lắp ráp dựa trên các contig và với các tham số mặc định. Các trình

tự chứa các thông tin nhiễu, các vị trí base có độ tin cậy thấp, các đoạn đọc có kích

thước nhỏ hơn 400 bp hoặc lớn hơn 460 được loại bỏ. Dữ liệu đáng tin cậy sẽ được so

sánh thẳng hàng với các trình tự đã công bố dựa trên cơ sở dữ liệu SILVA. Số lượng

các đơn vị phân loại (OTUs) có mức độ tương đồng lần lượt 97%, 95% và 90% được

sử dụng để xây dựng đường cong rarefaction, và tính toán các giá trị ACE (abundance

based coverage estimator), CHAO (richness), Shannon, Simpson đối với từng mẫu.

Kết quả sau khi phân tích được đưa vào phần mềm MEGAN 5 để so sánh mức độ

tương đồng và sai khác giữa ba hệ vi sinh vật.

Hình 2.4. Quy trình phân tích sử dụng công cụ QIIME

34

2.2.11. Phương pháp xác định tuyến trùng

a. Phương pháp lọc tĩnh thu tuyến trùng

Rây lọc được xếp một lớp giấy lên trên và đặt vào đĩa Petri, sau đó lấy rễ cho

vào rây lọc, điều chỉnh lượng nước vừa ngập rễ trên rây, đậy nắp và đặt yên tĩnh trong

48h ở nhiệt độ phòng. Tuyến trùng sống chui qua rây lọc, lắng đọng xuống đáy đĩa

Petri. Nhấc rây ra khỏi đĩa Petri thu lại dịch nước chứa tuyến trùng trong đĩa Petri.

b. Phương pháp đếm tuyến trùng

Tuyến trùng được đếm bằng đĩa đếm tuyến trùng dưới kính hiển vi soi nổi. Nếu

mẫu có ít tuyến trùng: Đổ dung dịch tuyến trùng vào đĩa đếm. sau đó lắc nhẹ cho dung

dịch tuyến trùng dàn đều. Đếm toàn bộ tuyến trùng theo các dãy ô cho toàn bộ đĩa hay

đếm đại diện một số ô hoặc dãy, sau đó tính trung bình một ô và nhân với tổng số ô

trong đĩa.

c. Phương pháp định danh tuyến trùng bằng hình thái theo De Grisse (1969)

Ngày thứ nhất: nhặt tuyến trùng chuyển vào giếng chứa 0,5ml dung dịch I

(99ml Formalin 40% + 1 ml glycerine). Đặt giếng có tuyến trùng vào bình hút ẩm

chứa ethanol 96 %. Để bình hút ẩm trong tủ ấm ở nhiệt độ 40°C ít nhất 12 giờ. Ngày

thứ 2: lấy giếng ra khỏi bình hút ẩm, nhỏ vài giọt dung dịch II (95ml ethanol 96% + 5

ml glycerine) đặt trong tủ ấm. Cứ sau 2 giờ thì nhỏ 2 giọt dung dịch II, thực hiện 4 lần.

Để giếng qua đêm, bổ sung vài giọt dung dịch III (50ml ethanol 96% + 50ml

glycerine). Ngày thứ 3: tuyến trùng nằm trong dung dịch glycerine tinh khiết được sử

dụng để lên tiêu bản định loại.

35

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. Phân tính đặc điểm lý hóa và sinh học chung của các mẫu

Dựa vào kiểu canh tác và hiện trạng phát triển, 04 vùng đất trồng cà phê bao

gồm cà phê tái canh nhiễm bệnh (TCB), tái canh phát triển tốt (TCT), kinh doanh năng

suất cao (NSC; 15-17 tấn/ha) và kinh doạnhnăng suất trung bình (NSTB; 5-6 tấn/ha)

được chọn để thu mẫu. Đất tại 9 vị trí trong 1 khu vực được gộp làm một, trộn đều, và

sau đó chuyển vào các túi đựng mẫu với trọng lượng khoảng 1 kg cho mỗi mẫu nghiên

cứu.

Hình 3.1: Hình ảnh cây cà phê tái canh bệnh và cà phê kinh doanh tại khu vực thu mẫu thí nghiệm. Cây cà phê tái canh bệnh (A) và mẫu rễ (C); Cây cà phê kinh doanh (B) và mẫu rễ (D)

Bệnh tuyến trùng hay còn gọi là bệnh vàng lá thối rễ: Lọại bệnh này khá nguy

hiểm, có thể gây cho cà phê chết hàng loạt. Các loại tuyến trùng chích hút rễ gây vết

thương hay các nốt sưng trên rễ tạo diều kiện cho các loại nấm xâm nhập gây hiện

tượng thối rễ vàng lá. Vào mùa mưa ở Tây Nguyên đã có hàng trăm hecta cà phê vối

bị bệnh, lá cây bị vàng và rụng, rễ bị tuyến trùng và nấm phá hoại.Các mẫu cà phê

được phân tích đánh giá tình trạng nhiễm tuyến trùng bằng phương pháp đếm tuyến

trùng. Kết quả đánh giá cấu trúc tuyến trùng trong 4 mẫu đất nghiên cứu được thể hiện

trong biểu đồ (hình 3.1).

36

Hình 3.2. Biểu đồ thể hiện thành phần loài tuyến trùng trong mẫu đất tại khu vực nghiên cứu

Kết quả phân tích tuyến trùng cho thấy 4 mẫu đất thu tại khu vực khảo sát bị

nhiễm tuyến trùng thuộc nhóm gây nốt sần vùng rễ- root knot nematodes (biểu đồ 3.1).

Nhóm tuyến trùng này phân bố rộng khắp và ký sinh trên hầu hết các mẫu tái canh

bệnh, đặc biệt là 2 nhóm Meloidogyne, Pratylenchus, trong các mẫu đất trồng cà phê

tái canh tốt, số lượng tuyến trùng ít hơn nhiều. Điều này khẳng định tác hại của tuyến

trùng lên hiệu quả tái canh cây cà phê.

Trong đất trồng cà phê kinh doanh, khi cây cà phê đã trưởng thành, ảnh hưởng

của tuyến trùng lên cây không nhiều như đối với cây con, tuy nhiên chúng tôi cũng

quan sát được số lượng tuyến trùng trong đất trồng cà phê cho năng suất cao ít hơn

nhiều so với trong đất trồng cà phê năng suất trung bình. Có thể nói tuyến trùng kí sinh

trong đất cũng là một trong những nguyên nhân ảnh hưởng đến năng suất trồng cà phê.

Để đánh giá các thành phần hữu cơ và cơ giới trong đất, các mẫu sau khi thu

thập được đem phân tích tại Phòng Kiểm định chất lượng phân bón số 11, Viện Thổ

nhưỡng Nông hóa. Kết quả phân tích được thống kê trong bảng 3.1

37

Bảng 3.1. Bảng thống kê thành phần của 4 mẫu đất nghiên cứu

Pdt

Kdt

Pts

Kts

Stt

Nhóm mẫu

pHKcl

Độ ẩm

(mgP2O5/

(mgK2O/

OM (%)

Nts (%N)

(%P2O5)

(%K2O)

100g)

100g)

4.41

31.72

3.4

0.21

0.32

0.04

28.30

25.73

1

Cà phê tái canh khỏe (TCT)

2

4.21

31.23

1.9

0.13

0.16

0.03

23.17

51.69

Cà phê tái canh bị bệnh (TCB)

3

4.27

32.90

6.55

0.25

0.89

0.03

10.90

29.71

Cà phê kinh doanh năng suất cao (NSC)

4

4.97

31.14

3.82

0.19

0.31

0.02

20.33

25.73

Cà phê kinh doanh năng suất trung bình (NSTB)

Kí hiệu: Hữu cơ tổng số (OM), Nitơ tổng số (Nts), Photpho tổng số (Pts), Kali tổng số (Kts), Photpho dễ tiêu (Pdt), Kali dễ tiêu (Kdt)

Kết quả phân tích thành phần hóa lý của các mẫu đất nghiên cứu cho thấy độ

ẩm và chỉ số pH của các nhóm mẫu khá tương đồng nhau. Chỉ số pH cho thấy đất bị

chua dao động từ 4.21 ở nhóm TCB đến 4.97 tại nhóm NSTB, độ ẩm trung bình từ

31.14- 32.90 tại 2 nhóm NSTB và NSC.

So sánh giữa 4 mẫu đất nghiên cứu kết quả cho thấy thành phần nitơ

(N),photpho (P) và kali (K) giữa các mẫu không có sự khác biệt đáng kể (Bảng 3.1),

tuy nhiên thành phần P dễ dùng cây trồng giữa mẫu đất tái canh tốt và tái canh

xấu(28.30 và 23.17); giữa 2 mẫu đất cà phê năng suất cao và năng suất thấp (20.33 và

10.90) có sự biệt rõ rệt Tương tự, hàm lượng K dễ tiêu trong mẫu đất cà phê kinh

doanh năng suất cao và mẫu cà phê tái canh tốt là cao hơn đáng kể so với trong mẫu

đất cà phê tái canh bị bệnh và mẫu cà phê kinh doanh năng suất trung bình (25.73 và

51.69 so với 29.71 và 20.82 ). Kết quả phân tích trên cho thấy hàm lượng P và K dễ

tiêu trong đất trồng cà phê là một trong những chỉ số để đánh giá chất lượng đất, ảnh

hưởng đến năng suất cà phê thu được.

Để xác định một số nguyên nhân khác có liên quan đến vi sinh vật có khả năng

ảnh hưởng đến khả năng tái canh cà phê và năng suất của cây cà phê, chúng tôi tiếp tục

38

sử dụng kỹ thuật metagenomis để đánh giá mức độ đa dạng của quần thể vi sinh vật

trong các mẫu nghiên cứu.

3.2. Kết quả tách chiết DNA tổng số.

Mẫu đất thu thập ở vùng rễ của cây cà phê bao gồm hệ vi sinh vật nấm, khuẩn

và động vật nguyên sinh, DNA tách chiết được từ đất sẽ bao gồm DNA tổng số của vi

khẩn nấm và những động vật nguyên sinh này. Số lượng và chất lượng DNA tổng số

tách từ các mẫu đấy là nguồn vật liệu ban đầu quan trọng và cần thiết cho các nghiên

cứu metagenomic. Chất lượngDNAđược đánh giá trên gel agrose.

Trong những thí nghiệm đầu tiên, 0,25g đất từ mỗi mẫu đã được sử dụng để

tách DNA tổng với bộ Kit Powersoil của hãng Ilumina.Tuy nhiên, kết quả cho thấy với

lượng mẫu ban đầu này nồng độ DNA thu được là rất thấp chỉ từ 9 - 11ng/ µl, mặc

dùđộsạch rất cao 1,77 – 1,83. Do đó, chúng tôi đã tăng khối lượng mẫu đất cho quá

trình tách chiết DNA tổng số lên 0,75g. DNA tổng số sau tách chiết được điện di kiểm

tra trên gel agarose 1% (Hình 3.3)

Hình 3.3. Kết quả điện di kiểm tra sản phẩm tách DNA tổng số của 4 mẫuđất nghiên cứu Kết quả điện di kiểm tra sản phẩm tách DNA tổng số trên hình 3.3 cho thấy,

DNA tổng số thu được có chất lượng tốt, các băng vạch đều sáng rõ, gọn điều này

chứng tỏ DNA thu được có nồng độ cao và độ tinh sạch tốt. Điều này cũng được phản

ánh trong kết quả đo nồng độ và độ sạch của DNA tổng số thu được bằng máy nano

drop (Bảng 3.2).

39

Bảng 3.2. Nồng độ và độ tinh sạch 4 mẫu DNA tách từ đất

STT Nồng độ Độ tinh sạch (A260/A280)

TCT 51,5 ng/µl 1,84

TCB 54,8 ng/µl 1,81

NSC 52,5 ng/µl 1,90

NSTB 60,1 ng/µl 1,86

Nồng độ DNA tách từ mẫu đất 4 có nồng độ cao nhất 60,1 ng/µl, sau đó là mẫu

2 có nồng độ 54,8 ng/µl, thấp nhất là mẫu 1 có nồng độ51,5ng/µl. Độ tinh sạch của cả

4 mẫu DNA đều đạt tiêu chuẩn1,81 -1,9. Điều này chứng tỏ quá trình tách chiết cho

kết quả tốt, DNA thu được đạt yêu cầu để sử dụng cho những nghiên cứu tiếp theo.

3.3. Chuẩn bị thư viện và gắn adapter

Từ kết quả phân tích trên máy Agilent 2100 Bioanalyser (Hình 3.4) cho thấy,

các đoạn DNA sau khi khuếch đại có kích thước khoàng 550 bp tương ứng với tính

toán lý thuyết. Kết quả này khẳng định đã nhân thành cônghai phân vùng V3 và V4

của vùng 16S rRNA. Sản phẩm thu được đảm bảo điều kiện để thực hiện các thí

nghiệm tiếp theo.

Hình 3.4. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm khuếch đại bằng cặp mồi 16S

Sau khi thực hiện bước gắn các đoạn index vào các sản phẩm 16S rRNA đã

khuếch đại, sản phẩm thu được này tiếp tục được kiểm tra trên máy Agilent 2100

Bioanalyser. Kết quả hiển thị như trên hình 3.5. Từ kết quả trên hình 3.5 cho thấy sản

phẩm của bước gắn cho kích thước khoảng 630 bp tương ứng với tính toán lý thuyết.

40

Kết quả nêu trên khẳng định, phản ứng gắn giữa đoạn 16S rRNA và các index được

thực hiện tốt, đủ điều kiện để thực hiện các thí nghiệm tiếp theo.

Hình 3.5. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm gắn index

3.4. Kết quả phân tích dữ liệu trình tự

Trong thí nghiệm này, các đoạn 16S rRNA được nhóm nghiên cứu thực hiện

giải trình tự và phân tích trình tự 2 lần. Dữ liệu sau khi thu được từ máy giải trình tự

Miseq, được đem phân tích bằng phần mềm Qiime. Sau khi thu được dữ liệu phân tích

bằng Qiime kết quả được trình bày trong bảng 3.3.

Bảng 3.3: Thống kê dữ liệu trình tự thu được sau bước giải trình tự

Số lượng đoạn trình tự có thể sử dụng

Mẫu

Tổng số trình tự đọc được

Kích thước trung bình

để phân tích (%)

1

142.893

138.261(96.76%)

438

2

87.048

82.718(95.03%)

438

3

119.885

113.893(95.00%)

438

4

124.574

120.525(96.75%)

438

Trên tổng số 142.893 trình tự đoạn 16S thu được từ mẫu cà phê tái canh khỏe,

sau khi loại bỏ các dữ liệu không đáng tin cậy, hơn 96% dữ liệu đã được chọn để tiến

hành phân tích tiếp theo. Tương tự như vậy, đối với mẫu thu thập từ cà phê tái canh bị

bệnh, cà phê kinh doanh năng suất cao và cà phê kinh doanh năng suất trung bình các

giá trị này lần lượt là 87.048, 119.885 và 124.574 trình tự đọc được và, trên 95% các

trình tự đáng tin cậy được lựa chọn để thực hiện các phân tích tiếp theo.

41

Đơn vị phận loại (OTUs) được định nghĩa là một trình tự hay một nhóm trình tự

tương đồng trong dữ liệu mẫu. Căn cứ vào các phân tích trên thế giới, các OTU thường

được chia theo các mức 0,03; 0,05; và 0,1 tương ứng với mức độ tương đồng giữa các

trình tự trong một OTU là 97%, 95%, và 90%.

Hình 3.6: Rarefaction curve dựa trên dữ liệu trình tự của bốn hệ vi sinh vậtcác OTU 0,1

Từ kết quả phân tích trên hình 3.6 cho thấy cả 4 hệ vi sinh vật đều chưa đạt bão

hòa về số lượng OTU ở mức độ 0,1, điều đó có nghĩa nếu tiếp tục giải trình tự với khối

lượng cao hơn thì số lượng các loài phát hiện được sẽ tiếp tục tăng.

Với các số liệu thu được, căn cứ vào các kết quả phân tích có thể thấy sự phong

phú về thành phần loài của các hệ vi sinh vật trong các mẫu đất nghiên cứu, tuy nhiên

để có thể nghiên cứu chính xác đầy đủ hơn về các hệ vi sinh vật này, cần tiếp tục giải

mã trình tự hệ vi sinh vật ở với quy mô lớn hơn.

3.5. Kết quả phân tích mức độ đa dạng quần thể vi khuẩn đất vùng rễ cây cà phê

Trên tổng số 3.470.415 trình tự phân tích của hệ vi sinh vật ở 4 nhóm mẫu đã

phân loại được 51 ngành, 141 lớp, 283 họ, 438 chi và 155 loài. Trên cả 4 khối dữ liệu

phân tích các nhóm trình tự có tỉ lệ phần trăm trên tổng số trình tự thấp hơn 0,1% được

xếp vào nhóm others, các trình tự không thể phân loại được thống kê trong nhóm

unclassified.

42

3.5.1. Kết quả đánh giá độ đa dạng ở mức phân loại ngành

Qua quá trình chọn lọc và phân tích dữ liệu dựa trên mẫu thu thập được, để làm

nổi bật nên vai trò của vi sinh vật đối với giai đoạn phát triển khác nhau của cây cà

phê, chúng tôi tiến hành phân tích, so sánh kết quả thu được theo 2 nhóm là cà phê tái

canh (cây con) và cà phê kinh doanh (cây trưởng thành). Dựa vào trình tự vi khuẩn

phân tích được ở cả bốn quần thể nghiên cứu chúng tôi đã phân loại được 51 ngành,

các nhóm trình tự có tỉ lệ phần trăm trên tổng số trình tự thấp hơn 0,1% được phân vào

nhóm còn lại, các trình tự không thể phân loại được được thống kê trong nhóm

unclassified.

Trong 51 ngành vi sinh vật phân tích được, trong khuôn khổ mục tiêu luận văn

chúng tôi tiến hành chọn lọc, đánh giá cấu trúc của một số ngành vi khuẩn chính có

khả năng tác động tới khả năng kháng tuyến trùng trong nhóm cà phê tái canh và năng

suất trong nhóm cà phê kinh doanh (hình 3.7). Kết quả phân tích cấu trúc vi sinh vật

trong đất trồng cà phê thu được sử dụng trong các nghiên cứu tiếp theo mới các mục

tiêu đánh giá ảnh hưởng của một số nguyên nhân khác tới sinh trưởng cà phát triển của

cây cà phê.

Hình 3.7. Cấu trúc quần thể vi sinh vật ở mức độ ngành

43

Từ biểu đồ trong hình 3.7 cho thấy các vi sinh vật chủ yếu thuộc nghành

Proteobacteria và Acidobacteria chiếm tỉ lệ trên 50% ở cả 4 mẫu nghiên cứu. Tiếp theo

là các ngành Actionbacteria, Bacteriodetes, Verucomicrobia, Chloroflexi,

Gemmationadetes, Planctomycetes và Nitrospirae. Tuy nhiên số lượng các vi sinh vật

trong các ngành trên biến động tùy thuộc vào từng giai đoạn phát triển của cây cà phê.

Trong nhóm cà phê tái canh số lượng trình tự xếp vào ngành proteobacteria cao hơn so

với cà phê kinh doanh và ngược lại ngành Acidobacteria số lượng trình tự xác định

được ở nhóm cà phê kinh doanh nhiều hơn so với nhóm cà phê tái canh. Proteobacteria

thuộc phân lớp vi khuẩn gram (-), bao gồm nhiều loại vi khuẩn có khả năng gây bệnh

như Escherichia, Salmonella, Vibrio, Helicobacter, Yersinia, các vi khuẩn cố định

đạm và nhiều chi quan trọng khác. Acidobacteria là ngành vi khuẩn phổ biến, các loài

vi khuẩn thuộc ngành này rất đa dạng về mặt sinh lý và phân bố, đặc biệt là trong đất,

tuy nhiên số lượng các loài được nuôi cấy chưa nhiều. Actinobacteria là một nhóm vi

khuẩn thật (Eubacteria) phân bố rất rộng rãi. Trước kia được xếp vào Tản thực vật

(nấm), nhưng ngày nay chúng được xếp vào vi khuẩn (Schizomycetes)

(https://vi.wikipedia.org/wiki/X%E1%BA%A1_khu%E1%BA%A9n)

Tiếp theo, dưới nghành chúng tôi xác định được 141 lớp trên toàn bộ dữ liệu và

chọn ra 15 lớp có số lượng lớn để phân tích (hình 3.8).

3.5.2. Kết quả phân tích cấu trúc thành phần vi khuẩn chiếm ưu thế trong đất

vùng rễ ở mức độ phân loại lớp và họ vi khuẩn

Kết quả phân tích thành phần vi khuẩn chiếm ưu thế ở mức độ phân loại lớp

(Class) được thể hiện ở (hình 3.8). Phân tích dữ liệu metagenomics cho thấy

Alphaproteobacteria, Betaproteobacteria, Gamaproteobacteria, Saprospirae,

Actinobacteria, Actinobacteria-6 là 6 lớp phổ biến nhất. Đặc biệt, vi sinh vật thuộc lớp

Alphaproteobacteria chiếm số lượng cao hơn hẳn ở trong mẫu cà phê tái canh tốt. Đây

là lớp vi khuẩn gram âm bao gồm một số chi vi sinh vật có khả năng quang hợp,

chuyển hóa hợp chất C1 như Methylobacterium, cộng sinh như Rhizobium. Vi sinh vật

thuộc lớp Betaproteobacteria có khả năng chuyển hóa rất đa dạng, chẳng hạn như

Rhodocyclus có thể sử dụng được năng lượng mặt trời. Một số loài khác có thể sử

dụng các hợp chất vô cơ để tạo ra năng lượng, như Nitrosomonadales chuyển hóa

44

nitrat. Gammaproteobacteria bao gồm một số nhóm quan trọng như

Enterobacteriaceae, Vibrionaceae, và Pseudomonadaceae. Chúng tôi tiếp tục đánh giá

cấu trúc hệ vi khuẩn đất vùng rễ cà phê ở mức độ họ (Family) nhằm lựa chọn những

họ vi khuẩn phổ biến trong các mẫu đất.

Hình 3.8. Cấu trúc quần thể vi sinh vật ở mức độ lớp

Ở mức độ họ, chúng tôi xác định được 283 họ trên toàn bộ dữ liệu và chọn ra

13 họ có số lượng OUT lớn để phân tích (Hình 3.8). Từ biểu đồ 3.8 cho ta thấy họ

Sphingomonadaceae, Chitinnophagaceae, Xanthomonadaceae, Burkholderiaceae,

Chthonlobacteraceae chiếm số lượng lớn. Mặc dù số lượng họ vi sinh vật thu được là

đa dạng, nhưng số chi trong cùng một họ thì khác nhau, phụ thuộc vào từng mẫu.

45

Hình 3.9. Cấu trúc quần thể vi sinh vật ở mức độ họ

Trong nghiên cứu này, chúng tôi chỉ tập trung phân tích các họ các tác động đến

sinh trưởng, phát triển của thực vật và môi trường. Sphingomonadaceae là một họ

thuộc lớp Alphaproteobacteria có khả năng phân hủy một số hợp chất vòng thơm như

dioxin, vì thế nhóm khuẩn này được đặc biệt quan tâm trong các nghiên cứu nhằm

khắc phục ô nhiễm môi trường. Trong các mẫu phân tích của chúng tôi, vi sinh vật

thuộc họ Sphingomonadaceae có số lượng giảm gấp đôi trong mẫu nhiễm bệnh so với

các mẫu khác. Trong các mẫu cà phê tái canh tốt, số lượng các vi sinh vật thuộc họ

Chitinophagaceae vượt trội hẳn (75729 OTUs) so với mẫu tái canh bệnh (28549

OTUs). Họ Chitinophagaceaebao gồm một số loài có thể thủy phân chitin (thành phần

cấu tạo nên vỏ của tuyến trùng) như B. Chitinophaga pinensis, thủy phân

của cellulosenhư B. Chitinophaga oryziterrae. Điều này phần nào cho thấy hai họ

Sphingomonadaceae và Chitinophagaceae có thể tác động tốt đến sự sinh trưởng và

phát triển của cây cà phê.

Họ Xanthomonadaceae và Burkholderiaceae là hai họ có khả năng gây bệnh ở

thực vật cũng phát hiệnphổ biến trong các mẫu đất nghiên cứu, kể cả mẫu cà phê kinh

doanh năng suất cao.Xanthomonadaceae là nhóm vi khuẩn gây bệnh lớn nhất, bao gồm

các loài như Xanthomonas citri, Xanthomonas euvesicatoria, Xanthomonas oryzae và

46

Xylella fastidiosa. Các vi khuẩn này ảnh hưởng đến các cây trồng quan trọng trong

nông nghiệp bao gồm cà chua, chuối, cây có múi, gạo, và cà phê. Tuy nhiên tại mẫu tái

canh tốt 2 họ này chiếm một số lượng ưu thế điều này có thể liên quan đến vấn đề

tương tác giữa các hệ vi sinh vật mà chúng ta chưa biết tới, còn đối với nhóm cà phê

kinh doanh có năng suất cao hệ vi sinh vật tồn tại trong mẫu đã được ổn định nên số

lượng các loài vi sinh vật thuộc họ Xanthomonadaceae chiếm ưu thế hơn mẫu năng

suất trung bình.

Chúng tôi tiếp tục tiến hành phân tích cấu trúc, thành phần hệ vi khuẩn đất vùng

rễ cây cà phê ở mức độ chi (Genus).

3.5.3. Kết quả phân tích cấu trúc hệ vi khuẩn đất vùng rễ ở mức độ chi

Ở mức độ thấp hơn về mặt phân loại, nghiên cứu đã xác định được 438 chi trên

toàn bộ dữ liệu phân tích, và chọn ra một số chi quan trọng, được cho là có lợi hay hại

trên cây cà phê (Hình 3.10 và 3.11), để tập trung phân tích. Các nhóm có tỉ lệ phần

trăm thấp hơn 0,1% được phân vào các nhóm khác. Các trình tự còn lại được xếp

nhóm chưa được phân loại.

B

A

A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật mức độ chi có lợi trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật mức độ chi có lợi trong nhóm cà phê kinh doanh

Hình 3.10. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có lợi ở mức độ chi

Từ hình 3.10 cho thấy có 11 chi các vi sinh vật có lợi trong đất quanh vùng rễ

cây cà phê. Tuy nhiên số lượng loài trong các chi phụ thược vào kiểu cảnh tác và giai

đoạn phát triển của cây. Kết quả trong hình 3.9A cho thấy, chi Sphingobium ở mẫu cà

phê tái canh có số lượng cao gấp 8 lần so với mẫu cà phê tái canh nhiễm bệnh. Đây

làchi bao gồm các loài được biết là có khả năng phân huỷ một loạt các hóa chất gây

47

độc cho môi trường như các hợp chất thơm và clo, phenol như nonylphenol và

pentachlorophenol, thuốc diệt cỏ như (RS)-2-(4-chloro-2-methylphenoxy) propionic

acid và hexachlorocyclohexane, và hydrocacbon thơm đa vòng. Chi Chitinophaga

chiếm một số có khả năng phân hủy chitin (vỏ tuyến trùng) và cellulose đây là một chi

vi sinh vật đất có ảnh hưởng đến sinh trưởng của cây cà phê chúng có khả năng phân

hủy vỏ chitin của tuyến trùng trong đất. Chi Streptomyces được tìm thấy chủ yếu trong

đất và thảm thực vật mục nát. Streptomyces sinh bào tử, tạo mùi đặc trưng, là kết quả

từ sản sinh geosmin trong quá trình chuyển hóa các chất. Streptomyces được nghiên

cứu rộng rãi và được biết đến nhiều nhất là chi của họ xạ khuẩn (Actinomyces).

Streptomyces thường sống ở đất có vai trò là vi sinh vật phân hủy quan trọng. Chủng

vi sinh này sản xuất hơn một nửa số thuốc kháng sinh trên thế giới và đó là sản phẩm

có giá trị lớn trong lĩnh vực y tế, chính vì có khả năng sinh kháng sinh nên mẫu cà phê

tái canh khỏe mạnh phân tích được lượng Streptomyces gấp 9 lần so với mẫu cà phê tái

canh nhiễm bệnh.

Từ hình 3.10 B cho thấy các chi Sphingobium, Chitinophaga, Streptomyces

chiếm ưu thế hơn trong mẫu cà phê kinh doanh năng suất cao. Ngoài các chi đó ra ta

thấy Bacillus loài gần như phổ biến trong tự nhiên, ví dụ như trong đất, mà còn xảy ra

trong môi trường khắc nghiệt như pH cao ( B. alcalophilus), nhiệt độ cao ( B.

thermophilus ), hoặc muối cao ( B. halodurans ). B. thuringiensis tạo ra một độc tố có

thể giết côn trùng và do đó đã được sử dụng làm thuốc trừ sâu (Joan L. Slonczewski &

John W. Foster (2011), các loại vi sinh vật trên tồn tại trong đất, chúng có tác dụng lên

trên vật chủ giúp cây chủ tăng được sức đề kháng với các loại bệnh, nấm, côn trùng

hại. Chính vì vậy qua số liệu thu đư

Được nhận thấy trong nhóm cà phê kinh doanh năng suất cao có bacillus cao

gấp 3 lần so với nhóm cà phê kinh doanh có năng suất thấp.

48

B

A

A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi trong nhóm cà phê kinh doanh.

Hình 3.11. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi

Số lượng và phân bố của các chi có hại đối với sinh trưởng và phát triển của cây

cà phê được thế hiện trong hình 3.11 A và 3.11 B, trong đó chi Burkholderia có số

lượng lớn. Đặc biệt với nhóm tái canh bệnh, số lượng vi sinh vật cao gấp 13 lần so với

nhóm cà phê tái canh tốt.

3.5.4. Kết quả phân tích thành phần một số loài vi khuẩn đặc trưng của hệ vi

sinh vật đất vùng rễ cây cà phê.

Phân tích trên toàn bộ dữ liệu, chúng tôi xác định được sự có mặt của 155 loài

và chọn ra một số loài đặc trưng để phân tích (Hình 3.12 và 3.13)

A

B

A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài trong nhóm cà phê kinh doanh.

Hình 3.12. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài

Trong số các loài được phát hiện, S. wittichii chiếm số lượng ưu thế đặc biệt với

mẫu tái canh tốt có số lượng cao gấp 5 lần so với mẫu tái canh bệnh. Điều này cho

thấy S.wittichii có thể ảnh hưởng trực tiếp đến sự sinh trưởng và phát triển của cà phê.

Các loài S. wittichii là loài có khả năng phân hủy dioxin. Ngoài ra còn có các loài tạo

ra các chất khác nhau như G. fujikuroi sản xuất chất kích thích sinh trưởng thực vật, H.

49

ochraceum chuyển hóa kháng nấm và sinh kháng sinh; R. leguminosarum có khả năng

cố định đạm tự do.

A

B

A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài trong nhóm cà phê kinh doanh

Hình 3.13. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài

Trong số các loài phân tích, có 5 loài có thể gây bệnh trên cà phê và các loài

thực vật khác.Kết quả thể hiện ở Hình 3.13 cho thấy, có các loài gây hại cho thực vật

điển hình như R. solanacearum gây bệnh héo lá, Fastidiosa gây bệnh lá cháy,

Pseudomonas garcae gây bệnh đốm lá cà phê. Đối với nhóm cà phê tai canh bị bệnh

và năng suất thấp ta thấy sự có mặt của các loài Fastidiosa, Pseudomonas garcae và R.

solanacearum cao hơn các nhóm tái canh tốt cà năng suất cao. Điều này phần nào cho

thấy các chủng này phần nào tác động tới sự phát triển cũng như năng suất của cây cà

phê.

50

KẾT LUẬN VÀ KIẾN NGHỊ

1. Kết luận

- Xác định được 512.896 trình tự các đoạn V3 và V4 trên gen 16S rRNA,

trong đó 133,661 trình tự cho cà phê tái canh ít bị bệnh,124,574 trình tự cho cà phê

tái canh bị bệnh,122,816 trình tự cho cà phê kinh doanh năng suất cao và 131,845

trình tự cho cà phê kinh doanh năng trung bình.

- Kết quả phân tích metagenomic cho thấy chiến đa số là các vi sinh vật vùng

rễ cà phê thuộc ngành Proteobacteria, lớp Alphaproteobacteria, Betaproteobacteria,

Gamaproteobacteria, Saprospirae, Actinobacteria, Actinobacteria-6, họ

Sphingomonadaceae, Chitinnophagaceae, Xanthomonadaceae, Burkholderiaceae,

Chthonlobacteraceae, Streptomycetaceae (33,44%, 41,71%, 41,57% và 40,49% lần

lượt cho cà phê tái canh tốt, cà phê tái canh bệnh, cà phê kinh doanh năng suất cao và

cà phê kinh doanh năng suất trung bình)

- Chi Sphingobium thuộc họ Sphingomonadaceae, Chitinophaga thuộc họ

Chitinnophagaceae, Streptomyces thuộc họ Streptomycetaceae chiếm ứu thế trong

mẫu cà phê kinh doanh năng suất cao. Chi Burkholderia thuộc họ Burkholderiaceae

phổ biến trong vùng rễ nhóm cá phê tái canh bệnh (cao gấp 13 lần so với nhóm cà

phê tái canh tốt).

- Loài Sphingobium wittichii chiếm ưu thế trong rễ cà phê tái canh tốt (gấp 5

lần so với tái canh bệnh). Các loài gây bệnh điển hình trên cây cà phê như R.

solanacearum gây bệnh héo lá, Fastidiosa gây bệnh lá cháy, Pseudomonas garcae

gây bệnh đốm lá cà phê cũng phát hiện trong các vùng rễ khác nhau, đặc biệt ở vùng

tái canh bệnh.

2. Kiến nghị

Từ kết quả thu được có thể nghiên cứu hướng phát triển sử dụng các chế

phẩm sinh học làm tăng các vi sinh vật tự nhiên có lợi và giảm các vi sinh vật có hại,

trực tiếp hoặc gián tiếp lên sinh trưởng và phát triển của cây cà phê, nhằm mục tiêu

phát triển bền vững, tăng năng suất và chất lượng của cây cà phê Việt Nam.

Tiến hành tiệp tục nghiên cứu để đánh giá sự ảnh hưởng của hệ sinh vật tới khả

năng sinh trưởng và phát triển của cà phê.

51

52

TÀI LIỆU THAM KHẢO

Tài liệu tham khảo

Tài liệu Tiếng Anh

1. Amann, R. I., Ludwig, W., Schleifer, K. H., (1995) “Phylogenetic

identification and in situ detection of individual microbial cells without

cultivation”. Microbiol. Rev. 59, 143–169.

2. Atkinson, D. and Watson, C. A., (2000) “The beneficial rhizosphere: A

dynamic entity”. Appl. Soil Ecol., 15, 99-104.

3. Aragon AD, Torrez-Martinez N, Edwards JS, (2012) “Genomic analysis of

Saccharomyces cerevisiae isolates that grow optimally with glucose as the sole

carbon source”. Electrophoresis 33(23): 3514-20.

4. Azad AK, Curtis A, Papp A, Webb A, Knoell D, Sadee W, Schlesinger LS,

(2013) “Allelic mRNA expression imbalance in C-type lectins reveals a frequent

regulatory SNP in the human surfactant protein A (SP-A) gene”. Genes Immun

14(2): 99-106.

5. Barns SM; Cain EC; Sommerville L; Kuske CR, (2007) “Acidobacteria

phylum sequences in uranium-contaminated subsurface sediments greatly

expand

the known diversity within

the phylum”. Appl. Environ.

Microbiol. 73 (9):31136.

6. Beja, O., Koonin, E. V., Aravind, L., Taylor, L. T., (2002) “Comparative

genomic analysis of archaeal genotypic variants in a single population and in

two different oceanic provinces”. Appl. Environ. Microbiol. 68, 335–345.

7. Bomar, L. , Maltz, M., Colston, S. and Graf, J. (2011) Directed culturing

of microorganisms using metatranscriptomics. MBio 2: e00012-0001.

8. Breitbart M, Salamon P, Andresen B, Mahaffy JM, Segall AM, Mead D,

Azam F, Rohwer F "Genomic analysis of uncultured marine viral communities".

Proceedings of the National Academy USA. 2002, 99 (22): 14250–14255.

53

9. Castro TL, Seyffert N, Ramos RT, Barbosa S, Carvalho RD, Pinto AC,

Carneiro AR, Silva WM, Pacheco LG, Downson C, Schneider MP, Miyoshi A,

Azevedo V, Silva A, (2013) “IonTorrent-based transcriptional assessment of a

Corynebacterium pseudotuberculosis equi strain reveals denaturing high-

performance liquid chromatography a promising rRNA depletion method”.

Microb Biotechnol 6(2): 168-177.

10. Campos VP & Villain L, (2005). Nematodes parasites of coffee and

cocoa. In: Plant parasitic nematodes in subtropical and tropical agriculture. Luc

M, Sikora A & Bridge J (Eds.). Pp: 529-579. CABI Publishing, Wallingford,

UK.

11. Daniel R., (2005) “The metagenomics of soil”. Nat Rev Microbiol.3(6):

470-488.

12. Daves K (2010) It’s “Watson Meets Moore” as Ion Torrent Introduces

Semiconductor

Sequencing. Bio-IT World

2010.

http://www.bio-

itworld.com/news/03/01/10/ion-torrent-semiconductor-sequencing.html.

13. Delmont TO, Robe P, Clark I, Simonet P, Vogel TM, (2011)

“Metagenomic comparison of direct and

indirect soil DNA extraction

approaches”. J Microbiol Methods86(3):397–400.

14. Edwards, RA; Rodriguez-Brito B, Wegley L, Haynes M, Breitbart M,

Peterson DM, Saar MO, Alexander S, Alexander EC, Rohwer F (2006). "Using

pyrosequencing to shed light on deep mine microbial ecology". BMC Genomics

7: 57.

15. EJ. Chung, TS Park, CO Jeon, YR Chung, (2012) “Chitinophaga

oryziterrae sp. nov., isolated from the rhizosphere soil of rice (Oryza sativa

L.)”.International Journal of Systematic and Evolutionary Microbiology.

16. Ferla MP, Thrash JC, Giovannoni SJ, Patrick WM (2013). "New rRNA

gene-based phylogenies of the Alphaproteobacteria provide perspective on

major groups, mitochondrial ancestry and phylogenetic instability"

54

17. Gams, W. (2007) Biodiversity of soil-inhabiting fungi. Biodivers.

Conserv. 16, 69–72

18. Handelsman, J., (2004) “Metagenomics: application of genomics to

uncultured microorganisms”. Microbiol. Mol. Biol. Rev. 68, 669-685.

19. Hartwig B, James GV, Konrad K, Schneeberger K, Turck F, (2012)

“Fast isogenic mapping-by-sequencing of ethyl methanesulfonate-induced

mutant bulks”. Plant Physiol 160(2): 591-600.

20. Hardeman, F., and S. Sjoling., (2007) “Metagenomic approach for the

isolation of a novel low-temperature-active lipase from uncultured bacteria of

marine sediment”. FEMS Microbiol. Ecol.59:524-534.

21. Hassan SS, Guimarães LC, Pereira Ude P, Islam A, Ali A, Bakhtiar SM,

Ribeiro D, Rodrigues Dos Santos A, Soares Sde C, Dorella F, Pinto AC,

Schneider MP, Barbosa MS, Almeida S, Abreu V, Aburjaile F, Carneiro AR,

Cerdeira LT, Fiaux K, Barbosa E, Diniz C, Rocha FS, Ramos RT, Jain N,

Tiwari S, Barh D, Miyoshi A, Müller B, Silva A, Azevedo V, (2012) “Complete

genome sequence of Corynebacterium pseudotuberculosis biovar ovis strain

P54B96 isolated from antelope in SOTUh Africa obtained by rapid next

generation sequencing technology”. Stand Genomic Sci7(2): 189–199.

22. Hochmuth T, Niederkruger H, Gernert C, Siegl A, Taudien

S,Platzer M, Crews P, Hentschel U & Piel J (2010) Linking chemical

and microbial diversity in marine sponges: possiblerole for Poribacteria as

producers of methyl-branched fatty acids. Chembiochem 11: 2572 – 2578

23. Howden BP, McEvoy CR, Allen DL, Chua K, Gao W, Harrison PF, Bell

J, Coombs G, Bennett-Wood V, Porter JL, Robins-Browne R, Davies JK,

Seemann T, Stinear TP, (2011) “Evolution of multidrug resistance during

Staphylococcus aureus infection involves mutation of the essential two

component regulator WalKR”. PLoS Pathog 7(11): e1002359.

55

24. Hugenholz, P., (2002) “Exploring prokaryotic diversity in the genomic

era”. Genome Biology3 (2): 1–8.

25. Iqbal, Z., Caccamo, M., Turner, I., Flicek, P. and McVean, G.,

(2012)“De novo assembly and genotyping of variants using colored de Bruijn

graphs”. Nat Genet 44: 226–32.

26. Jünemann S, Prior K, Szczepanowski R, Harks I, Ehmke B, Goesmann

A, Stoye J, Harmsen D, (2012) “Bacterial community shift in treated

periodontitis patients revealed by ion torrent 16S rRNA gene amplicon

sequencing”. PLoS One 7(8): e41606.

27. Pace, N. R., Stahl, D. A., Lane, D. J., Olsen, G. J., The analysis of

natural microbial populations by ribosomal RNA se-quences.Adv. Microb. Ecol.

1986,9, 1–55.

28. Pace, N.R.; Delong, EF (1991) Analysis of a marine picoplankton

community by 16S rRNA gene cloning and sequencing. Journal of

Bacteriology. 173 (14): 4371–4378.

29. Parachin, Nádia Skorupa; Marie F Gorwa-Grauslund. "Isolation of

xylose isomerases by sequence- and function-based screening from a soil

metagenomic library". Biotechnology for Biofuels 4 (1): 9 (2011).

30. Purushothaman S, Toumazou C, Ou C-P (2006) Protons and single

nucleotide polymorphism detection: a simple use for the ion sensitive field

effect transistor. Sensors & Actuators: B. Chemical 114 (2): 964-968.

31. Perkel J (2011) Making contact with sequencing's fourth generation.

Biotechniques 2011.

32. Poinar, HN; Schwarz, C, Qi, J, Shapiro, B, Macphee, RD, Buigues, B,

Tikhonov, A, Huson, D, Tomsho, LP, Auch, A, Rampp, M, Miller, W, and

Schuster, SC

(2006). "Metagenomics

to Paleogenomics: Large-Scale

Sequencing of Mammoth DNA". Science 311 (5759): 392–394.

56

33. Kakirde, Kavita S.; Larissa C. Parsley, Mark R. Liles (1 November

2010).

"Size Does Matter: Application-driven Approaches

for Soil

Metagenomics". Soil biology & biochemistry 42 (11): 1911–1923.

34. Karow J., (2011) “At AGBT, Ion Torrent Customers Provide First

Feedback”. Life Tech OTUlines Platform's Growth. In Sequence.

35. Kennedy, A.C., (1999) “The rhizosphere and spermosphere. In:

Principles and applications of soil microbiology” (Eds.: Sylvia, D. M.,

Fuhrmann, J. J., Hartel, P. G., and Zuberer, D. A.). Prentice Hall, Upper Saddle

River, NewJersy.

36. Kuske CR; Barns SM; Busch JD (1997). “Diverse uncultivated bacterial

groups from soils of the arid southwestern United States that are present in many

geographic regions”. Appl. Environ. Microbiol. 63

37. Lussier FX, Chambenoit O, Côté A, Hupé JF, Denis F, Juteau P, Beaudet

R, Shareck F, (2011)“Construction and functional screening of a metagenomic

library using a T7 RNA polymerase-based expression cosmid vector”. J. Ind.

Microbiol. Biotechnol. 38 (9): 1321-8.

38. Lynch, J. M., (1981) “Promotion and inhibition of soil aggregate

stability by microorganisms”. J. Gen. Microbiol. 126, 371-375

39. Madigan, M. và J. Martinko. (eds.) (2005). Brock Sinh học của vi sinh

vật (lần thứ 11 ed.). Prentice Hall. ISBN 0-13-144329-1 .

40. Mardis ER, (2008) “Next-generation DNA sequencing methods”. Annu

Rev Genomics Hum Genet 9: 387–402.

41. Maplestone, P. A. and Campbell, R., (1989) “Colonization of roots of

wheat seedlings by Bacilli proposed as biocontrol against take all”. Soil Biol.

Biochem. 21, 543-550.

42. Mellmann A, Harmsen D, Cummings CA, Zentz EB, Leopold SR, Rico

A, Prior K, Szczepanowski R, Ji Y, Zhang W, McLaughlin SF, Henkhaus JK,

Leopold B, Bielaszewska M, Prager R, Brzoska PM, Moore RL, Guenther S,

57

Rothberg JM, Karch H, (2011) “Prospective genomic characterization of the

German enterohemorrhagic Escherichia coli O104:H4 OTUbreak by rapid next

generation sequencing technology”. PLoS One 11;6(7): e22751.

43. Mendes, R. và cs. (2011) Deciphering the rhizosphere microbiome for

disease-suppressive bacteria. Science 332, 1097–1100.

44. Metzker M.L, (2005) “Emerging technologies in DNA sequencing”.

Genome Res 15(12): 1767-76.

45. Metzker ML., (2010) “Sequencing technologies - the next generation”.

Nat Rev Genet. 11(1): 31-46. doi: 10.1038/nrg2626. Epub 2009 Dec 8.

46. Perkel J, (2011) “Making contact with sequencing's fourth generation”.

Biotechniques 2011.

47. Purushothaman S, Toumazou C, Ou C-P, (2006) “Protons and single

nucleotide polymorphism detection: a simple use for the ion sensitive field

effect transistor”. Sensors & Actuators: B. Chemical114 (2): 964-968.

48. Ramachandran C., Fonseca HB., Jhabvala P, Escalon EA., Melnick SJ.

(2002) Curcumin inhibits telomerase activity through human telomerase reverse

transcriptase in MCF-7 breast cancer cell line. Cancer Lett 184: 1–6.

49. Rappe, M. S.; Giovannoni, S. J., (2003). “The Uncultured Microbial

Majority”. Annual Review of Microbiology57: 369–394.

50. Ramos RT, Carneiro AR, Soares Sde C, dos Santos AR, Almeida S,

Guimarães L, Figueira F, Barbosa E, Tauch A, Azevedo V, Silva A, (2013)

“Tips and tricks for the assembly of a Corynebacterium pseudotuberculosis

genome using a semiconductor sequencer”. Microb Biotechnol. 6(2): 150-6.

51. Rothberg JM, Hinz W, Rearick TM, Schultz J, Mileski W, Davey M,

Leamon JH, Johnson K, Milgrew MJ, Edwards M, Hoon J, Simons JF, Marran

D, Myers JW, Davidson JF, Branting A, Nobile JR, Puc BP, Light D, Clark TA,

Huber M, Branciforte JT, Stoner IB, Cawley SE, Lyons M, Fu Y, Homer N,

58

Sedova M, Miao X, Reed B, Sabina J, Feierstein E, Schorn M, Alanjary M,

Dimalanta E, Dressman D, Kasinskas R, Sokolsky T, Fidanza JA, Namsaraev E,

McKernan KJ, Williams A, Roth GT, Bustillo J, (2011) “An integrated

semiconductor device enabling non-optical genome sequencing”.Nature

475(7356): 348-352.

52. Rolf Daniel,

(2005)“The metagenomics of

soil”. Nat Rev

Microbiol.3(6):470-488.

53. Rusch DB, Halpern AL, Sutton G, Heidelberg KB, Williamson S, et al.

The Sorcerer II Global Ocean Sampling Expedition: Northwest Atlantic through

Eastern Tropical Pacific. PLoS Biology 5: e77 (2007)

54. Rusk N, (2011) “Torrents of sequence”. Nat Meth 8(1): 44-44.

55. Slonczewski JL, Foster JW

(2014). Microbiology: An Evolving

Science (3rd ed.). W. W. Norton & Company. pp. 742–3

56. Tamilarasi,

S., Nanthakumar, K., Karthikeyan, K.,

and

Lakshmanaperumalsamy,

(2008)

“Diversity

of

root

associated

microorganismsof

selected medicinal

plants

and

influence

of

rhizomicroorganisms on the antimicrobial property of Coriandrum sativum”. J.

Environ. Biol. 29, 127-134.

57. Thomas, T., J. Gilbert, and F. Meyer, (2012) “Metagenomics - a guide

from sampling to data analysis”. Microb Inform Exp 2(1): p. 3.

58. Torsvik, V., Daae, F. L., Sandaa, R.-A. & Øvreås, L. Microbial diversity

and function in soil: from genes to ecosystems. Curr. Opin. Microbiol. 5, 240–

245 (2002).

59. Turnbaugh PJ, Ley RE, Hamady M, Fraser-Liggett CM, Knight R, et al.

The Human Microbiome Project. Nature 449: 804–810 (2007)

59

60. Tringe SG, von Mering C, Kobayashi A, Salamov AA, Chen K, et al.

Comparative metagenomics of microbial communities. Science 308: 554–557

(2005)

61. Tyson, GW; Chapman J, Hugenholtz P, Allen EE, Ram RJ, Richardson

PM, Solovyev VV, Rubin EM, Rokhsar DS, Banfield JF (). "Insights into

community structure and metabolism by reconstruction of microbial genomes

from the environment". Nature. 2004, 428 (6978): 37–43.

62. Schmeisser, C., Steele, H. and Streit, W.R. (2007) Metagenomics,

biotechnology with nonculturable microbes. Appl Microbiol Biotechnol 75,

955–962

63. Sylvia, D. M. and Chellemi, D. O., (2001) “Interactions among root-

inhabiting fungi and their implications for biological control of root pathogens”.

Adv. Agron. 73, 1-33.

64. Venter, JC; Remington K, Heidelberg JF, Halpern AL, Rusch D, Eisen

JA, Wu D, Paulsen I, Nelson KE, Nelson W, FOTUs DE, Levy S, Knap AH,

Lomas MW, Nealson K, White O, Peterson J, Hoffman J, Parsons R, Baden-

Tillson H, Pfannkoch C, Rogers Y, Smith HO (2004). "Environmental Genome

Shotgun Sequencing of the Sargasso Sea". Science 304 (5667): 66–74.

65. Visi DK, D'Souza N, Ayre BG, Webber Iii CL, Allen MS, (2013)

“Investigation of

the bacterial retting community of kenaf (Hibiscus

cannabinus) under different conditions using next-generation semiconductor

sequencing”. J Ind Microbiol Biotechnol. 40(5): 465-475.

66. Vogel U, Szczepanowski R, Claus H, Jünemann S, Prior K, Harmsen D,

(2012)“Iontorrent personal genome machine sequencing for genomic typing of

Neisseria meningitidis for rapid determination of multiple layers of typing

information”. J Clin Microbiol.50(6): 1889-1894.

67. Whiteley AS, Jenkins S, Waite I, Kresoje N, Payne H, Mullan B,

Allcock R, O'Donnell A, (2012) “Microbial 16S rRNA Ion Tag and community

60

metagenome sequencing using the IonTorrent (PGM) Platform”.J Microbiol

Methods 91(1):80-88.

68. Woese, C. R., (1987) “Bacterial evolution”. Microbiol. Rev. 51, 221–

271.

69. Wolfgang, K., Erich, C., Brigitte, K., (2002) “Microbial contamination

of medicinal plants: A review”. Planta Medica 68, 5-15.

70. Yergeau E, Lawrence JR, Sanschagrin S, Waiser MJ, Korber DR, Greer

CW, (2012) “Next-generation sequencing of microbial communities in the

Athabasca River and its tributaries in relation to oil sands mining activities”.

Appl Environ Microbiol. 78(21): 7626-37.

61