VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT
HOÀNG THỊ HUYỀN TRANG
ỨNG DỤNG KĨ THUẬT METAGENIMICS TRONG NGHIÊN CỨU
HỆ VI SINH VẬT VÙNG RỄ CÂY CÀ PHÊ TẠI HUYỆN CƯM’GRA
TỈNH ĐĂK LĂK
LUẬN VĂN THẠC SĨ
Chuyên ngành: Sinh học thực nghiệm
Mã số: 60 42 01 14
HÀ NỘI, 2017
LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn là công trình nghiên cứu của tôi dưới sự
hướng dẫn của TS. Phạm Bích Ngọc. Các số liệu, kết quả nêu trong luận văn là
trung thực và chưa từng được công bố trong bất kỳ công trình nào khác.
Tác giả luận văn
Hoàng Thị Huyền Trang
i
LỜI CẢM ƠN
Với lòng biết ơn sâu sắc, tôi xin gửi lời cảm ơn tới TS. Phạm Bích Ngọc
đã tận tình hướng dẫn và tạo điều kiện thuận lợi, giúp đỡ tôi trong suốt quá
trình học tập, làm việc và hoàn thành luận văn.
Xin chân thành cảm ơn TS. Vũ Huyền Trang, Ths. Nguyễn Hồng Hà, Ths.
Nguyễn Khắc Hưng cùng tập thể cán bộ, nghiên cứu sinh, học viên phòng Công
nghệ tế bào thực vật, Viện Công nghệ Sinh học, Viện Hàn lâm Khoa học và công
nghệ Việt Nam đã nhiệt tình giúp đỡ, truyền đạt kinh nghiệm quý báu cho tôi
trong suốt thời gian thực hiện luận văn.
Xin chân thành cảm ơn đề tài : “Nghiên cứu metagenome của vi sinh vật
đất vùng rễ một số cây trồng ở Việt Nam: cây thuốc có củ (cây nghệ), cây công
nghiệp (cà phê) nhằm tăng năng suất và chất lượng cây trồng” do PGS. TS. Lê
Mai Hương chủ nhiệm đã hỗ trợ kinh phí và trang thiết bị trong quá trình thực
hiện luận văn.
Qua đây, tôi cũng xin gửi lời cảm ơn tới các thầy cô và ban đào tạo viện
Sinh thái và tài nguyên sinh vật đã hướng dẫn, truyền đạt kiến thức cho tôi trong
suốt thời gian học tập và nghiên cứu.
Cuối cùng tôi xin cảm ơn đến bạn bè và gia đình đã giúp đỡ, chia sẻ,
động viên tôi trong suốt quá trình học tập cũng như thực hiện luận văn.
Hà Nội, 1 tháng 11 năm 2017 Học viên Hoàng Thị Huyền Trang
ii
MỤC LỤC
MỞ ĐẦU ............................................................................................................... 1
CHƯƠNG 1: TỔNG QUAN TÀI LIỆU ............................................................... 3
1.1. Cây cà phê và tình hình sản xuất cà phê .................................................... 3
1.1.1. Nguồn gốc,phân bố cây cà phê ............................................................... 3
1.1.2. Tình hình sản xuất cây cà phê tại Việt Nam ....................................... 3
1.2. Hệ vi sinh vật đất và ý nghĩa đối với sinh trưởng, phát triển của cây trồng
........................................................................................................................... 5
1.2.1. Giới thiệu về hệ vi sinh vật ................................................................. 5
1.2.2. Vi sinh vật đất vùng rễ ........................................................................ 6
1.3. Công nghệ metagenomics và ứng dụng nghiên cứu đa dạng di truyền của
các hệ vi sinh vật đất ......................................................................................... 8
1.4. Các bước ứng dụng công nghệ Metagenomics trong nghiên cứu da dạng
khu hệ sinh vật từ môi trường ........................................................................... 9
1.5. Ứng dụng đọc trình tự gen thế hệ mới trong nghiên cứu metagenomics 14
1.5.1. Công nghệ đọc trình tự bán dẫn ion .................................................. 15
1.5.2. Công nghệ giải trình tự Illumina (Solexa) sequencing ..................... 17
1.6. Các nghiên cứu metagenomics trên thế giới và Việt Nam ...................... 21
1.6.1. Các nghiên cứu metagenomics trên thế giới ..................................... 21
1.6.2. Các nghiên cứu metagenomics tại Việt Nam .................................... 22
CHƯƠNG 2. VẬT LIỆU – PHƯƠNG PHÁP .................................................... 25
2.1. Vật liệu nghiên cứu .................................................................................. 25
2.2. Phương pháp nghiên cứu .......................................................................... 25
2.2.1. Phương pháp thu mẫu ....................................................................... 25
2.2.2. Phương pháp tách chiết DNA tổng số ............................................... 26
2.2.4. Khuếch đại vùng 16S rRNA ............................................................. 28
2.2.5. Tinh sạch sản phẩm PCR .................................................................. 29
2.2.6. Gắn Index (Nextera XT Index kit) .................................................... 29
iii
2.2.7. Tinh sạch sản phẩm gắn Index .......................................................... 31
2.2.8. Đánh giá thư viện .............................................................................. 31
2.2.9. Biến tính thư viện và giải trình tự trên máy Miseq ........................ 31
2.2.10. Phân tích dữ liệu .......................................................................... 33
2.2.11. Phương pháp xác định tuyến trùng ............................................. 35
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ...................................................... 36
3.1.
Phân tính đặc điểm lý hóa và sinh học chung của các mẫu ................ 36
3.2. Kết quả tách chiết DNA tổng số. ........................................................ 39
3.3. Chuẩn bị thư viện và gắn adapter ........................................................ 40
3.4. Kết quả phân tích dữ liệu trình tự ....................................................... 41
3.5. Kết quả phân tích mức độ đa dạng quần thể vi khuẩn đất vùng rễ cây
cà phê ............................................................................................................. 42
3.5.1. Kết quả đánh giá độ đa dạng ở mức phân loại nghành .................. 43
3.5.2. Kết quả phân tích cấu trúc thành phần vi khuẩn chiếm ưu thế trong
đất vùng rễ ở mức độ phân loại lớp và họ vi khuẩn. ................................... 44
3.5.3. Kết quả phân tích cấu trúc hệ vi khuẩn đất vùng rễ ở mức độ chi . 47
3.5.4. Kết quả phân tích thành phần một số loài vi khuẩn đặc trưng của hệ
vi sinh vật đất vùng rễ cây cà phê. .............................................................. 49
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................. 51
1. Kết luận ....................................................................................................... 51
2. Kiến nghị ..................................................................................................... 51
TÀI LIỆU THAM KHẢO ................................................................................... 53
iv
DANH MỤC CÁC BẢNG
Bảng 3.1. Bảng thống kê thành phần hữu cơ của 4 mẫu đất nghiên cứu ............ 38
Bảng 3.2. Nồng độ và độ tinh sạch 4 mẫu DNA tách từ đất ............................... 40
Bảng 3.3: Thống kê dữ liệu trình tự thu được sau bước giải trình tự ................. 41
DANH MỤC CÁC HÌNH
Hình 1.1. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina .......... 20
giai đoạn 1: tổng hợp ........................................................................................... 20
Hình 1.2. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina .......... 20
Hình 2.1. Vị trí tiến hành thu mẫu tại một khu vực nghiên cứu ......................... 26
Hình 2.2. Quy trình khuếch đại và giải trình tự vùng 16S rRNA ....................... 28
Hình 2.3. Bố trí các ống mẫu .............................................................................. 30
Hình 2.4. Quy trình phân tích sử dụng công cụ QIIME ..................................... 34
Hình 3.1: Hình ảnh cây cà phê tái canh bệnh và cà phê kinh doanh tại khu vực
thu mẫu thí nghiệm. Cây cà phê tái canh bệnh (A) và mẫu rễ (C); Cây cà phê
kinh doanh (B) và mẫu rễ (D) ............................................................................. 36
Hình 3.2. Biểu đồ thể hiện thành phần loài tuyến trùng trong mẫu đất tại khu vực
nghiên cứu ........................................................................................................... 37
Hình 3.3. Kết quả điện di kiểm tra sản phẩm tách DNA tổng số ....................... 39
của 4 mẫuđất nghiên cứu ..................................................................................... 39
Hình 3.4. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm khuếch đại bằng cặp
mồi 16S ................................................................................................................ 40
Hình 3.4. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm gắn index ................ 41
Hình 3.5: Rarefaction curve dựa trên dữ liệu trình tự của bốn hệ vi sinh vậtcác
OTU 0,1 ............................................................................................................... 42
Hình 3.6: Cấu trúc quần thể vi sinh vật ở mức độ ngành.................................... 43
Hình 3.7. Cấu trúc quần thể vi sinh vật ở mức độ lớp ........................................ 45
v
Hình 3.8. Cấu trúc quần thể vi sinh vật ở mức độ họ ......................................... 46
Hình 3.9. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có lợiở mức độ chi ..... 47
Hình 3.10. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi .... 49
Hình 3.11. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài ... 49
Hình 3.12. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài ... 50
vi
DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT
TCT
: Tái canh tốt
TCB
: Tái canh bệnh
NSC
: Năng suất cao
NSTB
: Năng suất trung bình
OM
: Hữu cơ tổng số
Nts
: Nitơ tổng số
Pts
: Photpho tổng số
Kts
: Kali tổng số
Pdt
: Photpho dễ tiêu
Kdt
: Kali dễ tiêu
vii
MỞ ĐẦU
Quần thể sinh vật (archaeal, vi khuẩn, nấm, tuyến trùng) quanh hệ rễ thường tạo nên
sinh thái điển hình và đặc trưng cho từng loài thực vật, đóng vai trò quan trọng trong sinh
trưởng và phát triển của cây. Các sinh vật này có thể cung cấp các chất dinh dưỡng, các chất
kích thích cho việc tăng cường phát triển của cây và ngăn ngừa sâu bệnh hoặc giúp cây
chống chịu với các điều kiện bật lợi như nóng, lạnh, muối và hạn hán.
Cà phê là cây công nghiệp dài ngày, là một trong những cây chủ lực mang lại
hiệu quả kinh tế cao cho ngượi trồng và cho kinh tế chung cho cả nước. Năm 2012
Việt Nam đã vượt qua Brasil trở thành quốc gia đứng đầu thế giới về xuất khẩu cà phê.
Lượng cà phê xuất khẩu tăng liên tục hàng năm. Năm 2016, Việt Nam xuất khẩu 1,78
triệu tấn với kim ngạch 3,34 tỷ USD, tăng 32,8% về khối lượng và tăng 24,7% về giá
trị so với năm 2015. Tuy nhiên do tập trung vào tăng sản lượng nên các vùng đất trồng
cà phê đang bị khai thác quá mức, gây ô nhiễm nguồn nước, đất bị xói mòn, bạc màu,
phát sinh dịch bệnh, tạo điều kiện cho các vi sinh vật kháng thuốc trừ sâu…. Vấn đề
nghiên cứu có tính hệ thống các sinh vật (có lợi và có hại, cộng sinh và ký sinh…) và
nguồn gen của chúng trong đất và trên cây trồng ở các vùng canh tác hiệu quả sẽ là cơ
sở khoa học định hướng, xây dựng các giải pháp cải tạo hiệu quả khu hệ sinh vật, góp
phần thúc đẩy phát triển cây cà phê một cách bền vững.
Hiện nay, metagenomics (phân tích DNA của các vi sinh vật trong môi trường
mà không cần nuôi cấy) là công nghệ mới, kết hợp các kỹ thuật công nghệ sinh học
khác nhau từ công nghệ gen, giải trình tự đến đến tin sinh học để nghiên cứu thành
phần, chức năng và động học của quần thể vi sinh vật. Các dữ liệu thu được từ nghiên
cứu metagenomics có thể cho phép phát hiện các đối tượng vi sinh vật gây bệnh, dự
báo được dịch bệnh để có các biện pháp phòng trừ hiệu quả. Việc đánh giá được đa
dạng của quần thể vi sinh vật trong đất canh tác, xác định được các nhóm vi sinh vật
có lợi, có hại… sẽ làm cơ sở để nghiên cứu các chế phẩm sinh học nhằm cải tạo đất,
kích thích các vi sinh vật có lợi, tăng cường sức đề kháng chống chịu, tăng năng suất,
chất lượng của cây trồng.
1
Xuất phát từ những phân tích trên chúng tôi tiến hành đề tài nghiên cứu “Ứng
dụng kĩ thuật metagenomics trong nghiên cứu hệ vi sinh vật vùng rễ cây cà phê tại
huyện Cư M’gra tỉnh Đăk Lăk”.
Mục tiêu nghiên cứu
Đánh giá được cấu trúc hệ vi khuẩn đất vùng rễ cây cà phê và bước đầu
khảo sát tác động của hệ vi sinh vật đến sinh trưởng và phát triển của cây cà phê
tại tỉnh Đăk Lăk.
Nội dung nghiên cứu
- Tách chiết DNA tổng số từ các mẫu đất nghiên cứu.
- Giải trình tự phân đoạn 16S ribosome bằng kỹ thuật metagenomics
- Xác định và so sánh thành phần nghành, lớp, họ, chi, loài của hệ vi
khuẩn đất vùng rễ cây cà phê.
Địa điểm nghiên cứu
Phòng Công nghệ Tế bào Thực vật – Viện Công nghệ Sinh học – Viện
Hàn lâm và Khoa học Việt Nam
2
CHƯƠNG 1: TỔNG QUAN TÀI LIỆU
1.1. Cây cà phê và tình hình sản xuất cà phê
1.1.1. Nguồn gốc,phân bố cây cà phê
Cây cà phê có nguồn gốc từ châu Phi cận nhiệt đới và phía Nam châu Á, thuộc họ
Rubiaceae. Về hình thái, cây cà phê là cây bụi luôn xanh hoặc cây nhỏ có thể cao tới 5
m. Lá có màu xanh đậm và bóng, thường dài 10-15 cm và rộng 6,0 cm, hoa trắng,
thơm. Quả cà phê có hình oval, dài khoảng 1,5 cm, khi chưa chín có màu xanh, chín
dần thành màu vàng, sau đó đỏ thắm và đen . Mỗi quả thường có 2 hạt nhưng đến 5-
10% số quả chỉ có 1 hạt. Quả chín trong khoảng từ 7-9 tháng. Hai loài cà phê chính
được trồng phổ biến là Coffea canephora (thường được gọi là “robusta”) và C.
arabica. Trong các loài cà phê đang được trồng trên thế giới, C. arabica là loài được
đánh giá cao nhất, có nguồn gốc từ vùng cao nguyên phía tây nam của Ethiopia, cao
nguyên Boma ở phía đông nam Sudan, và Mount Marsabit ở phía bắc Kenya. C.
canephora có nguồn gốc Guinea Uganda và miền nam Sudan. Các loài cà phê phổ
biến hơn là C. liberica, C. excelsa, C. stenophylla, C. mauritiana, và C. racemosa
(vi.wikipedia.org/wiki/Cà_phê).
1.1.2. Tình hình sản xuất cây cà phê tại Việt Nam
Theo VIFOCA, niên vụ 2015-2016 (tính từ ngày 1/10/2015-30/9/2016), Việt Nam
xuất khẩu được gần 1,75 triệu tấn cà phê, đạt kim ngạch 3,16 tỷ USD, tăng 34,8% về
lượng và tăng 17,2% về kim ngạch. Đây là niên vụ có khối lượng xuất khẩu cao nhất
trong 3 năm qua. Đó cũng là nguồn thu nhập chủ yếu của 540.000 hộ nông dân với
hơn 1,6 triệu lao động ở vùng sâu, vùng xa, nhất là ở Tây Nguyên. Cà phê Việt Nam
được trồng chủ yếu tại Lâm Đồng, Đăk Lăk, Gia Lai và Đắc Nông.
Với ý nghĩa kinh tế to lớn từ xuất khẩu hàng năm tăng liên tục của các sản phẩm cà
phê đã đưa Việt Nam trở thành một trong những quốc gia xuất nông sản lớn nhất trên
thế giới. Tuy nhiên, do năng suất cà phê Việt Nam quá cao, khai thác quá mức nên cây
cà phê, quá trình đầu tư thâm canh quá mức trong điều kiện không có cây che bóng,
thoái hoá đất, sâu bệnh gây hại…làm cây cà phê nhanh chóng kiệt quệ, già cỗi. Theo
TS. Lê Ngọc Báu, Viện trưởng Viện Khoa học kỹ thuật nông lâm nghiệp Tây Nguyên,
năm 1980, cả nước có 22.500 ha cà phê, năng suất bình quân 0,78 tấn/ha, sản lượng
3
8.400 tấn; nhưng nay diện tích trên 600.000 ha, sản lượng 1,5 triệu tấn/năm, năng suất
từ 2,3 – 2,5 tấn/ha. So với năm 1980, sản lượng cà phê tăng trên 180 lần, năng suất
tăng 3 lần năm 2013. Theo thống kê của Cục Trồng Trọt năm 2013, cả nước có trên
80.000 ha cà phê trên 20 năm tuổi và khoảng 40.000 ha cà phê dưới 20 năm nhưng đã
có biểu hiện già cỗi, sinh trưởng kém, nhiều cành không cho quả; tổng diện tích cà phê
già cần phải trồng thay thế và chuyển đổi trong 5 – 10 năm tới khoảng 140.000 –
160.000 ha, chiến gần 30%, tập trung tại 2 tỉnh Đắk Lăk và Lâm Đồng (Theo Cục
Trồng trọt-Bộ Nông nghiệp và phát triển nông thôn; giacaphe.com, 2013). Tỉnh Đăk
Lăk có trên 185.000 ha cà phê, mỗi năm cho thu hoạch từ 380.000 tấn trở lên với trên
51% diện tích cà phê đã hơn 15 tuổi, cho năng suất thấp dần (theo ông Nguyễn Văn
Sinh, Phó giám đốc Sở NN&PTNT tỉnh Đăk Lăk).
Tương tự, tỉnh Lâm Đồng có khoảng hơn 40.000 ha cà phê có độ tuổi từ 15-30 năm,
(chiếm hơn 27% tổng diện tích cà phê của tỉnh) cần được tái canh. Theo Bộ NN-
PTNT, hiện nay, diện tích cà phê già cỗi cần phải trồng thay thế và chuyển đổi trong 5
– 10 năm tới khoảng 140 – 160 nghìn ha (chiếm trên 20% diện tích cà phê của toàn
vùng). Trong đó diện tích cà phê trên 20 năm tuổi hiện có trên 86 nghìn ha, chưa kể
khoảng 40 nghìn ha cà phê dưới 20 tuổi nhưng đã có biểu hiện già cỗi cho năng suất
và chất lượng thấp.
Việc đẩy mạnh tái canh, thay thế vườn cây già cỗi đang đứng trước không ít trở
ngại cho ngành cà phê Việt Nam do kỹ thuật và chi phí trong quá trình tái canh. Việc
tái canh cây cà phê chi phí rất cao, tỷ lệ sâu bệnh cũng rất lớn, đặc biệt nghiêm trọng là
bệnh tuyến trùng hại rễ - một trong những khó khăn chính ảnh hưởng nghiêm trọng
đến sản xuất cà phê trên thế giới. Các nhóm tuyến trùng phổ biến nhất và gây hại nhiều
nhất trên cà phê là Meloidogyne và Pratylenchus [10]. Tại Việt Nam các loài tuyến
trùng Pratylenchus coffea and Meloidogyne spp. and Radopholus arabocoffea được
biết đến là tác nhân chính gây hại cho 24%, 9% and 12% các mẫu rễ cà phê được phân
tích. Tại Việt Nam vào những năm 1970, tuyến trùng Pratylenchus coffeae đã làm suy
yếu và chết hàng loạt các vườn cà phê chè tại Phủ Quỳ - Nghệ An. Đến năm 1994,
hiện tượng vàng lá do các bệnh hại rễ xuất hiện phổ biến tại một số tỉnh trồng cà phê
của tỉnh Đăk Lăk và sau đó là các vùng trồng khác của Tây Nguyên, gây hại hàng trăm
4
ha cà phê tại Đăk Lăk. Năm 1997, ở Đăk Lăk có trên 3.000 ha cà phê bị vàng lá, trong
đó có gần 50% diện tích vàng lá do các bệnh hại rễ. Gần đây nhất, trong năm 2008 tại
vùng Phủ Quỳ - Nghệ An đã có gần 100 ha cà phê chè Catimor đưọc trồng lại trên đất
cà phê được thanh lý cũng đã bị tuyến trùng gây hại và chết hàng loạt. Tuyến trùng có
thể gây tác hại trong thời kỳ vườn ương nhưng chủ yếu là ở trên đồng ruộng. Cây cà
phê bị tuyến trùng thường sinh trưởng kém, mùa khô thường bị vàng héo, cây bị nặng
có thể chết khô ngay ở trên lô trồng. Triệu chứng của tuyến trùng gây vết thương là
làm cho rễ bị sưng u, có những đường nứt nẻ. Còn tuyến trùng gây nốt sần chỉ ở trên
các rễ phụ có những u dạng nốt sần.
Việc phòng trừ nhóm tuyến trùng gây hại rất khó khăn ngay cả khi sử dụng các biện
pháp hóa học, sinh học. Ngoài ra các biện pháp canh tác để hạn chế nhóm tuyến trùng
được sử dụng như việc để đất hoang hóa một thời gian dài trước khi canh tác mới hay
luân canh đều không mang lại hiệu quả cao do ảnh hưởng trực tiếp đến thu nhập kinh
tế của người trồng cà phê. Đây là vấn đề nan giải đòi hỏi các biện pháp giải quyết triệt
để nhằm đảm bảo sự phát triển ổn định và bền vững của ngành cà phê Việt Nam.
Các nghiên cứu gần đây cho thấy chất đất và hệ vi sinh vật tồn tại trong đất là một
trong những nguyên nhân cơ bản tác động đến sự phân bố của tuyến trùng. Số lượng
và thành phần của tuyến trùng khác nhau trong các mẫu đất có đặc điểm khác nhau.P.
Q. Trinh và đồng sự đã xác định rằng tuyến trùng thuộc nhóm Meloidogyne spp. được
tìm thấy nhiều trong đất sét, trong khi nhóm tuyến trùng R. arabocoffeaetập trung chủ
yếu trong đất cát và đất mùn và Pratylenchus spp. tồn tại với số lượng lớn trong đất cát
(P.Q.Trinh et al., 2009). Nhóm tác giả này cũng chỉ ra rằng trong điều kiện nhà kính vi
khuẩn Pasteuria penetrans có khả năng hạn chế đáng kể số lượng tuyến trùng trong
đất trồng cà phê (P.Q.Trinh et al., 2009).
1.2. Hệ vi sinh vật đất và ý nghĩa đối với sinh trưởng, phát triển của cây trồng
1.2.1. Giới thiệu về hệ vi sinh vật
Vi sinh vật (VSV) có vai trò quan trọng trong các chu trình sinh thái như hình thành
cấu trúc đất, phân hủy chất hữu cơ, tham gia chu trình chuyển hóa các nguyên tố, chất
quan trọng (C, N, P, K…) và các chất dinh dưỡng khác. Chúng cũng tham gia kìm
hãm sự phát triển bệnh ở cây, tăng sinh trưởng cho cây giúp cây thích ứng với môi
5
trường. Nhóm VSV sống tự do trong đất lại có vai trò đặc biệt quan trọng trong việc
tạo nên độ màu mỡ, độ phì của đất. Chúng đảm bảo trạng thái cân bằng cho cây trong
môi trường đất. Một số VSV thuộc nhóm này có khả năng chuyển hóa các chất trong
đá mẹ thành đất và cung cấp chất dinh dưỡng cho cây, trong đó có những loại chuyển
hóa lân (P) và kali (K). Nhóm VSV vùng rễ là đội ngũ "vệ sinh viên" đông đảo và cần
mẫn. Chúng giúp cây phân hủy các chất hữu cơ, các chất cặn bã do cây bài tiết ra, các
chất này thường là không cần thiết đối với cây, có độc cho cây. Các loại VSV này
phần lớn là các loại đối kháng, chúng luôn cạnh tranh với các loại VSV, tuyến trùng...
gây bệnh cho cây ở trong đất và do đó tránh cho cây được nhiều loại bệnh. Mặt khác
thông qua quá trình phân hủy các chất hữu cơ, chúng cung cấp cho cây những chất
dinh dưỡng cần thiết như P, Ca, Cu, Fe...
Hệ vi sinh vật tồn tại xung quanh cây trồng đóng vai trò hết sức quan trọng lên năng
suất và chất lượng cây trồng [35] [66]. Nhìn chung, trong mối quan hệ với cây trồng,
VSV có thể cộng sinh (có lợi) hoặc gây bệnh (hại) cho cây. Vi sinh vật cộng sinh có
thể sống chung với cây trồng trong những mối quan hệ rất khăng khít và là một phần
không thể thiếu giúp cây trồng sinh trưởng và phát triển tốt. Một ví dụ cho mối quan
hệ trên là các VSV Rhizobium sp. trong nốt sần rễ cây họ Đậu Fabaceae, có vai trò
quan trọng trong quá trình cố định nitơ cho cây.
Các VSV gây bệnh cho cây đã từ lâu được xác định là khá nhiều về số lượng và
thường gây ra nhiều thiệt hại cho nông nghiệp. Tuy nhiên, cho đến nay người ta còn
nhìn nhận nhóm VSV này tương đối phiến diện. Người ta chỉ thấy gây hại mà quên
mất vai trò của nó trong các chu trình chuyển hóa vật chất, trong cân bằng sinh thái.
Trong các hệ sinh thái, chính các mối quan hệ giữa các mối quan hệ giữa các loại VSV
trong nhiều trường hợp mang ý nghĩa quyết định đối với trạng thái cân bằng, với sự
tốn tại và phát triển của các hệ đó.
1.2.2. Vi sinh vật đất vùng rễ
Vi sinh vật vùng rễ nói chung và nấm rễ nói riêng có ý nghĩa rất quan trọng trong
đời sống của thực vật ở cạn. Tập hợp vi sinh vật bao gồm vi khuẩn và nấm trong vùng
rễ có thể có ích hoặc gây hại cho cây [2][60]. Chúng có vai trò thực tiễn trong nền kinh
tế, khoa học và các chu trình vật chất, năng lượng trong tự nhiên. Các nấm cộng sinh
6
hình thành rễ nấm (mycorrhiza) cộng sinh với thực vật có thể ứng dụng trong lâm
nghiệp, đặc biệt trong việc trồng rừng, như Pisolithus tinctorius hình thành rễ nấm
ngoại dinh dưỡng (ectomycorrhiza) cộng sinh với cây thông nhựa (chi Pinus) hoặc cây
bạch đàn (chi Eucalyptus), giúp gia tăng tỷ lệ sinh trưởng của cây P. tinctorius hình
thành rễ nấm cộng sinh chặt chẽ với rễ cây thông, giúp cây tăng cường sự hấp thụ vận
chuyển các yếu tố dinh dưỡng như: N, P, K, Ca... nên nó được ứng dụng trong các dự
án tái sinh hoặc trồng mới các rừng thông nhựa, bạch đàn ở các vùng đất nghèo dinh
dưỡng hay đất cát. Bởi vậy, chúng ta có thể chọn lọc các vi sinh vật có ích và chủ động
bón cho đất và vùng môi trường rễ nhằm mục đích tăng cường các hoạt động có lợi
cho nông nghiệp theo định hướng như cải thiện tính ổn định đất, kìm hãm sinh vật có
hại cho cây và giúp cây phát triển tốt [36] [38] [52].
Đất trồng tự nhiên đều có khả năng ngăn chặn các tác nhân gây bệnh trong một mức
độ nhất định, điều này được chứng minh bằng các so sánh mức độ nhiễm bệnh khi tiến
hành gây nhiễm bệnh nhân tạo trên đất tiệt trùng và đất không tiệt trùng. Quá trình ức
chế bệnh tự nhiên này được cho là có liên quan đến hoạt động của cộng đồng vi sinh
vật. Việc thay đổi hữu cơ có thể kích thích hoạt động của hệ vi sinh vật trong đất trồng
và kết quả là tăng cường khả năng ức chế bệnh tự nhiên của đất trồng. Ức chế chọn lọc
là quá trình xảy ra khi một số vi sinh vật nhất định trong đất ức chế một loại tác nhân
gây bệnh. Quá trình ức chế chọn lọc xảy ra đồng thời với ức chế tự nhiên của đất sẽ
làm tăng hiệu quả ức chế bệnh. Tuy nhiên có rất ít trường hợp các nhà khoa học có thể
phân lập từ đất các vi sinh vật có khả năng ức chế tác nhân gây bệnh. Sau nhiều thập
kỷ nghiên cứu, các nhà bệnh lý học thực vật đã phát hiện ra rằng các hệ vi sinh vật cực
kỳ phức tạp đóng vai trò ức chế tác nhân gây bệnh, các nghiên cứu chỉ ra rằng các
phức hệ vi sinh vật này có thể góp phần vô cùng hữu ích cho sản xuất nông nghiệp.
Không một vi sinh vật riêng lẻ nào được phân lập lại có khả năng tương tự, điều này
cho thấy tác động qua lại, hỗ trợ nhau trong quá trình ức chế tác nhân gây bệnh của các
thành viên trong hệ vi sinh vật đất. Qua đó có thể nhận thấy tiềm năng của hệ vi sinh
vật đất là rất lớn và nghiên cứu thành công hệ vi sinh vật này hứa hẹn mang lại nhiều
thành tựu to lớn trong lĩnh vực sản xuất các chế phẩm sinh học như phân bón vi sinh
hay tác động đến hệ vi sinh vật đất nhằm cải thiện và nâng cao chất lượng cây trồng.
7
Hệ vi sinh vật trong đất được đánh giá là có mức độ đa dạng loài phong phú nhất
trong các hệ vi sinh vật đã được nghiên cứu từ trước tới nay [16]. Trong 1 gam đất
vùng rễ có thể chứa tới 1011 tế bào vi sinh vật và hơn 30,000 loài prokaryote [40]. Hệ
genome của cộng đồng vi sinh vật này lớn hơn nhiều so với genome của thực vật và
còn được gọi là bộ gen thứ hai của thực vật. Thực tế đãc ho thấy, thực vật không thể
tồn tại và phát triển nếu thiếu hệ vi sinh vật đất. Trên một số môi trường đất, cây trồng
vẫn phát triển tốt ngay cả khi tồn tại các tác nhân gây bệnh ở mật độ cao. Tác động của
hệ vi sinh vật trong đất lên sinh trưởng và phát triển của thực vật được thể hiện rõ ràng
nhất qua quá trình ức chế tác nhân gây bệnh: khi đất được tiệt trùng, các tác nhân ức
chế bệnh cũng biến mất.
1.3. Công nghệ metagenomics và ứng dụng nghiên cứu đa dạng di truyền của các hệ vi sinh vật đất
Các nghiên cứu từ trước cho thấy rằng phần lớn các vi sinh vật tồn tại trong môi
trường xung quanh chúng ta không thể nuôi cấy trên môi trường nhân tạo trong phòng
thí nghiệm và do đó không thể xác định trình tự DNA cũng như nghiên cứu phân tích
[1]. Những nghiên cứu đầu tiên về metagenomics đã tập trung phân tích trình tự 16S
rRNA, những trình tự này thường ngắn, mang tính bảo thủ cao trong cùng một loài và
khác nhau giữa các loài [64][6]. Các nhà khoa học đã phát hiện nhiều trình tự 16S
rRNA được tìm thấy không thuộc về bất kỳ loài nào đã được phân lập trước đây. Điều
này cho thấy rằng đã có rất nhiều loài vi sinh vật bị bỏ sót không được nghiên cứu đến.
Phân tích trình tự các đoạn 16S rRNA thu trực tiếp từ môi trường tự nhiên cho thấy
rằng bằng phương pháp nuôi cấy truyền thống, chúng ta chỉ có thể nghiên cứu được
khoảng 1% số lượng các loài vi sinh vật tồn tại trong mẫu tự nhiên thu được [23].
Theo Amann và các đồng sự, bằng các phương pháp vi sinh truyền thông chỉ có thể
nuôi cấy khoảng 0.001–0.1% các loài vi sinh vật biển, 0.25% loài vi sinh vật nước
ngọt, 0.25% trong trầm tích và chỉ 0.3% sinh vật đất [1].
Việc phân lập và nuôi cấy trên môi trường nhân tạo là những phương pháp truyền
thống thường được sử dụng để nghiên cứu phân tích vi sinh vật, tuy nhiên hơn 99% vi
sinh vật không thể được phân lập và nuôi cấy theo các phương pháp này, do đó hiện
nay mới chỉ có một phần rất nhỏ các gen và các vi sinh vật được nghiên cứu đến. Để
khắc phục các hạn chế của các phương pháp trên, các nhà nghiên cứu đã đề xuất
8
phương pháp tách chiết và phân tích thông tin di truyền (chủ yếu là DNA) trực tiếp từ
mẫu đất. Theo lý thuyết, DNA tách chiết được từ một mẫu đất mang thông tin di
truyền của tất cả các vi sinh vật tồn tại trong hệ vi sinh vật mẫu đất đó. Do trong đất
thường tồn tại các hợp chất liên kết với phân tử DNA, cản trở các phản ứng hóa học
của phân tử này, việc tinh sạch loại bỏ các hợp chất này là một khâu cực kỳ quan trọng
cho các bước phân tích sau này [49][13]. Sau bước tinh sạch DNA việc phân loại các
vi sinh vật đất có thể thực hiện bằng cách nhân bản các đoạn gen 16S RNA nhờ phản
ứng PCR. Bằng cách này có thể phân tích mức độ đa dạng của hệ vi sinh vật đất, so
sánh các hệ vi sinh vật của các mẫu đất khác nhau, cũng như nghiên cứu sự thay đổi về
cấu trúc khi có tác động của các yếu tố bên ngoài. Ngoài 16S rRNA một số gen khác
cũng được sử dụng để nghiên cứu đánh giá đa dạng di truyền của vi sinh vất đất như
dnaK (HSP-70-type molecular chaperone) và amoA (ammonia monooxygenase).
“Metagenomics” xuất phát từ ý tưởng cho rằng nghiên cứu phân tích thông tin di
truyền của một hệ sinh vật (thường là vi sinh vật) có thể thực hiện tương tự như việc phân
tích thông tin di truyền của một cá thể đơn lẻ. Công nghệ metagenomics ra đời đã khắc
phục được những hạn chế của các phương pháp truyền thống, hướng sự tập trung nghiên
cứu vào các vi sinh vật chưa được chú ý đến. Bằng cách phân lập và nghiên cứu trực tiếp
genome của toàn bộ các vi sinh vật tồn tại trong một môi trường nghiên cứu, ta có thể có
thông tin di truyền của hệ vi sinh vật ở đó mà không cần phải phân lập và nuôi cấy từng tế
bào riêng lẻ.
1.4. Các bước ứng dụng công nghệ metagenomics trong nghiên cứu da dạng khu
hệ sinh vật từ môi trường
Các bước ứng dụng công nghệ metagenomics trong nghiên cứu da dạng khu hệ sinh
vật từ môi trường có thể chia thành ba phần chính như sau:
Phần 1: Giải trình tự
Từ những năm 70 của thế kỷ trước, trình tự DNA toàn bộ hệ gene của sinh vật đầu
tiên được giải mã là của thể thực khuẩn Bacteriophage fX174 trên vi khuẩn
Escherichia coli (dài chỉ 5,368 bp, gồm 11 gene). Đến đầu những năm 90, hệ gene của
Saccharomyces cerevisiae (nấm men, dài khoảng 12,5 triệu bp, gồm 5770 gene), sinh
vật đa bào đơn giản nhất được giải mã toàn bộ (kích thước lưu trữ 12,8 Mb), tạo tiền
9
đề cho chương trình giải mã hệ gene người (dài 3,3 tỷ bp, gồm khoảng 21,000 gene,
kích thước 3,000 Mb) thành công năm 2003.
Những tiến bộ về chi phí cho giải trình tự và thời gian giải trình tự trung bình (vd.
Theo thống kê của National Human Genome Research Institute, giải trình tự hệ gene
người cần 95 triệu USD (01/2001), đến tháng 01/2012 đã giảm xuống còn 7,666 USD)
được đánh giá là một trong những thành tựu khoa học lớn nhất trong lịch sử nhân loại,
mở ra một chương mới trong nghiên cứu sinh học, y học và dược học. Đến nay, những
dự án giải trình tự hàng nghìn hệ gene người hay các quần thể vi sinh vật đã trở nên rất
khả thi. Nghiên cứu metagenomics ra đời và phát triển được trước hết nhờ có những
kỹ thuật giải trình tự mới này.
Phần 2: Quản lý và phân tích metabase
Metabase được hiểu là hệ thống cơ sở dữ liệu metagenome bao gồm các thành phần
chính sau đây:
➢ Các tập dữ liệu metagenome (trình tự DNA, RNA, protein) thu được từ hệ vi sinh
vật trong mẫu.
➢ Tập dữ liệu tham chiếu: toàn bộ hệ gene của các loài vi khuẩn, virus, v.v.
➢ Các tập dữ liệu metagenome có chú giải về đa dạng phân loài, chức năng, v.v.
Metabase được lưu trữ và quản lý bởi một số viện, trung tâm nghiên cứu lớn của thế
giới. Phần lớn trong số đó cung cấp các dịch vụ miễn phí như: tiếp nhận lưu trữ, truy
vấn, thống kê, tổng kết, và môt số công cụ tính toán. Đặc điểm chung của các hệ thống
này là: (i) Dung lượng lưu trữ lớn; (ii) Dữ liệu được tổ chức theo chuẩn nhất định, sử
dụng cơ sở dữ liệu quan hệ (chuẩn thường được sử dụng nhất là của Genome
Standards Consortium (GSC)); (iii) Sử dụng những máy chủ mạnh, siêu máy tính, môi
trường tính toán song song hoặc đám mây cho các tác vụ tính toán trên dữ liệu lớn;
(iv) Phân quyền truy vấn đối với các tập dữ liệu, người dùng; (v) Cho phép tải các tập
dữ liệu lên và trả về kết quả phân tích qua Internet.
Sau đây là một số hệ thống tiêu biểu, có những điểm cần tham khảo khi thiết kế hệ
thống của Việt Nam:
10
➢ Intergrated Microbial Genomes (IMG), JGI bộ Năng lượng Mỹ: tập dữ liệu
metagenomics đất, nước biển, nước ngọt, suối nước nóng, vật chủ (cây công
nghiệp, ruột động vật), môi trường ô nhiễm.
➢ MetabioME, RIKEN, Nhật: Tập hợp các tập dữ liệu metagenomics, dữ liệu tham
chiếu (971 hệ gene vi khuẩn), v.v đã được công bố từ 10 nguồn khác nhau, như
ENZYME, Swiss-Prot, BRENDA, GenBank, v.v. và chú giải bằng tay bởi các
chuyên gia. Đặc biệt, cung cấp danh sách trên 500 enzymes có giá trị thương
mại đã được công bố quốc tế.
➢ MG-RAST, NIH, Mỹ: Lưu trữ 50,683 tập dữ liệu metagenomics (trong đó trên
10,095 miễn phí), 14.2 Tbp DNA.
➢ CAMERA, Calit2, Mỹ: Cổng thông tin hỗ trợ lưu trữ dữ liệu metagenomics thô,
đã chú giải, đã phân tích và các công cụ tin sinh mạnh được tổ chức thành một
giải pháp nhất định hoặc luồng công việc.
Phần 3: Tính toán và phân tích dữ liệu metagenome Phân tích dữ liệu metagenomics tuân theo một quy trình nhất định (analysis pipeline)
cho các loại dữ liệu khác nhau và tùy theo mục tiêu phân tích của bài toán sinh học.
Tuy nhiên, có một số tác vụ cơ bản chung, trong đó các đề tài nhánh của đề án yêu cầu
2 tác vụ đầu tiên, như sau:
➢ Sự đa dạng phân loài (taxonomic binning): Nhận diện thành phân vi sinh vật của
môi trường đang xét: nhóm sinh vật, số lượng, vị trí trên cây phân loài v.v.
➢ Sự đa dạng chức năng (functional binning): Nhận diện chức năng của các gene
có mặt trong quần thể vi sinh đang xét và vai trò của chúng trong các quá trình
sinh học như trao đổi chất (metabolic pathways) và tổng hợp (biosynthetic
pathways), v.v. Phát hiện gene mới cũng nằm trong nhóm bài toán này.
➢ Ghép hệ gene (genome assemly): Từ số lượng lớn chuỗi DNA ngắn kết quả của
quá trình giải trình tự, yêu cầu lắp ghép lại thành chromosome hoặc hệ gene gốc.
Bài toàn này đặc biệt khó do bản chất hỗn tạp và dư thừa của dữ liệu
metagenomics.
➢ So sánh các quần thể vi sinh vật (comparative metagenomics of microbial
communities): Đặc điểm của quần thể vi sinh trong các mẫu môi trường có thể
11
được so sánh, ví dụ đa dạng phân loài, chức năng, hay khả năng trao đổi chất
(metabolic capacities) nhằm tìm ra đặc trưng quy định tính chất của từng quần
thể. Do khó ghép hệ gene, các chuỗi trình tự gene có thể được so sánh trực tiếp
với nhau.
Về cơ bản, các phương pháp tính toán có thể thuộc một trong số hoặc kết hợp hai
hướng tiếp cận sau: Dựa vào đặc tính của chuỗi DNA (sequence-based): số lượng, tần
số của nucleotide, motifs v.v. là đầu vào cho các thuật toán phân loại; và Dựa vào tính
tương đồng của chuỗi DNA (homolog-based): tìm sự tương đồng với chuỗi đã được
chú giải trong cơ sở dữ liệu tham chiếu, cây phân loài (NCBI) hoặc cây/con đường
chức năng (KEGG, SEED) để gán phân nhóm hay chức năng gần nhất.
Như đã nêu trên, hai khó khăn lớn nhất cho việc tính toán trên dữ liệu metagenomics
là: độ dài chuỗi DNA đọc được và sự dư thừa trong phân loài. Do chuỗi trình tự đọc
được ngắn (short read), việc trích rút đặc tính không có nhiều ý nghĩa. Vì vậy cần thiết
phải ghép lại thành những chuỗi dài hơn (contig) với sai số nhất định. Khi giải trình tự
hệ vi sinh vật, khối trình tự thu về hỗn tạp và không biết được phân bố của các loài
(đôi khi lên đến 10,000 loài). Dư thừa (redundancy) là hệ quả của việc không thể giải
trình tự sâu quần thể vi sinh trên mẫu (lý do chi phí), thay vào đó chỉ giải trình tự ngẫu
nhiên một phần (subsample). Khi đó một số loài hiện diện với tỷ lệ quá lớn so (thường
là những loài không cần quan tâm) với số còn lại hoặc hoàn toàn bỏ qua những loài
thiểu số gây khó khăn cho cách thuật toán lắp ghép, tìm chức năng, v.v. dẫn đến kết
quả bị bóp méo (biased).
Các công cụ đã được phát triển và công bố cho metagenomics tương đối nhiều, chạy
qua giao diện web, dòng lệnh, hoặc giao diện đồ họa, v.v., có thể chia thành ba nhóm
sau:
➢ Nền tảng tính toán (platform): cung cấp khả năng đưa các công cụ, thuật toán v.v
vào dưới dạng các module chức năng, ghép nối thành các luồng giải pháp
(analysis pipeline) cho từng vấn đề cụ thể, ví dụ như: Galaxy, MG-Rast,
IMG/M, CAMERA.
12
➢ Gói phần mềm (package): tập hợp các công cụ, tiện ích trong phân tích
metagenomics, ví dụ như Qiime, MetaABC, MetabioME, MEGAN. Các gói
này được cài đặt trên nền Windows, Linux, v.v.
➢ Công cụ cho từng tác vụ riêng biệt: tìm đa dạng phân loài hoặc và đa dạng chức
năng, ví dụ như BLAST, BLASTX, BLAT, PhyloPythia, Tetra, v.v. Đây chủ
yếu là các thuật toán cơ bản được công bố quốc tế giải quyết một vấn đề nhất
định trong tính toán. Riêng BLAST và các biến thể là công cụ tìm kiếm đối
sánh quan trọng được sử dụng trong hầu hết các hệ thống và gói phần mềm.
Như vậy mặc dù gặp phải những trở ngại khó khăn ban đầu như quá trình tách DNA
khỏi các tạp chất, số lượng khổng lồ các vi sinh vật tồn tại trong môi trường đất, xây
dựng thư viện metagenomic, xác định chức năng của các gen mới v.v… nhưng cùng
với những bước phát triển đột phá trong phương pháp đọc trình tự và công cụ tin sinh
học công nghệ metagenomics hiện nay đã đạt được những thành tựu đáng kể và ngày
càng được quan tâm phát triển hơn. Ứng dụng công nghệ metagenomics đã xác định
được phần lớn các vi sinh vật có mặt trong môi trường đất, so sánh mức độ đa dạng
giữa các môi trường khác nhau, đánh giá sự thay đổi về cấu trúc thành phần của hệ vi
sinh vật dưới tác động của các tác nhân khác nhau lên môi trường. Ngày nay số lượng
lớn dữ liệu thu được từ công nghệ metagenomics đã được công bố rộng rãi, không
những tạo điều kiện thuận lợi cho các nhà khoa học nghiên cứu phân tích các gen mới
mà còn mở ra những hướng mới góp phần cải thiện nâng cao sản xuất nông nghiệp,
công nghiệp.
Nghiên cứu sử dụng kỹ thuật metagenomics và xây dựng thư viện metagenom cho
phép đánh giá đa dạng di truyền và phương pháp trao đổi chất của các vi sinh vật
không thể nuôi cấy trong quần thể vi sinh vật [19, 24].Các vector tách dòng thích hợp
cho nghiên cứu metagenomics bao gồm BAC, cosmid và plasmid. Phân tích các dòng
vô tính ở các bước tiếp theo có thể thực hiện bằng cách đọc trình tự hoặc thông qua
các công cụ sàng lọc chức năng. Việc phân tích dựa trên kết quả đọc trình tự có thể
tiến hành theo phương pháp shotgun metagenome hoặc touchdown PCR với các cặp
mồi đặc hiệu cho các gen quan tâm [24].
13
1.5. Ứng dụng đọc trình tự gen thế hệ mới trong nghiên cứu metagenomics
Đọc trình tự gen (DNA sequencing) là việc xác định thứ tự các nucleotide gắn kết với
nhau dọc theo chiều dài của gen (DNA), và trình tự gắn kết nhau của các nucleotide
được gọi là trình tự gen. Đọc trình tự có thể xác định trình tự các gen riêng lẻ, các
vùng gen lớn, các nhiễm sắc thể hoặc toàn bộ các bộ gen. Tùy theo phương pháp sử
dụng, kết quả cho biết trình tựcủa các nucleotide trong sợi DNA hoặc RNA tách chiết
từ các tế bào động thực vật hoặc các nguồn chứa thông tin di truyền khác.
Kết quả này có nhiều ứng dụng chính như sau:
(i) Biết được trình tự nucleotide của bất cứ một đoạn DNA nào đó và đây chính là cơ
sở để các nhà khoa học có thể đọc trình tự gene hay bộ gen cho các nghiên cứu
có liên quan
(ii) Phát hiện các thay đổi của trình tự nucleotide của một đoạn DNA, tạo cơ sở cho
phát hiện các đột biến gen, các SNP, các kiểu gene, …
(iii) Định danh vi khuẩn hay vi nấm dựa trên đọc trình tự DNA của RNA ribosome
(16S của vi khuẩn và 28S của vi nấm) đặc biệt là các đối tượng khó định danh
hay không thành công nuôi cấy.
(iv) Sự khác biệt nhau từng nucleotide của các đoạn DNA được sử dụng trong xét
nghiệm dấu vân tay DNA (DNA finger printing) để nhận dạng cá nhân và mối
quan hệ cá nhân, trong phát hiện đa dạng loài…
Đọc trình tự gen thế hệ mới theo 2 nguyên lý chính sau:
Thứ nhất, đọc trình tự bằng tổng hợp (sequencing by synthesis, SBS) thường
được các thế hệ máy Roche 454, Ion Torrent và Illumina sử dụng. SBS liên quan đến
việc sử dụng một hỗn hợp các dNTP được biến đổi tại vị trí 2’. Hỗn hợp này bao gồm
các dNTP bổ sung tự nhiên và các dNTP bổ sung có đánh dấu huỳnh quang. Quá trình
xác định trình tự sẽ diễn ra tương tự như phản ứng PCR thông thường. Đầu tiên một
đoạn trình tự mồi nằm trên đoạn adapter sẽ được gắn vào phần cuối của đoạn gDNA
khuôn cần đọc trình tự. Sau đó, việc xác định trình tự được thực hiện bằng cách gắn
lần lượt từng dNTP bổ sung có đánh dấu huỳnh quangvào phần cuối của trình tự mồi
trên theo chu trình 3 bước:
14
(i) Một polymerase kết hợp với một dNTP kết thúc có đánh dấu huỳnh quang và
gắn bổ sung với base trên đoạn gen cần đọc trình tự;
(ii) Thiết bị sẽ ghi lại hình ảnh, phần mềm sẽ phân tích hình ảnh thu được để xác
định phân tử dNTP nào được kết hợpvà từ đó tìm ra được trình tự của base bổ
sung.
(iii) Nhóm kết thúc đầu 3’ và tín hiệu huỳnh quang sẽ được cắt bỏ bằng phương
pháp hóa học. SBS xác định trình tự các đoạn genome theo chiều từ đầu 5’ đến
3’.
Nguyên lý thứ hai, đọc trình tự gắn nối (sequencing by ligation, SBL) được sử
dụng ở máy SOLiD. Phương pháp xác định trình tự bằng phản ứng ghép nối (SBL):
được phát minh bởi George Church. SBL đã được sử dụng để xác định trình tự
genome và là nền tảng cho các thiết bị đọc trình tự thế hệ mới. SBL là một chu trình
tuần hoàn gồm 4 bước:
➢ Đưa vào các primer neo được thiết kế trình tự bổ sung với trình tự trên adapter.
➢ Quá trình lai của nonamers ngẫu nhiên với nhau. Mỗi hỗn hợp nonamer gồm có 4
loại nonamers, mỗi loại có các base và vị trí đã được biết đến. Các chất phát
quang khác nhau được gắn ở cuối của mỗi loại nonamer sẽ cho phép xác định
base trên nonamer.
➢ Các nonamer lai với các primer neo. Sau đó, thiết bị ghi hình và phần mềm sẽ
xác định base ở vị trí query.
➢ Primer neo, phức hệ nonamer được đọc phóng và quá trình được lặp lại cho các
vị trí query trong hỗn hợp nonamer. SBL hoạt động trong cả hai chiều: chiều
xuôi (5 'đến 3') và chiều ngược (3 'đến 5').
1.5.1. Công nghệ đọc trình tự bán dẫn ion
Khác với các công nghệ đọc trình tự khác, công nghệ đọc trình tự ion torrent sử
dụngnucleotide không bị biến đổi hoặc không sử dụng các mắt đọc. Đọc trình tự bán
dẫn ion (ion semiconductor sequencing) còn được gọi là đọc trình tự giải phóng ion
(ion torrent sequencing),đọc trình tự thông qua pH (pH-mediated sequencing), đọc
15
trình tự silicon (silicon sequencing) hoặc đọc trình tự bán dẫn (semiconductor
sequencing).
Ứng dụng chính của công nghệ này gồm: Đọc trình tự của các mẫu có nhiều chỉ
thị barcode; Đọc trình tự các thư viện đã được gắn adapter; Đọc trình tự genome của vi
khuẩn và virus; Đọc trình tự các mẫu metagenomic, RNA ngắn; Đọc trình tự các dòng
BAC …
a) Nguyên lý của công nghệ
Trong tự nhiên, sự liên kết của một dNTP vào sợi DNA liên quan sự hình thành
liên kết cộng hóa trị, đọc phóng pyrophosphate và ion hydro (Rusk, 2011;
Purushothaman et al., 2006). Một dNTP chỉ liên kết được nếu nó bổ sung với nucleotid
trên sợi khuôn.
Trong hệ thống đọc trình tự, mỗi giếng chứa có một sợi DNA khuôn vàđược
đưa vào một loại dNTP. Nếu loại dNTP này bổ sung với nucleotide trên sợi khuôn thì
nó sẽ liên kết và kéo dài sợi tổng hợp. Điều này dẫn tới sự giải phóng một ion hydro,
tạo thành một cảm ứng ion ISFET (ion-sensitive field-effect transistor) và xác định
một phản ứng đã xảy ra. Nếu trình tự sợi khuôn có sự lặp lại của một loại nucleotide,
thì sẽ có nhiều phân tử dNTP kết hợp trong cùng một chu kỳ, dẫn tới số phân tử hydro
tương ứng được giải phóng và tín hiệu điện tử tăng lên một cách tỷ lệ thuận.
b) Ưu nhược điểm của máy Ion Torrent
Độ chính xác của Ion Torrent ion semiconductor sequencer năm 2011
là99.6%trên 50 base được đọc với 100 Mb /lần chạy. Chiều dài đọc năm 2011 là 100
cặp base.Độ chính xác cho các đoạn lặp lại của đoạn 5 lặp lại là 98% [33]
Ưu điểm chính của ion semiconductor sequencing là i) đọc tốc độ đọc nhanh, ii)
chi phí vận hành và đầu tư thấp [30],iii) không dùng nucleotide biến đổi và xác định
bằng quang học. Vì hệ thống ghi lại hiện tượng liên kết nucleotide tự nhiên nên đọc
trình tự trong một thời gian thực. Tốc độ đọc trình tự chỉ bị giới hạn bởi vòng quay
nucleotides trong hệ thống Ion Torrent Systems Inc., các nhà phát minh công nghệ đã
thông báo rằng mỗi liên kết đo mất 4 giây, và mỗi lần chạy khoảng 1 giờ đọc được
100-200bp [12]. Nếu chip được nâng cấp thì số lần đọc sẽ được tăng lên [12]. Nếu
16
đoạn DNA khuôn có nhiều lần lặp nucleotide cùng loại thì sau khi liên kết có nhiều
ion hydro được giải phóng trong cùng một chu kỳ. Như vậy sự thay đổi pH cực lớn
dẫn tới tín hiệu điện tử tăng lên tương ứng [12]. Điều này là một hạn chế vì rất khó để
xác định một đoạn lặp lại. Hạn chế này cũng gặp ở trong các công nghệ khác như
pyrosequencing [41]. Tín hiệu được tạo ra từ số lặp lại cao là khó khăn để phân biệt từ
sự lặp lại của một số khác nhau nhưng tương tự, ví dụ: lặp lại của đoạn 7 khó phân biệt
với đoạn 8.
Hạn chế khác của hệ thống này là chiều dài đọc ngắn hơn các phương pháp
khác như Sanger sequencing hoặc pyrosequencing. Chiều dài đọc dài là một lợi thế
cho quá trình lắp ráp genome de novo. Chiều dài đọc đã được nâng cao bởiIon Torrent
Systems Inc. là 400 cặp base cho lần chạy [43][51]. Lượng vật liệu đưa vào thấp hơn
so với công nghệ đọc trình tự khác, mặc dù các nhà phát triển hy vọng thay đổi điều
này bằng sự tăng mật độ của chip [51].
c) Ứng dụng của máy đọc trình tự ion torrent
Đối với máy ion semiconductor sequencing nhà sản xuất nhấn mạnh ưu điểm
làđọc trình tự nhanh, liên tục và kinh tế, máy có thể sử dụng trong đa số phòng thí
nghiệm như một máy để bàn [51]. Hoặc sẽ hoạt động ở ngoài các trung tâm đặc trưng,
trong các bệnh viện và các phòng thí nghiệm nhỏ.Công nghệ này phù hợp trong các
ứng dụng nhỏ như đọc trình tự của genom vi khuẩn, đọc trình tựtranscriptome vi
khuẩn, đọc trình tự gen đích amplicon, hoặc kiểm tra chất lượng của thư viện trình tự
[51][30]. Từ khi ra đời tới nay công nghệ đọc trình tự bán dẫn ion đã được ứng dụng
trong nhiều công trình nghiên cứu, như: Dựa trên đọc trình tự DNA của rRNA để định
danh vi khuẩn hay vi nấm [25][61][66] Đọc trình tự genome [3][20][39][47][48][62];
Nghiên cứu đột biến, chức năng của gen đích [4][9][18][22]. Các nghiên cứu cũng đưa
ra được ưu nhược điểm của công nghệ [63].
1.5.2. Công nghệ giải trình tự Illumina (Solexa) sequencing
a. Nguyên lý công nghệ:
Công nghệ giải trình tự của Illumina sử dụng các array đơn dòng và công nghệ
khóa dừng thuận nghịch cho việc giải trình tự trên diện rộng với độ chính các cao. Hệ
thống giải trình tự linh hoạt, hiện đại cho phép thực hiện một loạt các ứng dụng nghiên
17
cứu genomics, transcriptomics, và epigenomics. Các template giải trình tự được cố
đình trên bề mặt một flow cell (1 loại chip DNA) được thiết kế để tạo ra 1 dạng DNA
hỗ trợ hoạt động các enzyme trong khi đảm bảo độ bền của các template bám trên bề
mặt và mức độ bám trên bề mặt và mức độ bám không đặc hiệu thấp của các
nucleotide đánh dấu huỳnh quang. Quá trình nhân bản trên pha rắn tạo ra tới 1000 bản
copy giống hệt nhau của mỗi template trong trạn thái đứng sát nhai (trong đường kính
< 1 µm). Vì quá trình này không bao gồm việc ghi ảnh, thực hiện thao tác cơ học, hay
đặt các hạt bead vào các giếng, nên mật độ của các cluster trên đơn vị diện tích được
đảm bảo.
Công nghệ giải trình tự bằng tổng hợp (SBS) sử dụng 4 nucleotide đánh dấu
huỳnh quang để giải trình tự hàng chục triệu cluster đồng thời trên bề mặt flow-cell.
Trong mỗi chu trình giải trình tự, một deoxynucloside triphosphate đánh dấu (dNTP)
được thêm vào chuỗi acid nucleic. Nhãn huỳnh quang của nucleotide đóng vai trò như
một khóa dừng phản ứng polymer hóa, do đó sau khi mỗi dNTP được tích hợp, dye
huỳnh quang được ghi lại để xác định nucleotide và sau đó bị cắt bỏ để tổng hợp
nucleotide tiếp theo. Vì cả 4 loại dNTP gắn khóa dừng tổng hợp thuận nghịch có mặt
đồng thời dưới dạng đơn phân tử, sự cạnh tranh ngẫu nhiên giúp giảm thiểu việc tổng
hợp mất cân đối. Việc xác định các base dựa trực tiếp vào cường độ tín hiệu đo được
trong mỗi chu trình, từ đó giảm thiểu các sai số thô so với công nghệ khác. Kết quả
cuối cùng là trình tự được đọc từng base một với độ chính xác cao, loại bỏ được các
lỗi do đặc thù trình tự, cho phép quá trình giải trình tự mạnh mẽ trên toàn bộ genome,
bao gồm các trình tự lặp lại, các homopolymer.
b. Ưu nhược điểm của hệ thống
Phương pháp giải trình tự của Illumina dựa trên số lượng cực lớn các đoạn đọc
trình tự đồng thời. Khối lượng mẫu lớn và độ bao phủ đồng nhất được sử dụng để tạo
ra một tổng thể và một độ tin cậy cao được đảm bảo trong việc xác định các biến dị di
truyền. Khối lượng mẫu lớn cho phép sử dụng các công cụ thống kê và cho điểm,
tương tự như các phương pháp truyền thống trong việc xác định thể đồng hợp, dị hợp
và phân biệt các lỗi giải trình tự. Mỗi base đọc thô có một điểm số chất lượng do đó
18
phần mềm có thể sử dụng một số công cụ định lượng trong việc xác định sự sai khác
và cho điểm số tin cậy.
Phần mềm thu nhận dữ liệu của Illumina cho phép người dùng xếp các trình tự
vào một vùng tham chiếu (mẫu) của các ứng dụng giải trình tự. Được phát triển dựa
trên sự hợp tác của các nhà nghiên cứu, phần mềm bao gồm các module thu nhận dữ
liệu, xử lý và phân tích tạo thành một chuỗi thu nhận và xử lý dữ liệu với sự can thiệp
ít nhất từ người sử dụng. Định dạng mở của phần mềm cho phép dễ dàng truy nhập dữ
liệu tại nhiều giai đoạn của quá trình xử lý và phân tích dữ liệu sử dụng các giao duện
chương trình đơn giản.
Các hóa chất công nghệ TruSeq mang những tiến bộ mới nhất trong công nghệ
giải trình tự bằng tổng hợp. Từ quá trình chuẩn bị thư viện cho tới giải trình tự, các
hóa chất TruSeq cho phép việc giải trình tự với độ chính xác dữ liệu cao nhất trong tất
cả các ứng dụng. Với kết quả cao nhất các đoạn đọc không có lỗi, và hầu hết các base
với điểm số chất lượng lớn hơn Q30, các nhà nghiên cứu có thể đạt được độ tin cậy
cao nhất với dữ liệu cho đến các kết luận nghiên cứu của mình.
Một quy trình một chiều, khả năng tự đông hóa cao yêu cầu thời gian thao tác ít
nhất. Với khả năng tạo ra hàng Gb dữ liệu DNA trong một lần chạy, ngay cả các
genome lớn của các động vật có vú có thể giải trình tự trong một vài tuần thay vì một
vài năm như trước kia. Khả năng chạy nhiều mẫu trên 1 flow cell đồng nghĩa với việc
có thể thực hiện nhiều ứng dụng trong một lần chạy.
Một nhược điểm của hệ thống máy giải trình tự của Illumina đó là việc sử dụng các
hóa chất và các thiết bị có giá thành ở mức cao. Chính vì vậy, với nhưng nghiên cứu ở
quy mô nhỏ với kinh phí thấp sẽ ít có cơ hội được thực hiện trên hệ thống này.
19
Hình 1.1. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina
giai đoạn 1: tổng hợp
Hình 1.2. Sơ đồ mô tả hoạt động của hệ thống giải trình tự của Illumina giai đoạn 2: xác định trình tự
c. Ứng dụng của công nghệ Illumina
Ứng dụng của hệ thống giải trình tự Illumina là rất đa dạng, hệ thống này cho
phép các nhà khoa học nghiên cứu nhiều lĩnh vực trong ngành khoa học sự sống.
Illumina cho phép giải mã một hệ gen hoàn chỉnh trong thời gian ngắn, so sánh với các
công nghệ trước đây. Cụ thể trong việc giải mã một hệ gen người hoàn chỉnh, với các
công nghệ trước đây chúng ta phải mất tới 10 năm, thì hiện nay với công nghệ
Illumina chúng ta chỉ mất tới 4 ngày. Công nghệ này cho phép ứng dụng trong lĩnh
20
vực y tế và bảo vệ sức khỏe cộng đồng, thông qua việc giải mã hệ gen của các vi sinh
vật, các virus, các tác nhân gây bệnh; phân tích, phát hiện các điểm đột biến; phân tích
các hệ gen phiên mã. Bên cạnh đó, với các nghiên cứu về biểu hiện gen phục vụ công
nghiệp dược đáp ứng thuốc, nghiên cứu sự tác động của thuốc tới tế bào, Ứng dụng
của Illumina cho phép thay thế các công cụ trước đây, cụ thể như microarray. Ngoài ra
các công nghệ hiện nay vẫn đang cải tiến liên tục, cho phép phát triển nhiều hơn nữa
các ứng dụng phục vụ trong đa dạng các lĩnh vực.
1.6. Các nghiên cứu metagenomics trên thế giới và Việt Nam
1.6.1. Các nghiên cứu metagenomics trên thế giới
Người đầu tiên đưa ra ý tưởng nhân bản trực tiếp các mẫu DNA từ môi trường
là Pace và cộng sự, họ đã chứng minh sự tồn tại của một hệ sinh vật phức tạp chưa
từng được nghiên cứu đến [26] . Năm 1991, Pace đã công bố nghiên cứu phân lập các
gen cấu trúc từ thư viện gen của hệ vi sinh vật phát triển trên cỏ khô trong điều kiện
phòng thí nghiệm [27]. Năm 2002, Breitbart và các đồng nghiệp sử dụng công nghệ
metagenomics cho thấy trong 200 lít nước biển chứa hơn 5000 loại virus khác nhau
[8]. Các nghiên cứu sau đó cho thấy rằng có hơn một nghìn loài virus trong phân của
con người và khoảng một triệu loại virus khác nhau cho mỗi kg trầm tích biển, bao
gồm cả thể thực khuẩn [50][54][55][56]. Về cơ bản tất cả các virus đã được phát hiện
trong các nghiên cứu này đều là những loài chưa từng được phát hiện. Năm 2004,
Tyson và các đồng nghiệp tại Đại học California, Berkeley đã xác định trình tự DNA
của hệ vi sinh vật có trong nước thải nhiễm acid [57]. Đây là một bước tiến quan trọng
xác định được bộ gen hoàn chỉnh, hoặc gần như hoàn chỉnh của một số vi khuẩn mà
trước đây chưa nuôi cấy thành công [23].
Từ năm 2003, Venter đã đi vòng quanh trái đất bằng đường biển nhằm thu thập
các mẫu và sử dụng công nghệ metagenomics với mục đích xác định các genome (và
theo đó là các sinh vật) mới.Dự án thí điểm, tiến hành trong vùng biển Sargasso, phát
hiện DNA của gần 2000 loài khác nhau, trong đó có 148 loài vi khuẩn chưa bao giờ
được xác định trước đây [60]. Phân tích hệ sinh vật đất sử dụng công nghệ
metagenomics xuất hiện chậm hơn so với những nghiên cứu phân tích hệ sinh vật biển
do trong đất thường tồn tại những hợp chất liên kết với DNA hoặc ức chế phản ứng
21
PCR, gây khó khăn cho việc nhân bản các mẫu DNA từ đất [11]. Tuy nhiên trong
những năm gần đây những tiến bộ đáng kể trong nghiên cứu hệ vi sinh vật đất, xây
dựng các thư viện gen của các vi sinh vật này đã giúp các nhà khoa học hiểu rõ hơn về
hệ sinh vật phức tạp này [32][28].
Các tiến bộ trong kỹ thuật đọc trình tự DNA đã mở ra phương pháp tiếp cận
mới cho công nghệ metagenomics. Năm 2006, các nhà khoa học tại Đại học Penn
State đã công bố các trình tự thu được từ một mẫu môi trường bằng phương pháp
pyrosequencing sử dụng kỹ thuật đọc trình tự 454 – kỹ thuật cho phép đọc tới 400-600
megabases DNA chỉ trong vòng 10 giờ. Kỹ thuật này ra đời cho phép đọc trình tự
nucleotit của hệ sinh vật ở quy mô lớn trong một thời gian ngắn [14]. Gần đây công
nghệ sinh học đã thay đổi cách tiếp cận trong việc xác định các gen mới, nghiên cứu
chức năng của các gen, phân tích thành phần loài và các hệ vi sinh vật... Kỹ thuật
metagenomics là một lĩnh vực nghiên cứu mới, đang phát triển mạnh mẽ trong hơn
một thập kỷ qua, đã giúp xác định hệ gen của các vi sinh vật không thể nuôi cấy, một
mặt hoàn thiện những hiểu biết của con người về các loài vi sinh vật trên trái đất, mặt
khác góp phần giải quyết nhu cầu tìm kiếm các enzyme và hợp chất sinh học có ích
[7][ 58]
Các nghiên cứu phân tích thành phần và hoạt động của các hệ vi sinh vật tự
nhiên cho thấy tiềm năng sản xuất từ các vi sinh vật này các hợp chất sinh học có giá
trị cao sử dụng trong y tế như thuốc kháng sinh, các chất chống ung thư và ức chế
miễn dịch. Sử dụng kỹ thuật metagenomic để đánh giá tiềm năng và hoạt tính sinh học
của quần thể vi sinh vật không thông qua nuôi cấy theo phương pháp cổ điển đã cho
thấy tiềm năng ứng dụng kỹ thuật metagenomic trong nghiên cứu khái thác đa dạng
sinh học vi sinh vật là rất lớn.
1.6.2. Các nghiên cứu metagenomics tại Việt Nam
Metagenomics là một lĩnh vực nghiên cứu tương đối mới mẻ tại Việt Nam.Tuy
nhiên, các trung tâm nghiên cứu cũng như các nhà khoa học Việt Nam đang từng bước
tiếp cận với công nghệ giải trình tự thế hệ mới. Viện nghiên cứu các hệ gen thuộc Viện
hàn lâm khoa học Việt Nam đã được thành lập để tiến hành các nghiên cứu về hệ gen.
22
Viện đang nghiên cứu triển khai một số dự án liên quan đến hệ gen người, hệ gen cá
tra cũng như các loài sinh vật khác.
Viện di truyền nông nghiệp Việt Nam kết hợp với các viện nghiên cứu tại
Vương Quốc Anh vừa tiến hành giải trình tự 36 giống lúa Việt Nam. Dữ liệu hệ gen
lúa sẽ cho phép chúng ta tiến hành các nghiên cứu liên quan đến bảo tồn các nguồn
gen quý, cũng như tìm ra các gen cho năng suất cao và có khả năng chống chịu được
với các điều kiện khí hậu khắc nghiệp như chịu rét, chịu hạn hay chịu mặn.
Các nhóm nghiên cứu về tin sinh học đã và đang tiếp tục được thành lập và phát
triển tại các viện nghiên cứu và các trường đại học lớn tại Việt Nam như Đại học công
nghệ, ĐHQGHN, Học viện bưu chính viên thông, Đại học sư phạm Hà Nội. Bộ khoa
học công nghệ đã tài trợ đề tài độc lập cấp nhà nước “Nghiên cứu các phương pháp
phân tích và phát triển các công cụ tin sinh học nhằm giải quyết các bài toán quan
trọng trong tin sinh học” từ năm 2009-2011 để phát triển đội ngũ cũng như các công
cụ tính toán tin sinh học phục vụ các nghiên cứu tại Việt Nam. Quỹ phát triển
Nafosted cũng đã và đang tài trợ nhiều đề tài nghiên cứu cơ bản trong lĩnh vực tin sinh
học như “phân tích mô hình biến đổi axit amin của vi rút”, “các phương pháp tính toán
hiệu quả giải quyết các bài toán lớn trong sinh học phân tử”. Các nghiên cứu trong các
năm gần đây của các nhóm đã được đăng tải trên các tạp chí và hội nghị có uy tin trên
thế giới về tin sinh học hay sinh học phân tử. Một số nhóm nghiên cứu tin sinh học
đang từng bước tìm hiểu và phát triển các phương pháp liên quan đến phân tích dữ liệu
hệ gen. Một số kết quả nghiên cứu đầu liên đã được công bố tại hội nghị quốc tế.
Các trung tâm tính toán hiệu năng cao đã được thành lập và trang bị các hệ
thống tính toán tương đối lớn và hiện đại như Trung tâm tính toán hiệu năng cao của
trường Đại học khoa học tự nhiên, ĐHQGHN, Trung tâm tính toán hiệu năng cao của
Đại học bách khoa Hà Nội, Trung tâm tính toán hiệu năng cao của Đại học sư phạm
Hà Nội.Các trung tâm này về cơ bản có thể tham gia vào việc phân tích các dữ liệu hệ
gen, kể cá các hệ gen có kích thước lớn như hệ gen người.
Việc áp dụng công nghệ metagenomics vào nghiên cứu hệ gen của vi sinh vật
đất, đã và sẽ đóng vai trò to lớn trong các nghiên cứu tiếp theo. Tuy nhiên, tại Việt
23
Nam chưa có nhiều các nghiên cứu ứng dụng kĩ thuật metagenomics trong nghiên cứu
hệ vi sinh vật đất nói chung cũng như hệ vi sinh vật vùng rễ cà phê nói riêng. Vì vậy,
nghiên cứu này tập trung đánh giá sự đa dạng, ảnh hưởng của hệ vi sinh vật vùng rễ
đến sự sinh trưởng và phát triển của cây cà phê thông qua kĩ thuật metagenomics.
24
CHƯƠNG 2. VẬT LIỆU – PHƯƠNG PHÁP
2.1. Vật liệu nghiên cứu
• Mẫu nghiên cứu:
Mẫu đất vùng rễ cây cà phê được thu thập tại Nông trường cà phê Eapok thuộc
huyện Cư M’gra, tỉnh Đắk Lắk. Tỉnh Đắk Lắk thuộc trung tâm cao nguyên Tây
Nguyên, trong khoảng tọa độ địa lý từ 107o28'57" đến 108o59'37" độ kinh Đông và từ
12o9'45"đến 13o25'06" độ vĩ Bắc, có độ cao trung bình 400 – 800 mét so với mặt nước
biển.
• Hóa chất
Bộ Kit PowerSoil® DNA Isolation (MO BIO) cho quá trình tách DNA từ đất,
Bộ kit KAPA2G Robust HotStart Ready Mix (Kapa Biosystems), Agencourt AMPure
XP DNA purification kit (Beckman Coulter), Nextera XT index kit (Illumina)
Hóa chất dùng trong điện di DNA: agarose, TAE 1X (Tris - Acetic acide -
EDTA), ethidium bromide.
• Máy móc, thiết bị
Máy PCR System 9700 (Appied Biosystem, Mỹ), máy điện di Powerpac300
(Bio-Rad, Mỹ), máy soi DNA (Mini-transllumminatior, Bio-Rad, Mỹ), máy chụp
ảnh (Amersham Pharmacia Biotech, Thuỵ Điển), máy vortex (Mimishaker, IKA,
Đức), máy ly tâm, Qubit (Invitrogen; LifeTechnologies Europe BV, Monza, Italy),
Agilent 2100 Bioanalyser (Agilent Technologies), cùng với các trang thiết bị khác
của phòng Công nghệ tế bào thực vật - Viện Công nghệ Sinh học.
2.2. Phương pháp nghiên cứu
2.2.1. Phương pháp thu mẫu
Mẫu đất được thu tại vùng rễ sâu từ 20-30 cm của các cây cà phê tái canh từ 2 đến 3 năm tuổi và các cây cà phê kinh doanh từ 10 đến 20 năm tuổi vào tháng 8 năm 2015.Tại mỗi khu vực 25 m2 gồm khoảng 3 cây cà phê, chúng tôi tiến hành lấy mẫu đất tại 9 vị trí nhưhình 2.1.
25
Hình 2.1. Vị trí tiến hành thu mẫu tại một khu vực nghiên cứu
Mẫu đất tại 9 vị trí trong 1 khu vực sau đó được gộp làm một, trộn đều, và chuyển vào các ống corning 50 ml. Mẫu đất được bảo quản trong điều kiện tối,ở -20oC tới khi tiến hành các thí nghiệm tiếp theo.
2.2.2. Phương pháp tách chiết DNA tổng số
Các mẫu đất thu tại các vùng trồng cà phê được tiến hành tách chiết DNA bằng bộ Kit PowerSoil® DNA Isolation theo quy trình như sau:
• B1: Thêm 0,25 gam mẫu đất vào ống PowerBead
• B2: Lắc hoặc vortex để trộn đều mẫu
• B3: Kiểm tra Giải dung dịch C1. Nếu C1 bị kết tủa, ủ ở 60 C cho đến khi tan
trước khi sử dụng
• B4: Thêm 60 l dung dịch C1 và đảo ngược nhiều lần hoặc lắc thời gian ngắn.
• B5: vortex 5-10p tốc độ tối đa
• B6: ly tâm 10.000g 30s ở nhiệt độ phòng, lưu ý nếu li tâm > 10.000g có thể ống sẽ vỡ
• B7: Chuyển nổi sang ống 2 ml, thể tích mong muốn khoảng 400-500 µl
• B8: Thêm 250 l đệm C2 và lắc trong 5 giây. Ủ ở 4 C trong 5 phút
• B9: Ly tâm ở nhiệt độ phòng trong 1 phút 10.000 x g
• B10: chuyển dịch nổi sang ống 2 ml nhưng không nhiều hơn 600 l
• B11: Thêm 200 l đệm C3 và vortex một thời gian ngắn. Ủ ở 4 C trong 5 phút
26
• B12: Ly tâm các ống ở nhiệt độ phòng trong 1 phút 10.000 x g
• B13: chuyển dich nổi vào ống 2 ml không nhiều quá 750 l
• B14: Lắc để trộn đệm C4 trước khi sử dụng. Thêm 1200 l đệm C4, lắc hoặc
vortex 5 giây
• B15: cho 675 l vào bộ lọc Spin và ly tâm ở 10.000 x g trong 1 phút ở nhiệt độ
phòng, đổ dich qua cột và lặp lại cho đến hết dung dịch
• B16: Thêm 500 l đệm C5 ly tâm ở nhiệt độ phòng trong 30 giây ở 10.000 x g
• B17: Loại bỏ các phần dung dịch qua qua cột
• B18: Ly tâm một lần nữa ở nhiệt độ phòng trong 1 phút ở 10.000 x g
• B19: chuyển thận đặt bộ lọc sang ống 2 ml sạch
• B20: Thêm 100 l đệm C6.
• B21: Ly tâm ở nhiệt độ phòng trong 30 giây ở 10.000 x g.
DNA sau khi tách thành công được tiến hành do nồng độ và độ tinh sach bằng máy nano drop, kiểm tra bằng điện di trên agarose 1% và bảo quản ở -20oC
2.2.3. Phương pháp khuếch đại và xác định trình tự các đoạn gen
a. Vùng 16S rRNA
Các loài vi sinh vật tách ra từ các mẫu thu thập được được phân loại dựa vào đa
hình của 9 vùng gen nằm trên gen 16S ribosome RNA (16S rRNA). Trong nghiên cứu
này, đa hình trên hai phân vùng V3 và V4 của vùng 16S rRNA sẽ được tập trung phân
tích. Các đoạn 16S rRNA tđược giải trình tự tự động thông qua hệ thống máy MiSeq.
b. Tóm tắt quy trình thiết kế theo hướng dẫn của hãng Ilumina
1. Thiết kế mồi
2. Chuẩn bị thư viện: các đoạn DNA sau khi được khuếch đại được gắn các
Illumina sequencing adapter và các vùng barcode index
3. Giải trình tự: Sử dụng bộ kit 300 bp để xác định trình tự các đoạn DNA với 65
giờ trong 1 lần chạy. dữ liệu đầu ra của hệ thống MiSeq xấp xỉ > 20 triệu đoạn
đọc (read)
4. Dữ liệu đầu ra của hệ thống được phân tích trên phần mềm MiSeq Sequencing
Reporter
27
Hình 2.2. Quy trình khuếch đại và giải trình tự vùng 16S rRNA
2.2.4. Khuếch đại vùng 16S rRNA
1. Thành phần phản ứng khuếch đại vùng 16S rRNA
Thể tích
DNA vi sinh vật (5 ng/µl) 2,5 µl
Mồi xuôi 16S Amplicon PCR 1 µM 5 µl
Mồi ngược 16S Amplicon PCR 1 µM 5 µl
2X KAPA HiFi HotStart Ready Mix 12,5 µl
Tổng 25 µl
2. Đậy chặt plate 96 giếng và tiến hành chạy PCR sử dụng chương trình sau:
25 chu kỳ
95oC
72oC
72oC
30 giây
95oC 3 phút
30 giây
5 phút
55oC 30 giây
4oC
3. Bổ sung 1 µl sản phẩm PCR vào Bioanalyzer DNA 1000 chip để kiểm định kích
∞
thước. Kích thước dự kiến sau khuếch đại là 550 bp
28
2.2.5. Tinh sạch sản phẩm PCR
1. Ly tâm đĩa 96 giếng 3000 v/p trong 1 phút ở 20oC. để toàn bộ dịch dồn xuống đáy ống
2. Sử dụng Pipet đa kênh hút toàn bộ 25 µl sản phẩm PCR chuyển sang plate MIDI
3. Vortex các hạt AMPure XP trong 30 giây để đảm bảo các hạt được trộn đều.
4. Sử dụng Pipet đa kênh, bổ sung 20 µl các hạt AMPure XP vào mỗi giếng của plate MIDI
5. Trộn đều nhẹ nhàng toàn bộ các giếng khoảng 10 lần sau đó đậy chặt nắp và
lắc plate MIDI tại 1800 v/p trong 2 phút
6. Ủ ở nhiệt độ phòng trong điều kiện không lắc trong 5 phút
7. Đặt plate trên một giá nam châm trong 2 phút hoặc tới khi quan sát thấy toàn dung dịch chuyển hoàn toàn thành dạng trong suốt
8. Giữ nguyên plate trên giá nam châm, sử dụng pipet đa kênh loại bỏ toàn bộ dịch nổi.
9. Rửa 2 lần với 200 µl cồn 80%, ủ trên giá nam châm 30 giây sau đó loại bỏ toàn bộ dịch nổi
10. Làm khô các hạt tự nhiên trong 10 phút
11. Chuyển plate MIDI khỏi giá nam châm, bổ sung 52,5 µl Tris pH 8,5 ở nồng độ 10 mM vào mỗi giếng
12. Trộn đều nhẹ nhàng 10 lần bằng pipet
13. Ủ ở nhiệt độ phòng trong 2 phút
14. Đặt plate lên giá nam châmtrong 2 phút hoặc tới khi dung dịch chuyển sang trong suốt
15. Dùng pipet đa kênh thu 50 µl dịch nổi chuyển sang plate 96 giếng mới
2.2.6. Gắn Index (Nextera XT Index kit)
1. Sử dụng pipet đa kênh, chuyển 5 µl từ mỗi giếng sang một plate mới.
2. Sắp xếp các mồi Index 1 và 2 lên rack như trên hình 2.4:
29
Hình 2.3. Bố trí các ống mẫu
A: Mồi Index 2 (Nắp màu trắng)
B: Mồi Index 1 (Nắp màu cam)
C: Đĩa 96 giếng
3. Thành phần phản ứng
Thể tích
DNA 5 µl
Nextera XT Index Primer 1 5 µl
Nextera XT Index Primer 2 5 µl
25 µl 2x KAPA HiFi HotStart Ready Mix
Nước khử ion 10 µl
Tổng 50 µl
4. Trộn đều thành phần phản ứng 10 lần
5. Đậy nắp plate với Microseal A 6. Ly tâm plate 3000 v/p trong 1 phút ở 20oC
7. Chạy PCR với chu trình phản ứng
8 chu kỳ
95oC
95oC
72oC
72oC
30 giây
3 phút
30 giây
5 phút
55oC 30 giây
4oC
∞
30
2.2.7. Tinh sạch sản phẩm gắn Index
1. Ly tâm plate 96 giếng 1000 v/p trong 1 phút ở 20oC. để toàn bộ dịch dồn xuống đáy ống
2. Sử dụng Pipet đa kênh hút toàn bộ 50 µl sản phẩm PCR chuyển sang plate MIDI
3. Vortex các hạt AMPure XP trong 30 giây để đảm bảo các hạt được trộn đều.
4. Sử dụng Pipet đa kênh, bổ sung 56 µl các hạt AMPure XP vào mỗi giếng của plate MIDI
5. Trộn đều nhẹ nhàng toàn bộ các giếng khoảng 10 lần sau đó đậy chặt nắp và
lắc plate MIDI tại 1800 v/p trong 2 phút
6. Ủ ở nhiệt độ phòng trong điều kiện không lắc trong 5 phút
7. Đặt plate trên một giá nam châm trong 2 phút hoặc tới khi quan sát thấy toàn dung dịch chuyển hoàn toàn thành dạng trong suốt
8. Giữ nguyên plate trên giá nam châm, sử dụng pipet đa kênh loại bỏ toàn bộ dịch nổi.
9. Rửa 2 lần với 200 µl cồn 80%, ủ trên giá nam châm 30 giây sau đó loại bỏ toàn bộ dịch nổi
10. Làm khô các hạt tự nhiên trong 10 phút
11. Chuyển plate MIDI khỏi giá nam châm, bổ sung 27,5 µl Tris pH 8,5 ở nồng độ 10 mM vào mỗi giếng
12. Trộn đều nhẹ nhàng 10 lần bằng pipet
13. Ủ ở nhiệt độ phòng trong 2 phút
14. Đặt plate lên giá nam châmtrong 2 phút hoặc tới khi dung dịch chuyển sang trong suốt
15. Dùng pipet đa kênh thu 25 µl dịch nổi chuyển sang plate 96 giếng mới
2.2.8. Đánh giá thư viện
1. Lấy 1 µl trong tổng thể tích dung dịch thư viện đã pha loãng 50 lần
2. Đưa lên Bioanalyser chip, lựa chọn quy trình V3 và V4 primer, kích thước tính toán trên máy là 630 bp
2.2.9. Biến tính thư viện và giải trình tự trên máy Miseq
Thư viện được biến tính sử dụng NaOH, pha loãng trong buffer, và sau đó biến tính bằng nhiệt trước khi đưa vào máy Miseq để giải trình tự. Mỗi một lượt chạy phải bao gồm tối thiểu 5% PhiX làm đối chứng đối với những thư viện có độ đa dạng thấp.
Chuẩn bị:
1. Đăt block nhiệt phù hợp với ống 1,7 ml lên 96oC
31
2. Đưa các thành phần phản ứng của máy Miseq từ các tủ -25oC ra ngoài và làm tan ở điều kiện nhiệt độ phòng
3. Trong một xô đá, chuẩn bị một bể nước đá bằng cách trộn 3 phần đá và 1 phần nước
a. Biến tính DNA
1. Trộn các thành phần thư viện DNA và NaOH0,2 N theo tỷ lệ thể tích như sau: 4nM thư viện DNA (5 µl) và 0,2N NaOH (5 µl)
2. Chuẩn bị đối chứng PhiX tương tự bằng cách trộn PhiX với NaOH 0,2N với tỉ lệ 1:1 (5 µl: 5 µl)
3. Trộn đều dung dịch phản ứng bằng vortex nhanh, và sau đó ly tâm ở 1000 v/p trong 1 phút ở 20oC
4. Ủ hỗn hợp dung dịch trong 5 phút ở nhiệt độ phòng để biến tính hoàn toàn các DNA sợi đôi thành sợi đơn
5. Bổ sung 10 µl sản phẩm DNA đã biến tính vào 990 µl Pre-chilled HT1
6. Đặt DNA biến tính trên đá cho tới khi bước pha loãng thư viện đã sẵn sang
b. Pha loãng thư viện DNA đã biến tính
1. Pha loãng DNA đã biến tính tới nồng độ mong muốn theo bảng sau: (Trong lần chạy đầu tiên, nồng độ thư viện được Illumina đề nghị là 4 pM, tùy thuộc vào khối lượng dữ liệu đầu ra, nồng độ thư viện trong các lần tiếp theo được điều chỉnh tăng giảm cho phù hợp)
Nồng độ cuối cùng 2 pM 4 pM 6 pM 8 pM 10 pM
60µl 120 µl 180 µl 240 µl 300 µl 20 pM Thư viện đã biến tính
Pre-chilled HT1 540 µl 480 µl 420 µl 360 µl 300 µl
2. Trộn đều hỗn hợp dung dịch bằng cách đảo ngược ống rồi đặt ống mẫu trên đá
c. Biến tính và pha loãng đối chứng PhiX
Sử dụng chỉ dẫn sau đây để biến tính và pha loãng 10 nM thư viện PhiX tới nồng độ tương tự như thư viện của mẫu phân tích. Thư viện trộn lẫn cuối cùng phải bao gồm ít nhất 5% PhiX.
1. Trộn các dung dịch theo tỷ lệ thể tích sau để nồng độ dung dịch cuối cùng đạt 4nM:
a. 10 nM thư viện PhiX (2 µl)
b. 10 nM Tris pH 8.5 (3 µl)
2. Pha loãng PhiX trong NaOH theo tỷ lệ thể tích sau:
a. 4 nM thư viện PhiX (5 µl)
b. 0,2 N NaOH (5 µl)
32
3. Trộn đều hỗn hợp dung dịch bằng vortex nhanh
4. Ủ hỗn hợp dung dịch ở nhiệt độ phòng trong 5 phút để biến tính thư viện DNA sợi đôi thành sợi đơn
5. Bổ sung 10 µl sản phẩm DNA đã biến tính vào 990 µl Pre-chilled HT1
6. Pha loãng 20 pM thư viện PhiX đã biến tính tới nồng độ giống với thư viện DNA của mẫu phân tích theo bảng sau:
Nồng độ cuối cùng 2 pM 4 pM 6 pM 8 pM 10 pM
60µl 120 µl 180 µl 240 µl 300 µl 20 pM Thư viện đã biến tính
Pre-chilled HT1 540 µl 480 µl 420 µl 360 µl 300 µl
7. Trộn đều hỗn hợp dung dịch bằng cách đảo ngược ống một vài lần sau đó ly tâm nhanh để toàn bộ dung dịch dồn xuống dưới đáy ống
8. Đặt các ống đã làm phản ứng trên đá
d. Hợp nhất thư viện DNA của mẫu phân tích và mẫu đối chứng
1. Hai thư viện được trộn lẫn theo tỉ lệ thể tích sau:
a. Hỗn hợp dung dịch đã biến tính và pha loãng của mẫu đối chứng PhiX
(30 µl)
b. Hỗn hợp dung dịch đã biến tính và pha loãng của mẫu phân tích (570 µl) 2. Sử dụng block nhiệt biến tính hỗn hợp dung dịch trộn lẫn hai thư viện ở 96oC trong 2 phút
3. Sau khi ủ, trộn đều hỗn hợp dung dịch bằng cách đảo ngược ống và ly tâm nhanh, sau đó giữ trong bể nước đá đã được chuẩn bị từ bước trước
4. Ủ hỗn hợp dung dịch trong bể nước đá trong 5 phút
5. Đưa hỗn hợp dung dịch trộn lẫn giữa 2 thư viện lên MiSeq v3 reagent cartridge
e. Giải trình tự trên máy Miseq
1. Khởi động máy Miseq
2. Sau khi mẫu được đưa lên cartridge, hệ thống yêu cầu khai báo các thông số chạy máy và các chuẩn phân tích mẫu. Khi đó, lựa chọn 16S Metagenomics workflow (quy trình phân tích 16S)
2.2.10. Phân tích dữ liệu
Các bước phân tích được thực hiện thông qua công cụ Qiime. Qiime là gói công
cụ mã nguồn mở, tích hợp nhiều kịch bản (script) được lập trình cho các nhà khoa học
nghiên cứu sự đa dạng của các hệ vi sinh vật thông qua phân tích trình tự bên trọng
hoặc giữa các vùng gen 16S rRNA và 18S rRNA. Qiime thích hợp cho tất cả các nền
33
tảng giải trình tự như: Illumina, 454, và giải trình tự dựa trên nguyên lý của Sanger.
Thiết kế của Qiime phù hợp cho nhiều đối tượng người sử dụng, từ sinh viên tới các
chuyên gia sinh phân tích, các câu lệnh được sử dụng dễ hiểu và không yêu cầu các kỹ
năng đặc biệt trong quá trình sử dụng. Trình tự vùng V3 và V4 của đoạn 16S rRNA
của một mẫu được lắp ráp dựa trên các contig và với các tham số mặc định. Các trình
tự chứa các thông tin nhiễu, các vị trí base có độ tin cậy thấp, các đoạn đọc có kích
thước nhỏ hơn 400 bp hoặc lớn hơn 460 được loại bỏ. Dữ liệu đáng tin cậy sẽ được so
sánh thẳng hàng với các trình tự đã công bố dựa trên cơ sở dữ liệu SILVA. Số lượng
các đơn vị phân loại (OTUs) có mức độ tương đồng lần lượt 97%, 95% và 90% được
sử dụng để xây dựng đường cong rarefaction, và tính toán các giá trị ACE (abundance
based coverage estimator), CHAO (richness), Shannon, Simpson đối với từng mẫu.
Kết quả sau khi phân tích được đưa vào phần mềm MEGAN 5 để so sánh mức độ
tương đồng và sai khác giữa ba hệ vi sinh vật.
Hình 2.4. Quy trình phân tích sử dụng công cụ QIIME
34
2.2.11. Phương pháp xác định tuyến trùng
a. Phương pháp lọc tĩnh thu tuyến trùng
Rây lọc được xếp một lớp giấy lên trên và đặt vào đĩa Petri, sau đó lấy rễ cho
vào rây lọc, điều chỉnh lượng nước vừa ngập rễ trên rây, đậy nắp và đặt yên tĩnh trong
48h ở nhiệt độ phòng. Tuyến trùng sống chui qua rây lọc, lắng đọng xuống đáy đĩa
Petri. Nhấc rây ra khỏi đĩa Petri thu lại dịch nước chứa tuyến trùng trong đĩa Petri.
b. Phương pháp đếm tuyến trùng
Tuyến trùng được đếm bằng đĩa đếm tuyến trùng dưới kính hiển vi soi nổi. Nếu
mẫu có ít tuyến trùng: Đổ dung dịch tuyến trùng vào đĩa đếm. sau đó lắc nhẹ cho dung
dịch tuyến trùng dàn đều. Đếm toàn bộ tuyến trùng theo các dãy ô cho toàn bộ đĩa hay
đếm đại diện một số ô hoặc dãy, sau đó tính trung bình một ô và nhân với tổng số ô
trong đĩa.
c. Phương pháp định danh tuyến trùng bằng hình thái theo De Grisse (1969)
Ngày thứ nhất: nhặt tuyến trùng chuyển vào giếng chứa 0,5ml dung dịch I
(99ml Formalin 40% + 1 ml glycerine). Đặt giếng có tuyến trùng vào bình hút ẩm
chứa ethanol 96 %. Để bình hút ẩm trong tủ ấm ở nhiệt độ 40°C ít nhất 12 giờ. Ngày
thứ 2: lấy giếng ra khỏi bình hút ẩm, nhỏ vài giọt dung dịch II (95ml ethanol 96% + 5
ml glycerine) đặt trong tủ ấm. Cứ sau 2 giờ thì nhỏ 2 giọt dung dịch II, thực hiện 4 lần.
Để giếng qua đêm, bổ sung vài giọt dung dịch III (50ml ethanol 96% + 50ml
glycerine). Ngày thứ 3: tuyến trùng nằm trong dung dịch glycerine tinh khiết được sử
dụng để lên tiêu bản định loại.
35
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. Phân tính đặc điểm lý hóa và sinh học chung của các mẫu
Dựa vào kiểu canh tác và hiện trạng phát triển, 04 vùng đất trồng cà phê bao
gồm cà phê tái canh nhiễm bệnh (TCB), tái canh phát triển tốt (TCT), kinh doanh năng
suất cao (NSC; 15-17 tấn/ha) và kinh doạnhnăng suất trung bình (NSTB; 5-6 tấn/ha)
được chọn để thu mẫu. Đất tại 9 vị trí trong 1 khu vực được gộp làm một, trộn đều, và
sau đó chuyển vào các túi đựng mẫu với trọng lượng khoảng 1 kg cho mỗi mẫu nghiên
cứu.
Hình 3.1: Hình ảnh cây cà phê tái canh bệnh và cà phê kinh doanh tại khu vực thu mẫu thí nghiệm. Cây cà phê tái canh bệnh (A) và mẫu rễ (C); Cây cà phê kinh doanh (B) và mẫu rễ (D)
Bệnh tuyến trùng hay còn gọi là bệnh vàng lá thối rễ: Lọại bệnh này khá nguy
hiểm, có thể gây cho cà phê chết hàng loạt. Các loại tuyến trùng chích hút rễ gây vết
thương hay các nốt sưng trên rễ tạo diều kiện cho các loại nấm xâm nhập gây hiện
tượng thối rễ vàng lá. Vào mùa mưa ở Tây Nguyên đã có hàng trăm hecta cà phê vối
bị bệnh, lá cây bị vàng và rụng, rễ bị tuyến trùng và nấm phá hoại.Các mẫu cà phê
được phân tích đánh giá tình trạng nhiễm tuyến trùng bằng phương pháp đếm tuyến
trùng. Kết quả đánh giá cấu trúc tuyến trùng trong 4 mẫu đất nghiên cứu được thể hiện
trong biểu đồ (hình 3.1).
36
Hình 3.2. Biểu đồ thể hiện thành phần loài tuyến trùng trong mẫu đất tại khu vực nghiên cứu
Kết quả phân tích tuyến trùng cho thấy 4 mẫu đất thu tại khu vực khảo sát bị
nhiễm tuyến trùng thuộc nhóm gây nốt sần vùng rễ- root knot nematodes (biểu đồ 3.1).
Nhóm tuyến trùng này phân bố rộng khắp và ký sinh trên hầu hết các mẫu tái canh
bệnh, đặc biệt là 2 nhóm Meloidogyne, Pratylenchus, trong các mẫu đất trồng cà phê
tái canh tốt, số lượng tuyến trùng ít hơn nhiều. Điều này khẳng định tác hại của tuyến
trùng lên hiệu quả tái canh cây cà phê.
Trong đất trồng cà phê kinh doanh, khi cây cà phê đã trưởng thành, ảnh hưởng
của tuyến trùng lên cây không nhiều như đối với cây con, tuy nhiên chúng tôi cũng
quan sát được số lượng tuyến trùng trong đất trồng cà phê cho năng suất cao ít hơn
nhiều so với trong đất trồng cà phê năng suất trung bình. Có thể nói tuyến trùng kí sinh
trong đất cũng là một trong những nguyên nhân ảnh hưởng đến năng suất trồng cà phê.
Để đánh giá các thành phần hữu cơ và cơ giới trong đất, các mẫu sau khi thu
thập được đem phân tích tại Phòng Kiểm định chất lượng phân bón số 11, Viện Thổ
nhưỡng Nông hóa. Kết quả phân tích được thống kê trong bảng 3.1
37
Bảng 3.1. Bảng thống kê thành phần của 4 mẫu đất nghiên cứu
Pdt
Kdt
Pts
Kts
Stt
Nhóm mẫu
pHKcl
Độ ẩm
(mgP2O5/
(mgK2O/
OM (%)
Nts (%N)
(%P2O5)
(%K2O)
100g)
100g)
4.41
31.72
3.4
0.21
0.32
0.04
28.30
25.73
1
Cà phê tái canh khỏe (TCT)
2
4.21
31.23
1.9
0.13
0.16
0.03
23.17
51.69
Cà phê tái canh bị bệnh (TCB)
3
4.27
32.90
6.55
0.25
0.89
0.03
10.90
29.71
Cà phê kinh doanh năng suất cao (NSC)
4
4.97
31.14
3.82
0.19
0.31
0.02
20.33
25.73
Cà phê kinh doanh năng suất trung bình (NSTB)
Kí hiệu: Hữu cơ tổng số (OM), Nitơ tổng số (Nts), Photpho tổng số (Pts), Kali tổng số (Kts), Photpho dễ tiêu (Pdt), Kali dễ tiêu (Kdt)
Kết quả phân tích thành phần hóa lý của các mẫu đất nghiên cứu cho thấy độ
ẩm và chỉ số pH của các nhóm mẫu khá tương đồng nhau. Chỉ số pH cho thấy đất bị
chua dao động từ 4.21 ở nhóm TCB đến 4.97 tại nhóm NSTB, độ ẩm trung bình từ
31.14- 32.90 tại 2 nhóm NSTB và NSC.
So sánh giữa 4 mẫu đất nghiên cứu kết quả cho thấy thành phần nitơ
(N),photpho (P) và kali (K) giữa các mẫu không có sự khác biệt đáng kể (Bảng 3.1),
tuy nhiên thành phần P dễ dùng cây trồng giữa mẫu đất tái canh tốt và tái canh
xấu(28.30 và 23.17); giữa 2 mẫu đất cà phê năng suất cao và năng suất thấp (20.33 và
10.90) có sự biệt rõ rệt Tương tự, hàm lượng K dễ tiêu trong mẫu đất cà phê kinh
doanh năng suất cao và mẫu cà phê tái canh tốt là cao hơn đáng kể so với trong mẫu
đất cà phê tái canh bị bệnh và mẫu cà phê kinh doanh năng suất trung bình (25.73 và
51.69 so với 29.71 và 20.82 ). Kết quả phân tích trên cho thấy hàm lượng P và K dễ
tiêu trong đất trồng cà phê là một trong những chỉ số để đánh giá chất lượng đất, ảnh
hưởng đến năng suất cà phê thu được.
Để xác định một số nguyên nhân khác có liên quan đến vi sinh vật có khả năng
ảnh hưởng đến khả năng tái canh cà phê và năng suất của cây cà phê, chúng tôi tiếp tục
38
sử dụng kỹ thuật metagenomis để đánh giá mức độ đa dạng của quần thể vi sinh vật
trong các mẫu nghiên cứu.
3.2. Kết quả tách chiết DNA tổng số.
Mẫu đất thu thập ở vùng rễ của cây cà phê bao gồm hệ vi sinh vật nấm, khuẩn
và động vật nguyên sinh, DNA tách chiết được từ đất sẽ bao gồm DNA tổng số của vi
khẩn nấm và những động vật nguyên sinh này. Số lượng và chất lượng DNA tổng số
tách từ các mẫu đấy là nguồn vật liệu ban đầu quan trọng và cần thiết cho các nghiên
cứu metagenomic. Chất lượngDNAđược đánh giá trên gel agrose.
Trong những thí nghiệm đầu tiên, 0,25g đất từ mỗi mẫu đã được sử dụng để
tách DNA tổng với bộ Kit Powersoil của hãng Ilumina.Tuy nhiên, kết quả cho thấy với
lượng mẫu ban đầu này nồng độ DNA thu được là rất thấp chỉ từ 9 - 11ng/ µl, mặc
dùđộsạch rất cao 1,77 – 1,83. Do đó, chúng tôi đã tăng khối lượng mẫu đất cho quá
trình tách chiết DNA tổng số lên 0,75g. DNA tổng số sau tách chiết được điện di kiểm
tra trên gel agarose 1% (Hình 3.3)
Hình 3.3. Kết quả điện di kiểm tra sản phẩm tách DNA tổng số của 4 mẫuđất nghiên cứu Kết quả điện di kiểm tra sản phẩm tách DNA tổng số trên hình 3.3 cho thấy,
DNA tổng số thu được có chất lượng tốt, các băng vạch đều sáng rõ, gọn điều này
chứng tỏ DNA thu được có nồng độ cao và độ tinh sạch tốt. Điều này cũng được phản
ánh trong kết quả đo nồng độ và độ sạch của DNA tổng số thu được bằng máy nano
drop (Bảng 3.2).
39
Bảng 3.2. Nồng độ và độ tinh sạch 4 mẫu DNA tách từ đất
STT Nồng độ Độ tinh sạch (A260/A280)
TCT 51,5 ng/µl 1,84
TCB 54,8 ng/µl 1,81
NSC 52,5 ng/µl 1,90
NSTB 60,1 ng/µl 1,86
Nồng độ DNA tách từ mẫu đất 4 có nồng độ cao nhất 60,1 ng/µl, sau đó là mẫu
2 có nồng độ 54,8 ng/µl, thấp nhất là mẫu 1 có nồng độ51,5ng/µl. Độ tinh sạch của cả
4 mẫu DNA đều đạt tiêu chuẩn1,81 -1,9. Điều này chứng tỏ quá trình tách chiết cho
kết quả tốt, DNA thu được đạt yêu cầu để sử dụng cho những nghiên cứu tiếp theo.
3.3. Chuẩn bị thư viện và gắn adapter
Từ kết quả phân tích trên máy Agilent 2100 Bioanalyser (Hình 3.4) cho thấy,
các đoạn DNA sau khi khuếch đại có kích thước khoàng 550 bp tương ứng với tính
toán lý thuyết. Kết quả này khẳng định đã nhân thành cônghai phân vùng V3 và V4
của vùng 16S rRNA. Sản phẩm thu được đảm bảo điều kiện để thực hiện các thí
nghiệm tiếp theo.
Hình 3.4. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm khuếch đại bằng cặp mồi 16S
Sau khi thực hiện bước gắn các đoạn index vào các sản phẩm 16S rRNA đã
khuếch đại, sản phẩm thu được này tiếp tục được kiểm tra trên máy Agilent 2100
Bioanalyser. Kết quả hiển thị như trên hình 3.5. Từ kết quả trên hình 3.5 cho thấy sản
phẩm của bước gắn cho kích thước khoảng 630 bp tương ứng với tính toán lý thuyết.
40
Kết quả nêu trên khẳng định, phản ứng gắn giữa đoạn 16S rRNA và các index được
thực hiện tốt, đủ điều kiện để thực hiện các thí nghiệm tiếp theo.
Hình 3.5. Biểu đồ ghi lại tín hiệu đo kích thước sản phẩm gắn index
3.4. Kết quả phân tích dữ liệu trình tự
Trong thí nghiệm này, các đoạn 16S rRNA được nhóm nghiên cứu thực hiện
giải trình tự và phân tích trình tự 2 lần. Dữ liệu sau khi thu được từ máy giải trình tự
Miseq, được đem phân tích bằng phần mềm Qiime. Sau khi thu được dữ liệu phân tích
bằng Qiime kết quả được trình bày trong bảng 3.3.
Bảng 3.3: Thống kê dữ liệu trình tự thu được sau bước giải trình tự
Số lượng đoạn trình tự có thể sử dụng
Mẫu
Tổng số trình tự đọc được
Kích thước trung bình
để phân tích (%)
1
142.893
138.261(96.76%)
438
2
87.048
82.718(95.03%)
438
3
119.885
113.893(95.00%)
438
4
124.574
120.525(96.75%)
438
Trên tổng số 142.893 trình tự đoạn 16S thu được từ mẫu cà phê tái canh khỏe,
sau khi loại bỏ các dữ liệu không đáng tin cậy, hơn 96% dữ liệu đã được chọn để tiến
hành phân tích tiếp theo. Tương tự như vậy, đối với mẫu thu thập từ cà phê tái canh bị
bệnh, cà phê kinh doanh năng suất cao và cà phê kinh doanh năng suất trung bình các
giá trị này lần lượt là 87.048, 119.885 và 124.574 trình tự đọc được và, trên 95% các
trình tự đáng tin cậy được lựa chọn để thực hiện các phân tích tiếp theo.
41
Đơn vị phận loại (OTUs) được định nghĩa là một trình tự hay một nhóm trình tự
tương đồng trong dữ liệu mẫu. Căn cứ vào các phân tích trên thế giới, các OTU thường
được chia theo các mức 0,03; 0,05; và 0,1 tương ứng với mức độ tương đồng giữa các
trình tự trong một OTU là 97%, 95%, và 90%.
Hình 3.6: Rarefaction curve dựa trên dữ liệu trình tự của bốn hệ vi sinh vậtcác OTU 0,1
Từ kết quả phân tích trên hình 3.6 cho thấy cả 4 hệ vi sinh vật đều chưa đạt bão
hòa về số lượng OTU ở mức độ 0,1, điều đó có nghĩa nếu tiếp tục giải trình tự với khối
lượng cao hơn thì số lượng các loài phát hiện được sẽ tiếp tục tăng.
Với các số liệu thu được, căn cứ vào các kết quả phân tích có thể thấy sự phong
phú về thành phần loài của các hệ vi sinh vật trong các mẫu đất nghiên cứu, tuy nhiên
để có thể nghiên cứu chính xác đầy đủ hơn về các hệ vi sinh vật này, cần tiếp tục giải
mã trình tự hệ vi sinh vật ở với quy mô lớn hơn.
3.5. Kết quả phân tích mức độ đa dạng quần thể vi khuẩn đất vùng rễ cây cà phê
Trên tổng số 3.470.415 trình tự phân tích của hệ vi sinh vật ở 4 nhóm mẫu đã
phân loại được 51 ngành, 141 lớp, 283 họ, 438 chi và 155 loài. Trên cả 4 khối dữ liệu
phân tích các nhóm trình tự có tỉ lệ phần trăm trên tổng số trình tự thấp hơn 0,1% được
xếp vào nhóm others, các trình tự không thể phân loại được thống kê trong nhóm
unclassified.
42
3.5.1. Kết quả đánh giá độ đa dạng ở mức phân loại ngành
Qua quá trình chọn lọc và phân tích dữ liệu dựa trên mẫu thu thập được, để làm
nổi bật nên vai trò của vi sinh vật đối với giai đoạn phát triển khác nhau của cây cà
phê, chúng tôi tiến hành phân tích, so sánh kết quả thu được theo 2 nhóm là cà phê tái
canh (cây con) và cà phê kinh doanh (cây trưởng thành). Dựa vào trình tự vi khuẩn
phân tích được ở cả bốn quần thể nghiên cứu chúng tôi đã phân loại được 51 ngành,
các nhóm trình tự có tỉ lệ phần trăm trên tổng số trình tự thấp hơn 0,1% được phân vào
nhóm còn lại, các trình tự không thể phân loại được được thống kê trong nhóm
unclassified.
Trong 51 ngành vi sinh vật phân tích được, trong khuôn khổ mục tiêu luận văn
chúng tôi tiến hành chọn lọc, đánh giá cấu trúc của một số ngành vi khuẩn chính có
khả năng tác động tới khả năng kháng tuyến trùng trong nhóm cà phê tái canh và năng
suất trong nhóm cà phê kinh doanh (hình 3.7). Kết quả phân tích cấu trúc vi sinh vật
trong đất trồng cà phê thu được sử dụng trong các nghiên cứu tiếp theo mới các mục
tiêu đánh giá ảnh hưởng của một số nguyên nhân khác tới sinh trưởng cà phát triển của
cây cà phê.
Hình 3.7. Cấu trúc quần thể vi sinh vật ở mức độ ngành
43
Từ biểu đồ trong hình 3.7 cho thấy các vi sinh vật chủ yếu thuộc nghành
Proteobacteria và Acidobacteria chiếm tỉ lệ trên 50% ở cả 4 mẫu nghiên cứu. Tiếp theo
là các ngành Actionbacteria, Bacteriodetes, Verucomicrobia, Chloroflexi,
Gemmationadetes, Planctomycetes và Nitrospirae. Tuy nhiên số lượng các vi sinh vật
trong các ngành trên biến động tùy thuộc vào từng giai đoạn phát triển của cây cà phê.
Trong nhóm cà phê tái canh số lượng trình tự xếp vào ngành proteobacteria cao hơn so
với cà phê kinh doanh và ngược lại ngành Acidobacteria số lượng trình tự xác định
được ở nhóm cà phê kinh doanh nhiều hơn so với nhóm cà phê tái canh. Proteobacteria
thuộc phân lớp vi khuẩn gram (-), bao gồm nhiều loại vi khuẩn có khả năng gây bệnh
như Escherichia, Salmonella, Vibrio, Helicobacter, Yersinia, các vi khuẩn cố định
đạm và nhiều chi quan trọng khác. Acidobacteria là ngành vi khuẩn phổ biến, các loài
vi khuẩn thuộc ngành này rất đa dạng về mặt sinh lý và phân bố, đặc biệt là trong đất,
tuy nhiên số lượng các loài được nuôi cấy chưa nhiều. Actinobacteria là một nhóm vi
khuẩn thật (Eubacteria) phân bố rất rộng rãi. Trước kia được xếp vào Tản thực vật
(nấm), nhưng ngày nay chúng được xếp vào vi khuẩn (Schizomycetes)
(https://vi.wikipedia.org/wiki/X%E1%BA%A1_khu%E1%BA%A9n)
Tiếp theo, dưới nghành chúng tôi xác định được 141 lớp trên toàn bộ dữ liệu và
chọn ra 15 lớp có số lượng lớn để phân tích (hình 3.8).
3.5.2. Kết quả phân tích cấu trúc thành phần vi khuẩn chiếm ưu thế trong đất
vùng rễ ở mức độ phân loại lớp và họ vi khuẩn
Kết quả phân tích thành phần vi khuẩn chiếm ưu thế ở mức độ phân loại lớp
(Class) được thể hiện ở (hình 3.8). Phân tích dữ liệu metagenomics cho thấy
Alphaproteobacteria, Betaproteobacteria, Gamaproteobacteria, Saprospirae,
Actinobacteria, Actinobacteria-6 là 6 lớp phổ biến nhất. Đặc biệt, vi sinh vật thuộc lớp
Alphaproteobacteria chiếm số lượng cao hơn hẳn ở trong mẫu cà phê tái canh tốt. Đây
là lớp vi khuẩn gram âm bao gồm một số chi vi sinh vật có khả năng quang hợp,
chuyển hóa hợp chất C1 như Methylobacterium, cộng sinh như Rhizobium. Vi sinh vật
thuộc lớp Betaproteobacteria có khả năng chuyển hóa rất đa dạng, chẳng hạn như
Rhodocyclus có thể sử dụng được năng lượng mặt trời. Một số loài khác có thể sử
dụng các hợp chất vô cơ để tạo ra năng lượng, như Nitrosomonadales chuyển hóa
44
nitrat. Gammaproteobacteria bao gồm một số nhóm quan trọng như
Enterobacteriaceae, Vibrionaceae, và Pseudomonadaceae. Chúng tôi tiếp tục đánh giá
cấu trúc hệ vi khuẩn đất vùng rễ cà phê ở mức độ họ (Family) nhằm lựa chọn những
họ vi khuẩn phổ biến trong các mẫu đất.
Hình 3.8. Cấu trúc quần thể vi sinh vật ở mức độ lớp
Ở mức độ họ, chúng tôi xác định được 283 họ trên toàn bộ dữ liệu và chọn ra
13 họ có số lượng OUT lớn để phân tích (Hình 3.8). Từ biểu đồ 3.8 cho ta thấy họ
Sphingomonadaceae, Chitinnophagaceae, Xanthomonadaceae, Burkholderiaceae,
Chthonlobacteraceae chiếm số lượng lớn. Mặc dù số lượng họ vi sinh vật thu được là
đa dạng, nhưng số chi trong cùng một họ thì khác nhau, phụ thuộc vào từng mẫu.
45
Hình 3.9. Cấu trúc quần thể vi sinh vật ở mức độ họ
Trong nghiên cứu này, chúng tôi chỉ tập trung phân tích các họ các tác động đến
sinh trưởng, phát triển của thực vật và môi trường. Sphingomonadaceae là một họ
thuộc lớp Alphaproteobacteria có khả năng phân hủy một số hợp chất vòng thơm như
dioxin, vì thế nhóm khuẩn này được đặc biệt quan tâm trong các nghiên cứu nhằm
khắc phục ô nhiễm môi trường. Trong các mẫu phân tích của chúng tôi, vi sinh vật
thuộc họ Sphingomonadaceae có số lượng giảm gấp đôi trong mẫu nhiễm bệnh so với
các mẫu khác. Trong các mẫu cà phê tái canh tốt, số lượng các vi sinh vật thuộc họ
Chitinophagaceae vượt trội hẳn (75729 OTUs) so với mẫu tái canh bệnh (28549
OTUs). Họ Chitinophagaceaebao gồm một số loài có thể thủy phân chitin (thành phần
cấu tạo nên vỏ của tuyến trùng) như B. Chitinophaga pinensis, thủy phân
của cellulosenhư B. Chitinophaga oryziterrae. Điều này phần nào cho thấy hai họ
Sphingomonadaceae và Chitinophagaceae có thể tác động tốt đến sự sinh trưởng và
phát triển của cây cà phê.
Họ Xanthomonadaceae và Burkholderiaceae là hai họ có khả năng gây bệnh ở
thực vật cũng phát hiệnphổ biến trong các mẫu đất nghiên cứu, kể cả mẫu cà phê kinh
doanh năng suất cao.Xanthomonadaceae là nhóm vi khuẩn gây bệnh lớn nhất, bao gồm
các loài như Xanthomonas citri, Xanthomonas euvesicatoria, Xanthomonas oryzae và
46
Xylella fastidiosa. Các vi khuẩn này ảnh hưởng đến các cây trồng quan trọng trong
nông nghiệp bao gồm cà chua, chuối, cây có múi, gạo, và cà phê. Tuy nhiên tại mẫu tái
canh tốt 2 họ này chiếm một số lượng ưu thế điều này có thể liên quan đến vấn đề
tương tác giữa các hệ vi sinh vật mà chúng ta chưa biết tới, còn đối với nhóm cà phê
kinh doanh có năng suất cao hệ vi sinh vật tồn tại trong mẫu đã được ổn định nên số
lượng các loài vi sinh vật thuộc họ Xanthomonadaceae chiếm ưu thế hơn mẫu năng
suất trung bình.
Chúng tôi tiếp tục tiến hành phân tích cấu trúc, thành phần hệ vi khuẩn đất vùng
rễ cây cà phê ở mức độ chi (Genus).
3.5.3. Kết quả phân tích cấu trúc hệ vi khuẩn đất vùng rễ ở mức độ chi
Ở mức độ thấp hơn về mặt phân loại, nghiên cứu đã xác định được 438 chi trên
toàn bộ dữ liệu phân tích, và chọn ra một số chi quan trọng, được cho là có lợi hay hại
trên cây cà phê (Hình 3.10 và 3.11), để tập trung phân tích. Các nhóm có tỉ lệ phần
trăm thấp hơn 0,1% được phân vào các nhóm khác. Các trình tự còn lại được xếp
nhóm chưa được phân loại.
B
A
A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật mức độ chi có lợi trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật mức độ chi có lợi trong nhóm cà phê kinh doanh
Hình 3.10. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có lợi ở mức độ chi
Từ hình 3.10 cho thấy có 11 chi các vi sinh vật có lợi trong đất quanh vùng rễ
cây cà phê. Tuy nhiên số lượng loài trong các chi phụ thược vào kiểu cảnh tác và giai
đoạn phát triển của cây. Kết quả trong hình 3.9A cho thấy, chi Sphingobium ở mẫu cà
phê tái canh có số lượng cao gấp 8 lần so với mẫu cà phê tái canh nhiễm bệnh. Đây
làchi bao gồm các loài được biết là có khả năng phân huỷ một loạt các hóa chất gây
47
độc cho môi trường như các hợp chất thơm và clo, phenol như nonylphenol và
pentachlorophenol, thuốc diệt cỏ như (RS)-2-(4-chloro-2-methylphenoxy) propionic
acid và hexachlorocyclohexane, và hydrocacbon thơm đa vòng. Chi Chitinophaga
chiếm một số có khả năng phân hủy chitin (vỏ tuyến trùng) và cellulose đây là một chi
vi sinh vật đất có ảnh hưởng đến sinh trưởng của cây cà phê chúng có khả năng phân
hủy vỏ chitin của tuyến trùng trong đất. Chi Streptomyces được tìm thấy chủ yếu trong
đất và thảm thực vật mục nát. Streptomyces sinh bào tử, tạo mùi đặc trưng, là kết quả
từ sản sinh geosmin trong quá trình chuyển hóa các chất. Streptomyces được nghiên
cứu rộng rãi và được biết đến nhiều nhất là chi của họ xạ khuẩn (Actinomyces).
Streptomyces thường sống ở đất có vai trò là vi sinh vật phân hủy quan trọng. Chủng
vi sinh này sản xuất hơn một nửa số thuốc kháng sinh trên thế giới và đó là sản phẩm
có giá trị lớn trong lĩnh vực y tế, chính vì có khả năng sinh kháng sinh nên mẫu cà phê
tái canh khỏe mạnh phân tích được lượng Streptomyces gấp 9 lần so với mẫu cà phê tái
canh nhiễm bệnh.
Từ hình 3.10 B cho thấy các chi Sphingobium, Chitinophaga, Streptomyces
chiếm ưu thế hơn trong mẫu cà phê kinh doanh năng suất cao. Ngoài các chi đó ra ta
thấy Bacillus loài gần như phổ biến trong tự nhiên, ví dụ như trong đất, mà còn xảy ra
trong môi trường khắc nghiệt như pH cao ( B. alcalophilus), nhiệt độ cao ( B.
thermophilus ), hoặc muối cao ( B. halodurans ). B. thuringiensis tạo ra một độc tố có
thể giết côn trùng và do đó đã được sử dụng làm thuốc trừ sâu (Joan L. Slonczewski &
John W. Foster (2011), các loại vi sinh vật trên tồn tại trong đất, chúng có tác dụng lên
trên vật chủ giúp cây chủ tăng được sức đề kháng với các loại bệnh, nấm, côn trùng
hại. Chính vì vậy qua số liệu thu đư
Được nhận thấy trong nhóm cà phê kinh doanh năng suất cao có bacillus cao
gấp 3 lần so với nhóm cà phê kinh doanh có năng suất thấp.
48
B
A
A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi trong nhóm cà phê kinh doanh.
Hình 3.11. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ chi
Số lượng và phân bố của các chi có hại đối với sinh trưởng và phát triển của cây
cà phê được thế hiện trong hình 3.11 A và 3.11 B, trong đó chi Burkholderia có số
lượng lớn. Đặc biệt với nhóm tái canh bệnh, số lượng vi sinh vật cao gấp 13 lần so với
nhóm cà phê tái canh tốt.
3.5.4. Kết quả phân tích thành phần một số loài vi khuẩn đặc trưng của hệ vi
sinh vật đất vùng rễ cây cà phê.
Phân tích trên toàn bộ dữ liệu, chúng tôi xác định được sự có mặt của 155 loài
và chọn ra một số loài đặc trưng để phân tích (Hình 3.12 và 3.13)
A
B
A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài trong nhóm cà phê kinh doanh.
Hình 3.12. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có ích mức độ loài
Trong số các loài được phát hiện, S. wittichii chiếm số lượng ưu thế đặc biệt với
mẫu tái canh tốt có số lượng cao gấp 5 lần so với mẫu tái canh bệnh. Điều này cho
thấy S.wittichii có thể ảnh hưởng trực tiếp đến sự sinh trưởng và phát triển của cà phê.
Các loài S. wittichii là loài có khả năng phân hủy dioxin. Ngoài ra còn có các loài tạo
ra các chất khác nhau như G. fujikuroi sản xuất chất kích thích sinh trưởng thực vật, H.
49
ochraceum chuyển hóa kháng nấm và sinh kháng sinh; R. leguminosarum có khả năng
cố định đạm tự do.
A
B
A. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài trong nhóm cà phê tái canh. B. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài trong nhóm cà phê kinh doanh
Hình 3.13. Biểu đồ thể hiện cấu trúc quần thể vi sinh vật có hại mức độ loài
Trong số các loài phân tích, có 5 loài có thể gây bệnh trên cà phê và các loài
thực vật khác.Kết quả thể hiện ở Hình 3.13 cho thấy, có các loài gây hại cho thực vật
điển hình như R. solanacearum gây bệnh héo lá, Fastidiosa gây bệnh lá cháy,
Pseudomonas garcae gây bệnh đốm lá cà phê. Đối với nhóm cà phê tai canh bị bệnh
và năng suất thấp ta thấy sự có mặt của các loài Fastidiosa, Pseudomonas garcae và R.
solanacearum cao hơn các nhóm tái canh tốt cà năng suất cao. Điều này phần nào cho
thấy các chủng này phần nào tác động tới sự phát triển cũng như năng suất của cây cà
phê.
50
KẾT LUẬN VÀ KIẾN NGHỊ
1. Kết luận
- Xác định được 512.896 trình tự các đoạn V3 và V4 trên gen 16S rRNA,
trong đó 133,661 trình tự cho cà phê tái canh ít bị bệnh,124,574 trình tự cho cà phê
tái canh bị bệnh,122,816 trình tự cho cà phê kinh doanh năng suất cao và 131,845
trình tự cho cà phê kinh doanh năng trung bình.
- Kết quả phân tích metagenomic cho thấy chiến đa số là các vi sinh vật vùng
rễ cà phê thuộc ngành Proteobacteria, lớp Alphaproteobacteria, Betaproteobacteria,
Gamaproteobacteria, Saprospirae, Actinobacteria, Actinobacteria-6, họ
Sphingomonadaceae, Chitinnophagaceae, Xanthomonadaceae, Burkholderiaceae,
Chthonlobacteraceae, Streptomycetaceae (33,44%, 41,71%, 41,57% và 40,49% lần
lượt cho cà phê tái canh tốt, cà phê tái canh bệnh, cà phê kinh doanh năng suất cao và
cà phê kinh doanh năng suất trung bình)
- Chi Sphingobium thuộc họ Sphingomonadaceae, Chitinophaga thuộc họ
Chitinnophagaceae, Streptomyces thuộc họ Streptomycetaceae chiếm ứu thế trong
mẫu cà phê kinh doanh năng suất cao. Chi Burkholderia thuộc họ Burkholderiaceae
phổ biến trong vùng rễ nhóm cá phê tái canh bệnh (cao gấp 13 lần so với nhóm cà
phê tái canh tốt).
- Loài Sphingobium wittichii chiếm ưu thế trong rễ cà phê tái canh tốt (gấp 5
lần so với tái canh bệnh). Các loài gây bệnh điển hình trên cây cà phê như R.
solanacearum gây bệnh héo lá, Fastidiosa gây bệnh lá cháy, Pseudomonas garcae
gây bệnh đốm lá cà phê cũng phát hiện trong các vùng rễ khác nhau, đặc biệt ở vùng
tái canh bệnh.
2. Kiến nghị
Từ kết quả thu được có thể nghiên cứu hướng phát triển sử dụng các chế
phẩm sinh học làm tăng các vi sinh vật tự nhiên có lợi và giảm các vi sinh vật có hại,
trực tiếp hoặc gián tiếp lên sinh trưởng và phát triển của cây cà phê, nhằm mục tiêu
phát triển bền vững, tăng năng suất và chất lượng của cây cà phê Việt Nam.
Tiến hành tiệp tục nghiên cứu để đánh giá sự ảnh hưởng của hệ sinh vật tới khả
năng sinh trưởng và phát triển của cà phê.