ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Nguyễn Thị Thảo

NGHIÊN CỨU SÀNG LỌC GENE MÃ HÓA ENZYME THAM GIA THỦY PHÂN CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG RUỘT MỐI BẰNG KỸ THUẬT

METAGENOMICS

Chuyên ngành: Di truyền học

Mã số: 62420121

TÓM TẮT DỰ THẢO LUẬN ÁN TIẾN SĨ SINH HỌC

Hà Nội - 2014

1

Công trình đƣợc hoàn thành tại:

Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Trƣờng Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội

Ngƣời hƣớng dẫn khoa học:

1. GS. TS. Trƣơng Nam Hải

2. TS. Đỗ Thị Huyền

Phản biện:

1.

2.

3.

Dự thảo luận án sẽ đƣợc bảo vệ trƣớc Hội đồng cấp Đại học Quốc gia chấm

luận án tiến sĩ họp tại Trƣờng Đại học Khoa học Tự nhiên

vào hồi giờ ngày tháng năm

Có thể tìm hiểu luận án tại:

- Thƣ viện Quốc gia Hà Nội

- Trung tâm thông tin – Thƣ viện, Đại học quốc gia Hà Nội

2

MỞ ĐẦU

1. Tính cấp thiết của đề tài

Cellulase là nhóm enzyme đƣợc sử dụng phổ biến trong các ngành công nghiệp nhƣ

chế biến thực phẩm, chế biến thức ăn, sản xuất giấy, sản xuất rƣợu, sản xuất bia, công nghệ

dệt…. Đặc biệt, cellulase đang đƣợc quan tâm nghiên cứu ứng dụng trong sản xuất nhiên

liệu sinh học nhƣ cồn sinh học từ nguồn phế phẩm lignocellulose dồi dào thay thế cho

nguồn nhiên liệu hóa thạch đang trên đà cạn kiệt. Trong vòng 25 năm qua, sản lƣợng cồn

sinh học đã tăng trƣởng và đạt mức nhảy vọt kể từ năm 2000. Cồn sinh học có thể đƣợc

dùng nhƣ nguồn nhiên liệu độc lập cho các loại xe có động cơ chuyên biệt hoặc làm phụ gia

nhiên liệu cho loại xe có động cơ truyền thống với tỉ lệ lên đến 30%. Ở nƣớc ta, ƣớc tính hàng

năm, nguồn nguyên liệu lignocellulose từ phế phẩm nông nghiệp nhƣ rơm, rạ, lá mía và bã

cây mía bỏ phí lên đến 50 triệu tấn. Các biện pháp xử lý nguồn phế phẩm này chủ yếu là

đốt đã gây ra những ảnh hƣởng tiêu cực đến môi trƣờng sống và sức khoẻ con ngƣời. Việc

tận dụng đƣợc nguồn nguyên vật liệu lignocellulose phế phẩm này vào sản xuất cồn sinh

học sẽ đem đến nhiều lợi ích to lớn cho môi trƣờng cũng nhƣ cho nền kinh tế của nƣớc ta.

Việc sử dụng cellulase thay thế các hoá chất truyền thống nhƣ acid, kiềm và nhiệt

độ cao vào trong quá trình sản xuất của các ngành công nghiệp đã giải quyết đƣợc nhiều

vấn đề nhƣ hạn chế ô nhiễm môi trƣờng và bảo vệ đƣợc sức khoẻ ngƣời lao động cũng nhƣ

tăng hiệu quả sản xuất. Tuy nhiên, vấn đề đặt ra là cần thiết phải có đƣợc nguồn cellulase

hoạt động ở điều kiện pH và nhiệt độ thích hợp cho các quá trình sản xuất đó. Hơn nữa,

việc sản xuất cồn sinh học đang gặp một số khó khăn trong việc giảm chi phí sản xuất đặc

biệt là nguồn cellulase để phân cắt cellulose thành glucose hiệu quả. Do đó, vấn đề quan

trọng nhất là tìm ra đƣợc nguồn cellulase mới phù hợp với điều kiện sản xuất của các

ngành công nghiệp liên quan, phát triển các phức hợp cellulase hiệu quả và ổn định để

khắc phục khó khăn trong quá trình sản xuất.

Metagenomics là kỹ thuật cho phép thu nhận trực tiếp DNA đa hệ gene của toàn bộ

các vi sinh vật trong môi trƣờng sống nhất định. Chính vì lợi thế là thu nhận và phân tích

đƣợc tất cả hệ gene của vi sinh vật phong phú và đa dạng, đặc biết là 99% vi sinh vật

không nuôi cấy đƣợc mà Metagenomics trở thành công cụ giúp các nhà nghiên cứu khai

thác nguồn gene mới hiệu quả nhất. Thực tế đã chứng minh, sau 20 năm phát triển, đặc biệt

là khoảng 5 năm gần đây, khi kỹ thuật giải mã gene thế hệ mới đƣợc áp dụng,

Metagenomics đã đƣợc sử dụng rất hiệu quả để tìm hiểu sự đa dạng vi sinh vật cũng nhƣ

3

khai thác các gene mới từ nhiều môi trƣờng sống khác nhau nhƣ nƣớc, đất, các đƣờng tiêu

hóa, phế thải, …

Mối đóng một vai trò quan trọng đối với hệ sinh thái bởi khả năng phân hủy sinh

khối lignocellulose và góp phần vào chu trình carbon. Khả năng phân hủy hiệu quả

lignocellulose của mối là kết quả hoạt động tổng hợp của các enzyme cellulase và

hemicellulase đƣợc tiết ra từ bản thân mối và từ vi sinh vật sống cộng sinh trong ruột mối.

Trong đó, hệ vi sinh vật cộng sinh trong ruột mối đóng vai trò quan trọng trong việc tiêu

hóa hiệu quả nguồn thức ăn lignocellulose của mối. Vì vậy, ruột mối là một nguồn gene

cellulase phong phú cần đƣợc khai thác nhằm tìm ra các enzyme mới liên quan đến sự

phân hủy cellulose.

Ở Việt Nam cho đến nay đã tìm thấy hơn 100 loài mối khác nhau. Tuy nhiên, hệ vi

sinh vật của các loài mối ở Việt Nam vẫn chƣa đƣợc nghiên cứu vì thế toàn bộ hệ enzyme

thủy phân lignocellulose có nguồn gốc từ vi sinh vật cộng sinh trong ruột mối cũng chƣa

đƣợc điều tra và khảo sát. Với đặc điểm đặc trƣng của quần xã vi sinh vật sống cộng sinh

trong ruột mối và vai trò của chúng giúp vật chủ phân hủy thức ăn, quần xã vi sinh vật ở

mối bậc thấp đƣợc xem là nguồn khai thác gene cellulase mới lý tƣởng sử dụng trong quá

trình thủy phân cellusose. Do đó, để nghiên cứu hệ vi sinh vật ruột mối và khai thác gene

mới mã hóa cellulase từ hệ vi sinh vật tƣơng ứng sống cộng sinh trong ruột hiệu quả,

chúng tôi đã tiến hành đề tài “Nghiên cứu sàng lọc gene mã hoá enzyme tham gia thủy

phân cellulose từ khu hệ vi sinh vật trong ruột mối bằng kỹ thuật Metagenomics”.

2. Mục tiêu của đề tài

1. Đánh giá đƣợc sự đa dạng vi sinh vật ruột mối và đa dạng gene mã hoá cellulase

của chúng.

2. Phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá cellulase từ DNA đa gene

vi sinh vật ruột mối.

3. Xác định đƣợc ảnh hƣởng của một số điều kiện đến hoạt động của protein do gene

tách dòng đƣợc mã hoá.

3. Đối tƣợng và phạm vi nghiên cứu

Nghiên cứu đƣợc tiến hành trên đối tƣợng là vi sinh vật ruột mối thợ Coptotermes

thu thập ở miền Bắc Việt Nam.

4. Nội dung nghiên cứu

1. Xác định đối tƣợng để tách lấy DNA đa hệ gen của vi sinh vật và định danh đối

tƣợng.

4

2. Xây dựng phƣơng pháp để tách chiết và tinh sạch DNA đa hệ gene.

3. Giải trình tự và xử lý trình tự DNA đa hệ gene.

4. Dự đoán gene theo hai khía cạnh là đa dạng vi sinh vật và đa dạng gene từ bộ

dữ liệu trình tự DNA đa hệ gene.

5. Chọn một trình tự gene để thiết mồi, phân lập, tách dòng và biểu hiện.

6. Xác định đặc điểm của sản phẩm biểu hiện gene phân lập đƣợc.

1. Ý nghĩa khoa học và thực tiễn của đề tài

Ý nghĩa khoa học

1. Đã định loại đƣợc một loài mối bậc thấp Coptotermes gestroi thu thập ở sáu địa

điểm tại Hà Nội và Hƣng Yên bằng phƣơng pháp phân tử.

2. Đã đánh giá đƣợc sự đa dạng vi sinh vật và đa đạng gene cellulase của vi khuẩn

sống trong ruột mối C. gestroi.

Ý nghĩa thực tiễn

3. Đã phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá endoglucanase. Đây

là enzyme đƣợc ứng dụng rộng rãi trong nhiều ngành công nghiệp.

4. Đóng góp mới của đề tài

1. Đây là nghiên cứu đầu tiên về sự đa dạng vi sinh vật ruột mối bậc thấp C.

gestroi cũng nhƣ đa dạng gen cellulase của chúng.

2. Trình tự của gen đã phân lập, tách dòng và biểu hiện đƣợc có độ sai khác so với

trình tự gene tƣơng ứng của các cơ sở dữ liệu.

5. Bố cục của luận án

Luận án gồm 151 trang bao gồm: phần mở đầu 3 trang; chƣơng 1: tổng quan tài liệu 37

trang; chƣơng 2: đối tƣợng và phƣơng pháp nghiên cứu 22 trang; chƣơng 3: kết quả và

thảo luận 58 trang; kết luận và kiến nghị 2 trang. Các công trình khoa học của tác giả 1

trang. Tài liệu tham khảo 19 trang. Trong luận án có 19 bảng và 62 hình.

Chƣơng 1. TỔNG QUAN TÀI LIỆU

1.1. GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE

Nêu đại cƣơng về đặc điểm cấu trúc chung của ba thành phần chính cấu tạo nên

lignocellulose là cellulose, hemicellulose và lignin.

1.2. GIỚI THIỆU CHUNG VỀ CELLULASE

Nêu tổng quan về cơ chế hoạt động của cellulase và sự thủy phân cellulose. Cấu

trúc của cellulase.

5

1.3. CELLULASE CỦA VI KHUẨN

Nêu tổng quan về các họ cellulase, đặc biệt các loài vi khuẩn và vi khuẩn cổ tạo ra

cellulase. Đồng thời đặc điểm về nhiệt độ, pH và kích thƣớc cellulase của các vi khuẩn

đƣợc đƣa ra cụ thể. Ngoài ra, phần này còn nêu một số ứng dụng nổi bật của cellulase.

1.4. MỐI VÀ HỆ VI SINH VẬT RUỘT MỐI LIÊN QUAN ĐẾN SỰ THỦY PHÂN

LIGNOCELLULOSE

Sơ lƣợc về mối và đa dạng mối ở Việt Nam. Nêu tổng quan hệ vi sinh vật trong ruột mối bậc thấp và sự tiêu hóa lignocellulose của mối. Khái quát tính hình nghiên cứu

gene mã hóa cellulase của sinh vật trong đƣờng ruột mối bậc thấp

1.5. KHÁI QUÁT CHUNG VỀ METAGENOMICS

Nếu khái quát: phƣơng pháp tiếp cận tìm gene mới bằng Metagenomics, các nghiên cứu phân lập gene từ thƣ viện DNA đa hệ gene và hơn phƣơng pháp khai thác và phân lập

gene từ dữ liệu trình tự DNA đa hệ gene. Nêu rõ phƣơng pháp giải trình tự của một số hệ thống máy thế hệ mới. Đặc biệt, đƣa ra các nghiên cứu ứng dụng của Metagenomics trong

khai thác gene mới và đánh giá sự đa dạng vi sinh vật. Ngoài ra tiềm năng ứng dụng của Metagenomics cũng đƣợc đề cập.

Chƣơng 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU

2.1. ĐỐI TƢỢNG, VẬT LIỆU, HÓA CHẤT VÀ THIỆT BỊ MÁY MÓC

Trong nghiên cứu này, chúng tôi đã sử dụng đối tượng là vi sinh vật ruột mối thuộc chi Coptotermes do Viện Sinh thái và Bảo vệ công trình cung cấp; các chủng vi sinh vật

dùng làm thể nhận trong thí nghiệm tách dòng gene và làm thể nhận biểu hiện gene; plasmid sử dụng để tách dòng và biểu hiện gene; các cặp mồi PCR.

Các loại hóa chất sử dụng trong nghiên cứu đều đƣợc đặt mua từ các công ty đạt

tiêu chuẩn quốc tế nhƣ Bio-Lab (Mỹ), Fermentas (Mỹ), Sigma (Mỹ), Merck (Đức).

2.2. PHƢƠNG PHÁP NGHIÊN CỨU

2.2.1. Các phƣơng pháp vi sinh

2.2.2. Các phƣơng pháp sinh học phân tử 2.2.2.1. Tách chiết DNA tổng số của mối

2.2.2.2. Phƣơng pháp thu nhận vi sinh vật ruột mối và tách chiết DNA đa hệ gene của chúng 2.2.2.3. Tinh sạch DNA đa hệ gene bằng phƣơng pháp máng đơn (troughing)

2.2.2.4. Giải trình tự DNA đa hệ gene hiệu năng cao bằng máy giải trình tự thế hệ mới HiSeq2000 của Illumina

6

2.2.2.5. Phƣơng pháp biến nạp bằng sốc nhiệt DNA plasmid vào vi khuẩn E. coli 2.2.2.6. Phƣơng pháp tách chiết DNA plasmid từ tế bào vi khuẩn E. coli

2.2.2.7. Phƣơng pháp cắt và ghép nối gene 2.2.2.8. Phƣơng pháp tinh sạch DNA từ gel agarose bằng QIAquick Gel Extraction kit

2.2.2.9. Kỹ thuật PCR 2.2.2.10. Thiết kế vector biểu hiện pET22b(+) mang gene egc

2.2.2.11. Điện di DNA trên gel agarose 2.2.2.12. Phƣơng pháp biểu hiện gene

2.2.2.13. Điện di biến tính protein trên gel polyacrylamide-SDS 2.2.2.14. Điện di protein trên gel polyacrylamide không SDS

2.2.3. Các phƣơng pháp hóa sinh protein 2.2.3.1. Phƣơng pháp tinh sạch protein bằng sắc kí ái lực his-tag

2.2.3.2. Định lƣợng protein bằng phƣơng pháp Bradford 2.2.3.3. Định lƣợng đƣờng khử bằng phƣơng pháp DNS 2.2.3.4. Phƣơng pháp xác định hoạt tính endoglucanase 2.2.3.5. Phƣơng pháp xác định hoạt tính β-glucosidase và β-xylosidase

2.2.3.6. Xác định ảnh hƣởng của nhiệt độ, pH, các ion kim loại và một số hóa chất lên hoạt tính endoglucanase

2.2.3.7. Xác định độ bền của enzyme

2.2.4. Các phƣơng pháp tin sinh học và xử lý số liệu bằng phần mềm sinh học 2.2.4.1. Phân tích trình tự DNA đa hệ gene vi sinh vật ruột mối 2.2.4.2. So sánh trình tự ORF của dữ liệu DNA đa hệ gene với CSDL của NCBI

2.2.4.3. Thiết kế mồi bằng phần mềm FastPCR 2.2.4.4. Kiểm tra vị trí của các enzyme hạn chế trên gene quan tâm bằng phần mềm trực

tuyến RestrictionMapper 2.2.4.5. Chuyển mã trình tự DNA sang trình tự amino acid bằng chƣơng trình dịch mã

ExPASy 2.2.4.6. Xây dựng cây chủng loài của loài mối nghiên cứu với các loài mối khác bằng phần

mềm Genedoc và MEGA5 2.2.4.7. Dự đoán cấu trúc của EGC bằng phần mềm Phyre2

2.2.4.8. Xác định độ tinh sạch của protein EGC tinh sạch đƣợc bằng phần mềm Quantity One

Chƣơng 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. THU THẬP MỐI

3.1.1. Thu thập mối

Từ tháng 4 đến tháng 6 năm 2012, sáu tổ mối đƣợc thu thập ở sáu địa điểm khác

nhau. Các tổ mối thu đƣợc ghi rõ địa điểm, sắp xếp vào các hộp đựng mẫu. Năm địa điểm

7

thu đƣợc mối tại Hà Nội là Văn Quán, Hà Đông; Tản Lĩnh, Ba Vì; Bùi Xƣờng Trạch, Đống Đa; Thái Hà, Đống Đa; Võng Thị, Tây Hồ và một địa điểm tại tỉnh Văn Lâm, Hƣng

Yên. Trong tổ thu đƣợc có hai đẳng cấp là mối lính và mối thợ. Mối lính thực hiện chức năng bảo vệ. Còn mối thợ thực hiện chức năng tìm kiếm và dự trữ thức ăn. Chính vì mối

thợ có vai trò then chốt trong tìm kiếm và tiêu hoá thức ăn, dó đó chúng là đối tƣợng quan trọng đƣợc lựa chọn để tách lấy vi sinh vật đƣờng ruột.

Mối của sáu tổ đều ăn gỗ và có hình dạng bên ngoài giống nhau. Dựa vào hình thái, rất ngẫu nhiên, cả sáu mẫu mối đƣợc các nhà nghiên cứu thuộc Viện Sinh thái và Bảo vệ

công trình đã định loại ở bậc giống đều là Coptotermes.

3.1.2. Kết quả định loài mối nghiên cứu bằng phƣơng pháp phân tử

3.1.2.1. Tách DNA tổng số của mối

Để xác định loài mối bằng phƣơng pháp phân tử, trƣớc hết, chúng tôi tiến hành tách

chiết DNA tổng số của mối. DNA tổng số mối của cả sáu mẫu thu thập ở sáu địa điểm tách chiết đƣợc đều nguyên vẹn và có kích thƣớc lớn hơn 10 kb. Mẫu DNA này sẽ đƣợc sử

dụng trực tiếp làm khuôn để khuếch đại đoạn gene ARN ribosome16S (rARN 16S) ti thể.

3.1.2.2. PCR khuếch đại đoạn DNA của gene ARN ribosome 16S ti thể mối

bp TH VT BXT VL M VQ TL

1000

Sản phẩm PCR của cặp mồi thứ nhất

500 400

Sản phẩm PCR của cặp mồi thứ hai

100

Hình 3.1. Điện di đồ hỗn hợp sản phẩm PCR khuếch đại các đoạn gene mã hóa rARN 16S ti

thể mối bằng hai cặp mồi LR-J-13007, LR-N-13398 và FST-F, FST-R từ khuôn DNA tổng số của mối Coptotermes trên gel agarose 1,7%. ĐC M: Thang chuẩn 100 bp (Fermentas); các ĐC TH, VT,

BXT, VL, VQ và TL tương ứng là sản phẩm PCR từ khuôn là DNA hệ gene mối thu thập ở Thái Hà, Võng Thị, Bùi Xương Trạch, Văn Lâm, Văn Quán và Tản Lĩnh.

Hai cặp mồi gồm cặp thứ nhất là LR-J-13007, LR-N-13398 và cặp thứ hai là FST-

F, FST-R đƣợc sử dụng để khuếch đại hai đoạn DNA của gene mã hóa RNA ribosome ti thể mối. Kết quả là ở 54oC, cặp mồi thứ nhất đã khuếch đại hiệu quả đoạn DNA duy nhất

đậm nét, kích thƣớc lớn hơn 400 bp và bé hơn 500 bp từ DNA tổng số của cả sáu mẫu mối.

8

Tuy nhiên, chỉ ở 57oC, cặp mồi thứ hai mới khuếch đại đƣợc một băng DNA duy nhất kích

thƣớc lớn hơn 100 bp từ hai mẫu khuôn DNA tổng số thu thập ở Văn Quán và Tản Lĩnh,

còn bốn mẫu DNA còn lại không có đoạn DNA nào đƣợc khuếch đại (Hình 3.1). Tất cả

các đoạn DNA khuếch đại đƣợc đều đƣợc đọc và phân tích trình tự nucleotide.

3.1.2.3. Phân tích sản phẩm PCR

Phân tích trình tự nucleotide đoạn DNA được khuếch đại bằng cặp mồi thứ nhất

Trình tự nucleotide của sáu đoạn DNA khuếch đại bằng cặp mồi thứ nhất đƣợc sắp

xếp và so sánh với nhau đã thể hiện rằng tất cả các trình tự đều tƣơng đồng với nhau trong

vùng 430 bp và không có sự khác nhau giữa ba mẫu mối thu thập ở Võng Thị, Văn Lâm và

Bùi Xƣơng Trạch. Tuy nhiên, giữa hai mẫu mối Văn Quán và Thái Hà khác với các nhóm

khác từ 0,5-0,9%; mẫu mối Tản Lĩnh khác với các mẫu mối khác từ 0,5-1,5% (Bảng 3.1).

Đồng thời, mức độ tƣơng đồng trình tự nucleotide của sáu đoạn DNA trên cũng đƣợc so

sánh với các trình tự tƣơng ứng của NCBI bằng BlastN. Kết quả cho thấy có sự giống nhau

rất cao (97-99%) giữa sáu trình tự nghiên cứu với các trình tự tƣơng ứng của C. gestroi

(Bảng 3.2). Để xác định rõ hơn mỗi quan hệ giữa mối Coptotermes nghiên cứu và các loài

thuộc giống này, cây phát sinh loài đƣợc thiết lập bằng phần mềm MEGA5 (Hình 3.2) dựa

vào trình tự vùng 430 bp cùng với 21 trình tự (giống từ 92-99%) của gene tƣơng ứng mã

hoá rARN 16S của các loài mối thuộc giống Coptotermes. Kết quả cho thấy tất cả sáu mẫu

mối thu tại sáu địa điểm nằm hoàn toàn trong nhánh tiến hóa của C. gestroi.

Phân tích trình tự nucelotide đoạn DNA được khuếch đại bằng cặp mồi thứ hai

Hai trình tự nghiên cứu chỉ khác nhau 1 nucleotide duy nhất. Kết quả so sánh mức

giống nhau của hai trình tự nghiên cứu với các trình tự tƣơng ứng của NCBI bằng Blastn

cho thấy, mức giống nhau thể hiện cao nhất (99-100%) đối với các trình tự của

Coptotermes gestroi. (Bảng 3.3). Đồng thời, các trình tự tƣơng ứng trên ngân hàng gene có

mức giống nhau từ 95-100 % so với hai trình tự nghiên cứu và xây dựng cây phát sinh loài

bằng phần mềm MEGA5 thể hiện mỗi quan hệ giữa hai mẫu mối nghiên cứu và các loài

mối thuộc giống Coptotermes. Giống với kết quả phân tích trình tự đoạn 430 bp, cây phát

sinh loài cũng cho thấy hai mẫu mối nghiên cứu nằm hoàn toàn trong nhánh tiến hóa của

C. gestroi.

Nhƣ vậy, những kết quả phân tích trên đã chứng minh đầy đủ và chắc chắn rằng, ở

mức độ phân tử, sáu mẫu mối nghiên cứu thu thập ở sáu địa điểm đều thuộc loài

Coptotermes gestroi.

9

C. gestroi

C. carvinatus

C. kalshoveni

C. lacteus

C. formosanus

C. intermedius

C. crassus

C. vastator

Hình 3.2. Cây phát sinh loài giữa loài mối nghiên cứu và 21 loài khác được xây dựng dựa

trên các trình tự có mức độ giống cao nhất với đoạn DNA kích thước 430 bp được khuếch lại bằng

cặp mồi LR-J-13007 và LR-N-13398.

Bảng 3.1. Tỷ lệ giống nhau và khác nhau về trình tự nucleotide giữa các vùng 430 bp gene

rARN ti thể mối Coptotermes thu thập từ 6 địa điểm.

Tỷ lệ giống nhau (%)

BXT VQ VL TL TH VT

BXT 4 0 2 2 0

VQ 99,1 4 6 2 4

TL 99,5 98,5 99,5 4 2

TH 99,5 99,5 99,5 99,1 2

VT 100 99,1 100 99,5 99,5

VL 100 99,1 2 2 0

Số nucleotide khác nhau

10

BXT: Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị

Bảng 3.2: Mức độ giống nhau vùng trình tự 430 bp gene rARN 16S của sáu mẫu mối

Coptotermes với trình tự tương ứng của cơ sở dữ liệu NCBI.

Mức độ giống nhau (%)

Loài

Mã số gene

Địa điểm

C. formosanus C. formosanus C. formosanus C. gestroi CgA2

BXT 93 94 93 98

VL 93 94 93 98

TL 93 93 93 97

TH VQ VT 93 93 94 94 94 94 93 93 93 98 97 98

AB626145 AY558911 U17778 DQ004487

Antigua

C. gestroi

99

99

98

99

98

99

AY558905

C. gestroi

98

98

98

98

98

98

AY558906

Nhật Bản Trung Quốc Hoa Kỳ Australia Đảo Barbuda Quần đảo Turk và Caico Singapore Hoa Kỳ

C. gestroi CgS3 C. gestroi CgF2 C. kalshoveni C. lacteus C. vastator

DQ004478 EF156760 AY683211 Malaysia Australia AY558912 Hoa Kỳ AY558898

99 98 95 93 93

99 98 95 93 93

99 98 94 92 92

99 98 95 93 93

99 98 94 93 93

99 98 95 93 92

(BXT: Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị).

3.2. TÁCH CHIẾT VÀ TINH SẠCH DNA ĐA HỆ GENE VI SINH VẬT SỐNG TRONG RUỘT MỐI

Toàn bộ ruột mối thợ gồm ruột trƣớc, ruột giữa và ruột sau đều đƣợc tách lấy. Sau đó, DNA đa hệ gene của hệ vi sinh vật ruột mối đƣợc tách lấy và tinh sạch. Kết quả cho thấy sản phẩm tinh chế chỉ còn một băng DNA đa hệ gene duy nhất đậm nét có kích thƣớc lơn hơn 10 kb (Hình 3.3).

M 1 kb

DNA đa hệ gen

10

Hình 3.3. Điện di đồ DNA đa hệ gene của hệ vi

sinh vật ruột mối Coptotermes gestroi trên gel agarose

0,8%. ĐC M: Thang chuẩn 1 kb (Fermentas); ĐC 1:

DNA đa hệ gene được tinh chế bằng phương pháp Máng đơn.

Để có đủ lƣợng DNA cần thiết cho việc nghiên cứu, chúng tôi đã tách chiết DNA đa hệ gene vi sinh vật từ khoảng 1.000.000 ruột mối thợ Coptotermes gestroi của sáu mẫu mối thu thập ở sáu địa điểm và thu đƣợc gần 11 µg DNA đa hệ gene sạch có nồng độ 114 ng/µl và OD260/280 đạt 1,83. Trong đó, 8,5 µg DNA đa hệ gene đƣợc đọc trình tự.

11

3.3. ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GENE VI SINH VẬT RUỘT MỐI Coptotermes

3.3.1. Tập hợp trình tự và xác định gene

Trình tự DNA đa hệ gene vi sinh vật ruột mối C. gestroi đƣợc đọc bằng máy giải trình tự

HiSeq 2000 của Illumina. Dữ liệu gồm các read tốt có tổng kích thƣớc là 5,4 Gb. Những read tốt này đƣợc sử dụng để tập hợp thành các contig có kích thƣớc dài hơn bằng phần mềm

SOAPdenovo. Với k = 41, phần mềm đã lắp ráp tất cả các read thành các contig tối ƣu nhất gồm số lƣợng contig nhiều nhất 79.262 contig có tổng chiều dài dài nhất khoảng 90,1 Mb,

kích thƣớc contig dài nhất là 183.853 bp và kích thƣớc contig ngắn nhất là 500 bp. Từ 79.262 contig, phần mềm MetaGeneAnnotator đã dự đoán đƣợc 125.431 ORF.

3.3.2. Đa dạng vi sinh vật ruột mối C. gestroi

Trên cơ sở bộ dữ liệu trình tự DNA đa hệ gene, mức độ đa dạng vi sinh vật ruột

mối C. gestroi đƣợc đánh giá dựa theo hai cách:

Thứ nhất, các read chất lƣợng cao đƣợc so sánh với các trình tự của CSDL. Trong số đó, 34,07% các read giống với gene vi khuẩn, 0,032% giống với gene của nấm, 3,79% giống với gene vi sinh vật đƣờng ruột ngƣời và 0,189% giống với trình tự của RDP. Tổng số read có trình tự giống với CSDL là 206.742.13. Trong đó, tổng số read có trình tự giống với CSDL của vi khuẩn là 186.147.74. Do đó, nếu chỉ xét riêng các read có trình tự tƣơng đồng với các CSDL thì số read của vi khuẩn chiếm 90% và chỉ một tỷ lệ nhỏ (< 1%) là của nấm.

Thứ hai, tất cả các ORF đƣợc phần mềm MEGAN (MEtaGeneomic ANalyser) phân tích dựa vào CSDL NR. Kết quả cho thấy 80% ORF thuộc vi khuẩn, 0,42% thuộc vi khuẩn cổ, 0,58% thuộc eukaryote, một tỷ lệ nhỏ thuộc vi rút (0,20%) và còn lại 18,79% là các ORF không dự đoán đƣợc. Từ dữ liệu, tổng số 1.460 loài vi sinh vật đƣợc xác định có mặt trong ruột mối C. gestroi, trong đó, vi khuẩn có độ đa dạng cao nhất, với 1.368 loài (chiếm tới 93,7% tổng số loài đƣợc dự đoán) (Bảng 3.3) thuộc 628 chi, 217 họ, 97 bộ, 41 lớp và 22 ngành.

Bảng 3.3. Đa dạng vi sinh vật ruột mối C. gestroi được dự đoán bằng MEGAN dựa vào

CSDL NR (non-redundant database) của NCBI.

Ngành

Lớp

Bộ

Chi

Loài Số gene

Tỷ lệ (%)

Họ

Vi khuẩn

22

41

97

628

1368

100340

80

217

Vi khuẩn cổ

4

10

15

47

61

533

0,42

21

Eukaryota

20

14

25

43

24

731

0,58

33

Vi rút

-

-

1

13

7

249

0,2

11

23570

18,79

Không dự đoán được

Tổng số

46

65

138

282

731

1460

125423

100

12

Trong số 22 ngành vi khuẩn đƣợc dự đoán có 7 ngành chiếm ƣu thế nhất gồm

Firmicutes, Proteobacteria, Spirochaetes, Bacteroidetes, Synergistetes, Planctomycetes và

Actinobacteria. Số ORF của các loài thuộc các ngành này chiếm đến 57,72% (Bảng 3.4)

tổng số ORF vi khuẩn dự đoán đƣợc..

Bảng 3.4. Đa dạng loài 7 ngành vi khuẩn chiếm ưu thể nhất sống trong ruột mối C. gestroi

Loài

Tỷ lệ có mặt (%)

Ngành

Lớp

Bộ

Họ

Chi

Firmicutes

4

8

40

126

429

22,48

Proteobacteria

6

41

84

260

490

17,84

Spirochaetes

1

1

3

8

34

17,4

Bacteroidetes

4

5

13

67

159

11,6

Synergistetes

1

1

1

9

11

4,27

Planctomycetes

2

3

3

9

10

1,14

1

5

37

72

135

0,48

Actinobacteria

Ở bậc phân loại bộ, trong số 97 bộ vi khuẩn dự đoán đƣợc có 12 bộ chiếm ƣu thế nhất thể hiện ở hình (Hình 3.5). Trong đó, chỉ có bộ Pseudomonades không thuộc 7 ngành

22.48

17.84 17.4

chiếm ƣu thể, còn lại đều thuộc 7 ngành chiếm ƣu thế trên.

)

%

11.6

(

l

ỷ T

4.27

1.14 0.48

25 20 15 10 5 0

Ngành vi khuẩn

Hình 3.4. Bảy ngành vi khuẩn chiếm ưu thế nhất có mặt trong ruột mối C.gestroi nghiên cứu

Trong đó, Clostridiales, Actinobacteria, Bacillales, Enterobacteriales, Bacillales, Pseudomonades và Bacteroidales là những bộ có các loài phổ biến có khả năng phân huỷ

cellulose, nhƣ Ruminococcus albus (62 ORF), Ruminococcus flavefaciens (40 ORF), Acetivibrio cellulolyticus (85 ORF), Pseudomonas fluorescens (1258 ORF).

Xét bậc phân loại chi, Treponema là chi thuộc bộ Spirochaetales chiếm ƣu thế nhất (chiếm đến 91,2% bộ, 15% tổng số vi khuẩn xác định đƣợc). Chi chiếm ƣu thế thứ hai là

Lactococcus (thuộc bộ Lactobacillales) chiếm 7,8%, tiếp đến là Pseudomonas (thuộc bộ Pseudomonades) chiếm 4,6% tổng số vi khuẩn có mặt trong mẫu ruột mối thu thập đƣợc.

13

Ngoài ra còn có năm chi cũng chiếm ƣu thế là Pseudomonas (5823 ORF), Enterobacter (3412 ORF), Dysgonomonas (2984 ORF), Clostridium (2968 ORF) và Bacteroides (2414

ORF). Những trình tự của tám chi ƣu thế nhất này chiếm đến 51,36% so với tổng tất cả các chi dự đoán đƣợc. Trong đó, Clostridium và Bacteroides là hai chi có rất nhiều loài phổ

biến có khả năng phân hủy cellulose. Trong dữ liệu cũng chỉ ra nhiều loài thuộc hai bộ có khả năng phân huỷ cellulose nhƣ C. acetobutylicum (32 ORF), C. cellulolyticum (40 ORF),

21825

13063 11995

9951 8438

5861

C. cellulovorans (46 ORF), C. papyrosolvens (53 ORF), B.cellulosilyticus (156 ORF).

F R O g n ợ ư

3685

l

2009 1740 1629 1470 410

ố S

25000 20000 15000 10000 5000 0

Bộ vi khuẩn

Hình 3.5. Mười hai bộ vi khuẩn chiếm ưu thế nhất trong ruột mối Coptotermes gestroi. ORF

được chú thích dựa vào CSDL NR.

3.4. GENE MÃ HOÁ ENZYME THUỶ PHÂN CELLULOSE CỦA VI SINH VẬT RUỘT MỐI

Coptotermes gestroi

3.4.1. Chú thích chức năng của DNA đa hệ gene

Toàn bộ các trình tự amino acid tƣơng ứng của 125.431 ORF trong dữ liệu DNA đa hệ gene vi sinh vật ruột mối C. gestroi đƣợc chú thích bằng Blastp dựa vào CSDL eggNOG, COG và KEGG. Các ORF này đƣợc chú thích chức năng sâu hơn dựa trên

CSDL COG và KEGG. Dựa vào COG, 7.428 ORF đƣợc chú thích liên quan đến quá trình chuyển hóa carbohydrate gồm 210 nhóm COG. Trong đó, 518 ORF thuộc các nhóm

COG1472, COG2723, COG1904, COG3459, COG1486, COG1363, COG2730, COG2273, COG3405 liên quan trực tiếp đến sự phân hủy cellulose. Dựa vào KEGG, kết

quả chú thích cũng thể hiện các ORF liên quan đến các con đƣờng chuyển hóa carbohydrate chiếm tỷ lệ cao 12,28% (12.763/103.918 ORF) và cao hơn rất nhiều so với

kết quả dự đoán dựa vào CSDL KOG. Trong đó, 587 ORF mã hóa enzyme phân hủy lignocellulose gồm 316 ORF cellulase, 259 ORF hemicellulase và 12 ORF còn lại mã hóa

pectatelyase và pectinesterase .

14

3.4.2. Gene mã hóa enzyme phân hủy cellulose

Toàn bộ 316 ORF đƣợc chú thích (dựa vào CSDL KEGG) thuộc 11 họ GH khác

nhau liên quan trực tiếp đến sự thủy phân cellulose thể hiện tám chức năng 6-phospho-β- glucosidase, licheninase, glucan endo-1,3-β-D-glucosidase, endoglucanase, cellulose 1,4-

β-cellobiosidase, glucan 1,3- β-glucosidase và cellobiose phosphorylase (Bảng 3.5).

Bảng 3.5. Các ORF mã hóa cellulase của vi sinh vật sống trong ruột C. gestroi.

ORF hoàn

ORF thiếu

ORF thiếu

ORRF thiếu

STT Mã EC

Enzyme

Tổng số

thiện

đầu 5’

đầu 3’

cả 2 đầu

1 3.2.1.86

19

20

15

6

60

6-phospho-β- glucosidase

2 3.2.1.21 β-glucosidase

29

40

55

87

211

cellobiose

3 2.4.1.20

1

1

2

4

phosphorylase

4 3.2.1.91

1

3

4

cellulose 1,4-β- cellobiosidase

5

3.2.1.4 endoglucanase

5

8

6

12

31

glucan

1,3-β-

6 3.2.1.58

2

1

3

glucosidase

glucan

endo-1,3-β-D-

7 3.2.1.39

1

1

glucosidase

8 3.2.1.73 licheninase

0

0

2

2

0

Tổng số

55

71

80

110

316

3.4.3. Lựa chọn ORF cellulase để biểu hiện

Trong số 316 ORF đƣợc chú thích mã hóa các enzyme tham gia thủy phân cellulose có 55 ORF hoàn thiện, 71 ORF thiếu đầu 5’, 80 ORF thiếu đầu 3’ và 110 ORF thiếu cả hai

đầu 5’ và 3’ (Bảng 3.5). 55 ORF hoàn thiện gồm 19 ORF mã hóa 6-phospho-β- glucosidase, 29 ORF mã hóa β-glucosidase, 5 ORF mã hóa endoglucanase và 2 ORF mã

hóa glucan 1,3-β-glucosidase. Đặc biệt, endoglucanase có rất nhiều ứng dụng trong công nghiệp. Do vậy, trong nghiên cứu này, 5 ORF hoàn thiện đƣợc chú thích chức năng

endoglucanase là những trình tự chúng tôi đặc biệt quan tâm.

Từ tỷ lệ tƣơng đồng và giống của trình tự nucleotide và trình tự amino acid của 5 ORF, bƣớc đầu ORF GL0130684 đƣợc lựa chọn. Để chắc chắn về dự đoán ORF GL0130684 mã hoá endoglucanase, chúng tôi đã xây dựng cây phân loại để xem xét mỗi quan hệ của trình tự amino acid ORF GL0130684 với các trình tự amino acid tƣơng ứng

của NCBI. Kết quả cho thấy, trình tự amino acid của GL0130684 thể hiện hoạt tính

15

endoglucanase rõ ràng (Hình 3.6) và thống nhất khi so sánh với các cơ sở dữ liệu COG, pfarm, PRK thông qua Blastp của NCBI. Hơn nữa, phần mềm Phyre 2 đã đƣa ra cấu trúc

3D và chức năng endoglucanase của trình tự amino acid của ORF GL0130684. Với những đặc điểm đã phân tích cho thấy ORF GL0130684 đƣợc dự đoán đúng chức năng

endoglucanase với tỷ lệ cao, do đó ORF GL0130684 đƣợc lựa chọn để phân lập, tách dòng và biểu hiện. Chúng tôi kí hiệu ORF GL0130684 là gen egc.

Hình 3.6. Phân tích cây phát sinh loài giữa EGC và các endogucanase dựa trên sự tương

đồng về trịnh tự amino acid. 0,05 là chỉ số thể hiện sự khác nhau giữa 2 nhóm là 5 nucleotide/100 amino acid; các con số trên các nhánh là chỉ số Bootstrap. Tên các loài trên cây gồm: tên loài và

mã số gene.

3.5. TÁCH DÒNG GENE egc

3.5.1. Trình tự ORF GL0130684

Gene egc chúng tôi lựa chọn có chiều dài 1107 bp. Phân tích đặc điểm của trình tự amino acid bằng chƣơng trình Expasy trực tuyến cho thấy, trình tự amino acid của gene egc

chứa một đoạn tín hiệu tiết dài 22 amino acid (từ amino acid đầu tiên cho đến amino acid thứ 22), tƣơng ứng với độ dài trình tự nucleotide là 66 bp (từ đầu gene cho đến bp thứ 66).

3.5.2. Khuếch đại gene egc

Để khuếch đại đƣợc gene egc từ khuôn DNA đa hệ gene vi sinh vật sống trong ruột mối với xác suất cao nhất, hai mồi xuôi GL0130684f1, GL0130684f2 và một mồi ngƣợc GL0130684r đã đƣợc sử dụng. Trong đó, mồi xuôi GL0130684f1 khuếch đại gene egc từ đầu gen (cả trình tự mã hoá tín hiệu tiết) và mồi xuôi GL0130684f2 khuếch đại gene egc từ vị trí ngay sau trình tự mã hoá tín hiệu tiết (không mang trình tự mã hoá tín hiệu tiết).

16

Trong khi khuếch đại gene egc, Vent DNA polymerase đã đƣợc sử dụng. Cả ba mồi đều đƣợc bổ sung vào cùng một phản ứng PCR.

Một đoạn DNA kích thƣớc lớn hơn 1 kb đƣợc khuếch đại (Hình 3.7) tƣơng đƣơng với kích thƣớc của gene egc mong muốn. Tuy nhiên, đoạn DNA khuếch đại đƣợc với số

lƣợng ít (băng DNA không rõ ràng), do đó, để thuận tiện cho việc tách dòng, sản phẩm khuếch đại có đoạn DNA mong muốn đƣợc sử dụng làm khuôn để khuếch đại đoạn DNA

đó lên với số lƣợng lớn hơn. Kết quả đúng nhƣ dƣ đoán, lƣợng DNA mong muốn đƣợc khuếch đại lên với số lƣợng lớn hơn (Hình 3.10). Đoạn DNA đƣợc thu hồi bằng bộ kit tinh

chế DNA QIAQuick gel extraction để ghép nối vào vector tách dòng.

kb 1 M (-) M (-) 2

10

Sản phẩm PCR

1,5 1,0

Hình 3.7. Điện di đồ sản phẩm khuếch đại gene egc trên gel agarose 0,8%. ĐC (-): đối

chứng âm; ĐC 1: sản phẩm PCR lần thứ nhất từ khuôn DNA đa hệ gene vi sinh vật trong ruột mối;

ĐC 2: sản phẩm PCR lần thứ hai từ khuôn là sản phẩm PCR lần thứ nhất; ĐC M; thang chuẩn

DNA 1 kb (Fermentas).

3.5.3. Ghép nối sản phẩm khuếch đại gene egc vào vector tách dòng pJET1.2 blunt

Trong nghiên cứu này, vector pJET1.2/blunt đƣợc sử dụng để tách dòng gene egc. Tỷ lệ sản phẩm PCR và vector pJET1 trong phản ứng ghép nối gene là 3:1. Hỗn hợp

phản ứng đƣợc ủ ở nhiệt độ thích hợp. Sản phẩm của phản ứng ghép nối sẽ đƣợc biến nạp vào tế bào E. coli DH10b bằng phƣơng pháp sốc nhiệt để chọn dòng mang plasmid

mong muốn.

3.5.4. Biến nạp sản phẩm ghép nối vào tế bào E. coli DH10b

Plasmid tái tổ hợp pJET-egc đƣợc biến nạp vào tế bào vi khuẩn E. coli DH10b

bằng phƣơng pháp sốc nhiệt.

Các dòng tế bào biến nạp đƣợc nuôi cấy trên môi trƣờng LBA ở 37oC và lắc qua đêm để tế bào sinh trƣởng và tổng hợp số lƣợng lớn. Những khuẩn lạc mọc trên đĩa môi trƣờng LBA chính là các dòng tế bào E. coli DH10b mang plasmid tái tổ hợp pJET-egc.

Bốn dòng khuẩn lạc của sản phẩm biến nạp đƣợc lựa chọn tách chiết DNA plasmid đều chứa

17

plasmid có kích thƣớc đồng nhất và lớn hơn kích thƣớc của dòng pJET1.2/blunt chỉ mang một đoạn DNA ngắn không đáng kế.

3.5.5. Cắt kiểm tra plasmid tái tổ hợp bằng enzyme hạn chế

M HindIII XbaI XhoI SalI BglII EcoRV kb

EcoRV 858

XbaI 377

SalI 511

4,5

wegc

BglII 384, HindIII, 624

Sản phẩm cắt

Eco47 R

PlacUV5

2,5

pJETwegc 4,2 Kb

XhoI 352 BglII 511 340 511 16 2782

Sản phẩm cắt

1

Rep(pMB1)

Bla (ApR)

A B

Hình 3.8. A. Vị trí cắt của các enzyme cắt kiểm tra plasmid tái tổ hợp trên gene egc và trên

vector pJET1.2/blunt. B. Điện di đồ sản phẩm cắt plasmid tái tổ bằng sáu enzyme hạn chế HindIII, SbalI, XhoI, SalI, BglII và EcoRV. Các ĐC HindIII, XbaI, XhoI, SalI, BglII và EcoRV tương ứng là

sản phẩm cắt plasmid bằng enzyme HindIII, XbaI, XhoI, SalI, BglII và EcoRV.

Sáu enzyme hạn chế gồm BglII, SalI, EcoRV, XhoI, XbaI và HindIII đƣợc sử dụng

để cắt kiểm tra các plasmid tái tổ hợp. BglII, XhoI, XbaI và HindIII cắt plasmid tái tổ hợp trên vector pJET1.2/blunt và không cắt trên gene egc. Kết quả cắt kiểm tra plasmid tái tổ

hợp đúng nhƣ tính toán lý thuyết (Hình 3.8). Nhƣ vậy, dòng plasmid chúng tôi lựa chọn cắt kiểm tra chính là pJET-egc mong muốn.

3.5.6. Phân tích trình tự gene egc phân lập đƣợc từ DNA đa hệ gene vi sinh vật ruột mối

Trình tự nucleotide của gene egc phân lập đƣợc từ DNA đa hệ gene vi sinh vật mối

chỉ khác với trình tự của ORF GL013068 một nucelotide ở vi trí 588/1104 Điều ngẫu nhiên là nucleotide sai khác này lại không làm thay đổi amino acid tƣơng ứng. Nghĩa là trình tự

amino acid của đoạn DNA phân lập đƣợc và của ORF GL013068 giống hệt nhau. Gene egc này phân lập đƣợc có cả trình tự mã hoá tín hiệu tiết nên đƣợc đặt tên là gene wegc để

phân biệt với gene egc không có tính hiệu tiết. Nhƣ vậy, plasmid tái tổ hợp chúng tôi có đƣợc là pJET-wegc. Điều đó chứng tỏ, trong ba mồi sử dụng để khuếch đại gene egc thì cặp mồi GL0130684f1 và GL0130684r đã khuếch đại đƣợc wegc. Trình tự tín hiệu tiết trong gene wegc sẽ đƣợc thay thế bằng trình tự tín hiệu tiết của protein pelB có trong vector biểu hiện pET22b+ , do đó, trình tự tín hiệu tiết cần phải loại bỏ khỏi gene wegc. Để loại bỏ trình tự tín hiệu tiết này khỏi gene wegc, chúng tôi sử dụng cặp mồi GL0130684f2

18

và GL0130684r để khuếch đại đúng đoạn DNA đích không có trình tự tín hiệu tiết từ khuôn plasmid tái tổ hợp pJET-wegc.

3.5.7. Khuếch đại gene egc không chứa tín hiệu tiết từ khuôn pJET-wegc

Ở nhiệt độ bắt cặp giữa mồi và khuôn là 50oC, trong 30 chu kỳ PCR, cặp mồi đặc hiệu GL0130684f2 và GL0130684r đã khuếch đại hiệu quả gene egc không mang tín hiệu tiết có kích thƣớc bé hơn wegc từ khuôn pJET-wegc (Hình 3.9). Gene egc này sẽ đƣợc tinh

chế bằng bộ kit QIAQuick gel và ghép nối vào vector biểu hiện pET22b(+).

Kb 1 2 M

10

Hình 3.9. Điện di đồ sản phẩm PCR

khuếch đại gene egc từ khuôn là gene wegc trên

1,5 1,0

wegc egc

gel agarose 0, 8%. ĐC 1: gene wegc; ĐC 2: gene egc được khuếch đại từ gene wegc; ĐC M: thang

chuẩn DNA 1 kb (Fermentas).

3.5.8. Thiết kế vector biểu hiện gene egc

3.5.8.1. Ghép nối gene egc vào vector biểu hiện

Trong nghiên cứu này, vector pET22b(+) đƣợc sử dụng để biểu hiện gene egc.

pET22b(+) là vector phù hợp cho biểu hiện protein tái tổ hợp trong vật chủ E. coli. Cả gene egc và vector pET22b(+) đều đƣợc xử lý bằng cặp enzyme hạn chế XhoI và NcoI.

Sản phẩm cắt là gene egc kích thƣớc 1041 bp và pET22b(+) dạng thẳng kích thƣớc 5431 bp đều có hai đầu dính tƣơng ứng giống nhau. Đặc điểm này giúp cho quá trình ghép nối

chúng với nhau hiệu quả cao. Sản phẩm ghép nối pET22-egc sẽ đƣợc biến nạp vào tế bào E.coli DH10B bằng sốc nhiệt để chọn dòng mong muốn.

3.5.8.2. Cắt kiểm tra plasmid tái tổ hợp pET22-egc

Plasmid tái tổ hợp pET22-egc chỉ có một trình tự cắt duy nhất của XhoI và của

NcoI ở hai đầu của gene egc. Khi sử dụng cặp enzyme này để cắt kiểm tra pET22-egc sẽ tạo ra hai đoạn DNA, đoạn thứ nhất chính là gene egc kích thƣớc 1041 bp và đoạn thứ hai chính là vector pET22b(+) kích thƣớc 5431 bp. Kết quả cắt kiểm tra bốn dòng

plasmid đều tạo ra hai đoạn DNA có kích đúng bằng kích thƣớc của gene egc và pET22b(+) (Hình 3.10). Nhƣ vậy, gene egc đã đƣợc ghép nối vào vector biểu hiện

19

pET22b(+) đúng nhƣ thiết kế. Plasmid pET22-egc sẽ đƣợc biến nạp vào tế bào biểu hiện E. coli BL21(DE3) bằng sốc nhiệt để biểu hiện gene egc.

kb 1 2 3 M 4

Hình 3.10. sản phẩm cắt các dòng

10 6,0 10 5,0

pET22b(+ )

pET22-egc bằng cặp enzyme hạn chế XhoI và NcoI trên gel agarose 0,8%. ĐC p1-4: 4 dòng plasmid pET22-egc; ĐC 1-4: sản phẩm cắt 4 dòng plasmid pET22-egc bằng XhoI và NxoI;

egc

1,0

ĐC M: thang chuẩn DNA 1 kb (Fermentas); ĐC

pET: vector pET22b(+).

3.6. BIỂU HIỆN GENE egc TRONG VI KHUẨN E. coli BL21(DE3)

3.6.1. Chọn dòng biểu hiện gene egc trong tế bào E. coli BL21(DE3)

M (-) 1 2 3 kda

M TS T KT kda

116

116

45

45

EGC

EGC

35

35

14,4

14,4

A B

Hình 3.11. Điện di đồ protein tổng số từ sản phẩm biểu hiện gene egc trong chủng E. coli BL21(DE3), môi trường LBA ở 37oC sau 4 tiếng cảm ứng 0,5 mM IPTG ở ba dòng tế bào khác nhau trên gel polyacrylamide 12,6% có SDS. Tế bào sau khi biểu hiện đều cô đặc đến OD600 = 10. ĐC (-): đối chứng âm, protein tổng số của dòng tế bào biểu hiện chỉ mang vector pET22b(+) không mang gene egc; ĐC 1-3: protein tổng số của 3 dòng tế bào biểu hiện mang pET22-egc; ĐC TS:

protein tổng số biểu hiện trong tế bào mang pET22-egc; ĐC T: protein ở dạng không tan biểu hiện trong tế bào mang pET22-egc; ĐC KT: protein ở dạng tan biểu hiện trong tế bào mang pET22-egc;

ĐC M: thang chuẩn protein unstained (Thermo scientific).

Kết quả cho thấy gene egc đã đƣợc tổng hợp thành protein EGC có kích thƣớc bé hơn 40 kda (Hình 3.11) tƣơng đƣơng với kích thƣớc tính toán lý thuyết ở cả ba dòng tế

bào, đồng thời, ở dòng đối chứng âm không có băng protein này. Nhƣ vậy, gene egc trong vector pET22b(+) đã đƣợc biểu hiện thành protein EGC trong tế bào E. coli BL21(DE3).

20

Kết quả kiểm tra khả năng tan của EGC cho thấy rằng, toàn bộ protein EGC đƣợc biểu hiện đều ở dạng không tan là dạng không mong muốn (Hình 3.12). Nhƣ vậy, điều

kiện biểu hiện gene egc cần phải thay đổi để tế bào tổng hợp đƣợc protein EGC ở dạng tan.

3.6.2. Ảnh hƣởng của nhiệt độ đến sự biểu hiện gene egc trong tế bào E. coli

20oC

30oC

37oC

25oC

BL21(DE3)

Kda (-) M TS T KT TS T KT TS T KT TS T KT

116

45

EGC

35

Hình 3.12. Điện di đồ protein EGC biểu hiện trong chủng E. coli BL21(DE3) sau 4 tiếng cảm

ứng 0,5 mM IPTG ở 20oC, 25oC, 30oC và 37oC trên gel polyacrylamide 12,6% có SDS.

Trong nghiên cứu này, để biểu hiện đƣợc protein mong muốn ở dạng tan, chúng tôi đã tiến hành nuôi tế bào ở 37oC đến OD600 đạt 0,6-0,8 thì cảm ứng IPTG đến nồng độ cuối cùng là 0,5 mM trong bốn tiếng ở bốn nhiệt độ là 20oC, 25oC, 30oC và 37oC. Ở 20oC và 25oC, protein đích đƣợc tạo thành có cả dạng tan và dạng không tan, trong đó lƣợng protein dạng tan ở 20oC khá nhiều và nhiều hơn ở 25oC (Hình 3.12). Ở nhiệt độ 30oC và 37oC, protein tạo thành đều ở dạng không tan. Nhƣ vậy, 20oC là nhiệt độ đƣợc lựa chọn để biểu hiện gene egc thành protein dùng cho các thí nghiệm tiếp theo.

3.6.3. Ảnh hƣởng của nồng độ IPTG đến hiệu quả cảm ứng

Tế bào đƣợc nuôi ở 37oC cho đến khi OD600 đạt 0,8 đƣợc chia thành 10 phần bằng nhau và bổ sung IPTG theo dải nồng độ trên. Tất cả các mẫu đƣợc nuôi cảm ứng ở 20oC trong thời gian 4 tiếng. Kết quả cho thấy nồng độ IPTG càng tăng từ 0,0 đến 2,0 thì lƣợng

tế bào biểu hiện thu đƣợc càng thấp. Sự tăng nồng độ IPTG cảm ứng từ 0,0 đến 0,1 mM làm tăng sự tạo thành protein EGC tổng số, nhƣng sự tăng này không thể hiện rõ ràng từ

nồng độ 0,1 đến 1 mM, thậm chí giảm mạnh ở nồng độ 2 mM (Hình 3.13A). Tỷ lệ thuận với kết quả protein EGC tổng số, lƣợng protein EGC dạng tan cũng tăng dần khi nồng độ

IPTG cảm ứng tăng từ 0,02 đến 0,1 mM, nhƣng sự tăng không thể hiện rõ ràng từ nồng độ 0,1-1mM và giảm mạnh ở nồng độ 0,02. Vậy, để đƣợc lƣợng protein EGC nhiều nhất cũng

nhƣ tỷ lệ protein dạng tan cao nhất thì nồng độ IPTG cảm ứng thích hợp nhất là 0,1 mM.

21

Kda 0,0 0,02 0,05 M 0,1 0,2 0,3 0,4 0,5 1,0 2,0

Kda 0,0 0,02 0,05 0,1 M 0,2 0,3 0,4 0,5 1,0 2,0

11 6

EGC

45 35

B

A

Hình 3.13. Điện di đồ protein EGC biểu hiện ở 20oC trong tế bào E. coli BL21(DE3) cảm ứng 10 nồng độ IPTG khác nhau trên gel polyacrylamide 12,6% có SDS. A: protein tổng số. B: protein

dạng tan. Các ĐC từ 0,0 – 2 tương ứng là protein biểu hiện khi tế bào được cảm ứng nồng độ IPTG từ 0,0-2 mM; ĐC M: thang chuẩn protein unstain (Thermo scientific).

3.6.4. Điện di protein trên gel polyacrylamide và kiểm tra hoạt tính endoglucanase

của EGC

M (-) EGC

Kda M (-) EGC

170

70

55

40

EGC

Vùng hoạt tính

A. Nhuộm comassie B. Ép gel và kiểm tra hoạt tính

Hình 3.14. Điện di đồ protein EGC biểu hiện ở 20oC trong tế bào E. coli BL21(DE3) trên gel polyacrylamide 9% không có SDS. (A). Gel nhuộm bằng thuốc nhuộm comassie. (B). Gel được ép trên môi trường cơ chất 0,1% CMC và kiểm tra hoạt tính. ĐC (-): đối chứng âm; ĐC EGC: protein tổng số, biểu hiện ở 20oC trong tế bào mang pET22-egc; ĐC M: thang chuẩn protein pageruler prestained (Fermentas).

Để kiểm tra hoạt tính của endoglucanase của protein EGC, chúng tôi đã tiến hành

điện di protein EGC trên gel polyacrylamide không biến tính và ép gel mang protein trên

môi trƣờng 0,5% có cơ chất đặc hiệu (CMC). Kết quả đúng nhƣ chú thích chức năng của

gene egc, băng protein EGC đậm có kích thƣớc bé hơn 40 kdal (Hình 3.14A) đã phân huỷ

CMC tại vị trí mà băng này tiếp xúc với thạch 0,5% CMC khi ép gel (Hình 3.14B). Điều

22

đó chứng tỏ, protein EGC đƣợc biểu hiện có hoạt tính endoglucanase. Vậy, bằng phƣơng

pháp ép gel định tính, chúng tôi khẳng định protein EGC có hoạt tính endoglucanase.

3.6.5. Tinh chế protein EGC bằng cột sắc kí ái lực His-tag

kda 1 2 3 M F1 F2 F3 F4 F5 F6 F7 F8

116

EGC

45 35

Hình 3.15. Điện di đồ kiểm tra sản phẩm tinh chế enzyme EGC bằng cột sắc kí ái lực His- tag trên gel polyacrylamide 12,6% có SDS. ĐC 1: protein tổng số biểu hiện từ tế bào mang gene

egc; ĐC 2: protein đi qua cột khi đưa mẫu lên giá thể; ĐC 3: protein bị đẩy ra khỏi giá thể bằng đệm rửa; các ĐC F1-8: 8 phân đoạn thu protein EGC bám trên giá thể cột sắc kí ái lực His-tag; ĐC M: thang chuẩn protein unstained (Thermo Scientific).

Kết quả này thể hiện ở Hình 3.16 cho thấy protein thu đƣợc ở 8 phân đoạn đều có

kích thƣớc bằng nhau và đúng bằng kích thƣớc của protein EGC. Trong đó, protein đƣợc

tập trung chủ yếu ở phân đoạn 5 và 6, đặc biệt là phân đoạn 5. .

3.6.6. Hoạ tính riêng của EGC

Bằng phƣơng pháp định lƣợng protein Bradford, khối lƣợng protein EGC/ml đƣợc xác định. Qua đó, hoạt tính riêng của EGC ở mỗi mg protein cũng đƣợc xác định. Ở điều kiện 37oC và pH 7 hoạt tính của EGC là 1,055 U/mg.

120

100.00

3.6.7. Ảnh hƣởng của nhiệt độ đến hoạt tính endoglucanase của EGC

)

90.46

100

%

82.78

(

72.90

69.33

80

57.31

60

40

C G E h n í t t ạ o H

20

0

30

35

40

45

50

55

Nhiệt độ (oC)

Hình 3.16. Ảnh hưởng của nhiệt độ đến hoạt tính của endoglucanase của EGC.

23

Dải nhiệt độ từ 30 đến 55oC đƣợc lựa chọn. Hoạt tính endoglucanase tăng dần từ 30 đến 40oC, nhƣng giảm dần khi nhiệt độ tăng từ 40 đến 45oC và giảm mạnh ở nhiệt độ 55oC (Hình 3.16). Nhƣ vậy, nhiệt độ thích hợp nhất cho hoạt động của EGC là 40oC.

3.6.8. Ảnh hƣởng của pH đến hoạt tính của EGC

Trong nghiên cứu này, chúng tối đã lựa chọn dải pH gồm 12 giá trị khác nhau từ

2,5 đến 8,0 để tìm điều kiện pH tối ƣu cho EGC hoạt động. Kết quả cho thấy enzyme có

hoạt tính cao nhất ở pH 5,5 đến 6,0. Ở pH từ 2,5 đến 4,5, hoạt tính của EGC rất thấp và

không ổn định. Ở pH từ 6,5 đến 8,0, mặc dù hoạt tính của EGC cao hơn và ổn định hơn so

với khoảng pH 2,5 đến 4,5 nhƣng hoạt tính giảm dần theo sự tăng dần của pH (Hình 3.17).

)

100.0 97.0

%

80.6 81.1

(

70.0

68.0

59.8

42.0 39.4

34.9 35.4

34.5

C G E h n í t t ạ o H

120 100 80 60 40 20 0

2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 pH

Hình 3.17. Ảnh hưởng của pH đến hoạt tính của EGC ở 40oC.

3.6.9. Ảnh hƣởng của một số ion kim loại và hoá chất lên hoạt tính của EGC

Chín ion kim loại (K+, Mn2+, Cu2+, Ca2+, Ni2+, Mg2+, Zn2+, Co2+, Fe3+) và sáu hoá

chất thƣờng sử dụng trong phòng thí nghiệm (EDTA, SDS, Urea, tween 80, triton X-100

và 2-mercaptoethanol) nồng độ 10 mM đƣợc chúng tôi lựa chọn để đánh giá ảnh hƣởng

của chúng đến hoạt tính của EGC. Tất cả đƣợc tiến hành ở điều kiện hoạt động tối ƣu của EGC (40oC và pH 5,5). Hình 3.18 cho thấy, các ion kim loại gồm Mn2+, Ca2+, Mg2+ và Fe3+ ức chế hoạt tính của EGC, đặc biệt Mn2+ và Fe3+ làm hoạt tính giảm xuống còn 21% và 40%, còn Cu2+ và Ni2+ ảnh hƣởng không đáng kể đến hoạt tính của EGC, hoạt tính EGC vẫn đạt 94 và 95%. Tuy nhiên, ion K+, Zn2+ và Co2+ lại làm tăng hoạt tính EGC, đặc biệt, Co2+ làm tăng hoạt tính lên đến 257%.

24

300

257

)

250

%

(

200

150

84 94 95 96 100 100 107 109 109 111

100

56 64 65

40

C G E h n í t t a o H

50

21

0

Nhân tố

Hình 3.18. Ảnh hưởng của một số ion kim loại và hoá chất đến hoạt tính của EGC.

3.6.10. Động học của EGC

Thông số động học đƣợc xác định từ đồ thị Lineweaver-Burke. Kết quả cho thấy,

phƣơng trình phụ thuộc giữa tốc độ phản ứng với nồng độ cơ chất đã tuân theo hàm y=ax+b với độ tin cậy cao R2 = 0,99 (Hình 3.19). Dựa trên phƣơng trình, Km và Vmax của

endoglucanase đã đƣợc tính tƣơng ứng là 16,14 mg/ml và 2,28 mol/phút. Do đó, hoạt tính

endoglucanase của EGC đạt đƣợc là 11,774 U/mg.

Hình 3.19. Sự phụ thuộc của tốc độ phản ứng của enzyme vào nồng độ cơ chất CMC theo

Linewever-Burk.

25

KẾT LUẬN

Với những kết quả thu đƣợc trong quá trình thực hiện đề tài, chúng tôi rút ra những

kết luận sau:

1. Bằng phƣơng pháp phân tử, dựa vào phân tích trình tự đoạn DNA của gen mã hoá

rRNA 16S ti thể, loài mối nghiên cứu đƣợc định loại là Coptotermes gestroi.

2. Đã tách chiết và tinh sạch đƣợc DNA đa hệ gene vi sinh vật ruột mối C. gestroi có kích

thƣớc 5.431,60 Mbp. Với bộ dữ liệu này, 125.431 ORF đã đƣợc xác định, 1460 loài,

731 chi, 282 họ, 138 bộ, 65 lớp và 46 ngành đƣợc dự đoán. Trong đó, vi khuẩn chiếm

1368 loài thuộc 628 chi, 217 họ, 97 bộ, 41 lớp và 22 ngành.

3. Tổng số 316 ORF mã hoá tám loại enzyme thuỷ phân cellulose đƣợc dự đoán. Trong

đó, ba loại enzyme có nhiều ORF mã hoá là β-glucosidase (211 ORF), 6-phospho-β-

glucosidase (60 ORF) và endoglucanase (31 ORF).

4. Đã phân lập, tách dòng và biểu hiện thành công gene egc dài 1107 bp. Gene biểu hiện

thành protein EGC ở điều kiện thích hợp là 20oC và cảm ứng 0,1 mM IPTG. Protein

EGC có hoạt tính endoglucanase đúng nhƣ dự đoán.

5. Enzyme EGC hoạt động tối ƣu ở 40oC và pH 5,5-6. Các thông số động học

endoglucanase đƣợc xác định theo phƣơng trình Lineweaver-Burk là Km =

16,14 mg/ml và Vmax = 2,28 mol/phút. Hoạt tính endoglucanase của EGC đạt đƣợc

là 11,774 U/mg. Ở nồng độ 10 mM của các ion kim loại và hoá chất, hoạt tính endoglucanase tăng khi có mặt của Co2+, Zn+ và K+ , đặc biệt, Co2+ làm hoạt tính endoglucanase tăng lên đến 257%; hoạt tính endoglucanase giảm khi có mặt của Mn2+, Fe2+, Ca2+, Cu2+ , Ni2+, SDS và EDTA.

KIẾN NGHỊ

1. Bộ dữ liệu trình tự DNA đa hệ gen vi sinh vật ruột mối C. gestroi thu đƣợc có 316

ORF đƣợc chú thích mã hoã các enzyme phân huỷ cellulose và hemicellulose. Tuy

nhiên, trong khuôn khô nghiên cứu này, chúng tôi mới phân lập, tách dòng và biểu hiện

đƣợc một ORF. Do đó, cần thiết phải có thêm các nghiên cứu tiếp theo biểu hiện các

ORF mã hoá cellulase phối trộn với nhau và với EGC để phân huỷ hiệu quả cellulose

hiệu quả.

26

DANH MỤC CÁC CÔNG TRÌNH LIÊN QUAN ĐẾN LUẬN ÁN

1. Nguyễn Thị Thảo, Lê Quỳnh Giang, Nguyễn Thanh Ngọc, Đỗ Thị Huyền, Trƣờng

Nam Hải (2012),“Sử dụng phƣơng pháp máng đơn (Troghing) để tinh sạch DNA

metageneome hệ vi sinh vật cộng sinh trong ruột mối”,Tạp chí Khoa học Đại học

Vinh,Số 41(4A):79-84.

2. Nguyễn Thị Thảo, Lê Quỳnh Giang, Nguyễn Thanh Ngọc, Nguyễn Thị Quý, Nguyễn

Thị Trung, Đỗ Thị Huyền, Trƣơng Nam Hải (2012),“Nghiên cứu làm tăng hiệu quả

biến nạp xung điện để tạo thƣ viện metageneome của hệ vi sinh vật trong ruột mối”,

Tạp chí Công nghệ Sinh học, Số10(3), tr. 441-447.

3. Nguyễn Thị Thảo, Đào Trọng Khoa, Lê Quỳnh Giang, Đỗ Thị Huyền, Nguyễn Thị Trung, Nguyễn Thúy Hiền, Nguyễn Quốc Huy, Trƣơng Nam Hải (2014),“Định danh

loài mối Coptotermes thu tại chùa Linh Quang, Hà Động, Hà Nội dựa trên trình tự các

đoạn DNA trên gene mã hóa ribosome 16S ti thể”,Tạp chí Sinh học, 36(1), tr. 58-64.

4. Thi-Thao NGUYEN, Thi-Huyen DO, Thu-Huong DUONG, Quynh-Giang LE, Trong-

Khoa DAO, Thi-Trung NGUYEN, Thi-Quy NGUYEN, Thi-Thu-Hien NGUYEN,

Keitarou KIMURA, Nam-Hai TRUONG (2014),“Identification of Vietnamese

Coptotermes species based on 428-bp and 151-bp regions of mtDNA 16S rRNA gene”,

B Insectol,67(1), pp. 131-136.

5. Thi Huyen Do, Thi Thao Nguyen, Thanh Ngoc Nguyen, Quynh Giang Le, Cuong

Nguyen,Keitarou Kimura, and Nam Hai Truong (2014), “Mining biomass-degrading

genes through Illumina-based de novo sequencing and metageneomic analysis of free-

living bacteria in the gut of the lower termite Coptotermes gestroi harvested in

Vietnam”. J. Biosci. Bioeng, 118(6), pp. 665-671.

27