viÖn hµn l©m khoa häc vµ c«ng nghÖ viÖt nam

viÖn c«ng nghÖ sinh häc TRẦN THANH THỦY NGHI£N CøU ®¸nh gi¸ ®a d¹ng vi sinh vËt,

SµNG LäC, THU NHËN Vµ X¸C §ÞNH TÝNH CHÊT

CñA CELLULASE SUèI N¦íC NãNG b×nh ch©u,

VIÖT NAM b»ng kü thuËt metagenomicS

luËn ¸n tiÕn sÜ sinh häc

Hµ néi - 2021

viÖn hµn l©m khoa häc vµ c«ng nghÖ viÖt nam

viÖn c«ng nghÖ sinh häc TRẦN THANH THỦY

NGHI£N CøU ®¸nh gi¸ ®a d¹ng vi sinh vËt, SµNG LäC, THU NHËN Vµ X¸C §ÞNH TÝNH CHÊT CñA CELLULASE SUèI N¦íC NãNG b×nh ch©u, VIÖT NAM b»ng kü thuËt metagenomicS Chuyªn ngµnh : Vi sinh vËt häc

M· sè

: 9 42 01 07

luËn ¸n tiÕn sÜ sinh häc

Người hướng dẫn khoa học: 1. TS. Nguyễn Kim Thoa Viện Công nghệ sinh học 2. PGS. TS. Trần Đình Mấn Viện Công nghệ sinh học

Hµ néi - 2021

LỜI CẢM ƠN

Với lòng biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành nhất đến TS. Nguyễn

Kim Thoa và PGS. TS. Trần Đình Mấn, Viện Công nghệ sinh học, Viện Hàn lâm

Khoa học và Công nghệ Việt Nam – những người thầy đã tận tình chỉ bảo, hướng

dẫn, động viên và tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện

luận án này.

Tôi xin gửi lời cảm ơn tới Ban lãnh đạo Viện Công nghệ sinh học, phòng Thí

nghiệm trọng điểm Công nghệ gen, phòng Công nghệ Vật liệu sinh học, các cán bộ

tại cơ sở đào tạo thuộc Viện Công nghệ sinh học, phòng Hệ gen học chức năng thuộc

Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tạo

điều kiện thuận lợi về cơ sở vật chất, máy móc, trang thiết bị cũng như các thủ tục

cần thiết để tôi có thể hoàn thành luận án.

Tôi cũng xin gửi lời cảm ơn tới các đồng nghiệp tham gia đề tài

ĐTĐLCN.15/14, các chú, anh, chị, em cán bộ phòng Công nghệ Vật liệu sinh học đã

giúp đỡ, động viên tôi trong suốt quá trình thực hiện luận án.

Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè, những người thân đã

luôn ở bên cạnh chia sẻ, động viên, khích lệ, giúp đỡ, tạo điều kiện thuận lợi về

mọi mặt để tôi có thể tập trung, yên tâm học tập, nghiên cứu và hoàn thành luận

án của mình.

Hà Nội, ngày ... tháng ... năm 2021

Tác giả

i

Trần Thanh Thủy

LỜI CAM ĐOAN

Tôi xin cam đoan:

Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác với các

cộng sự khác.

Các số liệu và kết quả trình bày trong luận án là trung thực, một phần đã được

công bố trên các tạp chí khoa học chuyên ngành với sự đồng ý và cho phép của các

đồng tác giả.

Phần còn lại chưa được ai công bố trong bất kỳ công trình nào khác.

Hà Nội, ngày … tháng … năm 2021

Tác giả

ii

Trần Thanh Thủy

MỤC LỤC

LỜI CẢM ƠN ........................................................................................................... i

LỜI CAM ĐOAN ..................................................................................................... ii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT....................................... vii

DANH MỤC CÁC BẢNG ........................................................................................ x

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ................................................................ xi

MỞ ĐẦU .................................................................................................................... 1

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 3

1.1. Khu hệ vi sinh vật trong suối nước nóng .................................................... 3

1.2. Cellulase ......................................................................................................... 6

1.2.1. Phân loại ......................................................................................................... 6

1.2.2. Đặc điểm hóa sinh .......................................................................................... 9

1.2.3. Ứng dụng công nghệ sinh học của cellulase ưa nhiệt .................................. 21

1.3. Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các

gen mới ........................................................................................................ 21

1.3.1. Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics ............. 22

1.3.2. Phương pháp đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA

metagenome ................................................................................................. 26

1.3.3. Ứng dụng kỹ thuật Metagenomics để đánh giá đa dạng vi sinh vật và

khai thác các gen mã hóa cho enzyme mới .............................................. 28

1.3.4. Tình hình ứng dụng metagenomics vào nghiên cứu đa dạng vi sinh vật và

khai thác các gen mã hóa cho cellulase ở Việt Nam .................................... 32

CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................... 35

2.1. Vật liệu ......................................................................................................... 35

iii

2.1.1. Vi sinh vật ..................................................................................................... 35

2.1.2. Vector ........................................................................................................... 35

2.1.3. Cặp mồi sử dụng ........................................................................................... 35

2.1.4. Gen nghiên cứu ............................................................................................. 36

2.1.5. Các hóa chất sử dụng .................................................................................... 36

2.1.6. Môi trường nuôi cấy ..................................................................................... 36

2.2. Máy móc và thiết bị .................................................................................... 36

2.3. Phương pháp nghiên cứu ........................................................................... 36

2.3.1. Tách chiết DNA metagenome của mẫu suối nước nóng Bình Châu ............ 36

2.3.2. Giải trình tự DNA metagenome suối nước nóng Bình Châu ....................... 37

2.3.3. Các phương pháp tin sinh .............................................................................. 38

2.3.4. Khuếch đại gen endoglucanase_18736 và β-glucosidase_32768 ................ 40

2.3.5. Tạo vector biểu hiện pET-17b gắn các đoạn gen endoglucanase_18736/

β-glucosidase_32768 .................................................................................... 41

2.3.6. Biến nạp vector biểu hiện pET-17b chứa các đoạn gen

endoglucanase_18736/ β-glucosidase_32768 vào E. coli TOP10F’ bằng

phương pháp xung điện ................................................................................ 42

2.3.7. Chọn lọc dòng E. coli mang vector pET17b-18736/ và pET17b-32768 ...... 43

2.3.8. Tạo chủng E. coli tái tổ hợp mang vector pET-17b_18736 và

pET-17b_32768 ........................................................................................ 43

2.3.9. Biểu hiện gen denovogenes_18736 và denovogenes_32768 ....................... 44

2.3.10. Xác định trọng lượng sinh khối khô ............................................................. 44

2.3.11. Phương pháp thu nhận enzyme thô .............................................................. 44

2.3.12. Phương pháp xác định hoạt tính endoglucanase .......................................... 45

iv

2.3.13. Phương pháp xác định hoạt tính -glucosidase ............................................ 45

2.3.14. Ảnh hưởng của một số yếu tố lên mức độ biểu hiện endoglucanase_18736

và β-glucanase_32768 .................................................................................. 46

2.3.15. Động thái sinh trưởng và sinh endoglucanase, β-glucosidase tái tổ hợp ..... 47

2.3.16. Tinh sạch endoglucanase và β-glucosidase tái tổ hợp .................................. 47

2.3.17. Định lượng protein tổng số ........................................................................... 48

2.3.18. Điện di protein SDS-PAGE .......................................................................... 48

2.3.19. Kiểm tra hoạt tính endoglucanase bằng Zymogram (Điện di protein trên

gel polyacrylamide có chứa cơ chất CMC) ................................................. 49

2.3.20. Kiểm tra hoạt tính β-glucosidase bằng Zymogram ...................................... 50

2.3.21. Nghiên cứu một số đặc tính của enzyme tái tổ hợp ..................................... 50

2.3.22. Xử lý thống kê ............................................................................................... 51

CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU .............................................................. 52

3.1. Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật

suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và

xây dựng bộ dữ liệu gen mã hóa cho cellulase . ................................... 52

3.1.1. Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng

Bình Châu .................................................................................................... 52

3.1.2. Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật,

xác định và tổng hợp gen mới mã hóa cho các enzyme thủy phân

cellulose (enzyme chịu kiềm, chịu axit và chịu nhiệt) ................................. 54

3.2. Biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 ............... 74

3.2.1. Thiết kế vector biểu hiện gen [denovogenes]_18736 và

[denovogenes]_32768 trong E. coli ............................................................. 74

3.2.2. Lựa chọn một số điều kiện biểu hiện gen [denovogenes]_18736 và

v

[denovogenes]_32768 trong E. coli ............................................................. 75

3.2.3. Động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của

chủng E. coli C43(DE3) tái tổ hợp .............................................................. 82

3.3. Tinh sạch và xác định tính chất của các cellulase tái tổ hợp .................. 83

3.3.1. Tinh sạch enzyme tái tổ hợp ......................................................................... 83

3.3.2. N g h i ê n c ứ u mộ t s ố đ ặ c t í n h c ủ a e n do g l u c a n a s e _ 1 8 7 3 6 v à

β - g l u c o s i d a s e _ 3 27 6 8 t á i t ổ h ợ p ...................................................... 85

CHƯƠNG 4. BÀN LUẬN KẾT QUẢ NGHIÊN CỨU ........................................ 95

4.1. Đa dạng vi sinh vật và tiềm năng khai thác các gen mới mã hóa cho

cellulase suối nước nóng Bình Châu thông qua cách tiếp cận không

phụ thuộc vào nuôi cấy. ............................................................................. 95

4.1.1. Đa dạng vi sinh vật ....................................................................................... 95

4.1.2. Tiềm năng khai thác các gen mới mã hóa cho cellulase .............................. 99

4.2. Mối liên hệ giữa mô hình cấu trúc với các đặc điểm của

endoglucanase_18736 và β-glucosidase_32768 ...................................... 104

4.2.1. Phân tích các do main ch ức năng c ủa endoglucana se_18 736

và β-glucos idase _3 2768 ..................................................................... 104

4.2.2. Mô hình cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768

tái tổ hợp .................................................................................................... 104

KẾT LUẬN VÀ KIẾN NGHỊ .............................................................................. 111

NHỮNG CÔNG TRÌNH CỦA TÁC GIẢ ĐÃ CÔNG BỐ LIÊN QUAN

ĐẾN ĐỀ TÀI ......................................................................................................... 113

TÓM TẮT LUẬN ÁN BẰNG TIẾNG ANH ...................................................... 114

TÀI LIỆU THAM KHẢO .................................................................................... 122

vi

PHỤ LỤC ................................................................................................................... 1

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Tên viết tắt Tên tiếng Anh Tên tiếng Việt

Ammonium persulfate Ammonium persulfate APS

Beijing Genomics Institute Viện nghiên cứu hệ gen Bắc Kinh BGI

BLAST Basic Local Alignment Công cụ tìm kiếm các trình tự tương

Search Tool đồng trực tuyến của NCBI

Base pair Cặp base Bp

Bovine serum albumin Albumin huyết thanh bò BSA

Carbohydrate – Active Enzyme thủy phân carbohydrate CAZy

enzymes

CBMs hay Carbohydrate Binding Module/Vùng liên kết với

modules/Domains carbohydrate CBD

Catalytic domain Vùng xúc tác CD

Carbohydrate esterases Carbohydrate esterases CEs

Carboxymethyl cellulose Carboxymethyl cellulose CMC

Cơ sở dữ liệu CSDL

Deionized water Nước deion dH2O

Deoxyribonucleic acid Axit Deoxyribonucleic DNA

3,5-Dinitrosalicylic acid Axit 3,5-Dinitrosalicylic DNSA

2’ – deoxyribonucleoside 2’ – deoxyribonucleoside 5’ - dNTP

5’ – triphosphate triphosphate

DPPE 1,2-bis 1,2-bis (diphenylphosphino) ethylene

(diphenylphosphino)

ethylene

EBI European Bioinformatics Viện nghiên cứu tin sinh Châu Âu

Institute

EDTA Ethylene diamine tetra Axit ethylene diamine tetra acetic

vii

acetic acid

EMBL European Molecular Phòng thí nghiệm sinh học phân tử

Biology Laboratory Châu Âu

ExPASY Expert Protein Analysis Hệ thống chuyên phân tích protein

System

GH Glycoside hydrolase Họ enzyme thủy phân glycoside

GTs Glycosyl transferases Glycosyl transferases

HTS High throughput Giải trình tự thông lượng cao

Sequencing

IPTG Isopropyl β- D-1- Isopropyl β- D-1-

thiogalactopyranoside thiogalactopyranoside

Kb Kilo base Đơn vị đo kích thước của axit

nucleic

KDa Kilo Dalton Đơn vị đo kích thước protein

KEGG Kyoto Encyclopedia of Cơ sở dữ liệu về gen và hệ gen

Genes and Genomes Kyoto.

Km Michaelis constants Hằng số Michaelis

LB Luria-Bertani Môi trường Luria-Bertani (LB)

MEGAN MEtaGenomic ANalyser Phần mềm phân tích trình tự đa hệ gen

NB Nutrient broth Môi trường Nutrient broth (NB)

NCBI National Center for Trung tâm Thông tin Công nghệ sinh

Biotechnology Information học quốc gia (Mỹ)

NGS Next Generation Giải trình tự gen thế hệ mới

Sequencing

NR Non - Redundant Cơ sở dữ liệu chứa các trình tự

không dư thừa của NCBI

ORF Open Reading Frame Khung đọc mở

PBS Phosphate – Buffered Đệm muối phosphate

saline

viii

PCR Polymerase Chain Reaction Phản ứng trùng hợp chuỗi

PDB Protein Data Bank Ngân hàng dữ liệu protein

PEG Polyethylen glycol Polyethylen glycol

PLs Polysaccharide lyases Polysaccharide lyases

pNPG p-nitrophenyl-β-d- p-nitrophenyl-β-d-glucopyranoside

glucopyranoside

SDS Sodium dodecyl sulphate Sodium dodecyl sulphate

SDS - SDS – Polyacrylamide gel Điện di trên gel polyacrylamide

PAGE electrophoresis

Swiss-Prot Swiss Protein Cơ sở dữ liệu protein Thụy Sĩ

TB Terrific Broth Môi trường Terrific broth (TB)

TEMED N,N,N′,N′-Tetramethyl N,N,N′,N′-Tetramethyl

ethylenediamine ethylenediamine

Tm Temperature Melting Nhiệt độ nóng chảy

Vmax Maximum Velocity Vận tốc tối đa

Uniprot Universal Protein Resource Nguồn dữ liệu phổ biến về trình tự

ix

và chức năng của protein

DANH MỤC CÁC BẢNG

Bảng 1.1. Phân bố của cellulase vào các họ GH khác nhau .................................... 8

Bảng 1.2. Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật

ở suối nước nóng .................................................................................... 14

Bảng 1.3. Đặc điểm của cellulase bền nhiệt .......................................................... 20

Bảng 1.4. Cellulase bền nhiệt từ metagenome của vi sinh vật ở suối nước nóng........ 31

Bảng 3.1. Nồng độ và độ tinh sạch của DNA metagenome mẫu nước và mẫu bùn

suối nước nóng Bình Châu ..................................................................... 54

Bảng 3.2. Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome suối nước nóng

Bình Châu ............................................................................................... 54

Bảng 3.3. Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu ....... 55

Bảng 3.4. Thống kê phân loại học DNA metagenome suối nước nóng Bình Châu

đã được chú giải ..................................................................................... 56

Bảng 3.5. Tỉ lệ các gen đã được phân loại thuộc các Ngành vi khuẩn ở

suối nước nóng Bình Châu ................................................................ 58

Bảng 3.6. Tỉ lệ các gen đã được phân loại thuộc các Lớp vi khuẩn ở suối nước nóng

Bình Châu ............................................................................................... 59

Bảng 3.7. Tóm tắt kết quả chú giải gen dựa vào các cơ sở dữ liệu mở ................. 61

Bảng 3.8. Phân bố của các ORF mã hóa cho cellulase được dự đoán từ bộ dữ liệu

DNA metagenome suối nước nóng Bình Châu .................................... 64

Bảng 3.9. Đặc điểm của 5 ORF mã hóa cho endoglucanase và β-glucosidase

thỏa mãn các tiêu chí lựa chọn gen/protein mới .................................... 68

Bảng 3.10. Kết quả tinh sạch endoglucanase và β-glucosidase tái tổ hợp bằng cột

IMAC-Ni2+ ............................................................................................. 85

x

Bảng 3.11. Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp ..... 90

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1. Nguyên tắc hoạt động của cellulase thủy phân cellulose ........................ 7

Hình 1.2. Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ

nấm Trichoderma reesei ................................................................... 10

Hình 1.3. Cấu trúc cellulosome của A. cellulolyticus ............................................ 11

Hình 1.4. Ba dạng tâm hoạt động của các họ GH ................................................. 11

Hình 1.5. Hai cơ chế xúc tác của GHsa ................................................................. 13

Hình 1.6. Các phương pháp chính để phát hiện gen mới bằng cách sử dụng

Metagenomics ........................................................................................ 22

Hình 1.7. Các bước chính xây dựng thư viện Metagenomic ................................. 24

Hình 1.8. Các bước phân tích tin sinh điển hình cho cơ sở dữ liệu

Metagenomic ......................................................................................... 26

Hình 2.1. Quy trình xử lý, phân tích dữ liệu DNA metagenome và sàng lọc gen

mã hóa cho enzyme thủy phân cellulose tiềm năng .............................. 38

Hình 3.1. Các vị trí lấy mẫu nước và mẫu bùn của suối nước nóng Bình Châu ... 53

Hình 3.2. DNA metagenome mẫu nước và bùn suối nước nóng Bình Châu ........ 53

Hình 3.3. Phân bố độ dài contig sau khi lắp ráp bằng phần mềm

SOAPdenovo2 ....................................................................................... 55

Hình 3.4. P h â n b ố đ ộ d à i c á c g e n đ ư ợ c d ự đ o á n t ừ b ộ d ữ l i ệ u

D N A m e t a g e n o m e s u ố i n ư ớ c n ó n g B ì n h C h â u .................... 56

Hình 3.5. Biểu đồ biểu thị 8 nhóm chiếm ưu thế cho từng cấp độ phân loại

(Ngành, Lớp, Bộ, Họ, Chi, Loài) vi sinh vật ở suối nước nóng

Bình Châu ............................................................................................. 57

Hình 3.6. Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA metagenome

suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy ................ 62

Hình 3.7. Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa

lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng

xi

Bình Châu .............................................................................................. 63

Hình 3.8. Cây phát sinh chủng loại Maximum likelihood của trình tự axit amin

mã hóa cho cellulase từ bộ dữ liệu DNA metagenome suối nước nóng

Bình Châu .............................................................................................. 66

Hình 3.9. Dự đoán tính chất của các protein tham gia vào quá trình thủy phân

cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome

suối nước nóng Bình Châu ...................................................................... 67

Hình 3.10. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của

endoglucanase_18736............................................................................ 71

Hình 3.11. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của

β-glucosidase_32768 ........................................................................... 71

Hình 3.12. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm

Swissmodel của ExPASy. a) Cấu trúc của endoglucanase_18736

dựa theo khuôn mô hình cấu trúc của cellulase Cel6 giả định

(1up3.1.A); b) Cấu trúc khuôn cellulase Cel6 giả định (1up3.1.A) . .. 72

Hình 3.13. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm

Swissmodel của ExPASy. a) Cấu trúc của β-glucosidase_32768 dựa

theo khuôn mô hình cấu trúc β-glucosidase (1vff.1.A); b) Cấu trúc

của β-glucosidase khuôn (1vff.1.A). ..................................................... 73

Hình 3.14. Điện di đồ sản phẩm cắt kiểm tra plasmid pET17b mang các đoạn gen

ngoại lai bằng hai enzyme giới hạn HindIII và NdeI .............................. 75

Hình 3.15. Hoạt tính endoglucanase_18736 (A) và β-glucosidase_32768 (B)

trong pha tan của các chủng tái tổ hợp .............................................. 76

Hình 3.16. Ảnh hưởng của chủng chủ lên quá trình sinh trưởng và biểu hiện

enzyme tái tổ hợp .................................................................................. 76

Hình 3.17. Ảnh hưởng của môi trường nuôi cấy lên sinh trưởng và sinh hoạt tính

enzyme ở chủng E. coli C43(DE3) tái tổ hợp ....................................... 77

Hình 3.18. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính

endoglucanase của chủng E. coli C43(DE3) tái tổ hợp ......................... 79

Hình 3.19. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính

xii

β-glucosidase của chủng E. coli C43(DE3) tái tổ hợp ............ 79

Hình 3.20. Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện

endoglucanase_18736 của chủng tái tổ hợp .......................................... 81

Hình 3.21. Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện

β-glucosidase của chủng E. coli C43(DE3) tái tổ hợp...................... 81

Hình 3.22. Động thái sinh trưởng và sinh endoglucanase của chủng E. coli C43(DE3)

tái tổ hợp ................................................................................................. 82

Hình 3.23. Động thái sinh trưởng và sinh β-glucosidase của chủng E. coli C43(DE3)

tái tổ hợp ................................................................................................. 83

Hình 3.24. Điện di đồ SDS-PAGE (a) và Zymogram (b) của endoglucanase

tái tổ hợp ............................................................................................... 84

Hình 3.25. Điện di đồ SDS-PAGE (a) và Zymogram (b) của β-glucosidase

tái tổ hợp ............................................................................................... 84

Hình 3.26. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp...................... 86

Hình 3.27. Ảnh hưởng của pH lên hoạt tính endoglucanase tái tổ hợp .................. 87

Hình 3.28. Ảnh hưởng của pH lên hoạt tính β-glucosidase tái tổ hợp .................... 87

Hình 3.29. Ảnh hưởng của một số ion kim loại lên hoạt tính

endoglucanase_18736 .......................................................................... 88

Hình 3.30. Ảnh hưởng của một số ion kim loại lên hoạt tính β-

glucosidase_32768 ................................................................................ 88

Hình 3.31. Độ bền nhiệt của endoglucanase_18736 được khảo sát tại giá trị Topt

và pHopt .................................................................................................. 91

Hình 3.32. Độ bền nhiệt của β-glucosidase_32768 được khảo sát tại giá trị Topt

và pHopt .................................................................................................. 92

Hình 3.33. Khả năng thủy phân một số loại cơ chất của

endoglucanase_18736 và β-glucosidase_32768 .............................. 93

xiii

Hình 3.34. Động học enzyme tái tổ hợp .................................................................. 94

1

MỞ ĐẦU

Cellulase là nhóm enzyme thủy phân các liên kết β-1,4-glucoside trong phân tử

cellulose, oligosaccharide, disaccharide và một số cơ chất tương tự khác. Cellulase

được tổng hợp bởi cổ khuẩn, vi khuẩn, nấm mốc, động vật nguyên sinh, thực vật và

động vật. Enzyme này được ứng dụng rộng rãi trong công nghiệp thực phẩm, lên men

rượu, thức ăn gia súc, dệt may, giặt ủi, trong ngành công nghiệp giấy và bột giấy,...

Khi nguồn nguyên liệu hóa thạch dần cạn kiệt thì nhu cầu sử dụng các nguồn năng

lượng thay thế, có thể tái tạo và thân thiện với môi trường ngày càng tăng. Một trong

những nguồn năng lượng thay thế được quan tâm nhất hiện nay là nhiên liệu sinh học

từ sinh khối lignocellulose. Quá trình chuyển hóa lignocellulose thành các sản phẩm

có giá trị như nhiên liệu sinh học, nhựa sinh học, axit hữu cơ và các cụm hóa chất

kiến tạo khác thường được thực hiện ở các điều kiện đặc biệt như ở nhiệt độ cao, tiền

xử lý bằng kiềm hoặc axit hoặc trong dung môi hữu cơ… Do đó đòi hỏi các nhà khoa

học phải nghiên cứu tìm kiếm các cellulase mang những đặc tính mới (như bền với

nhiệt độ cao, chịu được áp suất cao, chịu được pH axit/kiềm, dung môi …) để đáp

ứng được các yêu cầu của quá trình chuyển hóa lignocellulose và hạ được giá thành

sản xuất.

Một trong những nguồn địa nhiệt có thể thu nhận cellulase bền nhiệt là nhóm vi

sinh vật ưa nhiệt ở suối nước nóng. Tuy nhiên, sử dụng các phương pháp phân lập,

nuôi cấy vi sinh vật truyền thống không thể khai thác hết được tiềm năng của vật liệu

di truyền trong hệ sinh thái này vì có tới 99% các loài vi sinh vật sống trong môi

trường là các loài không nuôi cấy được. Hơn nữa, do đặc tính riêng của hệ sinh thái

suối nước nóng có mật độ vi sinh vật thấp hơn rất nhiều so với các môi trường bình

thường khác, vì vậy việc thu nhận được các loài vi sinh vật mới để khai thác nguồn gen

của chúng bằng phương pháp nuôi cấy thông thường gặp nhiều khó khăn.

Ngày nay, nhờ sự tiến bộ của công nghệ giải trình tự gen thế hệ mới, việc tách

dòng các gen mới có thể được thực hiện bằng cách tiếp cận cơ sở dữ liệu metagenome

kết hợp với các phần mềm tin sinh để dự đoán tính chất của protein tiềm năng trước

khi biểu hiện và nghiên cứu đặc tính của enzyme tái tổ hợp. Thông qua cách tiếp cận

2

này, các nhà nghiên cứu không chỉ đánh giá được mức độ đa dạng vi sinh vật ở trong

một hệ sinh thái mà còn bảo tồn và khai thác được các gen mới hoặc các protein có

tính chất đặc biệt từ các vi sinh vật đó.

Với mong muốn có thể đánh giá đa dạng vi sinh vật, đồng thời tiếp cận và khai

thác được nguồn cellulase bền nhiệt mới từ suối nước nóng Bình Châu - suối nước

nóng có nhiệt độ cao thứ hai ở Việt Nam không thông qua nuôi cấy, chúng tôi đã tiến

hành nghiên cứu, thực hiện đề tài: “Nghiên cứu đánh giá đa dạng vi sinh vật, sàng

lọc, thu nhận và xác định tính chất của cellulase suối nước nóng Bình Châu, Việt

Nam bằng kỹ thuật Metagenomics”.

MỤC TIÊU NGHIÊN CỨU

Thông qua kết quả giải trình tự DNA metagenome vi sinh vật suối nước nóng

Bình Châu bằng hệ thống giải trình tự gen thế hệ mới, (i) Đánh giá được nguồn đa

dạng vi sinh vật ưa nhiệt và xây dựng được bộ dữ liệu các gen mã hóa cho cellulase;

ii) Biểu hiện được các cellulase tái tổ hợp đồng thời (iii) Tinh sạch và xác định được

tính chất của các cellulase tái tổ hợp này.

NỘI DUNG NGHIÊN CỨU

- Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng

Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu các gen mã hóa cho

cellulase.

- Biểu hiện gen mới mã hóa cho cellulase (endoglucanase và β-glucosidase)

chịu nhiệt tiềm năng được lựa chọn từ bộ dữ liệu DNA metagenome.

- Tinh sạch và xác định tính chất của các cellulase tái tổ hợp.

NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN

- Đã xây dựng được bộ dữ liệu DNA metagenome của vi khuẩn và cổ khuẩn

suối nước nóng Bình Châu với kích thước 9,4 Gb độ bao phủ trên 60%. Qua phân

tích đã xác định được đa dạng vi sinh vật và gen mã hóa enzyme thủy phân cellulose,

lựa chọn được hai gen mới (có độ tương đồng thấp 50,35% và 53,94%) mã hóa cho

hai enzyme tương ứng là endoglucanase và beta-glucosidase.

- Đã biểu hiện, tinh sạch và nghiên cứu tính chất sinh học của endoglucanase và

beta-glucosidase. Đã xác định được Vmax và Km của hai enzyme này.

3

CHƯƠNG 1

TỔNG QUAN TÀI LIỆU

1.1. Khu hệ vi sinh vật trong suối nước nóng

Suối nước nóng đã được nghiên cứu từ thế kỷ XIX. Các nghiên cứu đầu tiên về

suối nước nóng chỉ tập trung vào nghiên cứu tính chất hóa lý và đặc điểm địa chất,

còn nghiên cứu về vi sinh vật sống trong hệ sinh thái này chỉ mới bắt đầu vào giữa

thế kỷ XX (Marsh và Larsen, 1953). Nhiệt độ trong suối nước nóng thường vượt quá

giới hạn phát triển của sinh vật nhân thật. Do đó, vi sinh vật trong hệ sinh thái này

chủ yếu là nhóm vi khuẩn, cổ khuẩn và virus (López-López và cs., 2013).

Vi sinh vật sống ở nhiệt độ cao được phân vào hai nhóm chính là vi sinh vật ưa

nhiệt - thermophiles (nhiệt độ sinh trưởng tối ưu > 50ºC) và vi sinh vật siêu ưa nhiệt

- hyperthermophiles (nhiệt độ sinh trưởng tối ưu > 80ºC). Các vi sinh vật này đóng

vai trò trung tâm trong chu trình phân hủy các hợp chất hữu cơ và chu trình hóa sinh

địa (Merino và cs., 2019).

Vi sinh vật trong suối nước nóng thường không đa dạng và phong phú bằng các

môi trường thủy vực khác. Để nghiên cứu khu hệ vi sinh vật trong suối nước nóng,

các nhà khoa học có thể tiếp cận bằng phương pháp nuôi cấy và/ hoặc không thông

qua nuôi cấy. Sử dụng phương pháp nuôi cấy, nhiều loài vi khuẩn và cổ khuẩn đã

được phân lập từ các suối nước nóng khác nhau trên thế giới. Từ các suối nước nóng

nằm trong công viên quốc gia Yellowstone (Mỹ), các nhà khoa học đã phân lập được

nhiều loài vi khuẩn và cổ khuẩn: Achnanthes exigua, Archaeoglobus spp, Bacillus

coagulans, Clostridium thermoautotrophicum, Sulfolobus acidocaldarius,

Thermoleophilum album, Thiobacillus thiooxidans (Resources, 1997). Đây là các loài

có nhiệt độ sinh trưởng cao hoặc cực cao. Sử dụng phương pháp này, nhiều loài vi

khuẩn và cổ khuẩn mới cũng đã được phát hiện như Caldivirga maquilingensis gen.

nov., sp. nov đã được phân lập từ suối nước nóng ở Phillipines (Itoh và cs., 1999);

Vulcanisaeta distribute gen. nov., sp. nov. và Vulcanisaeta souniana sp. nov. đã được

tìm thấy trong suối nước nóng ở Nhật Bản (Itoh và cs., 2002); Fervidicoccus fontis

gen. nov., sp. nov. đã được thu nhận ở suối nước nóng tại vùng Kamchatka Peninsula,

Nga (Perevalova và cs., 2010).

4

Mặc dù nhiều chủng, loài vi sinh vật khác nhau từ các suối nước nóng trên Thế

giới đã được phân lập và phân loại, nhưng số lượng những loài chưa thể phân lập

được vẫn còn rất lớn, do đó không thể tiếp cận được các vi sinh vật bản địa, nắm bắt

được vai trò của chúng trong các chu trình chuyển hóa vật chất cũng như thu nhận

được các chất có hoạt tính sinh học từ hệ sinh thái này. Sự ra đời của máy giải trình

tự gen thế hệ mới được đánh giá là một công nghệ tiên tiến của ngành công nghệ sinh

học, khi kết hợp với các công cụ tin sinh sẽ tạo thành kỹ thuật Metagenomic (kỹ thuật

phân tích hệ gen môi trường), cho phép các nhà khoa học có điều kiện tiếp cận, bảo

tồn và khai thác nguồn vi sinh vật một cách đầy đủ và toàn diện hơn. Hiệu quả của

phương pháp này đã được chứng minh rõ rệt khi phân tích về số lượng, thành phần

chủng loại của quần xã vi khuẩn trong suối nước nóng Comano Terme (Ý) so với

phương pháp nuôi cấy thông thường (Pedron và cs., 2019). Kết quả đánh giá đa dạng

không thông qua nuôi cấy có thể bao phủ toàn bộ số liệu về chủng loại vi khuẩn phân

lập được, do vậy bức tranh về quần xã vi sinh vật trong các hệ sinh thái suối nước

nóng trở lên phong phú và đa dạng hơn. Trong các nghiên cứu trước đây, hầu hết các

vi khuẩn phân lập được từ suối nước nóng Ma'in và Afra ở Jordanian thuộc chi

Bacillus, Geobacillus và Anoxybacillus (Malkawi và Al-Omari, 2010; Al-Batayneh

và cs., 2011), tuy nhiên sử dụng kỹ thuật Metagenomics cho thấy vi sinh vật trong

hai suối nước nóng này đa dạng hơn rất nhiều với sự có mặt của các loài thuộc ngành

Proteobacteria, Bacteroidetes, Firmicutes, Deinococcus, Verrucomicrobia,

Planctomycetes và Chloroflexi (Hussein và cs., 2017).

Sự phân bố và thành phần vi sinh vật trong mỗi suối nước nóng mang các đặc

trưng riêng biệt, thường bị tác động bởi các yếu tố như nhiệt độ, thành phần hóa học

và pH của suối nước nóng (López-López và cs., 2013). Nhiệt độ được coi là yếu tố

chính ảnh hưởng đến số lượng và thành phần của quần xã vi sinh vật ở các vị trí khác

nhau trong suối nước nóng. Nhiệt độ trong suối nước nóng giới hạn sự sống sót của

các sinh vật nhân thật (nhiệt độ giới hạn của chúng thường < 60ºC) và các sinh vật

quang hợp (70°C). Ví dụ quần thể vi sinh vật ở suối nước nóng ven biển Iceland chịu

tác động mạnh mẽ của sự thay đổi nhiệt độ và độ mặn do ảnh hưởng của thủy triều

cao định kỳ. Nhóm vi khuẩn siêu ưa nhiệt chiếm ưu thế tại các vị trí có thời gian nóng

5

kéo dài nhất, trong khi nhóm vi sinh vật ưa nhiệt vừa phải, các vi sinh vật biển, các

Proteobacteria ưa ấm được tìm thấy ở các khu vực có thời gian nóng ngắn nhất (Hobel

và cs., 2005). Ảnh hưởng của nhiệt độ lên sự phân bố vi sinh vật dọc theo dòng chảy

của suối nước nóng Octopus (suối nước nóng kiềm với pH=8,5, có nồng độ sulfide

thấp) nằm trong công viên quốc gia Yellowstone cũng được nghiên cứu. Ở vị trí cách

miệng giếng phun 2 m có nhiệt độ khoảng 88°C chỉ tìm thấy các loài vi khuẩn thuộc

chi Aquifex - tế bào có màu tím hồng, hóa tự dưỡng vô cơ. Dọc theo dòng chảy, càng

ra xa miệng giếng phun, nhiệt độ càng giảm. Ở nhiệt độ khoảng 45-72oC, các loài vi

khuẩn lam Cyanobacteria phát triển tạo thành các đám trên mặt nước. Trong số các

chi vi khuẩn lam, Synechococcus có khả năng chịu nhiệt cao nhất (~ 72oC) tạo thành

quần thể bên trên che phủ cho tầng dưới là quần thể của chi Chloroflexus - một loại

vi khuẩn lam màu xanh lá cây, quang hợp không thải khí oxy. Ngoài ra, các chi vi

khuẩn lam khác như Phormidium và Calothrix cũng được tìm thấy trong dòng chảy

của suối nước nóng Octopus ở các vị trí có nhiệt độ thấp hơn (Rothschild và

Mancinelli, 2001). Ngoài yếu tố nhiệt độ, cấu trúc các quần xã vi sinh vật suối nước

nóng có thể bị ảnh hưởng bởi các yếu tố khác như đặc điểm địa hóa, hoặc sự kết hợp

giữa hai yếu tố nhiệt độ và pH. Ngoài các yếu tố nhiệt độ, thành phần hóa học, pH,

quần xã vi sinh vật trong suối nước nóng còn có thể chịu sự tác động của khoảng cách

địa lý. Một số loài vi sinh vật có thể có mặt ở tất cả các suối nước nóng. Tuy nhiên,

bên cạnh đó cũng có những loài được cho là đặc hữu của một khu vực suối nước

nóng. Vai trò của khoảng cách địa lý còn gây tranh cãi, nhưng có thể là một yếu tố

quan trọng ảnh hưởng đến quần thể xạ khuẩn và vi khuẩn lam theo một số nghiên cứu

nhưng không đại diện cho các quần thể vi sinh vật khác (Valverde và cs., 2012;

López-López và cs., 2013).

Mỗi suối nước nóng thường đặc trưng bởi một vài nhóm vi sinh vật chiếm ưu

thế. Các nghiên cứu từ trước cho đến nay đều thấy Proteobacteria là ngành chiếm ưu

thế trong các suối nước nóng ở Châu Phi (Tekere và cs., 2011), trong khi đó nhóm cổ

khuẩn thuộc bộ Thermoplasmatales (chiếm 39%) thuộc ngành Euryarchaeota, và một

nhóm cổ khuẩn khác (chiếm 33%) thuộc ngành Crenarchaeota lại là các nhóm ưu thế

trong hệ sinh thái nước ngầm ở những vùng địa nhiệt ở Nga. Cả hai ngành này đều là

6

những ngành có mặt trong các suối nước nóng trên toàn thế giới. Tuy nhiên, nhóm vi

khuẩn chiếm ưu thế trong hệ sinh thái này chủ yếu lại là vi khuẩn chuyển hóa

methane, ưa axit, ưa nhiệt và vi khuẩn oxy hóa lưu huỳnh. Đây là các vi khuẩn có thể

sử dụng các hợp chất vô cơ có nguồn gốc từ núi lửa để sinh trưởng (Mardanov và cs.,

2011). Phân tích các đặc điểm phân loại của quần xã vi sinh vật trong suối nước nóng

có tính axit ở Colombia cho thấy chỉ một tỷ lệ nhỏ các trình tự nucleotide trong DNA

metagenome có thể được phân loại đến loài dựa vào các cơ sở dữ liệu hiện có, hầu

hết vi sinh vật trong suối nước nóng là các loài mới, chưa được phân lập và phân loại.

Những vi sinh vật được phân loại có tiềm năng tham gia vào các chu trình chuyển

hóa nitơ và lưu huỳnh trong môi trường (Jimenez và cs., 2012). Nghiên cứu suối nước

nóng Sungai Klah (SK) là suối nước nóng kiềm (pH 7,0 - 9,0), có nhiệt độ cao thứ

hai ở Malaysia (50 - 110°C) cho thấy ngành Proteobacteria và Firmicutes là hai ngành

chiếm ưu thế (Chan và cs., 2015). Kết quả này cũng phù hợp với kết quả nghiên cứu

về vi sinh vật ở suối nước nóng Kenya - suối nước nóng kiềm (pH 9,2 - 9,8), nhiệt độ

45,1 - 83,6ºC (Kambura và cs., 2016). Ngược lại, ngành Proteobacteria và Thermi

chiếm ưu thế ở suối nước nóng axit nhẹ (pH 5 - 7), có nhiệt độ 45 - 90ºC (Paul và cs.,

2016). Điều đó chứng tỏ, mức độ đa dạng và phân bố của vi sinh vật trong suối nước

nóng cũng bị ảnh hưởng rất nhiều bởi pH hệ sinh thái.

1.2. Cellulase

1.2.1. Phân loại

Dựa vào cơ chế hoạt động của các domain xúc tác và tính đặc hiệu cơ chất,

cellulase được chia thành 3 dạng chính: β-1,4-endoglucanase (EC 3.2.1.4),

exoglucanase [cellobiohydrolase phân giải cơ chất từ đầu không khử (EC 3.2.1.91),

cellobiohydrolase phân giải cơ chất từ đầu khử (EC 3.2.1.176) và cellodextrinase (EC

3.2.1.74)] và β-glucosidase (EC 3.2.1.21). Endoglucanase phân cắt ngẫu nhiên các

liên kết glycoside nội mạch của chuỗi cellulose, giải phóng ra các oligosaccharide có

chiều dài khác nhau (như cellobiose và cellotriose). Cellobiohydrolase hoạt động

phân cắt trên các đầu khử và không khử của cellulose, giải phóng cellobiose là chủ

yếu, ngoài ra còn giải phóng ra các oligosaccharide mạch ngắn khác. Cellodextrinase

hoạt động trên các cellooligosaccharide hòa tan và nó cũng giải phóng ra cellobiose.

7

Cuối cùng, β-glucosidases thủy phân cellodextrin và cellobiose để tạo thành glucose,

kích hoạt cả endoglucanase và exoglucanase bằng cách làm giảm sự ức chế của sản

phẩm cuối cùng (Hình 1.1).

Chú thích: Cellulose tinh thể (màu đỏ), cellulose vô định hình (màu đen).

Hình 1.1. Nguyên tắc hoạt động của cellulase thủy phân cellulose.

(Nguồn: Juturu và Wu (2014)).

Do polysaccharide rất đa dạng trong tự nhiên và thực tế cho thấy không phải lúc

nào cũng dễ dàng phân loại cellulase thành endo- hoặc exoglucanase (Poidevin và

cs., 2013) nên dựa trên mức độ tương đồng về trình tự axit amin và cấu trúc tinh thể,

cellulase được xếp vào họ enzyme thủy phân glycoside (glycoside hydrolase - GH).

Cách phân loại này không chỉ phản ánh mối quan hệ giữa cấu trúc và chức năng, cơ

chế nhận biết cơ chất và phản ứng enzyme mà nó còn phản ánh mối quan hệ tiến hóa

giữa các enzyme. Các enzyme thuộc các họ GH khác nhau được tập hợp trong cơ sở

dữ liệu enzyme có hoạt tính carbohydrate (Carbohydrate-Active Enzymes Database)

(http://www.cazy.org). Số lượng các enzyme mới liên tục được cập nhật ở cơ sở dữ

liệu này, trung bình mỗi năm có thêm khoảng 5 họ GH mới (Helbert và cs., 2019).

Tính đến thời điểm tháng 9 năm 2019 số lượng họ GH trong cơ sở dữ liệu CAZy là

165 họ GH, trong đó endoglucanase chủ yếu hiện diện ở 15 họ GH, bao gồm GH5-

10, GH12, GH26, GH44, GH45, GH48, GH51, GH74, GH124 và GH148;

8

cellobiohydrolase hoạt động trên các đầu không khử hiện diện ở 3 họ GH5, GH6 và

GH9; cellobiohydrolase hoạt động trên các đầu khử hiện diện ở 3 họ GH7, GH9 và

GH48; cellodextrinase hiện diện ở 4 họ GH1, GH3, GH5 và GH9; và cuối cùng, β-

glucosidase hiện diện ở 9 họ GH1-3, GH5, GH9, GH16, GH30, GH39 và GH116

(http://www.cazy.org).

Bảng 1.1. Phân bố của cellulase vào các họ GH khác nhau.

Loại Enzyme

Cơ chế

Cấu trúc 3D

Nucleophile/ Bazơ xúc tác

Chất cho proton xúc tác

Họ GH

Nhóm lớn (Clan)

Giữ lại GH-A

(β/α)8

Glu

1

Glu

β-Glucosidase; exo-β- 1,4-glucanase

Giữ lại

-

-

Asp

3

Glu

β-Glucosidase; glucan- 1,4-β-glucosidase

Giữ lại GH-A

(β/α)8

Glu

5

Glu

Endo-β-1,4-Glucanase; β-Glucosidase; exo-β-1,4-glucanase; β-1,4-cellobiosidase

-

-

Asp

6

Asp

Endo-β-1,4-Glucanase; cellobiohydrolase

Đảo ngược

-

Endo-β-1,4-Glucanase Giữ lại

β-jelly roll

Glu

7

Glu

Endo-β-1,4-Glucanase

GH-M

(α/α)6

Asp

8

Glu

Đảo ngược

-

(α/α)6

Asp

9

Glu

Đảo ngược

Endo-β-1,4-Glucanase; β-Glucosidase; exo-β-1,4-glucanase; cellobiohydrolase

Endo-β-1,4-Glucanase Giữ lại GH-C

β-jelly roll

Glu

12

Glu

β-Glucosidase

Giữ lại GH-A

(β/α)8

Glu

30

Glu

-

Endo-β-1,4-Glucanase Giữ lại

(β/α)8

Glu

44

Glu

-

Endo-β-1,4-Glucanase

-

Asp

45

Asp

Đảo ngược

48

Endo-β-1,4-Glucanase

GH-M

(α/α)6

-

Glu

Đảo ngược

Endo-β-1,4-Glucanase Giữ lại GH-A

(β/α)8

Glu

51

Glu

-

Endo-β-1,4-Glucanase

Asp

74

Asp

Seven fold β-propeller

Đảo ngược

-

116 β-Glucosidase

Giữ lại

Glu

Glu

-

124 Endo-β-1,4-Glucanase

-

-

-

Đảo ngược

(Nguồn: Sharma và Yazdani (2016)).

9

Mặc dù được phân loại vào cùng một họ GH nhưng các enzyme riêng biệt vẫn

có thể khác nhau về tính đặc hiệu cơ chất và nguồn gốc tiến hóa như trong trường

hợp họ GH5 bao gồm cả cellulase, xylanase và mannase. Điều này cho thấy sự tiến

hóa từ tâm hoạt động của enzyme để có thể phù hợp với các cơ chất khác nhau. Mặt

khác, do sự tiến hóa tập trung của các kiểu cuộn gấp khác nhau trong tâm hoạt

động mà các enzyme thuộc các họ GH khác nhau vẫn có thể thủy phân cùng một

cơ chất (Duan và Feng, 2010; Lopez-Mondejar và cs., 2016; Tiwari và cs., 2018).

Nghiên cứu cơ sở dữ liệu CAZy cũng cho thấy một số họ như họ GH1 và GH5 là

họ cellulase của vi khuẩn, nấm mốc và cổ khuẩn; họ GH30 và GH48 là họ enzyme thủy

phân của nấm mốc; họ GH8 và GH44 là họ enzyme thủy phân của vi khuẩn (Bảng 1.1).

Mặt khác, một chủng vi sinh vật có thể sinh tổng hợp nhiều loại cellulase thuộc một

số họ với các kiểu cuộn gấp và cơ chế xúc tác khác nhau. Do đó, có thể khẳng định

rằng cellulase là một nhóm phức hợp các enzyme dường như đã phát triển từ cùng

một kiểu cuộn gấp cơ bản. Sự đa dạng phổ biến trong các họ cellulase phản ánh tính

không đồng nhất của cơ chất, bao gồm cellulose và các polysaccharide liên quan cấu

thành sinh khối thực vật và cũng là đa dạng nơi sống của vi sinh vật – nơi mà quá

trình thủy phân diễn ra (Sharma và Yazdani, 2016).

1.2.2. Đặc điểm hóa sinh

1.2.2.1. Cấu trúc

Cellulase có cấu trúc gồm các module xúc tác và module không xúc tác. Các

module xúc tác của cellulase được phân loại thành nhiều họ dựa vào trình tự axit amin

và cấu trúc tinh thể của chúng. Các module liên kết carbohydrate - không xúc tác

(CBM) và/ hoặc các module đã biết hoặc chưa biết chức năng khác có thể nằm ở đầu

N hoặc đầu C của module xúc tác. Cellulase của nấm và vi khuẩn thường có hai hoặc

nhiều domain cấu trúc và chức năng.

Dựa vào thành phần enzyme có thể chia cellulase này thành hai loại cấu trúc:

(i) không tạo thành phức hợp hoặc (ii) tạo thành phức hợp đa enzyme (cellulosome).

Dạng cellulase không tạo thành phức hợp thường được sinh tổng hợp bởi vi sinh vật hiếu

khí phân giải cellulose, có cấu tạo gồm một vùng xúc tác (Catalytic domain – CD) gắn kết

10

với vùng liên kết cellulose (cellulose-binding domain – CBD) qua cầu nối peptide linh

hoạt (Hình 1.2). Ngược lại, hầu hết các vi sinh vật kỵ khí tạo ra một phức hợp cellulase

đa enzyme gọi là cellulosome. Cellulosome là một thể thống nhất, cấu tạo gồm có

vùng xúc tác (CD) gắn kết với vùng dockerin. Phức hợp cellulosome gồm nhiều

protein gắn lên trên bề mặt màng tế bào để thực hiện chức năng giống như các

cellulase dạng không tạo thành phức hợp (Hình 1.3). Ngoài hai domain chính, trong

cấu trúc cellulosome còn có một số domain khác như domain tương đồng lớp bề mặt

(Surface layer homology (SLH) domain), domain 111 dạng fibronectin, domain giống

NodB và các vùng chưa biết chức năng khác. Các domain này thường liên kết với nhau

qua chuỗi liên kết giàu axit amin Pro, Thr và Ser. Trong số tất cả các domain này, CD và

CBD là hai domain quan trọng nhất bởi vì chúng là thành viên chính tham gia vào cơ chế

thủy phân của enzyme (Jayasekara và Ratnayake, 2019).

Trong enzyme, tâm hoạt động thường nằm ở vùng xúc tác CD và có cấu trúc

thuộc một trong ba dạng: dạng túi (pocket), dạng đường hầm (tunnel) và dạng

khe/rãnh (cleft) (Hình 1.4). Hầu hết endoglucanase có tâm hoạt động dạng khe/rãnh,

exoglucanase có tâm hoạt động dạng đường hầm, còn β-glucosidase có tâm hoạt động

dạng túi (Davies và Henrissat, 1995).

Hình 1.2. Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ nấm

Chú thích: Enzyme có mang vùng CBM (xanh nhạt) được nối với vùng xúc tác lớn bởi cầu

nối linh hoạt (màu vàng); chuỗi cellulose (màu xanh lá cây).

Trichoderma reesei.

(Nguồn: Sanchez Hernandez (2019)).

11

Chú thích: Cellulosome A bao gồm ScaA, ScaB và ScaC, liên kết với nhau thông qua các tương tác cohesin-dockerin đặc biệt. ScaA chứa một cohesin dạng I cho phép enzym chứa

bảy dockerin gắn vào cellulosome. ScaA cũng chứa module liên kết với cellulose (CBM) và module xúc tác thuộc họ GH9. ScaB hoạt động như một cầu nối giữa ScaA và ScaC, đồng

thời ScaB cho phép bốn protein ScaA liên kết với cohesin dạng II của nó. Mặt khác scaffoldin dạng I, ScaC, có thể liên kết một cách chọn lọc với ba protein ScaB và gắn toàn bộ

cellulosome lên bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt (SLH) của nó. Cellulosome B chứa hai scaffoldin, ScaA và ScaD. ScaD cũng cố định cellulosome vào bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt và có thể liên kết hai protein ScaA

bằng hai cohesin dạng II của nó. ScaD cũng có thể liên kết với enzyme chứa dockerin dạng I thông qua cohesin dạng I của nó.

Hình 1.3. Cấu trúc cellulosome của A. cellulolyticus.

(Nguồn: Hamberg và cs. (2014)).

Chú thích: a) Dạng túi; b) dạng khe/rãnh; c) dạng đường hầm. Axit amin xúc tác có màu đỏ.

Hình 1.4. Ba dạng tâm hoạt động của các họ GH.

(Nguồn: Davies và Henrissat (1995)).

12

1.2.2.2. Cơ chế xúc tác

Cellulase xúc tác cho quá trình phân hủy mạch polysaccharide của cellulose

bằng cách phá vỡ các liên kết β-1,4-glycoside. Ba loại enzyme chính tham gia vào

quá trình thủy phân các vi sợi cellulose trong thành tế bào thực vật gồm:

endoglucanase, exoglucanase và β-glucosidase. Quá trình thủy phân hoàn toàn

cellulose hình thành nên một loạt các chất trung gian dưới sự xúc tác đồng thời của

cả ba loại enzyme chính này. Endoglucanase thường tấn công vào các vùng vô định

hình của cellulose. Enzyme này thuỷ phân các liên kết lỏng lẻo nội phân tử ở vùng

vô định hình của cellulose để tạo ra các chuỗi mới. Những chuỗi mới này sau đó dễ

dàng bị tấn công bởi các loại enzyme khác. Hoạt tính enzyme cao nhất thường đạt

được trên cơ chất cellulose dạng hòa tan hoặc cellulose vô định hình đã được xử lý

bằng axit. Exoglucanase có chức năng thủy phân đầu khử và không khử của cellulose

để tạo ra glucose hoặc cellobiose. Exoglucanase khác với endoglucanase ở chỗ có

khả năng thủy phân cơ chất cellulose tinh thể như avicel hoặc cellooligosaccharide.

Cuối cùng, β-glucosidase có thể thủy phân cellobiose thành glucose từ các đầu không

khử và β-glucosidase bị bất hoạt khi phản ứng với cellulose vô định hình hoặc

cellulose tinh thể. Mặc dù cơ chế chính xác vẫn chưa được hoàn thiện, tuy nhiên đã

quan sát thấy sự phân mảnh của cellulose thành các sợi ngắn trước khi phát hiện thấy

đường khử trong quá trình thủy phân (Jayasekara và Ratnayake, 2019).

Cellulase có hai cơ chế xúc tác: giữ lại và đảo ngược. Cellulase cắt các liên kết

glucoside bằng cách sử dụng nhóm xúc tác axit – bazơ. Quá trình thủy phân được

thực hiện bởi hai nhóm xúc tác của enzyme, trong đó một nhóm là axit (đóng vai trò

là chất cho proton) và một nhóm là nucleophile/bazơ. Cơ chế xúc tác xảy ra phụ thuộc

vào vị trí không gian của nhóm xúc tác. Duy trì và đảo ngược cấu hình dị thường của

cellulase là hai cơ chế thủy phân cellulose. Trong cơ chế đảo ngược, cấu hình C dị

thường của cellulase đã bị đảo ngược sau khi thủy phân dịch chuyển nucleophilic đơn

(Hình 1.5A). Còn trong cơ chế giữ lại, cellulase giữ nguyên cấu hình C dị thường

mang liên kết glucoside đích ngay cả khi đã có sự dịch chuyển kép của hai axit amin

glycosyl hóa hoặc khử glycosyl hóa chìa khóa trong quá trình thủy phân (Hình 1.5B)

(Vocadlo và Davies, 2008).

13

Chú thích: (A) Cơ chế đảo ngược; (B) Cơ chế giữ lại.

Hình 1.5. Hai cơ chế xúc tác của GHsa.

(Nguồn: Payne và cs. (2015)).

1.2.2.3. Cơ chế gắn kết và tính đặc hiệu cơ chất

Cơ chế gắn kết và tính đặc hiệu cơ chất là một trong những đặc tính hóa sinh

của enzyme. Ngoài cellulose, cellulase còn có thể thủy phân xylan, lichenan và

mannan. Cellulase Cel5E của Pseudomonas fluorescens có khả năng thủy phân CMC,

lichenan, avicel và cellulose trương nở bởi axit nhưng lại bị bất hoạt hoàn toàn trên

cơ chất xylan (Hall và cs., 1995). Trong khi cũng thuộc họ GH5, cellulase CelG của

Fibrobacter succinogenes S85 lại có khả năng thủy phân hoàn toàn CMC và xylan

nhưng lại bị bất hoạt hoàn toàn trên cơ chất avicel và lichenan (Iyo và Forsberg,

1996). Ngược lại, một số cellulase chỉ hoạt động trên các dẫn xuất của cellulose.

Chẳng hạn, cellulase cel5B thuộc họ GH5 sinh tổng hợp bởi Thermobifida fusca, chỉ

có thể thủy phân các cơ chất chứa cellulose như CMC, avicel và MN300 (sợi cellulose

tự nhiên) nhưng lại bị bất hoạt hoàn toàn trên các cơ chất khác (Posta và cs., 2004).

Do đó, CMC được sử dụng như là cơ chất đặc hiệu chung để phát hiện cellulase. Tuy

14

nhiên, các cơ chế gắn kết và tính đặc hiệu cơ chất của cellulase trên các cơ chất khác

ngoài CMC còn rất ít thông tin (Sukharnikov và cs., 2011).

1.2.2.4. Các chất ức chế và cofactors

 Ảnh hưởng của các ion kim loại lên hoạt tính cellulase

Các ion kim loại có thể liên kết với protein và cũng có thể tạo thành phức chất

với các phân tử khác khi liên kết với enzyme. Các ion này đóng vai trò là chất cho

hoặc nhận điện tử hoặc chất điều chỉnh cấu trúc. Các ion kim loại có thể làm tăng

hoặc ức chế hoạt tính enzyme bằng cách tương tác với các nhóm amine hoặc nhóm

axit carboxylic của các axit amin. Ảnh hưởng của các ion kim loại lên hoạt tính của

enzyme thủy phân lignocellulose nói chung và của cellulase nói riêng đã được Pereira

và cs. (2017) đề cập. Ngoài ra, hoạt tính cellulase của vi sinh vật ở suối nước nóng

cũng bị ảnh hưởng bởi một số ion kim loại như trong tóm tắt ở Bảng 1.2.

Bảng 1.2. Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật

ở suối nước nóng.

Enzyme

Nguồn gốc

Kim loại làm tăng hoạt

Kim loại làm

TLTK

tính enzyme

mất hoạt tính

enzyme

Endoglucanase Bacillus licheniformis

Ca2+, K+

Cu2+, Zn2+

Thankappan và

KBFB3

cs. (2018)

Endoglucanase

Ca2+, Mn2+, Mg2+

K+, Zn2+, Li+,

Zarafeta và cs.

Na+, Cu2+ , Fe3+

(2016)

Endoglucanase Bacillus sp. PW1

Ca2+, Ni2+, Co2+, Cu2+ ,

Sharma và cs.

và Bacillus sp.

Fe2+, Zn2+, Mg2+ , Mn2+

(2019)

PW2

và Hg2+

Bacillus

CMCase

Mg2+và Cu2+

K+, Zn2+, Co2+,

Azadian và cs.

sonorensis HSC7

Mn2+,

(2017)

Fe2+,Ca2+, Hg2+

β-Glucosidase DNA metagenome Ở nồng độ 1mM gồm:

Mn2+, Ni2+, Sr2+ Schroder và cs.

Al3+, Ca2+, Co2+, Cr3+,

(2014)

Fe2+, Fe3+, K+, Mg2+,

Rb+; ở nồng độ 5mM

gồm: Mg2+, Rb+

15

Các ion kim loại hóa trị I, II và III như Na+, K+, Ca2+, Mg2+, Mn2+, Fe2+, Co2+, Cu2+, Ni2+, Zn2+, Hg2+ và Fe3+ thường được nghiên cứu trong quá trình phân tích đặc

tính của cellulase. Bên cạnh đặc điểm về điện tích, kích thước bán kính ion cũng có

ảnh hưởng lớn đến hoạt tính và độ bền của enzyme. Một số nghiên cứu đã cho thấy

những ion có bán kính lớn hơn ít ảnh hưởng đến các axit amin xúc tác, trong khi

những ion có bán kính nhỏ hơn có thể hấp dẫn các axit amin tích điện mạnh hơn

làm thay đổi cấu trúc tổng thể của enzyme bằng việc phá hủy vị trí xúc tác (Zeng và

cs., 2014).

Tác dụng ức chế của Fe2+ và Cu2+ lên hoạt tính cellulase cũng đã được nghiên

cứu. Tuy nhiên, ảnh hưởng của các ion khác nhau có hóa trị II lên hoạt tính của

cellulase được sinh tổng hợp bởi các vi sinh vật khác nhau là khác nhau (Bảng 1.2).

Tác dụng của các ion hóa trị II lên cellulase không tuân theo quy luật rõ ràng và mức

độ ảnh hưởng khác nhau có thể do tác dụng của quá trình oxy hóa khử lên các axit

amin, làm tăng hoặc giảm hoạt tính của enzyme (Tejirian và Xu, 2010).

Ion Hg2+ ức chế cellulase do tương tác với các gốc axit amin xúc tác có chứa

lưu huỳnh dẫn đến quá trình oxy hóa và hình thành các liên kết disulfide bất thường

(Tejirian và Xu, 2010). Ion Fe2+ có thể tạo phức với D/L-Lys và L-Met (Vassilev và

cs., 2013), Cu2+ tạo phức với His và Ba2+ tạo phức với Arg, Glu, Pro, Ser và Val (Bush

và cs., 2008).

Sajadi (2010) đã đánh giá sự tương tác của các axit amin như Asp và Glu với

các ion kim loại và thiết lập thứ tự mức độ tương tác như sau: Ca2+ < Mg2+ < Mn2+ <

Zn2+ < Co2+ < Cu2+ (đối với aspartate); Ca2+ < Mg2+ < Mn2+ < Co2+ < Zn2+ < Cu2+ (đối

với glutamine).

 Ảnh hưởng của các tác nhân hóa học và các hợp chất hữu cơ lên hoạt tính

cellulase

Hoạt tính của cellulase có thể bị ảnh hưởng bởi các loại dược phẩm (ví dụ 2,3-

dichloride-1,4-nafthoquinone), thuốc diệt nấm (như phenylmercury acetate và

ethylen-bis-dithiocarbamate), các chất kháng sinh và chất khử trùng (như

Phenylmercury nitrate, 8-hydroxiquinoline và một số loại khác), đường (ức chế sản

phẩm cuối cùng), protein (các chất được tiết ra từ thực vật như cơ chế bảo vệ), các

hợp chất hữu cơ gắn với CBM, các sản phẩm từ phân hủy đường và lignin (như hợp

16

chất phenol), phụ gia thực phẩm (như Octyl gallate), hormone thực vật (auxin,

chẳng hạn như axit indoleacetic) và ion của chất rắn (Sodium azide – NaN3) (Pereira

và cs., 2017).

Các sản phẩm của quá trình thủy phân cellulose như cello-oligosaccharide và

cellobiose có thể ức chế hoạt tính tương ứng của endo- và exoglucanase. Quá trình

endoglucanase thủy phân xyloglucan và xylan có thể bị ức chế bởi chính sản phẩm

xylooligomer được giải phóng ra của phản ứng. Bổ sung xylanase vào môi trường

phản ứng là một cách thay thế để loại bỏ xylooligomer. β-Glucosidase bị ức chế bởi

glucose. Còn exoglucanase bị ức chế bởi các disaccharide (như cellobiose và

xylobiose) và monosaccharide (như mannose và galactose) (Pereira và cs., 2017).

Beta-glucosidase có thể bị ức chế bởi gluconolactone - sản phẩm của quá trình

oxy hóa cellulose bởi lytic polysaccharide monooxygenase (LPMO). Cellobiose và

các cơ chất khác của β-glucosidase cạnh tranh với gluconolactone và các sản phẩm

phân hủy bởi LPMO khác. Mặt khác, β-glucosidase có thể được kích hoạt bởi

soforose và lactose (Dhillon và cs., 2012; Pereira và cs., 2017).

Các loại đường được giải phóng ra khi thủy phân lignocellulose bằng enzyme

có thể bị phân hủy và chuyển hóa thành các hợp chất ức chế enzyme. Trong điều kiện

axit, glucose, mannose và galactose có thể được chuyển hóa thành các furan aldehyde

như hydroxymethylfurfurals (HMF). Ngược lại, HMF có thể được chuyển hóa thành

axit levulinic và axit formic (Jönsson và cs., 2013).

Tiền xử lý lignocellulose bằng kiềm hoặc axit, hoặc bằng các cách khác trong quá

trình thủy phân lignin bằng enzyme (có sự tham gia của laccase) có thể giải phóng các hợp

chất phenol như vanillin, syringaldehyde, axit trans-cinnamic và axit hydroxybenzoic. Các

hợp chất này là chất ức chế hoạt tính endo/exoglucanase và β-glucosidase do sự hiện diện

của các nhóm hydroxyl, carbonyl và methoxyl (Qin và cs., 2016).

Như đã đề cập ở trên, cellulase còn bị ức chế bởi một nhóm các chất có nguồn

gốc protein. Các protein ức chế xyloglucan endo-β-glucanase đặc hiệu (XEGIPs) có

mặt trong thành tế bào của một số loại rau như cà chua, thuốc lá và lúa mì. Đồng thời

các chất ức chế này cũng ức chế endoglucanase thủy phân xyloglucan. Những protein

17

trên là một phần của cơ chế bảo vệ ở thực vật chống lại mầm bệnh bằng cách hình

thành các phức chất có ái lực cao với enzyme (Pereira và cs., 2017).

Một yếu tố khác ảnh hưởng đến quá trình xúc tác của cellulase là sự tương tác

giữa enzyme với lignin, hiện tượng đó được gọi là liên kết (hấp phụ) không đặc hiệu.

Cellulase có thể hấp phụ lignin qua CBMs của chúng bằng cách sử dụng axit amin

đặc hiệu là Ala (Strobel và cs., 2015). Một số cellulase có hoạt tính xúc tác cao hơn

khi CBM bị loại bỏ bằng cách giảm hấp phụ không đặc hiệu lên lignin (Le Costaouëc

và cs., 2013).

Hấp phụ không đặc hiệu của cellulase lên lignin cũng có thể bị giảm bằng cách

thêm các chất hoạt động bề mặt vào môi trường phản ứng, làm tăng hiệu quả xúc tác

của enzyme. Tween 20, 40, 60, 80 và 100, triton X-100, polyethylen glycol (PEG)

cùng với các chất hoạt động bề mặt khác có xu hướng làm giảm sức căng bề mặt của

các chất hòa tan trong nước, có thể làm thay đổi tính chất của các chất lỏng như chất

tẩy rửa, nhũ hóa, bôi trơn và hòa tan. Các chất hoạt động bề mặt có thể làm giảm sự

hấp phụ không đặc hiệu của cellulase lên lignin, nó đóng vai trò là nhân tố kích hoạt

các enzyme này (Hsieh và cs., 2015).

Các tác nhân tạo phức (Chelating agent) như EDTA, ethylene glycol, β-

mercaptoethanol và DPPE (1,2-bis diphenylphosphino-ethylene) có thể làm tăng hoạt

tính của một số enzyme do các hợp chất này kết hợp với các ion kim loại có mặt trong

phản ứng làm cho tâm hoạt động của enzyme dễ dàng phản ứng với cơ chất. Đây

chính là ưu điểm của các tác nhân tạo phức đối với hoạt tính của enzyme. Ngược lại,

nhược điểm của các tác nhân tạo phức là làm cho enzyme bị phụ thuộc vào ion vô cơ

đã phân tách (Pereira và cs., 2017).

1.2.2.5. Cơ chế bền nhiệt

Các enzyme có thể (a) chịu được nhiệt độ cao, (b) cuộn xoắn ở nhiệt độ cao

và/ hoặc (c) có hoạt tính tối ưu ở nhiệt độ cao hơn được gọi là enzyme bền nhiệt

và/hoặc enzyme ưa nhiệt. Enzyme bền nhiệt khá ổn định ở nhiệt độ cao nơi mà

các enzyme ưa ấm bị biến tính làm hoạt tính tối ưu của enzyme bị mất hoặc giảm

(Turner và cs., 2007).

18

Độ bền nhiệt là một đặc tính do nhiều yếu tố tác động. Đặc tính này có thể là do

trình tự axit amin của protein hay do mức độ cuộn xoắn của nó quy định. Rất nhiều

nghiên cứu trên thế giới đã so sánh protein ưa ấm và protein bền nhiệt cho thấy các

yếu tố sau có thể làm tăng tính bền nhiệt như tỷ lệ của một số loại axit amin nào đó

trong trình tự enzyme (Kumar và cs., 2000), tăng tính kỵ nước (Gromiha và cs., 2013),

sự thay đổi của một axit amin đơn lẻ (Sandgren và cs., 2003), cấu trúc chặt chẽ của

protein, tỷ lệ của các axit amin có điện tích dương và sự thay đổi năng lượng tự do

Gibbs của quá trình hydrate hoá (Gromiha và cs., 2019). Nhìn chung, các protein ưa

nhiệt thường có tỷ lệ các axit amin kỵ nước và mang điện tích lớn hơn so với protein

ưa ấm. Các axit amin kỵ nước thường liên kết với nhau để tạo thành các trung tâm

của protein, làm hạn chế sự tiếp xúc với các dung môi hữu cơ tối đa, tạo các tương

tác van der Waals bền vững với các axit amin kỵ nước bên ngoài khác. Các nhóm

liên kết này thường tạo ra khoảng trống tối thiểu phía trong cấu trúc nhưng lại tạo

điều kiện tiếp cận trên bề mặt một cách tối đa. Theo đó, các protein ưa nhiệt thường

có tỷ lệ Val, Arg, Glu và Ile trung bình cao hơn so với các protein ưa ấm. Mặt khác,

các axit amin mang điện tích sẽ định dạng protein một cách phù hợp thông qua việc

hình thành các cầu muối disulfide, giúp ổn định cấu trúc trong quá trình cuộn xoắn

hơn so với các tương tác của các axit amin kỵ nước.

Mặc dù các nghiên cứu đã cố gắng xác định nhân tố chìa khóa quyết định mức

độ bền nhiệt của các họ protein, tuy nhiên cho đến nay cũng chưa có công bố nào đưa

ra được giả thuyết cũng như bằng chứng về đặc tính này một cách có quy luật.

Trong các nghiên cứu trước đây về endoglucanase bền nhiệt, Panasik và cs.

(2000) đã phân tích các yếu tố quyết định tính bền nhiệt của protein thuộc họ GH có

cấu trúc cuộn gấp (α/β)8 và chỉ ra rằng việc thiếu Gly trong các họ GH bền nhiệt (bao

gồm endoglucanase) đã được xác định là nhân tố ảnh hưởng đến độ bền nhiệt của

enzyme. Cấu trúc endoglucanase phổ biến được chia thành 3 dạng cuộn xoắn (α/β)8,

xoắn cuộn β, và (α/α)6. Việc phân tích các dữ liệu cấu trúc của enzyme cho thấy dạng

cuộn xoắn protein ảnh hưởng nhiều đến độ bền nhiệt của endoglucanase (Yennamalli

và cs., 2011). Khi so sánh trình tự của các endoglucanase bền nhiệt và ưa nhiệt, kết

19

quả cho thấy các axit amin Met và Arg cũng như các tương tác ion chiếm phần lớn

trong cấu trúc của enzyme bền nhiệt. Tuy nhiên, tỷ lệ lớn các axit amin này lại không

có ý nghĩa thống kê khi phân tích mức độ cuộn xoắn của protein. Chính kênh gắn cơ

chất và cấu trúc bậc 2 của enzyme là các yếu tố quyết định mức độ bền nhiệt của

chúng. Phân tích sự bắt cặp của các axit amin trong cấu trúc tương đồng về mức độ

cuộn xoắn giữa endoglucanase bền nhiệt và ưa nhiệt cho thấy sự thay đổi các vị trí

axit amin giữa hai loại enzyme này. Đối với cấu trúc xoắn cuộn β, axit amin Arg sẽ

được thay thế bởi Pro và các axit amin kỵ nước như Trp, Tyr, Phe, Ile, Met, Leu làm

giảm mức độ tương tác giữa các ion ở endoglucanase ưa ấm.

Trên cơ sở những cơ chế lý giải cho khả năng bền nhiệt của enzyme và protein

nói chung, cơ chế bền nhiệt của β-glucosidase cũng đã được nghiên cứu. Để nâng cao

khả năng bền nhiệt của UsBgl, Nam và cs. (2008) đã thiết kế một số điểm đột biến

trong đầu N và đầu C của UsBgl dựa trên trình tự và cấu trúc của β-glucosidase bền

nhiệt TmBglA ở vi khuẩn Thermotoga maritime. Kết quả là đầu N và đầu C đã tương

tác với nhau qua liên kết hydro, từ đó làm tăng khả năng hòa tan của protein cũng

như tăng hoạt tính xúc tác. Đồng thời, nhờ có tương tác này mà enzyme trở nên bền

hơn. Khả năng bền nhiệt của enzyme cũng được cho là do sự gia tăng về số lượng

của Pro, cầu liên kết tĩnh điện, các phân tử nước bên trong và sự liên kết của nhiều

tiểu phần trong cấu trúc bậc bốn của enzyme khi so sánh với enzyme ưa ấm.

1.2.2.6. Một số đặc điểm của cellulase bền nhiệt

Đặc điểm pH, nhiệt độ tối ưu và độ bền nhiệt là một trong những đặc tính quan

trọng của enzyme nói chung và cellulase bền nhiệt nói riêng. Các đặc điểm này là cơ

sở để định hướng ứng dụng enzyme vào các lĩnh vực khác nhau của cuộc sống.

Cellulase bền nhiệt được sinh tổng hợp chủ yếu từ vi khuẩn ưa nhiệt, cổ khuẩn, nấm

sợi ưa nhiệt và ưa ấm. Trong tự nhiên, các loài vi nấm có xu hướng sinh tổng hợp

nhiều cellulase hơn vi khuẩn, tuy nhiên, cellulase do vi khuẩn tạo ra lại là chất xúc

tác tốt hơn vì chúng ít bị ức chế ngược. Hơn nữa, vi khuẩn không chỉ sinh trưởng

nhanh mà nó còn có thể tạo enzyme tái tổ hợp cao hơn vi nấm. Vi khuẩn có khả năng

cư trú ở nhiều loại môi trường khác nhau như nhiệt độ cao, pH kiềm và pH axit; điều

20

đó đã giúp cho vi khuẩn tạo ra các chất xúc tác sinh học mang những đặc tính ổn định

trong điều kiện khắc nghiệt được tìm thấy trong các quá trình chuyển hóa sinh học

góp phần làm tăng tốc độ thủy phân và thu hồi sản phẩm một cách hiệu quả (Acharya

và Chaudhary, 2012). Bảng 1.3 mô tả đặc điểm của một số cellulase bền nhiệt.

Bảng 1.3. Đặc điểm của cellulase bền nhiệt.

Enzyme

Họ GH

Bền ở điều kiện

Nguồn

TLTK

Điều kiện tối ưu

Nhiệt độ

pH

12

≥ 100ºC

50%; 95ºC; 40h

EglA

6

Pyrococcus furiosus

(Bauer và cs., 1999)

CelA

6

95ºC

KXĐ

12

CelB

12

106ºC

6-6,6

Thermotoga neapolitana

Bok và cs. (1998)

50%; 106ºC; 130 phút 50%; 110ºC; 26 phút

EG

5

109ºC

5,5

Cổ khuẩn làm giàu

Graham và cs. (2011)

50%; 100ºC; 5 giờ 50%; 105ºC; 0,57 giờ 50%; 108ºC; 0,17 giờ

EG

12

80ºC

1,8

50%; 80ºC; 8 giờ

Sulfolobus solfataricus

Huang và cs. (2005)

5

Cel8H

KXĐ

45ºC

40-60ºC; pH 4-12

Halomonas sp. S66-4

Huang và cs. (2010)

9

BglW

50ºC

3

>75%; 40-50ºC; pH 8- 9,5; 30 phút

Cao và cs. (2015)

Aspergillus fumigatus WL002

1

Bgl1

90ºC

6.5

Schroder và cs. (2014)

67%; 90ºC; 1.5 giờ 78%; 50ºC; 24 giờ 68%; 60ºC; 24 giờ

Cổ khuẩn không nuôi cấy được từ DNA metagenome suối nước nóng

XM70-Cel9

KXĐ

70ºC

7

50%; 85ºC; 30 phút

(Zhao và cs., 2017)

DNA metagenome trầm tích suối nước nóng

Vul_Bgl1A

1

105ºC

7

Schröder và cs. (2019)

DNA metagenome mẫu lấy từ lỗ thông thủy nhiệt ở đảo Vulcano, Italy

50%; 75ºC; 99 phút 50%; 90ºC; 15 phút 50%; 99ºC; 11 phút 50-68%; pH 4-9; 24h 20%; pH4; 48 giờ 47%; pH7; 48 giờ

Chú thích: KXĐ: Không xác định

21

1.2.3. Ứng dụng công nghệ sinh học của cellulase ưa nhiệt

Enzyme ưa nhiệt có ưu điểm hơn so với các enzyme ưa ấm bởi chúng có khả

năng ứng dụng trong các ngành công nghiệp khác nhau. Enzyme ưa nhiệt thường bền

hơn khi hoạt động trong điều kiện ở nhiệt độ cao, pH cực đoan, có sự hiện diện của

các chất gây biến tính protein. Enzyme ưa nhiệt thường có tốc độ phản ứng cao hơn

so với enzyme ưa ấm (Wang và cs., 2015). Tốc độ truyền khối lớn làm tăng độ hòa

tan của cơ chất, làm giảm nguy cơ tạp nhiễm (Rawat và cs., 2015). Cuối cùng, enzyme

ưa nhiệt có thể hoạt động linh hoạt trong các quy trình được thiết kế riêng để giảm

chi phí vận hành. Hiện nay, cellulase ưa nhiệt được ứng dụng chủ yếu trong các ngành

sản xuất nhiên liệu sinh học (chuyển hóa sinh khối thực vật thành ethanol sinh học),

công nghiệp thực phẩm và sản xuất bia, công nghiệp dệt may (mài mòn sinh học và

đánh bóng sinh học), giặt ủi (trong công thức chất tẩy rửa), công nghiệp giấy và bột

giấy (Sharma và cs., 2016; Jayasekara và Ratnayake, 2019), cũng như trong sản xuất

thức ăn chăn nuôi (Wang và cs., 2015). Ngoài ra, cellulase ưa nhiệt còn được ứng

dụng trong một số ngành khác như quản lý chất thải, cải thiện đất nông nghiệp (Biver

và cs., 2014) và chiết xuất các hợp chất từ thực vật như dầu ô liu, bột màu và các

phân tử có hoạt tính sinh học (Sharma và cs., 2016). Quá trình chuyển hóa hoàn toàn

cellulose thành glucose, sau đó chuyển hóa tiếp thành bioethanol đòi hỏi phải có sự

kết hợp đồng thời của nhiều enzyme thủy phân cellulose (endo- và exoglucanase và

β-glucosidase). Do đó, khi nguồn năng lượng hóa thạch bị cạn kiệt phải thay thế bằng

nguồn năng lượng tái tạo thì nhiên liệu sinh học sản xuất từ sinh khối thực vật trở nên

tiềm năng và cần được quan tâm phát triển (Escuder-Rodríguez và cs., 2018). Sử dụng

cellulase bền nhiệt để tiền xử lý và xử lý sinh khối góp phần làm giảm giá thành sản

xuất năng lượng, cải thiện khả năng hòa tan của cơ chất, giảm độ nhớt và giảm sự

phụ thuộc vào việc sử dụng các hóa chất gây hại cho môi trường (Jayasekara và

Ratnayake, 2019).

1.3. Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các gen mới

Metagenomics được định nghĩa là kỹ thuật nghiên cứu đa hệ gen hay DNA hệ

gen tổng số trực tiếp từ mẫu môi trường. Kể từ khi thuật ngữ Metagenome được sử

dụng lần đầu tiên vào năm 1998 (Handelsman và cs., 1998), metagenomics đã là một

trong những công cụ nghiên cứu chính để nghiên cứu sinh thái vi sinh vật và là công

22

cụ không thể thiếu để nghiên cứu sự đa dạng cũng như tiềm năng trao đổi chất của

các vi sinh vật (phần lớn là những loài không nuôi cấy được) trong môi trường. Các

kết quả nghiên cứu về metagenomic có thể cung cấp thông tin về các gen chức năng,

cấu trúc và tổ chức bộ gen, xác định gen và chất xúc tác sinh học mới, cấu trúc quần

xã và các mối quan hệ tiến hóa trong quần xã vi sinh vật (Culligan và cs., 2014).

1.3.1. Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics

Hai phương pháp tiếp cận chính được sử dụng để tiếp cận và thu nhận các gen

mới từ DNA môi trường là (i) dựa vào trình tự và (ii) dựa vào chức năng (hoặc kết

hợp cả hai) (Hình 1.6).

Hình 1. 6. Các phương pháp chính để phát hiện gen mới bằng cách sử dụng

Chú thích: A) Mẫu môi trường quan tâm (ví dụ đất, hệ vi sinh vật đường ruột của người,

nước biển) được thu thập; B) DNA metagenomics tổng số của mẫu được phân lập trực tiếp

Metagenomics.

23

hoặc gián tiếp bằng cách phá vỡ tế bào; C) Phân tích DNA metagenomics dựa vào trình tự,

C-1) có thể tạo thư viện tách dòng bằng cách giải trình tự Sanger hoặc giải trình tự DNA

metagenome trực tiếp, sử dụng hệ thống giải trình tự thế hệ mới; C-2) sử dụng cặp mồi suy

biến được thiết kế từ các vùng bảo thủ của gen đích, sau đó khuếch đại gen dần từng bước

cho đến khi thu được toàn bộ gen; C-3) khai thác dữ liệu từ bộ dữ liệu giải trình tự

metagenomic để tìm kiếm thông tin của gen hoặc các vùng bảo thủ rồi tổng hợp gen sau khi

đã tối ưu để biểu hiện trong chủng chủ; C-4) thu giữ lại các gen mới từ các plasmid sử dụng

phương pháp TRACA (transposon-aided capture) hoặc các gen liên quan tới integron bằng

cách sử dụng phương pháp PCR với cặp mồi nhắm vào trình tự có vị trí tích hợp bảo thủ; D)

Phân tích metagenomics dựa vào chức năng; D-1) tạo thư viện mang đoạn chèn có kích

thước lớn hoặc nhỏ bằng cách sử dụng vector phù hợp (plasmid, fosmid, cosmid, or bacterial

artificial chromosome [BAC]) tùy thuộc vào nhu cầu của nghiên cứu; D-2) lựa chọn chủng

chủ thích hợp để biểu hiện gen hoặc hệ gen. Chủng chủ được sử dụng phổ biến nhất là E.

coli, ngoài ra còn có thể sử dụng các chủng Bacillus và Streptomyces. Thư viện gen được

giữ trên các đĩa micro-titer 96 hoặc 384 giếng và được bảo quản ở -80C; D-3) Các dòng

mang DNA metagenome có thể được sàng lọc để xác định hoạt tính đích bằng cách nhân

bản toàn bộ hoặc một phần thư viện vào trong các đĩa micro-titer mới hoặc cấy gạt lên trên

các đĩa thạch. Các dòng dương tính được nhận biết thông qua một số đặc điểm khác biệt như

khả năng kháng kháng sinh, hình thành sắc tố, sự thay đổi hình thái hoặc khả năng kháng một

số yếu tố khác; D-4) Đột biến gen nhảy có thể được tiến hành trên các dòng dương tính để xác

định gen hoặc các gen quan tâm; D-5) Tách dòng và biểu hiện các gen để xác nhận lại kiểu hình;

E) các gen mới được phát hiện dựa vào chức năng hoặc trình tự hoặc dựa vào sự kết hợp của

cả hai cách tiếp cận trên.

(Nguồn: Culligan và cs. (2014)).

1.3.1.1. Khai thác gen mới dựa vào chức năng

Trước đây, sàng lọc các gen mới từ DNA metagenome chủ yếu dựa vào hoạt

tính trao đổi chất của các dòng gen trong thư viện metagenome. Đây là phương pháp

tiếp cận duy nhất để xác định các gen mới mã hóa cho protein hoặc peptide đã biết

hoặc chưa biết chức năng mà không cần biết trình tự của gen (Simon và Daniel, 2011).

Phương pháp này không quá khó, ít tốn kém nhưng đòi hỏi mất nhiều công sức, tốn

nhiều thời gian, số lượng các dòng sàng lọc trong thư viện phải đủ lớn và chất lượng

24

thư viện phải cao. Bên cạnh đó, một gen hoàn chỉnh có thể biểu hiện được hoạt tính

hay không còn phụ thuộc vào quá trình phiên mã và dịch mã trong tế bào chủ.

Kỹ thuật Metagenomics theo hướng sàng lọc chức năng cần phải có một thư

viện metagenome chứa các đoạn DNA của vi sinh vật có trong mẫu phân tích. Quá

trình tạo thư viện DNA metagenome bao gồm các bước: (i) tách chiết DNA

metagenome trực tiếp từ các mẫu môi trường; (ii) sử dụng enzyme giới hạn cắt toàn

bộ DNA metagenome để tạo ra các đoạn DNA có kích thước đủ lớn, có khả năng

chứa toàn bộ trình tự của các gen có trong mẫu DNA môi trường; (iii) Các đoạn DNA

sau khi cắt bằng enzyme giới hạn được gắn vào vector phù hợp và biến nạp vào chủng

chủ (Simon và Daniel, 2017). Một trong những thách thức lớn nhất của kỹ thuật này

là số lượng các dòng gen để sàng lọc vô cùng lớn với tỷ lệ dòng dương tính là vô

cùng nhỏ. Đồng thời thư viện vẫn phải đảm bảo có chứa các dòng đại diện cho các

loài có mật độ cực ít trong mẫu (<1%) (Riesenfeld và cs., 2004). Các dòng biểu hiện

gen này sau đó được sử dụng để sàng lọc chức năng hoặc sàng lọc gen mong muốn

khác (Hình 1.7).

Mẫu môi trường

Hình 1.7. Các bước chính xây dựng thư viện Metagenomic.

(Nguồn: Dias và cs. (2014)).

1.3.1.2. Khai thác gen mới dựa vào trình tự DNA metagenomes

Những tiến bộ trong công nghệ giải trình tự thế hệ thứ hai và thế hệ thứ ba đã

thúc đẩy những tiến bộ trong kỹ thuật metagenomics. Với các công nghệ hiện nay,

hàng trăm cơ sở dữ liệu đã được giải trình tự DNA với chi phí rất thấp (Watson,

2014). Đồng thời công nghệ này cũng có thể phát hiện được sự có mặt của những vi

25

sinh vật với số lượng cực ít trong môi trường. Công nghệ giải trình tự hiện đại kết

hợp với những cải tiến liên tục trong lĩnh vực tin sinh học đã làm cho phân tích

metagenome trở thành một kỹ thuật dễ tiếp cận, giá cả phải chăng và nhanh chóng

được sử dụng cho hầu hết các phòng thí nghiệm (Roumpeka và cs., 2017). Thông qua

phân tích metagenome từ cơ sở dữ liệu giải trình tự thế hệ mới, nhiều enzyme, chất

xúc tác sinh học mới đã được phát hiện. Wallace và cs. (2015) đã giải trình tự mẫu

ruột dạ cỏ bằng máy giải trình tự Illumina, lắp ráp dữ liệu bằng de novo và chú giải

các contigs. Kết quả thu được cho thấy mẫu nghiên cứu có đến hơn 1,5 triệu gen giả

định với 58% là các protein chưa biết. Trong một nghiên cứu khác, khi phân tích

metagenomic của vi sinh vật sống trong dạ cỏ của bò và cừu đã xác định được 3.970

gen, trong số đó, gen có liên quan đến khả năng sinh khí metan và chuyển hóa hiệu

quả thức ăn đã biết chỉ chiếm tương ứng là 20 và 49 gen (Roehe và cs., 2016). Nghiên

cứu của Sunagawa và cs. (2015) khi khảo sát lấy mẫu đại dương toàn cầu đã phát

hiện 40 triệu trình tự từ hơn 35.000 loài, trong đó chỉ có 0.44% dữ liệu được so sánh

với các gen đã biết. Kết quả nghiên cứu này cho thấy tiềm năng của các gen chưa

được khám phá ở đại dương của chúng ta. Tóm lại, cùng với sự phát triển của các hệ

thống máy giải trình tự gen thế hệ mới và các phần mềm tin sinh, cách tiếp cận

metagenome thông qua giải trình tự đã trở thành một phương pháp khai thác nguồn

gen vi sinh vật vô cùng hiệu quả và nhanh chóng. Hơn nữa, có thể thấy ưu điểm nổi

bật của phương pháp này ở chỗ:

• Các kết quả không bị ảnh hưởng bởi một loại gen đặc hiệu.

• Không phụ thuộc vào các marker di truyền có tính phân loại.

• Đánh giá mức độ đa dạng vi sinh vật sâu, bao gồm virus.

• Ước lượng được sự đa dạng vi sinh vật.

• Phát hiện được vi sinh vật chiếm ưu thế trong các môi trường khác nhau.

• Phân tích vi sinh vật không nuôi cấy được.

• Thông tin về thành phần cũng như các chức năng có thể có của một hệ sinh thái.

• Nghiên cứu các gen và các cụm gen chức năng.

Khai thác gen mới dựa vào trình tự DNA metagenome sử dụng cùng một quy

trình phân tích tin sinh học: (a) lắp ráp các dữ liệu đã được giải trình tự (trực tiếp từ

26

các mẫu môi trường) để xây dựng các trình tự contig, (b) dự đoán các gen (và các

protein giả định) dựa trên dữ liệu được lắp ráp, và (c) dự đoán các domain, chức năng

và các con đường trao đổi chất cho các protein giả định (Hình 1.8).

Hình 1.8. Các bước phân tích tin sinh điển hình cho cơ sở dữ liệu metagenomic.

(Nguồn: Roumpeka và cs. (2017)).

1.3.2. Phương pháp đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA

metagenome

Đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA metagenome của một

hệ sinh thái hay còn gọi là phân loại trình tự là quá trình sắp xếp các trình tự gen vào

các nhóm sao cho mỗi tập con đại diện cho một đơn vị phân loại (taxon) sinh học

riêng biệt. Phân loại và lắp ráp là hai quá trình liên quan với nhau, phân loại có thể

27

được thực hiện trước khi lắp ráp hoặc tích hợp vào trong quá trình lắp ráp (Hình 1.8).

Trong cả hai trường hợp trên, phân loại trình tự cố gắng ngăn chặn việc lắp ráp đồng

thời các gen với nhau. Về lý thuyết, mỗi nhóm đại diện cho một hệ gen riêng và nó

được lắp ráp tách biệt để có thể loại bỏ được vấn đề lắp ráp không chính xác liên quan

đến các contig từ các đơn vị phân loại khác nhau (Roumpeka và cs., 2017).

Dữ liệu metagenomic thường không chứa trình tự của từng loài vi sinh vật riêng

biệt mà bao gồm trình tự của rất nhiều loài khác nhau (có khi hơn 10.000 loài trong

một mẫu (Wooley và cs., 2010). Do đó, một vấn đề quan trọng cần giải quyết trong

giai đoạn phân tích dữ liệu metagenomic là phân chia trình tự vào từng nhóm vi sinh

vật cũng như ước lượng mức độ chiếm ưu thế của chúng trong mẫu. Để phân loại

trình tự metagenomic có thể được chia thành hai nhóm phương pháp chính: phương

pháp có giám sát (supervised methods) và phương pháp không có giám sát

(unsupervised methods). Trong khi phương pháp có giám sát sử dụng cơ sở dữ liệu

tham khảo để phân loại trình tự, phương pháp không có giám sát chỉ dựa trên thông

tin được lấy từ tập dữ liệu đang được phân tích. Phân loại có giám sát thường sử dụng

các công cụ MEGAN (Huson và cs., 2007), CARMA (Krause và cs., 2008), TACOA

(Diaz và cs., 2009) và TAC-ELM (Rasheed và Rangwala, 2012). Các giải pháp được

sử dụng này có thể đạt được mức độ chính xác cao nếu có đầy đủ cơ sở dữ liệu tham

khảo. Tuy nhiên, cho đến nay, chỉ có một tỉ lệ rất nhỏ vi sinh vật đã được phân loại.

Nghiên cứu của Dinsdale và cs. (2008) cho thấy chỉ có khoảng 12% trình tự

metagenomic tương đồng với trình tự trong ngân hàng dữ liệu 16S rDNA. Trong các

phần mềm được sử dụng để phân loại có giám sát, MEGAN là phần mềm thiết kế

mới, cho phép phân tích bộ dữ liệu metagenomic lớn thực hiện trên máy tính xách

tay. Trong bước tiền xử lý, tập hợp các chuỗi DNA được so sánh với cơ sở dữ liệu

của các chuỗi đã biết bằng phần mềm BLAST hoặc một công cụ so sánh khác. Sau

đó MEGAN được sử dụng để tính toán và phát hiện các đơn vị phân loại, cuối cùng

sử dụng nguồn dữ liệu phân loại của NCBI để tóm tắt và sắp xếp kết quả. Kết quả

phân loại phản ánh mức độ bảo thủ của chuỗi được so sánh. Phần mềm cho phép mổ

xẻ bộ dữ liệu lớn mà không cần lắp ráp hoặc nhắm vào các dấu hiệu phát sinh chủng

loại cụ thể. MEGAN là phần mềm hiện được dùng khá phổ biến để phân loại các bộ

28

dữ liệu trình tự metagenome khác nhau. Phân loại không có giám sát thường sử dụng

các phần mềm như LikelyBin, PHYSCIMM. Ngoài ra để phân loại trình tự, chúng ta

có thể sử dụng MetaWatt. MetaWatt là một thuật toán mã nguồn mở có thể dùng cho

bất kỳ hệ thống/nền tảng nào được hỗ trợ bởi Blast và Glimmer. Thuật toán này có

khả năng mở rộng (do thời gian chạy ít hơn) và có thể xử lý số lượng lớn các dữ liệu

giải trình tự. MetaWatt có ưu điểm là có sẵn giao diện đồ họa graphical-user-interface

(GUI), do đó các nhà nghiên cứu ngay cả khi họ không phải là các nhà tin sinh vẫn

có thể dễ dàng sử dụng. Đồng thời, giao diện đồ họa này cho phép người sử dụng có

thể xem và chọn các nhóm cho mô hình Markov nội suy IMM. Dữ liệu đồ họa trả về

dạng SVG và dữ liệu các nhóm là dạng fasta để có thể phân tích và chú giải thêm.

Ngoài các phần mềm đã nêu trên, các nhà nghiên cứu hiện nay còn sử dụng

CONCOCT để phân loại trình tự. CONCOCT là một thuật toán sử dụng mô hình

GMMs (Gaussian mixture models) tự động nhóm các contigs vào hệ gen dựa trên sự

kết hợp giữa thành phần các trình tự và vùng bao phủ trên nhiều mẫu (Roumpeka và

cs., 2017).

1.3.3. Ứng dụng kỹ thuật Metagenomics để đánh giá đa dạng vi sinh vật và khai

thác các gen mã hóa cho enzyme mới

Hầu hết các vi sinh vật tham gia vào quá trình chuyển hóa vật chất trong tự

nhiên vẫn chưa thể phân lập và nuôi cấy riêng rẽ được. Các enzyme mới đã biết đều

được xác định ở mức độ trình tự protein, nhưng các biến thể gen rất khó để khuếch

đại trực tiếp từ DNA môi trường. Trong quá trình nghiên cứu hệ gen của môi trường,

Metagenomics đã trở thành một công cụ hữu ích không chỉ để đánh giá sự đa dạng

của vi sinh vật trong một hệ sinh thái mà nó còn có thể phát hiện được các gen mới

mã hóa cho các enzyme (Culligan và cs., 2014).

1.3.3.1. Đánh giá đa dạng vi sinh vật trong hệ sinh thái

Mỗi hệ sinh thái có sự đa dạng vi sinh vật khác nhau và mang những đặc trưng

riêng bởi số lượng cũng như thành phần vi sinh vật chiếm ưu thế. Bằng phương pháp

nuôi cấy truyền thống không thể đánh giá đầy đủ được tính đa dạng của vi sinh vật

trong hệ sinh thái vì có đến trên 99% vi sinh vật sống trong môi trường là những vi

sinh vật không thể nuôi cấy được (Hahn và cs., 2019). Nhờ sử dụng kỹ thuật

29

metagenomic, bức tranh vi sinh vật đã trở nên phong phú và đa dạng hơn, nhiều loài

mới đã được phát hiện.

Trong các hệ sinh thái vi sinh vật, suối nước nóng là một trong những hệ sinh

thái gặp nhiều khó khăn khi nghiên cứu đa dạng vi sinh vật bởi các chủng vi sinh vật

sống trong hệ sinh thái này chủ yếu là vi sinh vật ưa ấm (mesophilic), chịu nhiệt

(thermotolerant) và siêu ưa nhiệt (hyperthermophiles). Đồng thời đặc điểm sinh lý và

sinh hóa của những loài vi sinh vật của hệ sinh thái này có thể mang những đặc trưng

của môi trường sống như khả năng chịu axit, chịu kiềm, áp suất cao, chịu muối,…

Chúng là những vi sinh vật khó có thể nuôi cấy được trong môi trường nhân tạo. Vi

sinh vật kỵ khí của suối nước nóng được coi là hậu duệ còn sống gần nhất của các

dạng sống sớm nhất trên trái đất. Nghiên cứu về các vi sinh vật này đã cung cấp thêm

những hiểu biết về nguồn gốc cũng như sự tiến hóa của sự sống. Phân tích quần xã vi

khuẩn trong môi trường lỗ thông thủy nhiệt Pakistani cho thấy sự đa dạng di truyền

lớn và hầu hết các thành viên của quần xã này là những vi sinh vật không nuôi cấy

được và chưa được phân loại. Các kết quả cũng hé lộ một số vi sinh vật có kiểu hình

mới được dự đoán bằng phân tích phát sinh chủng loại là những vi sinh vật đặc hữu

của suối nước nóng (Amin và cs., 2018).

Ngoài ra, ứng dụng kỹ thuật metagenomic cũng đã phát hiện được sự đa dạng

của vi sinh vật trong các hệ sinh thái khác như vùng trồng trọt (Wolińska, 2019), phân

bón làm từ rác thải dầu cọ (Khalid và cs., 2019), trong đường ruột của mối (Chew và

cs., 2018), …

1.3.3.2. Khai thác gen mới

Ngoài ứng dụng để đánh giá đa dạng vi sinh vật trong một hệ sinh thái, kỹ thuật

metagenomic còn được sử dụng để khai thác hiệu quả các gen mới mã hóa cho các

chất xúc tác sinh học dựa vào chức năng hoặc dựa vào trình tự hoặc kết hợp cả hai.

Thông qua metagenomic, nhiều chất xúc tác sinh học mới đã được phát hiện từ các

vi sinh vật sống trong các hệ sinh thái khác nhau (Steele và cs., 2009; Culligan và cs.,

2014). Bằng cách tối ưu hóa các thông số hóa lý có thể nâng cao hiệu suất của các

quy trình sản xuất công nghiệp mà hầu hết các enzyme hiện có đều chưa đáp ứng

30

được với các điều kiện này. Do đó, việc sử dụng enzyme trong các quy trình công

nghiệp cần phải được điều chỉnh cho phù hợp. Các enzyme phải chịu được các điều

kiện khắc nghiệt của quá trình sản xuất. Mặc dù, mức độ đa dạng của quần xã vi sinh

vật trong các hệ sinh thái cực đoan có thể thấp nhưng các loài vi sinh vật ở đây vẫn

là nguồn gen tự nhiên để thu nhận các enzyme mới có tính chất đặc biệt, có thể ứng

dụng vào trong các quy trình sản xuất (Steele và cs., 2009). Thông qua sàng lọc thư

viện metagenomic của mẫu đất sa mạc ở Nam Cực đã phát hiện được một esterase

kiềm mới có khả năng hoạt động ở 7°C (Heath và cs., 2009). Ngược lại, Rhee và cs.

(2005) cũng đã phát hiện một esterase mới có khả năng hoạt động ở nhiệt độ cao và

bền nhiệt thông qua sàng lọc thư viện DNA Metagenome vi sinh vật suối nước nóng

vùng solfataric, Tangkuban Perahu, Indonesia.

Cellulase là enzyme có nhiều ứng dụng trong ngành dệt, công nghiệp thực

phẩm, trong ngành công nghiệp giấy và bột giấy. Gần đây, cellulase đã thu hút sự

quan tâm của các nhà khoa học do khả năng ứng dụng của nó vào quá trình thủy phân

lignocellulose thành glucose dùng để lên men sản xuất ethanol thế hệ thứ hai và các

sản phẩm sinh học có giá trị kinh tế. Nhiều cellulase mới đã được phát hiện từ DNA

metagenome của các hệ sinh thái khác nhau. Khai thác dữ liệu giải trình tự DNA

metagenome mẫu làm giàu quần xã vi sinh vật kỵ khí trong bã bia, gen Cel7482 mới

mã hóa cho endo-β-1,4-glucanase đã được phát hiện. Enzyme tái tổ hợp mang gen

Cel7482 có nhiều đặc tính mới như chịu được nồng độ muối cực cao tới 2M NaCl,

không bị bất hoạt bởi ba loại dung môi - là những dung dịch được sử dụng rộng rãi

trong quá trình tiền xử lý cellulose (Yang và cs., 2016). Toyama và cs. (2018) cũng

đã phát hiện ra gen AmBgl-LP mới mã hóa cho β-glucosidase thuộc họ GH1 từ DNA

metagenome vi sinh vật hồ Poraquê ở khu vực Amazon. Mặc dù enzyme tái tổ hợp

mang gen AmBgl-LP có khả năng thủy phân cả cơ chất tổng hợp p-nitrophenyl-β-d-

glucopyranoside (pNPβG) và cơ chất cellobiose tự nhiên nhưng xét về độ đặc hiệu

thì enzyme tái tổ hợp có độ đặc hiệu với pNPβG cao hơn. Enzyme tái tổ hợp hoạt

động tốt ở điều kiện 40C, pH 6 khi sử dụng cơ chất pNPβG. Nghiên cứu cấu trúc ba

chiều và trạng thái oligomeric của enzyme cho thấy mặc dù enzyme có tâm hoạt động

31

dạng monomer giống với cấu trúc của các thành viên khác trong họ GH1 nhưng phức

hệ cơ chất-enzyme AmBgl-LP lại tạo thành dạng dimer bền vững. Phát hiện thành

viên mới thuộc họ GH1 này bằng kỹ thuật metagenomics không những giúp mở rộng

hiểu biết về cơ chế phân tử và tính đa dạng của enzyme mà còn cho phép khảo sát

các ứng dụng của chúng ở quy mô công nghiệp. Tuy nhiên, để khai thác và thu nhận

các cellulase bền nhiệt và chịu được các điều kiện khắc nghiệt của quá trình chuyển

hóa sinh khối lignocellulose thành các sản phẩm có giá trị, vi sinh vật sống trong các

hệ sinh thái địa nhiệt là một trong những nguồn có thể thu nhận cellulase tiềm năng.

Bằng cách tiếp cận metagenomics, nhiều cellulase mới cũng như cellulase bền nhiệt

đã được phát hiện từ hệ sinh thái địa nhiệt như lỗ thông thủy nhiệt (hydrothermal

vents) (Leis và cs., 2015; Placido và cs., 2015), bể địa nhiệt và suối nước nóng

(Graham và cs., 2011; Schroder và cs., 2014). Các cellulase bền nhiệt thu nhận từ

DNA metagenome suối nước nóng đa dạng về thành phần, độ bền nhiệt cũng như

tính bền trong các giá trị pH khác nhau được thống kê và tóm tắt ở Bảng 1.4.

Bảng 1.4. Cellulase bền nhiệt từ metagenome của vi sinh vật ở suối nước nóng.

Enzyme Nhiệt độ tối ưu

pH tối ưu

Độ bền nhiệt

Tài liệu tham khảo

Egl

90ºC

5,5

Liew và cs. (2018)

Egl

65ºC

8,0

Gupta và cs. (2017)

Egl

70ºC

5,0

> 50%; 70ºC; 4h

Zarafeta và cs. (2016)

Egl

109ºC

5,5

50%; 100ºC; 4.5 h

Graham và cs. (2011)

50%; 105ºC; 0.57 h

50%; 108ºC; 0.17 h

Egl

92ºC

5,5

>80%; 80ºC; 4.5 h

(Leis và cs., 2015)

Bgl

90ºC

6,5

> 40%, 105ºC

(Schroder và cs., 2014)

67%; 90ºC; 1.5 h

68%; 60ºC; 24 h

78%; 50ºC; 24 h

Chú thích: Egl) Endoglucanase; Bgl) β–glucosidase.

32

1.3.4. Tình hình ứng dụng metagenomics vào nghiên cứu đa dạng vi sinh vật và

khai thác các gen mã hóa cho cellulase ở Việt Nam

Ở Việt Nam, các nghiên cứu về đa dạng vi sinh vật và enzyme cellulase của

chúng đã được tiến hành từ những năm 2000. Các nghiên cứu này chủ yếu tiếp cận

bằng con đường phân lập và nuôi cấy chủng vi khuẩn, nấm mốc, xạ khuẩn từ các hệ

sinh thái khác nhau (Lý Kim Bảng và cs., 1999; Dinh Kha Trinh và cs., 2013; Nguyễn

Kim Thoa và cs., 2015; Trần Văn Vươn và cs., 2017; Trần Ngọc Diễm My và Nguyễn

Trọng Nhân, 2018). Trong đó, một số enzyme cũng đã được nghiên cứu sâu về đặc

tính (Dinh Kha Trinh và cs., 2013; Nguyễn Kim Thoa và Trần Thanh Thủy, 2018).

Ngoài ra, để nâng cao hoạt tính của nhiều chủng vi sinh vật tự nhiên, các nghiên cứu

để tạo ra cellulase tái tổ hợp cũng đã được tiến hành và thu được kết quả tốt (Trịnh

Đình Khá, 2015; Phan Thị Tuyết Minh và cs., 2016).

Tuy nhiên, bằng các phương pháp phụ thuộc vào nuôi cấy không thể đánh giá

đầy đủ đa dạng vi sinh vật cũng như khai thác được nguồn vật liệu di truyền tiềm

năng mã hóa cho các gen mới nói chung và cho cellulase nói riêng có mặt trong hệ

sinh thái. Do đó, nhằm bắt kịp xu hướng của thế giới trong nghiên cứu đa dạng vi

sinh vật và tiếp cận nguồn gen vi sinh vật không thông qua nuôi cấy, cách đây gần 10

năm (2011-2012) nhóm nghiên cứu của GS. TS. Trương Nam Hải, Viện Công nghệ

Sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã là nhóm tiên phong

ứng dụng kỹ thuật Metagenomic trong khai thác enzyme tham gia vào quá trình phân

giải cellulose, hemicellulose từ khu hệ vi sinh vật ruột mối (Trương Nam Hải, 2011-

2012). Tiếp đó, để thúc đẩy nghiên cứu metagenomics ở Việt Nam nhằm xây dựng

cơ sở dữ liệu về đa dạng sinh học của các hệ vi sinh vật có giá trị cũng như khai thác

các vật liệu di truyền mới mã hóa cho các enzyme, các chất kháng u …có tiềm năng

công nghệ trong sản xuất thuốc, tạo kit chẩn đoán bệnh, phát triển cây trồng, vật nuôi

có giá trị kinh tế, góp phần bảo vệ sức khỏe cộng đồng, phát triển kinh tế bền vững,

bảo vệ môi trường, ngày 23/4/2014, Bộ trưởng Bộ Khoa học và công nghệ đã ban

hành quyết định số 826/QĐ-BKHCN phê duyệt danh mục đặt hàng dự án khoa học

và công nghệ cấp quốc gia: “Nghiên cứu Metagenome của vi sinh vật từ một số môi

33

trường đặc thù nhằm tìm kiếm các gen, enzyme, chất xúc tác sinh học mới để sản

xuất các chế phẩm sinh học phục vụ đời sống, bảo vệ sức khỏe con người và môi

trường” (Phạm Công Hoạt và cs., 2014). Dự án khoa học và công nghệ trên đã được

đặt hàng và giao cho Viện Hàn lâm Khoa học và Công nghệ Việt Nam chủ trì với 5

định hướng nghiên cứu chính gồm: 1) Nghiên cứu metagenome của vi sinh vật vùng

đất ô nhiễm chất diệt cỏ/dioxin nhằm tìm kiếm các gen mới có khả năng phân hủy

dioxin (Đặng Thị Cẩm Hà, 2014-2017); 2) Nghiên cứu metagenome vi sinh vật đất

vùng rễ một số đại diện cây trồng ở Việt Nam: cây thuốc có củ (cây nghệ), cây công

nghiệp (cà phê, lạc) nhằm tăng năng suất và chất lượng cây trồng (Lê Mai Hương,

2014-2017); 3) Nghiên cứu metagenome của ba hệ mini sinh thái tiềm năng nhằm

khai thác các gen mới mã hóa hệ enzyme chuyển hóa hiệu quả lignocellulose (Đỗ Thị

Huyền, 2014-2017); 4) Nghiên cứu metagenome của vi sinh vật trong các đầm nuôi

tôm góp phần tạo cơ sở khoa học để phát triển nghề nuôi tôm ở Việt Nam (Chu Hoàng

Hà, 2014-2018); 5) Nghiên cứu metagenome của vi sinh vật liên kết hải miên tại biển

miền Trung Việt Nam nhằm phát hiện và sàng lọc các chất hoạt tính sinh học (Nguyễn

Thị Kim Cúc, 2014-2018). Một trong năm đề tài nghiên cứu của Dự án đó là: “Nghiên

cứu metagenome của ba hệ mini sinh thái tiềm năng nhằm khai thác các gen mới mã

hóa hệ enzyme chuyển hóa hiệu quả lignocellulose” do PGS. TS. Đỗ Thị Huyền làm

chủ nhiệm. Luận án của nghiên cứu sinh là một phần trong nội dung nghiên cứu của

đề tài trên. Kết quả của Luận án là minh chứng cho việc lần đầu tiên ở Việt Nam, sử

dụng thành công công cụ metagenomics vào đánh giá đa dạng vi sinh vật và khai thác

các gen mã hóa cho cellulase trong suối nước nóng Bình Châu. Cụ thể, thông qua

cách tiếp cận không phụ thuộc vào nuôi cấy, vi sinh vật trong suối nước nóng Bình

Châu đa dạng hơn rất nhiều so với những kết quả nghiên cứu trước đây tiếp cận bằng

phương pháp phụ thuộc vào nuôi cấy chỉ phát hiện thấy vi sinh vật chủ yếu thuộc chi

Bacillus, Geobacillus (Nguyễn Kim Thoa và cs., 2015; Nguyễn Kim Thoa và cs.,

2017; Tran KM và cs., 2018). Đồng thời, kết quả nghiên cứu trong luận án cũng đã

phát hiện được các gen mã hóa cho hệ enzyme thủy phân cellulose và đã được chứng

minh đặc tính của hai gen thông qua thực nghiệm biểu hiện gen trong hệ thống

34

Escherichia coli. Hai gen này mã hóa cho cellulase mới, bền kiềm hơn so với cellulase

của vi sinh vật đã được công bố trong nghiên cứu trước đây của Nguyễn Kim Thoa

và Trần Thanh Thủy (2018) và Nguyễn Kim Thoa và cs. (2015).

35

CHƯƠNG 2

VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. Vật liệu

Các mẫu nước và bùn được thu thập từ suối nước nóng Bình Châu, huyện Xuyên

Mộc, tỉnh Bà Rịa – Vũng Tàu ngày 14 tháng 5 năm 2015. Mẫu nước được lấy trực

tiếp từ miệng giếng phun (10º36’03.9’’ Bắc và 107º33’30.0’’ Đông) với nhiệt độ

82°C, pH = 7,5. Bùn được thu thập ở các vị trí khác nhau bên ngoài miệng giếng

phun, dọc theo dòng chảy (10o37’03.9” Bắc và 107o32’30.0” Đông) với nhiệt độ dao

động từ 45 đến 65ºC, pH 7,7 - 9.

2.1.1. Vi sinh vật

- Chủng Escherichia coli TOP10F’ (Thermo Fisher Scientific) được dùng cho

thí nghiệm tách và nhân dòng gen.

- Chủng E. coli JM109(DE3) (Promega) và E. coli C43(DE3) (Lucigen) nhận

từ Phòng thí nghiệm Hóa sinh, Đại học Tổng hợp Saarland (CHLB Đức) được dùng

cho thí nghiệm biểu hiện gen.

2.1.2. Vector

- Vector pJET1.2 (ThermoFisher Scientific)

- Vector pET17b (Novagen). Bản đồ giới hạn của Vector pET17b được trình

bày trong Phụ lục 1.

2.1.3. Cặp mồi sử dụng

Mồi

Trình tự

Gen khuếch đại

KT gen

5’-GATCCATATGCTGCCGCAAGTAGCCGA-3’

18736F

5’GATCAAGCTTAGTGGTGATGGTGATGATGGTGGGT

[denovovenes]_18736

1506 bp

18736R

GCCCTGGTTGTAG3’

5’GATCCATATGGAAAAGAAATTTCCTGAAGGTTTT

32768F

TAT3’

[denovovenes]_32768

1224 bp

5’GATCAAGCTTAGTGGTGATGGTGATGATGTTCTACCAGC

32768R

CCGTTGTTCT3’

Các cặp mồi được tổng hợp tại Công ty Trách nhiệm hữu hạn một thành viên

(TNHH MTV) Sinh hóa Phù Sa (Việt Nam).

36

2.1.4. Gen nghiên cứu

Gen có mã số [denovovenes]_18736 mã hóa cho endoglucanase và

[denovovenes]_32768 mã hóa cho β-glucosidase đã được lựa chọn để tổng hợp và

lưu giữ trong vector pJET1.2 tại Công ty TNHH MTV Sinh hóa Phù Sa (Việt Nam).

Trình tự nucleotide và axit amin của 2 gen này được trình bày ở Phụ lục 2 và 3.

2.1.5. Các hóa chất sử dụng

Các bộ kít: Kit PowerWater® DNA Isolation (MO BIO), Kit PowerMax® Soil

DNA Isolation (MO BIO), kit tinh sạch PCR (GeneJet PCR purification kit - Thermo

Fisher Scientific), kit tách chiết plasmid (GeneJet Plasmid Miniprep Kit - Thermo

Fisher Scientific), kit Fast Link DNA ligation (Epicenter).

Các enzyme sử dụng bao gồm: NdeI, HindIII (Phụ lục 4), CIP (NEB) và Fast

link DNA ligase (Epicenter).

Marker sử dụng gồm: Thermo Scientific™ O'GeneRuler 1 kb DNA Ladder,

protein ladder (10-250 kDa của Promega).

Các hóa chất chính: Carboxymethyl cellulose (low viscosity, Sigma Aldrich:

C5678), DNSA, glucose, p-nitrophenol, p-nitrophenyl-β-glucopyranoside (pNPG)

(Sigma Aldrich), IPTG và các loại hóa chất thông dụng dùng trong sinh học phân tử,

trong hóa sinh, trong nuôi cấy vi sinh vật.

2.1.6. Môi trường nuôi cấy

Môi trường sử dụng để hồi biến, nuôi cấy và biểu hiện chủng tái tổ hợp gồm:

SOC, LB, NB và TB. Thành phần môi trường được thể hiện ở Phụ lục 5.

2.2. Máy móc và thiết bị

Các máy móc và thiết bị dùng trong nghiên cứu bao gồm: bộ điện di DNA

(Pharmacia Biotech), bộ điện di protein (Bio-rad), máy PCR (Applied Biosystems),

máy quang phổ (Labomed, Inc.), máy ly tâm các loại, máy xung điện, máy phá tế

bào, máy đo nồng độ DNA nanoDrop 1000 (Thermo Scientific), máy đo pH, máy lắc

ổn nhiệt, bể ổn nhiệt, box cấy.

2.3. Phương pháp nghiên cứu

2.3.1. Tách chiết DNA metagenome của mẫu suối nước nóng Bình Châu

37

a) Mẫu nước:

Quá trình tách chiết và tinh sạch DNA metagenome từ hệ vi sinh vật ở suối nước

nóng Bình Châu được tiến hành như sau: Khoảng 150 L nước đã được bơm trực tiếp

từ điểm phun của suối nước nóng Bình Châu vào bể chứa vô trùng. Khi nhiệt độ nguội xuống khoảng 30oC, thực hiện lọc qua màng lọc Ultra filtration (UF – Westerntech,

Việt Nam) với kích thước lỗ 0,4 m, áp suất lọc 1,5 kgf/cm2. Toàn bộ “cặn” của quá

trình lọc được giữ trong lõi lọc sau đó được chuyển sang bình Scott vô trùng. Tiến

hành lọc lần 2 bằng hệ thống lọc hút chân không (Millipore) qua giấy lọc với kích

thước lỗ 0,22 m. Thu mẫu giấy lọc và chuyển vào PowerWater® Bead Tube (MO

BIO). Toàn bộ công đoạn sau của quá trình tách được thực hiện theo sự hướng dẫn

của nhà sản xuất Kit PowerWater® DNA Isolation (MO BIO).

b) Mẫu bùn:

Bốn mẫu bùn được thu thập tại 4 vị trí có nhiệt độ khác nhau (45-65oC) của suối

nước nóng. Các mẫu được đồng nhất trước khi cân 10 g để làm nguyên liệu tách DNA

metagenome theo hướng dẫn của nhà sản xuất Kit PowerMax® Soil DNA Isolation

(MO BIO).

Kiểm tra chất lượng DNA metagenome bằng phương pháp điện di trên gel

agarose 0,8%. Nồng độ và độ tinh sạch DNA được xác định trên máy quang phổ

NanoDrop 1000 (Thermo Scientific) ở bước sóng 260, 280 và 230 nm. Nồng độ DNA

được tính theo công thức:

Nồng độ DNA (μg/ml) = A260× f × xε

Trong đó:

A260: Độ hấp phụ ở bước sóng 260 nm

f: Hệ số pha loãng

xε: Hệ số hấp phụ của sợi kép DNA ở bước sóng A260 = 50 μg/ml

Độ tinh sạch của DNA được đánh giá thông qua tỷ lệ A260/A280, A260/A230. DNA

được coi là sạch, đủ chất lượng cho các thí nghiệm tiếp theo khi tỷ lệ này nằm trong

khoảng 1,8 ÷ 2,0.

2.3.2. Giải trình tự DNA metagenome suối nước nóng Bình Châu

DNA metagenome của khu hệ vi sinh vật ở suối nước nóng Bình Châu được gửi đi giải trình tự bằng thiết bị giải trình tự thế hệ mới Illumina HiSeqTM platform 2500 tại công

ty BGI (Hongkong). Dữ liệu sau khi đọc trình tự được lưu ở dạng file fastq.

38

2.3.3. Các phương pháp tin sinh

2.3.3.1. Xử lý, phân tích dữ liệu giải trình tự DNA metagenome và sàng lọc gen mã

hóa enzyme thủy phân cellulose tiềm năng

Chất lượng đọc trình tự được đánh giá bằng phần mềm FastQC. Quá trình tiền

xử lý dữ liệu nhằm loại bỏ trình tự chất lượng kém được thực hiện bằng công cụ

Trimmomatic (Bolger và cs., 2014). Quá trình phân tích dữ liệu giải trình tự DNA

metagenome và sàng lọc gen mã hóa enzyme thủy phân cellulose tiềm năng được tiến

hành theo các bước như mô tả trong Hình 2.1.

Dữ liệu thô (Đánh giá chất lượng giải trình tự bằng FastQC)

Tinh sạch dữ liệu thô (Trimmomatic)

Lắp ráp thành các Contig (SOAP denovo2)

Dự đoán khung đọc mở (ORF) (MetaGeneMark v2.10)

Phân loại trình tự (nr, MEGAN) Chú giải chức năng các ORF (Dựa vào các CSDL: nr, Swiss-Prot, CAZy, KEGG)

Sàng lọc gen mã hóa enzyme thủy phân cellulose tiềm năng (Blast, Tm, Acalpred, % G ~ C content)

Hình 2. 1. Quy trình xử lý, phân tích dữ liệu DNA metagenome và sàng lọc gen

mã hóa cho enzyme thủy phân cellulose tiềm năng.

Dữ liệu DNA metagenome của khu hệ vi sinh vật ở suối nước nóng Bình Châu

được lắp ráp để tạo thành contig bằng phần mềm SOAPdenovo2 (Luo và cs., 2012)

với các thông số mặc định (kích cỡ Kmer, chiều dài contig ngắn nhất). Công cụ

39

Bowtie2 (Langmead và Salzberg, 2012) được sử dụng nhằm dóng hàng các đoạn đọc

ngắn với những contig được lắp ráp, qua đó những đoạn trình tự lỗi được loại bỏ. Kết

quả lắp ráp được đánh giá bằng phần mềm QUAST (Gurevich và cs., 2013). Sau khi

lắp ráp, chỉ những contig có độ dài lớn hơn 500 bp được sử dụng cho các bước phân

tích tiếp theo.

MetaGeneMark (Zhu và cs., 2010) (version 2.10 với các thông số mặc định,

http://exon.gatech.edu/GeneMark/metagenome/Prediction/) được sử dụng để dự

đoán khung đọc mở (ORFs) dựa trên kết quả lắp ráp. Các gen từ các mẫu khác nhau

được kết hợp với nhau và được nhóm lại bằng CD-Hit (Li và Godzik, 2006) với

ngưỡng nhận dạng trình tự là 95% và ngưỡng bao phủ trình tự là 90%. Tất cả các khung

đọc mở sau đó được so sánh với ngân hàng dữ liệu NCBI (Pruitt và cs., 2007), CAZy,

Swiss-Prot, KEGG, nr bằng công cụ Blast++ (e-value < 0.00001) nhằm tìm ra trình tự

protein có mức độ tương đồng cao nhất . Qua đó các trình tự được phân loại, dự đoán

chức năng và sàng lọc ORF mã hóa nhóm enzyme thủy phân cellulose. Cụ thể: phần

mềm MEGAN, version 4.6 (Huson và cs., 2007) được sử dụng để phân loại trình tự

dựa trên thuật toán LCA (lowest common ancestor) với các thông số mặc định

minScore = 50, topPercent = 10, minSupport = 50 (mức độ chiếm ưu thế tổng số là 100

và các loài có mức độ chiếm ưu thế nhỏ hơn 0,5 trong mẫu được phân loại thành 'loại

khác' trong các cấp độ phân loại khác nhau). Đồng thời, từ các ORF mã hóa cho

enzyme thủy phân cellulose, sử dụng các phần mềm khác nhau để dự đoán tính chất

của protein do gen mã hóa. Phần mềm tính toán chỉ số Tm - nhiệt độ nóng chảy của

protein (Melting temperature) (Ku và cs., 2009) được sử dụng để dự đoán khả năng

chịu nhiệt của enzyme. Chỉ số Tm được dự đoán chi tiết với ba ngưỡng chính <0, 0-

1 và > 1. Chỉ số Tm càng tiệm cận 1 thì nhiệt độ nóng chảy càng cao (≥65oC).

Phần mềm tính toán % G ~ C (https://www.sciencebuddies.org/science-fair-

projects/references/genomics-g-c-content-calculator) được sử dụng để xác định tỷ lệ

GC. Phần mềm AcalPred (Lin và cs., 2013) được sử dụng để dự đoán enzyme có tính

kiềm hay axit. Kết quả dự đoán được chấp nhận nếu xác suất dự đoán trên 0,5. Công

40

cụ trực tuyến Protein - Sol được sử dụng để dự đoán độ hòa tan của protein từ trình tự

(Hebditch và cs., 2017). Ở hệ thống biểu hiện E. coli, chỉ số Protein - Sol trung bình là

0,45, do đó tất cả những protein có chỉ số này > 0,45 được dự đoán là có tính tan trong khi

những protein có chỉ số Protein - Sol < 0,45 thường ở dạng ít hoặc không tan.

2.3.3.2. Dự đoán nguồn gốc của gen và xây dựng cây phát sinh chủng loại

Gen đích được dự đoán nguồn gốc bằng công cụ Blast-Explorer của phần mềm

phân tích Phylogeny (Dereeper và cs., 2010). Trình tự axit amin của các protein được

dóng hàng để tìm kiếm các đoạn tương đồng bằng phần mềm ClustalX (Larkin và cs.,

2007) và được dựng cây phát sinh chủng loại bằng phần mềm MEGA-X (Kumar và

cs., 2018). Công cụ Find best DNA/protein models được sử dụng để xác định mô hình

tiến hóa protein tốt nhất. Quá trình phân tích cây được kiểm tra bằng Bootstrap với

500 lần lặp lại (resampling).

2.3.3.3. Dự đoán mô hình cấu trúc

Sử dụng các phần mềm Scanprosite của ExPASy (https://prosite.expasy.org/)

để xác định vị trí tâm hoạt động, SignalP-5.0 (Armenteros và cs., 2019) để dự đoán

peptide tín hiệu và cơ sở dữ liệu vùng bảo thủ Cdd/Sparcle của NCBI để tìm kiếm

vùng bảo thủ của enzyme (Marchler-Bauer và cs., 2017). Cấu trúc 3D của protein

được xây dựng dựa vào công cụ Swissmodel của ExPASY (Waterhouse và cs., 2018),

đồng thời phần mềm Disulfind (Ceroni và cs., 2006) được sử dụng để dự đoán cầu

liên kết disulfide giữa các axit amin Cys trong cấu trúc của gen denovogenes_18736

và denovogenes_32768.

2.3.3.4. Kiểm tra vị trí cắt của enzyme giới hạn trên gen đích

Công cụ NEBcutter (Vincze và cs., 2003) được sử dụng để tìm các vị trí cắt của

các enzyme giới hạn trên gen đích.

2.3.4. Khuếch đại gen endoglucanase_18736 và β-glucosidase_32768

Để biểu hiện gen đích, đoạn khung đọc mở của các gen tổng hợp

endoglucanase và β-glucosidase được khuếch đại từ vector pJET1.2 mang đoạn

gen này.

41

Thành phần phản ứng cho tổng thể tích 25 µl như sau:

Go Taq Green master mix (2x) 12,5 µl

Mồi 18736F / 32768F (10 pmol) 0,5 µl

Mồi 18736R / 32768R (10 pmol) 0,5 µl

Khuôn pJET1.2 mang trình tự từng ORF (10 ng) 0,5 µl

11,0 µl ddH2O

Phản ứng được thực hiện ở điều kiện sau:

95oC 3 min

95oC 30 s

30 chu kỳ

66oC 1 min

72oC 1 min 30 s

72oC 5 min

4oC 

Sản phẩm PCR được kiểm tra bằng phương pháp điện di trên gel agarose 0,8%

và được làm sạch theo sự hướng dẫn của nhà sản xuất Kit GeneJET PCR Purification

(Thermo Fisher Scientific).

2.3.5. Tạo vector biểu hiện pET-17b gắn các đoạn gen endoglucanase_18736/ β-

glucosidase_32768

Vector pET-17b (Novagen) mang T7 promoter ở đầu N, vùng tạo dòng, T7

terminator, pBR322 origin được cắt mở vòng với hai enzyme giới hạn HindIII và

NdeI (NEB) và loại gốc phosphate với CIP (NEB). Thành phần phản ứng mở vòng

như sau:

Đệm Smart cutter (10X): 2 µl

NdeI (10 U/µl): 1 µl

Plasmid (152 ng/µl): 7 µl

9 µl dH2O:

Phản ứng được ủ ở 37C trong 60 phút. Enzyme NdeI được bất hoạt bằng cách

nâng nhiệt độ phản ứng lên 65oC trong 5 phút. Sau đó bổ sung 1 µl HindIII vào phản

ứng và ủ mẫu ở 37C trong 60 phút. Kết thúc quá trình ủ, enzyme HindIII được bất

hoạt ở 80C trong 10 phút.

42

Vector pET-17b sau khi được cắt mở vòng, tiếp tục loại gốc phosphate để ngăn

sự đóng vòng trở lại. Thành phần phản ứng loại gốc phosphate như sau:

Đệm Smart cutter (10X): 1,5 µl

Plasmid đã mở vòng (50 µg/ml): 7,0 µl

CIP (1000 U/ml): 0,7 µl

5,8 µl dH2O:

Phản ứng ủ ở 37C trong 60 phút. Làm sạch plasmid bằng Kit GenJET Gel

extraction (Thermo Fisher Scientific).

Mặt khác, các sản phẩm khuếch đại gen endoglucanase_18736 và β-

glucosidase_32768 trong Mục 2.3.4 cũng được cắt tạo đầu dính với 2 enzyme tương

ứng HindIII và NdeI (NEB). Làm sạch đoạn gen bằng Kit GenJET Gel extraction

(Thermo Fisher Scientific).

Các đoạn gen endoglucanase_18736 và β-glucosidase_32768 được gắn vào

vector pET-17b đã mở vòng tại 2 vị trí HindIII và NdeI bằng Kit Fast Link DNA

ligation (Epicenter) với thành phần phản ứng như sau (15 µl):

1,0 µl Đệm Fast-link ligation (5X):

0,75 µl ATP (10 mM)

1,0 µl pET17b mở vòng (50 µg/ml):

Đoạn gen endoglucanase_18736/β-glucosidase_32768 (50 µg/ml ) 4,0 µl

7,25 µl ddH2O:

1 µl Fast link DNA ligase (5 U/µl)

Hỗn hợp được ủ 15 phút ở nhiệt độ phòng (22-25C) trước khi bất hoạt enzyme

ở 70C trong 15 phút.

2.3.6. Biến nạp vector biểu hiện pET-17b chứa các đoạn gen

endoglucanase_18736/ β-glucosidase_32768 vào E. coli TOP10F’ bằng

phương pháp xung điện

Tế bào khả biến E. coli TOP10F’được sử dụng để nhân dòng gen. Một microlit

sản phẩm gắn vector pET17b với các đoạn gen Endoglucanase_18736 và β-

glucosidase_32768 ở Mục 2.3.5 được trộn vào tế bào khả biến E. coli TOP10F’ (40µl)

43

và để trên đá 5-10 phút. Đồng thời các cuvette (độ rộng của khe 1 mm) cũng được

đặt trên đá. Chuyển dịch tế bào vào cuvette và tiến hành xung điện ở hiệu điện thế

1800-2000 V. Phục hồi tế bào trong 1 ml môi trường SOC, lắc trong 1 giờ ở 37C.

Dịch biến nạp sau đó được cấy trải (100 µl) lên môi trường thạch đĩa LB có bổ sung

ampicillin (100 µg/ml) và ủ qua đêm ở 37C.

2.3.7. Chọn lọc dòng E. coli mang vector pET17b-18736/ và pET17b-32768

Từng dòng khuẩn lạc E. coli TOP10F’ mọc trên đĩa môi trường LB (sản phẩm Mục

2.3.6) được nuôi riêng trên môi trường LB lỏng có bổ sung ampicillin qua đêm ở 37C.

Để kiểm tra và chọn dòng mang gen mong muốn, plasmid từ các dòng tế bào được

tách bằng Kit GeneJET Plasmid miniprep (Thermo Fisher Scientific) và cắt kiểm tra

bằng hai enzyme giới hạn HindIII và NdeI. Sản phẩm cắt được kiểm tra bằng điện di

trên gel agarose 0,8%. Những dòng plasmid nào xuất hiện hai băng đúng kích thước

tương ứng của vector pET-17b (3306 bp) và của các đoạn gen denovogenes_18736

(1506 bp); denovogenes_32768 (1224 bp) được giữ lại và gửi đi đọc trình tự gen tại

Công ty TNHH MTV Sinh hóa Phù sa.

Các dòng có trình tự gen đảm bảo đủ và đúng bộ ba mã hóa từ promoter đến mã

khởi đầu của các gen denovogenes_18736 và denovogenes_32768 được bảo quản ở

-20C cho các thí nghiệm tiếp theo.

2.3.8. Tạo chủng E. coli tái tổ hợp mang vector pET-17b_18736 và pET-

17b_32768

Các plasmid pET-17b_18736 và pET-17b_32768 sau khi giải trình tự để đảm

bảo đúng mã di truyền được biến nạp vào tế bào E. coli JM109(DE3) và E. coli

C43(DE3) bằng phương pháp sốc nhiệt. Cụ thể: Ống Eppendorf 1,5 ml có chứa 40 µl

tế bào khả biến E. coli JM109(DE3)/E. coli C43(DE3) được làm tan trên đá. Sau đó,

plasmid (1 µl) được bổ sung vào ống và giữ ống trên đá 5-10 phút. Ống Eppendorf

(có chứa tế bào khả biến và plasmid) được lấy ra và ủ ở 42C trong 90 giây. Tế bào

sau khi biến nạp được phục hồi trong 1 ml môi trường SOC, lắc 200 rpm/phút trong

1 giờ ở 37C. Dịch biến nạp sau đó được cấy trải (100 µl) trên đĩa môi trường LB có

bổ sung ampicillin (100 µg/ml), nuôi qua đêm ở 37C. Từng dòng khuẩn lạc E. coli

44

JM109(DE3) và E. coli C43(DE3) được cấy riêng rẽ vào ống thạch nghiêng LB có

bổ sung kháng sinh, đồng thời được nhân lên trên môi trường LB dịch thể + ampicillin

(100 g/ml) qua đêm ở 37C. Plasmid từ các dòng tế bào được tách bằng Kit GeneJET

Plasmid miniprep (Thermo Fisher Scientific) và cắt kiểm tra bằng hai enzyme giới

hạn HindIII và NdeI. Sản phẩm cắt được kiểm tra bằng điện di trên gel agarose 0,8%.

Những dòng plasmid nào có xuất hiện hai băng đúng kích thước của vector pET-17b

(3306 bp) và của các đoạn gen denovogenes_18736 (1506 bp) và

denovogenes_32768 (1224 bp) thì ống tế bào tương ứng được giữ lại, nhân giống và

bảo quản trong glycerin ở -80oC.

2.3.9. Biểu hiện gen denovogenes_18736 và denovogenes_32768

Nhân giống trong bình tam giác

Các chủng E. coli JM109(DE3) và E. coli C43(DE3) mang vector pET-

17b_18736/pET-17b_32768 được hoạt hóa trên đĩa môi trường LB thạch đặc có bổ

sung ampicillin (100 µg/ml) bằng phương pháp cấy vạch. Các đĩa được ủ ở 37C

trong khoảng 16 giờ.

Khuẩn lạc đơn được cấy chuyển vào 20 ml môi trường LB + ampicillin (100

µg/ml) và nuôi ở 37ºC, lắc 200 vòng/phút trong khoảng 16 giờ.

Biểu hiện gen denovogenes_18736 và denovogenes_32768

Giống sau khi được chuẩn bị sẽ được cấy chuyển vào bình tam giác có dung

tích 500 ml chứa 100 ml các môi trường (LB, NB hoặc TB) với tỷ lệ giống 5%, nuôi

lắc 200 rpm ở 37oC trong 2-3 giờ cho đến khi OD600 đạt 0,6-0,8 thì bổ sung 1 mM

IPTG và hạ nhiệt độ xuống 30oC. Tiếp tục nuôi lắc 200 rpm trong 48 giờ. Ly tâm thu

sinh khối ở 6000 rpm trong 10 phút, loại bỏ dịch nổi và bảo quản ở -20oC cho thí

nghiệm xác định trọng lượng tế bào và hoạt tính enzyme thô.

2.3.10. Xác định trọng lượng sinh khối khô

Sinh khối được sấy khô ở 105C đến trọng lượng không đổi để xác định trọng

lượng sinh khối khô.

2.3.11. Phương pháp thu nhận enzyme thô

Cặn tế bào (sản phẩm mục 2.3.9) được rã đông và được hòa vào trong đệm phá

tế bào (Phụ lục 6). Tế bào sau đó được phá bằng sóng siêu âm trong 20 phút trên đá

45

(Pulse on 15s, pulse off 11s, Amp 50%). Dịch phá tế bào được ly tâm ở 35.000 rpm

trong 60 phút để thu dịch enzyme thô.

2.3.12. Phương pháp xác định hoạt tính endoglucanase

- Định tính endoglucanase: Hoạt tính endoglucanase được xác định theo phương

pháp khuếch tán trên đĩa thạch của Sharma và Guptasarma (2017) cải tiến. Dịch

enzyme (50 μl) được nhỏ vào giếng trên đĩa thạch có chứa 1 % CMC (w/v). Sau đó,

đĩa thạch được ủ ở 4C trong 4 giờ để dịch enzyme khuếch tán vào thạch trước khi

chuyển vào tủ ấm 55C, ủ 16-18 giờ. Hoạt tính endoglucanase được xác định bằng

đường kính vòng phân giải sau khi nhuộm bằng dung dịch 0,1 % Congo red (w/v) và

tẩy nhuộm bằng dung dịch 1M NaCl.

- Định lượng endoglucanase: Hoạt tính endoglucanase được xác định theo

phương pháp của Ghose (1987) cải tiến. Hỗn hợp phản ứng (500 µl enzyme trộn với

500 µl dung dịch 1% CMC pha trong 50 mM đệm Tris, pH 7) được ủ ở nhiệt độ 55ºC

trong 30 phút. Sau đó dừng phản ứng bằng cách thêm vào 3 ml thuốc thử

dinitrosalycilic (DNS). Các mẫu được đun sôi trong 5 phút, làm nguội nhanh trong

nước lạnh để ổn định màu. Lượng đường khử sinh ra (dưới dạng glucose) được xác

định theo Miller (1959). Độ hấp thụ được đo ở bước sóng 540 nm. Độ hấp thụ của

mẫu được xác định sau khi đã trừ cho mẫu đối chứng (Hỗn hợp phản ứng giữ nguyên

nhưng enzyme được bổ sung vào sau khi đã dừng phản ứng). Một đơn vị enzyme

được định nghĩa là lượng enzyme cần thiết để tạo ra 1 μmol glucose trong một phút

ở điều kiện nhiệt độ và pH phản ứng nhất định.

𝟎,𝟏𝟖𝟓

Hoạt tính endoglucanase được tính toán theo công thức:

𝑵ồ𝒏𝒈 độ 𝒆𝒏𝒛𝒚𝒎𝒆 để 𝒈𝒊ả𝒊 𝒑𝒉ó𝒏𝒈 𝒓𝒂 𝟎,𝟓 𝒎𝒈 𝒈𝒍𝒖𝒄𝒐𝒔𝒆

CMCase (U/ml) =

2.3.13. Phương pháp xác định hoạt tính -glucosidase

- Định tính β-glucosidase: Hoạt tính β-glucosidase được xác định theo phương

pháp của Veena và cs. (2011) cải tiến. Dịch enzyme (50 μl) được nhỏ vào giếng thạch

có chứa esculin (3 g/l) và ferric ammonium citrate (0.2 g/l). Sau đó, đĩa thạch được ủ

ở 4C trong 4 giờ để dịch enzyme khuếch tán vào thạch trước khi chuyển vào tủ ấm

46

55C, ủ 16-18 giờ. Hoạt tính β-glucosidase được xác định bằng đường kính vòng

phân giải esculin có màu nâu sẫm hình thành xung quanh giếng.

- Định lượng β-glucosidase: Hoạt tính β-glucosidase được xác định theo phương

pháp của Shi và cs. (2017) cải tiến, sử dụng p-nitrophenyl-β-D-glucopyranoside (p-

NPG) làm cơ chất phản ứng.

Hỗn hợp phản ứng (500 µl enzyme trộn với 500 µl dung dịch 20 mM p-NPG và

1 ml dung dịch đệm 50 mM Tris, pH 7) được ủ ở nhiệt độ 55ºC trong 15 phút. Sau

đó 2 ml dung dịch 200 mM Na2CO3 được thêm vào hỗn hợp để dừng phản ứng. Lượng

p-NP giải phóng ra được xác định bằng mức độ hấp thụ ở bước sóng 400 nm. Các

mẫu đối chứng được tiến hành song song. Trong đó, ở mẫu đối chứng, dịch enzyme

được thêm vào sau khi đã kết thúc phản ứng bằng 2 ml dung dịch 200 mM Na2CO3.

Một đơn vị hoạt tính enzyme được định nghĩa là lượng enzyme cần thiết xúc tác

phản ứng để giải phóng ra 1 mol p- nitrophenyl (p-NP) từ p-NPG trong thời gian

một phút ở điều kiện phản ứng.

A(Athí nghiệm −Ađối chứng)  Vt  df

Hoạt tính β-glucosidase được tính toán theo công thức:

18,1  1,0  t  Vs

β-glucosidase(U/ml)= = A  0,0295  df

β-glucosidase (U/mg) = (U/ml) x 1/C

Trong đó:

Vt: Tổng thể tích phản ứng (4,0 ml)

Vs: Thể tích enzyme phản ứng (0,5 ml)

18,1: Hệ số hấp thụ millimol của p-NP trong điều kiện thí nghiệm (cm2/micromol)

1,0: Chiều dài đường truyền ánh sáng đi qua cuvet (cm)

t: Thời gian phản ứng (15 phút)

df: Hệ số pha loãng

C: Nồng độ enzyme trong dung dịch (c mg/ml)

2.3.14. Ảnh hưởng của một số yếu tố lên mức độ biểu hiện endoglucanase_18736

và β-glucanase_32768

- Ảnh hưởng của thành phần môi trường: Các bước được thực hiện tương tự

như Mục 2.3.9. Chủng E. coli C43(DE3) tái tổ hợp mang vector pET17b_18736 và

47

chủng E. coli C43(DE3) tái tổ hợp mang vector pET17b_32768 được nhân giống trên

môi trường LB trước khi chuyển sang biểu hiện trên 3 loại môi trường NB, LB và

TB. Hiệu suất biểu hiện được đánh giá thông qua trọng lượng sinh khối và hoạt tính

của enzyme dung hợp.

- Ảnh hưởng của độ thoáng khí: Các bước được thực hiện tương tự như Mục

2.3.9. Chủng E. coli C43(DE3) tái tổ hợp mang vector pET17b_18736 và chủng E.

coli C43(DE3) tái tổ hợp mang vector pET17b_32768 được nhân giống trên môi

trường LB trước khi chuyển vào các bình tam giác (thể tích 500 ml) chứa môi trường

TB với các thể tích khác nhau 50 - 300 ml (tương ứng 10-60% thể tích bình). Quá

trình biểu hiện được thực hiện ở 30oC, 200 rpm trong 48 giờ. Hiệu suất biểu hiện

được đánh giá thông qua trọng lượng sinh khối và hoạt tính của enzyme dung hợp.

- Ảnh hưởng của nồng độ IPTG: Các bước được thực hiện tương tự như Mục

2.3.9. Nuôi cấy chủng tái tổ hợp E. coli C43(DE3) trong bình tam giác (thể tích 500

ml) có chứa 100 ml môi trường TB cho đến khi OD600 đạt 0,6-0,8, bổ sung IPTG với

các nồng độ 0,25-1,5mM. Hiệu suất biểu hiện được đánh giá thông qua trọng lượng

sinh khối và hoạt tính của enzyme dung hợp.

2.3.15. Động thái sinh trưởng và sinh endoglucanase, β-glucosidase tái tổ hợp

Các bước được thực hiện tương tự như Mục 2.3.9. Các chủng E. coli C43(DE3)

tái tổ hợp được nuôi trong bình tam giác (500 ml) có chứa 100 ml môi trường TB.

Quá trình biểu hiện được thực hiện sau khi cảm ứng 0,25 mM IPTG, nuôi cấy ở 30oC,

lắc 200 rpm. Mẫu được lấy mỗi 6 tiếng trong 48 giờ để xác định trọng lượng sinh

khối và hoạt tính của enzyme dung hợp.

2.3.16. Tinh sạch endoglucanase và β-glucosidase tái tổ hợp

Nguyên lý: Cột niken được sử dụng cho sắc ký ái lực cố định ion kim loại

(IMAC) để tinh sạch protein tái tổ hợp có gắn đuôi His-tag bởi niken có ái lực cao

với đuôi polyhistidin trong khi các protein khác có ái lực thấp hoặc không có ái lực.

Do đó, khi đi qua cột sắc ký IMAC-Ni2+, protein tái tổ hợp có gắn đuôi His-tag sẽ

hình thành liên kết giữa Ni2+ với đuôi 6xHis trong phân tử protein và được giữ lại

trên cột. Còn các protein khác không hình thành liên kết với Ni2+ sẽ đi ra khỏi cột.

48

Các protein liên kết với Ni2+ sau đó được rửa giải bằng đệm có bổ sung imidazole ở

nồng độ cao (thường từ 200 mM trở lên).

Tiến hành: Tất cả các bước trong thí nghiệm đều được tiến hành ở nhiệt độ lạnh

4ºC. Cân bằng cột IMAC-Ni2+ bằng đệm A (50 mM đệm potassium phosphate, pH

7.4, 500 mM natri acetate, 10% glycerol, 0,1 mM DTEm 1% natri cholat, 1% Tween

20 và 0,1 mM PMSF). Pha loãng enzyme thô cũng bằng đệm A với tỷ lệ 1:4 trước

khi đưa mẫu enzyme lên cột. Rửa cột bằng 50 ml đệm rửa (đệm A + 10 - 40 mM

imidazol). Endoglucanase tái tổ hợp được đẩy ra khỏi cột bằng đệm B (Đệm A + 250

mM imidazol). β-Glucosidase tái tổ hợp được đẩy ra khỏi cột bằng đệm đẩy C (Đệm

A + 200 mM imidazol).

Dịch đẩy ra khỏi cột sắc ký được thu lại thành các phân đoạn (1 ml/phân đoạn)

với tốc độ 2 ml/ phút. Imidazole được loại bỏ bằng phương pháp thẩm tích. Các phân

đoạn sau đó được kiểm tra hoạt tính theo phương pháp định tính như đã mô tả trong

Mục 2.3.12 và 2.3.13. Hai phân đoạn có hoạt tính cao nhất được gom lại, loại bớt

nước để đạt thể tích mong muốn. Sản phẩm enzyme sau đó được xác định hoạt tính

riêng, kiểm tra độ tinh sạch bằng điện di trên gel polyacrylamid và phân tích

zymogram.

2.3.17. Định lượng protein tổng số

Protein tổng số được định lượng theo phương pháp Bradford (1976) và nồng độ

protein được xác định dựa trên đường chuẩn BSA từ nồng độ 25–125 µg/ml (Phụ lục

7), khi tác dụng với thuốc thử Coomassie Brilliant Blue (Phụ lục 8) tạo phức hợp màu

có độ hấp thụ ở bước sóng 595 nm.

Cách tiến hành: Trộn 100 l mẫu + 900 μl dung dịch thuốc thử. Trộn đều và sau

10 phút đo độ hấp thụ protein ở bước sóng 595 nm. Ở mẫu đối chứng, dịch protein

được thay bằng dung dịch 0,15 M NaCl. Dựa vào hàm số tương quan giữa nồng độ

protein và độ hấp thụ để suy ra nồng độ protein trong mẫu.

2.3.18. Điện di protein SDS-PAGE

Nguyên lý: Việc phân tách protein theo khối lượng phân tử của chúng được tiến

hành theo phương pháp điện di gel SDS-PAGE của Laemmli (1970). Các phân tử

49

protein trong môi trường có SDS thường duỗi thẳng và tích điện âm. Do đó, khi điện

di, các phân tử protein này sẽ di chuyển về phía cực dương trong điện trường với tốc

độ phụ thuộc vào khối lượng phân tử của chúng.

Tiến hành: Dung dịch gel tách (separating gel) được chuẩn bị các thành phần

như mô tả ở Phụ lục 9, sau đó được rót cẩn thận vào giữa các tấm kính với chiều cao

khoảng ¾ chiều cao tấm kính. Sau khi lớp Gel tách được polymer hóa, tiếp tục rót

dung dịch gel cô (stacking gel) với thành phần được mô tả ở Phụ lục 9 lên trên và cẩn

thận cài lược vào giữa 2 tấm kính. Sau khi lớp gel cô polymer hóa, bảo quản các bản

Gel ở 4C cho đến khi sử dụng.

Xử lý mẫu trước khi điện di: Mẫu được hòa vào trong đệm 2x SDS (Phụ lục 9)

với tỷ lệ 1:1 (v/v), trộn đều, ủ ở 100ºC trong 5 phút để biến tính protein.

Tra mẫu và protein marker vào các giếng. Các protein được phân tách trên bản

Gel ở cường độ 80-100 mA cho đến khi mẫu chạy đến sát đáy Gel. Gỡ bản gel, nhuộm

bằng thuốc nhuộm Coomassie brilliant blue (Phụ lục 9) trong 30 phút, sau đó rửa lại

bằng dung dịch tẩy nhuộm (Phụ lục 9) cho đến khi quan sát được các băng protein

riêng rẽ.

2.3.19. Kiểm tra hoạt tính endoglucanase bằng Zymogram (Điện di protein trên

gel polyacrylamide có chứa cơ chất CMC)

Điện di protein trên gel polyacrylamide có chứa cơ chất CMC được tiến hành

theo phương pháp của Sharma và Guptasarma (2017) cải tiến. Các bước điện di được

tiến hành giống như điện di protein ở mục 2.3.18. Tuy nhiên có một vài thay đổi như

sau: thành phần gel tách được bổ sung 0,5% CMC; kết thúc quá trình điện di, protein

trong gel được hồi biến bằng cách ngâm bản gel trong dung dịch đệm Tris 50 mM,

pH 8,5 có chứa 1% Triton X - 100 (v/v) khoảng 1 giờ; bản gel được rửa lại trong dung

dịch đệm Tris 50 mM, pH 8,5 và tiếp tục sử dụng đệm Tris để ngâm ủ gel 4 giờ ở 4°C

và chuyển sang ủ ở 55°C qua đêm trước khi nhuộm gel bằng dung dịch 0,1 % Congo

red trong 30 phút; cuối cùng bản gel được tẩy nhuộm bằng dung dịch NaCl 1M. Băng

protein có hoạt tính thủy phân cellulose được xác định tương ứng với vùng không

màu xuất hiện trên nền bản gel có màu đỏ của thuốc nhuộm Congo Red.

50

2.3.20. Kiểm tra hoạt tính β-glucosidase bằng Zymogram

Zymogram được tiến hành theo phương pháp của Neddersen và Elleuche (2015)

cải tiến. Kết thúc quá trình điện di protein ở mục 2.3.18, bản gel được lấy ra và ngâm

trong dung dịch 1% Triton X- 100 (v/v) khoảng 1 giờ. Sau đó, bản gel được tiếp tục

chuyển sang ngâm trong dung dịch đệm Tris 50 mM, pH 8,5, 5 phút. Cuối cùng, bản

gel được ủ trong dung dịch đệm Tris 50 mM, pH 8,5 chứa 0,3% esculin (w/v) và

0,02% ferric ammonium citrate (w/v) qua đêm ở 55°C. Băng β-glucosidase có hoạt

tính sẽ xuất hiện màu vàng đậm đến nâu trên nền bản gel có màu vàng của esculin và

ferric ammonium citrate.

2.3.21. Nghiên cứu một số đặc tính của enzyme tái tổ hợp

2.3.21.1. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp

Enzyme tái tổ hợp được ủ với cơ chất ở các nhiệt độ khác nhau từ 50 đến 65C

trong 30 phút. Hoạt tính của endoglucanase được xác định theo Phương pháp 2.3.12

và của β-glucosidase được xác định theo Phương pháp 2.3.13 mô tả ở trên tại các

nhiệt độ nghiên cứu.

2.3.21.2. Ảnh hưởng của pH lên hoạt tính enzyme tái tổ hợp

Ủ enzyme với cơ chất tương ứng ở nhiệt độ 55C trong đệm có pH khác nhau:

citrate (pH 3-6); Tris/HCl (pH 7-10); disodium phosphate (pH 11-12). Các dung dịch

đệm đều có nồng độ 50 mM ngoại trừ đệm Tris/HCl, pH 10 có nồng độ 100 mM.

Hoạt tính của endoglucanase được xác định theo Phương pháp 2.3.12 và của β-

glucosidase được xác định theo Phương pháp 2.3.13.

2.3.21.3. Ảnh hưởng của các ion kim loại lên hoạt tính enzyme tái tổ hợp

Enzyme được hòa trong đệm Tris/HCl theo giá trị pH tối ưu. Bổ sung các ion

K+, Li+, Na+, Ag+, Ca2+, Cu2+, Zn2+, Mg2+, Fe2+, Mn2+, Co2+ và Fe3+ để đạt được nồng

độ cuối cùng là 5 mM. Phản ứng được thực hiện ở 55C. Sau đó, các ion có ảnh hưởng

làm tăng hoạt tính enzyme được tiếp tục khảo sát ảnh hưởng của nồng độ ion đó lên

hoạt tính enzyme tái tổ hợp để xác định nồng độ ion tối ưu cho phản ứng. Ở các mẫu

đối chứng dương, thành phần phản ứng không đổi nhưng enzyme được bố sung vào

sau khi đã dừng phản ứng. Trong khi đó, các mẫu đối chứng âm, thành phần enzyme

51

được thay bằng đệm và vẫn có sự hiện diện của các ion kim loại. Ảnh hưởng của các

ion kim loại lên hoạt tính enzyme tái tổ hợp được đánh giá thông qua hoạt tính enzyme

ở các mẫu có bổ sung ion kim loại vào phản ứng so với mẫu không bổ sung bất cứ

ion kim loại nào. Giá trị hoạt tính enzyme của mẫu không bổ sung bất cứ ion kim loại

nào được tính tương quan là 100%. Hoạt tính của endoglucanase được xác định theo

Phương pháp 2.3.12 và của β-glucosidase được xác định theo Phương pháp 2.3.13.

2.3.21.4. Xác định độ bền nhiệt của enzyme tái tổ hợp

Độ bền nhiệt của các enzyme tái tổ hợp được xác định tại các giá trị nhiệt độ và

pH tối ưu, có hoặc không có ion kim loại. Cụ thể: endoglucanase tái tổ hợp được tiến

hành ở nhiệt độ 55C và 60C; còn β-glucosidase được ủ ở nhiệt độ 50C và 55C.

Độ bền của enzyme được xác định theo giá trị T1/2, tại thời điểm hoạt tính tương đối

của enzyme mất đi một nửa. Giá trị T1/2 được tính theo công thức: T1/2 = ln2/Kd, trong

đó Kd là hằng số tốc độ bậc một, được xác định bằng hồi quy tuyến tính của ln (hoạt

độ còn lại) so với thời gian ủ (t).

2.3.21.5. Xác định tính đặc hiệu cơ chất của enzyme tái tổ hợp

Để xác định tính đặc hiệu cơ chất của endoglucanase và β-glucosidase tái tổ

hợp, phản ứng giữa enzyme và cơ chất được thực hiện dưới các điều kiện tối ưu, trong

đó các cơ chất được sử dụng để nghiên cứu gồm: CMC, bột giấy, Avicel (ở nồng độ

1%) và pNPG (20 mM).

2.3.21.6. Xác định động học của enzyme tái tổ hợp

Động học phản ứng của enzyme tái tổ hợp được xác định thông qua hằng số

Michaelis-Menten. Động học của endoglucanase và β-glucosidase tái tổ hợp được xác

định trên các cơ chất tương ứng là CMC (với dải nồng độ từ 0,2 - 2 mg/ml) và p-NPG

(với dải nồng độ từ 0,2 - 4 mM). Số liệu được tính toán trên phương trình hyperbol f(x)

= ax/(b+x) sử dụng phần mềm Sigma Plot (Rockware, Golden, CO, USA).

2.3.22. Xử lý thống kê

Tất cả các thí nghiệm được lặp lại 3 lần. Sử dụng Microsoft excel 2016 để xử

lý dữ liệu. Các kết quả được hiểu thị là giá trị trung bình ± độ lệch chuẩn của mẫu.

Giá trị p < 0,05 được coi là có ý nghĩa thống kê trong dữ liệu.

52

CHƯƠNG 3

KẾT QUẢ NGHIÊN CỨU

3.1. Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước

nóng Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu gen

mã hóa cho cellulase.

3.1.1. Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng

Bình Châu

Suối nước nóng Bình Châu thuộc xã Bưng Riềng, huyện Xuyên Mộc, tỉnh Bà

Rịa – Vũng Tàu có hơn 70 điểm phun nước lộ thiên, chảy len lỏi qua rừng tràm, nằm

trong khu rừng cấm nguyên sinh quốc gia với diện tích khoảng 7 ha. Suối nước nóng

có nhiệt độ ở gần miệng giếng phun dao động trong khoảng 82-84C, pH 7,5 – 9,2.

Vì là suối lộ thiên, do vậy các dòng chảy của suối trải dài trên khu rừng tràm nguyên

sinh, có dải nhiệt độ dao động từ 40C đến điểm sôi 82C.

Nghiên cứu của chúng tôi được thực hiện tại địa phận của Công ty cổ phần du

lịch Sài Gòn – Bình Châu với quy mô 33 ha nằm giữa rừng tràm với những vị trí khu

trú các điểm sôi chính. Vị trí lấy mẫu có tọa độ 1036’03.9” Bắc và 10733’30.0”

Đông (Hình 3.1). Chỉ tiêu hóa lý của mẫu nước thu nhận từ suối nước nóng Bình

Châu được trình bày tại Phụ lục 10.

Mẫu nước và mẫu bùn thu thập từ suối nước nóng Bình Châu được sử dụng làm

nguyên liệu tách DNA metagenome. Kết quả tách chiết DNA metagenome của mẫu

nước và bùn suối nước nóng Bình Châu cho thấy DNA metagenome có chất lượng

tốt, DNA không bị đứt gãy (Hình 3.2). DNA metagenome thu lần 1 và 2 của mẫu

nước và mẫu bùn (4 mẫu) sau đó được gộp lại để tạo thành DNA metagenome mẫu

nước và mẫu bùn (2 mẫu). DNA metagenome của hai mẫu này được xác định nồng

độ DNA bằng cách đo mẫu trên máy quang phổ Nano Drop 1000. Kết quả cho thấy

cả hai mẫu DNA thu được đều có độ tinh sạch cao, tỷ lệ A260/A280, A260/A230 đều lớn

hơn 2. Lượng DNA metagenome mẫu nước đạt 63,75 ng/µl và mẫu bùn đạt 120,9

ng/µl (Bảng 3.1). Mẫu DNA thu được này đảm bảo đủ điều kiện đáp ứng về số lượng

và chất lượng để gửi đi giải trình tự gen thế hệ mới. DNA metagenome mẫu nước và

53

mẫu bùn sau đó được trộn lại với nhau theo tỷ lệ 1:1 (v/v) để tạo thành mẫu DNA

metagenome suối nước nóng Bình Châu.

b a

d c

Hình 3.1. Các vị trí lấy mẫu nước và mẫu bùn của suối nước nóng Bình Châu.

a, b): vị trí lấy mẫu nước (82C); c, d): vị trí lấy mẫu bùn (45-65C).

Chú thích: M: thang DNA chuẩn 1 kb; 1 và 3: DNA metagenome của mẫu nước thu lần 1

và 2; 2 và 4: DNA metagenome của mẫu bùn thu lần 1 và 2.

Hình 3.2. DNA metagenome mẫu nước và bùn suối nước nóng Bình Châu.

54

Bảng 3.1. Nồng độ và độ tinh sạch của DNA metagenome mẫu nước và mẫu bùn

suối nước nóng Bình Châu.

Mẫu

Nồng độ DNA metagenome (ng/ µl)

A260/A280

A260/A230

Nước

63,75 ± 1,12

2,15 ± 0,1

2.1 ± 0,05

Bùn

120,9 ± 1,3

2,07 ± 0,16

2.1 ± 0,11

3.1.2. Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật, xác

định và tổng hợp gen mới mã hóa cho các enzyme thủy phân cellulose

(enzyme chịu kiềm, chịu axit và chịu nhiệt)

3.1.2.1. Giải trình tự và tiền xử lý dữ liệu DNA metagenome suối nước nóng Bình Châu

DNA metagenome suối nước nóng Bình Châu được gửi đi đọc trình tự tại công

ty BGI Co., Ltd (HongKong) bằng thiết bị giải trình tự thế hệ mới Illumina HiSeqTM

platform. Kết quả giải trình tự thu được 10,4 Gb dữ liệu thô. Phân tích dữ liệu bằng

phần mềm FastQC cho thấy có 0,04% trình tự không xác định được là A,T,G hay C;

0,41% là trình tự mồi đọc trình tự, 6,97% trình tự có chất lượng kém (Q<20) và

92,58% trình tự có chất lượng tốt.

Sử dụng phần mềm Trimmomatic để tinh sạch dữ liệu (loại bỏ trình tự chất

lượng kém), kết quả thu được bộ dữ liệu tinh sạch bao gồm 93.999.534 đoạn trình tự

(9,4 Gb dữ liệu) chất lượng cao. Tỷ lệ dữ liệu sạch/ dữ liệu thô là 89,98%. Dữ liệu có

Q20 đạt 94,98% và Q30 đạt 87,97% (Bảng 3.2).

Bảng 3.2. Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome

suối nước nóng Bình Châu.

Dữ liệu tinh sạch (G) Q20 (%) Q30 (%) Số lượng contig N50 (bp)

Tỉ lệ lắp ráp (%)

9,4

94,98

87,97

51.346

9.791

65,12

3.1.2.2. Lắp ráp de novo metagenome

Khi giải trình tự DNA metagenome suối nước nóng Bình Châu trên thiết bị giải

trình tự thế hệ mới Illumina HiSeqTM platform, DNA đã bị chia thành các đoạn nhỏ.

Do đó, để tiến hành phân tích, trước tiên các đoạn trình tự cần được lắp ráp thành các

contig. Dữ liệu DNA metagenome của khu hệ vi sinh vật ở suối nước nóng Bình Châu

được lắp ráp bằng phần mềm SOAPdenovo2 để tạo thành các contig và sử dụng công

cụ Quast để đánh giá chất lượng lắp ráp (Quality Assessment Tool for Genome

55

Assemblies). Kết quả cho thấy đã lắp ráp được 93.999.534 đoạn trình tự, tạo ra 51.346

contigs với tổng chiều dài là 172.103.446 bp, trong đó độ dài contig N50 là 9.791 bp,

độ dài contig N90 là 1.059 bp, contig dài nhất là 1.767.609 bp, ngắn nhất là 500 bp,

kích thước trung bình contig là 3.351 bp và tỷ lệ lắp ráp (mapping rate) đạt 65,12%

(Bảng 3.3).

Tổng số đoạn trình tự

93.999.534

Số đoạn trình tự được lắp ráp

61.212.496

Tổng chiều dài lắp ráp (bp)

172.103.446

Tỉ lệ lắp ráp (%)

65,12

Tổng số contig

51.346

Contig dài nhất (bp)

1.767.609

Contig ngắn nhất (bp)

500

Độ dài contig N90 (bp)

1.059

Độ dài contig N50 (bp)

9.791

Độ dài trung bình các contig (bp)

3.351

Bảng 3.3. Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu.

Hình 3.3. Phân bố độ dài contig sau khi lắp ráp bằng phần mềm SOAPdenovo2.

Phân bố độ dài của các contig được thể hiện trong Hình 3.3 cho thấy các contig

có độ dài từ 500-999 bp có tỷ lệ cao nhất, chiếm 42,9%; tiếp sau là các contig có độ

dài từ 1.000-1.499 bp, chiếm 17,8%.

56

3.1.2.3. Dự đoán gen

Sử dụng chức năng dự đoán ORF của phần mềm MetaGeneMark v2.10 với

51.346 contig chúng tôi đã thu được 156.093 khung đọc mở tiềm năng. Phân bố độ

dài của các khung đọc mở được thể hiện trong Hình 3.4 cho thấy các đoạn gen có độ

dài từ 500-999 bp có tỉ lệ cao nhất (chiếm 47,2%), tiếp theo là các đoạn gen có chiều

dài 1.000-1.499 bp (chiếm 20,4%); các đoạn gen có chiều dài từ 1.500-1.999 bp có tỉ

lệ thấp (chỉ chiếm 6,9%).

Hình 3.4. Phân bố độ dài các gen được dự đoán từ bộ dữ liệu DNA metagenome

suối nước nóng Bình Châu.

3.1.2.4. Đánh giá đa dạng vi sinh vật

Cơ sở dữ liệu nr và MEGAN được sử dụng để chú giải và phân loại tất cả

156.093 khung đọc mở, kết quả cho thấy có 106.903 gen được chú giải và 49.190 gen

là những gen chưa biết, chiếm lần lượt 68,5% và 31,5%. Kết quả phân loại các gen

đã được trình bày trong Bảng 3.4 và Hình 3.5.

Bảng 3.4. Thống kê phân loại học DNA metagenome suối nước nóng Bình Châu đã

được chú giải.

Số gen Số Giới Số Ngành Số Lớp Số Bộ Số Họ Số Chi Số Loài

106.903

5

41

57

128

245

825

2.250

57

Hình 3.5. Biểu đồ biểu thị 8 nhóm chiếm ưu thế cho từng cấp độ phân loại (Ngành,

Lớp, Bộ, Họ, Chi, Loài) vi sinh vật ở suối nước nóng Bình Châu.

Kết quả phân tích MEGAN cho thấy trong số 106.903 gen đã được chú giải có

29.069 gen vi khuẩn, 1.416 gen cổ khuẩn, 4 gen nhân thật, 3 gen virus và 76.411

gen chưa được xác định (unclassfied). Trong giới chiếm ưu thế là vi khuẩn và cổ

58

khuẩn, tám chú giải ở các cấp độ phân loại (Ngành, Lớp, Bộ, Họ, Chi, Loài) vi sinh

vật chiếm ưu thế trong suối nước nóng Bình Châu đã được tóm tắt và trình bày ở

Hình 3.5. Cụ thể: trong giới vi khuẩn, ngành Proteobacteria là ngành chiếm ưu thế

nhất chiếm 68,68%, tiếp theo là Firmicutes (8,22%), Cyanobacteria (4,53%),

Bacteroidetes (3,52%), Planctomycetes (2,81%), Actinobacteria (2.43%) và các

ngành khác (độ phong phú tương đối <2%) (Hình 3.5 và Bảng 3.5). Hơn nữa, trong

ngành Proteobacteria, lớp Gammaproteobacteria là lớp chiếm ưu thế nhất (24,87%),

tiếp sau là Alphaproteobacteria (19.61%) và Betaproteobacteria (16.42%) (Hình 3.5

và Bảng 3.6).

Bảng 3.5. Tỷ lệ các gen đã được phân loại thuộc các Ngành vi khuẩn ở suối nước

nóng Bình Châu.

Ngành

Số lượng reads

Mức độ chiếm ưu thế (%)

19.966

68.68

Proteobacteria

2.389

8.22

Firmicutes

1.318

4.53

Cyanobacteria

1.023

3.52

Bacteroidetes

816

2.81

Planctomycetes

707

2.43

Actinobacteria

481

1.65

Verrucomicrobia

375

1.29

Spirochaetes

367

1.26

Chloroflexi

244

0.84

Nitrospirae

184

0.63

Nitrospinae

134

0.46

Gemmatimonadetes

128

0.44

Aquificae

108

0.37

Deinococcus-Thermus

107

0.37

Acetothermia

85

0.29

Poribacteria

85

0.29

Thermodesulfobacteria

83

0.29

Acidobacteria

59

0.20

Synergistetes

43

0.15

Fusobacteria

36

0.12

Dictyoglomi

36

0.12

Marinimicrobia

59

Lentisphaerae

35

0.12

Chlorobi

33

0.11

Candidatus Saccharibacteria

24

0.08

Chlamydiae

19

0.07

Thermotogae

17

0.06

Deferribacteres

5

0.02

Tenericutes

5

0.02

Unclassified

158

0.54

Bảng 3.6. Tỷ lệ các gen đã được phân loại thuộc các Lớp vi khuẩn

ở suối nước nóng Bình Châu.

Ngành

Lớp

Số lượng read Mức độ chiếm ưu thế (%)

Gammaproteobacteria

7.230

Proteobacteria

24.87

Alphaproteobacteria

5.702

Proteobacteria

19.61

Betaproteobacteria

4.773

Proteobacteria

16.42

Deltaproteobacteria

2.010

Proteobacteria

6.91

NA

1.205

Cyanobacteria

4.15

Bacilli

1.151

Firmicutes

3.96

Clostridia

878

Firmicutes

3.02

Planctomycetia

816

Planctomycetes

2.81

Actinobacteria

656

Actinobacteria

2.26

Spirochaetia

375

Spirochaetes

1.29

Cytophagia

340

Bacteroidetes

1.17

Flavobacteriia

329

Bacteroidetes

1.13

Negativicutes

327

Firmicutes

1.12

274

Verrucomicrobia

Verrucomicrobiales

0.94

Nitrospira

244

Nitrospirae

0.84

Nitrospinia

184

Nitrospinae

0.63

Chloroflexia

178

Chloroflexi

0.61

NA

158

Unclassified

0.54

Bacteroidia

153

Bacteroidetes

0.53

Ktedonobacteria

150

Chloroflexi

0.52

Sphingobacteriia

149

Bacteroidetes

0.51

Zetaproteobacteria

144

Proteobacteria

0.50

134

Gemmatimonadetes

Gemmatimonadetes

0.46

Aquificae

128

Aquificae

0.44

Gloeobacteria

112

Cyanobacteria

0.39

60

Deinococcus-Thermus

Deinococci

108

0.37

NA

107

Acetothermia

0.37

NA

85

Poribacteria

0.29

Thermodesulfobacteria

Thermodesulfobacteria

85

0.29

Spartobacteria

84

Verrucomicrobia

0.29

NA

82

Verrucomicrobia

0.28

Epsilonproteobacteria

76

Proteobacteria

0.26

NA

63

Acidobacteria

0.22

Synergistia

59

Synergistetes

0.20

NA

52

Bacteroidetes

0.18

Fusobacteriia

43

Fusobacteria

0.15

Opitutae

41

Verrucomicrobia

0.14

NA

39

Chloroflexi

0.13

Rubrobacteria

36

Actinobacteria

0.12

Dictyoglomia

36

Dictyoglomi

0.12

NA

36

Marinimicrobia

0.12

Lentisphaeria

35

Lentisphaerae

0.12

Chlorobia

33

Chlorobi

0.11

NA

31

Proteobacteria

0.11

Erysipelotrichia

26

Firmicutes

0.09

24

Candidatus Saccharibacteria NA

0.08

Acidobacteriia

20

Acidobacteria

0.07

Chlamydiia

19

Chlamydiae

0.07

Thermotogae

17

Thermotogae

0.06

Coriobacteriia

9

Actinobacteria

0.03

NA

7

Firmicutes

0.02

Thermoleophilia

6

Actinobacteria

0.02

Deferribacteres

5

Deferribacteres

0.02

Mollicutes

5

Tenericutes

0.02

Dehalococcoidia

1

Chloroflexi

0.00

Chú thích: NA – No Annotation: chưa chú giải.

Trong suối nước nóng Bình Châu, Aquificae, Thermodesulfobacteria và

Thermotogae được biết đến là các Ngành vi khuẩn ưa nhiệt hoặc siêu ưa nhiệt. Ba

Ngành này xuất hiện với tỷ lệ thấp tương ứng: 0,44%, 0,29% và 0,06% (Bảng 3.6).

Mặc dù sử dụng cơ sở dữ liệu nr và MEGAN đã chú giải được 106.903 gen

nhưng đánh giá đa dạng vi sinh vật ở mức độ phân loại đến loài còn khá hạn chế, có

61

tới 78.487 gen chưa được phân loại chiếm 50,282% tổng số gen được dự đoán và

73,419% so với gen được chú giải. Phân tích kết quả phân loại vi khuẩn ở cấp độ loài

cho thấy Marinobacter manganoxydans là loài chiếm ưu thế nhất (5,57%), tiếp theo

là Roseobacter sp. (4,81%), Gamma proteobacterium IMCC2047 (3,93%),

Thiobacillus thioparus (1,11%), Bdellovibrio bacteriovorus (0,96%), Thiobacillus

denitrificans (0,96%), Caldimonas manganoxidans (0,85%) và các loài khác với tỷ

lệ các gen đã được phân loại chiếm < 0,85%.

Vi sinh vật trong suối nước nóng nói chung và trong suối nước nóng Bình Châu

nói riêng chủ yếu là vi khuẩn và cổ khuẩn. Cổ khuẩn có mặt trong suối nước nóng

Bình Châu chủ yếu thuộc Ngành Thaumarchaeota (51,76%), tiếp theo là Ngành

Euryarchaeota (35,38%). Đồng thời, trong số các loài cổ khuẩn đã được phân loại

trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu, loài cổ khuẩn

Candidatus Nitrosoarchaeum limnia là loài chiếm ưu thế nhất (22,17%) (Hình 3.5).

3.1.2.5. Khai thác gen mã hóa cho enzyme tham gia vào quá trình thủy phân cellulose từ

DNA metagenome suối nước nóng Bình Châu

Toàn bộ 156.093 khung đọc mở tiềm năng dự đoán ở trên được so sánh với các

cơ sở dữ liệu Nr, Swiss-Prot, CAZy và KEGG bằng công cụ Blast++ nhằm tìm ra các

trình tự axit amin có mức độ tương đồng cao nhất, qua đó chú giải chức năng của các

protein và sàng lọc ORF mã hóa cho enzyme tham gia vào quá trình thủy phân

cellulose. Kết quả được trình bày trong Bảng 3.7.

Bảng 3.7. Tóm tắt kết quả chú giải gen dựa vào các cơ sở dữ liệu mở.

Cơ sở dữ liệu

Số ORF

NR

106.903

Swiss - Prot

46.085

CAZy

2.849

KEGG

67.379

Với mục tiêu tiếp cận để khai thác các gen mã hóa cho enzyme tham gia vào

quá trình thủy phân cellulose từ DNA metagenome vi sinh vật suối nước nóng Bình

Châu, chúng tôi so sánh các trình tự ORF trong bộ dữ liệu DNA metagenome với cơ

sở dữ liệu CAZy. Kết quả cho thấy có 2.849 ORF tương đồng với các gen mã hóa

62

cho enzyme thủy phân carbohydrate, chủ yếu thuộc 4 nhóm enzyme chính: glycoside

hydrolases (GHs), glycosyl transferases (GTs), polysaccharide lyases (PLs) và

carbohydrate esterases (CEs). Ngoài ra, bộ dữ liệu còn có sự góp mặt của các module

liên kết với carbohydrate (CBM). Đồng thời, bộ dữ liệu DNA metagenome suối nước

nóng Bình Châu cũng cho thấy sự phân bố cụ thể của các nhóm enzyme trên như sau:

732 GH (chiếm 24,66%), 1633 GT (chiếm 55,02%), 19 PL (chiếm 0,64%), 224 CE

(chiếm 7,55%) và 360 CBM (chiếm 12,13%) (Hình 3.6).

CBMs 12.13%

GHs 24.66%

PLs 0.64%

CEs 7.55%

GTs 55.02%

Hình 3.6. Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA

Chú thích: GHs: họ glycoside hydrolases; GTs: họ glycosyl transferases; PLs: họ polysaccharide

lyases; CEs: họ carbohydrate esterases; CBMs: họ carbohydrate-binding modules.

metagenome suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy.

Quần xã vi sinh vật suối nước nóng Bình Châu có khả năng sinh tổng hợp nhiều

loại enzyme tham gia thủy phân cellulose và hemicellulose, tạo thành các dạng

monosaccharide. Trong số các ORF thủy phân glycoside, có 146 ORF thuộc 18 họ GH

mã hóa cho các enzyme tham gia chuyển hóa lignocellulose. Phần lớn các ORF mã hóa

cho các enzyme thuộc họ GH3 (52 ORF), GH57 (36 ORF) và GH1 (12 ORF). Họ

enzyme GH3 bao gồm β-1,4-glucosidase, β-1,4-xylosidase; β-1,3-glucosidase và α-

63

arabinofuranosidase cắt chuỗi carbonhydrate đầu không khử thành oligosaccharide. Họ

enzyme GH1 bao gồm β-glucosidase, β-galactosidase, β-mannosidase. Họ GH57 đóng

vai trò quan trọng trong việc phân giải mannan. Các ORF mã hóa cho enzyme thủy phân

cellulose chủ yếu thuộc họ GH1, GH3, GH5, GH6, GH8 và GH94 (Hình 3.7).

Hình 3.7. Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa

lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu.

Từ các ORF mã hóa cho các họ GH, nhóm enzyme cellulase gồm 82 trình tự

mã hóa cho endoglucanase, exoglucanase và β-glucosidase. Trong số này có 47 trình

tự hoàn thiện (chiếm 57,32%), 18 trình tự thiếu đầu N (5’) (chiếm 21,95%), 15 trình

tự thiếu đầu C (3’) (chiếm 18,29%) và 2 trình tự thiếu cả đầu N (5’) và đầu C (3’)

(chiếm 2,44%) (Bảng 3.8). Các trình tự tương đồng với CSDL nr ở mức độ <50% có

37 trình tự (chiếm 45,12%); 50–65% có 25 trình tự (chiếm 30,49%); 65–85% có 16

trình tự (chiếm 19,51%) và > 85% có 4 trình tự (chiếm 4,88%).

64

Bảng 3.8. Phân bố của các ORF mã hóa cho cellulase được dự đoán từ bộ dữ liệu

DNA metagenome suối nước nóng Bình Châu.

Enzyme

Mức độ

Beta-

tương đồnga

Endoglucanase Exoglucanase

Tổng

glucosidase

ORF

(%)

< 50

22

9

1

12

50 - 65

15

6

0

9

Đầy đủ

65 - 85

6

0

0

6

> 85

4

0

0

4

< 50

8

5

0

3

Thiếu đầu N

50 - 65

5

3

0

2

(5’)

65 - 85

5

1

0

4

< 50

7

4

1

2

Thiếu đầu C

50 - 65

5

1

0

4

(3’)

65 - 85

3

1

1

1

Thiếu cả 2 đầu:

65 - 85

2

2

0

0

N (5’) và C (3’)

3

Tổng

32

47

82

Ghi chú: a so với cơ sở dữ liệu non-redundant (nr) protein của NCBI.

Trong 47 trình tự ORF hoàn thiện có 15 ORF mã hóa cho endoglucanase, 1 ORF

mã hóa cho exoglucanase và 31 ORF mã hóa cho β-glucosidase. Các trình tự này chủ

yếu là các trình tự chưa có chú giải nguồn gốc tiến hóa (NA-No Annotation), chưa

phân loại được dựa vào các cơ sở dữ liệu của NCBI. Cây phát sinh chủng loại của 15

trình tự axit amin mã hóa cho endoglucanase và 1 trình tự axit amin mã hóa cho

exoglucanase đã được xây dựng (Hình 3.8A). Kết quả cho thấy các trình tự mã hóa

cho endoglucanase chủ yếu thuộc họ GH5, GH6 và GH8. Các trình tự này rất đa dạng

về nguồn gốc tiến hóa. Mặc dù cùng thuộc một họ GH nhưng các trình tự lại có

khoảng cách di truyền, tiến hóa rất xa nhau (như trường hợp họ GH5) trên cây phát

sinh chủng loại (Hình 3.8A), chứng tỏ các trình tự protein mã hóa cho endoglucanase

có thể có nguồn gốc từ các loài vi sinh vật khác nhau. Ngoài ra, cây phát sinh chủng

loại Hình 3.8A cũng cho thấy hầu hết các trình tự được nhóm lại với nhau ngoại trừ

trình tự 18736 và 5216. Điều đó chứng tỏ, 18736 và 5216 là những trình tự mã hóa

cho endoglucanase có khoảng cách di truyền tiến hóa cách xa so với các trình tự còn

lại. Trình tự 35895 là trình tự hoàn thiện duy nhất mã hóa cho exoglucanase. Trên

65

cây phát sinh chủng loại trình tự này nằm ở một nhánh khác so với các trình tự mã

hóa cho endoglucanase (Hình 3.8A).

Tương tự, cây phát sinh chủng loại của 31 trình tự axit amin mã hóa cho β-

glucosidase cũng đã được xây dựng (Hình 3.8B). Kết quả cho thấy các trình tự mã

hóa cho β-glucosidase chủ yếu thuộc họ GH1 và GH3. Đây là hai họ GH phổ biến

cho enzyme thủy phân cellulose. Cây phát sinh chủng loại Hình 3.8B cho thấy các

trình tự mã hóa cho β-glucosidase thuộc cùng một họ có khoảng cách di truyền tiến

hóa khá gần nhau.

A

66

B

Hình 3.8. Cây phát sinh chủng loại Maximum likelihood của trình tự axit amin mã

hóa cho cellulase từ bộ dữ liệu DNA metagenome suối nước nóng Bình Châu.

A) Trình tự mã hóa cho endoglucanase và exoglucanase; B) Trình tự mã hóa

cho β-glucosidase.

3.1.2.6. Phân tích một số tính chất của các enzyme được mã hóa từ các gen trong bộ

dữ liệu DNA metagenome suối nước nóng Bình Châu để lựa chọn gen tiềm

năng cho quá trình biểu hiện.

Với mục tiêu tiếp cận để khai thác các enzyme mới hoặc có tính chất mới như

bền nhiệt (có chỉ số Tm cao), có khả năng chịu kiềm hoặc chịu axit, phần mềm Tm

Index (http://tm.life.nthu.edu.tw) (Ku và cs., 2009) và phần mềm Acalpred

67

(http://lin.uestc.edu.cn/server/AcalPred) đã được sử dụng để dự đoán tính bền nhiệt

và tính chất kiềm/ axit của protein. Chỉ số kiềm tính, axit tính càng gần giá trị 1, càng

có khả năng kiềm hoặc axit. Việc dự đoán tính chất của các enzyme được tiến hành

trên 47 trình tự ORF hoàn thiện mã hóa cho cellulase. Kết quả cho thấy chủ yếu

cellulase của bộ dữ liệu DNA metagenome suối nước nóng Bình Châu là các enzyme

có thể hoạt động ở nhiệt độ ≥ 55ºC (97,87% enzyme có Tm ≥ 0) (Hình 3.9A) và là

các enzyme kiềm tính (57,44%) (Hình 3.9B).

A

B

Hình 3.9. Dự đoán tính chất của các protein tham gia vào quá trình thủy phân

cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome

suối nước nóng Bình Châu.

A) Dự đoán Tm của các enzyme; B) Dự đoán tính kiềm/ axit của các enzyme

Với mục tiêu tiếp cận được nguồn gen mới từ vi sinh vật suối nước nóng Bình

Châu mã hóa cho cellulase có tính chất đặc biệt, kết hợp với những cơ sở phân tích

trên, gen đích được lựa chọn để phân lập hoặc tổng hợp phải thỏa mãn đồng thời các

tiêu chí sau:

- Là ORF hoàn chỉnh có độ dài trong khoảng 1200 – 1600 bp trong bộ dữ liệu

gen mã hóa cho enzyme thủy phân cellulose.

- Là ORF mã hóa cho enzyme có độ tương đồng nằm trong khoảng từ 50 đến

70% so với các enzyme cellulase trong cơ sở dữ liệu NCBI.

- Là ORF có chỉ số dự đoán Tm ≥ 55C.

68

- Là ORF được dự đoán có tính chất kiềm hoặc axit.

Trong số 47 ORF hoàn chỉnh mã hóa cho cellulase trong bộ dữ liệu DNA

metagenome suối nước nóng Bình Châu, có 5 ORF đáp ứng được các tiêu chí lựa

chọn ở trên. Đặc điểm của 5 ORF được minh họa trong Bảng 3.9.

Bảng 3.9. Đặc điểm của 5 ORF mã hóa cho endoglucanase và β-glucosidase

thỏa mãn các tiêu chí lựa chọn gen/ protein mới.

%GC

Chiều dài gen (bp)

Độ tương đồng (%)

Mã số gen [denovogenes]

Dự đoán Tm Dự đoán tính chất Kiềm/ Axit

Chỉ số hòa tan của protein

Mã hóa cho endoglucanase

18736

1.506

≥ 65ºC

Axit 0,99

0,429

56,4

50,35% với endoglucanase [bacterium JGI 053], mã số SOD03652.1; 49,31% với endoglucanase [Polyangium fumosum], mã số WP_136936398.1

30313

1.263

55ºC ~ 65ºC

0,421

51

Kiềm 0,97

50,41% với endoglucanase [Geodermatophilus sp. DSM 45219], mã số SDN59245.1

Mã hóa cho β-glucosidase

62,08% với Beta- glucosidase [Candidatus Wolfebacteria

31089

1.251

55ºC ~ 65ºC Axit 0,52

0,211

48,5

bacterium

GW2011_GWC1_3 7_10], mã số KKQ21855.1

32768

1.224

55ºC ~ 65ºC

0,242

54

Kiềm 0,83

53,94% với Beta- glucosidase A [nhóm vi khuẩn Parcubacteria], mã số KKT80126.1

23970

1.380

55ºC ~ 65ºC

0,103

60,6

Kiềm 0,76

51,29% với Beta- glucosidase A [Chloroflexi bacterium ADurb.Bin180], mã số OQB26869.1

69

Với mong muốn thu nhận được các loại enzyme thủy phân sinh khối khác nhau

có tính chất đặc biệt, đồng thời căn cứ vào kết quả phân tích đặc tính của enzyme

(Bảng 3.9), hai ORF có mã số [denovogenes]_18736 mã hóa cho endoglucanase và

[denovogenes]_32768 mã hóa cho β-glucosidase là hai ORF được lựa chọn vì các lý

do sau đây. Thứ nhất, suối nước nóng Bình Châu là suối nước nóng kiềm nhưng

endoglucanase được mã hóa bởi [denovogenes]_18736 lại được dự đoán với tính chất

axit. Hơn nữa, endoglucanase của ORF này thuộc họ GH6 có khoảng cách di truyền

tiến hóa cách xa so với các trình tự còn lại, có nhiệt độ nóng chảy theo tính toán lý

thuyết ≥ 65oC, do đó có thể có những tính chất mới chưa được khai thác. Thứ hai,

trong số 3 ORF mã hóa cho β-glucosidase, ORF có mã số [denovogenes]_32768 có

tính chất kiềm và độ hòa tan cao nhất, trong khi ORF [denovogenes]_31089 có tính

axit yếu còn ORF [denovogenes]_23970 có tính kiềm nhưng mức độ hòa tan thấp.

Từ những phân tích này, hai ORF [denovogenes]_18736 và [denovogenes]_32768 đã

được chọn để tổng hợp nhân tạo tại công ty TNHH MTV Sinh hóa Phù Sa (Việt Nam)

và được gắn vào vector tách dòng pJET1.2 (pJET1.2_18736 và pJET1.2_32768).

* Gen [denovogenes]_18736

Gen [denovogenes]_18736 có chiều dài 1.506 nucleotide, mã hóa cho 501 axit

amin. Trình tự nucleotide và axit amin của gen [denovogenes]_18736 được trình bày

ở phụ lục 2.

* Gen [denovogenes]_32768

Gen [denovogenes]_32768 có chiều dài 1.224 nucleotide, mã hóa cho 407 axit

amin. Trình tự nucleotide và axit amin của gen [denovogenes]_32768 được trình bày

ở phụ lục 3.

Trình tự nucleotide của các gen [denovogenes]_18736 và [denovogenes]_32768

đã được đăng ký trên Ngân hàng Gen với các mã số lần lượt là QAU55420.1 và

QAU55422.1.

3.1.2.7. Phân tích mô hình cấu trúc của [denovogenes]_18736 và

[denovogenes]_32768

 Cấu trúc tâm hoạt động: Vị trí tâm hoạt động của endoglucanase và β-

glucosidase mã hóa lần lượt bởi 2 ORF [denovogenes_18736] và

70

[denovogenes_32768] được dự đoán nhờ phần mềm Scanprosite của ExPASy

(https://prosite.expasy.org/). Kết quả cho thấy endoglucanase_18736 có tâm

hoạt động (active site) nằm ở vị trí axit amin D299 (Phụ lục 11) trong khi không

xác định được vị trí tâm hoạt động của β-glucosidase_32768.

 Peptide tín hiệu: Phần mềm trực tuyến SignalP-5.0 (Armenteros và cs., 2019)

được ứng dụng để dự đoán peptide tín hiệu của 2 enzyme endoglucanase và β-

glucosidase, tuy nhiên kết quả cho thấy cả hai trình tự axit amin đều không có

trình tự của các motif đặc trưng cho vị trí cắt peptide tín hiệu, do đó 2 protein

này không có trình tự đoạn peptide tín hiệu.

 Cấu trúc domain chức năng

Domain chức năng là trình tự axit amin bảo thủ đặc trưng cho nhóm gen cụ

thể, có cấu trúc đặc trưng riêng biệt. Hầu hết các cellulase có cấu trúc gồm hai domain

độc lập: module lõi xúc tác và module liên kết cellulose (CBM). Hai domain này

thường được kết nối với nhau thông qua các chuỗi peptide ngắn, linh hoạt (Sandgren,

2003). Domain chức năng là phần lớn nhất của enzyme. Sử dụng phần mềm

https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi để tìm kiếm domain bảo thủ,

kết quả cho thấy endoglucanase_18736 chỉ có một domain duy nhất là domain xúc

tác thuộc họ GH6 nằm trong vùng bảo thủ từ axit amin Q236 đến axit amin G483.

Endoglucanse_18736 mang đặc trưng của họ GH6 (domain cấu trúc ID 10474417)

(Hình 3.10), tương tự như endoglucanase-6B của Humicola insolens, cắt liên kết β-

1,4-glucoside nội mạch và exoglucanase CEL6B của Podospora anserina cắt liên kết

β-1,4-glucoside ở đầu không khử trong cellulose và cellotetraose để giải phóng

cellobiose. Họ GH6 được biết đến bao gồm endoglucanase và cellobiohydrolase của

vi khuẩn và nấm (CAZy).

Đồng thời, β-glucosidase_32768 cũng chỉ có một domain duy nhất là domain

xúc tác thuộc họ GH1 nằm ở vị trí axit amin E2-E407. Protein thuộc họ GH1 (domain

cấu trúc ID 10006560) như 6-phospho-β-glucosidase, có khả năng thủy phân 6-

phospho-β-D-glucosyl-(1,4)-D-glucose thành glucose-6-phosphate (G-6-P) và D-

glucose; hoặc β-galactosidase, có khả năng thủy phân β-D-galactose đầu không khử

thành β-D-galactoside. Nhóm lớn của β-glucosidase mã hóa bởi ORF

[denovogenes_32768] cũng mang đặc trưng của BglB (Hình 3.11).

71

Hình 3.10. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của

endoglucanase_18736.

Hình 3.11. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của

β-glucosidase_32768.

72

 Mô hình cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768

Cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768 được xây dựng

nhờ phần mềm (https://swissmodel.expasy.org/interactive).

Cấu trúc 3D của gen denovogenes_18736

Trình tự axit amin của endoglucanase_18736 có trình tự nhận dạng cao nhất với

5 cấu trúc protein trong tổng số 140 cấu trúc được so sánh, bao gồm: (i) cellulase giả

định có mã số 1uoz.1.A (trình tự xác định 41,98%), (ii) cellulase Cel6 giả định có mã

số 1up3.1.A (trình tự xác định 43,62%), (iii) cellulase Cel6 giả định có mã số

1up3.1.A (trình tự xác định 45,45%), (iv) cellulase giả định có mã số 1uoz.1.A (trình

tự xác định 45,45%) và (v) cellobiohydrolase có mã số 3vog.1.A (trình tự xác định

31,8%). Tất cả các protein có trình tự nhận dạng cao nhất với endoglucanase_18736

đều là các cấu trúc protein giả định trong cơ sở dữ liệu mô hình cấu trúc protein

Swiss-model và chưa được nghiên cứu về đặc tính enzyme. Mặt khác, trình tự axit

amin của endoglucanase_18736 có mức độ tương đồng và nhận dạng cao nhất lần

lượt là 42% và 45,45% so với cellulase Cel6 (1up3.1.A), do đó cấu trúc của cellulase

Cel6 (1up3.1.A) đã được chọn làm khuôn để xây dựng mô hình cấu trúc 3D cho

endoglucanase_18736.

a b

Hình 3.12. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm

Swissmodel của ExPASy. a) Cấu trúc của endoglucanase_18736 dựa theo khuôn

mô hình cấu trúc của cellulase Cel6 giả định (1up3.1.A); b) Cấu trúc khuôn cellulase

Cel6 giả định (1up3.1.A).

73

Kết quả ở Hình 3.12 cho thấy endoglucanase_18736 được dự đoán ở trạng thái

monomer - A, không có phối tử (Phụ lục 12). Cấu trúc 3D của endoglucanase_18736

mang đặc trưng của các họ endoglucanase có cấu tạo tâm hoạt động hình khe hở do

vòng lặp ngắn đảo ngược ở vị trí tâm hoạt động tạo thành (Hình 3.12a), cho phép

enzyme liên kết và phân tách ngẫu nhiên dọc theo chuỗi cellulose (Davies và

Henrissat, 1995). Đồng thời, mô hình cấu trúc 3D của endoglucanase_18736 (Hình

3.12a) và mô hình cấu trúc 3D của khuôn cellulase Cel6 (1up3.1.A) (Hình 3.12b) có

hình dạng khá giống nhau mặc dù trình tự axit amin lại khác nhau (chỉ có 42% trình tự

axit amin tương đồng (Phụ lục 12).

Cấu trúc 3D của β-glucosidase_32768

Trình tự axit amin của β-glucosidase_32768 có trình tự nhận dạng cao nhất với

4 protein trong tổng số 799 cấu trúc đã được so sánh, bao gồm: (i) β-glucosidase có mã

số 1vff.1.A (trình tự xác định 41,35%), (ii) β-glucosidase có mã số 4hz6.1.A (trình tự

xác định 36,75%), (iii) β-glucosidase có mã số 3cmj.1.A (trình tự xác định 36,41%) và

(iv) 1,4-beta-D-glucan glucohydrolase có mã số 5idi.1.A (trình tự xác định 35,88%).

Khác với trường hợp endoglucanase_18736, tất cả các cấu trúc có trình tự nhận dạng

cao nhất với β-glucosidase_32768 đều là các cấu trúc của các protein đã được xác định

trong cơ sở dữ liệu mô hình cấu trúc protein Swiss-model.

a b

Hình 3.13. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm Swissmodel

của ExPASy. a) Cấu trúc của β-glucosidase_32768 dựa theo khuôn mô hình cấu trúc

β-glucosidase (1vff.1.A); b) Cấu trúc của β-glucosidase khuôn (1vff.1.A).

74

Tuy nhiên, trong 4 mô hình cấu trúc trên, mô hình cấu trúc của β-glucosidase

có mã số 1vff.1.A được chọn làm khuôn để xây dựng mô hình cấu trúc 3D của β-

glucosidase_32768 do có trình tự axit amin được nhận dạng và tương đồng cao nhất,

lần lượt là 41,35% và 41%. Beta-glucosidase_32768 được dự đoán ở trạng thái

monomer, không có ligand và mô hình cấu trúc 3D được thể hiện trong Hình 3.13a.

Mô trình cấu trúc 3D của β-glucosidase_32768 và khuôn beta-glucosidase

(1vff.1.A) có hình dạng khá giống nhau mặc dù trình tự axit amin của chúng chỉ có

41% tương đồng.

3.1.2.8. Truy cứu nguồn gốc của các gen denovogenes_18736 và denovogenes_32768

Nguồn gốc của gen [denovogenes]_18736 và [denovogenes]_32768 được truy

cứu bằng công cụ Blast – Explorer (Dereeper và cs., 2010). Kết quả cho thấy cả hai

gen này đều là các gen mới, không xác định được nguồn gốc. Đồng thời, kết quả này

cũng phù hợp với kết quả phân loại của MEGAN: cả hai gen đều là những gen chưa

được phân loại vì không có cơ sở dữ liệu phù hợp để so sánh.

Tóm lại: Với các kết quả phân tích ở trên, hai gen được chọn: [denovogenes]_18736

và [denovogenes]_32768 là những gen mới về trình tự, mã hóa cho các enzyme được

dự đoán có tính ưa nhiệt, kiềm/ axit và thủy phân cellulose. Gen [denovogenes]_18736

được dự đoán là gen mã hóa cho endoglucanase thuộc họ GH6 và

[denovogenes]_32768 được dự đoán là gen mã hóa cho β – glucosidase thuộc họ GH1.

3.2. Biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768

3.2.1. Thiết kế vector biểu hiện gen [denovogenes]_18736 và

[denovogenes]_32768 trong E. coli

Vector pET17b (Novagen) được lựa chọn làm vector biểu hiện gen

[denovogenes]_18736 và [denovogenes]_32768. Sau khi khuếch đại cả 2 ORF và xử lý

với HindIII và NdeI như mô tả trong Mục 2.3.4 và 2.3.5, các ORF này lại được ghép nối

vào vector pET17b đã mở vòng tại các vị trí enzyme giới hạn tương ứng (Mục 2.3.5).

Sản phẩm ghép nối được biến nạp vào E. coli TOP10F’ để nhân dòng trước khi kiểm tra

lại bằng cách cắt các vector tái tổ hợp bằng HindIII và NdeI. Kết quả điện di đồ sản phẩm

cắt cho thấy đã gắn thành công gen [denovogenes]_18736 và [denovogenes]_32768

vào vector pET17b (Hình 3.14). Các dòng plasmid này sau đó được gửi đi đọc

trình tự để đảm bảo đúng codon dịch mã từ promoter đến mã khởi đầu.

75

Hình 3.14. Điện di đồ sản phẩm cắt kiểm tra plasmid pET17b mang các đoạn gen

Chú thích: 1) gen [denovogenes]_18736 có kích thước 1506 bp; M) Marker DNA 1kb và 2)

gen [denovogenes]_32768 có kích thước 1224 bp. Vector pET17b (Novagen) có kích thước

3306 bp.

ngoại lai bằng hai enzyme giới hạn HindIII và NdeI.

3.2.2. Lựa chọn một số điều kiện biểu hiện gen [denovogenes]_18736 và

[denovogenes]_32768 trong E. coli

3.2.2.1. Lựa chọn chủng chủ biểu hiện gen [denovogenes]_18736 và

[denovogenes]_32768

Các plasmid pET17b mang các đoạn gen ngoại lai [denovogenes]_18736 mã

hóa cho endoglucanase và [denovogenes]_32768 mã hóa cho β-glucosidase được

biến nạp vào tế bào E. coli C43(DE3) (Lucigen) và E. coli JM109 (DE3) (Promega)

để tạo thành chủng tái tổ hợp. Các dòng tế bào này sau đó được nhân giống và biểu

hiện trong môi trường LB. Sau 48 giờ cảm ứng bằng IPTG, mức độ biểu hiện

endoglucanase_18736 và β-glucosidase_32768 của các chủng tái tổ hợp được thể

hiện lần lượt trong Hình 3.15 và Hình 3.16.

Kết quả trình bày trong Hình 3.15 và 3.16 cho thấy: khả năng sinh trưởng của

hai chủng E. coli C43(DE3) và E. coli JM109 (DE3) tái tổ hợp tương đương nhau

nhưng hoạt tính enzyme của hai chủng lại khác nhau. Ở cả hai trường hợp, dòng E.

coli C43(DE3) biểu hiện hoạt tính enzyme tái tổ hợp cao hơn dòng E. coli

JM109(DE3). Đối với endoglucanase_18736, chủng E. coli C43(DE3) đạt 0,15 U/ml

trong khi chủng E. coli JM109 chỉ đạt 0,098 U/ml (Hình 3.16A).

76

Hình 3.15. Hoạt tính endoglucanase_18736 (A) và β-glucosidase_32768 (B) trong pha

Chú thích: 1) E. coli JM109(DE3) không cảm ứng IPTG; 2) E. coli JM109(DE3) cảm ứng

IPTG; 3) E. coli C43(DE3) không cảm ứng IPTG; 4) E. coli C43(DE3) cảm ứng IPTG.

4.5

0.06

0.2

2.5

4

0.05

tan của các chủng tái tổ hợp.

) L m / U

3.5

2

) L m / U

3

0.04

1.5

) L / g ( ô h k i

2.5

0.03

0.1

) L / g ( ô h k i

2

1

1.5

0.02

ố h k h n i S

( c l g - β h n í t t ạ o H

1

0.5

ố h k h n i S

0.01

0.5

( e s a n a c u l g o d n e h n í t t ạ o H

0

0

0

0

E. coli C43 (DE3)

E. coli JM109

E. coli JM109

E. coli C43 (DE3)

SKK (g/L)

Hoạt tính endoglucanase (U/mL)

SKK (g/L)

Hoạt tính β-glucosidase (U/mL)

A B

Hình 3.16. Ảnh hưởng của chủng chủ lên quá trình sinh trưởng và biểu hiện

enzyme tái tổ hợp. A. Endoglucanase; B. β-glucosidase.

Tương tự, chủng E. coli C43(DE3) cũng biểu hiện β-glucosidase tái tổ hợp đạt

0,05 U/ml trong khi chủng E. coli JM109 chỉ đạt 0,02 U/ml (Hình 3.16B). Cả hai

enzyme tái tổ hợp đều ở dạng hòa tan và tất cả các mẫu đối chứng (không cảm ứng

77

bằng IPTG) đều không có hoạt tính (Hình 3.15). Chủng E. coli C43(DE3) được

Miroux và Walker (1996) phát triển từ quá trình sàng lọc các biến chủng của dòng E.

coli BL21(DE3) để biểu hiện vượt ngưỡng các protein màng. Ưu điểm của dòng E.

coli C43(DE3) so với dòng gốc E. coli BL21(DE3) ở chỗ hạn chế tỷ lệ chết của tế

bào khi biểu hiện quá mức protein dung hợp do đã được đột biến tại hai điểm trên

vùng -10 của promoter lacUV5. Trong khi đó, dòng tế bào E. coli JM109 là chủng

được dùng chủ yếu trong các chiến lược tách dòng gen. Từ kết quả này, các chủng E.

coli C43(DE3) tái tổ hợp được chọn cho các nghiên cứu tiếp theo.

3.2.2.2. Lựa chọn môi trường biểu hiện gen [denovogenes]_18736 và

[denovogenes]_32768

Các chủng E. coli C43(DE3) tái tổ hợp được nhân giống trong môi trường LB,

sau đó chuyển sang lên men trong môi trường NB, LB và TB để biểu hiện

endoglucanase và β-glucosidase tái tổ hợp. Điều kiện biểu hiện được lặp lại như các

9

0.35

0.9

5

4.5

8

0.8

0.3

bước đã mô tả ở Phần 2.3.14. Kết quả nghiên cứu được thể hiện trong Hình 3.17.

) L m / U

4

7

0.7

0.25

3.5

) L m / U

6

0.6

3

0.2

) L / g ( ô h k i

5

0.5

) L / g ( ô h k i

2.5

4

0.4

0.15

2

3

0.3

ố h k h n i S

1.5

ố h k h n i S

0.1

2

0.2

( c l g - β h n í t t ạ o H

1

0.05

1

0.1

0.5

( e s a n a c u l g o d n e h n í t t ạ o H

0

0

0

0

LB

NB

TB

LB

NB

TB

Môi trường biểu hiện

Môi trường biểu hiện

SKK (g/L)

Hoạt tính endoglucanase (U/mL)

SKK (g/L)

Hoạt tính β-glucosidase (U/mL)

A B

Hình 3.17. Ảnh hưởng của môi trường nuôi cấy lên sinh trưởng và sinh hoạt tính

enzyme ở chủng E. coli C43(DE3) tái tổ hợp. A. Endoglucanase; B. β-glucosidase.

78

Kết quả thể hiện ở Hình 3.17 cho thấy: môi trường TB là môi trường tốt nhất

cho sinh trưởng cũng như sinh tổng hợp endoglucanase và β-glucosidase của chủng

E. coli C43(DE3) tái tổ hợp; môi trường LB và NB cho sinh trưởng cũng như sinh

tổng hợp enzyme của chủng tái tổ hợp thấp hơn rất nhiều so với môi trường TB. Cụ

thể, cả hai môi trường LB và NB, khả năng sinh trưởng của chủng tái tổ hợp đã thấp

hơn từ 54-77%, khả năng sinh tổng hợp endoglucanase thấp hơn từ 81-89%, khả năng

sinh tổng hợp β-glucosidase thấp hơn từ 83-95% so với môi trường TB. Kết quả này

cũng tương tự như các công bố quốc tế khi nghiên cứu quá trình sinh trưởng và sinh

tổng hợp protein tái tổ hợp bằng hệ thống E. coli (Studier, 2005; Sezonov và cs.,

2007; Studier, 2014). Môi trường NB và LB được sử dụng phổ biến nhất để nuôi cấy

E. coli do chứa các thành phần dinh dưỡng dễ hấp thụ ở giai đoạn tăng sinh sớm. Tuy

nhiên, các môi trường này không phải là lựa chọn tốt nhất để biểu hiện các protein

dung hợp vì chứa rất ít carbohydrate và các ion kim loại hóa trị II (Sezonov và cs.,

2007). Trong khi đó, thành phần môi trường TB có hàm lượng cao nấm men gấp đôi

so với thành phần môi trường LB và NB, vì vậy khi nuôi cấy E. coli trong môi trường

TB sẽ cho mật độ tế bào cao hơn (Studier, 2005). Mặt khác, các chủng E. coli tái tổ

hợp khi biểu hiện protein dung hợp cần một lượng phosphate rất lớn, điều này chỉ có

môi trường TB đáp ứng được. Hơn nữa, môi trường TB có chứa glycerol cũng đóng

vai trò cảm ứng biểu hiện protein được điều khiển bởi lac promoter (Studier, 2014).

Nhờ đó, hiệu suất biểu hiện protein dung hợp tăng lên đáng kể. Vì vậy, môi trường

TB được chọn làm môi trường biểu hiện enzyme cho chủng tái tổ hợp.

3.2.2.3. Lựa chọn độ thoáng khí cho biểu hiện [genovogenes]_18736 và

[genovogenes]_32768

E. coli là vi khuẩn hiếu khí, do vậy, lượng oxy hòa tan trong môi trường nuôi

cấy là một yếu tố quan trọng, có ảnh hưởng rõ rệt đến sự sinh trưởng. Để nâng cao

hàm lượng sinh khối tế bào cũng như hoạt tính enzyme dung hợp, người ta có thể

điều chỉnh chỉ số oxy hòa tan bằng cách tăng tốc độ lắc hoặc giảm thể tích dịch nuôi

trong bình. Trong nghiên cứu này, chúng tôi đã khảo sát ảnh hưởng của 4 thể tích

dịch nuôi trên cùng một loại bình tam giác (500 mL).

79

2.5

8

) l

7

m / U

2

6

5

1.5

) L / g ( ô h k i

4

1

3

ố h k h n i S

2

0.5

( e s a n a c u l g o d n e h n í t t ạ o H

1

0

0

10

20

40

60

Thể tích nuôi cấy : Thể tích bình lắc (%)

Sinh khối khô (g/l)

Hoạt tính endoglucanase (U/ml)

Hình 3.18. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính

0.35

12

0.3

10

0.25

endoglucanase của chủng E. coli C43(DE3) tái tổ hợp.

) L m / U

8

0.2

) L / g ( ô h k i

6

0.15

4

ố h k h n i S

0.1

( c l g - β h n í t t ạ o H

2

0.05

0

0

10

20

40

60

Thể tích nuôi cấy : Thể tích bình (%)

Sinh khối khô (g/L)

Hoạt tính β-glucosidase (U/mL)

Hình 3.19. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính β-

glucosidase của chủng E. coli C43(DE3) tái tổ hợp.

Kết quả nghiên cứu trong Hình 3.18 và 3.19 cho thấy thể tích dịch nuôi cấy có

ảnh hưởng đến quá trình sinh trưởng và biểu hiện enzyme dung hợp. Mật độ tế bào

80

của chủng tái tổ hợp tỉ lệ nghịch với thể tích dịch nuôi cấy. Trong 4 điều kiện khảo

sát, mật độ tế bào đạt cao nhất khi thể tích dịch nuôi cấy chiếm 10% thể tích bình và

giảm dần khi tăng thể tích dịch nuôi cấy. Trong khi đó, hoạt tính endoglucanase và

β-glucosidase tái tổ hợp đạt cao nhất ở bình chứa thể tích dịch nuôi chiếm 20% (hoạt

tính endoglucanase đạt 1,87 U/ml, hoạt tính β-glucosidase đạt 0,31 U/mL). Khi giảm

độ thoáng khí tức tăng thể tích dịch nuôi trong bình lên 40 – 60% thì hoạt tính enzyme

sẽ giảm mạnh, hoạt tính endoglucanase giảm từ 72 - 86%; hoạt tính β-glucosidase

giảm từ 78 - 90% so với điều kiện khảo sát thể tích dịch nuôi chỉ chiếm 20% thể tích

bình. Khi nghiên cứu quá trình nuôi cấy E. coli tái tổ hợp có những điều kiện nuôi

cấy ảnh hưởng đến quá trình sinh trưởng nhưng không ảnh hưởng đến quá trình biểu

hiện protein tái tổ hợp và ngược lại. Protein tái tổ hợp có thể vẫn được sinh ra ngay

cả khi tế bào sinh trưởng chậm hoặc không sinh trưởng. Do đó, chúng ta cần phải

nghiên cứu điều kiện nuôi cấy tối ưu để biểu hiện protein tái tổ hợp cho từng loại

protein cụ thể mà không thể áp dụng chung cho tất cả các loại protein (Mahalik và

cs., 2014). Chính vì vậy, xét về hiệu quả biểu hiện enzyme dung hợp và hiệu quả kinh

tế, tỷ lệ thể tích dịch nuôi cấy chiếm 20% thể tích bình được lựa chọn là tỷ lệ thông

khí thích hợp cho biểu hiện enzyme dung hợp.

3.2.2.4. Lựa chọn nồng độ IPTG thích hợp cho quá trình biểu hiện gen

[denovogenes]_18736 và [denovogenes]_32768

IPTG là chất cảm ứng cho T7-promoter của hầu hết các vector biểu hiện thuộc

hệ thống pET. Trong nghiên cứu này, chúng tôi khảo sát ảnh hưởng của nồng độ

IPTG từ 0,25 - 1,5 mM lên quá trình sinh trưởng, biểu hiện endoglucanase và β-

glucosidase của chủng E. coli C43(DE3) tái tổ hợp. Kết quả nghiên cứu cho thấy

nồng độ IPTG có ảnh hưởng không nhiều đến khả năng sinh trưởng của chủng E. coli

C43(DE3) mang gen [denovogenes]_18736 mã hóa cho endoglucanase (sinh khối

khô dao động từ 4,95 – 5,46 g/l) nhưng lại có ảnh hưởng đáng kể đến hoạt tính

endoglucanase (hoạt tính enzyme dao động từ 0,42 – 1,93 U/ml) (Hình 3.20); trong

khi, nồng độ IPTG không ảnh hưởng nhiều đến khả năng sinh trưởng và biểu hiện β-

glucosidase của chủng E. coli C43(DE3) mang gen [denovogenes]_32768. Sinh khối

khô của chủng dao động từ 7,28 - 8,13 g/L, hoạt tính β-glucosidase dao động từ 0,3

81

– 0,34 U/mL (Hình 3.21). Vì vậy, trong khoảng nồng độ IPTG khảo sát từ 0,25 – 1,5

mM, xét về mặt hiệu quả, nồng độ IPTG 0,25 mM được chọn để cảm ứng biểu hiện

7

2.5

6

cho cả hai loại enzyme dung hợp.

) L m / U

2

5

1.5

) L / g ( ô h k i

4

3

1

ố h k h n i S

2

0.5

( e s a n a c u l g o d n e h n í t t ạ o H

1

0

0

0.25

0.5

0.75

1

1.25

1.5

Nồng độ IPTG (mM)

Sinh khối khô (g/L)

Hoạt tính endoglucanase (U/mL)

Hình 3.20. Ảnh hưởng của nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện

9

0.4

8

7

0.3

endoglucanase_18736 của chủng tái tổ hợp.

) L m / U

6

5

) L / g ( ô h k i

0.2

4

3

ố h k h n i S

0.1

( c l g - β h n í t t ạ o H

2

1

0

0

0.25

0.5

0.75

1

1.25

1.5

Nồng độ IPTG (mM)

Sinh khối khô (g/L)

Hoạt tính β-glucosidase (U/mL)

Hình 3.21. Ảnh hưởng của nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện

β-glucosidase của chủng E. coli C43(DE3) tái tổ hợp.

82

3.2.3. Động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của

chủng E. coli C43(DE3) tái tổ hợp

Dưới các điều kiện nuôi cấy được lựa chọn ở trên, quá trình sinh trưởng và biểu

hiện endoglucanase tái tổ hợp của chủng E. coli C43(DE3) mang plasmid

pET17b_18736 vào pha cân bằng sau 42-48 giờ nuôi cấy, phù hợp với điều kiện sinh

lý của vi khuẩn nói chung và loài E. coli nói riêng (Ryan và cs., 1996). Trong khoảng

thời gian này, sinh khối khô đạt giá trị dao động trong khoảng 5,54-5,58 g/l; sinh tổng

hợp endoglucanase đạt 1,92-1,98 U/ml (Hình 3.22). Mặt khác, quá trình sinh trưởng

và biểu hiện β-glucosidase tái tổ hợp của chủng E. coli C43(DE3) mang plasmid

pET17b_32768 cũng vào pha cân bằng sau 42-48 giờ nuôi cấy, sinh khối khô đạt giá

trị dao động trong khoảng 8,21-8,26 g/L; sinh tổng hợp β-glucosidase đạt 0,33-0,34

6

2.5

U/mL (Hình 3.23).

) l

5

2

m / U

4

1.5

) L / g ( ô h k i

3

1

ố h k h n i S

2

( e s a n a c u l g o d n e h n í t t ạ o H

0.5

1

0

0

0

6

12

18

24

30

36

42

48

54

Thời gian biểu hiện (giờ)

Sinh khối khô

Hoạt tính endoglucanase

Hình 3.22. Động thái sinh trưởng và sinh endoglucanase của chủng

E. coli C43(DE3) tái tổ hợp.

83

0.4

10

9

0.35

8

0.3

7

0.25

) L m / U

6

0.2

5

) L / g ( ô h k i

4

0.15

3

ố h k h n i S

0.1

( c l g - β h n í t t ạ o H

2

0.05

1

0

0

0

2.5

6

12

18

24

30

36

42

48

Thời gian biểu hiện (h)

Sinh khối khô (g/L)

Hoạt tính β-glucosidase (U/mL)

Hình 3.23. Động thái sinh trưởng và sinh β-glucosidase của chủng

E. coli C43(DE3) tái tổ hợp.

3.3. Tinh sạch và xác định tính chất của các cellulase tái tổ hợp

3.3.1. Tinh sạch enzyme tái tổ hợp

Dịch enzyme thô được pha loãng trong đệm A với tỷ lệ thể tích 1:4 (v/v) để

làm tăng khả năng gắn kết với các hạt sắc ký trước khi đưa lên cột sắc ký IMAC-Ni2+.

Quá trình thu nhận các enzyme tái tổ hợp diễn ra cụ thể như sau:

* Ở nồng độ 250 mM imidazol, endoglucanase_18736 bị đẩy ra tập trung ở

phân đoạn 7, trong khi phân đoạn trước và sau đều không có enzyme. Hình ảnh điện

di SDS-PAGE cho thấy protein tái tổ hợp ở dạng hòa tan, sản phẩm protein sau khi

qua cột sắc ký chỉ xuất hiện 1 băng có kích thước khoảng 55 kDa, đúng như theo dự

đoán lý thuyết (Hình 3.24).

* Ở nồng độ 200 mM imidazol, toàn bộ β-glucosidase_32768 được thu về

trong 2 phân đoạn 4 và 5. Ở phân đoạn 3 và 6 không có enzyme. Trên ảnh điện di SDS-

PAGE cho thấy sản phẩm protein sau khi qua cột sắc ký chỉ xuất hiện 1 băng có kích thước

khoảng 50 kDa, đúng như theo dự đoán lý thuyết (Hình 3.25).

84

A B

Chú thích: 1) Vector 0; M: protein ladder (10 - 250 kDa); 2) Dịch phá tế bào trước cảm ứng;

3) Dịch nổi sau khi ly tâm dịch lên men; 4) Dịch phá tế bào sau cảm ứng và 5) protein sau

tinh sạch bằng cột IMAC-Ni2+.

Hình 3.24. Điện di đồ SDS-PAGE (A) và Zymogram (B) của endoglucanase tái tổ hợp.

A B C

Chú thích: Ảnh A) M: thang protein chuẩn (10 - 250 kDa); 1: Dịch enzyme thô; 2: protein

sau tinh sạch bằng cột IMAC - Ni2+. Ảnh C) Phân đoạn protein có hoạt tính thủy phân pNPG

20 mM tạo ra sản phẩm có độ hấp thụ cực đại ở bước sóng 400 nm (màu vàng).

Hình 3.25. Điện di đồ SDS-PAGE (A) và Zymogram (B) của β-glucosidase tái tổ hợp.

85

Các mẫu enzyme thô và enzyme tinh sạch sau đó được đo hàm lượng protein

tổng số để tính hoạt tính riêng của enzyme. Kết quả cho thấy: hiệu suất tinh sạch của

endoglucanase và β-glucosidase tái tổ hợp đều đạt trên 80%, mức độ tinh sạch tăng

từ 5,2-5,6 lần so với dịch enzyme thô (Bảng 3.10). Enzyme tinh sạch đạt tiêu chuẩn

dùng để nghiên cứu các tính chất của enzyme.

Bảng 3.10. Kết quả tinh sạch endoglucanase và β-glucosidase tái tổ hợp bằng cột

IMAC-Ni2+.

Mẫu

Hoạt tính

Protein

Hoạt tính riêng

Mức độ

Hiệu suất

tổng (U)

tổng (mg)

(U/mg)

tinh sạch

thu hồi (%)

Enzyme

Dịch thô

585

1090,5

0,54

1

100

Egl

Dịch tinh

486,72

173,2

2,81

5,2

83,2

sạch

Enzyme

Dịch thô

102

850,3

0,12

1

100

Bgl

Dịch tinh

88,94

132,75

0,67

5,6

87,2

sạch

Chú thích: Egl: Endoglucanase tái tổ hợp; Bgl: Beta-glucosidase tái tổ hợp.

3.3.2. Nghiên cứu một số đặc tính của endoglucanase_18736 và β-

glucosidase_32768 tái tổ hợp

3.3.2.1. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp

Nhiệt độ là một trong những yếu tố quan trọng ảnh hưởng tới hoạt tính của

enzyme. Mỗi enzyme sẽ có một khoảng nhiệt độ tối ưu để xúc tác chuyển hóa cơ chất.

Một trong những tiêu chí được sử dụng khi lựa chọn 2 ORF [denovogenes]_18736

và [denovogenes]_32768 từ bộ dữ liệu DNA metagenome là dựa trên chỉ số dự đoán

Tm của protein ≥ 55C. Do đó, trong nghiên cứu này, khoảng nhiệt độ từ 50 - 65C

đã được sử dụng để khảo sát mức độ ảnh hưởng của nhiệt độ đến hoạt tính của hai

enzyme tái tổ hợp. Kết quả nghiên cứu cho thấy cả endoglucanase_18736 và β-

glucosidase_32768 đều hoạt động tối ưu ở nhiệt độ 55C nhưng

endoglucanase_18736 có xu hướng hoạt động tốt trong khoảng nhiệt độ từ 55 - 60C;

trong khi β-glucosidase_32768 lại hoạt động tốt trong khoảng nhiệt độ thấp hơn chỉ

từ 50 - 55C (Hình 3.26).

86

120

100

)

%

( i

80

60

40

ố đ g n ơ ư t h n í t t ạ o H

20

0

50

55

60

65

Nhiệt độ (C)

Endoglucanase

β-glucosidase

Hình 3.26. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp.

3.3.2.2. Ảnh hưởng của pH lên hoạt tính enzyme tái tổ hợp

Tương tự như nhiệt độ, mỗi enzyme đạt hoạt tính xúc tác cực đại trong một dải

pH nhất định. Hai enzyme tái tổ hợp được hòa trong các dung dịch đệm có độ pH

rộng từ 3-12 để xác định giá trị pH tối ưu của chúng. Kết quả ở Hình 3.27 và Hình 3.

28 cho thấy cả hai loại enzyme tái tổ hợp đều có khả năng hoạt động trong dải pH

rộng từ axit đến kiềm. Tuy nhiên, endoglucanase tái tổ hợp có phổ pH rộng hơn β-

glucosidase tái tổ hợp. Endoglucanase_18736 hoạt động tốt ở cả 2 vùng axit (pH 3-

5) và kiềm (7-10). Ở giá trị pH 6, hoạt tính tương đối chỉ đạt khoảng 38,5% và đạt

cực đại ở giá trị pH 10 (Hình 3.27). Beta-glucosidase_32768 hoạt động tốt trong dải

pH từ 4-9, đạt hoạt tính tối đa ở pH 8,5 (Hình 3.28). Kết quả nghiên cứu chỉ ra rằng

cả 2 loại enzyme tái tổ hợp có thể đáp ứng được nhiều điều kiện thủy phân sinh khối

từ quá trình tiền xử lý (cả axit và kiềm), tuy nhiên cả 2 enzyme đều có hoạt tính cao

nhất ở điều kiện kiềm, tương ứng với điều kiện sinh thái của suối nước nóng Bình

Châu có pH 7.4 ở miệng giếng phun.

87

120

100

)

%

( i

80

60

40

ố đ g n ơ ư t h n í t t ạ o H

20

0

3

4

5

6

7

8

9

10

11

12

pH

Chú thích: pH: 3-6 (đệm citrate); pH: 7-10 (đệm tris); pH: 11-12 (đệm Na2HPO4)

120

100

Hình 3.27. Ảnh hưởng của pH lên hoạt tính endoglucanase_18736.

)

%

( i

80

60

40

ố đ g n ơ ư t h n í t t ạ o H

20

0

3

4

5

6

7

8

8.5

9

pH

Chú thích: pH: 3-6 (đệm citrate); pH: 7-10 (đệm tris)

Hình 3.28. Ảnh hưởng của pH lên hoạt tính β-glucosidase_32768 .

3.3.2.3. Ảnh hưởng của các ion kim loại lên hoạt tính enzyme tái tổ hợp

Nhiều nghiên cứu cho thấy các enzyme thủy phân cellulose nhạy cảm với các

ion kim loại. Do đó, mức độ ảnh hưởng của các ion kim loại lên hoạt tính của

88

endoglucanase và β-glucosidase tái tổ hợp đã được nghiên cứu. Các mẫu thí nghiệm

được so sánh với mẫu không bổ sung ion kim loại nào. Hoạt tính enzyme của mẫu

không bổ sung ion kim loại được coi là 100%. Kết quả nghiên cứu được trình bày ở

160

140

Hình 3.29 và Hình 3.30.

)

%

120

( i

100

80

60

40

ố đ g n ơ ư t h n í t t ạ o H

20

0

Ion kim loại (5mM)

Hình 3.29. Ảnh hưởng của một số ion kim loại lên hoạt tính endoglucanase_18736.

)

%

( i

ố đ g n ơ ư t h n í t t ạ o H

1800 1700 1600 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0

Ion kim loại (5 mM)

Hình 3.30. Ảnh hưởng của một số ion kim loại lên hoạt tính β-glucosidase_32768.

89

Kết quả nghiên cứu cho thấy ở nồng độ 5 mM: các ion kim loại khác nhau có

ảnh hưởng khác nhau lên hoạt tính của enzyme tái tổ hợp. Cụ thể:

Đối với endoglucanase_18736: Ca2+ và Na+ có tác dụng làm tăng hoạt tính

enzyme. Các ion còn lại đều làm giảm (K+, Mn2+, Fe2+, Li+, Co2+, Zn2+, Mg2+, Fe3+)

hoặc làm mất hoàn toàn hoạt tính enzyme (Ag+, Cu2+). Thứ tự ảnh hưởng của các ion

kim loại theo chiều hướng làm tăng hoạt tính của enzyme được biểu diễn như sau:

Ag+< Cu2+< Zn2+< Co2+< Mn2+< Fe3+< Fe2+< Mg2+< Li+< K+< Na+< Ca2+ (Hình 3.29).

Đối với β-glucosidase_32768: K+, Mn2+, Fe2+, Li+, Mg2+, Fe3+, Ca2+ và Na+ có

tác dụng làm tăng hoạt tính enzyme; trong khi Cu2+, Zn2+ và Co2+ lại làm giảm hoạt

tính mạnh đến mức gần như làm mất hoàn toàn hoạt tính enzyme. Thứ tự ảnh hưởng

của các ion kim loại theo chiều hướng làm tăng hoạt tính của enzyme được biểu diễn

như sau: Cu2+< Co2+

biệt các ion Ca2+, Na+, Mg2+ và Li+ làm tăng hoạt tính của enzyme lên 10-17 lần so

với mẫu đối chứng không có ion kim loại (Hình 3.30). Đây là lý do tại sao các enzyme

thủy phân lignocellulose cũng được gọi là enzyme kim loại.

3.3.2.4. Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp

Trên cơ sở những ion kim loại có tác dụng làm tăng hoạt tính của enzyme tái tổ

hợp ở trên, một số ion kim loại đã được thay đổi nồng độ để nghiên cứu mức độ ảnh

hưởng của chúng lên hoạt tính enzyme tái tổ hợp. Kết quả nghiên cứu cho thấy: nồng

độ ion kim loại có ảnh hưởng rõ rệt đến hoạt tính enzyme tái tổ hợp. Ở nồng độ thấp,

các ion kim loại được nghiên cứu (Li+, Na+, Ca2+ và Mg2+) có thể làm tăng hoạt tính

của enzyme tái tổ hợp (nồng độ 5-15mM); nhưng ở nồng độ cao (nồng độ 20-30mM),

các ion kim loại này lại làm giảm đáng kể và có thể làm mất hoàn toàn hoạt tính

enzyme, ngoại trừ ion Ca2+ trong trường hợp endoglucanase_18736. Nồng độ Ca2+

lên tới 30 mM vẫn duy trì hoạt tính của endoglucanase_18736 cao hơn 1,4 lần so với

mẫu không bổ sung ion. Đồng thời, kết quả nghiên cứu cũng cho thấy ở nồng độ 15

mM Ca2+ là nồng độ thích hợp nhất cho hoạt động của endoglucanase_18736, hoạt

tính enzyme đã tăng 1,6 lần so với mẫu không bổ sung ion; nồng độ 10 mM Li+ là

nồng độ thích hợp nhất cho hoạt động của β-glucosidase_32768, ở nồng độ này, Li+

90

đã tạo ra một sự khác biệt rất lớn khi có khả năng làm tăng hoạt tính của enzyme lên

25,5 lần so với mẫu không bổ sung ion (Bảng 3.11).

Bảng 3.11. Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp.

Hoạt tính tương đối của enzyme tái tổ hợp (%)

Ion kim loại

Nồng độ (mM)

Endoglucanase

β-glucosidase

100

0

5

1.727,83 2,13

10

2.550,34 2,17

15

Li+

81,122,64

20

76,84 2,12

25

69,55 2,74

30

33,27 1,32

100

100

0

5

123,42 2,56

1.548,83 5,45

10

87,34 1,23

2.013,42 6,83

15

Na+

46,16 1,97

1.459,73 5,29

20

13,75 1,02

106,54 2,36

0

25

66,673,04

0

30

58,69 1,13

100

100

0

5

144,86 2,23

1.077,07 1,37

10

151,16 3,01

173,17 2,09

15

Ca2+

166,29 6,36

5,9 1,03

0

20

154,54 1,75

0

25

148.02 2,38

0

30

144.88 2,67

100

0

5

1.314,2 6,62

10

1.517,3 5,65

15

Mg2+

1.752,17 6,73

20

182,07 2,59

25

26,72 1,01

0

30

91

3.3.2.5. Độ bền của enzyme tái tổ hợp

Hiện nay, các cellulase được ứng dụng vào thực tiễn sản xuất thường mang

những đặc tính: bền nhiệt, chịu kiềm/axit, ... Do đó, để có thể định hướng ứng dụng

endoglucanase và β-glucosidase tái tổ hợp nghiên cứu ở trên vào thực tiễn, việc xác

định khả năng bền nhiệt của hai enzyme này là cần thiết. Trong nghiên cứu này,

endoglucanase_18736 và β-glucosidase_32768 được xác định khả năng bền nhiệt

trong điều kiện pH và khoảng nhiệt độ tối ưu cho mỗi loại enzyme. Kết quả nghiên

cứu cho thấy: endoglucanase_18736 bền ở nhiệt độ 55C hơn so với 60C. Đồng thời,

sự có mặt của ion Ca2+ (15 mM) không chỉ làm tăng hoạt tính của enzyme mà còn

góp phần làm cho enzyme bền hơn. Cụ thể: ở nhiệt độ 60C, khi có mặt ion Ca2+,

hoạt tính enzyme tăng lên 1,66 lần và vẫn duy trì được hoạt độ này sau 16 giờ ủ, còn

ở mẫu không có Ca2+, hoạt tính enzyme chỉ giữ được 8 giờ ủ. Ở 55C, khi có ion Ca2+,

hoạt tính enzyme cũng tăng lên 1,66 lần và duy trì hoạt độ sau 24 giờ ủ, trong khi ở

mẫu không có Ca2+, hoạt tính enzyme chỉ giữ được trong 12 giờ ủ. Nửa chu kỳ sống

của endoglucanase tái tổ hợp được xác định ở 55ºC là 25.16  0.21 giờ và ở 60ºC là

180

23.11  0.42 giờ (Hình 3.31).

)

160

%

( i

140

120

100

80

60

ố đ g n ơ ư t h n í t t ạ o H

40

20

0

0

10

40

50

20

30 Thời gian (h)

55°C/ -Ca2+

55°C/ + 15mM Ca2+

60°C/ -Ca2+

60°C/ + 15mM Ca2+

Hình 3. 31. Độ bền nhiệt của endoglucanase_18736 được khảo sát tại giá trị

Topt và pHopt.

92

Beta-glucosidase_32768 rất bền ở nhiệt độ 50 và 55C. Trong tất cả các phương

án thí nghiệm, β-glucosidase_32768 vẫn giữ được trên 60% hoạt tính sau 10 ngày ủ

ở 50 và 55C (Hình 3.32). Bên cạnh đó, kết quả nghiên cứu cũng cho thấy: với nồng

độ 10 mM Li+ duy trì trong suốt quá trình ủ enzyme chỉ có tác dụng làm tăng hoạt

tính enzyme ngay tại thời điểm ban đầu (làm cho hoạt tính tăng lên 25,5 lần) mà không

có tác dụng duy trì hoạt tính cũng như làm tăng độ bền của enzyme. Nửa chu kỳ sống của

β-glucosidase tái tổ hợp được xác định ở 55ºC là 11 ngày.

Hình 3.32. Độ bền nhiệt của β-glucosidase_32768 được khảo sát tại giá trị Topt

và pHopt.

93

3.3.2.6. Nghiên cứu tính đặc hiệu cơ chất của endoglucanase_18736 và β-

glucosidase_32768 tái tổ hợp.

Tính đặc hiệu cơ chất của endoglucanase_18736 và β-glucosidase_32768 tái tổ hợp được xác định dựa trên khả năng thủy phân cơ chất. Các cơ chất dùng trong

nghiên cứu này gồm: CMC, bột giấy, Avicel (ở nồng độ 1%) và pNPG (20 mM) theo

điều kiện phản ứng tối ưu. Kết quả nghiên cứu trong Hình 3.33 cho thấy:

endoglucanase_18736 có khả năng thủy phân CMC và bột giấy, trong đó khả năng

thủy phân bột giấy cao hơn so với CMC. Enzyme Cel8A thuộc họ GH8 từ chủng Seratia proteamaculans có khả năng thủy phân CMC và Bechwood xylan và cũng

không có khả năng thủy phân Avicel (cơ chất đặc hiệu cho exoglucanase) (Cano-

Ramirez và cs., 2016). Các enzyme khác nhau có phổ cơ chất khác nhau. AcCel12B tái tổ hợp từ chủng Acidothermus cellulolyticus 11b thuộc họ GH12, có khả năng thuỷ

phân CMC, RAC, Avicel và -glucan nhưng -glucan mới là cơ chất tốt nhất của

enzyme này (Wang và cs., 2015).

Trong khi đó, β-glucosidase_32768 chỉ có khả năng thủy phân pNPG trong dãy

cơ chất khảo sát. Beta-glucosidase bền nhiệt từ chủng nấm mốc Aspergillus fumigatus

Z5 có khả năng thủy phân nhiều loại cơ chất, bao gồm: 4-Nitrophenyl--D-

glucopyranoside, cellobiose, cellotriose, trong đó 4-Nitrophenyl--D-

glucopyranoside là cơ chất phù hợp nhất. Tuy nhiên enzyme này lại không thể thủy

1.8

1.6

1.4

phân được đồng phân α của cơ chất này (Liu và cs., 2012).

p ợ h ổ t i

1.2

) l

1

m / U

(

0.8

0.6

0.4

á t e m y z n e h n í t t ạ o H

0.2

0

CMC

Avicel

Bột giấy

p-NPG

Cơ chất

Endoglucanase

β-glucosidase

Hình 3.33. Khả năng thủy phân một số loại cơ chất của endoglucanase_18736 và β-

glucosidase _32768.

94

3.3.2.7. Nghiên cứu thông số động học Km, Vmax của endoglucanase và β-

glucosidase tái tổ hợp

Sử dụng enzyme tái tổ hợp đã được tinh sạch để xác định các thông số động

học. Cơ chất của endoglucanase_18736 và β-glucosidase_32768 tái tổ hợp được sử

dụng để khảo sát là CMC và pNPG ở các nồng độ khác nhau. Kết quả thu được biểu

diễn trên đồ thị với đường cong động học Michaelis và Menten, có phương trình dạng

y = ax/b+x, trong đó a là giá trị Vmax, b là giá trị Km. Các kết quả được xử lý và đồ

thị đường cong được xây dựng qua phần mềm của trang web

http://biomodel.uah.es/metab/enzimas/MM-regresion.htm.

Động học endoglucanase_18736 được thực hiện với cơ chất CMC trong dải

nồng độ từ 0,2-2 mg/ml. Kết quả ở Hình 3.34A cho thấy endoglucanase tái tổ hợp có

hệ số Km 1 mg/ml và Vmax đạt 90,59 μmol/min/ml. Với giá trị Km (1 mg/ml) nhỏ

hơn giá trị Km (6,87 mg/ml) của Cel8A tái tổ hợp từ chủng S. proteamaculans, chứng

tỏ endoglucanase_18736 có ái lực với CMC cao hơn so với Cel8A tái tổ hợp (Cano-

Ramirez và cs., 2016).

Beta-glucosidase_32768 được xác định động học trong khoảng cơ chất pNPG

từ 0,2 - 4 mM. Kết quả cho thấy enzyme có giá trị Km và Vmax lần lượt là 0,66 mM/ml

và 81,81 μmol/min/mg (Hình 3.34B). Hệ số xúc tác của enzyme tương đương với β-

glucosidase Bgl3 bền nhiệt từ chủng A. fumigatus Z5 (Liu và cs., 2012).

A B

Hình 3.34. Động học enzyme tái tổ hợp.

A) Endoglucanase_18736 trên nguồn cơ chất CMC (0,2-2 mg/ml); B) Beta-

glucosidase_32768 trên nguồn cơ chất pNPG (0,2-4 mM).

95

CHƯƠNG 4

BÀN LUẬN KẾT QUẢ NGHIÊN CỨU

4.1. Đa dạng vi sinh vật và tiềm năng khai thác các gen mới mã hóa cho cellulase

suối nước nóng Bình Châu thông qua cách tiếp cận không phụ thuộc vào

nuôi cấy.

4.1.1. Đa dạng vi sinh vật

Theo các tài liệu lịch sử, vào năm 1928, một bác sĩ người Pháp tên là Saillet

trong một chuyến khảo sát vùng Đông Nam Bộ đã phát hiện ra suối nước nóng Bình

Châu với hơn 70 điểm phun nước lộ thiên. Suối nước nóng Bình Châu là suối nước

nóng có nhiệt độ cao thứ 2 ở Việt Nam với nhiệt độ dao động từ 40°C - 84°C. Các

đặc điểm về thành phần và đặc điểm hóa lý của suối nước nóng Bình Châu đã được

nghiên cứu từ lâu bởi các nhà khoa học trong và ngoài nước nhưng các thông tin về

đa dạng vi sinh vật cũng như các hợp chất có hoạt tính sinh học của vi sinh vật vẫn

còn khá hạn chế, ngoại trừ nghiên cứu của Tran KM và cs. (2018), Nguyễn Kim Thoa

và cs. (2015) và Nguyễn Kim Thoa và Trần Thanh Thủy (2018). Do điều kiện lấy

mẫu và bảo quản mẫu còn khó khăn, các nghiên cứu này chủ yếu chỉ dừng lại ở việc

tiếp cận thông qua nuôi cấy các nhóm vi khuẩn có bào tử, do đó dữ liệu thu được chủ

yếu là các loài thuộc chi Bacillus, Geobacillus (Nguyễn Kim Thoa và cs., 2017; Tran

KM và cs., 2018). Trên thực tế, hầu hết các vi sinh vật ưa nhiệt trong suối nước nóng

thường không thể nuôi cấy được, do vậy sử dụng các phương pháp nuôi cấy để đánh

giá đa dạng vi sinh vật của hệ sinh thái này sẽ cho kết quả phiến diện (Kemp và Aller,

2004). Đồng thời, khi nghiên cứu vi sinh vật trong suối nước nóng, các nhà khoa học

phát hiện thấy vi sinh vật có mặt trong hệ sinh thái này chủ yếu là vi khuẩn và cổ

khuẩn (López-López và cs., 2013). Cho đến nay, các nghiên cứu vi sinh vật trong

suối nước nóng Bình Châu đã được công bố mới chỉ phát hiện được vi khuẩn thuộc

chi Bacillus, Geobacillus mà chưa phát hiện được nhóm cổ khuẩn nào. Đây là hạn

chế của phương pháp tiếp cận phụ thuộc vào nuôi cấy. Chính vì vậy, trong nghiên

cứu này, bằng cách tiếp cận không thông qua nuôi cấy Metagenomics, đa dạng vi sinh

vật cũng như các gen mã hóa cho enzyme của vi sinh vật suối nước nóng Bình Châu

96

đã được sáng tỏ hơn. Kết quả nghiên cứu của Luận án là minh chứng đầu tiên cho

thấy vi sinh vật trong suối nước nóng Bình Châu đa dạng hơn rất nhiều so với các

nghiên cứu đã công bố sử dụng phương pháp tiếp cận thông qua nuôi cấy. Cụ thể:

 Đã phát hiện được 41 ngành, 57 lớp, 128 bộ, 245 họ, 825 chi và 2.250 loài vi

sinh vật khác nhau hiện diện trong suối nước nóng Bình Châu. Đồng thời, trong số

các ngành vi sinh vật được phát hiện từ tổng trình tự gen đã được dự đoán (156.093

gen), 8 ngành chiếm ưu thế nhất trong suối nước nóng Bình Châu lần lượt là: ngành

Proteobacteria, tiếp theo là Firmicutes, Cyanobacteria, Bacteroidetes,

Planctomycetes, Thaumarchaeota, Actinobacteria và Euryarchaeota. Trong đó, ngành

Thaumarchaeota và ngành Euryarchaeota thuộc giới cổ khuẩn, còn 6 ngành còn lại là

giới vi khuẩn.

 Bộ dữ liệu phân loại vi sinh vật suối nước nóng Bình Châu cũng cho thấy sự

có mặt của ba ngành vi khuẩn được biết đến đó là những vi khuẩn siêu ưa nhiệt gồm:

Aquificae, Thermodesulfobacteria và Thermotogae. Ba ngành này chiếm tỷ lệ thấp

tương ứng 0,44%, 0,29% và 0,06% so với toàn bộ vi khuẩn có mặt trong mẫu (Bảng

3.5 và Hình 3.5). Ngành Aquificae gồm chủ yếu là các loài vi khuẩn ưa nhiệt như:

Aquifex pyrophilus (Huber và cs., 1992), Aquifex aeolicus (Deckert và cs., 1998),

Thermocrinis ruber (Huber và cs., 1998), Sulfurihydrogenibium yellowstonense

(Nakagawa và cs., 2005), Desulfurobacterium sp., và Hydrogenivirga sp. Trong khi

Thermodesulfatator atlanticus (Alain và cs., 2010) và Thermodesulfobacterium

thermophilum (Rozanova và Khudiakova, 1974) đã được miêu tả thuộc loại vi khuẩn

ưa nhiệt, khử sulfate, hóa tự dưỡng vô cơ (chemolithoautotrophic). Hai loài này là hai

loài đại diện chính của ngành Thermodesulfobacteria. Loài Thermotoga maritima là

đại diện của vi khuẩn ưa nhiệt độ cực cao, có thể sinh trưởng ở nhiệt độ lên tới 90°C

(Huber và cs., 1986) và là loài chính trong ngành Thermotogae. Từ các phân tích trên

cho thấy suối nước nóng Bình Châu bao gồm vô số các vi sinh vật ưa nhiệt và siêu

ưa nhiệt, hóa tự dưỡng vô cơ.

Không chỉ vậy, với các kết quả nhận được, vi sinh vật trong suối nước nóng

Bình Châu cũng đa dạng hơn vi sinh vật trong suối nước nóng Unkeshwar,

97

Maharashtra, Ấn Độ bởi mặc dù cùng được phân loại gồm 41 ngành nhưng vi sinh

vật trong suối nước nóng Bình Châu (nơi có nhiệt độ 45 - 84ºC) gồm 2.250 loài khác

nhau, còn vi sinh vật trong suối nước nóng Unkeshwar, Maharashtra, Ấn Độ (nhiệt

độ từ 50 - 60ºC) chỉ gồm 719 loài khác nhau (Mehetre và cs., 2015). Kết quả nghiên

cứu này trái ngược với một nghiên cứu gần đây cho rằng suối nước nóng có nhiệt độ

cao hơn thì đa dạng vi sinh vật sẽ thấp hơn (Saxena và cs., 2017). Với 2.250 loài vi

sinh vật khác nhau, suối nước nóng Bình Châu cho thấy có sự đa dạng về loài rất cao.

Điều này có thể bắt nguồn từ vị trí của suối nước nóng Bình Châu nằm trong khu

rừng cấm nguyên sinh quốc gia. Khu vực này có các hệ sinh thái thành phần: (i) Hệ

sinh thái rừng hơi ẩm nhiệt đới, nửa rụng lá trên đất đỏ bazan; (ii) Hệ sinh thái rừng

hơi khô ẩm nhiệt đới nửa rụng lá trên đất xám bạc màu có độ dốc thấp; (iii) Hệ sinh

thái rừng kín nửa rụng lá nhiệt đới vùng đất cát khô dốc thoải; (iv) Hệ sinh thái rừng

kín nửa rụng lá cây họ dầu trên nền đất cát tương đối ẩm; (v) Hệ sinh thái rừng ngập

mặn ven biển.

Ở một khía cạnh khác, bên cạnh những đặc điểm chung tương đồng với các

nghiên cứu khác trên thế giới khi nghiên cứu về đa dạng vi sinh vật trong suối nước

nóng như:

 Sự chiếm ưu thế của hai ngành Proteobacteria và Firmicutes trong suối nước

nóng Bình Châu có thể là đặc điểm đặc trưng của suối nước nóng có nhiệt độ cao và

kiềm tính bởi kết quả nghiên cứu này phù hợp với các kết quả nghiên cứu suối

nước nóng Sungai Klah (SK) - suối nước nóng kiềm (pH 7,0-9,0), có nhiệt độ cao

thứ hai ở Malaysia (50 - 110°C) (Chan và cs., 2015) và suối nước nóng ở Kenya

– suối nước nóng kiềm (pH 9,2 – 9,8), có nhiệt độ cao (45,1 – 83,6ºC) (Kambura

và cs., 2016). Trong khi ở suối nước nóng có nhiệt độ cao (45 - 90ºC) và axit nhẹ

(pH 5 - 7), ngành chiếm ưu thế là Proteobacteria và Thermi (Paul và cs., 2016).

Điều đó chứng tỏ, pH của môi trường có tác động đến đa dạng vi sinh vật trong

suối nước nóng.

 Hai ngành cổ khuẩn chiếm ưu thế trong suối nước nóng Bình Châu là ngành

Thaumarchaeota và ngành Euryarchaeota. Đây là những ngành cổ khuẩn đã được tìm

98

thấy trong cả suối nước nóng axit và suối nước nóng kiềm (Kambura và cs., 2016;

Paul và cs., 2016).

 Phân tích ngành Proteobacteria ở suối nước nóng Bình Châu cho thấy lớp

Gammaproteobacteria chiếm ưu thế nhất (24,87%), tiếp đến là Alphaproteobacteria

(19,61%) và Betaproteobacteria (16,42%) (Bảng 3.6 và Hình 3.5). Các lớp này trước

đây đã được xác định là các lớp chiếm ưu thế trong suối địa nhiệt có nhiệt độ gần

giống với nhiệt độ của suối nước nóng Bình Châu đó là suối nước nóng Amazonian

ở Peru (45 - 90ºC) (Paul và cs., 2016) và suối nước nóng ở Ấn Độ (43,5 - 98ºC)

(Saxena và cs., 2017).

Suối nước nóng Bình Châu cũng có những đặc trưng riêng về đa dạng vi sinh

vật như:

 Mức độ chiếm ưu thế ở cấp độ ngành theo thứ tự Proteobacteria > Firmicutes

> Cyanobacteria > Bacteroidetes > Planctomycetes > Thaumarchaeota >

Actinobacteria > Euryarchaeota. Đây là đặc trưng khác biệt với suối nước nóng kiềm

Unkeshwar, Maharashtra, Ấn Độ với 6 ngành chiếm ưu thế Actinobacteria >

Verrucomicrobia > Bacteriodes > Deinococcus-Thermus > Firmicutes > Viruses

(Mehetre và cs., 2015).

 Một đặc trưng nữa của vi sinh vật trong suối nước nóng Bình Châu là 4 loài vi

khuẩn chiếm ưu thế nhất đều là những loài được phân lập từ các nguồn có liên quan

đến biển. Đầu tiên, loài Marinobacter manganoxydans (1,514%) là vi khuẩn được

phân lập từ lỗ thông thủy nhiệt ở đáy biển Ấn Độ Dương, có khả năng oxi hóa mangan

(Wang và cs., 2012). Toàn bộ các loài thuộc chi Marinobacter đều là những loài được

phân lập từ biển (Handley và Lloyd, 2013). Tiếp đến, chủng Roseobacter sp. CCS2

(1,308%) được phân lập từ vùng nước ven biển Thái Bình Dương, là một loài của chi

Roseobacter (α-Proteobacteria) thường xuất hiện nhiều ở vùng nước ven biển.

Roseobacter sp. CCS2 là chủng vi khuẩn hiếu khí, quang dưỡng, sử dụng diệp lục để

thu năng lượng từ ánh sáng mà không tạo oxy (aerobic anoxygenic phototroph -

AAnP) (Slightom và Buchan, 2009). Loài vi khuẩn chiếm ưu thế thứ ba có đặc điểm

tương tự chủng Gamma proteobacterium IMCC2047 (1,070%), được phân lập từ một

99

mẫu nước bề mặt thu thập ở khu vực ven biển Hoàng Hải, Hàn Quốc (Kang và cs.,

2011). Cuối cùng, loài Thiobacillus thioparus (0,301%) được biết đến là loài có khả

năng oxy hóa sulfur, phân lập từ thảm vi sinh vật biển (Van den Ende và Gemerden,

1993). Kết quả đánh giá đa dạng vi sinh vật thu được 4 loài vi khuẩn chiếm ưu thế

nhất trong suối nước nóng Bình Châu là những loài có liên quan tới hệ sinh thái biển.

Nguồn gốc của các loài này có thể là do quá trình kiến tạo địa chất của suối nước

nóng Bình Châu trong hàng trăm đến hàng nghìn năm. Từ quan điểm địa chất, tại các

điểm phun, nước đã được tạo thành từ lớp chứa nước trong trầm tích biển đầm lầy

(hologen, gio-pleixtoxen), nước trong khe nứt của đá macma, nhờ áp suất cao tại đây,

chúng được đẩy lên mặt đất qua đới vỡ vụn tại giao điểm của 3 hệ thống đứt gãy kiến

tạo theo hướng: Tây Bắc Đông Nam, Tây Nam Đông Bắc. Nước xuất lộ kiểu dạng

mạch mang theo nhiều bọt khí có mùi lưu huỳnh, những chỗ có nhiều mạch lộ chính

nước trào lên mạnh và tạo thành các vũng nước sâu từ 0,5 đến 1 mét gọi là Bàu nước

nóng. Vị trí địa lý của suối nước nóng Bình Châu cũng là hệ sinh thái ven biển, nơi đây

gần biển Hồ Cốc và biển Hồ Tràm. Chính nhờ những đặc điểm này đã tạo lên đặc trưng

riêng về khu hệ vi sinh vật trong suối nước nóng Bình Châu có sự khác biệt với các

khu hệ vi sinh vật trong các suối nước nóng đã biết khác. Các loài vi khuẩn chiếm ưu

thế trong suối nước nóng Bình Châu chủ yếu là các loài được biết đến có khả năng

tham gia vào các chu trình hóa sinh địa như oxy hóa mangan, oxy hóa lưu huỳnh, …

4.1.2. Tiềm năng khai thác các gen mới mã hóa cho cellulase

Một nghiên cứu ngành gần đây do Freedonia thực hiện vào tháng 1 năm 2018

về “Enzyme công nghiệp toàn cầu” cho thấy nhu cầu toàn cầu về enzyme công nghiệp

dự kiến sẽ tăng 4% (~ 5 tỷ USD) vào năm 2021

(https://www.freedoniagroup.com/Brochure/FocusReports/bFW35117.pdf). Sự phát

triển của nghiên cứu khoa học về enzyme chủ yếu dựa trên các ngành như công nghệ

sinh học, sinh học phân tử và di truyền học. Những tiến bộ liên tục trong các lĩnh vực

nghiên cứu này, đặc biệt liên quan đến kỹ thuật và giải trình tự DNA, dẫn đến sự gia

tăng rộng rãi nhu cầu enzyme trên toàn thế giới. Cellulase là một trong những loại

enzyme có thị phần hàng đầu với nhu cầu tiêu thụ tăng liên tục trong những năm qua

100

do ứng dụng rộng rãi của chúng. Cellulase không phải là một enzyme đơn lẻ mà là

một nhóm bao gồm 3 loại enzyme chính endoglucanase, exoglucanase và β-

glucosidase. Cellulase có thể được tìm thấy ở hầu hết các đại diện của vi sinh vật, bao

gồm cổ khuẩn, vi khuẩn, nấm sợi và xạ khuẩn, nấm men. Do đó, việc tích lũy và tăng

cường các kiến thức về sự đa dạng của enzyme này là rất cần thiết nhằm phát triển

thêm các nghiên cứu cơ bản và ứng dụng về cellulase vào trong đời sống con người.

Cellulase sử dụng trong công nghiệp (sản xuất nhiên liệu sinh học, trong các

quy trình tẩy rửa, dệt nhuộm…) thường có tính chất đặc biệt như chịu nhiệt, chịu

kiềm/ axit hoặc dung môi, muối…, trong đó tính chất chịu nhiệt là một trong những

tiêu chí hàng đầu được quan tâm. Cellulase bền nhiệt nói riêng hay các enzyme ưa

nhiệt nói chung thường được thu nhận từ nhóm vi sinh vật ưa nhiệt và siêu ưa nhiệt

tại các vùng địa nhiệt. Suối nước nóng là một ví dụ về hệ sinh thái địa nhiệt, nơi nhiệt

độ của nước cao hơn nhiệt độ không khí xung quanh. Mặc dù hệ sinh thái này có tiềm

năng để khai thác các enzyme bền nhiệt từ vi sinh vật bản địa nhưng việc tiếp cận

chúng thông qua phương pháp nuôi cấy truyền thống trên các môi trường nhân tạo

hầu như không có hiệu quả, đặc biệt đối với những nhóm vi sinh vật không có bào

tử, hóa tự dưỡng. Do đó, việc phát triển và ứng dụng các kỹ thuật khác không thông

qua nuôi cấy nhằm tiếp cận và khai thác hiệu quả nguồn gen từ những hệ sinh thái

đặc biệt như thế này là vô cùng cần thiết

Mặc dù kỹ thuật metagenomic đã được phát triển và ứng dụng trên thế giới từ

những năm 1998 (Handelsman và cs., 1998) nhưng mới được áp dụng ở Việt Nam từ

những năm 2011 bởi nhóm nghiên cứu của GS. Trương Nam Hải (Trương Nam Hải,

2011-2012) trên hệ vi sinh vật ruột mối nhằm tìm kiếm các cellulase mới. Sau những

khó khăn và thành công ban đầu, hướng nghiên cứu này tiếp tục mở rộng với nhiều

hệ sinh thái khác nhau với nhiều mục đích nhằm tìm kiếm các gen mới, các hợp chất

mới trong tự nhiên. Cùng với các nhóm nghiên cứu khác của Viện Hàn lâm Khoa học

và Công nghệ Việt Nam, nhóm nghiên cứu của chúng tôi cũng sử dụng kỹ thuật

metagenomic để khai thác các gen mã hóa cho cellulase từ quần xã vi sinh vật của

suối nước nóng với mong muốn có thể tìm kiếm được nguồn cellulase mới có khả

101

năng bền nhiệt và bền trong các điều kiện pH axit/kiềm của quá trình tiền xử lý

lignocellulose. Trong nghiên cứu này, suối nước nóng Bình Châu - suối nước nóng

có nhiệt độ cao thứ hai ở Việt Nam (82-84C) với pH kiềm 7,5 – 9,2 được chọn làm

nguồn thu nhận DNA metagenome. Đặc biệt, đây là một trong số ít các suối nước

nóng lộ thiên ở Việt Nam, với vị trí nằm giữa khu rừng tràm nguyên sinh quốc gia.

Việc phân giải các cành cây nhỏ, lá tràm già gãy rụng xuống mặt nước, ngoài việc

tác động của nhiệt độ còn có sự tham gia của quần xã vi sinh vật ở đây. Chính vì vậy,

suối nước nóng Bình Châu có tiềm năng là nguồn dự trữ đa dạng vi sinh vật ưa nhiệt

cao cũng như các enzyme mang những đặc tính mới, có giá trị khoa học và công nghệ,

được tạo ra từ quá trình chọn lọc tự nhiên. Từ bộ dữ liệu DNA metagenome suối nước

nóng Bình Châu, chúng tôi đã sử dụng rất nhiều những công cụ tin sinh nhằm dự

đoán tính chất của các ORF mã hóa cho các enzyme thủy phân cellulose như giá trị

Tm, axit/ kiềm tính, tỷ lệ G+C, độ hòa tan, mức độ tương đồng và mức độ định danh

protein… để từ đó lựa chọn được hai gen [denovogenes]_18736 mã hóa cho

endoglucanase và [denovogenes]_32768 mã hóa cho β-glucosidase cho quá trình thực

nghiệm. Hai gen này đã được biểu hiện trong hệ thống E. coli C43(DE3) và các

protein tái tổ hợp đều ở dạng hòa tan. Kết quả nghiên cứu thực nghiệm cho thấy

endoglucanase_18736 tinh sạch hoạt động tối ưu ở nhiệt độ 55C và pH 10. Ở trong

điều kiện tối ưu này enzyme vẫn giữ được 100% hoạt tính sau 12 h ủ mẫu. Ion Ca2+

có khả năng làm tăng hoạt tính cũng như độ bền của enzyme. Khi có mặt 15 mM

Ca2+, hoạt tính của enzyme đã tăng lên 1,6 lần và vẫn giữ nguyên hoạt tính sau 24 giờ

ủ. Mặt khác, β-glucosidase_32768 cũng hoạt động tối ưu ở nhiệt độ 55C và pH 8,5.

Ở trong điều kiện tối ưu, enzyme vẫn giữ được trên 60% hoạt tính sau 10 ngày ủ mẫu.

Ion Li+ có khả năng làm tăng hoạt tính nhưng không có khả năng làm tăng độ bền của

enzyme. Nửa chu kỳ sống được xác định ở 55ºC của endoglucanase_18736 và β-

glucosidase_32768 lần lượt là 25.16  0.21 giờ và 11 ngày. Mặc dù vẫn có sự không

trùng khớp giữa dự đoán lý thuyết với thực nghiệm, ví dụ endoglucanase_18736 được

dự đoán có nhiệt độ tối ưu ≥ 65ºC, có tính chất axit nhưng thực nghiệm cho thấy

enzyme này có Topt từ 55-60oC, phổ pH rộng từ axit đến kiềm và pHopt 10, tuy nhiên

102

cả 2 enzyme tái tổ hợp thu nhận được đều có những tiềm năng ứng dụng cao vì độ

bền nhiệt và kiềm tính của chúng.

Với những cơ sở lý thuyết thu thập được kết hợp với các kết quả thực nghiệm

có thể khẳng định endoglucanase_18736 và β-glucosidase_32768 là những enzyme

mới vì những lý do cụ thể như sau:

- Về trình tự nucleotide và axit amin: Hai enzyme này được mã hóa bởi 2 trình

tự gen [denovogenes]_18736 và [denovogenes]_32768. Trình tự axit amin của

[denovogenes]_18736 có mức độ tương đồng cao nhất 50,35% so với endoglucanase

của chủng vi khuẩn chưa được phân loại JGI053 (mã số SOD03652 trên Ngân hàng

gen) và 49,31% so với protein thuộc họ GH6 của chủng Polyangium fumosum (mã

số WP_136936398.1) và 43,62% so với endo-1,4-β-D-glucanase của chủng

Thermobifida fusca (mã số 1TML_A). Trong khi đó trình tự axit amin của β-

glucosidase_32768 có quan hệ họ hàng gần nhất với β-glucosidase A của chủng

Parcubacteria bacterium GW2011_GWF2_44_8 (mã số KKT80126.1) với mức độ

tương đồng 53,94%. Đối với các protein có độ tương đồng < 75% so với các protein

trong ngân hàng gen có thể được kỳ vọng là mới (Mount, 2004). Hơn nữa,

endoglucanse_18736 được dự đoán thuộc họ GH6. Cho đến nay, số lượng enzyme

thủy phân cellulose đã được thu nhận bằng kỹ thuật metagenomic chủ yếu thuộc các

họ GH3, GH13, GH2, GH5, GH29, GH51 và GH94 (Duan và Feng, 2010; Tiwari và

cs., 2018). Trong đó, khả năng phát hiện các gen mã hóa cho cellulase thuộc ba họ

GH5, GH51 và GH94 ở DNA metagenome của ruột mối có tỉ lệ khoảng 1 gen

cellulase/0,4 Mb. Còn các gen mã hóa cho endoglucanase thuộc họ GH6 chỉ được tìm

thấy từ DNA metagenome đống ủ phân hữu cơ (Kwon và cs., 2010; Jensen và cs.,

2018). Do đó, việc sàng lọc và lựa chọn được endoglucanase_18736 thuộc họ GH6

trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu đã góp phần làm phong

phú, đa dạng cơ sở dữ liệu gen mã hóa cho cellulase bằng kỹ thuật không thông qua

nuôi cấy.

- Về đặc tính của enzyme: Endoglucanase_18736 và β-glucosidase_32768 có

thể là các enzyme bền kiềm nhất được phát hiện từ DNA metagenome vi sinh vật nói

103

chung và suối nước nóng nói riêng. Endoglucanase_18736 và endoglucanase

Thcel6A tái tổ hợp (Yin và cs., 2015) cùng thuộc họ GH6 và có cùng nhiệt độ tối ưu

(55C) nhưng Endoglucanase_18736 có pH tối ưu là 10 trong khi Thcel6A có pH tối

ưu là 8,5. Trong các nghiên cứu khác cũng đã phát hiện thấy sự có mặt của các gen

mã hóa cho endoglucanase thuộc họ GH6 từ DNA metagenome đống ủ phân hữu cơ

song các enzyme này đều là các enzyme axit (pHopt 6) (Kwon và cs., 2010; Jensen và

cs., 2018).

Tương tự, β-glucosidase _32768 là một trong những enzyme thuộc nhóm GH1

bền nhiệt và rất bền trong môi trường kiềm. Ở nhiệt độ 50C và pH 8,5, enzyme vẫn

giữ được 90% hoạt tính sau 10 ngày. Đồng thời sự có mặt của ion Li+ đã làm tăng

hoạt tính ban đầu của enzyme lên 25 lần, điều này rất có ý nghĩa trong các quy trình

thủy phân sinh khối liên tục hoặc dài ngày. Bằng tiếp cận metagenomic chúng tôi đã

thu nhận được β-glucosidase_32768 bền nhiệt và bền kiềm hơn so với các enzyme

cùng loại đã được công bố. Schroder và cs. (2014) đã phân lập được gen Bgl1 mã hóa

cho β-glucosidase từ DNA metagenome suối nước nóng São Miguel (Azores, Bồ Đào

Nha) cũng có khả năng hoạt động trong dải pH rộng (từ 4,5-9,5) nhưng ở 50°C,

enzyme tái tổ hợp của Bgl1 chỉ giữ được 78% hoạt tính sau 24 giờ. Trong một nghiên

cứu gần đây nhất, gen Vul_bgl1A mã hóa cho β-glucosidase cũng được tách dòng từ

DNA metagenome của mẫu làm giàu vi sinh vật lỗ thông thủy nhiệt đảo Vulcano

(Italy) và biểu hiện trong E. coli. Enzyme tái tổ hợp cũng bền nhiệt và bền trong pH

4-9, tuy nhiên hoạt tính enzyme mất 32% sau 24h ở pH 9 và gần 50% sau 48h ở pH7

(Schröder và cs., 2019).

Tóm lại: Hai enzyme endoglucanse_18736 và β-glucosidase_32768 là những

enzyme mới được phát hiện trong bộ dữ liệu DNA metagenome suối nước nóng Bình

Châu. Cả hai enzyme tái tổ hợp có mức độ tương đồng ~50-55% so với các protein

đã công bố trên ngân hàng gen với khả năng bền nhiệt và bền kiềm tương đương,

thậm chí hơn các enzyme thủy phân cellulose đã được tìm thấy từ DNA metagenome

của các hệ sinh thái khác. Kết quả này lại góp thêm một minh chứng nữa về hiệu quả

của kỹ thuật metagenomics trong việc khai thác các gen/ protein mới của vi sinh vật

104

trong tự nhiên. Đồng thời, đặc điểm của hai enzyme có ý nghĩa thực tiễn đối với các

quy trình thủy phân cellulose ở quy mô lớn.

4.2. Mối liên hệ giữa mô hình cấu trúc với các đặc điểm của

endoglucanase_18736 và β-glucosidase _32768

4.2.1. Phân tích các domain chức năng của Endoglucanase_18736 và β-

glucosidase_32768

Endoglucanase_18736 và β-glucosidase_32768 là các enzyme có cấu trúc nhỏ

gọn, chỉ mang một domain duy nhất - domain xúc tác. Domain xúc tác của

endoglucanase_18736 thuộc họ GH6 nằm từ vị trí axit amin Q236 đến G483 còn

domain xúc tác của gen denovogenes_32768 thuộc họ GH1 nằm từ vị trí axit amin

E2 đến E407. Kumar và cs., (2000) khi so sánh về cấu trúc và trình tự của các protein

ưa nhiệt (thermophilic) và protein ưa ấm (mesophilic) thấy rằng các protein ưa nhiệt

có cấu trúc nhỏ gọn hơn. Hơn nữa, đặc điểm cấu trúc thiếu module liên kết cellulose

của 2 enzyme tái tổ hợp cũng phù hợp với các cấu trúc của một số cellulase bền nhiệt

và hoạt động ở nhiệt độ cao. Endoglucanase của cổ khuẩn Pyrococcus furiosus thuộc

họ GH12 có thể giữ nguyên hoạt tính ở nhiệt độ 112C, với nửa chu kỳ sống ở 95oC

là 40 giờ. Nghiên cứu cấu trúc của enzyme siêu bền nhiệt này cũng cho thấy enzyme

không có CBM - một đặc điểm dường như phổ biến đối với nhiều endoglucanase và

exoglucanase bền nhiệt mà chỉ có một peptide tín hiệu để có thể tiết enzyme ngoại

bào (Bauer và cs., 1999). Một số cellulase bền nhiệt thuộc họ GH7 thu nhận từ nấm

mốc có nang Melanocarpus albomyces (Haakana và cs., 2004) hay endoglucanse

thuộc họ GH8 từ Aquifex aeolicus (Kim và cs., 2000) cũng không có vùng CBM này.

4.2.2. Mô hình cấu trúc 3D của Endoglucanase_18736 và β-glucosidase_32768

tái tổ hợp

Cấu trúc 3D của gen denovogenes_18736

Bền nhiệt là một đặc tính phức tạp của enzyme, nó có thể được điều khiển bởi

một vài nhân tố. Kumar và cs. (2000) cho rằng các protein ưa nhiệt thường có cấu trúc

nhỏ gọn, ở trạng thái oligomeric, có tính kỵ nước, có axit amin phân cực và không phân

cực ở khu vực bề mặt, chứa nhiều cầu muối và nhiều liên kết hydro giữa các chuỗi bên.

Tỷ lệ các axit amin Arg và Tyr thường chiếm ưu thế, trong khi Cys và Ser ít xuất hiện

trong các protein ưa nhiệt. Trong vòng xoắn alpha, protein ưa nhiệt có chứa nhiều axit

105

amin hơn nhưng không có các gốc Pro như ở protein ưa ấm. Căn cứ vào các đặc điểm này,

endoglucanase_18736 có thể được coi là enzyme ưa nhiệt. Cụ thể:

(i) cấu trúc nhỏ gọn do có tỷ lệ các axit amin có kích thước lớn nhỏ, chủ yếu là

các axit amin có kích thước vừa và nhỏ (Phụ lục 13).

(ii) Các axit amin chủ yếu thuộc nhóm kỵ nước và phân bố rải rác trong cấu

trúc. Các axit amin kỵ nước tập trung nhiều ở đầu C, trong các chuỗi xoắn α và chuỗi

mở rộng của tấm β (Phụ lục 14). Đồng thời, cấu trúc của denovogenes_18736 cũng

chứa nhiều axit amin có tính phân cực (Phụ lục 15).

+) của Lys (K) hoặc guanidinium

(iii) Cầu muối thường được hình thành từ anion carboxylate (RCOO−) của

+) của Arg (R). Cấu trúc của protein ổn định và protein bền nhiệt là

Asp(D) hoặc Glu (E) với cation ammonium (RNH3

(RNHC (NH2)2

nhờ các cầu muối và liên kết hydro. Các liên kết này có sự tham gia của một số axit

amin như: Arg (R), Tyr (Y), Trp (W)... Trong mô hình của endoglucanase_18736 xây

dựng có tới 46 vị trí axit amin có thể hình thành liên kết hydro.

(iv) Số lượng Cys có trong cấu trúc khá ít (chỉ có 4 Cys) (Phụ lục 16)

(v) Cuối cùng, trong vòng xoắn α của endoglucanase_18736 có chứa nhiều axit

amin ngoại trừ Pro. Pro chỉ tập trung chủ yếu ở trên các vòng lặp và trước domain

xúc tác (Phụ lục 17).

Ngoài ra, endoglucanase_18736 còn có một số đặc điểm khác cũng góp phần

làm tăng mức độ bền nhiệt. Ví dụ như sự không tham gia vào cấu trúc của 10 axit

amin trong chuỗi peptide, các vòng lặp trong cấu trúc cũng rất ngắn (Phụ lục 18) giúp

cho cấu trúc của enzyme nhỏ gọn hơn. Tỷ lệ các axit amin tích điện âm khá lớn (Phụ

lục 19). Tâm hoạt động của denovogenes là Asp299 tích điện âm và nằm trên chuỗi

3-helix. Sát cạnh Asp299 là Arg298 tích điện dương. Do đó, các ion trái dấu sẽ hút

nhau bằng lực hút tĩnh điện và mối liên kết giữa Asp299 và Arg298 là liên kết ion,

làm cho cấu trúc của khu vực tâm hoạt động trở nên bền vững hơn.

Endoglucanase_18736 cũng chứa nhiều axit amin aliphatic (Phụ lục 20), nhiều axit

amin thơm tập trung trong vùng xúc tác. Các axit amin này nằm trong các vòng lặp,

hoặc trong chuỗi mở rộng của tấm β hoặc trong những vị trí uốn cong (Phụ lục 21).

106

Cầu liên kết disulfide là một trong những đặc điểm giúp gia tăng độ bền nhiệt của

enzyme. Gần đây, Bashirova và cs. (2019) đã dùng kỹ thuật liên kết disulfide dựa trên

cấu trúc (DSB) để làm tăng khả năng bền nhiệt của EGLII từ Penicillium verruculum.

Trong nghiên cứu này, chúng tôi sử dụng phần mềm dự đoán cầu liên kết disulfide

giữa các Cys (Ceroni và cs., 2006) (http://disulfind.dsi.unifi.it/), kết quả cho thấy cấu

trúc của endoglucanase_18736 có 2 cầu liên kết disulfide. Cầu liên kết disulfide thứ

nhất được hình thành giữa Cys300 với Cys343 và cầu liên kết disulfide thứ hai được

hình thành giữa Cys442 với Cys478 (Phụ lục 22). Hai cầu liên kết disulfide này có

thể đóng vai trò giúp endoglucanase_18736 bền nhiệt hơn. Tất cả các đặc điểm mô tả

ở trên phù hợp với giả thiết về cấu trúc của enzyme bền nhiệt của các tác giả Russell

và cs. (1997), Russell và cs. (1998), Haney và cs. (1997), Yennamalli và cs. (2013),

Niu và cs. (2016) và Ge và cs. (2017).

Đặc tính của endoglucanase_18736 cơ bản tương đồng với endoglucanase Egl-

252 của vi khuẩn ưa kiềm Bacillus sp. strain KSM-N252 (Endo và cs., 2001). Chúng

cùng hoạt động tối ưu ở nhiệt độ 55C, pH 10. Tuy nhiên, ion Ca2+ giúp làm tăng

hoạt tính cho endoglucanase_18736 nhưng lại ức chế hoàn toàn hoạt tính của Egl-

252. Mặc dù khá giống nhau về đặc điểm enzyme nhưng chúng lại khác nhau hoàn

toàn về cấu trúc. Trong khi endoglucanase_18736 có cấu trúc nhỏ gọn, chỉ có một

domain xúc tác, không có CBM thì Egl-252 lại có cấu tạo gồm một peptide tín hiệu

dài 29 axit amin và chiều dài của protein trưởng thành gồm 463 axit amin. Đầu C của

enzyme có một CBM được lặp lại thuộc họ GH12. Hơn nữa, trình tự axit amin lặp lại

cũng khác nhau giữa 2 enzyme này. Endoglucnase_18736 có trình tự axit amin lặp

lại từ 2 đến 4 lần trước domain xúc tác (P-T (2)/P-A (4)/P-Q (2)/P-E (2)), còn Egl-

252 có bốn và sáu lần lặp lại P-P-S/ T-E/B-P-(E) ngay trước CBM1 và CBM2.

Ở một khía cạnh khác, endoglucanase_18736 được xác định bằng thực nghiệm

là một endoglucanase bền kiềm. Enzyme này hoạt động tối ưu ở nhiệt độ 55C, pH10.

Ở điều kiện tối ưu, hoạt tính enzyme tăng 1,6 lần (166,29% ± 3,23) khi có mặt ion

Ca2+ và giữ nguyên hoạt độ này sau 24 giờ ủ. Khi nâng nhiệt độ lên 60oC, enzyme

vẫn giữ được hoạt độ này sau 12 giờ ủ.

107

Cho đến nay, các nghiên cứu về trình tự axit amin và cấu trúc 3D của

endoglucanase thuộc họ GH6 vẫn còn ít được biết đến. Mặc dù chúng đều là các

endoglucanase bền nhiệt (50-55C) nhưng endoglucanase_18736 có khả năng bền

kiềm (pH10) trong khi mgCel6A lại chỉ bền trong pH 5-6 (Jensen và cs., 2018). Hai

enzyme này ngoài sự khác biệt về trình tự axit amin, chúng còn có sự khác biệt về

cấu trúc. Cấu trúc của denovogenes_18736 nhỏ gọn chỉ gồm một domain xúc tác

trong khi cấu trúc của mgCel6A gồm hai domain.

Cũng giống như cơ chế bền nhiệt, cơ chế bền kiềm của protein nói chung và của

endoglucanase nói riêng bị điều khiển bởi nhiều yếu tố. Ngoài các yếu tố chung giống

với cơ chế bền nhiệt, có một vài yếu tố riêng giải thích cho cơ chế bền kiềm. Theo

Shirai và cs. (2001), khả năng bền kiềm là do có sự gia tăng số lượng Arg, His và

Gln, và giảm Asp và Lys. Các cặp ion Lys-Asp đã không còn thích hợp và bị thay thế

một phần bằng các cặp ion Arg-Asp. Sự thích nghi trong kiềm dường như là sự tái

tạo của các cặp ion để cân bằng điện tích được giữ trong điều kiện hoạt động ở pH

cao. Trong cấu trúc vùng bảo thủ của endoglucanase_18736 (từ Gln236 đến Gly483)

cho thấy có sự sắp xếp trình tự axit amin theo xu hướng cân bằng điện tích (Phụ lục

19). Ngoài ra, theo nghiên cứu của Linhult và cs. (2004), khả năng bền kiềm là do sự

có mặt của Thr trong cấu trúc. Phân tích về cấu trúc, trình tự axit amin và thành phần

axit amin của endoglucanase_18736 cho thấy sự có mặt của Thr trong cấu trúc. Thr

có mặt ở 12 vị trí trong vùng bảo thủ (từ Gln236 đến Gly483) (Phụ lục 23).

Cấu trúc 3D của gen denovogenes_32768

Cũng tương tự như endoglucanase_18736, β-glucosidase_32768 là một enzyme

bền nhiệt và bền kiềm. Do đó, về mặt cấu trúc, denovogenes_32768 cũng có đầy đủ

các đặc điểm chung của một protein bền nhiệt theo giả thiết của Kumar và cs. (2000)

như cấu trúc nhỏ gọn chỉ gồm một domain xúc tác. Mô hình cấu trúc của β-

glucosidase_32768 chủ yếu là các axit amin có kích thước nhỏ, trên bề mặt tập trung

nhiều axit amin ít kỵ nước và axit amin phân cực, axit amin kỵ nước nằm bên trong

(Phụ lục 24, 25 và 26). Các cầu muối và liên kết hydro giữa các chuỗi bên làm cho

protein được mã hóa bởi β-glucosidase_32768 trở nên ổn định và bền nhiệt. Ngoài

ra, Cys và Ser là những axit amin hiếm gặp trong cấu trúc của β-glucosidase_32768,

108

chỉ có 7 và 15 axit amin (Phụ lục 27, 28). Trong vòng xoắn alpha, β-

glucosidase_32768 có chứa nhiều axit amin, vòng xoắn dài nhất chứa đến 20 axit

amin. Pro ít gặp trong vòng xoắn, Pro thường nằm trong các vòng lặp (Phụ lục 29).

Đồng thời, để có cấu trúc nhỏ gọn, mô hình cấu trúc của β-glucosidase_32768 đã xóa

bỏ 14 axit amin ở trên các vòng lặp (Phụ lục 30). Ngoài ra, một đặc điểm nữa trong

cấu trúc của denovogenes_32768 đó là các axit amin tích điện, aliphatic và axit amin

thơm chiếm số lượng rất lớn. Chúng phân bố khá đều trong mô hình cấu trúc (Phụ

lục 31, 32, 33).

Đặc biệt, khi sử dụng phần mềm Scanprosite của ExPASy

(https://prosite.expasy.org/) đã không xác định được vị trí tâm hoạt động của

denovogenes_32768. Vậy tâm hoạt động của β-glucosidase_32768 nằm ở vị trí nào?

Bằng thực nghiệm đã xác định được β-glucosidase_32768 là một enzyme bền nhiệt

và bền kiềm. Beta-glucosidase_32768 được phân loại thuộc họ GH1. Họ GH1 gồm

β-glucosidase từ cổ khuẩn, thực vật và động vật có vú (Ketudat Cairns và Esen, 2010;

Krisch và cs., 2010). Theo Davies và Henrissat (1995), hầu hết các β-glucosidase đều

có tâm hoạt động hình túi. Kết quả xây dựng mô hình cấu trúc 3D của

denovogenes_32768 (Hình 3.13) cũng cho thấy có một khu vực dạng hình túi. Do đó

khả năng tâm hoạt động của β-glucosidase_32768 nằm trong khu vực này. Đồng thời,

các β-glucosidase thuộc họ GH1 đã được nghiên cứu hầu hết đều có cơ chế xúc tác

kiểu giữ nguyên. Quá trình xúc tác gồm hai bước riêng biệt là quá trình glycosyl hóa

và quá trình khử glycosyl hóa. Axit amin Glu đóng vai trò là axit amin chìa khóa

trong tâm hoạt động và là axit amin bảo thủ được tìm thấy trong tất cả các β-

glucosidase đã được công bố (Davies và Henrissat, 1995; Wang và cs., 1995). Toàn

bộ phản ứng xúc tác của β-glucosidase do hai axit amin Glu thực hiện. Ở vi khuẩn,

một axit amin Glu hoạt động như nucleophile (Motif bảo thủ: I /VTENG) và axit

amin Glu còn lại hoạt động như một chất xúc tác axit/ bazơ chung (Motif bảo thủ:

TFNEP) (Davies và Henrissat, 1995; Singh và cs., 2016). Trong khi β-glucosidase

của thực vật motif: I /VTENG giữ nguyên, còn motif TFNEP thay đổi thành motif:

TXNEX (Zouhar và cs., 2001). So sánh trình tự axit amin của khuôn 1vff.1.A và β-

109

glucosidase_32768 cho thấy khuôn 1vff.1.A có hai motif bảo thủ đặc trưng cho β-

glucosidase GH1 của vi khuẩn. Trong khi đó, trên mô hình β-glucosidase_32768, các

motif này đã thay đổi trình tự axit amin. Cụ thể: Motif I /VTENG và motif TFNEP

đã thay đổi lần lượt thành motif VAEAG và motif TINEA (Phụ lục 34). Cấu trúc 3D

của β-glucosidase_32768 cũng cho thấy axit amin Glu155 trong motif TINEA và

Glu321 trong motif VAEAG đều nằm trọn trong khu vực dạng hình túi được hình

thành bởi các vòng lặp có bề mặt rộng, bao quanh đầu C của sợi β-barrel. Glu155

nằm trên sợi β-barrel thứ 4 còn Glu321 nằm trên sợi β-barrel 7 (Hình 3.13A). Trong

nghiên cứu của Tribolo và cs. (2007) đã công bố cấu trúc X-ray của β-glucosidase

thuộc họ GH1 ở dịch bào tương của người với tâm hoạt động hình túi được hình thành

bởi các vòng lặp có bề mặt rộng, bao quanh đầu C của sợi β-barrel, bên trong túi có

chứa hai axit amin Glu. Trong đó, axit amin Glu đóng vai trò là chất xúc tác axit/bazơ

nằm trên sợi β-barrel thứ 4, còn axit amin Glu đóng vai trò là nucleophilic nằm trên

sợi β-barrel thứ 7.

Từ các phân tích ở trên cho thấy Glu155 và Glu321 có thể là hai axit amin quan

trọng đóng vai trò xúc tác trong tâm hoạt động của β-glucosidase_32768. Tuy nhiên,

để có kết luận chính xác cần phải có thêm một số thực nghiệm về kết tinh protein

cũng như xác định vai trò của một số axit amin chìa khóa bằng phương pháp đột biến

điểm (Czjzek và cs., 2000; Kumar và cs., 2000; Zouhar và cs., 2001; Santos và cs.,

2016). Bên cạnh đó, sự khác biệt trong motif bảo thủ của β-glucosidase_32768 phải

chăng là sự khác biệt được tạo ra bởi nguồn gốc tiến hóa?

Với các kết quả nhận được cho thấy β-glucosidase_32768 không chỉ mới về

trình tự, cấu trúc và tính chất enzyme được thể hiện qua đặc tính bền nhiệt, bền kiềm

so với các enzyme β-glucosidase đã được công bố cho đến nay. Mặc dù cùng thuộc

họ GH1, có pH tối ưu gần như nhau nhưng β-glucosidase_32768 có trình tự axit amin,

có nhiệt độ tối ưu và độ bền nhiệt, bền kiềm cao hơn rất nhiều so với Cen502, một β-

glucosidase mới được thu nhận thông qua sàng lọc thư viện metagenomic của

Bursaphelenchus xylophilus (Zhang và cs., 2017). Beta-glucosidase _32768 vẫn giữ

110

được trên 60% hoạt tính sau 10 ngày khi ủ ở điều kiện tối ưu (nhiệt độ 55oC, pH 8.5).

Trong khi enzyme tái tổ hợp từ Cen502 hoạt động tối ưu ở 38C và chỉ giữ được 51

và 56% hoạt tính sau 24h ủ ở pH tương ứng là 8 và 9. Trình tự axit amin của

denovogenes_32768 cũng rất khác so với Cen502 (Phụ lục 35).

Trong một nghiên cứu khác, mặc dù cùng là enzyme bền nhiệt, có nhiệt độ tối

ưu như nhau (50C) nhưng enzyme tái tổ hợp của β-glucosidase_32768 lại bền kiềm

và có pH tối ưu (pH 8,5) cao hơn pH tối ưu của enzyme tái tổ hợp BglA từ Clostridium

thermocellum (pH 7) (Ahmed và cs., 2019).

Tóm lại: Từ các phân tích ở trên cho thấy: Endoglucanase_18736 và β-

glucosidase_32768 là các enzyme mới không chỉ về trình tự axit amin, cấu trúc mà

còn mang đặc tính mới bền nhiệt và bền kiềm so với những enzyme đã được công bố

cho đến nay. Mặc dù cả hai enzyme đều mang các đặc điểm chung về lý thuyết của

các enzyme bền nhiệt, tuy nhiên các thực nghiệm để tiếp tục làm sáng tỏ cấu trúc và

vai trò của các axit amin chìa khóa của chúng vẫn rất cần thiết và có ý nghĩa.

111

KẾT LUẬN VÀ KIẾN NGHỊ

KẾT LUẬN

1. Sử dụng hệ thống Illumina HiseqTM platform đã giải trình tự DNA metagenome

vi sinh vật suối nước nóng Bình Châu và xây dựng được bộ dữ liệu DNA

metagenome tinh sạch gồm 9,4 GB. Qua phân tích đã xác định được đa dạng vi

sinh vật và các gen mã hóa cho cellulase. Cụ thể, phân loại học vi sinh vật gồm

41 ngành, 57 lớp, 128 bộ, 245 họ, 825 chi và 2.250 loài khác nhau; còn bộ dữ

liệu về các gen mã hóa cho cellulase gồm 82 trình tự mã hóa cho endoglucanase,

exoglucanase và β-glucosidase.

2. Dựa vào các phần mềm tin sinh học đã lựa chọn được 2 trình tự gen

denovogenes_18736 và denovogenes_32768 có độ tương đồng lần lượt là

50,35% và 53,94% so với các gen mã hóa cho cellulase trong GenBank và hai

gen này đã được đăng ký trong GenBank với mã số lần lượt là QAU55420.1 và

QAU55422.1. Đã biểu hiện và tinh sạch được 2 enzyme tái tổ hợp

endoglucanase và β-glucosidase. Enzyme tái tổ hợp endoglucanase và β-

glucosidase sau tinh sạch có hoạt tính riêng đạt lần lượt là 2,81 U/mg và 0,67

U/mg.

3. Đã xác định được các tính chất của enzyme cellulase tái tổ hợp là các enzyme

ưa nhiệt và kiềm tính:

- Endoglucanase tái tổ hợp: pHopt 10; Topt 55ºC; ion Ca2+ và Na+ làm

tăng hoạt tính enzyme, nửa chu kỳ sống của enzyme ở 55oC là 25,16

giờ. Cơ chất phù hợp cho enzyme là CMC và bột giấy. Động học

enzyme khi sử dụng CMC làm cơ chất cho giá trị Km là 1 mg/ml và

Vmax đạt 90,59 μmol/min/ml.

- β-glucosidase tái tổ hợp: pHopt 8,5; Topt 55ºC; ion Li+ có tác dụng làm

tăng hoạt tính enzyme lên 25,5 lần. Nửa chu kỳ sống của enzyme ở

55oC là 11 ngày. Enzyme có chỉ số Km 0,66 mM và Vmax đạt 81,81

μmol/min/mg.

112

KIẾN NGHỊ

1. Tiếp tục khai thác các enzyme thủy phân lignocellulose khác trong bộ dữ liệu

DNA metagenome suối nước nóng Bình Châu để tạo cocktail enzyme.

2. Đánh giá hiệu quả thủy phân một số loại sinh khối cellulose của 2 loại enzyme

tái tổ hợp.

113

NHỮNG CÔNG TRÌNH CỦA TÁC GIẢ ĐÃ CÔNG BỐ

LIÊN QUAN ĐẾN ĐỀ TÀI

1. Trần Thanh Thủy, Lại Thị Hồng Nhung, Trần Đình Mấn, Lê Thị Thanh Xuân,

Nguyễn Kim Thoa (2019) Một số điều kiện ảnh hưởng đến quá trình biểu hiện

gen mã hóa endoglucanase từ DNA metagenome của suối nước nóng Bình Châu

trong Escherichia coli. Tạp chí Sinh học 41(2): 111–118.

2. Trần Thanh Thủy, Lại Thị Hồng Nhung, Lê Thị Thanh Xuân, Nguyễn Kim

Thoa (2019) Nâng cao hiệu quả biểu hiện β-glucosidase tái tổ hợp từ trình tự gen

trong cơ sở dữ liệu Metagenomic suối nước nóng Bình Châu. Tạp chí Công nghệ

Sinh học 17(3): 545-551.

3. Thanh Thuy Tran, Ngoc Lan Nguyen, Van Tung Nguyen, Dinh Man Tran, Huy

Hoang Nguyen, Kim Thoa Nguyen (2021) Analysis of microbial communities in

Binh Chau hot spring through metagenomic DNA sequencing. Vietnam Journal

of Biotechnology (in preparation).

114

TÓM TẮT LUẬN ÁN BẰNG TIẾNG ANH

1. Thesis’s title:

Investigation of microbial diversity as well as selection, expression and

determination of cellulase properties obtained from Binh Chau hot spring, Vietnam

by Metagenomics technique.

2. Introduction

Cellulases are a complex enzyme system comprising of endo-1,4-β-D-

glucanase (endoglucanase, EC 3.2.1.4), exo-1,4-β-D-glucanase (exoglucanase, EC

3.2.1.91) and β-D-glucosidase (β-D-glucoside glucanhydrolase, EC 3.2.1.21).

Cellulases are produced by molds, bacteria, archaea, protozoa, plants and animals.

Cellulases have been widely applied in food industry, alcohol fermentation, animal

feed, textile, laundry, pulp and paper industry. As fossil fuel resources are gradually

exhausted, the demand for alternative, renewable and eco- friendly environment energy

sources is increasing. One of the most interesting alternative energy sources is the

biofuel from lignocellulose biomass. The conversion of lignocellulose biomass into

valuable products such as biofuels, bioplastics and other tectonic chemical clusters

must undergo special conditions such as high temperatures, alkaline/acid pretreatment,

etc. Therefore, the scientists have concentrated to discover novel cellulases that resist

to harsh conditions such as thermostable, high pressure resistance, resistance of

high/low pH, which facility the requirements of lignocellulose metabolism and lowers

production costs.

One of the most promising sources for the thermostable cellulases is

thermophilic microorganisms in hot springs. However, isolation and culturing

microorganisms could not fully discover the potential of genetic material and

enzymes due to approximately 99% of the microorganisms are uncultivable.

Moreover, the microorganism density in the hot spring is much lower than in other

normal environments, therefore, it is difficult to exploit microorganism genetic

resources by culturing. Nowadays, metagenomics is actually a powerful tool for

discover microbial communities and novel enzymes. Based on the metagenome

database and bioinformatics analysis tools, the properties of potential proteins are

able to predicted.

115

Thermophiles and their cellulases from hot springs in Vietnam has been

reported in a few previous studies using conventional techniques. No sustained

research has focused on microbial diversity and novel cellulases using metagenomics

approach. The aims of this study were not only assessing the microbial diversity but

also mining novel genes that encoding to cellulase from the results of sequencing

DNA metagenome of Binh Chau hot spring microbial.

3. Materials and Methods

Materials

- Water and mud samples were collected from the Binh Chau hot springs.

- Bacterial strains: Escherichia coli TOP10F' (Thermo Fisher Scientific), E. coli

JM109 (DE3) (Promega) and E. coli C43 (DE3) (Lucigen).

- [denovovenes] _18736 encoding for endoglucanase and [denovovenes]

_32768 encoding for β-glucosidase.

- Vector pET17b (Novagen). Vectors pJET1.2_18736 and pJET1.2_32768

(PhuSa Biochem). Restriction enzymes: NdeI and HindIII (NEB) and T4 DNA

ligases (Thermo Fisher Scientific). Kit: Kit PowerWater® DNA Isolation (MO BIO),

Kit PowerMax® Soil DNA Isolation (MO BIO), PCR purification kit (GeneJet PCR

purification kit - Thermo Fisher Scientific), plasmid extraction kit (GeneJet Plasmid

Miniprep Kit - Thermo Fisher Scientific) and key chemicals: Carboxymethyl

cellulose (low viscosity, Sigma: C5678), DNSA, glucose, p-nitrophenol, p-

nitrophenyl-β-glucopyranoside (pNPG) (Sigma Aldrich), IPTG and other common

chemicals used in molecular biology, biochemistry and microbial culture.

Methods

- Metagenome DNA extraction and sequencing: metagenome DNAs of Binh

Chau hot spring’s water and mud samples were extracted by using Kit PowerWater®

Bead Tube and PowerMax® Soil DNA Isolation (MO BIO), respectively. The two

metagenome DNA samples were mixed with the volume ratio of 1:1 before

sequencing in Illumina HiSeqTM platform system in BGI Co., Ltd (HongKong).

- Analysis data metagenome DNA sequencing and selection genes encoding

cellulase: Qualified sequencing data produced by Illumina platform was processed

116

and assembled de novo using SOAPdenovo2 and Rabbit. MetaGenMark was then

used to predict genes from assembled scaffolds. The gene catalogs were blasted

against the public databases, including nr, Swiss-Prot, KEGG and CAZy (blast, e-

value<0.00001), retrieving proteins with the highest sequence similarity with the

given genes along with their protein functional annotations. Taxonomic assignment

was performed using nr annotation and MEGAN. The genes encoding novel cellulase

were selected by The melting temperature of ORFs was predicted using Tm predictor

website (http://tm.life.nthu.edu.tw/). Discriminating between Acidic and Alkaline

Enzymes was performed using AcalPred website (http://lin-

group.cn/server/AcalPred). The selected gene sequences encoding cellulase enzyme

were synthesized in pJET1.2 cloning vector by PhuSa Biochem Co., Ltd.

- Structure modeling: The peptide sequences of denovogenes_18736 and

denovogenes_32768 were submitted to the automated comparative protein modeling

server SwissModel (http://swissmodel.expasy.org/) to build up the 3D structures.

- Design of expression vector for denovogenes_18736 and denovogenes_32768

The denovogenes_18736 and denovogenes_32768 genes were amplified

respectively from pJET1.2_18736 and pJET1.2_32768 cloning vector and then

purified by using GeneJET PCR Purification Kit (Thermo Fisher Scientific). Both of

purified PCR products were digested with enzyme NdeI and HindIII, ligated into the

vector pET-17b in the corresponding sites and transformed into E. coli Top10F’. The

degenerated plasmids were named pET17b_18736 and pET17b_32768, which had a

6 His-tag at the C-terminus of denovogenes_18736 and denovogenes_32768 genes.

The plasmids were extracted and digested with enzyme NdeI and HindIII and then

sequenced.

- Investigation of recombinant protein expression

To improve the expression efficiency of endoglucanase encoded by gene

denovogenes_18736 and β-glucosidase encoded by gene denovogenes_32768,

several factors such as host strains, medium culture, IPTG concentration and aeration

were investigated.

117

- Enzyme activity assay

The endoglucanase activity was assayed according to the method of Ghose

(1987) with a minor modification using CMC as a substrate. The reaction was carried

out by adding 500 μl of diluted enzyme extraction into 500 μl of 1% (w/v) CMC

substrate in 100 mM Tris buffer (pH 10) and incubated at 55°C for 30 min. The total

amount of reducing sugar was measured by the DNS method (Miller 1959). One unit

of enzyme was defined as the amount of enzyme which could release 1 μM of

reducing sugar per minute under assay conditions.

The β-glucosidase activity was assayed according to the method of Shi et al.

(2017), with a minor modifications using pNPG as a substrate. A reaction mixture

containing 500 μl of diluted enzyme, 500 μl of 20 mM pNPG substrate and 1,000 µl

of 50 mM Tris buffer (pH 8.5) were incubated at 55°C for 15 min. Then, the reaction

was stopped with 2,000 μl of 200 mM Na2CO3. The p-NP released in the reaction was

determined by the appearance of yellow color and monitoring at 400 nm in

spectrophotometer (Epoch, Bio Tek Instruments, Inc., Winooski, VT, USA). One unit

of enzyme was defined as the amount of enzyme which could releas 1 µM of p-NP

from p-NPG per minute under assay conditions.

- Enzyme purification

The enzyme was purified with IMAC column under the cold condition (4ºC).

The recombinant protein was eluted with 200 – 250 mM imidazole in B buffer. The

protein concentration was assayed according to the method of Bradford (1976). SDS-

PAGE was performed with stacking gel (5% w/v acrylamide) and separating gel (12%

w/v acrylamide) under denature conditions. Zymogram analysis of endoglucanase

and β-glucosidase were carried out using the modified method of Sharma and

Guptasarma (2017) and Neddersen and Elleuche (2015), respectively.

- Biochemical characterizations of recombinant endoglucanase and β-

glucosidase

The optimal temperature and pH, the thermal and pH stability, the effects of

metal ions, substrate specificity and kinetic parameters of recombinant enzymes were

investigated.

118

4. Main results

Binh Chau hot spring located in the Ba Ria – Vung Tau province. This is

considered as the second highest temperature hot spring in Vietnam with

temperatures ranging from 45°C to 82°C and the pH ranging from 7.5 to 7.7. The

metagenome of the Binh Chau hot spring was extracted and sequenced using Illumina

technology. A total of approximately 10.4 Gbp of raw data was purified to produce

9.4 Gbp of clean data. Reads were assembled into 51,346 contigs with a total length

of 172,103,446 bp. Metagenomic binning resulted in 156,093 ORFs.

The microbial community of the Binh Chau hot spring was dominant with

bacteria and archaea and consisted 41 phyla, 57 classes, 128 orders, 245 families, 825

genera and 2,250 different species. The dominant bacteria phyla were Proteobacteria,

Firmicutes, Cyanobacteria, Bacteroidetes, Planctomycetes and Actinobacteria. The

dominant archaea phyla were Thaumarchaeota and Euryarchaeota. Furthermore,

functional annotation using available database: nr, Swiss-Prot, CAZy and KEGG

revealed dynamic potential of hot spring community in terms of metabolism,

environmental information processing, cellular processes and other important

aspects. Most abundant CAZy-associated genes in the Binh Chau hot spring

metagenome were related to glycosyl transferase families GTs (1,633 ORFs) and

glycoside hydrolases families GHs (732 ORFs). In total, we obtained 82 putative

cellulase – encoding ORFs. These ORFs were identified and classified within the

family of GH1, GH3, GH5, GH6, GH8 and GH94.

The aim of metagenomics analysis of the Binh Chau hot spring was to discover

new genes encoding for cellulases. The candidate genes were complete ORFs

encoding for putative cellulose hydrolytic enzymes and satisfied the following

criteria: (i) a length of the sequences about 1200 - 1600 bp; (ii) sharing 50 - 70%

identity with available cellulase sequences deposited in GenBank; (iii) Tm prediction

≥ 55°C; (iv) prediction as an alkaline or acidic enzyme.

Among 5 putative cellulase – encoding complete ORFs, we selected two target

sequences (denovogenes_18736 and denovogenes_32768), which showed low

similarity with those cellulase sequences deposited in GenBank.

119

Denovogenes_18736 showed 50,35% identity with endoglucanase of bacterium JGI

053 (GenBank accession no. SOD03652.1) and 49.31 % identity with endoglucanase

of Polyangium fumosum (GenBank accession no. WP_136936398.1).

Denovogenes_32768 showed 53.94% identity with a β-glucosidase from

Parcubacteria group bacterium (GenBank accession no. KKT80126.1).

Denovogenes_18736 has a length of 1506 bp and encodes for 501 amino acids.

While the length of denovogenes_32768 is 1224 bp and encodes for 407 amino acids.

The optimal temperature of both genes was predicted at ≥ 55ºC. Sequence-based

screening revealed denovogenes_18736 representing a novel endoglucanase-

encoding gene and denovogenes _32768 representing a novel β-glucosidase-

encoding gene. The nucleotide sequences of denovogenes_18736 and

denovogenes_32768 were deposited in GenBank under accession no. QAU55420.1

and QAU55422.1.

Denovogenes_18736 and denovogenes_32768 were successfully ligated into

pET-17b expression vector for generated plasmids (pET-17b_18736 and pET-

17b_32768) and subsequently transformed into E. coli Top10F’. Investigation of the

factors affect recombinant protein expression revealed that the E. coli C43(DE3) was

the best host for expression of pET17b_18736 and pET17b_32768. In addition, the

optimal conditions for growth and enzyme production of recombinant E. coli

C43(DE3) were determined, including the culturing on TB medium at 30ºC with 0.25

mM of IPTG as inducer, the culture volume of 20% compared with the bottle volume

and the expression time is 42–48 hours. In these conditions, the biomass production

and recombinant enzyme activity of E. coli C43(DE3) carrying pET17b_18736

reached up to 5.54–5.58 g /L and 1.92–1.98 U/mL, respectively. The biomass

production and recombinant enzyme activity of the strain E. coli C43(DE3) carrying

pET17b_32768 reached at 8.21 - 8.26 g/L and 0.33 – 0.34 U/ml, respectively.

Two recombinant cellulases were subsequently purified by immobilized metal

ion affinity chromatography (IMAC). The purified target proteins were observed at

the position of 55 kDa and 50 kDa in SDS-PAGE, which were identical to the

120

molecular masses of the recombinant [denovogenes] _18736 and [denovogenes]

_32768. The result of purification also shown that the recovery yield of recombinant

[denovogenes] _18736 and [denovogenes] _32768 reached at approximately 83 and

87% compared with before purification. Where upon it had a specific activity of up

to 2.81 U/mg and 0.67 U/mg. Furthermore, the biochemical characterization of the

purified recombinant enzymes (endoglucanase encoded by [denovogenes] _18736

and β-glucosidase encoded by [denovogenes] _32768) were performed using CMC

substrate for endoglucanase activity and pNPG substrate for β-glucosidase. Both of

recombinant enzymes are thermostable and alkaline stable. Maximal endoglucanase

and β-glucosidase activity were observed at 55ºC. The recombinant enzymes active

over a broad pH range (pH: 3-12 for endoglucanase and pH: 4-9 for β-glucosidase).

However, the optimal pH for endoglucanase and β-glucosidase occurred at pH 10 and

pH 8,5, respectively. Endoglucanase activity was enhanced by presence of 15 mM

Ca2+, while β-glucosidase activity was enhanced by presence of 10 mM Li+.

Recombinant enzymes remained its activity at 55°C and its half-life has been shown

about 25 hours (for endoglucanase) and 11 days (for β-glucosidase). The substrate

for endoglucanase is CMC and pulp, and the substrate for β-glucosidase is pNPG.

Moreover, kinetic parameters of endoglucanase, Km and Vmax were determined as

1 mg/ml and 90,59 μmol/min/ml using CMC substrate. For β-glucosidase, the

apparent Km and Vmax values toward pNPG were 0,66 mM and 81,81 μmol/min/mg,

respectively. With thermostable and alkaline stable, recombinant endoglucanase

encoded by [denovogenes] _18736 and β-glucosidase encoded by [denovogenes]

_32768 not only are the most alkaline stable enzymes known to date but also have

the potential to be used in the treatment of cellulose for biofuel production.

5. Conclusion and future perspectives

This is the first study on investigating of microbial diversity and mining novel

genes encoding potential lignocellulose hydrolytic enzymes from the BinhChau hot

spring - the second highest hot spring in Vietnam. The microbial communities of the

BinhChau hot spring revealed high diversity with 41 phyla, 57 classes, 128 orders,

121

families, 825 genera and 2,250 species. Addition, we found two novel cellulase

encoding genes (denovogenes_18736 encoding for endoglucanase and

denovogenes_32768 encoding for β-glucosidase) from metagenomes. Furthermore,

the recombinant cellulases were functionally expressed in Escherichia coli and

characterized. The recombinant enzymes were determined as thermostable and

alkaline cellulases. The optimal temperature and pH for the recombinant

denovogenes_18736 and denovogenes_32768 were 55ºC and pH 10 and 55ºC and pH

8.5, respectively. At the optimal conditions, the half-life of the recombinant

denovogenes_18736 and denovogenes_32768 were 25 hours and 11 days,

respectively. These two novel cellulases might be promising candidates for

degradation of cellulosic biomass under harsh conditions.

122

TÀI LIỆU THAM KHẢO

1. Acharya S and Chaudhary A (2012) Bioprospecting thermophiles for cellulase

production: a review. Braz J Microbiol 43(3): 844-856.

2. Ahmed SS, Akhter M, Sajjad M and Gul R (2019) Soluble Production,

Characterization, and Structural Aesthetics of an Industrially Important

Thermostable beta-Glucosidase from Clostridium thermocellum in Escherichia

coli. Biomed Res Int 2019: 9308593.

3. Al-Batayneh K, Jacob J and Hussein E (2011) Isolation and Molecular

Identification of New Thermophilic Bacterial Strains of Geobacillus pallidus

and Anoxybacillus flavithermus. Int J Integr Biol 11: 39-43.

4. Alain K, Postec A, Grinsard E, Lesongeur F, Prieur D and Godfroy A (2010)

Thermodesulfatator atlanticus sp. nov., a thermophilic, chemolithoautotrophic,

sulfate-reducing bacterium isolated from a Mid-Atlantic Ridge hydrothermal

vent. Int J Syst Evol Microbiol 60(Pt 1): 33-38.

5. Amin A, Ahmed I, Khalid N, Zhang Y, Xiao M and Li WJ (2018) Insights into

the Thermophile Diversity in Hot Springs of Pakistan. Extremophiles in

Eurasian Ecosystems: Ecology, Diversity, and Applications. Microorganisms

for Sustainability. Egamberdieva D., Panosyan H., Li WJ. (eds) Springer,

Singapore 8: 1-28.

6. Armenteros JJA, Tsirigos KD, Sønderby CK, Petersen TN, Winther O, Brunak

S, von Heijne G and Nielsen H (2019) SignalP 5.0 improves signal peptide

predictions using deep neural networks. Nature Biotechnology 37(4): 420-423.

7. Azadian F, Badoei Dalfard A, Namaki-Shoushtari A, Karami Z and

Hassanshahian M (2017) Production and characterization of an acido-

thermophilic, organic solvent stable cellulase from Bacillus sonorensis HSC7 by

conversion of lignocellulosic wastes. J Genet Eng Biotechnol 15(1): 187-196.

8. Bashirova A, Pramanik S, Volkov P, Rozhkova A, Nemashkalov V, Zorov I,

Gusakov A, Sinitsyn A, Schwaneberg U and Davari MD (2019) Disulfide Bond

Engineering of an Endoglucanase from Penicillium verruculosum to Improve

Its Thermostability. Int J Mol Sci. 2019 Mar 30 20(7): 1602.

123

9. Bauer MW, Driskill LE, Callen W, Snead MA, Mathur EJ and Kelly RM (1999)

An endoglucanase, EglA, from the hyperthermophilic archaeon Pyrococcus

furiosus hydrolyzes beta-1,4 bonds in mixed-linkage (1-->3),(1-->4)-beta-D-

glucans and cellulose. J Bacteriol 181(1): 284-290.

10. Biver S, Stroobants A, Portetelle D and Vandenbol M (2014) Two promising

alkaline beta-glucosidases isolated by functional metagenomics from

agricultural soil, including one showing high tolerance towards harsh

detergents, oxidants and glucose. J Ind Microbiol Biotechnol 41(3): 479-488.

11. Bok JD, Yernool DA and Eveleigh DE (1998) Purification, characterization,

and molecular analysis of thermostable cellulases CelA and CelB from

Thermotoga neapolitana. Appl Environ Microbiol 64(12): 4774-4781.

12. Bolger AM, Lohse M and Usadel B (2014) Trimmomatic: a flexible trimmer

for Illumina sequence data. Bioinformatics 30(15): 2114-2120.

13. Bradford MM (1976) A rapid and sensitive method for the quantitation of

microgram quantities of protein utilizing the principle of protein-dye binding.

Anal Biochem 72(1): 248-254.

14. Bush MF, Oomens J, Saykally RJ and Williams ER (2008) Effects of Alkaline

Earth Metal Ion Complexation on Amino Acid Zwitterion Stability: Results

from Infrared Action Spectroscopy. J Am Chem Soc 130(20): 6463-6471.

15. Cano-Ramirez C, Santiago-Hernandez A, Rivera-Orduna FN, Garcia-Huante Y,

Zuniga G and Hidalgo-Lara ME (2016) Expression, purification and

characterization of an endoglucanase from Serratia proteamaculans CDBB-

1961, isolated from the gut of Dendroctonus adjunctus (Coleoptera: Scolytinae).

AMB Express 6(1): 63.

16. Cao P, Wang L, Wang Y, Zhou N and Chen Y (2015) Alkali-tolerant β-

glucosidase produced by newly isolated Aspergillus fumigatus WL002 from

rotten wood. Int Biodeterior Biodegradation 105: 276-282.

17. Ceroni A, Passerini A, Vullo A and Frasconi P (2006) DISULFIND: a disulfide

bonding state and cysteine connectivity prediction server. Nucleic Acids Res

34(Web Server issue): W177-181.

124

18. Chan CS, Chan KG, Tay YL, Chua YH and Goh KM (2015) Diversity of

thermophiles in a Malaysian hot spring determined using 16S rRNA and

shotgun metagenome sequencing. Front Microbiol 6: 177.

19. Chew YM, Lye S, Md. Salleh M and Yahya A (2018) 16S rRNA metagenomic

analysis of the symbiotic community structures of bacteria in foregut, midgut, and

hindgut of the wood-feeding termite Bulbitermes sp. Symbiosis 76(2): 187-197.

20. Chu Hoàng Hà (2014-2018). Đề tài: "Nghiên cứu metagenome của vi sinh vật

trong các đầm nuôi tôm góp phần tạo cơ sở khoa học để phát triển nghề nuôi

tôm ở Việt Nam". Mã số: Mã số: ĐTĐLCN.16/14.

21. Culligan EP, Sleator RD, Marchesi JR and Hill C (2014) Metagenomics and

novel gene discovery: promise and potential for novel therapeutics. Virulence

5(3): 399-412.

22. Czjzek M, Cicek M, Zamboni V, Bevan DR, Henrissat B and Esen A (2000)

The mechanism of substrate (aglycone) specificity in β-glucosidases is revealed

by crystal structures of mutant maize β-glucosidase-DIMBOA, -DIMBOAGlc,

and dhurrin complexes. Proc Natl Acad Sci U S A 97(25): 13555-13560.

23. Đặng Thị Cẩm Hà (2014-2017). Đề tài: "Nghiên cứu metagenome của vi sinh

vật vùng đất ô nhiễm chất diệt cỏ/dioxin nhằm tìm kiếm các gene, enzyme mới

có khả năng phân hủy dioxin". Mã số: ĐTĐLCN.13/14.

24. Davies G and Henrissat B (1995) Structures and mechanisms of glycosyl

hydrolases. Structure 3(9): 853-859.

25. Deckert G, Warren PV, Gaasterland T, Young WG, Lenox AL, Graham DE,

Overbeek R, Snead MA, Keller M, Aujay M, Huber R, Feldman RA, Short JM,

Olsen GJ and Swanson RV (1998) The complete genome of the

hyperthermophilic bacterium Aquifex aeolicus. Nature 392(6674): 353-358.

26. Dereeper A, Audic S, Claverie J-M and Blanc G (2010) BLAST-EXPLORER

helps you building datasets for phylogenetic analysis. BMC evolutionary

biology 10: 8.

125

27. Dhillon GS, Kaur S, Brar SK and Verma M (2012) Potential of apple pomace

as a solid substrate for fungal cellulase and hemicellulase bioproduction through

solid-state fermentation. Ind Crops Prod 38: 6-13.

28. Dias R, Silva LCF, Eller M, Oliveira V, De Paula S and Silva C (2014)

Metagenomics: Library construction and screening methods: 45-65.

29. Diaz NN, Krause L, Goesmann A, Niehaus K and Nattkemper TW (2009)

TACOA – Taxonomic classification of environmental genomic fragments using

a kernelized nearest neighbor approach. BMC Bioinformatics 10(1): 56.

30. Dinh Kha Trinh, Dinh Thi Quyen, Thi Tuyen Do and Ngoc Minh Nghiem

(2013) Purification and characterization of a novel detergent- and organic

solvent-resistant endo-beta-1,4-glucanase from a newly isolated basidiomycete

Peniophora sp. NDVN01. Turkish Journal of Biology 37: 337-384.

31. Dinsdale EA, Pantos O, Smriga S, Edwards RA, Angly F, Wegley L, Hatay M,

Hall D, Brown E, Haynes M, Krause L, Sala E, Sandin SA, Thurber RV, Willis

BL, Azam F, Knowlton N and Rohwer F (2008) Microbial ecology of four coral

atolls in the Northern Line Islands. PloS one 3(2): e1584-e1584.

32. Đỗ Thị Huyền (2014-2017). Đề tài: "Nghiên cứu metagenome của một số hệ sinh

thái mini tiềm năng nhằm khai thác các gen mới mã hóa hệ enzyme chuyển hóa

hiệu quả lignocellulose”, mã số ĐTĐLCN.15/14, Bộ Khoa học và Công nghệ.

33. Duan CJ and Feng JX (2010) Mining metagenomes for novel cellulase genes.

Biotechnol Lett 32(12): 1765-1775.

34. Endo K, Hakamada Y, Takizawa S, Kubota H, Sumitomo N, Kobayashi T and

Ito S (2001) A novel alkaline endoglucanase from an alkaliphilic Bacillus

isolate: enzymatic properties, and nucleotide and deduced amino acid

sequences. Appl Microbiol Biotechnol 57(1): 109-116.

35. Escuder-Rodríguez JJ, DeCastro ME, Cerdán ME, Rodríguez-Belmonte E,

Becerra M and González-Siso MI (2018) Cellulases from Thermophiles Found

by Metagenomics. Microorganisms 6(3): 66.

36. Ge H, Chu Y and Zhang G (2017) Insight into the mechanism of protein

thermostability based on the residue interaction degrees. bioRxiv: 135319.

126

37. Ghose T (1987) Measurement of cellulase activities. Pure and Applied

Chemistry 59: 257-268.

38. Graham JE, Clark ME, Nadler DC, Huffer S, Chokhawala HA, Rowland SE,

Blanch HW, Clark DS and Robb FT (2011) Identification and characterization of

a multidomain hyperthermophilic cellulase from an archaeal enrichment. Nat

Commun 2: 375.

39. Gromiha MM, Nagarajan R and Selvaraj S (2019) Protein Structural

Bioinformatics: An Overview. Encyclopedia of Bioinformatics and

Computational Biology. S. Ranganathan, M. Gribskov, K. Nakai and C.

Schönbach. Oxford, Academic Press: 445-459.

40. Gromiha M, Pathak M, Kadhirvel S, Ortlund E and Gaucher E (2013)

Hydrophobic environment is a key factor for the stability of thermophilic

proteins. Proteins 81.

41. Gupta P, Mishra A and Vakhlu J (2017) Cloning and characterization of thermo-

alkalistable and surfactant stable endoglucanase from Puga hot spring

metagenome of Ladakh (J&K). Int J Biol Macromol 103(870-877).

42. Gurevich A, Saveliev V, Vyahhi N and Tesler G (2013) QUAST: quality

assessment tool for genome assemblies. Bioinformatics (Oxford, England)

29(8): 1072-1075.

43. Haakana H, Miettinen-Oinonen A, Joutsjoki V, Mäntylä A, Suominen P and

Vehmaanperä J (2004) Cloning of cellulase genes from Melanocarpus

albomyces and their efficient expression in Trichoderma reesei. Enzyme

Microb. Technol 34(2): 159-167.

44. Hahn M, Koll U and Schmidt J (2019) Isolation and Cultivation of Bacteria,

Springer, Cham: 313-351.

45. Hall J, Black GW, Ferreira LM, Millward-Sadler SJ, Ali BR, Hazlewood GP

and Gilbert HJ (1995) The non-catalytic cellulose-binding domain of a novel

cellulase from Pseudomonas fluorescens subsp. cellulosa is important for the

efficient hydrolysis of Avicel. Biochem J 309 ( Pt 3)(Pt 3): 749-756.

46. Hamberg Y, Ruimy-Israeli V, Dassa B, Barak Y, Lamed R, Cameron K, Fontes

CMGA, Bayer EA and Fried DB (2014) Elaborate cellulosome architecture of

127

Acetivibrio cellulolyticus revealed by selective screening of cohesin-dockerin

interactions. PeerJ 2: e636-e636.

47. Handelsman J, Rondon MR, Brady SF, Clardy J and Goodman RM (1998)

Molecular biological access to the chemistry of unknown soil microbes: a new

frontier for natural products. Chem Biol 5(10): R245-249.

48. Handley K and Lloyd J (2013) Biogeochemical implications of the ubiquitous

colonization of marine habitats and redox gradients by Marinobacter species.

Front Microbiol 4(136).

49. Haney P, Konisky J, Koretke KK, Luthey-Schulten Z and Wolynes PG (1997)

Structural basis for thermostability and identification of potential active site

residues for adenylate kinases from the archaeal genus Methanococcus. Proteins

28(1): 117-130.

50. Heath C, Hu XP, Cary SC and Cowan D (2009) Identification of a novel

alkaliphilic esterase active at low temperatures by screening a metagenomic

library from antarctic desert soil. Appl Environ Microbiol 75(13): 4657-4659.

51. Hebditch M, Carballo-Amador MA, Charonis S, Curtis R and Warwicker J

(2017) Protein–Sol: a web tool for predicting protein solubility from sequence.

Bioinformatics 33(19): 3098-3100.

52. Helbert W, Poulet L, Drouillard S, Mathieu S, Loiodice M, Couturier M,

Lombard V, Terrapon N, Turchetto J, Vincentelli R and Henrissat B (2019)

Discovery of novel carbohydrate-active enzymes through the rational exploration

of the protein sequences space. Proc Natl Acad Sci U S A 116(13): 6063-6068.

53. Hobel CF, Marteinsson VT, Hreggvidsson GO and Kristjansson JK (2005)

Investigation of the microbial ecology of intertidal hot springs by using diversity

analysis of 16S rRNA and chitinase genes. Appl Environ Microbiol 71(5): 2771-2776.

54. Hsieh CWC, Cannella D, Jørgensen H, Felby C and Thygesen LG (2015)

Cellobiohydrolase and endoglucanase respond differently to surfactants during

the hydrolysis of cellulose. Biotechnol Biofuels 8: 52-52.

55. http://www.cazy.org.

56. https://prosite.expasy.org/.

128

57. https://swissmodel.expasy.org/interactive.

58. https://www.freedoniagroup.com/Brochure/FocusReports/bFW35117.pdf.

59. https://www.sciencebuddies.org/science-fair-projects/references/genomics-g-

c-content-calculator.

60. Huang X, Shao Z, Hong Y, Lin L, Li C, Huang F, Wang H and Liu Z (2010)

Cel8H, a novel endoglucanase from the halophilic bacterium Halomonas sp.

S66-4: Molecular cloning, heterogonous expression, and biochemical

characterization. J Microbiol 48(3): 318-324.

61. Huang Y, Krauss G, Cottaz S, Driguez H and Lipps G (2005) A highly acid-

stable and thermostable endo-beta-glucanase from the thermoacidophilic

archaeon Sulfolobus solfataricus. Biochem J 385(Pt 2): 581-588.

62. Huber R, Eder W, Heldwein S, Wanner G, Huber H, Rachel R and Stetter KO

(1998) Thermocrinis ruber gen. nov., sp. nov., A pink-filament-forming

hyperthermophilic bacterium isolated from yellowstone national park. Appl

Environ Microbiol 64(10): 3576-3583.

63. Huber R, Langworthy TA, König H, Thomm M, Woese CR, Sleytr UB and

Stetter KO (1986) Thermotoga maritima sp. nov. represents a new genus of

unique extremely thermophilic eubacteria growing up to 90°C. Arch Microbiol

144(4): 324-333.

64. Huber R, Wilharm T, Huber D, Trincone A, Burggraf S, König H, Reinhard R,

Rockinger I, Fricke H and Stetter KO (1992) Aquifex pyrophilus gen. nov. sp.

nov., Represents a Novel Group of Marine Hyperthermophilic Hydrogen-

Oxidizing Bacteria. Syst Appl Microbiol 15(3): 340-351.

65. Huson DH, Auch AF, Qi J and Schuster SC (2007) MEGAN analysis of

metagenomic data. Genome Res 17(3): 377-386.

66. Hussein EI, Jacob JH, Shakhatreh MAK, Abd Al-Razaq MA, Juhmani ASF and

Cornelison CT (2017) Exploring the microbial diversity in Jordanian hot springs

by comparative metagenomic analysis. MicrobiologyOpen 6(6): e00521.

67. Itoh T, Suzuki K and Nakase T (2002) Vulcanisaeta distributa gen. nov., sp. nov.,

and Vulcanisaeta souniana sp. nov., novel hyperthermophilic, rod-shaped

129

crenarchaeotes isolated from hot springs in Japan. Int J Syst Bacteriol 52(4):

1097 - 1104.

68. Itoh T, Suzuki K, Sanchez P and Nakase T (1999) Caldivirga maquilingensis

gen. nov., sp. nov., a new genus of rod-shaped crenarchaeote isolated from a hot

spring in the Philippines. Int J Syst Bacteriol 49(3): 1157 - 1163.

69. Iyo AH and Forsberg CW (1996) Endoglucanase G from Fibrobacter

succinogenes S85 belongs to a class of enzymes characterized by a basic C-

terminal domain. Can J Microbiol 42(9): 934-943.

70. Jayasekara S and Ratnayake R (2019) Microbial Cellulases: An Overview and

Applications.

71. Jensen MS, Fredriksen L, MacKenzie AK, Pope PB, Leiros I, Chylenski P,

Williamson AK, Christopeit T, Østby H, Vaaje-Kolstad G and Eijsink VGH

(2018) Discovery and characterization of a thermostable two-domain GH6

endoglucanase from a compost metagenome. PLOS ONE 13(5): e0197862.

72. Jimenez DJ, Andreote FD, Chaves D, Montana JS, Osorio-Forero C, Junca H,

Zambrano MM and Baena S (2012) Structural and functional insights from the

metagenome of an acidic hot spring microbial planktonic community in the

Colombian Andes. PLoS One 7(12): e52069.

73. Jönsson LJ, Alriksson B and Nilvebrant NO (2013) Bioconversion of

lignocellulose: inhibitors and detoxification. Biotechnol Biofuels 6(1): 16.

74. Juturu V and Wu JC (2014) Microbial cellulases: Engineering, production and

applications. Renewable and Sustainable Energy Reviews 33: 188-203.

75. Kambura AK, Mwirichia RK, Kasili RW, Karanja EN, Makonde HM and Boga

HI (2016) Bacteria and Archaea diversity within the hot springs of Lake Magadi

and Little Magadi in Kenya. BMC Microbiology 16(1): 136.

76. Kang I, Kang D, Oh HM, Kim H, Kim HJ, Kang TW, Kim SY and Cho JC

(2011) Genome sequence of strain IMCC2047, a novel marine member of the

Gammaproteobacteria. J Bacteriol 193(14): 3688-3689.

130

77. Kemp PF and Aller JY (2004) Bacterial diversity in aquatic and other

environments: what 16S rDNA libraries can tell us. FEMS Microbiol Ecol

47(2): 161-177.

78. Ketudat Cairns JR and Esen A (2010) Beta-Glucosidases. Cell Mol Life Sci

67(20): 3389-3405.

79. Khalid NA, Rajandas H, Parimannan S, Croft LJ, Loke S, Chong CS, Bruce NC

and Yahya A (2019) Insights into microbial community structure and diversity

in oil palm waste compost. 3 Biotech 9(10): 364.

80. Kim JO, Park SR, Lim WJ, Ryu SK, Kim MK, An CL, Cho SJ, Park YW, Kim

JH and Yun HD (2000) Cloning and characterization of thermostable

endoglucanase (Cel8Y) from the hyperthermophilic Aquifex aeolicus VF5.

Biochem Biophys Res Commun 279(2): 420-426.

81. Krause L, Diaz NN, Goesmann A, Kelley S, Nattkemper TW, Rohwer F,

Edwards RA and Stoye J (2008) Phylogenetic classification of short

environmental DNA fragments. Nucleic Acids Res 36(7): 2230-2239.

82. Krisch J, Takó M, Papp T and Vágvölgyi C (2010) Characteristics and potential

use of β-glucosidases from Zygomycetes. Current Research; Technology and

Education Topics in Applied Microbiology and Microbial Biotechnology,

Edition: MICROBIOLOGY BOOK SERIES - Number 2, Publisher: Formatex

Research Center, Editors: Méndez-Vilas A.: 891-896.

83. Ku T, Lu P, Chan C, Wang T, Lai S, Lyu P and Hsiao N (2009) Predicting

melting temperature directly from protein sequences. Comput Biol Chem 33(6):

445-450.

84. Kumar S, Stecher G, Li M, Knyaz C and Tamura K (2018) MEGA X: Molecular

Evolutionary Genetics Analysis across Computing Platforms. Molecular

Biology and Evolution 35(6): 1547-1549.

85. Kumar S, Tsai CJ and Nussinov R (2000) Factors enhancing protein

thermostability. Protein Eng 13(3): 179-191.

86. Kwon EJ, Jeong YS, Kim YH, Kim SK, Na HB, Kim J, Yun HD and Kim H

(2010) Construction of a metagenomic library from compost and screening of

131

cellulase- and xylanase-positive clones. J Korean Soc Appl Biol Chem 53(6):

702-708.

87. Laemmli UK (1970) Cleavage of structural proteins during the assembly of the

head of bacteriophage T4. Nature 227(5259): 680-685.

88. Langmead B and Salzberg SL (2012) Fast gapped-read alignment with Bowtie

2. Nat Methods 9(4): 357-359.

89. Larkin M, Blackshields G, Brown N, Chenna R, McGettigan P, McWilliam H,

Valentin F, Wallace I, Wilm A, Lopez R, Thompson J, Gibson T and Higgins D

(2007) Clustal W and Clustal X version 2.0. Bioinformatics 23(21): 2947-2948.

90. Le Costaouëc T, Pakarinen A, Várnai A, Puranen T and Viikari L (2013) The

role of carbohydrate binding module (CBM) at high substrate consistency:

Comparison of Trichoderma reesei and Thermoascus aurantiacus Cel7A

(CBHI) and Cel5A (EGII). Bioresour Technol 143: 196-203.

91. Lê Mai Hương (2014-2017). Đề tài: Nghiên cứu metagenome vi sinh vật đất

vùng rễ một số đại diện cây trồng ở Việt Nam: cây thuốc có củ (cây nghệ), cây

công nghiệp (cà phê, lạc) nhằm tăng năng suất và chất lượng cây trồng. Mã số:

ĐTĐLCN. 14/4.

92. Leis B, Heinze S, Angelov A, Pham VT, Thurmer A, Jebbar M, Golyshin PN,

Streit WR, Daniel R and Liebl W (2015) Functional Screening of Hydrolytic

Activities Reveals an Extremely Thermostable Cellulase from a Deep-Sea

Archaeon. Front Bioeng Biotechnol 3: 95.

93. Li W and Godzik A (2006) Cd-hit: a fast program for clustering and

comparing large sets of protein or nucleotide sequences. Bioinformatics

22(13): 1658-1659.

94. Liew KJ, Lim CC, Chan CS, Wei KY, Salleh MM, Sani RK, Chan KG and Goh

KM (2018) Chapter 16 - Direct Cellulase Gene Amplification From Hot Spring

Using the Guidance of 16S rRNA Amplicon Metagenomics. Metagenomics. M.

Nagarajan, Academic Press: 309-325.

95. Lin H, Chen W and Ding H (2013) AcalPred: a sequence-based tool for

discriminating between acidic and alkaline enzymes. PLoS One 8(10): e75726.

132

96. Linhult M, Gulich S, Graslund T, Simon A, Karlsson M, Sjoberg A, Nord K and

Hober S (2004) Improving the tolerance of a protein a analogue to repeated alkaline

exposures using a bypass mutagenesis approach. Proteins 55(2): 407-416.

97. Liu D, Zhang R, Yang X, Zhang Z, Song S, Miao Y and Shen Q (2012)

Characterization of a thermostable beta-glucosidase from Aspergillus fumigatus

Z5, and its functional expression in Pichia pastoris X33. Microb Cell Fact 11: 25.

98. López-López O, Cerdán ME and González-Siso MI (2013) Hot Spring

Metagenomics. Life 3(2): 308-320.

99. Lopez-Mondejar R, Zuhlke D, Becher D, Riedel K and Baldrian P (2016)

Cellulose and hemicellulose decomposition by forest soil bacteria proceeds by

the action of structurally variable enzymatic systems. Sci Rep 6: 25279.

100. Luo R, Liu B, Xie Y, Li Z, Huang W, Yuan J, He G, Chen Y, Pan Q, Liu Y,

Tang J, Wu G, Zhang H, Shi Y, Liu Y, Yu C, Wang B, Lu Y, Han C, Cheung

DW, Yiu SM, Peng S, Xiaoqian Z, Liu G, Liao X, Li Y, Yang H, Wang J, Lam

TW and Wang J (2012) SOAPdenovo2: an empirically improved memory-

efficient short-read de novo assembler. GigaScience 1(1): 18-18.

101. Lý Kim Bảng, Lê Gia Hy, Tăng Thị Chính, Phan Tuyết Minh, Lê Thị Thanh

Xuân, Trần Quang Huy, Đào Ngọc Quang and Phạm Thị Cúc (1999). Sử dụng

vi sinh vật có hoạt tính phân giải cellulose cao để nâng cao chất lượng phân hủy

rác thải sinh hoạt và nông nghiệp. Báo cáo khoa học, Hội nghị Công nghệ Sinh

học toàn quốc, Hà Nội, NXB Khoa học và Kỹ thuật.

102. Mahalik S, Sharma A and Mukherjee K (2014) Genome engineering for

improved recombinant protein expression in Escherichia coli. Microb Cell Fact

13: 177.

103. Malkawi H and Al-Omari M (2010) Culture-dependent and culture-independent

approaches to study the bacterial and archaeal diversity from Jordanian hot

springs. Afr J Microbiol Res 4: 923-932.

104. Marchler-Bauer A, Bo Y, Han L, He J, Lanczycki CJ, Lu S, Chitsaz F,

Derbyshire MK, Geer RC, Gonzales NR, Gwadz M, Hurwitz DI, Lu F, Marchler

133

GH, Song JS, Thanki N, Wang Z, Yamashita RA, Zhang D, Zheng C, Geer LY

and Bryant SH (2017) CDD/SPARCLE: functional classification of proteins via

subfamily domain architectures. Nucleic acids research 45(D1): D200-D203.

105. Mardanov AV, Gumerov VM, Beletsky AV, Perevalova AA, Karpov GA,

Bonch-Osmolovskaya EA and Ravin NV (2011) Uncultured archaea dominate

in the thermal groundwater of Uzon Caldera, Kamchatka. Extremophiles 15(3):

365-372.

106. Marsh CL and Larsen DH (1953) Characterization of some thermophilic

bacteria from the Hot Springs of Yellowstone National Park. J Bacteriol 65(2):

193-197.

107. Mehetre GT, Paranjpe AS, Dastager SG and Dharne MS (2015) Complete

metagenome sequencing based bacterial diversity and functional insights from

basaltic hot spring of Unkeshwar, Maharashtra, India. Genomics data 7: 140-143.

108. Merino N, Aronson HS, Bojanova DP, Feyhl-Buska J, Wong ML, Zhang S and

Giovannelli D (2019) Living at the Extremes: Extremophiles and the Limits of

Life in a Planetary Context. Frontiers in microbiology 10: 780-780.

109. Miller G (1959) Use of Dinitrosalisylic acid reagent for determination of

reducing sugars. Anal Chem 31: 426-428.

110. Miroux B and Walker JE (1996) Over-production of Proteins inEscherichia coli:

Mutant Hosts that Allow Synthesis of some Membrane Proteins and Globular

Proteins at High Levels. J Mol Biol 260(3): 289-298.

111. Mount DW (2004) Bioinformatics: Sequence and Genome Analysis, Cold

Spring Harbor Laboratory Press.

112. Nakagawa S, Shtaih Z, Banta A, Beveridge TJ, Sako Y and Reysenbach AL

(2005) Sulfurihydrogenibium yellowstonense sp. nov., an extremely

thermophilic, facultatively heterotrophic, sulfur-oxidizing bacterium from

Yellowstone National Park, and emended descriptions of the genus

Sulfurihydrogenibium, Sulfurihydrogenibium subterraneum and

Sulfurihydrogenibium azorense. Int J Syst Evol Microbiol 55(Pt 6): 2263-2268.

134

113. Nam KH, Kim SJ, Kim MY, Kim JH, Yeo YS, Lee CM, Jun HK and Hwang

KY (2008) Crystal structure of engineered β-glucosidase from a soil

metagenome. Proteins 73(3): 788-793.

114. Neddersen M and Elleuche S (2015) Fast and reliable production, purification

and characterization of heat-stable, bifunctional enzyme chimeras. AMB Express

5(1): 33.

115. Nguyễn Kim Thoa và Trần Thanh Thủy (2018). Đặc điểm Carboxymethyl

cellulase kiềm của chủng vi khuẩn ưa nhiệt phân lập từ suối nước nóng Bình

Châu. Báo cáo Khoa học. Hội nghị Khoa học Công nghệ Sinh học toàn quốc

2018., Trung tâm Hội nghị Quốc gia Hà Nội, 26 tháng 10 năm 2018., Nhà xuất

bản Khoa học Tự nhiên và Công nghệ: 1230-1235.

116. Nguyễn Kim Thoa, Trần Thanh Thủy, Trần Thị Hoa và Trần Đình Mấn (2015).

Tiềm năng thu nhận enzyme bền nhiệt từ nhóm vi khuẩn phân lập tại suối nước

nóng Bình Châu. Báo cáo Khoa học về Sinh thái và Tài nguyên sinh vật. Hội nghị

Khoa học toàn quốc về Sinh thái và Tài nguyên sinh vật lần thứ 6: 1234-1238.

117. Nguyễn Kim Thoa, Trần Thị Hoa, Trần Đình Mấn và Tạ Thị Thu Thủy (2017)

Nghiên cứu tính chất α-Amylase của các chủng vi khuẩn thuộc chi Geobacillus phân

lập ở suối nước nóng Bình Châu. Tạp chí Công nghệ Sinh học 15(2): 373-380.

118. Nguyễn Thị Kim Cúc (2014-2018). Đề tài: “Nghiên cứu metagenome của vi

sinh vật liên kết hải miên tại biển miền Trung Việt Nam nhằm phát hiện và sàng

lọc các chất hoạt tính sinh học mới”, Mã số: ĐTĐLCN.17/14.

119. Niu C, Zhu L, Xu X and Li Q (2016) Rational Design of Disulfide Bonds

Increases Thermostability of a Mesophilic 1,3-1,4-beta-Glucanase from

Bacillus terquilensis. PLoS One 11(4): e0154036.

120. Panasik N, Brenchley JE and Farber GK (2000) Distributions of structural

features contributing to thermostability in mesophilic and thermophilic

alpha/beta barrel glycosyl hydrolases. Biochim Biophys Acta 1543(1): 189-201.

121. Paul S, Cortez Y, Vera N, Villena G and Gutiérrez-Correa M (2016)

Metagenomic analysis of microbial community of an Amazonian geothermal

spring in Peru. Genomics Data 9.

135

122. Payne CM, Knott BC, Mayes HB, Hansson H, Himmel ME, Sandgren M,

Ståhlberg J and Beckham GT (2015) Fungal Cellulases. Chem Rev 115(3):

1308-1448.

123. Pedron R, Esposito A, Bianconi I, Pasolli E, Tett A, Asnicar F, Cristofolini M,

Segata N and Jousson O (2019) Genomic and metagenomic insights into the

microbial community of a thermal spring. Microbiome 7(1): 8.

124. Pereira J, Giese E, Moretti M, dos Santos AC, Micali Perrone O, Boscolo M,

Da Silva R, Gomes E and Martins D (2017) Effect of metal ions, chemical

agents and organic compounds on lignocellulolytic enzymes activities. Enzyme

Inhibitors and Activators, InTech: 139-164.

125. Perevalova A, Bidzhieva S, Kublanov I, Hinrichs K, Liu X, Mardanov A,

Lebedinsky A and Bonch-Osmolovskaya E (2010) Fervidicoccus fontis gen.

nov., sp. nov., an anaerobic, thermophilic crenarchaeote from terrestrial hot

springs, and proposal of Fervidicoccaceae fam. nov. and Fervidicoccales ord.

nov. Int J Syst Bacteriol 60(9): 2082 - 2088.

126. Phạm Công Hoạt, Phùng Thu Nguyệt and Trần Ngọc Hùng (2014)

Metagenomics và việc khai thác tiềm năng đa dạng sinh học nguồn gen vi sinh

vật của Việt Nam. Tạp chí khoa học công nghệ Việt Nam 21: 6-9.

127. Phan Thị Tuyết Minh, Nguyễn Quốc Việt, Nguyễn Kim Thoa, Lê Gia Hy and

Trần Đình Mấn (2016) Thiết kế hệ thống biểu hiện ổn định gen mã hóa

endoglucanase trong Bacillus subtilis 168M. Tạp chí Công nghệ Sinh học 14(2):

347-351.

128. Placido A, Hai T, Ferrer M, Chernikova TN, Distaso M, Armstrong D, Yakunin

AF, Toshchakov SV, Yakimov MM, Kublanov IV, Golyshina OV, Pesole G,

Ceci LR and Golyshin PN (2015) Diversity of hydrolases from hydrothermal

vent sediments of the Levante Bay, Vulcano Island (Aeolian archipelago)

identified by activity-based metagenomics and biochemical characterization of

new esterases and an arabinopyranosidase. Appl Microbiol Biotechnol 99(23):

10031-10046.

136

129. Poidevin L, Feliu J, Doan A, Berrin J, Bey M, Coutinho P, Henrissat B, Record

E and Heiss-Blanquet S (2013) Insights into exo- and endoglucanase activities

of family 6 glycoside hydrolases from Podospora anserina. Appl Environ

Microbiol 79(14): 4220-4229.

130. Posta K, Beki E, Wilson DB, Kukolya J and Hornok L (2004) Cloning,

characterization and phylogenetic relationships of cel5B, a new endoglucanase

encoding gene from Thermobifida fusca. J Basic Microbiol 44(5): 383-399.

131. Pruitt K, Tatusova T and Maglott D (2007) NCBI reference sequences (RefSeq):

a curated non-redundant sequence database of genomes, transcripts and

proteins. Nucleic Acids Res 35(Database issue): D61-D65.

132. Qin L, Li WC, Liu L, Zhu JQ, Li X, Li BZ and Yuan YJ (2016) Inhibition of

lignin-derived phenolic compounds to cellulase. Biotechnol Biofuels 9(1): 70.

133. Rasheed Z and Rangwala H (2012) Metagenomic taxonomic classification

using extreme learning machines. J Bioinform Comput Biol 10(5): 1250015.

134. Rawat R, Kumar S, Chadha B, Kumar D and Oberoi H (2015) An

acidothermophilic functionally active novel GH12 family endoglucanase from

Aspergillus niger HO: purification, characterization and molecular interaction

studies. Antonie Van Leeuwenhoek 107(1): 103-117.

135. Resources YCf (1997). Thermophilic microorganism survey Yellowstone

national park.

136. Rhee JK, Ahn DG, Kim YG and Oh JW (2005) New thermophilic and

thermostable esterase with sequence similarity to the hormone-sensitive lipase

family, cloned from a metagenomic library. Appl Environ Microbiol 71(2):

817-825.

137. Riesenfeld CS, Schloss PD and Handelsman J (2004) Metagenomics: genomic

analysis of microbial communities. Annu Rev Genet 38: 525-552.

138. Roehe R, Dewhurst RJ, Duthie CA, Rooke JA, McKain N, Ross DW, Hyslop

JJ, Waterhouse A, Freeman TC, Watson M and Wallace RJ (2016) Bovine Host

Genetic Variation Influences Rumen Microbial Methane Production with Best

137

Selection Criterion for Low Methane Emitting and Efficiently Feed Converting

Hosts Based on Metagenomic Gene Abundance. PLoS Genet 12(2): e1005846.

139. Rothschild L and Mancinelli R (2001) Life in extreme environments. Nature

409: 1092-1101.

140. Roumpeka DD, Wallace RJ, Escalettes F, Fotheringham I and Watson M (2017)

A Review of Bioinformatics Tools for Bio-Prospecting from Metagenomic

Sequence Data. Front Genet 8.

141. Rozanova EP and Khudiakova AI (1974) A new non-spore forming

thermophilic organism, reducing sulfates, Desulfovibrio thermophilus nov. sp.

Mikrobiologiia 43: 1069–1075.

142. Russell RJ, Ferguson JM, Hough DW, Danson MJ and Taylor GL (1997) The

crystal structure of citrate synthase from the hyperthermophilic archaeon

pyrococcus furiosus at 1.9 A resolution. Biochemistry 36(33): 9983-9994.

143. Russell RJM, Gerike U, Danson MJ, Hough DW and Taylor GL (1998)

Structural adaptations of the cold-active citrate synthase from an Antarctic

bacterium. Structure 6(3): 351-361.

144. Ryan W, Collier P, Loredo L, Pope J and Sachdev R (1996) Growth kinetics of

Escherichia coli and expression of a recombinant protein and its isoforms under

heat shock conditions. Biotechnol Prog 12(5): 596-601.

145. Sajadi S (2010) Metal ion-binding properties of L-glutamic acid and L-aspartic

acid, a comparative investigation. Natural Science 02: 85-90.

146. Sanchez Hernandez JA (2019) Thermal Denaturation and Refolding of

Carbohydrate Binding Modules to Improve Enzyme Recycling in a

Lignocellulosic Biorefinery. Master, Hood college.

147. Sandgren M (2003). Structural and functional studies of glycoside hydrolase

family 12 enzymes from Trichoderma reesei and other cellulolytic

microorganisms. Comprehensive Summaries of Uppsala Dissertations from the

Faculty of Science and Technology. Uppsala, Acta Universitatis Upsaliensis.

819: 68.

138

148. Sandgren M, Gualfetti P, Shaw A, Gross L, Saldajeno M, Day A, Jones T and

Mitchinson C (2003) Comparison of family 12 glycoside hydrolases and recruited

substitutions important for thermal stability. Protein Sci 12(4): 848-860.

149. Santos C, Zanphorlin L, Crucello A, Tonoli C, Ruller R, Horta M, Murakami

M and de Souza A (2016) Crystal structure and biochemical characterization of

the recombinant ThBgl, a GH1 β-glucosidase overexpressed in Trichoderma

harzianum under biomass degradation conditions. Biotechnol Biofuels 9.

150. Saxena R, Dhakan D, Mittal P, Waiker P, Chowdhury A, Ghatak A and Sharma

V (2017) Metagenomic Analysis of Hot Springs in Central India Reveals

Hydrocarbon Degrading Thermophiles and Pathways Essential for Survival in

Extreme Environments. Front Microbiol 7: 2123-2123.

151. Schröder C, Eixenberger D, Suleiman M, Schäfers C and Antranikian G (2019)

Characterization of an extremely thermo-active archaeal β-glucosidase and its

activity towards glucan and mannan in concert with an endoglucanase. Appl

Microbiol Biotechnol 103(23): 9505-9514.

152. Schroder C, Elleuche S, Blank S and Antranikian G (2014) Characterization of

a heat-active archaeal beta-glucosidase from a hydrothermal spring

metagenome. Enzyme Microb Technol 57: 48-54.

153. Sezonov G, Joseleau-Petit D and D'Ari R (2007) Escherichia coli Physiology in

Luria-Bertani Broth. J Bacteriol 189(23): 8746-8749.

154. Sharma A, Tewari R, Rana SS, Soni R and Soni SK (2016) Cellulases:

Classification, Methods of Determination and Industrial Applications. Appl

Biochem Biotechnol 179(8): 1346-1380.

155. Sharma D, Dev K and Sourirajan A (2019) A Report on Metal Enhanced,

Solvent Tolerant Endoglucanase from Strict Thermophilic Bacillus sp. PW1 and

Bacillus sp. PW2 of North West Himalayas. Biol Forum 11(1): 222-230.

156. Sharma P and Guptasarma P (2017) Endoglucanase activity at a second site in

Pyrococcus furiosus triosephosphate isomerase-Promiscuity or compensation

for a metabolic handicap? FEBS open bio 7(8): 1126-1143.

139

157. Sharma S and Yazdani SS (2016) Chapter 6 - Diversity of Microbial Cellulase

System. New and Future Developments in Microbial Biotechnology and

Bioengineering. V. K. Gupta. Amsterdam, Elsevier: 49-64.

158. Shi X, Xie J, Liao S, Wu T, Zhao L, Ding G, Wang Z and Xiao W (2017) High-

level expression of recombinant thermostable β-glucosidase in Escherichia coli

by regulating acetic acid. Bioresource Technology 241: 795-801.

159. Shirai T, Ishida H, Noda J-i, Yamane T, Ozaki K, Hakamada Y and Ito S (2001)

Crystal structure of alkaline cellulase K: insight into the alkaline adaptation of

an industrial enzyme. Journal of Molecular Biology 310(5): 1079-1087.

160. Simon C and Daniel R (2011) Metagenomic Analyses: Past and Future Trends.

Appl Environ Microbiol 77: 1153-1161.

161. Simon C and Daniel R (2017) Construction of Small-Insert and Large-Insert

Metagenomic Libraries. Methods Mol Biol 1539: 1-12.

162. Singh G, Verma AK and Kumar V (2016) Catalytic properties, functional

attributes and industrial applications of β-glucosidases. 3 Biotech 6(1): 3-3.

163. Slightom R and Buchan A (2009) Surface Colonization by Marine

Roseobacters: Integrating Genotype and Phenotype. Appl Environ Microbiol

75: 6027-6037.

164. Steele HL, Jaeger KE, Daniel R and Streit WR (2009) Advances in recovery of novel

biocatalysts from metagenomes. J Mol Microbiol Biotechnol 16(1-2): 25-37.

165. Strobel K, Pfeiffer K, Blanch H and Clark D (2015) Structural insights into the

affinity of Cel7A carbohydrate-binding module for lignin. J Biol Chem

290(37): 22818-22826.

166. Studier FW (2005) Protein production by auto-induction in high density shaking

cultures. Protein Expr Purif 41(1): 207-234.

167. Studier FW (2014) Stable Expression Clones and Auto-Induction for Protein

Production in E. coli. Structural Genomics: General Applications. Y. W. Chen.

Totowa, NJ, Humana Press: 17-32.

140

168. Sukharnikov LO, Cantwell BJ, Podar M and Zhulin IB (2011) Cellulases:

ambiguous nonhomologous enzymes in a genomic perspective. Trends Biotechnol

29(10): 473-479.

169. Sunagawa S, Coelho LP, Chaffron S, Kultima JR, Labadie K, Salazar G,

Djahanschiri B, Zeller G, Mende DR, Alberti A, Cornejo-Castillo FM, Costea

PI, Cruaud C, d'Ovidio F, Engelen S, Ferrera I, Gasol JM, Guidi L, Hildebrand

F, Kokoszka F, Lepoivre C, Lima-Mendez G, Poulain J, Poulos BT, Royo-

Llonch M, Sarmento H, Vieira-Silva S, Dimier C, Picheral M, Searson S,

Kandels-Lewis S, Bowler C, de Vargas C, Gorsky G, Grimsley N, Hingamp P,

Iudicone D, Jaillon O, Not F, Ogata H, Pesant S, Speich S, Stemmann L,

Sullivan MB, Weissenbach J, Wincker P, Karsenti E, Raes J, Acinas SG and

Bork P (2015) Ocean plankton. Structure and function of the global ocean

microbiome. Science 348(6237): 1261359.

170. Tejirian A and Xu F (2010) Inhibition of Cellulase-Catalyzed Lignocellulosic

Hydrolysis by Iron and Oxidative Metal Ions and Complexes. Appl Environ

Microbiol 76(23): 7673-7682.

171. Tekere M, Lötter A, Olivier J, Jonker N and Venter S (2011) Metagenomic

analysis of bacterial diversity of Siloam hot water spring, Limpopo, South

Africa. African Journal of Biotechnology 10: 18005-18012.

172. Thankappan S, Kandasamy S, Joshi B, Sorokina KN, Taran OP and Uthandi S

(2018) Bioprospecting thermophilic glycosyl hydrolases, from hot springs of

Himachal Pradesh, for biomass valorization. AMB Express 8(1): 168-168.

173. Tiwari R, Nain L, Labrou NE and Shukla P (2018) Bioprospecting of functional

cellulases from metagenome for second generation biofuel production: a

review. Crit Rev Microbiol 44(2): 244-257.

174. Toyama D, de Morais MAB, Ramos FC, Zanphorlin LM, Tonoli CCC, Balula

AF, de Miranda FP, Almeida VM, Marana SR, Ruller R, Murakami MT and

Henrique-Silva F (2018) A novel beta-glucosidase isolated from the microbial

metagenome of Lake Poraque (Amazon, Brazil). Biochim Biophys Acta

Proteins Proteom 1866(4): 569-579.

141

175. Tran KM, Le VTT, Ngo DD, Hoang K, Nguyen PV and TH N (2018) Isolation

and optimization of the growth conditions of thermophilic microorganism

fromhot springs. The Journal of Agriculture and Development 17(3): 55-60.

176. Trần Ngọc Diễm My and Nguyễn Trọng Nhân (2018) Khảo sát sự hiện diện của

vi sinh vật phân giải cellulose trong dạ dày còng Perisesarma eumolpe tại khu

vực gãy đổ thuộc rừng ngập mặn Cần Giờ. Tạp chí Phát triển khoa học và công

nghệ: chuyên san Khoa học tự nhiên 2(5): 18-25.

177. Trần Văn Vươn, Ngô Thị Vân Kiều, Tạ Thị Hương and Nguyễn Thị Lan Phương

(2017) Nghiên cứu các chủng xạ khuẩn và nấm mốc có hoạt tính cellulase ở khu

vực tây nam vườn quốc gia Kon Ka Kinh - Gia Lai. Tạp chí Khoa học Xã hội,

Nhân văn và Giáo dục 7(2): 24-28.

178. Tribolo S, Berrin J-G, Kroon PA, Czjzek M and Juge N (2007) The Crystal

Structure of Human Cytosolic β-Glucosidase Unravels the Substrate Aglycone

Specificity of a Family 1 Glycoside Hydrolase. Journal of Molecular Biology

370(5): 964-975.

179. Trịnh Đình Khá (2015) Tinh sạch và nghiên cứu đặc tính của Cellulase tự nhiên và

tạo cellulase tái tổ hợp từ nấm sợi tại Việt Nam. Tiến sĩ, Đại học Thái Nguyên.

180. Trương Nam Hải (2011-2012). Sàng lọc các enzyme tham gia vào quá trình

phân giải cellulose, hemicellulose bằng kỹ thuật metagenomics.

181. Turner P, Mamo G and Karlsson EN (2007) Potential and utilization of

thermophiles and thermostable enzymes in biorefining. Microb Cell Fact 6: 9.

182. Valverde A, Tuffin M and Cowan DA (2012) Biogeography of bacterial

communities in hot springs: a focus on the actinobacteria. Extremophiles 16(4):

669-679.

183. Van den Ende FP and Gemerden HV (1993) Sulfide oxidation under oxygen

limitation by a thiobacillus thioparus isolated from a marine microbial mat.

FEMS Microbiol Ecol 13(1): 69-77.

184. Vassilev K, Turmanova S, Ivanova E and Trifonova V (2013) Catalytic Activity

of Amino Acids-Metal Complexes in Oxidation Reactions. J Biomater

Nanobiotechnol 4(2): 28-36.

142

185. Veena V, Paramasivan P, Parvatham R, Sivapriyadharsini and Kalaiselvi K

(2011) Isolation and characterization of β-glucosidase producing bacteria from

different sources. African Journal of Biotechnology 10: 14907-14912.

186. Vincze T, Posfai J and Roberts RJ (2003) NEBcutter: A program to cleave DNA

with restriction enzymes. Nucleic acids research 31(13): 3688-3691.

187. Vocadlo DJ and Davies GJ (2008) Mechanistic insights into glycosidase

chemistry. Curr Opin Chem Biol 12(5): 539-555.

188. Wallace RJ, Rooke JA, McKain N, Duthie CA, Hyslop JJ, Ross DW, Waterhouse

A, Watson M and Roehe R (2015) The rumen microbial metagenome associated

with high methane production in cattle. BMC Genomics 16.

189. Wang H, Li H, Shao Z, Liao S, Johnstone L, Rensing C and Wang G (2012)

Genome sequence of deep-sea manganese-oxidizing bacterium Marinobacter

manganoxydans MnI7-9. J Bacteriol 194(4): 899-900.

190. Wang J, Gao G, Li Y, Yang L, Liang Y, Jin H, Han W, Feng Y and Zhang Z

(2015) Cloning, Expression, and Characterization of a Thermophilic

Endoglucanase, AcCel12B from Acidothermus cellulolyticus 11B. Int J Mol Sci

16(10): 25080-25095.

191. Wang Q, Trimbur D, Graham R, Warren RAJ and Withers SG (1995)

Identification of the Acid/Base Catalyst in Agrobacterium faecalis .beta.-

Glucosidase by Kinetic Analysis of Mutants. Biochemistry 34(44): 14554-14562.

192. Waterhouse A, Bertoni M, Bienert S, Studer G, Tauriello G, Gumienny R, Heer

FT, de Beer TAP, Rempfer C, Bordoli L, Lepore R and Schwede T (2018)

SWISS-MODEL: homology modelling of protein structures and complexes.

Nucleic acids research 46(W1): W296-W303.

193. Watson M (2014) Illuminating the future of DNA sequencing. Genome Biol

15(2): 108.

194. Wolińska A (2019) Chapter 2 - Metagenomic Achievements in Microbial

Diversity Determination in Croplands: A Review. Microbial Diversity in the

Genomic Era. S. Das and H. R. Dash, Academic Press: 15-35.

143

195. Wooley JC, Godzik A and Friedberg I (2010) A primer on metagenomics. PLoS

Comput Biol 6(2): e1000667.

196. Yang C, Xia Y, Qu H, Li AD, Liu R, Wang Y and Zhang T (2016) Discovery

of new cellulases from the metagenome by a metagenomics-guided strategy.

Biotechnol Biofuels 9: 138-138.

197. Yennamalli RM, Rader AJ, Kenny AJ, Wolt JD and Sen TZ (2013)

Endoglucanases: insights into thermostability for biofuel applications.

Biotechnol Biofuels 6(1): 136.

198. Yennamalli RM, Rader AJ, Wolt JD and Sen TZ (2011) Thermostability in

endoglucanases is fold-specific. BMC Struct Biol 11: 10-10.

199. Yin YR, Zhang F, Hu QW, Xian WD, Hozzein WN, Zhou EM, Ming H, Nie

GX and Li WJ (2015) Heterologous expression and characterization of a novel

halotolerant, thermostable, and alkali-stable GH6 endoglucanase from

Thermobifida halotolerans. Biotechnol Lett 37(4): 857-862.

200. Zarafeta D, Kissas D, Sayer C, Gudbergsdottir SR, Ladoukakis E, Isupov MN,

Chatziioannou A, Peng X, Littlechild JA, Skretas G and Kolisis FN (2016)

Discovery and Characterization of a Thermostable and Highly Halotolerant

GH5 Cellulase from an Icelandic Hot Spring Isolate. PloS one 11(1): e0146454-

e0146454.

201. Zeng J, Gao X, Dai Z, Tang B and Tang XF (2014) Effects of Metal Ions on

Stability and Activity of Hyperthermophilic Pyrolysin and Further Stabilization

of This Enzyme by Modification of a Ca2+-Binding Site. Appl Environ

Microbiol 80(9): 2763-2772.

202. Zhang L, Fu Q, Li W, Wang B, Yin X, Liu S, Xu Z and Niu Q (2017)

Identification and characterization of a novel β-glucosidase via metagenomic

analysis of Bursaphelenchus xylophilus and its microbial flora. Scientific

reports 7(1): 14850.

203. Zhao C, Chu Y, Li Y, Yang C, Chen Y, Wang X and Liu B (2017) High-

throughput pyrosequencing used for the discovery of a novel cellulase from a

144

thermophilic cellulose-degrading microbial consortium. Biotechnol Lett 39(1):

123-131.

204. Zhu W, Lomsadze A and Borodovsky M (2010) Ab initio gene identification in

metagenomic sequences. Nucleic Acids Res 38(12): e132-e132.

205. Zouhar J, Vévodová J, Marek J, Damborský J, Su XD and Brzobohatý B (2001)

Insights into the functional architecture of the catalytic center of a maize beta-

glucosidase Zm-p60.1. Plant Physiol. 127(3): 973-985.

PHỤ LỤC

Phụ lục 1. Bản đồ giới hạn Vector biểu hiện pET-17b (Novagen) ...................... 1

Phụ lục 2. Trình tự nucleotide và axit amin của gen [denovogenes_18736]

mã hóa cho endoglucanase .................................................................. 1

Phụ lục 3. Trình tự nucleotide và axit amin của gen [denovogenes_32768]

mã hóa cho β-glucosidase ................................................................... 3

Phụ lục 4. Trình tự enzyme giới hạn .................................................................... 4

Phụ lục 5. Các môi trường sử dụng ...................................................................... 5

Phụ lục 6. Các loại đệm sử dụng .......................................................................... 6

Phụ lục 7. Đường chuẩn BSA .............................................................................. 6

Phụ lục 8. Chuẩn bị thuốc thử Coomassie Brilliant Blue để định lượng protein ....... 7

Phụ lục 9. Điện di protein SDS-PAGE ................................................................ 8

Phụ lục 10. Chỉ tiêu hóa lý của mẫu nước thu nhận từ suối nước nóng Bình Châu .... 9

Phụ lục 11. Kết quả dự đoán tâm hoạt động của denovogenes_18736 ................ 10

Phụ lục 12. So sánh trình tự axit amin domain xúc tác của gen

denovogenes_18736 với trình tự axit amin trong mô hình domain

xúc tác của 1up3.1.A.. ....................................................................... 11

Phụ lục 13. Kích thước của các axit amin trong mô hình cấu trúc protein của

denovogenes_18736.. ........................................................................ 11

Phụ lục 14. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và

bậc 4 của denovogenes_18736. ......................................................... 12

Phụ lục 15. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc protein

của denovogenes_18736 ................................................................... 12

Phụ lục 16. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng)

của denovogenes_18736. .................................................................. 13

Phụ lục 17. Vị trí của proline ở trong cấu trúc bậc 2 và bậc 4 (màu xanh tím)

của denovogenes_18736. .................................................................. 13

Phụ lục 18. Vị trí axit amin deletions trong mô hình (màu xanh tím) cấu trúc

protein của denovogenes_18736 ....................................................... 14

Phụ lục 19. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc

protein của denovogenes_18736 ....................................................... 14

Phụ lục 20. Vị trí aliphatic (màu xanh tím) trong cấu trúc protein của

denovogenes_18736 .......................................................................... 15

Phụ lục 21. Vị trí aromatic (màu xanh tím) trong cấu trúc protein của

denovogenes_18736 .......................................................................... 15

Phụ lục 22. Kết quả dự đoán cầu disulfide giữa các Cy strong cấu trúc của

denovogenes_18736 .......................................................................... 16

Phụ lục 23. Vị trí của Ser/Thr (màu xanh tím) trong cấu trúc protein của

denovogenes_18736 .......................................................................... 17

Phụ lục 24. Kích thước của các axit amin trong mô hình cấu trúc của

denovogenes_32768 .......................................................................... 18

Phụ lục 25. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và

bậc 4 của denovogenes_32768. ......................................................... 18

Phụ lục 26. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc của

denovogenes_32768 .......................................................................... 19

Phụ lục 27. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng)

của denovogenes_32768 ................................................................... 19

Phụ lục 28. Vị trí của Ser/Thr ở trong cấu trúc (màu xanh tím) của

denovogenes_32768 .......................................................................... 20

Phụ lục 29. Vị trí của proline (màu xanh tím) trong cấu trúc bậc 2 và bậc 4 của

denovogenes_32768 .......................................................................... 20

Phụ lục 30. Vị trí axit amin deletions (màu xanh tím) trong mô hình cấu trúc

của denovogenes_32768. .................................................................. 21

Phụ lục 31. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc

denovogenes_32768. ......................................................................... 21

Phụ lục 32. Vị trí aliphatic (màu xanh tím) trong cấu trúc

denovogenes_32768. ......................................................................... 22

Phụ lục 33. Vị trí aromatic (màu xanh tím) trong cấu trúc

denovogenes_32768. ......................................................................... 22

Phụ lục 34. So sánh trình tự axit amin domain xúc tác của gen

denovogenes_32768 với trình tự axit amin trong mô hình domain

xúc tác của 1vff.1.A. ......................................................................... 23

Phụ lục 35. Sự khác biệt về trình tự axit amin giữa denovogenes_32768 (query

23187) và Cen502 (query 23189). .................................................... 23

PHỤ LỤC

Phụ lục 1. Bản đồ giới hạn vector biểu hiện pET-17b (Novagen)

Phụ lục 2. Trình tự nucleotide và axit amin của gen denovogenes_18736 mã hóa cho

endoglucanase

atgctgccgcaagtagccgaagccgcaactcggaccgagtcggcgaataacacagtgtta

M L P Q V A E A A T R T E S A N N T V L

gtcgcaggccagaccggatcgattgtcgacgatcgtttgaacgtttggacaatcgtgaac

V A G Q T G S I V D D R L N V W T I V N

ggcgtcgtgaagaagaacggagcgaacgccgggtacagcgcccgcgtcattcaattggcg

G V V K K N G A N A G Y S A R V I Q L A

tatgtcaacgatgttgtctggcaggaaaatgccgatcatctttggtggagctggaacggt

Y V N D V V W Q E N A D H L W W S W N G

1

# 5'3' Frame 1

agttcatgggacggcggttggggtatcccgaccagcccgttgccgcaaaatgtgtccagt

S S W D G G W G I P T S P L P Q N V S S

ccgagtaacaacacgtcgctgaccgagtcagccaataactctgtactcctggccggtcaa

P S N N T S L T E S A N N S V L L A G Q

actggttcactcgtcgaccgccagaaggatgtctggacaattgtaaacggtgtcgtcaaa

T G S L V D R Q K D V W T I V N G V V K

aagaataacgttagtgccggctacagtgctcgcgttatccagctagcctacgtcaatggt

K N N V S A G Y S A R V I Q L A Y V N G

gtcatctggcaggaaaatgctgatcatctttggtggagctggaacggtagttcatgggac

V I W Q E N A D H L W W S W N G S S W D

ggcggttggggtatcccgaccagtccgttgtcgactgctgtaactgctccggcgcctcag

G G W G I P T S P L S T A V T A P A P Q

ccgcagccagaacctgaaccagcccccgcccccgcaccaacgaatagcagcaacccgttt

P Q P E P E P A P A P A P T N S S N P F

gctggtcagacactgtaccgcagcagctggtcgaacgcgctcaatcaggccaacgcttgg

A G Q T L Y R S S W S N A L N Q A N A W

cgttcaacacgaccggacgacgctgccaagatggattacttagccgcccagccgactgcc

R S T R P D D A A K M D Y L A A Q P T A

cgttggtttggtgactggaatgcgaatattcagagtgatgtcagcgcctacgtaggtgag

R W F G D W N A N I Q S D V S A Y V G E

gccgctgcagccaatgctctccccgtgcttgtcctctataacatcccgttccgtgactgc

A A A A N A L P V L V L Y N I P F R D C

ggtagctattctgccggtggtgcgggaagtgcctctggctaccacgactggatcgtgaag

G S Y S A G G A G S A S G Y H D W I V K

gtggctgaaggtattggtactcgtaaagcgatgatcgtgcttgaaccggatgctacgtcg

V A E G I G T R K A M I V L E P D A T S

cttgattgtttcgatgatactcgcgcagccatgctggctgacgcagtgaatgtcctcgaa

L D C F D D T R A A M L A D A V N V L E

gccaagccgaatgtcgctgtctacattgatgctggccacccagactgggttccggctgca

A K P N V A V Y I D A G H P D W V P A A

actatggccacacgtcttcagaagtctggaattcagaacgctcagggtatggccttgaac

T M A T R L Q K S G I Q N A Q G M A L N

2

gtctccaacttctatagcactgactcgaacatggcctacggtaacgacctctcgtcacgt

V S N F Y S T D S N M A Y G N D L S S R

cttggtggcaagcactacatcatcgacactgcccgcaatcacaacggctggcagggtgag

L G G K H Y I I D T A R N H N G W Q G E

tggtgtaacccacagggcgctggtatcggtaaggcaccgaccacgaacactggttctgcc

W C N P Q G A G I G K A P T T N T G S A

ctgttcgatgctggtttgtggatcaagccaccgggagaatccgatggtccgtgtaacggc

L F D A G L W I K P P G E S D G P C N G

ggtcctggtgctggtagctggtgggcggattacgctctcaagctctacaaccagggcacc

G P G A G S W W A D Y A L K L Y N Q G T

cactaa

H -

Phụ lục 3. Trình tự nucleotide và axit amin của gen denovogenes_32768 mã hóa cho

atggaaaagaaatttcctgaaggtttttattggggagcagccacatcctccttccaaacc

M E K K F P E G F Y W G A A T S S F Q T

gaaggcggcatcgagaacattgattgggcgaagggtgcccgcgaggggagagtgccacca

E G G I E N I D W A K G A R E G R V P P

ataggaaacgcgtgtgatttttacaatcggtacgaaagcgattttgatattgcgatagaa

I G N A C D F Y N R Y E S D F D I A I E

ttgggtcacaactgccaccgcatctcaattgaatgggcgcgcattgaaccggaggaaggg

L G H N C H R I S I E W A R I E P E E G

aagtttgatgaaaaagagatcgaacactatctacaggtactcgccgcgatgcgaaaacgg

K F D E K E I E H Y L Q V L A A M R K R

cacataaaaccgttcatcacgatctggcatttctcgctcccgcagtggtttgccgacaag

H I K P F I T I W H F S L P Q W F A D K

ggaggcttcgagcaccgtgattcgccggagattttcgcgcgatactgcggctacgtcgcg

G G F E H R D S P E I F A R Y C G Y V A

caaaagctcggcaacgactgccgccacttcgcgacgatcaacgaggcgctgccgtacacc

Q K L G N D C R H F A T I N E A L P Y T

acgaacggctggatccgcggatcgtggccgccctttaaggaggtgcccggactggggtgg

3

β-glucosidase

T N G W I R G S W P P F K E V P G L G W

tcgctctcgcacatccccgggcacatgccaatcaccatggatactcgctggaagaatgtg

S L S H I P G H M P I T M D T R W K N V

ctcctctatttccgcgtgcgaaaaaatctcgcgcgagcgcacaatcttgcgtatgacgag

L L Y F R V R K N L A R A H N L A Y D E

atcaaaaagcatgcgttcggcgcggaagtcggcattgtgcatcaaatcattctcttccac

I K K H A F G A E V G I V H Q I I L F H

gcgaacagtaacccgctcaatcaggcgctcgcggggtgcatgaattggttctggacgcac

A N S N P L N Q A L A G C M N W F W T H

tccttcattcggcgcgtatatcaaaaatgcgactcgatcggcatcaattactatttgcac

S F I R R V Y Q K C D S I G I N Y Y L H

aagaaattcggcgacaccgcaacgtaccggaaaaccgacatgaactgggatttttatccg

K K F G D T A T Y R K T D M N W D F Y P

gaaggcatttgcggagcgctcctcatgatgaagaggtacgggaggccgctgtgggtcgcg

E G I C G A L L M M K R Y G R P L W V A

gaggctggcatcgccgatgaggacgacgatcagcgcgcggaatacatcacgaagctgatt

E A G I A D E D D D Q R A E Y I T K L I

catggcatgtggacggcgatccaaagcggcgtcgatctgcgtgggtacatgtactggtcg

H G M W T A I Q S G V D L R G Y M Y W S

cttctcgataattacgaactcgcacacggctatacaaagcgcttcggcctcgtcgaagtg

L L D N Y E L A H G Y T K R F G L V E V

aatttcgagacacaagagaggaacatccggccctcggcctatgtttacaagcgcattata

N F E T Q E R N I R P S A Y V Y K R I I

gagaacaacgggctggtagaatag

E N N G L V E -

4

Phụ lục 4. Trình tự enzyme giới hạn

Phụ lục 5. Các môi trường sử dụng

- Môi trường SOC (g/L)

Bacto Tryptone 20

Cao nấm men 5

NaCl 0,5

980 mL H2O

Sau khi khử trùng bổ sung 20 ml dung dịch glucose 1M vô trùng

- Môi trường LB (g/L):

Bactotryptone 10

Cao nấm men 5

NaCl 5

1000 ml H2O cất

pH 7 - 7,2

- Môi trường NB (g/L)

D(+) glucose 1

Cao nấm men 3

Peptone 15

NaCl 6

1000 ml H2O cất

pH 7 - 7,2

- Môi trường TB (g/L)

Bacto Tryptone 12

Cao nấm men 24

Glycerin 4 ml

900 mL H2O cất

Sau khi khử trùng, bổ sung 100 ml:

0,72 M K2HPO4

0,17 M KH2PO4

5

pH 7 - 7,2

Phụ lục 6. Các loại đệm sử dụng

Đệm phá tế bào: 50 mM Tris/HCl, pH 8,5

1 mM EDTA

100 mM NaCl

0,1 mM DTE

1 mM PMSF

50 mM đệm potassium phosphate, pH 7.4 Đệm A

500 mM natri acetate

10% glycerol

0,1 mM DTE

1% natri cholat

1% Tween 20

0,1 mM PMSF

Đệm rửa: Đệm A

10 - 40 mM imidazol

Đệm đẩy B: Đệm A

250 mM Imidazole

Đệm đẩy C: Đệm A

200 mM Imidazole

Phụ lục 7. Đường chuẩn BSA

Đồ thị BSA chuẩn được xây dựng ở các nồng độ từ 0–1000 µg/ml. BSA gốc

ban đầu được chuẩn bị ở nồng độ 1 mg/ml, sau đó được pha loãng với dung dịch 0,15

M NaCl để tạo thành các thang nồng độ khác nhau với tổng thể tích 1000 l (Bảng

7.1). Đo độ hấp thụ của BSA ở bước sóng 595nm sau 10 phút ở nhiệt độ phòng kể từ

khi bổ sung dung dịch màu. Dựng đường chuẩn biểu thị mối liên quan giữa độ hấp

thụ của protein ở bước sóng 595 nm và nồng độ BSA (Hình 7.1).

Nồng độ protein trong mẫu nghiên cứu được xác định dựa trên đồ thị đường

6

chuẩn BSA. Trộn 100 l mẫu + 900 l dung dịch thuốc thử Coomassie Brilliant Blue.

Đo độ hấp thụ protein ở bước sóng 595 nm. Dựa vào hàm số tương quan giữa nồng

độ protein và độ hấp thụ để suy ra nồng độ protein trong mẫu.

Bảng 7.1: Thành phần phản ứng trong việc xây dựng đường chuẩn BSA

Ống Thể tích dịch BSA chuẩn Thể tích 0,15 Nồng độ protein

nghiệm nồng độ 1000 µg/ml (µl) M NaCl (µl) tương đương (µg/ml)

1000 0 1000 1

500 500 500 2

250 750 250 3

125 100 875 900 125 100 4 5

75 925 75 6

500 từ ống 5 500 50 7

500 từ ống 7 500 25 8

1.2

1

y = 0.0075x + 0.084 R² = 0.993

0.8

0.6

OD595

0 1000 0 9

5 9 5 D O

0.4

Linear (OD595 )

0.2

0

0

25

50

75

100

125

Nồng độ BSA (µg/ml)

Hình 7.1: Đồ thị đường chuẩn BSA với phương trình dạng y = ax+b

Phụ lục 8. Chuẩn bị thuốc thử Coomassie Brilliant Blue để định lượng protein

Hòa 100 mg Coomassie Brilliant Blue G-250 vào 50 ml ethanol có nồng độ

95%. Sau đó tiếp tục bổ sung thêm 100 ml H3PO4 85% (w/v) và dẫn nước tới thể tích

1 lít. Dung dịch cuối cùng có nồng độ các chất (w/v): 0.01% Coomassie Brilliant Blue

7

G-250, 4.7% ethanol và 8.5% H3PO4.

Phụ lục 9. Điện di protein SDS-PAGE

Hóa chất đổ gel polyacrylamide-SDS:

- Bis- Acrylamide 30% (tỷ lệ acrylamide : bis-acrylamide = 29 : 1).

- SDS 0,4%.

- APS 10%.

- TEMED 100%.

- 4x Đệm gel tách: Tris-HCl 1,5M (pH = 8,8); 0,4% SDS

- 4x Đệm gel cô: Tris-HCl 0,5M (pH = 6,8); 0,4% SDS

-2x SDS đệm tra mẫu (Tris –Hcl 125 mM (pH=6,8), Glycerol 20%, SDS 4%,

Bromophenol blue 0,004%, 2-mecaptoethanol 10%.

Công thức cho 2 bản gel (gồm gel tách và gel cô)

Hóa chất: Gel tách (12%) Gel cô (5%)

15 ml 10 ml H2O

Đệm 4xgel tách 3,75 ml

Đệm 4xgel cô 2,5 ml

Acrylamide 30% 6 ml 1,6 ml

APS 10% 75 μl 50 μl

TEMED 100% 7,5 μl 5 μl

Công thức cho đệm chạy 5X SDS running buffer

Tris 15g

Glycine 72g

SDS 5g

Công thức cho dung dịch nhuộm Coomassie Brilliant Blue

0,15% Coomassie Brilliant Blue (CBB) R-250

30% Methanol

10% axit Acetic

8

Công thức cho dung dịch tẩy nhuộm: 30% Methanol và 10% axit Acetic

Phụ lục 10. Chỉ tiêu hóa lý của mẫu nước thu nhận từ suối nước nóng Bình Châu

TT Chỉ tiêu phân tích Ký hiệu Đơn vị tính Kết quả phân tích

mg/L 1,45 Độ đục 1 SiO2

Thối, mặn Mùi 2

Cặn không tan 3 mg/L 3,8

Cặn sấy khô 4 M mg/L 2,18

Độ pH 5 pH 7,5

Độ cứng 6 CaO mg/L 259

Clorua 7 Cl- mg/L 1,885

-

Nitrate 8 mg/L 0,4 NO3

-

+

Nitrite 9 mg/L 0,001 NO2

Amoni 10 mg/L 0,01 NH4

Hydrosulfua 11 mg/L 0,37 H2S

Asen 13 As mg/L 0,001

Đồng 14 Cu mg/L 0,05

Kẽm 15 Zn mg/L 0,04

Sắt 16 Fe mg/L 0,05

Fluor 17 F mg/L 2,84

3-

Iodine 18 I mg/L 0,061

2-

Phosphate 19 mg/L - PO4

Sulphate 20 mg/L 368 SO4

Mangan 21 Mn mg/L 0,09

9

Magie 22 Mg 7,59

10

Phụ lục 11. Kết quả dự đoán tâm hoạt động của denovogenes_18736

Phụ lục 12. So sánh trình tự axit amin domain xúc tác của gen denovogenes_18736

với trình tự axit amin trong mô hình domain xúc tác của 1up3.1.A.

Phụ lục 13. Kích thước của các axit amin trong mô hình cấu trúc protein của

Chú thích: axit amin có màu xanh lá cây nhạt → đỏ: axit amin có kích thước bé nhất → lớn nhất.

11

denovogenes_18736.

Phụ lục 14. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và bậc 4

Chú thích: axit amin có màu xanh lam→ đỏ: ít kỵ nước → kỵ nước.

của denovogenes_18736.

Phụ lục 15. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc protein của

12

denovogenes_18736

Phụ lục 16. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng) của

denovogenes_18736.

Phụ lục 17. Vị trí của proline ở trong cấu trúc bậc 2 và bậc 4 (màu xanh tím) của

13

denovogenes_18736.

Phụ lục 18. Vị trí axit amin deletions trong mô hình (màu xanh tím) cấu trúc protein

của denovogenes_18736.

Phụ lục 19. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc protein

Chú thích: ED màu hồng: tích điện âm; HKR màu xanh tím: tích điện dương

14

của denovogenes_18736

Phụ lục 20. Vị trí aliphatic (màu xanh tím) trong cấu trúc protein của

denovogenes_18736

Phụ lục 21. Vị trí aromatic (màu xanh tím) trong cấu trúc protein của

15

denovogenes_18736

Phụ lục 22. Kết quả dự đoán cầu disulfide giữa các Cys trong cấu trúc của

.........10........20........30........40........50........60........70........

AA MLPQVAEAATRTESANNTVLVAGQTGSIVDDRLNVWTIVNGVVKKNGANAGYSARVIQLAYVNDVVWQENADHLWWSWN

DB_state

DB_conf

80........90........100.......110.......120.......130.......140.......150......

AA GSSWDGGWGIPTSPLPQNVSSPSNNTSLTESANNSVLLAGQTGSLVDRQKDVWTIVNGVVKKNNVSAGYSARVIQLAYV

DB_state

DB_conf

.160.......170.......180.......190.......200.......210.......220.......230.....

AA NGVIWQENADHLWWSWNGSSWDGGWGIPTSPLSTAVTAPAPQPQPEPEPAPAPAPTNSSNPFAGQTLYRSSWSNALNQA

DB_state

DB_conf

+----------------

|

..240.......250.......260.......270.......280.......290.......300.......310....

AA NAWRSTRPDDAAKMDYLAAQPTARWFGDWNANIQSDVSAYVGEAAAANALPVLVLYNIPFRDCGSYSAGGAGSASGYHD

DB_state 1

DB_conf 4

--------------------------+

|

...320.......330.......340.......350.......360.......370.......380.......390...

AA WIVKVAEGIGTRKAMIVLEPDATSLDCFDDTRAAMLADAVNVLEAKPNVAVYIDAGHPDWVPAATMATRLQKSGIQNAQ

DB_state 1

DB_conf 3

+--------------------------------

|

....400.......410.......420.......430.......440.......450.......460.......470..

AA GMALNVSNFYSTDSNMAYGNDLSSRLGGKHYIIDTARNHNGWQGEWCNPQGAGIGKAPTTNTGSALFDAGLWIKPPGES

DB_state 1

DB_conf 5

---+

|

.....480.......490.......500

AA DGPCNGGPGAGSWWADYALKLYNQGTH

16

denovogenes_18736

DB_state 1

DB_conf 2

DB_bond bond(300,343)

DB_bond bond(442,478)

Conn_conf 0.913818 Chú thích: AA: Trình tự axit amin; DB_state: dự đoán trạng thái liên kết disulfide (1 = liên

kết disulfide, 0 = không có liên kết disulfide); DB_conf: độ tin cậy của dự đoán trạng thái

liên kết disulfide (0 = thấp đến 9 = cao); DB_bond: vị trí theo trình tự của một cặp cystein

được dự đoán sẽ tạo thành cầu nối disulfide; Conn_conf: độ tin cậy của việc gán kết nối đưa

ra ở trạng thái liên kết disulfide được dự đoán (giá trị thực trong [0,1]).

17

Phụ lục 23. Vị trí của Ser/Thr (màu xanh tím) trong cấu trúc protein của denovogenes_18736

Phụ lục 24. Kích thước của các axit amin trong mô hình cấu trúc của

denovogenes_32768.

lớn nhất.

Chú thích: axit amin có màu xanh lá cây nhạt → đỏ: axit amin có kích thước bé nhất →

Phụ lục 25. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và bậc 4

Chú thích: axit amin có màu xanh lam→ đỏ: ít kỵ nước → kỵ nước.

18

của denovogenes_32768.

Phụ lục 26. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc của

denovogenes_32768

Phụ lục 27. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng) của

19

denovogenes_32768

Phụ lục 28. Vị trí của Ser/Thr ở trong cấu trúc (màu xanh tím) của

denovogenes_32768

Phụ lục 29. Vị trí của proline (màu xanh tím) trong cấu trúc bậc 2 và bậc 4 của

20

denovogenes_32768

Phụ lục 30. Vị trí axit amin deletions (màu xanh tím) trong mô hình cấu trúc của

denovogenes_32768.

Phụ lục 31. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc

Chú thích: ED màu hồng: tích điện âm; HKR màu xanh tím: tích điện dương

21

denovogenes_32768.

Phụ lục 32. Vị trí aliphatic (màu xanh tím) trong cấu trúc denovogenes_32768.

22

Phụ lục 33. Vị trí aromatic (màu xanh tím) trong cấu trúc denovogenes_32768.

Phụ lục 34. So sánh trình tự axit amin domain xúc tác của gen denovogenes_32768

với trình tự axit amin trong mô hình domain xúc tác của 1vff.1.A.

Phụ lục 35. Sự khác biệt về trình tự axit amin giữa denovogenes_32768 (query

Query_23187 1 MEKK--FPEGFYWGAXIT AMIN TSSFQTEGGIENI-----DWAKGAREGRVPPIGNACDFYNRYESDFDIAIELG-----HNCHRI 68

Query_23189 1 MKKLCLLAGVYMWGTATAXIT AMIN LQIEGAKKLCLLVPGGWKTVLDLGDVCPKACVCVQRRQRQCSLRQLSSLPSRYGVHLPTRL 80

Query_23187 69 SI------------EWARIEPEEGKFDEKEIEHYLQVLAXIT AMIN MRKRHI-KPFITIWHFSLPQWFADKGGFEHRDSPEIFARY 135

Query_23189 81 SYISFRGLLATYIPTWCTWSQSRG----IGRIIIVKLI--CLNDNIGLPFSTLYDRVLPQPLQLAVGWGNPPRIQAFVQF 154

Query_23187 136 CGYVAQKLGNDCRHFATINEALP--YTTNGWIRGSWPPFKEVPGLGWSLSHIPGHMPITMDTRWKNVLLYFRVRKNLARA 213

Query_23189 155 AETMFREFHGKIQHWHSFNEPWCTIAFVIQYVNGSCPGSDLSPDCDC-------------------------CRTSSWLA 209

Query_23187 214 HNLAYDEIKKHAFGAEVGIVHQIILFHANSNPLNQALAGCMNWFWTHSFI------------------------------ 263

Query_23189 210 HGLSVRRFRVLGTSGDSGIAPNVSWAVPYWHSEVDKAXIT AMIN CARTISLHSGLFLQPIFQGTIPQFLVDWFALQGGTVPIQDGD 289

Query_23187 264 -RRVYQKCDSIGINYYLHKKFGDTAT------------YRKTDMNWDFYPEGICGALLMMKRYGR-PLWVAEAGIADEDD 329

Query_23189 290 MEYIGEPIDMIGINYYSMSVNRFNPVAPFLQSEEINMPLPLTDIGWPLVARAVYEVLHYLQKYGNIDIYFTENGACYNHE 369

Query_23187 330 ---------DQRAEYITKLIHGMWTAIQSGVDLRGYMYWSLLDNYELAHGYTKRFGLVEVNFETQERNIRPSAYVYKRII 400

Query_23189 370 VVKRAKVQVDRRISKLQQHFQLVQRTIHDRLHVKGYMACSLLDNFLRAEGYKMTFGMIVVDFRTQVRTGLESYYWYGNVL 449

Query_23187 401 ENNGLVE--------- 407

Query_23189 450 SNNWLETRPQSFELLG 465

23

23187) và Cen502 (query 23189).