viÖn hµn l©m khoa häc vµ c«ng nghÖ viÖt nam
viÖn c«ng nghÖ sinh häc
TRẦN THANH THỦY
NGHI£N CøU ®¸nh gi¸ ®a d¹ng vi sinh vËt,
SµNG LäC, THU NHËN Vµ X¸C §ÞNH TÝNH CHÊT
CñA CELLULASE SUèI N¦íC NãNG b×nh ch©u,
VIÖT NAM b»ng kü thuËt metagenomicS
luËn ¸n tiÕn sÜ sinh häc
Hµ néi - 2021
viÖn hµn l©m khoa häc vµ c«ng nghÖ viÖt nam
viÖn c«ng nghÖ sinh häc
TRẦN THANH THỦY
NGHI£N CøU ®¸nh gi¸ ®a d¹ng vi sinh vËt,
SµNG LäC, THU NHËN Vµ X¸C §ÞNH TÝNH CHÊT
CñA CELLULASE SUèI N¦íC NãNG b×nh ch©u,
VIÖT NAM b»ng kü thuËt metagenomicS
Chuyªn ngµnh : Vi sinh vËt häc
M· sè
: 9 42 01 07
luËn ¸n tiÕn sÜ sinh häc
Người hướng dẫn khoa học: 1. TS. Nguyễn Kim Thoa
Viện Công nghệ sinh học
2. PGS. TS. Trần Đình Mấn
Viện Công nghệ sinh học
Hµ néi - 2021
LỜI CẢM ƠN
Với lòng biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành nhất đến TS. Nguyễn
Kim Thoa và PGS. TS. Trần Đình Mấn, Viện Công nghệ sinh học, Viện Hàn lâm
Khoa học và Công nghệ Việt Nam – những người thầy đã tận tình chỉ bảo, hướng
dẫn, động viên và tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện
luận án này.
Tôi xin gửi lời cảm ơn tới Ban lãnh đạo Viện Công nghệ sinh học, phòng Thí
nghiệm trọng điểm Công nghệ gen, phòng Công nghệ Vật liệu sinh học, các cán bộ
tại cơ sở đào tạo thuộc Viện Công nghệ sinh học, phòng Hệ gen học chức năng thuộc
Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tạo
điều kiện thuận lợi về cơ sở vật chất, máy móc, trang thiết bị cũng như các thủ tục
cần thiết để tôi có thể hoàn thành luận án.
Tôi cũng xin gửi lời cảm ơn tới các đồng nghiệp tham gia đề tài
ĐTĐLCN.15/14, các chú, anh, chị, em cán bộ phòng Công nghệ Vật liệu sinh học đã
giúp đỡ, động viên tôi trong suốt quá trình thực hiện luận án.
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè, những người thân đã
luôn ở bên cạnh chia sẻ, động viên, khích lệ, giúp đỡ, tạo điều kiện thuận lợi về
mọi mặt để tôi có thể tập trung, yên tâm học tập, nghiên cứu và hoàn thành luận
án của mình.
Hà Nội, ngày ... tháng ... năm 2021
Tác giả
i
Trần Thanh Thủy
LỜI CAM ĐOAN
Tôi xin cam đoan:
Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác với các
cộng sự khác.
Các số liệu và kết quả trình bày trong luận án là trung thực, một phần đã được
công bố trên các tạp chí khoa học chuyên ngành với sự đồng ý và cho phép của các
đồng tác giả.
Phần còn lại chưa được ai công bố trong bất kỳ công trình nào khác.
Hà Nội, ngày … tháng … năm 2021
Tác giả
ii
Trần Thanh Thủy
MỤC LỤC
LỜI CẢM ƠN ........................................................................................................... i
LỜI CAM ĐOAN ..................................................................................................... ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT....................................... vii
DANH MỤC CÁC BẢNG ........................................................................................ x
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ................................................................ xi
MỞ ĐẦU .................................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 3
1.1. Khu hệ vi sinh vật trong suối nước nóng .................................................... 3
1.2. Cellulase ......................................................................................................... 6
1.2.1. Phân loại ......................................................................................................... 6
1.2.2. Đặc điểm hóa sinh .......................................................................................... 9
1.2.3. Ứng dụng công nghệ sinh học của cellulase ưa nhiệt .................................. 21
1.3. Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các
gen mới ........................................................................................................ 21
1.3.1. Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics ............. 22
1.3.2. Phương pháp đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA
metagenome ................................................................................................. 26
1.3.3. Ứng dụng kỹ thuật Metagenomics để đánh giá đa dạng vi sinh vật và
khai thác các gen mã hóa cho enzyme mới .............................................. 28
1.3.4. Tình hình ứng dụng metagenomics vào nghiên cứu đa dạng vi sinh vật và
khai thác các gen mã hóa cho cellulase ở Việt Nam .................................... 32
CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................... 35
2.1. Vật liệu ......................................................................................................... 35
iii
2.1.1. Vi sinh vật ..................................................................................................... 35
2.1.2. Vector ........................................................................................................... 35
2.1.3. Cặp mồi sử dụng ........................................................................................... 35
2.1.4. Gen nghiên cứu ............................................................................................. 36
2.1.5. Các hóa chất sử dụng .................................................................................... 36
2.1.6. Môi trường nuôi cấy ..................................................................................... 36
2.2. Máy móc và thiết bị .................................................................................... 36
2.3. Phương pháp nghiên cứu ........................................................................... 36
2.3.1. Tách chiết DNA metagenome của mẫu suối nước nóng Bình Châu ............ 36
2.3.2. Giải trình tự DNA metagenome suối nước nóng Bình Châu ....................... 37
2.3.3. Các phương pháp tin sinh .............................................................................. 38
2.3.4. Khuếch đại gen endoglucanase_18736 và β-glucosidase_32768 ................ 40
2.3.5. Tạo vector biểu hiện pET-17b gắn các đoạn gen endoglucanase_18736/
β-glucosidase_32768 .................................................................................... 41
2.3.6. Biến nạp vector biểu hiện pET-17b chứa các đoạn gen
endoglucanase_18736/ β-glucosidase_32768 vào E. coli TOP10F’ bằng
phương pháp xung điện ................................................................................ 42
2.3.7. Chọn lọc dòng E. coli mang vector pET17b-18736/ và pET17b-32768 ...... 43
2.3.8. Tạo chủng E. coli tái tổ hợp mang vector pET-17b_18736 và
pET-17b_32768 ........................................................................................ 43
2.3.9. Biểu hiện gen denovogenes_18736 và denovogenes_32768 ....................... 44
2.3.10. Xác định trọng lượng sinh khối khô ............................................................. 44
2.3.11. Phương pháp thu nhận enzyme thô .............................................................. 44
2.3.12. Phương pháp xác định hoạt tính endoglucanase .......................................... 45
iv
2.3.13. Phương pháp xác định hoạt tính -glucosidase ............................................ 45
2.3.14. Ảnh hưởng của một số yếu tố lên mức độ biểu hiện endoglucanase_18736
và β-glucanase_32768 .................................................................................. 46
2.3.15. Động thái sinh trưởng và sinh endoglucanase, β-glucosidase tái tổ hợp ..... 47
2.3.16. Tinh sạch endoglucanase và β-glucosidase tái tổ hợp .................................. 47
2.3.17. Định lượng protein tổng số ........................................................................... 48
2.3.18. Điện di protein SDS-PAGE .......................................................................... 48
2.3.19. Kiểm tra hoạt tính endoglucanase bằng Zymogram (Điện di protein trên
gel polyacrylamide có chứa cơ chất CMC) ................................................. 49
2.3.20. Kiểm tra hoạt tính β-glucosidase bằng Zymogram ...................................... 50
2.3.21. Nghiên cứu một số đặc tính của enzyme tái tổ hợp ..................................... 50
2.3.22. Xử lý thống kê ............................................................................................... 51
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU .............................................................. 52
3.1. Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật
suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và
xây dựng bộ dữ liệu gen mã hóa cho cellulase . ................................... 52
3.1.1. Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng
Bình Châu .................................................................................................... 52
3.1.2. Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật,
xác định và tổng hợp gen mới mã hóa cho các enzyme thủy phân
cellulose (enzyme chịu kiềm, chịu axit và chịu nhiệt) ................................. 54
3.2. Biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 ............... 74
3.2.1. Thiết kế vector biểu hiện gen [denovogenes]_18736 và
[denovogenes]_32768 trong E. coli ............................................................. 74
3.2.2. Lựa chọn một số điều kiện biểu hiện gen [denovogenes]_18736 và
v
[denovogenes]_32768 trong E. coli ............................................................. 75
3.2.3. Động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của
chủng E. coli C43(DE3) tái tổ hợp .............................................................. 82
3.3. Tinh sạch và xác định tính chất của các cellulase tái tổ hợp .................. 83
3.3.1. Tinh sạch enzyme tái tổ hợp ......................................................................... 83
3.3.2. N g h i ê n c ứ u mộ t s ố đ ặ c t í n h c ủ a e n do g l u c a n a s e _ 1 8 7 3 6 v à
β - g l u c o s i d a s e _ 3 27 6 8 t á i t ổ h ợ p ...................................................... 85
CHƯƠNG 4. BÀN LUẬN KẾT QUẢ NGHIÊN CỨU ........................................ 95
4.1. Đa dạng vi sinh vật và tiềm năng khai thác các gen mới mã hóa cho
cellulase suối nước nóng Bình Châu thông qua cách tiếp cận không
phụ thuộc vào nuôi cấy. ............................................................................. 95
4.1.1. Đa dạng vi sinh vật ....................................................................................... 95
4.1.2. Tiềm năng khai thác các gen mới mã hóa cho cellulase .............................. 99
4.2. Mối liên hệ giữa mô hình cấu trúc với các đặc điểm của
endoglucanase_18736 và β-glucosidase_32768 ...................................... 104
4.2.1. Phân tích các do main ch ức năng c ủa endoglucana se_18 736
và β-glucos idase _3 2768 ..................................................................... 104
4.2.2. Mô hình cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768
tái tổ hợp .................................................................................................... 104
KẾT LUẬN VÀ KIẾN NGHỊ .............................................................................. 111
NHỮNG CÔNG TRÌNH CỦA TÁC GIẢ ĐÃ CÔNG BỐ LIÊN QUAN
ĐẾN ĐỀ TÀI ......................................................................................................... 113
TÓM TẮT LUẬN ÁN BẰNG TIẾNG ANH ...................................................... 114
TÀI LIỆU THAM KHẢO .................................................................................... 122
vi
PHỤ LỤC ................................................................................................................... 1
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Tên viết tắt Tên tiếng Anh Tên tiếng Việt
Ammonium persulfate Ammonium persulfate APS
Beijing Genomics Institute Viện nghiên cứu hệ gen Bắc Kinh BGI
BLAST Basic Local Alignment Công cụ tìm kiếm các trình tự tương
Search Tool đồng trực tuyến của NCBI
Base pair Cặp base Bp
Bovine serum albumin Albumin huyết thanh bò BSA
Carbohydrate – Active Enzyme thủy phân carbohydrate CAZy
enzymes
CBMs hay Carbohydrate Binding Module/Vùng liên kết với
modules/Domains carbohydrate CBD
Catalytic domain Vùng xúc tác CD
Carbohydrate esterases Carbohydrate esterases CEs
Carboxymethyl cellulose Carboxymethyl cellulose CMC
Cơ sở dữ liệu CSDL
Deionized water Nước deion dH2O
Deoxyribonucleic acid Axit Deoxyribonucleic DNA
3,5-Dinitrosalicylic acid Axit 3,5-Dinitrosalicylic DNSA
2’ – deoxyribonucleoside 2’ – deoxyribonucleoside 5’ - dNTP
5’ – triphosphate triphosphate
DPPE 1,2-bis 1,2-bis (diphenylphosphino) ethylene
(diphenylphosphino)
ethylene
EBI European Bioinformatics Viện nghiên cứu tin sinh Châu Âu
Institute
EDTA Ethylene diamine tetra Axit ethylene diamine tetra acetic
vii
acetic acid
EMBL European Molecular Phòng thí nghiệm sinh học phân tử
Biology Laboratory Châu Âu
ExPASY Expert Protein Analysis Hệ thống chuyên phân tích protein
System
GH Glycoside hydrolase Họ enzyme thủy phân glycoside
GTs Glycosyl transferases Glycosyl transferases
HTS High throughput Giải trình tự thông lượng cao
Sequencing
IPTG Isopropyl β- D-1- Isopropyl β- D-1-
thiogalactopyranoside thiogalactopyranoside
Kb Kilo base Đơn vị đo kích thước của axit
nucleic
KDa Kilo Dalton Đơn vị đo kích thước protein
KEGG Kyoto Encyclopedia of Cơ sở dữ liệu về gen và hệ gen
Genes and Genomes Kyoto.
Km Michaelis constants Hằng số Michaelis
LB Luria-Bertani Môi trường Luria-Bertani (LB)
MEGAN MEtaGenomic ANalyser Phần mềm phân tích trình tự đa hệ gen
NB Nutrient broth Môi trường Nutrient broth (NB)
NCBI National Center for Trung tâm Thông tin Công nghệ sinh
Biotechnology Information học quốc gia (Mỹ)
NGS Next Generation Giải trình tự gen thế hệ mới
Sequencing
NR Non - Redundant Cơ sở dữ liệu chứa các trình tự
không dư thừa của NCBI
ORF Open Reading Frame Khung đọc mở
PBS Phosphate – Buffered Đệm muối phosphate
saline
viii
PCR Polymerase Chain Reaction Phản ứng trùng hợp chuỗi
PDB Protein Data Bank Ngân hàng dữ liệu protein
PEG Polyethylen glycol Polyethylen glycol
PLs Polysaccharide lyases Polysaccharide lyases
pNPG p-nitrophenyl-β-d- p-nitrophenyl-β-d-glucopyranoside
glucopyranoside
SDS Sodium dodecyl sulphate Sodium dodecyl sulphate
SDS - SDS – Polyacrylamide gel Điện di trên gel polyacrylamide
PAGE electrophoresis
Swiss-Prot Swiss Protein Cơ sở dữ liệu protein Thụy Sĩ
TB Terrific Broth Môi trường Terrific broth (TB)
TEMED N,N,N′,N′-Tetramethyl N,N,N′,N′-Tetramethyl
ethylenediamine ethylenediamine
Tm Temperature Melting Nhiệt độ nóng chảy
Vmax Maximum Velocity Vận tốc tối đa
Uniprot Universal Protein Resource Nguồn dữ liệu phổ biến về trình tự
ix
và chức năng của protein
DANH MỤC CÁC BẢNG
Bảng 1.1. Phân bố của cellulase vào các họ GH khác nhau .................................... 8
Bảng 1.2. Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật
ở suối nước nóng .................................................................................... 14
Bảng 1.3. Đặc điểm của cellulase bền nhiệt .......................................................... 20
Bảng 1.4. Cellulase bền nhiệt từ metagenome của vi sinh vật ở suối nước nóng........ 31
Bảng 3.1. Nồng độ và độ tinh sạch của DNA metagenome mẫu nước và mẫu bùn
suối nước nóng Bình Châu ..................................................................... 54
Bảng 3.2. Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome suối nước nóng
Bình Châu ............................................................................................... 54
Bảng 3.3. Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu ....... 55
Bảng 3.4. Thống kê phân loại học DNA metagenome suối nước nóng Bình Châu
đã được chú giải ..................................................................................... 56
Bảng 3.5. Tỉ lệ các gen đã được phân loại thuộc các Ngành vi khuẩn ở
suối nước nóng Bình Châu ................................................................ 58
Bảng 3.6. Tỉ lệ các gen đã được phân loại thuộc các Lớp vi khuẩn ở suối nước nóng
Bình Châu ............................................................................................... 59
Bảng 3.7. Tóm tắt kết quả chú giải gen dựa vào các cơ sở dữ liệu mở ................. 61
Bảng 3.8. Phân bố của các ORF mã hóa cho cellulase được dự đoán từ bộ dữ liệu
DNA metagenome suối nước nóng Bình Châu .................................... 64
Bảng 3.9. Đặc điểm của 5 ORF mã hóa cho endoglucanase và β-glucosidase
thỏa mãn các tiêu chí lựa chọn gen/protein mới .................................... 68
Bảng 3.10. Kết quả tinh sạch endoglucanase và β-glucosidase tái tổ hợp bằng cột
IMAC-Ni2+ ............................................................................................. 85
x
Bảng 3.11. Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp ..... 90
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Nguyên tắc hoạt động của cellulase thủy phân cellulose ........................ 7
Hình 1.2. Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ
nấm Trichoderma reesei ................................................................... 10
Hình 1.3. Cấu trúc cellulosome của A. cellulolyticus ............................................ 11
Hình 1.4. Ba dạng tâm hoạt động của các họ GH ................................................. 11
Hình 1.5. Hai cơ chế xúc tác của GHsa ................................................................. 13
Hình 1.6. Các phương pháp chính để phát hiện gen mới bằng cách sử dụng
Metagenomics ........................................................................................ 22
Hình 1.7. Các bước chính xây dựng thư viện Metagenomic ................................. 24
Hình 1.8. Các bước phân tích tin sinh điển hình cho cơ sở dữ liệu
Metagenomic ......................................................................................... 26
Hình 2.1. Quy trình xử lý, phân tích dữ liệu DNA metagenome và sàng lọc gen
mã hóa cho enzyme thủy phân cellulose tiềm năng .............................. 38
Hình 3.1. Các vị trí lấy mẫu nước và mẫu bùn của suối nước nóng Bình Châu ... 53
Hình 3.2. DNA metagenome mẫu nước và bùn suối nước nóng Bình Châu ........ 53
Hình 3.3. Phân bố độ dài contig sau khi lắp ráp bằng phần mềm
SOAPdenovo2 ....................................................................................... 55
Hình 3.4. P h â n b ố đ ộ d à i c á c g e n đ ư ợ c d ự đ o á n t ừ b ộ d ữ l i ệ u
D N A m e t a g e n o m e s u ố i n ư ớ c n ó n g B ì n h C h â u .................... 56
Hình 3.5. Biểu đồ biểu thị 8 nhóm chiếm ưu thế cho từng cấp độ phân loại
(Ngành, Lớp, Bộ, Họ, Chi, Loài) vi sinh vật ở suối nước nóng
Bình Châu ............................................................................................. 57
Hình 3.6. Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA metagenome
suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy ................ 62
Hình 3.7. Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa
lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng
xi
Bình Châu .............................................................................................. 63
Hình 3.8. Cây phát sinh chủng loại Maximum likelihood của trình tự axit amin
mã hóa cho cellulase từ bộ dữ liệu DNA metagenome suối nước nóng
Bình Châu .............................................................................................. 66
Hình 3.9. Dự đoán tính chất của các protein tham gia vào quá trình thủy phân
cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome
suối nước nóng Bình Châu ...................................................................... 67
Hình 3.10. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của
endoglucanase_18736............................................................................ 71
Hình 3.11. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của
β-glucosidase_32768 ........................................................................... 71
Hình 3.12. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm
Swissmodel của ExPASy. a) Cấu trúc của endoglucanase_18736
dựa theo khuôn mô hình cấu trúc của cellulase Cel6 giả định
(1up3.1.A); b) Cấu trúc khuôn cellulase Cel6 giả định (1up3.1.A) . .. 72
Hình 3.13. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm
Swissmodel của ExPASy. a) Cấu trúc của β-glucosidase_32768 dựa
theo khuôn mô hình cấu trúc β-glucosidase (1vff.1.A); b) Cấu trúc
của β-glucosidase khuôn (1vff.1.A). ..................................................... 73
Hình 3.14. Điện di đồ sản phẩm cắt kiểm tra plasmid pET17b mang các đoạn gen
ngoại lai bằng hai enzyme giới hạn HindIII và NdeI .............................. 75
Hình 3.15. Hoạt tính endoglucanase_18736 (A) và β-glucosidase_32768 (B)
trong pha tan của các chủng tái tổ hợp .............................................. 76
Hình 3.16. Ảnh hưởng của chủng chủ lên quá trình sinh trưởng và biểu hiện
enzyme tái tổ hợp .................................................................................. 76
Hình 3.17. Ảnh hưởng của môi trường nuôi cấy lên sinh trưởng và sinh hoạt tính
enzyme ở chủng E. coli C43(DE3) tái tổ hợp ....................................... 77
Hình 3.18. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính
endoglucanase của chủng E. coli C43(DE3) tái tổ hợp ......................... 79
Hình 3.19. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính
xii
β-glucosidase của chủng E. coli C43(DE3) tái tổ hợp ............ 79
Hình 3.20. Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện
endoglucanase_18736 của chủng tái tổ hợp .......................................... 81
Hình 3.21. Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện
β-glucosidase của chủng E. coli C43(DE3) tái tổ hợp...................... 81
Hình 3.22. Động thái sinh trưởng và sinh endoglucanase của chủng E. coli C43(DE3)
tái tổ hợp ................................................................................................. 82
Hình 3.23. Động thái sinh trưởng và sinh β-glucosidase của chủng E. coli C43(DE3)
tái tổ hợp ................................................................................................. 83
Hình 3.24. Điện di đồ SDS-PAGE (a) và Zymogram (b) của endoglucanase
tái tổ hợp ............................................................................................... 84
Hình 3.25. Điện di đồ SDS-PAGE (a) và Zymogram (b) của β-glucosidase
tái tổ hợp ............................................................................................... 84
Hình 3.26. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp...................... 86
Hình 3.27. Ảnh hưởng của pH lên hoạt tính endoglucanase tái tổ hợp .................. 87
Hình 3.28. Ảnh hưởng của pH lên hoạt tính β-glucosidase tái tổ hợp .................... 87
Hình 3.29. Ảnh hưởng của một số ion kim loại lên hoạt tính
endoglucanase_18736 .......................................................................... 88
Hình 3.30. Ảnh hưởng của một số ion kim loại lên hoạt tính β-
glucosidase_32768 ................................................................................ 88
Hình 3.31. Độ bền nhiệt của endoglucanase_18736 được khảo sát tại giá trị Topt
và pHopt .................................................................................................. 91
Hình 3.32. Độ bền nhiệt của β-glucosidase_32768 được khảo sát tại giá trị Topt
và pHopt .................................................................................................. 92
Hình 3.33. Khả năng thủy phân một số loại cơ chất của
endoglucanase_18736 và β-glucosidase_32768 .............................. 93
xiii
Hình 3.34. Động học enzyme tái tổ hợp .................................................................. 94
1
MỞ ĐẦU
Cellulase là nhóm enzyme thủy phân các liên kết β-1,4-glucoside trong phân tử
cellulose, oligosaccharide, disaccharide và một số cơ chất tương tự khác. Cellulase
được tổng hợp bởi cổ khuẩn, vi khuẩn, nấm mốc, động vật nguyên sinh, thực vật và
động vật. Enzyme này được ứng dụng rộng rãi trong công nghiệp thực phẩm, lên men
rượu, thức ăn gia súc, dệt may, giặt ủi, trong ngành công nghiệp giấy và bột giấy,...
Khi nguồn nguyên liệu hóa thạch dần cạn kiệt thì nhu cầu sử dụng các nguồn năng
lượng thay thế, có thể tái tạo và thân thiện với môi trường ngày càng tăng. Một trong
những nguồn năng lượng thay thế được quan tâm nhất hiện nay là nhiên liệu sinh học
từ sinh khối lignocellulose. Quá trình chuyển hóa lignocellulose thành các sản phẩm
có giá trị như nhiên liệu sinh học, nhựa sinh học, axit hữu cơ và các cụm hóa chất
kiến tạo khác thường được thực hiện ở các điều kiện đặc biệt như ở nhiệt độ cao, tiền
xử lý bằng kiềm hoặc axit hoặc trong dung môi hữu cơ… Do đó đòi hỏi các nhà khoa
học phải nghiên cứu tìm kiếm các cellulase mang những đặc tính mới (như bền với
nhiệt độ cao, chịu được áp suất cao, chịu được pH axit/kiềm, dung môi …) để đáp
ứng được các yêu cầu của quá trình chuyển hóa lignocellulose và hạ được giá thành
sản xuất.
Một trong những nguồn địa nhiệt có thể thu nhận cellulase bền nhiệt là nhóm vi
sinh vật ưa nhiệt ở suối nước nóng. Tuy nhiên, sử dụng các phương pháp phân lập,
nuôi cấy vi sinh vật truyền thống không thể khai thác hết được tiềm năng của vật liệu
di truyền trong hệ sinh thái này vì có tới 99% các loài vi sinh vật sống trong môi
trường là các loài không nuôi cấy được. Hơn nữa, do đặc tính riêng của hệ sinh thái
suối nước nóng có mật độ vi sinh vật thấp hơn rất nhiều so với các môi trường bình
thường khác, vì vậy việc thu nhận được các loài vi sinh vật mới để khai thác nguồn gen
của chúng bằng phương pháp nuôi cấy thông thường gặp nhiều khó khăn.
Ngày nay, nhờ sự tiến bộ của công nghệ giải trình tự gen thế hệ mới, việc tách
dòng các gen mới có thể được thực hiện bằng cách tiếp cận cơ sở dữ liệu metagenome
kết hợp với các phần mềm tin sinh để dự đoán tính chất của protein tiềm năng trước
khi biểu hiện và nghiên cứu đặc tính của enzyme tái tổ hợp. Thông qua cách tiếp cận
2
này, các nhà nghiên cứu không chỉ đánh giá được mức độ đa dạng vi sinh vật ở trong
một hệ sinh thái mà còn bảo tồn và khai thác được các gen mới hoặc các protein có
tính chất đặc biệt từ các vi sinh vật đó.
Với mong muốn có thể đánh giá đa dạng vi sinh vật, đồng thời tiếp cận và khai
thác được nguồn cellulase bền nhiệt mới từ suối nước nóng Bình Châu - suối nước
nóng có nhiệt độ cao thứ hai ở Việt Nam không thông qua nuôi cấy, chúng tôi đã tiến
hành nghiên cứu, thực hiện đề tài: “Nghiên cứu đánh giá đa dạng vi sinh vật, sàng
lọc, thu nhận và xác định tính chất của cellulase suối nước nóng Bình Châu, Việt
Nam bằng kỹ thuật Metagenomics”.
MỤC TIÊU NGHIÊN CỨU
Thông qua kết quả giải trình tự DNA metagenome vi sinh vật suối nước nóng
Bình Châu bằng hệ thống giải trình tự gen thế hệ mới, (i) Đánh giá được nguồn đa
dạng vi sinh vật ưa nhiệt và xây dựng được bộ dữ liệu các gen mã hóa cho cellulase;
ii) Biểu hiện được các cellulase tái tổ hợp đồng thời (iii) Tinh sạch và xác định được
tính chất của các cellulase tái tổ hợp này.
NỘI DUNG NGHIÊN CỨU
- Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng
Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu các gen mã hóa cho
cellulase.
- Biểu hiện gen mới mã hóa cho cellulase (endoglucanase và β-glucosidase)
chịu nhiệt tiềm năng được lựa chọn từ bộ dữ liệu DNA metagenome.
- Tinh sạch và xác định tính chất của các cellulase tái tổ hợp.
NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
- Đã xây dựng được bộ dữ liệu DNA metagenome của vi khuẩn và cổ khuẩn
suối nước nóng Bình Châu với kích thước 9,4 Gb độ bao phủ trên 60%. Qua phân
tích đã xác định được đa dạng vi sinh vật và gen mã hóa enzyme thủy phân cellulose,
lựa chọn được hai gen mới (có độ tương đồng thấp 50,35% và 53,94%) mã hóa cho
hai enzyme tương ứng là endoglucanase và beta-glucosidase.
- Đã biểu hiện, tinh sạch và nghiên cứu tính chất sinh học của endoglucanase và
beta-glucosidase. Đã xác định được Vmax và Km của hai enzyme này.
3
CHƯƠNG 1
TỔNG QUAN TÀI LIỆU
1.1. Khu hệ vi sinh vật trong suối nước nóng
Suối nước nóng đã được nghiên cứu từ thế kỷ XIX. Các nghiên cứu đầu tiên về
suối nước nóng chỉ tập trung vào nghiên cứu tính chất hóa lý và đặc điểm địa chất,
còn nghiên cứu về vi sinh vật sống trong hệ sinh thái này chỉ mới bắt đầu vào giữa
thế kỷ XX (Marsh và Larsen, 1953). Nhiệt độ trong suối nước nóng thường vượt quá
giới hạn phát triển của sinh vật nhân thật. Do đó, vi sinh vật trong hệ sinh thái này
chủ yếu là nhóm vi khuẩn, cổ khuẩn và virus (López-López và cs., 2013).
Vi sinh vật sống ở nhiệt độ cao được phân vào hai nhóm chính là vi sinh vật ưa
nhiệt - thermophiles (nhiệt độ sinh trưởng tối ưu > 50ºC) và vi sinh vật siêu ưa nhiệt
- hyperthermophiles (nhiệt độ sinh trưởng tối ưu > 80ºC). Các vi sinh vật này đóng
vai trò trung tâm trong chu trình phân hủy các hợp chất hữu cơ và chu trình hóa sinh
địa (Merino và cs., 2019).
Vi sinh vật trong suối nước nóng thường không đa dạng và phong phú bằng các
môi trường thủy vực khác. Để nghiên cứu khu hệ vi sinh vật trong suối nước nóng,
các nhà khoa học có thể tiếp cận bằng phương pháp nuôi cấy và/ hoặc không thông
qua nuôi cấy. Sử dụng phương pháp nuôi cấy, nhiều loài vi khuẩn và cổ khuẩn đã
được phân lập từ các suối nước nóng khác nhau trên thế giới. Từ các suối nước nóng
nằm trong công viên quốc gia Yellowstone (Mỹ), các nhà khoa học đã phân lập được
nhiều loài vi khuẩn và cổ khuẩn: Achnanthes exigua, Archaeoglobus spp, Bacillus
coagulans, Clostridium thermoautotrophicum, Sulfolobus acidocaldarius,
Thermoleophilum album, Thiobacillus thiooxidans (Resources, 1997). Đây là các loài
có nhiệt độ sinh trưởng cao hoặc cực cao. Sử dụng phương pháp này, nhiều loài vi
khuẩn và cổ khuẩn mới cũng đã được phát hiện như Caldivirga maquilingensis gen.
nov., sp. nov đã được phân lập từ suối nước nóng ở Phillipines (Itoh và cs., 1999);
Vulcanisaeta distribute gen. nov., sp. nov. và Vulcanisaeta souniana sp. nov. đã được
tìm thấy trong suối nước nóng ở Nhật Bản (Itoh và cs., 2002); Fervidicoccus fontis
gen. nov., sp. nov. đã được thu nhận ở suối nước nóng tại vùng Kamchatka Peninsula,
Nga (Perevalova và cs., 2010).
4
Mặc dù nhiều chủng, loài vi sinh vật khác nhau từ các suối nước nóng trên Thế
giới đã được phân lập và phân loại, nhưng số lượng những loài chưa thể phân lập
được vẫn còn rất lớn, do đó không thể tiếp cận được các vi sinh vật bản địa, nắm bắt
được vai trò của chúng trong các chu trình chuyển hóa vật chất cũng như thu nhận
được các chất có hoạt tính sinh học từ hệ sinh thái này. Sự ra đời của máy giải trình
tự gen thế hệ mới được đánh giá là một công nghệ tiên tiến của ngành công nghệ sinh
học, khi kết hợp với các công cụ tin sinh sẽ tạo thành kỹ thuật Metagenomic (kỹ thuật
phân tích hệ gen môi trường), cho phép các nhà khoa học có điều kiện tiếp cận, bảo
tồn và khai thác nguồn vi sinh vật một cách đầy đủ và toàn diện hơn. Hiệu quả của
phương pháp này đã được chứng minh rõ rệt khi phân tích về số lượng, thành phần
chủng loại của quần xã vi khuẩn trong suối nước nóng Comano Terme (Ý) so với
phương pháp nuôi cấy thông thường (Pedron và cs., 2019). Kết quả đánh giá đa dạng
không thông qua nuôi cấy có thể bao phủ toàn bộ số liệu về chủng loại vi khuẩn phân
lập được, do vậy bức tranh về quần xã vi sinh vật trong các hệ sinh thái suối nước
nóng trở lên phong phú và đa dạng hơn. Trong các nghiên cứu trước đây, hầu hết các
vi khuẩn phân lập được từ suối nước nóng Ma'in và Afra ở Jordanian thuộc chi
Bacillus, Geobacillus và Anoxybacillus (Malkawi và Al-Omari, 2010; Al-Batayneh
và cs., 2011), tuy nhiên sử dụng kỹ thuật Metagenomics cho thấy vi sinh vật trong
hai suối nước nóng này đa dạng hơn rất nhiều với sự có mặt của các loài thuộc ngành
Proteobacteria, Bacteroidetes, Firmicutes, Deinococcus, Verrucomicrobia,
Planctomycetes và Chloroflexi (Hussein và cs., 2017).
Sự phân bố và thành phần vi sinh vật trong mỗi suối nước nóng mang các đặc
trưng riêng biệt, thường bị tác động bởi các yếu tố như nhiệt độ, thành phần hóa học
và pH của suối nước nóng (López-López và cs., 2013). Nhiệt độ được coi là yếu tố
chính ảnh hưởng đến số lượng và thành phần của quần xã vi sinh vật ở các vị trí khác
nhau trong suối nước nóng. Nhiệt độ trong suối nước nóng giới hạn sự sống sót của
các sinh vật nhân thật (nhiệt độ giới hạn của chúng thường < 60ºC) và các sinh vật
quang hợp (70°C). Ví dụ quần thể vi sinh vật ở suối nước nóng ven biển Iceland chịu
tác động mạnh mẽ của sự thay đổi nhiệt độ và độ mặn do ảnh hưởng của thủy triều
cao định kỳ. Nhóm vi khuẩn siêu ưa nhiệt chiếm ưu thế tại các vị trí có thời gian nóng
5
kéo dài nhất, trong khi nhóm vi sinh vật ưa nhiệt vừa phải, các vi sinh vật biển, các
Proteobacteria ưa ấm được tìm thấy ở các khu vực có thời gian nóng ngắn nhất (Hobel
và cs., 2005). Ảnh hưởng của nhiệt độ lên sự phân bố vi sinh vật dọc theo dòng chảy
của suối nước nóng Octopus (suối nước nóng kiềm với pH=8,5, có nồng độ sulfide
thấp) nằm trong công viên quốc gia Yellowstone cũng được nghiên cứu. Ở vị trí cách
miệng giếng phun 2 m có nhiệt độ khoảng 88°C chỉ tìm thấy các loài vi khuẩn thuộc
chi Aquifex - tế bào có màu tím hồng, hóa tự dưỡng vô cơ. Dọc theo dòng chảy, càng
ra xa miệng giếng phun, nhiệt độ càng giảm. Ở nhiệt độ khoảng 45-72oC, các loài vi
khuẩn lam Cyanobacteria phát triển tạo thành các đám trên mặt nước. Trong số các
chi vi khuẩn lam, Synechococcus có khả năng chịu nhiệt cao nhất (~ 72oC) tạo thành
quần thể bên trên che phủ cho tầng dưới là quần thể của chi Chloroflexus - một loại
vi khuẩn lam màu xanh lá cây, quang hợp không thải khí oxy. Ngoài ra, các chi vi
khuẩn lam khác như Phormidium và Calothrix cũng được tìm thấy trong dòng chảy
của suối nước nóng Octopus ở các vị trí có nhiệt độ thấp hơn (Rothschild và
Mancinelli, 2001). Ngoài yếu tố nhiệt độ, cấu trúc các quần xã vi sinh vật suối nước
nóng có thể bị ảnh hưởng bởi các yếu tố khác như đặc điểm địa hóa, hoặc sự kết hợp
giữa hai yếu tố nhiệt độ và pH. Ngoài các yếu tố nhiệt độ, thành phần hóa học, pH,
quần xã vi sinh vật trong suối nước nóng còn có thể chịu sự tác động của khoảng cách
địa lý. Một số loài vi sinh vật có thể có mặt ở tất cả các suối nước nóng. Tuy nhiên,
bên cạnh đó cũng có những loài được cho là đặc hữu của một khu vực suối nước
nóng. Vai trò của khoảng cách địa lý còn gây tranh cãi, nhưng có thể là một yếu tố
quan trọng ảnh hưởng đến quần thể xạ khuẩn và vi khuẩn lam theo một số nghiên cứu
nhưng không đại diện cho các quần thể vi sinh vật khác (Valverde và cs., 2012;
López-López và cs., 2013).
Mỗi suối nước nóng thường đặc trưng bởi một vài nhóm vi sinh vật chiếm ưu
thế. Các nghiên cứu từ trước cho đến nay đều thấy Proteobacteria là ngành chiếm ưu
thế trong các suối nước nóng ở Châu Phi (Tekere và cs., 2011), trong khi đó nhóm cổ
khuẩn thuộc bộ Thermoplasmatales (chiếm 39%) thuộc ngành Euryarchaeota, và một
nhóm cổ khuẩn khác (chiếm 33%) thuộc ngành Crenarchaeota lại là các nhóm ưu thế
trong hệ sinh thái nước ngầm ở những vùng địa nhiệt ở Nga. Cả hai ngành này đều là
6
những ngành có mặt trong các suối nước nóng trên toàn thế giới. Tuy nhiên, nhóm vi
khuẩn chiếm ưu thế trong hệ sinh thái này chủ yếu lại là vi khuẩn chuyển hóa
methane, ưa axit, ưa nhiệt và vi khuẩn oxy hóa lưu huỳnh. Đây là các vi khuẩn có thể
sử dụng các hợp chất vô cơ có nguồn gốc từ núi lửa để sinh trưởng (Mardanov và cs.,
2011). Phân tích các đặc điểm phân loại của quần xã vi sinh vật trong suối nước nóng
có tính axit ở Colombia cho thấy chỉ một tỷ lệ nhỏ các trình tự nucleotide trong DNA
metagenome có thể được phân loại đến loài dựa vào các cơ sở dữ liệu hiện có, hầu
hết vi sinh vật trong suối nước nóng là các loài mới, chưa được phân lập và phân loại.
Những vi sinh vật được phân loại có tiềm năng tham gia vào các chu trình chuyển
hóa nitơ và lưu huỳnh trong môi trường (Jimenez và cs., 2012). Nghiên cứu suối nước
nóng Sungai Klah (SK) là suối nước nóng kiềm (pH 7,0 - 9,0), có nhiệt độ cao thứ
hai ở Malaysia (50 - 110°C) cho thấy ngành Proteobacteria và Firmicutes là hai ngành
chiếm ưu thế (Chan và cs., 2015). Kết quả này cũng phù hợp với kết quả nghiên cứu
về vi sinh vật ở suối nước nóng Kenya - suối nước nóng kiềm (pH 9,2 - 9,8), nhiệt độ
45,1 - 83,6ºC (Kambura và cs., 2016). Ngược lại, ngành Proteobacteria và Thermi
chiếm ưu thế ở suối nước nóng axit nhẹ (pH 5 - 7), có nhiệt độ 45 - 90ºC (Paul và cs.,
2016). Điều đó chứng tỏ, mức độ đa dạng và phân bố của vi sinh vật trong suối nước
nóng cũng bị ảnh hưởng rất nhiều bởi pH hệ sinh thái.
1.2. Cellulase
1.2.1. Phân loại
Dựa vào cơ chế hoạt động của các domain xúc tác và tính đặc hiệu cơ chất,
cellulase được chia thành 3 dạng chính: β-1,4-endoglucanase (EC 3.2.1.4),
exoglucanase [cellobiohydrolase phân giải cơ chất từ đầu không khử (EC 3.2.1.91),
cellobiohydrolase phân giải cơ chất từ đầu khử (EC 3.2.1.176) và cellodextrinase (EC
3.2.1.74)] và β-glucosidase (EC 3.2.1.21). Endoglucanase phân cắt ngẫu nhiên các
liên kết glycoside nội mạch của chuỗi cellulose, giải phóng ra các oligosaccharide có
chiều dài khác nhau (như cellobiose và cellotriose). Cellobiohydrolase hoạt động
phân cắt trên các đầu khử và không khử của cellulose, giải phóng cellobiose là chủ
yếu, ngoài ra còn giải phóng ra các oligosaccharide mạch ngắn khác. Cellodextrinase
hoạt động trên các cellooligosaccharide hòa tan và nó cũng giải phóng ra cellobiose.
7
Cuối cùng, β-glucosidases thủy phân cellodextrin và cellobiose để tạo thành glucose,
kích hoạt cả endoglucanase và exoglucanase bằng cách làm giảm sự ức chế của sản
phẩm cuối cùng (Hình 1.1).
Chú thích: Cellulose tinh thể (màu đỏ), cellulose vô định hình (màu đen).
Hình 1.1. Nguyên tắc hoạt động của cellulase thủy phân cellulose.
(Nguồn: Juturu và Wu (2014)).
Do polysaccharide rất đa dạng trong tự nhiên và thực tế cho thấy không phải lúc
nào cũng dễ dàng phân loại cellulase thành endo- hoặc exoglucanase (Poidevin và
cs., 2013) nên dựa trên mức độ tương đồng về trình tự axit amin và cấu trúc tinh thể,
cellulase được xếp vào họ enzyme thủy phân glycoside (glycoside hydrolase - GH).
Cách phân loại này không chỉ phản ánh mối quan hệ giữa cấu trúc và chức năng, cơ
chế nhận biết cơ chất và phản ứng enzyme mà nó còn phản ánh mối quan hệ tiến hóa
giữa các enzyme. Các enzyme thuộc các họ GH khác nhau được tập hợp trong cơ sở
dữ liệu enzyme có hoạt tính carbohydrate (Carbohydrate-Active Enzymes Database)
(http://www.cazy.org). Số lượng các enzyme mới liên tục được cập nhật ở cơ sở dữ
liệu này, trung bình mỗi năm có thêm khoảng 5 họ GH mới (Helbert và cs., 2019).
Tính đến thời điểm tháng 9 năm 2019 số lượng họ GH trong cơ sở dữ liệu CAZy là
165 họ GH, trong đó endoglucanase chủ yếu hiện diện ở 15 họ GH, bao gồm GH5-
10, GH12, GH26, GH44, GH45, GH48, GH51, GH74, GH124 và GH148;
8
cellobiohydrolase hoạt động trên các đầu không khử hiện diện ở 3 họ GH5, GH6 và
GH9; cellobiohydrolase hoạt động trên các đầu khử hiện diện ở 3 họ GH7, GH9 và
GH48; cellodextrinase hiện diện ở 4 họ GH1, GH3, GH5 và GH9; và cuối cùng, β-
glucosidase hiện diện ở 9 họ GH1-3, GH5, GH9, GH16, GH30, GH39 và GH116
(http://www.cazy.org).
Bảng 1.1. Phân bố của cellulase vào các họ GH khác nhau.
Loại Enzyme
Cơ
chế
Cấu trúc
3D
Nucleophile/
Bazơ xúc tác
Chất cho
proton xúc tác
Họ
GH
Nhóm
lớn
(Clan)
Giữ lại GH-A
(β/α)8
Glu
1
Glu
β-Glucosidase; exo-β-
1,4-glucanase
Giữ lại
-
-
Asp
3
Glu
β-Glucosidase; glucan-
1,4-β-glucosidase
Giữ lại GH-A
(β/α)8
Glu
5
Glu
Endo-β-1,4-Glucanase;
β-Glucosidase;
exo-β-1,4-glucanase;
β-1,4-cellobiosidase
-
-
Asp
6
Asp
Endo-β-1,4-Glucanase;
cellobiohydrolase
Đảo
ngược
-
Endo-β-1,4-Glucanase Giữ lại
β-jelly roll
Glu
7
Glu
Endo-β-1,4-Glucanase
GH-M
(α/α)6
Asp
8
Glu
Đảo
ngược
-
(α/α)6
Asp
9
Glu
Đảo
ngược
Endo-β-1,4-Glucanase;
β-Glucosidase;
exo-β-1,4-glucanase;
cellobiohydrolase
Endo-β-1,4-Glucanase Giữ lại GH-C
β-jelly roll
Glu
12
Glu
β-Glucosidase
Giữ lại GH-A
(β/α)8
Glu
30
Glu
-
Endo-β-1,4-Glucanase Giữ lại
(β/α)8
Glu
44
Glu
-
Endo-β-1,4-Glucanase
-
Asp
45
Asp
Đảo
ngược
48
Endo-β-1,4-Glucanase
GH-M
(α/α)6
-
Glu
Đảo
ngược
Endo-β-1,4-Glucanase Giữ lại GH-A
(β/α)8
Glu
51
Glu
-
Endo-β-1,4-Glucanase
Asp
74
Asp
Seven fold
β-propeller
Đảo
ngược
-
116 β-Glucosidase
Giữ lại
Glu
Glu
-
124 Endo-β-1,4-Glucanase
-
-
-
Đảo
ngược
(Nguồn: Sharma và Yazdani (2016)).
9
Mặc dù được phân loại vào cùng một họ GH nhưng các enzyme riêng biệt vẫn
có thể khác nhau về tính đặc hiệu cơ chất và nguồn gốc tiến hóa như trong trường
hợp họ GH5 bao gồm cả cellulase, xylanase và mannase. Điều này cho thấy sự tiến
hóa từ tâm hoạt động của enzyme để có thể phù hợp với các cơ chất khác nhau. Mặt
khác, do sự tiến hóa tập trung của các kiểu cuộn gấp khác nhau trong tâm hoạt
động mà các enzyme thuộc các họ GH khác nhau vẫn có thể thủy phân cùng một
cơ chất (Duan và Feng, 2010; Lopez-Mondejar và cs., 2016; Tiwari và cs., 2018).
Nghiên cứu cơ sở dữ liệu CAZy cũng cho thấy một số họ như họ GH1 và GH5 là
họ cellulase của vi khuẩn, nấm mốc và cổ khuẩn; họ GH30 và GH48 là họ enzyme thủy
phân của nấm mốc; họ GH8 và GH44 là họ enzyme thủy phân của vi khuẩn (Bảng 1.1).
Mặt khác, một chủng vi sinh vật có thể sinh tổng hợp nhiều loại cellulase thuộc một
số họ với các kiểu cuộn gấp và cơ chế xúc tác khác nhau. Do đó, có thể khẳng định
rằng cellulase là một nhóm phức hợp các enzyme dường như đã phát triển từ cùng
một kiểu cuộn gấp cơ bản. Sự đa dạng phổ biến trong các họ cellulase phản ánh tính
không đồng nhất của cơ chất, bao gồm cellulose và các polysaccharide liên quan cấu
thành sinh khối thực vật và cũng là đa dạng nơi sống của vi sinh vật – nơi mà quá
trình thủy phân diễn ra (Sharma và Yazdani, 2016).
1.2.2. Đặc điểm hóa sinh
1.2.2.1. Cấu trúc
Cellulase có cấu trúc gồm các module xúc tác và module không xúc tác. Các
module xúc tác của cellulase được phân loại thành nhiều họ dựa vào trình tự axit amin
và cấu trúc tinh thể của chúng. Các module liên kết carbohydrate - không xúc tác
(CBM) và/ hoặc các module đã biết hoặc chưa biết chức năng khác có thể nằm ở đầu
N hoặc đầu C của module xúc tác. Cellulase của nấm và vi khuẩn thường có hai hoặc
nhiều domain cấu trúc và chức năng.
Dựa vào thành phần enzyme có thể chia cellulase này thành hai loại cấu trúc:
(i) không tạo thành phức hợp hoặc (ii) tạo thành phức hợp đa enzyme (cellulosome).
Dạng cellulase không tạo thành phức hợp thường được sinh tổng hợp bởi vi sinh vật hiếu
khí phân giải cellulose, có cấu tạo gồm một vùng xúc tác (Catalytic domain – CD) gắn kết
10
với vùng liên kết cellulose (cellulose-binding domain – CBD) qua cầu nối peptide linh
hoạt (Hình 1.2). Ngược lại, hầu hết các vi sinh vật kỵ khí tạo ra một phức hợp cellulase
đa enzyme gọi là cellulosome. Cellulosome là một thể thống nhất, cấu tạo gồm có
vùng xúc tác (CD) gắn kết với vùng dockerin. Phức hợp cellulosome gồm nhiều
protein gắn lên trên bề mặt màng tế bào để thực hiện chức năng giống như các
cellulase dạng không tạo thành phức hợp (Hình 1.3). Ngoài hai domain chính, trong
cấu trúc cellulosome còn có một số domain khác như domain tương đồng lớp bề mặt
(Surface layer homology (SLH) domain), domain 111 dạng fibronectin, domain giống
NodB và các vùng chưa biết chức năng khác. Các domain này thường liên kết với nhau
qua chuỗi liên kết giàu axit amin Pro, Thr và Ser. Trong số tất cả các domain này, CD và
CBD là hai domain quan trọng nhất bởi vì chúng là thành viên chính tham gia vào cơ chế
thủy phân của enzyme (Jayasekara và Ratnayake, 2019).
Trong enzyme, tâm hoạt động thường nằm ở vùng xúc tác CD và có cấu trúc
thuộc một trong ba dạng: dạng túi (pocket), dạng đường hầm (tunnel) và dạng
khe/rãnh (cleft) (Hình 1.4). Hầu hết endoglucanase có tâm hoạt động dạng khe/rãnh,
exoglucanase có tâm hoạt động dạng đường hầm, còn β-glucosidase có tâm hoạt động
dạng túi (Davies và Henrissat, 1995).
Hình 1.2. Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ nấm
Chú thích: Enzyme có mang vùng CBM (xanh nhạt) được nối với vùng xúc tác lớn bởi cầu
nối linh hoạt (màu vàng); chuỗi cellulose (màu xanh lá cây).
Trichoderma reesei.
(Nguồn: Sanchez Hernandez (2019)).
11
Chú thích: Cellulosome A bao gồm ScaA, ScaB và ScaC, liên kết với nhau thông qua các
tương tác cohesin-dockerin đặc biệt. ScaA chứa một cohesin dạng I cho phép enzym chứa
bảy dockerin gắn vào cellulosome. ScaA cũng chứa module liên kết với cellulose (CBM) và
module xúc tác thuộc họ GH9. ScaB hoạt động như một cầu nối giữa ScaA và ScaC, đồng
thời ScaB cho phép bốn protein ScaA liên kết với cohesin dạng II của nó. Mặt khác scaffoldin
dạng I, ScaC, có thể liên kết một cách chọn lọc với ba protein ScaB và gắn toàn bộ
cellulosome lên bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt (SLH) của nó.
Cellulosome B chứa hai scaffoldin, ScaA và ScaD. ScaD cũng cố định cellulosome vào bề
mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt và có thể liên kết hai protein ScaA
bằng hai cohesin dạng II của nó. ScaD cũng có thể liên kết với enzyme chứa dockerin dạng
I thông qua cohesin dạng I của nó.
Hình 1.3. Cấu trúc cellulosome của A. cellulolyticus.
(Nguồn: Hamberg và cs. (2014)).
Chú thích: a) Dạng túi; b) dạng khe/rãnh; c) dạng đường hầm. Axit amin xúc tác có màu đỏ.
Hình 1.4. Ba dạng tâm hoạt động của các họ GH.
(Nguồn: Davies và Henrissat (1995)).
12
1.2.2.2. Cơ chế xúc tác
Cellulase xúc tác cho quá trình phân hủy mạch polysaccharide của cellulose
bằng cách phá vỡ các liên kết β-1,4-glycoside. Ba loại enzyme chính tham gia vào
quá trình thủy phân các vi sợi cellulose trong thành tế bào thực vật gồm:
endoglucanase, exoglucanase và β-glucosidase. Quá trình thủy phân hoàn toàn
cellulose hình thành nên một loạt các chất trung gian dưới sự xúc tác đồng thời của
cả ba loại enzyme chính này. Endoglucanase thường tấn công vào các vùng vô định
hình của cellulose. Enzyme này thuỷ phân các liên kết lỏng lẻo nội phân tử ở vùng
vô định hình của cellulose để tạo ra các chuỗi mới. Những chuỗi mới này sau đó dễ
dàng bị tấn công bởi các loại enzyme khác. Hoạt tính enzyme cao nhất thường đạt
được trên cơ chất cellulose dạng hòa tan hoặc cellulose vô định hình đã được xử lý
bằng axit. Exoglucanase có chức năng thủy phân đầu khử và không khử của cellulose
để tạo ra glucose hoặc cellobiose. Exoglucanase khác với endoglucanase ở chỗ có
khả năng thủy phân cơ chất cellulose tinh thể như avicel hoặc cellooligosaccharide.
Cuối cùng, β-glucosidase có thể thủy phân cellobiose thành glucose từ các đầu không
khử và β-glucosidase bị bất hoạt khi phản ứng với cellulose vô định hình hoặc
cellulose tinh thể. Mặc dù cơ chế chính xác vẫn chưa được hoàn thiện, tuy nhiên đã
quan sát thấy sự phân mảnh của cellulose thành các sợi ngắn trước khi phát hiện thấy
đường khử trong quá trình thủy phân (Jayasekara và Ratnayake, 2019).
Cellulase có hai cơ chế xúc tác: giữ lại và đảo ngược. Cellulase cắt các liên kết
glucoside bằng cách sử dụng nhóm xúc tác axit – bazơ. Quá trình thủy phân được
thực hiện bởi hai nhóm xúc tác của enzyme, trong đó một nhóm là axit (đóng vai trò
là chất cho proton) và một nhóm là nucleophile/bazơ. Cơ chế xúc tác xảy ra phụ thuộc
vào vị trí không gian của nhóm xúc tác. Duy trì và đảo ngược cấu hình dị thường của
cellulase là hai cơ chế thủy phân cellulose. Trong cơ chế đảo ngược, cấu hình C dị
thường của cellulase đã bị đảo ngược sau khi thủy phân dịch chuyển nucleophilic đơn
(Hình 1.5A). Còn trong cơ chế giữ lại, cellulase giữ nguyên cấu hình C dị thường
mang liên kết glucoside đích ngay cả khi đã có sự dịch chuyển kép của hai axit amin
glycosyl hóa hoặc khử glycosyl hóa chìa khóa trong quá trình thủy phân (Hình 1.5B)
(Vocadlo và Davies, 2008).
13
Chú thích: (A) Cơ chế đảo ngược; (B) Cơ chế giữ lại.
Hình 1.5. Hai cơ chế xúc tác của GHsa.
(Nguồn: Payne và cs. (2015)).
1.2.2.3. Cơ chế gắn kết và tính đặc hiệu cơ chất
Cơ chế gắn kết và tính đặc hiệu cơ chất là một trong những đặc tính hóa sinh
của enzyme. Ngoài cellulose, cellulase còn có thể thủy phân xylan, lichenan và
mannan. Cellulase Cel5E của Pseudomonas fluorescens có khả năng thủy phân CMC,
lichenan, avicel và cellulose trương nở bởi axit nhưng lại bị bất hoạt hoàn toàn trên
cơ chất xylan (Hall và cs., 1995). Trong khi cũng thuộc họ GH5, cellulase CelG của
Fibrobacter succinogenes S85 lại có khả năng thủy phân hoàn toàn CMC và xylan
nhưng lại bị bất hoạt hoàn toàn trên cơ chất avicel và lichenan (Iyo và Forsberg,
1996). Ngược lại, một số cellulase chỉ hoạt động trên các dẫn xuất của cellulose.
Chẳng hạn, cellulase cel5B thuộc họ GH5 sinh tổng hợp bởi Thermobifida fusca, chỉ
có thể thủy phân các cơ chất chứa cellulose như CMC, avicel và MN300 (sợi cellulose
tự nhiên) nhưng lại bị bất hoạt hoàn toàn trên các cơ chất khác (Posta và cs., 2004).
Do đó, CMC được sử dụng như là cơ chất đặc hiệu chung để phát hiện cellulase. Tuy
14
nhiên, các cơ chế gắn kết và tính đặc hiệu cơ chất của cellulase trên các cơ chất khác
ngoài CMC còn rất ít thông tin (Sukharnikov và cs., 2011).
1.2.2.4. Các chất ức chế và cofactors
Ảnh hưởng của các ion kim loại lên hoạt tính cellulase
Các ion kim loại có thể liên kết với protein và cũng có thể tạo thành phức chất
với các phân tử khác khi liên kết với enzyme. Các ion này đóng vai trò là chất cho
hoặc nhận điện tử hoặc chất điều chỉnh cấu trúc. Các ion kim loại có thể làm tăng
hoặc ức chế hoạt tính enzyme bằng cách tương tác với các nhóm amine hoặc nhóm
axit carboxylic của các axit amin. Ảnh hưởng của các ion kim loại lên hoạt tính của
enzyme thủy phân lignocellulose nói chung và của cellulase nói riêng đã được Pereira
và cs. (2017) đề cập. Ngoài ra, hoạt tính cellulase của vi sinh vật ở suối nước nóng
cũng bị ảnh hưởng bởi một số ion kim loại như trong tóm tắt ở Bảng 1.2.
Bảng 1.2. Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật
ở suối nước nóng.
Enzyme
Nguồn gốc
Kim loại làm tăng hoạt
Kim loại làm
TLTK
tính enzyme
mất hoạt tính
enzyme
Endoglucanase Bacillus licheniformis
Ca2+, K+
Cu2+, Zn2+
Thankappan và
KBFB3
cs. (2018)
Endoglucanase
Ca2+, Mn2+, Mg2+
K+, Zn2+, Li+,
Zarafeta và cs.
Na+, Cu2+ , Fe3+
(2016)
Endoglucanase Bacillus sp. PW1
Ca2+, Ni2+, Co2+, Cu2+ ,
Sharma và cs.
và Bacillus sp.
Fe2+, Zn2+, Mg2+ , Mn2+
(2019)
PW2
và Hg2+
Bacillus
CMCase
Mg2+và Cu2+
K+, Zn2+, Co2+,
Azadian và cs.
sonorensis HSC7
Mn2+,
(2017)
Fe2+,Ca2+, Hg2+
β-Glucosidase DNA metagenome Ở nồng độ 1mM gồm:
Mn2+, Ni2+, Sr2+ Schroder và cs.
Al3+, Ca2+, Co2+, Cr3+,
(2014)
Fe2+, Fe3+, K+, Mg2+,
Rb+; ở nồng độ 5mM
gồm: Mg2+, Rb+
15
Các ion kim loại hóa trị I, II và III như Na+, K+, Ca2+, Mg2+, Mn2+, Fe2+, Co2+,
Cu2+, Ni2+, Zn2+, Hg2+ và Fe3+ thường được nghiên cứu trong quá trình phân tích đặc
tính của cellulase. Bên cạnh đặc điểm về điện tích, kích thước bán kính ion cũng có
ảnh hưởng lớn đến hoạt tính và độ bền của enzyme. Một số nghiên cứu đã cho thấy
những ion có bán kính lớn hơn ít ảnh hưởng đến các axit amin xúc tác, trong khi
những ion có bán kính nhỏ hơn có thể hấp dẫn các axit amin tích điện mạnh hơn
làm thay đổi cấu trúc tổng thể của enzyme bằng việc phá hủy vị trí xúc tác (Zeng và
cs., 2014).
Tác dụng ức chế của Fe2+ và Cu2+ lên hoạt tính cellulase cũng đã được nghiên
cứu. Tuy nhiên, ảnh hưởng của các ion khác nhau có hóa trị II lên hoạt tính của
cellulase được sinh tổng hợp bởi các vi sinh vật khác nhau là khác nhau (Bảng 1.2).
Tác dụng của các ion hóa trị II lên cellulase không tuân theo quy luật rõ ràng và mức
độ ảnh hưởng khác nhau có thể do tác dụng của quá trình oxy hóa khử lên các axit
amin, làm tăng hoặc giảm hoạt tính của enzyme (Tejirian và Xu, 2010).
Ion Hg2+ ức chế cellulase do tương tác với các gốc axit amin xúc tác có chứa
lưu huỳnh dẫn đến quá trình oxy hóa và hình thành các liên kết disulfide bất thường
(Tejirian và Xu, 2010). Ion Fe2+ có thể tạo phức với D/L-Lys và L-Met (Vassilev và
cs., 2013), Cu2+ tạo phức với His và Ba2+ tạo phức với Arg, Glu, Pro, Ser và Val (Bush
và cs., 2008).
Sajadi (2010) đã đánh giá sự tương tác của các axit amin như Asp và Glu với
các ion kim loại và thiết lập thứ tự mức độ tương tác như sau: Ca2+ < Mg2+ < Mn2+ <
Zn2+ < Co2+ < Cu2+ (đối với aspartate); Ca2+ < Mg2+ < Mn2+ < Co2+ < Zn2+ < Cu2+ (đối
với glutamine).
Ảnh hưởng của các tác nhân hóa học và các hợp chất hữu cơ lên hoạt tính
cellulase
Hoạt tính của cellulase có thể bị ảnh hưởng bởi các loại dược phẩm (ví dụ 2,3-
dichloride-1,4-nafthoquinone), thuốc diệt nấm (như phenylmercury acetate và
ethylen-bis-dithiocarbamate), các chất kháng sinh và chất khử trùng (như
Phenylmercury nitrate, 8-hydroxiquinoline và một số loại khác), đường (ức chế sản
phẩm cuối cùng), protein (các chất được tiết ra từ thực vật như cơ chế bảo vệ), các
hợp chất hữu cơ gắn với CBM, các sản phẩm từ phân hủy đường và lignin (như hợp
16
chất phenol), phụ gia thực phẩm (như Octyl gallate), hormone thực vật (auxin,
chẳng hạn như axit indoleacetic) và ion của chất rắn (Sodium azide – NaN3) (Pereira
và cs., 2017).
Các sản phẩm của quá trình thủy phân cellulose như cello-oligosaccharide và
cellobiose có thể ức chế hoạt tính tương ứng của endo- và exoglucanase. Quá trình
endoglucanase thủy phân xyloglucan và xylan có thể bị ức chế bởi chính sản phẩm
xylooligomer được giải phóng ra của phản ứng. Bổ sung xylanase vào môi trường
phản ứng là một cách thay thế để loại bỏ xylooligomer. β-Glucosidase bị ức chế bởi
glucose. Còn exoglucanase bị ức chế bởi các disaccharide (như cellobiose và
xylobiose) và monosaccharide (như mannose và galactose) (Pereira và cs., 2017).
Beta-glucosidase có thể bị ức chế bởi gluconolactone - sản phẩm của quá trình
oxy hóa cellulose bởi lytic polysaccharide monooxygenase (LPMO). Cellobiose và
các cơ chất khác của β-glucosidase cạnh tranh với gluconolactone và các sản phẩm
phân hủy bởi LPMO khác. Mặt khác, β-glucosidase có thể được kích hoạt bởi
soforose và lactose (Dhillon và cs., 2012; Pereira và cs., 2017).
Các loại đường được giải phóng ra khi thủy phân lignocellulose bằng enzyme
có thể bị phân hủy và chuyển hóa thành các hợp chất ức chế enzyme. Trong điều kiện
axit, glucose, mannose và galactose có thể được chuyển hóa thành các furan aldehyde
như hydroxymethylfurfurals (HMF). Ngược lại, HMF có thể được chuyển hóa thành
axit levulinic và axit formic (Jönsson và cs., 2013).
Tiền xử lý lignocellulose bằng kiềm hoặc axit, hoặc bằng các cách khác trong quá
trình thủy phân lignin bằng enzyme (có sự tham gia của laccase) có thể giải phóng các hợp
chất phenol như vanillin, syringaldehyde, axit trans-cinnamic và axit hydroxybenzoic. Các
hợp chất này là chất ức chế hoạt tính endo/exoglucanase và β-glucosidase do sự hiện diện
của các nhóm hydroxyl, carbonyl và methoxyl (Qin và cs., 2016).
Như đã đề cập ở trên, cellulase còn bị ức chế bởi một nhóm các chất có nguồn
gốc protein. Các protein ức chế xyloglucan endo-β-glucanase đặc hiệu (XEGIPs) có
mặt trong thành tế bào của một số loại rau như cà chua, thuốc lá và lúa mì. Đồng thời
các chất ức chế này cũng ức chế endoglucanase thủy phân xyloglucan. Những protein
17
trên là một phần của cơ chế bảo vệ ở thực vật chống lại mầm bệnh bằng cách hình
thành các phức chất có ái lực cao với enzyme (Pereira và cs., 2017).
Một yếu tố khác ảnh hưởng đến quá trình xúc tác của cellulase là sự tương tác
giữa enzyme với lignin, hiện tượng đó được gọi là liên kết (hấp phụ) không đặc hiệu.
Cellulase có thể hấp phụ lignin qua CBMs của chúng bằng cách sử dụng axit amin
đặc hiệu là Ala (Strobel và cs., 2015). Một số cellulase có hoạt tính xúc tác cao hơn
khi CBM bị loại bỏ bằng cách giảm hấp phụ không đặc hiệu lên lignin (Le Costaouëc
và cs., 2013).
Hấp phụ không đặc hiệu của cellulase lên lignin cũng có thể bị giảm bằng cách
thêm các chất hoạt động bề mặt vào môi trường phản ứng, làm tăng hiệu quả xúc tác
của enzyme. Tween 20, 40, 60, 80 và 100, triton X-100, polyethylen glycol (PEG)
cùng với các chất hoạt động bề mặt khác có xu hướng làm giảm sức căng bề mặt của
các chất hòa tan trong nước, có thể làm thay đổi tính chất của các chất lỏng như chất
tẩy rửa, nhũ hóa, bôi trơn và hòa tan. Các chất hoạt động bề mặt có thể làm giảm sự
hấp phụ không đặc hiệu của cellulase lên lignin, nó đóng vai trò là nhân tố kích hoạt
các enzyme này (Hsieh và cs., 2015).
Các tác nhân tạo phức (Chelating agent) như EDTA, ethylene glycol, β-
mercaptoethanol và DPPE (1,2-bis diphenylphosphino-ethylene) có thể làm tăng hoạt
tính của một số enzyme do các hợp chất này kết hợp với các ion kim loại có mặt trong
phản ứng làm cho tâm hoạt động của enzyme dễ dàng phản ứng với cơ chất. Đây
chính là ưu điểm của các tác nhân tạo phức đối với hoạt tính của enzyme. Ngược lại,
nhược điểm của các tác nhân tạo phức là làm cho enzyme bị phụ thuộc vào ion vô cơ
đã phân tách (Pereira và cs., 2017).
1.2.2.5. Cơ chế bền nhiệt
Các enzyme có thể (a) chịu được nhiệt độ cao, (b) cuộn xoắn ở nhiệt độ cao
và/ hoặc (c) có hoạt tính tối ưu ở nhiệt độ cao hơn được gọi là enzyme bền nhiệt
và/hoặc enzyme ưa nhiệt. Enzyme bền nhiệt khá ổn định ở nhiệt độ cao nơi mà
các enzyme ưa ấm bị biến tính làm hoạt tính tối ưu của enzyme bị mất hoặc giảm
(Turner và cs., 2007).
18
Độ bền nhiệt là một đặc tính do nhiều yếu tố tác động. Đặc tính này có thể là do
trình tự axit amin của protein hay do mức độ cuộn xoắn của nó quy định. Rất nhiều
nghiên cứu trên thế giới đã so sánh protein ưa ấm và protein bền nhiệt cho thấy các
yếu tố sau có thể làm tăng tính bền nhiệt như tỷ lệ của một số loại axit amin nào đó
trong trình tự enzyme (Kumar và cs., 2000), tăng tính kỵ nước (Gromiha và cs., 2013),
sự thay đổi của một axit amin đơn lẻ (Sandgren và cs., 2003), cấu trúc chặt chẽ của
protein, tỷ lệ của các axit amin có điện tích dương và sự thay đổi năng lượng tự do
Gibbs của quá trình hydrate hoá (Gromiha và cs., 2019). Nhìn chung, các protein ưa
nhiệt thường có tỷ lệ các axit amin kỵ nước và mang điện tích lớn hơn so với protein
ưa ấm. Các axit amin kỵ nước thường liên kết với nhau để tạo thành các trung tâm
của protein, làm hạn chế sự tiếp xúc với các dung môi hữu cơ tối đa, tạo các tương
tác van der Waals bền vững với các axit amin kỵ nước bên ngoài khác. Các nhóm
liên kết này thường tạo ra khoảng trống tối thiểu phía trong cấu trúc nhưng lại tạo
điều kiện tiếp cận trên bề mặt một cách tối đa. Theo đó, các protein ưa nhiệt thường
có tỷ lệ Val, Arg, Glu và Ile trung bình cao hơn so với các protein ưa ấm. Mặt khác,
các axit amin mang điện tích sẽ định dạng protein một cách phù hợp thông qua việc
hình thành các cầu muối disulfide, giúp ổn định cấu trúc trong quá trình cuộn xoắn
hơn so với các tương tác của các axit amin kỵ nước.
Mặc dù các nghiên cứu đã cố gắng xác định nhân tố chìa khóa quyết định mức
độ bền nhiệt của các họ protein, tuy nhiên cho đến nay cũng chưa có công bố nào đưa
ra được giả thuyết cũng như bằng chứng về đặc tính này một cách có quy luật.
Trong các nghiên cứu trước đây về endoglucanase bền nhiệt, Panasik và cs.
(2000) đã phân tích các yếu tố quyết định tính bền nhiệt của protein thuộc họ GH có
cấu trúc cuộn gấp (α/β)8 và chỉ ra rằng việc thiếu Gly trong các họ GH bền nhiệt (bao
gồm endoglucanase) đã được xác định là nhân tố ảnh hưởng đến độ bền nhiệt của
enzyme. Cấu trúc endoglucanase phổ biến được chia thành 3 dạng cuộn xoắn (α/β)8,
xoắn cuộn β, và (α/α)6. Việc phân tích các dữ liệu cấu trúc của enzyme cho thấy dạng
cuộn xoắn protein ảnh hưởng nhiều đến độ bền nhiệt của endoglucanase (Yennamalli
và cs., 2011). Khi so sánh trình tự của các endoglucanase bền nhiệt và ưa nhiệt, kết
19
quả cho thấy các axit amin Met và Arg cũng như các tương tác ion chiếm phần lớn
trong cấu trúc của enzyme bền nhiệt. Tuy nhiên, tỷ lệ lớn các axit amin này lại không
có ý nghĩa thống kê khi phân tích mức độ cuộn xoắn của protein. Chính kênh gắn cơ
chất và cấu trúc bậc 2 của enzyme là các yếu tố quyết định mức độ bền nhiệt của
chúng. Phân tích sự bắt cặp của các axit amin trong cấu trúc tương đồng về mức độ
cuộn xoắn giữa endoglucanase bền nhiệt và ưa nhiệt cho thấy sự thay đổi các vị trí
axit amin giữa hai loại enzyme này. Đối với cấu trúc xoắn cuộn β, axit amin Arg sẽ
được thay thế bởi Pro và các axit amin kỵ nước như Trp, Tyr, Phe, Ile, Met, Leu làm
giảm mức độ tương tác giữa các ion ở endoglucanase ưa ấm.
Trên cơ sở những cơ chế lý giải cho khả năng bền nhiệt của enzyme và protein
nói chung, cơ chế bền nhiệt của β-glucosidase cũng đã được nghiên cứu. Để nâng cao
khả năng bền nhiệt của UsBgl, Nam và cs. (2008) đã thiết kế một số điểm đột biến
trong đầu N và đầu C của UsBgl dựa trên trình tự và cấu trúc của β-glucosidase bền
nhiệt TmBglA ở vi khuẩn Thermotoga maritime. Kết quả là đầu N và đầu C đã tương
tác với nhau qua liên kết hydro, từ đó làm tăng khả năng hòa tan của protein cũng
như tăng hoạt tính xúc tác. Đồng thời, nhờ có tương tác này mà enzyme trở nên bền
hơn. Khả năng bền nhiệt của enzyme cũng được cho là do sự gia tăng về số lượng
của Pro, cầu liên kết tĩnh điện, các phân tử nước bên trong và sự liên kết của nhiều
tiểu phần trong cấu trúc bậc bốn của enzyme khi so sánh với enzyme ưa ấm.
1.2.2.6. Một số đặc điểm của cellulase bền nhiệt
Đặc điểm pH, nhiệt độ tối ưu và độ bền nhiệt là một trong những đặc tính quan
trọng của enzyme nói chung và cellulase bền nhiệt nói riêng. Các đặc điểm này là cơ
sở để định hướng ứng dụng enzyme vào các lĩnh vực khác nhau của cuộc sống.
Cellulase bền nhiệt được sinh tổng hợp chủ yếu từ vi khuẩn ưa nhiệt, cổ khuẩn, nấm
sợi ưa nhiệt và ưa ấm. Trong tự nhiên, các loài vi nấm có xu hướng sinh tổng hợp
nhiều cellulase hơn vi khuẩn, tuy nhiên, cellulase do vi khuẩn tạo ra lại là chất xúc
tác tốt hơn vì chúng ít bị ức chế ngược. Hơn nữa, vi khuẩn không chỉ sinh trưởng
nhanh mà nó còn có thể tạo enzyme tái tổ hợp cao hơn vi nấm. Vi khuẩn có khả năng
cư trú ở nhiều loại môi trường khác nhau như nhiệt độ cao, pH kiềm và pH axit; điều
20
đó đã giúp cho vi khuẩn tạo ra các chất xúc tác sinh học mang những đặc tính ổn định
trong điều kiện khắc nghiệt được tìm thấy trong các quá trình chuyển hóa sinh học
góp phần làm tăng tốc độ thủy phân và thu hồi sản phẩm một cách hiệu quả (Acharya
và Chaudhary, 2012). Bảng 1.3 mô tả đặc điểm của một số cellulase bền nhiệt.
Bảng 1.3. Đặc điểm của cellulase bền nhiệt.
Enzyme
Họ GH
Bền ở điều kiện
Nguồn
TLTK
Điều kiện
tối ưu
Nhiệt độ
pH
12
≥ 100ºC
50%; 95ºC; 40h
EglA
6
Pyrococcus
furiosus
(Bauer và
cs., 1999)
CelA
6
95ºC
KXĐ
12
CelB
12
106ºC
6-6,6
Thermotoga
neapolitana
Bok và cs.
(1998)
50%; 106ºC; 130 phút
50%; 110ºC; 26 phút
EG
5
109ºC
5,5
Cổ khuẩn làm
giàu
Graham và
cs. (2011)
50%; 100ºC; 5 giờ
50%; 105ºC; 0,57 giờ
50%; 108ºC; 0,17 giờ
EG
12
80ºC
1,8
50%; 80ºC; 8 giờ
Sulfolobus
solfataricus
Huang và
cs. (2005)
5
Cel8H
KXĐ
45ºC
40-60ºC; pH 4-12
Halomonas
sp. S66-4
Huang và
cs. (2010)
9
BglW
50ºC
3
>75%; 40-50ºC; pH 8-
9,5; 30 phút
Cao và cs.
(2015)
Aspergillus
fumigatus
WL002
1
Bgl1
90ºC
6.5
Schroder và
cs. (2014)
67%; 90ºC; 1.5 giờ
78%; 50ºC; 24 giờ
68%; 60ºC; 24 giờ
Cổ khuẩn
không nuôi
cấy được từ
DNA
metagenome
suối nước
nóng
XM70-Cel9
KXĐ
70ºC
7
50%; 85ºC; 30 phút
(Zhao và
cs., 2017)
DNA
metagenome
trầm tích suối
nước nóng
Vul_Bgl1A
1
105ºC
7
Schröder và
cs. (2019)
DNA
metagenome
mẫu lấy từ lỗ
thông thủy
nhiệt ở đảo
Vulcano, Italy
50%; 75ºC; 99 phút
50%; 90ºC; 15 phút
50%; 99ºC; 11 phút
50-68%; pH 4-9; 24h
20%; pH4; 48 giờ
47%; pH7; 48 giờ
Chú thích: KXĐ: Không xác định
21
1.2.3. Ứng dụng công nghệ sinh học của cellulase ưa nhiệt
Enzyme ưa nhiệt có ưu điểm hơn so với các enzyme ưa ấm bởi chúng có khả
năng ứng dụng trong các ngành công nghiệp khác nhau. Enzyme ưa nhiệt thường bền
hơn khi hoạt động trong điều kiện ở nhiệt độ cao, pH cực đoan, có sự hiện diện của
các chất gây biến tính protein. Enzyme ưa nhiệt thường có tốc độ phản ứng cao hơn
so với enzyme ưa ấm (Wang và cs., 2015). Tốc độ truyền khối lớn làm tăng độ hòa
tan của cơ chất, làm giảm nguy cơ tạp nhiễm (Rawat và cs., 2015). Cuối cùng, enzyme
ưa nhiệt có thể hoạt động linh hoạt trong các quy trình được thiết kế riêng để giảm
chi phí vận hành. Hiện nay, cellulase ưa nhiệt được ứng dụng chủ yếu trong các ngành
sản xuất nhiên liệu sinh học (chuyển hóa sinh khối thực vật thành ethanol sinh học),
công nghiệp thực phẩm và sản xuất bia, công nghiệp dệt may (mài mòn sinh học và
đánh bóng sinh học), giặt ủi (trong công thức chất tẩy rửa), công nghiệp giấy và bột
giấy (Sharma và cs., 2016; Jayasekara và Ratnayake, 2019), cũng như trong sản xuất
thức ăn chăn nuôi (Wang và cs., 2015). Ngoài ra, cellulase ưa nhiệt còn được ứng
dụng trong một số ngành khác như quản lý chất thải, cải thiện đất nông nghiệp (Biver
và cs., 2014) và chiết xuất các hợp chất từ thực vật như dầu ô liu, bột màu và các
phân tử có hoạt tính sinh học (Sharma và cs., 2016). Quá trình chuyển hóa hoàn toàn
cellulose thành glucose, sau đó chuyển hóa tiếp thành bioethanol đòi hỏi phải có sự
kết hợp đồng thời của nhiều enzyme thủy phân cellulose (endo- và exoglucanase và
β-glucosidase). Do đó, khi nguồn năng lượng hóa thạch bị cạn kiệt phải thay thế bằng
nguồn năng lượng tái tạo thì nhiên liệu sinh học sản xuất từ sinh khối thực vật trở nên
tiềm năng và cần được quan tâm phát triển (Escuder-Rodríguez và cs., 2018). Sử dụng
cellulase bền nhiệt để tiền xử lý và xử lý sinh khối góp phần làm giảm giá thành sản
xuất năng lượng, cải thiện khả năng hòa tan của cơ chất, giảm độ nhớt và giảm sự
phụ thuộc vào việc sử dụng các hóa chất gây hại cho môi trường (Jayasekara và
Ratnayake, 2019).
1.3. Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các gen mới
Metagenomics được định nghĩa là kỹ thuật nghiên cứu đa hệ gen hay DNA hệ
gen tổng số trực tiếp từ mẫu môi trường. Kể từ khi thuật ngữ Metagenome được sử
dụng lần đầu tiên vào năm 1998 (Handelsman và cs., 1998), metagenomics đã là một
trong những công cụ nghiên cứu chính để nghiên cứu sinh thái vi sinh vật và là công
22
cụ không thể thiếu để nghiên cứu sự đa dạng cũng như tiềm năng trao đổi chất của
các vi sinh vật (phần lớn là những loài không nuôi cấy được) trong môi trường. Các
kết quả nghiên cứu về metagenomic có thể cung cấp thông tin về các gen chức năng,
cấu trúc và tổ chức bộ gen, xác định gen và chất xúc tác sinh học mới, cấu trúc quần
xã và các mối quan hệ tiến hóa trong quần xã vi sinh vật (Culligan và cs., 2014).
1.3.1. Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics
Hai phương pháp tiếp cận chính được sử dụng để tiếp cận và thu nhận các gen
mới từ DNA môi trường là (i) dựa vào trình tự và (ii) dựa vào chức năng (hoặc kết
hợp cả hai) (Hình 1.6).
Hình 1. 6. Các phương pháp chính để phát hiện gen mới bằng cách sử dụng
Chú thích: A) Mẫu môi trường quan tâm (ví dụ đất, hệ vi sinh vật đường ruột của người,
nước biển) được thu thập; B) DNA metagenomics tổng số của mẫu được phân lập trực tiếp
Metagenomics.
23
hoặc gián tiếp bằng cách phá vỡ tế bào; C) Phân tích DNA metagenomics dựa vào trình tự,
C-1) có thể tạo thư viện tách dòng bằng cách giải trình tự Sanger hoặc giải trình tự DNA
metagenome trực tiếp, sử dụng hệ thống giải trình tự thế hệ mới; C-2) sử dụng cặp mồi suy
biến được thiết kế từ các vùng bảo thủ của gen đích, sau đó khuếch đại gen dần từng bước
cho đến khi thu được toàn bộ gen; C-3) khai thác dữ liệu từ bộ dữ liệu giải trình tự
metagenomic để tìm kiếm thông tin của gen hoặc các vùng bảo thủ rồi tổng hợp gen sau khi
đã tối ưu để biểu hiện trong chủng chủ; C-4) thu giữ lại các gen mới từ các plasmid sử dụng
phương pháp TRACA (transposon-aided capture) hoặc các gen liên quan tới integron bằng
cách sử dụng phương pháp PCR với cặp mồi nhắm vào trình tự có vị trí tích hợp bảo thủ; D)
Phân tích metagenomics dựa vào chức năng; D-1) tạo thư viện mang đoạn chèn có kích
thước lớn hoặc nhỏ bằng cách sử dụng vector phù hợp (plasmid, fosmid, cosmid, or bacterial
artificial chromosome [BAC]) tùy thuộc vào nhu cầu của nghiên cứu; D-2) lựa chọn chủng
chủ thích hợp để biểu hiện gen hoặc hệ gen. Chủng chủ được sử dụng phổ biến nhất là E.
coli, ngoài ra còn có thể sử dụng các chủng Bacillus và Streptomyces. Thư viện gen được
giữ trên các đĩa micro-titer 96 hoặc 384 giếng và được bảo quản ở -80C; D-3) Các dòng
mang DNA metagenome có thể được sàng lọc để xác định hoạt tính đích bằng cách nhân
bản toàn bộ hoặc một phần thư viện vào trong các đĩa micro-titer mới hoặc cấy gạt lên trên
các đĩa thạch. Các dòng dương tính được nhận biết thông qua một số đặc điểm khác biệt như
khả năng kháng kháng sinh, hình thành sắc tố, sự thay đổi hình thái hoặc khả năng kháng một
số yếu tố khác; D-4) Đột biến gen nhảy có thể được tiến hành trên các dòng dương tính để xác
định gen hoặc các gen quan tâm; D-5) Tách dòng và biểu hiện các gen để xác nhận lại kiểu hình;
E) các gen mới được phát hiện dựa vào chức năng hoặc trình tự hoặc dựa vào sự kết hợp của
cả hai cách tiếp cận trên.
(Nguồn: Culligan và cs. (2014)).
1.3.1.1. Khai thác gen mới dựa vào chức năng
Trước đây, sàng lọc các gen mới từ DNA metagenome chủ yếu dựa vào hoạt
tính trao đổi chất của các dòng gen trong thư viện metagenome. Đây là phương pháp
tiếp cận duy nhất để xác định các gen mới mã hóa cho protein hoặc peptide đã biết
hoặc chưa biết chức năng mà không cần biết trình tự của gen (Simon và Daniel, 2011).
Phương pháp này không quá khó, ít tốn kém nhưng đòi hỏi mất nhiều công sức, tốn
nhiều thời gian, số lượng các dòng sàng lọc trong thư viện phải đủ lớn và chất lượng
24
thư viện phải cao. Bên cạnh đó, một gen hoàn chỉnh có thể biểu hiện được hoạt tính
hay không còn phụ thuộc vào quá trình phiên mã và dịch mã trong tế bào chủ.
Kỹ thuật Metagenomics theo hướng sàng lọc chức năng cần phải có một thư
viện metagenome chứa các đoạn DNA của vi sinh vật có trong mẫu phân tích. Quá
trình tạo thư viện DNA metagenome bao gồm các bước: (i) tách chiết DNA
metagenome trực tiếp từ các mẫu môi trường; (ii) sử dụng enzyme giới hạn cắt toàn
bộ DNA metagenome để tạo ra các đoạn DNA có kích thước đủ lớn, có khả năng
chứa toàn bộ trình tự của các gen có trong mẫu DNA môi trường; (iii) Các đoạn DNA
sau khi cắt bằng enzyme giới hạn được gắn vào vector phù hợp và biến nạp vào chủng
chủ (Simon và Daniel, 2017). Một trong những thách thức lớn nhất của kỹ thuật này
là số lượng các dòng gen để sàng lọc vô cùng lớn với tỷ lệ dòng dương tính là vô
cùng nhỏ. Đồng thời thư viện vẫn phải đảm bảo có chứa các dòng đại diện cho các
loài có mật độ cực ít trong mẫu (<1%) (Riesenfeld và cs., 2004). Các dòng biểu hiện
gen này sau đó được sử dụng để sàng lọc chức năng hoặc sàng lọc gen mong muốn
khác (Hình 1.7).
Mẫu môi trường
Hình 1.7. Các bước chính xây dựng thư viện Metagenomic.
(Nguồn: Dias và cs. (2014)).
1.3.1.2. Khai thác gen mới dựa vào trình tự DNA metagenomes
Những tiến bộ trong công nghệ giải trình tự thế hệ thứ hai và thế hệ thứ ba đã
thúc đẩy những tiến bộ trong kỹ thuật metagenomics. Với các công nghệ hiện nay,
hàng trăm cơ sở dữ liệu đã được giải trình tự DNA với chi phí rất thấp (Watson,
2014). Đồng thời công nghệ này cũng có thể phát hiện được sự có mặt của những vi
25
sinh vật với số lượng cực ít trong môi trường. Công nghệ giải trình tự hiện đại kết
hợp với những cải tiến liên tục trong lĩnh vực tin sinh học đã làm cho phân tích
metagenome trở thành một kỹ thuật dễ tiếp cận, giá cả phải chăng và nhanh chóng
được sử dụng cho hầu hết các phòng thí nghiệm (Roumpeka và cs., 2017). Thông qua
phân tích metagenome từ cơ sở dữ liệu giải trình tự thế hệ mới, nhiều enzyme, chất
xúc tác sinh học mới đã được phát hiện. Wallace và cs. (2015) đã giải trình tự mẫu
ruột dạ cỏ bằng máy giải trình tự Illumina, lắp ráp dữ liệu bằng de novo và chú giải
các contigs. Kết quả thu được cho thấy mẫu nghiên cứu có đến hơn 1,5 triệu gen giả
định với 58% là các protein chưa biết. Trong một nghiên cứu khác, khi phân tích
metagenomic của vi sinh vật sống trong dạ cỏ của bò và cừu đã xác định được 3.970
gen, trong số đó, gen có liên quan đến khả năng sinh khí metan và chuyển hóa hiệu
quả thức ăn đã biết chỉ chiếm tương ứng là 20 và 49 gen (Roehe và cs., 2016). Nghiên
cứu của Sunagawa và cs. (2015) khi khảo sát lấy mẫu đại dương toàn cầu đã phát
hiện 40 triệu trình tự từ hơn 35.000 loài, trong đó chỉ có 0.44% dữ liệu được so sánh
với các gen đã biết. Kết quả nghiên cứu này cho thấy tiềm năng của các gen chưa
được khám phá ở đại dương của chúng ta. Tóm lại, cùng với sự phát triển của các hệ
thống máy giải trình tự gen thế hệ mới và các phần mềm tin sinh, cách tiếp cận
metagenome thông qua giải trình tự đã trở thành một phương pháp khai thác nguồn
gen vi sinh vật vô cùng hiệu quả và nhanh chóng. Hơn nữa, có thể thấy ưu điểm nổi
bật của phương pháp này ở chỗ:
• Các kết quả không bị ảnh hưởng bởi một loại gen đặc hiệu.
• Không phụ thuộc vào các marker di truyền có tính phân loại.
• Đánh giá mức độ đa dạng vi sinh vật sâu, bao gồm virus.
• Ước lượng được sự đa dạng vi sinh vật.
• Phát hiện được vi sinh vật chiếm ưu thế trong các môi trường khác nhau.
• Phân tích vi sinh vật không nuôi cấy được.
• Thông tin về thành phần cũng như các chức năng có thể có của một hệ sinh thái.
• Nghiên cứu các gen và các cụm gen chức năng.
Khai thác gen mới dựa vào trình tự DNA metagenome sử dụng cùng một quy
trình phân tích tin sinh học: (a) lắp ráp các dữ liệu đã được giải trình tự (trực tiếp từ
26
các mẫu môi trường) để xây dựng các trình tự contig, (b) dự đoán các gen (và các
protein giả định) dựa trên dữ liệu được lắp ráp, và (c) dự đoán các domain, chức năng
và các con đường trao đổi chất cho các protein giả định (Hình 1.8).
Hình 1.8. Các bước phân tích tin sinh điển hình cho cơ sở dữ liệu metagenomic.
(Nguồn: Roumpeka và cs. (2017)).
1.3.2. Phương pháp đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA
metagenome
Đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA metagenome của một
hệ sinh thái hay còn gọi là phân loại trình tự là quá trình sắp xếp các trình tự gen vào
các nhóm sao cho mỗi tập con đại diện cho một đơn vị phân loại (taxon) sinh học
riêng biệt. Phân loại và lắp ráp là hai quá trình liên quan với nhau, phân loại có thể
27
được thực hiện trước khi lắp ráp hoặc tích hợp vào trong quá trình lắp ráp (Hình 1.8).
Trong cả hai trường hợp trên, phân loại trình tự cố gắng ngăn chặn việc lắp ráp đồng
thời các gen với nhau. Về lý thuyết, mỗi nhóm đại diện cho một hệ gen riêng và nó
được lắp ráp tách biệt để có thể loại bỏ được vấn đề lắp ráp không chính xác liên quan
đến các contig từ các đơn vị phân loại khác nhau (Roumpeka và cs., 2017).
Dữ liệu metagenomic thường không chứa trình tự của từng loài vi sinh vật riêng
biệt mà bao gồm trình tự của rất nhiều loài khác nhau (có khi hơn 10.000 loài trong
một mẫu (Wooley và cs., 2010). Do đó, một vấn đề quan trọng cần giải quyết trong
giai đoạn phân tích dữ liệu metagenomic là phân chia trình tự vào từng nhóm vi sinh
vật cũng như ước lượng mức độ chiếm ưu thế của chúng trong mẫu. Để phân loại
trình tự metagenomic có thể được chia thành hai nhóm phương pháp chính: phương
pháp có giám sát (supervised methods) và phương pháp không có giám sát
(unsupervised methods). Trong khi phương pháp có giám sát sử dụng cơ sở dữ liệu
tham khảo để phân loại trình tự, phương pháp không có giám sát chỉ dựa trên thông
tin được lấy từ tập dữ liệu đang được phân tích. Phân loại có giám sát thường sử dụng
các công cụ MEGAN (Huson và cs., 2007), CARMA (Krause và cs., 2008), TACOA
(Diaz và cs., 2009) và TAC-ELM (Rasheed và Rangwala, 2012). Các giải pháp được
sử dụng này có thể đạt được mức độ chính xác cao nếu có đầy đủ cơ sở dữ liệu tham
khảo. Tuy nhiên, cho đến nay, chỉ có một tỉ lệ rất nhỏ vi sinh vật đã được phân loại.
Nghiên cứu của Dinsdale và cs. (2008) cho thấy chỉ có khoảng 12% trình tự
metagenomic tương đồng với trình tự trong ngân hàng dữ liệu 16S rDNA. Trong các
phần mềm được sử dụng để phân loại có giám sát, MEGAN là phần mềm thiết kế
mới, cho phép phân tích bộ dữ liệu metagenomic lớn thực hiện trên máy tính xách
tay. Trong bước tiền xử lý, tập hợp các chuỗi DNA được so sánh với cơ sở dữ liệu
của các chuỗi đã biết bằng phần mềm BLAST hoặc một công cụ so sánh khác. Sau
đó MEGAN được sử dụng để tính toán và phát hiện các đơn vị phân loại, cuối cùng
sử dụng nguồn dữ liệu phân loại của NCBI để tóm tắt và sắp xếp kết quả. Kết quả
phân loại phản ánh mức độ bảo thủ của chuỗi được so sánh. Phần mềm cho phép mổ
xẻ bộ dữ liệu lớn mà không cần lắp ráp hoặc nhắm vào các dấu hiệu phát sinh chủng
loại cụ thể. MEGAN là phần mềm hiện được dùng khá phổ biến để phân loại các bộ
28
dữ liệu trình tự metagenome khác nhau. Phân loại không có giám sát thường sử dụng
các phần mềm như LikelyBin, PHYSCIMM. Ngoài ra để phân loại trình tự, chúng ta
có thể sử dụng MetaWatt. MetaWatt là một thuật toán mã nguồn mở có thể dùng cho
bất kỳ hệ thống/nền tảng nào được hỗ trợ bởi Blast và Glimmer. Thuật toán này có
khả năng mở rộng (do thời gian chạy ít hơn) và có thể xử lý số lượng lớn các dữ liệu
giải trình tự. MetaWatt có ưu điểm là có sẵn giao diện đồ họa graphical-user-interface
(GUI), do đó các nhà nghiên cứu ngay cả khi họ không phải là các nhà tin sinh vẫn
có thể dễ dàng sử dụng. Đồng thời, giao diện đồ họa này cho phép người sử dụng có
thể xem và chọn các nhóm cho mô hình Markov nội suy IMM. Dữ liệu đồ họa trả về
dạng SVG và dữ liệu các nhóm là dạng fasta để có thể phân tích và chú giải thêm.
Ngoài các phần mềm đã nêu trên, các nhà nghiên cứu hiện nay còn sử dụng
CONCOCT để phân loại trình tự. CONCOCT là một thuật toán sử dụng mô hình
GMMs (Gaussian mixture models) tự động nhóm các contigs vào hệ gen dựa trên sự
kết hợp giữa thành phần các trình tự và vùng bao phủ trên nhiều mẫu (Roumpeka và
cs., 2017).
1.3.3. Ứng dụng kỹ thuật Metagenomics để đánh giá đa dạng vi sinh vật và khai
thác các gen mã hóa cho enzyme mới
Hầu hết các vi sinh vật tham gia vào quá trình chuyển hóa vật chất trong tự
nhiên vẫn chưa thể phân lập và nuôi cấy riêng rẽ được. Các enzyme mới đã biết đều
được xác định ở mức độ trình tự protein, nhưng các biến thể gen rất khó để khuếch
đại trực tiếp từ DNA môi trường. Trong quá trình nghiên cứu hệ gen của môi trường,
Metagenomics đã trở thành một công cụ hữu ích không chỉ để đánh giá sự đa dạng
của vi sinh vật trong một hệ sinh thái mà nó còn có thể phát hiện được các gen mới
mã hóa cho các enzyme (Culligan và cs., 2014).
1.3.3.1. Đánh giá đa dạng vi sinh vật trong hệ sinh thái
Mỗi hệ sinh thái có sự đa dạng vi sinh vật khác nhau và mang những đặc trưng
riêng bởi số lượng cũng như thành phần vi sinh vật chiếm ưu thế. Bằng phương pháp
nuôi cấy truyền thống không thể đánh giá đầy đủ được tính đa dạng của vi sinh vật
trong hệ sinh thái vì có đến trên 99% vi sinh vật sống trong môi trường là những vi
sinh vật không thể nuôi cấy được (Hahn và cs., 2019). Nhờ sử dụng kỹ thuật
29
metagenomic, bức tranh vi sinh vật đã trở nên phong phú và đa dạng hơn, nhiều loài
mới đã được phát hiện.
Trong các hệ sinh thái vi sinh vật, suối nước nóng là một trong những hệ sinh
thái gặp nhiều khó khăn khi nghiên cứu đa dạng vi sinh vật bởi các chủng vi sinh vật
sống trong hệ sinh thái này chủ yếu là vi sinh vật ưa ấm (mesophilic), chịu nhiệt
(thermotolerant) và siêu ưa nhiệt (hyperthermophiles). Đồng thời đặc điểm sinh lý và
sinh hóa của những loài vi sinh vật của hệ sinh thái này có thể mang những đặc trưng
của môi trường sống như khả năng chịu axit, chịu kiềm, áp suất cao, chịu muối,…
Chúng là những vi sinh vật khó có thể nuôi cấy được trong môi trường nhân tạo. Vi
sinh vật kỵ khí của suối nước nóng được coi là hậu duệ còn sống gần nhất của các
dạng sống sớm nhất trên trái đất. Nghiên cứu về các vi sinh vật này đã cung cấp thêm
những hiểu biết về nguồn gốc cũng như sự tiến hóa của sự sống. Phân tích quần xã vi
khuẩn trong môi trường lỗ thông thủy nhiệt Pakistani cho thấy sự đa dạng di truyền
lớn và hầu hết các thành viên của quần xã này là những vi sinh vật không nuôi cấy
được và chưa được phân loại. Các kết quả cũng hé lộ một số vi sinh vật có kiểu hình
mới được dự đoán bằng phân tích phát sinh chủng loại là những vi sinh vật đặc hữu
của suối nước nóng (Amin và cs., 2018).
Ngoài ra, ứng dụng kỹ thuật metagenomic cũng đã phát hiện được sự đa dạng
của vi sinh vật trong các hệ sinh thái khác như vùng trồng trọt (Wolińska, 2019), phân
bón làm từ rác thải dầu cọ (Khalid và cs., 2019), trong đường ruột của mối (Chew và
cs., 2018), …
1.3.3.2. Khai thác gen mới
Ngoài ứng dụng để đánh giá đa dạng vi sinh vật trong một hệ sinh thái, kỹ thuật
metagenomic còn được sử dụng để khai thác hiệu quả các gen mới mã hóa cho các
chất xúc tác sinh học dựa vào chức năng hoặc dựa vào trình tự hoặc kết hợp cả hai.
Thông qua metagenomic, nhiều chất xúc tác sinh học mới đã được phát hiện từ các
vi sinh vật sống trong các hệ sinh thái khác nhau (Steele và cs., 2009; Culligan và cs.,
2014). Bằng cách tối ưu hóa các thông số hóa lý có thể nâng cao hiệu suất của các
quy trình sản xuất công nghiệp mà hầu hết các enzyme hiện có đều chưa đáp ứng
30
được với các điều kiện này. Do đó, việc sử dụng enzyme trong các quy trình công
nghiệp cần phải được điều chỉnh cho phù hợp. Các enzyme phải chịu được các điều
kiện khắc nghiệt của quá trình sản xuất. Mặc dù, mức độ đa dạng của quần xã vi sinh
vật trong các hệ sinh thái cực đoan có thể thấp nhưng các loài vi sinh vật ở đây vẫn
là nguồn gen tự nhiên để thu nhận các enzyme mới có tính chất đặc biệt, có thể ứng
dụng vào trong các quy trình sản xuất (Steele và cs., 2009). Thông qua sàng lọc thư
viện metagenomic của mẫu đất sa mạc ở Nam Cực đã phát hiện được một esterase
kiềm mới có khả năng hoạt động ở 7°C (Heath và cs., 2009). Ngược lại, Rhee và cs.
(2005) cũng đã phát hiện một esterase mới có khả năng hoạt động ở nhiệt độ cao và
bền nhiệt thông qua sàng lọc thư viện DNA Metagenome vi sinh vật suối nước nóng
vùng solfataric, Tangkuban Perahu, Indonesia.
Cellulase là enzyme có nhiều ứng dụng trong ngành dệt, công nghiệp thực
phẩm, trong ngành công nghiệp giấy và bột giấy. Gần đây, cellulase đã thu hút sự
quan tâm của các nhà khoa học do khả năng ứng dụng của nó vào quá trình thủy phân
lignocellulose thành glucose dùng để lên men sản xuất ethanol thế hệ thứ hai và các
sản phẩm sinh học có giá trị kinh tế. Nhiều cellulase mới đã được phát hiện từ DNA
metagenome của các hệ sinh thái khác nhau. Khai thác dữ liệu giải trình tự DNA
metagenome mẫu làm giàu quần xã vi sinh vật kỵ khí trong bã bia, gen Cel7482 mới
mã hóa cho endo-β-1,4-glucanase đã được phát hiện. Enzyme tái tổ hợp mang gen
Cel7482 có nhiều đặc tính mới như chịu được nồng độ muối cực cao tới 2M NaCl,
không bị bất hoạt bởi ba loại dung môi - là những dung dịch được sử dụng rộng rãi
trong quá trình tiền xử lý cellulose (Yang và cs., 2016). Toyama và cs. (2018) cũng
đã phát hiện ra gen AmBgl-LP mới mã hóa cho β-glucosidase thuộc họ GH1 từ DNA
metagenome vi sinh vật hồ Poraquê ở khu vực Amazon. Mặc dù enzyme tái tổ hợp
mang gen AmBgl-LP có khả năng thủy phân cả cơ chất tổng hợp p-nitrophenyl-β-d-
glucopyranoside (pNPβG) và cơ chất cellobiose tự nhiên nhưng xét về độ đặc hiệu
thì enzyme tái tổ hợp có độ đặc hiệu với pNPβG cao hơn. Enzyme tái tổ hợp hoạt
động tốt ở điều kiện 40C, pH 6 khi sử dụng cơ chất pNPβG. Nghiên cứu cấu trúc ba
chiều và trạng thái oligomeric của enzyme cho thấy mặc dù enzyme có tâm hoạt động
31
dạng monomer giống với cấu trúc của các thành viên khác trong họ GH1 nhưng phức
hệ cơ chất-enzyme AmBgl-LP lại tạo thành dạng dimer bền vững. Phát hiện thành
viên mới thuộc họ GH1 này bằng kỹ thuật metagenomics không những giúp mở rộng
hiểu biết về cơ chế phân tử và tính đa dạng của enzyme mà còn cho phép khảo sát
các ứng dụng của chúng ở quy mô công nghiệp. Tuy nhiên, để khai thác và thu nhận
các cellulase bền nhiệt và chịu được các điều kiện khắc nghiệt của quá trình chuyển
hóa sinh khối lignocellulose thành các sản phẩm có giá trị, vi sinh vật sống trong các
hệ sinh thái địa nhiệt là một trong những nguồn có thể thu nhận cellulase tiềm năng.
Bằng cách tiếp cận metagenomics, nhiều cellulase mới cũng như cellulase bền nhiệt
đã được phát hiện từ hệ sinh thái địa nhiệt như lỗ thông thủy nhiệt (hydrothermal
vents) (Leis và cs., 2015; Placido và cs., 2015), bể địa nhiệt và suối nước nóng
(Graham và cs., 2011; Schroder và cs., 2014). Các cellulase bền nhiệt thu nhận từ
DNA metagenome suối nước nóng đa dạng về thành phần, độ bền nhiệt cũng như
tính bền trong các giá trị pH khác nhau được thống kê và tóm tắt ở Bảng 1.4.
Bảng 1.4. Cellulase bền nhiệt từ metagenome của vi sinh vật ở suối nước nóng.
Enzyme Nhiệt độ tối ưu
pH tối ưu
Độ bền nhiệt
Tài liệu tham khảo
Egl
90ºC
5,5
Liew và cs. (2018)
Egl
65ºC
8,0
Gupta và cs. (2017)
Egl
70ºC
5,0
> 50%; 70ºC; 4h
Zarafeta và cs. (2016)
Egl
109ºC
5,5
50%; 100ºC; 4.5 h
Graham và cs. (2011)
50%; 105ºC; 0.57 h
50%; 108ºC; 0.17 h
Egl
92ºC
5,5
>80%; 80ºC; 4.5 h
(Leis và cs., 2015)
Bgl
90ºC
6,5
> 40%, 105ºC
(Schroder và cs., 2014)
67%; 90ºC; 1.5 h
68%; 60ºC; 24 h
78%; 50ºC; 24 h
Chú thích: Egl) Endoglucanase; Bgl) β–glucosidase.
32
1.3.4. Tình hình ứng dụng metagenomics vào nghiên cứu đa dạng vi sinh vật và
khai thác các gen mã hóa cho cellulase ở Việt Nam
Ở Việt Nam, các nghiên cứu về đa dạng vi sinh vật và enzyme cellulase của
chúng đã được tiến hành từ những năm 2000. Các nghiên cứu này chủ yếu tiếp cận
bằng con đường phân lập và nuôi cấy chủng vi khuẩn, nấm mốc, xạ khuẩn từ các hệ
sinh thái khác nhau (Lý Kim Bảng và cs., 1999; Dinh Kha Trinh và cs., 2013; Nguyễn
Kim Thoa và cs., 2015; Trần Văn Vươn và cs., 2017; Trần Ngọc Diễm My và Nguyễn
Trọng Nhân, 2018). Trong đó, một số enzyme cũng đã được nghiên cứu sâu về đặc
tính (Dinh Kha Trinh và cs., 2013; Nguyễn Kim Thoa và Trần Thanh Thủy, 2018).
Ngoài ra, để nâng cao hoạt tính của nhiều chủng vi sinh vật tự nhiên, các nghiên cứu
để tạo ra cellulase tái tổ hợp cũng đã được tiến hành và thu được kết quả tốt (Trịnh
Đình Khá, 2015; Phan Thị Tuyết Minh và cs., 2016).
Tuy nhiên, bằng các phương pháp phụ thuộc vào nuôi cấy không thể đánh giá
đầy đủ đa dạng vi sinh vật cũng như khai thác được nguồn vật liệu di truyền tiềm
năng mã hóa cho các gen mới nói chung và cho cellulase nói riêng có mặt trong hệ
sinh thái. Do đó, nhằm bắt kịp xu hướng của thế giới trong nghiên cứu đa dạng vi
sinh vật và tiếp cận nguồn gen vi sinh vật không thông qua nuôi cấy, cách đây gần 10
năm (2011-2012) nhóm nghiên cứu của GS. TS. Trương Nam Hải, Viện Công nghệ
Sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã là nhóm tiên phong
ứng dụng kỹ thuật Metagenomic trong khai thác enzyme tham gia vào quá trình phân
giải cellulose, hemicellulose từ khu hệ vi sinh vật ruột mối (Trương Nam Hải, 2011-
2012). Tiếp đó, để thúc đẩy nghiên cứu metagenomics ở Việt Nam nhằm xây dựng
cơ sở dữ liệu về đa dạng sinh học của các hệ vi sinh vật có giá trị cũng như khai thác
các vật liệu di truyền mới mã hóa cho các enzyme, các chất kháng u …có tiềm năng
công nghệ trong sản xuất thuốc, tạo kit chẩn đoán bệnh, phát triển cây trồng, vật nuôi
có giá trị kinh tế, góp phần bảo vệ sức khỏe cộng đồng, phát triển kinh tế bền vững,
bảo vệ môi trường, ngày 23/4/2014, Bộ trưởng Bộ Khoa học và công nghệ đã ban
hành quyết định số 826/QĐ-BKHCN phê duyệt danh mục đặt hàng dự án khoa học
và công nghệ cấp quốc gia: “Nghiên cứu Metagenome của vi sinh vật từ một số môi
33
trường đặc thù nhằm tìm kiếm các gen, enzyme, chất xúc tác sinh học mới để sản
xuất các chế phẩm sinh học phục vụ đời sống, bảo vệ sức khỏe con người và môi
trường” (Phạm Công Hoạt và cs., 2014). Dự án khoa học và công nghệ trên đã được
đặt hàng và giao cho Viện Hàn lâm Khoa học và Công nghệ Việt Nam chủ trì với 5
định hướng nghiên cứu chính gồm: 1) Nghiên cứu metagenome của vi sinh vật vùng
đất ô nhiễm chất diệt cỏ/dioxin nhằm tìm kiếm các gen mới có khả năng phân hủy
dioxin (Đặng Thị Cẩm Hà, 2014-2017); 2) Nghiên cứu metagenome vi sinh vật đất
vùng rễ một số đại diện cây trồng ở Việt Nam: cây thuốc có củ (cây nghệ), cây công
nghiệp (cà phê, lạc) nhằm tăng năng suất và chất lượng cây trồng (Lê Mai Hương,
2014-2017); 3) Nghiên cứu metagenome của ba hệ mini sinh thái tiềm năng nhằm
khai thác các gen mới mã hóa hệ enzyme chuyển hóa hiệu quả lignocellulose (Đỗ Thị
Huyền, 2014-2017); 4) Nghiên cứu metagenome của vi sinh vật trong các đầm nuôi
tôm góp phần tạo cơ sở khoa học để phát triển nghề nuôi tôm ở Việt Nam (Chu Hoàng
Hà, 2014-2018); 5) Nghiên cứu metagenome của vi sinh vật liên kết hải miên tại biển
miền Trung Việt Nam nhằm phát hiện và sàng lọc các chất hoạt tính sinh học (Nguyễn
Thị Kim Cúc, 2014-2018). Một trong năm đề tài nghiên cứu của Dự án đó là: “Nghiên
cứu metagenome của ba hệ mini sinh thái tiềm năng nhằm khai thác các gen mới mã
hóa hệ enzyme chuyển hóa hiệu quả lignocellulose” do PGS. TS. Đỗ Thị Huyền làm
chủ nhiệm. Luận án của nghiên cứu sinh là một phần trong nội dung nghiên cứu của
đề tài trên. Kết quả của Luận án là minh chứng cho việc lần đầu tiên ở Việt Nam, sử
dụng thành công công cụ metagenomics vào đánh giá đa dạng vi sinh vật và khai thác
các gen mã hóa cho cellulase trong suối nước nóng Bình Châu. Cụ thể, thông qua
cách tiếp cận không phụ thuộc vào nuôi cấy, vi sinh vật trong suối nước nóng Bình
Châu đa dạng hơn rất nhiều so với những kết quả nghiên cứu trước đây tiếp cận bằng
phương pháp phụ thuộc vào nuôi cấy chỉ phát hiện thấy vi sinh vật chủ yếu thuộc chi
Bacillus, Geobacillus (Nguyễn Kim Thoa và cs., 2015; Nguyễn Kim Thoa và cs.,
2017; Tran KM và cs., 2018). Đồng thời, kết quả nghiên cứu trong luận án cũng đã
phát hiện được các gen mã hóa cho hệ enzyme thủy phân cellulose và đã được chứng
minh đặc tính của hai gen thông qua thực nghiệm biểu hiện gen trong hệ thống
34
Escherichia coli. Hai gen này mã hóa cho cellulase mới, bền kiềm hơn so với cellulase
của vi sinh vật đã được công bố trong nghiên cứu trước đây của Nguyễn Kim Thoa
và Trần Thanh Thủy (2018) và Nguyễn Kim Thoa và cs. (2015).
35
CHƯƠNG 2
VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Vật liệu
Các mẫu nước và bùn được thu thập từ suối nước nóng Bình Châu, huyện Xuyên
Mộc, tỉnh Bà Rịa – Vũng Tàu ngày 14 tháng 5 năm 2015. Mẫu nước được lấy trực
tiếp từ miệng giếng phun (10º36’03.9’’ Bắc và 107º33’30.0’’ Đông) với nhiệt độ
82°C, pH = 7,5. Bùn được thu thập ở các vị trí khác nhau bên ngoài miệng giếng
phun, dọc theo dòng chảy (10o37’03.9” Bắc và 107o32’30.0” Đông) với nhiệt độ dao
động từ 45 đến 65ºC, pH 7,7 - 9.
2.1.1. Vi sinh vật
- Chủng Escherichia coli TOP10F’ (Thermo Fisher Scientific) được dùng cho
thí nghiệm tách và nhân dòng gen.
- Chủng E. coli JM109(DE3) (Promega) và E. coli C43(DE3) (Lucigen) nhận
từ Phòng thí nghiệm Hóa sinh, Đại học Tổng hợp Saarland (CHLB Đức) được dùng
cho thí nghiệm biểu hiện gen.
2.1.2. Vector
- Vector pJET1.2 (ThermoFisher Scientific)
- Vector pET17b (Novagen). Bản đồ giới hạn của Vector pET17b được trình
bày trong Phụ lục 1.
2.1.3. Cặp mồi sử dụng
Mồi
Trình tự
Gen khuếch đại
KT gen
5’-GATCCATATGCTGCCGCAAGTAGCCGA-3’
18736F
5’GATCAAGCTTAGTGGTGATGGTGATGATGGTGGGT
[denovovenes]_18736
1506 bp
18736R
GCCCTGGTTGTAG3’
5’GATCCATATGGAAAAGAAATTTCCTGAAGGTTTT
32768F
TAT3’
[denovovenes]_32768
1224 bp
5’GATCAAGCTTAGTGGTGATGGTGATGATGTTCTACCAGC
32768R
CCGTTGTTCT3’
Các cặp mồi được tổng hợp tại Công ty Trách nhiệm hữu hạn một thành viên
(TNHH MTV) Sinh hóa Phù Sa (Việt Nam).
36
2.1.4. Gen nghiên cứu
Gen có mã số [denovovenes]_18736 mã hóa cho endoglucanase và
[denovovenes]_32768 mã hóa cho β-glucosidase đã được lựa chọn để tổng hợp và
lưu giữ trong vector pJET1.2 tại Công ty TNHH MTV Sinh hóa Phù Sa (Việt Nam).
Trình tự nucleotide và axit amin của 2 gen này được trình bày ở Phụ lục 2 và 3.
2.1.5. Các hóa chất sử dụng
Các bộ kít: Kit PowerWater® DNA Isolation (MO BIO), Kit PowerMax® Soil
DNA Isolation (MO BIO), kit tinh sạch PCR (GeneJet PCR purification kit - Thermo
Fisher Scientific), kit tách chiết plasmid (GeneJet Plasmid Miniprep Kit - Thermo
Fisher Scientific), kit Fast Link DNA ligation (Epicenter).
Các enzyme sử dụng bao gồm: NdeI, HindIII (Phụ lục 4), CIP (NEB) và Fast
link DNA ligase (Epicenter).
Marker sử dụng gồm: Thermo Scientific™ O'GeneRuler 1 kb DNA Ladder,
protein ladder (10-250 kDa của Promega).
Các hóa chất chính: Carboxymethyl cellulose (low viscosity, Sigma Aldrich:
C5678), DNSA, glucose, p-nitrophenol, p-nitrophenyl-β-glucopyranoside (pNPG)
(Sigma Aldrich), IPTG và các loại hóa chất thông dụng dùng trong sinh học phân tử,
trong hóa sinh, trong nuôi cấy vi sinh vật.
2.1.6. Môi trường nuôi cấy
Môi trường sử dụng để hồi biến, nuôi cấy và biểu hiện chủng tái tổ hợp gồm:
SOC, LB, NB và TB. Thành phần môi trường được thể hiện ở Phụ lục 5.
2.2. Máy móc và thiết bị
Các máy móc và thiết bị dùng trong nghiên cứu bao gồm: bộ điện di DNA
(Pharmacia Biotech), bộ điện di protein (Bio-rad), máy PCR (Applied Biosystems),
máy quang phổ (Labomed, Inc.), máy ly tâm các loại, máy xung điện, máy phá tế
bào, máy đo nồng độ DNA nanoDrop 1000 (Thermo Scientific), máy đo pH, máy lắc
ổn nhiệt, bể ổn nhiệt, box cấy.
2.3. Phương pháp nghiên cứu
2.3.1. Tách chiết DNA metagenome của mẫu suối nước nóng Bình Châu
37
a) Mẫu nước:
Quá trình tách chiết và tinh sạch DNA metagenome từ hệ vi sinh vật ở suối nước
nóng Bình Châu được tiến hành như sau: Khoảng 150 L nước đã được bơm trực tiếp
từ điểm phun của suối nước nóng Bình Châu vào bể chứa vô trùng. Khi nhiệt độ nguội
xuống khoảng 30oC, thực hiện lọc qua màng lọc Ultra filtration (UF – Westerntech,
Việt Nam) với kích thước lỗ 0,4 m, áp suất lọc 1,5 kgf/cm2. Toàn bộ “cặn” của quá
trình lọc được giữ trong lõi lọc sau đó được chuyển sang bình Scott vô trùng. Tiến
hành lọc lần 2 bằng hệ thống lọc hút chân không (Millipore) qua giấy lọc với kích
thước lỗ 0,22 m. Thu mẫu giấy lọc và chuyển vào PowerWater® Bead Tube (MO
BIO). Toàn bộ công đoạn sau của quá trình tách được thực hiện theo sự hướng dẫn
của nhà sản xuất Kit PowerWater® DNA Isolation (MO BIO).
b) Mẫu bùn:
Bốn mẫu bùn được thu thập tại 4 vị trí có nhiệt độ khác nhau (45-65oC) của suối
nước nóng. Các mẫu được đồng nhất trước khi cân 10 g để làm nguyên liệu tách DNA
metagenome theo hướng dẫn của nhà sản xuất Kit PowerMax® Soil DNA Isolation
(MO BIO).
Kiểm tra chất lượng DNA metagenome bằng phương pháp điện di trên gel
agarose 0,8%. Nồng độ và độ tinh sạch DNA được xác định trên máy quang phổ
NanoDrop 1000 (Thermo Scientific) ở bước sóng 260, 280 và 230 nm. Nồng độ DNA
được tính theo công thức:
Nồng độ DNA (μg/ml) = A260× f × xε
Trong đó:
A260: Độ hấp phụ ở bước sóng 260 nm
f: Hệ số pha loãng
xε: Hệ số hấp phụ của sợi kép DNA ở bước sóng A260 = 50 μg/ml
Độ tinh sạch của DNA được đánh giá thông qua tỷ lệ A260/A280, A260/A230. DNA
được coi là sạch, đủ chất lượng cho các thí nghiệm tiếp theo khi tỷ lệ này nằm trong
khoảng 1,8 ÷ 2,0.
2.3.2. Giải trình tự DNA metagenome suối nước nóng Bình Châu
DNA metagenome của khu hệ vi sinh vật ở suối nước nóng Bình Châu được gửi đi
giải trình tự bằng thiết bị giải trình tự thế hệ mới Illumina HiSeqTM platform 2500 tại công
ty BGI (Hongkong). Dữ liệu sau khi đọc trình tự được lưu ở dạng file fastq.
38
2.3.3. Các phương pháp tin sinh
2.3.3.1. Xử lý, phân tích dữ liệu giải trình tự DNA metagenome và sàng lọc gen mã
hóa enzyme thủy phân cellulose tiềm năng
Chất lượng đọc trình tự được đánh giá bằng phần mềm FastQC. Quá trình tiền
xử lý dữ liệu nhằm loại bỏ trình tự chất lượng kém được thực hiện bằng công cụ
Trimmomatic (Bolger và cs., 2014). Quá trình phân tích dữ liệu giải trình tự DNA
metagenome và sàng lọc gen mã hóa enzyme thủy phân cellulose tiềm năng được tiến
hành theo các bước như mô tả trong Hình 2.1.
Dữ liệu thô
(Đánh giá chất lượng giải trình tự bằng FastQC)
Tinh sạch dữ liệu thô
(Trimmomatic)
Lắp ráp thành các Contig
(SOAP denovo2)
Dự đoán khung đọc mở (ORF)
(MetaGeneMark v2.10)
Phân loại trình
tự (nr, MEGAN) Chú giải chức năng các ORF
(Dựa vào các CSDL: nr, Swiss-Prot, CAZy, KEGG)
Sàng lọc gen mã hóa enzyme thủy phân cellulose tiềm năng
(Blast, Tm, Acalpred, % G ~ C content)
Hình 2. 1. Quy trình xử lý, phân tích dữ liệu DNA metagenome và sàng lọc gen
mã hóa cho enzyme thủy phân cellulose tiềm năng.
Dữ liệu DNA metagenome của khu hệ vi sinh vật ở suối nước nóng Bình Châu
được lắp ráp để tạo thành contig bằng phần mềm SOAPdenovo2 (Luo và cs., 2012)
với các thông số mặc định (kích cỡ Kmer, chiều dài contig ngắn nhất). Công cụ
39
Bowtie2 (Langmead và Salzberg, 2012) được sử dụng nhằm dóng hàng các đoạn đọc
ngắn với những contig được lắp ráp, qua đó những đoạn trình tự lỗi được loại bỏ. Kết
quả lắp ráp được đánh giá bằng phần mềm QUAST (Gurevich và cs., 2013). Sau khi
lắp ráp, chỉ những contig có độ dài lớn hơn 500 bp được sử dụng cho các bước phân
tích tiếp theo.
MetaGeneMark (Zhu và cs., 2010) (version 2.10 với các thông số mặc định,
http://exon.gatech.edu/GeneMark/metagenome/Prediction/) được sử dụng để dự
đoán khung đọc mở (ORFs) dựa trên kết quả lắp ráp. Các gen từ các mẫu khác nhau
được kết hợp với nhau và được nhóm lại bằng CD-Hit (Li và Godzik, 2006) với
ngưỡng nhận dạng trình tự là 95% và ngưỡng bao phủ trình tự là 90%. Tất cả các khung
đọc mở sau đó được so sánh với ngân hàng dữ liệu NCBI (Pruitt và cs., 2007), CAZy,
Swiss-Prot, KEGG, nr bằng công cụ Blast++ (e-value < 0.00001) nhằm tìm ra trình tự
protein có mức độ tương đồng cao nhất . Qua đó các trình tự được phân loại, dự đoán
chức năng và sàng lọc ORF mã hóa nhóm enzyme thủy phân cellulose. Cụ thể: phần
mềm MEGAN, version 4.6 (Huson và cs., 2007) được sử dụng để phân loại trình tự
dựa trên thuật toán LCA (lowest common ancestor) với các thông số mặc định
minScore = 50, topPercent = 10, minSupport = 50 (mức độ chiếm ưu thế tổng số là 100
và các loài có mức độ chiếm ưu thế nhỏ hơn 0,5 trong mẫu được phân loại thành 'loại
khác' trong các cấp độ phân loại khác nhau). Đồng thời, từ các ORF mã hóa cho
enzyme thủy phân cellulose, sử dụng các phần mềm khác nhau để dự đoán tính chất
của protein do gen mã hóa. Phần mềm tính toán chỉ số Tm - nhiệt độ nóng chảy của
protein (Melting temperature) (Ku và cs., 2009) được sử dụng để dự đoán khả năng
chịu nhiệt của enzyme. Chỉ số Tm được dự đoán chi tiết với ba ngưỡng chính <0, 0-
1 và > 1. Chỉ số Tm càng tiệm cận 1 thì nhiệt độ nóng chảy càng cao (≥65oC).
Phần mềm tính toán % G ~ C (https://www.sciencebuddies.org/science-fair-
projects/references/genomics-g-c-content-calculator) được sử dụng để xác định tỷ lệ
GC. Phần mềm AcalPred (Lin và cs., 2013) được sử dụng để dự đoán enzyme có tính
kiềm hay axit. Kết quả dự đoán được chấp nhận nếu xác suất dự đoán trên 0,5. Công
40
cụ trực tuyến Protein - Sol được sử dụng để dự đoán độ hòa tan của protein từ trình tự
(Hebditch và cs., 2017). Ở hệ thống biểu hiện E. coli, chỉ số Protein - Sol trung bình là
0,45, do đó tất cả những protein có chỉ số này > 0,45 được dự đoán là có tính tan trong khi
những protein có chỉ số Protein - Sol < 0,45 thường ở dạng ít hoặc không tan.
2.3.3.2. Dự đoán nguồn gốc của gen và xây dựng cây phát sinh chủng loại
Gen đích được dự đoán nguồn gốc bằng công cụ Blast-Explorer của phần mềm
phân tích Phylogeny (Dereeper và cs., 2010). Trình tự axit amin của các protein được
dóng hàng để tìm kiếm các đoạn tương đồng bằng phần mềm ClustalX (Larkin và cs.,
2007) và được dựng cây phát sinh chủng loại bằng phần mềm MEGA-X (Kumar và
cs., 2018). Công cụ Find best DNA/protein models được sử dụng để xác định mô hình
tiến hóa protein tốt nhất. Quá trình phân tích cây được kiểm tra bằng Bootstrap với
500 lần lặp lại (resampling).
2.3.3.3. Dự đoán mô hình cấu trúc
Sử dụng các phần mềm Scanprosite của ExPASy (https://prosite.expasy.org/)
để xác định vị trí tâm hoạt động, SignalP-5.0 (Armenteros và cs., 2019) để dự đoán
peptide tín hiệu và cơ sở dữ liệu vùng bảo thủ Cdd/Sparcle của NCBI để tìm kiếm
vùng bảo thủ của enzyme (Marchler-Bauer và cs., 2017). Cấu trúc 3D của protein
được xây dựng dựa vào công cụ Swissmodel của ExPASY (Waterhouse và cs., 2018),
đồng thời phần mềm Disulfind (Ceroni và cs., 2006) được sử dụng để dự đoán cầu
liên kết disulfide giữa các axit amin Cys trong cấu trúc của gen denovogenes_18736
và denovogenes_32768.
2.3.3.4. Kiểm tra vị trí cắt của enzyme giới hạn trên gen đích
Công cụ NEBcutter (Vincze và cs., 2003) được sử dụng để tìm các vị trí cắt của
các enzyme giới hạn trên gen đích.
2.3.4. Khuếch đại gen endoglucanase_18736 và β-glucosidase_32768
Để biểu hiện gen đích, đoạn khung đọc mở của các gen tổng hợp
endoglucanase và β-glucosidase được khuếch đại từ vector pJET1.2 mang đoạn
gen này.
41
Thành phần phản ứng cho tổng thể tích 25 µl như sau:
Go Taq Green master mix (2x) 12,5 µl
Mồi 18736F / 32768F (10 pmol) 0,5 µl
Mồi 18736R / 32768R (10 pmol) 0,5 µl
Khuôn pJET1.2 mang trình tự từng ORF (10 ng) 0,5 µl
11,0 µl ddH2O
Phản ứng được thực hiện ở điều kiện sau:
95oC 3 min
95oC 30 s
30 chu kỳ
66oC 1 min
72oC 1 min 30 s
72oC 5 min
4oC
Sản phẩm PCR được kiểm tra bằng phương pháp điện di trên gel agarose 0,8%
và được làm sạch theo sự hướng dẫn của nhà sản xuất Kit GeneJET PCR Purification
(Thermo Fisher Scientific).
2.3.5. Tạo vector biểu hiện pET-17b gắn các đoạn gen endoglucanase_18736/ β-
glucosidase_32768
Vector pET-17b (Novagen) mang T7 promoter ở đầu N, vùng tạo dòng, T7
terminator, pBR322 origin được cắt mở vòng với hai enzyme giới hạn HindIII và
NdeI (NEB) và loại gốc phosphate với CIP (NEB). Thành phần phản ứng mở vòng
như sau:
Đệm Smart cutter (10X): 2 µl
NdeI (10 U/µl): 1 µl
Plasmid (152 ng/µl): 7 µl
9 µl dH2O:
Phản ứng được ủ ở 37C trong 60 phút. Enzyme NdeI được bất hoạt bằng cách
nâng nhiệt độ phản ứng lên 65oC trong 5 phút. Sau đó bổ sung 1 µl HindIII vào phản
ứng và ủ mẫu ở 37C trong 60 phút. Kết thúc quá trình ủ, enzyme HindIII được bất
hoạt ở 80C trong 10 phút.
42
Vector pET-17b sau khi được cắt mở vòng, tiếp tục loại gốc phosphate để ngăn
sự đóng vòng trở lại. Thành phần phản ứng loại gốc phosphate như sau:
Đệm Smart cutter (10X): 1,5 µl
Plasmid đã mở vòng (50 µg/ml): 7,0 µl
CIP (1000 U/ml): 0,7 µl
5,8 µl dH2O:
Phản ứng ủ ở 37C trong 60 phút. Làm sạch plasmid bằng Kit GenJET Gel
extraction (Thermo Fisher Scientific).
Mặt khác, các sản phẩm khuếch đại gen endoglucanase_18736 và β-
glucosidase_32768 trong Mục 2.3.4 cũng được cắt tạo đầu dính với 2 enzyme tương
ứng HindIII và NdeI (NEB). Làm sạch đoạn gen bằng Kit GenJET Gel extraction
(Thermo Fisher Scientific).
Các đoạn gen endoglucanase_18736 và β-glucosidase_32768 được gắn vào
vector pET-17b đã mở vòng tại 2 vị trí HindIII và NdeI bằng Kit Fast Link DNA
ligation (Epicenter) với thành phần phản ứng như sau (15 µl):
1,0 µl Đệm Fast-link ligation (5X):
0,75 µl ATP (10 mM)
1,0 µl pET17b mở vòng (50 µg/ml):
Đoạn gen endoglucanase_18736/β-glucosidase_32768 (50 µg/ml ) 4,0 µl
7,25 µl ddH2O:
1 µl Fast link DNA ligase (5 U/µl)
Hỗn hợp được ủ 15 phút ở nhiệt độ phòng (22-25C) trước khi bất hoạt enzyme
ở 70C trong 15 phút.
2.3.6. Biến nạp vector biểu hiện pET-17b chứa các đoạn gen
endoglucanase_18736/ β-glucosidase_32768 vào E. coli TOP10F’ bằng
phương pháp xung điện
Tế bào khả biến E. coli TOP10F’được sử dụng để nhân dòng gen. Một microlit
sản phẩm gắn vector pET17b với các đoạn gen Endoglucanase_18736 và β-
glucosidase_32768 ở Mục 2.3.5 được trộn vào tế bào khả biến E. coli TOP10F’ (40µl)
43
và để trên đá 5-10 phút. Đồng thời các cuvette (độ rộng của khe 1 mm) cũng được
đặt trên đá. Chuyển dịch tế bào vào cuvette và tiến hành xung điện ở hiệu điện thế
1800-2000 V. Phục hồi tế bào trong 1 ml môi trường SOC, lắc trong 1 giờ ở 37C.
Dịch biến nạp sau đó được cấy trải (100 µl) lên môi trường thạch đĩa LB có bổ sung
ampicillin (100 µg/ml) và ủ qua đêm ở 37C.
2.3.7. Chọn lọc dòng E. coli mang vector pET17b-18736/ và pET17b-32768
Từng dòng khuẩn lạc E. coli TOP10F’ mọc trên đĩa môi trường LB (sản phẩm Mục
2.3.6) được nuôi riêng trên môi trường LB lỏng có bổ sung ampicillin qua đêm ở 37C.
Để kiểm tra và chọn dòng mang gen mong muốn, plasmid từ các dòng tế bào được
tách bằng Kit GeneJET Plasmid miniprep (Thermo Fisher Scientific) và cắt kiểm tra
bằng hai enzyme giới hạn HindIII và NdeI. Sản phẩm cắt được kiểm tra bằng điện di
trên gel agarose 0,8%. Những dòng plasmid nào xuất hiện hai băng đúng kích thước
tương ứng của vector pET-17b (3306 bp) và của các đoạn gen denovogenes_18736
(1506 bp); denovogenes_32768 (1224 bp) được giữ lại và gửi đi đọc trình tự gen tại
Công ty TNHH MTV Sinh hóa Phù sa.
Các dòng có trình tự gen đảm bảo đủ và đúng bộ ba mã hóa từ promoter đến mã
khởi đầu của các gen denovogenes_18736 và denovogenes_32768 được bảo quản ở
-20C cho các thí nghiệm tiếp theo.
2.3.8. Tạo chủng E. coli tái tổ hợp mang vector pET-17b_18736 và pET-
17b_32768
Các plasmid pET-17b_18736 và pET-17b_32768 sau khi giải trình tự để đảm
bảo đúng mã di truyền được biến nạp vào tế bào E. coli JM109(DE3) và E. coli
C43(DE3) bằng phương pháp sốc nhiệt. Cụ thể: Ống Eppendorf 1,5 ml có chứa 40 µl
tế bào khả biến E. coli JM109(DE3)/E. coli C43(DE3) được làm tan trên đá. Sau đó,
plasmid (1 µl) được bổ sung vào ống và giữ ống trên đá 5-10 phút. Ống Eppendorf
(có chứa tế bào khả biến và plasmid) được lấy ra và ủ ở 42C trong 90 giây. Tế bào
sau khi biến nạp được phục hồi trong 1 ml môi trường SOC, lắc 200 rpm/phút trong
1 giờ ở 37C. Dịch biến nạp sau đó được cấy trải (100 µl) trên đĩa môi trường LB có
bổ sung ampicillin (100 µg/ml), nuôi qua đêm ở 37C. Từng dòng khuẩn lạc E. coli
44
JM109(DE3) và E. coli C43(DE3) được cấy riêng rẽ vào ống thạch nghiêng LB có
bổ sung kháng sinh, đồng thời được nhân lên trên môi trường LB dịch thể + ampicillin
(100 g/ml) qua đêm ở 37C. Plasmid từ các dòng tế bào được tách bằng Kit GeneJET
Plasmid miniprep (Thermo Fisher Scientific) và cắt kiểm tra bằng hai enzyme giới
hạn HindIII và NdeI. Sản phẩm cắt được kiểm tra bằng điện di trên gel agarose 0,8%.
Những dòng plasmid nào có xuất hiện hai băng đúng kích thước của vector pET-17b
(3306 bp) và của các đoạn gen denovogenes_18736 (1506 bp) và
denovogenes_32768 (1224 bp) thì ống tế bào tương ứng được giữ lại, nhân giống và
bảo quản trong glycerin ở -80oC.
2.3.9. Biểu hiện gen denovogenes_18736 và denovogenes_32768
Nhân giống trong bình tam giác
Các chủng E. coli JM109(DE3) và E. coli C43(DE3) mang vector pET-
17b_18736/pET-17b_32768 được hoạt hóa trên đĩa môi trường LB thạch đặc có bổ
sung ampicillin (100 µg/ml) bằng phương pháp cấy vạch. Các đĩa được ủ ở 37C
trong khoảng 16 giờ.
Khuẩn lạc đơn được cấy chuyển vào 20 ml môi trường LB + ampicillin (100
µg/ml) và nuôi ở 37ºC, lắc 200 vòng/phút trong khoảng 16 giờ.
Biểu hiện gen denovogenes_18736 và denovogenes_32768
Giống sau khi được chuẩn bị sẽ được cấy chuyển vào bình tam giác có dung
tích 500 ml chứa 100 ml các môi trường (LB, NB hoặc TB) với tỷ lệ giống 5%, nuôi
lắc 200 rpm ở 37oC trong 2-3 giờ cho đến khi OD600 đạt 0,6-0,8 thì bổ sung 1 mM
IPTG và hạ nhiệt độ xuống 30oC. Tiếp tục nuôi lắc 200 rpm trong 48 giờ. Ly tâm thu
sinh khối ở 6000 rpm trong 10 phút, loại bỏ dịch nổi và bảo quản ở -20oC cho thí
nghiệm xác định trọng lượng tế bào và hoạt tính enzyme thô.
2.3.10. Xác định trọng lượng sinh khối khô
Sinh khối được sấy khô ở 105C đến trọng lượng không đổi để xác định trọng
lượng sinh khối khô.
2.3.11. Phương pháp thu nhận enzyme thô
Cặn tế bào (sản phẩm mục 2.3.9) được rã đông và được hòa vào trong đệm phá
tế bào (Phụ lục 6). Tế bào sau đó được phá bằng sóng siêu âm trong 20 phút trên đá
45
(Pulse on 15s, pulse off 11s, Amp 50%). Dịch phá tế bào được ly tâm ở 35.000 rpm
trong 60 phút để thu dịch enzyme thô.
2.3.12. Phương pháp xác định hoạt tính endoglucanase
- Định tính endoglucanase: Hoạt tính endoglucanase được xác định theo phương
pháp khuếch tán trên đĩa thạch của Sharma và Guptasarma (2017) cải tiến. Dịch
enzyme (50 μl) được nhỏ vào giếng trên đĩa thạch có chứa 1 % CMC (w/v). Sau đó,
đĩa thạch được ủ ở 4C trong 4 giờ để dịch enzyme khuếch tán vào thạch trước khi
chuyển vào tủ ấm 55C, ủ 16-18 giờ. Hoạt tính endoglucanase được xác định bằng
đường kính vòng phân giải sau khi nhuộm bằng dung dịch 0,1 % Congo red (w/v) và
tẩy nhuộm bằng dung dịch 1M NaCl.
- Định lượng endoglucanase: Hoạt tính endoglucanase được xác định theo
phương pháp của Ghose (1987) cải tiến. Hỗn hợp phản ứng (500 µl enzyme trộn với
500 µl dung dịch 1% CMC pha trong 50 mM đệm Tris, pH 7) được ủ ở nhiệt độ 55ºC
trong 30 phút. Sau đó dừng phản ứng bằng cách thêm vào 3 ml thuốc thử
dinitrosalycilic (DNS). Các mẫu được đun sôi trong 5 phút, làm nguội nhanh trong
nước lạnh để ổn định màu. Lượng đường khử sinh ra (dưới dạng glucose) được xác
định theo Miller (1959). Độ hấp thụ được đo ở bước sóng 540 nm. Độ hấp thụ của
mẫu được xác định sau khi đã trừ cho mẫu đối chứng (Hỗn hợp phản ứng giữ nguyên
nhưng enzyme được bổ sung vào sau khi đã dừng phản ứng). Một đơn vị enzyme
được định nghĩa là lượng enzyme cần thiết để tạo ra 1 μmol glucose trong một phút
ở điều kiện nhiệt độ và pH phản ứng nhất định.
𝟎,𝟏𝟖𝟓
Hoạt tính endoglucanase được tính toán theo công thức:
𝑵ồ𝒏𝒈 độ 𝒆𝒏𝒛𝒚𝒎𝒆 để 𝒈𝒊ả𝒊 𝒑𝒉ó𝒏𝒈 𝒓𝒂 𝟎,𝟓 𝒎𝒈 𝒈𝒍𝒖𝒄𝒐𝒔𝒆
CMCase (U/ml) =
2.3.13. Phương pháp xác định hoạt tính -glucosidase
- Định tính β-glucosidase: Hoạt tính β-glucosidase được xác định theo phương
pháp của Veena và cs. (2011) cải tiến. Dịch enzyme (50 μl) được nhỏ vào giếng thạch
có chứa esculin (3 g/l) và ferric ammonium citrate (0.2 g/l). Sau đó, đĩa thạch được ủ
ở 4C trong 4 giờ để dịch enzyme khuếch tán vào thạch trước khi chuyển vào tủ ấm
46
55C, ủ 16-18 giờ. Hoạt tính β-glucosidase được xác định bằng đường kính vòng
phân giải esculin có màu nâu sẫm hình thành xung quanh giếng.
- Định lượng β-glucosidase: Hoạt tính β-glucosidase được xác định theo phương
pháp của Shi và cs. (2017) cải tiến, sử dụng p-nitrophenyl-β-D-glucopyranoside (p-
NPG) làm cơ chất phản ứng.
Hỗn hợp phản ứng (500 µl enzyme trộn với 500 µl dung dịch 20 mM p-NPG và
1 ml dung dịch đệm 50 mM Tris, pH 7) được ủ ở nhiệt độ 55ºC trong 15 phút. Sau
đó 2 ml dung dịch 200 mM Na2CO3 được thêm vào hỗn hợp để dừng phản ứng. Lượng
p-NP giải phóng ra được xác định bằng mức độ hấp thụ ở bước sóng 400 nm. Các
mẫu đối chứng được tiến hành song song. Trong đó, ở mẫu đối chứng, dịch enzyme
được thêm vào sau khi đã kết thúc phản ứng bằng 2 ml dung dịch 200 mM Na2CO3.
Một đơn vị hoạt tính enzyme được định nghĩa là lượng enzyme cần thiết xúc tác
phản ứng để giải phóng ra 1 mol p- nitrophenyl (p-NP) từ p-NPG trong thời gian
một phút ở điều kiện phản ứng.
A(Athí nghiệm −Ađối chứng) Vt df
Hoạt tính β-glucosidase được tính toán theo công thức:
18,1 1,0 t Vs
β-glucosidase(U/ml)= = A 0,0295 df
β-glucosidase (U/mg) = (U/ml) x 1/C
Trong đó:
Vt: Tổng thể tích phản ứng (4,0 ml)
Vs: Thể tích enzyme phản ứng (0,5 ml)
18,1: Hệ số hấp thụ millimol của p-NP trong điều kiện thí nghiệm (cm2/micromol)
1,0: Chiều dài đường truyền ánh sáng đi qua cuvet (cm)
t: Thời gian phản ứng (15 phút)
df: Hệ số pha loãng
C: Nồng độ enzyme trong dung dịch (c mg/ml)
2.3.14. Ảnh hưởng của một số yếu tố lên mức độ biểu hiện endoglucanase_18736
và β-glucanase_32768
- Ảnh hưởng của thành phần môi trường: Các bước được thực hiện tương tự
như Mục 2.3.9. Chủng E. coli C43(DE3) tái tổ hợp mang vector pET17b_18736 và
47
chủng E. coli C43(DE3) tái tổ hợp mang vector pET17b_32768 được nhân giống trên
môi trường LB trước khi chuyển sang biểu hiện trên 3 loại môi trường NB, LB và
TB. Hiệu suất biểu hiện được đánh giá thông qua trọng lượng sinh khối và hoạt tính
của enzyme dung hợp.
- Ảnh hưởng của độ thoáng khí: Các bước được thực hiện tương tự như Mục
2.3.9. Chủng E. coli C43(DE3) tái tổ hợp mang vector pET17b_18736 và chủng E.
coli C43(DE3) tái tổ hợp mang vector pET17b_32768 được nhân giống trên môi
trường LB trước khi chuyển vào các bình tam giác (thể tích 500 ml) chứa môi trường
TB với các thể tích khác nhau 50 - 300 ml (tương ứng 10-60% thể tích bình). Quá
trình biểu hiện được thực hiện ở 30oC, 200 rpm trong 48 giờ. Hiệu suất biểu hiện
được đánh giá thông qua trọng lượng sinh khối và hoạt tính của enzyme dung hợp.
- Ảnh hưởng của nồng độ IPTG: Các bước được thực hiện tương tự như Mục
2.3.9. Nuôi cấy chủng tái tổ hợp E. coli C43(DE3) trong bình tam giác (thể tích 500
ml) có chứa 100 ml môi trường TB cho đến khi OD600 đạt 0,6-0,8, bổ sung IPTG với
các nồng độ 0,25-1,5mM. Hiệu suất biểu hiện được đánh giá thông qua trọng lượng
sinh khối và hoạt tính của enzyme dung hợp.
2.3.15. Động thái sinh trưởng và sinh endoglucanase, β-glucosidase tái tổ hợp
Các bước được thực hiện tương tự như Mục 2.3.9. Các chủng E. coli C43(DE3)
tái tổ hợp được nuôi trong bình tam giác (500 ml) có chứa 100 ml môi trường TB.
Quá trình biểu hiện được thực hiện sau khi cảm ứng 0,25 mM IPTG, nuôi cấy ở 30oC,
lắc 200 rpm. Mẫu được lấy mỗi 6 tiếng trong 48 giờ để xác định trọng lượng sinh
khối và hoạt tính của enzyme dung hợp.
2.3.16. Tinh sạch endoglucanase và β-glucosidase tái tổ hợp
Nguyên lý: Cột niken được sử dụng cho sắc ký ái lực cố định ion kim loại
(IMAC) để tinh sạch protein tái tổ hợp có gắn đuôi His-tag bởi niken có ái lực cao
với đuôi polyhistidin trong khi các protein khác có ái lực thấp hoặc không có ái lực.
Do đó, khi đi qua cột sắc ký IMAC-Ni2+, protein tái tổ hợp có gắn đuôi His-tag sẽ
hình thành liên kết giữa Ni2+ với đuôi 6xHis trong phân tử protein và được giữ lại
trên cột. Còn các protein khác không hình thành liên kết với Ni2+ sẽ đi ra khỏi cột.
48
Các protein liên kết với Ni2+ sau đó được rửa giải bằng đệm có bổ sung imidazole ở
nồng độ cao (thường từ 200 mM trở lên).
Tiến hành: Tất cả các bước trong thí nghiệm đều được tiến hành ở nhiệt độ lạnh
4ºC. Cân bằng cột IMAC-Ni2+ bằng đệm A (50 mM đệm potassium phosphate, pH
7.4, 500 mM natri acetate, 10% glycerol, 0,1 mM DTEm 1% natri cholat, 1% Tween
20 và 0,1 mM PMSF). Pha loãng enzyme thô cũng bằng đệm A với tỷ lệ 1:4 trước
khi đưa mẫu enzyme lên cột. Rửa cột bằng 50 ml đệm rửa (đệm A + 10 - 40 mM
imidazol). Endoglucanase tái tổ hợp được đẩy ra khỏi cột bằng đệm B (Đệm A + 250
mM imidazol). β-Glucosidase tái tổ hợp được đẩy ra khỏi cột bằng đệm đẩy C (Đệm
A + 200 mM imidazol).
Dịch đẩy ra khỏi cột sắc ký được thu lại thành các phân đoạn (1 ml/phân đoạn)
với tốc độ 2 ml/ phút. Imidazole được loại bỏ bằng phương pháp thẩm tích. Các phân
đoạn sau đó được kiểm tra hoạt tính theo phương pháp định tính như đã mô tả trong
Mục 2.3.12 và 2.3.13. Hai phân đoạn có hoạt tính cao nhất được gom lại, loại bớt
nước để đạt thể tích mong muốn. Sản phẩm enzyme sau đó được xác định hoạt tính
riêng, kiểm tra độ tinh sạch bằng điện di trên gel polyacrylamid và phân tích
zymogram.
2.3.17. Định lượng protein tổng số
Protein tổng số được định lượng theo phương pháp Bradford (1976) và nồng độ
protein được xác định dựa trên đường chuẩn BSA từ nồng độ 25–125 µg/ml (Phụ lục
7), khi tác dụng với thuốc thử Coomassie Brilliant Blue (Phụ lục 8) tạo phức hợp màu
có độ hấp thụ ở bước sóng 595 nm.
Cách tiến hành: Trộn 100 l mẫu + 900 μl dung dịch thuốc thử. Trộn đều và sau
10 phút đo độ hấp thụ protein ở bước sóng 595 nm. Ở mẫu đối chứng, dịch protein
được thay bằng dung dịch 0,15 M NaCl. Dựa vào hàm số tương quan giữa nồng độ
protein và độ hấp thụ để suy ra nồng độ protein trong mẫu.
2.3.18. Điện di protein SDS-PAGE
Nguyên lý: Việc phân tách protein theo khối lượng phân tử của chúng được tiến
hành theo phương pháp điện di gel SDS-PAGE của Laemmli (1970). Các phân tử
49
protein trong môi trường có SDS thường duỗi thẳng và tích điện âm. Do đó, khi điện
di, các phân tử protein này sẽ di chuyển về phía cực dương trong điện trường với tốc
độ phụ thuộc vào khối lượng phân tử của chúng.
Tiến hành: Dung dịch gel tách (separating gel) được chuẩn bị các thành phần
như mô tả ở Phụ lục 9, sau đó được rót cẩn thận vào giữa các tấm kính với chiều cao
khoảng ¾ chiều cao tấm kính. Sau khi lớp Gel tách được polymer hóa, tiếp tục rót
dung dịch gel cô (stacking gel) với thành phần được mô tả ở Phụ lục 9 lên trên và cẩn
thận cài lược vào giữa 2 tấm kính. Sau khi lớp gel cô polymer hóa, bảo quản các bản
Gel ở 4C cho đến khi sử dụng.
Xử lý mẫu trước khi điện di: Mẫu được hòa vào trong đệm 2x SDS (Phụ lục 9)
với tỷ lệ 1:1 (v/v), trộn đều, ủ ở 100ºC trong 5 phút để biến tính protein.
Tra mẫu và protein marker vào các giếng. Các protein được phân tách trên bản
Gel ở cường độ 80-100 mA cho đến khi mẫu chạy đến sát đáy Gel. Gỡ bản gel, nhuộm
bằng thuốc nhuộm Coomassie brilliant blue (Phụ lục 9) trong 30 phút, sau đó rửa lại
bằng dung dịch tẩy nhuộm (Phụ lục 9) cho đến khi quan sát được các băng protein
riêng rẽ.
2.3.19. Kiểm tra hoạt tính endoglucanase bằng Zymogram (Điện di protein trên
gel polyacrylamide có chứa cơ chất CMC)
Điện di protein trên gel polyacrylamide có chứa cơ chất CMC được tiến hành
theo phương pháp của Sharma và Guptasarma (2017) cải tiến. Các bước điện di được
tiến hành giống như điện di protein ở mục 2.3.18. Tuy nhiên có một vài thay đổi như
sau: thành phần gel tách được bổ sung 0,5% CMC; kết thúc quá trình điện di, protein
trong gel được hồi biến bằng cách ngâm bản gel trong dung dịch đệm Tris 50 mM,
pH 8,5 có chứa 1% Triton X - 100 (v/v) khoảng 1 giờ; bản gel được rửa lại trong dung
dịch đệm Tris 50 mM, pH 8,5 và tiếp tục sử dụng đệm Tris để ngâm ủ gel 4 giờ ở 4°C
và chuyển sang ủ ở 55°C qua đêm trước khi nhuộm gel bằng dung dịch 0,1 % Congo
red trong 30 phút; cuối cùng bản gel được tẩy nhuộm bằng dung dịch NaCl 1M. Băng
protein có hoạt tính thủy phân cellulose được xác định tương ứng với vùng không
màu xuất hiện trên nền bản gel có màu đỏ của thuốc nhuộm Congo Red.
50
2.3.20. Kiểm tra hoạt tính β-glucosidase bằng Zymogram
Zymogram được tiến hành theo phương pháp của Neddersen và Elleuche (2015)
cải tiến. Kết thúc quá trình điện di protein ở mục 2.3.18, bản gel được lấy ra và ngâm
trong dung dịch 1% Triton X- 100 (v/v) khoảng 1 giờ. Sau đó, bản gel được tiếp tục
chuyển sang ngâm trong dung dịch đệm Tris 50 mM, pH 8,5, 5 phút. Cuối cùng, bản
gel được ủ trong dung dịch đệm Tris 50 mM, pH 8,5 chứa 0,3% esculin (w/v) và
0,02% ferric ammonium citrate (w/v) qua đêm ở 55°C. Băng β-glucosidase có hoạt
tính sẽ xuất hiện màu vàng đậm đến nâu trên nền bản gel có màu vàng của esculin và
ferric ammonium citrate.
2.3.21. Nghiên cứu một số đặc tính của enzyme tái tổ hợp
2.3.21.1. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp
Enzyme tái tổ hợp được ủ với cơ chất ở các nhiệt độ khác nhau từ 50 đến 65C
trong 30 phút. Hoạt tính của endoglucanase được xác định theo Phương pháp 2.3.12
và của β-glucosidase được xác định theo Phương pháp 2.3.13 mô tả ở trên tại các
nhiệt độ nghiên cứu.
2.3.21.2. Ảnh hưởng của pH lên hoạt tính enzyme tái tổ hợp
Ủ enzyme với cơ chất tương ứng ở nhiệt độ 55C trong đệm có pH khác nhau:
citrate (pH 3-6); Tris/HCl (pH 7-10); disodium phosphate (pH 11-12). Các dung dịch
đệm đều có nồng độ 50 mM ngoại trừ đệm Tris/HCl, pH 10 có nồng độ 100 mM.
Hoạt tính của endoglucanase được xác định theo Phương pháp 2.3.12 và của β-
glucosidase được xác định theo Phương pháp 2.3.13.
2.3.21.3. Ảnh hưởng của các ion kim loại lên hoạt tính enzyme tái tổ hợp
Enzyme được hòa trong đệm Tris/HCl theo giá trị pH tối ưu. Bổ sung các ion
K+, Li+, Na+, Ag+, Ca2+, Cu2+, Zn2+, Mg2+, Fe2+, Mn2+, Co2+ và Fe3+ để đạt được nồng
độ cuối cùng là 5 mM. Phản ứng được thực hiện ở 55C. Sau đó, các ion có ảnh hưởng
làm tăng hoạt tính enzyme được tiếp tục khảo sát ảnh hưởng của nồng độ ion đó lên
hoạt tính enzyme tái tổ hợp để xác định nồng độ ion tối ưu cho phản ứng. Ở các mẫu
đối chứng dương, thành phần phản ứng không đổi nhưng enzyme được bố sung vào
sau khi đã dừng phản ứng. Trong khi đó, các mẫu đối chứng âm, thành phần enzyme
51
được thay bằng đệm và vẫn có sự hiện diện của các ion kim loại. Ảnh hưởng của các
ion kim loại lên hoạt tính enzyme tái tổ hợp được đánh giá thông qua hoạt tính enzyme
ở các mẫu có bổ sung ion kim loại vào phản ứng so với mẫu không bổ sung bất cứ
ion kim loại nào. Giá trị hoạt tính enzyme của mẫu không bổ sung bất cứ ion kim loại
nào được tính tương quan là 100%. Hoạt tính của endoglucanase được xác định theo
Phương pháp 2.3.12 và của β-glucosidase được xác định theo Phương pháp 2.3.13.
2.3.21.4. Xác định độ bền nhiệt của enzyme tái tổ hợp
Độ bền nhiệt của các enzyme tái tổ hợp được xác định tại các giá trị nhiệt độ và
pH tối ưu, có hoặc không có ion kim loại. Cụ thể: endoglucanase tái tổ hợp được tiến
hành ở nhiệt độ 55C và 60C; còn β-glucosidase được ủ ở nhiệt độ 50C và 55C.
Độ bền của enzyme được xác định theo giá trị T1/2, tại thời điểm hoạt tính tương đối
của enzyme mất đi một nửa. Giá trị T1/2 được tính theo công thức: T1/2 = ln2/Kd, trong
đó Kd là hằng số tốc độ bậc một, được xác định bằng hồi quy tuyến tính của ln (hoạt
độ còn lại) so với thời gian ủ (t).
2.3.21.5. Xác định tính đặc hiệu cơ chất của enzyme tái tổ hợp
Để xác định tính đặc hiệu cơ chất của endoglucanase và β-glucosidase tái tổ
hợp, phản ứng giữa enzyme và cơ chất được thực hiện dưới các điều kiện tối ưu, trong
đó các cơ chất được sử dụng để nghiên cứu gồm: CMC, bột giấy, Avicel (ở nồng độ
1%) và pNPG (20 mM).
2.3.21.6. Xác định động học của enzyme tái tổ hợp
Động học phản ứng của enzyme tái tổ hợp được xác định thông qua hằng số
Michaelis-Menten. Động học của endoglucanase và β-glucosidase tái tổ hợp được xác
định trên các cơ chất tương ứng là CMC (với dải nồng độ từ 0,2 - 2 mg/ml) và p-NPG
(với dải nồng độ từ 0,2 - 4 mM). Số liệu được tính toán trên phương trình hyperbol f(x)
= ax/(b+x) sử dụng phần mềm Sigma Plot (Rockware, Golden, CO, USA).
2.3.22. Xử lý thống kê
Tất cả các thí nghiệm được lặp lại 3 lần. Sử dụng Microsoft excel 2016 để xử
lý dữ liệu. Các kết quả được hiểu thị là giá trị trung bình ± độ lệch chuẩn của mẫu.
Giá trị p < 0,05 được coi là có ý nghĩa thống kê trong dữ liệu.
52
CHƯƠNG 3
KẾT QUẢ NGHIÊN CỨU
3.1. Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước
nóng Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu gen
mã hóa cho cellulase.
3.1.1. Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng
Bình Châu
Suối nước nóng Bình Châu thuộc xã Bưng Riềng, huyện Xuyên Mộc, tỉnh Bà
Rịa – Vũng Tàu có hơn 70 điểm phun nước lộ thiên, chảy len lỏi qua rừng tràm, nằm
trong khu rừng cấm nguyên sinh quốc gia với diện tích khoảng 7 ha. Suối nước nóng
có nhiệt độ ở gần miệng giếng phun dao động trong khoảng 82-84C, pH 7,5 – 9,2.
Vì là suối lộ thiên, do vậy các dòng chảy của suối trải dài trên khu rừng tràm nguyên
sinh, có dải nhiệt độ dao động từ 40C đến điểm sôi 82C.
Nghiên cứu của chúng tôi được thực hiện tại địa phận của Công ty cổ phần du
lịch Sài Gòn – Bình Châu với quy mô 33 ha nằm giữa rừng tràm với những vị trí khu
trú các điểm sôi chính. Vị trí lấy mẫu có tọa độ 1036’03.9” Bắc và 10733’30.0”
Đông (Hình 3.1). Chỉ tiêu hóa lý của mẫu nước thu nhận từ suối nước nóng Bình
Châu được trình bày tại Phụ lục 10.
Mẫu nước và mẫu bùn thu thập từ suối nước nóng Bình Châu được sử dụng làm
nguyên liệu tách DNA metagenome. Kết quả tách chiết DNA metagenome của mẫu
nước và bùn suối nước nóng Bình Châu cho thấy DNA metagenome có chất lượng
tốt, DNA không bị đứt gãy (Hình 3.2). DNA metagenome thu lần 1 và 2 của mẫu
nước và mẫu bùn (4 mẫu) sau đó được gộp lại để tạo thành DNA metagenome mẫu
nước và mẫu bùn (2 mẫu). DNA metagenome của hai mẫu này được xác định nồng
độ DNA bằng cách đo mẫu trên máy quang phổ Nano Drop 1000. Kết quả cho thấy
cả hai mẫu DNA thu được đều có độ tinh sạch cao, tỷ lệ A260/A280, A260/A230 đều lớn
hơn 2. Lượng DNA metagenome mẫu nước đạt 63,75 ng/µl và mẫu bùn đạt 120,9
ng/µl (Bảng 3.1). Mẫu DNA thu được này đảm bảo đủ điều kiện đáp ứng về số lượng
và chất lượng để gửi đi giải trình tự gen thế hệ mới. DNA metagenome mẫu nước và
53
mẫu bùn sau đó được trộn lại với nhau theo tỷ lệ 1:1 (v/v) để tạo thành mẫu DNA
metagenome suối nước nóng Bình Châu.
b a
d c
Hình 3.1. Các vị trí lấy mẫu nước và mẫu bùn của suối nước nóng Bình Châu.
a, b): vị trí lấy mẫu nước (82C); c, d): vị trí lấy mẫu bùn (45-65C).
Chú thích: M: thang DNA chuẩn 1 kb; 1 và 3: DNA metagenome của mẫu nước thu lần 1
và 2; 2 và 4: DNA metagenome của mẫu bùn thu lần 1 và 2.
Hình 3.2. DNA metagenome mẫu nước và bùn suối nước nóng Bình Châu.
54
Bảng 3.1. Nồng độ và độ tinh sạch của DNA metagenome mẫu nước và mẫu bùn
suối nước nóng Bình Châu.
Mẫu
Nồng độ DNA metagenome (ng/ µl)
A260/A280
A260/A230
Nước
63,75 ± 1,12
2,15 ± 0,1
2.1 ± 0,05
Bùn
120,9 ± 1,3
2,07 ± 0,16
2.1 ± 0,11
3.1.2. Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật, xác
định và tổng hợp gen mới mã hóa cho các enzyme thủy phân cellulose
(enzyme chịu kiềm, chịu axit và chịu nhiệt)
3.1.2.1. Giải trình tự và tiền xử lý dữ liệu DNA metagenome suối nước nóng Bình Châu
DNA metagenome suối nước nóng Bình Châu được gửi đi đọc trình tự tại công
ty BGI Co., Ltd (HongKong) bằng thiết bị giải trình tự thế hệ mới Illumina HiSeqTM
platform. Kết quả giải trình tự thu được 10,4 Gb dữ liệu thô. Phân tích dữ liệu bằng
phần mềm FastQC cho thấy có 0,04% trình tự không xác định được là A,T,G hay C;
0,41% là trình tự mồi đọc trình tự, 6,97% trình tự có chất lượng kém (Q<20) và
92,58% trình tự có chất lượng tốt.
Sử dụng phần mềm Trimmomatic để tinh sạch dữ liệu (loại bỏ trình tự chất
lượng kém), kết quả thu được bộ dữ liệu tinh sạch bao gồm 93.999.534 đoạn trình tự
(9,4 Gb dữ liệu) chất lượng cao. Tỷ lệ dữ liệu sạch/ dữ liệu thô là 89,98%. Dữ liệu có
Q20 đạt 94,98% và Q30 đạt 87,97% (Bảng 3.2).
Bảng 3.2. Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome
suối nước nóng Bình Châu.
Dữ liệu tinh sạch (G) Q20 (%) Q30 (%) Số lượng contig N50 (bp)
Tỉ lệ lắp ráp (%)
9,4
94,98
87,97
51.346
9.791
65,12
3.1.2.2. Lắp ráp de novo metagenome
Khi giải trình tự DNA metagenome suối nước nóng Bình Châu trên thiết bị giải
trình tự thế hệ mới Illumina HiSeqTM platform, DNA đã bị chia thành các đoạn nhỏ.
Do đó, để tiến hành phân tích, trước tiên các đoạn trình tự cần được lắp ráp thành các
contig. Dữ liệu DNA metagenome của khu hệ vi sinh vật ở suối nước nóng Bình Châu
được lắp ráp bằng phần mềm SOAPdenovo2 để tạo thành các contig và sử dụng công
cụ Quast để đánh giá chất lượng lắp ráp (Quality Assessment Tool for Genome
55
Assemblies). Kết quả cho thấy đã lắp ráp được 93.999.534 đoạn trình tự, tạo ra 51.346
contigs với tổng chiều dài là 172.103.446 bp, trong đó độ dài contig N50 là 9.791 bp,
độ dài contig N90 là 1.059 bp, contig dài nhất là 1.767.609 bp, ngắn nhất là 500 bp,
kích thước trung bình contig là 3.351 bp và tỷ lệ lắp ráp (mapping rate) đạt 65,12%
(Bảng 3.3).
Tổng số đoạn trình tự
93.999.534
Số đoạn trình tự được lắp ráp
61.212.496
Tổng chiều dài lắp ráp (bp)
172.103.446
Tỉ lệ lắp ráp (%)
65,12
Tổng số contig
51.346
Contig dài nhất (bp)
1.767.609
Contig ngắn nhất (bp)
500
Độ dài contig N90 (bp)
1.059
Độ dài contig N50 (bp)
9.791
Độ dài trung bình các contig (bp)
3.351
Bảng 3.3. Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu.
Hình 3.3. Phân bố độ dài contig sau khi lắp ráp bằng phần mềm SOAPdenovo2.
Phân bố độ dài của các contig được thể hiện trong Hình 3.3 cho thấy các contig
có độ dài từ 500-999 bp có tỷ lệ cao nhất, chiếm 42,9%; tiếp sau là các contig có độ
dài từ 1.000-1.499 bp, chiếm 17,8%.
56
3.1.2.3. Dự đoán gen
Sử dụng chức năng dự đoán ORF của phần mềm MetaGeneMark v2.10 với
51.346 contig chúng tôi đã thu được 156.093 khung đọc mở tiềm năng. Phân bố độ
dài của các khung đọc mở được thể hiện trong Hình 3.4 cho thấy các đoạn gen có độ
dài từ 500-999 bp có tỉ lệ cao nhất (chiếm 47,2%), tiếp theo là các đoạn gen có chiều
dài 1.000-1.499 bp (chiếm 20,4%); các đoạn gen có chiều dài từ 1.500-1.999 bp có tỉ
lệ thấp (chỉ chiếm 6,9%).
Hình 3.4. Phân bố độ dài các gen được dự đoán từ bộ dữ liệu DNA metagenome
suối nước nóng Bình Châu.
3.1.2.4. Đánh giá đa dạng vi sinh vật
Cơ sở dữ liệu nr và MEGAN được sử dụng để chú giải và phân loại tất cả
156.093 khung đọc mở, kết quả cho thấy có 106.903 gen được chú giải và 49.190 gen
là những gen chưa biết, chiếm lần lượt 68,5% và 31,5%. Kết quả phân loại các gen
đã được trình bày trong Bảng 3.4 và Hình 3.5.
Bảng 3.4. Thống kê phân loại học DNA metagenome suối nước nóng Bình Châu đã
được chú giải.
Số gen Số Giới Số Ngành Số Lớp Số Bộ Số Họ Số Chi Số Loài
106.903
5
41
57
128
245
825
2.250
57
Hình 3.5. Biểu đồ biểu thị 8 nhóm chiếm ưu thế cho từng cấp độ phân loại (Ngành,
Lớp, Bộ, Họ, Chi, Loài) vi sinh vật ở suối nước nóng Bình Châu.
Kết quả phân tích MEGAN cho thấy trong số 106.903 gen đã được chú giải có
29.069 gen vi khuẩn, 1.416 gen cổ khuẩn, 4 gen nhân thật, 3 gen virus và 76.411
gen chưa được xác định (unclassfied). Trong giới chiếm ưu thế là vi khuẩn và cổ
58
khuẩn, tám chú giải ở các cấp độ phân loại (Ngành, Lớp, Bộ, Họ, Chi, Loài) vi sinh
vật chiếm ưu thế trong suối nước nóng Bình Châu đã được tóm tắt và trình bày ở
Hình 3.5. Cụ thể: trong giới vi khuẩn, ngành Proteobacteria là ngành chiếm ưu thế
nhất chiếm 68,68%, tiếp theo là Firmicutes (8,22%), Cyanobacteria (4,53%),
Bacteroidetes (3,52%), Planctomycetes (2,81%), Actinobacteria (2.43%) và các
ngành khác (độ phong phú tương đối <2%) (Hình 3.5 và Bảng 3.5). Hơn nữa, trong
ngành Proteobacteria, lớp Gammaproteobacteria là lớp chiếm ưu thế nhất (24,87%),
tiếp sau là Alphaproteobacteria (19.61%) và Betaproteobacteria (16.42%) (Hình 3.5
và Bảng 3.6).
Bảng 3.5. Tỷ lệ các gen đã được phân loại thuộc các Ngành vi khuẩn ở suối nước
nóng Bình Châu.
Ngành
Số lượng reads
Mức độ chiếm ưu thế (%)
19.966
68.68
Proteobacteria
2.389
8.22
Firmicutes
1.318
4.53
Cyanobacteria
1.023
3.52
Bacteroidetes
816
2.81
Planctomycetes
707
2.43
Actinobacteria
481
1.65
Verrucomicrobia
375
1.29
Spirochaetes
367
1.26
Chloroflexi
244
0.84
Nitrospirae
184
0.63
Nitrospinae
134
0.46
Gemmatimonadetes
128
0.44
Aquificae
108
0.37
Deinococcus-Thermus
107
0.37
Acetothermia
85
0.29
Poribacteria
85
0.29
Thermodesulfobacteria
83
0.29
Acidobacteria
59
0.20
Synergistetes
43
0.15
Fusobacteria
36
0.12
Dictyoglomi
36
0.12
Marinimicrobia
59
Lentisphaerae
35
0.12
Chlorobi
33
0.11
Candidatus Saccharibacteria
24
0.08
Chlamydiae
19
0.07
Thermotogae
17
0.06
Deferribacteres
5
0.02
Tenericutes
5
0.02
Unclassified
158
0.54
Bảng 3.6. Tỷ lệ các gen đã được phân loại thuộc các Lớp vi khuẩn
ở suối nước nóng Bình Châu.
Ngành
Lớp
Số lượng read Mức độ chiếm ưu thế (%)
Gammaproteobacteria
7.230
Proteobacteria
24.87
Alphaproteobacteria
5.702
Proteobacteria
19.61
Betaproteobacteria
4.773
Proteobacteria
16.42
Deltaproteobacteria
2.010
Proteobacteria
6.91
NA
1.205
Cyanobacteria
4.15
Bacilli
1.151
Firmicutes
3.96
Clostridia
878
Firmicutes
3.02
Planctomycetia
816
Planctomycetes
2.81
Actinobacteria
656
Actinobacteria
2.26
Spirochaetia
375
Spirochaetes
1.29
Cytophagia
340
Bacteroidetes
1.17
Flavobacteriia
329
Bacteroidetes
1.13
Negativicutes
327
Firmicutes
1.12
274
Verrucomicrobia
Verrucomicrobiales
0.94
Nitrospira
244
Nitrospirae
0.84
Nitrospinia
184
Nitrospinae
0.63
Chloroflexia
178
Chloroflexi
0.61
NA
158
Unclassified
0.54
Bacteroidia
153
Bacteroidetes
0.53
Ktedonobacteria
150
Chloroflexi
0.52
Sphingobacteriia
149
Bacteroidetes
0.51
Zetaproteobacteria
144
Proteobacteria
0.50
134
Gemmatimonadetes
Gemmatimonadetes
0.46
Aquificae
128
Aquificae
0.44
Gloeobacteria
112
Cyanobacteria
0.39
60
Deinococcus-Thermus
Deinococci
108
0.37
NA
107
Acetothermia
0.37
NA
85
Poribacteria
0.29
Thermodesulfobacteria
Thermodesulfobacteria
85
0.29
Spartobacteria
84
Verrucomicrobia
0.29
NA
82
Verrucomicrobia
0.28
Epsilonproteobacteria
76
Proteobacteria
0.26
NA
63
Acidobacteria
0.22
Synergistia
59
Synergistetes
0.20
NA
52
Bacteroidetes
0.18
Fusobacteriia
43
Fusobacteria
0.15
Opitutae
41
Verrucomicrobia
0.14
NA
39
Chloroflexi
0.13
Rubrobacteria
36
Actinobacteria
0.12
Dictyoglomia
36
Dictyoglomi
0.12
NA
36
Marinimicrobia
0.12
Lentisphaeria
35
Lentisphaerae
0.12
Chlorobia
33
Chlorobi
0.11
NA
31
Proteobacteria
0.11
Erysipelotrichia
26
Firmicutes
0.09
24
Candidatus Saccharibacteria NA
0.08
Acidobacteriia
20
Acidobacteria
0.07
Chlamydiia
19
Chlamydiae
0.07
Thermotogae
17
Thermotogae
0.06
Coriobacteriia
9
Actinobacteria
0.03
NA
7
Firmicutes
0.02
Thermoleophilia
6
Actinobacteria
0.02
Deferribacteres
5
Deferribacteres
0.02
Mollicutes
5
Tenericutes
0.02
Dehalococcoidia
1
Chloroflexi
0.00
Chú thích: NA – No Annotation: chưa chú giải.
Trong suối nước nóng Bình Châu, Aquificae, Thermodesulfobacteria và
Thermotogae được biết đến là các Ngành vi khuẩn ưa nhiệt hoặc siêu ưa nhiệt. Ba
Ngành này xuất hiện với tỷ lệ thấp tương ứng: 0,44%, 0,29% và 0,06% (Bảng 3.6).
Mặc dù sử dụng cơ sở dữ liệu nr và MEGAN đã chú giải được 106.903 gen
nhưng đánh giá đa dạng vi sinh vật ở mức độ phân loại đến loài còn khá hạn chế, có
61
tới 78.487 gen chưa được phân loại chiếm 50,282% tổng số gen được dự đoán và
73,419% so với gen được chú giải. Phân tích kết quả phân loại vi khuẩn ở cấp độ loài
cho thấy Marinobacter manganoxydans là loài chiếm ưu thế nhất (5,57%), tiếp theo
là Roseobacter sp. (4,81%), Gamma proteobacterium IMCC2047 (3,93%),
Thiobacillus thioparus (1,11%), Bdellovibrio bacteriovorus (0,96%), Thiobacillus
denitrificans (0,96%), Caldimonas manganoxidans (0,85%) và các loài khác với tỷ
lệ các gen đã được phân loại chiếm < 0,85%.
Vi sinh vật trong suối nước nóng nói chung và trong suối nước nóng Bình Châu
nói riêng chủ yếu là vi khuẩn và cổ khuẩn. Cổ khuẩn có mặt trong suối nước nóng
Bình Châu chủ yếu thuộc Ngành Thaumarchaeota (51,76%), tiếp theo là Ngành
Euryarchaeota (35,38%). Đồng thời, trong số các loài cổ khuẩn đã được phân loại
trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu, loài cổ khuẩn
Candidatus Nitrosoarchaeum limnia là loài chiếm ưu thế nhất (22,17%) (Hình 3.5).
3.1.2.5. Khai thác gen mã hóa cho enzyme tham gia vào quá trình thủy phân cellulose từ
DNA metagenome suối nước nóng Bình Châu
Toàn bộ 156.093 khung đọc mở tiềm năng dự đoán ở trên được so sánh với các
cơ sở dữ liệu Nr, Swiss-Prot, CAZy và KEGG bằng công cụ Blast++ nhằm tìm ra các
trình tự axit amin có mức độ tương đồng cao nhất, qua đó chú giải chức năng của các
protein và sàng lọc ORF mã hóa cho enzyme tham gia vào quá trình thủy phân
cellulose. Kết quả được trình bày trong Bảng 3.7.
Bảng 3.7. Tóm tắt kết quả chú giải gen dựa vào các cơ sở dữ liệu mở.
Cơ sở dữ liệu
Số ORF
NR
106.903
Swiss - Prot
46.085
CAZy
2.849
KEGG
67.379
Với mục tiêu tiếp cận để khai thác các gen mã hóa cho enzyme tham gia vào
quá trình thủy phân cellulose từ DNA metagenome vi sinh vật suối nước nóng Bình
Châu, chúng tôi so sánh các trình tự ORF trong bộ dữ liệu DNA metagenome với cơ
sở dữ liệu CAZy. Kết quả cho thấy có 2.849 ORF tương đồng với các gen mã hóa
62
cho enzyme thủy phân carbohydrate, chủ yếu thuộc 4 nhóm enzyme chính: glycoside
hydrolases (GHs), glycosyl transferases (GTs), polysaccharide lyases (PLs) và
carbohydrate esterases (CEs). Ngoài ra, bộ dữ liệu còn có sự góp mặt của các module
liên kết với carbohydrate (CBM). Đồng thời, bộ dữ liệu DNA metagenome suối nước
nóng Bình Châu cũng cho thấy sự phân bố cụ thể của các nhóm enzyme trên như sau:
732 GH (chiếm 24,66%), 1633 GT (chiếm 55,02%), 19 PL (chiếm 0,64%), 224 CE
(chiếm 7,55%) và 360 CBM (chiếm 12,13%) (Hình 3.6).
CBMs
12.13%
GHs
24.66%
PLs
0.64%
CEs
7.55%
GTs
55.02%
Hình 3.6. Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA
Chú thích: GHs: họ glycoside hydrolases; GTs: họ glycosyl transferases; PLs: họ polysaccharide
lyases; CEs: họ carbohydrate esterases; CBMs: họ carbohydrate-binding modules.
metagenome suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy.
Quần xã vi sinh vật suối nước nóng Bình Châu có khả năng sinh tổng hợp nhiều
loại enzyme tham gia thủy phân cellulose và hemicellulose, tạo thành các dạng
monosaccharide. Trong số các ORF thủy phân glycoside, có 146 ORF thuộc 18 họ GH
mã hóa cho các enzyme tham gia chuyển hóa lignocellulose. Phần lớn các ORF mã hóa
cho các enzyme thuộc họ GH3 (52 ORF), GH57 (36 ORF) và GH1 (12 ORF). Họ
enzyme GH3 bao gồm β-1,4-glucosidase, β-1,4-xylosidase; β-1,3-glucosidase và α-
63
arabinofuranosidase cắt chuỗi carbonhydrate đầu không khử thành oligosaccharide. Họ
enzyme GH1 bao gồm β-glucosidase, β-galactosidase, β-mannosidase. Họ GH57 đóng
vai trò quan trọng trong việc phân giải mannan. Các ORF mã hóa cho enzyme thủy phân
cellulose chủ yếu thuộc họ GH1, GH3, GH5, GH6, GH8 và GH94 (Hình 3.7).
Hình 3.7. Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa
lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu.
Từ các ORF mã hóa cho các họ GH, nhóm enzyme cellulase gồm 82 trình tự
mã hóa cho endoglucanase, exoglucanase và β-glucosidase. Trong số này có 47 trình
tự hoàn thiện (chiếm 57,32%), 18 trình tự thiếu đầu N (5’) (chiếm 21,95%), 15 trình
tự thiếu đầu C (3’) (chiếm 18,29%) và 2 trình tự thiếu cả đầu N (5’) và đầu C (3’)
(chiếm 2,44%) (Bảng 3.8). Các trình tự tương đồng với CSDL nr ở mức độ <50% có
37 trình tự (chiếm 45,12%); 50–65% có 25 trình tự (chiếm 30,49%); 65–85% có 16
trình tự (chiếm 19,51%) và > 85% có 4 trình tự (chiếm 4,88%).
64
Bảng 3.8. Phân bố của các ORF mã hóa cho cellulase được dự đoán từ bộ dữ liệu
DNA metagenome suối nước nóng Bình Châu.
Enzyme
Mức độ
Beta-
tương đồnga
Endoglucanase Exoglucanase
Tổng
glucosidase
ORF
(%)
< 50
22
9
1
12
50 - 65
15
6
0
9
Đầy đủ
65 - 85
6
0
0
6
> 85
4
0
0
4
< 50
8
5
0
3
Thiếu đầu N
50 - 65
5
3
0
2
(5’)
65 - 85
5
1
0
4
< 50
7
4
1
2
Thiếu đầu C
50 - 65
5
1
0
4
(3’)
65 - 85
3
1
1
1
Thiếu cả 2 đầu:
65 - 85
2
2
0
0
N (5’) và C (3’)
3
Tổng
32
47
82
Ghi chú: a so với cơ sở dữ liệu non-redundant (nr) protein của NCBI.
Trong 47 trình tự ORF hoàn thiện có 15 ORF mã hóa cho endoglucanase, 1 ORF
mã hóa cho exoglucanase và 31 ORF mã hóa cho β-glucosidase. Các trình tự này chủ
yếu là các trình tự chưa có chú giải nguồn gốc tiến hóa (NA-No Annotation), chưa
phân loại được dựa vào các cơ sở dữ liệu của NCBI. Cây phát sinh chủng loại của 15
trình tự axit amin mã hóa cho endoglucanase và 1 trình tự axit amin mã hóa cho
exoglucanase đã được xây dựng (Hình 3.8A). Kết quả cho thấy các trình tự mã hóa
cho endoglucanase chủ yếu thuộc họ GH5, GH6 và GH8. Các trình tự này rất đa dạng
về nguồn gốc tiến hóa. Mặc dù cùng thuộc một họ GH nhưng các trình tự lại có
khoảng cách di truyền, tiến hóa rất xa nhau (như trường hợp họ GH5) trên cây phát
sinh chủng loại (Hình 3.8A), chứng tỏ các trình tự protein mã hóa cho endoglucanase
có thể có nguồn gốc từ các loài vi sinh vật khác nhau. Ngoài ra, cây phát sinh chủng
loại Hình 3.8A cũng cho thấy hầu hết các trình tự được nhóm lại với nhau ngoại trừ
trình tự 18736 và 5216. Điều đó chứng tỏ, 18736 và 5216 là những trình tự mã hóa
cho endoglucanase có khoảng cách di truyền tiến hóa cách xa so với các trình tự còn
lại. Trình tự 35895 là trình tự hoàn thiện duy nhất mã hóa cho exoglucanase. Trên
65
cây phát sinh chủng loại trình tự này nằm ở một nhánh khác so với các trình tự mã
hóa cho endoglucanase (Hình 3.8A).
Tương tự, cây phát sinh chủng loại của 31 trình tự axit amin mã hóa cho β-
glucosidase cũng đã được xây dựng (Hình 3.8B). Kết quả cho thấy các trình tự mã
hóa cho β-glucosidase chủ yếu thuộc họ GH1 và GH3. Đây là hai họ GH phổ biến
cho enzyme thủy phân cellulose. Cây phát sinh chủng loại Hình 3.8B cho thấy các
trình tự mã hóa cho β-glucosidase thuộc cùng một họ có khoảng cách di truyền tiến
hóa khá gần nhau.
A
66
B
Hình 3.8. Cây phát sinh chủng loại Maximum likelihood của trình tự axit amin mã
hóa cho cellulase từ bộ dữ liệu DNA metagenome suối nước nóng Bình Châu.
A) Trình tự mã hóa cho endoglucanase và exoglucanase; B) Trình tự mã hóa
cho β-glucosidase.
3.1.2.6. Phân tích một số tính chất của các enzyme được mã hóa từ các gen trong bộ
dữ liệu DNA metagenome suối nước nóng Bình Châu để lựa chọn gen tiềm
năng cho quá trình biểu hiện.
Với mục tiêu tiếp cận để khai thác các enzyme mới hoặc có tính chất mới như
bền nhiệt (có chỉ số Tm cao), có khả năng chịu kiềm hoặc chịu axit, phần mềm Tm
Index (http://tm.life.nthu.edu.tw) (Ku và cs., 2009) và phần mềm Acalpred
67
(http://lin.uestc.edu.cn/server/AcalPred) đã được sử dụng để dự đoán tính bền nhiệt
và tính chất kiềm/ axit của protein. Chỉ số kiềm tính, axit tính càng gần giá trị 1, càng
có khả năng kiềm hoặc axit. Việc dự đoán tính chất của các enzyme được tiến hành
trên 47 trình tự ORF hoàn thiện mã hóa cho cellulase. Kết quả cho thấy chủ yếu
cellulase của bộ dữ liệu DNA metagenome suối nước nóng Bình Châu là các enzyme
có thể hoạt động ở nhiệt độ ≥ 55ºC (97,87% enzyme có Tm ≥ 0) (Hình 3.9A) và là
các enzyme kiềm tính (57,44%) (Hình 3.9B).
A
B
Hình 3.9. Dự đoán tính chất của các protein tham gia vào quá trình thủy phân
cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome
suối nước nóng Bình Châu.
A) Dự đoán Tm của các enzyme; B) Dự đoán tính kiềm/ axit của các enzyme
Với mục tiêu tiếp cận được nguồn gen mới từ vi sinh vật suối nước nóng Bình
Châu mã hóa cho cellulase có tính chất đặc biệt, kết hợp với những cơ sở phân tích
trên, gen đích được lựa chọn để phân lập hoặc tổng hợp phải thỏa mãn đồng thời các
tiêu chí sau:
- Là ORF hoàn chỉnh có độ dài trong khoảng 1200 – 1600 bp trong bộ dữ liệu
gen mã hóa cho enzyme thủy phân cellulose.
- Là ORF mã hóa cho enzyme có độ tương đồng nằm trong khoảng từ 50 đến
70% so với các enzyme cellulase trong cơ sở dữ liệu NCBI.
- Là ORF có chỉ số dự đoán Tm ≥ 55C.
68
- Là ORF được dự đoán có tính chất kiềm hoặc axit.
Trong số 47 ORF hoàn chỉnh mã hóa cho cellulase trong bộ dữ liệu DNA
metagenome suối nước nóng Bình Châu, có 5 ORF đáp ứng được các tiêu chí lựa
chọn ở trên. Đặc điểm của 5 ORF được minh họa trong Bảng 3.9.
Bảng 3.9. Đặc điểm của 5 ORF mã hóa cho endoglucanase và β-glucosidase
thỏa mãn các tiêu chí lựa chọn gen/ protein mới.
%GC
Chiều dài
gen (bp)
Độ tương đồng
(%)
Mã số gen
[denovogenes]
Dự đoán Tm Dự đoán
tính chất
Kiềm/
Axit
Chỉ số
hòa tan
của
protein
Mã hóa cho endoglucanase
18736
1.506
≥ 65ºC
Axit 0,99
0,429
56,4
50,35% với
endoglucanase
[bacterium JGI
053], mã số
SOD03652.1;
49,31% với
endoglucanase
[Polyangium
fumosum], mã số
WP_136936398.1
30313
1.263
55ºC ~ 65ºC
0,421
51
Kiềm
0,97
50,41% với
endoglucanase
[Geodermatophilus
sp. DSM 45219],
mã số SDN59245.1
Mã hóa cho β-glucosidase
62,08% với Beta-
glucosidase
[Candidatus
Wolfebacteria
31089
1.251
55ºC ~ 65ºC Axit 0,52
0,211
48,5
bacterium
GW2011_GWC1_3
7_10], mã số
KKQ21855.1
32768
1.224
55ºC ~ 65ºC
0,242
54
Kiềm
0,83
53,94% với Beta-
glucosidase A
[nhóm vi khuẩn
Parcubacteria], mã
số KKT80126.1
23970
1.380
55ºC ~ 65ºC
0,103
60,6
Kiềm
0,76
51,29% với Beta-
glucosidase A
[Chloroflexi
bacterium
ADurb.Bin180], mã
số OQB26869.1
69
Với mong muốn thu nhận được các loại enzyme thủy phân sinh khối khác nhau
có tính chất đặc biệt, đồng thời căn cứ vào kết quả phân tích đặc tính của enzyme
(Bảng 3.9), hai ORF có mã số [denovogenes]_18736 mã hóa cho endoglucanase và
[denovogenes]_32768 mã hóa cho β-glucosidase là hai ORF được lựa chọn vì các lý
do sau đây. Thứ nhất, suối nước nóng Bình Châu là suối nước nóng kiềm nhưng
endoglucanase được mã hóa bởi [denovogenes]_18736 lại được dự đoán với tính chất
axit. Hơn nữa, endoglucanase của ORF này thuộc họ GH6 có khoảng cách di truyền
tiến hóa cách xa so với các trình tự còn lại, có nhiệt độ nóng chảy theo tính toán lý
thuyết ≥ 65oC, do đó có thể có những tính chất mới chưa được khai thác. Thứ hai,
trong số 3 ORF mã hóa cho β-glucosidase, ORF có mã số [denovogenes]_32768 có
tính chất kiềm và độ hòa tan cao nhất, trong khi ORF [denovogenes]_31089 có tính
axit yếu còn ORF [denovogenes]_23970 có tính kiềm nhưng mức độ hòa tan thấp.
Từ những phân tích này, hai ORF [denovogenes]_18736 và [denovogenes]_32768 đã
được chọn để tổng hợp nhân tạo tại công ty TNHH MTV Sinh hóa Phù Sa (Việt Nam)
và được gắn vào vector tách dòng pJET1.2 (pJET1.2_18736 và pJET1.2_32768).
* Gen [denovogenes]_18736
Gen [denovogenes]_18736 có chiều dài 1.506 nucleotide, mã hóa cho 501 axit
amin. Trình tự nucleotide và axit amin của gen [denovogenes]_18736 được trình bày
ở phụ lục 2.
* Gen [denovogenes]_32768
Gen [denovogenes]_32768 có chiều dài 1.224 nucleotide, mã hóa cho 407 axit
amin. Trình tự nucleotide và axit amin của gen [denovogenes]_32768 được trình bày
ở phụ lục 3.
Trình tự nucleotide của các gen [denovogenes]_18736 và [denovogenes]_32768
đã được đăng ký trên Ngân hàng Gen với các mã số lần lượt là QAU55420.1 và
QAU55422.1.
3.1.2.7. Phân tích mô hình cấu trúc của [denovogenes]_18736 và
[denovogenes]_32768
Cấu trúc tâm hoạt động: Vị trí tâm hoạt động của endoglucanase và β-
glucosidase mã hóa lần lượt bởi 2 ORF [denovogenes_18736] và
70
[denovogenes_32768] được dự đoán nhờ phần mềm Scanprosite của ExPASy
(https://prosite.expasy.org/). Kết quả cho thấy endoglucanase_18736 có tâm
hoạt động (active site) nằm ở vị trí axit amin D299 (Phụ lục 11) trong khi không
xác định được vị trí tâm hoạt động của β-glucosidase_32768.
Peptide tín hiệu: Phần mềm trực tuyến SignalP-5.0 (Armenteros và cs., 2019)
được ứng dụng để dự đoán peptide tín hiệu của 2 enzyme endoglucanase và β-
glucosidase, tuy nhiên kết quả cho thấy cả hai trình tự axit amin đều không có
trình tự của các motif đặc trưng cho vị trí cắt peptide tín hiệu, do đó 2 protein
này không có trình tự đoạn peptide tín hiệu.
Cấu trúc domain chức năng
Domain chức năng là trình tự axit amin bảo thủ đặc trưng cho nhóm gen cụ
thể, có cấu trúc đặc trưng riêng biệt. Hầu hết các cellulase có cấu trúc gồm hai domain
độc lập: module lõi xúc tác và module liên kết cellulose (CBM). Hai domain này
thường được kết nối với nhau thông qua các chuỗi peptide ngắn, linh hoạt (Sandgren,
2003). Domain chức năng là phần lớn nhất của enzyme. Sử dụng phần mềm
https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi để tìm kiếm domain bảo thủ,
kết quả cho thấy endoglucanase_18736 chỉ có một domain duy nhất là domain xúc
tác thuộc họ GH6 nằm trong vùng bảo thủ từ axit amin Q236 đến axit amin G483.
Endoglucanse_18736 mang đặc trưng của họ GH6 (domain cấu trúc ID 10474417)
(Hình 3.10), tương tự như endoglucanase-6B của Humicola insolens, cắt liên kết β-
1,4-glucoside nội mạch và exoglucanase CEL6B của Podospora anserina cắt liên kết
β-1,4-glucoside ở đầu không khử trong cellulose và cellotetraose để giải phóng
cellobiose. Họ GH6 được biết đến bao gồm endoglucanase và cellobiohydrolase của
vi khuẩn và nấm (CAZy).
Đồng thời, β-glucosidase_32768 cũng chỉ có một domain duy nhất là domain
xúc tác thuộc họ GH1 nằm ở vị trí axit amin E2-E407. Protein thuộc họ GH1 (domain
cấu trúc ID 10006560) như 6-phospho-β-glucosidase, có khả năng thủy phân 6-
phospho-β-D-glucosyl-(1,4)-D-glucose thành glucose-6-phosphate (G-6-P) và D-
glucose; hoặc β-galactosidase, có khả năng thủy phân β-D-galactose đầu không khử
thành β-D-galactoside. Nhóm lớn của β-glucosidase mã hóa bởi ORF
[denovogenes_32768] cũng mang đặc trưng của BglB (Hình 3.11).
71
Hình 3.10. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của
endoglucanase_18736.
Hình 3.11. Kết quả phân tích vùng bảo thủ trên trình tự axit amin của
β-glucosidase_32768.
72
Mô hình cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768
Cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768 được xây dựng
nhờ phần mềm (https://swissmodel.expasy.org/interactive).
Cấu trúc 3D của gen denovogenes_18736
Trình tự axit amin của endoglucanase_18736 có trình tự nhận dạng cao nhất với
5 cấu trúc protein trong tổng số 140 cấu trúc được so sánh, bao gồm: (i) cellulase giả
định có mã số 1uoz.1.A (trình tự xác định 41,98%), (ii) cellulase Cel6 giả định có mã
số 1up3.1.A (trình tự xác định 43,62%), (iii) cellulase Cel6 giả định có mã số
1up3.1.A (trình tự xác định 45,45%), (iv) cellulase giả định có mã số 1uoz.1.A (trình
tự xác định 45,45%) và (v) cellobiohydrolase có mã số 3vog.1.A (trình tự xác định
31,8%). Tất cả các protein có trình tự nhận dạng cao nhất với endoglucanase_18736
đều là các cấu trúc protein giả định trong cơ sở dữ liệu mô hình cấu trúc protein
Swiss-model và chưa được nghiên cứu về đặc tính enzyme. Mặt khác, trình tự axit
amin của endoglucanase_18736 có mức độ tương đồng và nhận dạng cao nhất lần
lượt là 42% và 45,45% so với cellulase Cel6 (1up3.1.A), do đó cấu trúc của cellulase
Cel6 (1up3.1.A) đã được chọn làm khuôn để xây dựng mô hình cấu trúc 3D cho
endoglucanase_18736.
a b
Hình 3.12. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm
Swissmodel của ExPASy. a) Cấu trúc của endoglucanase_18736 dựa theo khuôn
mô hình cấu trúc của cellulase Cel6 giả định (1up3.1.A); b) Cấu trúc khuôn cellulase
Cel6 giả định (1up3.1.A).
73
Kết quả ở Hình 3.12 cho thấy endoglucanase_18736 được dự đoán ở trạng thái
monomer - A, không có phối tử (Phụ lục 12). Cấu trúc 3D của endoglucanase_18736
mang đặc trưng của các họ endoglucanase có cấu tạo tâm hoạt động hình khe hở do
vòng lặp ngắn đảo ngược ở vị trí tâm hoạt động tạo thành (Hình 3.12a), cho phép
enzyme liên kết và phân tách ngẫu nhiên dọc theo chuỗi cellulose (Davies và
Henrissat, 1995). Đồng thời, mô hình cấu trúc 3D của endoglucanase_18736 (Hình
3.12a) và mô hình cấu trúc 3D của khuôn cellulase Cel6 (1up3.1.A) (Hình 3.12b) có
hình dạng khá giống nhau mặc dù trình tự axit amin lại khác nhau (chỉ có 42% trình tự
axit amin tương đồng (Phụ lục 12).
Cấu trúc 3D của β-glucosidase_32768
Trình tự axit amin của β-glucosidase_32768 có trình tự nhận dạng cao nhất với
4 protein trong tổng số 799 cấu trúc đã được so sánh, bao gồm: (i) β-glucosidase có mã
số 1vff.1.A (trình tự xác định 41,35%), (ii) β-glucosidase có mã số 4hz6.1.A (trình tự
xác định 36,75%), (iii) β-glucosidase có mã số 3cmj.1.A (trình tự xác định 36,41%) và
(iv) 1,4-beta-D-glucan glucohydrolase có mã số 5idi.1.A (trình tự xác định 35,88%).
Khác với trường hợp endoglucanase_18736, tất cả các cấu trúc có trình tự nhận dạng
cao nhất với β-glucosidase_32768 đều là các cấu trúc của các protein đã được xác định
trong cơ sở dữ liệu mô hình cấu trúc protein Swiss-model.
a b
Hình 3.13. Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm Swissmodel
của ExPASy. a) Cấu trúc của β-glucosidase_32768 dựa theo khuôn mô hình cấu trúc
β-glucosidase (1vff.1.A); b) Cấu trúc của β-glucosidase khuôn (1vff.1.A).
74
Tuy nhiên, trong 4 mô hình cấu trúc trên, mô hình cấu trúc của β-glucosidase
có mã số 1vff.1.A được chọn làm khuôn để xây dựng mô hình cấu trúc 3D của β-
glucosidase_32768 do có trình tự axit amin được nhận dạng và tương đồng cao nhất,
lần lượt là 41,35% và 41%. Beta-glucosidase_32768 được dự đoán ở trạng thái
monomer, không có ligand và mô hình cấu trúc 3D được thể hiện trong Hình 3.13a.
Mô trình cấu trúc 3D của β-glucosidase_32768 và khuôn beta-glucosidase
(1vff.1.A) có hình dạng khá giống nhau mặc dù trình tự axit amin của chúng chỉ có
41% tương đồng.
3.1.2.8. Truy cứu nguồn gốc của các gen denovogenes_18736 và denovogenes_32768
Nguồn gốc của gen [denovogenes]_18736 và [denovogenes]_32768 được truy
cứu bằng công cụ Blast – Explorer (Dereeper và cs., 2010). Kết quả cho thấy cả hai
gen này đều là các gen mới, không xác định được nguồn gốc. Đồng thời, kết quả này
cũng phù hợp với kết quả phân loại của MEGAN: cả hai gen đều là những gen chưa
được phân loại vì không có cơ sở dữ liệu phù hợp để so sánh.
Tóm lại: Với các kết quả phân tích ở trên, hai gen được chọn: [denovogenes]_18736
và [denovogenes]_32768 là những gen mới về trình tự, mã hóa cho các enzyme được
dự đoán có tính ưa nhiệt, kiềm/ axit và thủy phân cellulose. Gen [denovogenes]_18736
được dự đoán là gen mã hóa cho endoglucanase thuộc họ GH6 và
[denovogenes]_32768 được dự đoán là gen mã hóa cho β – glucosidase thuộc họ GH1.
3.2. Biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768
3.2.1. Thiết kế vector biểu hiện gen [denovogenes]_18736 và
[denovogenes]_32768 trong E. coli
Vector pET17b (Novagen) được lựa chọn làm vector biểu hiện gen
[denovogenes]_18736 và [denovogenes]_32768. Sau khi khuếch đại cả 2 ORF và xử lý
với HindIII và NdeI như mô tả trong Mục 2.3.4 và 2.3.5, các ORF này lại được ghép nối
vào vector pET17b đã mở vòng tại các vị trí enzyme giới hạn tương ứng (Mục 2.3.5).
Sản phẩm ghép nối được biến nạp vào E. coli TOP10F’ để nhân dòng trước khi kiểm tra
lại bằng cách cắt các vector tái tổ hợp bằng HindIII và NdeI. Kết quả điện di đồ sản phẩm
cắt cho thấy đã gắn thành công gen [denovogenes]_18736 và [denovogenes]_32768
vào vector pET17b (Hình 3.14). Các dòng plasmid này sau đó được gửi đi đọc
trình tự để đảm bảo đúng codon dịch mã từ promoter đến mã khởi đầu.
75
Hình 3.14. Điện di đồ sản phẩm cắt kiểm tra plasmid pET17b mang các đoạn gen
Chú thích: 1) gen [denovogenes]_18736 có kích thước 1506 bp; M) Marker DNA 1kb và 2)
gen [denovogenes]_32768 có kích thước 1224 bp. Vector pET17b (Novagen) có kích thước
3306 bp.
ngoại lai bằng hai enzyme giới hạn HindIII và NdeI.
3.2.2. Lựa chọn một số điều kiện biểu hiện gen [denovogenes]_18736 và
[denovogenes]_32768 trong E. coli
3.2.2.1. Lựa chọn chủng chủ biểu hiện gen [denovogenes]_18736 và
[denovogenes]_32768
Các plasmid pET17b mang các đoạn gen ngoại lai [denovogenes]_18736 mã
hóa cho endoglucanase và [denovogenes]_32768 mã hóa cho β-glucosidase được
biến nạp vào tế bào E. coli C43(DE3) (Lucigen) và E. coli JM109 (DE3) (Promega)
để tạo thành chủng tái tổ hợp. Các dòng tế bào này sau đó được nhân giống và biểu
hiện trong môi trường LB. Sau 48 giờ cảm ứng bằng IPTG, mức độ biểu hiện
endoglucanase_18736 và β-glucosidase_32768 của các chủng tái tổ hợp được thể
hiện lần lượt trong Hình 3.15 và Hình 3.16.
Kết quả trình bày trong Hình 3.15 và 3.16 cho thấy: khả năng sinh trưởng của
hai chủng E. coli C43(DE3) và E. coli JM109 (DE3) tái tổ hợp tương đương nhau
nhưng hoạt tính enzyme của hai chủng lại khác nhau. Ở cả hai trường hợp, dòng E.
coli C43(DE3) biểu hiện hoạt tính enzyme tái tổ hợp cao hơn dòng E. coli
JM109(DE3). Đối với endoglucanase_18736, chủng E. coli C43(DE3) đạt 0,15 U/ml
trong khi chủng E. coli JM109 chỉ đạt 0,098 U/ml (Hình 3.16A).
76
Hình 3.15. Hoạt tính endoglucanase_18736 (A) và β-glucosidase_32768 (B) trong pha
Chú thích: 1) E. coli JM109(DE3) không cảm ứng IPTG; 2) E. coli JM109(DE3) cảm ứng
IPTG; 3) E. coli C43(DE3) không cảm ứng IPTG; 4) E. coli C43(DE3) cảm ứng IPTG.
4.5
0.06
0.2
2.5
4
0.05
tan của các chủng tái tổ hợp.
)
L
m
/
U
3.5
2
)
L
m
/
U
3
0.04
1.5
)
L
/
g
(
ô
h
k
i
2.5
0.03
0.1
)
L
/
g
(
ô
h
k
i
2
1
1.5
0.02
ố
h
k
h
n
i
S
(
c
l
g
-
β
h
n
í
t
t
ạ
o
H
1
0.5
ố
h
k
h
n
i
S
0.01
0.5
(
e
s
a
n
a
c
u
l
g
o
d
n
e
h
n
í
t
t
ạ
o
H
0
0
0
0
E. coli C43 (DE3)
E. coli JM109
E. coli JM109
E. coli C43
(DE3)
SKK (g/L)
Hoạt tính endoglucanase (U/mL)
SKK (g/L)
Hoạt tính β-glucosidase (U/mL)
A B
Hình 3.16. Ảnh hưởng của chủng chủ lên quá trình sinh trưởng và biểu hiện
enzyme tái tổ hợp. A. Endoglucanase; B. β-glucosidase.
Tương tự, chủng E. coli C43(DE3) cũng biểu hiện β-glucosidase tái tổ hợp đạt
0,05 U/ml trong khi chủng E. coli JM109 chỉ đạt 0,02 U/ml (Hình 3.16B). Cả hai
enzyme tái tổ hợp đều ở dạng hòa tan và tất cả các mẫu đối chứng (không cảm ứng
77
bằng IPTG) đều không có hoạt tính (Hình 3.15). Chủng E. coli C43(DE3) được
Miroux và Walker (1996) phát triển từ quá trình sàng lọc các biến chủng của dòng E.
coli BL21(DE3) để biểu hiện vượt ngưỡng các protein màng. Ưu điểm của dòng E.
coli C43(DE3) so với dòng gốc E. coli BL21(DE3) ở chỗ hạn chế tỷ lệ chết của tế
bào khi biểu hiện quá mức protein dung hợp do đã được đột biến tại hai điểm trên
vùng -10 của promoter lacUV5. Trong khi đó, dòng tế bào E. coli JM109 là chủng
được dùng chủ yếu trong các chiến lược tách dòng gen. Từ kết quả này, các chủng E.
coli C43(DE3) tái tổ hợp được chọn cho các nghiên cứu tiếp theo.
3.2.2.2. Lựa chọn môi trường biểu hiện gen [denovogenes]_18736 và
[denovogenes]_32768
Các chủng E. coli C43(DE3) tái tổ hợp được nhân giống trong môi trường LB,
sau đó chuyển sang lên men trong môi trường NB, LB và TB để biểu hiện
endoglucanase và β-glucosidase tái tổ hợp. Điều kiện biểu hiện được lặp lại như các
9
0.35
0.9
5
4.5
8
0.8
0.3
bước đã mô tả ở Phần 2.3.14. Kết quả nghiên cứu được thể hiện trong Hình 3.17.
)
L
m
/
U
4
7
0.7
0.25
3.5
)
L
m
/
U
6
0.6
3
0.2
)
L
/
g
(
ô
h
k
i
5
0.5
)
L
/
g
(
ô
h
k
i
2.5
4
0.4
0.15
2
3
0.3
ố
h
k
h
n
i
S
1.5
ố
h
k
h
n
i
S
0.1
2
0.2
(
c
l
g
-
β
h
n
í
t
t
ạ
o
H
1
0.05
1
0.1
0.5
(
e
s
a
n
a
c
u
l
g
o
d
n
e
h
n
í
t
t
ạ
o
H
0
0
0
0
LB
NB
TB
LB
NB
TB
Môi trường biểu hiện
Môi trường biểu hiện
SKK (g/L)
Hoạt tính endoglucanase (U/mL)
SKK (g/L)
Hoạt tính β-glucosidase (U/mL)
A B
Hình 3.17. Ảnh hưởng của môi trường nuôi cấy lên sinh trưởng và sinh hoạt tính
enzyme ở chủng E. coli C43(DE3) tái tổ hợp. A. Endoglucanase; B. β-glucosidase.
78
Kết quả thể hiện ở Hình 3.17 cho thấy: môi trường TB là môi trường tốt nhất
cho sinh trưởng cũng như sinh tổng hợp endoglucanase và β-glucosidase của chủng
E. coli C43(DE3) tái tổ hợp; môi trường LB và NB cho sinh trưởng cũng như sinh
tổng hợp enzyme của chủng tái tổ hợp thấp hơn rất nhiều so với môi trường TB. Cụ
thể, cả hai môi trường LB và NB, khả năng sinh trưởng của chủng tái tổ hợp đã thấp
hơn từ 54-77%, khả năng sinh tổng hợp endoglucanase thấp hơn từ 81-89%, khả năng
sinh tổng hợp β-glucosidase thấp hơn từ 83-95% so với môi trường TB. Kết quả này
cũng tương tự như các công bố quốc tế khi nghiên cứu quá trình sinh trưởng và sinh
tổng hợp protein tái tổ hợp bằng hệ thống E. coli (Studier, 2005; Sezonov và cs.,
2007; Studier, 2014). Môi trường NB và LB được sử dụng phổ biến nhất để nuôi cấy
E. coli do chứa các thành phần dinh dưỡng dễ hấp thụ ở giai đoạn tăng sinh sớm. Tuy
nhiên, các môi trường này không phải là lựa chọn tốt nhất để biểu hiện các protein
dung hợp vì chứa rất ít carbohydrate và các ion kim loại hóa trị II (Sezonov và cs.,
2007). Trong khi đó, thành phần môi trường TB có hàm lượng cao nấm men gấp đôi
so với thành phần môi trường LB và NB, vì vậy khi nuôi cấy E. coli trong môi trường
TB sẽ cho mật độ tế bào cao hơn (Studier, 2005). Mặt khác, các chủng E. coli tái tổ
hợp khi biểu hiện protein dung hợp cần một lượng phosphate rất lớn, điều này chỉ có
môi trường TB đáp ứng được. Hơn nữa, môi trường TB có chứa glycerol cũng đóng
vai trò cảm ứng biểu hiện protein được điều khiển bởi lac promoter (Studier, 2014).
Nhờ đó, hiệu suất biểu hiện protein dung hợp tăng lên đáng kể. Vì vậy, môi trường
TB được chọn làm môi trường biểu hiện enzyme cho chủng tái tổ hợp.
3.2.2.3. Lựa chọn độ thoáng khí cho biểu hiện [genovogenes]_18736 và
[genovogenes]_32768
E. coli là vi khuẩn hiếu khí, do vậy, lượng oxy hòa tan trong môi trường nuôi
cấy là một yếu tố quan trọng, có ảnh hưởng rõ rệt đến sự sinh trưởng. Để nâng cao
hàm lượng sinh khối tế bào cũng như hoạt tính enzyme dung hợp, người ta có thể
điều chỉnh chỉ số oxy hòa tan bằng cách tăng tốc độ lắc hoặc giảm thể tích dịch nuôi
trong bình. Trong nghiên cứu này, chúng tôi đã khảo sát ảnh hưởng của 4 thể tích
dịch nuôi trên cùng một loại bình tam giác (500 mL).
79
2.5
8
)
l
7
m
/
U
2
6
5
1.5
)
L
/
g
(
ô
h
k
i
4
1
3
ố
h
k
h
n
i
S
2
0.5
(
e
s
a
n
a
c
u
l
g
o
d
n
e
h
n
í
t
t
ạ
o
H
1
0
0
10
20
40
60
Thể tích nuôi cấy : Thể tích bình lắc (%)
Sinh khối khô (g/l)
Hoạt tính endoglucanase (U/ml)
Hình 3.18. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính
0.35
12
0.3
10
0.25
endoglucanase của chủng E. coli C43(DE3) tái tổ hợp.
)
L
m
/
U
8
0.2
)
L
/
g
(
ô
h
k
i
6
0.15
4
ố
h
k
h
n
i
S
0.1
(
c
l
g
-
β
h
n
í
t
t
ạ
o
H
2
0.05
0
0
10
20
40
60
Thể tích nuôi cấy : Thể tích bình (%)
Sinh khối khô (g/L)
Hoạt tính β-glucosidase (U/mL)
Hình 3.19. Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính β-
glucosidase của chủng E. coli C43(DE3) tái tổ hợp.
Kết quả nghiên cứu trong Hình 3.18 và 3.19 cho thấy thể tích dịch nuôi cấy có
ảnh hưởng đến quá trình sinh trưởng và biểu hiện enzyme dung hợp. Mật độ tế bào
80
của chủng tái tổ hợp tỉ lệ nghịch với thể tích dịch nuôi cấy. Trong 4 điều kiện khảo
sát, mật độ tế bào đạt cao nhất khi thể tích dịch nuôi cấy chiếm 10% thể tích bình và
giảm dần khi tăng thể tích dịch nuôi cấy. Trong khi đó, hoạt tính endoglucanase và
β-glucosidase tái tổ hợp đạt cao nhất ở bình chứa thể tích dịch nuôi chiếm 20% (hoạt
tính endoglucanase đạt 1,87 U/ml, hoạt tính β-glucosidase đạt 0,31 U/mL). Khi giảm
độ thoáng khí tức tăng thể tích dịch nuôi trong bình lên 40 – 60% thì hoạt tính enzyme
sẽ giảm mạnh, hoạt tính endoglucanase giảm từ 72 - 86%; hoạt tính β-glucosidase
giảm từ 78 - 90% so với điều kiện khảo sát thể tích dịch nuôi chỉ chiếm 20% thể tích
bình. Khi nghiên cứu quá trình nuôi cấy E. coli tái tổ hợp có những điều kiện nuôi
cấy ảnh hưởng đến quá trình sinh trưởng nhưng không ảnh hưởng đến quá trình biểu
hiện protein tái tổ hợp và ngược lại. Protein tái tổ hợp có thể vẫn được sinh ra ngay
cả khi tế bào sinh trưởng chậm hoặc không sinh trưởng. Do đó, chúng ta cần phải
nghiên cứu điều kiện nuôi cấy tối ưu để biểu hiện protein tái tổ hợp cho từng loại
protein cụ thể mà không thể áp dụng chung cho tất cả các loại protein (Mahalik và
cs., 2014). Chính vì vậy, xét về hiệu quả biểu hiện enzyme dung hợp và hiệu quả kinh
tế, tỷ lệ thể tích dịch nuôi cấy chiếm 20% thể tích bình được lựa chọn là tỷ lệ thông
khí thích hợp cho biểu hiện enzyme dung hợp.
3.2.2.4. Lựa chọn nồng độ IPTG thích hợp cho quá trình biểu hiện gen
[denovogenes]_18736 và [denovogenes]_32768
IPTG là chất cảm ứng cho T7-promoter của hầu hết các vector biểu hiện thuộc
hệ thống pET. Trong nghiên cứu này, chúng tôi khảo sát ảnh hưởng của nồng độ
IPTG từ 0,25 - 1,5 mM lên quá trình sinh trưởng, biểu hiện endoglucanase và β-
glucosidase của chủng E. coli C43(DE3) tái tổ hợp. Kết quả nghiên cứu cho thấy
nồng độ IPTG có ảnh hưởng không nhiều đến khả năng sinh trưởng của chủng E. coli
C43(DE3) mang gen [denovogenes]_18736 mã hóa cho endoglucanase (sinh khối
khô dao động từ 4,95 – 5,46 g/l) nhưng lại có ảnh hưởng đáng kể đến hoạt tính
endoglucanase (hoạt tính enzyme dao động từ 0,42 – 1,93 U/ml) (Hình 3.20); trong
khi, nồng độ IPTG không ảnh hưởng nhiều đến khả năng sinh trưởng và biểu hiện β-
glucosidase của chủng E. coli C43(DE3) mang gen [denovogenes]_32768. Sinh khối
khô của chủng dao động từ 7,28 - 8,13 g/L, hoạt tính β-glucosidase dao động từ 0,3
81
– 0,34 U/mL (Hình 3.21). Vì vậy, trong khoảng nồng độ IPTG khảo sát từ 0,25 – 1,5
mM, xét về mặt hiệu quả, nồng độ IPTG 0,25 mM được chọn để cảm ứng biểu hiện
7
2.5
6
cho cả hai loại enzyme dung hợp.
)
L
m
/
U
2
5
1.5
)
L
/
g
(
ô
h
k
i
4
3
1
ố
h
k
h
n
i
S
2
0.5
(
e
s
a
n
a
c
u
l
g
o
d
n
e
h
n
í
t
t
ạ
o
H
1
0
0
0.25
0.5
0.75
1
1.25
1.5
Nồng độ IPTG (mM)
Sinh khối khô (g/L)
Hoạt tính endoglucanase (U/mL)
Hình 3.20. Ảnh hưởng của nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện
9
0.4
8
7
0.3
endoglucanase_18736 của chủng tái tổ hợp.
)
L
m
/
U
6
5
)
L
/
g
(
ô
h
k
i
0.2
4
3
ố
h
k
h
n
i
S
0.1
(
c
l
g
-
β
h
n
í
t
t
ạ
o
H
2
1
0
0
0.25
0.5
0.75
1
1.25
1.5
Nồng độ IPTG (mM)
Sinh khối khô (g/L)
Hoạt tính β-glucosidase (U/mL)
Hình 3.21. Ảnh hưởng của nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện
β-glucosidase của chủng E. coli C43(DE3) tái tổ hợp.
82
3.2.3. Động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của
chủng E. coli C43(DE3) tái tổ hợp
Dưới các điều kiện nuôi cấy được lựa chọn ở trên, quá trình sinh trưởng và biểu
hiện endoglucanase tái tổ hợp của chủng E. coli C43(DE3) mang plasmid
pET17b_18736 vào pha cân bằng sau 42-48 giờ nuôi cấy, phù hợp với điều kiện sinh
lý của vi khuẩn nói chung và loài E. coli nói riêng (Ryan và cs., 1996). Trong khoảng
thời gian này, sinh khối khô đạt giá trị dao động trong khoảng 5,54-5,58 g/l; sinh tổng
hợp endoglucanase đạt 1,92-1,98 U/ml (Hình 3.22). Mặt khác, quá trình sinh trưởng
và biểu hiện β-glucosidase tái tổ hợp của chủng E. coli C43(DE3) mang plasmid
pET17b_32768 cũng vào pha cân bằng sau 42-48 giờ nuôi cấy, sinh khối khô đạt giá
trị dao động trong khoảng 8,21-8,26 g/L; sinh tổng hợp β-glucosidase đạt 0,33-0,34
6
2.5
U/mL (Hình 3.23).
)
l
5
2
m
/
U
4
1.5
)
L
/
g
(
ô
h
k
i
3
1
ố
h
k
h
n
i
S
2
(
e
s
a
n
a
c
u
l
g
o
d
n
e
h
n
í
t
t
ạ
o
H
0.5
1
0
0
0
6
12
18
24
30
36
42
48
54
Thời gian biểu hiện (giờ)
Sinh khối khô
Hoạt tính endoglucanase
Hình 3.22. Động thái sinh trưởng và sinh endoglucanase của chủng
E. coli C43(DE3) tái tổ hợp.
83
0.4
10
9
0.35
8
0.3
7
0.25
)
L
m
/
U
6
0.2
5
)
L
/
g
(
ô
h
k
i
4
0.15
3
ố
h
k
h
n
i
S
0.1
(
c
l
g
-
β
h
n
í
t
t
ạ
o
H
2
0.05
1
0
0
0
2.5
6
12
18
24
30
36
42
48
Thời gian biểu hiện (h)
Sinh khối khô (g/L)
Hoạt tính β-glucosidase (U/mL)
Hình 3.23. Động thái sinh trưởng và sinh β-glucosidase của chủng
E. coli C43(DE3) tái tổ hợp.
3.3. Tinh sạch và xác định tính chất của các cellulase tái tổ hợp
3.3.1. Tinh sạch enzyme tái tổ hợp
Dịch enzyme thô được pha loãng trong đệm A với tỷ lệ thể tích 1:4 (v/v) để
làm tăng khả năng gắn kết với các hạt sắc ký trước khi đưa lên cột sắc ký IMAC-Ni2+.
Quá trình thu nhận các enzyme tái tổ hợp diễn ra cụ thể như sau:
* Ở nồng độ 250 mM imidazol, endoglucanase_18736 bị đẩy ra tập trung ở
phân đoạn 7, trong khi phân đoạn trước và sau đều không có enzyme. Hình ảnh điện
di SDS-PAGE cho thấy protein tái tổ hợp ở dạng hòa tan, sản phẩm protein sau khi
qua cột sắc ký chỉ xuất hiện 1 băng có kích thước khoảng 55 kDa, đúng như theo dự
đoán lý thuyết (Hình 3.24).
* Ở nồng độ 200 mM imidazol, toàn bộ β-glucosidase_32768 được thu về
trong 2 phân đoạn 4 và 5. Ở phân đoạn 3 và 6 không có enzyme. Trên ảnh điện di SDS-
PAGE cho thấy sản phẩm protein sau khi qua cột sắc ký chỉ xuất hiện 1 băng có kích thước
khoảng 50 kDa, đúng như theo dự đoán lý thuyết (Hình 3.25).
84
A B
Chú thích: 1) Vector 0; M: protein ladder (10 - 250 kDa); 2) Dịch phá tế bào trước cảm ứng;
3) Dịch nổi sau khi ly tâm dịch lên men; 4) Dịch phá tế bào sau cảm ứng và 5) protein sau
tinh sạch bằng cột IMAC-Ni2+.
Hình 3.24. Điện di đồ SDS-PAGE (A) và Zymogram (B) của endoglucanase tái tổ hợp.
A B C
Chú thích: Ảnh A) M: thang protein chuẩn (10 - 250 kDa); 1: Dịch enzyme thô; 2: protein
sau tinh sạch bằng cột IMAC - Ni2+. Ảnh C) Phân đoạn protein có hoạt tính thủy phân pNPG
20 mM tạo ra sản phẩm có độ hấp thụ cực đại ở bước sóng 400 nm (màu vàng).
Hình 3.25. Điện di đồ SDS-PAGE (A) và Zymogram (B) của β-glucosidase tái tổ hợp.
85
Các mẫu enzyme thô và enzyme tinh sạch sau đó được đo hàm lượng protein
tổng số để tính hoạt tính riêng của enzyme. Kết quả cho thấy: hiệu suất tinh sạch của
endoglucanase và β-glucosidase tái tổ hợp đều đạt trên 80%, mức độ tinh sạch tăng
từ 5,2-5,6 lần so với dịch enzyme thô (Bảng 3.10). Enzyme tinh sạch đạt tiêu chuẩn
dùng để nghiên cứu các tính chất của enzyme.
Bảng 3.10. Kết quả tinh sạch endoglucanase và β-glucosidase tái tổ hợp bằng cột
IMAC-Ni2+.
Mẫu
Hoạt tính
Protein
Hoạt tính riêng
Mức độ
Hiệu suất
tổng (U)
tổng (mg)
(U/mg)
tinh sạch
thu hồi (%)
Enzyme
Dịch thô
585
1090,5
0,54
1
100
Egl
Dịch tinh
486,72
173,2
2,81
5,2
83,2
sạch
Enzyme
Dịch thô
102
850,3
0,12
1
100
Bgl
Dịch tinh
88,94
132,75
0,67
5,6
87,2
sạch
Chú thích: Egl: Endoglucanase tái tổ hợp; Bgl: Beta-glucosidase tái tổ hợp.
3.3.2. Nghiên cứu một số đặc tính của endoglucanase_18736 và β-
glucosidase_32768 tái tổ hợp
3.3.2.1. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp
Nhiệt độ là một trong những yếu tố quan trọng ảnh hưởng tới hoạt tính của
enzyme. Mỗi enzyme sẽ có một khoảng nhiệt độ tối ưu để xúc tác chuyển hóa cơ chất.
Một trong những tiêu chí được sử dụng khi lựa chọn 2 ORF [denovogenes]_18736
và [denovogenes]_32768 từ bộ dữ liệu DNA metagenome là dựa trên chỉ số dự đoán
Tm của protein ≥ 55C. Do đó, trong nghiên cứu này, khoảng nhiệt độ từ 50 - 65C
đã được sử dụng để khảo sát mức độ ảnh hưởng của nhiệt độ đến hoạt tính của hai
enzyme tái tổ hợp. Kết quả nghiên cứu cho thấy cả endoglucanase_18736 và β-
glucosidase_32768 đều hoạt động tối ưu ở nhiệt độ 55C nhưng
endoglucanase_18736 có xu hướng hoạt động tốt trong khoảng nhiệt độ từ 55 - 60C;
trong khi β-glucosidase_32768 lại hoạt động tốt trong khoảng nhiệt độ thấp hơn chỉ
từ 50 - 55C (Hình 3.26).
86
120
100
)
%
(
i
80
60
40
ố
đ
g
n
ơ
ư
t
h
n
í
t
t
ạ
o
H
20
0
50
55
60
65
Nhiệt độ (C)
Endoglucanase
β-glucosidase
Hình 3.26. Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp.
3.3.2.2. Ảnh hưởng của pH lên hoạt tính enzyme tái tổ hợp
Tương tự như nhiệt độ, mỗi enzyme đạt hoạt tính xúc tác cực đại trong một dải
pH nhất định. Hai enzyme tái tổ hợp được hòa trong các dung dịch đệm có độ pH
rộng từ 3-12 để xác định giá trị pH tối ưu của chúng. Kết quả ở Hình 3.27 và Hình 3.
28 cho thấy cả hai loại enzyme tái tổ hợp đều có khả năng hoạt động trong dải pH
rộng từ axit đến kiềm. Tuy nhiên, endoglucanase tái tổ hợp có phổ pH rộng hơn β-
glucosidase tái tổ hợp. Endoglucanase_18736 hoạt động tốt ở cả 2 vùng axit (pH 3-
5) và kiềm (7-10). Ở giá trị pH 6, hoạt tính tương đối chỉ đạt khoảng 38,5% và đạt
cực đại ở giá trị pH 10 (Hình 3.27). Beta-glucosidase_32768 hoạt động tốt trong dải
pH từ 4-9, đạt hoạt tính tối đa ở pH 8,5 (Hình 3.28). Kết quả nghiên cứu chỉ ra rằng
cả 2 loại enzyme tái tổ hợp có thể đáp ứng được nhiều điều kiện thủy phân sinh khối
từ quá trình tiền xử lý (cả axit và kiềm), tuy nhiên cả 2 enzyme đều có hoạt tính cao
nhất ở điều kiện kiềm, tương ứng với điều kiện sinh thái của suối nước nóng Bình
Châu có pH 7.4 ở miệng giếng phun.
87
120
100
)
%
(
i
80
60
40
ố
đ
g
n
ơ
ư
t
h
n
í
t
t
ạ
o
H
20
0
3
4
5
6
7
8
9
10
11
12
pH
Chú thích: pH: 3-6 (đệm citrate); pH: 7-10 (đệm tris); pH: 11-12 (đệm Na2HPO4)
120
100
Hình 3.27. Ảnh hưởng của pH lên hoạt tính endoglucanase_18736.
)
%
(
i
80
60
40
ố
đ
g
n
ơ
ư
t
h
n
í
t
t
ạ
o
H
20
0
3
4
5
6
7
8
8.5
9
pH
Chú thích: pH: 3-6 (đệm citrate); pH: 7-10 (đệm tris)
Hình 3.28. Ảnh hưởng của pH lên hoạt tính β-glucosidase_32768 .
3.3.2.3. Ảnh hưởng của các ion kim loại lên hoạt tính enzyme tái tổ hợp
Nhiều nghiên cứu cho thấy các enzyme thủy phân cellulose nhạy cảm với các
ion kim loại. Do đó, mức độ ảnh hưởng của các ion kim loại lên hoạt tính của
88
endoglucanase và β-glucosidase tái tổ hợp đã được nghiên cứu. Các mẫu thí nghiệm
được so sánh với mẫu không bổ sung ion kim loại nào. Hoạt tính enzyme của mẫu
không bổ sung ion kim loại được coi là 100%. Kết quả nghiên cứu được trình bày ở
160
140
Hình 3.29 và Hình 3.30.
)
%
120
(
i
100
80
60
40
ố
đ
g
n
ơ
ư
t
h
n
í
t
t
ạ
o
H
20
0
Ion kim loại (5mM)
Hình 3.29. Ảnh hưởng của một số ion kim loại lên hoạt tính endoglucanase_18736.
)
%
(
i
ố
đ
g
n
ơ
ư
t
h
n
í
t
t
ạ
o
H
1800
1700
1600
1500
1400
1300
1200
1100
1000
900
800
700
600
500
400
300
200
100
0
Ion kim loại (5 mM)
Hình 3.30. Ảnh hưởng của một số ion kim loại lên hoạt tính β-glucosidase_32768.
89
Kết quả nghiên cứu cho thấy ở nồng độ 5 mM: các ion kim loại khác nhau có
ảnh hưởng khác nhau lên hoạt tính của enzyme tái tổ hợp. Cụ thể:
Đối với endoglucanase_18736: Ca2+ và Na+ có tác dụng làm tăng hoạt tính
enzyme. Các ion còn lại đều làm giảm (K+, Mn2+, Fe2+, Li+, Co2+, Zn2+, Mg2+, Fe3+)
hoặc làm mất hoàn toàn hoạt tính enzyme (Ag+, Cu2+). Thứ tự ảnh hưởng của các ion
kim loại theo chiều hướng làm tăng hoạt tính của enzyme được biểu diễn như sau:
Ag+< Cu2+< Zn2+< Co2+< Mn2+< Fe3+< Fe2+< Mg2+< Li+< K+< Na+< Ca2+ (Hình 3.29).
Đối với β-glucosidase_32768: K+, Mn2+, Fe2+, Li+, Mg2+, Fe3+, Ca2+ và Na+ có
tác dụng làm tăng hoạt tính enzyme; trong khi Cu2+, Zn2+ và Co2+ lại làm giảm hoạt
tính mạnh đến mức gần như làm mất hoàn toàn hoạt tính enzyme. Thứ tự ảnh hưởng
của các ion kim loại theo chiều hướng làm tăng hoạt tính của enzyme được biểu diễn
như sau: Cu2+< Co2+
biệt các ion Ca2+, Na+, Mg2+ và Li+ làm tăng hoạt tính của enzyme lên 10-17 lần so
với mẫu đối chứng không có ion kim loại (Hình 3.30). Đây là lý do tại sao các enzyme
thủy phân lignocellulose cũng được gọi là enzyme kim loại.
3.3.2.4. Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp
Trên cơ sở những ion kim loại có tác dụng làm tăng hoạt tính của enzyme tái tổ
hợp ở trên, một số ion kim loại đã được thay đổi nồng độ để nghiên cứu mức độ ảnh
hưởng của chúng lên hoạt tính enzyme tái tổ hợp. Kết quả nghiên cứu cho thấy: nồng
độ ion kim loại có ảnh hưởng rõ rệt đến hoạt tính enzyme tái tổ hợp. Ở nồng độ thấp,
các ion kim loại được nghiên cứu (Li+, Na+, Ca2+ và Mg2+) có thể làm tăng hoạt tính
của enzyme tái tổ hợp (nồng độ 5-15mM); nhưng ở nồng độ cao (nồng độ 20-30mM),
các ion kim loại này lại làm giảm đáng kể và có thể làm mất hoàn toàn hoạt tính
enzyme, ngoại trừ ion Ca2+ trong trường hợp endoglucanase_18736. Nồng độ Ca2+
lên tới 30 mM vẫn duy trì hoạt tính của endoglucanase_18736 cao hơn 1,4 lần so với
mẫu không bổ sung ion. Đồng thời, kết quả nghiên cứu cũng cho thấy ở nồng độ 15
mM Ca2+ là nồng độ thích hợp nhất cho hoạt động của endoglucanase_18736, hoạt
tính enzyme đã tăng 1,6 lần so với mẫu không bổ sung ion; nồng độ 10 mM Li+ là
nồng độ thích hợp nhất cho hoạt động của β-glucosidase_32768, ở nồng độ này, Li+
90
đã tạo ra một sự khác biệt rất lớn khi có khả năng làm tăng hoạt tính của enzyme lên
25,5 lần so với mẫu không bổ sung ion (Bảng 3.11).
Bảng 3.11. Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp.
Hoạt tính tương đối của enzyme tái tổ hợp (%)
Ion kim loại
Nồng độ (mM)
Endoglucanase
β-glucosidase
100
0
5
1.727,83 2,13
10
2.550,34 2,17
15
Li+
81,122,64
20
76,84 2,12
25
69,55 2,74
30
33,27 1,32
100
100
0
5
123,42 2,56
1.548,83 5,45
10
87,34 1,23
2.013,42 6,83
15
Na+
46,16 1,97
1.459,73 5,29
20
13,75 1,02
106,54 2,36
0
25
66,673,04
0
30
58,69 1,13
100
100
0
5
144,86 2,23
1.077,07 1,37
10
151,16 3,01
173,17 2,09
15
Ca2+
166,29 6,36
5,9 1,03
0
20
154,54 1,75
0
25
148.02 2,38
0
30
144.88 2,67
100
0
5
1.314,2 6,62
10
1.517,3 5,65
15
Mg2+
1.752,17 6,73
20
182,07 2,59
25
26,72 1,01
0
30
91
3.3.2.5. Độ bền của enzyme tái tổ hợp
Hiện nay, các cellulase được ứng dụng vào thực tiễn sản xuất thường mang
những đặc tính: bền nhiệt, chịu kiềm/axit, ... Do đó, để có thể định hướng ứng dụng
endoglucanase và β-glucosidase tái tổ hợp nghiên cứu ở trên vào thực tiễn, việc xác
định khả năng bền nhiệt của hai enzyme này là cần thiết. Trong nghiên cứu này,
endoglucanase_18736 và β-glucosidase_32768 được xác định khả năng bền nhiệt
trong điều kiện pH và khoảng nhiệt độ tối ưu cho mỗi loại enzyme. Kết quả nghiên
cứu cho thấy: endoglucanase_18736 bền ở nhiệt độ 55C hơn so với 60C. Đồng thời,
sự có mặt của ion Ca2+ (15 mM) không chỉ làm tăng hoạt tính của enzyme mà còn
góp phần làm cho enzyme bền hơn. Cụ thể: ở nhiệt độ 60C, khi có mặt ion Ca2+,
hoạt tính enzyme tăng lên 1,66 lần và vẫn duy trì được hoạt độ này sau 16 giờ ủ, còn
ở mẫu không có Ca2+, hoạt tính enzyme chỉ giữ được 8 giờ ủ. Ở 55C, khi có ion Ca2+,
hoạt tính enzyme cũng tăng lên 1,66 lần và duy trì hoạt độ sau 24 giờ ủ, trong khi ở
mẫu không có Ca2+, hoạt tính enzyme chỉ giữ được trong 12 giờ ủ. Nửa chu kỳ sống
của endoglucanase tái tổ hợp được xác định ở 55ºC là 25.16 0.21 giờ và ở 60ºC là
180
23.11 0.42 giờ (Hình 3.31).
)
160
%
(
i
140
120
100
80
60
ố
đ
g
n
ơ
ư
t
h
n
í
t
t
ạ
o
H
40
20
0
0
10
40
50
20
30
Thời gian (h)
55°C/ -Ca2+
55°C/ + 15mM Ca2+
60°C/ -Ca2+
60°C/ + 15mM Ca2+
Hình 3. 31. Độ bền nhiệt của endoglucanase_18736 được khảo sát tại giá trị
Topt và pHopt.
92
Beta-glucosidase_32768 rất bền ở nhiệt độ 50 và 55C. Trong tất cả các phương
án thí nghiệm, β-glucosidase_32768 vẫn giữ được trên 60% hoạt tính sau 10 ngày ủ
ở 50 và 55C (Hình 3.32). Bên cạnh đó, kết quả nghiên cứu cũng cho thấy: với nồng
độ 10 mM Li+ duy trì trong suốt quá trình ủ enzyme chỉ có tác dụng làm tăng hoạt
tính enzyme ngay tại thời điểm ban đầu (làm cho hoạt tính tăng lên 25,5 lần) mà không
có tác dụng duy trì hoạt tính cũng như làm tăng độ bền của enzyme. Nửa chu kỳ sống của
β-glucosidase tái tổ hợp được xác định ở 55ºC là 11 ngày.
Hình 3.32. Độ bền nhiệt của β-glucosidase_32768 được khảo sát tại giá trị Topt
và pHopt.
93
3.3.2.6. Nghiên cứu tính đặc hiệu cơ chất của endoglucanase_18736 và β-
glucosidase_32768 tái tổ hợp.
Tính đặc hiệu cơ chất của endoglucanase_18736 và β-glucosidase_32768 tái tổ
hợp được xác định dựa trên khả năng thủy phân cơ chất. Các cơ chất dùng trong
nghiên cứu này gồm: CMC, bột giấy, Avicel (ở nồng độ 1%) và pNPG (20 mM) theo
điều kiện phản ứng tối ưu. Kết quả nghiên cứu trong Hình 3.33 cho thấy:
endoglucanase_18736 có khả năng thủy phân CMC và bột giấy, trong đó khả năng
thủy phân bột giấy cao hơn so với CMC. Enzyme Cel8A thuộc họ GH8 từ chủng
Seratia proteamaculans có khả năng thủy phân CMC và Bechwood xylan và cũng
không có khả năng thủy phân Avicel (cơ chất đặc hiệu cho exoglucanase) (Cano-
Ramirez và cs., 2016). Các enzyme khác nhau có phổ cơ chất khác nhau. AcCel12B
tái tổ hợp từ chủng Acidothermus cellulolyticus 11b thuộc họ GH12, có khả năng thuỷ
phân CMC, RAC, Avicel và -glucan nhưng -glucan mới là cơ chất tốt nhất của
enzyme này (Wang và cs., 2015).
Trong khi đó, β-glucosidase_32768 chỉ có khả năng thủy phân pNPG trong dãy
cơ chất khảo sát. Beta-glucosidase bền nhiệt từ chủng nấm mốc Aspergillus fumigatus
Z5 có khả năng thủy phân nhiều loại cơ chất, bao gồm: 4-Nitrophenyl--D-
glucopyranoside, cellobiose, cellotriose, trong đó 4-Nitrophenyl--D-
glucopyranoside là cơ chất phù hợp nhất. Tuy nhiên enzyme này lại không thể thủy
1.8
1.6
1.4
phân được đồng phân α của cơ chất này (Liu và cs., 2012).
p
ợ
h
ổ
t
i
1.2
)
l
1
m
/
U
(
0.8
0.6
0.4
á
t
e
m
y
z
n
e
h
n
í
t
t
ạ
o
H
0.2
0
CMC
Avicel
Bột giấy
p-NPG
Cơ chất
Endoglucanase
β-glucosidase
Hình 3.33. Khả năng thủy phân một số loại cơ chất của endoglucanase_18736 và β-
glucosidase _32768.
94
3.3.2.7. Nghiên cứu thông số động học Km, Vmax của endoglucanase và β-
glucosidase tái tổ hợp
Sử dụng enzyme tái tổ hợp đã được tinh sạch để xác định các thông số động
học. Cơ chất của endoglucanase_18736 và β-glucosidase_32768 tái tổ hợp được sử
dụng để khảo sát là CMC và pNPG ở các nồng độ khác nhau. Kết quả thu được biểu
diễn trên đồ thị với đường cong động học Michaelis và Menten, có phương trình dạng
y = ax/b+x, trong đó a là giá trị Vmax, b là giá trị Km. Các kết quả được xử lý và đồ
thị đường cong được xây dựng qua phần mềm của trang web
http://biomodel.uah.es/metab/enzimas/MM-regresion.htm.
Động học endoglucanase_18736 được thực hiện với cơ chất CMC trong dải
nồng độ từ 0,2-2 mg/ml. Kết quả ở Hình 3.34A cho thấy endoglucanase tái tổ hợp có
hệ số Km 1 mg/ml và Vmax đạt 90,59 μmol/min/ml. Với giá trị Km (1 mg/ml) nhỏ
hơn giá trị Km (6,87 mg/ml) của Cel8A tái tổ hợp từ chủng S. proteamaculans, chứng
tỏ endoglucanase_18736 có ái lực với CMC cao hơn so với Cel8A tái tổ hợp (Cano-
Ramirez và cs., 2016).
Beta-glucosidase_32768 được xác định động học trong khoảng cơ chất pNPG
từ 0,2 - 4 mM. Kết quả cho thấy enzyme có giá trị Km và Vmax lần lượt là 0,66 mM/ml
và 81,81 μmol/min/mg (Hình 3.34B). Hệ số xúc tác của enzyme tương đương với β-
glucosidase Bgl3 bền nhiệt từ chủng A. fumigatus Z5 (Liu và cs., 2012).
A B
Hình 3.34. Động học enzyme tái tổ hợp.
A) Endoglucanase_18736 trên nguồn cơ chất CMC (0,2-2 mg/ml); B) Beta-
glucosidase_32768 trên nguồn cơ chất pNPG (0,2-4 mM).
95
CHƯƠNG 4
BÀN LUẬN KẾT QUẢ NGHIÊN CỨU
4.1. Đa dạng vi sinh vật và tiềm năng khai thác các gen mới mã hóa cho cellulase
suối nước nóng Bình Châu thông qua cách tiếp cận không phụ thuộc vào
nuôi cấy.
4.1.1. Đa dạng vi sinh vật
Theo các tài liệu lịch sử, vào năm 1928, một bác sĩ người Pháp tên là Saillet
trong một chuyến khảo sát vùng Đông Nam Bộ đã phát hiện ra suối nước nóng Bình
Châu với hơn 70 điểm phun nước lộ thiên. Suối nước nóng Bình Châu là suối nước
nóng có nhiệt độ cao thứ 2 ở Việt Nam với nhiệt độ dao động từ 40°C - 84°C. Các
đặc điểm về thành phần và đặc điểm hóa lý của suối nước nóng Bình Châu đã được
nghiên cứu từ lâu bởi các nhà khoa học trong và ngoài nước nhưng các thông tin về
đa dạng vi sinh vật cũng như các hợp chất có hoạt tính sinh học của vi sinh vật vẫn
còn khá hạn chế, ngoại trừ nghiên cứu của Tran KM và cs. (2018), Nguyễn Kim Thoa
và cs. (2015) và Nguyễn Kim Thoa và Trần Thanh Thủy (2018). Do điều kiện lấy
mẫu và bảo quản mẫu còn khó khăn, các nghiên cứu này chủ yếu chỉ dừng lại ở việc
tiếp cận thông qua nuôi cấy các nhóm vi khuẩn có bào tử, do đó dữ liệu thu được chủ
yếu là các loài thuộc chi Bacillus, Geobacillus (Nguyễn Kim Thoa và cs., 2017; Tran
KM và cs., 2018). Trên thực tế, hầu hết các vi sinh vật ưa nhiệt trong suối nước nóng
thường không thể nuôi cấy được, do vậy sử dụng các phương pháp nuôi cấy để đánh
giá đa dạng vi sinh vật của hệ sinh thái này sẽ cho kết quả phiến diện (Kemp và Aller,
2004). Đồng thời, khi nghiên cứu vi sinh vật trong suối nước nóng, các nhà khoa học
phát hiện thấy vi sinh vật có mặt trong hệ sinh thái này chủ yếu là vi khuẩn và cổ
khuẩn (López-López và cs., 2013). Cho đến nay, các nghiên cứu vi sinh vật trong
suối nước nóng Bình Châu đã được công bố mới chỉ phát hiện được vi khuẩn thuộc
chi Bacillus, Geobacillus mà chưa phát hiện được nhóm cổ khuẩn nào. Đây là hạn
chế của phương pháp tiếp cận phụ thuộc vào nuôi cấy. Chính vì vậy, trong nghiên
cứu này, bằng cách tiếp cận không thông qua nuôi cấy Metagenomics, đa dạng vi sinh
vật cũng như các gen mã hóa cho enzyme của vi sinh vật suối nước nóng Bình Châu
96
đã được sáng tỏ hơn. Kết quả nghiên cứu của Luận án là minh chứng đầu tiên cho
thấy vi sinh vật trong suối nước nóng Bình Châu đa dạng hơn rất nhiều so với các
nghiên cứu đã công bố sử dụng phương pháp tiếp cận thông qua nuôi cấy. Cụ thể:
Đã phát hiện được 41 ngành, 57 lớp, 128 bộ, 245 họ, 825 chi và 2.250 loài vi
sinh vật khác nhau hiện diện trong suối nước nóng Bình Châu. Đồng thời, trong số
các ngành vi sinh vật được phát hiện từ tổng trình tự gen đã được dự đoán (156.093
gen), 8 ngành chiếm ưu thế nhất trong suối nước nóng Bình Châu lần lượt là: ngành
Proteobacteria, tiếp theo là Firmicutes, Cyanobacteria, Bacteroidetes,
Planctomycetes, Thaumarchaeota, Actinobacteria và Euryarchaeota. Trong đó, ngành
Thaumarchaeota và ngành Euryarchaeota thuộc giới cổ khuẩn, còn 6 ngành còn lại là
giới vi khuẩn.
Bộ dữ liệu phân loại vi sinh vật suối nước nóng Bình Châu cũng cho thấy sự
có mặt của ba ngành vi khuẩn được biết đến đó là những vi khuẩn siêu ưa nhiệt gồm:
Aquificae, Thermodesulfobacteria và Thermotogae. Ba ngành này chiếm tỷ lệ thấp
tương ứng 0,44%, 0,29% và 0,06% so với toàn bộ vi khuẩn có mặt trong mẫu (Bảng
3.5 và Hình 3.5). Ngành Aquificae gồm chủ yếu là các loài vi khuẩn ưa nhiệt như:
Aquifex pyrophilus (Huber và cs., 1992), Aquifex aeolicus (Deckert và cs., 1998),
Thermocrinis ruber (Huber và cs., 1998), Sulfurihydrogenibium yellowstonense
(Nakagawa và cs., 2005), Desulfurobacterium sp., và Hydrogenivirga sp. Trong khi
Thermodesulfatator atlanticus (Alain và cs., 2010) và Thermodesulfobacterium
thermophilum (Rozanova và Khudiakova, 1974) đã được miêu tả thuộc loại vi khuẩn
ưa nhiệt, khử sulfate, hóa tự dưỡng vô cơ (chemolithoautotrophic). Hai loài này là hai
loài đại diện chính của ngành Thermodesulfobacteria. Loài Thermotoga maritima là
đại diện của vi khuẩn ưa nhiệt độ cực cao, có thể sinh trưởng ở nhiệt độ lên tới 90°C
(Huber và cs., 1986) và là loài chính trong ngành Thermotogae. Từ các phân tích trên
cho thấy suối nước nóng Bình Châu bao gồm vô số các vi sinh vật ưa nhiệt và siêu
ưa nhiệt, hóa tự dưỡng vô cơ.
Không chỉ vậy, với các kết quả nhận được, vi sinh vật trong suối nước nóng
Bình Châu cũng đa dạng hơn vi sinh vật trong suối nước nóng Unkeshwar,
97
Maharashtra, Ấn Độ bởi mặc dù cùng được phân loại gồm 41 ngành nhưng vi sinh
vật trong suối nước nóng Bình Châu (nơi có nhiệt độ 45 - 84ºC) gồm 2.250 loài khác
nhau, còn vi sinh vật trong suối nước nóng Unkeshwar, Maharashtra, Ấn Độ (nhiệt
độ từ 50 - 60ºC) chỉ gồm 719 loài khác nhau (Mehetre và cs., 2015). Kết quả nghiên
cứu này trái ngược với một nghiên cứu gần đây cho rằng suối nước nóng có nhiệt độ
cao hơn thì đa dạng vi sinh vật sẽ thấp hơn (Saxena và cs., 2017). Với 2.250 loài vi
sinh vật khác nhau, suối nước nóng Bình Châu cho thấy có sự đa dạng về loài rất cao.
Điều này có thể bắt nguồn từ vị trí của suối nước nóng Bình Châu nằm trong khu
rừng cấm nguyên sinh quốc gia. Khu vực này có các hệ sinh thái thành phần: (i) Hệ
sinh thái rừng hơi ẩm nhiệt đới, nửa rụng lá trên đất đỏ bazan; (ii) Hệ sinh thái rừng
hơi khô ẩm nhiệt đới nửa rụng lá trên đất xám bạc màu có độ dốc thấp; (iii) Hệ sinh
thái rừng kín nửa rụng lá nhiệt đới vùng đất cát khô dốc thoải; (iv) Hệ sinh thái rừng
kín nửa rụng lá cây họ dầu trên nền đất cát tương đối ẩm; (v) Hệ sinh thái rừng ngập
mặn ven biển.
Ở một khía cạnh khác, bên cạnh những đặc điểm chung tương đồng với các
nghiên cứu khác trên thế giới khi nghiên cứu về đa dạng vi sinh vật trong suối nước
nóng như:
Sự chiếm ưu thế của hai ngành Proteobacteria và Firmicutes trong suối nước
nóng Bình Châu có thể là đặc điểm đặc trưng của suối nước nóng có nhiệt độ cao và
kiềm tính bởi kết quả nghiên cứu này phù hợp với các kết quả nghiên cứu suối
nước nóng Sungai Klah (SK) - suối nước nóng kiềm (pH 7,0-9,0), có nhiệt độ cao
thứ hai ở Malaysia (50 - 110°C) (Chan và cs., 2015) và suối nước nóng ở Kenya
– suối nước nóng kiềm (pH 9,2 – 9,8), có nhiệt độ cao (45,1 – 83,6ºC) (Kambura
và cs., 2016). Trong khi ở suối nước nóng có nhiệt độ cao (45 - 90ºC) và axit nhẹ
(pH 5 - 7), ngành chiếm ưu thế là Proteobacteria và Thermi (Paul và cs., 2016).
Điều đó chứng tỏ, pH của môi trường có tác động đến đa dạng vi sinh vật trong
suối nước nóng.
Hai ngành cổ khuẩn chiếm ưu thế trong suối nước nóng Bình Châu là ngành
Thaumarchaeota và ngành Euryarchaeota. Đây là những ngành cổ khuẩn đã được tìm
98
thấy trong cả suối nước nóng axit và suối nước nóng kiềm (Kambura và cs., 2016;
Paul và cs., 2016).
Phân tích ngành Proteobacteria ở suối nước nóng Bình Châu cho thấy lớp
Gammaproteobacteria chiếm ưu thế nhất (24,87%), tiếp đến là Alphaproteobacteria
(19,61%) và Betaproteobacteria (16,42%) (Bảng 3.6 và Hình 3.5). Các lớp này trước
đây đã được xác định là các lớp chiếm ưu thế trong suối địa nhiệt có nhiệt độ gần
giống với nhiệt độ của suối nước nóng Bình Châu đó là suối nước nóng Amazonian
ở Peru (45 - 90ºC) (Paul và cs., 2016) và suối nước nóng ở Ấn Độ (43,5 - 98ºC)
(Saxena và cs., 2017).
Suối nước nóng Bình Châu cũng có những đặc trưng riêng về đa dạng vi sinh
vật như:
Mức độ chiếm ưu thế ở cấp độ ngành theo thứ tự Proteobacteria > Firmicutes
> Cyanobacteria > Bacteroidetes > Planctomycetes > Thaumarchaeota >
Actinobacteria > Euryarchaeota. Đây là đặc trưng khác biệt với suối nước nóng kiềm
Unkeshwar, Maharashtra, Ấn Độ với 6 ngành chiếm ưu thế Actinobacteria >
Verrucomicrobia > Bacteriodes > Deinococcus-Thermus > Firmicutes > Viruses
(Mehetre và cs., 2015).
Một đặc trưng nữa của vi sinh vật trong suối nước nóng Bình Châu là 4 loài vi
khuẩn chiếm ưu thế nhất đều là những loài được phân lập từ các nguồn có liên quan
đến biển. Đầu tiên, loài Marinobacter manganoxydans (1,514%) là vi khuẩn được
phân lập từ lỗ thông thủy nhiệt ở đáy biển Ấn Độ Dương, có khả năng oxi hóa mangan
(Wang và cs., 2012). Toàn bộ các loài thuộc chi Marinobacter đều là những loài được
phân lập từ biển (Handley và Lloyd, 2013). Tiếp đến, chủng Roseobacter sp. CCS2
(1,308%) được phân lập từ vùng nước ven biển Thái Bình Dương, là một loài của chi
Roseobacter (α-Proteobacteria) thường xuất hiện nhiều ở vùng nước ven biển.
Roseobacter sp. CCS2 là chủng vi khuẩn hiếu khí, quang dưỡng, sử dụng diệp lục để
thu năng lượng từ ánh sáng mà không tạo oxy (aerobic anoxygenic phototroph -
AAnP) (Slightom và Buchan, 2009). Loài vi khuẩn chiếm ưu thế thứ ba có đặc điểm
tương tự chủng Gamma proteobacterium IMCC2047 (1,070%), được phân lập từ một
99
mẫu nước bề mặt thu thập ở khu vực ven biển Hoàng Hải, Hàn Quốc (Kang và cs.,
2011). Cuối cùng, loài Thiobacillus thioparus (0,301%) được biết đến là loài có khả
năng oxy hóa sulfur, phân lập từ thảm vi sinh vật biển (Van den Ende và Gemerden,
1993). Kết quả đánh giá đa dạng vi sinh vật thu được 4 loài vi khuẩn chiếm ưu thế
nhất trong suối nước nóng Bình Châu là những loài có liên quan tới hệ sinh thái biển.
Nguồn gốc của các loài này có thể là do quá trình kiến tạo địa chất của suối nước
nóng Bình Châu trong hàng trăm đến hàng nghìn năm. Từ quan điểm địa chất, tại các
điểm phun, nước đã được tạo thành từ lớp chứa nước trong trầm tích biển đầm lầy
(hologen, gio-pleixtoxen), nước trong khe nứt của đá macma, nhờ áp suất cao tại đây,
chúng được đẩy lên mặt đất qua đới vỡ vụn tại giao điểm của 3 hệ thống đứt gãy kiến
tạo theo hướng: Tây Bắc Đông Nam, Tây Nam Đông Bắc. Nước xuất lộ kiểu dạng
mạch mang theo nhiều bọt khí có mùi lưu huỳnh, những chỗ có nhiều mạch lộ chính
nước trào lên mạnh và tạo thành các vũng nước sâu từ 0,5 đến 1 mét gọi là Bàu nước
nóng. Vị trí địa lý của suối nước nóng Bình Châu cũng là hệ sinh thái ven biển, nơi đây
gần biển Hồ Cốc và biển Hồ Tràm. Chính nhờ những đặc điểm này đã tạo lên đặc trưng
riêng về khu hệ vi sinh vật trong suối nước nóng Bình Châu có sự khác biệt với các
khu hệ vi sinh vật trong các suối nước nóng đã biết khác. Các loài vi khuẩn chiếm ưu
thế trong suối nước nóng Bình Châu chủ yếu là các loài được biết đến có khả năng
tham gia vào các chu trình hóa sinh địa như oxy hóa mangan, oxy hóa lưu huỳnh, …
4.1.2. Tiềm năng khai thác các gen mới mã hóa cho cellulase
Một nghiên cứu ngành gần đây do Freedonia thực hiện vào tháng 1 năm 2018
về “Enzyme công nghiệp toàn cầu” cho thấy nhu cầu toàn cầu về enzyme công nghiệp
dự kiến sẽ tăng 4% (~ 5 tỷ USD) vào năm 2021
(https://www.freedoniagroup.com/Brochure/FocusReports/bFW35117.pdf). Sự phát
triển của nghiên cứu khoa học về enzyme chủ yếu dựa trên các ngành như công nghệ
sinh học, sinh học phân tử và di truyền học. Những tiến bộ liên tục trong các lĩnh vực
nghiên cứu này, đặc biệt liên quan đến kỹ thuật và giải trình tự DNA, dẫn đến sự gia
tăng rộng rãi nhu cầu enzyme trên toàn thế giới. Cellulase là một trong những loại
enzyme có thị phần hàng đầu với nhu cầu tiêu thụ tăng liên tục trong những năm qua
100
do ứng dụng rộng rãi của chúng. Cellulase không phải là một enzyme đơn lẻ mà là
một nhóm bao gồm 3 loại enzyme chính endoglucanase, exoglucanase và β-
glucosidase. Cellulase có thể được tìm thấy ở hầu hết các đại diện của vi sinh vật, bao
gồm cổ khuẩn, vi khuẩn, nấm sợi và xạ khuẩn, nấm men. Do đó, việc tích lũy và tăng
cường các kiến thức về sự đa dạng của enzyme này là rất cần thiết nhằm phát triển
thêm các nghiên cứu cơ bản và ứng dụng về cellulase vào trong đời sống con người.
Cellulase sử dụng trong công nghiệp (sản xuất nhiên liệu sinh học, trong các
quy trình tẩy rửa, dệt nhuộm…) thường có tính chất đặc biệt như chịu nhiệt, chịu
kiềm/ axit hoặc dung môi, muối…, trong đó tính chất chịu nhiệt là một trong những
tiêu chí hàng đầu được quan tâm. Cellulase bền nhiệt nói riêng hay các enzyme ưa
nhiệt nói chung thường được thu nhận từ nhóm vi sinh vật ưa nhiệt và siêu ưa nhiệt
tại các vùng địa nhiệt. Suối nước nóng là một ví dụ về hệ sinh thái địa nhiệt, nơi nhiệt
độ của nước cao hơn nhiệt độ không khí xung quanh. Mặc dù hệ sinh thái này có tiềm
năng để khai thác các enzyme bền nhiệt từ vi sinh vật bản địa nhưng việc tiếp cận
chúng thông qua phương pháp nuôi cấy truyền thống trên các môi trường nhân tạo
hầu như không có hiệu quả, đặc biệt đối với những nhóm vi sinh vật không có bào
tử, hóa tự dưỡng. Do đó, việc phát triển và ứng dụng các kỹ thuật khác không thông
qua nuôi cấy nhằm tiếp cận và khai thác hiệu quả nguồn gen từ những hệ sinh thái
đặc biệt như thế này là vô cùng cần thiết
Mặc dù kỹ thuật metagenomic đã được phát triển và ứng dụng trên thế giới từ
những năm 1998 (Handelsman và cs., 1998) nhưng mới được áp dụng ở Việt Nam từ
những năm 2011 bởi nhóm nghiên cứu của GS. Trương Nam Hải (Trương Nam Hải,
2011-2012) trên hệ vi sinh vật ruột mối nhằm tìm kiếm các cellulase mới. Sau những
khó khăn và thành công ban đầu, hướng nghiên cứu này tiếp tục mở rộng với nhiều
hệ sinh thái khác nhau với nhiều mục đích nhằm tìm kiếm các gen mới, các hợp chất
mới trong tự nhiên. Cùng với các nhóm nghiên cứu khác của Viện Hàn lâm Khoa học
và Công nghệ Việt Nam, nhóm nghiên cứu của chúng tôi cũng sử dụng kỹ thuật
metagenomic để khai thác các gen mã hóa cho cellulase từ quần xã vi sinh vật của
suối nước nóng với mong muốn có thể tìm kiếm được nguồn cellulase mới có khả
101
năng bền nhiệt và bền trong các điều kiện pH axit/kiềm của quá trình tiền xử lý
lignocellulose. Trong nghiên cứu này, suối nước nóng Bình Châu - suối nước nóng
có nhiệt độ cao thứ hai ở Việt Nam (82-84C) với pH kiềm 7,5 – 9,2 được chọn làm
nguồn thu nhận DNA metagenome. Đặc biệt, đây là một trong số ít các suối nước
nóng lộ thiên ở Việt Nam, với vị trí nằm giữa khu rừng tràm nguyên sinh quốc gia.
Việc phân giải các cành cây nhỏ, lá tràm già gãy rụng xuống mặt nước, ngoài việc
tác động của nhiệt độ còn có sự tham gia của quần xã vi sinh vật ở đây. Chính vì vậy,
suối nước nóng Bình Châu có tiềm năng là nguồn dự trữ đa dạng vi sinh vật ưa nhiệt
cao cũng như các enzyme mang những đặc tính mới, có giá trị khoa học và công nghệ,
được tạo ra từ quá trình chọn lọc tự nhiên. Từ bộ dữ liệu DNA metagenome suối nước
nóng Bình Châu, chúng tôi đã sử dụng rất nhiều những công cụ tin sinh nhằm dự
đoán tính chất của các ORF mã hóa cho các enzyme thủy phân cellulose như giá trị
Tm, axit/ kiềm tính, tỷ lệ G+C, độ hòa tan, mức độ tương đồng và mức độ định danh
protein… để từ đó lựa chọn được hai gen [denovogenes]_18736 mã hóa cho
endoglucanase và [denovogenes]_32768 mã hóa cho β-glucosidase cho quá trình thực
nghiệm. Hai gen này đã được biểu hiện trong hệ thống E. coli C43(DE3) và các
protein tái tổ hợp đều ở dạng hòa tan. Kết quả nghiên cứu thực nghiệm cho thấy
endoglucanase_18736 tinh sạch hoạt động tối ưu ở nhiệt độ 55C và pH 10. Ở trong
điều kiện tối ưu này enzyme vẫn giữ được 100% hoạt tính sau 12 h ủ mẫu. Ion Ca2+
có khả năng làm tăng hoạt tính cũng như độ bền của enzyme. Khi có mặt 15 mM
Ca2+, hoạt tính của enzyme đã tăng lên 1,6 lần và vẫn giữ nguyên hoạt tính sau 24 giờ
ủ. Mặt khác, β-glucosidase_32768 cũng hoạt động tối ưu ở nhiệt độ 55C và pH 8,5.
Ở trong điều kiện tối ưu, enzyme vẫn giữ được trên 60% hoạt tính sau 10 ngày ủ mẫu.
Ion Li+ có khả năng làm tăng hoạt tính nhưng không có khả năng làm tăng độ bền của
enzyme. Nửa chu kỳ sống được xác định ở 55ºC của endoglucanase_18736 và β-
glucosidase_32768 lần lượt là 25.16 0.21 giờ và 11 ngày. Mặc dù vẫn có sự không
trùng khớp giữa dự đoán lý thuyết với thực nghiệm, ví dụ endoglucanase_18736 được
dự đoán có nhiệt độ tối ưu ≥ 65ºC, có tính chất axit nhưng thực nghiệm cho thấy
enzyme này có Topt từ 55-60oC, phổ pH rộng từ axit đến kiềm và pHopt 10, tuy nhiên
102
cả 2 enzyme tái tổ hợp thu nhận được đều có những tiềm năng ứng dụng cao vì độ
bền nhiệt và kiềm tính của chúng.
Với những cơ sở lý thuyết thu thập được kết hợp với các kết quả thực nghiệm
có thể khẳng định endoglucanase_18736 và β-glucosidase_32768 là những enzyme
mới vì những lý do cụ thể như sau:
- Về trình tự nucleotide và axit amin: Hai enzyme này được mã hóa bởi 2 trình
tự gen [denovogenes]_18736 và [denovogenes]_32768. Trình tự axit amin của
[denovogenes]_18736 có mức độ tương đồng cao nhất 50,35% so với endoglucanase
của chủng vi khuẩn chưa được phân loại JGI053 (mã số SOD03652 trên Ngân hàng
gen) và 49,31% so với protein thuộc họ GH6 của chủng Polyangium fumosum (mã
số WP_136936398.1) và 43,62% so với endo-1,4-β-D-glucanase của chủng
Thermobifida fusca (mã số 1TML_A). Trong khi đó trình tự axit amin của β-
glucosidase_32768 có quan hệ họ hàng gần nhất với β-glucosidase A của chủng
Parcubacteria bacterium GW2011_GWF2_44_8 (mã số KKT80126.1) với mức độ
tương đồng 53,94%. Đối với các protein có độ tương đồng < 75% so với các protein
trong ngân hàng gen có thể được kỳ vọng là mới (Mount, 2004). Hơn nữa,
endoglucanse_18736 được dự đoán thuộc họ GH6. Cho đến nay, số lượng enzyme
thủy phân cellulose đã được thu nhận bằng kỹ thuật metagenomic chủ yếu thuộc các
họ GH3, GH13, GH2, GH5, GH29, GH51 và GH94 (Duan và Feng, 2010; Tiwari và
cs., 2018). Trong đó, khả năng phát hiện các gen mã hóa cho cellulase thuộc ba họ
GH5, GH51 và GH94 ở DNA metagenome của ruột mối có tỉ lệ khoảng 1 gen
cellulase/0,4 Mb. Còn các gen mã hóa cho endoglucanase thuộc họ GH6 chỉ được tìm
thấy từ DNA metagenome đống ủ phân hữu cơ (Kwon và cs., 2010; Jensen và cs.,
2018). Do đó, việc sàng lọc và lựa chọn được endoglucanase_18736 thuộc họ GH6
trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu đã góp phần làm phong
phú, đa dạng cơ sở dữ liệu gen mã hóa cho cellulase bằng kỹ thuật không thông qua
nuôi cấy.
- Về đặc tính của enzyme: Endoglucanase_18736 và β-glucosidase_32768 có
thể là các enzyme bền kiềm nhất được phát hiện từ DNA metagenome vi sinh vật nói
103
chung và suối nước nóng nói riêng. Endoglucanase_18736 và endoglucanase
Thcel6A tái tổ hợp (Yin và cs., 2015) cùng thuộc họ GH6 và có cùng nhiệt độ tối ưu
(55C) nhưng Endoglucanase_18736 có pH tối ưu là 10 trong khi Thcel6A có pH tối
ưu là 8,5. Trong các nghiên cứu khác cũng đã phát hiện thấy sự có mặt của các gen
mã hóa cho endoglucanase thuộc họ GH6 từ DNA metagenome đống ủ phân hữu cơ
song các enzyme này đều là các enzyme axit (pHopt 6) (Kwon và cs., 2010; Jensen và
cs., 2018).
Tương tự, β-glucosidase _32768 là một trong những enzyme thuộc nhóm GH1
bền nhiệt và rất bền trong môi trường kiềm. Ở nhiệt độ 50C và pH 8,5, enzyme vẫn
giữ được 90% hoạt tính sau 10 ngày. Đồng thời sự có mặt của ion Li+ đã làm tăng
hoạt tính ban đầu của enzyme lên 25 lần, điều này rất có ý nghĩa trong các quy trình
thủy phân sinh khối liên tục hoặc dài ngày. Bằng tiếp cận metagenomic chúng tôi đã
thu nhận được β-glucosidase_32768 bền nhiệt và bền kiềm hơn so với các enzyme
cùng loại đã được công bố. Schroder và cs. (2014) đã phân lập được gen Bgl1 mã hóa
cho β-glucosidase từ DNA metagenome suối nước nóng São Miguel (Azores, Bồ Đào
Nha) cũng có khả năng hoạt động trong dải pH rộng (từ 4,5-9,5) nhưng ở 50°C,
enzyme tái tổ hợp của Bgl1 chỉ giữ được 78% hoạt tính sau 24 giờ. Trong một nghiên
cứu gần đây nhất, gen Vul_bgl1A mã hóa cho β-glucosidase cũng được tách dòng từ
DNA metagenome của mẫu làm giàu vi sinh vật lỗ thông thủy nhiệt đảo Vulcano
(Italy) và biểu hiện trong E. coli. Enzyme tái tổ hợp cũng bền nhiệt và bền trong pH
4-9, tuy nhiên hoạt tính enzyme mất 32% sau 24h ở pH 9 và gần 50% sau 48h ở pH7
(Schröder và cs., 2019).
Tóm lại: Hai enzyme endoglucanse_18736 và β-glucosidase_32768 là những
enzyme mới được phát hiện trong bộ dữ liệu DNA metagenome suối nước nóng Bình
Châu. Cả hai enzyme tái tổ hợp có mức độ tương đồng ~50-55% so với các protein
đã công bố trên ngân hàng gen với khả năng bền nhiệt và bền kiềm tương đương,
thậm chí hơn các enzyme thủy phân cellulose đã được tìm thấy từ DNA metagenome
của các hệ sinh thái khác. Kết quả này lại góp thêm một minh chứng nữa về hiệu quả
của kỹ thuật metagenomics trong việc khai thác các gen/ protein mới của vi sinh vật
104
trong tự nhiên. Đồng thời, đặc điểm của hai enzyme có ý nghĩa thực tiễn đối với các
quy trình thủy phân cellulose ở quy mô lớn.
4.2. Mối liên hệ giữa mô hình cấu trúc với các đặc điểm của
endoglucanase_18736 và β-glucosidase _32768
4.2.1. Phân tích các domain chức năng của Endoglucanase_18736 và β-
glucosidase_32768
Endoglucanase_18736 và β-glucosidase_32768 là các enzyme có cấu trúc nhỏ
gọn, chỉ mang một domain duy nhất - domain xúc tác. Domain xúc tác của
endoglucanase_18736 thuộc họ GH6 nằm từ vị trí axit amin Q236 đến G483 còn
domain xúc tác của gen denovogenes_32768 thuộc họ GH1 nằm từ vị trí axit amin
E2 đến E407. Kumar và cs., (2000) khi so sánh về cấu trúc và trình tự của các protein
ưa nhiệt (thermophilic) và protein ưa ấm (mesophilic) thấy rằng các protein ưa nhiệt
có cấu trúc nhỏ gọn hơn. Hơn nữa, đặc điểm cấu trúc thiếu module liên kết cellulose
của 2 enzyme tái tổ hợp cũng phù hợp với các cấu trúc của một số cellulase bền nhiệt
và hoạt động ở nhiệt độ cao. Endoglucanase của cổ khuẩn Pyrococcus furiosus thuộc
họ GH12 có thể giữ nguyên hoạt tính ở nhiệt độ 112C, với nửa chu kỳ sống ở 95oC
là 40 giờ. Nghiên cứu cấu trúc của enzyme siêu bền nhiệt này cũng cho thấy enzyme
không có CBM - một đặc điểm dường như phổ biến đối với nhiều endoglucanase và
exoglucanase bền nhiệt mà chỉ có một peptide tín hiệu để có thể tiết enzyme ngoại
bào (Bauer và cs., 1999). Một số cellulase bền nhiệt thuộc họ GH7 thu nhận từ nấm
mốc có nang Melanocarpus albomyces (Haakana và cs., 2004) hay endoglucanse
thuộc họ GH8 từ Aquifex aeolicus (Kim và cs., 2000) cũng không có vùng CBM này.
4.2.2. Mô hình cấu trúc 3D của Endoglucanase_18736 và β-glucosidase_32768
tái tổ hợp
Cấu trúc 3D của gen denovogenes_18736
Bền nhiệt là một đặc tính phức tạp của enzyme, nó có thể được điều khiển bởi
một vài nhân tố. Kumar và cs. (2000) cho rằng các protein ưa nhiệt thường có cấu trúc
nhỏ gọn, ở trạng thái oligomeric, có tính kỵ nước, có axit amin phân cực và không phân
cực ở khu vực bề mặt, chứa nhiều cầu muối và nhiều liên kết hydro giữa các chuỗi bên.
Tỷ lệ các axit amin Arg và Tyr thường chiếm ưu thế, trong khi Cys và Ser ít xuất hiện
trong các protein ưa nhiệt. Trong vòng xoắn alpha, protein ưa nhiệt có chứa nhiều axit
105
amin hơn nhưng không có các gốc Pro như ở protein ưa ấm. Căn cứ vào các đặc điểm này,
endoglucanase_18736 có thể được coi là enzyme ưa nhiệt. Cụ thể:
(i) cấu trúc nhỏ gọn do có tỷ lệ các axit amin có kích thước lớn nhỏ, chủ yếu là
các axit amin có kích thước vừa và nhỏ (Phụ lục 13).
(ii) Các axit amin chủ yếu thuộc nhóm kỵ nước và phân bố rải rác trong cấu
trúc. Các axit amin kỵ nước tập trung nhiều ở đầu C, trong các chuỗi xoắn α và chuỗi
mở rộng của tấm β (Phụ lục 14). Đồng thời, cấu trúc của denovogenes_18736 cũng
chứa nhiều axit amin có tính phân cực (Phụ lục 15).
+) của Lys (K) hoặc guanidinium
(iii) Cầu muối thường được hình thành từ anion carboxylate (RCOO−) của
+) của Arg (R). Cấu trúc của protein ổn định và protein bền nhiệt là
Asp(D) hoặc Glu (E) với cation ammonium (RNH3
(RNHC (NH2)2
nhờ các cầu muối và liên kết hydro. Các liên kết này có sự tham gia của một số axit
amin như: Arg (R), Tyr (Y), Trp (W)... Trong mô hình của endoglucanase_18736 xây
dựng có tới 46 vị trí axit amin có thể hình thành liên kết hydro.
(iv) Số lượng Cys có trong cấu trúc khá ít (chỉ có 4 Cys) (Phụ lục 16)
(v) Cuối cùng, trong vòng xoắn α của endoglucanase_18736 có chứa nhiều axit
amin ngoại trừ Pro. Pro chỉ tập trung chủ yếu ở trên các vòng lặp và trước domain
xúc tác (Phụ lục 17).
Ngoài ra, endoglucanase_18736 còn có một số đặc điểm khác cũng góp phần
làm tăng mức độ bền nhiệt. Ví dụ như sự không tham gia vào cấu trúc của 10 axit
amin trong chuỗi peptide, các vòng lặp trong cấu trúc cũng rất ngắn (Phụ lục 18) giúp
cho cấu trúc của enzyme nhỏ gọn hơn. Tỷ lệ các axit amin tích điện âm khá lớn (Phụ
lục 19). Tâm hoạt động của denovogenes là Asp299 tích điện âm và nằm trên chuỗi
3-helix. Sát cạnh Asp299 là Arg298 tích điện dương. Do đó, các ion trái dấu sẽ hút
nhau bằng lực hút tĩnh điện và mối liên kết giữa Asp299 và Arg298 là liên kết ion,
làm cho cấu trúc của khu vực tâm hoạt động trở nên bền vững hơn.
Endoglucanase_18736 cũng chứa nhiều axit amin aliphatic (Phụ lục 20), nhiều axit
amin thơm tập trung trong vùng xúc tác. Các axit amin này nằm trong các vòng lặp,
hoặc trong chuỗi mở rộng của tấm β hoặc trong những vị trí uốn cong (Phụ lục 21).
106
Cầu liên kết disulfide là một trong những đặc điểm giúp gia tăng độ bền nhiệt của
enzyme. Gần đây, Bashirova và cs. (2019) đã dùng kỹ thuật liên kết disulfide dựa trên
cấu trúc (DSB) để làm tăng khả năng bền nhiệt của EGLII từ Penicillium verruculum.
Trong nghiên cứu này, chúng tôi sử dụng phần mềm dự đoán cầu liên kết disulfide
giữa các Cys (Ceroni và cs., 2006) (http://disulfind.dsi.unifi.it/), kết quả cho thấy cấu
trúc của endoglucanase_18736 có 2 cầu liên kết disulfide. Cầu liên kết disulfide thứ
nhất được hình thành giữa Cys300 với Cys343 và cầu liên kết disulfide thứ hai được
hình thành giữa Cys442 với Cys478 (Phụ lục 22). Hai cầu liên kết disulfide này có
thể đóng vai trò giúp endoglucanase_18736 bền nhiệt hơn. Tất cả các đặc điểm mô tả
ở trên phù hợp với giả thiết về cấu trúc của enzyme bền nhiệt của các tác giả Russell
và cs. (1997), Russell và cs. (1998), Haney và cs. (1997), Yennamalli và cs. (2013),
Niu và cs. (2016) và Ge và cs. (2017).
Đặc tính của endoglucanase_18736 cơ bản tương đồng với endoglucanase Egl-
252 của vi khuẩn ưa kiềm Bacillus sp. strain KSM-N252 (Endo và cs., 2001). Chúng
cùng hoạt động tối ưu ở nhiệt độ 55C, pH 10. Tuy nhiên, ion Ca2+ giúp làm tăng
hoạt tính cho endoglucanase_18736 nhưng lại ức chế hoàn toàn hoạt tính của Egl-
252. Mặc dù khá giống nhau về đặc điểm enzyme nhưng chúng lại khác nhau hoàn
toàn về cấu trúc. Trong khi endoglucanase_18736 có cấu trúc nhỏ gọn, chỉ có một
domain xúc tác, không có CBM thì Egl-252 lại có cấu tạo gồm một peptide tín hiệu
dài 29 axit amin và chiều dài của protein trưởng thành gồm 463 axit amin. Đầu C của
enzyme có một CBM được lặp lại thuộc họ GH12. Hơn nữa, trình tự axit amin lặp lại
cũng khác nhau giữa 2 enzyme này. Endoglucnase_18736 có trình tự axit amin lặp
lại từ 2 đến 4 lần trước domain xúc tác (P-T (2)/P-A (4)/P-Q (2)/P-E (2)), còn Egl-
252 có bốn và sáu lần lặp lại P-P-S/ T-E/B-P-(E) ngay trước CBM1 và CBM2.
Ở một khía cạnh khác, endoglucanase_18736 được xác định bằng thực nghiệm
là một endoglucanase bền kiềm. Enzyme này hoạt động tối ưu ở nhiệt độ 55C, pH10.
Ở điều kiện tối ưu, hoạt tính enzyme tăng 1,6 lần (166,29% ± 3,23) khi có mặt ion
Ca2+ và giữ nguyên hoạt độ này sau 24 giờ ủ. Khi nâng nhiệt độ lên 60oC, enzyme
vẫn giữ được hoạt độ này sau 12 giờ ủ.
107
Cho đến nay, các nghiên cứu về trình tự axit amin và cấu trúc 3D của
endoglucanase thuộc họ GH6 vẫn còn ít được biết đến. Mặc dù chúng đều là các
endoglucanase bền nhiệt (50-55C) nhưng endoglucanase_18736 có khả năng bền
kiềm (pH10) trong khi mgCel6A lại chỉ bền trong pH 5-6 (Jensen và cs., 2018). Hai
enzyme này ngoài sự khác biệt về trình tự axit amin, chúng còn có sự khác biệt về
cấu trúc. Cấu trúc của denovogenes_18736 nhỏ gọn chỉ gồm một domain xúc tác
trong khi cấu trúc của mgCel6A gồm hai domain.
Cũng giống như cơ chế bền nhiệt, cơ chế bền kiềm của protein nói chung và của
endoglucanase nói riêng bị điều khiển bởi nhiều yếu tố. Ngoài các yếu tố chung giống
với cơ chế bền nhiệt, có một vài yếu tố riêng giải thích cho cơ chế bền kiềm. Theo
Shirai và cs. (2001), khả năng bền kiềm là do có sự gia tăng số lượng Arg, His và
Gln, và giảm Asp và Lys. Các cặp ion Lys-Asp đã không còn thích hợp và bị thay thế
một phần bằng các cặp ion Arg-Asp. Sự thích nghi trong kiềm dường như là sự tái
tạo của các cặp ion để cân bằng điện tích được giữ trong điều kiện hoạt động ở pH
cao. Trong cấu trúc vùng bảo thủ của endoglucanase_18736 (từ Gln236 đến Gly483)
cho thấy có sự sắp xếp trình tự axit amin theo xu hướng cân bằng điện tích (Phụ lục
19). Ngoài ra, theo nghiên cứu của Linhult và cs. (2004), khả năng bền kiềm là do sự
có mặt của Thr trong cấu trúc. Phân tích về cấu trúc, trình tự axit amin và thành phần
axit amin của endoglucanase_18736 cho thấy sự có mặt của Thr trong cấu trúc. Thr
có mặt ở 12 vị trí trong vùng bảo thủ (từ Gln236 đến Gly483) (Phụ lục 23).
Cấu trúc 3D của gen denovogenes_32768
Cũng tương tự như endoglucanase_18736, β-glucosidase_32768 là một enzyme
bền nhiệt và bền kiềm. Do đó, về mặt cấu trúc, denovogenes_32768 cũng có đầy đủ
các đặc điểm chung của một protein bền nhiệt theo giả thiết của Kumar và cs. (2000)
như cấu trúc nhỏ gọn chỉ gồm một domain xúc tác. Mô hình cấu trúc của β-
glucosidase_32768 chủ yếu là các axit amin có kích thước nhỏ, trên bề mặt tập trung
nhiều axit amin ít kỵ nước và axit amin phân cực, axit amin kỵ nước nằm bên trong
(Phụ lục 24, 25 và 26). Các cầu muối và liên kết hydro giữa các chuỗi bên làm cho
protein được mã hóa bởi β-glucosidase_32768 trở nên ổn định và bền nhiệt. Ngoài
ra, Cys và Ser là những axit amin hiếm gặp trong cấu trúc của β-glucosidase_32768,
108
chỉ có 7 và 15 axit amin (Phụ lục 27, 28). Trong vòng xoắn alpha, β-
glucosidase_32768 có chứa nhiều axit amin, vòng xoắn dài nhất chứa đến 20 axit
amin. Pro ít gặp trong vòng xoắn, Pro thường nằm trong các vòng lặp (Phụ lục 29).
Đồng thời, để có cấu trúc nhỏ gọn, mô hình cấu trúc của β-glucosidase_32768 đã xóa
bỏ 14 axit amin ở trên các vòng lặp (Phụ lục 30). Ngoài ra, một đặc điểm nữa trong
cấu trúc của denovogenes_32768 đó là các axit amin tích điện, aliphatic và axit amin
thơm chiếm số lượng rất lớn. Chúng phân bố khá đều trong mô hình cấu trúc (Phụ
lục 31, 32, 33).
Đặc biệt, khi sử dụng phần mềm Scanprosite của ExPASy
(https://prosite.expasy.org/) đã không xác định được vị trí tâm hoạt động của
denovogenes_32768. Vậy tâm hoạt động của β-glucosidase_32768 nằm ở vị trí nào?
Bằng thực nghiệm đã xác định được β-glucosidase_32768 là một enzyme bền nhiệt
và bền kiềm. Beta-glucosidase_32768 được phân loại thuộc họ GH1. Họ GH1 gồm
β-glucosidase từ cổ khuẩn, thực vật và động vật có vú (Ketudat Cairns và Esen, 2010;
Krisch và cs., 2010). Theo Davies và Henrissat (1995), hầu hết các β-glucosidase đều
có tâm hoạt động hình túi. Kết quả xây dựng mô hình cấu trúc 3D của
denovogenes_32768 (Hình 3.13) cũng cho thấy có một khu vực dạng hình túi. Do đó
khả năng tâm hoạt động của β-glucosidase_32768 nằm trong khu vực này. Đồng thời,
các β-glucosidase thuộc họ GH1 đã được nghiên cứu hầu hết đều có cơ chế xúc tác
kiểu giữ nguyên. Quá trình xúc tác gồm hai bước riêng biệt là quá trình glycosyl hóa
và quá trình khử glycosyl hóa. Axit amin Glu đóng vai trò là axit amin chìa khóa
trong tâm hoạt động và là axit amin bảo thủ được tìm thấy trong tất cả các β-
glucosidase đã được công bố (Davies và Henrissat, 1995; Wang và cs., 1995). Toàn
bộ phản ứng xúc tác của β-glucosidase do hai axit amin Glu thực hiện. Ở vi khuẩn,
một axit amin Glu hoạt động như nucleophile (Motif bảo thủ: I /VTENG) và axit
amin Glu còn lại hoạt động như một chất xúc tác axit/ bazơ chung (Motif bảo thủ:
TFNEP) (Davies và Henrissat, 1995; Singh và cs., 2016). Trong khi β-glucosidase
của thực vật motif: I /VTENG giữ nguyên, còn motif TFNEP thay đổi thành motif:
TXNEX (Zouhar và cs., 2001). So sánh trình tự axit amin của khuôn 1vff.1.A và β-
109
glucosidase_32768 cho thấy khuôn 1vff.1.A có hai motif bảo thủ đặc trưng cho β-
glucosidase GH1 của vi khuẩn. Trong khi đó, trên mô hình β-glucosidase_32768, các
motif này đã thay đổi trình tự axit amin. Cụ thể: Motif I /VTENG và motif TFNEP
đã thay đổi lần lượt thành motif VAEAG và motif TINEA (Phụ lục 34). Cấu trúc 3D
của β-glucosidase_32768 cũng cho thấy axit amin Glu155 trong motif TINEA và
Glu321 trong motif VAEAG đều nằm trọn trong khu vực dạng hình túi được hình
thành bởi các vòng lặp có bề mặt rộng, bao quanh đầu C của sợi β-barrel. Glu155
nằm trên sợi β-barrel thứ 4 còn Glu321 nằm trên sợi β-barrel 7 (Hình 3.13A). Trong
nghiên cứu của Tribolo và cs. (2007) đã công bố cấu trúc X-ray của β-glucosidase
thuộc họ GH1 ở dịch bào tương của người với tâm hoạt động hình túi được hình thành
bởi các vòng lặp có bề mặt rộng, bao quanh đầu C của sợi β-barrel, bên trong túi có
chứa hai axit amin Glu. Trong đó, axit amin Glu đóng vai trò là chất xúc tác axit/bazơ
nằm trên sợi β-barrel thứ 4, còn axit amin Glu đóng vai trò là nucleophilic nằm trên
sợi β-barrel thứ 7.
Từ các phân tích ở trên cho thấy Glu155 và Glu321 có thể là hai axit amin quan
trọng đóng vai trò xúc tác trong tâm hoạt động của β-glucosidase_32768. Tuy nhiên,
để có kết luận chính xác cần phải có thêm một số thực nghiệm về kết tinh protein
cũng như xác định vai trò của một số axit amin chìa khóa bằng phương pháp đột biến
điểm (Czjzek và cs., 2000; Kumar và cs., 2000; Zouhar và cs., 2001; Santos và cs.,
2016). Bên cạnh đó, sự khác biệt trong motif bảo thủ của β-glucosidase_32768 phải
chăng là sự khác biệt được tạo ra bởi nguồn gốc tiến hóa?
Với các kết quả nhận được cho thấy β-glucosidase_32768 không chỉ mới về
trình tự, cấu trúc và tính chất enzyme được thể hiện qua đặc tính bền nhiệt, bền kiềm
so với các enzyme β-glucosidase đã được công bố cho đến nay. Mặc dù cùng thuộc
họ GH1, có pH tối ưu gần như nhau nhưng β-glucosidase_32768 có trình tự axit amin,
có nhiệt độ tối ưu và độ bền nhiệt, bền kiềm cao hơn rất nhiều so với Cen502, một β-
glucosidase mới được thu nhận thông qua sàng lọc thư viện metagenomic của
Bursaphelenchus xylophilus (Zhang và cs., 2017). Beta-glucosidase _32768 vẫn giữ
110
được trên 60% hoạt tính sau 10 ngày khi ủ ở điều kiện tối ưu (nhiệt độ 55oC, pH 8.5).
Trong khi enzyme tái tổ hợp từ Cen502 hoạt động tối ưu ở 38C và chỉ giữ được 51
và 56% hoạt tính sau 24h ủ ở pH tương ứng là 8 và 9. Trình tự axit amin của
denovogenes_32768 cũng rất khác so với Cen502 (Phụ lục 35).
Trong một nghiên cứu khác, mặc dù cùng là enzyme bền nhiệt, có nhiệt độ tối
ưu như nhau (50C) nhưng enzyme tái tổ hợp của β-glucosidase_32768 lại bền kiềm
và có pH tối ưu (pH 8,5) cao hơn pH tối ưu của enzyme tái tổ hợp BglA từ Clostridium
thermocellum (pH 7) (Ahmed và cs., 2019).
Tóm lại: Từ các phân tích ở trên cho thấy: Endoglucanase_18736 và β-
glucosidase_32768 là các enzyme mới không chỉ về trình tự axit amin, cấu trúc mà
còn mang đặc tính mới bền nhiệt và bền kiềm so với những enzyme đã được công bố
cho đến nay. Mặc dù cả hai enzyme đều mang các đặc điểm chung về lý thuyết của
các enzyme bền nhiệt, tuy nhiên các thực nghiệm để tiếp tục làm sáng tỏ cấu trúc và
vai trò của các axit amin chìa khóa của chúng vẫn rất cần thiết và có ý nghĩa.
111
KẾT LUẬN VÀ KIẾN NGHỊ
KẾT LUẬN
1. Sử dụng hệ thống Illumina HiseqTM platform đã giải trình tự DNA metagenome
vi sinh vật suối nước nóng Bình Châu và xây dựng được bộ dữ liệu DNA
metagenome tinh sạch gồm 9,4 GB. Qua phân tích đã xác định được đa dạng vi
sinh vật và các gen mã hóa cho cellulase. Cụ thể, phân loại học vi sinh vật gồm
41 ngành, 57 lớp, 128 bộ, 245 họ, 825 chi và 2.250 loài khác nhau; còn bộ dữ
liệu về các gen mã hóa cho cellulase gồm 82 trình tự mã hóa cho endoglucanase,
exoglucanase và β-glucosidase.
2. Dựa vào các phần mềm tin sinh học đã lựa chọn được 2 trình tự gen
denovogenes_18736 và denovogenes_32768 có độ tương đồng lần lượt là
50,35% và 53,94% so với các gen mã hóa cho cellulase trong GenBank và hai
gen này đã được đăng ký trong GenBank với mã số lần lượt là QAU55420.1 và
QAU55422.1. Đã biểu hiện và tinh sạch được 2 enzyme tái tổ hợp
endoglucanase và β-glucosidase. Enzyme tái tổ hợp endoglucanase và β-
glucosidase sau tinh sạch có hoạt tính riêng đạt lần lượt là 2,81 U/mg và 0,67
U/mg.
3. Đã xác định được các tính chất của enzyme cellulase tái tổ hợp là các enzyme
ưa nhiệt và kiềm tính:
- Endoglucanase tái tổ hợp: pHopt 10; Topt 55ºC; ion Ca2+ và Na+ làm
tăng hoạt tính enzyme, nửa chu kỳ sống của enzyme ở 55oC là 25,16
giờ. Cơ chất phù hợp cho enzyme là CMC và bột giấy. Động học
enzyme khi sử dụng CMC làm cơ chất cho giá trị Km là 1 mg/ml và
Vmax đạt 90,59 μmol/min/ml.
- β-glucosidase tái tổ hợp: pHopt 8,5; Topt 55ºC; ion Li+ có tác dụng làm
tăng hoạt tính enzyme lên 25,5 lần. Nửa chu kỳ sống của enzyme ở
55oC là 11 ngày. Enzyme có chỉ số Km 0,66 mM và Vmax đạt 81,81
μmol/min/mg.
112
KIẾN NGHỊ
1. Tiếp tục khai thác các enzyme thủy phân lignocellulose khác trong bộ dữ liệu
DNA metagenome suối nước nóng Bình Châu để tạo cocktail enzyme.
2. Đánh giá hiệu quả thủy phân một số loại sinh khối cellulose của 2 loại enzyme
tái tổ hợp.
113
NHỮNG CÔNG TRÌNH CỦA TÁC GIẢ ĐÃ CÔNG BỐ
LIÊN QUAN ĐẾN ĐỀ TÀI
1. Trần Thanh Thủy, Lại Thị Hồng Nhung, Trần Đình Mấn, Lê Thị Thanh Xuân,
Nguyễn Kim Thoa (2019) Một số điều kiện ảnh hưởng đến quá trình biểu hiện
gen mã hóa endoglucanase từ DNA metagenome của suối nước nóng Bình Châu
trong Escherichia coli. Tạp chí Sinh học 41(2): 111–118.
2. Trần Thanh Thủy, Lại Thị Hồng Nhung, Lê Thị Thanh Xuân, Nguyễn Kim
Thoa (2019) Nâng cao hiệu quả biểu hiện β-glucosidase tái tổ hợp từ trình tự gen
trong cơ sở dữ liệu Metagenomic suối nước nóng Bình Châu. Tạp chí Công nghệ
Sinh học 17(3): 545-551.
3. Thanh Thuy Tran, Ngoc Lan Nguyen, Van Tung Nguyen, Dinh Man Tran, Huy
Hoang Nguyen, Kim Thoa Nguyen (2021) Analysis of microbial communities in
Binh Chau hot spring through metagenomic DNA sequencing. Vietnam Journal
of Biotechnology (in preparation).
114
TÓM TẮT LUẬN ÁN BẰNG TIẾNG ANH
1. Thesis’s title:
Investigation of microbial diversity as well as selection, expression and
determination of cellulase properties obtained from Binh Chau hot spring, Vietnam
by Metagenomics technique.
2. Introduction
Cellulases are a complex enzyme system comprising of endo-1,4-β-D-
glucanase (endoglucanase, EC 3.2.1.4), exo-1,4-β-D-glucanase (exoglucanase, EC
3.2.1.91) and β-D-glucosidase (β-D-glucoside glucanhydrolase, EC 3.2.1.21).
Cellulases are produced by molds, bacteria, archaea, protozoa, plants and animals.
Cellulases have been widely applied in food industry, alcohol fermentation, animal
feed, textile, laundry, pulp and paper industry. As fossil fuel resources are gradually
exhausted, the demand for alternative, renewable and eco- friendly environment energy
sources is increasing. One of the most interesting alternative energy sources is the
biofuel from lignocellulose biomass. The conversion of lignocellulose biomass into
valuable products such as biofuels, bioplastics and other tectonic chemical clusters
must undergo special conditions such as high temperatures, alkaline/acid pretreatment,
etc. Therefore, the scientists have concentrated to discover novel cellulases that resist
to harsh conditions such as thermostable, high pressure resistance, resistance of
high/low pH, which facility the requirements of lignocellulose metabolism and lowers
production costs.
One of the most promising sources for the thermostable cellulases is
thermophilic microorganisms in hot springs. However, isolation and culturing
microorganisms could not fully discover the potential of genetic material and
enzymes due to approximately 99% of the microorganisms are uncultivable.
Moreover, the microorganism density in the hot spring is much lower than in other
normal environments, therefore, it is difficult to exploit microorganism genetic
resources by culturing. Nowadays, metagenomics is actually a powerful tool for
discover microbial communities and novel enzymes. Based on the metagenome
database and bioinformatics analysis tools, the properties of potential proteins are
able to predicted.
115
Thermophiles and their cellulases from hot springs in Vietnam has been
reported in a few previous studies using conventional techniques. No sustained
research has focused on microbial diversity and novel cellulases using metagenomics
approach. The aims of this study were not only assessing the microbial diversity but
also mining novel genes that encoding to cellulase from the results of sequencing
DNA metagenome of Binh Chau hot spring microbial.
3. Materials and Methods
Materials
- Water and mud samples were collected from the Binh Chau hot springs.
- Bacterial strains: Escherichia coli TOP10F' (Thermo Fisher Scientific), E. coli
JM109 (DE3) (Promega) and E. coli C43 (DE3) (Lucigen).
- [denovovenes] _18736 encoding for endoglucanase and [denovovenes]
_32768 encoding for β-glucosidase.
- Vector pET17b (Novagen). Vectors pJET1.2_18736 and pJET1.2_32768
(PhuSa Biochem). Restriction enzymes: NdeI and HindIII (NEB) and T4 DNA
ligases (Thermo Fisher Scientific). Kit: Kit PowerWater® DNA Isolation (MO BIO),
Kit PowerMax® Soil DNA Isolation (MO BIO), PCR purification kit (GeneJet PCR
purification kit - Thermo Fisher Scientific), plasmid extraction kit (GeneJet Plasmid
Miniprep Kit - Thermo Fisher Scientific) and key chemicals: Carboxymethyl
cellulose (low viscosity, Sigma: C5678), DNSA, glucose, p-nitrophenol, p-
nitrophenyl-β-glucopyranoside (pNPG) (Sigma Aldrich), IPTG and other common
chemicals used in molecular biology, biochemistry and microbial culture.
Methods
- Metagenome DNA extraction and sequencing: metagenome DNAs of Binh
Chau hot spring’s water and mud samples were extracted by using Kit PowerWater®
Bead Tube and PowerMax® Soil DNA Isolation (MO BIO), respectively. The two
metagenome DNA samples were mixed with the volume ratio of 1:1 before
sequencing in Illumina HiSeqTM platform system in BGI Co., Ltd (HongKong).
- Analysis data metagenome DNA sequencing and selection genes encoding
cellulase: Qualified sequencing data produced by Illumina platform was processed
116
and assembled de novo using SOAPdenovo2 and Rabbit. MetaGenMark was then
used to predict genes from assembled scaffolds. The gene catalogs were blasted
against the public databases, including nr, Swiss-Prot, KEGG and CAZy (blast, e-
value<0.00001), retrieving proteins with the highest sequence similarity with the
given genes along with their protein functional annotations. Taxonomic assignment
was performed using nr annotation and MEGAN. The genes encoding novel cellulase
were selected by The melting temperature of ORFs was predicted using Tm predictor
website (http://tm.life.nthu.edu.tw/). Discriminating between Acidic and Alkaline
Enzymes was performed using AcalPred website (http://lin-
group.cn/server/AcalPred). The selected gene sequences encoding cellulase enzyme
were synthesized in pJET1.2 cloning vector by PhuSa Biochem Co., Ltd.
- Structure modeling: The peptide sequences of denovogenes_18736 and
denovogenes_32768 were submitted to the automated comparative protein modeling
server SwissModel (http://swissmodel.expasy.org/) to build up the 3D structures.
- Design of expression vector for denovogenes_18736 and denovogenes_32768
The denovogenes_18736 and denovogenes_32768 genes were amplified
respectively from pJET1.2_18736 and pJET1.2_32768 cloning vector and then
purified by using GeneJET PCR Purification Kit (Thermo Fisher Scientific). Both of
purified PCR products were digested with enzyme NdeI and HindIII, ligated into the
vector pET-17b in the corresponding sites and transformed into E. coli Top10F’. The
degenerated plasmids were named pET17b_18736 and pET17b_32768, which had a
6 His-tag at the C-terminus of denovogenes_18736 and denovogenes_32768 genes.
The plasmids were extracted and digested with enzyme NdeI and HindIII and then
sequenced.
- Investigation of recombinant protein expression
To improve the expression efficiency of endoglucanase encoded by gene
denovogenes_18736 and β-glucosidase encoded by gene denovogenes_32768,
several factors such as host strains, medium culture, IPTG concentration and aeration
were investigated.
117
- Enzyme activity assay
The endoglucanase activity was assayed according to the method of Ghose
(1987) with a minor modification using CMC as a substrate. The reaction was carried
out by adding 500 μl of diluted enzyme extraction into 500 μl of 1% (w/v) CMC
substrate in 100 mM Tris buffer (pH 10) and incubated at 55°C for 30 min. The total
amount of reducing sugar was measured by the DNS method (Miller 1959). One unit
of enzyme was defined as the amount of enzyme which could release 1 μM of
reducing sugar per minute under assay conditions.
The β-glucosidase activity was assayed according to the method of Shi et al.
(2017), with a minor modifications using pNPG as a substrate. A reaction mixture
containing 500 μl of diluted enzyme, 500 μl of 20 mM pNPG substrate and 1,000 µl
of 50 mM Tris buffer (pH 8.5) were incubated at 55°C for 15 min. Then, the reaction
was stopped with 2,000 μl of 200 mM Na2CO3. The p-NP released in the reaction was
determined by the appearance of yellow color and monitoring at 400 nm in
spectrophotometer (Epoch, Bio Tek Instruments, Inc., Winooski, VT, USA). One unit
of enzyme was defined as the amount of enzyme which could releas 1 µM of p-NP
from p-NPG per minute under assay conditions.
- Enzyme purification
The enzyme was purified with IMAC column under the cold condition (4ºC).
The recombinant protein was eluted with 200 – 250 mM imidazole in B buffer. The
protein concentration was assayed according to the method of Bradford (1976). SDS-
PAGE was performed with stacking gel (5% w/v acrylamide) and separating gel (12%
w/v acrylamide) under denature conditions. Zymogram analysis of endoglucanase
and β-glucosidase were carried out using the modified method of Sharma and
Guptasarma (2017) and Neddersen and Elleuche (2015), respectively.
- Biochemical characterizations of recombinant endoglucanase and β-
glucosidase
The optimal temperature and pH, the thermal and pH stability, the effects of
metal ions, substrate specificity and kinetic parameters of recombinant enzymes were
investigated.
118
4. Main results
Binh Chau hot spring located in the Ba Ria – Vung Tau province. This is
considered as the second highest temperature hot spring in Vietnam with
temperatures ranging from 45°C to 82°C and the pH ranging from 7.5 to 7.7. The
metagenome of the Binh Chau hot spring was extracted and sequenced using Illumina
technology. A total of approximately 10.4 Gbp of raw data was purified to produce
9.4 Gbp of clean data. Reads were assembled into 51,346 contigs with a total length
of 172,103,446 bp. Metagenomic binning resulted in 156,093 ORFs.
The microbial community of the Binh Chau hot spring was dominant with
bacteria and archaea and consisted 41 phyla, 57 classes, 128 orders, 245 families, 825
genera and 2,250 different species. The dominant bacteria phyla were Proteobacteria,
Firmicutes, Cyanobacteria, Bacteroidetes, Planctomycetes and Actinobacteria. The
dominant archaea phyla were Thaumarchaeota and Euryarchaeota. Furthermore,
functional annotation using available database: nr, Swiss-Prot, CAZy and KEGG
revealed dynamic potential of hot spring community in terms of metabolism,
environmental information processing, cellular processes and other important
aspects. Most abundant CAZy-associated genes in the Binh Chau hot spring
metagenome were related to glycosyl transferase families GTs (1,633 ORFs) and
glycoside hydrolases families GHs (732 ORFs). In total, we obtained 82 putative
cellulase – encoding ORFs. These ORFs were identified and classified within the
family of GH1, GH3, GH5, GH6, GH8 and GH94.
The aim of metagenomics analysis of the Binh Chau hot spring was to discover
new genes encoding for cellulases. The candidate genes were complete ORFs
encoding for putative cellulose hydrolytic enzymes and satisfied the following
criteria: (i) a length of the sequences about 1200 - 1600 bp; (ii) sharing 50 - 70%
identity with available cellulase sequences deposited in GenBank; (iii) Tm prediction
≥ 55°C; (iv) prediction as an alkaline or acidic enzyme.
Among 5 putative cellulase – encoding complete ORFs, we selected two target
sequences (denovogenes_18736 and denovogenes_32768), which showed low
similarity with those cellulase sequences deposited in GenBank.
119
Denovogenes_18736 showed 50,35% identity with endoglucanase of bacterium JGI
053 (GenBank accession no. SOD03652.1) and 49.31 % identity with endoglucanase
of Polyangium fumosum (GenBank accession no. WP_136936398.1).
Denovogenes_32768 showed 53.94% identity with a β-glucosidase from
Parcubacteria group bacterium (GenBank accession no. KKT80126.1).
Denovogenes_18736 has a length of 1506 bp and encodes for 501 amino acids.
While the length of denovogenes_32768 is 1224 bp and encodes for 407 amino acids.
The optimal temperature of both genes was predicted at ≥ 55ºC. Sequence-based
screening revealed denovogenes_18736 representing a novel endoglucanase-
encoding gene and denovogenes _32768 representing a novel β-glucosidase-
encoding gene. The nucleotide sequences of denovogenes_18736 and
denovogenes_32768 were deposited in GenBank under accession no. QAU55420.1
and QAU55422.1.
Denovogenes_18736 and denovogenes_32768 were successfully ligated into
pET-17b expression vector for generated plasmids (pET-17b_18736 and pET-
17b_32768) and subsequently transformed into E. coli Top10F’. Investigation of the
factors affect recombinant protein expression revealed that the E. coli C43(DE3) was
the best host for expression of pET17b_18736 and pET17b_32768. In addition, the
optimal conditions for growth and enzyme production of recombinant E. coli
C43(DE3) were determined, including the culturing on TB medium at 30ºC with 0.25
mM of IPTG as inducer, the culture volume of 20% compared with the bottle volume
and the expression time is 42–48 hours. In these conditions, the biomass production
and recombinant enzyme activity of E. coli C43(DE3) carrying pET17b_18736
reached up to 5.54–5.58 g /L and 1.92–1.98 U/mL, respectively. The biomass
production and recombinant enzyme activity of the strain E. coli C43(DE3) carrying
pET17b_32768 reached at 8.21 - 8.26 g/L and 0.33 – 0.34 U/ml, respectively.
Two recombinant cellulases were subsequently purified by immobilized metal
ion affinity chromatography (IMAC). The purified target proteins were observed at
the position of 55 kDa and 50 kDa in SDS-PAGE, which were identical to the
120
molecular masses of the recombinant [denovogenes] _18736 and [denovogenes]
_32768. The result of purification also shown that the recovery yield of recombinant
[denovogenes] _18736 and [denovogenes] _32768 reached at approximately 83 and
87% compared with before purification. Where upon it had a specific activity of up
to 2.81 U/mg and 0.67 U/mg. Furthermore, the biochemical characterization of the
purified recombinant enzymes (endoglucanase encoded by [denovogenes] _18736
and β-glucosidase encoded by [denovogenes] _32768) were performed using CMC
substrate for endoglucanase activity and pNPG substrate for β-glucosidase. Both of
recombinant enzymes are thermostable and alkaline stable. Maximal endoglucanase
and β-glucosidase activity were observed at 55ºC. The recombinant enzymes active
over a broad pH range (pH: 3-12 for endoglucanase and pH: 4-9 for β-glucosidase).
However, the optimal pH for endoglucanase and β-glucosidase occurred at pH 10 and
pH 8,5, respectively. Endoglucanase activity was enhanced by presence of 15 mM
Ca2+, while β-glucosidase activity was enhanced by presence of 10 mM Li+.
Recombinant enzymes remained its activity at 55°C and its half-life has been shown
about 25 hours (for endoglucanase) and 11 days (for β-glucosidase). The substrate
for endoglucanase is CMC and pulp, and the substrate for β-glucosidase is pNPG.
Moreover, kinetic parameters of endoglucanase, Km and Vmax were determined as
1 mg/ml and 90,59 μmol/min/ml using CMC substrate. For β-glucosidase, the
apparent Km and Vmax values toward pNPG were 0,66 mM and 81,81 μmol/min/mg,
respectively. With thermostable and alkaline stable, recombinant endoglucanase
encoded by [denovogenes] _18736 and β-glucosidase encoded by [denovogenes]
_32768 not only are the most alkaline stable enzymes known to date but also have
the potential to be used in the treatment of cellulose for biofuel production.
5. Conclusion and future perspectives
This is the first study on investigating of microbial diversity and mining novel
genes encoding potential lignocellulose hydrolytic enzymes from the BinhChau hot
spring - the second highest hot spring in Vietnam. The microbial communities of the
BinhChau hot spring revealed high diversity with 41 phyla, 57 classes, 128 orders,
121
families, 825 genera and 2,250 species. Addition, we found two novel cellulase
encoding genes (denovogenes_18736 encoding for endoglucanase and
denovogenes_32768 encoding for β-glucosidase) from metagenomes. Furthermore,
the recombinant cellulases were functionally expressed in Escherichia coli and
characterized. The recombinant enzymes were determined as thermostable and
alkaline cellulases. The optimal temperature and pH for the recombinant
denovogenes_18736 and denovogenes_32768 were 55ºC and pH 10 and 55ºC and pH
8.5, respectively. At the optimal conditions, the half-life of the recombinant
denovogenes_18736 and denovogenes_32768 were 25 hours and 11 days,
respectively. These two novel cellulases might be promising candidates for
degradation of cellulosic biomass under harsh conditions.
122
TÀI LIỆU THAM KHẢO
1. Acharya S and Chaudhary A (2012) Bioprospecting thermophiles for cellulase
production: a review. Braz J Microbiol 43(3): 844-856.
2. Ahmed SS, Akhter M, Sajjad M and Gul R (2019) Soluble Production,
Characterization, and Structural Aesthetics of an Industrially Important
Thermostable beta-Glucosidase from Clostridium thermocellum in Escherichia
coli. Biomed Res Int 2019: 9308593.
3. Al-Batayneh K, Jacob J and Hussein E (2011) Isolation and Molecular
Identification of New Thermophilic Bacterial Strains of Geobacillus pallidus
and Anoxybacillus flavithermus. Int J Integr Biol 11: 39-43.
4. Alain K, Postec A, Grinsard E, Lesongeur F, Prieur D and Godfroy A (2010)
Thermodesulfatator atlanticus sp. nov., a thermophilic, chemolithoautotrophic,
sulfate-reducing bacterium isolated from a Mid-Atlantic Ridge hydrothermal
vent. Int J Syst Evol Microbiol 60(Pt 1): 33-38.
5. Amin A, Ahmed I, Khalid N, Zhang Y, Xiao M and Li WJ (2018) Insights into
the Thermophile Diversity in Hot Springs of Pakistan. Extremophiles in
Eurasian Ecosystems: Ecology, Diversity, and Applications. Microorganisms
for Sustainability. Egamberdieva D., Panosyan H., Li WJ. (eds) Springer,
Singapore 8: 1-28.
6. Armenteros JJA, Tsirigos KD, Sønderby CK, Petersen TN, Winther O, Brunak
S, von Heijne G and Nielsen H (2019) SignalP 5.0 improves signal peptide
predictions using deep neural networks. Nature Biotechnology 37(4): 420-423.
7. Azadian F, Badoei Dalfard A, Namaki-Shoushtari A, Karami Z and
Hassanshahian M (2017) Production and characterization of an acido-
thermophilic, organic solvent stable cellulase from Bacillus sonorensis HSC7 by
conversion of lignocellulosic wastes. J Genet Eng Biotechnol 15(1): 187-196.
8. Bashirova A, Pramanik S, Volkov P, Rozhkova A, Nemashkalov V, Zorov I,
Gusakov A, Sinitsyn A, Schwaneberg U and Davari MD (2019) Disulfide Bond
Engineering of an Endoglucanase from Penicillium verruculosum to Improve
Its Thermostability. Int J Mol Sci. 2019 Mar 30 20(7): 1602.
123
9. Bauer MW, Driskill LE, Callen W, Snead MA, Mathur EJ and Kelly RM (1999)
An endoglucanase, EglA, from the hyperthermophilic archaeon Pyrococcus
furiosus hydrolyzes beta-1,4 bonds in mixed-linkage (1-->3),(1-->4)-beta-D-
glucans and cellulose. J Bacteriol 181(1): 284-290.
10. Biver S, Stroobants A, Portetelle D and Vandenbol M (2014) Two promising
alkaline beta-glucosidases isolated by functional metagenomics from
agricultural soil, including one showing high tolerance towards harsh
detergents, oxidants and glucose. J Ind Microbiol Biotechnol 41(3): 479-488.
11. Bok JD, Yernool DA and Eveleigh DE (1998) Purification, characterization,
and molecular analysis of thermostable cellulases CelA and CelB from
Thermotoga neapolitana. Appl Environ Microbiol 64(12): 4774-4781.
12. Bolger AM, Lohse M and Usadel B (2014) Trimmomatic: a flexible trimmer
for Illumina sequence data. Bioinformatics 30(15): 2114-2120.
13. Bradford MM (1976) A rapid and sensitive method for the quantitation of
microgram quantities of protein utilizing the principle of protein-dye binding.
Anal Biochem 72(1): 248-254.
14. Bush MF, Oomens J, Saykally RJ and Williams ER (2008) Effects of Alkaline
Earth Metal Ion Complexation on Amino Acid Zwitterion Stability: Results
from Infrared Action Spectroscopy. J Am Chem Soc 130(20): 6463-6471.
15. Cano-Ramirez C, Santiago-Hernandez A, Rivera-Orduna FN, Garcia-Huante Y,
Zuniga G and Hidalgo-Lara ME (2016) Expression, purification and
characterization of an endoglucanase from Serratia proteamaculans CDBB-
1961, isolated from the gut of Dendroctonus adjunctus (Coleoptera: Scolytinae).
AMB Express 6(1): 63.
16. Cao P, Wang L, Wang Y, Zhou N and Chen Y (2015) Alkali-tolerant β-
glucosidase produced by newly isolated Aspergillus fumigatus WL002 from
rotten wood. Int Biodeterior Biodegradation 105: 276-282.
17. Ceroni A, Passerini A, Vullo A and Frasconi P (2006) DISULFIND: a disulfide
bonding state and cysteine connectivity prediction server. Nucleic Acids Res
34(Web Server issue): W177-181.
124
18. Chan CS, Chan KG, Tay YL, Chua YH and Goh KM (2015) Diversity of
thermophiles in a Malaysian hot spring determined using 16S rRNA and
shotgun metagenome sequencing. Front Microbiol 6: 177.
19. Chew YM, Lye S, Md. Salleh M and Yahya A (2018) 16S rRNA metagenomic
analysis of the symbiotic community structures of bacteria in foregut, midgut, and
hindgut of the wood-feeding termite Bulbitermes sp. Symbiosis 76(2): 187-197.
20. Chu Hoàng Hà (2014-2018). Đề tài: "Nghiên cứu metagenome của vi sinh vật
trong các đầm nuôi tôm góp phần tạo cơ sở khoa học để phát triển nghề nuôi
tôm ở Việt Nam". Mã số: Mã số: ĐTĐLCN.16/14.
21. Culligan EP, Sleator RD, Marchesi JR and Hill C (2014) Metagenomics and
novel gene discovery: promise and potential for novel therapeutics. Virulence
5(3): 399-412.
22. Czjzek M, Cicek M, Zamboni V, Bevan DR, Henrissat B and Esen A (2000)
The mechanism of substrate (aglycone) specificity in β-glucosidases is revealed
by crystal structures of mutant maize β-glucosidase-DIMBOA, -DIMBOAGlc,
and dhurrin complexes. Proc Natl Acad Sci U S A 97(25): 13555-13560.
23. Đặng Thị Cẩm Hà (2014-2017). Đề tài: "Nghiên cứu metagenome của vi sinh
vật vùng đất ô nhiễm chất diệt cỏ/dioxin nhằm tìm kiếm các gene, enzyme mới
có khả năng phân hủy dioxin". Mã số: ĐTĐLCN.13/14.
24. Davies G and Henrissat B (1995) Structures and mechanisms of glycosyl
hydrolases. Structure 3(9): 853-859.
25. Deckert G, Warren PV, Gaasterland T, Young WG, Lenox AL, Graham DE,
Overbeek R, Snead MA, Keller M, Aujay M, Huber R, Feldman RA, Short JM,
Olsen GJ and Swanson RV (1998) The complete genome of the
hyperthermophilic bacterium Aquifex aeolicus. Nature 392(6674): 353-358.
26. Dereeper A, Audic S, Claverie J-M and Blanc G (2010) BLAST-EXPLORER
helps you building datasets for phylogenetic analysis. BMC evolutionary
biology 10: 8.
125
27. Dhillon GS, Kaur S, Brar SK and Verma M (2012) Potential of apple pomace
as a solid substrate for fungal cellulase and hemicellulase bioproduction through
solid-state fermentation. Ind Crops Prod 38: 6-13.
28. Dias R, Silva LCF, Eller M, Oliveira V, De Paula S and Silva C (2014)
Metagenomics: Library construction and screening methods: 45-65.
29. Diaz NN, Krause L, Goesmann A, Niehaus K and Nattkemper TW (2009)
TACOA – Taxonomic classification of environmental genomic fragments using
a kernelized nearest neighbor approach. BMC Bioinformatics 10(1): 56.
30. Dinh Kha Trinh, Dinh Thi Quyen, Thi Tuyen Do and Ngoc Minh Nghiem
(2013) Purification and characterization of a novel detergent- and organic
solvent-resistant endo-beta-1,4-glucanase from a newly isolated basidiomycete
Peniophora sp. NDVN01. Turkish Journal of Biology 37: 337-384.
31. Dinsdale EA, Pantos O, Smriga S, Edwards RA, Angly F, Wegley L, Hatay M,
Hall D, Brown E, Haynes M, Krause L, Sala E, Sandin SA, Thurber RV, Willis
BL, Azam F, Knowlton N and Rohwer F (2008) Microbial ecology of four coral
atolls in the Northern Line Islands. PloS one 3(2): e1584-e1584.
32. Đỗ Thị Huyền (2014-2017). Đề tài: "Nghiên cứu metagenome của một số hệ sinh
thái mini tiềm năng nhằm khai thác các gen mới mã hóa hệ enzyme chuyển hóa
hiệu quả lignocellulose”, mã số ĐTĐLCN.15/14, Bộ Khoa học và Công nghệ.
33. Duan CJ and Feng JX (2010) Mining metagenomes for novel cellulase genes.
Biotechnol Lett 32(12): 1765-1775.
34. Endo K, Hakamada Y, Takizawa S, Kubota H, Sumitomo N, Kobayashi T and
Ito S (2001) A novel alkaline endoglucanase from an alkaliphilic Bacillus
isolate: enzymatic properties, and nucleotide and deduced amino acid
sequences. Appl Microbiol Biotechnol 57(1): 109-116.
35. Escuder-Rodríguez JJ, DeCastro ME, Cerdán ME, Rodríguez-Belmonte E,
Becerra M and González-Siso MI (2018) Cellulases from Thermophiles Found
by Metagenomics. Microorganisms 6(3): 66.
36. Ge H, Chu Y and Zhang G (2017) Insight into the mechanism of protein
thermostability based on the residue interaction degrees. bioRxiv: 135319.
126
37. Ghose T (1987) Measurement of cellulase activities. Pure and Applied
Chemistry 59: 257-268.
38. Graham JE, Clark ME, Nadler DC, Huffer S, Chokhawala HA, Rowland SE,
Blanch HW, Clark DS and Robb FT (2011) Identification and characterization of
a multidomain hyperthermophilic cellulase from an archaeal enrichment. Nat
Commun 2: 375.
39. Gromiha MM, Nagarajan R and Selvaraj S (2019) Protein Structural
Bioinformatics: An Overview. Encyclopedia of Bioinformatics and
Computational Biology. S. Ranganathan, M. Gribskov, K. Nakai and C.
Schönbach. Oxford, Academic Press: 445-459.
40. Gromiha M, Pathak M, Kadhirvel S, Ortlund E and Gaucher E (2013)
Hydrophobic environment is a key factor for the stability of thermophilic
proteins. Proteins 81.
41. Gupta P, Mishra A and Vakhlu J (2017) Cloning and characterization of thermo-
alkalistable and surfactant stable endoglucanase from Puga hot spring
metagenome of Ladakh (J&K). Int J Biol Macromol 103(870-877).
42. Gurevich A, Saveliev V, Vyahhi N and Tesler G (2013) QUAST: quality
assessment tool for genome assemblies. Bioinformatics (Oxford, England)
29(8): 1072-1075.
43. Haakana H, Miettinen-Oinonen A, Joutsjoki V, Mäntylä A, Suominen P and
Vehmaanperä J (2004) Cloning of cellulase genes from Melanocarpus
albomyces and their efficient expression in Trichoderma reesei. Enzyme
Microb. Technol 34(2): 159-167.
44. Hahn M, Koll U and Schmidt J (2019) Isolation and Cultivation of Bacteria,
Springer, Cham: 313-351.
45. Hall J, Black GW, Ferreira LM, Millward-Sadler SJ, Ali BR, Hazlewood GP
and Gilbert HJ (1995) The non-catalytic cellulose-binding domain of a novel
cellulase from Pseudomonas fluorescens subsp. cellulosa is important for the
efficient hydrolysis of Avicel. Biochem J 309 ( Pt 3)(Pt 3): 749-756.
46. Hamberg Y, Ruimy-Israeli V, Dassa B, Barak Y, Lamed R, Cameron K, Fontes
CMGA, Bayer EA and Fried DB (2014) Elaborate cellulosome architecture of
127
Acetivibrio cellulolyticus revealed by selective screening of cohesin-dockerin
interactions. PeerJ 2: e636-e636.
47. Handelsman J, Rondon MR, Brady SF, Clardy J and Goodman RM (1998)
Molecular biological access to the chemistry of unknown soil microbes: a new
frontier for natural products. Chem Biol 5(10): R245-249.
48. Handley K and Lloyd J (2013) Biogeochemical implications of the ubiquitous
colonization of marine habitats and redox gradients by Marinobacter species.
Front Microbiol 4(136).
49. Haney P, Konisky J, Koretke KK, Luthey-Schulten Z and Wolynes PG (1997)
Structural basis for thermostability and identification of potential active site
residues for adenylate kinases from the archaeal genus Methanococcus. Proteins
28(1): 117-130.
50. Heath C, Hu XP, Cary SC and Cowan D (2009) Identification of a novel
alkaliphilic esterase active at low temperatures by screening a metagenomic
library from antarctic desert soil. Appl Environ Microbiol 75(13): 4657-4659.
51. Hebditch M, Carballo-Amador MA, Charonis S, Curtis R and Warwicker J
(2017) Protein–Sol: a web tool for predicting protein solubility from sequence.
Bioinformatics 33(19): 3098-3100.
52. Helbert W, Poulet L, Drouillard S, Mathieu S, Loiodice M, Couturier M,
Lombard V, Terrapon N, Turchetto J, Vincentelli R and Henrissat B (2019)
Discovery of novel carbohydrate-active enzymes through the rational exploration
of the protein sequences space. Proc Natl Acad Sci U S A 116(13): 6063-6068.
53. Hobel CF, Marteinsson VT, Hreggvidsson GO and Kristjansson JK (2005)
Investigation of the microbial ecology of intertidal hot springs by using diversity
analysis of 16S rRNA and chitinase genes. Appl Environ Microbiol 71(5): 2771-2776.
54. Hsieh CWC, Cannella D, Jørgensen H, Felby C and Thygesen LG (2015)
Cellobiohydrolase and endoglucanase respond differently to surfactants during
the hydrolysis of cellulose. Biotechnol Biofuels 8: 52-52.
55. http://www.cazy.org.
56. https://prosite.expasy.org/.
128
57. https://swissmodel.expasy.org/interactive.
58. https://www.freedoniagroup.com/Brochure/FocusReports/bFW35117.pdf.
59. https://www.sciencebuddies.org/science-fair-projects/references/genomics-g-
c-content-calculator.
60. Huang X, Shao Z, Hong Y, Lin L, Li C, Huang F, Wang H and Liu Z (2010)
Cel8H, a novel endoglucanase from the halophilic bacterium Halomonas sp.
S66-4: Molecular cloning, heterogonous expression, and biochemical
characterization. J Microbiol 48(3): 318-324.
61. Huang Y, Krauss G, Cottaz S, Driguez H and Lipps G (2005) A highly acid-
stable and thermostable endo-beta-glucanase from the thermoacidophilic
archaeon Sulfolobus solfataricus. Biochem J 385(Pt 2): 581-588.
62. Huber R, Eder W, Heldwein S, Wanner G, Huber H, Rachel R and Stetter KO
(1998) Thermocrinis ruber gen. nov., sp. nov., A pink-filament-forming
hyperthermophilic bacterium isolated from yellowstone national park. Appl
Environ Microbiol 64(10): 3576-3583.
63. Huber R, Langworthy TA, König H, Thomm M, Woese CR, Sleytr UB and
Stetter KO (1986) Thermotoga maritima sp. nov. represents a new genus of
unique extremely thermophilic eubacteria growing up to 90°C. Arch Microbiol
144(4): 324-333.
64. Huber R, Wilharm T, Huber D, Trincone A, Burggraf S, König H, Reinhard R,
Rockinger I, Fricke H and Stetter KO (1992) Aquifex pyrophilus gen. nov. sp.
nov., Represents a Novel Group of Marine Hyperthermophilic Hydrogen-
Oxidizing Bacteria. Syst Appl Microbiol 15(3): 340-351.
65. Huson DH, Auch AF, Qi J and Schuster SC (2007) MEGAN analysis of
metagenomic data. Genome Res 17(3): 377-386.
66. Hussein EI, Jacob JH, Shakhatreh MAK, Abd Al-Razaq MA, Juhmani ASF and
Cornelison CT (2017) Exploring the microbial diversity in Jordanian hot springs
by comparative metagenomic analysis. MicrobiologyOpen 6(6): e00521.
67. Itoh T, Suzuki K and Nakase T (2002) Vulcanisaeta distributa gen. nov., sp. nov.,
and Vulcanisaeta souniana sp. nov., novel hyperthermophilic, rod-shaped
129
crenarchaeotes isolated from hot springs in Japan. Int J Syst Bacteriol 52(4):
1097 - 1104.
68. Itoh T, Suzuki K, Sanchez P and Nakase T (1999) Caldivirga maquilingensis
gen. nov., sp. nov., a new genus of rod-shaped crenarchaeote isolated from a hot
spring in the Philippines. Int J Syst Bacteriol 49(3): 1157 - 1163.
69. Iyo AH and Forsberg CW (1996) Endoglucanase G from Fibrobacter
succinogenes S85 belongs to a class of enzymes characterized by a basic C-
terminal domain. Can J Microbiol 42(9): 934-943.
70. Jayasekara S and Ratnayake R (2019) Microbial Cellulases: An Overview and
Applications.
71. Jensen MS, Fredriksen L, MacKenzie AK, Pope PB, Leiros I, Chylenski P,
Williamson AK, Christopeit T, Østby H, Vaaje-Kolstad G and Eijsink VGH
(2018) Discovery and characterization of a thermostable two-domain GH6
endoglucanase from a compost metagenome. PLOS ONE 13(5): e0197862.
72. Jimenez DJ, Andreote FD, Chaves D, Montana JS, Osorio-Forero C, Junca H,
Zambrano MM and Baena S (2012) Structural and functional insights from the
metagenome of an acidic hot spring microbial planktonic community in the
Colombian Andes. PLoS One 7(12): e52069.
73. Jönsson LJ, Alriksson B and Nilvebrant NO (2013) Bioconversion of
lignocellulose: inhibitors and detoxification. Biotechnol Biofuels 6(1): 16.
74. Juturu V and Wu JC (2014) Microbial cellulases: Engineering, production and
applications. Renewable and Sustainable Energy Reviews 33: 188-203.
75. Kambura AK, Mwirichia RK, Kasili RW, Karanja EN, Makonde HM and Boga
HI (2016) Bacteria and Archaea diversity within the hot springs of Lake Magadi
and Little Magadi in Kenya. BMC Microbiology 16(1): 136.
76. Kang I, Kang D, Oh HM, Kim H, Kim HJ, Kang TW, Kim SY and Cho JC
(2011) Genome sequence of strain IMCC2047, a novel marine member of the
Gammaproteobacteria. J Bacteriol 193(14): 3688-3689.
130
77. Kemp PF and Aller JY (2004) Bacterial diversity in aquatic and other
environments: what 16S rDNA libraries can tell us. FEMS Microbiol Ecol
47(2): 161-177.
78. Ketudat Cairns JR and Esen A (2010) Beta-Glucosidases. Cell Mol Life Sci
67(20): 3389-3405.
79. Khalid NA, Rajandas H, Parimannan S, Croft LJ, Loke S, Chong CS, Bruce NC
and Yahya A (2019) Insights into microbial community structure and diversity
in oil palm waste compost. 3 Biotech 9(10): 364.
80. Kim JO, Park SR, Lim WJ, Ryu SK, Kim MK, An CL, Cho SJ, Park YW, Kim
JH and Yun HD (2000) Cloning and characterization of thermostable
endoglucanase (Cel8Y) from the hyperthermophilic Aquifex aeolicus VF5.
Biochem Biophys Res Commun 279(2): 420-426.
81. Krause L, Diaz NN, Goesmann A, Kelley S, Nattkemper TW, Rohwer F,
Edwards RA and Stoye J (2008) Phylogenetic classification of short
environmental DNA fragments. Nucleic Acids Res 36(7): 2230-2239.
82. Krisch J, Takó M, Papp T and Vágvölgyi C (2010) Characteristics and potential
use of β-glucosidases from Zygomycetes. Current Research; Technology and
Education Topics in Applied Microbiology and Microbial Biotechnology,
Edition: MICROBIOLOGY BOOK SERIES - Number 2, Publisher: Formatex
Research Center, Editors: Méndez-Vilas A.: 891-896.
83. Ku T, Lu P, Chan C, Wang T, Lai S, Lyu P and Hsiao N (2009) Predicting
melting temperature directly from protein sequences. Comput Biol Chem 33(6):
445-450.
84. Kumar S, Stecher G, Li M, Knyaz C and Tamura K (2018) MEGA X: Molecular
Evolutionary Genetics Analysis across Computing Platforms. Molecular
Biology and Evolution 35(6): 1547-1549.
85. Kumar S, Tsai CJ and Nussinov R (2000) Factors enhancing protein
thermostability. Protein Eng 13(3): 179-191.
86. Kwon EJ, Jeong YS, Kim YH, Kim SK, Na HB, Kim J, Yun HD and Kim H
(2010) Construction of a metagenomic library from compost and screening of
131
cellulase- and xylanase-positive clones. J Korean Soc Appl Biol Chem 53(6):
702-708.
87. Laemmli UK (1970) Cleavage of structural proteins during the assembly of the
head of bacteriophage T4. Nature 227(5259): 680-685.
88. Langmead B and Salzberg SL (2012) Fast gapped-read alignment with Bowtie
2. Nat Methods 9(4): 357-359.
89. Larkin M, Blackshields G, Brown N, Chenna R, McGettigan P, McWilliam H,
Valentin F, Wallace I, Wilm A, Lopez R, Thompson J, Gibson T and Higgins D
(2007) Clustal W and Clustal X version 2.0. Bioinformatics 23(21): 2947-2948.
90. Le Costaouëc T, Pakarinen A, Várnai A, Puranen T and Viikari L (2013) The
role of carbohydrate binding module (CBM) at high substrate consistency:
Comparison of Trichoderma reesei and Thermoascus aurantiacus Cel7A
(CBHI) and Cel5A (EGII). Bioresour Technol 143: 196-203.
91. Lê Mai Hương (2014-2017). Đề tài: Nghiên cứu metagenome vi sinh vật đất
vùng rễ một số đại diện cây trồng ở Việt Nam: cây thuốc có củ (cây nghệ), cây
công nghiệp (cà phê, lạc) nhằm tăng năng suất và chất lượng cây trồng. Mã số:
ĐTĐLCN. 14/4.
92. Leis B, Heinze S, Angelov A, Pham VT, Thurmer A, Jebbar M, Golyshin PN,
Streit WR, Daniel R and Liebl W (2015) Functional Screening of Hydrolytic
Activities Reveals an Extremely Thermostable Cellulase from a Deep-Sea
Archaeon. Front Bioeng Biotechnol 3: 95.
93. Li W and Godzik A (2006) Cd-hit: a fast program for clustering and
comparing large sets of protein or nucleotide sequences. Bioinformatics
22(13): 1658-1659.
94. Liew KJ, Lim CC, Chan CS, Wei KY, Salleh MM, Sani RK, Chan KG and Goh
KM (2018) Chapter 16 - Direct Cellulase Gene Amplification From Hot Spring
Using the Guidance of 16S rRNA Amplicon Metagenomics. Metagenomics. M.
Nagarajan, Academic Press: 309-325.
95. Lin H, Chen W and Ding H (2013) AcalPred: a sequence-based tool for
discriminating between acidic and alkaline enzymes. PLoS One 8(10): e75726.
132
96. Linhult M, Gulich S, Graslund T, Simon A, Karlsson M, Sjoberg A, Nord K and
Hober S (2004) Improving the tolerance of a protein a analogue to repeated alkaline
exposures using a bypass mutagenesis approach. Proteins 55(2): 407-416.
97. Liu D, Zhang R, Yang X, Zhang Z, Song S, Miao Y and Shen Q (2012)
Characterization of a thermostable beta-glucosidase from Aspergillus fumigatus
Z5, and its functional expression in Pichia pastoris X33. Microb Cell Fact 11: 25.
98. López-López O, Cerdán ME and González-Siso MI (2013) Hot Spring
Metagenomics. Life 3(2): 308-320.
99. Lopez-Mondejar R, Zuhlke D, Becher D, Riedel K and Baldrian P (2016)
Cellulose and hemicellulose decomposition by forest soil bacteria proceeds by
the action of structurally variable enzymatic systems. Sci Rep 6: 25279.
100. Luo R, Liu B, Xie Y, Li Z, Huang W, Yuan J, He G, Chen Y, Pan Q, Liu Y,
Tang J, Wu G, Zhang H, Shi Y, Liu Y, Yu C, Wang B, Lu Y, Han C, Cheung
DW, Yiu SM, Peng S, Xiaoqian Z, Liu G, Liao X, Li Y, Yang H, Wang J, Lam
TW and Wang J (2012) SOAPdenovo2: an empirically improved memory-
efficient short-read de novo assembler. GigaScience 1(1): 18-18.
101. Lý Kim Bảng, Lê Gia Hy, Tăng Thị Chính, Phan Tuyết Minh, Lê Thị Thanh
Xuân, Trần Quang Huy, Đào Ngọc Quang and Phạm Thị Cúc (1999). Sử dụng
vi sinh vật có hoạt tính phân giải cellulose cao để nâng cao chất lượng phân hủy
rác thải sinh hoạt và nông nghiệp. Báo cáo khoa học, Hội nghị Công nghệ Sinh
học toàn quốc, Hà Nội, NXB Khoa học và Kỹ thuật.
102. Mahalik S, Sharma A and Mukherjee K (2014) Genome engineering for
improved recombinant protein expression in Escherichia coli. Microb Cell Fact
13: 177.
103. Malkawi H and Al-Omari M (2010) Culture-dependent and culture-independent
approaches to study the bacterial and archaeal diversity from Jordanian hot
springs. Afr J Microbiol Res 4: 923-932.
104. Marchler-Bauer A, Bo Y, Han L, He J, Lanczycki CJ, Lu S, Chitsaz F,
Derbyshire MK, Geer RC, Gonzales NR, Gwadz M, Hurwitz DI, Lu F, Marchler
133
GH, Song JS, Thanki N, Wang Z, Yamashita RA, Zhang D, Zheng C, Geer LY
and Bryant SH (2017) CDD/SPARCLE: functional classification of proteins via
subfamily domain architectures. Nucleic acids research 45(D1): D200-D203.
105. Mardanov AV, Gumerov VM, Beletsky AV, Perevalova AA, Karpov GA,
Bonch-Osmolovskaya EA and Ravin NV (2011) Uncultured archaea dominate
in the thermal groundwater of Uzon Caldera, Kamchatka. Extremophiles 15(3):
365-372.
106. Marsh CL and Larsen DH (1953) Characterization of some thermophilic
bacteria from the Hot Springs of Yellowstone National Park. J Bacteriol 65(2):
193-197.
107. Mehetre GT, Paranjpe AS, Dastager SG and Dharne MS (2015) Complete
metagenome sequencing based bacterial diversity and functional insights from
basaltic hot spring of Unkeshwar, Maharashtra, India. Genomics data 7: 140-143.
108. Merino N, Aronson HS, Bojanova DP, Feyhl-Buska J, Wong ML, Zhang S and
Giovannelli D (2019) Living at the Extremes: Extremophiles and the Limits of
Life in a Planetary Context. Frontiers in microbiology 10: 780-780.
109. Miller G (1959) Use of Dinitrosalisylic acid reagent for determination of
reducing sugars. Anal Chem 31: 426-428.
110. Miroux B and Walker JE (1996) Over-production of Proteins inEscherichia coli:
Mutant Hosts that Allow Synthesis of some Membrane Proteins and Globular
Proteins at High Levels. J Mol Biol 260(3): 289-298.
111. Mount DW (2004) Bioinformatics: Sequence and Genome Analysis, Cold
Spring Harbor Laboratory Press.
112. Nakagawa S, Shtaih Z, Banta A, Beveridge TJ, Sako Y and Reysenbach AL
(2005) Sulfurihydrogenibium yellowstonense sp. nov., an extremely
thermophilic, facultatively heterotrophic, sulfur-oxidizing bacterium from
Yellowstone National Park, and emended descriptions of the genus
Sulfurihydrogenibium, Sulfurihydrogenibium subterraneum and
Sulfurihydrogenibium azorense. Int J Syst Evol Microbiol 55(Pt 6): 2263-2268.
134
113. Nam KH, Kim SJ, Kim MY, Kim JH, Yeo YS, Lee CM, Jun HK and Hwang
KY (2008) Crystal structure of engineered β-glucosidase from a soil
metagenome. Proteins 73(3): 788-793.
114. Neddersen M and Elleuche S (2015) Fast and reliable production, purification
and characterization of heat-stable, bifunctional enzyme chimeras. AMB Express
5(1): 33.
115. Nguyễn Kim Thoa và Trần Thanh Thủy (2018). Đặc điểm Carboxymethyl
cellulase kiềm của chủng vi khuẩn ưa nhiệt phân lập từ suối nước nóng Bình
Châu. Báo cáo Khoa học. Hội nghị Khoa học Công nghệ Sinh học toàn quốc
2018., Trung tâm Hội nghị Quốc gia Hà Nội, 26 tháng 10 năm 2018., Nhà xuất
bản Khoa học Tự nhiên và Công nghệ: 1230-1235.
116. Nguyễn Kim Thoa, Trần Thanh Thủy, Trần Thị Hoa và Trần Đình Mấn (2015).
Tiềm năng thu nhận enzyme bền nhiệt từ nhóm vi khuẩn phân lập tại suối nước
nóng Bình Châu. Báo cáo Khoa học về Sinh thái và Tài nguyên sinh vật. Hội nghị
Khoa học toàn quốc về Sinh thái và Tài nguyên sinh vật lần thứ 6: 1234-1238.
117. Nguyễn Kim Thoa, Trần Thị Hoa, Trần Đình Mấn và Tạ Thị Thu Thủy (2017)
Nghiên cứu tính chất α-Amylase của các chủng vi khuẩn thuộc chi Geobacillus phân
lập ở suối nước nóng Bình Châu. Tạp chí Công nghệ Sinh học 15(2): 373-380.
118. Nguyễn Thị Kim Cúc (2014-2018). Đề tài: “Nghiên cứu metagenome của vi
sinh vật liên kết hải miên tại biển miền Trung Việt Nam nhằm phát hiện và sàng
lọc các chất hoạt tính sinh học mới”, Mã số: ĐTĐLCN.17/14.
119. Niu C, Zhu L, Xu X and Li Q (2016) Rational Design of Disulfide Bonds
Increases Thermostability of a Mesophilic 1,3-1,4-beta-Glucanase from
Bacillus terquilensis. PLoS One 11(4): e0154036.
120. Panasik N, Brenchley JE and Farber GK (2000) Distributions of structural
features contributing to thermostability in mesophilic and thermophilic
alpha/beta barrel glycosyl hydrolases. Biochim Biophys Acta 1543(1): 189-201.
121. Paul S, Cortez Y, Vera N, Villena G and Gutiérrez-Correa M (2016)
Metagenomic analysis of microbial community of an Amazonian geothermal
spring in Peru. Genomics Data 9.
135
122. Payne CM, Knott BC, Mayes HB, Hansson H, Himmel ME, Sandgren M,
Ståhlberg J and Beckham GT (2015) Fungal Cellulases. Chem Rev 115(3):
1308-1448.
123. Pedron R, Esposito A, Bianconi I, Pasolli E, Tett A, Asnicar F, Cristofolini M,
Segata N and Jousson O (2019) Genomic and metagenomic insights into the
microbial community of a thermal spring. Microbiome 7(1): 8.
124. Pereira J, Giese E, Moretti M, dos Santos AC, Micali Perrone O, Boscolo M,
Da Silva R, Gomes E and Martins D (2017) Effect of metal ions, chemical
agents and organic compounds on lignocellulolytic enzymes activities. Enzyme
Inhibitors and Activators, InTech: 139-164.
125. Perevalova A, Bidzhieva S, Kublanov I, Hinrichs K, Liu X, Mardanov A,
Lebedinsky A and Bonch-Osmolovskaya E (2010) Fervidicoccus fontis gen.
nov., sp. nov., an anaerobic, thermophilic crenarchaeote from terrestrial hot
springs, and proposal of Fervidicoccaceae fam. nov. and Fervidicoccales ord.
nov. Int J Syst Bacteriol 60(9): 2082 - 2088.
126. Phạm Công Hoạt, Phùng Thu Nguyệt and Trần Ngọc Hùng (2014)
Metagenomics và việc khai thác tiềm năng đa dạng sinh học nguồn gen vi sinh
vật của Việt Nam. Tạp chí khoa học công nghệ Việt Nam 21: 6-9.
127. Phan Thị Tuyết Minh, Nguyễn Quốc Việt, Nguyễn Kim Thoa, Lê Gia Hy and
Trần Đình Mấn (2016) Thiết kế hệ thống biểu hiện ổn định gen mã hóa
endoglucanase trong Bacillus subtilis 168M. Tạp chí Công nghệ Sinh học 14(2):
347-351.
128. Placido A, Hai T, Ferrer M, Chernikova TN, Distaso M, Armstrong D, Yakunin
AF, Toshchakov SV, Yakimov MM, Kublanov IV, Golyshina OV, Pesole G,
Ceci LR and Golyshin PN (2015) Diversity of hydrolases from hydrothermal
vent sediments of the Levante Bay, Vulcano Island (Aeolian archipelago)
identified by activity-based metagenomics and biochemical characterization of
new esterases and an arabinopyranosidase. Appl Microbiol Biotechnol 99(23):
10031-10046.
136
129. Poidevin L, Feliu J, Doan A, Berrin J, Bey M, Coutinho P, Henrissat B, Record
E and Heiss-Blanquet S (2013) Insights into exo- and endoglucanase activities
of family 6 glycoside hydrolases from Podospora anserina. Appl Environ
Microbiol 79(14): 4220-4229.
130. Posta K, Beki E, Wilson DB, Kukolya J and Hornok L (2004) Cloning,
characterization and phylogenetic relationships of cel5B, a new endoglucanase
encoding gene from Thermobifida fusca. J Basic Microbiol 44(5): 383-399.
131. Pruitt K, Tatusova T and Maglott D (2007) NCBI reference sequences (RefSeq):
a curated non-redundant sequence database of genomes, transcripts and
proteins. Nucleic Acids Res 35(Database issue): D61-D65.
132. Qin L, Li WC, Liu L, Zhu JQ, Li X, Li BZ and Yuan YJ (2016) Inhibition of
lignin-derived phenolic compounds to cellulase. Biotechnol Biofuels 9(1): 70.
133. Rasheed Z and Rangwala H (2012) Metagenomic taxonomic classification
using extreme learning machines. J Bioinform Comput Biol 10(5): 1250015.
134. Rawat R, Kumar S, Chadha B, Kumar D and Oberoi H (2015) An
acidothermophilic functionally active novel GH12 family endoglucanase from
Aspergillus niger HO: purification, characterization and molecular interaction
studies. Antonie Van Leeuwenhoek 107(1): 103-117.
135. Resources YCf (1997). Thermophilic microorganism survey Yellowstone
national park.
136. Rhee JK, Ahn DG, Kim YG and Oh JW (2005) New thermophilic and
thermostable esterase with sequence similarity to the hormone-sensitive lipase
family, cloned from a metagenomic library. Appl Environ Microbiol 71(2):
817-825.
137. Riesenfeld CS, Schloss PD and Handelsman J (2004) Metagenomics: genomic
analysis of microbial communities. Annu Rev Genet 38: 525-552.
138. Roehe R, Dewhurst RJ, Duthie CA, Rooke JA, McKain N, Ross DW, Hyslop
JJ, Waterhouse A, Freeman TC, Watson M and Wallace RJ (2016) Bovine Host
Genetic Variation Influences Rumen Microbial Methane Production with Best
137
Selection Criterion for Low Methane Emitting and Efficiently Feed Converting
Hosts Based on Metagenomic Gene Abundance. PLoS Genet 12(2): e1005846.
139. Rothschild L and Mancinelli R (2001) Life in extreme environments. Nature
409: 1092-1101.
140. Roumpeka DD, Wallace RJ, Escalettes F, Fotheringham I and Watson M (2017)
A Review of Bioinformatics Tools for Bio-Prospecting from Metagenomic
Sequence Data. Front Genet 8.
141. Rozanova EP and Khudiakova AI (1974) A new non-spore forming
thermophilic organism, reducing sulfates, Desulfovibrio thermophilus nov. sp.
Mikrobiologiia 43: 1069–1075.
142. Russell RJ, Ferguson JM, Hough DW, Danson MJ and Taylor GL (1997) The
crystal structure of citrate synthase from the hyperthermophilic archaeon
pyrococcus furiosus at 1.9 A resolution. Biochemistry 36(33): 9983-9994.
143. Russell RJM, Gerike U, Danson MJ, Hough DW and Taylor GL (1998)
Structural adaptations of the cold-active citrate synthase from an Antarctic
bacterium. Structure 6(3): 351-361.
144. Ryan W, Collier P, Loredo L, Pope J and Sachdev R (1996) Growth kinetics of
Escherichia coli and expression of a recombinant protein and its isoforms under
heat shock conditions. Biotechnol Prog 12(5): 596-601.
145. Sajadi S (2010) Metal ion-binding properties of L-glutamic acid and L-aspartic
acid, a comparative investigation. Natural Science 02: 85-90.
146. Sanchez Hernandez JA (2019) Thermal Denaturation and Refolding of
Carbohydrate Binding Modules to Improve Enzyme Recycling in a
Lignocellulosic Biorefinery. Master, Hood college.
147. Sandgren M (2003). Structural and functional studies of glycoside hydrolase
family 12 enzymes from Trichoderma reesei and other cellulolytic
microorganisms. Comprehensive Summaries of Uppsala Dissertations from the
Faculty of Science and Technology. Uppsala, Acta Universitatis Upsaliensis.
819: 68.
138
148. Sandgren M, Gualfetti P, Shaw A, Gross L, Saldajeno M, Day A, Jones T and
Mitchinson C (2003) Comparison of family 12 glycoside hydrolases and recruited
substitutions important for thermal stability. Protein Sci 12(4): 848-860.
149. Santos C, Zanphorlin L, Crucello A, Tonoli C, Ruller R, Horta M, Murakami
M and de Souza A (2016) Crystal structure and biochemical characterization of
the recombinant ThBgl, a GH1 β-glucosidase overexpressed in Trichoderma
harzianum under biomass degradation conditions. Biotechnol Biofuels 9.
150. Saxena R, Dhakan D, Mittal P, Waiker P, Chowdhury A, Ghatak A and Sharma
V (2017) Metagenomic Analysis of Hot Springs in Central India Reveals
Hydrocarbon Degrading Thermophiles and Pathways Essential for Survival in
Extreme Environments. Front Microbiol 7: 2123-2123.
151. Schröder C, Eixenberger D, Suleiman M, Schäfers C and Antranikian G (2019)
Characterization of an extremely thermo-active archaeal β-glucosidase and its
activity towards glucan and mannan in concert with an endoglucanase. Appl
Microbiol Biotechnol 103(23): 9505-9514.
152. Schroder C, Elleuche S, Blank S and Antranikian G (2014) Characterization of
a heat-active archaeal beta-glucosidase from a hydrothermal spring
metagenome. Enzyme Microb Technol 57: 48-54.
153. Sezonov G, Joseleau-Petit D and D'Ari R (2007) Escherichia coli Physiology in
Luria-Bertani Broth. J Bacteriol 189(23): 8746-8749.
154. Sharma A, Tewari R, Rana SS, Soni R and Soni SK (2016) Cellulases:
Classification, Methods of Determination and Industrial Applications. Appl
Biochem Biotechnol 179(8): 1346-1380.
155. Sharma D, Dev K and Sourirajan A (2019) A Report on Metal Enhanced,
Solvent Tolerant Endoglucanase from Strict Thermophilic Bacillus sp. PW1 and
Bacillus sp. PW2 of North West Himalayas. Biol Forum 11(1): 222-230.
156. Sharma P and Guptasarma P (2017) Endoglucanase activity at a second site in
Pyrococcus furiosus triosephosphate isomerase-Promiscuity or compensation
for a metabolic handicap? FEBS open bio 7(8): 1126-1143.
139
157. Sharma S and Yazdani SS (2016) Chapter 6 - Diversity of Microbial Cellulase
System. New and Future Developments in Microbial Biotechnology and
Bioengineering. V. K. Gupta. Amsterdam, Elsevier: 49-64.
158. Shi X, Xie J, Liao S, Wu T, Zhao L, Ding G, Wang Z and Xiao W (2017) High-
level expression of recombinant thermostable β-glucosidase in Escherichia coli
by regulating acetic acid. Bioresource Technology 241: 795-801.
159. Shirai T, Ishida H, Noda J-i, Yamane T, Ozaki K, Hakamada Y and Ito S (2001)
Crystal structure of alkaline cellulase K: insight into the alkaline adaptation of
an industrial enzyme. Journal of Molecular Biology 310(5): 1079-1087.
160. Simon C and Daniel R (2011) Metagenomic Analyses: Past and Future Trends.
Appl Environ Microbiol 77: 1153-1161.
161. Simon C and Daniel R (2017) Construction of Small-Insert and Large-Insert
Metagenomic Libraries. Methods Mol Biol 1539: 1-12.
162. Singh G, Verma AK and Kumar V (2016) Catalytic properties, functional
attributes and industrial applications of β-glucosidases. 3 Biotech 6(1): 3-3.
163. Slightom R and Buchan A (2009) Surface Colonization by Marine
Roseobacters: Integrating Genotype and Phenotype. Appl Environ Microbiol
75: 6027-6037.
164. Steele HL, Jaeger KE, Daniel R and Streit WR (2009) Advances in recovery of novel
biocatalysts from metagenomes. J Mol Microbiol Biotechnol 16(1-2): 25-37.
165. Strobel K, Pfeiffer K, Blanch H and Clark D (2015) Structural insights into the
affinity of Cel7A carbohydrate-binding module for lignin. J Biol Chem
290(37): 22818-22826.
166. Studier FW (2005) Protein production by auto-induction in high density shaking
cultures. Protein Expr Purif 41(1): 207-234.
167. Studier FW (2014) Stable Expression Clones and Auto-Induction for Protein
Production in E. coli. Structural Genomics: General Applications. Y. W. Chen.
Totowa, NJ, Humana Press: 17-32.
140
168. Sukharnikov LO, Cantwell BJ, Podar M and Zhulin IB (2011) Cellulases:
ambiguous nonhomologous enzymes in a genomic perspective. Trends Biotechnol
29(10): 473-479.
169. Sunagawa S, Coelho LP, Chaffron S, Kultima JR, Labadie K, Salazar G,
Djahanschiri B, Zeller G, Mende DR, Alberti A, Cornejo-Castillo FM, Costea
PI, Cruaud C, d'Ovidio F, Engelen S, Ferrera I, Gasol JM, Guidi L, Hildebrand
F, Kokoszka F, Lepoivre C, Lima-Mendez G, Poulain J, Poulos BT, Royo-
Llonch M, Sarmento H, Vieira-Silva S, Dimier C, Picheral M, Searson S,
Kandels-Lewis S, Bowler C, de Vargas C, Gorsky G, Grimsley N, Hingamp P,
Iudicone D, Jaillon O, Not F, Ogata H, Pesant S, Speich S, Stemmann L,
Sullivan MB, Weissenbach J, Wincker P, Karsenti E, Raes J, Acinas SG and
Bork P (2015) Ocean plankton. Structure and function of the global ocean
microbiome. Science 348(6237): 1261359.
170. Tejirian A and Xu F (2010) Inhibition of Cellulase-Catalyzed Lignocellulosic
Hydrolysis by Iron and Oxidative Metal Ions and Complexes. Appl Environ
Microbiol 76(23): 7673-7682.
171. Tekere M, Lötter A, Olivier J, Jonker N and Venter S (2011) Metagenomic
analysis of bacterial diversity of Siloam hot water spring, Limpopo, South
Africa. African Journal of Biotechnology 10: 18005-18012.
172. Thankappan S, Kandasamy S, Joshi B, Sorokina KN, Taran OP and Uthandi S
(2018) Bioprospecting thermophilic glycosyl hydrolases, from hot springs of
Himachal Pradesh, for biomass valorization. AMB Express 8(1): 168-168.
173. Tiwari R, Nain L, Labrou NE and Shukla P (2018) Bioprospecting of functional
cellulases from metagenome for second generation biofuel production: a
review. Crit Rev Microbiol 44(2): 244-257.
174. Toyama D, de Morais MAB, Ramos FC, Zanphorlin LM, Tonoli CCC, Balula
AF, de Miranda FP, Almeida VM, Marana SR, Ruller R, Murakami MT and
Henrique-Silva F (2018) A novel beta-glucosidase isolated from the microbial
metagenome of Lake Poraque (Amazon, Brazil). Biochim Biophys Acta
Proteins Proteom 1866(4): 569-579.
141
175. Tran KM, Le VTT, Ngo DD, Hoang K, Nguyen PV and TH N (2018) Isolation
and optimization of the growth conditions of thermophilic microorganism
fromhot springs. The Journal of Agriculture and Development 17(3): 55-60.
176. Trần Ngọc Diễm My and Nguyễn Trọng Nhân (2018) Khảo sát sự hiện diện của
vi sinh vật phân giải cellulose trong dạ dày còng Perisesarma eumolpe tại khu
vực gãy đổ thuộc rừng ngập mặn Cần Giờ. Tạp chí Phát triển khoa học và công
nghệ: chuyên san Khoa học tự nhiên 2(5): 18-25.
177. Trần Văn Vươn, Ngô Thị Vân Kiều, Tạ Thị Hương and Nguyễn Thị Lan Phương
(2017) Nghiên cứu các chủng xạ khuẩn và nấm mốc có hoạt tính cellulase ở khu
vực tây nam vườn quốc gia Kon Ka Kinh - Gia Lai. Tạp chí Khoa học Xã hội,
Nhân văn và Giáo dục 7(2): 24-28.
178. Tribolo S, Berrin J-G, Kroon PA, Czjzek M and Juge N (2007) The Crystal
Structure of Human Cytosolic β-Glucosidase Unravels the Substrate Aglycone
Specificity of a Family 1 Glycoside Hydrolase. Journal of Molecular Biology
370(5): 964-975.
179. Trịnh Đình Khá (2015) Tinh sạch và nghiên cứu đặc tính của Cellulase tự nhiên và
tạo cellulase tái tổ hợp từ nấm sợi tại Việt Nam. Tiến sĩ, Đại học Thái Nguyên.
180. Trương Nam Hải (2011-2012). Sàng lọc các enzyme tham gia vào quá trình
phân giải cellulose, hemicellulose bằng kỹ thuật metagenomics.
181. Turner P, Mamo G and Karlsson EN (2007) Potential and utilization of
thermophiles and thermostable enzymes in biorefining. Microb Cell Fact 6: 9.
182. Valverde A, Tuffin M and Cowan DA (2012) Biogeography of bacterial
communities in hot springs: a focus on the actinobacteria. Extremophiles 16(4):
669-679.
183. Van den Ende FP and Gemerden HV (1993) Sulfide oxidation under oxygen
limitation by a thiobacillus thioparus isolated from a marine microbial mat.
FEMS Microbiol Ecol 13(1): 69-77.
184. Vassilev K, Turmanova S, Ivanova E and Trifonova V (2013) Catalytic Activity
of Amino Acids-Metal Complexes in Oxidation Reactions. J Biomater
Nanobiotechnol 4(2): 28-36.
142
185. Veena V, Paramasivan P, Parvatham R, Sivapriyadharsini and Kalaiselvi K
(2011) Isolation and characterization of β-glucosidase producing bacteria from
different sources. African Journal of Biotechnology 10: 14907-14912.
186. Vincze T, Posfai J and Roberts RJ (2003) NEBcutter: A program to cleave DNA
with restriction enzymes. Nucleic acids research 31(13): 3688-3691.
187. Vocadlo DJ and Davies GJ (2008) Mechanistic insights into glycosidase
chemistry. Curr Opin Chem Biol 12(5): 539-555.
188. Wallace RJ, Rooke JA, McKain N, Duthie CA, Hyslop JJ, Ross DW, Waterhouse
A, Watson M and Roehe R (2015) The rumen microbial metagenome associated
with high methane production in cattle. BMC Genomics 16.
189. Wang H, Li H, Shao Z, Liao S, Johnstone L, Rensing C and Wang G (2012)
Genome sequence of deep-sea manganese-oxidizing bacterium Marinobacter
manganoxydans MnI7-9. J Bacteriol 194(4): 899-900.
190. Wang J, Gao G, Li Y, Yang L, Liang Y, Jin H, Han W, Feng Y and Zhang Z
(2015) Cloning, Expression, and Characterization of a Thermophilic
Endoglucanase, AcCel12B from Acidothermus cellulolyticus 11B. Int J Mol Sci
16(10): 25080-25095.
191. Wang Q, Trimbur D, Graham R, Warren RAJ and Withers SG (1995)
Identification of the Acid/Base Catalyst in Agrobacterium faecalis .beta.-
Glucosidase by Kinetic Analysis of Mutants. Biochemistry 34(44): 14554-14562.
192. Waterhouse A, Bertoni M, Bienert S, Studer G, Tauriello G, Gumienny R, Heer
FT, de Beer TAP, Rempfer C, Bordoli L, Lepore R and Schwede T (2018)
SWISS-MODEL: homology modelling of protein structures and complexes.
Nucleic acids research 46(W1): W296-W303.
193. Watson M (2014) Illuminating the future of DNA sequencing. Genome Biol
15(2): 108.
194. Wolińska A (2019) Chapter 2 - Metagenomic Achievements in Microbial
Diversity Determination in Croplands: A Review. Microbial Diversity in the
Genomic Era. S. Das and H. R. Dash, Academic Press: 15-35.
143
195. Wooley JC, Godzik A and Friedberg I (2010) A primer on metagenomics. PLoS
Comput Biol 6(2): e1000667.
196. Yang C, Xia Y, Qu H, Li AD, Liu R, Wang Y and Zhang T (2016) Discovery
of new cellulases from the metagenome by a metagenomics-guided strategy.
Biotechnol Biofuels 9: 138-138.
197. Yennamalli RM, Rader AJ, Kenny AJ, Wolt JD and Sen TZ (2013)
Endoglucanases: insights into thermostability for biofuel applications.
Biotechnol Biofuels 6(1): 136.
198. Yennamalli RM, Rader AJ, Wolt JD and Sen TZ (2011) Thermostability in
endoglucanases is fold-specific. BMC Struct Biol 11: 10-10.
199. Yin YR, Zhang F, Hu QW, Xian WD, Hozzein WN, Zhou EM, Ming H, Nie
GX and Li WJ (2015) Heterologous expression and characterization of a novel
halotolerant, thermostable, and alkali-stable GH6 endoglucanase from
Thermobifida halotolerans. Biotechnol Lett 37(4): 857-862.
200. Zarafeta D, Kissas D, Sayer C, Gudbergsdottir SR, Ladoukakis E, Isupov MN,
Chatziioannou A, Peng X, Littlechild JA, Skretas G and Kolisis FN (2016)
Discovery and Characterization of a Thermostable and Highly Halotolerant
GH5 Cellulase from an Icelandic Hot Spring Isolate. PloS one 11(1): e0146454-
e0146454.
201. Zeng J, Gao X, Dai Z, Tang B and Tang XF (2014) Effects of Metal Ions on
Stability and Activity of Hyperthermophilic Pyrolysin and Further Stabilization
of This Enzyme by Modification of a Ca2+-Binding Site. Appl Environ
Microbiol 80(9): 2763-2772.
202. Zhang L, Fu Q, Li W, Wang B, Yin X, Liu S, Xu Z and Niu Q (2017)
Identification and characterization of a novel β-glucosidase via metagenomic
analysis of Bursaphelenchus xylophilus and its microbial flora. Scientific
reports 7(1): 14850.
203. Zhao C, Chu Y, Li Y, Yang C, Chen Y, Wang X and Liu B (2017) High-
throughput pyrosequencing used for the discovery of a novel cellulase from a
144
thermophilic cellulose-degrading microbial consortium. Biotechnol Lett 39(1):
123-131.
204. Zhu W, Lomsadze A and Borodovsky M (2010) Ab initio gene identification in
metagenomic sequences. Nucleic Acids Res 38(12): e132-e132.
205. Zouhar J, Vévodová J, Marek J, Damborský J, Su XD and Brzobohatý B (2001)
Insights into the functional architecture of the catalytic center of a maize beta-
glucosidase Zm-p60.1. Plant Physiol. 127(3): 973-985.
PHỤ LỤC
Phụ lục 1. Bản đồ giới hạn Vector biểu hiện pET-17b (Novagen) ...................... 1
Phụ lục 2. Trình tự nucleotide và axit amin của gen [denovogenes_18736]
mã hóa cho endoglucanase .................................................................. 1
Phụ lục 3. Trình tự nucleotide và axit amin của gen [denovogenes_32768]
mã hóa cho β-glucosidase ................................................................... 3
Phụ lục 4. Trình tự enzyme giới hạn .................................................................... 4
Phụ lục 5. Các môi trường sử dụng ...................................................................... 5
Phụ lục 6. Các loại đệm sử dụng .......................................................................... 6
Phụ lục 7. Đường chuẩn BSA .............................................................................. 6
Phụ lục 8. Chuẩn bị thuốc thử Coomassie Brilliant Blue để định lượng protein ....... 7
Phụ lục 9. Điện di protein SDS-PAGE ................................................................ 8
Phụ lục 10. Chỉ tiêu hóa lý của mẫu nước thu nhận từ suối nước nóng Bình Châu .... 9
Phụ lục 11. Kết quả dự đoán tâm hoạt động của denovogenes_18736 ................ 10
Phụ lục 12. So sánh trình tự axit amin domain xúc tác của gen
denovogenes_18736 với trình tự axit amin trong mô hình domain
xúc tác của 1up3.1.A.. ....................................................................... 11
Phụ lục 13. Kích thước của các axit amin trong mô hình cấu trúc protein của
denovogenes_18736.. ........................................................................ 11
Phụ lục 14. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và
bậc 4 của denovogenes_18736. ......................................................... 12
Phụ lục 15. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc protein
của denovogenes_18736 ................................................................... 12
Phụ lục 16. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng)
của denovogenes_18736. .................................................................. 13
Phụ lục 17. Vị trí của proline ở trong cấu trúc bậc 2 và bậc 4 (màu xanh tím)
của denovogenes_18736. .................................................................. 13
Phụ lục 18. Vị trí axit amin deletions trong mô hình (màu xanh tím) cấu trúc
protein của denovogenes_18736 ....................................................... 14
Phụ lục 19. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc
protein của denovogenes_18736 ....................................................... 14
Phụ lục 20. Vị trí aliphatic (màu xanh tím) trong cấu trúc protein của
denovogenes_18736 .......................................................................... 15
Phụ lục 21. Vị trí aromatic (màu xanh tím) trong cấu trúc protein của
denovogenes_18736 .......................................................................... 15
Phụ lục 22. Kết quả dự đoán cầu disulfide giữa các Cy strong cấu trúc của
denovogenes_18736 .......................................................................... 16
Phụ lục 23. Vị trí của Ser/Thr (màu xanh tím) trong cấu trúc protein của
denovogenes_18736 .......................................................................... 17
Phụ lục 24. Kích thước của các axit amin trong mô hình cấu trúc của
denovogenes_32768 .......................................................................... 18
Phụ lục 25. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và
bậc 4 của denovogenes_32768. ......................................................... 18
Phụ lục 26. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc của
denovogenes_32768 .......................................................................... 19
Phụ lục 27. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng)
của denovogenes_32768 ................................................................... 19
Phụ lục 28. Vị trí của Ser/Thr ở trong cấu trúc (màu xanh tím) của
denovogenes_32768 .......................................................................... 20
Phụ lục 29. Vị trí của proline (màu xanh tím) trong cấu trúc bậc 2 và bậc 4 của
denovogenes_32768 .......................................................................... 20
Phụ lục 30. Vị trí axit amin deletions (màu xanh tím) trong mô hình cấu trúc
của denovogenes_32768. .................................................................. 21
Phụ lục 31. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc
denovogenes_32768. ......................................................................... 21
Phụ lục 32. Vị trí aliphatic (màu xanh tím) trong cấu trúc
denovogenes_32768. ......................................................................... 22
Phụ lục 33. Vị trí aromatic (màu xanh tím) trong cấu trúc
denovogenes_32768. ......................................................................... 22
Phụ lục 34. So sánh trình tự axit amin domain xúc tác của gen
denovogenes_32768 với trình tự axit amin trong mô hình domain
xúc tác của 1vff.1.A. ......................................................................... 23
Phụ lục 35. Sự khác biệt về trình tự axit amin giữa denovogenes_32768 (query
23187) và Cen502 (query 23189). .................................................... 23
PHỤ LỤC
Phụ lục 1. Bản đồ giới hạn vector biểu hiện pET-17b (Novagen)
Phụ lục 2. Trình tự nucleotide và axit amin của gen denovogenes_18736 mã hóa cho
endoglucanase
atgctgccgcaagtagccgaagccgcaactcggaccgagtcggcgaataacacagtgtta
M L P Q V A E A A T R T E S A N N T V L
gtcgcaggccagaccggatcgattgtcgacgatcgtttgaacgtttggacaatcgtgaac
V A G Q T G S I V D D R L N V W T I V N
ggcgtcgtgaagaagaacggagcgaacgccgggtacagcgcccgcgtcattcaattggcg
G V V K K N G A N A G Y S A R V I Q L A
tatgtcaacgatgttgtctggcaggaaaatgccgatcatctttggtggagctggaacggt
Y V N D V V W Q E N A D H L W W S W N G
1
# 5'3' Frame 1
agttcatgggacggcggttggggtatcccgaccagcccgttgccgcaaaatgtgtccagt
S S W D G G W G I P T S P L P Q N V S S
ccgagtaacaacacgtcgctgaccgagtcagccaataactctgtactcctggccggtcaa
P S N N T S L T E S A N N S V L L A G Q
actggttcactcgtcgaccgccagaaggatgtctggacaattgtaaacggtgtcgtcaaa
T G S L V D R Q K D V W T I V N G V V K
aagaataacgttagtgccggctacagtgctcgcgttatccagctagcctacgtcaatggt
K N N V S A G Y S A R V I Q L A Y V N G
gtcatctggcaggaaaatgctgatcatctttggtggagctggaacggtagttcatgggac
V I W Q E N A D H L W W S W N G S S W D
ggcggttggggtatcccgaccagtccgttgtcgactgctgtaactgctccggcgcctcag
G G W G I P T S P L S T A V T A P A P Q
ccgcagccagaacctgaaccagcccccgcccccgcaccaacgaatagcagcaacccgttt
P Q P E P E P A P A P A P T N S S N P F
gctggtcagacactgtaccgcagcagctggtcgaacgcgctcaatcaggccaacgcttgg
A G Q T L Y R S S W S N A L N Q A N A W
cgttcaacacgaccggacgacgctgccaagatggattacttagccgcccagccgactgcc
R S T R P D D A A K M D Y L A A Q P T A
cgttggtttggtgactggaatgcgaatattcagagtgatgtcagcgcctacgtaggtgag
R W F G D W N A N I Q S D V S A Y V G E
gccgctgcagccaatgctctccccgtgcttgtcctctataacatcccgttccgtgactgc
A A A A N A L P V L V L Y N I P F R D C
ggtagctattctgccggtggtgcgggaagtgcctctggctaccacgactggatcgtgaag
G S Y S A G G A G S A S G Y H D W I V K
gtggctgaaggtattggtactcgtaaagcgatgatcgtgcttgaaccggatgctacgtcg
V A E G I G T R K A M I V L E P D A T S
cttgattgtttcgatgatactcgcgcagccatgctggctgacgcagtgaatgtcctcgaa
L D C F D D T R A A M L A D A V N V L E
gccaagccgaatgtcgctgtctacattgatgctggccacccagactgggttccggctgca
A K P N V A V Y I D A G H P D W V P A A
actatggccacacgtcttcagaagtctggaattcagaacgctcagggtatggccttgaac
T M A T R L Q K S G I Q N A Q G M A L N
2
gtctccaacttctatagcactgactcgaacatggcctacggtaacgacctctcgtcacgt
V S N F Y S T D S N M A Y G N D L S S R
cttggtggcaagcactacatcatcgacactgcccgcaatcacaacggctggcagggtgag
L G G K H Y I I D T A R N H N G W Q G E
tggtgtaacccacagggcgctggtatcggtaaggcaccgaccacgaacactggttctgcc
W C N P Q G A G I G K A P T T N T G S A
ctgttcgatgctggtttgtggatcaagccaccgggagaatccgatggtccgtgtaacggc
L F D A G L W I K P P G E S D G P C N G
ggtcctggtgctggtagctggtgggcggattacgctctcaagctctacaaccagggcacc
G P G A G S W W A D Y A L K L Y N Q G T
cactaa
H -
Phụ lục 3. Trình tự nucleotide và axit amin của gen denovogenes_32768 mã hóa cho
atggaaaagaaatttcctgaaggtttttattggggagcagccacatcctccttccaaacc
M E K K F P E G F Y W G A A T S S F Q T
gaaggcggcatcgagaacattgattgggcgaagggtgcccgcgaggggagagtgccacca
E G G I E N I D W A K G A R E G R V P P
ataggaaacgcgtgtgatttttacaatcggtacgaaagcgattttgatattgcgatagaa
I G N A C D F Y N R Y E S D F D I A I E
ttgggtcacaactgccaccgcatctcaattgaatgggcgcgcattgaaccggaggaaggg
L G H N C H R I S I E W A R I E P E E G
aagtttgatgaaaaagagatcgaacactatctacaggtactcgccgcgatgcgaaaacgg
K F D E K E I E H Y L Q V L A A M R K R
cacataaaaccgttcatcacgatctggcatttctcgctcccgcagtggtttgccgacaag
H I K P F I T I W H F S L P Q W F A D K
ggaggcttcgagcaccgtgattcgccggagattttcgcgcgatactgcggctacgtcgcg
G G F E H R D S P E I F A R Y C G Y V A
caaaagctcggcaacgactgccgccacttcgcgacgatcaacgaggcgctgccgtacacc
Q K L G N D C R H F A T I N E A L P Y T
acgaacggctggatccgcggatcgtggccgccctttaaggaggtgcccggactggggtgg
3
β-glucosidase
T N G W I R G S W P P F K E V P G L G W
tcgctctcgcacatccccgggcacatgccaatcaccatggatactcgctggaagaatgtg
S L S H I P G H M P I T M D T R W K N V
ctcctctatttccgcgtgcgaaaaaatctcgcgcgagcgcacaatcttgcgtatgacgag
L L Y F R V R K N L A R A H N L A Y D E
atcaaaaagcatgcgttcggcgcggaagtcggcattgtgcatcaaatcattctcttccac
I K K H A F G A E V G I V H Q I I L F H
gcgaacagtaacccgctcaatcaggcgctcgcggggtgcatgaattggttctggacgcac
A N S N P L N Q A L A G C M N W F W T H
tccttcattcggcgcgtatatcaaaaatgcgactcgatcggcatcaattactatttgcac
S F I R R V Y Q K C D S I G I N Y Y L H
aagaaattcggcgacaccgcaacgtaccggaaaaccgacatgaactgggatttttatccg
K K F G D T A T Y R K T D M N W D F Y P
gaaggcatttgcggagcgctcctcatgatgaagaggtacgggaggccgctgtgggtcgcg
E G I C G A L L M M K R Y G R P L W V A
gaggctggcatcgccgatgaggacgacgatcagcgcgcggaatacatcacgaagctgatt
E A G I A D E D D D Q R A E Y I T K L I
catggcatgtggacggcgatccaaagcggcgtcgatctgcgtgggtacatgtactggtcg
H G M W T A I Q S G V D L R G Y M Y W S
cttctcgataattacgaactcgcacacggctatacaaagcgcttcggcctcgtcgaagtg
L L D N Y E L A H G Y T K R F G L V E V
aatttcgagacacaagagaggaacatccggccctcggcctatgtttacaagcgcattata
N F E T Q E R N I R P S A Y V Y K R I I
gagaacaacgggctggtagaatag
E N N G L V E -
4
Phụ lục 4. Trình tự enzyme giới hạn
Phụ lục 5. Các môi trường sử dụng
- Môi trường SOC (g/L)
Bacto Tryptone 20
Cao nấm men 5
NaCl 0,5
980 mL H2O
Sau khi khử trùng bổ sung 20 ml dung dịch glucose 1M vô trùng
- Môi trường LB (g/L):
Bactotryptone 10
Cao nấm men 5
NaCl 5
1000 ml H2O cất
pH 7 - 7,2
- Môi trường NB (g/L)
D(+) glucose 1
Cao nấm men 3
Peptone 15
NaCl 6
1000 ml H2O cất
pH 7 - 7,2
- Môi trường TB (g/L)
Bacto Tryptone 12
Cao nấm men 24
Glycerin 4 ml
900 mL H2O cất
Sau khi khử trùng, bổ sung 100 ml:
0,72 M K2HPO4
0,17 M KH2PO4
5
pH 7 - 7,2
Phụ lục 6. Các loại đệm sử dụng
Đệm phá tế bào: 50 mM Tris/HCl, pH 8,5
1 mM EDTA
100 mM NaCl
0,1 mM DTE
1 mM PMSF
50 mM đệm potassium phosphate, pH 7.4 Đệm A
500 mM natri acetate
10% glycerol
0,1 mM DTE
1% natri cholat
1% Tween 20
0,1 mM PMSF
Đệm rửa: Đệm A
10 - 40 mM imidazol
Đệm đẩy B: Đệm A
250 mM Imidazole
Đệm đẩy C: Đệm A
200 mM Imidazole
Phụ lục 7. Đường chuẩn BSA
Đồ thị BSA chuẩn được xây dựng ở các nồng độ từ 0–1000 µg/ml. BSA gốc
ban đầu được chuẩn bị ở nồng độ 1 mg/ml, sau đó được pha loãng với dung dịch 0,15
M NaCl để tạo thành các thang nồng độ khác nhau với tổng thể tích 1000 l (Bảng
7.1). Đo độ hấp thụ của BSA ở bước sóng 595nm sau 10 phút ở nhiệt độ phòng kể từ
khi bổ sung dung dịch màu. Dựng đường chuẩn biểu thị mối liên quan giữa độ hấp
thụ của protein ở bước sóng 595 nm và nồng độ BSA (Hình 7.1).
Nồng độ protein trong mẫu nghiên cứu được xác định dựa trên đồ thị đường
6
chuẩn BSA. Trộn 100 l mẫu + 900 l dung dịch thuốc thử Coomassie Brilliant Blue.
Đo độ hấp thụ protein ở bước sóng 595 nm. Dựa vào hàm số tương quan giữa nồng
độ protein và độ hấp thụ để suy ra nồng độ protein trong mẫu.
Bảng 7.1: Thành phần phản ứng trong việc xây dựng đường chuẩn BSA
Ống Thể tích dịch BSA chuẩn Thể tích 0,15 Nồng độ protein
nghiệm nồng độ 1000 µg/ml (µl) M NaCl (µl) tương đương (µg/ml)
1000 0 1000 1
500 500 500 2
250 750 250 3
125
100 875
900 125
100 4
5
75 925 75 6
500 từ ống 5 500 50 7
500 từ ống 7 500 25 8
1.2
1
y = 0.0075x + 0.084
R² = 0.993
0.8
0.6
OD595
0 1000 0 9
5
9
5
D
O
0.4
Linear (OD595 )
0.2
0
0
25
50
75
100
125
Nồng độ BSA (µg/ml)
Hình 7.1: Đồ thị đường chuẩn BSA với phương trình dạng y = ax+b
Phụ lục 8. Chuẩn bị thuốc thử Coomassie Brilliant Blue để định lượng protein
Hòa 100 mg Coomassie Brilliant Blue G-250 vào 50 ml ethanol có nồng độ
95%. Sau đó tiếp tục bổ sung thêm 100 ml H3PO4 85% (w/v) và dẫn nước tới thể tích
1 lít. Dung dịch cuối cùng có nồng độ các chất (w/v): 0.01% Coomassie Brilliant Blue
7
G-250, 4.7% ethanol và 8.5% H3PO4.
Phụ lục 9. Điện di protein SDS-PAGE
Hóa chất đổ gel polyacrylamide-SDS:
- Bis- Acrylamide 30% (tỷ lệ acrylamide : bis-acrylamide = 29 : 1).
- SDS 0,4%.
- APS 10%.
- TEMED 100%.
- 4x Đệm gel tách: Tris-HCl 1,5M (pH = 8,8); 0,4% SDS
- 4x Đệm gel cô: Tris-HCl 0,5M (pH = 6,8); 0,4% SDS
-2x SDS đệm tra mẫu (Tris –Hcl 125 mM (pH=6,8), Glycerol 20%, SDS 4%,
Bromophenol blue 0,004%, 2-mecaptoethanol 10%.
Công thức cho 2 bản gel (gồm gel tách và gel cô)
Hóa chất: Gel tách (12%) Gel cô (5%)
15 ml 10 ml H2O
Đệm 4xgel tách 3,75 ml
Đệm 4xgel cô 2,5 ml
Acrylamide 30% 6 ml 1,6 ml
APS 10% 75 μl 50 μl
TEMED 100% 7,5 μl 5 μl
Công thức cho đệm chạy 5X SDS running buffer
Tris 15g
Glycine 72g
SDS 5g
Công thức cho dung dịch nhuộm Coomassie Brilliant Blue
0,15% Coomassie Brilliant Blue (CBB) R-250
30% Methanol
10% axit Acetic
8
Công thức cho dung dịch tẩy nhuộm: 30% Methanol và 10% axit Acetic
Phụ lục 10. Chỉ tiêu hóa lý của mẫu nước thu nhận từ suối nước nóng Bình Châu
TT Chỉ tiêu phân tích Ký hiệu Đơn vị tính Kết quả phân tích
mg/L 1,45 Độ đục 1 SiO2
Thối, mặn Mùi 2
Cặn không tan 3 mg/L 3,8
Cặn sấy khô 4 M mg/L 2,18
Độ pH 5 pH 7,5
Độ cứng 6 CaO mg/L 259
Clorua 7 Cl- mg/L 1,885
-
Nitrate 8 mg/L 0,4 NO3
-
+
Nitrite 9 mg/L 0,001 NO2
Amoni 10 mg/L 0,01 NH4
Hydrosulfua 11 mg/L 0,37 H2S
Asen 13 As mg/L 0,001
Đồng 14 Cu mg/L 0,05
Kẽm 15 Zn mg/L 0,04
Sắt 16 Fe mg/L 0,05
Fluor 17 F mg/L 2,84
3-
Iodine 18 I mg/L 0,061
2-
Phosphate 19 mg/L - PO4
Sulphate 20 mg/L 368 SO4
Mangan 21 Mn mg/L 0,09
9
Magie 22 Mg 7,59
10
Phụ lục 11. Kết quả dự đoán tâm hoạt động của denovogenes_18736
Phụ lục 12. So sánh trình tự axit amin domain xúc tác của gen denovogenes_18736
với trình tự axit amin trong mô hình domain xúc tác của 1up3.1.A.
Phụ lục 13. Kích thước của các axit amin trong mô hình cấu trúc protein của
Chú thích: axit amin có màu xanh lá cây nhạt → đỏ: axit amin có kích thước bé nhất → lớn nhất.
11
denovogenes_18736.
Phụ lục 14. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và bậc 4
Chú thích: axit amin có màu xanh lam→ đỏ: ít kỵ nước → kỵ nước.
của denovogenes_18736.
Phụ lục 15. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc protein của
12
denovogenes_18736
Phụ lục 16. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng) của
denovogenes_18736.
Phụ lục 17. Vị trí của proline ở trong cấu trúc bậc 2 và bậc 4 (màu xanh tím) của
13
denovogenes_18736.
Phụ lục 18. Vị trí axit amin deletions trong mô hình (màu xanh tím) cấu trúc protein
của denovogenes_18736.
Phụ lục 19. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc protein
Chú thích: ED màu hồng: tích điện âm; HKR màu xanh tím: tích điện dương
14
của denovogenes_18736
Phụ lục 20. Vị trí aliphatic (màu xanh tím) trong cấu trúc protein của
denovogenes_18736
Phụ lục 21. Vị trí aromatic (màu xanh tím) trong cấu trúc protein của
15
denovogenes_18736
Phụ lục 22. Kết quả dự đoán cầu disulfide giữa các Cys trong cấu trúc của
.........10........20........30........40........50........60........70........
AA MLPQVAEAATRTESANNTVLVAGQTGSIVDDRLNVWTIVNGVVKKNGANAGYSARVIQLAYVNDVVWQENADHLWWSWN
DB_state
DB_conf
80........90........100.......110.......120.......130.......140.......150......
AA GSSWDGGWGIPTSPLPQNVSSPSNNTSLTESANNSVLLAGQTGSLVDRQKDVWTIVNGVVKKNNVSAGYSARVIQLAYV
DB_state
DB_conf
.160.......170.......180.......190.......200.......210.......220.......230.....
AA NGVIWQENADHLWWSWNGSSWDGGWGIPTSPLSTAVTAPAPQPQPEPEPAPAPAPTNSSNPFAGQTLYRSSWSNALNQA
DB_state
DB_conf
+----------------
|
..240.......250.......260.......270.......280.......290.......300.......310....
AA NAWRSTRPDDAAKMDYLAAQPTARWFGDWNANIQSDVSAYVGEAAAANALPVLVLYNIPFRDCGSYSAGGAGSASGYHD
DB_state 1
DB_conf 4
--------------------------+
|
...320.......330.......340.......350.......360.......370.......380.......390...
AA WIVKVAEGIGTRKAMIVLEPDATSLDCFDDTRAAMLADAVNVLEAKPNVAVYIDAGHPDWVPAATMATRLQKSGIQNAQ
DB_state 1
DB_conf 3
+--------------------------------
|
....400.......410.......420.......430.......440.......450.......460.......470..
AA GMALNVSNFYSTDSNMAYGNDLSSRLGGKHYIIDTARNHNGWQGEWCNPQGAGIGKAPTTNTGSALFDAGLWIKPPGES
DB_state 1
DB_conf 5
---+
|
.....480.......490.......500
AA DGPCNGGPGAGSWWADYALKLYNQGTH
16
denovogenes_18736
DB_state 1
DB_conf 2
DB_bond bond(300,343)
DB_bond bond(442,478)
Conn_conf 0.913818
Chú thích: AA: Trình tự axit amin; DB_state: dự đoán trạng thái liên kết disulfide (1 = liên
kết disulfide, 0 = không có liên kết disulfide); DB_conf: độ tin cậy của dự đoán trạng thái
liên kết disulfide (0 = thấp đến 9 = cao); DB_bond: vị trí theo trình tự của một cặp cystein
được dự đoán sẽ tạo thành cầu nối disulfide; Conn_conf: độ tin cậy của việc gán kết nối đưa
ra ở trạng thái liên kết disulfide được dự đoán (giá trị thực trong [0,1]).
17
Phụ lục 23. Vị trí của Ser/Thr (màu xanh tím) trong cấu trúc protein của
denovogenes_18736
Phụ lục 24. Kích thước của các axit amin trong mô hình cấu trúc của
denovogenes_32768.
lớn nhất.
Chú thích: axit amin có màu xanh lá cây nhạt → đỏ: axit amin có kích thước bé nhất →
Phụ lục 25. Đánh giá tính kỵ nước của các axit amin trong cấu trúc bậc 2 và bậc 4
Chú thích: axit amin có màu xanh lam→ đỏ: ít kỵ nước → kỵ nước.
18
của denovogenes_32768.
Phụ lục 26. Vị trí axit amin phân cực (màu xanh tím) trong cấu trúc của
denovogenes_32768
Phụ lục 27. Vị trí axit amin Cystein trong cấu trúc bậc 2 và bậc 4 (màu vàng) của
19
denovogenes_32768
Phụ lục 28. Vị trí của Ser/Thr ở trong cấu trúc (màu xanh tím) của
denovogenes_32768
Phụ lục 29. Vị trí của proline (màu xanh tím) trong cấu trúc bậc 2 và bậc 4 của
20
denovogenes_32768
Phụ lục 30. Vị trí axit amin deletions (màu xanh tím) trong mô hình cấu trúc của
denovogenes_32768.
Phụ lục 31. Vị trí và khả năng tích điện -, + của các axit amin trong cấu trúc
Chú thích: ED màu hồng: tích điện âm; HKR màu xanh tím: tích điện dương
21
denovogenes_32768.
Phụ lục 32. Vị trí aliphatic (màu xanh tím) trong cấu trúc denovogenes_32768.
22
Phụ lục 33. Vị trí aromatic (màu xanh tím) trong cấu trúc denovogenes_32768.
Phụ lục 34. So sánh trình tự axit amin domain xúc tác của gen denovogenes_32768
với trình tự axit amin trong mô hình domain xúc tác của 1vff.1.A.
Phụ lục 35. Sự khác biệt về trình tự axit amin giữa denovogenes_32768 (query
Query_23187 1 MEKK--FPEGFYWGAXIT AMIN TSSFQTEGGIENI-----DWAKGAREGRVPPIGNACDFYNRYESDFDIAIELG-----HNCHRI 68
Query_23189 1 MKKLCLLAGVYMWGTATAXIT AMIN LQIEGAKKLCLLVPGGWKTVLDLGDVCPKACVCVQRRQRQCSLRQLSSLPSRYGVHLPTRL 80
Query_23187 69 SI------------EWARIEPEEGKFDEKEIEHYLQVLAXIT AMIN MRKRHI-KPFITIWHFSLPQWFADKGGFEHRDSPEIFARY 135
Query_23189 81 SYISFRGLLATYIPTWCTWSQSRG----IGRIIIVKLI--CLNDNIGLPFSTLYDRVLPQPLQLAVGWGNPPRIQAFVQF 154
Query_23187 136 CGYVAQKLGNDCRHFATINEALP--YTTNGWIRGSWPPFKEVPGLGWSLSHIPGHMPITMDTRWKNVLLYFRVRKNLARA 213
Query_23189 155 AETMFREFHGKIQHWHSFNEPWCTIAFVIQYVNGSCPGSDLSPDCDC-------------------------CRTSSWLA 209
Query_23187 214 HNLAYDEIKKHAFGAEVGIVHQIILFHANSNPLNQALAGCMNWFWTHSFI------------------------------ 263
Query_23189 210 HGLSVRRFRVLGTSGDSGIAPNVSWAVPYWHSEVDKAXIT AMIN CARTISLHSGLFLQPIFQGTIPQFLVDWFALQGGTVPIQDGD 289
Query_23187 264 -RRVYQKCDSIGINYYLHKKFGDTAT------------YRKTDMNWDFYPEGICGALLMMKRYGR-PLWVAEAGIADEDD 329
Query_23189 290 MEYIGEPIDMIGINYYSMSVNRFNPVAPFLQSEEINMPLPLTDIGWPLVARAVYEVLHYLQKYGNIDIYFTENGACYNHE 369
Query_23187 330 ---------DQRAEYITKLIHGMWTAIQSGVDLRGYMYWSLLDNYELAHGYTKRFGLVEVNFETQERNIRPSAYVYKRII 400
Query_23189 370 VVKRAKVQVDRRISKLQQHFQLVQRTIHDRLHVKGYMACSLLDNFLRAEGYKMTFGMIVVDFRTQVRTGLESYYWYGNVL 449
Query_23187 401 ENNGLVE--------- 407
Query_23189 450 SNNWLETRPQSFELLG 465
23
23187) và Cen502 (query 23189).