BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------

TRẦN THỊ HỒNG SÀNG LỌC VÀ BIỂU HIỆN GEN MÃ HÓA PROTEIN ỨC CHẾ

PROTEASE CỦA VI SINH VẬT LIÊN KẾT HẢI MIÊN Spheciospongia

vesparium THU NHẬN TẠI VÙNG BIỂN MIỀN TRUNG, VIỆT NAM

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ SINH HỌC

HÀ NỘI, 2020

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------

TRẦN THỊ HỒNG SÀNG LỌC VÀ BIỂU HIỆN GEN MÃ HÓA PROTEIN ỨC CHẾ

PROTEASE CỦA VI SINH VẬT LIÊN KẾT HẢI MIÊN Spheciospongia

vesparium QT2 THU NHẬN TẠI VÙNG BIỂN MIỀN TRUNG, VIỆT

NAM

Chuyên ngành: Công nghệ sinh học

Mã số: 9420201

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ SINH HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:

1. PGS.TS.NCVCC Phạm Việt Cường

2. PGS.TS Nguyễn Thị Kim Cúc

Hà Nội, 2020

LỜI CÁM ƠN

Lời đầu tiên, tôi xin được bày tỏ lòng kính trọng và biết ơn sâu sắc nhất tới

PGS.TS.NCVCC Phạm Việt Cường, nguyên Viện trưởng Viện Nghiên cứu Khoa

học Miền Trung, Viện Hàn lâm Khoa học và Công nghệ Việt Nam- Nhà Khoa học

mẫn cán, người thầy mẫu mực- người đã giúp tôi định hướng nội dung, giúp đỡ về

tinh thần, kiến thức chuyên môn, cơ sở vật chất và chỉ bảo tận tình giúp tôi vượt qua

rất nhiều khó khăn để hoàn thành Luận án trong suốt những năm qua.

Tôi cũng xin chân thành cảm ơn sâu sắc tới PGS.TS Nguyễn Thị Kim Cúc,

Chủ nhiệm đề tài ĐTĐLCN.17/14 “Nghiên cứu metagenome của vi sinh vật liên kết

hải miên tại biển miền Trung Việt Nam nhằm phát hiện và sàng lọc các chất hoạt

tính sinh học mới” đã định hướng cho luận án của tôi và quan tâm, giúp đỡ tôi trong

suốt thời gian thực hiện luận án.

Tôi xin cảm ơn Ban lãnh đạo Viện Nghiên cứu Khoa học Miền Trung đã cử

tôi đi học, tập thể Trung tâm sinh học Phân tử Nghĩa Đô, Ths.NCS Tôn Thất Hữu

Đạt, phòng quản lý tổng hợp Viện Nghiên cứu Khoa học Miền Trung đã tạo điều

kiện cho tôi làm việc, hoàn thành các thủ tục giấy tờ và hoàn thiện các nội dung

trong nghiên cứu này.

Tôi trân trọng cảm ơn Học viện Khoa học và Công nghệ, Viện Công nghệ

Sinh học đã tạo điều kiện thuận lợi về cơ sở vật chất và giúp đỡ tôi hoàn thành mọi

thủ tục cần thiết trong quá trình học tập.

Cuối cùng, tôi xin gửi lời cảm ơn đến gia đình, bạn bè và người thân đã luôn

bên cạnh động viên, giúp đỡ, chia sẻ và tạo điều kiện tốt nhất cho tôi học tập,

nghiên cứu và hoàn thiện luận án của mình.

Hà Nội, ngày tháng năm 2019

Tác giả

i

NCS. Trần Thị Hồng

LỜI CAM ĐOAN

Tôi xin cam đoan:

Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác với các

cộng sự khác;

Các số liệu và kết quả trình bày trong luận án là trung thực, một số kết quả

lần đầu tiên được công bố trên tạp chí khoa học chuyên ngành có uy tín với sự đồng

ý và cho phép của các đồng tác giả.

Phần còn lại chưa được ai công bố trong bất kỳ công trình nào khác.

Hà Nội, ngày tháng năm 2019

Tác giả

ii

NCS. Trần Thị Hồng

MỤC LỤC

Lời cảm ơn ................................................................................................................... i

Lời cam đoan ............................................................................................................... ii

MỤC LỤC .................................................................................................................... iii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT............................................ vi

DANH MỤC CÁC BẢNG .......................................................................................... viii

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ .................................................................... ix

MỞ ĐẦU ...................................................................................................................... 1

CHƯƠNG I. TỔNG QUAN ....................................................................................... 3

1.1. Hải miên và vi sinh vật liên kết hải miên .................................................................. 3

1.1.1. Giới thiệu về hải miên................................................................................................... 3

1.1.2. Vi sinh vật liên kết hải miên ......................................................................................... 6

1.2. Sơ lược về metagenomics ........................................................................................... 14

1.3. Chất ức chế protease (PIs) ......................................................................................... 19

1.3.1. Sơ lược protease ............................................................................................................ 19

1.3.2. Chất ức chế protease và phân loại ................................................................................ 20

1.3.3. Cơ chế hoạt động của PIs.............................................................................................. 25

1.3.4. Ứng dụng của chất ức chế protease .............................................................................. 28

1.3.5. Tình hình nghiên cứu PIs từ vi sịnh vật liên kết với hải miên trong và

ngoài nước ..................................................................................................................... 31

1.4. Hệ biểu hiện gen ngoại lai Escherichia coli và Pichia pastoris ................................ 35

CHƯƠNG II. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .......................... 37

2.1. Vật liệu nghiên cứu ..................................................................................................... 37

2.1.1 Vật liệu….. .................................................................................................................... 37

2.1.2. Đối tượng nghiên cứu….. ............................................................................................. 39

2.1.3. Hóa chất…. ................................................................................................................... 39

2.1.4. Máy móc thiết bị ........................................................................................................... 39

2.1.5. Dung dịch và môi trường sử dụng ................................................................................ 40

2.2. Phương pháp nghiên cứu ........................................................................................... 42

iii

2.2.1. Phương pháp tách DNA metagenome của VSV liên kết hải miên ............................... 43

2.2.2. Định danh hải miên bằng sinh học phân tử ..................................................................

43

2.2.3. Phân tích dữ liệu metagenomics ................................................................................... 43

2.2.4. Tổng hợp gen PIs từ CSDL metagenomics hải miên và thiết kế

plasmid mang gen PIs ................................................................................................... 47

2.2.5. Các phương pháp sử dụng để thu hồi protein PIs tái tổ hợp trong hệ

biểu hiện E. coli (DE3) ................................................................................................ 48

2.2.6. Các phương pháp sử dụng để thu hồi protein PIs tái tổ hợp trong hệ

biểu hiện nấm men Pichia pastoris .............................................................................. 49

2.2.7. Phương pháp xác định hoạt tính ức chế protease ......................................................... 50

2.2.8. Phương pháp xác định ảnh hưởng của một số yếu tố đến protein PIs

tái tổ hợp ....................................................................................................................... 52

2.2.9. Phân tích thống kê ......................................................................................................... 52

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ............................................................. 53

3.1. Thu thập mẫu hải miên .............................................................................................. 53

3.2. Kết quả tách chiết DNA metagenome ....................................................................... 54

3.2.1. Tách chiết DNA metagenome của vi sinh vật liên kết hải miên biển

Quảng Trị ...................................................................................................................... 54

3.2.2. Định danh hải miên QT2 bằng sinh học phân tử .......................................................... 55

3.3. Xây dựng cơ sở dữ liệu DNA metagenome của vi sinh vật liên kết

hải miên Spheciospongia vesparium QT2 biển Quảng Trị, Việt

Nam bằng tin sinh học ................................................................................................ 56

3.3.1. Lắp ráp reads của DNA metagenome ........................................................................... 56

3.3.2. Kết quả dự đoán gen ..................................................................................................... 58

3.3.3. Kết quả chú giải và phân loại chức năng gen ............................................................... 60

3.3.4. Đa dạng sinh học vi sinh vật liên kết hải miên Spheciospongia

vesparium QT2 biển Quảng Trị ................................................................................... 64

3.3.5. Khai thác gen có hoạt tính ức chế protease (PIs) dựa trên cơ sở dữ

liệu (CSDL) metagenomics ......................................................................................... 71

3.4. Nghiên cứu biển hiện ức chế protease (PIs) trong hệ Escherichia

coli ................................................................................................................................. 75

iv

3.4.1. Phân tích trình tự a xít amin và cây phân loại của protein PI-QT ................................ 76

3.4.2. Thiết kế vectơ biểu hiện pET-32a(+) mang gen PIs .....................................................

78

3.4.3. Biểu hiện gen PIs trong E. coli chủng BL21(DE3) ...................................................... 79

3.4.4. Nghiên cứu điều kiện thích hợp nhất để thu protein tái tổ hợp PI-QT

ở trạng thái tan cao nhất ................................................................................................ 81

3.4.5. Tinh sạch protein tái tổ hợp PI-QT trong E. coli và nhận diện bằng

khối phổ ........................................................................................................................ 87

3.4.6 Thử hoạt tính ức chế của protein tái tổ hợp PI-QT với protease .................................. 89

3.5. Nghiên cứu biển hiện ức chế protease (PIs) trong hệ nấm men

Pichia pastoris .............................................................................................................. 91

3.5.1. Tạo plasmid pPIC9 mang gen PI-QT ........................................................................... 91

3.5.2. Tạo dòng tế bào Pichia pastoris SMD1168 mang gen PI-QT ..................................... 92

3.5.3. Biểu hiện gen PI-QT trong nấm men P. pastoris SMD1168 ........................................ 93

3.5.4. Kết quả thử hoạt tính ức chế của protein PI-QT biểu hiện trong nấm

men ................................................................................................................................ 96

3.5.5. Kết quả phát hiện chất ức chế protease bằng điện di trên gel SDS-

PAGE có bổ sung cơ chất casein 0,1 % ........................................................................ 97

3.5.6. Khảo sát các yếu tố ảnh hưởng đến sự biểu hiện P. pastoris SMD

1168 [pPIC9/PI-QT] ..................................................................................................... 98

3.5.7. Tinh sạch protein PI-QT tái tổ hợp biểu hiện trong nấm men P.

pastoris qua cột sắc ký ái lực Trypsin-Sepharore 4B .................................................. 104

3.5.8. Ảnh hưởng của một số yếu tố đến protein PI-QT ......................................................... 106

KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................... 112

DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ .......................................................... 113

v

TÀI LIỆU THAM KHẢO ......................................................................................... 114

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

ACN Acetonitrile

Amp Ampicillin

BLAST Basic Local Alignment Search Tool

bp, kb, kDa Base pair, Kilo base, Kilo dalton

CFU Colony forming units

CSDL Cơ sở dữ liệu

CTAB Cetyl trimêtylamôni brômua

ĐC Đối chứng

DN Đà Nẵng

DNA Deoxyribonucleic Acid

dNTP Deoxyribonucleotide triphosphate

đtg Đồng tác giả

DTT Dithiothreitol

E. coli Escherichia coli

EDTA Ethylenediaminetetraacetic acid

EtBr Ethidium bromide

FA AntiFoam

HMA High microbial abundance

IAA 3-Indolebutyric acid

IPTG Isopropyl β-D-1-thiogalactopyranoside

KH&CN Khoa học và Công nghệ

LB: Luria-Bertani

LMA Low microbial abundance

mRNA Messenger RNA

NCBI National Center for Biotechnology Information

P. pastoris Pichia pastoris

PCR Polymerase Chain Reaction

PIs Protein inhibitors

vi

QT Quảng Trị

RNA Ribonucleic acid

RNase Ribonuclease

SCUBA Self contained underwater breathing apparatus

SDS Sodium dodecyl sulphate

TAE Tris-Acetic-EDTA

Taq polymerase Polymerase Thermus aquarius

TBS Tris-buffered saline

TE Tris- EDTA

TFA Axit trifluoroacetic

TQ Trung Quốc

vii

VSV Vi sinh vật

DANH MỤC CÁC BẢNG

32 Bảng 1.2. Chất ức chế protease từ vi sinh vật liên kết hải miên……………

42 Bảng 2.1. Thành phần của bản gel polyacryamide .......................................................................

Bảng 3.1. Chất lượng của DNA tổng số tách từ các mẫu hải miên biển

Quảng trị ....................................................................................................................... 54

57 Bảng 3.2. Kết quả lắp ráp DNA metagenome của mẫu QT2 ........................................................

Bảng 3.3. Kết quả dự đoán, cluster genes và kiểm tra tính toàn vẹn của gen

(mẫu QT2) .................................................................................................................... 59

60 Bảng 3.4. Tổng hợp kết quả chú giải chức năng gen (QT2) .........................................................

Bảng 3.5. Phân loại các reads 16S rRNA của hải miên Spheciospongia

vesparium QT2 theo giới và ngành ............................................................................... 65

Bảng 3.6. Phân loại các reads 16S rRNA của hải miên Spheciospongia

vesparium QT2 đến lớp và bộ ....................................................................................... 66

Bảng 3.7. Phân loại các reads 16S rRNA của hải miên Spheciospongia

vesparium QT2 đến họ; chi ........................................................................................... 68

Bảng 3.8. Kết quả sàng lọc các gen có hoạt tính protease inhibitor từ

CSDL metagenomics QT2 ............................................................................................ 71

73 Bảng 3.9 Gen có hoạt tính sinh học mới (so với ở Việt Nam) ....................................................

Bảng 3.10 So sánh hoạt tính ức chế protease của protein PI-QT tinh sạch

thu hồi biểu hiện trong P. pastoris SMD1168 và E. coli

viii

BL21(DE3) .................................................................................................................. 106

DANH MỤC CÁC HÌNH

Cấu trúc cơ thể hải miên và các mô .............................................................................. 4 Hình 1.1.

Sơ đồ đại diện cho hải miên asconoid .......................................................................... 4 Hình 1.2.

Vai trò của vi sinh vật với hải miên .............................................................................. 8 Hình 1.3.

Ba trạng thái liên kết chung củ VSV và hải miên ........................................................ 10 Hình 1.4.

Ba cách truyền và thu nhận VSV để thiết lập và duy trì các Hình 1.5.

cộng đồng VSV liên kết hải miên ................................................................................. 11

Ba chất ức chế protease có sẵn trên thị trường ............................................................. 20 Hình 1.6.

23 Hình 1.7. Một vài họ PPI quan trọng ............................................................................................

Ức chế cạnh tranh (Competitive inhibitor) ................................................................... 26 Hình 1.8.

Cơ chế ức chế không cạnh tranh kiểu thứ II ................................................................. 27 Hình 1.9.

Serpin ức chế protease .................................................................................................. 28 Hình 1.10.

Cấu trúc vectơ pET-32a(+) ........................................................................................... 38 Hình 2.1.

Cấu trúc vectơ pPIC9 .................................................................................................... 39 Hình 2.2.

Điện di đồ sản phẩm tách DNA của vi sinh vật liên kết hải Hình 3.1.

miên biển Quảng Trị ..................................................................................................... 54

Điện di đồ trên gel agarose 1 % .................................................................................... 56 Hình 3.2.

Kết quả tinh sạch dữ liệu QT2 ...................................................................................... 57 Hình 3.3.

Phân bố độ dài contig sau lắp ráp ................................................................................. 58 Hình 3.4.

Phân bố độ dài gen ........................................................................................................ 59 Hình 3.5.

Phân loại chức năng gen trên cơ sở dữ liệu COG ........................................................ 61 Hình 3.6.

Phân nhóm chức năng của enzyme trên cơ sở dữ liệu CAZy....................................... 62 Hình 3.7.

Kết quả phân loại trên cơ sở dữ liệu KEGG ................................................................. 63 Hình 3.8.

Điện di đồ sản phẩm PCR trên gel agarose 1,8 % ........................................................ 64 Hình 3.9.

Phân loại vi sinh vật liên kết hải miên Spheciospongia Hình 3.10.

vesparium QT2 theo giới và ngành .............................................................................. 66

Phân loại vi sinh vật liên kết hải miên Spheciospongia Hình 3.11.

vesparium QT2 biển Quảng Trị theo chi ...................................................................... 69

So sánh trình tự axít amin của protein PI-QT với các trình tự Hình 3.12.

tương đồng trên cơ sở dữ liệu NCBI ............................................................................ 76

ix

Hình 3.13. Mối phát sinh quan hệ gen của protein PI-QT với các serpin

khác. (B) Cấu trúc protein của PI-QT đã được dự đoán bằng

SWISS-MODEL. (C) Cấu trúc protein của PI-QT đã được dự

đoán bằng (PS)2-v2 ...................................................................................................... 77

(A) –Gel agarose của vectơ cắt bằng EcoRI/NotI, (B) – Gel Hình 3.14.

agarose của plasmid tái tổ hợp ([pET-32a(+)/PI-QT]) được cắt

bằng enzyme EcoRI/ NotI ............................................................................................. 78

Hình 3.15. A- Kết quả điện di PAGE 12,6 % kiểm tra E. coli

BL21(DE3)/[pET-32a(+)/PI-QT] biểu hiện ở 37 oC .................................................... 80

80 Hình 3.16. Kiểm tra trạng thái của protein PI-QT biểu hiện ..........................................................

Hình 3.17. Protein PI-QT biểu hiện trong E. coli dưới các nồng độ IPTG

khác nhau ...................................................................................................................... 81

83 Hình 3.18. Ảnh hưởng của nhiệt độ lên khả năng tạo protein PI-QT tan.......................................

(A)- Điện di SDS- PAGE 12,6 % kiểm tra khả năng tan của Hình 3.19.

protein ở OD600= 0,6 trước khi cảm ứng; (B)- Trạng thái

protein PI-QT (% tan) và hàm lượng protein tạo ra khi OD600

trước cảm ứng khác nhau. ............................................................................................. 84

Hình 3.20. Sử dụng đệm đẩy cột imidazole 100 mM, 250 mM, 300 mM,

500 mM ......................................................................................................................... 86

Hình 3.21. Kết quả Western blot và kết quả loại bỏ đuôi dung hợp TRx-

His-tag ra khỏi protein PI-QT bằng thrombin trên gel SDS-

PAGE 12.6 % ............................................................................................................... 88

Hình 3.22. Thử nghiệm hoạt tính ức chế protein tái tổ hợp PI-QT đối với

Trypsin và Elastase trên đĩa thạch ................................................................................ 90

Hình 3.23. Thử nghiệm hoạt tính ức chế protein tái tổ hợp PI-QT đối với

ɑ-Chymotrypsin trên đĩa thạch ..................................................................................... 90

Hình 3.24. Điện di đồ trên gel agarose 1 % sản phẩm cắt mở vòng vectơ

pPIC9 (a) và cắt kiểm tra plasmid [pPIC9/PI-QT] ....................................................... 91

Hình 3.25. Điện di đồ trên gel agarose 1% sản phẩm cắt kiểm tra plasmid

pPIC9/PI-QT và sản phẩm PCR bằng cặp mồi AOX1 ................................................. 92

Hình 3.26. Kết quả kiểm tra kiểu hình và kiểu gen nấm men mang gen PI-

x

QT ................................................................................................................................. 92

Hình 3.27. Đường cong sinh trưởng của các dòng P. pastoris tái tổ hợp

theo thời gian ................................................................................................................ 94

Hình 3.28. Điện di đồ protein PI-QT biểu hiện trong P. pastoris

SMD1168 [pPIC9/PI-QT] ............................................................................................ 95

Hình 3.29. Đồ thị tương quan giữa hàm lượng protein ngoại lai tạo ra với

mật độ tế bào nấm men tái tổ hợp................................................................................. 95

96 Hình 3.30. Định tính khả năng ức chế protease của protein biểu hiện ...........................................

Hình 3.31. Kết quả thử hoạt tính ức chế protease của dịch chiết thô

P. pastoris SMD1168 không mang gen PI-QT ............................................................ 97

Hình 3.32. Điện di SDS-PAGE 12,6 % đồng trùng hợp với cơ chất casein

0.1 % và xử lý bằng enzyme trypsin ............................................................................ 98

Hình 3.33. Khảo sát ảnh hưởng của môi trường đến khả năng tạo protein

PI-QT (mg/L) trong nấm men P. pastoris .................................................................... 99

Hình 3.34. Khảo sát nhiệt độ biểu hiện của P. pastoris SMD 1168

[pPIC9/PI-QT] .............................................................................................................. 100

Hình 3.35. Khảo sát pH trong quá trình biểu hiện P. pastoris SMD

1168[pPIC9/PI-QT] ...................................................................................................... 102

Hình 3.36. Nồng độ methanol cảm ứng trong biểu hiện P. pastoris tái tổ

hợp ................................................................................................................................ 103

Hình 3.37. Điện di SDS – PAGE 12,6 % protein PI-QT qua màng cut off

30 kDa và qua cột sắc ký ái lực Trypsin-Sepharose 4B ............................................... 105

Hình 3.38. Hoạt tính ức chế protease của protein PI-QT tinh sạch biểu

hiện trong nấm men P. pastoris SMD1168 .................................................................. 105

106 Hình 3.39. Biểu đồ ảnh hưởng của nhiệt độ đến hợp chất PI-QT ..................................................

xi

107 Hình 3.40. Biểu đồ ảnh hưởng của pH đến hợp chất PI-QT ..........................................................

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------

TRẦN THỊ HỒNG SÀNG LỌC VÀ BIỂU HIỆN GEN MÃ HÓA PROTEIN ỨC CHẾ

PROTEASE CỦA VI SINH VẬT LIÊN KẾT HẢI MIÊN Spheciospongia

vesparium THU NHẬN TẠI VÙNG BIỂN MIỀN TRUNG , VIỆT NAM

LUẬN ÁN TIẾN SĨ CÔNG NGHỆ SINH HỌC

HÀ NỘI, 2020

1

MỞ ĐẦU

Chất ức chế protease (PI), một tác nhân có thể làm cho protease mất khả

năng thủy phân protein thành peptide được ứng dụng trong nhiều lĩnh vực đặc biệt

là trong y dược như: điều trị kháng phân hủy sợi huyết (antifibrinolytic); ức chế

angiotensin trong điều trị tăng huyết áp; ngăn chặn sự nhân lên của một số virus

(HIV, viêm gan C…. Ví dụ về các thuốc ức chế protease là saquinavir (tên thương

hiệu: Invirase) và ritonavir (tên thương hiệu: Novir) được sử dụng chủ yếu trong

điều trị HIV/AIDS. Chúng được dùng như một phần của một loại cocktail đa thuốc

và đã được chứng minh là có khả năng làm giảm đáng kể mức độ virus HIV trong

máu.

Vì vậy, việc sàng lọc và phát hiện các phân tử protein mới có hoạt tính ức

chế đặc hiệu các protease đích khác nhau, liên quan đến các loại bệnh là một hướng

nghiên cứu được quan tâm hiện nay. Hải miên và các vi sinh vật liên kết với hải

miên được xem là một nguồn để phát hiện và khai thác các hợp chất có hoạt tính

sinh học mới phục vụ chế tạo thuốc, các peptide có hoạt tính ức chế protease là một

trong số đó. Tuy nhiên, phần lớn các vi sinh vật liên kết hải miên thuộc loại không

nuôi cấy được nên hạn chế khả năng khai thác chúng. Nhờ kỹ thuật metagenomic,

với sự hỗ trợ của thiết bị giải trình tự gen hiệu năng cao và công cụ tin sinh cho

phép phát hiện các gen, cụm gen có chức năng mã hóa cho các PI, cho phép khai

thác được các PI từ các vi sinh vật chưa nuôi cấy được.

Đến nay tại Việt Nam cũng đã có nhiều nghiên cứu về hải miên, từ việc phân

lập vi sinh vật trên hải miên, đến tách chiết các chất có hoạt tính sinh học từ nhóm

vi sinh vật này. Tuy nhiên, vẫn còn chưa có nghiên cứu nào sử dụng công cụ

metagenomics và công nghệ giải trình tự gen thế hệ mới để phát hiện, sàng lọc các

gen có hoạt tính sinh học, trong đó có hoạt tính ức chế protease và biểu hiện các gen

này trong hệ Escherichia coli và nấm men Pichia pastoris.

Chính vì vậy, chúng tôi thực hiện luận án với tên đề tài: “Sàng lọc và biểu

hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên

Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam”.

2

Mục tiêu của đề tài luận án

Phát hiện và sàng lọc gen liên quan đến sinh tổng hợp các chất có hoạt tính ức

chế protease từ vi sinh vật liên kết hải miên thu nhận từ biển Miền Trung, Việt Nam

bằng phương pháp metagenomics. Sau đó biểu hiện gen chọn lọc in vitro và xác

định hoạt tính.

Nội dung nghiên cứu

1. Tách DNA của vi sinh vật liên kết với hải miên, xác định nồng độ DNA và độ

tinh sạch, lựa chọn mẫu giải trình tự metagenomics.

2. Phân tích dữ liệu metagenomics mẫu đã giải trình tự bằng các công cụ tin sinh

học. Đánh giá đa dạng sinh học của vi sinh vật liên kết với hải miên. Từ CSDL

metagenomics khai thác gen liên quan đến sinh tổng hợp các chất có hoạt tính ức

chế protease.

3. Nghiên cứu biểu hiện gen mã hóa protein ức chế protease trong hệ biểu hiện

Escherichia coli và hệ biểu hiện nấm men Pichia pasroris.

4. Đánh giá hoạt tính ức chế protease của protein tái tổ hợp.

Những đóng góp mới của luận án

1. Đã xây dựng được cơ sở dữ liệu DNA metagenome của vi sinh vật liên kết hải

miên của mẫu hải miên QT2 thu nhận tại vùng biển Quảng Trị (Miền Trung),

Việt Nam. Cơ sở dữ liệu thu được có ý nghĩa về mặt khoa học góp phần bảo tồn

nguồn gen vi sinh vật biển Việt Nam và có tiềm năng khai thác nguồn gen trên để

ứng dụng vào thực tiễn.

2. Thu nhận được gen mới PI-QT mã hóa cho PIs và biểu hiện thành công ở E. coli

và P. pastoris. Hoạt tính ức chế protease của protein biểu hiện đã được đánh giá

và kết quả thu được cho thấy protein PI-QT tái tổ hợp từ E. coli có hoạt tính ức

chế trypsin, ức chế ɑ-chymotrypsin và protein từ P. pastoris thể hiện hoạt tính ức

chế trypsin, ɑ-chymotrypsin và thermolysin.

3

CHƯƠNG I. TỔNG QUAN

1.1. Hải miên và vi sinh vật liên kết hải miên

1.1.1. Giới thiệu về hải miên

Hải miên là một ngành động vật đa bào nguyên thủy, có cấu trúc tế bào tách

biệt và là nhóm động vật sống bám, tuy nhiên một số loài có khả năng vận động nhờ

vào tế bào chất hay roi. Hải miên có thể sống trong các loại môi trường khác nhau ở

biển và trong tất cả các vùng khí hậu. Từ các vùng cực và ôn đới, đến hệ sinh thái

rạn san hô nhiệt đới và cận nhiệt đới. Tính đến năm 2019, khoảng 9.125 loài hải

miên nói chung được chấp nhận có trong danh sách của Cơ sở dữ liệu hải miên thế

giới (Http://www.marinespecies.org). Vì vậy, các quần thể hải miên có sự khác biệt

về sự đa dạng, sự phong phú và mật độ. Các loài hải miên được chia thành 4 lớp:

Calcarea (hải miên đá vôi), Demospongia (demosponges), Hexactinellida (hải miên

thủy tinh), và Homoscleromorpha. Lớp lớn nhất là Demospongia, gồm khoảng 83,4

% tất cả các loài được biết. Trong số các loài hải miên được biết đến, chỉ có khoảng

250 loài là sống trong nước ngọt (van Soest et al., 2012).

Hải miên có các hình dạng khác nhau, từ hình cầu, hình ống, hình bình hoặc

phân nhánh và kích thước cũng khác nhau, từ một vài milimet (hải miên Cliona

celata), đến vài mét (hải miên Xestospongia muta). Phần lớn hải miên là động vật

ăn lọc, trừ các loài ăn thịt cư trú ở môi trường biển sâu nghèo dinh dưỡng (Lee et

al., 2012). Hình dáng cơ thể chung của loài ăn lọc được chuyên môn hóa cho lọc

nước để lấy dinh dưỡng, hô hấp và bài tiết. Phụ thuộc vào thiết kế của hệ thống lọc

nước, hải miên được chia thành: (1) Asconoid, khi cơ thể hải miên có hình trụ rỗng,

bề mặt có các lỗ nhỏ; (2) Syconoid, khi bề mặt cơ thể hải miên có xen kẽ các túi

chui vào trong và lồi ra ngoài, làm tăng tỉ lệ giữa diện tích và thể tích; hoặc (3)

Leuconoid, khi cơ thể hải miên được tạo thành bởi các kênh dẫn nước bao gồm rất

nhiều các khoang hình cầu nối với nhau bởi các ống giống như mao mạch (Hình 1.1

và 1.2) (Cavalcanti & Klautau., 2011; Webster & Thomas., 2016).

4

Hình 1.1. Cấu trúc cơ thể hải miên và các mô.

(Nguồn: Cavalcanti & Klautau., 2011).

(A): Asconoid; (B): Syconoid; (C): Leuconoid. Mô liên kết: mesophyl (màu xám),

lớp bề mặt (pinacoderm) và một lớp tế bào bên trong hình thành bởi các tế bào hình

roi (choanoderm: màu đen).

Hình 1.2. Sơ đồ đại diện cho hải miên Asconoid.

(Nguồn: Webster &Thomas., 2016).

Nước biển đi vào hải miên thông qua các lỗ nhỏ (ostia) vào lớp bề mặt

(pinacoderm). Các tế bào roi choanocyte được sắp xếp thành vòng tròn lót hệ

chuyển nước của hải miên và chịu trách nhiệm di chuyển nước qua hải miên cho

đến khi thải ra qua các lỗ thoát nước (osculum). Vi sinh vật môi trường là các tế bào

màu xanh, trong khi mật độ cộng đồng vi sinh vật liên kết có trong mô liên kết màu

đỏ.

5

Cấu trúc cơ thể hải miên được giữ vững bởi mô liên kết và các loại tế bào khác

nhau. Các thành phần khung riêng biệt làm cho hải miên có cấu trúc toàn vẹn được

cấu tạo từ các gai (spicules), canxi (calcareous) hoặc silic (siliceous), chitin hoặc sợi

collagen (collagenous spongin) (Hentschel et al., 2012).

Thành phần hóa học, sự khác biệt cấu trúc và kích thước gai là các đặc điểm

hình thái quan trọng để phân loại hải miên. Lớp Demospongia và

Homoscleromorpha có sợi collagen hoặc các gai hoặc cả hai. Lớp

Homoscleromorpha cũng có đại diện không có gai nhưng có sợi collagen. Lớp hải

miên đá vôi và hải miên thủy tinh có canxi hoặc silic, tương ứng (van Soest et al.,

2012).

Là loài ăn lọc, hải miên xử lý hàng trăm lít nước biển một ngày, vì vậy thức

ăn của chúng bao gồm VSV, sinh vật nhân chuẩn nhỏ, các hợp chất hữu cơ nhỏ...

(de Goeij et al., 2013). Thức ăn được tế bào roi và lớp bề mặt của hải miên bắt giữ,

và chuyển đến các tế bào mô liên kết và tiêu hóa bởi tế bào khởi thủy

(archaeocytes). Tiếp theo, các sản phẩm của thức ăn đã được tiêu hóa được phân bố

đến các tế bào mô liên kết khác và cuối cùng các thứ không được tiêu hóa và sản

phẩm bài tiết được trục xuất ra khỏi hải miên thông qua các kênh thở ra (exhalant)

hoặc mặt ngoài qua ngoại tế bào (exocytosis) (Maldonado et al., 2012).

Hải miên có sự đa dạng cao và là một thành phần quan trọng của quần thể

sinh vật đáy biển, từ cửa sông, bờ biển đến biển sâu. Nhóm này là một trong những

nguồn các hợp chất hoạt tính sinh học từ biển nổi bật nhất, với khoảng 4851 hợp

chất (năm 2014), đóng góp gần 30 % tổng số các hợp chất tự nhiên từ biển được

phát hiện. Trong 10 năm từ 2001 đến 2010, hơn 2400 các sản phẩm tự nhiên mới

được phát hiện từ 542 chi và 671 loài hải miên (Mehbub et al., 2014). Rất nhiều hợp

chất nhận được từ hải miên, gồm terpenoids, alkaloids, peptides, và polyketides...

(Tung et al., 2009; Utkina & Denisenko., 2011; Kalinin et al., 2012) và chúng có

nhiều ứng dụng tiềm năng trong công nghệ sinh học, được sử dụng như các chất

kháng sinh, kháng ung thư, kháng virus, chống viêm và chống độc (Hirashima et

al., 2010; Joseph & Sujatha., 2011; Li et al., 2013; Perdicaris et al., 2013). Do sự

tương đồng cao của một số hợp chất nhận được từ hải miên với các chất trao đổi thứ

cấp của VSV đã biết, người ta tin rằng ít nhất một số chất hoạt tính sinh học là do

6

VSV liên kết sản sinh. Việc định vị các chất trao đổi thứ cấp trong các vi sinh vật

cộng sinh đã ủng hộ giả thiết này (Wilson et al., 2014).

1.1.2. Vi sinh vật liên kết hải miên

Vi sinh vật liên kết hải miên được tìm thấy cả trong và ngoài tế bào hải miên,

nằm trong mô liên kết hoặc trong lớp ngoài của hải miên. Các vi khuẩn và cổ khuẩn

gồm ngành Thaumarchaeota và các ngành vi khuẩn Acidobacteria, Actinobacteria,

Bacteroidetes, Chloroflexi, Cyanobacteria, Firmicutes, Gemmatimonadetes,

Nitrospirae, Proteobacteria (Alpha-, Beta-, Gamma-, và Delta-), Planctomycetes,

Verrucomicrobia, và Poribacteria (Hentschel et al., 2012). Từ nghiên cứu giải trình

tự thông lượng cao về quần xã VSV liên kết hải miên, số lượng ngành VSV trong

một hải miên tăng từ 23 ngành (Webster et al., 2010) lên đến 47 ngành (Reveillaud

et al., 2014). Theo số liệu mới nhất gần đây, hơn 60 ngành VSV đã tìm được từ các

mẫu hải miên biển theo phân loại của Silva và hơn 70 ngành theo phân loại của

Greengenes (Moitinho-Silva et al., 2017). Nhìn chung, VSV liên kết hải miên có

các loại tương tác khác nhau, có lợi hoặc có hại, từ việc là nguồn thức ăn, ký sinh,

gây bệnh, đến hỗ sinh và hội sinh (Hình 1.3) (Taylor et al., 2007; Lafi et al., 2009).

Vi khuẩn liên kết hải miên được chia ra thành các nhóm: vi khuẩn quang

hợp, vi khuẩn dị dưỡng, cổ khuẩn oxi hóa ammonia. Ba loại liên kết rộng rãi của vi

khuẩn với hải miên gồm: (1) Lượng lớn các quần thể vi khuẩn đặc hiệu hải miên

trong mô liên kết hải miên; (2) Các quần thể nhỏ vi khuẩn bên trong tế bào riêng

biệt; (3) Các quần thể vi khuẩn không đặc hiệu giống với các quần thể trong môi

trường nước xung quanh (Mares et al., 2017).

VSV nhân chuẩn là một trong những thành phần quan trọng và đa dạng của

các hệ sinh thái biển; tuy nhiên, chúng được đánh giá thấp so với các VSV khác.

Trong hải miên, chủ yếu là thấy nấm men. Trái ngược với các cộng đồng vi khuẩn

liên kết với hải miên, các nghiên cứu về sự liên kết giữa nấm và hải miên vẫn còn

rất khiêm tốn (Rodríguez-Marconi et al., 2015; Naim et al., 2017). Các sinh vật

nhân chuẩn khác như "SAR" - một nhánh bao gồm Stramenopiles, Alveolates và

Rhizaria cũng đã được phát hiện trong hải miên (Burki el al., 2007; Webster et al.,

2004; Sipkema & Blanch., 2009). Tuy nhiên, cộng đồng các VSV nhân chuẩn

7

dường như không cộng sinh chặt chẽ với hải miên (Rodríguez-Marconi et al.,

2015).

Vai trò của vi sinh vật với hải miên

VSV liên kết hải miên có vai trò khác nhau đối với vật chủ (Hentschel et al.,

2012; Taylor et al., 2007). Ví dụ, vật chủ hải miên có thể nhận được lợi ích từ VSV

liên kết ở dạng chất trao đổi thứ cấp, sinh tổng hợp vitamin (Siegl et al., 2011), loại

bỏ chất thải trao đổi chất, ổn định khung hải miên hoặc ngay cả bảo vệ hải miên

khỏi tia UV. Các chất trao đổi thứ cấp của VSV có thể là những nhân tố quan trọng

trong các cơ chế bảo vệ hóa học của hải miên chống lại các loại động vật ăn thịt hải

miên, các nguồn bệnh hoặc động vật không cuống đáy cạnh tranh không gian (ví dụ

san hô) (Pawlik., 2011).

Rất nhiều VSV liên kết hải miên tham gia vào các chu trình dinh dưỡng phức

tạp giữa hải miên và môi trường. Ví dụ, quá trình chuyển hóa quang tự dưỡng

(photoautotrophic) và hóa tự dưỡng (chemoautotrophic) của cacbon vô cơ và hữu

cơ hòa tan như một phần của chu trình cacbon ở hải miên (Hentschel et al., 2012;

Easson & Thacker., 2014; Maldonado et al., 2012). Một số VSV cộng sinh có thể

có chức năng quan trọng trong chu trình nitơ của hải miên, và tham gia vào quá

trình chuyển hóa nitơ như cố định nitơ, nitrit hóa, oxy hóa yếm khí ammonia và

phản nitrit hóa (Maldonado et al., 2012; Fan et al., 2012). Rất nhiều loài hải miên

nhiệt đới có vi khuẩn lam (cyanobacteria) liên kết (ví dụ: chi Synechococcus)

(Bayer et al., 2014a) cố định nitơ thành ammonia cho hải miên. Hải miên cũng

được lợi khi được cung cấp dinh dưỡng như phosphate hữu cơ hay glycerol. Có đến

50 % nhu cầu năng lượng và 80 % quỹ cacbon của hải miên có thể được vi khuẩn

lam liên kết cung cấp (Taylor et al., 2007; Thoms & Schupp., 2007). Hải miên vùng

lạnh, ôn đới và nhiệt đới (ví dụ: Phakellia ventilabrum, Geodia barretti, hoặc

Inflatella pellicula), có các VSV liên kết như cổ khuẩn oxy hóa ammonia (ngành

Thaumarchaeota với chi Nitrosopumilus hoặc Cenarchaeum), vi khuẩn oxy hóa

ammonia (ngành Planctomycetes, bộ Planctomycetales, lớp Betaproteobacteria với

chi Nitrosomonas), và vi khuẩn oxy hóa nitrite (ngành Nitrospirae, chi Nitrospira)

(Radax et al., 2012).

8

Liên kết Vai trò Vai trò VSV nhân sơ (Prokaryotes) VSV nhân chuẩn (Eukaryotes)

Tảo (algae)

Khử sulphate Cố định nitơ, bảo vệ

Hải miên Polychaetes Vi khuẩn (Cyanobacteria, Actinobacteria, Proteobacteria) Nguồn thức ăn Oxy hóa nitơ

Vận chuyển dinh dường … Tăng tốc độ sinh trưởng Tảo đơn bào 2 roi Dinoflagellat e)

Cổ khuẩn (Archae) Oxy hóa ammonia Cỏ (Mangroves)

Giảm nhiễm bệnh

Hình 1.3.Vai trò của vi sinh vật với hải miên

(Nguồn: Lafi et al., 2009)

Sự phong phú, đa dạng và đặc hiệu của vi sinh vật liên kết hải miên

VSV liên kết hải miên thường cư trú ở vùng ngoại bào, nơi chúng tập trung

xung quanh các tế bào roi, các vòng của các tế bào roi tạo thành hệ thống dẫn nước

của hải miên (Hình 1.2). Dựa vào mật độ VSV liên kết, hải miên được chia thành loài có mật độ liên kết cao (high microbial abundance: HMA), có tới 109 tế bào/cm3

mô hải miên, và loài có mật độ VSV liên kết thấp (low microbial abundance: LMA) với 105-106 vi khuẩn/cm3 mô và vùng mô liên kết chỉ có rất ít VSV (Gloeckner et

al., 2014).

Hải miên được biết liên kết với hơn 60 ngành VSV khác nhau (Webster et

al., 2010; Schmitt et al., 2012; Reveillaud et al, 2014; Rodríguez-Marconiet al,

2015; Moitinho-Silva et al, 2017). Mức độ phong phú và đa dạng của các cộng

đồng liên kết khác nhau nhiều giữa các loài hải miên, từ một vài đơn vị phân loại

9

riêng biệt đến hàng trăm VSV cộng sinh khác nhau về mặt di truyền cho một mẫu

hải miên (Webster et al., 2010; Reveillaud et al, 2014; Lee et al., 2011). Những

khảo sát rộng rãi về phát sinh loài cho thấy những VSV liên kết hải miên chiếm ưu

thế nằm trong các đơn vị phân loại Gamma- và Alphaproteobacteria,

Actinobacteria, Chloroflexi, Nitrospirae, Cyanobacteria,Poribacteria và

Thaumarchaea (Hentschel et al., 2012).

Rất nhiều nghiên cứu cho thấy các cộng đồng VSV hải miên phần lớn đặc

hiệu vật chủ (Webster et al., 2010; Schmitt et al., 2012; Lee et al., 2011; Simister et

al., 2012) và trong cùng loài, các cộng đồng VSV có xu hướng ổn định cao không

phụ thuộc vào địa sinh học và các điều kiện môi trường khác nhau (Webster &

Taylor., 2012; Erwin et al., 2012). Những cụm trình tự đặc hiệu hải miên này là các

nhánh đơn phát sinh (monophyletic clades), chứa ít nhất 3 trình tự có nguồn gốc từ

hải miên (Hentschel et al., 2002). Đáng chú ý là gần đây việc lập bản đồ phả hệ của

12 triệu trình tự 16S rRNA ngắn từ Dự án giải trình tự thông lượng cao của Tổng

cục điều tra Quốc tế về VSV biển (International Census of Marine Microbes -

ICoMM; Http://icomm.mbl.edu/) đối với 173 cụm trình tự đặc hiệu hải miên của

Simisterel al. (2012) cho thấy, rất nhiều VSV đặc hiệu hải miên cũng có mặt trong

các hệ sinh thái biển khác, nhưng với số lượng cực ít. Webster et al. (2010) sử dụng

giải trình tự thông lượng cao 16S rRNA để nghiên cứu đa dạng và sự phong phú của

quần xã VSV liên kết 3 loài hải miên (Ianthella basta, Ircinia ramosa và

Rhopaloeides odorabile) từ biển Đông Bắc, Australia. Kết quả nhận được cho thấy

đơn vị phân loại vi khuẩn có đa dạng ngành cao (n=23) trong 3 loài hải miên nghiên

cứu. Các trình tự nhận được rơi vào 33 cụm đặc hiệu hải miên, với hầu như một nửa

số cụm chỉ liên quan đến vật chủ. Bằng cách ứng dụng 16S rRNA giải trình tự

thông lượng cao cho 32 loài hải miên (˃ 90 mẫu vật) từ 8 địa điểm của vùng nhiệt

đới và ôn đới phân bố trên toàn cầu, Schmitt el al. (2012) mô tả 3 trạng thái chung

của các cộng đồng VSV liên kết hải miên: (1) cộng đồng lõi nhỏ; (2) cộng đồng bất

định và (3) nhóm lớn đặc hiệu hải miên (Hình 1.4).

Các cộng đồng VSV liên kết hải miên dường như tương đối ổn định và có

thay đổi theo vật chủ hoặc đặc hiệu loài theo không gian, thời gian. Những nghiên

cứu luân chuyển loài của các cộng đồng VSV liên kết hải miên theo thời gian

10

(Hardoim & Costa., 2014), không gian (Reveillaud et al., 2014) cũng như các môi

trường khác nhau (Cardenas et al., 2014) nhấn mạnh rằng các cấu trúc cộng đồng

VSV nói chung là đặc hiệu loài. Ngược lại, sự khác biệt theo chiều dọc (độ sâu) và

chiều ngang (địa sinh học) có vẻ chỉ có ảnh hưởng nhỏ lên các kiểu cộng đồng.

Nhưng ảnh hưởng của gradients môi trường tự nhiên cục bộ (ví dụ, độ sâu, mật độ

dinh dưỡng, độ mặn hoặc gradients ánh sáng) hoặc tổ hợp các nhân tố lên quần xã

VSV hải miên được nghiên cứu ít toàn diện hơn, chỉ có một vài nghiên cứu đặc biệt

tập trung vào các ảnh hưởng cụ thể này (Cardenas et al., 2014).

Hình 1.4. Ba trạng thái liên kết chung của VSV và hải miên

(Nguồn: Schmitt et al., 2012).

Quá trình thu nhận vi sinh vật của hải miên

Hải miên có thể sinh sản hữu tính (sản sinh chồi mầm) hoặc vô tính (bằng

cách phân đoạn, mọc chồi), tất cả đều có thể truyền VSV cộng sinh hiệu quả từ hải

miên bố mẹ cho thế hệ sau (Webster & Thomas., 2016). Việc truyền VSV từ thế hệ

này sang thế hệ khác được gọi là “sự truyền dọc” và được cho là một cơ chế tiến

hóa cổ đại để duy trì VSV cộng sinh trong hải miên HMA. Kịch bản tiến hóa này

được củng cố khi các cụm phát sinh loài VSV đặc hiệu hải miên được tìm thấy

trong các loài hải miên có quan hệ họ hàng xa và cách xa về mặt địa lý. Ngoài ra,

nhiều loài VSV đặc hiệu hải miên không tìm được trong nước biển (Hentschel et

al., 2012; Simister et al., 2012).

11

Một phương thức khác để thu nhận vi sinh vật vào hải miên thông qua việc

làm giàu đặc hiệu hoặc không đặc hiệu từ môi trường. Phương thức này còn được

gọi là “truyền ngang”. Bằng cách “truyền ngang” quần xã VSV đặc hiệu hải miên

được làm giàu một cách không đặc hiệu, ví dụ qua dinh dưỡng như thức ăn vi khuẩn

từ nước biển, hoặc ngẫu nhiên hấp thu qua vết thương vào biểu bì hải miên. Về mặt

lý thuyết, làm giàu đặc hiệu VSV trong truyền ngang gồm một vài cơ chế: (1) hấp

thụ chủ động VSV đặc hiệu thông qua việc nhận biết VSV cụ thể bởi hệ miễn dịch

của hải miên; (2) làm giàu loại trừ (subtractive enrichment), là tích lũy VSV kháng

được sự thực bào (Taylor et al., 2007). Trong những trường hợp này, VSV môi

trường mà hải miên thu được cần phải cạnh tranh thắng các loài định cư tiềm năng

để tạo ra các cộng đồng liên kết hải miên ưu thế.

Có khả năng nhất là cả 2 phương thức “truyền dọc” và “truyền ngang” đồng

thời có trong hải miên. Mỗi chiến lược đều có lợi ích và phí tổn nhất định. Ví dụ,

trong trường hợp “truyền dọc”, thế hệ con cháu chắc chắn nhận được VSV cộng

sinh cần thiết cho vật chủ trực tiếp từ bố mẹ, nhưng cũng có thể làm giảm genome

cộng sinh hoặc đánh mất khả năng trao đổi chất ở thế hệ tiếp theo, và điều này có

thể có hại trong trường hợp hải miên bị phân tán đến môi trường không thuận lợi

cho VSV liên kết. Trong khi chọn lọc tự nhiên dường như có lợi cho vật chủ khi có

được VSV cộng sinh từ môi trường tự nhiên, nhưng cũng đồng thời có hại bởi có

thể các nguồn bệnh có cơ hội nhiễm vào hải miên (Hentschel et al., 2012).

Hình 1.5. Ba cách truyền và thu nhận VSV để thiết lập và duy trì các cộng

đồng VSV liên kết hải miên

(Nguồn: Hentschel et al., 2012).

12

Các chất hoạt tính sinh học từ vi sinh vật liên kết hải miên

Các hợp chất chống virus

Các hợp chất tự nhiên từ hải miên (bọt biển)/ hay vi sinh vật liên kết với

chúng thường được tìm thấy là thành phần dược phẩm đầy triển vọng. Một số chúng

đã được phê duyệt làm thuốc chống virus sử dụng lâm sàng hoặc đã được sử dụng

trong giai đoạn cuối của thử nghiệm lâm sàng. Hầu hết các loại thuốc này được sử

dụng để điều trị virus gây suy giảm miễn dịch ở người (HIV) và virus herpes

simplex (HSV) (Sagar et al., 2010).

Macrolactin A, phân lập từ vi khuẩn liên kết hải miên được xác định ức chế

mạnh virus Herpes simplex type I và type II với giá trị IC50 5,0 µg/mL và 8,3 µg/mL. Từ hải miên biển Homophymia sp. đã phân lập được chủng Pseudomonas

sp. 1531-E7 sản sinh hợp chất kháng virus 2-undecyl-4-quinolone với nồng độ IC50 thử nghiệm in vitro chống HIV-1 là 10-3µg/mL. Hợp chất sorbicillactone A được

phân lập từ nấm Penicillium chrysogenum liên kết với hải miên Ircinia fasciculata

và xác định cấu trúc bởi Bringmann et al. (2003). Sorbicillactone A có hiệu quả bảo

vệ tế bào bị nhiễm HIV-1 của dòng tế bào người H9, và thử nghiệm in vitro cho

thấy hợp chất này làm giảm sự xuất hiện của HIV-1 protein trong tế bào H9 đến 70

% ở nồng độ 0,3 µg/mL (Bringmann et al., 2003). Chủng nấm Stachybotrys

chartarum MXH-X73 liên kết hải miên sản sinh hợp chất stachybotrin D, có hoạt

tính kháng HIV-1 bằng enzyme phiên mã ngược (reverse transcriptase) hướng đích.

Li et al. (2014) đã nhận dạng 3 hợp chất kháng HIV-1 khác từ Stachybotrys

chartarum: chartarutine B, G, và H, trong đó chartarutine B có IC50 cho HIV-1 thấp nhất (1,81 µg/mL), tiếp theo là chartarutine G và H (2,05 µg/mL) (Sagar et al.,

2010).

Vi sinh vật liên kết hải miên cũng sản sinh các hợp chất kháng virus cúm.

Zhao et al. (2015) đã làm rõ 14 isoprenylated cyclohexanols được đặt tên là

truncateols A-N từ nấm liên kết hải miên Truncatella angustata. Truncateols C, E

và M thể hiện hoạt tính đối kháng H1N1, trong đó Truncateols M có tiềm năng nhất

với nồng độ IC50 thấp hơn 6 lần so với đối chứng dương Oseltamivir.

Một số ví dụ về VSV liên kết hải miên sản sinh hợp chất kháng virus được

trình bày ở Phụ lục 1.

Các hợp chất kháng khuẩn

13

Vi sinh vật phân lập từ hải miên biển thể hiện hoạt tính sinh học đối kháng

phổ rộng các vi khuẩn gây bệnh (Phụ lục 2). Kháng sinh mới thiopeptide YM-

266183 và YM-266184 được phân lập từ Bacillus cereus QN03323 liên kết hải

miên có hoạt tính đối kháng vi khuẩn Gram (+) gây bệnh truyền nhiễm bệnh viện in

vitro, trong đó có Staphylococcus aureus và Enterococcus faecium kháng

vancomycin với nồng độ ức chế tối thiểu (MIC) 0,025 µg/mL. Cả 2 hợp chất này

đều có khả năng ức chế Staphylococcus aureus kháng methicillin (MRSA) với MIC

là 0,39 µg/mL và 0,78 µg/mL, tương ứng. Hợp chất kocurin được nhận dạng từ 3

loài Actinobacteria liên kết hải miên: Kocuria marina F-276,310; Kocuria palustris

F-276,345, và Micrococcus yunnanensis F-256,446; là thành viên mới của họ

thiazolyl peptide, và là hợp chất đối kháng MRSA phân lập từ vi sinh vật liên kết

hải miên mạnh nhất cho đến nay (Martin et al., 2012; Pandey et al., 2014).

Scheenemaan el al. (2010) phân lập Streptomyces sp. HB202 từ hải miên Haliclona

simulans, dẫn đến việc phát hiện polyketide mayamycin. Mayamycin thể hiện hoạt

tính đối kháng S. aureus, Staphylococcus epidermidis và MRSA với giá trị IC50 là 1,16 µg/mL; 0,14 µg/mL và 0,58 µg/mL, tương ứng ở thử nghiệm in vitro. Những

báo cáo về các hợp chất phân lập từ vi sinh vật liên kết hải miên đối kháng vi khuẩn

Gram (-) ít hơn so với đối kháng vi khuẩn Gram (+). Một ví dụ hợp chất ức chế vi

khuẩn Gram (-) Chlamydia trachomatis là naphthacene glycoside SF2446A2 phân

lập từ Streptomyces sp. RV15, trước đó nhận được từ hải miên Dysidea tupha.

Chlamydia trachomatis là vi khuẩn nội bào bắt buộc G (-) gây các bệnh truyền qua

đường sinh dục và hiện không có phương pháp để diệt vi khuẩn này (Reimer et al.,

2015).

Pruksakorn et al.(2010) báo cáo 3 hợp chất kháng lao tiềm năng trichoderin

A, A1 và B từ nấm liên kết hải miên Trichoderma sp. 05FI48, trong đó trichoderin

A là hợp chất mạnh nhất với giá trị MIC thấp nhất chống lại các chủng

Mycobacterium smegmatis, M. bovis BCG, và M. tuberculosis H37Rv. Những

nghiên cứu sâu hơn chỉ ra rằng hoạt tính sinh học của trichoderin A dựa trên khả

năng ức chế tổng hợp adenosine triphosphate (ATP) của mycobacteria.

Các hợp chất đối kháng nấm

Từ chủng Streptomyces sp. liên kết hải miên Aplysina fistularis đã phân lập

được 2 hợp chất: saadamycin là một hợp chất mới và 1 hợp chất đã biết 5,7-

dimethoxy-4-p-methoxylphenylcoumarin. Thử nghiệm sinh học cho thấy cả 2 hợp

chất này đều thể hiện hoạt tính đối kháng Candida albicans rõ ràng với MIC 2,22

14

µg/mL và 15 µg/mL, tương ứng. Ngoài ra, 2 hợp chất này cũng thể hiện hoạt tính

sinh học chống lại một số nấm gây bệnh da như Epidermophyton floccosum,

Trichophyton rubrum, Trichophyton mentagrophytes, Microsporum gypseum,

Aspergillus niger, Aspergillus fumigatus, Fusarium oxysporum, và Cryptococcus

humicolus. So với đối chứng dương (miconazole), giá trị MIC của saadamycin thấp

hơn 3875 lần và của 5,7-dimethoxy-4-p-methoxylphenylcoumarin thấp hơn 200 lần

(Gendy & Bondkly., 2010). Hợp chất Lacton YM-202204 được phân lập từ chủng

nấm Phoma sp. Q60596 liên kết hải miên có hiệu quả đối kháng C. albicans (IC80 6,25 µg/mL), Cryptococcus neoformans (IC80 1,56 µg/mL), Saccharomyces cerevisiae (IC80 1,56 µg/mL) và Aspergillus fumigatus (IC80 12,5 µg/mL) (Nagai et al., 2002). YM-202204 có khả năng bao vây neo glycophosphatidylinositol (GPI

anchor), một cấu trúc quan trọng cho protein gắn vào trong các tế bào sinh vật nhân

chuẩn (eukaryotes) và một trong những đích để phát triển thuốc đối kháng nấm.

Hoạt tính chống lại protozoa (Antiprotozoan activity)

Manzamine A, đầu tiên được tách chiết từ hải miên Haliclona sp., và sau đó

từ một số loài hải miên khác. Hợp chất này được chứng minh có hoạt tính kháng

khối u, kháng nấm, kháng khuẩn, chống sốt rét và kháng HIV (Eyese et al., 2011;

Ranwan et al., 2012). Manzamine A sau đó được tách chiết từ Micromonospora sp.

M42 liên kết hải miên biển Indonesia Acanthostrongylophora ingens (Hill et al.,

2005). Pimentel-Elardo et al. (2010) nhận dạng 3 hợp chất cyclic depsipeptide

valinomycin, indolocarbazole alkaloid staurosporine và butenolide từ chủng

Streptomyces sp. liên kết hải miên. Valinomycin và staurosporine ức chế sinh

trưởng của L. major với giá trị IC50 0,12 µg/mL và 1,24 µg/mL, tương ứng; ức chế

Trypanosoma brucei với IC50 0,0036 µg/mL và 0,0051 µg/mL, tương ứng và

butenolide có IC50 là 7,92 µg/mL.

1.2. Sơ lược về metagenomics

Khái niệm về metagenomics

Metagenomics nổi lên như một vũ khí mạnh mẽ được sử dụng để nghiên cứu

cộng đồng vi sinh vật bất kể chúng có thể nuôi cấy được hay không trong điều kiện

phòng thí nghiệm và cũng cung cấp cơ hội để mô tả sự đa dạng vi sinh vật trong

môi trường vì rất nhiều loài hiện chưa nuôi cấy được. Metagenomics dựa vào việc

tách DNA từ một cộng đồng và như vậy tất cả genome của vi sinh vật trong cộng

15

đồng đều được gộp lại. Metagenomics cũng được mô tả như genomic cộng đồng và

môi trường bao gồm phân tích genome của vi sinh vật bằng cách tách trực tiếp

DNA và tạo dòng từ một tập hợp các vi sinh vật trong phần lớn môi trường trên trái

đất như nước và đất. Phương pháp metagenomics dựa trên tách nucleic acid trực

tiếp từ mẫu môi trường được chứng minh là công cụ mạnh để so sánh và khám phá

hệ sinh thái (Nazir., 2016; Ghosh et al., 2019).

Cách tiếp cận metagenomics

Phương pháp metagenomics cho phép đánh giá genome vi sinh vật có

trong môi trường. Metagenomics bao gồm tách dòng trực tiếp DNA môi trường vào

các thư viện dòng lớn để thuận tiện cho việc phân tích gen và các trình tự trong các

thư viện này. Kỹ thuật metagenomics bao gồm những bước cơ bản sau: (1) Thu nhận mẫu và tách chiết acid nucleic; (2) thiết lập thư viện metagenome hoặc giải

trình tự DNA metagenome; (3) sàng lọc gen dựa vào ngân hàng gen hoặc phân lập

gen dựa vào số liệu giải trình tự gen. Việc phân lập gen từ metagenome được thực

hiện tương tự như các nghiên cứu phân lập gen trong một hệ gen (genome) (Thi

Huyen Do et al., 2014).

Hiện nay sau khi tách chiết nucleic acid người ta ít tiến hành lập thư viện

gen mà tiến hành giải trình tự. Sau đó dựa trên số liệu giải trình tự kết hợp với các

công cụ tin sinh để tìm kiếm, khai thác gen hay vùng gen mã hóa cho các protein

quan tâm trước khi đưa vào thực nghiệm (Nguyễn Minh Giang et al., 2015) .

Một số mục tiêu của metagenomics

Mục tiêu của metagenomics là để tìm hiểu thành phần và hoạt động của

tập đoàn vi sinh vật phức tạp trong các mẫu môi trường thông qua phân tích trình tự

DNA của chúng (George et al., 2010). Mặt khác, khi có số liệu về đa hệ gen, chúng

ta có thể thực hiện hàng loạt dự án phân lập gen tùy theo mục đích nghiên cứu. Ví

dụ như phân lập những gen tham gia vào chuyển hóa các protein, vitamin, chất

béo…từ hệ vi sinh vật nghiên cứu (Nguyễn Minh Giang et al., 2015).

Một số mục tiêu cụ thể của metagenomics là: Xác định tính đa dạng phân

loài sử dụng 16S rRNA, các mẫu gen đa dạng và cây phân loài của vi sinh vật

(Sharma et al., 2012). Số liệu đó được sử dụng để theo dõi và dự đoán các biến đổi

môi trường; xác định gen hay operon mã hóa cho các enzyme cần thiết, có đặc tính

mới (như cellulases, chitinases, lipases, thuốc kháng sinh, các sản phẩm tự nhiên

16

khác…). Những enzyme này có thể được ứng dụng trong công nghiệp hoặc dược

phẩm; xác định biến thể hoặc đa dạng trong gen cho các enzyme quan trọng và thiết

kế tối ưu các điều kiện xúc tác của enzyme; xác định các cơ chế điều hòa và truyền

tín hiệu của các gen quan tâm; xác định vi khuẩn hoặc các trình tự plasmid, đánh

giá ảnh hưởng của chúng đến cấu trúc và sự đa dạng của các cộng đồng vi sinh vật.

Xác định các sự kiện chuyển gen tiềm năng hay các gen/operon cho việc thu nhận

dinh dưỡng, trung tâm trao đổi chất trung gian… Từ đó, cung cấp những hiểu biết

về tương tác giữa các sinh vật trong chuỗi và lưới thức ăn, hoặc khám phá nền tảng

thành công của vi sinh vật trong môi trường của chúng; xác định con đường trao đổi

chất để có thể thiết kế môi trường nuôi cấy tăng trưởng cho các loài vi sinh vật chưa

thể nuôi cấy được (Nguyễn Minh Giang et al., 2015).

Sử dụng công cụ tin sinh khai thác metagenome

Việc chuẩn bị mẫu metagenome để đọc trình tự rất quan trọng, nếu mẫu

không đủ sạch sẽ gây nhiễu khi đưa vào máy đọc tự động có thể gây ra sai lệch

trong kết quả. Toàn bộ DNA tách chiết được từ mẫu môi trường đủ tiêu chuẩn sẽ

được đưa vào máy đọc trình tự tự động. Sau khi đọc, máy sẽ xác lập được số lượng

lớn các trình tự đọc ngắn (short – reads). Công việc tiếp theo là sắp dãy (assembly)

các short – reads này để thu được bộ gen hoàn chỉnh. Tuy nhiên, trong quá trình xác

lập trình tự DNA của các kĩ thuật có khả năng sinh lỗi cho từng nucleotide với tỉ lệ

khoảng từ 1 % đến 2 % trên chiều dài của short - reads. Các nucleotide lỗi phải

được sửa chữa để phục vụ cho việc sắp dãy lại thành một bộ gen hoàn chỉnh. Ở

bước này, một số phần mềm như SOAPdenovo được sử dụng để lắp ráp lại bộ gen

từ các short - reads (hay “reads”) thu được trong quá trình giải trình tự gen. Phần

mềm này gồm có 6 module được dùng để 1) sửa chữa các lỗi đọc trình tự; sau đó 2)

xây dựng đồ thị de Bruijn để 3) lắp ghép các contig, rồi 4) kiểm tra lại kết quả lắp

ráp bằng cách so sánh các contig với các trình tự đọc được dùng để tạo ra nó; tiếp

đến 5) tối ưu độ bao phủ và chiều dài các contig để 6) thu nhỏ các vùng gen không

đọc được trình tự. Bằng công cụ như SOAPaligner các trình tự sau đó được đem so

sánh lại (map) với các contig của chính nó để tìm ra bao nhiêu trình tự được sử

dụng để tạo contig. PE (pair-end reads) là các trình tự mà cả hai

đầu của nó đều tương đồng với contig và mối quan hệ hai đầu này là chính xác, cho

17

độ tin cậy cao. Các trình tự mà chỉ có một đầu của nó tương đồng với contig hoặc

mối quan hệ hai đầu không chính xác thì được gọi là SE (single-end reads).

Sau khi có các contig từ metageneome, bước đầu tiên nên làm là kiểm tra chất

lượng giải trình tự, ví dụ bằng phần mềm FastQC (Qian Zhou et al., 2014); tiếp theo

loại bỏ những đoạn trình tự có chất lượng thấp và độ dài ngắn (Trimmomatics,…);

lắp ráp các tập dữ liệu với độ sâu đọc không đồng đều (IBDA-UD (Iterative De

Bruijn Graph De Novo Assembler), ….); Sau đó sử dụng các phần mềm dự đoán

gen như: Prodigal, MetaGene Annotator (MGA), FragGeneScan, Glimmer-MG,

GeneMark… để dự đoán tất cả các khung đọc mở (ORF – open reading frame) từ

các contig. Dựa trên các ORF đã được xác định, sẽ tiếp tục dự đoán bằng cách so

sánh ORF với hàng loạt các dữ liệu khác nhau như: Dữ liệu NCBI NR, MetaHIT,

Silva, GreenGene để phân tích độ đa dạng loài; dữ liệu KEGG, MetaCys để phân

loại gen vào các con đường chuyển hóa khác nhau; dữ liệu CAZy, GO, KEGG,

eggNOG, Pfam, Prk, COG, FIGfam để sắp xếp gen vào các nhóm chức năng. Nếu

nghiên cứu tập trung vào DNA và protein của metagenome thì công cụ BLASTall

(Basic Local Alignment Search Tool: http://blast.ncbi.nlm.nih.gov/Blasti) được sử

dụng rộng rãi nhất trong tin sinh học. BLAST sử dụng thuật toán tìm kiếm cục bộ

heuristic và do đó có thể phát hiện ra mối liên hệ giữa các trình tự có những sự

tương đồng riêng biệt. Có rất nhiều loại tìm kiếm khác nhau trên BLAST phục vụ

cho những mục đích khác nhau: 1) BLASTp tìm kiếm tất cả các trình tự protein

tương đồng với trình tự protein cần phân tích trong cơ sở dữ liệu protein; 2)

BLASTn tìm kiếm tất cả các trình tự nucleotide tương đồng với trình tự DNA cần

phân tích trong cơ sở dữ liệu DNA; 3) TBLASTn tìm trình tự protein tương đồng

trong cơ sở dữ liệu DNA bằng cách dịch mỗi trình tự DNA ra tất cả 6 khung đọc

mở; 4) BLASTx tìm trình tự nucleotide tương đồng trong cơ sở dữ liệu protein bằng

cách dịch trình tự nucleotide cần phân tích sang tất cả 6 khung đọc mở. Sau khi có

được các khung đọc mở cần quan tâm, sử dụng công cụ tìm kiếm trình tự amino

acid tương đồng trong BLASTp; 5) Công cụ Blastpby được sử dụng trong so sánh

các ORF với cơ sở dữ liệu NR để tiến hành phân loài. Cấp độ phân loài của mỗi

ORF được xác định bằng thuật toán dựa trên cơ sở LCA (Least Common Ancestors)

được sử dụng trong phần mềm MEGAN (MetaGenomic ANalyser). Thuật toán

18

LCA sẽ xếp trình tự vào nhóm phân loại mà cấp độ phân loại của nhóm phân loại

đó phản ánh được mức độ bảo thủ của trình tự gen. Căn cứ vào các ORF đã được

đối chiếu với chức năng và các con đường chuyển hóa để lựa chọn các gen hay

nhóm quan tâm. Trình tự các axit amin được dịch từ các ORF sẽ được sử dụng để

dự đoán cụ thể về cấu trúc và các đặc tính của protein (trung tâm hoạt động, cơ chế

xúc tác enzyme, khả năng chịu nhiệt, khả năng chịu kiềm…),… bằng phần mềm

Phyre 2 (http://www.sbg.bio.ic.ac.uk/phyre2), Expasy (http://www.expasy.org)…

Hoặc có thể xây dựng mô hình chuyển hóa các chất giữa các sinh vật trong môi

trường bằng các công cụ Pathway Tools, COBRA, Model SEED ((Nguyễn Minh

Giang et al., 2015).

Phương pháp này đã được áp dụng để phân tích quần xã vi sinh vật trong rất

nhiều môi trường như đại dương, đất, dải san hô, xác cá voi, suối nước nóng và các

quần xã vi sinh vật liên kết với nhiều cơ thể sống khác nhau như người, mối, rệp,

giun (Kennedy et al., 2011).

Ứng dụng của metagenomics

Metagenomics cung cấp một nguồn tài nguyên không giới hạn cho sự phát

triển các gen mới, enzyme, các sản phẩm tự nhiên, các hợp chất hoạt tính sinh học

và các chế phẩm sinh học có thể ảnh hưởng đáng kể đến các ứng dụng công nghiệp

và công nghệ sinh học (Nazir., 2016).

Cellulases, lipases, xylanases, amylases, proteases, và rất nhiều enzyme có

tầm quan trọng công nghiệp được sản xuất thông qua metagenomics (Nazir., 2016).

Ngoài ra, một số nhà khoa học cũng cho rằng có thể khai thác các chất kháng sinh

mới nhờ ứng dụng kỹ thuật metagenomics. Các sản phẩm tự nhiên từ vi sinh vật

biển như chất hoạt động bề mặt (Biosurfactants) là chất thay thế tiềm năng cho chất

hoạt động bề mặt tổng hợp (Surfactants) trong một vài quá trình công nghiệp như

bôi trơn, làm ướt, làm mềm, cố định thuốc nhuộm, làm nhũ tương, ổn định độ phân

tán, tạo bọt, ngăn ngừa tạo bọt cũng như trong công nghiệp thực phẩm, y sinh và

dược phẩm, sửa chữa sinh học các điểm bị ô nhiễm bởi các chất hữu cơ hoặc vô cơ

(Nazir., 2016). Metagenomics được sử dụng để tạo thư viện DNA của các mẫu

đất/nước bị ô nhiễm dầu, sau đó sàng lọc các dòng sinh chất hoạt động bề mặt

(Cynthia et al., 2013). Isabel et al. (2014) báo cáo tiềm năng của phương pháp

19

metagenomics để nhận dạng và làm sáng tỏ các gen mới trong các môi trường ít

được nghiên cứu và cho thấy triển vọng rộng lớn hơn vào quá trình phân hủy

hydrocacbon trong các bể chứa dầu. Gần đây các nhà nghiên cứu đã nhận dạng các

gen và các con đường trao đổi chất của chúng liên quan đến phân hủy phenol và các

hợp chất vòng thơm khác trong các mẫu bùn từ một hệ thống xử lý nước thải nhà

máy lọc dầu, sử dụng phương pháp metagenomics để nắm bắt sự đa dạng chức năng

to lớn trong cộng đồng vi sinh vật.

1.3. Chất ức chế protease (PIs)

1.3.1. Sơ lược protease

Protease là một trong những họ enzyme phổ biến và đa dạng nhất được biết

đến và có mặt trong tất cả các sinh vật sống, bao gồm virus, vi khuẩn, cổ khuẩn,

nấm, thực vật và động vật. Protease đóng nhiều vai trò quan trọng trong các quá

trình của tế bào, bao gồm đông máu, tiêu hóa thức ăn, tăng trưởng và di chuyển tế

bào, sắp xếp mô, phát triển hình thái, viêm, tăng trưởng khối u và di căn, đông máu,

kích hoạt zymogen, giải phóng hormone và các peptide có hoạt tính dược lý từ các

protein tiền thân và vận chuyển các protein bài tiết qua màng (Sapna., 2013).

Về phân loại protease được chia nhỏ thành hai nhóm chính, tức là

exopeptidase và endopeptidase, tùy thuộc vào vị trí tác dụng của chúng. Nói chung,

protease đặc trưng là endopeptidase hoặc exopeptidase. Endopeptidase tách liên kết

trong protein và thường rất đặc hiệu cho các chuỗi axit amin cụ thể. Exopeptidase

tách một axit amin duy nhất từ đầu cuối của protein và ít đặc hiệu hơn đối với axit

amin đang bị phân cắt. Exopeptidase là những loại tách ra từ C-terminator

(carboxypeptidase), N-terminus (aminopeptidase) hoặc cả hai termini (dipeptidase).

Protease cũng được phân loại theo loại xúc tác của chúng thành peptidase aspartic,

cysteine, glutamic, serine và threonine, dựa trên dư lượng axit amin chức năng có

tại vị trí hoạt động. Serine protease tạo thành lớp phong phú nhất bao gồm khoảng

1/3 tổng số protease, được công nhận là yếu tố quan trọng trong việc kiểm soát

nhiều con đường liên quan đến đông máu, tiêu sợi huyết, chuyển mô liên kết, cân

bằng nội môi, thụ tinh và phản ứng viêm, tiếp theo là peptidase metallico-, cysteine,

aspartic và threonine (Ana et al., 2010; Sabotic & Kos., 2012).

20

Cơ chế phân giải protein: Protease cũng được đặc trưng bởi cơ chế hoạt động

của chúng; đó là các axit amin có liên quan đến vị trí xúc tác của enzyme. Vị trí xúc

tác chứa các axit amin đóng vai trò trực tiếp trong quá trình thủy phân liên kết

peptide. Quá trình này đòi hỏi một nucleophile để bắt đầu phản ứng, có thể là chuỗi

bên axit amin hoạt động hoặc phân tử nước. Trong các giai đoạn sau của quá trình

phân giải protein, hai phần của protein bị thủy phân được giải phóng và vị trí hoạt

động của protease trở lại trạng thái ban đầu, sẵn sàng liên kết một chất nền khác để

phân giải protein. Các protease thường được nhóm thành bốn nhóm chính dựa trên

vị trí hoạt động của chúng: serine protease, cysteine protease (thiol), aspartic

protease và metallicoprotease. Serine protease và cysteine (thiol) có một axit amin

trong vị trí hoạt động tấn công nucleophilic ban đầu, trong khi aspartic protease và

metallicoprotease kích hoạt một phân tử nước để thực hiện tấn công nucleophilic

ban đầu (Ritchie., 2019) .

1.3.2. Chất ức chế protease và phân loại

Chất ức chế protease (PI) là phân tử ngăn chặn hoạt động của protease và

thường hoạt động trên protease có cơ chế hoạt động tương tự. Các chất ức chế

protease (PIs) có thể ở dạng protein, peptide hoặc các phân tử nhỏ (Hình 1.6). Các

chất ức chế protease trong tự nhiên thường là protein hoặc peptide.

Hình 1.6. Ba chất ức chế protease có sẵn trên thị trường. PMSF là một phân tử nhỏ;

E-64 là một phân tử giống như peptide; Aprotinin là một protein nhỏ.

(Nguồn: Labome.com; Sigmaaldrich.com)

Phân loại chất ức chế protease

21

Các chất ức chế protease có thể được phân loại theo nguồn gốc (vi sinh vật,

nấm, thực vật, động vật), theo cấu trúc của chúng (sơ cấp và ba chiều), hoặc theo

protease mà chúng ức chế (rộng, đặc hiệu) và cơ chế phản ứng (cạnh tranh, không -

cạnh tranh). PIs thường được phân loại theo nhóm protease mà chúng ức chế (thuốc

ức chế protease aspartic, cysteine hoặc serine). Ngày nay, các chất ức chế protease

thường được phân loại thành hai nhóm chính (1) Các chất ức chế phân tử nhỏ và (2)

Các chất ức chế protein (Sapna., 2013).

Chất ức chế phân tử nhỏ

Các chất ức chế phân tử nhỏ (SMIs) bao gồm các hợp chất tự nhiên như

pepstatin, bestatin và amastatin, và một số chất ức chế tổng hợp được tạo ra trong

phòng thí nghiệm. Vì vậy, rất khó để cung cấp bất kỳ phân loại tự nhiên, không

giống như các peptidase và chất ức chế protein và một loạt các định danh mới đã

được mô tả. Theo đó, mỗi SMI được gắn một mã định danh bao gồm một chữ J ban

đầu theo sau là một số có năm chữ số. Ví dụ, pepstatin là J00095 và ethylene

diamine tetraacetic acid là J00149 (Rawlings & Barrett, 2011).

SMI là chất ức chế không phải là protein, bao gồm peptide và chất ức chế

tổng hợp thường có nguồn gốc vi sinh vật và là peptide trọng lượng phân tử thấp.

Nhiều loại trong số chúng đã được tổng hợp trong phòng thí nghiệm; tuy nhiên,

những loại xuất hiện tự nhiên đã được tách chiết từ vi khuẩn và nấm (Rawlings.,

2010). Các chất ức chế phân tử nhỏ đã được chứng minh là hữu ích và được sử

dụng là thuốc thử trong phòng thí nghiệm như retropepsin của virus HIV; thrombin,

điều hòa cầm máu và chống đông máu; dipeptidyl-peptidase IV, có liên quan đến

bệnh tiểu đường loại 2; γ-secretase, có liên quan đến bệnh Alzheimer; renin và

angiotensin kiểm soát huyết áp… (Sapna., 2013).

Trong số các chất ức chế phân tử nhỏ có nguồn gốc vi khuẩn và nấm,

peptidyl aldehydes như leupeptin và antipain, hexapeptide pepstatin và

epoxysuccinyl peptide E-64 và các chất tương tự của chúng đã được nghiên cứu

như là chất chống ung thư. Chất ức chế đặc hiệu thiol-protease, E-64, ban đầu được

phân lập từ Aspergillus japonicus đã được nghiên cứu rộng rãi như một tác nhân

chống ung thư tiềm năng trong nuôi cấy tế bào và mô hình động vật. Sau đó, các

dẫn xuất của E-64 tiếp tục được ứng dụng trong điều trị ung thư và các bệnh khác

(Frlan & Gobec, 2006).

22

Một vài ví dụ về việc sử dụng các chất ức chế phân tử nhỏ của vi sinh vật

như các tác nhân chống côn trùng gây hại cây trồng, ví dụ: Các chất ức chế

aminopeptidase của Actinomycetes amastatin và bestatin chống lại bọ bột đỏ

(Tribolium castaneum) (Oppert et al., 2011), thuốc ức chế protease aspartic A từ

Actinomycetes chống lại đậu đũa (Callosobulusus). Thuốc ức chế protease serine và

cysteine leupeptin từ Actinomycetes chống lại giun bắp phương Tây (Diabrotica

virgifera) và E-64, thuốc ức chế protease cysteine từ Aspergillus japonicus chống

lại bọ cánh cứng Colorado hại khoai tây (Leptinotarsa decemlineata) (Sapna.,

2013).

Trong quá trình thu hồi protein tái tổ hợp, các chất ức chế phân tử nhỏ có thể

được thêm vào môi trường nuôi cấy để ức chế hoạt động phân giải protein của sinh

vật chủ thường thuộc loại serine và aspartic (Sabotic et al., 2012). Một số vi khuẩn

tổng hợp peptide và dẫn xuất của peptide là chất ức chế peptidase hiệu quả, thường

là những chất ảnh hưởng đến peptidase từ các họ khác nhau. Được biết đến nhiều

nhất trong số này là leupeptin (N-acetyl-L-leucyl-L-leucyl-D, L-argininaldehyd),

ban đầu được phân lập từ Streptomyces và ức chế nhiều loại serine, cysteine và

threonine trypsin, PACE4 calpain, clostripain và hoạt động giống như trypsin của

proteasome. Các chất ức chế phân tử nhỏ khác được sản xuất bởi Actinomycetes bao

gồm bestatin và amastatin (chất ức chế aminopeptidase); tyrostatin, chất ức chế

sedolisin của họ S53 (Sapna., 2013).

Chất ức chế protein (PPIs)

Các chất ức chế protein của protease có mặt khắp nơi và đã được phân lập từ

nhiều loài thực vật, động vật và vi sinh vật. Trước đây, PPIs được nhóm theo loại

protease mà chúng ức chế. Sau đó, chúng được phân loại là chất ức chế cysteine,

serine, aspartic và metallicoprotease. Ngoại trừ macroglobulin huyết tương, ức chế

protease của tất cả các lớp, các chất ức chế protein riêng lẻ chỉ ức chế các protease

thuộc một lớp cơ học duy nhất. Trong số các chất ức chế này, nghiên cứu rộng rãi

nhất là các chất ức chế protease serine. Các chất ức chế protein của protease aspartic

tương đối hiếm gặp và chỉ được tìm thấy ở một vài địa điểm chuyên biệt (Sapna.,

2013). Rawllings et al. (2004) đã phân loại PPIs theo sự tương đồng trong trình tự

axit amin. Phân loại này có 48 họ PI được nhóm lại trong 26 loại siêu họ

(superfamilies) có liên quan trên cơ sở cấu trúc của chúng. Một số họ tiêu biểu được

tóm tắt trong Hình 1.7.

23

Việc phân loại các chất ức chế peptidase protein liên tục được sửa đổi bởi cơ

sở dữ liệu MEROPS và hiện tại các chất ức chế được nhóm thành 71 họ dựa trên so

sánh các trình tự protein bao gồm 17451 trình tự ức chế. Những họ này có thể được

nhóm lại thành 39 nhóm dựa trên sự so sánh về cấu trúc bậc ba. Họ và nhóm của

một số chất ức chế peptidase protein được mô tả trong Phụ lục 3. Mỗi nhóm, họ và

chất ức chế peptidase đặc trưng hóa học được cung cấp một định danh duy nhất.

Một định danh họ bao gồm chữ cái “I” theo sau là một số và số nhận dạng nhóm hai

chữ cái bắt đầu bằng chữ “I” hoặc chữ “J” (Rawlings., 2010).

Phân bố các họ giữa các sinh vật: Hơn 634 loài ức chế peptidase protein

được phân phối trên khắp các sinh vật từ virus đến động vật. Trong số 71 họ, có 27

họ có nguồn gốc vi sinh vật và nấm (Bảng 3.2, Phụ lục 3). Trong đó, 7 họchỉ có

trong vi khuẩn (I10, I16, I36, I38, I57, I58, I69) và 5 họchỉ có trong nấm (I34, I48,

Chất ức chế protease

I66, I79, I85) (Rawlings., 2010).

Mol wt: 3-3.5 kDa; Ức chế: Trypsin, chymotrypsin,

Mol wt: 4.2 kDa; Ức chế: Carboxy- -peptidase

Mol wt: 39-43kDa; Ức chế: Trypsin, chymotrypsin , cathepsin

Mol wt: 8 kDa; Ức chế: Trypsin, hymotrypsin, elastase

Mol wt: 27 kDa; Ức chế: Trypsin, chymotrypsin, cathepsin D

Kininogen

Stefin

Cystatin

Phytostatin

Mol wt: 13.4-14.4 kDa Ức chế: Cysteine

Mol wt: 11 kDa Ức chế: Papain; cathepsin B, H, L

Mol wt: 39-43 kDa Ức chế: Trypsin; chymotrypsin; cathepsin

Mol wt: 17- 19 kDa Ức chế: Papain; ficin

Aspartyl Kunitz Cystatin Serpin Bowman Birk Metallocarboxyl peptide

Hình 1.7. Một vài họ PPI quan trọng

(Nguồn: Shamsi et al., 2016)

24

Siêu họ Serpin: là siêu họ lớn nhất và phổ biến nhất của PPIs. Serpin có

nguồn gốc thực vật đã được tách chiết từ hạt ngũ cốc (Habib & Khalid., 2007).

Serpin có vai trò kiểm soát chính của các quá trình như đông máu và viêm, và trở

thành mục tiêu của nhiều nghiên cứu y học (Khunaizi et al., 2002). Một số loại

trong họ serpin ức chế mạnh trypsin và chymotrypsin, ngoài ra, chúng cũng ức chế

thrombin, kallikrein, yếu tố VIIa và yếu tố Xa. Vài loại serpin khác ức chế

chymotrypsin, cathepsin G và có axit glutamic, lysine hoặc arginine tại vị trí P1

(Roberts et al., 2003).

Họ Kunitz: Các thành viên của họ này chủ yếu ức chế các protease serine,

nhưng cũng có thể ức chế các protease khác (Heibges el al., 2003). Các chất ức chế

Kunits thường có khối lượng phân tử 18 - 22 kDa; có hai cầu nối disulfide và một vị

trí phản ứng (Habib & Khalid., 2007). Các thành viên của họ này bao gồm một

chuỗi peptide nhỏ chứa từ 28 đến 30 axit amin có phân tử khối 3.0 - 3.5 kDa (Oliva

& Sampaio., 2008). Hiểu biết về cấu trúc của các chất ức chế họ Kunitz rất hữu ích

để nghiên cứu các cơ chế đằng sau tính đặc hiệu của chúng đối với các khối u, các

yếu tố đông máu và viêm, và vùng chịu trách nhiệm cho hoạt động sinh học của nó

(Oliva & Sampaio., 2009).

Siêu họ Cystatin: bao gồm 4 họ ức chế hoạt động của cysteine và thiol

proteinase (Habib & Khalid., 2007). PI Thiol đóng một vai trò quan trọng trong

kiểm soát tất cả các mô sống bởi chúng có khả năng ức chế cathepsin và nhiều đặc

tính sinh học khác (Qadeer et al., 2014).

Họ ức chế Bowman Birk (BBI): Họ này được đặt theo tên của nhà khoa học

đã phát hiện và mô tả chất ức chế đầu tiên của họ này từ đậu tương, (hai nhà khoa

học D.E. Bowman và Y. Birk). Các chất ức chế thuộc họ này có trọng lượng phân

tử khoảng 8 kDa và có vị trí hoạt động đầu tiên thường đặc hiệu cho elastase,

trypsin và chymotrypsin (Qi et al., 2005). BBI đã được báo cáo là làm giảm sự tăng

sinh của các tế bào ung thư vú MCF7 (Palavalli et al., 2012).

Họ ức chế peptidase metallicoparboxy: Chúng là những chất ức chế peptide

nhỏ có trọng lượng phân tử khoảng 4.2 kDa. Chúng ức chế cạnh tranh mạnh đối với

phổ rộng của carboxypeptidase từ vi khuẩn và động vật, nhưng không thể ức chế

25

carboxypeptidase serine từ nấm men và thực vật. Chúng được tìm thấy trong các mô

của củ khoai tây trong quá trình phát triển, cùng với các chất ức chế khoai tây I và II

của serine PI (Shamshi et al., 2016).

Họ Aspartyl PI: Các thành viên của họ này đã được tìm thấy trong hoa

hướng dương, lúa mạch, thảo quả (Cynara cardunculus) và củ khoai tây. Chất ức

chế cathepsin D, có trọng lượng phân tử khoảng 27 kDa và ức chế các protease

serine, ví dụ như trypsin và chymotrypsin cùng với aspartyl protease cathepsin D,

nhưng không ức chế pepsin, cathepsin E và rennin, tất cả đều là aspartyl protease.

Pepstatin, một chất ức chế mạnh mẽ protease aspartyl đã được chứng minh là ức chế

sự phân giải protein của enzyme amylase và lipase của bọ cánh cứng Colorado

(Lptinotarsa decemlineata) (Shamshi et al., 2016).

1.3.3. Cơ chế hoạt động của PIs

Chất ức chế protease có thể hoạt động theo nhiều cách khác nhau để ức chế

hoạt động của protease. Các chất ức chế này có thể được phân loại theo loại

protease mà chúng ức chế và cơ chế mà chúng ức chế các enzyme đó. Hiểu rõ cơ

chế ức chế protease của PIs sẽ giúp cho quá trình phát triển các thuốc ức chế

protease như một chiến lược điều trị.

Cơ chế ức chế protease của PIs có thể được khái quát làm 2 phương thức là

ức chế thuận nghịch (Reversible inhibition) và ức chế bất thuận nghịch (Irreversible

inhibitor) (Sapna.., 2013; Đỗ Quý Hai., 2013).

Các chất ức chế thuận nghịch bao gồm các chất ức chế cạnh tranh

(Competitive inhibitors), ức chế không cạnh tranh kiểu thứ I (Non-competitive

inhibitor) và ức chế không cạnh tranh kiểu thứ II (Uncompetitive inhibitor) (Mai

Xuân Lương., 2005).

Ức chế cạnh tranh: Phần lớn các chất ức chế protease có tính cạnh tranh.

Trong trường hợp ức chế cạnh tranh là cơ chất và chất ức chế đều tác dụng lên trung

tâm hoạt động của enzyme, chất ức chế thay thế chỗ của cơ chất ở enzyme. Khi cơ

chất dư thừa, nồng độ chất ức chế thấp thì có thể loại bỏ tác dụng của chất ức chế,

còn nồng độ cơ chất thấp và nồng độ chất ức chế cao thì lại có tác dụng ức chế hoàn

toàn (Hình 1.8a). Cơ chế ức chế này được nghiên cứu kỹ lưỡng ở họ serine protease

26

inhibitors. Các chất ức chế canonical (khóa và chìa khóa) liên kết với các mục tiêu

của chúng theo cách giống như cơ chất để tạo thành phức hợp gần như “Michaelis”,

một nguyên tắc được sử dụng bởi các chất ức chế protease serine (Sermilvan et al.,

2001). Những chất ức chế này bao gồm các chất ức chế họ Kazal, Kunitz và

Bowman-Birk (Sapna., 2013). Một ví dụ về chất ức chế cạnh tranh là aprotinin, ức

chế nhiều loại protease thuộc họ protease serine. Các chất ức chế cạnh tranh thường

có cấu trúc tương tự như trạng thái chuyển tiếp của cơ chất tự nhiên. Trạng thái

chuyển tiếp của cơ chất là trạng thái trung gian của cấu trúc thường liên kết chặt chẽ

nhất với enzyme. Do đó, các hợp chất bắt chước cấu trúc này liên kết với enzyme có

độ bền cao hơn cơ chất (ở trạng thái ban đầu), và do đó phản ứng enzyme thông

thường không thể tiến hành. Một ví dụ về loại tương tự trạng thái chuyển tiếp này là

LP-130 (Hình 1.8b), một chất ức chế protease HIV-1.

E + S  ES → E + P

+

I

EI

(a) (b)

Hình 1.8. Ức chế cạnh tranh (Competitive inhibitors)

(a): Mô tả cơ chế, trong đó S (cơ chất); I (chất ức chế); E (Enzyme)

(Nguồn: Đỗ Quý Hai., 2013)

(b): Cấu trúc tinh thể của protease HIV-1 (màu xanh lá cây) liên kết với LP-130,

một chất ức chế trạng thái chuyển tiếp (1ODY) (màu đỏ) và dư lượng của aspartic

protease (màu vàng).

(Nguồn: Ritchie., 2019)

Ức chế không cạnh tranh kiểu thứ I (Non-competitive inhibitor): Các chất ức

chế không cạnh tranh kiểu thứ I liên kết với protease có ái lực tương tự, bất kể sự có

mặt của cơ chất liên kết. Các phân tử này ức chế hoạt động protease thông qua cơ

chế allosteric. BBI, một chất ức chế trypsin từ đậu nành (Prasad et al., 2010) và

27

aminoglycoside, chất ức chế protease yếu tố gây bệnh than ở người (anthrax lethal

factor) (Kuzmic et al., 2006) là những ví dụ về các chất ức chế không cạnh tranh

kiểu thứ I.

Ức chế không cạnh tranh kiểu thứ II (Uncompetitive inhibitor): Các chất ức

chế không cạnh tranh kiểu thứ II liên kết với protease chỉ khi protease đã liên kết

với một cơ chất mà không liên kết với enzyme tự do (Hình 1.9). Các chất ức chế

không cạnh tranh kiểu thứ II đã được xác định đối với protease HIV-1 (Sperka et

al., 2005) và proteinase NS2B-NS3 của virus West Nile (Johnston et al., 2007).

E + S  ES → E + P

+

I

ESI

Hình 1.9. Cơ chế ức chế không cạnh tranh kiểu thứ II

(Nguồn: Đỗ Quý Hai., 2013)

Ức chế bất thuận nghịch (Irreversible inhibitor): Các chất ức chế bất thuận

nghịch là các chất thường tạo liên kết đồng hóa trị với enzyme hoặc phá hủy các

nhóm chức năng cần thiết cho hoạt tính của enzyme hay tạo ra các quá trình kết hợp

không đồng hóa trị bền. Chất ức chế loại này hoạt động như một cơ chất, sau đó sử

dụng các nhóm xúc tác của enzyme để bẫy và ức chế enzyme. Chất ức chế α-2-

macroglobin (α2M) và họ hàng của nó chịu trách nhiệm làm sạch các protease dư

thừa từ huyết tương (Sapna., 2013).

Serpins là một họ thuộc nhóm ức chế bất thuận nghịch phổ biến của các

protease serine. Phần lớn các serpin có hoạt tính ức chế các serin protease nhờ tác

dụng của một trung tâm hoạt động (RCL) nằm ở trong chuỗi polypeptid của chúng.

Trong họ này, anti thrombin III (AT III) có vai trò ức chế rất to lớn. AT III có khả

năng ức chế đa số các serine protease (tức là các yếu tố đông máu đã được hoạt hoá)

trừ yếu tố Vila. Tác dụng ức chế này đặc biệt mạnh với thrombin (lia). Hiệu lực ức

chế càng được tăng lên gấp rất nhiều lần khi có mặt của heparin, vì vậy AT III còn

28

được coi như là một đồng yếu tố của heparin. Cơ chế tác động của AT III là: Trên

bề mặt của AT III có vị trí gắn kết với vị trí hoạt động cùa serin protease cũng như

của heparin. Ở trạng thái hoạt hoá sự kết hợp AT III với serin proteasẹ và heparin

được tạo ra. Như vậy AT III đã tạo điều kiện đê heparin gắn với các serin protease,

qua đó ức chê tác dụng của serin protease (như Xlla, xia, IXa, Xa và lia). Do tính

chất mạnh mẽ và không thể đảo ngược của cơ chế này, serpin có chức năng bảo vệ

các tế bào và mô khỏi hoạt động phân giải protein không mong muốn. Những loại

chất ức chế này, lợi dụng hoạt động xúc tác của protease để bẫy và ức chế enzyme,

là chất ức chế hiệu quả và mạnh mẽ, chịu trách nhiệm bảo vệ sinh vật khỏi hoạt

động phân giải protein bất thường từ một loạt các protease. Vì vậy, chúng có xu

hướng tương đối không đặc hiệu (Sapna., 2013).

Hình 1.10. Serpin ức chế protease serine bằng cách liên kết một vòng

trung tâm phản ứng trong vị trí hoạt động, tạo thành phức chất cộng

hóa trị với enzyme, trải qua một sự thay đổi lớn về hình dạng và làm

biến dạng không thể đảo ngược vị trí hoạt động của protease.

Nguồn: (Farady & Craik, 2010).

1.3.4. Ứng dụng của chất ức chế protease

Ngày nay, do bản chất tương tác đặc hiệu cụ thể nên PIs đã trở thành một

công cụ có giá trị trong y học, nông nghiệp và thực phẩm (Shamsi et al., 2016).

PIs trong y học

PIs có vai trò quan trọng trong y học vì sự phân giải protein có trong hầu hết

các quá trình sinh học. Sự phân giải protein không được kiểm soát ảnh hưởng đến

các quá trình sinh lý như sự phát triển, sự tăng sinh và sự chết tế bào, sao chép

29

DNA, tu sửa mô, cầm máu (đông máu), chữa lành vết thương và đáp ứng miễn dịch.

Mất kiểm soát phân giải protein đóng vai trò quan trọng trong ung thư và các bệnh

tim mạch, viêm, thoái hóa thần kinh, các bệnh do vi khuẩn, virus và ký sinh trùng

(Christopher & Clifford., 2010). Protease thường là mục tiêu cho các can thiệp trị

liệu (Turk., 2006; Murphy., 2008). Aprotinin, một chất ức chế mạnh plasmin,

trypsin và kallikrein, đã được sử dụng để điều trị kháng phân hủy sợi huyết

(antifibrinolytic) (Waxler & Rabito., 2003). Can thiệp điều trị bằng thuốc PIs bao

gồm enzyme ức chế can thiệp angiotensin (ACE) để điều trị tăng huyết áp

(Abbenante & Fairlie., 2005), PIs aspartyl protease HIV để ngăn chặn sự phát triển

của AIDS và các chất ức chế proteasome cũng đã được ứng dụng trong điều trị

nhiều u tủy (Orlowski., 2004).

Một vài chất ức chế proteasome (ví dụ, lactacystin từ Streptomyces

lactacystinaeus) đã được báo cáo là cản trở sự sao chép của một số virus, bao gồm

virus cúm, virus herpesđơn type1, virus paramyxo và virus rhabdo, cũng như virus

cytomegalo (Kaspari &Bogner., 2009). Một chất ức chế peptide mạnh của protease

HIV-1 có nguồn gốc vi khuẩn (ATBI) đã được tìm thấy trong Bacillus sp.

(Vathipadiekal et al., 2010). Một vài chất ức chế virus cytomegalo đã được mô tả có

nguồn gốc vi khuẩn (Streptomyces) và nấm (Cytonaema) (Anderson et al., 2009;

Stoeva & Efferth., 2008). PIs được phân lập từ Streptomyces chromofuscus có hoạt

tính kháng lại virus cúm A/ Rostock / 34 (H7N7) (Angelova et al., 2006). Sự sinh

sản của virus cytomegalo và virus cúm đã bị ức chế hiệu quả bởi PIs của các loài

Streptomyces (Shamsi et al., 2016).

Theo Shamsi et al. (2016) báo cáo đã có khoảng 278 PIs được nghiên cứu

trong trị liệu bệnh của con người. Các PIs này được sử dụng trong điều trị các bệnh

như (1) Tim mạch: ví dụ, Antithrombin: chất ức chế thrombin và yếu tố đông máu

Xa, là thành viên của họ serpin và được biết là ức chế sự phát triển khối u và tạo

mạch máu (Winckers et al., 2013); (2) Ung thư: Matrix Metallo-Proteases (MMPs)

được báo cáo để tiêu diệt các mô viêm dẫn đến các bệnh viêm mãn tính. MMPs

cũng làm giảm collagen màng tế bào dẫn đến di căn tế bào ung thư (Dufour el al.,

2013); (3) loãng xương: Các PIs cysteine như leupeptin có thể ức chế sự tái hấp thu

xương trong nuôi cấy mô và sau đó trong các tế bào hủy xương bị cô lập. Peptide

30

aldehydes như leupeptin và antipain là các cysteine PIs hoạt động sớm nhất chống

lại trypsin, peptide epoxit (E64) và peptidyl diaometyl; (4) AIDS: cho đến nay, 9

PIs khác nhau đã được sử dụng trong điều trị lâm sàng bệnh nhân HIV/AIDS. PIs

ức chế hoạt động của Protease Receptor HIV-1 (PR) bằng cách ngăn chặn sự phân

tách trong Gag và Gag-Pol dẫn đến sản xuất các hạt virus không độc (la Porte.,

2009; Naggie & Hicks., 2010; Sekar et al., 2010). Ngoài những nghiên cứu sử dụng

PIs trong điều trị các bệnh trên, PIs còn được nghiên cứu trong điều trị viêm thấp

khớp và viêm do vi khuẩn gây ra (Haq et al., 2010).

PIs trong nông nghiệp

Các phương pháp bảo vệ cây trồng hiện nay phụ thuộc chủ yếu vào việc sử

dụng thuốc trừ sâu hóa học. Việc sử dụng độc quyền thuốc trừ sâu hóa học sẽ làm

mất cân bằng giữa sâu bệnh và các loài ăn thịt tự nhiên, và thường có lợi cho sâu

bệnh. Để hạn chế tác hại của các phân tử tổng hợp này đối với môi trường và sức

khỏe con người, kỹ thuật di truyền thực vật đã được đề xuất như là một giải pháp

thay thế để tạo ra các cây kháng sâu bệnh. Trong số các protein có tác dụng diệt côn

trùng có nguồn gốc từ thực vật, các chất ức chế protease nổi lên như một chiến lược

thú vị để kiểm soát côn trùng gây hại (Lawrence & Koundal, 2002).

Các PIs thực vật là các protein có trọng lượng phân tử thấp, chiếm gần 10 %

tổng hàm lượng protein trong thực vật. Chúng được tích lũy chủ yếu trong các mô

lưu trữ nhưng cũng có thể tìm thấy trong lá; ví dụ như chúng phản ứng với sự tấn

công của côn trùng và VSV gây bệnh xâm nhập (Jongsma & Beekwilder., 2011).

Các PIs đã thu được sự chú ý đặc biệt khi chúng đóng một vai trò quan trọng trong

nông nghiệp như thuốc trừ sâu sinh học, thuốc diệt nấm, kháng nấm và kháng

khuẩn. Một số chất ức chế trypsin và chymotrypsin gây ức chế sự phát triển của

nấm và vi khuẩn đã được báo cáo trước đây (Kim et al., 2005). PIs thường điều hòa

các prophinase nội sinh và cũng có chức năng như các tác nhân bảo vệ thực vật

ngăn chặn côn trùng và các protease của vi sinh vật (Kim et al., 2009). Khả năng

phòng thủ của các PIs thực vật dựa vào sự ức chế protease tiết ra bởi các vi sinh vật,

làm giảm các axit amin cần thiết cho sự phát triển của chúng. Ngoài vai trò kháng

lại VSV gây hại thực vật, PIs còn được biết là cải thiện chất lượng dinh dưỡng của

thực phẩm (Lawrence & Koundal., 2002).

31

Các PIs đóng một vai trò quan trọng trong tự nhiên, chúng bảo vệ cây trồng

chống lại côn trùng ăn thực vật. Các chất ức chế protease như protein phòng thủ

được hỗ trợ bởi tính đặc hiệu của chúng chống lại các enzyme từ côn trùng gây hại

(Franco et al, 2002). Tác dụng diệt côn trùng của các chất ức chế serine và cysteine

protease đã được nghiên cứu bằng các thí nghiệm kết hợp chế độ ăn uống hoặc bằng

các nghiên cứu ức chế in vitro. PIs cản trở quá trình tiêu hóa, làm giảm sự tăng

trưởng và phát triển của côn trùng gây hại (Annadana et al., 2002; Oppert et al,

2003).

PIs còn được biết đến như là một trong những ứng cử viên chính có hoạt tính

ức chế cao sâu bệnh (Lawrence & Koundal., 2002). Một vài chất ức chế protease

thuộc loại Kunitz đã được chứng minh chống lại các protease midgut từ sâu bertha

armyworm (BAW; Mamestra configurata) và sâu bướm rừng (FTC; Malacosoma

disstria), sâu hại của cây dương xỉ và cây lá kim (Major & Constabel., 2008). Chất

ức chế protease biểu hiện trong cây chuyển gen có mức độ kháng sâu bệnh cao hơn

so với cây thường. Các gen ức chế protease đã được sử dụng để tạo ra cây trồng

biến đổi gen được đưa vào các chương trình quản lý dịch hại tổng hợp (Haq et al.,

2004; Lawrence & Koundal., 2002). Một số chất ức chế serine và cysteine protease

đã được biểu hiện trong cây chuyển gen để tăng cường khả năng chống lại bướm

cánh cứng (Lepidoptera) (Falco &Silva-Filho., 2003) và bọ cánh cứng (Coleoptera)

(Alfonso-Rubi et al., 2003).

1.3.5. Tình hình nghiên cứu PIs từ vi sinh vật liên kết hải miên trong và ngoài nước

Tình hình nghiên cứu ngoài nước

Mặc dù PIs có thể được tìm thấy từ nhiều nguồn khác nhau trên cạn (ví dụ,

VSV, thực vật, động vật), có một vài nghiên cứu về PIs từ môi trường biển, đặc biệt

là từ VSV liên kết hải miên đã được báo cáo. Các nghiên cứu gần đây cho thấy các

chất ức chế protease tiềm năng đã được phân lập từ VSV liên kết hải miên (Bảng

1.2). Các chất chiết xuất từ vi khuẩn liên kết hải miên biển Caribbean thể hiện hoạt

tính ức chế các protease khác nhau như cathepsin B, rhodesain, falcipain-2. Ngoài

ra, các chất chiết xuất thô này cho thấy hoạt tính điều hòa miễn dịch thông qua sự

kích hoạt giải phóng cytokine bởi các tế bào đơn nhân máu ngoại biên của con

32

người (Tabares et al., 2011). Trong một nghiên cứu khác, các teromycin chiết xuất

từ Streptomyces axinellae liên kết với hải miên Axinellae polypoides cũng ức chế

các protease khác nhau như rhodesain, falcipain-2, cathepsin-L, cathepsin-B,

SARS-CoV-PLpro (Pimentel et al., 2011). Hơn nữa, các chất chiết xuất từ vi khuẩn

liên kết hải miên khác (ví dụ, Jasis sp., Plakortis nigra, Jasis stellifera,

Xestospongia testudinaria, Aplysina aerophoba) đã cho thấy hoạt tính ức chế

protease chống lại subtilisin, thermolysin cũng như protease từ Escherichia coli,

Staphylococcus aureus, Pseudomonas aeruginosa (Ramadan et al., 2012; Wahyudi

et al., 2010; Nurhayati et al., 2006).

Bảng 1.2. Chất ức chế protease từ vi sinh vật liên kết hải miên

Hợp chất

Vi khuẩn

Ức chế protease và hoạt tính

Hải miên

Tác giả

Chiết xuất thô

Nocardioides sp.

Rhodesain (ức chế 40 ± 1 %)

Chiết xuất thô

Agrococcus jenensis

Cathepsin B (ức chế 41 ± 1 %) Falcipain-2 (ức chế 44 ± 2 %)

Chiết xuất thô

Falcipain-2 (ức chế 42 ± 2 %)

Micromonospora coxensis

Chiết xuất thô

Rhodesain (ức chế 52 ± 1 %)

Saccharopolyspora shandongensis

Chiết xuất thô

Rhodococcus sp.

Cathepsin L (ức chế 44 ± 4 %)

Hải miên biển Caribbean Hải miên biển Caribbean Hải miên biển Caribbean Hải miên biển Caribbean Hải miên biển Caribbean

Tabares et al., 2011 Tabares et al., 2011 Tabares et al., 2011 Tabares et al., 2011 Tabares et al., 2011

Chiết xuất thô

Micromonospora coxensis

Hải miên biển Caribbean

Cathepsin B (ức chế 45 ± 3 %) Cathepsin L (ức chế 43 ± 2 %) Falcipain-2 (ức chế 41 ± 2 %) Rhodesain (ức chế 57 ± 5 %)

Chiết xuất thô

Sphingobium sp.

Rhodesain (ức chế 53 ± 3 %)

Chiết xuất thô

Sphingomonas mucosissima

Cathepsin B (ức chế 49 ± 5 %) Falcipain-2 (ức chế 45 ± 1 %)

Hải miên biển Caribbean Hải miên biển Caribbean

Tabares et al., 2011 Tabares et al., 2011 Tabares et al., 2011

Tetromycin B

Axinella polypoides

Streptomyces axinellae

Pimentel et al., 2011

Tetromycin 3

Axinella polypoides

Streptomyces axinellae

Tetromycin 4

Axinella polypoides

Streptomyces axinellae

Rhodesain (Ki = 0.62 ± 0.03 µM) Falcipain-2 (Ki = 1.42 ± 0.01 µM) Cathepsin L (Ki = 32.5 ± 0.05 µM) Cathepsin B (Ki = 1.59 ± 0.09 µM) SARS-CoV-PLpro (Ki = 69.6 ± 7.2 µM) Rhodesain (Ki = 2.1 ± 0.9 µM) Falcipain-2 (Ki = 1.65 ± 0.25 µM) Cathepsin L (Ki = 15.0 ± 1.95 µM) Cathepsin B (Ki = 0.57 ± 0.04 µM) Rhodesain (Ki = 4.0 ± 0.3 µM) Falcipain-2 (Ki = 3.1 ± 0.2 µM) Cathepsin L (Ki = 22.4 ± 0.8 µM)

Pimentel et al., 2011 Pimentel et al., 2011

33

Cathepsin B (Ki = 1.6 ± 0.1 µM) SARS-CoV-Plpro (Ki = 40 ± 6.5 µM)

Diazepinomicin

Micromonospora

Aplysina aerophoba

Rhodesain (Ki = 98 µM) Cathepsin L (IC50 = 72.4 ± 5.3 Μm)

Chiết xuất thô

Jaspis sp.

Providencia sp.

Chiết xuất thô

Jaspis sp.

Bacillus sp.

Ramadan et al., 2012 Wahyudi et al., 2010 Wahyudi et al., 2010

Chiết xuất thô

Jaspis sp.

Paracoccus sp.

Subtilisin (ức chế 91.57 %) Thermolysin (ức chế 59.4 7%) E. coli protease (ức chế 98.84 %) Subtilisin (ức chế 57.23 %) Thermolysin (ức chế 70.37 %) S. aureus protease (ức chế 51.29 %) Subtilisin (ức chế 30.78 %) Thermolysin (ức chế 50.52 %) P. aeruginosa protease (ức chế 23.52 %)

Chiết xuất thô

Jaspis sp.

Unidentified bacteria

P. aeruginosa protease (ức chế 72.7 %)

Chiết xuất thô

Unidentified bacteria E. coli protease (ức chế 93.5 %)

Plakortis nigra

Chiết xuất thô

Unidentified bacteria S. aureus protease (ức chế 40.0 %)

Jaspis stellifera

Chiết xuất thô

Xestospongia testudinaria

Chromohalobacter sp.

P. aeruginosa protease (ức chế 95.5 %)

Wahyudi et al., 2010 Nurhayati et al., 2006 Nurhayati et al., 2006 Nurhayati et al., 2006 Nurhayati et al., 2006

Tình hình nghiên cứu trong nước

Nghiên cứu về hoạt tính sinh học của các hợp chất thiên nhiên ở biển Việt

Nam là một trong những hướng nghiên cứu quan trọng hiện nay. Một số nhóm sinh

vật ở biển Việt Nam bao gồm: nhóm hải miên, nhóm san hô mềm và nhóm da gai

đã được nghiên cứu về thành phần hóa học và hoạt tính sinh học (hoạt tính gây độc

tế bào trên một số dòng ung thư thử nghiệm, hoạt tính kháng sinh, kháng viêm,

chống loãng xương và chống ô xy hóa) (Châu Văn Minh et al., 2012).

Bên cạnh đó, hoạt tính sinh học của vi sinh vật biển cũng đã được nghiên

cứu. Viện Công nghệ sinh học đã báo cáo phân lập định danh vi khuẩn từ các mẫu

nước biển và nghiên cứu khả năng phân hủy hydratcacbon, khả năng sinh các chất

có hoạt tính bề mặt nhằm ứng dụng trong các ngành công nghiệp và xử l‎ý môi

trường, hoạt tính ức chế E. coli, Staphylococcus aureus, F. oxysporum của vi khuẩn

phân lập từ bùn biển... (Thi Tuyen Do et al., 2012). Đỗ Mạnh Hào và Phạm Thế

Thư (2010) đã nghiên cứu đa dạng VSV của các mẫu nước và trầm tích vùng ven

biển Hải Phòng và đã phân lập được 65 chủng vi khuẩn điển hình thuộc 31 loài, 16

34

chi, 8 họ và 2 bộ. Một số Đề tài nghiên cứu có định hướng ứng dụng VSV biển

như: “Phân lập và tuyển chọn các chủng vi sinh vật có khả năng tổng hợp các chất

kháng sinh từ một số vùng biển của Việt Nam” của Viện Công nghệ sinh học từ

2006-2008 đã đánh giá tính đa dạng và lựa chọn các vi sinh vật biển có hoạt tính

kháng sinh từ vùng đất ngập mặn ven bờ biển Việt Nam và tìm hiểu khả năng ứng

dụng trong nuôi trồng thủy sản, bảo vệ môi trường và y dược. Đề tài KC.09.09/06-

10: “Nghiên cứu sàng lọc các chất có hoạt tính sinh học theo định hướng kháng

sinh, gây độc tế bào và chống oxy hóa từ sinh vật biển nhằm tạo các sản phẩm có

giá trị dược dụng” từ 2007-2008 của Viện Hóa học các hợp chất thiên nhiên nhằm

xây dựng danh mục sinh vật biển có chất kháng sinh, gây độc tế bào và chống ôxy

hóa và qui trình công nghệ tách chiết các chất có hoạt tính sinh học và tạo ra một số

sản phẩm có giá trị dược dụng. Đề tài VAST 06.04/13-14: “Nghiên cứu đặc tính

sinh học của một số vi khuẩn cộng sinh trên hải miên (Sponge) vùng biển Hải Vân -

Sơn Chà (Thừa Thiên - Huế)”. Kết quả thu được từ 34 mẫu hải miên biển vùng biển

Hải vân - Sơn Chà đã phân lập được 9600 dòng vi khuẩn bám, 9960 dòng vi khuẩn

cộng sinh, 360 dòng xạ khuẩn bám và 940 dòng xạ khuẩn cộng sinh, 1710 dòng vi

nấm bám và 1462 chủng cộng sinh. Thử nghiệm hoạt tính ức chế với nguồn bệnh

Vibrio vulnificus và V. Parahaemolytisus cho thấy 41 chủng vi khuẩn và 11 chủng

xạ khuẩn có hoạt tính đối kháng, trong đó có 9 chủng vi khuẩn và 1 chủng xạ khuẩn

có hoạt tính đối kháng với cả 2 nguồn bệnh trên với đường kính vòng kháng khuẩn

từ từ 14-17,5 mm. Một số nghiên cứu tách chiết các chất có hoạt tính sinh học từ hải

miên và vi sinh vật liên kết với hải miên đã được báo cáo. C29-Sterols từ hải miên

Ianthella sp. có đặc tính chống ung thư (Nguyen Huu Tung et al., 2009). Từ hải

miên biển Việt Nam Xestospongia testudinaria đã phân lập được 3 C29 sterol mới,

xác định cấu trúc và khả năng ức chế sự bám dính của Pseudoalteromonas spp. và

Polaribacter sp. (Xuan Cuong Nguyen et al., 2013). Ngoài ra, Viện Hóa sinh biển –

Viện Hàn lâm KH&CN Việt Nam có hợp tác với một số nước khác (Mỹ, Nga, Hàn

Quốc) để nghiên cứu về hoạt tính sinh học của sinh vật biển tại Việt Nam trong đó

có hải miên. Ví dụ: “Nghiên cứu tìm kiếm các hợp chất có hoạt tính sinh học cao từ

các đối tượng san hô mềm và hải miên thu thập tại Quảng Ninh và Hạ Long, Việt

Nam”với KORDI Hàn Quốc. Sử dụng các phương pháp sắc ký khác nhau, các dẫn

35

xuất Sesquiterpene (smenohaimiens AE (1-5); 19-hydroxy-polyfibrospongol B (6);

ilimaquinone (7); dictyoceratin C (8); polyfibrospongol B (10) đã được phân lập từ

hải miên Smenospongia cerebriformis. Kết quả thử nghiệm hoạt tính kháng viêm

của các hợp chất trên cho thấy hợp chất (7) đã ức chế đáng kể việc sản xuất NO

trong lipopolysacarit được kích thích bởi các tế bào microglia BV2 với giá trị IC50

là 10,40 ± 1,28 µM. Các hợp chất còn lại cho thấy hoạt tính ức chế sản xuất NO vừa

phải với giá trị IC50 dao động từ 24,37 đến 30,43 µM (Kiem PV et al., 2017). Đề

tài: “Phân tích, lắp ráp, chú giải genome một chủng vi sinh vật liên kết hải miên có

hoạt tính sinh học thu nhận từ biển Đà Nẵng, Việt Nam” do TS. Vũ Thị Thu Huyền,

Viện Hóa Sinh biển cũng đang được tiến hành (2018-2020) (Http://gust.edu.vn/).

Các nghiên cứu về VSV liên kết hải miên tại Việt Nam còn rất hạn chế và chưa

có nghiên cứu nào về việc sử dụng kỹ thuật metagenomics để phát hiện và sàng lọc

các gen có hoạt tính PIs từ nguồn môi trường tiềm năng này.

1.4. Hệ biểu hiện gen ngoại lai Escherichia coli và Pichia pastoris

Để biểu hiện thành công các gen hữu ích như mong muốn, việc lựa chọn và

thiết kế vectơ biểu hiện đóng một vai trò cực kỳ quan trọng. Để lựa chọn và thiết kế

vectơ thành công phải đánh giá rất nhiều yếu tố khác nhau như kích thước gen

muốn biểu hiện, loại tế bào chủ, các yếu tố cấu trúc của vectơ ….

Vectơ biểu hiện trong E. coli được sử dụng rộng rãi nhất hiện nay bởi chúng

có nhiều ưu điểm như: (1) sinh trưởng nhanh, thời gian nhân đôi khoảng 20 phút;

(2) dễ dàng đạt được mật độ tế bào cao. E. coli được sử dụng như “con ngựa” trong

biểu hiện protein ngoại lai do những hiểu biết đầy đủ về sinh lý của vi khuẩn này:

các loại môi trường tổng hợp giàu dinh dưỡng sẵn có và không đắt giúp vi khuẩn

sinh trưởng nhanh; việc biến nạp DNA ngoại lai vào E. coli dễ và nhanh. Tuy nhiên,

hệ biểu hiện E. coli cũng có một số hạn chế. Khi không phát hiện sự biểu hiện của

protein ngoại lai hoặc protein biểu hiện rất ít, điều đó cho thấy có thể protein biểu

hiện độc đối với tế bào vật chủ hoặc hiện tượng “thiên vị codon”. Protein ngoại lai

biểu hiện trong hệ E. coli dễ ở trạng thái thể vùi (inclusion bodies) do sự gấp protein

không đúng hoặc sự tạo cầu nối disulfide không chính xác. Protein biểu hiện cũng

36

có thể không có hoạt tính do sự gấp protein không hoàn chỉnh, sự biến dị của cDNA

hoặc độ hòa tan của protein quá thấp (Rosanoet al., 2014).

Có rất nhiều vectơ biểu hiện trong E. coli thương mại đã được gắn với các

đuôi N-terminate và C-terminate cho phép tinh sạch protein hiệu quả. Đặc biệt, các

chủng E. coli khác nhau phục vụ cho việc biểu hiện cũng được thương mại hóa và

dễ dàng sử dụng, tạo thuận lợi cho việc tối ưu hóa quá trình biểu hiện protein cho

các mục đích khác nhau. Hiện nay đã có rất nhiều vectơ biểu hiện trong E. coli đã

được thương mại hóa, trong đó vectơ pET-32a(+) được sử dụng khá phổ biến trong

các nghiên cứu biểu hiện protein ngoại lai trong hệ E. coli (Kaur & Kumar., 2018).

Nấm men P. pastoris hiện là một trong những hệ đa năng và hiệu quả nhất để

biểu hiện protein ngoại lai do những lí do sau: (1) các kỹ thuật sinh học phân tử

được sử dụng cũng là những kỹ thuật được sử dụng cho chủng nấm men được

nghiên cứu rộng rãi Saccharomyces cerevisiae; (2) có khả năng biểu hiện protein

ngoại lại mức độ cao, hoặc nội bào, hoặc ngoại bào; (3) khả năng thực hiện nhiều

thay đổi sau dịch mã như glycosylation, tạo cầu nối disulphide và proteolytic

processing; (4) các kít thương mại để biểu hiện có sẵn; (5) promoter được điều

chỉnh chặt chẽ và hiệu quả alcohol oxidase 1 (AOX1), nó cảm ứng đến hơn 1000 lần

khi sử dụng nguồn cacbon là methanol; (6) nó có khả năng chịu được mật độ nuôi

cấy cao trong thiết bị lên men và ưu tiên hô hấp chứ không phải là kiểu tăng trưởng

lên men. Hiện nay có khá nhiều vectơ biểu hiện mạnh trong nấm men đã được

thương mại hóa để người sử dụng có thể lựa chọn vectơ thích hợp để biểu hiện như

pHIL-D2, pHIL-S1, pPIC3.5K, pPICK9, pPIC9K, pPICZ, pPICZα (Ahman et al.,

2014; Potvin el al., 2012). Trong đó vectơ pPIC9 đã được sử dụng hiệu quả trong

các nghiên cứu trước đó.

37

CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. Vật liệu nghiên cứu

2.1.1. Vật liệu

Các mẫu hải miên được thu thập tại biển Quảng Trị, Việt Nam bằng thiết bị

thở dưới nước khép kín (SCUBA: self contained underwater breathing apparatus).

Mẫu vật lập tức được đưa vào nước biển có bổ sung 30 % glycerol và đặt trong

thùng xốp có chứa đá và vận chuyển về phòng thí nghiệm.

Kít tách DNA ZR Soil Microbe DNA MiniPrep™ (Zymo Research Corp.);

Kít thôi gel (GeneJet gel Extraction Kit) của Thermo Scientific; Kít tách plasmis

(GeneJET Plasmid Miniprep Kit) của hãng Thermo Scientific; Kít tách DNA hải

miên DNeasy Blood & Tissue Kit (Qiagen, Germany).

Chủng vi khuẩn Escherichia coli Top10F’ để tách dòng gen (Invitrogen, Mỹ);

Mồi 16S rRNA, 18S rRNA (Thermo Fisher Scientific, Mỹ); Enzyme giới hạn

EcoRI, NotI (Thermo Fisher Scientific, Mỹ); Thang chuẩn DNA được cung cấp bởi

hãng Fermentas (Mỹ); T4 DNA ligase (Thermo Fisher Scientific, Mỹ); Thang

chuẩn protein được cung cấp bởi một số hãng như Novagen (Netherlands), Sigma-

Aldrich (Mỹ), iNtRON Biotechnology (Korea), Affymetrix (Mỹ).

Mồi AOX1 để xác định kiểu hình chủng Pichia pastoris tái tổ hợp: 5’AOX1: 5’- gactggttccaattgacaac-3, 3’AOX1: 5’- gcaaatggcattctgacatcc-3’ (Invitrogen, Mỹ).

Chủng biểu hiện Escherichia coli BL21(DE3) (Invitrogen, Mỹ) có đặc điểm:

Là chủng biểu hiện mang gen đột biến làm mất khả năng tổng hợp các protease. Tế

bào E. coli BL21 (DE3) chứa đột biến Ion proteaza (một proteaza nội bào) và ompT

proteaza (một protein ngoại bào) không còn có khả năng thủy phân protein. Như

vậy, cả protein nội bào và ngoại bào ở chủng này đều bị bất hoạt. Ngoài ra, chủng

BL21(DE3) có chứa lysogen λDE3 mang gen T7 RNA polymerase dưới sự kiểm

soát của promotơ lacUV5. Cần có IPTG để tối đa hóa sự biểu hiện của polymerase

T7 RNA khi biểu hiện các gen tái tổ hợp nhân dòng vô tính của promotơ T7.

38

BL21(DE3) phù hợp cho biểu hiện từ promotơ T7 hoặc T7-lac hoặc promotơ được

nhận biết bởi E. coli RNA polymerase.

Chủng biểu hiện Pichia pastoris SMD1168 (Invitrogen, Mỹ) có đặc điểm: bị

gây đột biến gen his4 nên không có khả năng tổng hợp histidinol dehydrogenase.

Chúng sinh trưởng được trên môi trường giàu chất dinh dưỡng, nhưng trong môi

trường cơ bản cần bổ sung thêm histidine. Do vậy, gen his4 của P. pastoris được

xem là một chỉ thị nhận biết chủng chứa vectơ biểu hiện sau biến nạp do vectơ biểu

hiện chứa gen his4 bình thường. Ngoài ra, P. pastoris SMD1168 có cả 2 gen aox1

và aox2 nên có khả năng sinh trưởng trên môi trường methanol. Vì vậy, methanol

được sử dụng là chất cảm ứng trong quá trình biểu hiện.

Vectơ biểu hiện pET-32a(+) (Hình 2.1) và pPIC9 (Hình 2.2) đã được cung

cấp bởi hãng Thermofisher Scientific, Mỹ.

Hình 2.1. Cấu trúc vectơ pET-32a(+)

(Nguồn: Http://www.novopro.cn)

39

Hình 2.2. Cấu trúc vectơ pPIC9

(Nguồn: Snapgene.com)

2.1.2. Đối tượng nghiên cứu

Đối tượng nghiên cứu là vi sinh vật liên kết với hải miên biển Quảng Trị,

Việt Nam.

2.1.3. Hóa chất

Hóa chất dùng cho nghiên cứu được cung cấp bởi một số Hãng có uy tín

như: Hãng Sigma-Aldrich của Mỹ (IPTG, SDS, APS, Tris-HCl, Trypsin, ɑ-

chymotrypsin, Thermolysin, TCA, BAPNA (N-ɑ-benzoyl-DL-arginine-p-

nitroanilide), H-D-Phe-Pip-Arg-pNA (HDAP), N-benzoyl-tyrosine ethyl ester

(BTEE), Hammerstein casein, Ampicilin, X-gal, Beta-Mecaptoethanol, Bromphenol

blue, Acrylamid, Bis-Acrylamid, Coomassie Brilliant Blue R,PMSF, YNB w/o aa,

Sorbitol…); Hãng Merck của Đức (Methanol, NaOH, HCl, Acid acetic…); Hãng

HiMedia của Ấn Độ (Cao nấm men, cao thịt, Trypton, Agar); Hãng Bio basic của

Canada (Tris-HCl, Tris base).

2.1.4. Máy móc thiết bị

Sử dụng các máy móc thiết bị của Trung tâm Sinh học phân tử Nghĩa Đô

(thuộc Viện Nghiên cứu Khoa học Miền Trung, Viện Hàn lâm KH&CN Việt Nam)

và một số máy móc trọng điểm của Viện Hóa sinh biển, Viện Công nghệ sinh học

40

(thuộc Viện Hàn lâm KH&CN Việt Nam): Tủ lạnh sâu (-)20 ºC, (-)80 ºC (Sanyo,

Nhật Bản); Tủ cấy vô trùng (Esco, Singapo); Tủ ấm lắc có điều khiển nhiệt độ

(Wish, Hàn Quốc); Nồi khử trùng (Nhật Bản); Máy ly tâm (Sorvall, Mỹ); Máy soi

gel (Bio- Rad); Máy ủ nhiệt (Bio- Scientific, Mỹ); Cân điện tử (Đức); Pipetman

(Thụy Sĩ); Máy voltex (Velp, Italy); Lò vi sóng (Mỹ); Bộ nguồn điện di protein

(Bio-Rad); Máy lắc gel (BioSan); Máy đo pH (HANNA); Máy phá sóng tế bào

bằng siêu âm (Qsonica, Mỹ); Máy khuấy từ (Arec.X); Máy soi UV (Analytikjena,

Mỹ); … Ngoài ra còn có các dụng cụ trong nuôi cấy vi sinh vật: đĩa petri, bình tam

giác, que ria, que chang, lọ penicillin, giấy bạc, ống eppendorf…cũng được cung

cấp từ các hãng uy tín.

2.1.5. Dung dịch và môi trường sử dụng

Dung dịch được sử dụng trong điện di DNA

Dung dịch đệm TAE 50 lần (100 mL): 24,2 g Tris-base; 5,71 mL axít

acetic; 10 ml EDTA 0,5M; pH 8,0.

Đệm tra mẫu (6x) (loading dye): 0,25 % bromophenol blue; 0,25 %

xylencyanol FF; 30 % glycerol.

Dung dịch nhuộm gel ethidium bromide (EtBr) 0,5 µg/mL.

Môi trường và dung dịch sử dụng trong biến nạp và biểu hiện gen ngoại lai ở vi

khuẩn E. coli

Môi trường Luria-Bertani (LB) lỏng: Cao nấm men (0,5 %); Pepton (1 %);

NaCl (1 %).

Môi trường LB đặc: Tương tự như môi trường LB lỏng nhưngthêm Agar

1,6-2 %.

Dung dịch: CaCl2 0,1 M vô trùng, giữ 4 oC.

Nước biển nhân tạo (1 lít): NaCl (28,16 g); MgSO4 (3,5 g); NaHCO3 (0,11

g); MgCl2 (4,8 g); CaCl2 (1,6 g); CaCO3 (0,008 %); KBr (0,008 %); SnCl2 (0,0034

%); H3BO3 (0,0022 %); Na2O3Si (0,0004 %); NaF (0,00024 %); NH4NO3 (0,00016

%); Na2HPO4 (0,0008 %).

Môi trường sử dụng trong biến nạp và biểu hiện gen ngoại lai ở nấm men P.

pastoris (theo Pichia Expression Kit) (trong 1 lít):

41

Môi trường YPD: Cao nấm men (1 %); Pepton (2 %); Dextrose (2 %), Agar

(2 %).

Môi trường MD: YNB (1,34 %); Biotin (4 x 10-5 %); Dextrose (2 %).

Môi trường MDH: Tương tự MD có thêm Histidine (40 mg/L).

Môi trường MM: YNB (1,34 %); Biotin (4 x 10-5 %); Methanol (0,5 %).

Môi trường BMGY: Cao nấm men (1 %); Petone (2 %); Potassium

phosphate (100 mM, pH 6); YNB (1,34 %); Biotin (4 x 10-5 %); Glycerol (1 %).

Môi trường BMGY: Cao nấm men (1 %); Petone (2 %); Potassium

phosphate (100 mM, pH 6); YNB (1,34 %); Biotin (4 x 10-5 %); Methanol (0,5 %).

Dung dịch sử dụng trong điện di SDS-PAGE

Bis-acrylamide 30 %: Acrylamide (37,5 g) và Bis-acrylamide (1 g) hòa tan

trong 128 mL nước deion, bảo quản ở 4 oC.

Đệm Tris HCl 1,5 M pH 8,8: Cân 180,5 g Tris hòa tan trong 600 mL nước

deion. Chỉnh pH 8,8 bằng HCl đậm đặc, sau đó định mức lên 1 lít bằng nước deion.

Đệm Tris HCl 1 M pH 6,8: Lấy 400 mL Tris HCl 1,5 M pH 8,8 đã pha,

chỉnh về pH 6,8 bằng HCl đậm đặc. Định mức lên 600 mL bằng nước deion.

Đệm Tris HCl 0,5 M pH 6,8: Lấy 200 mL Tris HCl 1 M pH 6,8 đã pha,

thêm 200 mL nước deion thành tổng thể tích 400 mL.

SDS 10 % (100 mL): 10 g SDS và thêm nước deion cho đến thể tích 100

mL.

Đệm chạy điện di 10X (1 lít): Glycine (114,28 g), Tris base (30 g), SDS (10

g). Định mức lên 1 lít bằng nước deion.

APS 10 %: 1 g APS bổ sung nước deion cho đến 10 mL.

TEMED: Sử dụng dung dịch đậm đặc mua từ công ty hóa chất.

Đệm xử lý mẫu 5x: 4 mL Tris HCl 1M pH 6,8 + 5 mL SDS 20 % + 6 mL

Glycerol 100 % + 0,008 g Bromphenol blue + 1 mL ß-mercaptonethanol 100 %.

Định mức lên 20 mL bằng nước deion.

Thành phần bản gel polyacrylamide (Bảng 2.1):

42

Bảng 2.1. Thành phần của bản gel polyacrylamide

(Nguồn: Sigma.com)

Gel tách (12,6 %)

Gel cô (5 %) 0,45 mL 0,2 mL (pH = 6,8)

0,55 mL 1,125 mL (pH = 8,8) 0,9 mL 1,80 mL 45 mL 30 mL 3 mL 0,14 mL 4 μL 8 μL 1 μL Hóa chất H2O Tris – HCl Glycerol 50 % Acrylamide 30 % SDS 10 % APS 10 % TEMED

2.2. Phương pháp nghiên cứu

Phương pháp nghiên cứu được khái quát bằng sơ đồ sau:

Sơ đồ 2.1. Mô tả tóm tắt các bước nghiên cứu

43

2.2.1. Phương pháp tách DNA metagenome của vi sinh vật liên kết hải miên

Tách chiết DNA tổng số của vi sinh vật liên kết với hải miên theo phương

pháp của Abe et al. (2014) với một số cải tiến nhỏ cho phù hợp với điều kiện của

Việt Nam. Các mẫu hải miên được rửa 3 lần bằng nước biển nhân tạo vô trùng. 10 g

mẫu được cắt nhỏ và nghiền đến đồng nhất trong dung dịch đệm TE (10 mM Tris

HCl; 1 mM EDTA (ethylene diaminetetraacetic acid); pH 8,0). Đầu tiên, lọc hỗn

hợp qua hai lớp vải màn, sau đó ly tâm 250 g trong 1 phút để loại bỏ các mảnh vỡ

của hải miên và các chất bẩn. Dịch phía trên được ly tâm tiếp 8.000 g trong 15 phút

để thu tế bào vi sinh vật. Rửa tế bào thu được bằng dung dịch TE50 (10 mM Tris–

HCl, 50 mM EDTA, pH 8,0). DNA tổng số được tách bằng ZR Soil Microbe DNA

MiniPrep™ (Zymo Research Corp.) theo hướng dẫn của nhà sản xuất.

2.2.2. Định danh hải miên bằng sinh học phân tử

Mô hải miên (500 mg) đã được tách chiết DNA bằng kít tách DNA (DNeasy

Blood & Tissue Kit, hãng Qiagen, Đức) theo hướng dẫn của nhà sản xuất. Kết quả

sau tách được kiểm tra bằng điện di trên gel agarose 1 %. Nồng độ DNA và độ tinh

sạch cũng được kiểm tra bằng máy Nanodrop 1000 spectrophotometer (Nanodrop

Technol-ogies, Wilmington, DE). DNA tổng số của hải miên được hòa trong dung dịch đệm TE và lưu giữ ở (-)20 oC để thực hiện các phản ứng tiếp theo. Gen 18S

rRNA (~ 1800 bp) được khuyếch đại từ DNA tách chiết sử dụng cặp mồi

EukF/EukR (Medlin et al., 1988). Sản phẩm PCR được tách dòng vào vectơ

pCRTM2.1 ((TA Cloning Kit, Invitrogen) theo hướng dẫn của nhà sản xuất. Các

dòng dương tính được giải trình tự bằng máy ABI PRISM 3100, Applied

Bioscience.

2.2.3. Phân tích dữ liệu metagenomics

Mẫu DNA lựa chọn được giải trình tự bằng hệ thống Illumina HiSeq2500

và hướng dẫn phân tích dữ liệu thu được bởi công ty BaseClear, Hà Lan.

Đánh giá và tiền xử lý dữ liệu

Các file trình tự FASTQ được tạo ra bằng pipeline Illumina Casava pipeline

version 1.8.3. Việc đánh giá chất lượng ban đầu được thực hiện thông qua các dữ

liệu vượt qua chức năng lọc Illumina Chastity. Sau đó, các reads chứa tín hiệu điều

44

khiển PhiX sẽ được loại bỏ bằng công cụ lọc in-house. Ngoài ra, các reads có chứa

một phần adapter cũng cắt bỏ (tối thiểu bằng 50 bp chiều dài của read). Việc đánh

giá chất lượng thứ cấp được thực hiện đối với các read còn lại sử dụng công cụ

kiểm soát chất lượng FASTQC, sau đó được tinh sạch nhằm loại bỏ những đoạn

trình tự có chất lượng thấp và độ dài ngắn, sử dụng phần mềm Trimmomatics

(Bolger et al, 2014). Trong nghiên này tất cả những đoạn trình tự có điểm chất

lượng nhỏ hơn 30 (QC < 30) và độ dài nhỏ hơn 70 bp đều được loại bỏ.

Lắp ráp de novo metagenome

Dữ liệu sau tinh sạch được dùng để lắp ráp de novo metagenome sử dụng

phần mềm SPAdes (Bankevich et al., 2012) với k-mer biến thiên từ 21 đến 55. Để

chọn được tham số k-mer tối ưu, chúng tôi sử dụng phần mềm QUAST để đánh giá

dựa trên các tiêu chí: Kích thước hệ metagenome tổng số, độ dài contig lớn nhất, chỉ

số N50 và tỷ lệ đoạn trình tự ánh xạ ngược lại (remapping sử dụng phần mềm

Bowtie2 (Langmead & Salzberg., 2012) và Qualimap (García et al., 2012). Tất cả

những contigs có kích thước nhỏ hơn 1000 bp đều bị loại bỏ để thu được hệ

metagenome cuối cùng.

Dự đoán gen

Hai phần mềm Prodigal (Hyatt et al., 2010) và MetageneMark (Zhu et al.,

2010) với tham số mặc định được sử dụng để dự đoán gen trong metagenome thu

được. Để chọn ra tập gen chung nhất, hai tập gen dự đoán thu được từ hai phần

mềm Prodigal và MetageneMark được phân cụm (clustering) bằng phần mềm CD-

HIT (Li & Godzik., 2006) với mức độ tương đồng 90 %. Điều này có nghĩa là, hai

gen dự đoán từ hai phần mềm phải có mức độ tương đồng từ 90 % trở lên thì mới

được chọn làm gen dự đoán cuối cùng. Sau đó, loại bỏ các gen được dự đoán có độ

dài dưới 250 bp để thu được tập gen được dự đoán cuối cùng.

Chú giải chức năng gen

Tập gen dự đoán cuối cùng được so sánh (blasted) với các cơ sở dữ liệu sinh

học khác nhau bao gồm: CAZy (Cantarel et al., 2009) (sử dụng phần mềm DBCAN

(Yin et al., 2012), GO (Ashburner et al., 2006), COG (Tatusov et al., 2001), Swiss-

Prot (Bairoch et al., 2000), KEGG (Kanehisa et al., 2011) và NR (Pruitt et al.,

45

2007) (blast (Altschul et al., 1990), evalue < 1.e-3, max_target_seqs 20). Trong đó,

NR: cơ sở dữ liệu các trình tự protein không lặp lại (non-redundant) từ các cơ sở dữ

liệu GenPept , Swiss-Prott , PIR, PDF, PDB và RefSeq; CAZy: là cơ sở dữ

liệu Carbohydrate Active enzyme (http://www.cazy.org/); GO: Gen Ontology, Dự

án Gen Ontology được xây dựng nhằm đưa ra những mô tả, định nghĩa những sản

phẩm của gen. Dự án GO được phát triển bao gồm: structured, controlled

vocabularies (ontologies) nhằm mô tả các chức năng của gen liên quan đến các chu

trình sinh học, thành phần tế bào và chức năng phân tử của 1 loài sinh vật độc lập

(http://genontology.org/); COG: Cluster of Orthologous Groups: là cơ sở dữ liệu

những trình tự protein được tạo ra bởi NCBI. Cơ sở dữ liệu này được tạo nên dựa

trên mối quan hệ tiến hóa của hệ thống protein giữa vi khuẩn, tảo và sinh vật nhân

chuẩn. Trình tự protein có thể được chia vào 1 loại của COG và mỗi loại của COG

được tạo nên bởi những trình tự tương đồng và hình thành chức năng của protein

(Http://www.ncbi.nlm.nih.gov/COG/); KEGG: Kyoto Encyclopedia of Gens and

Genomes với cơ sở dữ liệu chính là KEGG PATHWAY. Cơ sở KEGG PATHWAY

chia con đường sinh học thành 8 phần chính và mỗi phần được hình thành từ nhiều

phần nhỏ khác nhau, mỗi phần được chú giải bởi các gen liên quan. Bằng việc sử

dụng chú giải trên KEGG, chúng ta có thể tìm ra những gen liên qua đến những gen

đã được chú giải một cách dễ dàng. (Http://www.kegg.jp/kegg/pathway.html);

Swiss-Prot: UniProtKB/Swiss-Prot là một phần của UniProtKnowledgebase được

chú giải và đánh giá thủ công. Nó là một cơ sở dữ liệu của các trình tự protein

không lặp lại có chất lượng chú giải được kiểm chứng bẳng thực nghiệm

(Http://web.expasy.org/docs/swiss-prot_guideline.html); Pfam: Đây là cơ sở dữ liệu

tập hợp các họ của protein. Các trình tự protein được tạo bởi một hoặc nhiều vùng

chức năng, thông thường là các domain. Sự kết hợp khác nhau sẽ làm tăng tính đa

dạng của của protein được tìm thấy trong tự nhiên (Http://pfam.xfam.org/).

Sau khi có kết quả chú giải gen, bằng các công cụ chọn lọc chức năng trong

excel để sàng lọc các gen PIs trong CSDL metagenomics.

Chuẩn bị thư viện Miseq

Để nghiên cứu sự đa dạng của các vi sinh vật liên kết hải miên, gen 16S

rRNA thường được sử dụng. Gen 16S rRNA dài khoảng 1.500 bp, bao gồm chín

46

vùng biến đổi giữa các loài nằm xen kẽ với các vùng gen bảo thủ. Trong nghiên cứu

này, cặp mồi để khuếch đại vùng V4 siêu biến của gen 16S rRNA đã được sử dụng

để đánh giá đa dạng cộng đồng vi sinh vật liên kết với hải miên biển bằng hệ thống

giải trình tự gen thế hệ mới Miseq Illumina.

Khuếch đại vùng V4 của gen 16S rRNA (1st PCR):

Cặp mồi 515F/806R (Caporaso et al., 2012) sử dụng để khuếch đại vùng V4

của gen 16S rRNA có trình tự sau:

515F: GTGYCAGCMGCCGCGGTAA

806R: GGACTACNVGGGTWTCTAAT

Thành phần phản ứng cho PCR khuếch đại vùng V4 gen 16S rRNA và gắn barcodes

trong phần Phụ lục 5.

PCR gắn mã vạch (barcode) (2nd PCR):

Bước PCR này nhằm mục đích gắn mã vạch cho sản phẩm PCR vùng V4 của

gen 16S rRNA của mẫu QT2: GAGTTCATACT (forward); GAGTTCATTCA

(reverse).

Chuẩn bị thư viện gửi mẫu giải trình tự

Sản phẩm PCR sau khi gắn mã vạch (2nd PCR) được tinh sạch bởi kit tinh

sạch HighPrep™ PCR Protocol – MagBio. Sau khi tinh sạch, sản phẩm PCR được

đo nồng độ bằng kit Qubit của hãng Invitrogen. Để chuẩn bị thư viện, các sản phẩm

PCR sẽ được lấy 150 µg/mẫu và được trộn chung (pool) với nhau để tạo thành một

thư viện. Sau khi trộn chung các mẫu với nhau, thư viện sẽ được tinh sạch lại bằng

kit HighPrep™ PCR Protocol – MagBio. Thư viện sau khi tinh sạch sẽ được gửi

đến công ty BaseClear (Hà Lan) để giải trình tự thư viện 16S Miseq.

Xử lý dữ liệu 16S rRNA Miseq

Thư viện 16S Miseq sau khi được giải trình tự sẽ được xử lý bằng Qiime

Virtual Box 1.9.0 với NG-Tax pipeline. Đầu tiên các read không được gắn mã vạch

hoặc không bắt cặp với mồi (primer) sẽ được loại bỏ khỏi thư viện bằng script

Library_filtering (Qiime). Các read được gắn mã vạch sau đó sẽ được tiếp tục loại

bỏ mã vạch (demultiplexing), nhóm OTU, loại bỏ các read nhiễu và cuối cùng phân

47

loại (taxonomy) bằng script OTU_picking_pair_end_read. Trong đó các read có

mức tương đồng 98,5 % sẽ được nhóm vào một OTU, chiều dài read mỗi đầu là 100

nucleotide, các OTU được phân loại dựa theo cơ sở dữ liệu Project (RDP) Silva

database v.1.1.1. Các OTU có mức phong phú thấp hơn 0,1 % so với tổng số read

cũng sẽ được loại bỏ.

2.2.4. Tổng hợp gen PIs từ CSDL metagenomics hải miên và thiết kế plasmid

mang gen PIs

Trình tự gen mã hóa chất ức chế protease (PIs) được tổng hợp dựa trên trình

tự gen được chú giải là gen PIs trên CSDL metagenomics của hải miên dựa trên một

số thông số như trình tự gen được chọn là trình tự gen PIs mới (có độ tương đồng

dưới 85 % khi so sánh trên ngân hàng gen NCBI), gen hoàn chỉnh, kích thước

khoảng 30-55 kDa (thuận tiện cho việc biểu hiện).

Để định hướng cho việc tách dòng gen, trình tự nhận biết bởi enzyme giới

hạn EcoRI và NotI được đưa vào hai đầu của gen. Trình tự gen EcoRI-PIs-NotI sẽ

được tổng hợp bởi hãng Genscript và tách dòng trong vectơ pUC57. Sau đó, đoạn

gen PIs được cắt khỏi vectơ tách dòng bằng EcoRI và NotI, hai vectơ biểu hiện

pET-32a(+) và pPIC9 cũng được xử lý bằng hai enzyme giới hạn trên. Tiếp theo nối

đoạn gen PIs vào vectơ biểu hiện để tạo thành vectơ pET-32a(+)/PIs (biểu hiện

trong hệ E. coli) hoặc vectơ pPIC9/PIs (biểu hiện trong hệ nấm men P. pastoris)

nhờ enzyme T4 DNA ligase.

Thành phần phản ứng cắt: Buffer O (1µL); DNA plasmid (5 µL); EcoRI (1 µL); NotI(1 µL); H2O (2 µL). Hỗn hợp được ủ ở 37 oC trong 4 h. Sản phẩm cắt được

điện di kiểm tra trên bản gel agarose 1 %.

Thành phần phản ứng lai: Buffer T4 DNA ligase (2 μL); Vectơ biểu hiện (10 μL); DNA PIs (4 μL); T4 DNA ligase (1 μL); H2O (3 μL). Hỗn hợp được ủ ở 16 oC

trong 6 h. Biến nạp 5 µL sản phẩm lai vào chủng tế bào khả biến E. coli Top10F’ bằng cách sốc nhiệt ở 42 oC trong 50 giây. Bổ sung 250 µL SOC nuôi ở 37 oC /1h

cấy trải 100 µL trên môi trương LB đặc có bổ sung kháng sinh Amp nồng độ 50

µg/mL qua đêm.

48

2.2.5. Các phương pháp sử dụng để biểu hiện và thu hồi protein PIs tái tổ hợp

trong hệ biểu hiện E. coli BL21(DE3)

Phương pháp biến nạp

Biến nạp vectơ tái tổ hợp mang gen PIs vào vi khuẩn E. coli BL21(DE3)

được thực hiện theo Đỗ Thị Huyền et al., 2008.

Biểu hiện và tối ưu hóa quá trình biểu hiện gen PIs trong E. coli

Tế bào E. coli BL21(DE3) mang vectơ biểu hiện pET-32a(+)/PIs được nuôi

cấy trong môi trường Luria Broth có ampicillin nồng độ 50 μg/mL (LBamp) qua đêm ở 37 oC, lắc 200 vòng/phút rồi chuyển sang môi trường LBamp mới sao cho

nồng độ 0,1; 0,5; 1,0 và 1,5 mM); Nhiệt độ biểu hiện được thử nghiệm từ 20, 25, 30 và 37 oC. Thời gian thu mẫu sau cảm ứng: 4 h (biểu hiện 37 oC), 5 h (biểu hiện 25 và 30 oC), 6 h (20 oC) (Đỗ Thị Huyền et al., 2008; Nguyễn Thị Quý et al., 2013).

OD600 ban đầu là 0,1. Tiếp tục nuôi cấy trong cùng điều kiện cho tới khi OD600 = (0,4; 0,6; 0,7; 0,8; 1); bổ sung Isopropylthio-ß-galactosida (IPTG) (khảo sát ở các

Dịch nuôi cấy sau biểu hiện được ly tâm 5000 vòng/ phút trong 5 phút, loại

dịch nổi. Cặn tế bào được hòa lại trong dung dịch đệm TE (Tris 20 mM; EDTA 10 mM; PMFS 0,05 mM). Mẫu được ủ ở -75 oC trong 1 h, sau đó làm tan ở 50 oC trong

30 phút và siêu âm đến khi dung dịch trong suốt. Ly tâm 13.000 vòng/phút trong 15

phút, thu riêng pha nổi (pha tan), pha cặn (pha không tan) hòa lại trong đệm TE về

thể tích ban đầu. Tiếp đó, bổ sung đệm xử lý protein vào pha tổng số (dịch tế bào phá trước ly tâm), pha tan và pha không tan. Biến tính ở 100 oC trong 10 phút, và

điện di trên gel SDS-PAGE 12,6 % để xác định trạng thái biểu hiện của protein PIs.

Phản ứng lai kháng thể (Western blot)

Protein sau khi điện di trên gel SDS-PAGE được điện chuyển lên màng

polyvinylidenedifluoride (PVDF) (Invitrogen) và ngăn cản các protein lạ bám vào

màng bằng TBS 1X (có chứa 5 % sữa gầy) qua đêm. Màng PVDF được ủ với kháng thể anti-TRx ở 4 oC (1:1000) trong 2 h để tạo liên kết protein-protein. Sau đó, màng

được đặt trong bộ đệm TBS và rửa trong 10 phút. Tiếp theo, màng được ủ với dung

dịch kháng thể thứ cấp trong 1 h ở nhiệt độ phòng, sau đó được đặt vào TBS và rửa

lắc nhẹ trong 10 phút. Bước này được lặp lại 2 lần với bộ đệm mới. Cuối cùng, hiện

màu bằng dung dịch cơ chất ρ-nitro blue tetrazolium chloride 5-bromo-4-chloro-3-

indolyl phosphat (NBT/BCIP).

49

Tinh sạch protein PIs tái tổ hợp

Protein tái tổ hợp PIs được tinh sạch theo hướng dẫn của Ni-NTA

Purification System (Novex by life technologies) có một số cải biến nhỏ. Sau quá

trình biểu hiện, cặn tế bào E. coli được thu lại và hòa trong đệm Native Purification

Buffer 1 X (NPB 1 X: 50 mM NaH2PO4, pH 8.0; 0,5 M NaCl), bổ sung lysozyme, ủ trên đá 30 phút, tiếp đó siêu âm phá tế bào, ly tâm 6000 vòng/10 phút thu dịch nổi,

bỏ cặn. Dịch nổi sau ly tâm được nạp vào cột Ni-NTA. Các protein tạp nhiễm được

rửa khỏi cột bằng đệm NWB (NPB 1 X, Imidazole 100 mM). Protein PIs tinh sạch

được đẩy ra khỏi cột bằng Imidazol (100, 250, 300 và 500 mM) có trong thành phần

đệm NEB (NPB 1 X, Imidazol). Protein PIs sau tinh sạch qua cột Niken được thẩm

tích để loại bỏ Imidazol và các tạp nhiễm bằng dung dịch đệm TBS (Tris-HCl 50 mM; NaCl 50 mM) pH 7,4 trong 24 h ở 4 oC. Protein tái tổ hợp sau thẩm tích được

xử lý bằng kit Thrombin (Novagen) để loại bỏ đuôi TRx-His và thu hồi protein tái tổ

hợp ở trạng thái không liên kết.

Nhận diện và phân tích protein bằng phương pháp proteomics/tin sinh học (Phụ lục

12).

2.2.6. Các phương pháp sử dụng để biểu hiện và thu hồi protein PIs tái tổ hợp

trong hệ biểu hiện nấm men Pichia pastoris

Tạo dòng tế bào P. pastoris SMD 1168 mang gen PIs

Các thí nghiệm thực hiện theo hướng dẫn của Pichia expression kit –

Invitrogen.

Kiểm tra kiểu gen, kiểu hình của các dòng biến nạp

Các thí nghiệm thực hiện theo hướng dẫn của Pichia expression kit –

Invitrogen.

Biểu hiện P. pastoris SMD 1168 mang vectơ tái tổ hợp và xác định điều kiện biểu

hiện thích hợp nhất trên quy mô nuôi cấy lắc

Các thí nghiệm thực hiện theo hướng dẫn của Pichia expression kit –

Invitrogen.

Phương pháp phát hiện chất ức chế protease bằng điện di trên gel SDS – PAGE có

bổ sung cơ chất casein

50

Điện di phát hiện băng chất ức chế protease: gel SDS – PAGE 12,6 % có cơ

chất casein (0,1 %), sau khi điện di kết thúc xử lý với enzyme trypsin, ở vị trí có

chất ức chế protease sẽ tạo thành các băng có màu đậm trên nền gel sáng hơn. Đây

là một phương pháp nhạy, cho phép phát hiện trực tiếp chất ức chế protease từ một

lượng rất ít dịch chiết thô (< 20 μL) mà không cần phải tinh sạch ( Hoàng Thu Hà et

al., 2008).

Sắc ký ái lực qua cột Trypsin-Sepharore 4B

Dịch protein sau biểu hiện 72 h được tủa với muối (NH4)2SO4và muối được loại bằng phương pháp thẩm tích ở 4 ºC trong 24 h. Dịch protein sau loại muối được

cho qua cột sắc kí lọc gel với chất giá Sephacryl-S200. Mẫu được thôi bằng hệ

thống thôi mẫu tự động FPLC với tốc độ dòng 0.5 mL/phút bằng dung dịch đệm

Tris/HCl 50mM pH 7,0 có bổ sung Sodium azide (NaN3) 0,2 %, thu mỗi phân đoạn

2 mL. Kiểm tra các phân đoạn bằng điện di SDS-PAGE. Sau đó gộp các phân đoạn

chứa protein quan tâm và cho qua màng lọc cut off 30 kDa (Microcon-30kDa

Centrifugal Filter Unit), thu sản phẩm ở phần >30 kDa. Sau đó dịch protein thu

được sẽ được cho qua cột sắc ký ái lực Trypsin-Sepharore 4B (Sigma) đã được cân

bằng với đệm A (Tris-HCl 20 mM, pH 7,5; KCl 50 mM) có chứa 2 mM CaCl2. Protein không hấp thụ và gắn không đặc hiệu được đẩy bằng dung dịch NaCl 1 M

pha trong cùng đệm A. Phần protein gắn đặc hiệu trên cột được đẩy bằng dung dịch

HCl 0,001 M có chứa 2 mM CaCl2 và cô đặc protein thu được bằng màng lọc cut off 30 kDa (Phan Tuấn Nghĩa et al., 2004; Sapna., 2013).

2.2.7. Phương pháp xác định hoạt tính ức chế protease

Thử nghiệm hoạt tính ức chế protease của protein tái tổ hợp PIs trên đĩa thạch

Chuẩn bị đĩa thạch gầy (Agar 0,8 %, Skimmed milked 1 %), đục giếng có

kích thước 1 cm ở giữa và các giếng bên cạnh cách nhau 1 cm. Nhỏ 20 μL protease

(trypsin, ɑ-chymotrypsin, thermolysin nồng độ 0,5 mg/mL) vào giếng ở giữa.

Protein tái tổ hợp PIs nhỏ vào một trong các giếng thạch bên cạnh và bổ sung nước vô trùng vào giếng còn lại. Đĩa thạch sau đó được ủ ở 37 oC qua đêm (Sapna.,

2013).

Phương pháp xác định phần trăm ức chế protease (Karthik et al., 2014)

Bổ sung protein tái tổ hợp PIs vào hỗn hợp mercuric chloride, photphate

buffer và protease (trypsin, ɑ-chymotrypsin). Sau khi chỉnh pH đến 7,5; bổ sung

51

BAPNA (N-ɑ-benzoyl-DL-arginine-p-nitroanilide) và ủ ở 37 oC trong 20 phút. Sau

đó, bổ sung 5 % TCA và ủ ở nhiệt độ phòng trong 20 phút. Tiếp đó, lọc dung dịch bằng giấy lọc Whatmann No1 và đo ở bước sóng 280 nm. Hoạt tính ức chế protease

được tính theo công thức sau:

Hoạt tính ức chế (%) = C-T/C *100

Trong đó: C: Kết quả đo OD280 của mẫu không có chất ức chế (blank)

T: Kết quả đo OD280 của mẫu có chất ức chế

Các thí nghiệm được lặp lại 3 lần.

Xác định hoạt tính ức chế trypsin và ɑ-chymotrypsin

Hoạt tính ức chế trypsin và α-chymotrypsin được xác định theo phương pháp

của Jiang et al., 2011.

Xác định hoạt tính ức chế trypsin: Mẫu chứng (blank) được chuẩn bị với

dung dịch đệm Tris-HCl 50 mM (pH 7,8) và cơ chất H-D-Phe-Pip-Arg-pNA (HDAP) 0,5 mM ở 25 oC. Sự hình thành pNA được theo dõi liên tục ở bước sóng

405 nm trong 5 phút. Phản ứng kiểm soát enzyme được nghiên cứu trong cùng

điều kiện với việc bổ sung HDAP (0,5 mM) trong nước khử ion khoảng 15 phút.

Hoạt tính ức chế được xác định bằng cách sử dụng một phần enzyme tương tự như

phản ứng đối chứng với nồng độ chất ức chế 0,5 μM. Hỗn hợp này được ủ trước

15 phút để cho phép hình thành phức chất ức chế proteinase trước khi bổ sung cơ

chất. Bổ sung cơ chất khoảng 15 phút và đo hoạt tính còn lại. Thử nghiệm ức chế

được thực hiện như mô tả ở trên. Ki thu được bằng cách vẽ đồ thị đối ứng của tốc

độ phản ứng thông qua nồng độ chất ức chế dưới các nồng độ cơ chất khác nhau

(0 - 2 mM).

Xác định hoạt tính ức chế ɑ-chymotrypsin: Mẫu đối chứng (blank) được chuẩn bị với dung dịch đệm (50 mM Tris-HCl, pH 7,8 ở 25 oC) và cơ chất 0,5 mM

N-benzoyl-tyrosine ethyl ester (BTEE, Sigma). Phản ứng được theo dõi liên tục ở

bước sóng 253 nm trong 5 phút. Tác dụng của chất ức chế được ước tính bằng

cách đặt vận tốc ban đầu là 100 %, thu được enzyme đơn (không có protein PI-

QT). Thử nghiệm ức chế được thực hiện như mô tả ở trên. Ki thu được bằng cách

vẽ đồ thị đối ứng của tốc độ phản ứng thông qua nồng độ chất ức chế dưới các

52

nồng độ cơ chất khác nhau (0 - 2 mM). Một enzyme đối chứng (control) được xác

định hoạt tính ức chế bằng cách sử dụng dung dịch đệm (990 L) với 10 μL enzyme (1 mg/mL) và ủ với 2 mL BTEE trong 3 phút ở 25 oC. Sau đó đo hoạt tính

enzyme còn lại.

Xác định hoạt độ đặc hiệu

Hoạt độ ức chế đặc hiệu của chất ức chế protease PI-QT được tính bằng công

Hoạt tính phân giải casein (μ/mL)

thức dưới đây và được biểu thị dưới dạng Units/mg protein (Sapna., 2013).

Protein (mg/mL)

Hoạt độ ức chế đặc hiệu =

2.2.8. Phương pháp xác định ảnh hưởng của một số yếu tố đến hoạt tính của

protein PIs tái tổ hợp

Xác định ảnh hưởng của nhiệt độ và pH đến hoạt tính của protein PIs tái tổ

hợp được thực hiện theo phương pháp của Sapna., 2013.

2.2.9. Phân tích thống kê

Các thí nghiệm được thực hiện ba lần và được biểu thị bằng trung bình ± sai

số chuẩn của giá trị trung bình (SEM). Phân tích thống kê và phân tích phương sai

một chiều được thực hiện bằng phần mềm ANOVA, sau đó là các thử nghiệm so

sánh nhiều lần bằng phần mềm SPSS v.22 (SPSS Inc, Chicago, IL, USA). Kết quả

được coi là có ý nghĩa tại P <0,05.

53

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. Thu thập mẫu hải miên

Điều kiện địa lý và môi trường tại biển Quảng Trị:

Môi trường biển là hệ sinh thái nước lớn nhất trên hành tinh và là một trong

những nguồn đa dạng sinh học quan trọng nhất trên thế giới. Các hệ sinh thái biển

có các đặc điểm riêng biệt do sự kết hợp dị thường giữa một vài nhân tố lý học.

Những nơi sinh sóng cho phép rất nhiều cơ thể phát triển như vi khuẩn, tảo, nấm,

hải miên, cá…và chúng có khả năng đối mặt với những điều kiện khắc nghiệt. Đặc

biệt, một số vi sinh vật có khả năng sống trong biển bắc băng dương và các vùng

bắc cực, và các loài đó sinh trưởng dưới áp suất cao, nhiệt độ thấp, độ pH và độ

muối khác nhau, hoặc trong vùng biển bị ô nhiễm cao (Norway, biển Đỏ) (Barone et

al., 2014).

Quảng Trị: nằm trong vùng khí hậu nhiệt đới gió mùa, có nền nhiệt độ cao,

chế độ ánh sáng và mưa, ẩm dồi dào… Cửa Tùng thuộc địa phận xã Vĩnh Quang

huyện Vĩnh Linh, là một vịnh nhỏ ăn sâu vào chân dải đất đồi bazan chạy sát biển,

nơi hiền hoà, kín gió. Cửa Tùng là một phần của biển Đông và cũng là một phần

của bờ biển duyên hải miền Trung. Khu vực biển Quảng Trị thuộc chế độ bán nhật

triều đều tương ứng với chỉ số phân loại triều khoảng 0,35-0,60. Hầu hết các ngày

trong tháng đều có hai lần nước lớn, hai lần nước ròng, chênh lệch độ cao của hai

lần nước lớn và nước ròng rõ rệt. Biển Quảng Trị là nơi có điều kiện rất tốt về hải văn (nhiệt độ nước trung bình hàng năm 23 oC, độ mặn khoảng 32-33 ‰, có nhiều

sóng).

Thu thập, vận chuyển, và bảo quản mẫu:

Bằng phương pháp SCUBA, đã thu thập được 8 mẫu hải miên tại Quảng Trị.

Hải miên được thu thập tại tọa độ là 107°07'06.0"E; 17°04'50.2"N. Các mẫu được

lưu trữ trong 30 % glycerol, bảo quản trong đá, vận chuyển về phòng thí nghiệm và

tiến hành tách chiết DNA của vi sinh vật liên kết hải miên ngay, trong quá trình tách chiết DNA, các mẫu hải miên được lưu giữ ở -25 oC và thời gian tách chiết không

quá 1 tuần.

54

3.2. Kết quả tách chiết DNA metagenome

3.2.1. Tách chiết DNA metagenome của vi sinh vật liên kết hải miên biển Quảng Trị

Sử dụng phương pháp được mô tả ở mục 2.2.1, DNA tổng số của VSV liên kết

hải miên đã được tách chiết từ 8 mẫu hải miên thu thập tại biển Quảng Trị, Việt

Nam (Hình thái và màu sắc hải miên trình bày trong Phụ lục 4). Sản phẩm sau tách

QT9 QT8 QT7 QT6

QT5 QT4 QT2 QT3 M

bp

(3μL) được điện di kiểm tra trên gel agarose 0,8 % (Hình 3.1).

Hình 3.1. Điện di đồ sản phẩm tách DNA của vi sinh vật liên kết hải miên biển Quảng Trị

Giếng M: Thang DNA chuẩn 100bp của hãng Invitrogen

Sử dụng máy Nanodrop để đo nồng độ DNA metagenomes nhận được và đo

độ hấp thu các bước sóng khác nhau để đánh giá độ tinh sạch (Bảng 3.1).

Bảng 3.1. Chất lượng của DNA tổng số tách từ các mẫu hải miên biển Quảng Trị

DNA (ng/µL) A260/A230 A260/A280 TT Mẫu

1 QT2 2,0 202,5 1,80

2 QT3 1,8 165,1 1,71

3 QT4 1,83 160,9 1,54

4 QT5 1,82 178,7 1,32

5 QT6 1,9 39,8 1,62

55

6 QT7 73,5 1,8 1,72

7 QT8 125,8 1,77 1,41

8 QT9 36,5 1,78 1,70

Từ kết quả trên Hình 3.1 và Bảng 3.1 có thể thấy đã tách chiết được DNA tổng

số của VSV liên kết hải miên từ các mẫu hải miên biển Quảng Trị. Tuy nhiên lượng

DNA tách được ở mỗi mẫu khác nhau, có mẫu tách được nhiều DNA (QT2, QT3,

QT4, QT5, QT8), có mẫu tách được ít DNA (QT6, QT7, QT9).

Xử lý mẫu là bước đầu tiên và quan trọng nhất trong một dự án metagenomics.

DNA tách từ mẫu phải đại diện cho tất cả các tế bào có trong mẫu và một lượng

acid nucleic đủ, chất lượng cao cần nhận được để phục vụ cho các nghiên cứu tiếp

theo như tạo thư viện DNA và giải trình tự. Vì vậy, tham khảo theo hướng dẫn

chuẩn bị mẫu để giải metagenomics của một số công ty giải trình tự (Ví dụ: IGA

Tech: Metagenomics sample preparation guidelines) thì nồng độ DNA tối thiểu 20

ng/μL, hàm lượng 1.0 μg, độ tinh sạch A260/A280 ≥ 1,8; ngoài ra băng DNA tổng

số gọn, có kích thước lớn hơn ít nhất 2 kb. Nồng độ DNA càng cao, độ tinh sạch

cao, ít đứt gãy thì khả năng thành công trong việc lập thư viện DNA càng cao. Do

đó, trong số các mẫu tách chiết được chúng tôi lựa chọn mẫu DNA QT2 (nồng độ

DNA: 202,5 ng/µL, độ tinh sạch A260/A230=2,0 và A260/A280=1,80) để giải trình

tự trên hệ Illumina HiSeq 2500 System (BaseClear, Hà Lan). Dữ liệu thô nhận được

đã được xử lý bằng các phần mềm tin-sinh học khác nhau để thu nhận hệ gen của vi

sinh vật liên kết các mẫu hải miên biển Quảng Trị nghiên cứu. Kết quả cụ thể ở Phụ

lục 5.

3.2.2. Định danh hải miên QT2 bằng sinh học phân tử

Đoạn gen 18S rRNA dài khoảng 1,9 kb của mẫu hải miên QT2 đã được

khuếch đại thành công từ DNA tách chiết. Kết quả giải trình tự gen bằng máy ABI

PRISM 3100 và so sánh trình tự nhận được bằng chương trình BLAST (Basic Local

Alignment Search Tool) với các trình tự gen 18S rRNA khác trên NCBI (National

Center for Biotechnology Information) cho thấy đoạn gen 18S rRNA của hải miên

QT2 tương đồng 99,9 % với trình tự gen tương ứng của hải miên Spheciospongia

56

vesparium có mã số AY734440. Vì vậy, chúng tôi đặt tên cho mẫu QT2 là

Spheciospongia vesparium QT2.

M 1

~ 1,9 kb

Hình 3.2. Điện đi đồ trên gen agarose 1 %.

Giếng M: Thang chuẩn DNA 1 kb của hãng Thermo; Giếng 2: Sản phẩm PCR

khuếch đại gen 18S rRNA

3.3. Xây dựng cơ sở dữ liệu DNA metagenome của vi sinh vật liên kết hải miên

Spheciospongia vesparium QT2 biển Quảng Trị, Việt Nam bằng tin sinh học

3.3.1. Lắp ráp reads của DNA metagenome

Sau khi giải trình tự metagenome toàn bộ của mẫu QT2, dữ liệu thô thu được

bao gồm 2 tập tin (R1 và R2) (Hình 3.3). Sau quá trình tinh sạch loại bỏ tất cả

những trình tự không bắt cặp với nhau ở 2 tập tin (những trình tự chất lượng thấp và

ngắn sử dụng phần mềm trimmomatic), tổng số hơn 44 triệu đoạn trình tự paired

reads được dùng để lắp ráp de novo metagenome sử dụng phần mềm SPAdes. Tổng

kích thước hệ lắp ráp thu được là khoảng 418 Mb bao gồm 102.236 contigs. Contig

có kích thước dài nhất là hơn 855 kb, contigs nhỏ nhất là 1.000 bp, độ dài trung

bình là 4.089 bp. Gần 90 % số đoạn trình tự có thể ánh xạ ngược lại với hệ gen lắp

ráp (Bảng 3.2). Điều này chứng tỏ rằng tất cả thông tin đã được chuyển đến tổ hợp

lắp ráp. Kết quả nhận được cho thấy các contigs chủ yếu phân bố trong khoảng từ

1.000 đến 100.000 bp (Hình 3.4). Tỷ lệ GC % trong hệ gen của mẫu QT2 là 61,82

%. Nhìn chung, bộ gen của các vi sinh vật liên kết với hải biên có hàm lượng GC

57

cao. Theo kết quả phân tích metagenomics của hải miên Địa Trung Hải cho thấy tỉ

lệ GC của hệ gen là 58-63 %. Hàm lượng GC tương đối cao là một đặc điểm của

metagenomic hải miên (Horn et al., 2016).

R1

R2

Hình 3.3.Kết quả tinh sạch dữ liệu QT2

Bảng 3.2. Kết quả lắp ráp DNA metagenome của mẫu QT2

Chỉ số QT2 Chỉ số QT2

Tổng số reads (paired-end) 44.117.722 Trung bình của contig (nt) 4.089

Phạm vi độ dài reads (nt) 70-126 N50 (nt) 6.929

Số lượng contigs 102.236 N75 (nt) 1.718

Độ dài tổng số của contigs 418.103.634 Lượng GC (%) 61,82

(nt)

Contig lớn nhất (nt) 855.566 % mapped reads 89,88

Contig ngắn nhất (nt) 1.000

Ghi chú: N50 được định nghĩa là độ dài tối thiểu của contigs cần để bao phủ 50 %

genome.

58

Hình 3.4. Phân bố độ dài contig sau lắp ráp (Trục tung: Số contig, trục hoành: Độ

dài contig)

3.3.2. Kết quả dự đoán gen

Dự đoán gen trong giải trình tự metagenomics vẫn là một vấn đề khó khăn.

Một số phần mềm không đảm bảo có thể lắp ráp được hết các bộ gen riêng lẻ trong

một mẫu đại diện điển hình, do đó, các chuỗi chạy tạo ra một số lượng lớn các

chuỗi ngắn mà không rõ nguồn gốc chính xác. Vì các chuỗi này thường nhỏ hơn độ

dài trung bình của gen nên các thuật toán phải đưa ra dự đoán dựa trên rất ít dữ liệu.

Trong số các phần mềm dự đoán gen hiện nay thì Prodigal và MetageneMark được

đánh giá là có thể dự đoán các gen ngắn với độ chính xác cao (Hyattet al., 2010).

Kết quả dự đoán gen bằng phần mềm Prodigal và MetageneMark nhận được lần

lượt là khoảng 366 Mb (386.416 ORFs) và 361 Mb (380.886 ORFs). Kết quả dự

đoán gen của hai phần mềm khá tương đồng nhau, với gen lớn nhất có kích thước là

66.639 bp, độ dài trung bình là 864 bp và tỷ lệ GC là khoảng hơn 62 %. Sau khi loại

bỏ tất cả những gen có kích nhỏ hơn 250 bp, sử dụng phần mềm CD-HIT với mức

độ tương đồng 90 %, thu được tập gen cuối cùng có tổng kích thước gần 360 Mb

bao gồm 372.732 trình tự gen, trong đó có 262.159 gen hoàn chỉnh (chiếm 70,33 %)

(gen có đủ mã mở đầu và mã kết thúc); 53.162 (14,26 %) gen thiếu mã kết thúc 3’;

49.569 (13,3 %) gen thiếu mã mở đầu 5’ và số lượng gen thiếu cả mã mở đầu và mã

59

kết thúc chỉ có 7.842 gen, chiếm 2,1 %. Phân bố độ dài cho thấy gen dự đoán chủ

yếu có kích thước từ khoảng 250 bp đến khoảng 2.000 bp (Bảng 3.3 và Hình 3.5).

Bảng 3.3. Kết quả dự đoán và kiểm tra tính toàn vẹn của gen (mẫu QT2)

Chỉ số Prodigal Metagenemark Cluster

Tổng gen dự đoán 386.416 380.886 372.732

Tổng độ dài gen dự đoán (nt) 366.878.679 361.181.676 359.967.498

Gen lớn nhất (nt) 66.639 66.639 66.639

Gen ngắn nhất (nt) 250 250 252

Độ dài trung bình của gen 864 864 965

Hàm lượng GC (%) 62,33 62,45 62,40

Tình trạng gen Gen thống nhất giữa hai phần Phần trăm

mềm

Gen hoàn chỉnh 262.159 70,33

Thiếu đầu 3’ 53.162 14,26

Thiếu đầu 5’ 49.569 13,30

Thiếu cả 2 đầu 7.842 2,10

Hình 3.5. Phân bố độ dài gen (Trục tung: Số gen; Trục hoành: Độ dài gen)

60

3.3.3. Kết quả chú giải và phân loại chức năng gen

Trong khi các nghiên cứu trước đây chủ yếu đánh giá đa dạng loài trong cộng

đồng, thì ngày nay, nhiều nghiên cứu về metagenomics đã tập trung vào gen và

chức năng của gen. Một số phần mềm dự đoán gen như: MetaGene Annotator

(MGA), FragGeneScan, Glimmer-MG, GeneMark… được sử dụng để dự đoán tất

cả các khung đọc mở (ORF – open reading frame) từ các contig. Dựa trên các ORF

đã được xác định, sẽ tiếp tục dự đoán bằng cách so sánh ORF với hàng loạt các dữ

liệu khác nhau như: Dữ liệu NCBI NR, MetaHIT, Silva, GreenGene để phân tích độ

đa dạng loài; dữ liệu KEGG, MetaCys để phân loại gen vào các con đường chuyển

hóa khác nhau; dữ liệu Swiss-Prot, Pfam, GO, COG, FIGfam…. để sắp xếp gen vào

các nhóm chức năng (Nguyễn Minh Giang et al., 2014; Carr et al., 2014).

Kết quả chú giải bằng các cơ sở dữ liệu cho thấy, với tổng số 372.732 trình tự

gen (axit amin), có 360.564 (96,74 %) gen được chú giải trên cở sở dữ liệu NR;

266.553 gen được chú giải trên Swiss-Prot chiếm 71,51 %; 274.632 gen chiếm

73,68 % được chú giải trên cơ sở dữ liệu COG; chỉ có 11.974 (3,21 %) gen được

chú giải trên cơ sở dữ liệu CAZy; số gen được chú giải trên cơ sơ dữ liệu GO là

165.552 gen chiếm 44,42 %, 244.436 gen được chú giải trên cơ sơ dữ liệu KEGG

chiếm 65,58 %; đối với cơ sở dự liệu Pfam, có 273.826 (73,46 %) gen được chú giải

(Bảng .4).

Bảng 3.4. Tổng hợp kết quả chú giải chức năng gen (QT2)

Dữ Swiss-

liệu NR Prot COG CAZy GO KEGG Pfam

Chú

giải 360.564 266.553 274.632 11.974 165.552 244.436 273.826

gen

% 96,74 71,51 73,68 3,21 44,42 65,58 73,46

Hình 3.6 mô tả kết quả phân loại chức năng gen trên cơ sở dữ liệu COG. Kết

quả số lượng gen được phân loại chức năng vào nhóm R: Chức năng chung (Genral

function prediction only), tiếp theo là nhóm E: Trao đổi và vận chuyển axít amin

61

(Amino Acid Transport and Metabolism); theo sau là nhóm C: Chuyển hóa và sản

xuất năng lượng (Energy Production and Conversion). Các nhóm chức năng còn lại

có số lượng gen tương đối bằng bằng nhau. Riêng chỉ có nhóm A: Chỉnh sửa và xử

lý RNA (RNA processing and modification) và nhóm B: Cấu trúc và động lực học

của chất nhiễm sắc (Chromatin Structure and dyamics) là hầu như không có gen

tương đồng.

Hình 3.6. Phân loại chức năng gen trên cơ sở dữ liệu COG (Trục tung: Số gen, trục

hoành: Nhóm chức năng gen)

Kết quả phân loại nhóm chức năng enzyme cho thấy, dữ liệu gen chủ yếu

thuộc vào nhóm GH (Glycoside Hydrolase) với khoảng gần 5000 gen, tiếp theo sau

là hai nhóm Carbohydrate Esterase (CE) và Glycosyl Transferase (GT) với khoảng

2500 gen tương đồng. Số lượng đoạn trình tự thuộc nhóm chức năng Carbohydrate

62

Binding Module (CBM) thấp hơn 1 chút, khoảng 2000 trình tự. Các nhóm chức

năng còn lại có số lượng gen tương đồng không đáng kể, khoảng dưới 1.000 trình tự

gen (Hình 3.7).

Hình 3.7.Phân nhóm chức năng của enzyme trên cơ sở dữ liệu CAZy (Trục tung: Số

gen được chú giải, trục hoành: Nhóm chức năng gen)

Kết quả phân loại trên cơ sở dữ liệu KEGG cho thấy gen dự đoán chủ yếu có

chức năng liên quan đến con đường trao đổi chất (M: Metabolism); tiếp theo đó là

nhóm quá trình phát triển tế bào (C: Cellular Process) và nhóm xử lý thông tin di

truyền (G: Gentic Information Processing). Một phần nhỏ gen tham gia vào nhóm

hệ thống sinh vật (O: Organismal Systems) và nhóm bệnh ở người (H: Human

Diseases) (Hình 3.8).

63

Hình 3.8. Kết quả phân loại trên cơ sở dữ liệu KEGG (Trục tung: Nhóm chức năng

gen, trục hoành: Số gen chú giải)

G: Xử lý thông tin di truyền (Gentic Information Processing); C: Quá trình phát

triển tế bào (Cellular Processes); M: Trao đổi chất (Metabolism);

O: Hệ thống sinh vật (Organismal Systems); H: Bệnh ở người (Human Diseases)

64

3.3.4. Đa dạng sinh học vi sinh vật liên kết hải miên Spheciospongia vesparium

QT2 biển Quảng Trị

Vùng siêu biến V4 của gen 16S rRNA vi sinh vật liên kết hải miên

Spheciospongia vesparium QT2 biển Quảng Trị đã được khuếch đại và gắn mã vạch

(barcodes) (Phụ lục 6), sản phẩm PCR được kiểm tra trên agarose gel 1,8 % (Hình

3.9a), cho thấy kích thước tương ứng 300 bp như tính toán lý thuyết. Sản phẩm PCR

sau khi được gắn mã vạch cũng được kiểm tra trên agarose gel 1,8 % (Hình 3.9b).

(a) (b)

Hình 3.9. Điện di đồ sản phẩm PCR trên gel agarose 1,8 %

(a). Giếng 1: Sản phẩm PCR vùng V4 gen 16S rRNA của vi khuẩn liên kết hải miên Spheciospongia vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM

(b). Giếng 3. Sản phẩm PCR sau khi gắn mã vạch của kết hải miên Spheciospongia vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM

Sản phẩm PCR vùng siêu biến V4 gen 16S rRNA sau khi gắn mã vạch đã

được giải trình tự, phân tích và so sánh với cơ sở dữ liệu Silva để xác định tính đa

dạng của vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 ở các mức độ

phân loại khác nhau. Với mẫu hải miên này, có 58,29 % reads (45.965 reads/ 78.849

reads) đạt yêu cầu sử dụng cho phân loại, trong đó 82,93 % thuộc giới (domain) vi

khuẩn, 16,84% thuộc cổ khuẩn (Archaea) và 0,23 % không nhận dạng được (Bảng

3.5; Hình 3.10)

65

Bảng 3.5. Phân loại các reads 16S rRNA của hải miên Spheciospongia vesparium

QT2 theo giới và ngành

Giới Số % tổng số Tên ngành Số % tổng số

reads reads (Phylum) reads reads

Vi khuẩn 38119 82,93 Thaumarchaeota 7742 16,84 (Bacteria)

Cổ khuẩn 7741 16,84 Acidobacteria 1905 4,14 (Archaea)

Không xác

định 106 0,23 Actinobacteria 3225 7,02

(Unclassified)

Bacteroidetes 882 1,92

Chloroflexi 3747 8,15

Deferribacteres 61 0,13

Gemmatimonadetes 3417 7,43

Nitrospirae 839 1,82

Proteobacteria 23658 51,47

Spirochaetes 383 0,83

Unclassified 106 0,23

Đối với cổ khuẩn, chỉ nhận dạng được ngành Thaumarchaeota với tỉ lệ 16,84

% tổng số reads, là một trong những ngành chiếm ưu thế. Ngành Proteobacteria

chiếm tới hơn nửa số reads nhận được, gần 51,5 %. Các ngành chiếm ưu thế khác

trong cộng đồng vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 lần

lượt là Chloroflexi (8,15 % reads), Gemmatimonadetes (7,43 % reads),

Actinobacteria (7,06 % reads), Acidobacteria (4,14 % reads) và Nitrospirae (1,82 %

reads). Các ngành còn lại mỗi ngành chỉ chiếm dưới 1 % tổng số reads.

66

Hình 3.10. Phân loại vi sinh vật liên kết hải miên Spheciospongia vesparium QT2

theo giới (bên trái) và ngành (bên phải)

Các reads tiếp tục được phân loại đến mức thấp hơn là lớp và bộ. Bảng 3.6

và Phụ lục 7 cho thấy 21 lớp vi khuẩn và 36 bộ đã được nhận dạng, trong đó 3 lớp

chiếm đa số (Gammaproteobacteria 22,63 % reads), Marine_Group_I (15,55 %

reads) và Betaproteobacteria (14,59 % reads). Có 0,23 % reads không được nhận

dạng.

Bảng 3.6. Phân loại các reads 16S rRNA vi sinh vật liên kết hải miên

Spheciospongia vesparium QT2 đến lớp và bộ

Lớp % tổng số Bộ % tổng số

reads reads

Gammaproteobacteria 22,63 15,30 Oceanospirillales

Marine_Group_I 15,55 14,59 Nitrosomonadales

Betaproteobacteria 14,59 12,94 Nitrosopumilus

Deltaproteobacteria 8,41 7,88 Unclassified

Gemmatimonadetes 7,43 7,01 Acidimicrobiales

Acidimicrobiia 7,01 5,17 BD2-11_terrestrial_group

4,56 4,87 Alphaproteobacteria Sh765B-TzT-29

Caldilineae 4,33 4,33 Caldilineales

Acidobacteria 3,56 3,10 BPC015

67

TK10 2,06 Alteromonadales 3,07

Cytophagia 1,92 Rhodospirillales 2,99

1,82 PAUC43f_marine_benthic 2,26 Nitrospira _group

Anaerolineae 1,34 Nitrospirales 1,82

Soil_Crenarchaeotic_ 1,29 1,70 Order_II_Incertae_Sedis Group(SCG)

JTB23 1,06 Anaerolineales 1,34

Spirochaetes 0,83 Pseudomonadales 1,27

Holophagae 0,58 Desulfurellales 1,23

SAR202_clade 0,27 GR-WP33-30 1,17

Unclassified 0,23 HOC36 1,04

SC3-20 0,21 Spirochaetales 0,83

JG30-KF-CM66 0,14 Desulfobacterales 0,83

Deferribacteres 0,13 Rhodobacterales 0,79

Chromatiales 0,62

TK85 0,58

E01-9C-26_marine_group 0,56

Xanthomonadales 0,37

Rickettsiales 0,34

Bdellovibrionales 0,30

32-21 0,27

Aeromonadales 0,26

Cytophagales 0,22

Acidobacteriales 0,18

Rhizobiales 0,17

MNG3 0,14

Deferribacterales 0,13

KI89A_clade 0,12

Kordiimonadales 0,12

68

Các bộ có tỉ lệ reads lớn hơn 10 % gồm Oceanospirillales (15,3 % reads),

Nitrosomonadales (14,59 % reads) và Nitrosopumilus (12,94 % reads). Đối với

phân loại mức bộ, có tới 7,88 % reads không được nhận dạng. Ở mức phân loại họ

và chi, số lượng reads không được nhận dạng tăng lên rất nhiều, 58,53 % cho phân

loại mức họ và tới 72,07 % cho phân loại đến chi.

Bảng 3.7: Phân loại reads 16S rRNA vi sinh vật liên kết hải miên

Spheciospongia vesparium QT2 đến họ; chi

Họ % tổng số Chi % tổng số reads

reads

Unclassified Unclassified 72,07 58,53

Hahellaceae Endozoicomonas 13,94 14,33

Sva0996_marine_group 6,47 Caldilinea 4,33

Caldilineaceae 4,33 Shewanella 3,07

Shewanellaceae 3,07 Nitrospira 1,82

Nitrospiraceae 1,82 Defluviicoccus 1,61

Rhodothermaceae 1,70 Pseudomonas 0,92

Rhodospirillaceae 1,61 Spirochaeta 0,38

Desulfurellaceae 1,23 Acinetobacter 0,35

Anaerolineaceae 1,12 Bdellovibrio 0,30

Pseudomonadaceae 0,92 Aeromonas 0,26

Nitrospinaceae 0,83 Granulosicoccus 0,23

OCS155_marine_group 0,55 Persicobacter 0,22

Rhodobacteraceae 0,38 Pseudovibrio 0,14

Spirochaetaceae 0,38 Ruegeria 0,13

Sinobacteraceae 0,38 Rhodovulum 0,11

Moraxellaceae 0,35 Pseudospirillum 0,11

TK34 0,34

Bdellovibrionaceae 0,29

Aeromonadaceae 0,26

Granulosicoccaceae 0,22

Flammeovirgaceae 0,22

69

Acidobacteriaceae 0,18

PAUC34f 0,13

Kordiimonadaceae 0,12

Oceanospirillaceae 0,11

SAR86_clade 0,10

Trong số 22 họ nhận dạng, chỉ có họ Hahellaceae chiếm tỉ lệ 14,33 % tổng số

reads, các họ khác chiếm tỉ lệ reads trên 1 % gồm Sva0996_marine_group, một họ

candidate (6,47 % reads), Caldilineaceae (4,33 % reads), Shewanellaceae (3,07 %

reads), Nitrospiraceae (1,82 % reads), Rhodothermaceae (1,7 % reads),

Rhodospirillaceae (1,61 %), Desulfurellaceae (1,23 %) và Anaerolineaceae (1,12

%). Tổng cộng có 16 chi vi khuẩn liên kết hải miên Spheciospongia vesparium QT2

được nhận dạng, trong đó chi Endozoicomonas chiếm đa số (14,94 % reads), chi

Caldilinea chiếm 4,33 %, chi Shewanella 3,07 %, Nitrospira chiếm 1,82 % reads và

Defluviicoccus chiếm 1,61 % reads. Các chi còn lại mỗi chi chỉ chiếm không tới 1

% tổng số reads (Bảng 3.7; Hình 3.11).

Hình 3.11. Phân loại vi sinh vật liên kết hải miên Spheciospongia

vespariumQT2 biển Quảng Trị theo chi

Đã nhận dạng 10 ngành, 21 lớp, 36 bộ, 22 họ và 16 chi vi khuẩn liên kết với hải

miên Spheciospongia vesparium QT2 biển Quảng Trị.

70

Sự đa dạng vi sinh vật liên kết hải miên biển được các nhà khoa học quan

tâm nghiên cứu từ lâu do tầm quan trọng của chúng trong sinh thái hải miên cũng

như khả năng sản sinh các chất có hoạt tính sinh học. Theo Li et al. (2006), vi

khuẩn liên kết hải miên từ cùng một vị trí địa lý có sự đa dạng vi khuẩn trội khác

nhau, chứng tỏ vi khuẩn liên kết hải miên là đặc hiệu vật chủ. Ví dụ, Proteobacteria

cấu trúc α, β và γ chiếm đa số trong hải miên, và vi khuẩn có mối quan hệ phát sinh

loài gần cũng được tìm thấy trong các loại hải miên khác nhau (Li et al., 2006). Kết

quả nhận được đối với cộng đồng vi sinh vật liên kết hải miên Spheciospongia

vesparium QT2 cho thấy, các ngành chủ yếu cũng được tìm thấy trong các loài hải

miên khác (Proteobacteria, Gemmatimonadetes, Acidobacteria, Actinobacteria,

Chloroflexi). Riêng ngành Thaumarchaeota phát hiện khá nhiều trong loài hải miên

này, chiếm tới 16,84 % tổng số reads. Các chi trong hải miên Spheciospongia

vesparium QT2 cũng chủ yếu là từ α và γ proteobacteria (Defluviicoccus và

Shewanella, tương ứng), kết quả này trùng với kết quả của Li et al (2006); Hardoim

&Costa (2014). Ngoài ra, Gemmatimonadetes và Nitrospira cũng được tìm thấy ở

Spheciospongia vesparium QT2 và một số loài hải miên Ircinia (Hardoim & Costa.,

2014).

Kết quả nghiên cứu bằng phương pháp 16S metagenomics cho thấy có 15

ngành vi sinh vật (có độ phong phú lớn hơn 0,1 %) đã được tìm thấy liên kết với các

mẫu hải miên Việt Nam (Phụ lục 7). Trong khi các nghiên cứu dựa vào phương

pháp phân lập truyền thống chỉ phân lập được một lượng số lượng hạn chế các vi

sinh vật liên kết với hải miên, phương pháp nghiên cứu đa dạng vi sinh vật không

qua nuôi cấy như 16S metagenomics cho phép phát hiện được nhiều vi sinh vật mới

và chưa được phân lập trước đây. Các nghiên cứu dựa vào phân lập thường chỉ phân

lập được một số các vi khuẩn thuộc một vài ngành phổ biến như Proteobacteria (α

và γ - Proteobacteria), Bacteroidetes, Cyanobacteria, Firmicutes. Trong đó các Chi

như Bacillus, Streptomyces, Pseudovibrio, Vibrio, …. thường được phân lập lặp đi

lặp lại từ nhiều mẫu môi trường khác nhau (đất, hải miên, trầm tích, …). Vì vậy

những vi khuẩn này thường được biết đến như những vi khuẩn cỏ dại “weedy

bacteria” bởi chúng có thể phát triển nhanh trên các môi trường phân lập. Tuy

nhiên, bằng phương pháp 16S metagenomics chúng tôi đã phát hiện được nhiều

71

ngành hiếm được phân lập hoặc chưa được phân lập thông qua phương pháp nuôi

cấy như Thaumarchaeota, Acidobacteria, Chloroflexi, Deferribacteres,

Deinococcus-Thermus, Planctomycetes, Delta-proteobacteria, Epsilon-

proteobacteria, Beta-proteobacteria, Spirochaetes, Verrucomicrobia (Phụ lục 8).

3.3.5. Khai thác gen có hoạt tính ức chế protease (PIs) dựa trên cơ sở dữ liệu

(CSDL) metagenomics

Bằng các công cụ tin sinh học, đã khai thác được 50 gen hoàn chỉnh liên

quan đến chất ức chế protease từ CSDL là metagenomics QT2 (Quảng Trị) (Bảng

3.8). Trong đó có 28 gen, chiếm 56 % được chú giải thuộc họ Serpin (Serine

protease inhibitor); còn lại 22 gen (44 %) thuộc nhóm Inter-alpha-trypsin inhibitor.

Gen ngắn nhất là 198 bp, mã hóa cho 66 axit amin; gen dài nhất là 2406 bp, mã hóa

cho 802 axit amin. Một số gen cũng đã được xác định là gen mới ở Việt Nam (Bảng

3.9). Nhằm xác định lại độ tin cậy của kết quả chú giải trên, một số trình tự axít

amin đã được lựa chọn để so sánh protein trên NCBI. Kết quả sau so sánh cho thấy

các axít amin này thuộc nhóm ức chế protease tương ứng với kết quả chú giải (Phụ

lục 9).

Bảng 3.8. Kết quả sàng lọc các gen có hoạt tính protease inhibitor từ CSDL

TT

metagenomics QT2

Uni_

UniProtKB_

Uni_

Uni_

Acid

Contig

Locus_tag

amin

accession_1

product

score

Evalue

1

contig000016 Prokka_05808

442

Q5RB37

ITIH chain H3

89.4

1.00E-17

2

contig000019 Prokka_06418

323

O02668

ITIH chain H2

61.2

5.00E-09

3

contig000019 Prokka_06445

398

Q61703

ITIH chain H2

71.6

4.00E-12

4

contig000046 Prokka_10704

429

Q9D154

Serpin

184

6.00E-52

5

contig000046 Prokka_10705

405

Q5BIR5

Serpin

214

1.00E-63

6

contig000127 Prokka_20087

328

Q3T052

ITIH chain H4

62

3.00E-09

7

contig000172 Prokka_24210

400

Q8BJD1

ITIH chain H5

71.6

4.00E-12

8

contig000213 Prokka_27784

418

Q5BIR5

Serpin B8

216

5.00E-64

72

9

contig000213 Prokka_27785

405

Q99574

Neuroserpin

209

2.00E-61

10

contig000314 Prokka_34813

736

A6X935

ITIH

171

6.00E-43

11

231

6.00E-70

contig000433 Prokka_41698

419

Q5BIR5

Serpin B8

12

contig000631 Prokka_52340

325

Q3T052

ITIH chain H4

58.9

3.00E-08

13

contig000726 Prokka_56621

398

Q61703

ITIH chain H2

57

2.00E-07

14

contig000981 Prokka_67673

428

Q90935

Neuroserpin

214

1.00E-62

15

contig001114 Prokka_72799

419

Q5BIR5

Serpin B8

219

4.00E-65

16

contig001390 Prokka_82416

386

A6X935

ITIH

114

4.00E-26

17

contig001690 Prokka_91580

454

Q5BIR5

Serpin B8

152

5.00E-40

18

contig001737 Prokka_93032

412

Q5BIR5

Serpin B8

214

1.00E-63

19

contig001737 Prokka_93033

223

Q99574

Neuroserpin

87.8

6.00E-19

20

contig001813 Prokka_95168

412

Q99574

Neuroserpin

207

3.00E-60

21

contig002069 Prokka_102253

280

Q8PTN8

serpin

175

7.00E-50

22

contig002236 Prokka_106102

324

A2VE29

ITIH chain H5

64.7

4.00E-10

23

contig002339 Prokka_108516

478

Q14624

ITIH chain H4

63.5

2.00E-09

24

contig002592 Prokka_114432

355

Q90935

Neuroserpin

197

3.00E-57

25

contig002838 Prokka_119867

334

Q14624

ITIH chain H4

55.5

3.00E-07

26

contig003102 Prokka_125566

401

Q8BJD1

ITIH chain H5

58.5

5.00E-08

27

contig003892 Prokka_140659

323

Q3T052

ITIH chain H4

67

7.00E-11

28

contig004584 Prokka_152589

631

Q61703

ITIH chain H2

66.2

6.00E-10

29

contig005997 Prokka_173538

430

Q8PTN8

Serpin

206

2.00E-59

30

contig006820 Prokka_184178

417

Q5BIR5

Serpin B8

237

5.00E-72

31

contig007047 Prokka_186946

497

Q61703

ITIH chain H2

122

2.00E-28

32

contig007181 Prokka_188591

146

Q96P15

Serpin B11

105

5.00E-26

73

33

contig007964 Prokka_197295

66

Q90935

Neuroserpin

51.6

7.00E-08

34

contig008443 Prokka_202257

443

P50453

Serpin B9

213

2.00E-62

35

contig010618 Prokka_222724

382

Q8BJD1

ITIH chain H5

64.3

8.00E-10

36

contig012483 Prokka_237228

378

Q9JK88

Serpin I2

57

1.00E-07

37

contig015758 Prokka_258680

430

Q9S7T8

Serpin-ZX

143

1.00E-36

38

contig020504 Prokka_283125

394

Q90935

Neuroserpin

73.2

8.00E-13

39

contig020772 Prokka_284248

402

Q90935

Neuroserpin

213

1.00E-62

40

contig020806 Prokka_284376

802

Q61703

ITIH chain H2

142

2.00E-33

41

contig020909 Prokka_284844

362

A6X935

ITIH

104

6.00E-23

42

contig021896 Prokka_288956

722

P56652

ITIH chain H3

170

8.00E-43

43

contig024785 Prokka_300295

303

Q29052

ITIH chain H1

55.5

3.00E-07

44

contig030105 Prokka_318139

717

Q9GLY5

ITIH chain H3

116

2.00E-25

45

contig033816 Prokka_328453

391

B4USX2

Serpin B10

220

1.00E-65

46

contig038363 Prokka_339464

376

Q9CQV3

Serpin B11

82

7.00E-16

47

contig040171 Prokka_346561

423

Q99574

Neuroserpin

211

1.00E-61

48

contig044964 Prokka_352966

457

Q5JJ64

Serpin

249

7.00E-76

49

contig060339 Prokka_377096

149

Q9UIV8

Serpin B13

66.6

4.00E-12

50

contig067320 Prokka_385523

98

Q5NBM0

Putative serpin

66.2

1.00E-12

Chú thích: ITIH: Inter-alpha-trypsin inhibitor heavy; Serpin: serine protease inhibitor; I: Inhibitor

Bảng 3.9. Ví dụ về gen mới được sàng lọc

STT Tên gen Đặc điểm Chiều dài Nu Độ tương đồng (%)

1 1398 55.98 Predicted_gene_ 346561

2 Predicted_gene_ 1893 49.75 Neuroserpin; AltName: Full=Peptidase inhibitor 12; Short=PI-12; AltName: Full=Serpin I1; Flags: Precursor Inter-alpha-trypsin inhibitor

74

91473

heavy chain H2; Short=ITI heavy chain H2; Short=ITI- HC2; Short=Inter-alpha- inhibitor heavy chain 2

Việc phát hiện các con đường sinh tổng hợp quan tâm trong hệ cộng sinh

phức tạp như hải miên là thách thức cực lớn bởi sự đa dạng cao của hệ vi sinh vật

liên kết. Vì vậy, chiến lược khai thác (mining) metagenome được áp dụng để phát

hiện các hợp chất chưa biết từ vi sinh vật không nuôi cấy được và có thể khám phá

các hợp chất được vi sinh vật liên kết sản sinh (Barone et al., 2014).

Các chiến lược metagenomics được sử dụng thành công để phân lập và xác

định các enzyme có hoạt tính sinh học mới, hoặc các chất chuyển hóa thứ cấp từ các

thành phần không thể phục hồi của các cộng đồng vi sinh vật từ các mẫu môi trường

khác nhau. Các enzyme thích nghi lạnh có thể hoạt động mạnh hơn tới 10 lần ở

nhiệt độ thấp và trung bình (Singh., 2010; Selvin et al., 2012; Baroneet al., 2014;

Alma’abadi et al., 2015,…). Một nghiên cứu trước đây đã xây dựng một thư viện

plasmid chứa khoảng 50.000 bản sao từ DNA metagenomics phân lập ở các mẫu

nước biển (Jiang et al., 2010). Các mẫu nước biển được thu thập từ Biển Đông.

DNA plasmid từ các dòng vô tính được chọn ngẫu nhiên và được cắt bằng enzyme

giới hạn EcoRІ. Các DNA có kích thước khoảng 1-15 kb, trung bình khoảng 4,0 kb.

Kết quả này xác nhận rằng thư viện metagenomics biển có chứa các phân tử DNA

từ bộ gen không bị biến đổi. Các metagenome biển của vi sinh vật xuất hiện tự

nhiên cũng được chứng minh có chứa một nhóm gen rất lớn. Hầu hết các gen này

không được tìm thấy bằng phương pháp phân lập truyền thống. Từ thư viện này,

Jiang et al. (2011) đã khai thác 1 gen mới, được gọi là Spi1C. Gen này có khung

đọc mở dài 642 bp, với hàm lượng G + C là 49,92 %, mã hóa 214 axít amin. Trọng

lượng phân tử tương đối được dự đoán (Mr) là khoảng 24 kDa và điểm đẳng điện là

4,33. Những giá trị này phù hợp với trọng lượng phân tử khoảng 20-40 kDa quan

sát được của đa số các protein serpin (Torres-Castillo et al., 2009). Chỉ số không ổn

định của Spi1C đã được xác định là 24,90, như vậy, Spi1C được coi là một Serpin

tương đối ổn định. Trình tự axít amin của Spi1C đã được so sánh (BLAST) trên cơ

sở dữ liệu NCBI (National Center for Biotechnology Information) và ExPaSy

(Expert Protein Analysis System). Kết quả cho thấy protein Spi1C tương đồng 57-

75

60 % với các chất ức chế protease Serpin I4. Trong nghiên cứu này, chúng tôi cũng

đã sàng lọc được trên 50 % gen (28 gen) liên quan đến chất ức chế serpin, và kết

quả so sánh trên NCBI, ExPaSy cho thấy các gen này tương đồng trên 50 % với các

chất ức chế serpin khác (Phụ lục 9). Theo hiểu biết của chúng tôi thì đây là công

trình thứ hai công bố về khai thác gen ức chế protease từ cơ sở dữ liệu

metagenomics từ môi trường biển. Chất ức chế serpin là một siêu họ quan trọng và

lớn nhất của chất ức chế protease. Chúng hoạt động như một điều biến (modulator)

và tham gia vào rất nhiều quá trình phân giải protein quan trọng, liên kết hóa trị với

protein đích và bất hoạt chúng (Jiang et al., 2011). Do đó kết quả nghiên cứu của

chúng tôi mở ra một tiềm năng triển vọng về khai thác các gen này để nghiên cứu

và ứng dụng trong các ngành y dược.

3.4. Nghiên cứu biểu hiện gen ức chế protease (PIs) trong hệ Escherichia coli

Dựa vào kết quả khai thác gen PIs từ CSDL metagenomics QT2, đã thiết kế

một số cặp mồi để tách dòng các gen ức chế protease thuộc họ serpin mong muốn

với template là DNA metagenome mẫu QT2 bằng phương pháp PCR. Tuy nhiên,

mặc dù đã thay đổi rất nhiều thông số trong chu trình PCR nhưng vẫn không tách

dòng được theo phương pháp PCR thông thường. Vì vậy, dựa vào kết quả sàng lọc

gen (Bảng 3.8), trình tự gen contig 000046, contig000433 và contig020504 đã được

tổng hợp (GenScript) và đưa vào vector tách dòng pUC57. Các gen lựa chọn ngoài

là gen được chú giải thuộc họ serpin (ức chế serine protease) còn có một số ưu điểm

hơn các contig khác như: gen mới, trình tự gen hoàn chỉnh (có độ tương đồng dưới

85 % với các gen liên quan đến chất ức chế protease đã được công bố trên ngân

hàng gen NCBI), trọng lượng protein dự đoán khoảng 30-55 kDa (thuận tiện cho

quá trình biểu hiện, tinh sạch và thu hồi protein tái tổ hợp), ngoài ra, các contig này

đều có giá trị Uni-evalue cao và tin cậy. Các contig 000046, contig000433 và

contig020504 được đặt tên là PI-QT, PI-QT1 và PI-QT2, tương ứng.

Trong quá trình nghiên cứu, đã thiết kế thành công các vectơ biểu hiện pET-

32a(+) trong hệ E. coli và vectơ pPIC9 biểu hiện trong P. pastoris mang 3 gen PI-

QT, PI-QT1 và PI-QT2. Tuy nhiên, các gen PI-QT1 và PI-QT2 biểu hiện protein tái

tổ hợp nằm trong cặn tế bào ở dạng không tan trong hệ E.coli BL21 (DE3) và không

biểu hiện được trong hệ P. pastoris SDM1168 dưới các điều kiện nghiên cứu. Chỉ

76

có gen PI-QT biểu hiện trong cả hệ E. coli và P. pastoris thu được protein tái tổ hợp

ở trạng thái tan. Vì vậy, trong luận án này chỉ báo cáo về quá trình biểu hiện gen PI-

QT trong 2 hệ biểu hiện nghiên cứu.

3.4.1. Phân tích trình tự a xít amin và cây phân loại của protein PI-QT

Gen PI-QT có kích thước 1287 bp, mã hóa cho 429 axít amin, trọng lượng

protein dự đoán khoảng 50 kDa, điểm đẳng điện theo lý thuyết là 4.56. So sánh

trình tự axít amin của PI-QT với các trình tự trong cơ sở dữ liệu NCBI cho thấy

protein PI-QT tương đồng với các serpin khoảng 50 – 55 % và peptide PI-QT có

các vùng bảo thủ giống với các trình tự của protein này trong vi sinh vật (Hình

3.12).

Hình 3.12: So sánh trình tự axít amin của protein PI-QT với các trình tự

tương đồng trên cơ sở dữ liệu NCBI

77

Các chuỗi peptide được xử lý bằng phần mềm ClustalW. Các serpin đã biết

(từ CSDL NCBI) bao gồm: RKU17271, RKU16626, RKU24896, RKU24895,

RKU11755 (chất ức chế protease Serpin I4 từ vi khuẩn); RKZ34327 (protein vi

khuẩn họ serpin); WP_068816727 (chất ức chế protease Serpin I4 từ vi khuẩn

Phormidesmis priestleyi), WP_058997120 (chất ức chế protease Serpin I4 từ vi

khuẩn Leptolyngbya sp. NIES-2104), WP_106255732 (chất ức chế protease Serpin

I4 từ vi khuẩn Leptolyngbya frigida), WP_048868337 (chất ức chế protease Serpin

I4 từ vi khuẩn Scytonema tolypothrichoides), RCJ36945 (chất ức chế protease

Serpin I4 từ vi khuẩn Nostoc minutum NIES-26), WP_092470061 (chất ức chế

protease Serpin I4 từ vi khuẩn Desulfallas arcticus), WP_041285583 (chất ức chế

protease Serpin I4 từ vi khuẩn Desulfallas gibsoniae), AGL02566 (chất ức chế

protease Serpin I4 từ vi khuẩn Desulfallas gibsoniae DSM 7213).

Hình 3.13: (A) Mối quan hệ phát sinh gen của protein PI-QT với các serpin

khác. (B) Cấu trúc protein của PI-QT đã được dự đoán bằng SWISS-MODEL. (C)

Cấu trúc protein của PI-QT đã được dự đoán bằng (PS)2-v2.

Cây phân loại protein dựa trên phương pháp neighbor-joining giữa protein

PI-QT với 2 loại serpin vi khuẩn khác đã được xây dựng (Hình 3.13 A): một loại

serpin từ một ngành ứng viên của vi khuẩn ban đầu được xác định trong hệ vi sinh

78

vật của hải miên biển và một serpin khác từ vi khuẩn ngành Firmicutes và

Cyanobacteria. Dựa trên dữ liệu so sánh, protein PI-QT có thể thấy là một loại

serpin vi khuẩn mới. Cấu trúc protein của PI-QT được dự đoán theo mô hình

SWISS- MODEL (Hình 3.13 B) và (PS) 2-v2 (Hình 3.13 C).

Gen PI-QT cũng đã được đăng ký trên ngân hàng gen NCBI với mã số

MK359987.1 (Phụ lục 10).

3.4.2. Thiết kế vectơ biểu hiện pET-32a(+) mang gen PI-QT

Gen PI-QT được gắn thêm 2 điểm cắt của enzyme giới hạn EcoRI và NotI

vào hai đầu của gen và tách dòng vào vectơ pUC57 (GenScript, Mỹ). Do đó, để gắn

gen PI-QT vào vectơ biểu hiện pET-32a(+), vectơ pUC57 chứa gen PI-QT và pET-

32a(+) đã được xử lý bằng enzyme EcoRI và NotI (Hình 3.14 A), sau đó được tinh

sạch lại bằng kít tinh sạch gel (Fermentas, Mỹ).

M 1 2 3 M 1 2 3 4 5

6.0 kb

2.7 kb 1.3 kb

Hình 3.14. Gel agarose của vectơ cắt bằng EcoRI/NotI (A) và gel agarose của plasmid

tái tổ hợp được cắt bằng enzyme EcoRI/ NotI (B)

(A): giếng M: Marker DNA 1 kb (Thermo); giếng 1: Vectơ pET-32a(+) cắt mở vòng

bằng EcoRI/NotI; giếng 2: Gen PI-QT tinh sạch; giếng 3: Vectơ [pUC57/ PI-QT] được

cắt bằng EcoRI/NotI.

(B): giếng M: Marker 1kb (Thermo); giếng 1: Plasmid [pET-32a(+)/PI-QT]; giếng 2, 3,

4: Plasmid [pET-32a(+)/PI-QT] cắt bởi enzyme EcoRI/ NotI; giếng 5: Vectơ pET-

32a(+).

79

Gen PI-QT được đưa vào vectơ biểu hiện pET-32a(+) đã mở vòng sử dụng

enzyme T4 DNA ligase, và biến nạp vào chủng E. coli TOP10F', sau đó trải trên đĩa

LB có bổ sung ampicillin (50 μg/mL). Một vài khuẩn lạc trắng và 1 khuẩn lạc xanh

được chọn ngẫu nhiên để tách plasmid và cắt plasmid tách được bằng enzyme

EcoRI và NotI. Phân tích trên gel agarose 1 % cho thấy có 1 băng ~ 1,3 kb (tương

đương kích thước của gen PI-QT) và 1 băng khoảng 5,9 kb (tương ứng với kích

thước của vectơ pET-32a(+) (Hình 3.14 B).

Để xác nhận gen PI-QT đã được chèn thành công vào vectơ biểu hiện, các

plasmid đã được giải trình tự và so sánh với trình tự gen PI-QT được thiết kế. Các

kết quả giải trình tự nhận được cho thấy, trình tự gen được đưa vào vectơ pET-

32a(+) tương đồng 100 % với trình tự PI-QT được thiết kế (Phụ lục 11), do đó

chúng tôi có thể khẳng định gen PI-QT đã được chèn thành công vào vectơ biểu

hiện pET-32a(+) để tạo thành vectơ tái tổ hợp [pET-32a(+)/PI-QT].

3.4.3. Biểu hiện gen PI-QT trong E. coli chủng BL21(DE3)

Vectơ tái tổ hợp [pET-32a(+)/PI-QT] được biến nạp vào chủng chủ E. coli

BL21(DE3) bằng phương pháp sốc nhiệt và cấy trải trên môi trường LBamp qua

đêm. Kết quả nhận được cho thấy trên đĩa thạch xuất hiện những khuẩn lạc màu

trắng được cho là mang vectơ tái tổ hợp. Chọn 3 khuẩn lạc bất kỳ để nuôi trong môi

trường lỏng đến khi OD600 đạt khoảng 0.8-1, cảm ứng IPTG 1 mM trong 4 h ở 37 oC. Protein biểu hiện được kiểm tra trên gel SDS-PAGE 12,6 % (Hình 3.15).

Kết quả nhận được trên điện di đồ Hình 3.15 cho thấy, tất cả các dòng E. coli

mang vectơ [pET-32a(+)/PI-QT] chọn lựa đều xuất hiện một băng biểu hiện vượt

mức khoảng 64 kDa (Hình 3.15, giếng 3, 5, 7), tương ứng với kích thước lý thuyết

của protein PI-QT dung hợp với đuôi peptide TRx-his-tag. Trong khi đối chứng âm

(Hình 3.15, giếng 1) là dòng chỉ mang vectơ pET-32a(+) và dòng mang vectơ tái tổ

hợp nhưng không được cảm ứng IPTG (Hình 3.15; giếng 2, 4, 6) đều không có băng

protein này.

80

Hình 3.15: Kết quả điện di PAGE 12,6 % kiểm tra E. coli BL21 (DE3)/[pET- 32a(+)/PI-QT] biểu hiện ở 37 oC

Giếng M: Marker protein của hãng Novagen; giếng 1: E. coli BL21 (DE3)/pET-

32a(+); giếng 2, 4, 6: E. coli BL21(DE3)/[pET-32a(+)/PI-QT] không cảm ứng IPTG

dòng 1, 2, 3, tương ứng; giếng 3, 5, 7: E. coli BL21(DE3)/[pET-32a(+)/PI-QT] cảm

ứng IPTG dòng 1, 2, 3, tương ứng.

Kiểm tra trạng thái biểu hiện (theo phương pháp 2.2.5 đã được mô tả) cho

thấy protein biểu hiện đa số tồn tại ở trạng thái không tan (Hình 3.16, giếng 2).

PI-QT ~64 kDa

M 1 2

Hình 3.16. Kiểm tra trạng thái của protein PI-QT biểu hiện. Giếng M: Marker

protein của hãng iNtRON; Giếng 1: Protein tổng số từ E. coli BL21(DE3)[pET-

32a(+)/PI-QT] pha tan; Giếng 2: Protein tổng số từ E. coli BL21(DE3)[pET-

32a(+)/PI-QT] pha không tan

81

3.4.4. Nghiên cứu điều kiện thích hợp nhất để thu protein tái tổ hợp PI-QT ở

trạng thái tan nhiều nhất.

Ảnh hưởng của nồng độ IPTG đến sự biểu hiện protein PI-QT

Sự tổng hợp protein PI-QT được điều khiển bởi promoter T7 trên vectơ pET-

32a(+). Promoter này được cảm ứng bởi sự có mặt của IPTG trong môi trường nuôi

cấy. Theo một số nghiên cứu, nếu cảm ứng IPTG ở nồng độ quá thấp sẽ cản trở quá

trình phiên mã, làm giảm lượng protein ngoại lai tạo ra (Dương Thu Hương et al.,

2016). Cảm ứng IPTG ở nồng độ cao cũng có thể gây độc tế bào, ức chế sự sinh

trưởng của vi khuẩn. Vì vậy, trong thí nghiệm này chúng tôi khảo sát khả năng biểu

hiện của protein PI-QT ở các nồng độ IPTG cảm ứng 0; 0,5; 1,0; 1,5 mM, mật độ tế bào trước khi cảm ứng OD600 khoảng 0,8-1; cảm ứng ở 37 oC, thời gian cảm ứng 4

h. Kết quả biểu hiện được kiểm tra trên gel SDS-PAGE 12,6% (Hình 3.17).

Hình 3.17. Protein PI-QT biểu hiện trong E. coli dưới các nồng độ IPTG khác nhau.

Giếng M: Marker protein (Novagen); Giếng 1, 3, 5, 7: Protein tổng số từ E. coli

BL21(DE3)/[pET-32a(+)/PI- QT] trước cảm ứng; Giếng 2, 4, 6, 8: Protein tổng số

từ E. coli BL21(DE3)/[pET-32a(+)/PI- QT] cảm ứng IPTG ở các nồng độ 1,5; 1,0;

0,5; 0 mM, tương ứng; Giếng 9: Protein tổng số của E. coli không mang gen PI-QT.

82

Kết quả trên Hình 3.17 cho thấy protein PI-QT biểu hiện tốt khi được cảm

ứng 1,0 mM IPTG (giếng 4) và tổng hợp được rất thấp khi không có chất cảm ứng

hoặc nồng độ IPTG thấp (0,5 mM) hoặc cao (1,5 mM). Tuy nhiên protein PI-QT

biểu hiện được vẫn tồn tại chủ yếu ở trạng thái không tan.

Ảnh hưởng của nhiệt độ và thời gian cảm ứng đến sự tạo protein PI-QT dạng tan

Có nhiều nghiên cứu đã xác định nhiệt độ tối ưu cho sinh trưởng của E. coli là 37 oC, tuy nhiên đây không phải là điều kiện tối ưu tạo ra sản phẩm ngoại lai (Đỗ

Thị Huyền et al., 2008). Nhiệt độ càng cao, khả năng đào thải plasmid càng lớn

(Lee et al., 2002). Khi biểu hiện quá mạnh ở trong tế bào, protein hình thành cấu

trúc bậc ba sai lệch, dẫn đến protein tạo ra không có hoạt tính sinh học (Đỗ Thị

Huyền et al., 2008). Qua nhiều thực nghiệm nghiên cứu, các nhà khoa học chỉ ra

rằng, với chủng E. coli điều kiện tối ưu cho sự biểu hiện tạo protein ngoại lai tốt nhất là 25-30 oC (Chou., 2007). Ngoài ra, nhiệt độ biểu hiện thấp sẽ hạn chế sự phân

cắt protein đích bởi protease nội bào, làm tăng lên đáng kể lượng protein tái tổ hợp

có hoạt tính sinh học (Andrea., 2004). Có nhiều chiến lược đã được sử dụng để

tránh protein biểu hiện tạo thành thể vùi (inclusion bodies) trong đó có biểu hiện ở

nhiệt độ thấp (Fakruddin et al., 2013).

Vì vậy, để tìm điều kiện nhiệt độ và thời gian biểu hiện thích hợp nhất nhằm

thu được protein dạng tan nhiều nhất, chúng tôi tiến hành khảo sát biểu hiện protein

PI-QT trong E. coli dưới các nhiệt độ khác nhau, thời gian cảm ứng đối với từng nhiệt độ cũng thay đổi (4 h ở 30 oC, 37 oC), 5 h (25 oC), 6 h (20 oC). Sau đó xác

định trạng thái biểu hiện ở các nhiệt độ này. Kết quả thu được, ở các nhiệt độ nghiên cứu đều có sự biểu hiện protein PI-QT. Cảm ứng ở nhiệt độ 30 oC và 37 oC

cho thấy hàm lượng protein biểu hiện nhiều nhất nhưng protein tan chỉ khoảng hơn 50 %. Ở 20 oC, lượng protein tái tổ hợp thu được rất thấp, không đáng kể, hầu như

không nhìn thấy trên băng điện di SDS 12,6 %. Protein PI-QT tồn tại ở trạng thái tan nhiều nhất, trên 90 % khi cảm ứng ở 25 oC, nhưng hàm lượng protein PI-QT thu

được không nhiều (Hình 3.18b). Như vậy, có thể thấy nhiệt độ ảnh hưởng rất lớn

đến trạng thái của protein tái tổ hợp sau quá trình biểu hiện (Hình 3.18a).

83

100

600

500

80

400

60

%

300

%

40

200

mg/l

20

100

0

0

20 25 30 37 Nhiệt độ cảm ứng (0C)

1 2 3 M 4 5

(a) (b

Hình 3.18. Ảnh hưởng của nhiệt độ lên khả năng tạo protein PI-QT tan.

(a) Trạng thái tan của protein PI-QT (%) và hàm lượng protein tạo ra khi biểu hiện

ở các nhiệt độ khác nhau.

(b) Điện di SDS-PAGE 12,6 %

Giếng 1: E. coli BL21(DE3)/[pET-32a(+)]; giếng 2: E. coli BL21(DE3)/[pET-

32a(+)/PI-QT] không cảm ứng IPTG; giếng 3: E. coli BL21 (DE3)/[pET-32a(+)/PI- QT] cảm ứng 1 mM IPTG 25 oC; giếng M: Marker protein của hãng iNtRON; 4:

Protein tổng số từ E . coli BL21(DE3)/[pET-32a(+)/PI-QT] pha không tan; giếng 5:

Protein tổng số từ E. coli BL21(DE3)/[pET-32a(+)/PI-QT] pha tan.

Ảnh hưởng của mật độ tế bào trước khi cảm ứng đến sự biểu hiện tạo protein PI-QT

dạng tan

Ngoài nồng độ IPTG, nhiệt độ biểu hiện và thời gian cảm ứng thì mật độ tế

bào trước lúc cảm ứng cũng ảnh hưởng đến việc tạo ra sản phẩm protein ngoại lai.

Nghiên cứu của Dương Thu Hương et al. (2016) chỉ ra rằng mật độ tế bào OD600

khoảng 0,4-1 là thời điểm tế bào bắt đầu bước vào pha tổng hợp protein trong khi

OD600 khoảng 1,5-2 là thời điểm tế bào bắt đầu bước vào pha cân bằng, sinh trưởng

giảm, mật độ tế bào cuối cùng không tăng lên. Ở các thí nghiệm biểu hiện trước,

chúng tôi đã nghiên cứu OD600 trước cảm ứng là 0,8-1. Tuy nhiên ở khoảng mật độ

này, protein tồn tại ở trạng thái không tan nhiều hơn tan. Vì vậy, trong thí nghiệm

này, chúng tôi khảo sát tiếp nồng độ OD600 trước khi cảm ứng ở các giá trị: 0,4; 0,5; 0,6; 0,7, nồng độ IPTG cảm ứng 1 mM, thời gian cảm ứng 6 h ở 25 oC. Sau quá

trình biểu hiện, xác định trạng thái protein theo phương pháp mô tả ở trên. Kết quả

nhận được, ở OD600= 0,4 protein tái tổ hợp thu được rất thấp, hầu như không nhìn

84

thấy trên điện di đồ gel SDS 12,6 %; với OD600= 0,5 protein tái tổ hợp được tạo ra

nhiều hơn, và tồn tại chủ yếu ở trạng thái tan, khoảng 90 %. Hàm lượng protein PI-

QT tạo ra nhiều nhất và tồn tại ở trạng thái tan trên 90 % khi OD600 trước cảm ứng

khoảng 0,6-0,7, hàm lượng protein PI-QT khoảng 299 mg/L (Hình 3.19). Kết quả

này cũng tương tự kết quả đã công bố của Jiang et al. (2011), 1 gen mã hóa protein

ức chế serine protease sàng lọc từ DNA metagenome biển đã biểu hiện thành công

protein tái tổ hợp dạng tan trong E. coli ở điều kiện OD600 trước khi cảm ứng là 0,6;

nồng độ cảm ứng 1 mM IPTG.

(a) M 1 2 3

96

94

64 kDa

92

%

%

90

mg/l

88

86

350 300 250 200 150 100 50 0

0,5

0,6

0,7

0,4 Nồng độ OD600 trước cảm ứng

(b)

Hình 3.19. Điện di SDS- PAGE 12,6 % kiểm tra khả năng tan của protein ở OD600=

0,6 trước khi cảm ứng (a); Trạng thái protein PI-QT (% tan) và hàm lượng protein

tạo ra khi OD600 trước cảm ứng khác nhau (b).

(a)- Giếng M: Marker protein của hãng Thermo; giếng 1: Protein tổng số từ E. coli

BL21(DE3)/[pET-32a(+)/PI-QT] trước khi phá tế bào; giếng 2: Protein tổng số từ

E. coli BL21(DE3)/[pET-32a(+)/PI-QT] pha không tan; giếng 3: Protein tổng số từ

E. coli BL21(DE3)/[pET-32a(+)/PI-QT] pha tan.

Từ các kết quả nghiên cứu trên chúng tôi đã xác định được điều kiện thích

hợp nhất để thu được protein PI-QT tái tổ hợp ở trạng thái tan trên 90 % trong tế bào E. coli BL21(DE3) như sau: nhiệt độ biểu hiện 25 oC, nồng độ chất cảm ứng 1

mM IPTG, mật độ tế bào trước cảm ứng (OD600) từ 0,6 đến 0,8, thời gian cảm ứng

khoảng 5 – 6 h.

Dựa vào kết quả trên Bảng 3.8 và kết quả so sánh trên ngân hàng gen NCBI,

có thể thấy protein PI-QT tái tổ hợp là chất ức chế protease thuộc họ Serpin. Serpin

là một trong siêu họ lớn nhất của PIs, nhiều chất ức chế mới thuộc họ này đã được

85

phát hiện và khai thác gần đây thông qua các hệ biểu hiện. Trong đó nghiên cứu tạo

ra chất ức chế Serpin ở dạng tan và không tan (thể vùi) được nghiên cứu khá nhiều

trong E. coli. Alpha-1 Antitrypsin (AAT) tái tổ hợp đã được biểu hiện thành công

trong hệ E. coli. Protein AAT đã được thu hồi khi cảm ứng ở nhiều điều kiện nhiệt

độ khác nhau. Một số báo cáo cho thấy khi biểu hiện gen AAT trong E. coli ở nhiệt độ cao từ 37-40 oC thì protein AAT thu hồi chủ yếu ở dạng thể vùi (Pearce et al.,

2011). Khi đó, AAT sẽ được tái cấu trúc và thu lại ở dạng tan. Tuy nhiên, quá trình

tinh chế protein từ thể vùi sẽ rất tốn kém và mất thời gian hơn so với tinh chế AAT

hòa tan từ tế bào chất E. coli, chủ yếu là do bước tinh chế không hiệu quả (Krishnan

et al., 2017). Hopkins et al. (1993) cũng đã nghiên cứu biểu hiện AAT trong chủng E. coli BL21(DE3) ở 37 oC, IPTG (0,1 % w/v) và mật độ tế bào trước cảm ứng

(A600) khoảng 10, thời gian cảm ứng 3,5 h, kết quả thu được protein AAT ở trạng

thái tan chỉ khoảng 0,05 % tổng số protein hòa tan. Sau đó, nhóm tác giả bổ sung

rifampicin, có tác dụng ức chế RNA polymerase của E. coli nhưng không ức chế T7

RNA polymerase thì protein AAT ở trạng thái tan tăng gấp 40 lần, tuy nhiên, cũng

chỉ đạt 2 % của tổng số protein hòa tan. Protein AAT ở dạng hòa tan đã được thu lại

từ hệ biểu hiện E. coli khi cảm ứng IPTG ở nhiệt độ thấp. Krishnan et al. (2017) đã

thu được protein AAT dạng hòa tan trong hệ biểu hiện E. coli BL21(DE3) khi cảm ứng IPTG ở nhiệt độ 30 oC.

Ngoài ra, một số báo cáo khác cũng cho thấy protein tái tổ hợp ở dạng hòa

tan cao khi được cảm ứng ở nhiệt độ thấp. Khảo sát sự biểu hiện của protein SUMO-IL11 ở 20, 25, 30, 37 và 40 oC. Qua giá trị OD600 ở thời điểm thu mẫu sau 4 giờ cảm ứng, protein SUMO-IL11 ở trạng thái tan nhiều nhất khi biểu hiện ở 25 oC.

Nguyễn Thị Quý et al. (2015) xác định, nhiệt độ ảnh hưởng khá lớn đến mật độ tế bào. Các mẫu cảm ứng từ 25 oC đến 37 oC sẽ cho mật độ tế bào cao nhất. Trong khi đó tăng nhiệt độ lên 40 oC thì mật độ tế bào bị giảm đi. Mật độ tế bào (OD600) từ mẫu cảm ứng ở 20oC chỉ bằng một nửa so với mẫu cảm ứng ở 25-37 oC.Tuy nhiên

protein tái tổ hợp ở dạng hòa tan lại thu được nhiều nhất khi cảm ứng ở nhiệt độ thấp 25- 30 oC. Choi & Geletu (2018), hormon tăng trưởng tái tổ hợp của cá bơn đã

được biểu hiện quá mức ở E. coli bằng cách tối ưu hóa codon và điều kiện biểu hiện

để thu được protein tái tổ hợp ở mức độ cao. Gen này được gắn vào vectơ biểu hiện

PET-28a và biểu hiện trong E. coli BL21 (DE3). Cảm ứng ở nhiệt độ thấp, nồng độ

86

IPTG thấp và môi trường nuôi cấy tối ưu dẫn đến mức độ biểu hiện tăng lên. Protein tái tổ hợp ở trạng thái tan nhiều nhất khi biểu hiện ở 30 oC, sau đó là 25 và 18 oC, ở 37 oC protein tái tổ hợp ở trạng thái tan thu được rất ít.

Nhìn chung, sự biểu hiện protein tái tổ hợp gây gánh nặng trao đổi chất cho

vật chủ và có sự tích tụ protein ngoại lai thành các khối không tan (inclusion

bodies). Phản ứng tạo khối thường xảy ra ở nhiệt độ cao do tương tác kỵ nước. Ở

nhiệt độ thấp tốc độ sinh trưởng của tế bào diễn ra chậm hơn, hạn chế sự tạo khối in

vivo của protein ngoại lai trong vật chủ (Sorensen et al., 2005; Kaur et al., 2018).

Kết quả nghiên cứu của chúng tôi thu được cho thấy cũng tương tự các kết quả

nghiên cứu trên. Protein PI-QT thu được ở dạng hòa tan nhiều nhất khi cảm ứng ở nhiệt độ thấp 25 oC.

Pha sinh trưởng của vi khuẩn E. coli trong thời gian cảm ứng giữ vai trò

quan trọng trong sản xuất protein tái tổ hợp ở dạng tan. Thông thường, thời điểm

cảm ứng thích hợp đối với E. coli khi mật độ tế bào OD600nm= 0,4-1,0. Protein serpin alpha-1 antitrypsin (α1AT) tái tổ hợp đã thu được ở trạng thái tan khi biểu hiện trong E. coli BL21(DE3) ở mật độ tế bào OD600nm= 0,4-1,0 (Krishnan & Gierasch., 2011). Garçia-Fraga (2015) cho thấy protein tái tổ hợp có hoạt tính cao

nhất khi mật độ tế bào OD600nm bằng 1 đối với HsChiA1p và bằng 0,7 đối với PtChi19p. Nếu tăng mật độ tế bào lên sẽ làm giảm hoạt tính enzyme. Choi & Geletu

(2018) cũng nhận được hormon sinh trưởng tái tổ hợp của cá bơn nhiều nhất khi

mật độ tế bào OD600nm đạt 0,75. Tối ưu hóa quá trình biểu hiện gen cholesterol oxidase phân lập từ Chromobacterium sp. DS1 biểu hiện trong tế bào E. coli chủng

BL21 (DE3), BL21 (DE3) pLysS và Rosetta-gami2 (DE3) cho thấy, đối với cả 3

chủng biểu hiện, protein tái tổ hợp được tạo ra nhiều nhất khi nồng độ IPTG cảm

ứng là 0,5 mM; mật độ tế bào ở thời điểm cảm ứng (OD600nm) đạt 0,6; nhiệt độ nuôi cấy ở 37 oC, 160 vòng/ phút sau 6 h nuôi cấy (Fazaeli et al., 2019). Kết quả nghiên

cứu của chúng tôi cũng thu được protein PI-QT ở trạng thái tan trên 90 % khi

OD600nmtừ 0,6-0,8.

Hàm lượng chất cảm ứng sử dụng cũng là một nhân tố ảnh hưởng đến sự

biểu hiện gen ngoại lai. Lượng chất cảm ứng nhỏ không đủ để cảm ứng sự biểu hiện

gen, nhưng lượng thừa có thể gây độc cho tế bào, như làm chậm sinh trưởng, nồng

độ protein tái tổ hợp thấp. Nồng độ IPTG 0-1 mM không ảnh hưởng đến vận tốc

sinh trưởng đặc hiệu của E. coli. Garcia-Fraga et al. (2015) chứng minh nồng độ

87

IPTG thấp, hoạt tính của các enzyme HsChiA1p (0,5 mM IPTG) và PtChi19p (0,25

mM) cao nhất, trong khi nồng độ IPTG cao hơn hoặc rất thấp sẽ gây nên sự cảm

ứng không hiệu quả và làm giảm hoạt tính của protein. Nghiên cứu của một số tác

giả khác cũng chứng minh quan điểm này (Huyen et al., 2015). Trong nghiên cứu

này, gen PI-QT được cảm ứng tốt hơn với nồng độ IPTG là 1 mM.

3.4.5. Tinh sạch protein PI-QT trong E. coli và nhận diện bằng khối phổ

Protein PI-QT sau khi biểu hiện trong tế bào E. coli đã được thu hồi (Phụ lục

12). Dịch nổi sau phá tế bào được cho qua cột sắc ký ái lực Ni-NTA agarose và

protein được thôi bằng imidazol với các nồng độ theo bậc thang 100, 200, 250, 300

và 500 mM. Các phân đoạn thu được sau khi thôi protein được kiểm tra điện di

SDS-PAGE 12,6 % (Hình 3.20).

L 10 11 12

64 kDa

64 kDa

(b)

(a)

1 2 M 3 4 5 6

Hình 3.20. Sử dụng đệm đẩy cột imidazole 100 mM, 250 mM, 300 mM, 500 mM

Giếng M: Thang protein (Bio-basic), giếng 1: Protein của E.coli BL21(DE3)/[pET-

32a(+)]; Giếng 2: Protein của E.coli BL21(DE3)/[pET-32a(+)/PI-QT]; Giếng 3:

Pha dịch chưa tinh sạch qua cột Ni-NTA; Giếng 4: Dịch qua cột; Giếng 5: Phân

đoạn rửa cột; Giếng 6: Protein PI-QT được thôi ra khỏi cột khi sử dụng đệm đẩy cột

imidazole 250 mM.

Giếng L: Marker protein của hãng Thermo; Giếng 10, 11, 12 lần lượt là protein

được thôi ra khỏi cột khi sử dụng đệm đẩy cột imidazole 100 mM, 300 mM, 500

mM, tương ứng.

88

Kết quả trên Hình 3.20 cho thấy protein quan tâm thu hồi được nhiều nhất ở

nồng độ muối 100 và 300 mM imidazole, tuy nhiên các phân đoạn này còn lẫn

nhiều loại protein khác. Ở phân đoạn protein được thu hồi với đệm đẩy cột chưa

imidazole 500 nM thì lượng protein quan tâm ít hơn nhưng lại có độ tinh sạch cao

hơn.

Để khẳng định protein tinh sạch được là protein PI-QT dung hợp TRx-His-

tag, tiến hành lai miễn dịch (Western blot), sử dụng kháng thể anti-TRx với nồng độ

pha loãng 1:1000. Kết quả cho thấy, trên màng lai xuất hiện 1 băng protein có kích

thước khoảng 64 kDa, tương ứng với kích thước lý thuyết của PI-QT dung hợp

(Hình 3.21a), chứng tỏ PI-QT đã được biểu hiện thành công trong tế bào E. coli

BL21(DE3) và đã tinh sạch được protein tái tổ hợp mong muốn có độ tinh sạch cao

khi sử dụng cột sắc ký ái lực. Ngoài ra, để thu protein PI-QT ở trạng thái không liên

kết với đuôi dung hợp TRx-His-tag phục vụ cho các nghiên cứu tiếp theo, chúng tôi

(a)

(b) 1 2 M

M1

85 kDa

85 kDa

64 kDa

64 kDa

50 kDa

50 kDa

20 kDa

đã sử dụng thrombin (Novagen Kit) nhằm loại bỏ đuôi dung hợp (Hình 3.21b).

Hình 3.21. Kết quả Western blot và kết quả loại bỏ đuôi dung hợp TRx-His-tag ra

khỏi protein PI-QT bằng thrombin trên gel SDS-PAGE 12,6 %.

(a) M: Marker protein của hãng Bio-Basic;

1: Protein dung hợp PI-QT/TRx-His-tag lai với kháng thể anti-TRx.

(b) Marker protein của hãng Bio-Basic;

1: Protein dung hợp PI-QT/TRx-His-tagtrước khi cắt bằng thrombin;

2: Protein dung hợp PI-QT/TRx-His-tagcắt bằng thrombin.

89

Điện di đồ SDS-PAGE 12,6 % trên Hình 3.21b cho thấy, sau khi được xử lý

với thrombin, protein tái tổ hợp cho 1 băng có kích thước khoảng 50 kDa (tương

ứng với kích thước của protein PI-QT theo lý thuyết) và một băng kích thước

khoảng 14 kDa, tương ứng kích thước của peptide TRx-His-tag. Như vậy, protein

PI-QT ở trạng thái sạch (không liên kết) đã nhận được.

Với mục đích nhận diện protein quan tâm bằng khối phổ, chúng tôi đã tiến

hành cắt băng protein biểu hiện vượt mức (64 kDa) trên để nhận diện. Kết quả thể

hiện trên phổ (Phụ lục 13) cho thấy, số các đoạn peptide nhận diện được có độ bắt

cặp với trình tự gốc 30,3 % (màu đậm). Do trình tự protein thiết kế có sự sai khác

nhiều và nằm rải rác khắp trình tự polypeptide nên không thể tìm kiếm sự trùng lăp

trên các cơ sở dữ liệu sẵn có. Mặc dù vậy, với cơ sở protein tự xây dựng dựa trên

trình tự lý thuyết và phần mềm Peak (Canada), chúng tôi vẫn khẳng định đây chính

là protein tái tổ hợp đã thiết kế có các trình tự đúng như lý thuyết dịch mã từ gen.

MTKQLINATIIACVGLIYLLGCSGEEDVLHEDELLEMSLEEGAPTAPDGCAIL

AKPAGFTDNALSEANAKFGFKLLAELYNQKPNKNVFISPLSISIALTMTYNGARG

ATKQAMAKTLEIEGMDLGAVNQANAELREILKSADPQIELAIANSIWLRNTFDEV

Trình tự axít amin PI-QT sau khi nhận diện:

NPDFLDRNDRFFGAEIASLDFDDPQTVETINQWVNTNTQGKIKEILGEIEEHEVMF

LINAIYFKGGWKGKFDASKTQDGVFHLLDGGEKQVPMMSHTCNYSYLESGDFR

AVGLPYGEGRVSMYIFLPEHSSNLDEFLADLNAENWENWLSRFWNERDLRFIM

PRFRLEYGMLLNDALKALGMEIAFIPYVANLEGIAPLLFIEKVIHKTFLEVNEEGTE

AAAVTLVSPPPASTPGPFVVNRPFFFAIHDNWTNTILFMGIVVEPMZ

3.4.6. Thử hoạt tính ức chế protease của protein tái tổ hợp PI-QT

Các chất ức chế Serpin hoạt động có hiệu quả đối với các họ protease serine và

cysteine (bao gồm cả protease mô và họ Cys-Asp) (Gettins., 2002). Các chất ức chế

Serpin hoạt động (đặc biệt là các thành viên họ Kunitz và Kazal) sử dụng vị trí phản

ứng thay đổi hình dạng cấu trúc vòng lặp và do đó bẫy động học một enzyme trung

gian để ức chế hiệu quả. Để kiểm tra tính ức chế đặc hiệu của protein PI-QT đối với

protease serine, protein PI-QT sau khi tinh sạch và loại bỏ đuôi dung hợp đã được

thử nghiệm cho hoạt động ức chế chống lại ba loại protease khác nhau là trypsin, α-

90

chymotrypsin (thuộc protease serine) và thermolysin (không thuộc nhóm protease

Thermolysin (0.5 mg/mL)

Trypsin (0,5 mg/mL)

H20

H2O

Protein PI-QT 468 µg

Protein PI-QT 468 µg

Thermolysin (0.5 mg/mL)

serine), (Hình 3.22; Hình 3.23).

Hình 3.22: Thử nghiệm hoạt tính ức chế protein tái tổ hợp PI-QT đối với trypsin và

thermolysin trên đĩa thạch (Skimmed milked 1 %).

Hình 3.23: Thử nghiệm hoạt tính ức chế protein tái tổ hợp PI-QT đối với α-

chymotrypsin trên đĩa thạch (Skimmed milked 1 %).

Protein PI-QT đã ức chế mạnh với trypsin, yếu với α-chymotrypsin, nhưng

không có tác dụng với thermolysin. Protein PI-QT có hoạt tính ức chế mạnh trypsin với hằng số ức chế Ki là 1,33 × 10-8 M; ức chế yếu hơn đối với α-chymotrypsin, hằng số ức chế là 2,87 × 10-8 M. Jiang et al. (2011) cũng đã biểu hiện thành công

protein Spi1C tái tổ hợp trong E. coli BL21(DE3). Spi1C được sàng lọc từ thư viện

metagenomic biển. Protein Spi1C tinh khiết thu được đã ức chế trypsin với hằng số ức chế Ki là 1,52 × 10-8 M và ức chế α-chymotrypsin với hằng số Ki là 1,79 × 10-8

M, không có sự ức chế Elastase. Yang et al. (2009) đã tìm thấy một chất ức chế

protease serine mới có tên bicolin từ nọc độc của Vespa bcolor Fabricius. Ki của

91

bicolin đối với trypsin là 5,5 × 10-7 M và không có sự ức chế nào được phát hiện đối

với elastase và α-chymotrypsin. Lu et al. (2008) cũng đã báo cáo rằng một chất ức

chế protease serine mới (Bungaruskuni) từ nọc độc Bungarus fasciatus có Ki khoảng 6,1 × 10-6M đối với chymotrypsin. Sử dụng nồng độ protein PI-QT khác

nhau, giá trị Vmax của trypsin và α-chymotrypsin vẫn nhất quán. Những dữ liệu

này chỉ ra rằng protein PI-QT là một chất ức chế đặc hiệu và có tính cạnh tranh.

3.5. Nghiên cứu biểu hiện gen ức chế protease (PI-QT) trong hệ nấm men

Pichia pastoris

3.5.1. Thiết kế vectơ biểu hiện pPIC9 mang gen PI-QT

Plasmid pPIC9 sau khi mở vòng được gắn gen PI-QT và biến nạp vào tế bào

khả biến E. coli TOP10F’. Tách plasmid tái tổ hợp, cắt bằng enzyme giới hạn và

kiểm tra kết quả trên gel agarose 1 % (Hình 3.24). Sau khi cắt plasmid tái tổ hợp

bằng enzyme giới hạn nhận được 2 băng trên điện di đồ, băng trên tương ứng kích

thước pPIC9 mở vòng (8,0 kb) và băng dưới tương ứng kích thước gen PI-QT

1.3

(a)

(b)

(khoảng 1,3 kb).

Hình 3.24. Điện di đồ trên gel agarose 1 % sản phẩm cắt mở vòng vectơ pPIC9 (a)

và cắt kiểm tra plasmid [pPIC9/PI-QT] (b).

M: Marker 1 kb (Thermo)

Giếng 1a: Cắt mở vòng vectơ pPIC9 bằng enzyme EcoRI và NotI

Giếng 1b và 3b: Plasmid tách từ khuẩn lạc trắng cắt bằng enzyme EcoRI và NotI

Giếng 2b và 4b: Plasmid tách từ khuẩn lạc xanh cắt bằng enzyme EcoRI và NotI

Để khẳng định PI-QT đã được gắn vào pPIC9 đúng chiều và đúng khung

đọc, tiến hành PCR với cặp mồi AOX1 và giải trình tự gen. Kết quả nhận được cho

92

thấy sản phẩm PCR là băng kích thước khoảng gần 1,8 kb; là kích thước của gen PI-

QT cộng với kích thước của cặp mồi (Hình 3.25). Kết quả giải trình tự khẳng định

gen PI-QT đã được gắn thành công vào vectơ pPIC9.

Hình 3.25. Sản phẩm PCR bằng cặp mồi AOX1

M: Marker DNA 1 kb (Thermo).

Giếng 1-5: Sản phẩm PCR bằng cặp mồi AOX1 từ 5 khuẩn lạc trắng

3.5.2. Tạo dòng tế bào Pichia pastoris SMD1168 mang gen PI-QT

Bằng phương pháp xung điện, đã tiến hành biến nạp gen PI-QT nghiên cứu

vào chủng P. pastoris SMD1168 khả biến. Sau khi chủng P. pastoris nhận được plasmid tái tổ hợp [pPIC9/PI-QT], đã xác định thể biến nạp là Muts hoặc Mut+ trên

đĩa thạch theo khuyến cáo của nhà sản xuất. Tiến hành phản ứng PCR, sử dụng cặp

mồi AOX1. Kết quả nhận được thể hiện trên Hình 3.26.

Hình 3.26. Kết quả kiểm tra kiểu hình và kiểu gen nấm men mang gen PI-QT

Giếng 1, 2, 3: Sản phẩm PCR kiểm tra kiểu gen của 3 dòng nấm men mang gen PI-QT

M: Marker 1kb (Thermo)

Kết quả trên hình 3.26 cho thấy, các dòng biến nạp đều sinh trưởng tốt trên

môi trường MD, nhưng sinh trưởng kém ở môi trường MM. Theo nhiều công bố đã

93

chỉ ra rằng, khi DNA plasmid ngoại lai sát nhập vào bộ gen của tế bào chủ

P. pastoris, gen AOX1 (mã hóa cho enzyme alcohol axidase, quy định khả năng sử

dụng methanol của P. pastoris) có thể bị loại bỏ hoặc giữ lại. Nếu gen này bị loại

bỏ, kiểu hình của các dòng biến nạp sẽ là Mus, sinh trưởng kém trên môi trường có

methanol (MM). Còn nếu gen AOX1 không bị mất đi, các dòng biến nạp sẽ có kiểu

hình Mut+, chúng sẽ sinh trưởng tốt trên môi trường MM (Pichia expression kit –

Invitrogen). Do đó, các dòng biến nạp mà chúng tôi thu được đều có kiểu hình Mus.

Ngoài ra, kết quả PCR xác nhận lại kết quả kiểm tra kiểu hình cũng nhận

được 1 băng duy nhất có kích thước khoảng 1779 bp (Hình 3.26, giếng 1, 2, 3).

Theo lý thuyết, sau PCR nếu thu được 2 băng, một băng có kích thước 1779bp

(tương đương với kích thước tổng của gen PI-QT và gen AOX1) và 1 băng có kích

thước khoảng 2.2 kbtương đương với kích thước của gen AOX1 có sẵn trong bộ gen

của P. pastoris SMD1168, thì dòng biến nạp sẽ mang kiểu hình Mu+, còn kết quả

chỉ thu được một băng có kích thước 1779 bp thì dòng biến nạp sẽ có kiểu hình Mus

(Pichia expression kit – Invitrogen). Điều đó cho thấy, dòng tế bào P. pastoris

mang vectơ tái tổ hợp thuộc thể Muts.

3.5.3. Biểu hiện gen PI-QT trong nấm men P. pastoris SMD1168

Để kiểm tra việc chứa nhiều bản sao của plasmid tái tổ hợp trong bộ gen có

làm ảnh hưởng tới khả năng sinh trưởng của chủng nấm men hay không chúng tôi

tiến hành đo phổ hấp phụ của dịch nuôi cấy ở bước sóng 600 nm. Kết quả nhận

được cho thấy đường cong sinh trưởng của các dòng nấm men mang plasmid tái tổ

hợp (mang plasmid [pPIC9/PI-QT] và cả chủng đối chứng (chỉ mang plasmid

pPIC9 không mang gen PI-QT) là tương đối giống nhau (Hình 3.27), giá trị OD600

cao nhất đạt được sau 72 h nuôi cấy, ổn định đến 96 h và bắt đầu giảm sau 120 h

nuôi cấy. Điều này chứng tỏ các dòng P. pastoris tái tổ hợp mang gen PI-QT không

bị giảm sức sống do hiện tượng sát nhập gen gây ra.

94

400

350

300

pPIC9

250

Dòng 5

200

Dòng 4

Dòng 3

150

Dòng2

100

Dòng 1

50

0 0 6

D O

0

0h

12h

24h

48h

72h

96h

120h

Hình 3.27. Đường cong sinh trưởng của các dòng P. pastoris tái tổ hợp theo thời gian

Thời gian nuôi cấy sau cảm ứng

Dòng 1-5: Chủng P. pastoris mang vectơ tái tổ hợp [pPIC9/PI-QT]; pPIC9: Chủng

P. pastoris mang vectơ pPIC9 không mang gen.

Trong số các dòng tái tổ hợp lựa chọn khảo sát tốc độ tăng trưởng, dòng tế

bào số 1 cho thấy sự phát triển ổn định và mạnh hơn cả. Vì vậy, chúng tôi lựa chọn

dòng này biểu hiện theo hướng dẫn của nhà sản xuất (Pichia expression kit – Invitrogen) đối với chủng có kiểu hình Muts.

Dòng tế bào số 1 được nuôi ở điều kiện lắc ổn nhiệt (200 vòng/phút, 28 oC)

trong 100 mL môi trường BMGY (môi trường đầy đủ với nguồn các bon là 2 %

glycerin) trong khoảng thời gian 16-18 h để có OD600 của hỗn dịch tế bào là 2-6.

Cảm ứng cho việc biểu hiện của gen thực hiện bằng cách li tâm loại bỏ môi trường

BMGY rồi hòa cặn tế bào vào 10-20 mL môi trường BMMY (môi trường cảm ứng

với nguồn các bon là 0,5 % methanol. Tiếp tục nuôi lắc ở điều kiện đã nêu trên. Sau

24, 48, 72, 96 và 120 h kể từ khi cảm ứng, lấy mẫu để kiểm tra khả năng biểu hiện

của gen. Sau mỗi lần lấy mẫu, methanol được bổ sung để duy trì nồng độ trong môi

trường là 0,5 %.

Mẫu cảm ứng được li tâm để loại bỏ cặn tế bào. Protein ngoại bào trong dịch

nổi được kết tủa bằng NH4(SO4)2. Protein tái tổ hợp được kiểm tra bằng điện di trên

gel polyacrylamid 12,6 % (Hình 3.28).

95

PI-QT

Hình 3.28. Điện di đồ protein PI-QT biểu hiện trong P. pastoris SMD1168.

M: Marker protein (Affymetric) 1: Mẫu không cảm ứng. 2: 0 h sau cảm ứng. 3-8: Có cảm ứng (3: 24 h; 4: 48 h; 5:120 h; 6:72 h;7, 8: 96 h sau cảm ứng)

Kết quả trên Hình 3.28 cho thấy protein PI-QT đã được tổng hợp có kích

thước khoảng 50 kDa tương ứng với kích thước của protein PI-QT ở các thời điểm

24, 48, 72, 96 và 120 h cảm ứng. Vạch protein này không xuất hiện ở chủng đối

chứng (P. pastoris không mang gen PI-QT), và đậm dần theo thời gian lên men từ

24 h - 96 h. Ngoài ra có thể thấy protein mục tiêu chiếm đa số trong thành phần

protein tổng số của dịch nuôi cấy còn protein nội sinh của nấm men P. pastoris

chiếm tỉ lệ rất ít.

Sự tương quan giữa hàm lượng protein ngoại lai tạo ra với mật độ tế bào của

mg/mL

OD600

Thời gian cảm ứng

nấm men tái tổ hợp cũng đã được chúng tôi khảo sát (Hình 3.29).

Hình 3.29. Đồ thị tương quan giữa hàm lượng protein ngoại lai tạo ra với mật độ tế

bào nấm men tái tổ hợp.

96

Kết quả thu được chỉ ra rằng tốc độ sinh trưởng của nấm men P. pastoris tái

tổ hợp tỉ lệ thuận với hàm lượng protein tái tổ hợp tạo ra. Khi tốc độ tăng trưởng đạt

mật độ tế bào (OD600) cao nhất thì ở thời điểm đó lượng protein ngoại lai tạo ra cũng nhiều nhất, và khi tốc độ tăng trưởng của nấm men giảm thì lượng protein

ngoại lai được tạo thành cũng giảm

3.5.4. Kết quả thử hoạt tính ức chế protease của protein PI-QT biểu hiện trong

nấm men

Protein ngoại bào của nấm men P. pastoris SMD1168 mang gen PI-QT và

không mang gen PI-QT sau cảm ứng methanol 72 h đã được chúng tôi thử hoạt tính

ức chế protease (trypsin, ɑ-chymotrypsin và thermolysin). Kết quả thu được cho

thấy, trong dịch tiết thô của dòng nấm men không mang gen PI-QT đều không có

hoạt tính ức chế với cả 3 protease thử nghiệm. Trong khi đó, dịch tiết ngoại bào của

P. pastoris SMD1168 mang gen PI-QT thì có hoạt tính ức chế với cả 3 enzyme

protease trên. Trong đó, ức chế mạnh nhất với trypsin, yếu hơn với ɑ-chymotrypsin

Try

ɑ-chy

Ther

H20

H20

PI 1

PI 1

PI 1

H20

PI2

PI2

PI 2

PI 3

PI 3

PI 3

và rất yếu với thermolysin (Hình 3.30).

a c b

Hình 3.30. Định tính khả năng ức chế proteases của protein biểu hiện

a, b, c tương ứng với thử nghiệm ức chế với trypsin (Try), ɑ-chymotrypsin (ɑ-chy)

và Thermolysin (Ther). Nồng độ proteae ở mỗi giếng là 0.01 mg);

PI: protein tái tổ hợp PI-QT (PI 1: 0,4 mg protein PI-QT; PI 2: 1,0 mg protein PI-

QT; PI 3: 2,0 mg protein PI-QT)

Dịch ngoại bào của nấm men không mang gen PI-QT cũng được xác định

hoạt tính ức chế với trypsin (0,5 mg/mL), ɑ-chymotrypsin (0,5 mg/mL) và

thermolysin (0,5 mg/mL) theo phương pháp đục lỗ trên đĩa thạch với cơ chất là sữa

97

gầy 1 %. Kết quả không phát hiện hoạt tính ức chế các proteases nghiên cứu của

dịch nuôi cấy (Hình 3.31).

Hình 3.31. Kết quả thử hoạt tính ức chế protease của dịch tiết thô P. pastoris

SMD1168 không mang gen PI-QT

N: Nước; 1: Trypsin; 2: ɑ-chymotrypsin, 3: Thermolysin; P: Dịch tiết P. pastoris

SMD1168 không mang gen PI-QT

Protein PI-QT từ dịch chiết thô nấm men có hoạt tính trypsin với hằng số ức chế Ki là 2,52 × 10-9 M; ức chế yếu hơn đối với α-chymotrypsin, hằng số ức chế là 5,92 × 10-9 M và rất yếu với thermolysin, Ki= 1,37 × 10-10 M.

3.5.5. Kết quả phát hiện chất ức chế protease bằng điện di trên gel SDS – PAGE

có bổ sung cơ chất casein 0,1 %

Để khẳng định protein có hoạt tính trên là protein tái tổ hợp mục tiêu. Chúng

tôi đã lấy dịch tiết thô có hoạt tính và không có hoạt tính trên để thực hiện phương

pháp phát hiện chất ức chế protease bằng điện di trên gel SDS – PAGE có bổ sung

cơ chất casein 0,1 % theo mô tả trên phần phương pháp. Kết quả thu được ở Hình

3.32 cho thấy dịch tiết ngoại bào của P. pastoris SMD1168 mang vectơ pPIC9

không mang gen PI-QT không xuất hiện băng nào. Trong khi dịch tiết ngoại bào

của P. pastoris SMD1168 mang vectơ tái tổ hợp [pPIC9/PI-QT] lại có 1 băng khá

đậm có kích thước khoảng 50 kDa, tương ứng với kích thước của gen PI-QT theo lý

thuyết. Như vậy có thể khẳng định, protein có trong dịch tiết ngoại bào của P.

pastoris SMD1168 [pPIC9/PI-QT] có hoạt tính chính là protein mục tiêu.

98

Hình 3.32: Điện di SDS-PAGE 12,6 % có bổ sung cơ chất casein 0,1 % và xử lý

bằng enzyme trypsin

M: Marker protein của hãng Bio-basic

Giếng 1: Dịch tiết của P. pastoris SMD1168 [pPIC9] sau cảm ứng 72h

Giếng 2: Dịch tiết của P. pastoris SMD1168 [pPIC9/PI-QT] sau cảm ứng 72h

3.5.6. Khảo sát các yếu tố ảnh hưởng đến sự biểu hiện của P. pastoris SMD 1168

[pPIC9/PI-QT]

Để tinh sạch protein tái tổ hợp đòi hỏi phải có một lượng khá lớn protein, tuy

nhiên việc chuyển từ nuôi cấy lắc sang lên men có thể gây ra sự gia tăng đáng kể

hàm lượng protein, mức độ biểu hiện trong quá trình lên men có thể cao gấp 10 lần

so với bình lắc. Liên quan đến quá trình lên men, một số yếu tố ảnh hưởng đến năng

suất biểu hiện cũng đã được báo cáo như môi trường nuôi cấy, nhiệt độ nuôi cấy,

pH và nồng độ chất cảm ứng methanol. Nhiều nghiên cứu cho rằng sản xuất protein

tái tổ hợp trong P. pastoris nên được tối ưu hóa riêng để thu được lượng protein cao

nhất (Files el al., 2001; Ling et al., 2010; Sinha et al., 2003). Vì vậy, trong nghiên

cứu này, chúng tôi tiến hành xác định thành phần môi trường, nhiệt độ nuôi cấy, pH

và nồng độ methanol thích hợp nhất cho quá trình lên men P. pastoris SMD 1168

[pPIC9/PI-QT] nhằm thu được lượng protein PI-QT cao nhất.

Khảo sát thành phần môi trường nuôi cấy:

99

Theo hướng dẫn của kít Pichia expression kit (Invitrogen, môi trường để cảm

ứng chủng P. pastoris tái tổ hợp có thể là 1 trong 3 loại môi trường như MM, BMM

hoặc BMMY; Y (Yeast Nitrogen Base) là hợp chất có vai trò cung cấp vitamin thúc

đẩy quá trình tổng hợp protein, ức chế protease tế bào hoạt động nhưng cũng là một

hóa chất đắt tiền nên nếu có thể giảm đi hay giảm hẳn là một cách giảm chi phí rất

tốt khi tiến hành lên men lượng lớn khi biểu hiện protein trong tế bào nấm men. Vì

vậy, trong nghiên cứu này chúng tôi đánh giá điều kiện biểu hiện của chủng P.

pastoris SMD 1168 [pPIC9/PI-QT] trong MM (môi trường thiếu Biotin và YNB);

BMM (môi trường thiếu đi YNB) và BMMY (môi trường đầy đủ).

Kết quả khảo sát (Hình 3.33) cho thấy, trong số 3 môi trường cảm ứng (MM,

BMM và BMMY), protein PI-QT tái tổ hợp thu được nhiều nhất là trong môi

trường BMMY. Ngay sau 24 h giờ đầu cảm ứng quan sát đã thấy có sự biểu hiện

của protein PI-QT nhưng khi sử dụng môi trường cảm ứng là BMM; MM thì 48 h

sau khi cảm ứng mới quan sát thấy sự biểu hiện tạo protein PI-QT. Sự khác biệt về

sinh khối (không nhận thấy sự khác nhau) và biểu hiện cũng được quan sát giữa môi

trường MM, BMM và BMMY. Lượng protein PI-QT đạt cao nhất sau khi cảm ứng

14

12

10

8

mg PI-QT trong mt MM

6

methanol ở BMMY là 11 mg/L và BMM là 8,5 mg/L.

L m / g m

mg PI-QT trong mt BMM

4

mg PI-QT trong mt BMMY

2

0

0

1

2

3

4

5

Thời gian cảm ứng (ngày)

Hình 3.33. Khảo sát ảnh hưởng của môi trường đến khả năng tạo protein PI-

QT (mg/L) trong nấm men P. pastoris

100

Các thành phần của BMMY, như pepton, cao nấm men và pH ổn định có tác

dụng nổi bật đối với sự tăng trưởng và biểu hiện của protein tái tổ hợp trong P.

pastoris. Môi trường nuôi cấy duy trì một điều kiện pH ổn định, và tăng cường sự

hấp thụ và sử dụng các chất dinh dưỡng của các tế bào. Cao nấm men, pepton, axit

amin, vitamin và các nguyên tố vi lượng, có thể tăng khối lượng sinh học và năng

lượng cho sự biểu hiện tổng hợp protein. Sự ổn định của sản phẩm cũng được duy

trì bằng việc bổ sung các chất giàu axit amin, đóng vai trò là chất thay thế và cạnh

tranh cho các protease, bên cạnh việc kìm nén cảm ứng protease gây ra bởi giới hạn

nitơ (Ling et al., 2010).

Khảo sát nhiệt độ nuôi cấy

Tốc độ tăng trưởng tối ưu của P. pastoris là 30 oC (Pichia expression kit –

Invitrogen), tuy nhiên mội số báo cáo về việc biểu hiện các protein ngoại lai trong P. pastoris ở nhiệt độ thấp như 20, 23, 25 và 27 oC có thể làm giảm sự phân hủy của

protein tái tổ hợp và làm tăng khả năng sống của tế bào (Curvers et al., 2001; Jahic

et al., 2003; Li et al., 2001). Theo nghiên cứu của Shi et al. (2003), P. pastoris có thể được nhân giống ở nhiệt độ thấp tới 15 oC, ở nhiệt độ này lượng protease nội

sinh sẽ giảm và làm tăng lượng protein ngoại lai (Shi et al., 2003). Một vài nghiên

cứu khác cũng đã cho thấy biểu hiện ở nhiệt độ thấp có thể làm tăng hàm lượng protein tái tổ hợp, mặc dù thời gian lên men dài hơn ở 30 oC (Hong et al., 2002; Li

et al., 2007; Murasugi et al., 2003). Trong nghiên cứu này, chúng tôi khảo sát nhiệt

1,2

1

0,8

0,6

độ biểu hiện của chủng P. pastoris SMD 1168 [pPIC9/PI-QT]ở 20, 23, 28, 30 và 32 oC (Hình 3.34).

l / g m

0,4

0,2

n 1 n 2 n 3

0

20oC

23oC

28oC

30oC

32oC

Nhiệt độ

Hình 3.34. Khảo sát nhiệt độ biểu hiện của P.pastoris SMD 1168 [pPIC9/PI-QT]

101

Kết quả trên Hình 3.34 nhận được, ở nhiệt độ cảm ứng 23 oC và 30 oC, lượng

protein biểu hiện tốt hơn và tăng dần theo thời gian đến ngày thứ 4. Điều này cũng

phù hợp với khuyến cáo của Pichia expression kit (Invitrogen), nhiệt độ sinh trưởng

tối ưu của P. pastoris là 30 oC, tuy nhiên trong thí nghiệm này, cảm ứng ở 30 oC

lượng protein PI-QT biểu hiện kém hơn so với 23 oC. Hàm lượng protein PI-QT thu

được ít nhất khi biểu hiện ở ngưỡng nhiệt độ thấp nhất (20 oC) và ngưỡng nhiệt độ

cao nhất (32 oC).

Kết quả biểu hiện được kiểm tra bằng SDS-PAGE 12,6 % và phân tích bằng

phần mềm Quantity One cũng cho thấy băng protein ngoại lai đậm và nhiều nhất

(70 % so với tổng lượng protein tiết của tế bào) khi biểu hiện ở 23 oC sau 72 h cảm

ứng. Ở nhiệt độ dưới 23 oC hàm lượng protein tiết ra thấp và trên 32 oC biểu hiện

protein dừng lại và bắt đầu phân hủy.

Phương thức chuẩn tiến hành sản xuất protein ngoại lai trong P. pastoris cơ

bản dựa trên chiến lược bổ sung cơ chất đầy đủ trong các pha sinh trưởng và cảm ứng, trong khi giữ nhiệt độ ở 30 oC trong suốt quá trình. Sản xuất protein ngoại lai

trong P. pastoris được công nhận là quá trình sử dụng oxy cực lớn, quá trình này

liên quan chặt chẽ đến vận tốc sử dụng oxy (OUR); OUR cao thì nồng độ protein cao (Gao & Shi., 2013). Một số tác giả báo cáo giảm nhiệt độ xuống 20 oC hoặc

thấp hơn có lợi cho việc biểu hiện protein ngoại lai. Điều này do dựa trên thực tế là

nhiệt độ thấp có thể hoạt hóa oxidase cảm ứng alcohol (AOX) khi nuôi cấy trên

methanol, tiếp theo sẽ tăng OUR, làm giảm sự tiêu khung tế bào và giảm tiết

protease, giảm hoạt tính proteolytic ngoại bào. Nhưng tăng biểu hiện protein ở nhiệt độ thấp (20 oC), sự cảm ứng sẽ cần cung cấp oxy nhiều hơn để phù hợp với sự tăng

OUR (Dragosits et al., 2009). Kết quả nhận được khi biểu hiện PI-QT cũng phù hợp

với kết quả của các tác giả khác.

Khảo sát pH môi trường biểu hiện

Lựa chọn pH thích hợp là việc rất quan trọng cho sự phát triển của tế bào, tạo

thành protein và sự ổn định của protein. P. pastoris có thể phát triển trong phạm vi

pH rộng (3 đến 7), tuy nhiên pH thấp đã được chứng minh là làm giảm hoạt tính

102

protease nội sinh và tăng năng suất của protein tái tổ hợp (Koganesawa et al., 2002;

Shi et al., 2003). Do đó, trong nghiên cứu này, chúng tôi tiến hành khảo sát pH môi

trường trong quá trình biểu hiện ở pH 3, 4, 5, 6 và 7 (Hình 3.35).

Hình 3.35. Khảo sát pH trong biểu hiện P. pastoris SMD 1168 [pPIC9/PI-QT]

(n1-n5: Ký hiệu của ngày 1 đến ngày thứ 5, trục hoành biểu thị giá trị pH)

Kết quả nhận được cho thấy protein PI-QT được tổng hợp cao nhất ở pH 3

sau 72 h và 96 h nuôi cấy, và giảm dần từ pH 4 đến 6, ở pH 7 rất thấp, hầu như

không nhìn thấy sự có mặt của protein PI-QT bằng điện di trên gel SDS-PAGE 12,6

%. Kết quả này cũng phù hợp với báo cáo của Ling et al. (2010), nhóm tác giả cũng

đã quan sát thấy sự tạo thành SAG2 (T) và SAG2 (S) tái tổ hợp cao nhất ở pH 3 sau

48 h cảm ứng. Duy trì nuôi cấy ở pH 3 hoặc thấp hơn trong giai đoạn biểu hiện có

thể bảo vệ protein ngoại lai khỏi bị phân hủy và có thuận lợi cho quá trình tinh sạch

protein từ môi trường ngoại bào. Còn ở pH trên 6 không thấy sự xuất hiện của

protein tái tổ hợp có thể protein bị phân hủy do hoạt động của protease nội sinh cao

(Murasugi & Tohma-Aiba., 2003).

pH của môi trường sinh trưởng và cảm ứng giữ vai trò quan trọng trong sản

xuất protein ngoại lai vì vận tốc sinh trưởng và hoạt tính của các enzyme, chìa khóa

liên quan đến trao đổi chất methanol và phân hủy proteolytic phụ thuộc vào pH môi

103

trường. Đã có báo cáo về vận tốc sinh trưởng của P. pastoris Mut+ như nhau khi pH

môi trường nằm trong khoảng 3,5-5,5; trong khi pH tối ưu thay đổi cho việc sản

xuất các protein ngoại lai khác nhau (Wang et al., 2009). pH tối ưu rất quan trọng

cho sinh trưởng của tế bào, sự tạo protein và độ bền của protein. Giữ pH môi trường

nuôi cấy ở 3 hoặc thấp hơn trong pha cảm ứng methanol có hiệu quả bảo vệ IGF-1

(insulin-like growth factor) không bị protease thủy phân trong hệ biểu hiện. Một số

nghiên cứu khác cũng cho thấy, lên men P. pastoris nên giữ ở pH thấp (Li et al.,

2007). Như vậy có thể thấy protein PI-QT cũng được biểu hiện tốt hơn khi pH môi

trường thấp.

Khảo sát nồng độ methanol cảm ứng

Theo hướng dẫn của nhà sản xuất (Pichia expression kit, Invitrogen),

methanol 100 % được bổ sung sau mỗi 24 h để cảm ứng sự biểu hiện protein ngoại

lai trong P. pastoris đến nồng độ cuối cùng là 1,0 %. Tuy nhiên, P. pastoris thể Muts sử dụng methanol kém hiệu quả hơn so với thể Mut+, và trong quá trình nuôi

cấy lắc, methanol cũng bị bay hơi khá nhanh. Vì vậy, nồng độ chất cảm ứng đã

được bổ sung đến nồng độ cuối cùng khác nhau để xác định ảnh hưởng của nó đến

khả năng biểu hiện của PI-QT (0,25; 0,5; 1; 1,5 và 2,0) (Hình 3.36).

Hình 3.36. Nồng độ methanol cảm ứng trong biểu hiện P. pastoristái tổ hợp

(n1-n5: Ký hiệu của ngày 1 đến ngày thứ 5; trục hoành: các nồng độ methanol)

104

Kết quả chỉ ra rằng, cảm ứng methanol ở nồng độ 1 % là tối ưu cho sự phát

triển của nấm men P. pastoris và sự tạo thành protein PI-QT. Sinh khối và biểu hiện

giảm khi cảm ứng methanol dưới 0,5 % hoặc trên 2,0 % nguyên nhân có thể là do

thiếu hụt nguồn carbon khi cảm ứng dưới 0,5 % hoặc gây độc tế bào khi nồng độ

methanol cảm ứng trên 2,0 % (Boettner et al., 2002).

Một trong các yếu tố quyết định sự biểu hiện thành công protein tái tổ hợp

trong P.pastoris là nồng độ chất cảm ứng methanol (Ling et al., 2010), bởi vì việc

biểu hiện các gen ngoại lai trong P. pastoris được điều khiển hiệu quả và chặt chẽ

bởi promoter AOX1. Promoter này được cảm ứng mạnh mẽ bởi methanol

(Cereghino et al., 2000b). Methanol được đưa vào môi trường nuôi cấy sẽ bị oxy

hóa tạo thành hydrogenperoxid (H2O2) và formaldehyde nhờ alcohol oxidase

(AOX) (trong tế bào P. pastoris). Vì vậy trong quá trình biểu hiện, phải giữ mức độ

methanol trong một phạm vi tương đối hẹp. Methanol dư thừa có thể gây độc cho tế

bào và làm giảm mạnh hoạt động promotor AOX, có thể dẫn đến chết tế bào

(Minning et al., 2001).

Ngoài ra, sự có mặt của methanol là cần thiết cho mức độ phiên mã cao.

Người ta công nhận rằng thừa methanol sẽ làm tổn thương hiệu quả phiên mã

AOX1 và hoạt tính trao đổi chất của tế bào, đặc biệt khi tế bào ở trong môi trường

có nồng độ methanol cao thời gian dài. Nồng độ methanol trong pha cảm ứng ảnh

hưởng trực tiếp đến sự sản xuất protein và sinh trưởng của tế bào, vì vậy cần kiểm

soát nồng độ của chất này (Gao & Shi., 2013).

Như vậy, từ các kết quả trên chúng tôi kết luận về điều kiện tốt nhất để biểu

hiện gen PI- QT trong P. pastoris SMD1168 như sau: môi trường nuôi cấy cảm ứng là BMMY, pH = 3, nồng độ methanol cảm ứng là 1 %, nhiệt độ 23 oC, lắc 250-300

rpm, trong 4 ngày.

3.5.7. Tinh sạch protein PI-QT tái tổ hợp biểu hiện trong nấm men P. pastoris

qua cột sắc ký ái lực Trypsin-Sepharore 4B

Dịch protein sau khi tủa được loại muối, sau đó cho qua màng lọc cut off 30

kDa và thu lại phần protein >30 kDa.

105

Hình 3.37: Điện di SDS – PAGE 12,6 % protein PI-QT qua màng cut off 30 kDa và

qua cột sắc ký ái lực Trypsin-sepharose 4B.

M: Marker protein của hãng Bio-basic

Giếng 1: Protein PI-QT tái tổ hợp phân đoạn >30 kDa

Giếng 2: Protein PI-QT tái tổ hợp qua cột sắc ký ái lực Trypsin-Sepharose 4B.

Kết quả điện di SDS-PAGE 12,6 % trên Hình 3.37 cho thấy, đã loại được hết

các protein kích thước dưới 30 kDa, protein có kích thước 50 kDa (tương ứng kích

thước protein PI-QT) thu được lượng khá nhiều, ngoài ra còn có một số rất ít các

protein có kích thước trên 50 kDa (giếng 1). Phần protein có kích thước >30 kDa

được cho qua cột Trypsin-Sepharose như mô tả trong phần phương pháp. Kết quả

phân tích trên gel SDS-PAGE (giếng 2) cho thấy thu được 1 băng duy nhất protein

(a)

(b)

(c)

E

P

T

N

N

P

N

C

P

N

C

P

1

N

P

có kích thước khoảng 50 kDa, tương ứng với kích thước của PI-QT theo lý thuyết.

Hình 3.38. Hoạt tính ức chế proteases của protein PI-QT tinh sạch biểu hiện

trong nấm men P. pastoris SMD1168

N: nước; P: protein PI-QT tinh sạch; T: trypsin; C: ɑ-chymotrypsin;

E: thermolysin

106

Protein sau tinh sạch cũng đã được thử hoạt tính ức chế với 3 chất protease là

trypsin, ɑ-chymotrypsin và thermolysin (Hình 3.38). Kết quả nhận được là protein

sau tinh sạch có hoạt tính ức chế mạnh với trypsin và yếu hơn với ɑ-chymotrypsin, rất yếu với thermolysin, hằng số Ki lần lượt là 1,12 × 10-7 M, 1,45 × 10-8 M và 2,34 × 10-9 M, tương ứng. Như vậy, có thể khẳng định chúng tôi đã tinh sạch được

protein PI-QT trong nấm men P. pastoris SMD1168.

3.5.8. Ảnh hưởng của một số yếu tố đến protein PI-QT

Ảnh hưởng của nhiệt độ

Protein PI-QT sau khi tinh sạch được lựa chọn để nghiên cứu các đặc tính

của protein tái tổ hợp. Khảo sát hoạt tính của PI-QT ở các nhiệt độ khác nhau được

100

90

% ức chế Trypsin

80

% ức chế ɑ-chymo

70

% ức chế thermo

60

50

thể hiện trong Hình 3.39.

ế h c c ứ %

40

30

20

10

0

4

20

30

40

50

60

70

80

90

100

Nhiệt độ (oC

Hình 3.39. Biểu đồ ảnh hưởng của nhiệt độ đến hợp chất PI-QT (thu hồi trong P.

pastoris)

Hình 3.39 cho thấy, PI-QT ổn định ở nhiệt độ dưới 60 oC, còn trên ngưỡng

nhiệt độ này cả nồng độ protein và hoạt tính đều giảm mạnh. Hợp chất PI-QT bị mất hoạt tính khi ủ ở 100 oC và hoạt tính đạt tối ưu khi ở điều kiện lạnh 4 oC và 60 oC,

tương tự như kết quả nghiên cứu đặc tính của chất ức chế protease của Sapna

(2013). Chất ức chế protease phân lập từ hạt Hyptis suaveolens L. đã được nghiên cứu là ổn định trong phạm vi nhiệt độ rộng, từ 4 - 95 oC (Aguirre et al., 2004).

107

Hợp chất biểu hiện PI-QT thuộc họ Serpin (nhóm serine protease inhibitor),

vì vậy, nhiệt độ là một trong các yếu tố tác động mạnh mẽ tới hoạt động của

enzyme. Kết quả nhận được cho thấy khi nhiệt độ tăng, protein cũng bị phân hủy vì

vậy nồng độ bị giảm dần và kéo theo hoạt tính ức chế protease cũng giảm.

Ảnh hưởng của pH đến protein PI-QT

Bên cạnh nhiệt độ, pH cũng ảnh hưởng đến hoạt tính của protein, phân tích

hoạt tính enzyme ở các pH khác nhau cho thấy, PI-QT ổn định và đạt hoạt tính tối

ưu khi ở dải pH 7-9, giảm mạnh khi ở điều kiện có tính kiềm cao (pH>10) và có

tính axit cao (pH 3-4) (Hình 3.40). Một số công bố cũng cho thấy chất ức chế ổn

định tối đa ở pH 7, ví dụ như chất ức chế được tạo ra từ metagenome biển (Jiang et

al., 2011), từ xạ khuẩn đất (Pandhare et al., 2002). Nghiên cứu của Sapna (2013)

cũng chỉ ra rằng ở điều kiện kiềm cao (pH 11-12) và axit cao (pH 2-3), chất ức chế

protease không ổn định (Sapna., 2013). Chất ức chế của protease serine đã được báo

cáo là có độ ổn định pH cao trong khoảng pH 2-12 và ổn định nhiệt (Tsybina et al.,

% ức chế Trypsin

% ức chế ɑ-chymo

% ức chế thermo

100

90

80

70

60

50

2004).

ế h c c ứ %

40

30

20

10

0

ĐC

2

3

4

5

6

7

8

9

10

11

12

pH

Hình 3.40. Biểu đồ ảnh hưởng của pH đến hợp chất PI-QT (thu hồi trong P.

pastoris)

Qua các kết quả nghiên cứu trên có thể thấy protein PI-QT thu được trong hệ

biểu hiện P. pastoris SMD1168 có hoạt tính ức chế với cả ba protease thử nghiệm

(trypsin, ɑ-chymotrypsin và thermolysin). Trong khi đó, protein PI-QT thu được

108

trong E. coli BL21(DE3) chỉ có hoạt tính ức chế với trypsin và ɑ-chymotrypsin.

Ngoài ra, hoạt tính ức chế protease của protein thu hồi trong nấm men cũng cao hơn

E. coli khi sử dụng nồng độ giống nhau (Bảng 3.10).

Bảng 3.10. So sánh hoạt tính ức chế proteae của protein PI-QT tinh sạch thu hồi

biểu hiện trong P. pastoris SMD1168 và E. coli BL21(DE3)

Ki Protein PI-QT thu hồi trong Protein PI-QT thu hồi trong

P. pastoris SMD1168) E. coli BL21(DE3)) Protease

Trypsin 1,12 × 10-7 M 1,33 × 10-8 M

ɑ-Chymotrypsin 1,45 × 10-8 M 2,87 × 10-8 M.

Protein PI-QT có khung đọc mở là 429 axít amin với trọng lượng phân tử

tính toán khoảng 50 kDa. Các giá trị này phù hợp với trọng lượng phân tử trung

bình quan sát được của hầu hết các protein serpin, dao động từ 40 - 60 kDa với 330

- 500 axít amin. Protein PI-QT tái tổ hợp thu được trong E. coli cũng đã được chúng

tôi đánh giá hoạt độ ức chế đặc hiệu với protease. Protein PI-QT có tác dụng ức chế

trypsin và ɑ-chymotrypsin với hoạt độ ức chế đặc hiệu tương ứng là 975 ± 26 và

417 ± 14 U/mg. Hoạt độ ức chế đặc hiệu của protein PI-QT tương đương với hoạt

độ ức chế đặc hiệu của một protein serpin mới được báo cáo trong các nghiên cứu

gần đây. Ví dụ, Jiang et al. (2011) đã khai thác 1 gen mới, được gọi là Spi1C.

Protein Spi1C tái tổ hợp có tác dụng ức chế chống lại trypsin và ɑ-chymotrypsin với

các giá trị cụ thể tương ứng là 6940 và 3640 U/mg. Chan et al. (2014) đã tinh chế

được chất ức chế trypsin ổn định nhiệt từ hạt đậu và báo cáo rằng protein tinh khiết

có hoạt động ức chế chống lại trypsin với giá trị cụ thể là 2398 U/mg. Shamsi et al.

(2016) đã phân lập và tinh chế một chất ức chế trypsin Kunitz (ASPI) mới từ tỏi

Allium sativum; Protein ASPI cho thấy hoạt độ ức chế chống lại trypsin là 30376

U/mg. Trong một nghiên cứu khác, Mohan et al. (2018) đã phân lập được chất ức

chế protease từ Capsicum frutescens với hoạt tính đặc hiệu chống lại trypsin là 6749

U/mg.

109

Hệ thống biểu hiện gen ở E. coli nhìn chung đã được sử dụng rộng rãi để tạo

protein tái tổ hợp. Tuy nhiên trong nhiều trường hợp protein tổng hợp ở vi khuẩn

không có hoạt tính sinh học hoặc không ổn định. Hơn nữa vi khuẩn thường tạo ra

chất gây sốt (pyrogen) ở người và động vật, vì vậy các protein biểu hiện ở vi khuẩn

sẽ không an toàn và gây trở ngại lớn cho việc áp dụng protein tái tổ hợp vào công

nghệ thực phẩm, công nghệ dược liệu. Nhằm khác phục nhược điểm trên, các nhà

nghiên cứu đã tạo ra các hệ biểu hiện Eukaryote để tổng hợp lượng lớn protein dùng

chữa bệnh cho người và động vật. Protein này phải được đảm bảo về chức năng và

các đặc điểm sinh lý- sinh hóa. Sở dĩ Eukaryot có khả năng tạo được protein có đặc

điểm tốt như vậy là do tế bào Eukaryot có quá trình sửa đổi sau khi dịch mã rất

hoàn thiện, các cầu disulfit được hình thành chính xác bởi disulfit-isomerase, quá

trình cải biến protein để tạo ra protein có hoạt tính diễn ra chính xác, có khả năng

glycosil hóa, photphoryl hóa, acetyl hóa protein. Nấm men P. pastoris là cơ thể

Eukaryot đã nổi lên như một vật chủ quan trọng và hiệu quả trong công nghệ sinh

học hiện đại. Nó được sử dụng như một hệ thống biểu hiện thành công cho protein

tái tổ hợp trong nghiên cứu và sản xuất công nghiệp (Cregg et al., 1993; Morton et

al, 2000; Lê Trần Bình et al., 2003; Senerovic et al., 2006; Cos et al., 2006;

Arjmand et al., 2011). Kết quả nghiên cứu của chúng tôi cũng thu được protein PI-

QT từ nấm men P. pastoris có hoạt tính cao hơn khi biểu hiện trong vi khuẩn E.

coli.

Serpin là một glycoprotein và việc bổ sung các gốc carbohydrate vào các vị

trí thích hợp là một sửa đổi quan trọng sau dịch mã rất cần thiết cho sự ổn định của

protein Serpin (Arjmand et al., 2011). Do đó, để có được glycosyl hóa thích hợp là

một trong những mối quan tâm chính trong việc sản xuất Serpin tái tổ hợp. Các hệ

biểu hiện phù hợp nhất để sản xuất Serpin ở dạng chính xác với sự sửa đổi gần nhất

với Serpin đích thực của con người là các tế bào động vật có vú (Dodd & Leiby.,

2004). Nhưng sử dụng các tế bào này để sản xuất protein tái tổ hợp là một quá trình

tốn thời gian và ứng dụng công nghiệp/ dược phẩm của nó không hiệu quả về chi

phí. Sử dụng các loại nấm men như P. pastoris để sản xuất Serpin glycoprotein

dường như là một sự thay thế hiệu quả và mang lại năng suất cao hơn. P. pastoris so

với hai loại nấm men khác (Saccharomyces cerevisiae và Hansenula polymorpha)

110

tạo ra ɑ1-antitrypsin tái tổ hợp với mẫu glycosyl hóa gần giống với ɑ1-antitrypsin

của con người (Kang et al., 1998). Mochizuki et al. (2001) đã mô tả sự biểu hiện và

tinh chế của rATIII trong nấm men P. pastoris. Antithrombin III (ATIII) là một

thành viên của siêu họ Serpin và là chất điều chỉnh chính trong quá trình đông máu.

Protein rATIII đạt mức 320 IU/L trong môi trường nuôi cấy ở 169 h. Từ dịch nuôi

cấy, protein rATIII đã được tinh chế đến hơn 99 % bằng phương pháp sắc ký ái lực

ái lực Heparin và các phương pháp sắc ký cột khác. Tổng hàm lượng của protein

rATIII tinh khiết là 60 mg. Do đó, mức sản xuất của protein rATIII là hơn 100

mg/L trong môi trường nuôi cấy. Khả năng biểu hiện protein rATIII của P. pastoris

vì thế cao hơn nhiều so với S. cerevisiae, được báo cáo là tối đa 0,1 mg/L.

Kết quả của một số nghiên cứu khác cho thấy bản chất siêu bền của nếp gấp

Serpin là cần thiết cho chức năng ức chế của nó, nhưng có thể gây khó khăn cho

việc sản xuất protein tái tổ hợp do xu hướng trùng lặp. Vấn đề này trở nên trầm

trọng hơn trong trường hợp huyết thanh, một nhóm bệnh được đặc trưng bởi sự

trùng hợp của Serpin in vivo. Các nghiên cứu in vitro về các đột biến huyết thanh

này bị cản trở bởi sự mất ổn định nội tại của chúng có thể kích hoạt các phản ứng

protein chưa mở trong ER hoặc làm giảm hiệu quả của quá trình tinh chế. Biểu hiện

trong nấm men cung cấp một cách mới để sản xuất các protein có liên quan về mặt

y tế này. Bằng cách đơn giản loại bỏ peptide tín hiệu khỏi đầu N, Serpin được

hướng vào tế bào chất để gập lại, cho phép nó tránh làm căng ER, trong khi vẫn gập

trong quá trình tăng sinh (Levina et al., 2009; Kaiserman et al., 2011).

Một số nghiên cứu về protease inhibitor nguồn gốc vi sinh vật liên kết hải

miên biển đã được báo cáo, đa số là phân lập, tuyển chọn các chủng có hoạt tính ức

chế proteases, sau đó tách chiết hợp chất này từ chủng vi sinh vật phân lập.

Wahyudi et al. (2010) đã phân lập 138 chủng vi khuẩn từ hải miên Jaspis sp., trong

đó có 3 chủng có hoạt tính PI được đặt tên là SAB S-12, SAB S-21, và SAB S-17.

Hoạt tính ức chế subtilisin của chúng tương ứng là 62,06 %; 27,58 % và 20,68 % ở

28 h. Hoạt tính ức chế thermolysin của chúng tương ứng là 6,25 % ở 8 h; 14,58 %

và 12,5 % ở 28 h. Có nghĩa hoạt tính ức chế subtilisin của cả 3 chủng cao nhất sau

28 h nuôi cấy và hoạt tính ức chế thermolysin cao nhất của chủng SAB S-12 là sau

8 h và của 2 chủng còn lại là sau 28 h nuôi cấy.

111

Từ 18 loài hải miên Caribe đã phân lập 79 chủng vi khuẩn thuộc 20 chi của

bộ Actinomycetales và 7 chủng thuộc 2 chi của bộ Sphingomonadales. Dịch chiết

thô của các chủng chọn lọc thể hiện hoạt tính ức chế protease cathepsins B và L,

rhodesain và falcipain-2 cũng như hoạt tính điều biến miễn dịch như cảm ứng tiết

cytokine bởi tế bào máu ngoại vi đơn nhân của người (Tabares et al, 2011).

Abdelmohsen et al. (2012) đã phân lập chủng Micromonospora sp. RV115 từ hải

miên Aplysina aerophoba, Croatia và hợp chất Diazepinomicin đã được tách chiết

từ chủng vi khuẩn này và được nhận dạng bằng phân tích khối phổ, so sánh với dữ

liệu có sẵn. Diazepinomicin ức chế proteases rhodesain và cathepsin L ở nồng độ

IC50 of 70–90 μM. Karthik et al. (2014) cũng đã tuyển chọn được 3 chủng

actinobacteria từ 100 chủng phân lập thể hiện hoạt tính ức chế proteases trypsin,

chymotrypsin và proteinase K từ trung bình đến cao.

Theo nhận biết của chúng tôi, hiện nay chưa có nghiên cứu nào sàng lọc gen

ức chế protease bằng phương pháp để biểu hiện trong nấm men Pichia pastoris. Kết

quả nghiên cứu của chúng tôi là báo cáo đầu tiên về vấn đề này.

112

KẾT LUẬN VÀ KIẾN NGHỊ

Kết luận

1. Đã thu thập được 8 mẫu hải miên tại biển Quảng Trị. Lựa chọn mẫu DNA đạt

hàm lượng, độ tinh sạch cao và có đa dạng vi sinh vật cao là DNA QT2 (vi sinh

vật liên kết hải miên Spheciospongia vesparium, biển Quảng Trị) để giải trình tự

metagenomics.

2. Kết quả giải trình tự nhận được tổng kích thước hệ gen của mẫu QT2 là 418 Mb.

CSDL metagenomics cho mẫu QT2 đã được xây dựng. Từ đó, sàng lọc được

tổng 50 gen mã hóa chất ức chế protease (PIs), trong đó, 28 gen, chiếm 56 %

được chú giải thuộc họ Serpin (Serine protease inhibitor); còn lại 22 gen (44 %)

thuộc nhóm Inter-alpha-trypsin inhibitor.

3. Đã biểu hiện thành công gen PI-QT trong cả 2 hệ biểu hiện E. coli và P. pastoris.

Protein tái tổ hợp thu hồi từ E. coli BL21(DE3) dưới dạng tan có hoạt tính ức chế trypsin khá mạnh (87 % khi sử dụng 468 µg protein PI-QT; Ki= 1,33 × 10-8 M ),

ức chế yếu hơn với ɑ-chymotrypsin (51 % khi sử dụng 468 µg protein PI-QT; Ki= 2,87 × 10-8 M) và không ức chế thermolysin. Protein PI-QT thu hồi từ

P. pastoris SMD 1168 có hoạt tính ức chế cao hơn với trypsin, yếu hơn với α- chymotrypsin và rất yếu với thermolysin (88,7 %, Ki= 1,12 × 10-7 M ; 69 %, Ki= 1,45 × 10-8 M; 43 %, Ki= 1,37 × 10-10 M; tương ứng, ở nồng độ 2 mg protein).

Protein PI-QT thu hồi từ 2 hệ trên đều có độ tinh sạch trên 85 %. Ngoài ra,

nghiên cứu ảnh hưởng của một số yếu tố như nhiệt độ, pH, cho thấy protein PI- QT có hoạt tính mạnh nhất khi được giữ ở 4 oC, ổn định trong dải 30 oC đến 70 oC, bất hoạt ở 100 oC. Hoạt tính ức chế protease của protein PI-QT ổn định và

cao trong dải pH 7-9.

Kiến nghị

Kết quả của luận án cho thấy việc tìm kiếm các chất có hoạt tính sinh học từ

vi sinh vật biển thông qua kỹ thuật metagenomics là hướng đi mới nhiều triển vọng.

Vì vậy, trong tương lai cần có thêm nhiều nghiên cứu về hệ vi sinh vật liên kết với

sinh vật biển hơn nữa.

113

DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ

1. Nguyen Thi Kim Cuc, Ton That Huu Dat, Tran Thi Hong, Pham Viet Cuong, Phylogenetic diversity of microorganisms asscociated with three marine

sponges from Mien Trung sea of Viet Nam. Journal of Science and Technology, 2017, 55(2), 168-177.

2. Tran Thi Hong, Ton That Huu Dat, Pham Viet Cuong, Nguyen Thi Kim Cuc, sponge-associated from marine inhibitors sponge and

Protease microorganisms. Journal of Science and Technology, 2018, 56(4), 405-423. 3. Trần Thị Hồng, Nguyễn Thị Kim Cúc, Tôn Thất Hữu Đạt, Phạm Việt Cường,

Sàng lọc các vi khuẩn ức chế protease liên kết với hải miên Đà Nẵng, Việt

Nam. Tuyển tập báo cáo hội nghị khoa học công nghệ sinh học toàn quốc,

2018, 743-748. Nhà xuất bản Khoa học tự nhiên và Công nghệ. ISBN: 978-

604-913-759-4.

4. Trần Thị Hồng, Phạm Việt Cường, Nguyễn Thị Kim Cúc, Sàng lọc gen ức

chế protease từ metagenomics của vi sinh vật liên kết với hải miên biển Quảng

Trị (Việt Nam). Academia Journal of Biology, 2019, 41(2), 49-60.

5. Tran Thi Hong, Ton That Huu Dat, Nguyen Phuong Hoa, Tran Thi Kim

Dung, Vu Thi Thu Huyen, Le Minh Bui, Nguyen Thi Kim Cuc, Pham Viet

Cuong, Expression and characterization of a new serine protease inhibitory

protein in Escherichia coli. Biomedical research and therapy, 2020, 7(2):

3633-3644.

114

TÀI LIỆU THAM KHẢO

1. Abbenante G, and D.P. Fairlie, Protease inhibitors in the clinic, Medicinal

Chemistry., 2005, 1, 71–104.

2. Abdelmohsen U.R, M. Szesny, E.M. Othman, T. Schirmeister, S. Grond, H.

Stopper and U. Hentschel, Antioxidant and Anti-Protease Activities of

Diazepinomicin from the Sponge-Associated Micromonospora Strain RV115, Mar

Drugs., 2012, 10, 2208-2221.

3. Abe T, F. P. Sahin, K. Akiyama, T. Naito, M. Kishigami, K. Miyamoto,

Construction of a Metagenomic Library for the Marine Sponge Halichondria

okadai, Bioscience Biotechnology and Biochemistry., 2014, 76 (4).

4. Aguirre C, S. Valdes-Rodrıguez, G. Mendoza-Herna´ndezb, A. Rojo-

Dom´ınguezc, and A. Blanco-Labra, A novel 8.7 kDa protease inhibitor from chan

seeds (Hyptis suaveolens L.) inhibits proteases from the larger grain borer

Prostephanus truncatus (Coleoptera: Bostrichidae), Comparative Biochemistry

and Physiology., 2004, 138, 81–89.

5. Ahmad M, M. Hirz, H. Pichler, H. Schwab, Protein expression in Pichia pastoris:

recent achievements and perspectives for heterologous protein production,

Applied Microbiology and Biotechnology., 2014, 98, 5301–5317.

6. Alma’abadi A.D, T. Gojobori, K. Mineta, Marine Metagenome as A Resource for

Novel Enzymes, Genomics Proteomics Bioinformatics., 2015.

7. Ana R, E. Mihaela-Carmen, S. Maria, GuideaSilvana, L. Rina, and J. Stefana, In

search of plant sources for serine protease inhibitors: I Detection of serine

protease inhibitors in callus cultures induced from somatic explants of flax (Linum

usitatissimum L, Romanian Biotechnological Letters 15., 2010.

8. Anderson J, C. Schiffer, S. KLee, and R. Swanstrom, Viral protease inhibitors,

Handbook of Experimental Pharmacology., 2009, 189, 85-110.

115

9. Andrea P.R.G, Optimized bacterial expression and purification of the c-Src

catalytic domain for solution NMR studies, Journal of Biomoecular NMR, 2009,

44(2), 87-93.

10. Annadana, J. Peters, K. Gruden, A. Schipper, N.S. Outchkourov, M.J. Beekwilder,

M. Udayakumar, and M.A. Jongsma, Effects of cysteine protease inhibitors on

oviposition rate of the western flower thrips Frankliniella occidentalis, Journal of

Insect Physiology., 2002, 48, 701-706.

11. Angelova L, M. Dalgalarrondo, I. Minkov, S. Danova, N. Kirilov, J. Serkedjieva,

J.M. Chobert, T. Haertl, and I. Ivanova, Purification and characterization of a

protease inhibitor from Streptomyces chromofuscus 34-1 with an antiviral activity,

Biochimica et Biphysica acta., 2006, 1760, 1210-1216.

12. Arjmand M.H , F.A. Shah, M.S. Moghadam, F. Tara, A. Jalili, M. M. Bazaz,

and D.H. Alamdari, Prooxidant-Antioxidant Balance in Umbilical Cord Blood of

Infants with Meconium Stained of Amniotic Fluid, Biochemistry Research

International., 2013, Article ID 270545, 4 pages.

13. Arjmand S., Bidram E., A. S. Lotfi, M. Shamsara, S. J.Mowla, Expression and

Purification of Functionally Active Recombinant Human Alpha 1-Antitrypsin in

Methylotrophic Yeast Pichia pastoris, Avicenna Journal of Medical

Biotechnology, 2011, 3(3), 127–134.

14. Ashburner M, C. Ball, J. Blake, Gene ontology: tool for the unification of biology.

The gene ontology consortium database resources of the national center for

biotechnology information, Nucleic acids research., 2006, 34.

15. Bairoch A, R. Apweiler, The SWISS-PROT protein sequence database and its

supplement TrEMBL, Nucleic acids research., 2000, 28(1), 45-48.

16. Bankevich A, S. Nurk, D. Antipov, A.A. Gurevich, M. Dvorkin, A.S. Kulikov,

V.M. Lesin, S.I. Nikolenko, S. Pham, A.D. Prjibelski, et al., SPAdes: a new

genome assembly algorithm and its applications to single-cell sequencing, Journal

of computational biology: a journal of computational molecular cell biology.,

2012, 19(5), 455-477.

116

17. Barone R, C. D. Santi, F. Palma Esposito, P. Tedesco, F. Galati, M. Visone, A. Di

Scala, D. De Pascale, Marine metagenomics, a valuable tool for enzymes and

bioactive compounds discovery, Frontiers in Marine Science ., 2014, 1, 38.

18. Bayer K, L. Moitinho-Silva, F. Brümmer, C.V. Cannistraci, T. Ravasi, U.

Hentschel, GeoChip-based insights into the microbial functional gene repertoire of

marine sponges (high microbial abundance, low microbial abundance) and

seawater, Federation of European Microbiological Societies., 2014b, 90, 832–843.

19. Boettner M, B. Prinz, C. Holz, U. Stahl, C. Lang, High-throughput screening for

expression of heterologous proteins in the yeast Pichia pastoris. Journal

of Biotechnology., 2002, 99, 51-62.

20. Bolger A.M, M. Lohse, B. Usadel, Trimmomatic: a flexible trimmer for Illumina

sequence data. Bioinformatics., 2014, 30(15), 2114-2120.

21. Bringmann G, G. Lang, J. Muhlbacher, K. Schaumann, S. Steffens, P.G. Rytik, U.

Hentschel, J. Morschhauser, W.E.G. Müller, Sorbicillactone A: A structurally

unprecedented bioactive novel-type alkaloid from a sponge-derived fungus.

Progress in Molecular and Subcellular Biology., 2003, 37, 231–253.

22. Burki F, K.S. Tabrizi, M. Minge, A. Skjæveland , S.I. Nikolaev, K.S. Jakobsen, et

al., Phylogenomics reshuffles the eukaryotic supergroups, PLoS ONE., 2007, 2,

e00790.

23. Cantarel B. L, P. M. Coutinho, C. Rancurel, T. Bernard, V. Lombard, B. Henrissat,

The Carbohydrate-Active EnZymes database (CAZy): an expert resource for

glycogenomics, Nucleic acids research., 2009, 37(1), 233-238.

24. Caporaso J.G., C.L. Lauber., W.A. Walters, D. Berg-Lyons Huntley J, et al., Ultra-

high-throughput microbialcommunity analysis on the Illumina HiSeq and MiSeq

platforms, The International Society for Microbial Ecology., 2012, 6, 1621–1624.

25. Cárdenas C.A, J.J. Bell, S.K. Davy, et al, Influence of environmental variation on

symbiotic bacterial communities of two temperate sponges. Federation of European

Microbiological Societies Microbiology Ecology., 2014, 88, 516–527.

117

26. Carr R and E. Borenstein, Comparative Analysis of Functional Metagenomic

Annotation and the Mappability of Short Reads, PLoS One., 2014, 9(8), 105776.

27. Castillo T, J.A. Jacobo, C.M. Blanco-Labra, Characterization of a highly stable

trypsin-like proteinase inhibitor from the seeds of Opuntia streptacantha (O.

streptacantha Lemaire), Phytochemistry., 2009, 70, 1374–1381.

28. Cavalcanti F.F and M. Klautau, Solenoid: a new aquiferous system to Porifera,

Zoomorphology., 2011, 130(4), 255–260.

29. Cereghino J.L, and J.M. Cregg, Heterologous protein expression in the

methylotrophic yeast Pichia pastoris. European Microbiological Societies

Microbiol Reviews., 2000b, (24), 45–66.

30. Cos O, R. Ramon, J.L. Montesinos, F. Valero, Operational strategies, monitoring

and control of heterologous protein production in the methylotrophic yeast Pichia

pastoris under different promoters: a review, Microbial Cell Factories., 2006, 5,

17–37.

31. Curvers S, P. Brixius, T. Klauser, J. Thommes, D. Weuster-Botz, R. Takors, et al.,

Biotechnology Progress., 2001, 17, 495–502.

32. Cynthia C.S, H. Helen, S.Tim, M. Pauline, O.D.P. Sérgio, C.F.S. Lívia, M.P.V.

Pedro, V. Renato, P.S. Maíra, P.R.T. Ana, M.J.S. Vânia. and M.O. Valéria,

Identification of Genes and Pathways Related to Phenol Degradation in

Metagenomic Libraries from Petroleum Refinery Wastewater, PLoS One., 2013,

8.

33. Chan Y.S, Y. Zhang, S.C. Sze, T.B. Ng, A thermostable trypsin inhibitor with

antiproliferative activity from small pinto beans, Journal Enzyme Inhibitor

Medicine Chemischy., 2014; 29(4), 485–90.

34. Châu Văn Minh, Nguyễn Xuân Cường, Nguyễn Hải Đăng, Nguyễn Phương Thảo,

Trần Hồng Quang, Nguyễn Hữu Tùng, Nguyễn Hoài Nam, Nguyễn Văn Hùng,

Phan Văn Kiệm, Điểm lại các nghiên cứu hóa học và hoạt tính sinh học của một số

loài sinh vật biển Việt Nam trong giai đoạn 2006-2012. Tạp chí Khoa học và Công

nghệ, 2012, 50(6), 825-837.

118

35. Choi T.J and T.T. Geletua, High level expression and purification of recombinant

flounder growth hormone in E. coli, Journal of Genetic Engineering

and Biotechnology., 2018, 16(2), 347–355.

36. Chou C.P, Engineering cell physiology to enhance recombinant protein production

in Escherichia coli, Applied Microbiology and Biotechnology., 2007, 76(3), 521-

532.

37. Christopher S.J, and T.C. Clifford, Biologic protease inhibitors as novel

therapeutic agents. Biochimie., 2010, 92, 1681-1688.

38. de Goeij J.M, D. van Oevelen, M.J. Vermeij, R. Osinga, J.J. Middelburg, A.F. de

Goeij, and W. Admiraal, Surviving in a marine desert: the sponge loop retains

resources within coral reefs, Science., 2013, 342, 108-110.

39. Dodd R.Y, D.A. Leiby, Emerging infectious threats to the blood

supply, Annual Review of Medicine., 2004, 55, 191–207.

40. Dragosits M, J. Stadlmann, J. Albiol, K. Baumann, M. Maurer, B. Gasser, M.

Sauer, F. Altmann, P. Ferrer, D. Mattanovich, The effect of temperature on the

proteome of recombinant Pichia pastoris, Journal of Proteome Research., 2009, 8,

1380-1392.

41. Dufour A, C.M. Overall, Missing the target: matrix metalloproteinase antitargets

in inflammation and cancer, Trends Pharmacol Sci., 2013, 34: 233–242.

42. Đỗ Mạnh Hào, Phạm Thế Thư, Một số kết quả nghiên cứu về vi sinh vật tại vùng

ven biển Hải Phòng. Tạp chí Khoa học và Công nghệ biển, 2010, 10(1), 51-65.

43. Đỗ Quý Hải, Động Học enzyme, Voer.edu.vn., 2013

44. Đỗ Thị Huyền, Lê Quỳnh Giang, Trần Ngọc Tân, Tô Long Thành, Trương Nam

Hải, Biểu hiện lượng lớn protein SEFA của Salmonella enterica serovar enteritidis

trong vi khuẩn Escherichia coli BL21, Tạp chí Công nghệ sinh học, 2008, 6(2),

175-182.

45. Easson C.G, R.W. Thacker, Phylogenetic signal in the community structure of

host-specific microbiomes of tropical marine sponges, Front Microbiol., 2014, 5,

1–11.

119

46. El-Gendy M.A, A.A. El-Bondkly, Production and genetic improvement of a novel

antimycotic agent, Saadamycin, against Dermatophytes and other clinical fungi

from Endophytic Streptomyces sp. Hedaya48. J. Ind,

Applied Microbiology and Biotechnology., 2010, 37, 831–841.

47. Erwin P.M, L. Pita, S. López-Legentil, X. Turon, Stability of sponge associated

bacteria over large seasonal shifts in temperature and irradiance, Applied and

Environmental Microbiology., 2012, 78, 7358–7368.

48. Eyase F.L, H.M. Akala, J.D. Johnson, D.S. Walsh. Inhibitory Activity of

Ferroquine, versus Chloroquine, against Western Kenya Plasmodium falciparum

Field Isolates Determined by a SYBR Green I in Vitro Assay, American

Journal of Tropical Medicine and Hygiene., 2011, 85, 984–988.

49. Fakruddin M.D, R.M. Mazumdar, K.S.B. Mannan, A. Chowdhury, and M.N

Hossain, Critical Factors Affecting the Success of Cloning, Expression, and Mass

Production of Enzymes by Recombinant E. coli, Hindawi Publishing Corporation;

ISRN Biotechnology., 2013, Article ID 590587, 7 pages.

50. Falco M.C, and M.C. Silva-Filho, Expression of soybean proteinase inhibitors in

transgenic sugarcane plants: effects on natural defense against Diatrea

saccharalis, Plant Physiology and Biochemistry., 2003, 41, 761–766.

51. Fan L, D. Reynolds, M. Liu, M. Stark, S. Kjelleberg, N.S. Webster, and T. Thomas

Functional equivalence and evolutionary convergence in complex communities of

microbial sponge symbionts, PNAS., 2012, doi/10.1073/pnas.1203287109.

52. Farady C.J, C.S. Craik, Mechanisms of macromolecular protease inhibitors,

Chembiochem., 2010, 11(17), 2341-6.

53. Fazaeli A, A. Golestani, M. Lakzaei, S. S.R. Varaei, M. Aminian, Expression

optimization, purification, and functional characterization of cholesterol oxidase

from Chromobacterium sp. DS1, PLoS ONE., 2019, 14(2), e0212217.

120

54. Files D, M. Ogawa, C.H. Scaman, S.A. Baldwin, A Pichia pastoris fermentation

process for producing high-levels of recombinant human cystatin-C,

Enzyme and Microbial Technology., 2001, 29, 335-40.

55. Franco O.L, D.J. Rigden, F.R. Melo, and M.F. Grossi-de-Sa, Plant α-amylase

inhibitors and their interaction with α-amylases-structure,function and potential

for crop protection, European Journal of Biochemistry., 2002, 269, 397-412.

56. Frlan R, and S. Gobec, Inhibitors of cathepsin B, Current Medicinal Chemistry.,

2006, 13, 2309–2327.

57. Gao M and Z. Shi, Process Control and Optimization for Heterologous Protein

Production by Methylotrophic Pichia pastoris. Chinese Journal of Chemical

Engineering., 2013, 21(2), 216-226.

58. García-Alcalde F, K. Okonechnikov, J. Carbonell, L.M. Cruz, S. Götz, S.

Tarazona, J. Dopazo, T.F. Meyer, A. Conesa, Qualimap: evaluating next-genration

sequencing alignment data, Bioinformatics., 2012, 28(20), 2678-2679.

59. García-Fraga B, A.F. da Silva, J. López-Seijas, C. Sieiro, Optimized expression

conditions for enhancing production of two recombinant chitinolytic enzymes from

different prokaryote domains, Bioprocess and Biosystems Engineering., 2015,

38(12), 2477–2486.

60. George I et al., Application of Metagenomics to Bioremediation. Metagenomics:

Theory, Methods and Applications, Caister Academic Press., 2010, ISBN 978-1-

904455-54-7.

61. Ghosh A, A. Mehta, A.M. Khan, Encyclopedia of Bioinformatics and

Computational Biology, Sciencedirect., 2019, (3), 184-193.

62. Gloeckner V, M. Wehrl, L. Moitinho-Silva, C. Gernert, P. Schupp, J.R. Pawlik,

N.L. Lindquist, D. Erpenbeck, G. Wörheide, U. Hentschel, The HMA-LMA

dichotomy revisited: an electron microscopical survey of 56 sponge species,

Biology Bulletin., 2014, 227, 78–88.

121

63. Habib H, M.F. Khalid, Plant protease inhibitors: a defense strategy in plants,

Biotechnology and Molecular Biology Reviews., 2007, 2, 68-85.

64. Habib S.J, et al., The N-terminal domain of Tob55 has a receptor-like function in

the biogenesis of mitochondrial beta-barrel proteins, Journal of Cell Biology.,

2007, 176(1), 77-88.

65. Hardoim C.C.P, M. Cardinale, A.C.B. Cucio, A.I.S. Esteves, G. Berg, J.R. Xavier,

C.J. Cox and R. Costa, Effects of sample handling and cultivation bias on the

specificity of bacterial communities in keratose marine sponges, Frontiers in

Microbiol 5 (article 611)., 2014, 1-15.

66. Heibges A, H. Glaczinski, A. Ballvora, F. Salamini, C. Gebhardt, Structural

diversity and organization of three gene families for Kunitz-type enzyme inhibitors

from potato tubers (Solanum tuberosum L.), Molecular Genetics and Genomics.,

2003, 269, 526-34.

67. Heibges A, H. Glaczinski, A. Ballvora, F. Salamini, C. Gebhardt, Structural

diversity and organization of three gene families for Kunitz-type enzyme inhibitors

from potato tubers (Solanum tuberosum L.), Molecular Genetics and Genomics.,

2003, 269, 526-34.

68. Hentschel U, J. Hopke, M. Horn, et al., Molecular Evidence for a Uniform from Different Oceans, Applied and Microbial Community in Sponges

Environmental Microbiology., 2002, 68, 4431–4440.

69. Hentschel U, J. Piel, S.M. Degnan, and M.W. Taylor, Genomic insights into the

marine sponge microbiome, Nature Reviews Microbiology., 2012, 10, 641-654.

70. Hill R.T, M. Hamann, O.T. Peraud, N. Kasanah, Manzamine Producing

Actinomycetes, United States Patent and Trademark., 2005.

71. Hirashima M, K. Tsuda, T. Hamada, H. Okamura, T. Furukawa, S. Akiyama, Y.

Tajitsu, R. Ikeda, M. Komatsu, M. Doe, Y. Morimoto, M. Shiro, R.W.M. van

Soest, K. Takemura, and T. Iwagawa, Cytotoxic Isomalabaricane Derivatives and

122

a Monocyclic Triterpene Glycoside from the Sponge Rhabdastrella globostellata,

Journal of Natural Products., 2010, 73 (9).

72. Hoàng Thu Hà, Phạm Thị Trân Châu, Nghiên cứu điều tra các chất ức chế

proteinase ở các phần khác nhau của thân và hạt cây tô mộc (Caesalpinia sappan

L.), Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Công nghệ., 2008, 24,

261-270.

73. Hong F, N.Q. Meinander, L.J. Jonsson, Biotechnology Bioengineering., 2002, 79,

438-449.

74. Horn H, B.M. Slaby, M.T. Jahn, K. Bayer, L. Moitinho-Silva, F. Förster, et al, An

enrichment of CRISPR and other defense-related features in marine sponge-

associated microbial metagenomes. Frontiers in Microbiology., 2016, 7, 1751.

75. Hyatt D, G.L. Chen, P.F. LoCascio, M.L. Land, F.W. Larimer, L.J. Hauser,

Prodigal: prokaryotic gene recognition and translation initiation site

identification, BMC bioinformatics, 2010, 11(1), 1.

76. Isabel N.S, C.A. Javier, P.V. Suzan, S. Anete Pereira de, V.S.N. Eugenio dos and

M.O. Valéria, New Hydrocarbon Degradation Pathways in the Microbial

Metagenome from Brazilian Petroleum Reservoirs, PLoS One., 2014, 9(2).

77. Jahic M, M. Gustavsson, A. K. Jansen, M. Martinelle, & S.O. Enfors, Journal of

Biotechnology., 2003, 102, 45–53.

78. Jiang C, L.L. Wu, G.C. Zhao, P.H Shen, K. Jin, Z.Y. Hao, S.X Li, G.F. Ma, F.F

Luo, G.Q. Hu, W.L. Kang, X.M. Qin, Y.L. Bi, X.L. Tang, B. Wu, Identification

and characterization of a novelfumarase gene by metagenome expressioncloning

from marine microorganisms, Microbial Cell Factories., 2010, 9(1), 2-9.

79. Jiang C. J, Z.Y. Hao, R. Zeng, P.H. Shen, and J.F. Li, Characterization of a novel

serine protease inhibitor gene from a marine metagenome, Marine Drugs., 2011, 9,

1487-1501.

80. Johnston P, J. Phillips, T. Shun, S. Shinde, J. Lazo, D. Huryn, et al., HTS identifies

novel and specific uncompetitive inhibitors of the two-component NS2B-NS3

123

proteinase of West Nile virus, Assay and drug development technologies., 2007, 5,

737-50.

81. Jongsma M.A, J. Beekwilder, Co-evolution of insect proteases and plant protease

inhibitors, Current Protein & Peptide Science., 2011,12(5), 437-47.

82. Joseph B, S. Sujatha, Pharmacologically Important Natural products from Marine

Sponges, Journal of Natural Products., 2011, 4, 05-12.

83. Kaiserman D, C. Hitchen, V. Levina, S.P. Bottomley, P.I. Bird, Intracellular

Production of Recombinant Serpins in Yeast. Serpin Structure and Evolution.,

2011, 1–12.

84. Kalinin V.I, N.V. Ivanchina, V.B. Krasokhin, T.N. Makarieva and V.A. Stonik,

Glycosides from Marine Sponges (Porifera, Demospongiae): Structures,

Taxonomical Distribution, Biological Activities and Biological Roles, Marine

Drugs., 2012, 10, 1671-1710.

85. Kanehisa M, S. Goto, Y. Sato, M. Furumichi, M. Tanabe, KEGG for integration

and interpretation of large-scale molecular data sets, Nucleic acids research.,

2011, 988.

86. Karthik K, N.S. Muneeswaran, H.V. Manjunathachar, M. Gopi, A. Elamurugan

and S. Kalaiyarasu, Bacteriophages: Effective alternative to antibiotics, Advances

in Animal and Veterinary Sciences., 2014, 2, 1-7.

87. Kaspari M.S, and E. Bogner, Antiviral activity of proteasome

inhibitors/cytomegalovirus. In: Lendeckel U, Hooper NM (eds) Viral proteases and

antiviral protease inhibitor therapy, Springer Media., 2009, 71–81.

88. Kaur J, A. Kumar, J. Kaur, Strategies for optimization of heterologous protein

expression in E. coli: Roadblocks and reinforcements, International Journal of

Biological Macromolecules., 2018, 106, 803–822.

89. Kennedy J, O'Leary N.D, Kiran G.S, Morrissey J.P, O'Gara F, Selvin J, Dobson

A.D, Functional metagenomic strategies for the discovery of novel enzymes and

124

biosurfactants with biotechnological applications from marine ecosystems, Journal

of Applied Microbiology., 2011, 111(4), 787-99.

90. Kim M, et al., Phosphorylation of the yeast Rpb1 C-terminal domain at serines 2,

5, and 7, Journal of Biological Chemistry., 2009, 284(39), 26421-26426.

91. Kim W, et al., Yos9p detects and targets misfolded glycoproteins for ER-

associated degradation, Molecules and Cells., 2005, 19(6), 753-764.

92. Koganesawa N, T. Aizava, H. Shimojo, et al, Expression and purification of a

small cytokine growth-blocking peptide from armyworm Pseudaletia separata by

an op-timized fermentation method using the methylotrophic yeast Pichia pastoris,

Protein Expression and Purification., 2002, 25, 416-425.

93. Krishnan B, L. Hedstrom, N. D. Hebert, L.M. Gierasch, A.Gershenson, Expression

and Purification of Active Recombinant Human Alpha-1 Antitrypsin (AAT) from

Escherichia coli, Methods in Molecular Biology., 2017, 1639, 195–209.

94. Krishnan B, L. Hedstrom, N. D. Hebert, L.M. Gierasch, A.Gershenson, Expression

and Purification of Active Recombinant Human Alpha-1 Antitrypsin (AAT) from

Escherichia coli, Methods in Molecular Biology., 2017, 1639, 195–209.

95. Kuzmic P, L. Cregar, S. Millis, M. Goldman, Mixed-type noncompetitive inhibition

of anthrax lethal factor protease by aminoglycosides, FEBS Journal., 2006, 273,

3054-62.

96. Khunaizi M.A, Cliff J Luke, Yuko S Askew, Stephen Pak, The Serpin SQN-5 Is a

Dual Mechanistic-Class Inhibitor of Serine and Cysteine Proteinases,

Biochemistry., 2002, 41(9), 3189-99.

97. la Porte C.J, Saquinavir the pioneer antiretroviral protease inhibitor, Expert

Opinion on Drug Metabolism & Toxicology., 2009, 5, 1313–1322.

98. Lafi F.F, J.A. Fuerst, L. Fieseler, C. Engels, W.W.L. Goh, & U. Hentschel,

Widespread distribution of Poribacteria in Demospongiae, Applied and

Environmental Microbiology., 2009, 75(17), 5695-5699.

125

99. Langmead B, S.L. Salzberg, Fast gapped-read alignment with Bowtie 2, Nature

methods, 2012, 9(4), 357-359.

100. Lawrence P.K, and K.R. Koundal, Plant protease inhibitors in control of

phytophagous insects, Electronic Journal of Biotechnology., 2002, 5, 93-109.

101. Lee O.O, J. Yang, S. Bougouffa, Y. Wang, Z. Batang, R. Tian, A. Al-Suwailem

and P.Y. Qian, Spatial and species variations in bacterial communities associated

with corals from the Red Sea as revealed by pyrosequencing, Applied and

Environmental Microbiology., 2012, 78, 7173–7184.

102. Lee O.O, Y. Wang, J. Yang, F.F. Lafi, A. Al-Suwailem, P.Y. Qian,

Pyrosequencing reveals highly diverse and species-specific microbial communities

in sponges from the Red Sea, ISME Journal., 2011, 5, 650–664.

103. Lee S.J, S.Y. Lee, Efficient high level production of spider silk protein by fed-

batch cultivation of recombinant Escherichia coli and its purification,

Theoretical Foundations of Chemical Engineering., 2002, 8(2), 3969-3972.

104. Levina V, W. Dai, A.S. Knaupp, D. Kaiserman, M.C. Pearce, L.D. Cabrita, P.I.

Bird, S.P. Bottomley, Expression, purification and characterization of

recombinant Z alpha(1)-antitrypsin—The most common cause of alpha(1)-

antitrypsin deficiency, Protein Expression and Purification., 2009, 68, 226–232.

105. Lê Trần Bình, Phan Văn Chi, Nông Văn Hải, Trương Nam Hải, Lê Quang

Huấn, Áp dụng các kỹ thuật phân tử trong nghiên cứu tài nguyên sinh vật việt nam.

Nhà xuất bản Khoa học và Kỹ thuật, 2003.

106. Li P, X. Gao, et al, Expression of Recombinant Proteins in Pichia Pastoris,

Applied Biochemistry and Biotechnology., 2007, 142(2),105-24.

107. Li P.Z, X.G. Gao, R.O. Arellano, V. Renugopalakrishnan, Protein Expression

and Purification., 2001, 22, 369–380.

108. Li W, A. Godzik, Cd-hit: a fast program for clustering and comparing large

sets of protein or nucleotide sequences, Bioinformatics., 2006, 22(13), 1658-1659.

126

109. Li Y, D. Liu, S. Cen, P. Proksch, W. Lin, Isoindolinone-type alkaloids from the

sponge-derived fungus Stachybotrys chartarum, Tetrahedron., 2014, 70, 7010–

7015.

110. Li Y.X, S.W.A. Himaya and K. Se-Kwon, Triterpenoids of Marine Origin as

Anti-Cancer Agents, Molecules., 2013, 18, 7886-7909.

111. Ling L.Y, I. Ithoi, F.M. Yik, Optimization for high-level expression in Pichia

pastoris and purification of truncated and full leghth recombinant SAG2 of

TOXOPLASMA GONDII for diagnostic use Expression southeast asian, Tropical

Medicine and Public Health Project., 2010, 41(3), 507-513.

112. Lu J, H. Yang, H. Yu, W. Gao, R. Lai, J. Liu, X. Liang, A novel serine protease

inhibitor from Bungarus fasciatus venom, Peptides., 2008, 29, 369–374.

113. Mai Xuân Lương, Giáo trình enzyme, Trường Đại học Đà Lạt., 2005

114. Major I.T, and C.P. Constabel, Functional analysis of the kunitz trypsin

inhibitor family in poplar reveals biochemical diversity and multiplicity in defense

against herbivores, Plant Physiology., 2008, 146, 888-903.

115. Maldonado M, M. Ribes, F.C. van Duyl, Nutrient fluxes through sponges:

biology, budgets, and ecological implications, Advances in Marine Biology., 2012,

62, 113.

116. Mares M.C.D, D. Sipkema, S. Huang, B. Bunk, J. Overmann, J. Dirk, V. Elsas,

Host Specificity for Bacterial, Archaeal and Fungal Communities Determined for

High- and Low-Microbial Abundance Sponge Species in Two Genera, Front

Microbiol., 2017, 8, 2560.

117. Martín J, T. da S Sousa, G. Crespo, S. Palomo, I. González, J.R. Tormo, M. de

la Cruz, M. Anderson, R.T. Hill, F. Vicente, et al., Kocurin, the true structure of

PM181104, an Anti-Methicillin-Resistant Staphylococcus aureus (MRSA) thiazolyl

peptide from the marine-derived bacterium Kocuria palustris, Marine Drugs.,

2013, 11, 387–398.

127

118. Mehbub M.F, Jie Lei, Christopher Franco, and Wei Zhang, Marine Sponge

Derived Natural Products between 2001 and 2010: Trends and Opportunities for

Discovery of Bioactives, Marine Drugs., 2014, 12, 4539-4577.

119. Minning S, A. Serrano, P. Ferrer, C. Solá, R.D. Schmid, F. Valero, Optimization

of the high-level production of Rhizopus oryzae lipase in Pichia pastoris, Jounal

Biotechnol., 2001, 86, 59-70.

120. Mochizuki S, N. Hamato, M. Hirose, K. Miyano, W. Ohtani, S. Kameyama, …

H. Ohi, Expression and Characterization of Recombinant Human Antithrombin III

in Pichia pastoris, Protein Expression and Purification., 2001, 23(1), 55–65.

121. Moitinho-Silva L, S. Nielsen, A. Amir, A. Gonzalez, G.L. Ackermann, C.

Cerrano, C. Astudillo-Garcia, C. Easson, D. Sipkema, et al., The sponge

microbiome project, GigaScience., 2017, 6, 1–7.

122. Morton C.L, P.M. Potter, Comparison of Escherichia coli, Saccharomyces

cerevisiae, Pichia pastoris, Spodoptera frugiperda, and COS7 cells for

recombinant gene expression. Application to a rabbit liver

carboxylesterase, Molecular Biotechnology., 2000, 16(3), 193–202.

123. Mohan M, S. Kozhithodi, A. Nayarisseri, K.K. Elyas, Screening, Purifcation

and Characterization of Protease Inhibitor from Capsicum frutescens,

Bioinformation., 2018, 14(6), 285–93.

124. Murasugi & Y. Tohma-Aiba, Protein Expression and Purification., 2003, 27,

244–252.

125. Murphy G, The ADAMs: signalling scissors in the tumour microenvironment,

Nature Reviews Cancer., 2008, 8, 929-941.

126. Nagai K, K. Kamigiri, H. Matsumoto, Y. Kawano, M. Yamaoka, H. Shimoi, M.

Watanabe, K. Suzuki, YM-202204, a new antifungal antibiotic produced by marine

fungus Phoma sp., Journal of Antibiotics., 2002, 55, 1036–1041.

128

127. Naggie S, C. Hicks, Protease inhibitor-based antiretroviral therapy in

treatment-naive HIV-1-infected patients: the evidence behind the options, Journal

of Antimicrobial Chemotherapy., 2010, 65, 1094–1099.

128. Naim M.A, H. Smidt, D. Sipkema, Fungi found in Mediterranean and North

Sea sponges: how specific are they, Peer Jounal., 2017, 5, e3722.

129. Nazir A, Review on Metagenomics and its Applications, Imperial Journal of

Interdisciplinary Research., 2016, 2(3): 277-286.

130. Nurhayati T, M.T. Suhartono, L. Nuraida, S.B. Poerwanto, Karakterisasi Awal

Inhibitor Protease dari Bakteri yang Berasosiasi dengan Spons Asal Pulau

Panggang, Kepulauan Seribu, HAYATI Journal of Biosciences., 2006, 13(2): 58-

64.

131. Nguyen Huu Tung, Chau Van Minh, Tran Thu Ha, Phan Van Kiem, Hoang

Thanh Huong, Nguyen Tien Dat, Nguyen Xuan Nhiem, Bui Huu Tai, Jae-Hee

Hyun, Hee-Kyoung Kang, Young Ho Kim, C29-Sterols with a cyclopropane ring

at C-25 and 26 from the Vietnamese marine sponge Ianthella sp. and their

anticancer properties, Bioorganic & Medicinal Chem Letter., 2009. DOI:

10.1016/j.bmcl.2009.06.097.

132. Nguyen Xuan Cuong, Arlette Longeon, Van Cuong Pham, Félix Urvois,

Christine Bressy, Thi Thanh Van Trinh , Hoai Nam Nguyen, Van Kiem Phan, Van

Minh Chau, Jean-François Briand, and Marie-Lise Bourguet-Kondracki,

Antifouling 26, 27-Cyclosterols from the Vietnamese Marine Sponge Xestospongia

testudinaria. Journal of Natural Products., 2013, 76 (7), 1313–1318.

133. Nguyễn Thị Quý, Dương Thu Hương, Đặng Thị Ngọc Hà, Lê Thị Thu Hồng,

Đỗ Thị Huyền, Trương Nam Hải, Cải thiện khả năng biểu hiện protein SUMO-

IL11 từ tế bào Escherichia coli bằng cách lựa chọn điều kiện lên men phù hợp,

Tạp chí Sinh học., 2015, 37(1se): 289-295.

134. Nguyễn Thị Quý, Dương Thu Hương, Lê Ngọc Giang, Lê Thị Thu Hồng, Đỗ

Thi Huyền, Trương Nam Hải, Nghiên cứu tạo chủng Escherichia coli tái tổ hợp

129

biểu hiện Interleukin-3 và Interleukin-11 người dưới dạng lai với PelB, Tạp chí

sinh học., 2013, 35(3se), 94-99.

135. Oliva M.L, U.M. Sampaio, Action of plant proteinase inhibitors on enzymes of

physiopathological importance, Anais da Academia Brasileira de Ciências , 2009,

81, 615-621.

136. Oppert B, T.D. Morgan, K. Hartzer, B. Lenarcic, K. Galesa, J. Brzin, V. Turk,

K. Yoza, K. Ohtsubo, and K.J. Kramer, Effects of proteinase inhibitors on

digestive proteinases and growth of the red flour beetle, Tribolium castaneum

(Herbst) (Coleoptera:Tenebrionidae), Comparative Biochemistry and Physiology.,

2003, 134: 481–490.

137. Oppert B, T.D. Morgan, K.J. Kramer, Efficacy of Bacillus thuringiensis Cry3Aa

protoxin and protease inhibitors against coleopteran storage pests, Pest Manag

Sci.. 2011, 67(5), 568-73.

138. Orlowski R.Z, Bortezomib and its role in the management of patients with

multiple myeloma, Expert Review of Anticancer Therapy., 2004, 4, 171-179.

139. Palavalli M.H, S.S. Natarajan, T.T. Wang, H.B. Krishnan, Imbibition of soybean

seeds in warm water results in the release of copious amounts of Bowman-Birk

protease inhibitor, a putative anticarcinogenic agent, Journal of Agricultural and

Food Chemistry., 2012, 60, 3135-3143.

140. Pandey S, A. Sree, D.P. Sethi, C.G. Kumar, S. Kakollu, L. Chowdhury, S.S.

Dash, A marine sponge associated strain of Bacillus subtilis and other marine

bacteria can produce anticholinesterase compounds, Microbial Cell Factories.,

2014, 13(1), 24.

141. Pandhare J, K. Zog, and V.V Deshpande, Differential stabilities of alkaline

protease inhibitors from actinomycetes: Effect of various additives on

thermostability, Biores Technol., 2002, 84: 165-169.

142. Pawlik J.R, The Chemical Ecology of Sponges on Caribbean Reefs: Natural

Products Shape Natural Systems, Bioscience., 2011, 61, 888–898.

130

143. Pearce M.C, L.D. Cabrita, Production of recombinant serpins in Escherichia

coli, Methods Enzymol., 2011, 501, 13–28.

144. Perdicaris S, T. Vlachogianni, A. Valavanidis, Bioactive Natural Substances

from Marine Sponges: New Developments and Prospects for Future

Pharmaceuticals, Natural Products Chemistry and Research., 2013, 1, 115.

145. Pimentel-Elardo S.M, V. Buback, T.A.M. Gulder, T.S. Bugni, J. Reppart, G.

Bringmann, C.M. Ireland, T. Schirmeister, U. Hentschel, New Tetromycin

Derivatives with Anti-Trypanosomal and Protease Inhibitory Activities, Marine

Drugs., 2011, 9 (10), 1682-1697.

146. Potvin G, A. Ahmad & Z. Zhang, Bioprocess engineering aspects of heterologous protein production in Pichia pastoris: A review, Biochemical Engineering Journal.,

2012, 64: 91-105.

147. Prasad E, A.D Gupta, K. Padmasree, Purification and characterization of a

Bowman-Birk proteinase inhibitor from the seeds of black gram (Vigna mungo),

Phytochemistry., 2010, 71, 363-72.

148. Pruitt K.D, T.Tatusova, D.R. Maglott, NCBI reference sequences (RefSeq): a

curated non-redundant sequence database of genomes, transcripts and proteins,

Nucleic acids research., 2007, 35(1), 61-65.

149. Pruksakorn P, M. Arai, L. Liu, P. Moodley, W.R.J. Jacobs, M. Kobayashi,

ActionMechanism of Trichoderin A, an Anti-dormant Mycobacterial

Aminolipopeptide from Marine sponge-derived Trichoderma sp, Biological and

Pharmaceutical Bulletin., 2011, 34, 1287-1290.

150. Phan Tuấn Nghĩa, Đặng Quang Hưng, Tinh sạch chất ức chế trypsin (TI) từ hạt

đậu tương (Glycine max L.), Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và

Công nghệ, 2004, 20(4), 261-270.

151. Qadeer A, M. Zaman, and R.H. Khan, Inhibitory Effect of Post-micellar SDS

Concentration on Thermal Aggregation and Activity of Papain, Biochemistry

(Mosc)., 2014, 79, 785-796.

131

152. Qi R.F, Z. Song, C. Chi, Structural features and molecular evolution of

Bowman-Birk protease inhibitors and their potential application: Acta Biochem,

Biophys., 2005, 37, 283-292.

153. Radax R, F. Hoffmann, H.T. Rapp, S. Leininger, C. Schleper, Ammonia-

oxidizing archaea as main drivers of nitrification in cold-water sponges,

Environmental Microbiology., 2012, 14, 909–923.

154. Radwan M, A. Hanora, S. Khalifa, S.H. Abou-El-Ela, Manzamines, Cell Cycle.,

2012, 11, 1765–1772.

155. Ramadan A.U, M. Szesny, E.M. Othman, T. Schirmeister, S. Grond, H. Stopper,

U. Hentschel, Antioxidant and Anti-Protease Activities of Diazepinomicin from the

Sponge-Associated Micromonospora Strain RV115, Marine Drugs., 2012, 10 (10),

2208-2221.

156. Rawlings N.D, A.J. Barrett, and A. Bateman, MEROPS: the peptidase database,

Nucleic Acids Research., 2010, 38, 227–233.

157. Rawlings N.D, Peptidase inhibitors in the MEROPS database, Biochimie.,

2011, 92 (11), 1463-1483.

158. Reimer A, A. Blohm, T. Quack, C.G. Grevelding V. Kozjak-Pavlovic, T. Rudel,

U. Hentschel, U.R. Abdelmohsen, Inhibitory activities of the marine

streptomycete-derived compound SF2446A2 against Chlamydia trachomatis and

Schistosoma mansoni, Journal of Antibiotics., 2015, 68, 674-679.

159. Reveillaud J, L. Maignien, M.A. Eren, J.A. Huber, A. Apprill, M.L. Sogin and

A. Vanreusel, Host-specificity among abundant and rare taxa in the sponge

microbiome, ISME Journal., 2014, 8, 1198–1209.

160. Ritchie C, Protease và chất ức chế protease, State University, United States,

2019, //dx.doi.org/10.13070/mm.en.3.169

161. Roberts RL, et al., Purine synthesis and increased Agrobacterium tumefaciens

transformation of yeast and plants, Proceedings of the National

Academy of Sciences of the United States of America., 2003, 100(11), 6634-9.

132

162. Roberts T.H, S. Marttila, S.K. Rasmussen, J. Hejgaard, Differential gene

expression for suicide-substrate serine proteinase inhibitors (serpins) in vegetative

and grain tissues of barley, Journal of the Society of Experimental Botany., 2003,

54, 2251-2263.

163. Rodríguez-Marconi S, R. De La Iglesia, B. Díez, C.A. Fonseca, E. Hajdu, N.

Trefault, et al., Characterization of bacterial, archaeal and eukaryote symbionts

from Antarctic sponges reveals a high diversity at a three-domain level and a

particular signature for this ecosystem, PLoS ONE., 2015, 10, e138837.

164. Rosano G.L and E.A. Ceccarelli, Recombinant protein expression in

Escherichia coli: advances and challenges, Frontiers in Microbiology., 2014,

5(172).

165. Sabotič J, and J. Kos, Microbial and fungal protease inhibitors—current and

potential applications, Applied Microbiology and Biotechnology., 2012, 93, 1351–

1375.

166. Sagar S, M. Kaur, and K.P. Minneman, Antiviral Lead Compounds from Marine

Sponges, Marine Drugs., 2010, 8(10), 2619–2638.

167. Sapna K, Isolation, purification, characterization and application of

proteinaceous protease inhibitor from marine bacterium Pseudomonas mendocina

BTMW 301, PhD Thesis, Cochin University of Science and Technology, Kerala,

India., 2013, 215.

168. Sapna K, P.P. Manzur Ali, K.R. Rekha Mol, S.G. Bhat, M. Chandrasekaran,

K.K. Elyas, Isolation, purification and characterization of a pH tolerant and

temperature stable proteinaceous protease inhibitor from marine Pseudomonas

mendocina. Biotechnol Lett., 2017, 39(12), 1911-1916.

169. Schmitt S, U. Hentschel & M. Taylor, Deep sequencing reveals diversity and

community structure of complex microbiota in five Mediterranean sponges,

Hydrobiologia., 2012, 687, 341-351.

133

170. Schneemann I, K. Nagel, I. Kajahn, A. Labes, J. Wiese, J.F. Imhoff,

Comprehensive investigation of marine Actinobacteria associated with the sponge

Halichondria panicea, Applied and Environmental Microbiology., 2010, 76, 3702–

3714.

171. Sekar V, L. Lavreys, T. Van de Casteele, C. Berckmans, S. Spinosa-Guzman, T.

Vangeneugden, et al., Pharmacokinetics of darunavir/ritonavir and rifabutin

coadministered in HIV-negative healthy volunteers, Antimicrobial

Agents and Chemotherapy., 2010, 54, 4440–4445.

172. Senerovic L, N. Stankovic, P. Spizzo, A. Basso, L. Gar-dossi, B. Vasiljevic, et

al., High-level production and covalent immobilization of Providencia rettgeri

penicillin G acylase (PAC) from recombinant Pichia pastoris for the development

of a novel and stable biocatalyst of industrial applicability, Biotechnol Bioeng.,

2006, 93(2), 344–354.

173. Shamsi T, S. Fatima, R. paveen, Characterization, Biomedical and Agricultural

applications of Protease Inhibitors: A review, International Journal of Biological

Macromolecules., 2016, 91, 1–14.

174. Shi X, T. Karkut, M. Chamankhah, M. Alting-Mees, S.M. Hemmingsen, & D.

Hegedus, Protein Expression and Purification., 2003, 28, 321–330.

175. Shrikant Sharma, Shashank Rana, Raghvendar Singh, A short

notemetagenomics, International Journal of Business Research., 2012, 3(04),

181‐186.

176. Siegl A, J. Kamke, T. Hochmuth, J. Piel, M. Richter, C. Lian, T. Dandekar & U.

Hentschel, Single-cell genomics reveals the lifestyle of Poribacteria, a candidate

phylum symbiotically associated with marine sponges, ISME Journal., 2011, 5, 61-

70.

177. Silverman G.A., P.I. Bird , R.W. Carrell , F.C. Church, P.B. Coughlin, P.G.

Gettins, J.A. Irving, D.A. Lomas, C.J. Luke, R.W. Moyer, P. Pemberton, E.

Remold-O’Donnell, G. S. Salvesen, J. Travis, and J. C. Whisstock, The serpins are

134

an expanding superfamily of structurally similar but functionally diverse proteins.

Evolution, mechanism of inhibition, novel functions and a revised nomenclature,

Journal of Biological Chemistry., 2001, 276, 33293–33296.

178. Simister R.L, P. Deines, E.S. Botté, et al., Sponge-specific clusters revisited: a

comprehensive phylogeny of sponge-associated microorganisms, Environmental

Microbiology., 2012, 14, 517–524.

179. Singh J, A. Behal , N. Singla , A. Joshi , N. Birbian , S. Singh , V. Bali , N.

Batra, Metagenomics: Concept, methodology, ecological inference and recent

advances, Biotechnology Journal., 2009, 4(4), 480-494.

180. Sinha J, B.A. Plantz, W. Zhang, et al, Improved production of recombinant ovine inter-feron-T by Mut+ strain of Pichia pastoris using an optimised methanol

feed profile, Biotechnology Progress., 2003, 19, 794-802.

181. Sipkema D, H.W. Blanch, Spatial distribution of bacteria associated with the

marine sponge Tethya californiana, Marine Biology., 2009, 157, 627–638.

182. Sørensen H.P, K.K. Mortensen, Soluble expression of recombinant proteins in

the cytoplasm of Escherichia coli, Microbial Cell Factories., 2005, 4 (1).

183. Sperka T, J. Pitlik, P. Bagossi, J. Tozser, Beta-lactam compounds as apparently

uncompetitive inhibitors of HIV-1 protease, Bioorganic & Medicinal Chemistry

Letters., 2005, 15, 3086-90.

184. Stoeva S, and T. Efferth, Human cytomegalovirus: drug resistance and new

treatment options using natural products, Molecular Medicine Reports., 2008, 1,

781–785.

185. Tabares P, S.M.P. Elardo, T. Schirmeister, T. Hünig, U. Hentschel, Anti-

protease and immunomodulatory activities of bacteria associated with Caribbean

sponges, Marine Biotechnology., 2011, 13(5), 883–892.

186. Tamaki H, C.L. Wright, X. Li, Q. Lin, C. Hwang, S. Wang, J. Thimmapuram,

Y. Kamagata and W.T. Liu, Analysis of 16S rRNA amplicon sequencing options on

135

the Analysis of 16S rRNA amplicon sequencing options on the Roche/454 next-

generation titanium sequencing platform, PLoS One., 2011, 6, e25263.

187. Tatusov R. L, D. A. Natale, I. V. Garkavtsev, T. A. Tatusova, U. T.

Shankavaram, B. S. Rao, B. Kiryutin, M.Y. Galperin, N. D. Fedorova, E.V.

Koonin, The COG database: new developments in phylogenetic classification of

proteins from complete genomes, Nucleic acids research., 2001, 29(1), 22-28.

188. Taylor M.W, R. Radax, D. Steger, M. Wagner, Sponge-associated

microorganisms: evolution, ecology, and biotechnological potential, Microbiology

and Molecular Biology Reviews., 2007, 71(2), 295-347.

189. Tsybina T, Y. Dunaevsky, A. Musolyamov, T. Egorov, N. Larionova, N.

Popykina, and M. Belozersky, New protease inhibitors from buckwheat seeds:

properties, partial amino acid sequences and possible biological role, Journal of

Biological Chemistry., 2004, 385, 429-434.

190. Turk B, Targeting proteases: successes, failures and future prospects,

Nature Reviews Drug Discover., 2006, 5(9), 785–799.

191. Thi Tuyen Do; Dinh Quyen Le; Dinh Thi Quyen; Van Cuong Pham, Isolation

and identification of marine bacteria from marine mud in Vietnam with

antimicrobial activity. Journal of Vietnamese Environment., 2012, 3(2), 71-75.

192. Thi Huyen Do, Thi Thao Nguyen, Thanh Ngoc Nguyen, Quynh Giang Le,

Cuong Nguyen, Keitarou Kimura, and Nam Hai Truong, Mining biomass-

degrading genes through Illumina-basedde novosequencing and metagenomic

analysis of freeliving bacteria in the gut of the lower termite Coptotermes gestroi

harvested in Vietnam. Journal of Bioscience and Bioengineering., 2014, 118(6),

665-71.

193. Thoms C, P.J. Schupp, Chemical defense strategies in sponges: a review. In:

Porifera Res. Biodiversity, Innov. Sustain, Serie Livros 28 Museu Nacional, Rio de

Janeiro., 2007, 627–637.

136

194. Utkina N.K and V.A. Denisenko, Sesquiterpene quinones from a Vietnames

dea sponge sp, Chemistry of Natural Compounds., 2011, 47(1), 135-137.

195. van Soest R.W.M, N. Boury-Esnault, J. Vacelet, M. Dohrmann, D. Erpenbeck,

N.J. De Voogd, N. Santodomingo, B. Vanhoorne, M. Kelly, J.N.A. Hooper,

Global diversity of sponges (Porifera), PLoS One., 2012, 7, e35105.

196. Vathipadiekal V, P.K. Umasankar, M.S. Patole, Molecular cloning, over

expression, and activity studies of a peptidic HIV-1 protease inhibitor: designed

synthetic gene to functional recombinant peptide, Peptides., 2010, 31, 16–21.

197. Wahyudi A.T, Quatrunnada, Nisa Rachmania Mubarik, Screening and

Characterization of Protease Inhibitors from Marine Bacteria Associated with

Sponge Jaspis sp. HAYATI Journal of Biosciences., 2010., 17(4), 173-178.

198. Waxler B, S.F. Rabito, Aprotinin: A Serine Protease Inhibitor with Therapeutic

Actions: Its Interaction with ACE Inhibitors, Current Pharmaceutical Design.,

2003, 9, 777-787.

199. Webster N.S, A.P. Negri, M.M. Munro, C.N. Battershill, Diverse microbial

communities inhabit Antarctic sponges, Environmental Microbiology., 2004, 6,

288–300.

200. Webster N.S, and M.W. Taylor, Marine sponges and their microbial symbionts:

Love and other relationships, Environmental Microbiology., 2012., 14, 335-346.

201. Webster N.S, M.W. Taylor, F. Behnam, S. Lücker, T. Rattei, S. Whalan, M.

Horn & M. Wagner, Deep sequencing reveals exceptional diversity and modes of

transmission for bacterial sponge symbionts, Environmental Microbiology., 2010,

12, 2070-2082.

202. Webster N.S, T. Thomas, The sponge hologenome, mBio., 2016, 7(2), e00135-

16.

137

203. Wilson M.C, T. Mori, C. Rückert, A.R. Uria, M.J. Helf, K. Takada, C. Gernert,

U.A. Steffens, N. Heycke, S. Schmitt, An environmental bacterial taxon with a

large and distinct metabolic repertoire, Nature., 2014, 506, 58–62.

204. Winckers K, H. ten-Cate, T.M. Hackeng, The role of tissue factor pathway

inhibitor in atherosclerosis and arterial thrombosis, Blood Reviews., 2013, 27,

119–132.

205. Yang X.Y, Z. Wang Lu, L. Zhai, J. Jiang, J. Liu, H. Yu, A novel serine protease

inhibitor from the venom of Vespa bicolor Fabricius,

Comparative Biochemistry and Physiology covers biochemical and molecular

biology., 2009, 153, 116–120.

206. Yin Y, X. Mao, J. Yang, X. Chen, F. Mao, Y. Xu, dbCAN: a web resource for

automated carbohydrate-active enzyme annotation, Nucleic acids research., 2012,

40(1), 445-451.

207. Zhao Y, L. Si, D. Liu, P. Proksch, D. Zhou, W. Lin, Truncateols A-N, new

isoprenylated cyclohexanols from the sponge-associated fungus Truncatella

angustata with anti-H1N1 virus activities, Tetrahedron., 2015, 71, 2708–2718.

208. Zhu, W A. Lomsadze, M. Borodovsky, Ab initio gene identification in

metagenomic sequences, Nucleic acids research., 2010, 38(12), 132-132.

PHỤ LỤC

1 Phụ lục 1. Vi sinh vật liên kết hải miên cũng sản sinh các hợp chất kháng

virus

2 Phụ lục 2. Một số hợp chất kháng khuẩn từ vi sinh vật liên kết hải miên

Phân loại chất ức chế phân giải protein 4 Phụ lục 3.

Bảng 3.1. Họ và nhóm của một số chất ức chế peptidase protein 4

Bảng 3.2. Các họ ức chế protein có nguồn gốc vi sinh vật và nấm 6

8 Phụ lục 4. Hình thái và tên hải miên tương ứng

9 Phụ lục 5. Giải trình tự

Thành phần PCR gắn mã vạch 16 Phụ lục 6.

Phân loại vi sinh vật liên kết hải miên QT2 17 Phụ lục 7.

Hình 7.1. Kết quả phân loại các gen theo ngành (QT2) 17

Hình 7.2. Kết quả phân loại đến lớp (QT2) 18

Hình 7.3. Kết quả phân loại đến bộ (QT2) 18

Hình 7.4. Kết quả phân loại đến họ (QT2) 19

Hình 7.5. Thành phần đa dạng vi sinh vật liên kết với hải miên

Việt Nam tại mức ngành (phylum) và lớp (class) đối với ngành

19 Proteobacteria

20 Phụ lục 8. Danh sách một số OUT phân loại vi sinh vật mới

Trình tự gen 18S rRNA của mẫu hải miên QT2 21 Phụ lục 9.

Phụ lục 10. Blast một số trình tự axit amin được chú giải là chất ức chế

22 protease từ CSDL metagenomics QT2

27 Phụ lục 11. Trình tự gen, a xít amin của PI-QT

Phụ lục 12. So sánh kết quả giải trình tự gen tách dòng trong pUC57, pET-

28 32a(+) với gen đích

Phụ lục 13. Các phương pháp sử dụng trong thu hồi và nhận diện protein PI-

29 QT

Phụ lục 14. Phân tích nhận diện phổ MS/MS của các mảnh peptide từ protein

33 tái tổ hợp đã được thủy phân bằng Trypsin

1

Phụ lục 1. Vi sinh vật liên kết hải miên cũng sản sinh các hợp chất kháng

virus

Hải miên Ngành Hợp chất Đặc tính Đích

HIV-1

Ascomycota

IC50 (10-3 2-undecyl-4- quinolone µg/mL) Sorbicillactone A Reducing protein HIV-1

Homophymia sp. Ircinia fasciculata

Vi sinh vật

Pseudomonas sp. Proteobacteria 1531-E7 Penicillium chrysogenum

Ascomycota

Stachybotrin D

HIV-1

Xestospongia testudinaria

Paracel Islands (ND)

expression and activity of reverse transcriptase (0.3–1 µg/mL) EC50 (3.71 µg/mL)

Stachybotrys chartarum MXH-X73

EC50 (3.09 µg/mL)

EC50 (10.51 µg/mL)

EC50 (5.87 µg/mL)

EC50 (6.27 µg/mL)

EC50 (2.73 µg/mL)

Niphates sp.

Ascomycota

NNRTI resistant HIV-1 strain 1RT- K103N NNRTI resistant HIV-1RT- L100I, K103N NNRTI resistant HIV-1RT- K103N, V108I NNRTI resistant HIV-1RT- K103N, G190A NNRTI resistant HIV-1RT- K103N, P225H HIV-1

Chartarutine B

IC50 (1.81 µg/mL)

Stachybotrys chartarum

Beibuwan Bay, China (10 m)

HIV-1

Chartarutine G

HIV-1

Chartarutine H

H1N1

Amphimedon sp. Yongxin

IC50 (2.05 µg/mL) IC50 (2.05 µg/mL) IC50 (2.91 µg/mL)

Truncatella angustata

Ascomycota

Truncateol M

island, China (10 m)

H1N1

Callyspongia sp. Sanya, China

Ascomycota

Epicoccum sp. JJY40

IC50 (56.06 µg/mL)

Pyronepolyene C- glucoside iso-D8646-2-6

Nguồn gốc Touho, New Caledonia Bight of Fetovaia, Italy (17.5 m)

H1N1

IC50 (62.07 µg/mL)

Pyronepolyene C- glucoside, 8646-2-6

NNRTI: Non-nucleoside reverse transcriptase inhibitor

2

(Nguồn: Indraningrat et al., 2016)

Phụ lục 2. Một số hợp chất kháng khuẩn từ vi sinh vật liên kết hải miên

Hải Nguồn Vi sinh Ngành Hợp Đích Đặc

Halichondria

Iriomote

Bacillus cereus

Firmicutes

Thiopeptide YM-266183

MIC

Staphylococcus

japonica

island, Japan

QNO3323

(0.025 µg/mL)

aureus, S.

aureus

Halichondria

Kiel Fjord,

Streptomyces sp.

Actinobacteria

Mayamycin

IC50

S. aureus

panicea

Baltic Sea,

HB202

(1.16 µg/mL)

Germany

Spheciospongia

Red Sea

Micrococcus sp.

Actinobacteria

Microluside A

MIC

S. aureus

vagabunda

EG45

(12.42 µg/mL)

NCTC 8325

Isodictya

Ross island,

Pseudomonas

Proteobacteria

Phenazine-1-carboxylic

MIC

S. aureus

setifera

Antartica

aeruginosa

acid

(>4.99 µg/mL)

(30–40 m)

Hymeniacidon

Bohai Sea,

Aspergillus

Ascomycota

5- Methoxydihydro-

MIC

S. aureus

perleve

China

versicolor MF359

sterigmatocystin

(12.5 µg/mL)

Melophus sp.

Lau group,

Penicillium sp.

Ascomycota

Citrinin

MIC

S. aureus

(1.95 µg/mL)

Fiji islands

FF001

(10 m)

Petrosia sp.

Jeju island,

Aspergillus

Ascomycota

Averantin; Nidurufin

MIC

S. aureus

Korea (20 m)

versicolor

(3.13 µg/mL)

SG511

(6.25 µg/mL)

Petrosia sp.

Jeju island,

Aspergillus

Ascomycota

Averantin and nidurufin

MIC

S. aureus 285

(3.13 µg/mL)

Korea (20 m)

versicolor

Petrosia sp.

Jeju island,

Aspergillus

Ascomycota

Averantin; Nidurufin

MIC

S. aureus 503

(1.56 µg/mL);

Korea (20 m)

versicolor

(3.13 _g/mL)

Hymeniacidon

Nanji island,

Pseudoalteromona

Ascomycota

Norharman

MIC

S. aureus

s piscicida

perleve

China

(beta-carboline alkaloid)

(50 µg/mL)

NJ6-3-1

Halichondria

Bogil island,

Exophiala sp.

Ascomycota

Chlorohydroaspyrones A;

MIC

S. aureus

panicea

Korea

B

(62.5 µg/mL)

miên gốc vật chất tính

Axinella sp.

South China

Eupenicillium sp.

Ascomycota

α, β Dehydrocurvularin

MIC

S. aureus

(375 µg/mL)

Sea, China

Haliclona sp.

Cagarras

Pseudomonas

Proteobacteria

Diketopiperazine

MIC

S. aureus

(512 µg/mL)

Archipelago,

fluorescens H40,

Brazil (4–20

H41 and

m)

Pseudomonas

aeruginosa H51

Spongia

Southeast

Streptomyces sp.

Actinobacteria

2-pyrrolidone

MIC (500

S. aureus PC6

officinalis

Coast India

MAPS15

µg/mL)

(10–15 m)

Koror,

Oscillatoria

Cyanobacteria 2-(21,41-dibromophenyl)-

ND

S. aureus

Dysidea

Republic

spongeliae

4,6-dibromophenol

herbacea

Palau (1 m)

Hyrtios altum

Aragusuku

Vibrio sp

Proteobacteria

Trisindoline

DOI (10 mm)

S. aureus

island, Japan

Xestospongia

Bidong

Serratia

Proteobacteria

Prodigiosin

DOI (≤9 mm)

S. aureus

testudinaria

Island,

marcescens IBRL

Malaysia

USM 84

Aplysina

Banyuls-sur-

Bacillus subtilis

Firmicutes

Surfactin Iturin Fengycin

ND

S. aureus

aerophoba

Mer, France

A184

(5–15 m)

Halichondria

West Coast of

Bacillus

. Firmicutes

Indole

DOI

S. aureus

sp.

India (10 m)

licheniformis SAB1

(7–10 mm)

3-Phenylpropionic

DOI (4–6 mm)

S. aureus

Halichondria

Iriomote

Bacillus cereus

Firmicutes

Thiopeptide YM-266183

MIC

MRSA

japonica

island, Japan

QNO3323

(0.78 µg/mL)

Thiopeptide YM-266184

MIC

MRSA

(0.39 µg/mL)

Halichondria

Kiel Fjord,

Streptomyces sp.

Actinobacteria

Mayamycin

IC50

MRSA

panicea

Baltic Sea,

HB202

(0.58 µg/mL)

Germany

3

4

Phụ lục 3. Phân loại chất ức chế phân giải protein

Bảng 3.1. Họ và nhóm của một số chất ức chế peptidase protein

(Nguồn: Sapna., 2013)

Tác giả

Nhóm

Họ hoặc Phân họ I1

IA

Tên chất ức chế và số đơn vị (Nguồn) Ovomucoid unit 3 (Meleagris gallopavo)

IB

Aprotinin (Bos taurus)

I2

IC

I3

Soybean trypsin inhibitor (Glycine max)

ID

I4

α1-proteinase inhibitor (Homo sapiens)

IA

I5

IJ

(Laskowski & Kato, 1980; Lu et al., 2001) (Ascenzi et al., 2003; Beierlein et al., 2005) (Laskowski & Kato, 1980), (Oliveira et al., 2001) (Huntington et al., 2000), (Al-Khunaizi et al., 2002) (Kumazaki et al., 1994) (Hojima et al., 1980)

I6

IE

I7

IA

I8

Ascidian trypsin inhibitor (Halocynthia rorefzi) Ragi seed trypsin/ α- amylase inhibitor (Eleusine coracana) Trypsin inhibitor MCTI-1 (Momordica charantia) Nematode anticoagulant inhibitor (Ascaris suum)

JC

(Wieczorek et al., 1985) (Bernard & Peanasky, 1993), (Griesch et al., 2000) (Kojima et al., 1999)

I9

IN IF

I11 I12

IG

(Chung et al., 1983) (Odani & Ikenaka, 1973), (Hatano et al ., 1996) (Heinz et al., 1991)

I13

IM

I14

IM

(Bode & Huber, 1992) (Rester et al., 1999)

I15

Protease B inhibitor (Saccharomyces cerevisiae) Ecotin (Escherichia coli) Bowman-Birk plant trypsin inhibitor (Glycine max) unit 1 Eglin C (Hirudo medicinalis) Hirudin (Hirudo medicinalis) Antistasin unit 1 (Haementeria officinalis)

I16

IY

Subtilisin inhibitor (Streptomyces albogriseolus)

(Mitsui et al., 1979), (Taguchi et al., 1998)

IP

Mucus proteinase inhibitor

(Tsunemi et al.,

I17

unit 2 (Homo sapiens)

1993)

JD

Mustard trypsin inhibitor

(Menegatti et al.,

I18

(Sinapis alba)

1992)

IW

Proteinase inhibitor LCMI

(Eguchi et al., 1994)

I19

I (Locusta migratoria)

JO

Proteinase inhibitor II

(Barrette-Ng et al.,

I20

(Solanum tuberosum)

2003)

IH

Ovocystatin (Gallus

(Bode et al., 1988),

I25

gallus)

(Alvarez-Fernandez

et al., 1999)

II

Calpastatin unit 1 (Homo

(Todd et al., 2003)

I27

sapiens)

JF

Cytotoxic T-lymphocyte

(Guay et al., 2000)

I29

antigen

IX

Equistatin (Actinia equina)

(Strukelj et al.,

I31

2000)

IV

BIRC-5 protein (Homo

(Riedl et al., 2001)

I32

sapiens)

IR

Ascaris pepsin inhibitor

(Ng et al., 2000)

I33

PI-3 (Ascaris suum)

JA

Saccharopepsin inhibitor

(Phylip et al., 2001)

I34

(Saccharomyces

5

cerevisiae)

I35

IT

Timp-1 (Homo sapiens)

(Gomis-Ruth et al.,

1997), (Lee et al.,

2003)

I36

IU

Streptomyces

(Hiraga et al., 1999)

metalloproteinase inhibitor

(Streptomyces nigrescens)

I37

IE

Potato carboxy peptidase

(Bode & Huber,

inhibitor (Solanum

1992)

tuberosum)

I38

IK

Metalloproteinase

(Feltzer et al., 2003)

inhibitor (Erwinia

chrysanthemi)

IL

(Barrett., 1981)

I39

α2-macroglobulin (Homo

sapiens)

Bombyx subtilisin

(Pham et al., 1996)

I40

inhibitor (Bombyx mori)

6

Bảng 3.2. Các họ ức chế protein có nguồn gốc vi sinh vật và nấm

(Nguồn: Rawlings & Barrett, 2011)

Họ

Tên gọi chung

Các họ ức chế protein

Kazal

M10, S1A, S1D, S8A, S9A

I1

Kunitz-BPTI

S1A, S7

I2

C1A, C14A, S1A, S7, S8A, S8B

Serpin

I4

YIB

S8A

I9

Marinostatin

S1A, S8A

I10

I11

Ecotin

S1A

M4, M7, S1A, S8A, S8B

I16

SSI

Thyropin

A1A, C1A, M10A

I31

I32

IAP

C14A

I34

IA3

A1A

I36

SMI

M4

I38

Aprin

M10B

A1A, A2A, C1A, C2A, C11, M4,

M10A,M10B, M12A, M12B, S1A,

139

S1B, S8A

I42

Chagasin

C1A

I43

Oprin

M12B

I48

Clitocypin

C1A, C13

I51

IC

S1A, S10

I57

Staphostatin B

C47

I58

Staphostatin A

C47

I63

M43B, S1A

7

8

Phụ lục 4. Hình thái và tên hải miên tương ứng

QT3. Tương đồng 96,2 % với Xestospongia muta (AY621510 trong NCBI) QT4. Tương đồng 99,4 % với Timea sp. MNRJ15692 (KC902069 trong NCBI) QT2. Tương đồng 99,9 % với Spheciospongia vesparium (AY734440 trong NCBI)

QT6. Tương đồng 96,0 % với Xestospongia muta (AY621510 trong NCBI)

QT7. Tương đồng 90,9 % với Terpios aploos (KC902316 trong NCBI)

QT5. Tương đồng 99,9 % với Clathria reinwardti 0CDN9893-N (KC902087 trong NCBI)

QT8. Tương đồng 95,3 % với Crella elegans (AY348882 trong NCBI)

QT9. Tương đồng 99,6 % với Spirastrella cf. coccinea (KC902040)

9

BioDetection Systems Research Bram Brouwer Science Park 406 1096 XH AMSTERDAM NEDERLAND

Project code

78208

Date of Report

20-jun-2016

Ordernumber Client

UNKNOWN

Next generation sequencing project report

Authorization

Iris Kolder Bioinformatician

Walter Pirovano Productspecialist

BaseClear Group

Einsteinweg 5 2333 CC Leiden The Netherlands T +31 71 523 3917 F +31 71 523 5594 E info@baseclear.com

vs. 12

definitief

13-nov-2013

PS Bioinformatica

1 of 3

F081-16-05

Next generation sequencing project report

project

Client

Date

78208 BioDetection Systems Research 20-jun-2016

1. Introduction

This report contains a detailed overview of your Next generation sequencing experiment. The data and results apply to the following samples:

Analysis 3

HM2QT

Prokaryotic Annotation

Analysis 1 Quality analysis of FASTQ sequence reads

Analysis 2 Metagenomic Assembly

For each service/analysis a short summary is given in the following section(s). Also detailed analysis statistics are provided per sample as Enclosure.

2. Accessing the secured sFTP server

The sFTP server provides a safe option for data download as connections are encrypted through a secure shell. You can connect to it using an sftp-client. Our preference is FileZilla which can be downloaded from http://filezilla-project.org/.

After installation, open the program and login using the following account details:

 Host: sftp.baseclear.com  Username: 78208  Password: bNlsILBqykO9kyv  Port: 22

Once you are connected, you can drag the files from the server (on the right) to your own environment (on the left). The data will be available on our sFTP server for the coming two weeks. The file/folder structure on the sFTP server is described in the results section (see below).

3. Quality analysis of FASTQ sequence reads

Paired-end sequence reads were generated using the Illumina HiSeq2500 system. FASTQ sequence files were generated using the Illumina Casava pipeline version 1.8.3. Initial quality assessment was based on data passing the Illumina Chastity filtering. Subsequently, reads containing PhiX control signal were removed using an in-house filtering protocol. In addition, reads containing (partial) adapters were clipped (up to minimum read length of 50bp. The second quality assessment was based on the remaining reads using the FASTQC quality control tool version 0.10.0. The final quality scores per sample are provided as Enclosure.

4. Metagenomic Assembly

The analysis has been performed using IDBA-UD(v1.0.9) a iterative De Bruijn Graph De Novo Assembler for Short Reads Sequencing data with Highly Uneven Sequencing Depth(http://i.cs.hku.hk/~alse/hkubrg/projects/idba_ud/). Specialized in metagenomics assembly. The analysis statistics per sample are provided as Enclosure.

vs. 12

definitief

13-nov-2013

PS Bioinformatica

2 of 3

F081-16-05

Next generation sequencing project report

project

Client

Date

78208 BioDetection Systems Research 20-jun-2016

5. Prokaryotic genome annotation with Prokka

Genome annotation has been performed on the assembled contig or scaffold sequences using the BaseClear annotation pipeline which is based on the Prokka Prokaryotic Genome Annotation System (http://vicbioinformatics.com/). The pipeline (based on Prokka version 1.6) includes a number of features among which:

rRNA using barrnap v0.2 tRNA prediction by Aragorn v1.2.36

Inferred proteins:

 Prokaryote gene prediction by Prodigal v2    pCDS physic-chemical properties using an in-house script 

o EC number from UniProt BLAST best hit o Signal peptide from signalp v4.0 o Cellular localization from signalp v4.0 o CAZY number from UniProt BLAST best hit o Function annotation from BLAST UniProt best hit o Conserved domains by hmmer-3

 Organism prediction using an in-house script

The annotation statistics per sample are provided as Enclosure.

6. Results

A Summary of the results is provided below. Sequence and project data are recorded digitally in our secure database and stored for backup purposes only. Data is stored for a period of three months. The result files which have been generated within this project are (for each analysis) as followed: Illumina sequence reads The files are stored in the “raw_sequences” folder and include:  The raw sequence reads in FASTQ format (*.fastq)

Metagenomic Assembly The analysis files are stored in the “metagenomics_assembly” folder and include:

 The contig sequences in fasta format (*contig_IDBA_UD.fa)  The scaffold sequences in fasta format (*scaffold_IDBA_UD.fa)

Prokaryotic Genome Annotation with Prokka Output files The files are stored in the “genome_annotation” folder and include:  The genome annotations in Excel table format (*.table.txt)  The genome annotations in GenBank format (*.gbf)  The genome annotations in GFF format (*.gff)  The genome annotations in Sequin format (*.sqn)  The NCBI Feature Table in TAB-delimited format (*.tbl)  The nucleotide sequences in FASTA format (*.faa)

7. Enclosures

 Standard: Summary of the results.

vs. 12

definitief

13-nov-2013

PS Bioinformatica

3 of 3

F081-16-05

Quality analysis of FASTQ sequence reads

project

Client

Date

78208 BioDetection Systems Research 20-jun-2016

Quality analysis of FASTQ sequence reads

Quality statistics after CASAVA and FastQC analysis

Number of reads

Sample Yield (in MB)

Average Quality scores (Phred)

HM2QT

66,835,559

16,530

38.27

vs. 2

definitief

27-jan-2014

PS Bioinformatica

1 of 1

F081-16-06

De Novo Assembly Report

project

Client

Date

78208 BioDetection Systems Research 20-jun-2016

Summary of the results – de novo assembly

Sample HM2QT

De novo assembly statistics Number of scaffolds

415,516,814

Sum (bp)

76,697

GC contents (%)

62.05

Maximum scaffold size

1,641,540

Minimum scaffold size

700

Average scaffold size

5,417

N25

36,866

N50

13,412

4,459

N75 Scaffold statistics

Minimum scaffold length

Number of scaffolds

Total scaffold length

Min 1.000

9.405.115

10.614

Min 5.000

113.259.576

47.930

Min 10.000

176.872.070

9.076

Min 10.000.000

415.516.814

9.077

vs. 7

definitief

07-jan-2015

PS Bioinformatica

1 of 1

F081-16-02

BaseClear Annotation Report

project

Client

Date

78208 BioDetection Systems Research 20-jun-2016

Summary of the results – BaseClear Annotation

Sample HM2QT

General Sample information

Count

Genome size (bp)

415,516,814

Number of contigs

76,697

Number of genes

389,489

Number of tRNA

4,729

Number of rRNA

423

Gram

gram-

Percentage Identity

99.76

Contig statistics

Count

Number of contigs

76,697

Average GC percentage

62.05

Total genome size

415,516,814

Average contig size

5,417

Max contig size

1,641,540

Min contig size

700

N25

36,866

N50

13,412

N75

4,459

Statistics of Coding Sequences (CDS)

Count

Number of genes

389,489

with a known function

202,570

with a GO annotation

200,514

with a CaZy number

2,739

with a signal peptide

22,008

Gene density [gene/Mbp]

937

Total gene size

340,612,472

Max gene size

25,437

Min gene size

67

Average gene size

874

vs. 3

Definitief

28-mei-2014

PS Bioinformatica

1 of 1

F081-16-07

16

Phụ lục 6. Thành phần PCR gắn mã vạch

Thành phần cho PCR khuếch đại vùng V4 gen 16S rRNA

Thành phần Thể tích [µL]

Nước deion 17.30

Đệm 5x green HF Buffer 5.00

dNTP 0.5

Mồi xuôi (515F) 0.5

Mồi ngược (806R) 0.5

Phusion Polymerase 0.2

DNA Template 1

Tổng thể tích phản ứng 25

Thành phần cho PCR để gắn barcodes vào vùng V4

Thành phần Thể tích [µL]

Nước deion 31

Đệm 5x green HF Buffer 10

dNTP 1

Barcode forward 2.5

Barcode reverse 2.5

0.5

Phusion Polymerase Sản phẩm 1st PCR 2.5

Tổng thể tích phản ứng 50

Chu trình nhiệt cho 2 phản ứng PCR: 5 phút 98 oC; 25 cycles (45 giây 98 oC; 30

giây 50 oC; 30 giây 72 oC); 10 phút 72 oC, giữ ở 4 oC. Sản phẩm PCR được kiểm tra

trên gel agarose 1.8 %, điện di 45 phút tại 100 V.

17

Phụ lục 7. Phân loại vi sinh vật liên kết hải miên QT2

Hình 7.1. Kết quả phân loại các gen nhận được theo ngành (QT2)

Mức độ đậm nhạt của màu xanh (green) thể hiện số lượng gen được ấn định. Màu càng đậm có nghĩa là số lượng gen ấn định vào nhóm đó càng cao

18

Gammaproteobacteria

CLASS HM2QT

1.29%

1.06%

Marine_Group_I

1.34%

2.44%

1.82%

Betaproteobacteria

Deltaproteobacteria

1.92%

2.06%

Gemmatimonadetes

3.56%

Acidimicrobiia

22.63%

4.33%

Alphaproteobacteria

Caldilineae

4.56%

Acidobacteria

15.55%

TK10

7.01%

7.43%

Cytophagia

Nitrospira

8.41%

14.59%

Anaerolineae

Soil_Crenarchaeotic_Group(SCG)

JTB23

Other

Oceanospirillales

1.17%

Hình 7.2. Kết quả phân loại đến lớp (QT2)

ORDER HM2QT

1.23%

1.04%

1.34%

Nitrosomonadales Nitrosopumilus Unclassified Acidimicrobiales

6.92%

1.27%

1.70%

BD2-11_terrestrial_group Sh765B-TzT-29

15.30%

1.82%

2.26%

Caldilineales BPC015

2.99%

14.59%

3.07%

Alteromonadales Rhodospirillales PAUC43f_marine_benthic

3.10%

_group Nitrospirales

12.94%

4.33%

4.87%

7.88%

Order_II_Incertae_Sedis Anaerolineales Pseudomonadales Desulfurellales

5.17%

GR-WP33-30 HOC36

7.01%

Other

Hình 7.3. Kết quả phân loại đến bộ (QT2)

19

1.12%

Unclassified

FAMILY HM2QT

1.23%

Hahellaceae

5.79%

1.61%

Sva0996_marine_group

1.70%

Caldilineaceae

3.07% 1.82%

Shewanellaceae

4.33%

Nitrospiraceae

Rhodothermaceae

6.47%

Rhodospirillaceae

58.53%

14.33%

Desulfurellaceae

Anaerolineaceae

Other

Hình 7.4. Kết quả phân loại đến họ (QT2)

Hình 7.5. Thành phần đa dạng vi sinh vật liên kết với hải miên Việt Nam tại mức

ngành (phylum) và lớp (class) đối với ngành Proteobacteria

20

Phụ lục 8. Danh sách một số OUT phân loại vi sinh vật mới

TT OTU Domain

Phylum

Class

Order

Family

324

Bacteria Deferibacteres

Deferibacteres

Deferibacterales PAUC34f

1

626

Bacteria Proteobacteria

Gammaproteobacteria Oceanospirillales ZD0405

2

666

Bacteria Proteobacteria

Gammaproteobacteria PYR10d3

3

451

Bacteria Proteobacteria

Deltaproteobacteria

Sh765B-TzT-29

4

130

Bacteria Actinobacteria Acidimicrobiia

Acidimicrobiales uncultured

5

233

Bacteria Proteobacteria

Deltaproteobacteria

GR-WP33-30

6

901

Bacteria Chloroflexi

TK10

7

362

Bacteria Acidobacteria

Acidobacteria

BPC015

8

437

Bacteria Acidobacteria

Holophagae

TK85

9

10 31

Archaea Thaumarchaeota Marine-Group I

Kết quả phân tích MiSeq tìm thấy được nhiều ngành ít được phân lập hoặc

chưa được phân lập như: Thaumarchaeota, Acidobacteria, Chloroflexi,

Deferribacteres, Deinococcus-Thermus, Planctomycetes, Delta-proteobacteria,

Epsilon-proteobacteria, Beta-proteobacteria, Spirochaetes, Verrucomicrobia. Vì các

đoạn gen giải bằng NGS thường ngắn (read), vài trăm bp và được nhóm với nhau tại

mức 97 % hoặc 98.5 % (OUT), nên tất cả nghiên cứu đều chỉ định danh đến mức chi.

Trong đó nhiều OTU chỉ có thể phân loại đến mức bộ hoặc họ vì độ tương đồng thấp,

nên những OTU này chính là loài mới. Ngoài ra nhiều OTU được phân loại là

unculture, nghĩa là thuộc nhóm các vi sinh vật chưa nuôi cấy được.

21

Phụ lục 9. Trình tự gen 18S rRNA của mẫu hải miên QT2

GAAGGCAGCA

GGCGCGCAAA

TTACCCAATC

CCGACTCGGG

GAGGTAGTGA

CAATAAATAA

1

71 CAATGCCGGG

CTTTCTTAGT

CTGGCAATTG

GAATGAGTAC

AATCTAAACC

CCTTAACGAG

AGGGCAAGTC

TGGTGCCAGC

AGCCGCGGTA

ATTCCAGCTC

CAATAGCGTA

141 GAACAATTGG

GTTGCAGTTA

AAAAGCTCGT

AGTTGGATTT

CGGGGCAGCC

TGGCTGGTCC

211 TATTACTGTT

GAGTACTGGT

CAGCCGCCCT

TCCTCTCGAA

AGCCCCGACT

GCTCTTCGTT

281 GCCGCAAGGC

GGTAGTCCGG

GACGTTTACT

TTGAAAAAAT

TAGAGTGTTC

AAGGCAGGCC

351 GCAGTGGTCG

TACATTAGCA

TGGAATAATG

GAAGAGGACC

TCGGTCCTAT

TTTGTTGGTT

421 TACGCCTGAA

AAGTAATGAT

TAAGAGGGAC

AGTTGGGGGC

ATTCGTATTT

AATTGTCAGA

491 TCCAGGGCCG

TCGGATTTAT

GAAAGACGAA

CAACTGCGAA

AGCATTTGCC

AAGGATGTTT

561 GGTGAAATTC

AGAACGTTAG

TTAGGGGTTC

GAAGACGATC

AGATACCGTC

GTAGTCCTAA

631 TCATTAATCA

TGCCGACTAG

GGATCGGTGG

ATGTTAGCGT

TTGACTCCAT

CGGCACCTTA

701 CCATAAACTA

AAGTCTTTGG

GTTCCGGGGG

GAGTATGGTC

GCAAGGCTGA

AACTTAAAGG

771 TGAGAAATCA

AGGGCACCAC

CAGGAGTGGA

GCCTGCGGCT

TAATTTGACT

CAACACGGGG

841 AATTGACGGA

GGTCCAGACA

TAGTAAGGAT

TGACAGATTG

AGAGCTCTTT

CTTGATTCTA

911 AAACTCACCA

TGCATGGCCG

TTCTTAGTT

981 TGGGTGGTGG

22

Phụ lục 10. Blast một số trình tự axit amin được chú giải là chất ức chế protease từ CSDL metagenomics QT2

Met N T G K T S K R P F L W L Met C L V S L L F A G C N N L S A I F S D E G R D E P E T V S I D T N V V T A N T Q F G F D L F N E I R K I E Q D K N I F I S P L S I S I A L A MetT L N G A S G E T E Q A Met A N T L H L Q G L G S E A I N P G Y A G L R Q A L Q V A D P K V I L T I A N S L W A R Q D V P F K Q D F L Q R N T E Y F G A E V S T L N F T D P N T L P T I N Q W I N T N T N G K I T K I L D E I N P D T V L F L I N A I Y F K G T W Q T E F D P S R T R D G T F Y L A T G A E K Q I P Met Met T R T G D Y P Y Y E N N D A K F Q A I S L P Y G D G R Met S Met Y I F L P Y P E S D I N T F L D G L N T E N W E S W V S Q L R D Q E L F L S Met P K F K L E Y E K T L N N P L Q S L G Met G I A F A P G L A D F S Q Met A D L E A L G Q N L Y I G E V L H K A V V E V N E E G T E A A A V T S V G I R A T S A P

P A F Met A N R P F F F A I R D N E T K T V L F Met G T V V D P Stop

contig000433 Prokka_41698 Serpin B8

23

Met T K Q L I N A T I I A C V G L I Y L L G C S G E E D V L H E D E L L E Met S L E E G A P T A P D G C A I L A K P A G F T D N A L S E A N A K F G F K L L A E L Y N Q K P N K N V F I S P L S I S I A L T Met T Y N G A R G A T K Q A Met A K T L E I E G Met D L G A V N Q A N A E L R E I L K S A D P Q I E L A I A N S I W L R N T F D E V N P D F L D R N D R F F G A E I A S L D F D D P Q T V E T I N Q W V N T N T Q G K I K E I L G E I E E H E V Met F L I N A I Y F K G G W K G K F D A S K T Q D G V F H L L D G G E K Q V P Met Met S H T C N Y S Y L E S G D F R A V G L P Y G E G R V S Met Y I F L P E H S S N L D E F L A D L N A E N W E N W L S R F W N E R D L R F I Met P R F R L E Y G Met L L N D A L K A L G Met E I A F I P Y V A N L E G I A P L L F I E K V I H K T F L E V N E E G T E A A A V T L V S P P P A S T P G P F V V N R P F F F A I H D N W T N T I L F Met G I V V E P MetStop

contig000046 Prokka_10704 Serpin (serine protease inhibitor)

24

Met I K R Q H P E P T G R G R N A G R G R R F S I P A A L L L L S P A G C G L L E P D V E E I Met R L P R A L T A G E I E V I R A S N R F A F D L L A Q A N E A N E N L F L S P L S A S Met A L G Met S Met N G A D G E T W N Q Met R D V L G F G S L A E E E I N D S Y K S L I E L L V G L D P T V E T A I G N S V W T R S G F P V V P D F L N T V R E V F G A E V A E L D F A S P S A S E R I N E W V N D A T R G R I E D I V P D V I P A G V V Met Y L L N A I Y F K G S W T F Q F D P S K T R T E P F H L D D G S T R T V P L Met T L S K T L P Y R E D G R F Q A V D L P Y G G R A F T Met T V L L P G Q G V S V D T L A A N L D A G E W E D V A D G F R D T D V T L F L P R F R Met S Y E R Met L N D D L A A L G Met V D A F D P Y R A D F T R L S P V A P L A I S E V K Q K S W V D V N E E G T E A A A V T S A G T Y T G G V P V V R A D R P F L F F I R E R L S G T I L F A G K F A S P T A E Stop

contig003635, Prokka_126438 Serpin B9

25

MDNEQSEHRPDSGNRVRGAARRGWLPGAGAVLLLAAAGCGGPSTVPVPGLPPIPGVPPADPPSAPELPR ALSATEVDVIAAGNRFGFDLLREANRPGDNLFLSPFSASMALGMTMNGAGGETWNQMRDALGFGGLT EEEINAGYASLIQVLTELDPAVETAIGNSVWTRLGFPLRAEFVDVLREFFGAEAAELDFAGPSASGRVNE WVRSATGGHIEEIVPDPIPPAVLMFLINAIYFNAPWTFEFDPDDTRTEPFYPEDRSPREVPLMTILRDFLYL ETSRFQAVDLPYGGGAFSMTVLVPREDVRVDDVVASLDAPAWSDVTGGFEETEVELFLPRFRMEYERE LKDDLAALGMVDAFSPGKADLTRLSPVDLSISSVRQKALVEVTEEGTEAAAATVVIGVTSAPPPPVTVR ADRPFLFFIRERLTGAIIFVGKVAHPPPR

contig000199 Prokka_21375 Serpin

26

Met K T Q L T L L L A L L A P L P A L S I G Y V Y T G V G D D G R Q H L E L T S V T V D V Q I D E R I A R T R T D Q I F T N H A E W E V E G I Y E F T L P E G A I I T D L V L W I G D K R I Q G E V L E K E E A R R T Y D D I V G R R I D P A L I E Q V S P N Q F R L S I F P F P A K G S R R V E F E Y Met Q L L E S H S G R L D Y S F P L A P E T D Q P L Q Met E L F V L R A Q V R S Q H A F E A T T S G L P R L T E I D R P D A H R A N I F F G D E K I K P R E D F T L T I R Q T D D R P K P T V L S F A P R A N D D L G Y Y A L W L P P L P E L T R D G P L P R S L T F V I D I S S S Met Q E G K L R A V K G A L T A A I D A L D A G D L F N I V V F T H R A N S F A A A P V P A D P D N K K A A T A F I N Q Q D A L G V S N F E A G L G R A Met Q Q A F P A N R V N H V I F L T D G L P T I G E L E L A S L S E Met V G E W S A G Q A R L F T I G V G Q D V D Q G F L S G L A E D H R G E A Y F L S E E G D I E A A L Q E L F E S F T F P I L L L D E L S F D Q V E I H D V H P R G L E T L A A G R E L F Q V G R Y R G G G T F T L S L A G H Met G E E N Met S L D F P L E F T Q T D V S G S L I P R L W A Y Q K I Q A L E E Q I S R F G E K Q E L L D D I L A L G L E Y R L V T R R T S L F A P D D G V E V N P Q P R D Q V A L N F G G I D D L F D S S S E S D Q E E D D E F F S T A V N D A R P T T H W L G R D F F L Y D E V W I D L A Y Q P G Met P R E L Y E S R T Y Q P A E L A H F A R L G Q A Met L V V V E E R A Y E I P A D A Q G S R P V L L Q N A P N P F N A S T T I S F L I P F R L A N E P T R L S I Y N L A G Q L V R V L Q L E A L Q A G E H R L S W D G R D D Y G R E V A S G V Y I Y R L D V G E W A V H R R Met L L L R Stop

Prokka_130363

27

Phụ lục 11. Trình tự gen, axít amin của PI-QT

1 ATGACAAAAC AGTTGATTAA TGCAACGATC ATCGCATGTG TCGGATTGAT TTATCTGCTT GGGTGTTCAG

71 GTGAAGAAGA TGTGTTGCAT GAGGATGAAC TTCTTGAGAT GTCTCTTGAA GAAGGAGCCC CAACGGCACC

141 TGATGGGTGT GCAATTTTAG CAAAGCCTGC TGGTTTCACC GATAATGCAC TGTCCGAAGC AAATGCAAAG

211 TTCGGCTTTA AACTACTCGC CGAACTGTAT AATCAAAAAC CCAACAAAAA CGTCTTTATC TCCCCATTAA

281 GCATTTCGAT AGCTTTGACC ATGACATATA ATGGTGCCAG AGGCGCAACA AAACAGGCAA TGGCAAAGAC

351 GCTAGAGATC GAGGGAATGG ACCTGGGTGC GGTCAACCAA GCTAACGCCG AGTTACGAGA AATCCTTAAG

421 AGCGCAGATC CCCAGATTGA ACTTGCCATC GCCAACTCGA TCTGGCTACG GAACACGTTT GATGAAGTAA

491 ATCCCGATTT CCTTGACCGA AATGATCGAT TCTTTGGCGC AGAGATTGCT TCGCTTGATT TTGACGATCC

561 GCAAACAGTA GAGACCATCA ACCAATGGGT GAACACGAAC ACACAGGGAA AAATCAAGGA GATTCTAGGT

631 GAAATTGAGG AGCACGAAGT TATGTTCCTG ATTAACGCCA TCTATTTTAA GGGCGGCTGG AAAGGAAAGT

701 TCGACGCATC AAAAACACAG GACGGTGTTT TCCATCTGTT GGATGGTGGC GAGAAGCAGG TGCCCATGAT

771 GTCCCACACC TGCAATTATT CGTATCTTGA GAGCGGAGAC TTTAGGGCTG TTGGCTTACC TTATGGAGAG

841 GGACGTGTAA GCATGTATAT CTTTCTGCCG GAGCATTCCT CCAATCTTGA CGAATTTCTT GCAGATTTGA

911 ACGCCGAGAA CTGGGAGAAC TGGCTGTCGC GGTTTTGGAA TGAACGGGAT TTGAGATTTA TAATGCCTCG

981 CTTTAGACTA GAGTATGGAA TGCTTCTCAA TGACGCGCTC AAAGCACTCG GCATGGAAAT TGCCTTTATT

1051 CCGTACGTAG CCAATCTTGA GGGCATTGCG CCTCTTTTGT TTATTGAAAA AGTCATACAC AAAACTTTTT

1121 TGGAAGTCAA CGAAGAAGGC ACCGAAGCGG CTGCCGTAAC GTTGGTTAGT CCACCACCGG CGAGCACTCC

1191 GGGGCCCTTT GTTGTAAACC GCCCCTTTTT CTTCGCCATC CATGACAATT GGACAAACAC AATATTGTTC

1261 ATGGGAATTG TCGTCGAACC GATGTAG

Trình tự gen

Met T K Q L I N A T I I A C V G L I Y L L G C S G E E D V L H E D E L L E Met S L E E G A P T A P D G C A I L A K P A G F T D N A L S E A N A K F G F K L L A E L Y N Q K P N K N V F I S P L S I S I A L T Met T Y N G A R G A T K Q A Met A K T L E I E G Met D L G A V N Q A N A E L R E I L K S A D P Q I E L A I A N S I W L R N T F D E V N P D F L D R N D R F F G A E I A S L D F D D P Q T V E T I N Q W V N T N T Q G K I K E I L G E I E E H E V Met F L I N A I Y F K G G W K G K F D A S K T Q D G V F H L L D G G E K Q V P Met Met S H T C N Y S Y L E S G D F R A V G L P Y G E G R V S Met Y I F L P E H S S N L D E F L A D L N A E N W E N W L S R F W N E R D L R F I Met P R F R L E Y G Met L L N D A L K A L G Met E I A F I P Y V A N L E G I A P L L F I E K V I H K T F L E V N E E G T E A A A V T L V S P P P A S T P G P F V V N R P F F F A I H D N W T N T I L F Met G I V V E P MetStop

Trình tự axit amin

28

So sánh trình tự acid amin nhằm tìm kiếm chức năng gen tương đồng trên ngân hàng dữ liệu Uniprot.

Phụ lục 12. So sánh kết quả giải trình tự gen tách dòng trong pUC57, pET- 32a(+) với gen đích

Chú thích: gen MK359987.1 là mã số trình tự gen đích đăng ký trên NCBI

29

Phụ lục 13. Các phương pháp sử dụng trong thu hồi và nhận diện protein

PI-QT

13.1. Thu protein từ môi trường nuôi cấy bằng phương pháp tủa muối

Môi trường nuôi cấy tế bào được ly tâm 5000 v/p, 10 phútthu dịch nổi. Sau đó

tủa protein bằng muối (NH2)2SO4. Phương pháp tủa được sử dụng tương đối rộng rãi

để thu nhận các phân tử sinh học mà nhất là protein. Tủa bằng muối là một phương

pháp phổ biến để tủa protein. Khả năng hòa tan của protein tùy thuộc vào nhiều yếu tố:

đặc tính lý hóa tự nhiên của protein, pH, nhiệt độ, nồng độ của muối… Ở nồng độ

muối thấp, tính tan của protein tăng nhẹ (salting in). Tuy nhiên, ở nồng độ muối cao,

tính tan của protein giảm mạnh (salting out).Vì vậy, khi muốn tách 1 protein từ một

hỗn hợp gồm nhiều protein khác nhau, ta có thể lựa chọn nồng độ muối thích hợp sao

cho phù hợp nhất với protein mục tiêu.

Tiến hành tủa protein ở 4 dải nồng độ muối khác nhau ở điều kiện 4 ºC với 2 loại muối

(NH2)2SO4. 1 loại của Trung Quốc, 1 loại của hãng Merk (Đức).

Khối lượng muối; thể tích cuối cùng Nồng độ

0-30 % 16.98 g; 109.02 ml

30-50 % 12.04 g; 106.39 ml

50-75 % 16.36 g; 108.69 ml

75-100 % 17.92 g; 109.52 ml

Bổ sung lượng muối cần thiết vào phần dịch sau ly tâm, lắc ở 4 ºC, trong vòng 12 h. Ở

mỗi nồng độ muối, sau khi tủa chúng tôi tiến hành thu dịch tủa và ly tâm 12000 v/p

trong 30 phút ở 4 ºC để thu protein. Sau đó, lượng tủa protein được hòa lại trong đệm

Tris/HCl 50 mM, pH 7.0, vortex cho tan đều và ly tâm 1 lần nữa để loại bỏ cặn còn sót

lại. Các hỗn hợp protein được tủa ở các nồng độ khác nhau được kiểm tra bằng điện di

SDS-PAGE.Sau đó dựa vào kích thước lý thuyết protein quan tâm, chúng tôi cắt băng

30

protein ra khỏi bản gel và tiến hành thủy phân, tách chiết protein để nhận diện bằng

khối phổ MS/MS.

13.2 Tinh sạch protein bằng sắc ký lọc gel với cột Sephacryl-S200 trên hệ thống

FPLC

Sắc ký lọc gel dùng để phân tách các phân tử dựa trên sự khác nhau về kích thước

các phân tử. Hỗn hợp protein thu được sau khi tủa với muối (NH4)2SO4được loại muối

bằng phương pháp thẩm tích ở 4 ºC trong 24 h. Dịch protein sau loại muối được cho

qua cột sắc kí lọc gel với chất giá Sephacryl-S200. Mẫu được thôi bằng hệ thống thôi

mẫu tự động FPLC với tốc độ dòng 0.5 ml/ phút bằng dung dịch đệm Tris/HCl 50mM

pH 7.0 có bổ sung Sodium azide (NaN3) 0.2 %,thu mỗi phân đoạn 2 ml. Kiểm tra các

phân đoạn bằng điện di SDS-PAGE. Sau đó gộp các phân đoạn chứa protein quan tâm

và cho qua màng lọc cut off 30 kDa (Microcon-30kDa Centrifugal Filter Unit) sản

phẩm thu được sẽ gồm 2 phần: phần hỗn hợp protein< 30 kDa và phần >30 kDa.2 phần

sản phẩm được kiểm tra điện di SDS-PAGE. Dựa vào kích thước tính toán lý thuyết

của protein quan tâm, chúng tôi tiến hành nhận diện băng protein bằng các phương

pháp thủy phân trong gel, tách chiết và nhận diện protein mục tiêu bằng phân tích khối

phổ MS (quy trình như mục 5.4).

13.3. Thu protein từ vi khuẩn E. coli

Thu 1L dịch tế bào và ly tâm ở 4000 v/p trong 10 phút ở 4 ºC loại môi trường. Cặn

tế bào được rửa và hòa lại trong 100 mL dung dịch đệm lysis buffer (Tris/HCl 50mM,

Triton X-100 0.5 %, lysozyme 10 µg/mL, pH 7.0) ủ ở 30ºC trong 30 phút. Sau đó tế

bào được phá vỡ bằng siêu âm với xung ngắn (200-300 µA) khoảng 3s trong đá lạnh.

Siêu âm cho đến khi dịch tế bào hết nhầy và tan đều. Tiếp tục ly tâm dịch tế bào 14000

v/p, 30 phút ở 4 ºC để tách phần dịch nổi và cặn tế bào.Kiểm tra điện di phần dịch nổi

và cặn tế bào bằng điện di SDS-PAGE.Đưa phần dịch nổi qua cột sắc kí ái lực Ni-NTA

agarose và rửa các protein không bám bằng đệm Tris HCL 50 mM với 5 mM

Imidazol.Protein bám cột được thôi bằng Imidazol với các nồng độ ,100 mM, 300 mM

và 500 mM. Các phân đoạn sau khi tinh sạch được kiểm tra bằng điện di SDS-PAGE.

31

Sau đó băng protein quan tâm được bằng các phương pháp thủy phân trong gel, tách

chiết và nhận diện protein mục tiêu bằng phân tích khối phổ MS (quy trình như mục

5.4).

13.4. Nhận diện và phân tích protein bằng phương pháp proteomics/tin sinh học

Nhận dạng protein bằng khối phổ: Quá trình thực hiện khối phổ liên tiếp được tiến

hành trên máy khối phổ QSTAR - XL, vận hành ở chế độ IDA (Information Dependent

Acquisition) để thực hiện việc chuyển từ quét phổ TOF MS đơn đối với các ion nằm

trong dải khối (TOF mass) từ 400 đến 1200 sang khối phổ liên tiếp trên 3 ion phân tử

có mật độ cao nhất và lớn hơn 15 được xác định tự động nhờ phần mềm BioAnalyst

QS v1.4 (AppliedBiosystems, Mỹ). Sai số về khối (mass tolerance) được đặt ở mức

100 ppm, thời gian thực hiện không lặp lại MS/MS đối với mỗi mảnh là 90 giây. Hiệu

điện thế được đặt để ion hoá mẫu trong dung dịch đi ra từ đầu Fused Silica PicoTip là

2200V. Các protein được nhận dạng thông qua phần mềm Mascot v1.8 (MatrixScience

Ltd., London, Anh).

Tìm kiếm protein bằng phần mềm Mascot v1.8 : Dữ liệu phổ khối (MS/MS) được phân

tích bằng phần mềm Mascot v1.8. Đây là phần mềm có khả năng phân tích dữ liệu phổ

MS/MS để nhận dạng protein dựa trên thuật toán Mowse được phát triển bởi Matrix

Science (Matrix Science Ltd., London, Anh) (Pappin et al., 1993). Ngân hàng Dữ liệu

được dùng để tìm kiếm trong Mascot là Uniprot, một Ngân hàng Dữ liệu các protein

không lặp lại và toàn diện về hệ protein của người mới nhất được cài đặt trên một máy

tính HP Proliant Server (s/n:2UA5100LXZ). Các thông số tìm kiếm bằng phần mềm

Mascot như sau:

Enzyme thủy phân: Trypsin;

Sai số khối lượng peptide: ± 0,5 Da;

Sai số khối lượng của các mảnh ion trong phổ MS/MS: ± 0,5 Da;

Trạng thái điện tích của ion phân tử được chọn: + 2,+ 3, và +4;

Cải biến cố định: Carbamindomethyl (C);

Cải biến biến đổi: oxy hóa (methionin) xảy ra trong quá trình thủy phân;

32

Mức độ chính xác được đặt mặc định: 99,5 %.

Việc phân tích dữ liệu phổ khối giới hạn trong Ngân hàng Dữ liệu protein của vi sinh

vật của toàn bộ Ngân hàng Dữ liệu Uniprot. Với các thông số như trên phần mềm

Mascot đưa ra những protein/peptide có điểm số > 30 sẽ đảm bảo độ tương đồng cao

giữa các phổ thực nghiệm và phổ lý thuyết với mức ý nghĩa p < 0,05. Sau đó, các

protein được xác nhận lại bằng phần mềm Peak (Canada).

33

Phụ lục 14: Phân tích nhận diện phổ MS/MS của các mảnh peptide từ

protein tái tổ hợp đã được thủy phân bằng Trypsin

Coverage: 30.3%

34