ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
NGUYỄN THỊ HƯƠNG GIANG
SÀNG LỌC ẢO HỢP CHẤT
ỨC CHẾ ENZYM TYROSINASE
TỪ HỢP CHẤT THIÊN NHIÊN VIỆT NAM
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC
Hà Nội – 2017
ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
NGUYỄN THỊ HƯƠNG GIANG
SÀNG LỌC ẢO HỢP CHẤT
ỨC CHẾ ENZYM TYROSINASE
TỪ HỢP CHẤT THIÊN NHIÊN VIỆT NAM
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC
Khóa:
QH.2012.Y
Người hướng dẫn: TS. Lê Thị Thu Hường
TS. Phạm Thế Hải
Hà Nội – 2017
Lời cảm ơn
Tôi xin gửi lời cảm ơn sâu sắc tới TS. Lê Thị Thu Hường - Giảng viên Bộ
môn Dược liệu và Dược học cổ truyền, Khoa Y Dược, Đại học Quốc Gia Hà Nội,
TS. Phạm Thế Hải - Giảng viên Bộ môn Hóa dược, Trường đại học Dược Hà Nội đã trực tiếp hướng dẫn, tận tình giúp đỡ và tạo điều kiện thuận lợi để tôi có thể nghiên
cứu và hoàn thành khóa luận này.
Tôi xin chân thành cảm ơn ThS. Ninh Bảo Yến đã giúp đỡ tôi rất nhiều trong quá trình thực hiện khóa luận, cũng như xin gửi lời cảm ơn đến tất cả quý thầy cô tại
Đại học Quốc Gia Hà Nội đã dạy dỗ, trang bị kiến thức cho tôi trong suốt 5 năm theo
học tại trường.
Tôi cũng xin cảm ơn gia đình, bạn bè đã luôn theo sát động viên, quan tâm và
tạo điều kiện giúp tôi có thể hoàn thành khóa luận này.
Xin chân thành cảm ơn!
Hà Nội, tháng 06 năm 2017
Sinh viên
Nguyễn Thị Hương Giang
Bảng ký hiệu, chữ viết tắt
Asn Asparagin
CSDL Cơ sở dữ liệu
DHI 5,6-dihydroxyindol
DHICA Acid 5,6-dihydroxyindol-2-cacboxylic
Glu Acid glutamic
HC Hợp chất
His Histidin
HQ Hydroquinon
L-DOPA L-3,4-dihydroxyphenylalanin
Phel Phenylalanin
PPO Polyphenol Oxidase
QSAR Quantitative Structure-Activity Relationships
TTHĐ Trung tâm hoạt động
TSPT Tham số phân tử
Val Valin
Danh mục các bảng
Bảng 1: Các phân nhóm chính trong CSDL ............................................................. 14
Bảng 2: Ái lực liên kết với đích của 21 hợp chất được dự đoán là có khả năng ức chế tyrosinase ............................................................................................................ 22
Danh mục hình vẽ, đồ thị
Hình 1: Quá trình oxy hóa phenol thông qua enzym tyrosinase ................................ 7
Hình 2: Các dạng oxi hóa của enzym tyrosinase ........................................................ 7
Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon ........... 8
Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin ....................................... 9
Hình 5: Mô phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase ........... 16
Hình 6: Giá trị Tc của các chất trong CSDL tương ứng với 12 chất mẫu ................. 19
Hình 7: Khoảng phân bố của giá trị Tc max ................................................................ 19
Hình 8: Phân bố giá trị Tc max theo từng chất mẫu .................................................... 20
Hình 9: Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD ........... 20
Hình 10: Phân bố các nhóm chất .............................................................................. 21
Hình 11: Phân bố năng lượng liên kết với trung tâm hoạt động của enzym ............ 21
Hình 12: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID929 ............................................................................................................ 27
Hình 13: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID722 ............................................................................................................ 28
Hình 14: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID889 ............................................................................................................ 28
Hình 15: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID723 ............................................................................................................ 29
Hình 16: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID1157 .......................................................................................................... 30
MỤC LỤC
Lời cảm ơn Bảng ký hiệu, chữ viết tắt Danh mục các bảng Danh mục hình vẽ, đồ thị MỞ ĐẦU .................................................................................................................... 1
Chương 1 - TỔNG QUAN ........................................................................................ 2
1.1. Tổng quan về sàng lọc ảo ................................................................................... 2
1.1.1. Khái niệm ................................................................................................... 2
1.1.2. Quy trình sàng lọc ảo.................................................................................. 2
1.1.3. Các kỹ thuật sàng lọc ảo ............................................................................. 2
1.2. Tổng quan về enzym tyrosinase ........................................................................ 6
1.2.1. Khái niệm enzym tyrosinase ...................................................................... 6
1.2.2. Trung tâm hoạt động của enzym tyrosinase ............................................... 7
1.2.3. Vai trò của tyrosinase ................................................................................. 8
1.2.4. Các chất ức chế tyrosinase ......................................................................... 9
1.3. Tổng quan về hợp chất thiên nhiên Việt Nam ............................................... 12
1.3.1. Khái niệm hợp chất thiên nhiên ............................................................... 12
1.3.2. Vai trò của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc ... 12
1.3.3. Tiềm năng của hơp chất thiên nhiên Việt Nam ........................................ 13
Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ........ 14
2.1. Đối tượng, nguyên vật liệu và thiết bị nghiên cứu ........................................ 14
2.1.1 Đối tượng nghiên cứu ................................................................................ 14
2.1.2. Nguyên liệu .............................................................................................. 14
2.1.3. Thiết bị ..................................................................................................... 15
2.2. Phương pháp nghiên cứu ................................................................................. 15
2.2.1. Tìm kiếm đồng dạng ................................................................................. 16
2.2.2. Mô hình QSAR ......................................................................................... 17
2.2.3. Docking .................................................................................................... 17
2.2.4. Xử lý số liệu ............................................................................................. 18
Chương 3 - KẾT QUẢ VÀ BÀN LUẬN ............................................................... 19
3.1. Kết quả tìm kiếm đồng dạng ........................................................................... 19
3.2. Kết quả mô hình QSAR ................................................................................... 20
3.3. Kết quả Docking ............................................................................................... 21
3.4. Bàn luận ............................................................................................................ 23
3.4.1. Về phương pháp sàng lọc ảo .................................................................... 23
3.4.2. Về kết quả sàng lọc ảo .............................................................................. 26
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................ 31
Tài liệu tham khảo
Phụ lục
MỞ ĐẦU
Hiện nay, khi xã hội ngày càng phát triển thì vấn đề về thẩm mỹ, làm đẹp của
con người càng được chú ý hơn đặc biệt là vấn đề chăm sóc da. Màu da của con người
được quyết định bởi nhiều yếu tố, trong đó, quan trọng nhất là sự sản xuất và phân bố của sắc tố melanin bởi tế bào biểu bì tạo sắc tố [68]. Khi tế bào biểu bì tạo sắc tố
hoạt động mạnh hơn sẽ sản sinh ra nhiều melanin và phân tán mạnh hơn, gây ra hiện
tượng nám da, sạm da, tàn nhang… và ung thư da [22]. Melanin được hình thành trong hạt sắc tố melanosom bởi hoạt động của enzym tyrosinase [63]. Vì vậy, hiện
nay nhiều sản phẩm làm sáng da, chống nám sử dụng hoạt chất là các chất ức chế
tyrosinase. Tuy nhiên, các chất có hoạt tính ức chế tyrosinase đang được sử dụng hiện
nay như Hydroquinon (HQ), Acid Kojic và Arbutin lại có nhiều vấn đề liên quan đến độ an toàn và hiệu quả [17, 81]. Do vậy mà việc tìm kiếm các hợp chất mới ức chế
tyrosinase có độ an toàn và hiệu quả cao hơn đặc biệt là từ các hợp chất có nguồn gốc
thiên nhiên là một việc làm hết sức thiết thực và cấp bách.
Phát hiện và tối ưu hóa chất dẫn đường là một khâu quan trọng trong quá trình
nghiên cứu và phát triển thuốc hiện đại. Lâu nay, các nghiên cứu này chủ yếu dựa
vào phương pháp thực nghiệm “thử và lỗi” với nhược điểm là tốn thời gian, tiền bạc
và cho hiệu quả thấp. Các phương pháp trợ giúp bởi máy tính (in silico) đã giúp ích
nhiều cho việc phát hiện các hợp chất mới có hoạt tính sinh học ngay cả trước khi
chúng được tổng hợp hay phân lập thông qua quá trình sàng lọc ảo. Sàng lọc ảo không
những bổ sung cho các sàng lọc thật mà còn giúp định hướng quá trình tổng hợp/phân
lập các chất. Sàng lọc ảo tương đối rẻ, nhanh, cho phép làm việc với số lượng lớn lên
tới hàng triệu hợp chất, điều không thể làm được trong các mô hình thực nghiệm.
Bên cạnh đó, Việt Nam có nguồn dược liệu phong phú với hàng nghìn hợp
chất đã được phân lập và tổng hợp các thông tin liên quan lại thành một cơ sở dữ liệu (CSDL) cung cấp các thông tin đầu vào hữu ích cho việc sàng lọc ảo. Cho đến thời điểm hiện tại, chưa có bài báo nào công bố về một quy trình sàng lọc ảo để tìm kiếm
các chất ức chế tyrosinase từ CSDL này. Do đó, việc sàng lọc CSDL các hợp chất phân lập từ dược liệu sẽ đóng góp nhiều cho quá trình nghiên cứu và phát triển thuốc làm trắng da, chống nám tại Việt Nam.
Trên cơ sở đó, đề tài “Sàng lọc ảo hợp chất ức chế enzym Tyrosinase từ hợp chất thiên nhiên Việt Nam” được thực hiện với mục tiêu: Phát hiện được các
hợp chất có khả năng ức chế tyrosinase mạnh thông qua sàng lọc ảo các hợp chất phân lập từ thảo dược Việt Nam.
1
Chương 1 - TỔNG QUAN
1.1. Tổng quan về sàng lọc ảo
1.1.1. Khái niệm
Các khái niệm về sàng lọc ảo (virtual screening) xuất hiện vào những năm 60 của thế kỷ XX với các mô hình của Hansch [28]. Thế nhưng, chỉ từ năm 1990 thì lĩnh
vực này mới có nhiều bước tiến và từ đó đến nay, ngày càng phát triển mạnh mẽ [41].
Sàng lọc ảo đề cập đến một loạt các kỹ thuật in silico (các kỹ thuật được thự hiện với sự trợ giúp của máy tính) được sử dụng để sàng lọc các CSDL hợp chất lớn nhằm lựa
chọn một số lượng nhỏ hơn cho thử nghiệm sinh học. Mô hình sàng lọc ảo không
những bổ sung cho các mô hình thực nghiệm mà còn giúp định hướng quá trình tổng
hợp/phân lập các chất. Ngoài ra sau khi được xây dựng, việc sử dụng các mô hình này tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh và cho phép làm việc với số lượng
lớn lên tới hàng triệu hợp chất, một điều không thể làm được trong các mô hình thực
nghiệm.
1.1.2. Quy trình sàng lọc ảo
Quá trình sàng lọc ảo gồm 5 bước như sau: 1) Lựa chọn đối tượng sàng lọc 2)
Lựa chọn kỹ thuật 3) Sắp xếp các kỹ thuật theo thứ tự phù hợp 4) Sàng lọc 5) Phân
tích kết quả.
1.1.3. Các kỹ thuật sàng lọc ảo
Các kỹ thuật sàng lọc ảo hiện nay được phân vào 2 nhóm chính là sàng lọc ảo
dựa trên phối tử (Ligand-based Virtual Screening) và sàng lọc ảo dựa trên cấu trúc
(Structure-based Virtual Screening). Sàng lọc ảo dựa trên phối tử được thực hiện
trong trường hợp không có cấu trúc 3D của protein, chỉ có cấu trúc của phối tử. Các
kỹ thuật có thể sử dụng lúc này là kỹ thuật xây dựng phần cấu trúc mang hoạt tính
(pharmacophore), kỹ thuật tìm kiếm đồng dạng (similarity searching), QSAR. Trong trường hợp có cả cấu trúc 3D của protein và cấu trúc của phối tử, kỹ thuật sàng lọc
ảo dựa vào cấu trúc sẽ được áp dụng, sử dụng kỹ thuật docking [47].
Hệ thống sàng lọc ảo được trợ giúp bởi máy tính gồm nhiều phễu lọc khác nhau, mỗi phễu lọc sử dụng một kỹ thuật sàng lọc khác nhau, được sắp xếp tuần tự hợp lý dựa vào thời gian mà máy tính cần cho mỗi thuật toán và sự phức tạp của thông tin đầu vào. Nghiên cứu sử dụng kết hợp 3 phễu lọc: Tìm kiếm đồng dạng, Mô hình
QSAR và Kỹ thuật docking.
2
1.1.3.1. Tổng quan về tìm kiếm đồng dạng
a. Khái quát về tìm kiếm đồng dạng
Kỹ thuật tìm kiếm đồng dạng (similarity searching) là kỹ thuật tìm kiếm các
hợp chất có cấu trúc tương tự với hợp chất mẫu (reference) trên cơ sở dữ liệu về cấu trúc của các hợp chất. Kỹ thuật được thực hiện dựa trên nguyên lý tính chất giống
nhau, như vậy những phân tử có cấu trúc giống nhau được hy vọng có tính chất hoặc
hoạt tính sinh học giống nhau [40]. Kỹ thuật tìm kiếm đồng dạng được đưa vào sử dụng rộng rãi kể từ thập niên 80, và được chứng minh là rất hữu ích trong lĩnh vực
dược phẩm. Hiện nay, phương pháp tìm kiếm đồng dạng đã được xây dựng bởi nhiều
nhóm nghiên cứu trên thế giới. Sàng lọc ảo sử dụng kỹ thuật tìm kiếm đồng dạng có
thể tiến hành một cách nhanh chóng, do đó, kỹ thuật này được sử dụng nhiều để sàng lọc các cơ sở dữ liệu lớn [70].
Hai yếu tố quan trọng tham gia vào quá trình tìm kiếm đồng dạng là các tham
số phân tử đặc trưng cho các chất và thông số sử dụng để thiết lập mối liên hệ so sánh
giữa cặp phân tử (hệ số tương đồng). Sau khi so sánh có thể sắp xếp các hợp chất
trong CSDL theo thứ tự giảm dần về hệ số tương đồng so với các hợp chất mẫu. Khi
có được danh sách sắp xếp này, người nghiên cứu sử dụng một ngưỡng (cut-off) để
lựa chọn tập hợp các hợp chất nằm trên cùng danh sách [30].
Tham số phân tử là giá trị đại diện cho mô tả phân tử. Các mô tả phân tử
thường được định nghĩa dựa vào chiều của chúng. Mô tả phân tử 1 chiều là các đặc
tính như khối lượng phân tử, số lượng liên kết, đếm các mảnh cấu trúc. Mô tả phân
tử 2 chiều là mô tả biểu diễn các cấu trúc theo kích thước, độ phân nhánh và hình
dạng tổng thể, trong khi 3 chiều sử dụng các thông tin tử cấu trúc không gian 3 chiều
của phân tử. Mô tả phân tử được sử dụng thường xuyên nhất là mô tả phân tử 2D, là
mô tả nhị phân, mã hóa sự có mặt hoặc không của các mảnh cấu trúc [80].
Có nhiều hệ số được xây dựng để biểu diễn sự giống nhau giữa một cặp cấu trúc, chẳng hạn như hệ số Tanimoto/Jaccard, hệ số Cosine/ Ochiai, hệ số Dice, hệ số
Fossum, hệ số Simpson, hệ số Pearson/Stile, khoảng cách Euclide, khoảng cách Hamming, khoảng cách Soergel, khoảng cách Manhattan. Hệ số Tanimoto được sử dụng rộng rãi nhất cho các dữ liệu nhị phân. Nhiều nghiên cứu đã chỉ ra rằng, hệ số này cho kết quả tốt hơn so với nhiều hệ số khác [79].
3
b. Quy trình tìm kiếm đồng dạng
Quá trình tìm kiếm đồng dạng gồm các bước chính sau: 1) Tính toán tham số
phân tử đặc trưng cho hợp chất, 2) Tính toán hệ số tương đồng, 3) Sắp xếp các chất
theo chiều giảm dần hệ số tương đồng, 4) Chọn ngưỡng.
1.1.3.2. Tổng quan về các mô hình QSAR
a. Khái quát về mô hình QSAR
Mô hình QSAR (Quantitative Structure-Activity Relationships) là mô hình biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất. Mô hình
QSAR được xây dựng dựa trên giả thuyết cấu trúc của một phân tử phải chứa những
đặc điểm cấu trúc chịu trách nhiệm cho tính chất hóa học, vật lý, sinh học. Mô hình
QSAR cho phép dự đoán tính chất của một phân tử mới dựa trên các hợp chất tương tự có các tính chất đã được kiểm chứng.
Mô hình QSAR được biểu diễn dưới dạng một phương trình toán học (Phương
trình 1). Để có thể xây dựng được các mô hình này thì cả cấu trúc và hoạt tính đều
phải được định lượng hóa. Các cấu trúc được định lượng thông qua các tham số phân
tử (biến x). Các tham số phân tử là kết quả của một quá trình toán học chuyển đổi các
thông tin trong cấu trúc phân tử thành một số đặc trưng cho cấu trúc phân tử ấy. Hoạt
tính được sử dụng có thể là hoạt tính hoá học hay hoạt tính sinh học (biến Y) được
đánh giá bằng các phương pháp nghiên cứu thực nghiệm. Một số đại lượng hoạt tính sinh học thường được dùng như: IC50 nồng độ ức chế 50% hoạt tính; MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu; MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu; EC50 (Effective Concentration): nồng độ 50% tác dụng tối đa; KI: Hằng số ức chế...
Phương trình 1: 𝑌 = 𝑓1(𝑥1) + 𝑓2(𝑥2) + ⋯ + 𝑓𝑛(𝑥𝑛)
Trong đó:
Y: Biến đáp ứng (mang giá trị biểu thị tác dụng sinh học)
x1, x2,…xn: Các tham số đặc trưng cho cấu trúc
f1, f2,…fn: Các thuật toán thể hiện trọng số của tham số phân tử x, được tính toán bằng các phần mềm phân tích thống kê sử dụng kỹ thuật xác suất thống kê hay trí tuệ nhân tạo
4
b. Quy trình xây dựng mô hình QSAR
Các bước để xây dựng mô hình QSAR [76] gồm: 1) Xây dựng cơ sở dữ liệu;
2) Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc; 3) Xây dựng mô hình
QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử và các giá trị đại lượng biểu
diễn hoạt tính; 4) Đánh giá mô hình; 5) Giải thích các kết quả và sử dụng mô hình
trong quá trình sàng lọc ảo.
c. Hệ thống phân loại kếp hợp các mô hình QSAR
Dieterich đã nghiên cứu kết luận là một hệ thống phân loại phối hợp thường
tốt hơn việc sử dụng các mô hình đơn [18]. Sự thành công của các hệ thống phân loại
kết hợp (Multiple classifier system) phụ thuộc vào hai yếu tố là sự đa dạng của các mô hình đơn để kết hợp và cách kết hợp các đầu ra [54].
Có nhiều cách để tạo nên sự đa dạng của các mô hình đơn. Trong các nghiên
cứu của mình, Kuncheva trình bày 4 cấp để tạo nên sự đa dạng của các mô hình đơn
[54]. Cấp độ 1 là thay đổi tập huấn luyện (training set). Cấp độ 2 là thay đổi tập hợp
của các biến độc lập (independent variables). Các biến độc lập dùng để xây dựng các
mô hình QSAR là các tham số phân tử khác nhau đặc trưng cho cấu trúc. Cấp độ 3,
sử dụng các kỹ thuật khác nhau để xây dựng các mô hình đơn. Cấp độ cuối cùng là
cách kết hợp các mô hình đơn. Kuncheva và Whitaker đã tổng kết 10 cách để định
lượng sự đa dạng giữa các mô hình đơn sử dụng các hệ số đa dạng. Có rất nhiều cách
kết hợp các đầu ra như: Biểu quyết đa số phiếu [8], Biểu quyết với trọng số [54],
Bagging (Boostrap AGGregatING) [8], Boosting [7], Stacking [8]. Mỗi cách kết hợp
đầu ra sẽ cho kết quả với độ chính xác khác nhau.
1.1.1.4. Tổng quan về kỹ thuật docking
a. Khái quát về docking
Docking là phương pháp đưa cấu trúc của một chất (dạng cấu trúc không gian
3 chiều) vào một trung tâm tương tác của mục tiêu phân tử (đích tác dụng của thuốc) và tính toán các giá trị tương tác để đánh giá khả năng tương tác của chất đó với mục tiêu phân tử. Mục đích của docking là xác định một cấu dạng tối ưu nhất cho phối tử (phân tử hay anion liên kết trực tiếp với trung tâm hoạt động được gọi là phối tử) và dự đoán chính xác hoạt động của phối tử để năng lượng tự do của phức hợp mục tiêu
phân tử - phối tử là nhỏ nhất [51].
5
Khi cơ chất gắn lên một phân tử protein, hai điểm cần chú ý là sự phù hợp về
hình dạng, kích thước và năng lượng tương tác giữa nó với protein. Sự phù hợp về
hình dạng tương tự như cơ chế chìa khoá - ổ khoá nhưng trong thực tế, cả cơ chất và
protein đều có thể thay đổi cấu hình, đặc biệt protein là phân tử lớn và có cấu trúc mềm dẻo. Quá trình này trong thực tế phức tạp hơn. Ngoài yêu cầu phù hợp về hình
dạng, kích thước, giữa cơ chất và enzym còn có những tương tác khác như van der
Waals, tương tác tĩnh điện, trong nhiều trường hợp còn có tương tác hoá học. Nhưng do protein thường có kích thước lớn và mềm dẻo, rất khó khảo sát hết tất cả khả năng
có thể nên trong docking, phân tử protein thường được đưa vào dưới dạng cấu trúc
cứng (rigid), cơ chất chuyển động tương đối so với protein và thay đổi cấu hình. Một
số phần mềm docking cũng cho phép thay đổi cấu hình trên một số amino acid. Hiện nay, có rất nhiều phần mềm được sử dụng để docking: AutoDock [3], ICM-Docking
[35], MOE (Molecular Operating Environment) [59], SwissDock [73]...
Có 2 cách tiếp cận trong phương pháp docking: docking cơ học và docking tự
động [64]. Docking cơ học trong trường hợp đã biết các nhóm liên kết của phối tử và
vị trí liên kết của mục tiêu. Sử dụng một số chương trình cho phép phối tử chuyển
động trong vị trí liến kết và cố gắng lắp ghép chúng lại với nhau một cách phù hợp
nhất ở trạng thái cứng. Docking tự động được tiến hành nhờ sử dụng các phần mềm
tự động docking. Các chương trình này sẽ tự động quyết định việc làm thế nào để
dock phối tử vào vị trí liên kết.
Một chương trình docking gồm 2 phần chính: thuật toán tìm kiếm cấu dạng,
quay và dịch chuyển của phân tử trong vùng gắn và thuật toán để đánh giá sự phù
hợp của phối tử và receptor hoặc ái lực gắn giữa chúng. Docking yêu cầu thông tin
3D của phân tử và hình dáng 3D của protein đích. Để tìm cấu hình phù hợp nhất cần
liên hệ không gian cấu hình với các giá trị số đánh giá được khả năng gắn kết của cơ chất lên protein và sau đó áp dụng thuật toán tìm kiếm.
b. Quy trình docking
Quy trình docking gồm 4 bước cơ bản: 1) Chuẩn bị protein; 2) Chuẩn bị cấu
tử; 3) Mô phỏng docking; 4) Giải thích kết quả.
1.2. Tổng quan về enzym tyrosinase
1.2.1. Khái niệm enzym tyrosinase
Tyrosinase (EC 1.14.18.1) hay còn gọi là enzym polyphenol oxidase (PPO), là một enzym monooxygenase có chứa đồng tham gia vào hai phản ứng riêng biệt
6
của quá trình chuyển hóa melanin; một là hydroxyl hóa monophenol thành O-
diphenol, hai là oxi hóa O-diphenol thành O-quinon (Hình 1) [9, 48]; sau đó, O-
quinon tham gia một loạt các phản ứng để tạo thành melanin.
Hình 1: Quá trình oxy hóa phenol thông qua enzym tyrosinase
Enzym này được phân bố rộng rãi trong nấm, động vật và thực vật, nó đóng
vai trò quan trọng trong quá trình hình thành sắc tố. Enzym tyrosinase có thể tồn tại
ở 3 dạng là: oxy, deoxy, met-tyrosinase được biểu diễn qua sơ đồ trong Hình 2 [10, 45, 49]. Cả dạng met-tyrosinase và dạng oxy-tyrosinase đều có hoạt tính diphenolase,
trong khi chỉ có dạng oxy-tyrosinase là có hoạt tính monophenolase. Dạng deoxy-
tyrosinase là dạng yếu, không ổn định; phản ứng với oxy để tạo thành dạng oxy-
tyrosinase.
Hình 2: Các dạng oxi hóa của enzym tyrosinase
1.2.2. Trung tâm hoạt động của enzym tyrosinase
Việc phân tích về trung tâm hoạt động là cần thiết cho quá trình xác định hợp chất ức chế enzym tyrosinae. Cấu trúc tinh thể tia X của enzym được tải về từ ngân hàng dữ liệu protein (ID: 2Y9X). Trung tâm hoạt động gồm có túi enzym và 2 nguyên tử đồng nằm ở đáy túi, đóng vai trò quan trọng trong cơ chế xúc tác của enzym. Mỗi
7
nguyên tử đồng tạo liên kết phối trí với 3 phân tử histamin. Miệng túi được hình thành
từ các chuỗi acid amin như Val283, Phel264, His244, Val248, Asn260… (Hình 3)
[36].
Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon
Như vậy, để một cấu tử thể hiện được vai trò ức chế enzym tyrosinase, nó cần phải chui được vào túi enzym của trung tâm hoạt động và khóa được ion Cu2+ ở đáy túi enzym [83].
1.2.3. Vai trò của tyrosinase
Sắc tố là một trong những đặc điểm kiểu hình rõ ràng nhất trong thế giới tự
nhiên. Trong các tế bào động vật hoặc thực vật, một sắc tố được định nghĩa là bất kỳ
chất tạo màu do chúng phản xạ và hấp thụ một số sóng ánh sáng đặc hiệu [57]. Trong
các sắc tố sinh học đó, melanin (theo tiếng Hy Lạp có nghĩa là đen) được phân bố
rộng rãi nhất và được tìm thấy trong suốt quá trình phát sinh loài, từ các vi sinh vật
cho đến động vật, có cả con người [66]. Ở người, melanin được tìm thấy chủ yếu
trong da, tóc, võng mạc [25]. Melanin được tiết ra bởi tế bào sắc tố phân bố ở lớp đáy
của biểu bì. Vai trò của melanin là bảo vệ da khỏi tác hại của tia tử ngoại, đặc biệt là
tia cực tím B bằng cách hấp thụ và tán xạ ánh sáng mặt trời và loại bỏ các gốc oxy hóa tự do. Các rối loạn khác nhau ở da là kết quả của sự tích tụ quá mức sắc tố ở biểu
bì. Tăng sắc tố có thể do tăng tế bào tạo sắc tố hoặc do tăng hoạt động của các enzym hình thành sắc tố.
Các tế bào biểu bì tạo sắc tố của động vật có vú có thể sản xuất hai loại melanin là eumelanin và pheomelanin. Eumelanin có màu từ nâu đến đen, không tan trong
hầu hết các dung môi, liên kết chặt chẽ với protein thông qua các liên kết đồng hóa trị. Pheomelanin có màu từ vàng đến đỏ, có bộ khung được tạo bởi các tiểu đơn vị là các benzothiazin và cũng liên kết chặt chẽ với protein thông qua các liên kết đồng
8
hóa trị. Tỷ lệ về số lượng và mật độ của hai melanin này sẽ quyết định màu sắc của
da, mắt và tóc [78].
Con đường hình thành sắc tố melanin được tóm tắt trong Hình 4 [49, 65].
Bước đầu tiên và cũng là bước bắt buộc trong quá trình hình thành sắc tố là sự oxy hóa tyrosin thành dopaquinon. Đây là bước giới hạn tốc độ trong quá trình sinh tổng
hợp tyrosin do chuỗi phản ứng còn lại có thể tự diễn ra tại một giá trị pH sinh lý nhất
định. Dopaquinon sinh ra được chuyển thành leukodopachrom, sau đó chuyển thành dopachrom. Cuối cùng eumelanin được hình thành thông qua một loạt các phản ứng
oxy hóa từ các sản phẩm chuyển hóa của dopachrom là 5,6-dihydroxyindol (DHI) và
acid 5,6-dihydroxyindol-2-cacboxylic (DHICA). Trong trường hợp có sự có mặt của
cystein hoặc glutathion, dopaquinon sẽ được chuyển hóa thành cysteyldopa hoặc glutathionyldopa. Cysteinyldopa hoặc glutathionyldopa tiếp tục trải qua một loạt các
phản ứng để tạo thành pheomelanin [12, 49].
Như vậy, tyrosinase tham gia vào phản ứng đầu của quá trình hình thành sắc
tố da melanin. Chính vì thế mà các chất ức chế tyrosinase đã và đang được sử dụng
rất rộng trong điều trị các bệnh tăng sắc tố và trong mỹ phẩm như một yếu tố làm
trắng da.
Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin
1.2.4. Các chất ức chế tyrosinase
9
Tyrosinase đóng một vai trò quan trọng trong quá trình tổng hợp melanin, do
đó ức chế enzym này làm giảm hình thành sắc tố da [56]. Vì thế việc tìm kiếm các
chất ức chế tyrosinase ngày càng trở nên quan trọng trong các sản phẩm thuốc và mỹ
phẩm sử dụng để ngăn ngừa và điều trị rối loạn sắc tố.
1.2.4.1. Các chất ức chế tyrosinase có nguồn gốc thiên nhiên
Polyphenol thực vật là nhóm các hợp chất có nhiều nhóm chức phenol, tiêu
biểu là flavonoid. Hơn 4000 flavonoid phân bố trong lá, hạt, vỏ cây và hoa đã được xác định. Ở thực vật các hợp chất này bảo vệ thực vật bằng cách chống lại tia cực tím
và tác nhân gây bệnh [27]. Một số flavonoid như kaempferol, quercetin và morin thể
hiện tác dụng ức chế tyrosinase, trong khi những chất khác, ví dụ catechin và
rhamnetin, đóng vai trò là các cơ chất của tyrosinase. Một số nghiên cứu cho thấy rằng flavonoid có chứa nhóm α-keto có tác dụng ức chế tyrosinase mạnh [5].
Nhiều aldehyd và các hợp chất khác cũng được phân lập và xác định là có tác
dụng ức chế enzym tyrosinase như cinnamaldehyd, (2E) -alkenal, 2-hydroxy-4-
methoxybenzaldehyd, anisaldehyd, cuminaldehyd và acid cumic [52]. Hoạt động ức
chế tyrosinase của anisaldehyd và cuminaldehyd mạnh hơn khoảng 2,5 và 16 lần so
với benzaldehyd. Một số alkanal có tác dụng ức chế tyrosinase có thể là do sự tương
tác kỵ nước của chúng với các enzym, làm ảnh hưởng đến cấu trúc bậc 3 của enzym
[15]. (2E) - alkenal ức chế quá trình oxy hóa L-3,4-dihydroxyphenylalanin (L-DOPA)
của tyrosinase là chất ức chế không cạnh tranh, và phần alkyl kỵ nước có liên quan
đến hoạt động ức chế của chúng [15].
Bên cạnh những thực vật bậc cao thì trong nấm cũng có một số hợp chất có
tác dụng ức chế enzym tyrosinase. Acid dicacboxylic bão hòa được tạo thành bởi quá
trình peroxy hóa lipid và este hóa acid béo bằng nấm men, vi nấm Pityrosporum
ovale. Acid dicacboxylic này có tác dụng gây độc nhất định trên các tế bào biểu bì tạo sắc tố của khối u ác tính ở da, mặc dù bình thường tế bào biểu bì tạo sắc tố không bị ảnh hưởng [69]. Acid kojic, 5-hydroxy-2- (hydroxymethyl)-γ-pyron, một chất
chuyển hóa của nấm được sản xuất bởi nhiều loài thuộc chi Aspergillus và Penicillium. Acid kojic ức chế sự hình thành sắc tố từ phản ứng oxy hóa L-DOPA, norepinephrin và dopamin dưới sự xúc tác của tyrosinase. Điều này có nghĩa rằng acid kojic có thể giảm chuyển hóa O-quinon thành O-diphenol ngăn cản tạo thành các sắc tố [43].
1.2.4.2. Các chất ức chế tyrosinase có nguồn gốc tổng hợp
10
Một lượng đáng kể các hợp chất có nguồn gốc tổng hợp như hydroxylamin,
các hợp chất chứa thiol, acid cacboxylic thơm, dẫn xuất của acid cinnamic, trihydroxy
chalconas, peptid, acid alkylbenzoic [31], N-hydroxy-N’-phenyl ure và N-hydroxy-
N’-phenyl thioure [16] có tác dụng ức chế enzym tyrosinase.
Tropolon (2-hydroxy-2,4,6-cycloheptatrien-1-on) là một trong những chất ức
chế tyrosinase mạnh nhất. Nó có cấu trúc tương tự như các cơ chất O-diphenolic của
tyrosinase [42].
Resorcinol được gắn nhóm thế ở vị trí 4 là các chất ức chế tyrosinase yếu.
Trong các hợp chất này, tác dụng ức chế mạnh nhất đạt được khi thay thế nhóm kỵ
nước vào vị trí thứ 4, chẳng hạn như 4-hexyl resorcinol và 4-dodecyl resorcinol. 4-
hexyl resorcinol là các chất ức chế tyrosinase hiệu quả nhất sử dụng trong các ngành công nghiệp thực phẩm vì nó hòa tan trong nước, ổn định, không độc hại, không gây
đột biến và không gây ung thư, và chất này cũng đã được công nhận là an toàn trong
việc kiểm soát sự sẫm màu của lát táo cũng như khoai tây và bơ khi để ngoài không
khí lâu [21].
1.2.4.3. Các thuốc được phát hiện có tác dụng ức chế tyrosinase
Captopril, (S)-1-(3-mercapto-2-metyl-1-oxopropyl)-L-prolin, ức chế hoạt
động monophenolase và diphenolase của tyrosinase [20]. Captopril được biết đến là
chất tạo chelat với đồng [38]. Do đó, có thể cho rằng captopril chủ yếu có tác dụng
ức chế là do tạo chelat với ion đồng ở vị trí hoạt động của tyrosinase.
Một số thuốc khác cũng có tác dụng ức chế hoạt động của tyrosinase, như
penicillamin, được sử dụng trong điều trị bệnh Wilson [55], và methimazol là thuốc
kháng tuyến giáp. Methimazol (1-methyl-2-mercaptoimidazol) ức chế cả hoạt động
monophenolase và diphenolase của tyrosinase nấm. Methimazol ức chế hoạt động
tyrosinase của nấm bằng hai cách: liên hợp với O-quinon, do đó ức chế rõ sự hình thành sắc tố, và tạo chelat với đồng tại vị trí hoạt động của tyrosinase [1].
1.2.4.4. Một số chất ức chế đã được sử dụng
HQ làm giảm 90% hoạt tính của tyrosinase [77], là một hóa chất phổ biến có trong mỹ phẩm và sản phẩm làm sáng da không cần đơn. Nó được coi là một trong các chất ức chế hiệu quả nhất quá trình sản xuất melanin ở cả in vitro và in vivo. HQ ảnh hưởng nghiêm trọng đến sức khỏe đặc biệt là sắc tố của mắt, và trong một số ít
trường hợp HQ gây tổn thương giác mạc vĩnh viễn. Hiện tượng này đã được quan sát thấy ở các công nhân sản xuất HQ. HQ đã bị Cục quản lý Dược phẩm Hoa Kỳ cấm
11
sử dụng trong các chế phẩm mỹ phẩm ở Châu Âu vì không an toàn khi sử dụng trong
thời gian dài [17].
Arbutin, một hợp chất chuyển hóa thứ cấp của cây dâu gấu (tên khoa học là
Arctostaphylos uva-ursi), được sử dụng rộng rãi với hiệu quả làm sáng da. Arbutin tự nhiên tương đối an toàn tuy nhiên lại có độ ổn định thấp và dễ dàng chuyển hóa
thành HQ. Vì thế, vào năm 2008, Hiệp hội Mỹ phẩm Châu Âu đã cấm sử dụng các
đồng dạng của beta-arbutin [81].
1.3. Tổng quan về hợp chất thiên nhiên Việt Nam
1.3.1. Khái niệm hợp chất thiên nhiên
Hợp chất thiên nhiên ( natural products) là các chất hóa học có nguồn gốc từ
thiên nhiên hoặc được chiết xuất từ các mô của động vật, thực vật trên cạn; sinh vật biển; vi khuẩn lên men; vi sinh vật [37]. Hầu hết các hợp chất thiên nhiên có hoạt
tính sinh học là các chất chuyển hóa thứ cấp có cấu trúc rất phức tạp.
1.3.2. Vai trò của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc
Thực vật được cấu thành bởi một hệ thống lớn và đa dạng các chất hóa học,
chúng có thể cung cấp những hợp chất với cấu trúc có độ phức tạp cao mà không thể
tổng hợp được trong các phòng thí nghiệm. Những phân tử nhỏ này cung cấp nguồn
hoặc là tiền chất cho phần lớn các hoạt chất được FDA chấp thuận và hiện đang là
một trong những nguồn cảm hứng chính cho việc nghiên cứu và phát hiện thuốc mới.
Có nhiều chất dẫn đường có nguồn gốc từ thực vật [62] (ví dụ morphin,
cocain, digitalis, quinin, tubocurarin, nicotin, muscarin…). Một số đóng vai trò trực
tiếp là những loại thuốc hữu ích (ví dụ morphin và quinin), và một số khác là cơ sở
cho tổng hợp các hoạt chất làm thuốc (ví dụ như thuốc gây mê cục bộ phát triển từ
cocain). Gần đây trong lâm sàng, một số loại thuốc mới đã được phân lập từ thực vật
bao gồm thuốc chống ung thư paclitaxel (Taxol) từ cây thủy tùng, và thuốc chống sốt rét artemisinin từ câu thanh hao hoa vàng.
Nhiều thực vật bậc cao chứa các chất chuyển hóa mới có tính kháng khuẩn và kháng virus [26]. Ở những nước phát triển, các ca lâm sàng có dử dụng hóa trị liệu thường dùng các thuốc đã được sản xuất bằng hóa tổng hợp in vitro; nhưng taxol và vincristin là ngoại lệ [46], chúng là các chất chuyển hóa có cấu trúc phức tạp, rất khó tổng hợp trong ống nghiệm. Nhiều loại thuốc tổng hợp và bán tổng hợp gây ra các
phản ứng phụ nghiêm trọng, nhất là các thuốc dùng điều trị cho bệnh nhân ung thư với các tác dụng phụ biểu hiện trên da một cách rất nghiêm trọng. Các chất chuyển
12
hóa được phát hiện trong một số loài thực vật có thể tránh tác dụng phụ của thuốc
tổng hợp vì chúng đã từng tích tụ trong các tế bào sống [29].
Một trong những hợp chất tinh khiết được phân lập đầu tiên trong lịch sử y
học là morphin vào khoảng năm 1804 bởi Friedrich Serturner từ thuốc phiện. Vào thời điểm đó, thuốc phiện được gọi là thuốc gây nghiện, mặc dù nó đã được sử dụng
nhiều trong điều trị giảm đau vào thời Trung cổ. Tiếp sau đó, thuốc kháng sốt rét,
quinin đã được Pelletier và Caventou phân lập từ cây vỏ cây cinchona vào năm 1820. Loại vỏ cây này đã được sử dụng để điều trị sốt rét từ những năm 1600 và cũng là
một phần của y học cổ truyền Nam Mỹ để điều trị bệnh sốt. Sự gia tăng tính kháng
thuốc đối với quinin và dẫn chất của nó dẫn đến nhu cầu về thuốc sốt rét thay thế, đó
là artemisinin được phân lập từ cây thanh hao hoa vàng. Ngoài ra còn có thuốc giảm đau aspirin là este của acid salicylic được tách chiết từ vỏ cây liễu, lá của cây này
được người Ai Cập cổ đại sử dụng với tác dụng giảm đau và chống viêm.
1.3.3. Tiềm năng của hơp chất thiên nhiên Việt Nam
Theo kết quả thống kê của Viện Dược liệu, tính đến năm 2017 đã ghi nhận
được 5.117 loài thực vật và nấm lớn, 52 loài tảo biển, 408 loài động vật và 75 loài
khoáng vật có công dụng làm thuốc. Trong số đó, có khoảng 70 loài có tiềm năng
khai thác với tổng trữ lượng khoảng 18.000 tấn/năm như diếp cá (5.000 tấn), cẩu tích
(1.500 tấn), lạc tiên (1.500 tấn), rau đắng đất (1.500 tấn)…Đặc biệt, Việt Nam sở hữu
nhiều loài dược liệu quý, hiếm, đặc hữu như: Sâm Ngọc Linh, Ba kích, Châu thụ,
Ngân đằng… Kết quả này cho thấy nguồn dược liệu ở nước ta rất phong phú. Con số
này còn có thể sẽ tăng thêm, nếu đi sâu điều tra cụ thể hơn một số nhóm động – thực
vật tiềm năng, mà trong đó số loài Tảo, Rêu, Nấm và Côn trùng làm thuốc mới được
thống kê còn quá ít.
Chiến lược quốc gia phát triển ngành dược đến năm 2020 đã đặt mục tiêu phấn đấu sản xuất được 20% nhu cầu nguyên liệu cho sản xuất thuốc trong nước; thuốc sản xuất trong nước chiếm 80% tổng giá trị thuốc tiêu thụ trong năm, trong đó thuốc
từ dược liệu chiếm 30%.
13
Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Đối tượng, nguyên vật liệu và thiết bị nghiên cứu
2.1.1 Đối tượng nghiên cứu
Nghiên cứu được thực hiện trên cơ sở dữ liệu cấu trúc các hợp chất có nguồn gốc từ thảo dược Việt Nam. Thông tin của 1376 hợp chất được phân lập từ 311 loài
thực vật và nấm thuộc 114 họ thực vật tại Việt Nam đã được xác định cấu trúc trong
418 nghiên cứu trong nước (được công bố trên các tạp chí Dược liệu, Dược học, Hóa học và Khoa học công nghệ) và quốc tế được tập hợp lại thành một CSDL. CSDL Có
các thông tin về hợp chất (tên, biểu diễn cấu trúc dưới dạng SMILE, InChI và
InChiKey), tên nguồn dược liệu (tên thông thường, tên khoa học), địa chỉ thu hái, thời
gian thu hái, bộ phận sử dụng, tác dụng dân gian, tác dụng dược lý được chứng minh và tài liệu tham khảo. Mỗi hợp chất trong CSDL được gán một số đăng ký VNPD_ID
từ VNPD_ID1 tới VNPD_ID1376. Ngoài ra, mỗi cấu trúc còn được phân loại, tính
toán các thông số lý hóa như khối lượng phân tử, AlogP, XlogP, số liên kết cho hydro,
số liên kết nhận hydro...
CSDL Có các hợp chất được được phân loại vào các nhóm khác nhau, chủ yếu
là lipid, phenylpropanoid và benzoid, được nêu cụ thể trong Bảng 1.
Bảng 1: Các phân nhóm chính trong CSDL
Nhóm phân loại chính Tỷ lệ (%)
Lipid và các phân tử giống lipid Phenylpropanoid và polyketid Benzenoid Hợp chất có cấu trúc dị vòng Hợp chất hữu cơ có chứa oxy Alkaloid và các dẫn xuất Lignan, neolignan Khác Tổng Số lượng hợp chất 531 364 144 117 80 60 60 20 1376 38,59 26,45 10,46 8,50 5,81 4,36 4,36 1,46 100
2.1.2. Nguyên liệu
- Mô hình QSAR phân loại (Classify) và QSAR hoạt tính (Potency) đã được công bố trong nghiên cứu trước đây [34]
14
- Cấu trúc tinh thể tia X của enzym tyrosinase (ID: 2Y9X) phân lập từ A.bisporus với
chất ức chế Tropolon được tải về từ ngân hàng Protein Data Bank
(http://www.rcsb.org/)
2.1.3. Thiết bị
- Máy tính Dell Vostro 3460, Ram 6GB, hệ điều hành Window 7, CPU Intel Core i5
Ivy Bridge với tốc độ xử lý 2.50GHz
- Phần mềm:
1. CDK DescUI-1.4.6 [11]
2.TOMOCOMD-CARDD (TOpological MOlecular COMputer Design -
Computer - Aided Racional Drug Design) [84]
3. Weka 3.6 (Waikato Environment for Knowledge Analysis) [75]
4. ChemBioDraw Ultra 12.0 [13]
5. UCSF Chimera 1.11.2 [14]
6. MOE 2009.10 (Molecular Operating Environment) [59]
7. Microsoft Office 2013
2.2. Phương pháp nghiên cứu
Nghiên cứu sử dụng phương pháp sàng lọc các hợp chất ức chế tyrosinase sử
dụng mô hình sàng lọc ảo. Hệ thống sàng lọc được định hướng phát triển theo các bước giống Hình 5. Hệ thống này có nhiều phễu lọc cho phép sàng lọc được những
cơ sở dữ liệu lớn (hàng nghìn hợp chất) nhằm thu được một tập hợp nhỏ các hợp chất
có tiềm năng ức chế enzym tyrosinase.
15
Hình 5: Mô phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase
2.2.1. Tìm kiếm đồng dạng
Phễu lọc tìm kiếm tương đồng được sử dụng nhằm sàng lọc được các hợp chất
có độ tương đồng cao (trên 75%) với các hợp chất mẫu, cung cấp một số lượng nhỏ
các chất có chất lượng cao cho phễu lọc tiếp theo.
Tham số phân tử MACCS [67] (là 1 mô tả phân tử sử dụng 166 bit để mã hóa
thông tin về nguyên tử, loại nguyên tử, vòng và các liên kết trong phân tử) được tính
toán bằng phần mềm CDK DescUI-1.4.6 trên tập hợp chất trong CSDL và tập hợp
mẫu. Tập hợp chất mẫu trong nghiên cứu này là tập hợp các chất ức chế mạnh
tyrosinase đã biết trước cấu trúc [33] (chi tiết cấu trúc hóa học của các hợp chất mẫu
được nêu trong Phụ lục 1). Sau đó, hệ số Tanimoto được tính toán bằng ngôn ngữ R
(là ngôn ngữ dành cho tính toán và đồ họa thống kê) [39], dựa theo Công thức (2).
Mỗi hợp chất của CSDL sẽ có 12 hệ số tương đồng ứng với 12 chất mẫu (từ Ref1 tới
Ref12). Nghiên cứu sử dụng quy tắc MAX để kết hợp các giá trị định lượng về sự
tương đồng cấu trúc theo: Tc max = Maximum (Tc1, Tc2,…Tc12). Sau đó, từng hợp chất trong CSDL được sắp xếp theo giá trị Tc max giảm dần. Các hợp chất được giữ lại cho quá trình sàng lọc tiếp theo khi có giá trị Tc từ 0.75 trở lên.
𝑁𝑐 𝑁𝑎+𝑁𝑏−𝑁𝑐
Công thức (2): 𝑇𝑐 =
Trong đó:
16
Tc: Hệ số Tanimoto
Na: Số lượng các đặc tính xuất hiện trong cấu trúc A
Nb: Số lượng các đặc tính xuất hiện trong cấu trúc B
Nc: Số lượng các đặc tính xuất hiện trong cả 2 cấu trúc A và B
2.2.2. Mô hình QSAR
Các hợp chất được xác định là có cấu trúc tương đồng với các hợp chất ức chế
tyrosinase mạnh (kết quả sàng lọc sử dụng phễu lọc tìm kiếm độ tương đồng), sẽ được đánh giá khả năng ức chế sử dụng mô hình QSAR. Đầu tiên, nghiên cứu sử dụng mô
hình QSAR phân loại (Classify) nhằm phân loại hợp chất thành có tiềm năng ức chế
hay không có tiềm năng ức chế. Sau đó, các hợp chất được phân loại là có tiềm năng
ức chế, sẽ được sàng lọc qua mô hình QSAR hoạt tính (Potency) để đánh giá khả năng ức chế tyrosinase mạnh hay yếu.
Các hợp chất thu được từ phễu lọc tìm kiếm đồng dạng sẽ được tính toán các
tham số phân tử đặc trưng biểu thị mối quan hệ giữa đặc tính, cấu trúc và hoạt tính
sinh học sử dụng phần mềm TOMOCOMD-CARDD. Danh sách các tham số phân
tử và ý nghĩa các tham số phân tử này được liệt kê trong Phụ lục 2. Tập kiểm tra
(testing set) được chuẩn bị từ danh sách kết quả các tham số phân tử vừa tính được
sử dụng phần mềm WEKA 3.6. Tập huấn luyện (training set) cho mô hình QSAR
phân loại gồm 1072 hợp chất, trong đó có 526 hợp chất có hoạt tính và 546 hợp chất
không có hoạt tính ức chế tyrosinase. Tập huấn luyện cho QSAR hoạt tính gồm 257
chất có hoạt tính mạnh và 141 chất có hoạt tính trung bình-yếu [34].
Nghiên cứu sử dụng mô hình QSAR là mô hình hợp kết hợp giữa các mô hình
đơn có độ chính xác cao được xây dựng từ việc áp dụng các thuật toán thống kê và
mô hình học máy khác nhau. Sau đó, sử dụng thêm trình huấn luyện stacking để kết
hợp đầu ra của các mô hình đơn nhằm đạt kết quả tốt nhất. 2 mô hình QSAR phân loại và QSAR hoạt tính được sử dụng đều là các mô hình được nhóm nghiên cứu của
TS. Lê Thị Thu Hường đánh giá là tốt nhất [34], có độ tin cậy cao, 95,43% và 93,72% tương ứng.
2.2.3. Docking
Cuối cùng, các hợp chất được dự đoán là có khả năng ức chế tyrosianse mạnh sẽ được dock với enzym tyrosinase (ID: 2Y9X) nhằm xác định năng lượng liên kết
17
và tương tác với trung tâm hoạt động. Quá trình dock được thực hiện theo 3 bước như
sau:
Bước 1: Chuẩn bị cấu trúc enzym và cơ chất dưới dạng file .moe
Cấu trúc tyrosinase từ file 2Y9X được loại bỏ phối tử (trong nghiên cứu này là Tropolon), các phân tử nước, các phân tử nền, giữ lại chuỗi A (dùng phần mềm
UCSF Chimera 1.11.2), tinh chỉnh trung tâm hoạt động (dùng phần mềm MOE
2009.10) và được ghi lại dưới dạng file .moe. Cấu trúc của phối tử (các hợp chất trong CSDL đã được dự đoán là có hoạt tính ức chế tyrosinase mạnh) được chuyển từ dạng
2D sang 3D (sử dụng phần mềm ChemBioDraw Ultra 12.0) và tối ưu hóa sơ bộ dùng
MOE 2009.10, sau đó ghi lại dưới dạng file .moe.
Bước 2: Docking
Sau khi lựa chọn trường lực (ForceField) và loại năng lượng cần tính toán
(ΔG), enzym và phối tử được dock với nhau tự động. Thuật toán tìm kiếm được sử
dụng là kết hợp thuật giải di truyền với tối ưu hóa cục bộ. Các thông số sử dụng mặc
định của phần mềm.
Bước 3: Xử lý kết quả
Kết quả được đưa ra là một danh sách các cấu dạng liên kết của enzym và phối
tử được sắp xếp theo thứ tự năng lượng liên kết tăng dần. Cấu dạng có tương tác với
trung tâm hoạt động của enzym đồng thời có năng lượng liên kết nhỏ nhất sẽ được
ưu tiên lựa chọn.
2.2.4. Xử lý số liệu
Số liệu được xử lý bằng phương pháp thống kê, lọc sử dụng phần mềm
Microsoft Office Excel 2013.
18
Chương 3 - KẾT QUẢ VÀ BÀN LUẬN
3.1. Kết quả tìm kiếm đồng dạng
Kết quả sau khi tính toán hệ số tương đồng Tanimoto được lưu lại và xử lý
bằng Microsoft Office Excel 2013 (Hình 6). Trong đó, các giá trị in đậm là các giá trị lớn nhất của hệ số Tanimoto được lựa chọn để sắp xếp độ tương đồng theo chiều giảm
dần.
Hình 6: Giá trị Tc của các chất trong CSDL tương ứng với 12 chất mẫu
600
HC
500
400
300
200
100
0
0,0-0,3
0,3-0,4
0,4-0,5
0,5-0,6
0,6-0,7
0,7-0,75
0,75-0,8
0,8-0,9
0,9-1,0
Tc max
Giá trị Tc max của các hợp chất trong CSDL được phân bố như Hình 7. 75% hợp chất có giá trị Tc max nằm trong khoảng từ 0,5-0,75. Dưới 15% hợp chất có Tc max lớn hơn 0,75.
Hình 7: Khoảng phân bố của giá trị Tc max
Các hợp chất có độ tương đồng trên 75%, tương ứng với Tc max >0,75, sau đó được lọc bằng Excel và sắp xếp theo thứ tự giảm dần độ tương đồng. Sự phân bố Tcmax của các chất thu được lúc này được biểu diễn trong Hình 8. Gần 50% số hợp chất
trong CSDL có độ tương đồng với hợp chất mẫu Ref8 trong khi không có hợp chất nào trong CSDL tương đồng với Ref6. Sau khi loại đi các hợp chất có hệ số tương đồng dưới 0,75 thì 174 hợp chất còn lại, chủ yếu tương đồng với Ref8 (116/174 hợp
19
chất) và Ref9 (38/174 hợp chất). Không có hợp chất nào trong CSDL có độ tương
700
643
600
500
461
400
300
200
116
88
100
62
53
38
32
26
8
8
5
4
2
2
2
0
0
0
0
0
0
0
0
0
Ref1
Ref2
Ref3
Ref4
Ref5
Ref6
Ref7
Ref8
Ref9
Ref10
Ref11
Ref12
Tc max
Tc max>0.75
đồng trên 0,75 với Ref2, Ref3, Ref4, Ref6, Ref7, Ref11 và Ref12.
Hình 8: Phân bố giá trị Tc max theo từng chất mẫu
Như vậy, 1376 hợp chất trong CSDL qua phễu lọc tìm kiếm tương đồng thu
được 174 hợp chất (12,64% tổng số chất) có độ tương đồng từ 0,75 được sắp xếp theo
thứ tự giảm dần độ tương đồng.
3.2. Kết quả mô hình QSAR
174 hợp chất thu được sau phễu lọc tìm kiếm đồng dạng sẽ được vẽ lại bằng
phần mềm TOMOCOMD-CARDD và được lưu lại dưới dạng file *.net. Ví dụ về cấu
trúc VNPD_ID929 được biểu diễn lại bằng TOMOCOMD-CARD như Hình 9.
Hình 9: Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD
20
11 tham số phân tử phục vụ cho mô hình QSAR phân loại và 14 tham số phân
tử sử dụng cho mô hình QSAR hoạt tính được tính toán dựa trên 174 file *.net ở trên
bằng phần mềm TOMOCOMD-CARDD. Kết quả các tham số phân tử thu được
tương ứng với 2 mô hình QSAR cuối cùng được biểu diễn trong Phụ lục 3.
174 hợp chất với độ tương đồng trên 75% tiếp tục được lọc qua mô hình QSAR
phân loại và QSAR hoạt tính thu được 41 hợp chất được dự đoán là có hoạt tính ức
chế tyrosinase và 34 hợp chất được dự đoán là có hoạt tính ức chế tyrosinase mạnh (Phụ lục 4). 34 hợp chất được dự đoán là có hoạt tính ức chế tyrosinase mạnh chủ
yếu thuộc vào nhóm flavonoid (7/34 hợp chất) và triterpenoid (13/34 hợp chất). Cụ
Triterpenoid Flavonoid Stigmastan Terpene lacton Sesterterpenoid Ergostane steroid Naphthalen Stigmastane Steroid
0
2
4
6
8
10
12
14
thể phân loại 34 chất vào các nhóm như Hình 10.
Hình 10: Phân bố các nhóm chất
3.3. Kết quả Docking
Áp dụng phương pháp Docking 34/1376 hợp chất trong CSDL với trung tâm hoạt động của enzym tyrosinase được kết quả là danh sách các cấu dạng liên kết và
năng lượng liên kết được trình bày cụ thể trong Phụ lục 5.
0 dG -1 -2 -3 -4 -5 -6 -7 -8 -9
Hình 11: Phân bố năng lượng liên kết với trung tâm hoạt động của enzym
21
Phân tích kết quả Docking, tất cả 34 hợp chất đều có khả năng chui vào túi
enzym của trung tâm hoạt động (tất cả đều có năng lượng liên kết âm với đích, từ -
8,7921 đến -3,8160 Kcal/mol) nhưng chỉ có 21/34 hợp chất có khả năng liên kết với ion Cu2+ nằm tại đáy túi trung tâm hoạt động của tyrosinase (Bảng 2). Trong đó, 13 hợp chất liên kết với cả 2 ion đồng của trung tâm hoạt động, 8 hợp chất được dự đoán
là có khả năng liên kết với 1 ion đồng của trung tâm hoạt động, còn lại 13 hợp chất
không tạo được liên kết phối trí với ion đồng và được dự đoán là không có khả năng ức chế tyrosinase (Hình 11).
Bảng 2: Ái lực liên kết với đích của 21 hợp chất được dự đoán là có khả năng ức
chế tyrosinase
No Số đăng ký Hợp chất ΔG(Kcal/mol)
VNPD_ID46 1 -5,3657 Acid (24E)-3-oxo-lanosta-8,24-dien-26- oic
Acid 20(R),24(E)-3-oxo-9β-lanosta- VNPD_ID184 2 -5,8818 7,24-dien-26-oic
VNPD_ID395 6β-hydroxystigmast-4-en-3-on 3 -6,3335
VNPD_ID577 Citrostadienol acetat 4 -6,4105
VNPD_ID722 Epigallocatechin 5 -8,6404
VNPD_ID723 Epigallocatechingallat 6 -8,5137
VNPD_ID725 Ergosta-4,6,8(14),22-tetraen-3-on 7 -5,7037
VNPD_ID889 Kaempferol 8 -8,5998
VNPD_ID894 Kaempferol 3-O-β-D-glucopyranosid 9 -8,7538
10 VNPD_ID921 Leoheteronin -5,4323
11 VNPD_ID922 Leoheteronin A -6,2830
12 VNPD_ID923 Leoheteronin B -5,3499
13 VNPD_ID929 Luteolin -8,7921
14 VNPD_ID940 Lup-20(29)-en-3β-yl acetat -5,8188
15 VNPD_ID1023 Neosarmentol III -3,8160
16 VNPD_ID1157 Quercetin -7,7230
17 VNPD_ID1166 Quercetin 3-O-α-L-rhamnopyranosid -8,1534
18 VNPD_ID1256 Stigmast-4-en-3-on -5,6756
19 VNPD_ID1257 Stigmasta-4-en-3,6-dion -6,3540
20 VNPD_ID1286 Taraxeryl acetat -5,4154
21 VNPD_ID1365 α-spinasteron -5,2966
22
3.4. Bàn luận
3.4.1. Về phương pháp sàng lọc ảo
Việc ứng dụng các kỹ thuật máy tính (sàng lọc ảo) trong quá trình nghiên cứu
và phát triển thuốc đang là một xu thế chung của các ngành công nghiệp dược phẩm trên toàn thế giới. Số lượng các bài báo về sàng lọc ảo tăng lên hàng năm, chứng tỏ
lĩnh vực này đang rất được quan tâm. Điều này có thể giải thích là do các kỹ thuật
sàng lọc ảo có nhiều ứng dụng trong nghiên cứu về thiết kế thuốc, phát triển các hợp chất ức chế trên đích sinh học khác nhau, điển hình như các đích phân tử cho những
bệnh đang được quan tâm hiện nay như ung thư, bệnh do ký sinh trùng, bệnh HIV…
Vì thế, áp dụng các kỹ thuật sàng lọc ảo sẽ giúp Việt Nam tiếp cận và theo kịp với
các kỹ thuật mới trên thế giới.
Mặt khác, trong nghiên cứu này, quá trình sàng lọc ảo được áp dụng trên CSDL
mà nhóm nghiên cứu đã xây dựng được. Việc sàng lọc CSDL này là một hướng đi
nhanh và hiệu quả nhất cho việc phát triển một thuốc mới vì các hợp chất trong CSDL
đã được xác định, phân lập từ thảo dược ở Việt Nam (tránh được giai đoạn tổng hợp).
Để sàng lọc được ngân hàng này nhanh và chính xác, việc thiết lập một quy trình sàng
lọc ảo một cách hệ thống, có nhiều phễu lọc khác nhau là rất cần thiết.
Phương pháp sàng lọc ảo chất ức chế tyrosinase sử dụng các mô hình toán học
mới có tính chính xác cao, được xây dựng sử dụng mô hình hợp (multiclassifiers), và
hệ thống trình sàng lọc ảo (có nhiều phễu lọc) cho phép phát hiện các hợp chất ức chế
enzym tyrosinase mới có hoạt tính cao chỉ từ cấu trúc phân tử.
Bên cạnh những ưu điểm trên, sàng lọc ảo cũng còn gặp một số khó khăn như
sự khác biệt giữa mô hình hóa và thực tế diễn ra trong cơ thể con người, sự chính xác
trong việc xác định cấu trúc 3D của protein, hay việc sử dụng quá nhiều phễu lọc
cũng có thể gây tăng sai số cho quá trình. Chính vì vậy, việc phối hợp các kỹ thuật in silico, in vivo, in vitro là rất cần thiết.
Về kỹ thuật tìm kiếm đồng dạng
Việc sử dụng mô tả 2D để mô tả phân tử vừa đơn giản, dễ thực hiện, vừa tiết kiệm thời gian. Mô tả phân tử 2D thường ổn định hơn so với mô tả phân tử 3D vì mô tả 2D chỉ mang một giá trị duy nhất trong khi mô tả 3D có thể mang nhiều giá trị do độ linh động về cấu dạng. Vì thế, sử dụng mô tả phân tử 2D sẽ làm tăng hiệu quả cho
quá trình tính toán. Trong khóa luận này, vân tay điện tử MACCS (Molecular ACCESS System) được sử dụng để biểu diễn cho các phân tử trong CSDL và các hợp
23
chất mẫu. MACCS là một mô tả cấu trúc 2D, sử dụng 166 bit để mã hóa thông tin về
nguyên tử, loại nguyên tử, vòng và các liên kết trong phân tử. MACCS được tính toán
bằng phần mềm CDK DescUI-1.4.6 sử dụng dữ liệu đầu vào là SMILE (là ngôn ngữ
dùng để biểu diễn cấu trúc hóa học và các phản ứng). Bên cạnh những ưu điểm của một mô tả 2D, việc sử dụng MACCS để mô tả phân tử còn có một số hạn chế.
MACCS là vân tay từ điển (điều này có nghĩa là một từ điển cố định về các mảnh cấu
trúc sẽ được sử dụng trong quá trình mã hóa hợp chất), như vậy, nếu hợp chất có chứa mảnh cấu trúc không được định nghĩa trong từ điển thì mảnh cấu trúc đó sẽ không
xuất hiện trong kết quả mô tả phân tử nhận được, gây ra sai số cho mô tả.
Hệ số Tanimoto được sử dụng để biểu diễn sự giống nhau giữa các chất của
CSDL được sàng lọc và chất mẫu. Đây là hệ số tương đồng được sử dụng rộng rãi nhất trong lĩnh vực hóa tin do thuật toán đơn giản, dễ thực hiện và nhanh chóng và
hiệu quả hơn so với các hệ số tương đồng khác. Tuy nhiên, trong các nghiên cứu về
so sánh các hệ số tương đồng đã chỉ ra rằng, việc sử dụng kết hợp các hệ số tương
đồng sẽ mang lại hiệu quả cao hơn cho quá trình sàng lọc [4]. Hoặc việc xây dựng
nên một vân tay mẫu (model fingerprint), là dấu vân tay được kết hợp từ dấu vân tay
của các hợp chất mẫu cũng là một cách làm tăng hiệu quả cho quá trình tìm kiếm.
Qua quá trình sàng lọc ảo dựa vào đồng dạng, 12,64% số hợp chất đạt yêu cầu
đã được lựa chọn, việc làm này đã tiết kiệm được thời gian cho quá trình sàng lọc dựa
vào đồng dạng, cung cấp các chất đầu vào có tiềm năng cao hơn cho các phễu lọc
sau. Như vậy, đây là một phễu lọc vô cùng hữu ích, tiết kiệm được thời gian và công
sức cho quá trình sàng lọc.
Về kỹ thuật sàng lọc sử dụng mô hình QSAR
QSAR hiện nay đang là một kỹ thuật được ứng dụng trong rất nhiều các lĩnh
vực như dược phẩm, y học, hóa học... Có rất nhiều nghiên cứu trên thế giới sử dụng mô hình QSAR để sàng lọc các hoạt chất chống ung thư phổi [85], điều trị bệnh Parkinson, điều trị các bệnh đái tháo đường, HIV [58] .... Trong nước hiện nay cũng
đã bắt đầu sử dụng mô hình QSAR trong nghiên cứu phát triển thuốc như Thái Khắc Minh và cộng sự đã xây dựng thành công mô hình QSAR các hợp chất ức chế topoisomerase I và các chất chống ung thư [74]. Tuy nhiên, các nghiên cứu sử dụng mô hình QSAR hầu hết chỉ sử dụng mô hình đơn, có rất ít các nghiên cứu sử dụng hệ thống phân loại hợp (kết hợp đầu ra của các mô hình đơn) trong khi hệ thống phân
loại hợp là một dụng cụ rất hiệu quả trong các nghiên cứu QSAR.
24
Nghiên cứu này sử dụng mô hình phân loại hợp QSAR trong các công bố trước
đó của TS. Lê Thị Thu Hường cùng nhóm nghiên cứu [34]. Nhóm nghiên cứu đã xây
dựng rất nhiều mô hình đơn và mô hình hợp với các thuật toán khác nhau để mô tả
mối liên quan định lượng giữa cấu trúc và tác dụng của hợp chất ức chế enzym tyrosinase. Các mô hình lần lượt được đánh giá. Kết quả cho thấy, việc sử dụng mô
hình hợp mang lại hiệu quả cao hơn so với việc sử dụng mô hình đơn trong việc dự
đoán hợp chất có tác dụng ức chế tyrosinase. Đồng thời, các mô hình được xây dựng dựa trên tập huấn luyện bao gồm rất nhiều hợp chất (1027 hợp chất) làm tăng độ
chính xác của mô hình. Chính vì thế mà việc áp dụng mô hình hợp QSAR vào nghiên
cứu này đã mang lại hiệu quả cao cho quá trình sàng lọc.
Tuy nhiên, mô hình QSAR không phải là mô hình sẵn có, để xây dựng được mô hình, cần phải có thông tin về cấu trúc, hóa học, thực nghiệm... của tập hợp các
chất được dùng làm tập huấn luyện, đồng thời phải có hiểu biết về phân tích thống
kê, mô hình học máy khá phức tạp.
Về kỹ thuật docking
Docking là một kỹ thuật phổ biến hiện nay để mô phỏng các tương tác giữa
protein với protein hoặc giữa protein và phối tử, được ứng dụng để thiết kế thuốc dựa
vào cấu trúc, tối ưu hóa hợp chất dẫn đường, hay nghiên cứu cơ chế tác dụng của các
thuốc… Tuy nhiên, docking có nhược điểm là cần có thông tin về cấu trúc 3D của
protein, cấu dạng của cơ chất và protein đều có thể bị thay đổi, giữa cơ chất và enzym
còn có các tương tác khác như tương tác van der Waals, tương tác tĩnh điện, trong
nhiều trường hợp còn có tương tác hóa học khác.
Hơn 60 phần mềm docking được phát triển trong suốt 2 thập kỷ qua bao gồm
cả phần mềm thương mại và phần mềm học thuật như là DOCK [19], AutoDock [3],
MOE [59], GOLD [23]... Trong đó, các phần mềm thương mại được đánh giá là có độ chính xác cao hơn so với các phần mềm học thuật. MOE 2009.10 là một phần mềm docking thương mại với hàm tính toán có độ chính xác cao nằm trong top đầu [60].
Vì thế, các kết quả docking nhận được trong nghiên cứu này đều có độ chính xác cao. Đây cũng là lý do vì sao docking được thực hiện bằng phần mềm MOE 2009.10 trong nghiên cứu này.
Tyrosinase tồn tại trong thực vật, động vật, nấm và vi khuẩn. Tyrosinase tiêu biểu nhất là tyrosinase được phân lập từ các loài vi khuẩn Streptomyces, từ nấm
Neurospora crassa và Agaricus bisporus. Ngày nay, enzym nội bào từ A.bisporus là
25
enzym thương mại sẵn có duy nhất. Tyrosinase từ A.bisporus đã được chứng minh là
có tính tương đồng cao với tyrosinase của động vật có vú và con người, vì thế nó
được sử dụng như mô hình trong hầu hết các nghiên cứu về tăng sắc tố da [44]. Chính
vì lý do này mà nghiên cứu lựa chọn cấu trúc tinh thể của tyrosinase từ A.bisporus để phục vụ cho bước sàng lọc dựa vào cấu trúc (docking).
3.4.2. Về kết quả sàng lọc ảo
Tất cả 34 hợp chất được dock với tyrosinase đều có nhóm hydroxy phenol (có độ phân cực cao) hoặc nhóm keto (gần nối đôi hoặc liên kết trực tiếp với nguyên tử
oxy). Các phân tử oxy có độ âm điện lớn có khả năng tạo phức chelat với ion đồng,
tuy nhiên, tùy thuộc vào cấu trúc của từng hợp chất, mà cấu dạng tạo thành khi liên
kết vào trung tâm hoạt động của enzym có cho phép phân tử oxy có độ âm điện lớn đó nằm vào đúng vị trí để tương tác với ion đồng hay không. Điều này giải thích vì
sao 2 hợp chất cùng có nhóm hydroxy phenol tại vị trí meta và para nhưng có chất
tạo được 4 liên kết với ion đồng (VNPD_ID929), có chất lại chỉ tạo được 2 liên kết
(VNPD_ID1157). Hay 2 hợp chất cùng có nhóm keto liên kết trực tiếp với nguyên tử
oxy, nhưng 1 chất thì tạo được 1 liên kết với ion đồng (VNPD_ID940), trong khi chất
còn lại không tạo được liên kết với ion đồng (VNPD_ID938).
Trong số 34 hợp chất đã tiến hành nghiên cứu docking, có 21/34 hợp chất cho
kết quả là có tác dụng ức chế tyrosinase mạnh. 16/21 hợp chất chưa có bất kỳ nghiên
cứu nào về tác dụng ức chế tyrosinase. Cụ thể, VNPD_ID725 mới được nghiên cứu
và chứng minh tác dụng phòng ngừa tổn thương thận gia đoạn sớm trên chuột [82],
tác dụng gây độc tế bào và gây độc dòng tế bào ung thư [72]. VNPD_ID922 được
chứng minh là có tác dụng ức chế cholinesterase [32]. VNPD_ID940 đã được nghiên
cứu và chứng minh là có khả năng kích ứng da mạnh [2]. VNPD_ID1256 đã được
chứng minh là có hoạt tính ức chế sự tăng trưởng của Mycobacterium tuberculosis [24]. Các hợp chất còn lại mới chỉ được nghiên cứu và phân lập, chưa được nghiên cứu về bất kỳ tác dụng sinh học nào. Như vậy, 16 hợp chất chưa được chứng minh
hoạt tính ức chế tyrosinase này là các hợp chất tiềm năng cần được nghiên cứu thêm.
5 trong số 21 hợp chất được dự đoán là có tác dụng ức chế tyrosinase mạnh đã được chứng minh hoạt tính ức chế tyrosinase trong các công bố trước đây. Cả 5 hợp chất này đều là 5 hợp chất thuộc nhóm flavonoid, là nhóm chất có rất nhiều hợp chất đã được chứng minh tác dụng ức chế tyrosinase, trong phân tử có 1 đến 2 nhóm
hydroxy phenol. Các nhóm hydoxy phenol này có tính phân cực mạnh nên khi đi vào trung tâm hoạt động của enzym có thể tạo phức với ion đồng nằm ở đáy túi, gây bất
26
hoạt enzym theo cơ chế cạnh tranh. Cụ thể, tương tác của 5 hợp chất này với trung
tâm hoạt động của enzym như sau:
a. VNPD_ID929. Luteolin
Hình 12: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID929
Theo kết quả nghiên cứu trên mô hình docking thì VNPD_ID929 được dự đoán
là có khả năng ức chế tyrsionase mạnh do có nhóm m-hydroxy và p-hydroxy khi đi
sâu vào trung tâm hoạt động của enzym sẽ bị de-proton hóa tạo nên hai cực âm có
điện tích phân bố đều trên hai nguyên tố oxy. Nhờ đó mà cả 2 nguyên tố oxy đều tạo phức chelat với 2 ion Cu2+. Đồng thời, các liên kết hydro cũng được hình thành giữa 2 vòng thơm của VNPD_ID929 và His263, phân tử oxy tại vị trí para- của
VNPD_ID929 nhận điện tử từ His61. Đồng thời, VNPD_ID929 tương tác với trung
tâm hoạt động của enzym với mức năng lượng nhỏ nhất ΔG = -8,7921 Kcal/mol. Như
vậy, VNPD_ID929 là chất có khả năng chui vào trung tâm hoạt động của enzym,
tương tác với 2 ion đồng, và được giữ lại bởi các liên kết hydro nên có thể dự đoán
VNPD_ID929 có khả năng ức chế tyrosinase mạnh nhất.
Trên thực tế, VNPD_ID929 được tìm thấy trong rất nhiều loài thực vật ở Việt
Nam, trong đó chưa thấy có nghiên cứu về tác dụng ức chế tyrosinase từ dịch chiết
của các loài thực vật này. Tuy nhiên, đã có nghiên cứu chứng minh tác dụng ức chế tyrosinase của chất này trên thế giới [6, 50, 53].
b. VNPD_ID722. Epigallocatechin
27
Hình 13: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID722
Từ kết quả của mô hình sàng lọc ảo, VNPD_ID722 được dự đoán có tác dụng
ức chế tyrosinase. So với VNPD_ID929, VNPD_ID722 tạo thêm được liên kết hydro
do mạch chính của Asn260 nhận điện tử từ hydro liên kết với nhóm methyl của hợp
chất. Như vậy, VNPD_ID722 có khả năng ổn định tại trung tâm hoạt động của enzym
hơn so với VNPD_ID929. Tuy nhiên, năng lượng liên kết với trung tâm hoạt động
của VNPD_ID722 lớn hơn VNPD_ID929, ΔG = -8,6404 Kcal/mol.
VNPD_ID722 được tìm thấy trong cây trôm leo (Byttneria aspera C., Sterculiaceae) (có tác dụng dân gian là giúp phụ nữ có thai dễ sinh nở) và cây vừng
(Sesamum indicum, Pedaliaceae) (đã được chứng minh là có khả năng ức chế enzym
amylase, điều trị đái tháo đường), nhưng chưa thấy có nghiên cứu ức chế tyrosinase
từ dịch chiết cây này tại Việt Nam. Hợp chất này đã được chứng minh tác dụng ức
chế tyrosinase với nồng độ ức chế 50% bằng 0,5 lần so với acid kojic trong các công
bố trước đó [61].
c. VNPD_ID889. Kaempferol
Hình 14: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID889
28
Kết quả nghiên cứu trên mô hình sàng lọc ảo cho thấy, VNPD_ID889 có nhóm
chức p-hydroxy tạo phức chelat với 2 ion đồng nằm dưới đáy túi của trung tâm hoạt
động của enzym. Tương tự như VNPD_ID929, VNPD_ID889 cũng tạo được 2 liên
kết hydro với His263 và His61 giúp ổn định hơn cấu trúc của phức hợp. 2 liên kết phối trí với ion đồng, đồng thời, VNPD_ID889 có mức năng lượng ΔG = -8,5998
Kcal/mol cao hơn so với VNPD_ID929 cho thấy khả năng ức chế tyrosinase của
VNPD_ID889 thấp hơn so với VNPD_ID929.
VNPD_ID889 đã được nghiên cứu và chứng minh tác dụng ức chế tyrosinase
với nồng độ ức chế 50% là 0,23mM cao hơn so với VNPD_ID929 (0,19mM) [71].
d. VNPD_ID723. Epigallocatechingallat
Hình 15: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID723
VNPD_ID723 khi đi vào sâu trong trung tâm hoạt động, 2 nhóm m-hydroxy và p-hydroxy của VNPD_ID723 tạo phức chelat với 2 ion Cu2+ do đó VNPD_ID723 có khả năng ức chế tyrosinase. Mức năng lượng dự đoán được là ΔG = -8,5137 Kcal/mol. So với VNPD_ID929, VNPD_ID723 chỉ tạo được 2 liên kết với 2 ion Cu2+, nhưng lại tạo được 4 liên kết hydro với các chuỗi His244, His85, Glu322 và Arg268.
VNPD_ID723 được tìm thấy trong lá trà xanh (Camellia sinensis L.) với tác dụng kháng khuẩn, kháng nấm, kìm hãm sự phát triển của tế bào ung thư. Ngoài ra,
đã có nghiên cứu về tác dụng ức chế ức chế tyrosinase của VNPD_ID723 và một số hợp chất cùng nhóm với hợp chất này, kết quả cho thấy chúng đều thể hiện tác dụng ức chế tyrosinase [61].
29
e. VNPD_ID1157. Quercetin
Hình 16: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID1157
Dựa vào kết quả quá trình docking, VNPD_ID1157 được dự đoán là có khả
năng ức chế tyrsionase. Do cấu dạng của đáy túi enzym, VNPD_ID1157 chỉ có thể
tạo được cấu dạng mà tại đó chỉ có nhóm m-hydroxy tạo liên kết phối trí với 2 ion Cu2+. Năng lượng liên kết ghi lại được là ΔG = -7,7230 Kcal/mol.
VNPD_ID1157 được tìm thấy trong nhiều loài thực vật ở Việt Nam như mục
ký ngũ hùng (Dendrophthoe pentandra L.), đảng sâm bắc (Codonopsis pilosula F.),
đại bi (Blumea balsamifera L.), bồ kết (Gleditsia australis)... Các nghiên cứu về hoạt
tính ức chế tyrosinase của VNPD_ID1157 cũng đã được thực hiện, kết quả cho thấy
VNPD_ID1157 có hoạt tính ức chế tyrosinase mạnh gấp 2 lần so với acid kojic [71].
30
KẾT LUẬN VÀ KIẾN NGHỊ
KẾT LUẬN
Từ kết quả của quá trình sàng lọc ảo trên CSDL các hợp chất thiên nhiên Việt
Nam, chúng tôi rút ra kết luận sau:
1. Từ 1376 hợp chất trong CSDL, 174 hợp chất được xác định là có cấu trúc tương
đồng với các hợp chất ức chế mạnh thông qua phễu lọc tìm kiếm tương đồng.
2. 41 hợp chất được dự đoán là có khả năng ức chế thông qua mô hình QSAR phân loại, 34 hợp chất được dự đoán là ức chế mạnh sử dụng mô hình QSAR hoạt tính
3. Cả 34 hợp chất đều có năng lượng liên kết âm trên các nghiên cứu docking. Phân
tích các hợp chất có năng lượng liên kết âm trên docking, đã phát hiện được 21 hợp
chất có khả năng ức chế tyrosinase mạnh.
KIẾN NGHỊ
Để tiếp tục phát triển các kết quả nghiên cứu của khóa luận trong tìm kiếm các
hợp chất thiên nhiên Việt Nam có hoạt tính ức chế enzym tyrosinase, chúng tôi xin
đưa ra các đề xuất sau:
1. Chiết tách, phân lập các hợp chất đã được dự đoán thông qua hệ thống sàng lọc ảo.
2. Tiến hành thử hoạt tính sinh học để kiểm chứng lại các kết luận của quá trình sàng
lọc ảo.
31
Tài liệu tham khảo [1]. Andrawis A., Kahn V. (1986), "Effect of methimazole on the activity of mushroom
tyrosinase", Biochem J, 235(1), 91-96.
[2]. Asif M. S., Sabir W. A. (2003), "Irritant potential of some constituents from the seeds of Caesalpinia bonducella (L.) Fleming", Journal of Asian Natural Products Research, 5(1), 35-41.
[3]. AutoDock, The Scripps Research Institute. [4]. Aysha Al K., Maciej H., John H. (2009), "Comparison of Nonbinary Similarity Coefficients for Similarity Searching, Clustering and Compound Selection", Chem. Inf. Model., 49, 1193-1201.
[5]. Badria F. A., Gayyar M. A. (2001), "A new type of tyrosinase inhibitors from natural products as potential treatments for hyperpigmentation", Boll Chim Farm, 140(4), 267-271.
[6]. Balyan R., Kudugunti SK., Hamad HA., Yousef MS., Moridani MY. (2015), "Bioactivation of luteolin by tyrosinase selectively inhibits glutathione S- transferase", Chemico Biological Interactions, 240, 208-218.
[7]. Battiti R., Colla A. M. (1994), "Democracy in neural nets: voting schemes for
classification", Neural Networks 7, 691-708.
[8]. Breiman L. (1996), "Bagging predictors", Machine Learning, 24(2). [9]. Canovas F. G., Garcia-Carmona F., Sanchez J. V., Pastor J. L., Teruel J. A. (1982), "The role of pH in the melanin biosynthesis pathway", J Biol Chem, 257(15), 8738- 8744.
[10]. Casanola-Martin G. M., Le-Thi-Thu H., Marrero-Ponce Y., Castillo-Garit J. A., Torrens F., Rescigno A., Abad C., Khan M. T. (2014), "Tyrosinase enzyme: An overview on a pharmacological target", Curr Top Med Chem, 14(12), 1494-1501.
[11]. CDK Descriptor Calculator GUI v1.4.6, Rajarshi Guha. [12]. Chang T. S. (2009), "An updated review of tyrosinase inhibitors", Int J Mol Sci, 10(6),
2440-2475.
[13]. ChemBioDraw Ultra 12.0 CambridgeSoft (2010), PerkinElmer. [14]. Chimera v1.11.2 - Extensible Molecular Modeling System (2016), Resource for
Biocomputing, Visualization, and Informatics.
[15]. Conrad J. S., Dawso S. R., Hubbard E. R., Meyers T. E., Strothkamp K. G. (1994), "Inhibitor binding to the binuclear active site of tyrosinase: temperature, pH, and solvent deuterium isotope effects", Biochemistry, 33(19), 5739-5744.
[16]. Criton M., Le Mellay-Hamon V. (2008), "Analogues of N-hydroxy-N'-phenylthiourea and N-hydroxy-N'-phenylurea as inhibitors of tyrosinase and melanin formation", Bioorganic & Medicinal Chemistry Letters, 18(12), 3607-3610.
[17]. DeCaprio A. P. (1999), "The toxicology of hydroquinone relevance to occupational
and environmental exposure", Crit Rev Toxicol, 29(3), 283-330.
[18]. Dietterich T. G (2000), Ensemble methods in machine learning, Springer-Verlag,
Berlin Heidenberg.
[19]. DOCK, Irwin "Tack" Kuntz's Group, University of California, San Francisco. [20]. Espin J. C., Wichers H. J. (2001), "Effect of captopril on mushroom tyrosinase activity
in vitro", Biochim Biophys Acta, 1544, 289-300.
[21]. Frankos V. H., Schmitt D. F., Haws L. C., McEvily A. J., Iyengar R., Miller S. A., Munro I. C., Clydesdale F. M., Forbes A. L., Sauer R. M. (1991), "Generally recognized as safe (GRAS) evaluation of 4-hexylresorcinol for use as a processing
aid for prevention of melanosis in shrimp", Regul Toxicol Pharmacol, 14(2), 202- 212.
[22]. Frenk.E (1995), "Treatment of melasma with depigmenting agents ", Martin Dunitz,
London.
[23]. Genetic Optimization for Ligand Docking (GOLD), The Cambridge Crystallgraphic
Data Centre.
[24]. Girma M. W., Scott G. F., Fangqiu Z., Barbara N. T. (2003), "Inhibitory effect of sterols from Ruprechtia triflora and diterpenes from Calceolaria pinnifolia on the growth of Mycobacterium tuberculosis", Planta Med, 69, 628-631.
[25]. Gottesberge A. M. (1988), "Physiology and Pathophysiology of Inner Ear Melanin",
Pigment Cell Research, 1(4), 238-249.
[26]. Gutzeit H. O., Ludwig-Müller J. "Biological Functions and Practical Applications",
Plant Natural Products: Synthesis. Wiley Blackwell.
[27]. Hammerstone J. F., Lazarus S. A., Schmitz H. H. (2000), "Procyanidin content and variation in some commonly consumed foods", The Journal of Nutrition, 130(8), 2086-2092.
[28]. Hansch C., Fujita T. (1964), "A method for the correlation of biological activity and
chemical structure.", J. Am. Chem. Soc., 86, 1616-1626.
[29]. Hany A., El-Shemy, Ahmed M. Aboul-Enein, Kounosuke F. (2007), "Willow Leaves' Extracts Contain Antitumor Agents Effective against Three Cell Types", PLoS ONE, 2(1), 178.
[30]. Hert J., Willett P., Wilton D. J., Acklin P., Azzaoui K., Jacoby E., Schuffenhauer A. (2004), "Comparison of fingerprint-based methods for virtual screening using multiple bioactive reference structures", J Chem Inf Comput Sci, 44(3), 1177-1185. [31]. Huang X.-H., Chen Q.-X., Wang Q., Song K.-K., Wang J., Sha L., Guan X. (2006), "Inhibition of the activity of mushroom tyrosinase by alkylbenzoic acids", Food Chem, 94, 1-6.
[32]. Hung TM, Luan TC, Vinh BT, Cuong TD, Min BS (2011), "Labdane-type diterpenoids from Leonurus heterophyllus and their cholinesterase inhibitory activity", Phytother Res, 25(4), 611-615.
[33]. Huong Le-Thi-Thu, Gerardo M. Casañola-Martín, Yovani Marrero-Ponce, Antonio Rescigno, Concepción Abad, Mahmud Tareq Hassan Khan (2014), "A Rational Workflow for Sequential Virtual Screening of Chemical Libraries on Searching for New Tyrosinase Inhibitors", Medicinal Chemistry, 14.
[34]. Huong Le-Thi-Thu, Isis Bonet Cruz, Yovani Marrero-Ponce, Nam Nguyen-Hai, Hai Pham-The, Hai Nguyen-Thanh, Tung Bui Thanh, Gerardo M. Casañola-Martin (2015), "Multi-Criteria Decision Making: The Best Choice for the Modeling of Chemicals Against Hyper-Pigmentation?", Current Bioinformatics, 10(5), 13.
[35]. Internal Coordinate Mechanics (ICM) (2014), MolSoft LLC. [36]. Ismaya W.T., Rozeboom H.J., Weijn A., Mes J.J., Fusetti F., Wichers H.J., Dijkstra B.W. (2011), "Crystal structure of PPO3, a tyrosinase from Agaricus bisporus, in deoxy-form that contains additional unknown lectin-like subunit, with inhibitor Tropolone", Biochemistry, 50(24), 5477–5486.
[37]. James R. H. (2003), Natural Products: The Secondary Metabolites, UKRoyal Society
of Chemistry.
[38]. Jay D., Cuellar A., Zamorano R., Munoz E., Gleason R. (1991), "Captopril does not scavenge superoxide: captopril prevents O2- production by chelating copper", Arch Biochem Biophys, 290(2), 463-467.
[39]. John F., Robert A. (2005), Using the R Statistical Computing Environment to Teach Social Statistics Courses, Department of Sociology, McMaster University. [40]. Johnson M.A., Maggiora G.M. (1990), Concepts and Applications of Molecular
Similarity, John Wiley & Sons, New York.
[41]. Jonsdottir S. O., Jorgensen F. S., Brunak S. (2005), "Prediction methods and databases within chemoinformatics: emphasis on drugs and drug candidates", Bioinformatics, 21(10), 2145-2160.
[42]. Kahn V., Andrawis A. (1985), "Inhibition of mushroom tyrosinase by tropolone",
Phytochemistry, 24, 905-908.
[43]. Kahn V. (1995), "Effect of kojic acid on the oxidation of DL-DOPA, norepinephrine, and dopamine by mushroom tyrosinase", Pigment Cell Res, 8(5), 234-240. [44]. Kamal U. Zaidi, Ayesha S. Ali, Sharique A. Ali (2014), "Purification and Characterization of Melanogenic Enzyme Tyrosinase from Button Mushroom", Enzyme Research.
[45]. Kanteev M., Goldfeder M., Fishman A. (2015), "Structure-function correlations in
tyrosinases", Protein Sci, 24(9), 1360-1369.
[46]. Karl-Hein A., Memmert K. (2008), Natural Compounds as Drugs, Basel. Boston.
BerlinBirkhauser.
[47]. Kenneth M. Merz, Dagmar Ringe, Charles H. Reynolds (2010), Drug design: Structure
and ligand-based approaches, Cambridge University Press.
[48]. Khan M. T. H. (2007), "Molecular design of tyrosinase inhibitors: A critical review of promising novel inhibitors from synthetic origins", Pure and Applied Chemistry, 79(12).
[49]. Kim Y. J., Uyama H. (2005), "Tyrosinase inhibitors from natural and synthetic sources: structure, inhibition mechanism and perspective for the future", Cell Mol Life Sci, 62(15), 1707-1723.
[50]. Kima Y. J., Uyama H. (2005), "Tyrosinase inhibitors from natural and synthetic sources: structure, inhibition mechanism and perspective for the future", Cellular and Molecular Life Sciences, 62(1707-1723).
[51]. Kitchen D. B., Decornez H., Furr J. R., Bajorath J. (2004), "Docking and scoring in virtual screening for drug discovery: methods and applications", Nat Rev Drug Discov, 3(11), 935-949.
[52]. Kubo I., Kinst-Hori I. (1999), "2-Hydroxy-4-methoxybenzaldehyde: a potent tyrosinase inhibitor from African medicinal plants", Planta Med, 65(1), 19-22. [53]. Kubo I., Kinsy-Hori I., Chaudhuri S. K., Kubo Y., Sánchez Y., T. Ogura (2000), "Flavonols from Heterotheca inuloides: tyrosinase inhibitory activity and structural criteria", Bioorg. Med. Chem., 8(1749-1755).
[54]. Kuncheva L. I. (2004), Combining Pattern Classifiers, Wiley Interscience. [55]. Lovstad R. A. (1976), "Effect of penicillamine on the conversion of dopa to dopachrome in the presence of tyrosinase or ceruloplasmin", Biochem Pharmacol, 25(5), 533-535.
[56]. Maeda K., Fukuda M. (1991), "In vitro effectiveness of several whitening cosmetic
components in human melanocytes", J. Soc. Cosmet. Chem, 42, 361-368.
[57]. Mc Quarrie D. A., Simon J. D. (1997), Physical Chemistry: A Molecular Approach,
University Science Books.
[58]. McGee T. D. Jr., Yi H. A. , Allen W. J., Jacobs A., Rizzo R. C. (2017), "Structure- based identification of inhibitors targeting obstruction of the HIVgp41 N-heptad repeat trimer", Bioorg Med Chem Lett, 7, 503-506.
[59]. Molecular Operating Environment (MOE) (2009.10), Chemical Computing Group:
Suite 910, 1010 Sherbrooke St. W, Montreal, Quebec H3A 2R7, Canada.
[60]. Nataraj S. P., Khajamohiddin S., Jack T. (2017), "Software for molecular docking: a
review", Biophys Rev.
[61]. No JK., Soung DY., Kim YJ., Shim KH., Jun YS., Rhee SH., Yokozawa T., Chung HY. (1999), "Inhibition of tyrosinase by green tea components", Life Science, 65(21), 241-246.
[62]. Odugbemi T. (2008), A Textbook of Medicinal Plants from Nigeria, University of
Lagos Press.
[63]. Ortonne J. P., Nordlund J. J. (1998), "Mechanisms that cause abnormal skin color", The Pigmentary System: Physiology and Pathophysiology. Oxford University Press, 489-502.
[64]. Patrick G. (2006), "Computer in medicinal chemistry", An introduction to medicinal
chemistry. Oxford University Press, UK.
[65]. Pawelek J. M. (1991), "After dopachrome?", Pigment Cell Res, 4(2), 53-62. [66]. Prota G. (1998), "Progress in the chemistry of melanins and related metabolites",
Medicinal Research Reviews, 8(4), 525-556.
[67]. Release 2000.2, MDL Information MACCS Drug Data Report. [68]. Sánchez-Ferrer A., Rodríguez-López J. N., Garcia-Canovas F., Garcia-Carmona (1995), "Tyrosinase: a comprehensive review of its mechanism", Biochimica et Biophysica Acta, 1247(1), 1-11.
[69]. Schallreuter K. U., Wood J. W. (1990), "A possible mechanism of action for azelaic
acid in the human epidermis", Arch Dermatol Res, 282(3), 168-171.
[70]. Sheridan R. P., Kearsley S. K. (2002), "Why do we need so many chemical similarity
search methods?", Drug Discov Today, 7(17), 903-911.
[71]. Solimine J., Garo E., Wedler J., Rusanov K., Fertig O., Hamburger M., Atanassov I., Butterweck V. (2016), "Tyrosinase inhibitory constituents from a polyphenol enriched fraction of rose oil distillation wastewater", Science Direct, 108, 13-19.
[72]. Supakorn A., Cholpisut T., Kwanjai K., Kasem S., Somdej K. (2017), "A new xanthone from the fungus Apiospora montagnei", Natural Product Research. [73]. SwissDock, Molecular Modeling Group of the Swiss Institute of Bioinformatics,
Lausanne, Switzerland.
[74]. Thai KM, Bui QH, Tran TD, Huynh TN (2012), "QSAR modeling on benzo[c]phenanthridine analogues as topoisomerase I inhibitors and anti-cancer agents.", Medicinal Chemistry, 17(5), 5690-5712.
[75]. Tony C. Smith, Eibe Frank (2016), "Introducing Machine Learning Concepts with WEKA", Statistical Genomics - Methods and Protocols. Springer, New York, 353- 378.
[76]. VanWaterbeemd H. (1995), Chemometric methods in molecular design, Wiley-VCH,
New York.
[77]. Verallo-Rowell V. M., Verallo V., Graupe K., Lopez-Villafuerte L., Garcia-Lopez M. (1989), "Double-blind comparison of azelaic acid and hydroquinone in the treatment of melasma", Acta Derm Venereol Suppl, 143, 58-61.
[78]. Walter C., Quevedo Jr, Thomas B. Fitzpatrick, Kowichi Jimbow (1985), "Human skin color: Origin, variation and significance", Journal of Human Evolution, 14(1), 43- 56.
[79]. Willet P., Barnard J.M., Downs G.M. (1998), "Chemical similarity searching", Journal
of Chemical Information and Computer Sciences, 38(6), 983-996.
[80]. Willett P. (2011), Similarity searching using 2D structural fingerprints, Springer
Protocols, New York.
[81]. Yagi A., Kanbara T., Morinobu N. (1987), "Inhibition of mushroom-tyrosinase by aloe
extract", Planta Med, 53(6), 515-517.
[82]. Ying-Yong Z., Li Z., Jia-Rong M., Xiao-Hong C., Rui-Chao L., Yongmin Z., Wen-Ji S. (2011), "Ergosta-4,6,8(14),22-tetraen-3-one isolated from Polyporus umbellatus prevents early renal injury in aristolochic acid-induced nephropathy rats", Journal of Pharmacy and Pharmacology, 63(1581-1586).
[83]. Yong-Doo P., You-Jeong L., Hwa-Sun H., Myong-Joon H., Jun-Mo Y. (2012), "Complex Inhibition of Tyrosinase by Thiol-Composed Cu2+ Chelators: A Clue for Designing Whitening Agents", Journal of Biomolecular Structure and Dynamics, 24(2), 131-138.
[84]. Yovani M. P., Francisco T. "Novel 2D TOMOCOMD-CARDD Descriptors: Atom- based Stochastic and non-Stochastic Bilinear Indices and their QSPR Applications ". [85]. Zang S. Z., Yang Y. R., Zhao S. S., Li Y. X., Gao X. Y., Zhong C. L. (2017), "In silico insight into EGFR treatment in patients with lung carcinoma and T790M mutations", Ther Med, 13(5).
Phụ lục
Phụ lục 1: Cấu trúc hóa học các hợp chất mẫu ức chế mạnh tyrosinase
Ref1. Acid kojic Ref2. L-mimosin Ref3. L-Tropolon
Ref4. N- cyclopenthyl-N- nitrosohydroxyl- amin Ref5. Methyl este của acid gentisic Ref6.Kurarinon
Ref7. Phenyl- thioure Ref8. 8´-epi-cleomiscosin A Ref9. Isolongifolen-4-on
Ref10. 4'- Prenyloxyresveratr ol Ref11. N-(2,4- dihydroxybenzyl)-3,5- dihydroxybenzylbenzami d Ref12. 3-Hydroxy-4-methoxy benzaldehyd thiosemicarbazon hemihydrat
Phụ lục 2.a: Tham số phân tử sử dụng cho mô hình QSAR phân loại
No TSPT
1 VEqh1 Nguyên tử ngoại lai Có nguyên tử hydro
2 VHq2
3 VHq14
4 PHq5 Lực vander Waals Lực vander Waals Lực vander Waals Khả năng phân cực
5 PHq15 Khả năng phân cực
6 KEq2 Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai
7 GEq11 Nguyên tử ngoại lai
8 MHq1s Không ngẫu nhiên Không ngẫu nhiên Không ngẫu nhiên Không ngẫu nhiên Không ngẫu nhiên Không ngẫu nhiên Không ngẫu nhiên Ngẫu nhiên
9 KEqh3s Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai Không có nguyên tử hydro Không có nguyên tử hydro Không có nguyên tử hydro Không có nguyên tử hydro Không có nguyên tử hydro Không có nguyên tử hydro Không có nguyên tử hydro Có nguyên tử hydro Ngẫu nhiên
10 KEqh8s Nguyên tử ngoại lai Có nguyên tử hydro Ngẫu nhiên
11 KEq0s Nguyên tử ngoại lai Ngẫu nhiên Độ âm điện Muliken Độ âm điện Paulin Khối lượng phân tử Độ âm điện Muliken Độ âm điện Muliken Độ âm điện Muliken Ý nghĩa Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Không có nguyên tử hydro Đếm bước: 1 Đếm bước: 2 Đếm bước: 14 Đếm bước: 5 Đếm bước: 15 Đếm bước: 2 Đếm bước: 11 Đếm bước: 1 Đếm bước: 1 Đếm bước: 8 Đếm bước: 0
Phụ lục 2.b: Tham số phân tử sử dụng cho mô hình QSAR hoạt tính
No TSPT
1 Mqh13 Tất cả nguyên tử Có nguyên tử hydro
2 Mq15 Tất cả nguyên tử Khối lượng phân tử Khối lượng phân tử Ý nghĩa Chỉ số bậc 2 Chỉ số bậc 2 Không có nguyên tử hydro Đếm bước: 13 Đếm bước: 15 Không ngẫu nhiên Không ngẫu nhiên
3 KEq5 Nguyên tử ngoại lai
4 KEq11 Nguyên tử ngoại lai
5 Mqh1s Tất cả nguyên tử Không có nguyên tử hydro Không có nguyên tử hydro Có nguyên tử hydro Không ngẫu nhiên Không ngẫu nhiên Ngẫu nhiên
6 Mqh4s Tất cả nguyên tử Có nguyên tử hydro Ngẫu nhiên
7 Mqh6s Tất cả nguyên tử Có nguyên tử hydro Ngẫu nhiên
8 MHq4s Ngẫu nhiên
9 MHq5s Không có nguyên tử hydro Có nguyên tử hydro Ngẫu nhiên
10 MHq8s Có nguyên tử hydro Ngẫu nhiên
11 KEqh2s Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai liên kết với hydro Nguyên tử ngoại lai Có nguyên tử hydro Ngẫu nhiên
12 KEqh9s Nguyên tử ngoại lai Có nguyên tử hydro Ngẫu nhiên
13 KEq14s Nguyên tử ngoại lai Ngẫu nhiên
14 GEqh3s Nguyên tử ngoại lai Không có nguyên tử hydro Có nguyên tử hydro Ngẫu nhiên Độ âm điện Muliken Độ âm điện Muliken Khối lượng phân tử Khối lượng phân tử Khối lượng phân tử Khối lượng phân tử Khối lượng phân tử Khối lượng phân tử Độ âm điện Muliken Độ âm điện Muliken Độ âm điện Muliken Độ âm điện Paulin Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Chỉ số bậc 2 Đếm bước: 5 Đếm bước: 11 Đếm bước: 1 Đếm bước: 4 Đếm bước: 6 Đếm bước: 4 Đếm bước: 5 Đếm bước: 8 Đếm bước: 2 Đếm bước: 9 Đếm bước: 14 Đếm bước: 3
Phụ lục 3.a: Kết quả các tham số phân tử sử dụng trong QSAR phân loại
VEqh1 VHq2
KEq2
GEq11
KEqh3s
KEqh8s
KEq0s
Số đăng ký
VHq1 4
PHq 5
PHq1 5
MHq1 s
120.16 146.86 173.57 213.62 106.81
3920.86 4152.19 5442.34 6809.59 3766.62 851.19 1032.11 1367.25 3069.65 3069.65 2888.74 1367.25 1960.42 2734.51 4255.99 3947.54 2064.23 4255.99 1702.39 1367.25 516.05 4128.46 4128.46 3947.54 1702.39
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
334.03 344.06 410.82 654.79 367.37 126.96 187.08 243.81 253.84 253.84 240.49 113.52 160.30 200.35 404.19 347.22 173.65 387.52 250.52 243.80 93.54 734.74 734.74 420.69 126.88
1083185.92 595335.51 595548.69 1245847.11 744111.07 992198.27 4206578.88 2053367.30 537386.37 537386.37 536833.74 295432.18 137009.86 138123.91 1615078.65 314976.20 138106.36 850949.05 1221374.03 2085946.51 786199.27 3808546.01 3646141.20 588241.54 55403.95
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
100.02 118.97 131.05 155.17 80.56 19.48 17.68 27.04 76.36 76.36 82.49 31.25 61.86 68.83 104.75 76.52 36.70 102.13 37.19 27.02 10.03 81.13 81.50 75.84 45.28
Dự đoán InA InA InA InA InA 26.70 Act 26.70 Act 40.05 Act InA 93.46 InA 93.46 InA 93.46 InA 40.05 InA 66.75 InA 80.11 InA 133.51 InA 106.81 InA 53.40 InA 133.51 53.40 Act 40.05 Act 13.35 Act InA InA InA InA
106.81 106.81 106.81 53.40
VNPD_ID1 VNPD_ID7 VNPD_ID25 VNPD_ID27 VNPD_ID28 VNPD_ID38 VNPD_ID45 VNPD_ID46 VNPD_ID53 VNPD_ID54 VNPD_ID55 VNPD_ID90 VNPD_ID112 VNPD_ID120 VNPD_ID167 VNPD_ID173 VNPD_ID176 VNPD_ID181 VNPD_ID183 VNPD_ID184 VNPD_ID194 VNPD_ID230 VNPD_ID232 VNPD_ID237 VNPD_ID240
104.49 123.65 146.10 169.99 94.39 20.48 21.51 34.27 83.77 83.77 85.47 36.42 67.60 77.54 110.59 99.98 47.63 111.10 40.67 34.24 11.21 90.33 90.09 101.38 52.33
537377.60 1678858.43 2370315.01 138676.55 639733.19 745742.81 953823.42 1243720.48 896665.07 2369753.60 2238180.62 99518.34 1651350.16 1080451.30 1626129.97 266388.10 1937142.05 996929.03 265256.51 265256.51 1649843.85 490597.77 137009.87 887704.14 1367972.62 765632.99 765080.36
2734.51 6293.54 3250.57 2915.43 1032.12 1032.12 1367.26 1032.12 1367.26 2734.51 7298.97 335.14 6166.00 5985.09 5442.34 3766.63 6139.31 2734.51 2399.37 2399.37 851.20 670.28 2037.54 4256.00 4745.37 4256.00 4075.08
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
240.49 618.05 287.26 213.70 183.68 183.68 217.10 183.68 207.07 260.55 775.12 33.41 711.36 651.23 584.47 273.83 644.76 230.45 207.07 207.07 126.96 66.83 160.30 467.63 484.38 471.02 457.67
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
61.73 156.58 69.34 62.70 21.53 19.32 27.66 17.24 26.72 60.84 187.72 9.36 121.67 122.22 145.29 81.72 135.59 62.47 50.09 50.09 18.72 18.48 66.46 101.96 139.37 99.18 105.31
70.41 165.21 79.86 75.84 23.38 22.80 32.80 23.81 32.01 68.22 193.62 8.43 150.77 150.03 158.61 96.83 149.81 71.26 60.18 60.18 18.73 15.87 67.61 113.53 136.23 115.39 117.10
InA 80.11 InA 200.28 InA 93.46 80.11 InA 26.70 Act 26.70 Act 40.06 Act 26.70 Act 40.06 Act InA 80.11 InA 240.33 InA 13.35 InA 173.57 InA 173.57 InA 173.57 InA 106.81 InA 186.92 InA 80.11 InA 66.76 66.76 InA 26.70 Act InA 26.70 InA 66.76 InA 133.52 InA 160.22 InA 133.52 InA 133.52
VNPD_ID248 VNPD_ID249 VNPD_ID250 VNPD_ID260 VNPD_ID291 VNPD_ID297 VNPD_ID298 VNPD_ID313 VNPD_ID314 VNPD_ID323 VNPD_ID324 VNPD_ID337 VNPD_ID340 VNPD_ID341 VNPD_ID343 VNPD_ID347 VNPD_ID348 VNPD_ID358 VNPD_ID366 VNPD_ID369 VNPD_ID395 VNPD_ID412 VNPD_ID419 VNPD_ID442 VNPD_ID451 VNPD_ID462 VNPD_ID463
133.52 160.22 146.87 146.87 120.17 146.87 160.22
13.35 80.11
4075.08 5107.20 4410.22 4410.22 3739.94 4772.06 5288.11 1032.12 5469.03 8331.08 335.14 2915.43 3766.63 2580.29 2553.60 2372.68 4772.06 2553.60 4410.22 516.06 5777.48 5469.03 3223.88 6216.43 5469.03 2526.91 4229.31
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
420.94 584.56 434.29 464.39 394.16 461.00 527.83 183.69 581.16 952.17 33.42 367.29 313.97 450.88 247.21 193.72 484.30 237.17 434.29 93.54 651.40 654.64 367.45 644.76 614.50 146.95 337.27
1488024.74 2793216.88 1233986.41 3673028.59 970680.25 668316.42 3982651.78 522846.29 6105169.93 5273928.78 145132.74 499030.31 2626003.15 3023907.85 1932322.48 491389.90 806826.30 2494809.43 1488033.51 752514.79 1854733.48 3461984.25 970118.84 1281324.63 1009562.84 49881.51 509289.94
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
106.47 129.19 129.80 123.06 94.99 107.60 117.06 22.28 109.85 217.13 9.78 49.73 82.96 50.10 71.52 75.36 107.82 68.41 121.10 9.53 140.78 118.92 86.49 154.19 119.51 94.44 145.00
109.96 136.57 129.80 123.74 104.27 118.32 126.15 22.39 129.54 219.35 7.57 80.04 95.50 57.13 69.58 74.46 129.02 69.97 123.31 13.28 145.59 126.76 92.62 166.94 141.98 87.05 143.31
InA InA InA InA InA InA InA 26.70 Act InA 160.22 267.03 Act InA InA 106.81 Act 66.76 Act InA 80.11 InA 80.11 InA 146.87 InA 80.11 InA 146.87 13.35 Act InA 186.92 InA 160.22 InA 106.81 200.28 InA 160.22 Act 93.46 Act 146.87 Act
VNPD_ID465 VNPD_ID467 VNPD_ID493 VNPD_ID495 VNPD_ID517 VNPD_ID528 VNPD_ID571 VNPD_ID577 VNPD_ID579 VNPD_ID580 VNPD_ID582 VNPD_ID587 VNPD_ID615 VNPD_ID616 VNPD_ID625 VNPD_ID627 VNPD_ID637 VNPD_ID644 VNPD_ID646 VNPD_ID648 VNPD_ID651 VNPD_ID653 VNPD_ID661 VNPD_ID664 VNPD_ID699 VNPD_ID722 VNPD_ID723
516.06 3250.57 1856.63 670.28 2372.68 6474.46 4256.00 5107.20 2372.68 6293.54 4128.46 3069.66 2399.37 4745.37 6628.68 6628.68 4926.28 5931.71 1702.40 3894.17 2218.46 4410.22 2707.83 6112.62 6112.62 7144.74 4410.22
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
93.54 257.16 190.32 56.81 173.65 668.15 447.56 474.35 263.96 654.80 327.24 233.78 230.38 477.75 698.25 698.25 491.10 611.42 190.32 380.89 203.75 464.39 247.21 671.55 671.55 835.17 464.39
1445432.62 997490.44 204659.53 277853.10 137018.64 2013541.01 697974.56 1489147.55 760934.81 1330693.45 1213360.58 1203737.70 871428.02 3673037.37 4354956.61 4200446.40 3673590.00 1864302.74 205203.40 1372092.99 996367.62 2860858.08 2368657.10 4354395.21 4345414.23 5714172.37 3673028.59
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
9.39 71.88 61.42 17.81 81.09 151.32 95.53 123.47 60.49 158.79 70.13 78.17 50.40 137.69 173.17 173.12 131.56 158.17 40.66 111.80 54.89 119.47 87.73 164.67 164.24 186.23 123.06
11.02 83.15 66.60 16.25 80.96 163.21 111.83 133.25 61.24 167.09 92.39 84.69 58.25 137.09 178.23 178.45 135.39 161.53 51.55 112.89 59.86 120.27 84.98 166.58 166.87 192.81 123.74
13.35 Act InA 93.46 InA 66.76 InA 26.70 InA 80.11 InA 200.28 InA 133.52 InA 160.22 InA 80.11 InA 200.28 InA 106.81 InA 93.46 InA 66.76 InA 160.22 InA 213.63 InA 213.63 InA 160.22 InA 200.28 InA 53.41 InA 133.52 InA 66.76 InA 146.87 93.46 Act InA 200.28 InA 200.28 226.98 InA 146.87 Act
VNPD_ID725 VNPD_ID735 VNPD_ID761 VNPD_ID766 VNPD_ID770 VNPD_ID791 VNPD_ID797 VNPD_ID798 VNPD_ID799 VNPD_ID825 VNPD_ID855 VNPD_ID856 VNPD_ID861 VNPD_ID868 VNPD_ID869 VNPD_ID870 VNPD_ID871 VNPD_ID875 VNPD_ID880 VNPD_ID882 VNPD_ID883 VNPD_ID887 VNPD_ID889 VNPD_ID890 VNPD_ID892 VNPD_ID893 VNPD_ID894
5777.48 6112.62 7479.88 6112.62 4410.22 2372.68 4075.08 3378.11 2734.51 1548.17 1548.17 1548.17 2372.68 1186.34 1032.12 1032.12 516.06 4410.22 6112.62 5107.19 4410.22 3713.25 4229.30 1702.39 2037.54 1856.62 3894.16
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
648.16 671.55 825.21 671.55 464.39 193.72 320.60 280.55 230.46 267.20 267.20 267.20 203.75 150.35 183.69 183.69 93.54 424.26 631.41 517.72 471.02 380.80 364.13 190.32 203.67 146.94 350.78
4015608.73 4199884.99 4550266.78 4085944.56 3673028.59 491389.90 945604.06 944490.01 996929.03 3761684.24 3513991.17 3761684.24 995823.76 2328060.66 805909.96 805909.96 1094008.75 756369.76 1280771 822396 1367963 580937 513296 870313 293300 478951 513287
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
151.76 164.62 187.42 160.59 123.06 75.68 121.06 118.69 63.38 24.55 25.04 24.55 75.64 26.29 21.51 21.51 9.17 123.35 164.91 116.63 124.73 112.20 131.87 45.55 59.08 66.64 117.24
153.06 166.80 194.73 162.81 123.74 74.88 125.90 115.96 71.50 33.38 32.56 33.38 74.92 28.64 22.64 22.64 13.60 125.59 168.64 131.51 122.87 117.92 132.28 53.43 70.25 64.94 118.93
InA 186.92 InA 200.28 InA 240.33 InA 200.28 InA 146.87 InA 80.11 InA 133.52 InA 120.17 InA 80.11 40.06 Act 40.06 Act 40.06 Act 80.11 Act 40.06 InA 26.70 Act 26.70 Act 13.35 Act InA InA InA InA InA InA InA InA InA InA
146.87 200.27 160.22 146.86 133.51 146.86 53.40 66.75 66.75 133.51
VNPD_ID896 VNPD_ID898 VNPD_ID899 VNPD_ID900 VNPD_ID901 VNPD_ID911 VNPD_ID912 VNPD_ID913 VNPD_ID916 VNPD_ID921 VNPD_ID922 VNPD_ID923 VNPD_ID929 VNPD_ID935 VNPD_ID938 VNPD_ID940 VNPD_ID943 VNPD_ID948 VNPD_ID950 VNPD_ID952 VNPD_ID961 VNPD_ID964 VNPD_ID966 VNPD_ID974 VNPD_ID975 VNPD_ID992 VNPD_ID1021
1032.11 851.19 5080.50 5080.50 6112.62 3559.02 6809.59 3069.65 2372.68 3069.65 5261.42 3250.57 4410.22 4410.22 1005.42 3069.65 5777.48 6447.76 1186.34 3920.85 1032.11 516.05 1032.11 335.14 1883.31 2218.45 516.05
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
183.68 116.92 561.33 561.33 671.54 380.80 711.60 273.91 233.856 273.91 604.62 287.26 454.36 444.32 40.05 273.91 628.09 684.89 163.61 434.21 183.68 93.5424 187.08 33.41 140.23 217.02 93.54
639794 1566778 2473787 2882248 4199884 970127 4200999 2369762 2368648 2369762 4638087 2625441 3593743 3596169 26.31 2369762 2135679 4199893 204641 1363076 745795 1137237 3203544 145132 55956 205764 759970
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
21.53 17.83 133.59 133.07 164.64 101.11 167.01 75.46 73.09 75.46 147.92 74.45 128.85 127.58 43.88 75.46 148.55 179.25 32.16 88.27 19.31 9.79 18.96 9.78 39.15 49.15 9.21
23.35 17.30 136.50 137.17 166.67 105.97 176.61 81.56 71.62 81.56 149.39 83.85 127.52 127.29 40.05 81.56 153.01 180.15 39.89 95.24 22.80 10.67 21.02 7.57 50.63 63.19 14.50
26.70 Act 26.70 Act InA 173.57 InA 173.57 InA 200.27 InA 120.16 InA 213.62 93.46 InA 80.11 Act InA 93.46 InA 173.57 InA 93.46 146.86 Act InA 146.86 InA 40.05 InA 93.46 InA 186.92 InA 213.62 InA 40.05 InA 120.16 26.70 Act 13.35 Act 26.70 Act InA 13.35 InA 53.40 66.75 InA 13.35 Act
VNPD_ID1022 VNPD_ID1023 VNPD_ID1027 VNPD_ID1028 VNPD_ID1031 VNPD_ID1038 VNPD_ID1056 VNPD_ID1057 VNPD_ID1157 VNPD_ID1158 VNPD_ID1159 VNPD_ID1163 VNPD_ID1166 VNPD_ID1167 VNPD_ID1177 VNPD_ID1178 VNPD_ID1179 VNPD_ID1188 VNPD_ID1193 VNPD_ID1220 VNPD_ID1237 VNPD_ID1256 VNPD_ID1257 VNPD_ID1261 VNPD_ID1272 VNPD_ID1277 VNPD_ID1285
146.86 146.86 80.11 173.57 53.40 40.05 186.92 133.51 186.92
1032.11 4591.14 4591.14 3096.34 5442.34 1702.39 1367.25 5492.76 3894.16 5596.56 1032.11 516.05 2372.68 335.14
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0
183.68 427.57 437.61 287.26 628.01 190.32 113.52 547.98 380.88 578.00 183.68 93.54 263.95 33.41
640057 825738 1695386 594290 4740552 205203 55395 1686539 1372092 1906974 639733 503618 760934 145132
0 0 0 0 0 0 0 0 0 0 0 0 0 0
21.53 117.36 117.09 59.05 145.25 40.66 30.65 156.46 111.79 152.19 21.53 10.92 60.50 9.78
23.35 123.73 121.32 64.09 150.61 51.54 38.98 155.29 112.88 155.73 23.35 10.46 61.30 7.57
26.70 Act InA InA InA InA InA InA InA InA InA 26.70 Act 13.35 Act InA 80.11 InA 13.35
VNPD_ID1286 VNPD_ID1290 VNPD_ID1291 VNPD_ID1292 VNPD_ID1306 VNPD_ID1333 VNPD_ID1334 VNPD_ID1346 VNPD_ID1347 VNPD_ID1353 VNPD_ID1359 VNPD_ID1365 VNPD_ID1376 VNPD_ID1277
Phụ lục 3.b: Kết quả các tham số phân tử sử dụng cho QSAR hoạt tính
Mqh13
Mq15
KEq5
KEq11 Mqh1s Mqh4s
Mqh6s MHq4s MHq5s MHq8s KEqh2s
KEqh9s KEq14s GEqh3s
Số đăng ký
Dự đoán
131685078
74088271
712.08
56841
2825.65
3372.32
3360.76
88.77
94.27
87.51
79.43 S
VNPD_ID38
0
0
0
373453496
1193264631
2377.55
581442
4400.03
5280.82
5273.15
144.71
149.12
146.16
122.24 S
VNPD_ID45
0
0
0
1533293874
12378636791
4138.51
2699307
2548.92
3448.42
3442.58
0
0
72.61
73.17
70.24
62.20 S
VNPD_ID46
0
1533320515
12378637176
4148.54
2699317
2837.14
3643.92
3638.08
0
0
85.96
87.80
83.59
74.45 S
VNPD_ID395
0
1162052157
6273089776
2197.42
1139077
2683.94
3388.09
3384.54
0
0
76.25
75.54
75.62
63.79 S
VNPD_ID184
0
10620049931
26758296968
2056.95
731761
3961.26
4437.93
4377.85
0
0
24.57
22.21
22.26
18.10 S
VNPD_ID889
0
2909158858
17909224772
7621.09
4183298
4097.22
5100.51
5099.83
128.32
125.75
116.45
104.67 S
VNPD_ID291
0
0
0
2836022685
17744905691
7283.66
4093242
4232.24
5130.62
5119.54
130.70
131.62
122.00
109.38 S
VNPD_ID297
0
0
0
14987773481
58863895874
2087.05
1134929
3760.13
4172.67
4120.28
0
0
20.97
16.41
14.65
16.40 S
VNPD_ID298
0
16626229863
72510013454
4307.45
4804225
3574.19
3831.24
3812.51
0
0
22.46
21.69
22.19
15.10 S
VNPD_ID313
0
13092624188
47121046803
4033.62
2348752
3951.36
4390.86
4330.74
0
0
34.71
26.26
29.96
23.06 S
VNPD_ID314
0
9756695042
18365704529
3468.33
1396777
6055.01
6544.12
6462.95
0
0
44.29
36.52
42.34
31.40 W
VNPD_ID194
0
12606146239
39484602362
4053.69
2386017
4053.81
4494.19
4422.95
0
0
34.71
27.00
30.83
23.05 S
VNPD_ID577
0
10145561706
24822910898
1485.01
899297
3437.80
3800.14
3746.21
0
0
10.96
10.06
10.04
8.48 W
VNPD_ID580
0
9777906029
26758296968
2056.95
731761
3982.16
4452.97
4393.05
0
0
24.57
22.24
22.26
18.10 S
VNPD_ID894
0
8861068916
16429060102
2187.39
853021
5148.81
5413.57
5380.36
0
0
24.11
20.52
26.04
16.36 S
VNPD_ID921
0
11845020449
29142532582
2849.62
1091034
5343.80
5787.69
5733.84
0
0
34.22
28.29
33.56
23.43 S
VNPD_ID648
0
12098154429
30964150331
2859.66
1422634
4377.65
5366.84
5318.38
0
0
23.56
18.05
23.55
14.79 S
VNPD_ID923
0
12529630471
28194141940
2689.08
1025654
6778.03
7236.51
7183.31
0
0
34.84
27.42
33.18
22.72 S
VNPD_ID722
0
8460353217
24620320777
2384.51
1884905
3467.66
3713.94
3690.83
0
0
21.25
18.73
18.94
15.76 S
VNPD_ID723
0
9525594734
20294261923
1836.20
598060
3858.81
4201.60
4179.36
0
0
24.75
22.96
22.48
18.66 S
VNPD_ID725
0
0
0
0
5482676829
22758157933
14086.49
6008624
7485.25
8573.54
8542.75
228.88
223.20
208.35
184.51 W
VNPD_ID610
10787512983
44417106573
6501.96
4110534
3985.05
4373.73
4315.56
0
0
73.75
61.60
63.02
50.29 W
VNPD_ID616
0
9374403388
30845147647
6294.48
3456660
3831.85
4116.98
4076.84
0
0
60.29
55.19
55.85
42.41 W
VNPD_ID1022
0
9088766776
17679132586
1685.69
860767
3540.24
3906.57
3861.21
0
0
10.81
9.93
11.31
8.13 S
VNPD_ID922
0
8115827494
21497708815
2337.89
983494
3234.24
3488.52
3453.79
29.67
26.25
25.12 W
VNPD_ID691
0
0
35.56
0
20527387875
81392843648
1725.83
1653363
3384.49
3639.04
3634.14
0
0
11.82
9.56
8.72
7.95 S
VNPD_ID929
0
10254377398
46529267021
5267.47
4298340
2945.79
3185.11
3152.75
0
0
34.89
28.43
30.60
21.22 S
VNPD_ID938
0
10109370857
44775836172
5006.59
4014868
2945.79
3207.34
3176.37
0
0
35.04
29.12
30.56
21.55 S
VNPD_ID940
0
10254377398
46529267021
5267.47
4298340
2945.79
3185.11
3152.75
0
0
34.89
28.43
30.60
21.22 S
VNPD_ID943
0
10563405602
27705137299
2097.08
921843
3982.15
4427.01
4376.85
0
0
24.57
21.74
19.81
18.08 S
VNPD_ID1166
0
11668490781
30097541263
2097.08
921843
4003.05
4445.83
4398.53
0
0
24.57
21.74
19.76
18.08 S
VNPD_ID1023
0
12952167120
35321509200
1765.96
1251386
3562.95
3936.29
3903.61
0
0
11.69
9.72
9.78
7.83 S
VNPD_ID1157
0
10853746070
27919918470
2056.95
731831
3961.25
4404.70
4360.32
0
0
24.57
22.21
22.24
18.10 W
VNPD_ID183
0
8046722520
32881762267
2107.12
1791351
1868.28
2067.34
2075.11
0
0
21.88
19.19
16.90
15.09 S
VNPD_ID1237
0
9109233974
16832538718
2187.39
853081
5251.25
5547.39
5513.71
0
0
24.11
20.52
26.01
16.36 S
VNPD_ID1256
0
8758505004
22844311402
1685.69
1300833
3396.00
3657.98
3632.82
0
0
10.96
10.32
11.34
8.28 S
VNPD_ID1257
0
10864877386
40850307413
3865.96
3657304
3653.92
3917.76
3890.38
0
0
21.77
21.52
22.86
16.09 S
VNPD_ID1285
0
11636676456
30200099420
1685.69
869296
3521.16
3950.56
3915.20
0
0
11.69
10.24
10.34
7.87 S
VNPD_ID1286
0
10663164059
27610612228
2056.95
732132
3961.25
4457.91
4404.77
0
0
24.57
22.20
22.29
18.10 S
VNPD_ID1359
0
9824639912
2165445877
1244.20
576065
3437.80
3707.88
3692.81
0
0
11.19
10.17
9.64
9.15 S
VNPD_ID1365
0
Phụ lục 4: Kết quả của quá trình sàng lọc qua phễu lọc mô hình QSAR
Xếp hạng Phân Hoạt STT Số đăng ký Tc độ tương đồng tính loại
1 VNPD_ID992 2 VNPD_ID1277 3 VNPD_ID880 4 VNPD_ID1333 5 VNPD_ID167 6 VNPD_ID1 7 VNPD_ID297 8 VNPD_ID1237 9 VNPD_ID798 10 VNPD_ID869 11 VNPD_ID975 12 VNPD_ID240 13 VNPD_ID577 14 VNPD_ID343 15 VNPD_ID664 16 VNPD_ID825 17 VNPD_ID870 18 VNPD_ID871 19 VNPD_ID1291 20 VNPD_ID1376 21 VNPD_ID938 22 VNPD_ID1257 23 VNPD_ID791 24 VNPD_ID1056 25 VNPD_ID1290 26 VNPD_ID587 27 VNPD_ID974 28 VNPD_ID1256 29 VNPD_ID1365 30 VNPD_ID517 31 VNPD_ID890 32 VNPD_ID900 33 VNPD_ID1179 34 VNPD_ID1220 35 VNPD_ID1272 36 VNPD_ID571 37 VNPD_ID913 38 VNPD_ID395 39 VNPD_ID722 40 VNPD_ID340 0.966666667 0.916666667 0.913043478 0.913043478 0.904761905 0.9 0.894736842 0.894736842 0.88372093 0.88372093 0.88 0.875 0.868421053 0.860465116 0.860465116 0.860465116 0.860465116 0.860465116 0.860465116 0.857142857 0.842105263 0.842105263 0.840909091 0.840909091 0.840909091 0.84 0.84 0.837837838 0.837837838 0.837209302 0.837209302 0.837209302 0.837209302 0.837209302 0.833333333 0.829787234 0.828571429 0.825 0.825 0.822222222 1 2 3 3 4 5 6 6 7 7 8 9 10 11 11 11 11 11 11 12 13 13 14 14 14 15 15 16 16 17 17 17 17 17 18 19 20 21 21 22 InA InA InA InA InA InA Act Act InA InA InA InA Act InA InA InA InA InA InA InA Act Act InA InA InA InA InA Act Act InA InA InA InA InA InA InA InA Act Act InA - - - - - - S S - - - - S - - - - - - - S S - - - - - S S - - - - - - - - S S -
41 VNPD_ID341 42 VNPD_ID580 43 VNPD_ID53 44 VNPD_ID181 45 VNPD_ID462 46 VNPD_ID653 47 VNPD_ID875 48 VNPD_ID892 49 VNPD_ID45 50 VNPD_ID291 51 VNPD_ID1286 52 VNPD_ID1359 53 VNPD_ID495 54 VNPD_ID646 55 VNPD_ID868 56 VNPD_ID887 57 VNPD_ID894 58 VNPD_ID898 59 VNPD_ID901 60 VNPD_ID929 61 VNPD_ID948 62 VNPD_ID950 63 VNPD_ID1031 64 VNPD_ID1188 65 VNPD_ID314 66 VNPD_ID528 67 VNPD_ID579 68 VNPD_ID799 69 VNPD_ID249 70 VNPD_ID442 71 VNPD_ID7 72 VNPD_ID38 73 VNPD_ID90 74 VNPD_ID1023 75 VNPD_ID1353 76 VNPD_ID324 77 VNPD_ID463 78 VNPD_ID248 79 VNPD_ID723 80 VNPD_ID313 81 VNPD_ID323 82 VNPD_ID940 83 VNPD_ID1022 84 VNPD_ID1057 0.822222222 0.822222222 0.820512821 0.818181818 0.818181818 0.818181818 0.818181818 0.818181818 0.815789474 0.815789474 0.815789474 0.815789474 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.813953488 0.80952381 0.808510638 0.808510638 0.804878049 0.804347826 0.804347826 0.8 0.8 0.8 0.8 0.8 0.795454545 0.795454545 0.794871795 0.794871795 0.794871795 0.794871795 0.794871795 0.794871795 0.794871795 22 22 23 24 24 24 24 24 25 25 25 25 26 26 26 26 26 26 26 26 26 26 26 26 27 28 28 29 30 30 31 31 31 31 31 32 32 33 33 33 33 33 33 33 InA Act InA InA InA InA InA InA Act Act Act Act InA InA InA InA Act InA InA Act InA InA InA InA Act InA InA InA InA InA InA Act InA Act InA InA InA InA Act Act InA Act Act InA - W - - - - - - S S S S - - - - S - - S - - - - S - - - - - - S - S - - - - S S - S S -
85 VNPD_ID1178 86 VNPD_ID176 87 VNPD_ID465 88 VNPD_ID797 89 VNPD_ID1159 90 VNPD_ID1346 91 VNPD_ID112 92 VNPD_ID260 93 VNPD_ID627 94 VNPD_ID644 95 VNPD_ID725 96 VNPD_ID911 97 VNPD_ID25 98 VNPD_ID348 99 VNPD_ID1193 100 VNPD_ID1334 101 VNPD_ID347 102 VNPD_ID896 103 VNPD_ID1167 104 VNPD_ID28 105 VNPD_ID952 106 VNPD_ID54 107 VNPD_ID55 108 VNPD_ID889 109 VNPD_ID250 110 VNPD_ID358 111 VNPD_ID366 112 VNPD_ID369 113 VNPD_ID582 114 VNPD_ID610 115 VNPD_ID735 116 VNPD_ID856 117 VNPD_ID916 118 VNPD_ID1158 119 VNPD_ID1163 120 VNPD_ID1261 121 VNPD_ID1277 122 VNPD_ID637 123 VNPD_ID651 124 VNPD_ID935 125 VNPD_ID27 126 VNPD_ID899 127 VNPD_ID120 128 VNPD_ID861 0.794871795 0.791666667 0.790697674 0.790697674 0.790697674 0.790697674 0.783783784 0.783783784 0.783783784 0.783783784 0.783783784 0.783783784 0.782608696 0.782608696 0.782608696 0.782608696 0.780487805 0.780487805 0.777777778 0.775510204 0.775510204 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.775 0.772727273 0.772727273 0.772727273 0.770833333 0.770833333 0.769230769 0.769230769 33 34 35 35 35 35 35 35 35 35 35 35 36 36 36 36 37 37 38 39 39 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 41 41 41 42 42 43 43 InA InA InA InA InA InA InA InA InA InA Act InA InA InA InA InA InA InA InA InA InA InA InA Act InA InA InA InA InA InA InA InA InA InA InA InA InA InA InA InA InA InA InA InA - - - - - - - - - - S - - - - - - - - - - - - S - - - - - - - - - - - - - - - - - - - -
129 VNPD_ID883 130 VNPD_ID183 131 VNPD_ID230 132 VNPD_ID232 133 VNPD_ID298 134 VNPD_ID616 135 VNPD_ID661 136 VNPD_ID766 137 VNPD_ID855 138 VNPD_ID882 139 VNPD_ID921 140 VNPD_ID922 141 VNPD_ID923 142 VNPD_ID964 143 VNPD_ID966 144 VNPD_ID1021 145 VNPD_ID1038 146 VNPD_ID1292 147 VNPD_ID1347 148 VNPD_ID893 149 VNPD_ID1157 150 VNPD_ID419 151 VNPD_ID625 152 VNPD_ID648 153 VNPD_ID770 154 VNPD_ID912 155 VNPD_ID943 156 VNPD_ID46 157 VNPD_ID184 158 VNPD_ID412 159 VNPD_ID691 160 VNPD_ID451 161 VNPD_ID961 162 VNPD_ID761 163 VNPD_ID1177 164 VNPD_ID194 165 VNPD_ID1285 166 VNPD_ID173 167 VNPD_ID237 168 VNPD_ID337 169 VNPD_ID493 170 VNPD_ID1027 171 VNPD_ID1028 172 VNPD_ID467 0.769230769 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.76744186 0.765957447 0.763157895 0.763157895 0.763157895 0.763157895 0.763157895 0.763157895 0.763157895 0.761904762 0.761904762 0.761904762 0.761904762 0.760869565 0.760869565 0.76 0.75862069 0.756756757 0.756756757 0.756097561 0.756097561 0.756097561 0.756097561 0.756097561 0.756097561 0.755555556 43 44 44 44 44 44 44 44 44 44 44 44 44 44 44 44 44 44 44 45 46 46 46 46 46 46 46 47 47 47 47 48 48 49 50 51 51 52 52 52 52 52 52 53 InA Act InA InA Act Act InA InA InA InA Act Act Act InA InA InA InA InA InA InA Act InA InA Act InA InA Act Act Act InA InA InA InA InA InA Act Act InA InA InA InA InA InA InA - W - - S W - - - - S S S - - - - - - - S - - S - - S S S - - - - - - W S - - - - - - -
173 VNPD_ID1306 174 VNPD_ID1166 0.755555556 0.755555556 53 53 InA Act - S
Trong đó, Act: có hoạt tính ức chế tyrosinase; InA: không có hoạt tính ức chế tyrosinase; S: hoạt tính ức chế tyrosinase mạnh; W: hoạt tính ức chế tyrosinase yếu
Phụ lục 5: Mô phỏng cấu dạng docking và năng lượng liên kết (Kcal/mol) của 34
hợp chất với trung tâm hoạt động của enzym tyrosinase
1.VNPD_ID722 ΔG = -8,6404 2.VNPD_ID723 ΔG = -8,5137
3.VNPD_ID1157 ΔG = -7,230 4.VNPD_ID889 ΔG = -8,5998
5.VNPD_ID929 ΔG = -8,7921 6.VNPD_ID1359 ΔG = -4,9933
7.VNPD_ID894 ΔG = -8,7538 8.VNPD_ID1166 ΔG = -8,1534
9.VNPD_ID38 ΔG = -5,2493 10.VNPD_ID45 ΔG = -5,8310
11.VNPD_ID46 ΔG = -5,3657 12.VNPD_ID184 ΔG = -5,8818
13.VNPD_ID291 ΔG = -5,4977 14.VNPD_ID297 ΔG = -7,9121
15.VNPD_ID298 ΔG = -6,9306 16.VNPD_ID313 ΔG = -5,9711
17.VNPD_ID314 ΔG = -8,6825 18.VNPD_ID395 ΔG = -6,3335
19.VNPD_ID577 ΔG = -6,4105 20.VNPD_ID648 ΔG = -4,9127
21.VNPD_ID725 ΔG = -5,7037 22.VNPD_ID921 ΔG = -5,4323
23.VNPD_ID922 ΔG = -6,2830 24.VNPD_ID923 ΔG = -5,3499
25.VNPD_ID938 ΔG = -5,7722 26.VNPD_ID940 ΔG = -5,8188
27.VNPD_ID943 ΔG = -4,3292 28.VNPD_ID1023 ΔG = -3,8160
29.VNPD_ID1237 ΔG = -7,7862 30.VNPD_ID1256 ΔG = -5,6756
31.VNPD_ID1257 ΔG = -6,3540 32.VNPD_ID1285 ΔG = -4,5574
33.VNPD_ID1286 ΔG = -5,4154 34.VNPD_ID1365 ΔG = -5,2966