Khóa luận tốt nghiệp Đại học ngành Dược học: Xây dựng mô hình toán học giúp nhận biết chất ức chế enzym histon deacetylase 2 có tác dụng chống ung thư

ĐẠI HỌC QUỐC GIA HÀ NỘI

KHOA Y DƢỢC

NGUYỄN THỊ HIỀN

XÂY DỰNG MÔ HÌNH TOÁN HỌC

GIÚP NHẬN BIẾT CHẤT ỨC CHẾ

ENZYM HISTON DEACETYLASE 2

CÓ TÁC DỤNG CHỐNG UNG THƢ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC

Hà Nội – 2017

ĐẠI HỌC QUỐC GIA HÀ NỘI

KHOA Y DƢỢC

Người thực hiện: NGUYỄN THỊ HIỀN

XÂY DỰNG MÔ HÌNH TOÁN HỌC

GIÚP NHẬN BIẾT CHẤT ỨC CHẾ

ENZYM HISTON DEACETYLASE 2

CÓ TÁC DỤNG CHỐNG UNG THƢ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC

Khóa: QH.2012.Y

Người hướng dẫn: 1. TS. LÊ THỊ THU HƢỜNG

2. TS. PHẠM THẾ HẢI

Hà Nội - 2017

LỜI CẢM ƠN

Trước hết, tôi xin tỏ lòng biết ơn sâu sắc và gửi lời cảm ơn chân thành tới TS. Lê Thị Thu Hường, công tác tại bộ môn Dược liệu và Dược học cổ truyền - khoa Y Dược Trường Đại học Quốc gia Hà Nội là người thầy tận tình chỉ bảo, động viên, hướng dẫn để tôi hoàn thành luận văn.

Tôi xin chân thành cảm ơn TS.Phạm Thế Hải công tác tại Trường Đại học Dược Hà Nội đã chỉ bảo tận tình cho tôi từ những bước đi ban đầu khi nhận đề tài.

Bên cạnh đó, tôi cũng xin gửi lời cảm ơn tới lãnh đạo, thầy cô Khoa Y Dược, Đại học Quốc gia Hà Nội đã giúp đỡ, tạo điều kiện để tôi được làm khóa luận, được học tập, nghiên cứu, rèn luyện tại Khoa suốt 5 năm học qua.

Sau cùng, tôi xin bày tỏ lòng biết ơn sâu sắc tới gia đình, anh chị em và bạn bè luôn sát cánh, đồng hành, ủng hộ động viên tôi trong quá tình học tập, nghiên cứu hoàn thành luận văn.

Dù đã rất cố gắng nhưng kiến thức, kỹ năng và thời gian thực hiện còn hạn hẹp, tôi khó tránh khỏi những thiếu sót. Tôi rất mong nhận được những ý kiến đóng góp của các thầy cô để khóa luận của tôi được hoàn thiện hơn.

Tôi xin chân thành cảm ơn.

Hà Nội, Ngày 8 tháng 6 năm 2017

Sinh Viên

Nguyễn Thị Hiền

DANH MỤC KÝ HIỆU VIẾT TẮT

Tên viết tắt Tên Tiếng Anh Tên Tiếng Việt

Cơ sở dữ liệu CSDL

FDA

Food and Drug Administation

Cơ quan Quản lý Thực phẩm và Dược phẩm Hoa Kỳ

HAT Enzym Histon

Acetyltransferase

Histon deacetylase HDAC

Histon deacetylase 2 HDAC2

Nồng độ ức chế 50% IC50

The half maximal inhibitory concentration

MLR

Multiple Linear Regression Phương pháp hồi quy tuyến tính đa biến

Hệ số tương quan chéo Q2

ext

Hệ số xác định cho tập kiểm tra

QSAR

Quantitative Structure – Activity Relationship Tương quan định lượng cấu trúc – tác dụng

Hệ số xác định R2

SAHA

Suberoylanilide hydroxamic acid

Test set Tập kiểm tra Te

Training set Tập huấn luyện Tr

TSPT Tham số phân tử

UHDAC

Chất ức chế histon deacetylase

DANH MỤC HÌNH VẼ

STT Kí hiệu Trang Tên hình

1 Hình 1.1 7

Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã. (a) Sự methyl hóa và deacetyl hóa histon dẫn tới hình dạng đóng xoắn nhiễm sắc thể và ức chế phiên mã. (b) Sự acetyl hóa và demethyl hóa histon làm tháo xoắn nhiễm sắc thể và cho phép phiên mã.

2 Hình 1.2 8

Cấu tạo trung tâm hoạt động của HDAC nhóm I, II, IV

3 Hình 2.1 19

Cấu trúc hóa học của 45 dẫn xuất của acid hydroxamic thu thập được.

4 Hình 3.1 Miền ứng dụng của mô hình QSAR xác 28

định hợp chất có khả năng ức chế HDAC2

5 Hình 3.2 30

Tóm tắt quy trình sàng lọc in silico chất ức chế HDAC2 từ CSDL PubChem

DANH MỤC BẢNG

STT Ký hiệu Tên bảng Trang

Các nhóm thuốc chống ung thư 1 Bảng 1.1 5

2 Bảng 1.2 12

Các chất ức chế HDAC đang thử nghiệm lâm sàng.

3 Bảng 2.1 20

Giá trị IC50 thực nghiệm của 45 hợp chất trong CSDL.

4 Bảng 3.1 28

Kết quả đánh giá nội và đánh ngoại mô hình QSAR.

Kết quả sàng lọc ảo từ CSDL Pubchem. 5 Bảng 3.2 33

MỤC LỤC

DANH MỤC KÝ HIỆU VIẾT TẮT

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG

MỞ ĐẦU .......................................................................................................... 1

Chƣơng 1- TỔNG QUAN ............................................................................... 3

1.1. Thực trạng ung thư và tử vong do ung thư ............................................. 3

1.1.1. Thực trạng ung thư và tử vong do ung thư trên thế giới .................. 3

1.1.2. Thực trạng ung thư và tử vong do ung thư ở Việt Nam ................... 4

1.2. Thuốc điều trị ung thư ............................................................................. 4

1.3. Tổng quan histon deacetylase ................................................................. 6

1.3.1. Khái niệm histon deacetylase ........................................................... 6

1.3.2. Phân loại các HDAC ......................................................................... 7

1.3.3. HDAC2 và vai trò trong ung thư ...................................................... 8

1.3.4. Các chất ức chế HDAC ................................................................... 11

1.3.5. Cơ chế tác dụng của các chất ức chế HDAC .............................. 13

1.4. Tổng quan phương pháp QSAR ............................................................ 13

1.4.1. Lịch sử QSAR ................................................................................. 13

1.4.2. Đại cương về QSAR ....................................................................... 14

1.4.3. Quy trình xây dựng mô hình QSAR .............................................. 15

Chƣơng 2 - NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU ....... 19

2.1. Nguyên liệu .......................................................................................... 19

2.1.1. Cơ sở dữ liệu ................................................................................... 19

2.1.2. Phần mềm sử dụng .......................................................................... 20

2.2. Phương pháp nghiên cứu ..................................................................... 20

2.2.1 Tính toán tham số mô tả phân tử ..................................................... 20

2.2.2. Phân chia tập huấn luyện / Tập kiểm tra ........................................ 21

2.2.3. Xây dựng mô hình QSAR ............................................................... 21

2.2.4. Sàng lọc và dự đoán hoạt tính một số dẫn xuất HDAC2 sử dụng mô hình QSAR đã xây dựng được .................................................................. 21

Chƣơng 3 – KẾT QUẢ VÀ BÀN LUẬN ..................................................... 23

3.1. Kết quả .................................................................................................. 23

3.1.1. Mô hình toán học thu được ............................................................. 23

3.1.2. Đánh giá mô hình theo các tiêu chí của OECD .............................. 27

3.1.3. Sàng lọc ảo đánh giá khả năng ức chế HDAC2 sử dụng mô hình xây dựng được ........................................................................................... 29

3.2. Bàn luận ................................................................................................ 34

3.2.1. Về mô hình QSAR ......................................................................... 34

3.2.2. Về quy trình sàng lọc ảo. ................................................................ 35

KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 37

TÀI LIỆU THAM KHẢO

PHỤ LỤC

MỞ ĐẦU

Theo thống kê của tổ chức Y tế giới (WHO), ung thư đã trở thành căn bệnh giết người hàng đầu thế giới, với khoảng 14 triệu ca mới phát hiện và 8,2 triệu trường hợp tử vong mỗi năm (số liệu tính đến hết năm 2012). So với thế giới thì Việt Nam thuộc nhóm nước có tỷ lệ mắc bệnh cao nhất đối với nhiều loại ung thư. ớc tính mỗi năm tại Việt Nam có khoảng 150 - 200 nghìn người phát hiện bị ung thư, trong đó 70.000 trường hợp tử vong.

Trước tình hình đó, việc nghiên cứu và phát triển các thuốc mới chống lại ung thư luôn là mối quan tâm hàng đầu của ngành công nghiệp dược phẩm thế giới và Việt Nam. Tuy nhiên, quá trình nghiên cứu phát triển thuốc nói chung và các thuốc điều trị ung thư nói riêng hiện nay vẫn chủ yếu dựa trên các phương pháp kinh điển hay phương pháp “thử và lỗi” với nhược điểm là tốn thời gian, tiền bạc và cho hiệu quả thấp [22]. Ngoài ra, các thuốc điều trị ung thư hiện đang gặp rất nhiều vấn đề liên quan đến độc tính và tỷ lệ kháng thuốc cao. Do đó yêu cầu cấp bách đặt ra là phải nghiên cứu và phát triển thuốc chống ung thư mới, có tác dụng chọn lọc trên đích phân tử nhằm phát huy tối đa hiệu quả, lâu bị kháng và ít độc hơn.

Histon deacetylase (HDAC) là một trong những đích phân tử được ch

hiện nay, enzym này x c tác cho quá trình deacetyl hoá nhóm -N acetyl

lysine amino acid ở phần đuôi của histon. Người ta đã chứng minh được trong nhiều tế bào ung thư có sự huy động quá mức các enzym HDAC, gây nên hiện tượng giảm sự acetyl hoá của histon. Các chất ức chế HDAC có thể ngăn chặn quá trình này thông qua việc làm thay đổi biểu hiện gen gây ung thư hay các gen ức chế khối u do gây cường acetyl hóa các protein histone [32]. Hiện nay người ta đã biết đến 18 loại HDAC khác nhau, chia thành 4 nhóm, trong đó HDAC2 thuộc nhóm I được đánh giá là một đích phân tử quan trọng do có vai trò trong quá trình deacetyl hoá của các histon H3K56 và H4K16 xảy ra trong hầu hết các dòng tế bào ung thư người [7,10].

Quá trình nghiên cứu tìm kiếm chất ức chế HDAC nhằm phát triển thành thuốc chống ung thư đã kéo dài hơn một thập kỷ [43]. Các mô hình liên

quan mối quan hệ cấu trúc – tác dụng dược lý xuất hiện từ năm 1868, được biết đến là mô hình toán học định lượng mối liên quan tác dụng dược lý và cấu trúc hóa học của hợp chất hay còn gọi là QSAR. Xây dựng mô hình QSAR để dự đoán hoạt tính của những phân tử chưa từng được kiểm tra. Từ đó gi p tìm kiếm các hợp chất hóa học có tác dụng sinh học, tối ưu hóa cấu tr c các hợp chất này nhằm tăng hoạt tính sinh học, giảm độc tính, tăng các tính chất dược động học của thuốc. Phương pháp này nhìn chung nhanh có tính kinh tế và hỗ trợ rất tốt cho các nghiên cứu thực nghiệm, giúp nâng cao tỷ lệ thành công của nghiên cứu.

Từ các vấn đề nêu trên, mục tiêu chung của nghiên cứu này là “Xây dựng mô hình toán học giúp nhận biết chất ức chế enzym histon deacetylase 2 có tác dụng chống ung thư”. Với mục tiêu cụ thể:

- Xây dựng mô hình QSAR mới sử dụng phương pháp hồi quy tuyến tính

nhằm dự đoán khả năng ức chế HDAC2.

- Đánh giá mô hình xây dựng được theo các tiêu chí của Tổ chức kinh tế

thế giới (OECD).

- Vận dụng mô hình xây dựng được xác định hợp chất dẫn đường tiềm

năng ức chế HDAC2 phát triển thành thuốc chữa ung thư.

Chƣơng 1- TỔNG QUAN

1.1. Thực trạng ung thƣ và tử vong do ung thƣ

1.1.1. Thực trạng ung thư và tử vong do ung thư trên thế giới

Ung thư là một trong những nguyên nhân hàng đầu gây tử vong trên toàn thế giới. Trong năm 2012, có khoảng 14 triệu trường hợp ung thư được phát hiện mới và có đến 8,2 triệu ca tử vong liên quan đến ung thư [40]. Trong đó, số lượng các ca tử vong do các ung thư chủ yếu là: ung thư phổi (1,59 triệu ca), ung thư gan (745000 ca), ung thư dạ dày (723000 ca), ung thư đại trực tràng (694000 ca), ung thư v (521000 ca), ung thư thực quản (400000 ca) [40].

Số lượng các ca ung thư mới được dự đoán sẽ tăng khoảng 70% trong vòng hai thập kỉ tới. Dự đoán số trường hợp ung thư hàng năm sẽ tăng từ 14 triệu trong 2012 lên 22 triệu trong vòng hai thập kỉ tới [2]. Hơn 60% số các ca ung thư mới hàng năm trên thế giới xảy ra ở Châu Phi, Châu Á, Trung và Nam Mỹ, chiếm 70% số các ca tử vong ung thư thế giới [40].

Đối với nam giới, 5 ung thư phổ biến nhất được chẩn đoán trong năm 2012 là ung thư phổi, tuyến tiền liệt, đại trực tràng, dạ dày và gan. Đối với nữ giới, 5 ung thư phổ biến nhất được chẩn đoán là ung thư v , đại trực tràng, phổi, cổ tử cung, dạ dày.

Khoảng 30% các trường hợp tử vong liên quan đến ung thư là do 5 yếu tố nguy cơ hàng đầu về hành vi và chế độ ăn uống: chỉ số khối cơ thể cao (béo phì), ăn ít rau quả tươi, ít tập thể dục, nghiện thuốc lá hoặc rượu. Thuốc lá là yếu tố nguy cơ quan trọng nhất đối với ung thư, gây ra hơn 20% các ca tử vong ung thư và khoảng 70% các ca tử vong do ung thư phổi trên toàn cầu. Ngoài ra, các bệnh nhiễm virus HBV, HCV và một số type Human Papilloma Virus (HPV) là nguyên nhân của trên 20% số các ca tử vong ung thư ở các nước thu nhập thấp và thu nhập trung bình [12].

1.1.2. Thực trạng ung thư và tử vong do ung thư ở Việt Nam

Ở Việt Nam, trong năm 2012, số lượng các ung thư gặp phổ biến ở nam giới là gan 16.815 ca, phổi 16.082 ca, dạ dày 9.406 ca, đại trực tràng 4.561 ca và mũi họng 3.301 ca; còn các ung thư gặp phổ biến ở nữ giới là: vú 11.067 ca, phổi 5.783 ca, gan 5.182 ca, cổ tử cung 5.146 ca và dạ dày 4.797 ca [39].

Ở Việt Nam, tổng số ca tử vong do ung thư năm 2012 là 91.600 ca, trong đó: số nam giới tử vong do ung thư là 58.200 ca: ung thư gan chiếm 26,9%, phổi 24,4%, dạ dày 14,5%, miệng - thực quản 5,8%, đại trực tràng 5,2% và do ung thư khác là 23,2%; số nữ giới tử vong do ung thư là 33.400 ca: ung thư phổi chiếm 14,5%, gan 13,7%, v 12,5%, dạ dày 12,1%, đại trực tràng 8% và do ung thư khác là 39,3% [39].

1.2. Thuốc điều trị ung thƣ

Ngày nay có nhiều phương pháp điều trị ung thư, gồm có phẫu thuật, vật lí trị liệu (xạ trị liệu), hóa trị liệu (dùng thuốc điều trị ung thư), nội tiết, miễn dịch [1]. Tuy nhiên áp dụng phương pháp nào để điều trị có hiệu quả còn tuỳ thuộc vào giai đoạn, vào sức chịu đựng của cơ thể, vào khả năng của cơ sở điều trị và một phần vào kinh nghiệm của thầy thuốc chuyên khoa.

Từ khi bắt đầu tiến triển, ung thư đã có thể cho di căn, do đó các phương pháp điều trị tại chỗ và tại vùng như phẫu thuật và xạ trị thường không mang lại hiệu quả. Sử dụng các thuốc điều trị ung thư đặc biệt là các hóa chất chống ung thư có thể ngăn chặn được tiến triển của ung thư. Hóa chất chống ung thư đều là những chất gây độc tế bào. Ch ng can thiệp vào phân bào theo các cách khác nhau, ví dụ như sự sao chép DNA hay quá trình phân chia các nhiễm sắc thể mới được tạo thành [1]. Điều trị hóa chất dựa trên sự đáp ứng khác biệt nhau giữa tế bào ung thư và tế bào lành. Đặc trưng tăng trưởng của ung thư có ảnh hưởng rất lớn đến đáp ứng với hóa trị. Các hiểu biết về động học tế bào, sự tăng trưởng của khối u, sinh học ung thư là căn bản cho các nguyên tắc hóa trị lâm sàng.

Có khoảng hơn 200 loại thuốc chống ung thư trên lâm sàng [1]. Theo

cơ chế hoạt động, các thuốc chống ung thư được phân loại như bảng 1.1 [1].

Bảng 1.1. Các nhóm thuốc chống ung thư

Nhóm tác nhân Mục tiêu Cấu trúc hóa học

Liên kết chéo DNA Nitrogen mustard

Ethyle limin

Sulfonic acid ester

Epoxide Các tác nhân ngăn chặn tổng hợp DNA bằng alkyl hóa có nguồn gốc tổng hợp (các tác nhân alkyl hóa) Nitrosourea

Halogenated hexitol

Hợp chất platinum

Kháng sinh kháng u Xen giữa DNA làm đứt gãy DNA

Anthracyclin, Actinomycin D, Mitomycin C, Bleomycin

Sinh tổng hợp acid nhân

Các kháng chuyển hóa

Các kháng acid Folic, kháng Purin, kháng Pirimidin, các ức chế tổng hợp protein và acid amin

Alkaloid nhóm vinca

Ngăn cản hình thức thoi trong kì gián phân Podophylin Các ức chế giai đoạn gián phân hình thoi Colchicin

Hỗn hợp Không xác định

Alkylamin (HMM, PMM)*

Dacarbazin

Procarbazin

Các Taxane Taxol, Taxotere

Làm đông cứng các vi quản nội tế bào

Các camptothecin Ức chế men topoisomerasa I Camptothecin, CPT - 11

Các hormone Androgen Antiandrogen

Estrogen Estrogen Antiestrogen

Steroid Antisteroid

Progestin

Các thuốc tác dụng lên tuyến yên

* HMM: Hexamethylmelamine

PMM: Pentamethylmelamine

1.3. Tổng quan histon deacetylase

1.3.1. Khái niệm histon deacetylase

Nhiễm sắc thể là phức hợp gồm 3 thành phần: ADN, protein histon và protein không phải histon [21]. Đơn vị cơ bản của nhiễm sắc thể là nucleosom. Mỗi nucleosom gồm 146 cặp base ADN được gói trong một protein histon octame [16] tạo bởi 4 thành phần: H2A, H2B, H3, H4 [13].

Các đầu amino của protein histon thường bị biến đổi bởi các quá trình methyl hóa, phosphoryl hóa hoặc acetyl hóa sau dịch mã. Quá trình acetyl hoá là một trong những cơ chế điều hoà chính của biểu thị gen. Kiểm soát quá trình biểu thị gen này phụ thuộc vào sự cân bằng giữa hoạt động của enzym histon acetylase và enzym histon deacetylase, nhờ vào sự điều hoà quá trình acetyl hoá lysin ở phần đuôi histon [6].

Histon acetyltrasferase (HAT) là enzym acetyl hóa nhóm -NH2 trong

gốc lysin (đầu N tận) của histon, làm trung hòa điện tích dương trên lysin, do đó giảm khả năng tương tác của histon với ADN (tích điện âm) tạo cấu trúc mở chromatin. Vì vậy, sự acetyl hóa histon tạo điều kiện cho quá trình phiên mã, dịch mã xảy ra (hình 1.1b) [6,21].

Histon deacetylase (HDAC) là enzym có tác dụng đối lập với HAT. HDAC loại bỏ nhóm acetyl từ acetyl lysin (Ac-Lys) ở đầu N tận của histon, làm đóng xoắn chromatin, do đó ức chế quá trình phiên mã (Hình 1.1) [6,21].

Hình 1.1. Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã. (a) Sự methyl hóa và deacetyl hóa histon dẫn tới hình dạng đóng xoắn nhiễm sắc thể và ức chế phiên mã. (b) Sự acetyl hóa và demethyl hóa histon làm tháo xoắn nhiễm sắc thể và cho phép phiên mã.

1.3.2. Phân loại các HDAC

Hiện nay người ta đã biết đến 18 loại HDAC khác nhau, được chia thành 4 nhóm: I, II, III, IV. HDAC nhóm I, II và IV được gọi là các HDAC “kinh điển” và thường được sử dụng để sàng lọc và thiết kế các chất ức chế HDAC mới [43].

Nhóm I: HDAC1, HDAC2, HDAC3, HDAC8. Các enzym này có ở

phần nhân của nhiều loại tế bào.

Nhóm II: gồm nhóm IIa và nhóm IIb. Trong đó nhóm IIa có HDAC4, HDAC5, HDAC7, HDAC9, nhóm IIb có HDAC6, HDAC10. Các enzym này biểu thị mô đặc trưng, có khả năng di chuyển giữa bào tương và nhân.

Nhóm III: Các protein điều hoà chuỗi thông tin 2 (SIRT): SIRT 1 – 7,

chúng có ở bào tương, ty thể và nhân.

Nhóm IV: HDAC11, có ở phần nhân của nhiều loại tế bào.

Các enzym nhóm I, II và IV phụ thuộc vào Zn2+. Nhóm III là các

enzym có cấu trúc phụ thuộc NAD+ [11,43].

Trung tâm hoạt động HDAC gồm 2 phần chính (Hình 1.2): ion Zn2+ là coenzyme của HDAC và kênh enzym dạng túi hình ống. Cấu trúc rất linh động, có thể biến đổi phù hợp với chiều dài cơ chất khác nhau. Trên miệng túi có một vành nhỏ được tạo nên từ một vài vòng xoắn protein, phần vành này sẽ tương tác với nhóm nhận diện bề mặt HDAC [18].

Hình 1.2. Cấu tạo trung tâm hoạt động của HDAC nhóm I, II, IV.

1.3.3. HDAC2 và vai trò trong ung thư

Histon deacetylasa 2 (HDAC2) thuộc HDAC nhóm I. HDAC2 hoạt động như một chất ức chế phiên mã thông qua loại bỏ nhóm lysine ở đầu N của protein histon (H2A, H2B, H3 và H4). Tuy nhiên HDAC2 không liên kết với ADN nên chúng sẽ được chọn lọc bởi các yếu tố phiên mã như YY1, SP1/SP3, gen ức chế khối u p53 và BRCA1. HDAC2 cũng có thể được gắn vào ADN như là một phần của phức hợp CoREST, mSin3 và NuRD. Những phức hợp là mục tiêu với các trình tự gen đặc hiệu bằng các tương tác với các yếu tố phiên mã trình tự đặc hiệu. Ví dụ, các HDAC2/HDAC1 chứa phức hợp Sin3-SAP chọn lọc họ E2F của các yếu tố phiên mã để ức chế phiên mã [17].

Phức hợp chứa HDAC2 cũng liên quan đến gen điều chỉnh phiên mã qua thụ thể trung gian. Những phức hợp chứa gen biến đổi biểu sinh khác,

chẳng hạn như MeCp2 – là một protein có nhóm liên kết methyl. Các enzyme vận chuyển nhóm methyl DNA DNMT1, DNMT3A và DNMT3B, sự methyl transferases histone SUVAR39H1 và G9a và histon bị bỏ đi nhóm methyl (LSD1), cho thấy một cách khác mà HDAC2 quy định biểu hiện gen và sửa chữa nhiễm sắc.

HDAC2 cũng quy định biểu hiện gen thông qua sự deacetyl của yếu tố phiên mã cụ thể bao gồm STAT3 và SMAD7. HDAC2 là một chìa khóa quan trọng của gen điều hòa chu kỳ tế bào, quá trình tế bào tự tiêu diệt, kết dính tế bào và di cư. Cùng với HDAC1, HDAC2 quy định việc phiên mã của các gen liên quan đến quá trình tạo máu, biệt hóa tế bào biểu mô, phát triển tim và tế bào thần kinh [34].

Các đột biến có thể có ở HDAC2 xuất hiện ở tế bào soma. HDAC2 bị đột biến trong các khối u lẻ tẻ và trong các khối u phát sinh ở người có ung thư biểu mô đại trực tràng không polyp di truyền. Đột biến này do sự cắt bỏ 9 adenin ở exon1 tạo thành protein không hoạt động. Sự biểu hiện các dạng đột biến của HDAC2 gây ra sự kháng với tác dụng của các chất ức chế HDAC. Việc thiếu các biểu hiện và chức năng HDAC2 tạo nên sự tăng điều chỉnh gen th c đẩy tăng trưởng khối u [5,25].

HDAC2 liên quan đến nhiều bệnh ung thư khác nhau:

Việc điều hòa về biểu hiện hoạt động HDAC2 có liên quan đến sự phát triển ung thư. HDAC2 biểu hiện quá mức trong các loại ung thư khác nhau bao gồm cả đại tràng, dạ dày, cổ tử cung, ung thư tuyến tiền liệt, ung thư phổi không tế bào nhỏ và ung thư biểu mô tế bào gan. HDAC2 biểu hiên quá mức liên quan đến ung thư một phần thông qua việc chọn lọc sai lầm của nó và sự im lặng của các gen ức chế khối u. Sự ức chế của gen p21WAF1 ức chế khối u ở vùng khởi động và có thể được đảo ngược bởi việc điều trị bằng thuốc ức chế HDAC [31]. Biểu hiện HDAC2 tương quan với tiên lượng xấu khi bệnh ở giai đoạn tiên triển trong ung thư đại trực tràng, tuyến tiền liệt, dạ dày và biểu mô tế bào gan.

Ung thư đại tràng: Có một số nghiên cứu cho thấy HDAC2 biểu hiện quá mức trong ung thư đại tràng. Sự gia tăng các biểu hiện HDAC2 đã được

tìm thấy ở mức độ protein và mRNA chỉ ra rằng HDAC2 quá mức là do hoạt hóa phiên mã. Các nghiên cứu cho thấy trong loại khối u này sự phiên mã HDAC2 được điều chỉnh bởi tín hiệu beta-catenin-TCF-myc đã bị xóa bỏ trong bệnh ung thư đại tràng. HDAC2 biểu hiện quá mức tương quan với tiên lượng xấu và bệnh ở giai đoạn tiến triển trong ung thư đại trực tràng. Tuy nhiên, Ropero và các cộng sự tìm thấy một sự đột biến bất hoạt của HDAC2 trong ung thư đại tràng với bất ổn microsatellite [29].

Ung thư v : Các nghiên cứu khác nhau cho thấy vai trò quan trọng của HDAC2 trong ung thư v . HDAC2 gây lão hóa trong tế bào ung thư v . Hơn nữa sự mất hoạt tính của HDAC2 kéo theo quá trình chết tế bào (apoptosis) của tamoxifen trong estrogen/ progesterone tế bào ung thư v dương tính [27].

Bệnh ung thư tuyến tiền liệt: Theo nghiên cứu của Weichert và các cộng sự thấy rằng HDAC2 được biểu hiện mạnh mẽ trong hơn 70% các trường hợp phân tích ung thư tuyến tiền liệt. Sự gia tăng trong biểu hiện HDAC2 có liên quan với tăng cường tăng sinh tế bào khối u [5].

Ung thư biểu mô tế bào gan: HDAC2 quy định chu kỳ tế bào và sự phân chia của HDAC2 gây ra ngừng chuyển pha G1/S trong chu kỳ tế bào. Trong quá trình chuyển đổi G1/S, sự phân chia đích của HDAC2 có tính chọn lọc gây ra các biểu hiện của p16 (INK4a) và p21 (WAF1/Cip1), và đồng thời ức chế sự biểu hiện của cyclin D1, CDK4 và CDK2. Do đó, sự ức chế HDAC2 dẫn đến sự giảm điều chỉnh của gen đích E2F/DP1 thông qua việc giảm sự phosphoryl hóa protein PRB [5].

Ung thư phổi: HDAC2 được điều chỉnh lên cao trong ung thư phổi. HDAC2 bất hoạt dẫn đến thoái hoá tăng trưởng tế bào khối u và kích hoạt các quá trình chết tế bào (apoptosis) qua p53, kích hoạt Bax và ức chế BCL2. Trong điều chỉnh chu kỳ tế bào, HDAC2 bất hoạt gây ra cảm ứng biểu hiện p21WAF1/Cip1, đồng thời ức chế sự biểu hiện của cyclin E2, cyclin D1, và CDK2, tương ứng. Do đó, điều này dẫn đến việc giảm quá trình phosphoryl hóa của protein PRB trong chuyển pha G1/S và do đó bất hoạt phiên mã gen

đích E2F/DP1 của các tế bào A549. HDAC2 trực tiếp điều chỉnh biểu hiên p21WAF/Cip1 không phụ thuộc p53 [5].

Bệnh phổi tắc nghẽn mãn tính (COPD): giảm hoạt động và biểu hiện HDAC2 được tìm thấy trong bệnh phổi tắc nghẽn mãn tính (COPD). Việc giảm hoạt động của HDAC2 làm tăng điều hòa các gen liên quan đến phản ứng viêm và kháng corticosteroid trong COPD [5].

1.3.4. Các chất ức chế HDAC

Yoshida và cộng sự (1990), đã phát hiện ra dẫn chất hydroxamat tự nhiên đầu tiên có tác dụng ức chế trực tiếp HDAC là Trichostatin A (TSA), vốn là chất có tác dụng chống nấm [41]. Sau đó, dựa trên hiểu biết về mối liên quan giữa HDAC và ung thư đồng thời xác định được cấu trúc 3D của các HDAC, một số chất ức chế HDAC đã được nghiên cứu và thử nghiệm trên lâm sàng để ứng dụng trong điều trị ung thư. Cho đến nay, nhiều chất ức chế HDAC (UHDAC) đã được công bố. Chúng có thể có nguồn gốc tự nhiên hay tổng hợp. Trong các nhóm chất ức chế HDAC, các acid hydroxamic là nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất. Do các acid hydroxamic có cấu tr c đơn giản, dễ tổng hợp và có nhóm -NHOH tạo được phức bền với Zn+ ở trung tâm hoạt động của HDAC mang lại có hoạt tính ức chế enzym mạnh. Hiện nay, FDA đã phê duyệt một acid hydroxamic UHDAC điển hình là vorinostat (suberoylanilide hydroxamic acid, Zolinza) vào năm 2006 sử dụng trong điều trị u lympho da tế bào [cutaneous T-cell lymphoma (CTCL)]. Một hợp chất UHDAC khác là depsipeptide (romidepsin, Istodax) cũng được FDA cấp phép lưu hành vào năm 2009 để điều trị CTCL và điều trị ung thư hạch tế bào T ngoại vi [peripheral T-cell lymphoma (PTCL)]. Đây chính là nguồn động lực để các nhà nghiên cứu tiếp tục tìm kiếm các chất ức chế HDAC mới. Nhiều chất ức chế enzym HDAC khác cũng đang được thử nghiệm lâm sàng nhằm phát triển liệu pháp điều trị ung thư dựa trên đích này, bao gồm nhóm hydroxamat, benzamid, peptid vòng, acid carboxylic (Bảng 1.2) [4,30].

Bảng 1.2. Các chất ức chế HDAC đang thử nghiệm lâm sàng.

Nhóm

Hợp chất

Pha

Loại ung thƣ

Acid carboxylic

Butyrat

I, II

Ung thư đại tràng

AN-9 (tiền thuốc)

I, II

Thể rắn, NSCLC

Acid valproic

I, II

Thể rắn, ung thư máu, AML,

MDS, CTCL, u trung biểu

mô

Phenyl butyrate

Thể rắn, AML/MDS

I

Acid hydroxamic

SAHA

Đã c/m

CTCL

I, II

Thể rắn, ung thư máu

Ung thư máu

PXD101

II

Thể rắn, ung thư máu

NVP-LAQ824

I

II, III

Thể rắn, AML, ALL,

LBH-589

MDS

ITF-2357

II

U lympho Hodgkin

SB-939

I

Thể rắn, ung thư máu

CRA 024781

I

JNJ-16241199

I

Các benzamid

SNDX-275

I, II

Thể rắn, u lympho, AML, u

(MS-275)

hắc sắc tố ác tính di căn tiến

triển

CI-994

I, II

Thể rắn, NSCLC, tế bào

MGCD-0103

II

thận, tuỵ

Thể rắn, ung thư bạch cầu,

MDS

Peptid vòng

Depsipeptid

I, II

Thể rắn, CLL, AML, CTCL,

(FK228)

u đa tuỷ xương, NHL tế bào

T ngoại vi, RAI kháng

thyroid, ung thư đại tràng

tiến triển

Trong đó:

NSCLC (Non-Small Cell Lung Cancer) : Ung thư phổi không tế bào nhỏ

AML (Acute Myeloid Leukemia): Bệnh bạch cầu myeloid cấp tính

MDS (Myelodysplastic Syndrome ): Hội chứng rối loạn sinh tủy

CTCL (Cutaneous T Cell Lymphoma): U lympho tế bào T da

NHL (non-Hodgkin's lymphoma): Ung thư hạch không Hodgkin

RAI (Radioactive iodine): Iod phóng xạ

Tuy nhiên, mỗi nhóm nêu trên đều có những hạn chế nhất định như: các acid hydroxamic bị chuyển hoá nhanh, ức chế không chọn lọc lên các loại enzym HDAC; các benzamid và acid béo có hiệu lực kém; các peptid vòng khó tạo thành về mặt hoá học và FK-228 có phần gắn kết với ion Zn2+ chứa thiol [26].

1.3.5. Cơ chế tác dụng của các chất ức chế HDAC

Các chất ức chế HDAC có tác dụng chống ung thư do tác động lên nhiều giai đoạn quan trọng của chu trình tế bào làm mất sự điều hòa trong tế bào ác tính. Trong đó, yếu tố then chốt quyết định hoạt tính chống ung thư của ch ng là th c đẩy sự biệt hóa, ức chế chu trình tế bào và th c đẩy sự chết tế bào. Ngoài ra, hoạt hóa đáp ứng miễn dịch và ức chế sự tạo mạch cũng là vai trò rất quan trọng của các UHDA, gián tiếp ức chế sự phát triển của các khối u. Ngoài ra các chất ức chế HDAC ngăn cản các đuôi histon có nhóm acetyl tiến đến vị trí xúc tác [7,9].

Vai trò sinh học của HDAC và các nghiên cứu về các chất UHDA cho thấy nó là một mục tiêu quan trọng cần hướng tới trong điều trị ung thư. Do đó, việc tìm kiếm các hợp chất mới có tiềm năng ức chế HDAC là một hướng đi nhằm tìm kiếm các hợp chất mới với khả năng ức chế cao hơn, ít độc tính hơn đang là một hướng đi được nhiều nhà khoa học quan tâm [21].

1.4. Tổng quan phƣơng pháp QSAR

1.4.1. Lịch sử QSAR

Lịch sử phát triển của phương pháp QSAR có thể nói khởi nguồn từ những nghiên cứu của Crum-Brown và Frasher (1868) khi nhận xét rằng tác dụng sinh học là hàm số của cấu trúc hóa học. Đến năm 1893, Richet đã cho

rằng sự khác nhau về tác dụng sinh học là do sự thay đổi về tính chất lí hóa. Đến năm 1935, một phương trình quan trọng của Hammett được coi là mô hình đầu tiên biểu diễn mối quan hệt hoạt tính và cấu trúc:

Log 

Với K, Ko là hằng số acid,  là hằng số Hammett, thông số hóa l đặc

trưng cho khả năng h t hoặc đấy điện tử của nhóm thế.

QSAR thực sự được nghiên cứu bởi C.L. Corwin Hansch từ những năm 60 của thế kỉ 20. Mô hình QSAR Hansch thường sử dụng phương pháp hồi quy tuyến tính đa biến để biểu thị mối tương quan giữa các tham số hóa lí và hoạt tính sinh học, ví dụ một phương trình của ông như sau:

Log (1/C) = k1+ k22+ k3

Trong đó: C là nộng độ mol mà tại đó hoạt chất thể hiện hoạt tính sinh

học, : hằng số kỵ nước, : hằng số thế Hammett, k1,k2,k3 là các hệ số hồi

quy.

Kể từ đây, đã có nhiều phương trình QSAR cùng với những phương pháp xây dựng đa dạng đã ra đời và chiếm một vai trò quan trọng trong nghiên cứu và phát triển dược phẩm.

1.4.2. Đại cương về QSAR

Về mặt toán học, mô hình QSAR (Quantitative Structure-Activity Relationships) biểu diễn mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính thông qua phương trình:

(1.4.2) Y = f(x1) + f(x2) + ... + f(xn)

Trong đó, Y là biến phụ thuộc, phản ánh hoạt tính sinh học của các hợp chất. Giá trị của Y được xác định thông qua các nghiên cứu thực nghiệm, ví dụ như nồng độ ức chế 50% hoạt tính của enzym (IC50), MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu, hay nồng độ kìm khuẩn tối thiểu (dùng trong vi sinh); MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu; EC 50 (Effective Concentration): nồng độ 50%

tác dụng tối đa... Y cũng có thể nhận giá trị rời rạc, ví dụ như có hay không có hoạt tính, hoạt tính mạnh hay yếu. Các biến x trong mô hình QSAR được gọi là các tham số phân tử (TSPT), mô tả một đặc điểm cấu tr c nào đó của phân tử hóa học. Hàm f là một hàm mô tả mối tương quan giữa Y và các biến x. Để xây dựng được hàm f, cần áp dụng các thuật toán thống kê (statistical) hoặc học máy (machine learning). Một số kỹ thuật thống kê thường được sử dụng trong xây dựng mô hình QSAR có thể kể đến như bình phương tối thiểu từng phần (Partial Least Squares), hồi quy đa biến tuyến tính (Multiple Linear Regression), phân tích thành phần chính (Principal Component Analysis).

1.4.3. Quy trình xây dựng mô hình QSAR

Các bước để xây dựng mô hình QSAR [19] gồm:

1) Xây dựng cơ sở dữ liệu (CSDL); 2) Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc; 3) Xây dựng mô hình QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử (TSPT) và các giá trị đại lượng biểu diễn hoạt tính; 4) Đánh giá mô hình; 5) Giải thích các kết quả và sử dụng mô hình trong quá trình sàng lọc ảo (nếu có thể).

Xây dựng cơ sở dữ liệu: CSDL thường là cấu trúc của các hợp chất hoá học đã được chứng minh hoạt tính sinh học in vitro. Để hạn chế các yếu tố gây sai số cho mô hình, CSDL thường sẽ được làm sạch dựa trên sự tương đồng về cấu trúc, về protocol,...

Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc:

Tham số mô tả phân tử là một số thu được từ một quá trình toán học và lôgic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học [37]. Trong nghiên cứu này, các tham số được tính toán sử dụng phần mềm Dragon [37].

Xây dựng mô hình QSAR: sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các TSPT và giá trị đại lượng biểu diễn hoạt tính.

Đánh giá mô hình: Đánh giá mô hình là giai đoạn quan trọng liên quan đến khả năng ứng dụng của mô hình. Đánh giá mô hình thường sử dụng 5 nguyên tắc của OECD [28].

- Nguyên tắc 1: Có đích xác định (defined end-points).

Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được từ CSDL. Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này). Còn nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin cậy cao.

- Nguyên tắc 2: Các thuật toán sử dụng được mô tả rõ ràng.

Các thuật toán sử dụng để xây dựng mô hình cần được mô tả rõ ràng,

có khả năng ứng dụng để xây dựng các mô hình khác.

- Nguyên tắc 3: Có miền cấu trúc ứng dụng xác định.

Miền cấu trúc ứng dụng là khoảng không gian cấu tr c được xác định bởi các hợp chất trong tập huấn luyện để xây dựng mô hình. Những hợp chất thuộc tập huấn luyện nếu có cấu trúc nằm ngoài miền cấu trúc ứng dụng sẽ ảnh hưởng đến độ chính xác của mô hình. Những hợp chất thuộc tập dự đoán, nếu có cấu trúc nằm ngoài miền này sẽ cho kết quả dự đoán không chính xác. Các phương pháp xác định miền ứng dụng thường gặp như: phương pháp đòn bẩy, phương pháp ba lân cận gần nhất,...

- Nguyên tắc 4: Có độ khớp, độ ổn định, và khả năng dự đoán tốt.

∑

 Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R2, R2 càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực nghiệm càng tốt. R2> 0,6 thì mô hình mới có nghĩa. Công thức tính hệ số xác định như sau:

R2 = 1-

∑

, lần lượt là giá Trong đó n là số các quan sát của tập huấn luyện; yi,

trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; là giá trị thực

tế trung bình của biến phụ thuộc.

∑

 Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q2, Q2 được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out) bằng cách lần lượt loại 1 quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã lựa chọn và tính toán lại các thông số của mô hình. Q2 càng gần 1, tính tổng quát hóa của mô hình càng cao, mô hình càng ổn định. Thông thường, yêu cầu Q2 > 0,5 thì mô hình mới bền vững. Công thức hệ số tương quan chéo tính như sau:

Q2 = 1 -

∑

Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị thực tế của

quan sát thứ i; giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng

ext, Q2

mô hình đã loại biến i; là giá trị thực tế trung bình của biến phụ thuộc.

∑

 Khả năng dự đoán ngoại Khả năng dự đoán ngoại được đánh giá thông qua giá trị Q2 ext càng lớn mô hình càng cho thấy độ tuyến tính của tập kiểm tra và do vậy chứng tỏ khả năng dự đoán của mô hình cao.

= 1 -

∑

, lần lượt là giá trị thực Trong đó n là số các quan sát tập kiểm tra; yi,

tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; là giá trị thực tế

trung bình của biến phụ thuộc. - Nguyên tắc 5: Giải thích được cơ chế (nếu có thể).

Mô hình cần được giải thích về vai trò của các biến trong mô hình, qua đó gi p định hướng thiết kế các hợp chất mới. Tuy nhiên việc giải thích các biến này nhiều khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi

những hiểu biết chuyên sâu về hóa lượng tử. Bên cạnh đó có nhiều biến chưa có các tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích.

Chƣơng 2 - NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU

2.1. Nguyên liệu

2.1.1. Cơ sở dữ liệu

Cơ sở dữ liệu (CSDL): gồm 45 hợp chất ức chế HDAC2 lựa chọn từ dữ liệu xây dựng bởi 6 bài báo khoa học đã công bố trước đó cùng với giá trị IC50 được xác định bằng phương pháp giống nhau (sử dụng Kit định lượng Bioscence®) [8,14,15,24,36,38]. Công thức hóa học mô tả như hình 2.1 và giá trị IC50 tương ứng được nêu trong bảng 2.1.

Hình 2.1. Cấu trúc hóa học của 45 dẫn xuất của acid hydroxamic thu thập được.

Bảng 2.1. Giá trị IC50 thực nghiệm của 45 hợp chất trong CSDL.

STT STT STT STT STT IC50 IC50 IC50 IC50 IC50

(µM) (µM) (µM) (µM) (µM)

0.175 0.120 1 0,308 10 0.116 19 28 0.310 37

0.254 0.150 2 0,284 11 0.152 20 29 0.190 38

1,399 0.320 3 0,891 12 0.086 21 30 0.192 39

0.260 4 0,460 13 0.120 22 0.3618 31 0.160 40

0.002 2,457 5 0,358 14 0.179 23 32 0.060 41

0.199 1,987 6 0,870 15 0.117 24 33 0.030 42

0.189 2,015 7 1,779 16 0.447 25 34 0.030 43

0.381 0.105 8 0.116 17 0.472 26 35 0.080 44

0.270 5.784 9 0.152 18 0.267 27 36 0.160 45

2.1.2. Phần mềm sử dụng

Danh sách các phần mềm sử dụng bao gồm:

1. ChemDraw phiên bản 10.0 2. Dragon 6.0

3. Mobydigs 1.0 4. Microsoft Excell 2007

5. STATISTICA 10.0

2.2. Phƣơng pháp nghiên cứu

2.2.1 Tính toán tham số mô tả phân tử

Tham số mô tả phân tử là kết quả của một quá trình toán học và logic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học thành một số có khả năng đặc trưng cho phân tử đấy [37]. Để thực hiện tính toán, tất cả các cấu trúc của CSDL được chuyển đổi thành hệ thống đơn giản hóa với đầu vào được biểu diễn dưới dạng dòng SMILES (Simplified Molecular Input Line

Entry System) bằng việc sử dụng phần mềm ChemDraw phiên bản 10.0 [33]. Căn cứ vào các mã code, hơn 2000 mô tả phân tử thuộc họ 0D, 1D và 2D được tính toán bằng phần mềm Dragon phiên bản 6.0 [3].

2.2.2. Phân chia tập huấn luyện / Tập kiểm tra

Sau khi tính toán mô tả phân tử, CSDL được chia ngẫu nhiên thành tập huấn luyện (Tr - training set) và tập kiểm tra (Te – test set). Tập huấn luyện (chiếm 75% CSDL) được sử dụng cho việc xây dựng (huấn luyện) mô hình. Tập huấn luyện cho phép phát hiện mối quan hệ có khả năng dự đoán. Còn tập kiểm tra bao gồm các phân tử mà mô hình chưa bao giờ gặp được sử dụng để đánh giá độ mạnh và khả năng ngoại suy của các mô hình xây dựng được.

2.2.3. Xây dựng mô hình QSAR

Tập huấn luyện gồm 75% số hợp chất trong CSDL được lựa chọn ngẫu nhiên để xây dựng mô hình QSAR. Các hợp chất còn lại được xếp vào tập kiểm nghiệm để đánh giá mô hình. Các mô hình được xây dựng bằng các phương pháp hồi quy đa biến tuyến tính (MLR) sử dụng phần mềm STATISTICA 10.0, lựa chọn TSPT bằng phương pháp thuật giải di truyền (Genetic algorithm) sử dụng phần mềm Mobydigs 1.0, sau đó đánh giá để lựa chọn mô hình tốt nhất.

2.2.4. Sàng lọc và dự đoán hoạt tính một số dẫn xuất HDAC2 sử dụng mô hình QSAR đã xây dựng được

Dựa trên công thức hóa học của một chất đã có tác dụng ức chế HDAC2 mạnh là SAHA (Suberoylanilide hydroxamic acid hay còn gọi là Vorinostat), chúng tôi tìm kiếm và dự đoán hoạt tính cho các hợp chất có tính tương đồng về cấu trúc với SAHA mà chưa được nghiên cứu tác dụng ức chế HDAC2. Để làm được điều này, chúng tôi tiến hành sàng lọc dựa trên 2 bước:

- Bước 1. Lấy SAHA làm khuôn, tìm kiếm trên CSDL PubChem các hợp chất có tính tương đồng cao về cấu trúc với SAHA, sử dụng công cụ “tìm kiếm đồng dạng” (Similarity searching) tích hợp trên CSDL PubChem: Dán công thức SMILES của SAHA vào thanh công cụ tìm kiếm. Sau đó chọn tiêu chí tương đồng, sử dụng tùy biến hệ số Tanimoto ≥ 0,85. Kết

quả thu được dãy các dẫn xuất của hydroxamic, lựa chọn các hợp chất chưa từng được nghiên cứu tác dụng ức chế HDAC2.

- Bước 2. Tính toán TSPT cho các hợp chất được lựa chọn và sử dụng mô

hình QSAR đã xây dựng được để dự đoán hoạt tính cho chúng.

Chƣơng 3 – KẾT QUẢ VÀ BÀN LUẬN

3.1. Kết quả

3.1.1. Mô hình toán học thu được

Mô hình QSAR là mô hình biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất. Mô hình QSAR được biểu diễn dưới dạng một phương trình toán học (1.4.2). QSAR sử dụng các TSPT, các kỹ thuật xác suất thống kê và trí tuệ nhân tạo để xây dựng các mô hình. QSAR được xây dựng dựa trên giả thuyết là cấu trúc của một phân tử phải chứa những đặc điểm cấu trúc liên quan tới tính chất hóa học, vật lý, sinh học và dựa trên khả năng các mô tả phân tử. Bởi các mô hình QSAR, hoạt tính sinh học của một phân tử mới hoặc chưa được kiểm nghiệm có thể được suy ra từ cấu trúc của các hợp chất tương tự trong đó tính chất của ch ng đã được kiểm nghiệm [37].

Phương pháp QSAR xây dựng các mô hình toán học nhằm dự đoán hoạt tính của các hợp chất dựa trên cấu trúc hóa học của chúng, là các kỹ thuật nhằm dự đoán các kết quả trước khi các thử nghiệm được tiến hành trong phòng thí nghiệm. QSAR cung cấp thông tin dự đoán về kết quả có thể có của một thử nghiệm nào đó và khả năng mới này cung cấp các yếu tố liên quan để thiết lập thứ tự ưu tiên cho một chất mới cho các thử nghiệm [35].

Như vậy, để có thể xây dựng được các mô hình này thì cả cấu trúc và hoạt tính đều phải được định lượng hóa. Trong nghiên cứu này, các cấu trúc được định lượng thông qua các TSPT (biến x), biến Y là giá trị logIC50 với IC50 là nồng độ ức chế 50% hoạt tính của enzym HDAC2, được đánh giá bằng các phương pháp nghiên cứu thực nghiệm sử dụng Kit định lượng Bioscence®). Giá trị logIC50 thu được bằng cách xử lí dữ liệu IC50 bằng phần mềm Microsoft Excell 2007. IC50 càng nhỏ hoạt tính ức chế enzym HDAC2 của chất đó càng mạnh.

- Tính toán TSPT: Tham số mô tả phân tử là một số thu được từ một quá trình toán học và lôgic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học [37]. Trong nghiên cứu này, các tham số được tính toán sử dụng phần

mềm Dragon [37]. Dragon là một phần mềm được phát triển bởi công ty Talete của Italia vào năm 1993, được sử dụng rất rộng rãi hiện nay trong các nghiên cứu hóa tin và thiết kế thuốc. Dragon tính toán được hơn 5000 TSPT khác nhau . Các mô tả phân tử thường được phân loại dựa vào chiều thông tin mô tả cấu trúc. (i) Tham số 0D mô tả thành phần cấu tạo nên cấu trúc, còn được gọi là các tham số đếm nguyên tử, như số lượng C, N... (ii) Tham số 1D mô tả cấu tr c dưới dạng chuỗi, như vân tay cấu trúc (fingerprint), hay số lượng các mảnh cấu tr c, như số lượng nhân thơm, nhóm carboxylic... (iii) Tham số 2D mô tả cấu tr c dưới dạng hình học topo, cho phép xác định chính xác thứ tự, vị trí của nguyên tố hay mảnh cấu trúc trong phân tử. Các tham số 2D thường được tính toán dựa trên lý thuyết về graph. (iii) Tham số 3D mô tả đặc điểm cấu trúc của phân tử trong không gian. Các tham số 3D có thể được tính toán dựa trên các phương pháp l thuyết như MoRSE, GETAWAY, tính toán lượng tử, mô tả bề mặt hoặc thể tích phân tử...

Trong nghiên cứu này chúng tôi lựa chọn tham số phân tử 2D để mô tả cấu trúc các hợp chất. Bởi so với các mô tả phân tử 3D thì mô tả phân tử 2D không cần tới các thông tin về cấu trúc 3D của phân tử, có tính ổn định cao hơn do các hợp chất được mô tả dưới dạng 3D thường có độ linh động về cấu dạng.

Kết quả: Sử dụng phần mềm Dragon 6.0 tính toán được 3764 TSPT cho mỗi phân tử trong CSDL. Sau khi xử lí loại bỏ TSPT gây nhiễu, 1632 TSPT còn lại được kiểm tra quan hệ phi tuyến với biến đáp ứng LogIC50. Cuối cùng các hợp chất được tính toán với 534 TSPT 2D và lưu dưới dạng file.txt.

- Phân chia tập huấn luyện / tập kiểm tra

Sử dụng phương pháp phân chia ngẫu nhiên chia 45 hợp chất trong CSDL thành 34 hợp chất được phân vào tập huấn luyện, 11 hợp chất được phân vào tập kiểm tra.

- Xây dựng mô hình: Lựa chọn tham số phân tử bằng phương pháp thuật giải di truyền sử dụng phần mềm Mobydigs 1.0. Sau đó xây dựng mô hình QSAR trên tập huấn luyện bằng phương pháp MLR sử dụng phần mềm

STATISTICA 10.0 để xác định tương quan hoạt tính ức chế với tham số mô tả phân tử Dragon.

 Lựa chọn TSPT thích hợp: tất cả các biến không phải được đưa hết vào mô hình. Mặc dù việc thêm biến độc lập vào làm tăng hệ số tương quan R2, nhưng nó chỉ tốt khi chúng có liên hệ mạnh với biến phụ thuộc. Mô hình được chọn ứng với mô hình có Q2 cao nhất. Thực hiện thuật giải di truyền để chọn mô hình có các biến tối ưu bằng phần mềm Mobydigs 1.0.

Thuật giải di truyền dựa trên cơ chế của chọn lọc tiến hóa trong tự nhiên: “Trong mọi thế hệ, một tập mới các sinh vật được tạo ra bằng cách lai ghép những nhân tố thích hợp nhất với môi trường của những sinh vật trong thế hệ cũ cùng với sự xuất hiện đột biến ngẫu nhiên của các cá thể trong thế hệ mới”. Vận dụng cơ chế này, đầu tiên thuật toán sẽ mã hoá tất cả các tham số của cấu tr c ban đầu trong một nhiễm sắc thế - biểu diễn bằng một vec tơ. Từ nhiễm sắc thể ban đầu này, tạo ngẫu nhiên một quần thể. Quần thể này được đánh giá và từ đó các nhiễm sắc thể thích nghi nhất (tức là có hàm mục tiêu Q2 cao nhất) được chọn làm khung để tạo ra quần thể tiếp theo. Quy trình này làm tăng Q2 của toàn bộ nhiễm sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi từ một quần thể này sang một quần thể khác. Sau một số chu kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm được một nhiễm sắc thể (mô hình) phù hợp với giá trị Q2 cao nhất.

Các bước thực hiện thuật giải di truyền:

(1). Khởi tạo một quần thể ban đầu (file đầu vào được lưu dưới dạng file.mdd chứa các dữ liệu về tên, các mô tả phân tử được tính toán bằng phần mềm Dragon 6.0, giá trị log IC50 của các hợp chất trong tập huấn luyện).

(2). Xác định hàm mục tiêu (fitness) cho mỗi cá thể trong quần thể.

Hàm mục tiêu trong nghiên cứu này là giá trị Q2.

(3). Tạo ra quần thể mới bằng cách lai ghép chéo (crossver) từ các cá thể hiện tại có chọn lọc (selection), đồng thời tạo ra các đột biến (mutation) trong quần thể mới theo một xác suất nhất định. Quá trình này thực hiện thông qua cài đặt giải thuật di truyền (Genetic Algorithm set up).

(4). Các cá thể trong quần thể mới được sinh ra thay thế cho các cá thể

trong quần thể cũ.

(5). Nếu điều kiện dừng, giải thuật dừng lại và trả về cá thể tốt nhất

cùng với giá trị hàm mục tiêu của nó.

Kết quả đã lựa chọn được 6 tham số mô tả phân tử có thể xây dựng mô hình tốt nhất. Đó là ATS8m, JGI10, SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm), B06[N-O].



Lập mô hình với số biến đã chọn bằng phương pháp hồi qui đa biến tuyến tính (MLR) bằng phần mềm STATISTICA 10.0. MLR là một trường hợp rất phổ biến trong thực tế, là tổ hợp tuyến tính giữa các biến phụ thuộc (Y) với nhiều biến độc lập (x). Trong nghiên cứu này x chính là các TSPT đặc trưng cho cấu trúc các hợp chất trong CSDL, Y là giá trị logIC50 với IC50 là nồng độ ức chế 50% hoạt tính của enzyme HDAC2. Phân tích hồi qui bao hàm cả nghĩa “ước tính” (Estimating) hay “dự đoán” (Predictive) vì sau khi sự tương quan tuyến tính giữa x và Y được thiết lập bởi một biểu thức toán học cụ thể người ta có thể ước tính hay dự đoán giá trị của Y từ một giá trị của x. Đường biểu diễn biểu thức toán học ấy được gọi là đường hồi qui của Y theo x.

Kết quả mô hình MLR xây dựng được gồm 6 biến TSPT như sau:

LogIC50 = 2.808 + 0.064×ATS8m – 230.167×JGI10 –

1.072×SM15_AEA(bo) – 2.821×SM08_AEA(dm) + 3.519×SM09_AEA(dm) – 0.700×B06[N-O]

(3.1)

Trong đó ATS8m, JGI10, SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm), B06[N-O] là các biến tham số phân tử 2D. Hệ số của biến mang dấu (+), giá trị biến TSPTcàng lớn thì logIC50 càng lớn, IC50 càng lớn chứng tỏ hoạt tính ức chế enzyme HDAC2 của chất đó càng nhỏ. Và ngược lại, hệ số biến mang dấu (-), giá trị biến TSPTcàng lớn thì logIC50 càng nhỏ, IC50 càng nhỏ, hoạt tính ức chế enzyme HDAC2 càng lớn.

3.1.2. Đánh giá mô hình theo các tiêu chí của OECD

Đánh giá mô hình QSAR là công việc quan trọng nhất quyết định việc mô hình xây dựng được có thể sử dụng để dự đoán sàng lọc hay không. Để sử dụng và được thông qua mô hình QSAR bởi các cơ quan quản lý, mô hình phải thỏa mãn các nguyên tắc, tiêu chí của OECD (Tổ chức kinh tế thế giới):

Tiêu chí 1: Toàn bộ CSDL đều sử dụng đích xác định là nồng độ ức chế 50% (IC50) enzym HDAC2 được tiến hành theo cùng một điều kiện thí nghiệm là sử dụng Kit định lượng Bioscence®.

Tiêu chí 2: Thuật toán áp dụng rõ ràng: Các phương pháp xây dựng mô hình trong nghiên cứu chúng tôi đã nêu rõ trong mục 2.2. Do tính rõ ràng và đ ng đắn của phương pháp mà mô hình có thể được sử dụng lặp lại để phát hiện các hợp chất mới ức chế HDAC2.

Tiêu chí 3: Xác định miền ứng dụng của mô hình.

Để đạt được khả năng dự đoán tốt trong sàng lọc ảo, việc xác định được

miền ứng dụng của mô hình QSAR là vô cùng cần thiết. Miền ứng dụng là

khoảng không gian cấu trúc bao gổm trong mô hình. Chỉ những dự đoán đối

với các hợp chất có cấu trúc nằm trong miền cấu trúc này mới đáng tin cậy.

Miền ứng dụng được xây dựng dựa trên mối quan hệ giữa phần dư

chuẩn (Standardized Residual) và giá trị “đòn bẩy” (Leverage) (ký hiệu là h)

tính được cho từng hợp chất. Biểu đồ dưới đây (Hình 3.1) cho thấy mối quan

hệ giữa phần dư chuẩn và giá trị h. Chỉ số h cho biết một chất có ảnh hưởng

tới không gian cấu trúc của biến như thế nào. Giá trị giới hạn của h gọi là h*,

h* là một ngưỡng quan trọng để tham chiếu các dự đoán bởi mô hình QSAR

cho hợp chất trong Tr và Te được tính toán theo công thức: h* = 3p/N, trong

đó p là số biến độc lập trong mô hình (3.1), N là số lượng quan sát trong tập

huấn luyện. Miền ứng dụng được xác định là phần giới hạn bởi khung vuông

± 3 phần dư chuẩn đối và h* bằng 0.6.

Hình 3.1. Miền ứng dụng của mô hình QSAR xác định hợp chất có khả năng ức chế HDAC2.

Sau khi tính toán tập huấn luyện, ta thấy 34/34 hợp chất đều nằm trong miền ứng dụng. Với tập kiểm tra, toàn bộ 11 hợp chất đều nằm trong miền ứng dụng, do đó có thể thấy các dự đoán của mô hình đối với tập kiểm tra là hoàn toàn đáng tin cậy.

Tiêu chí 4: Kết quả các đánh giá nội và ngoại được trình bày trong

bảng 3.1.

Bảng 3.1. Kết quả đánh giá nội và đánh ngoại mô hình QSAR.

Thông số R2 Q2 Q2

ext

0,89 0,81 0,85 Giá trị thực tế

Ta có R2 ~ 1,0 chứng tỏ độ chính xác của mô hình cao, Q2 = 0,81 cho thấy mô hình có độ ổn định tốt. Khả năng dự đoán nội 88,85% và khả năng dự đoán ngoại 84,64% cho thấy mô hình có khả năng dự đoán hoạt tính tốt.

Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ

chính xác, độ ổn định và khả năng dự đoán tốt.

Tiêu chí 5: Giải thích cơ chế của mô hình.

Mô hình QSAR có sự tham gia của 6 biến, là các tham số phân tử 2D.

Tham số phân tử 2D biểu diễn các cấu tr c theo kích thước, độ phân nhánh, và hình dạng tổng thể.

Các tham số phân tử 2D trong mô hình bao gồm ATS8m, JGI10,

SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm), B06[N-O]. Trong đó:

 ATS8m: mô tả tự tương quan Moreau-Broto (ATS) đại diện cho các tương tác giữa các nguyên tử ở khoảng cách topo 8, (lag 8) theo khối lượng nguyên tử. Giá trị này dương, hệ số của tham số mang dấu (+) chứng tỏ sự có mặt của các nguyên tử khối lượng càng lớn càng làm tăng tương tác và càng giảm hoạt tính ức chế.

 JGI 10: Chỉ số topo trung bình cụm 10. Hệ số của tham số này mang

dấu (+), vì vậy giá trị này càng cao càng làm giảm hoạt tính.

 Các tham số SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm) thuộc nhóm mô tả Edge adjacency indices. Việc giải thích các biến này gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi những hiểu biết chuyên sâu về hóa lượng tử. Bên cạnh đó chưa có nhiều tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích.

 B06[N-O] = 1 hoặc 0 nếu có mặt hoặc không có mặt khoảng cách giữa 2 nguyên tử Nitơ và Oxi là 6 liên kết (C-C). Hệ số B06[N-O] mang dấu (-) do đó nếu giá trị này bằng 1 sẽ làm tăng hoạt tính ức chế.

Như vậy mô hình thỏa mãn các tiêu chí đánh giá của OECD, do đó có thể ứng dụng mô hình này để ứng dụng vào dự đoán hoạt tính sinh học của các hợp chất thiết kế.

3.1.3. Sàng lọc ảo đánh giá khả năng ức chế HDAC2 sử dụng mô hình xây dựng đƣợc

Nghiên cứu sử dụng phương pháp sàng lọc các hợp chất ức chế HDAC2 sử dụng mô hình sàng lọc ảo. Hệ thống sàng lọc được định hướng phát triển theo các bước như hình 3.2 dưới đây.

CSDL PubChem

Tìm kiếm đồng dạng

QSAR

Hợp chất ức chế HDAC2

Hình 3.2. Tóm tắt quy trình sàng lọc in silico chất ức chế HDAC2 từ

CSDL PubChem.

Sàng lọc sử dụng tìm kiếm đồng dạng trên CSDL PubChem: PubChem (http://pubchem.ncbi.nlm.nih.gov/) một CSDL miễn phí về các cấu trúc hóa học, đặc tính và vai trò sinh học của các hợp chất hóa học và các chất nói chung. Các hợp chất có nguồn gốc từ khoảng hơn 80 nhà cung cấp, với khoảng 31 nghìn hợp chất. PubChem giúp tìm kiếm nhanh chóng các hợp chất hóa học dựa vào các phương pháp tìm kiếm theo sự tương đồng về cấu trúc. PubChem chứa thông tin về tên, tên gọi khác, các tính chất: cấu trúc hóa học, tên đoạn, cấu trúc hóa học, khối lượng phân tử, logP, và các liên kết cho và nhận hydrogen.

Để tìm kiếm trên PubChem, "structural query input" có thể là PubChem Identifier (CID – tên định danh trong PubChem), SMILES, Inchi. Trong nghiên cứu này, chúng tôi dùng SAHA là cấu trúc truy vấn. Bởi trong các nhóm chất ức chế histon deacetylase (HDAC), các acid hydroxamic là nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất. Do các acid hydroxamic có cấu tr c đơn giản, dễ tổng hợp và có nhóm -NHOH tạo được phức bền với Zn+ ở trung tâm hoạt động của HDAC mang lại có hoạt

tính ức chế enzym mạnh. Trên thực tế, FDA đã phê duyệt một acid hydroxamic UHDAC điển hình là vorinostat (suberoylanilide hydroxamic acid, Zolinza) vào năm 2006 sử dụng trong điều trị u lympho da tế bào [refractory cutaneous T-cell lymphoma (CTCL)]. Chính vì vậy SAHA được lựa chọn là cấu trúc truy vấn (chất mẫu), được sử dụng để sàng lọc các hợp chất có cấu tr c tương tự. Các chất này có cấu tr c tương tự SAHA hy vọng có tính chất hoặc hoạt tính sinh học giống SAHA.

Kỹ thuật tìm kiếm đồng dạng là kỹ thuật tìm kiếm các hợp chất có cấu trúc tương tự với hợp chất mẫu (SAHA) trên CSDL (Pubchem) về cấu trúc của các hợp chất. Kỹ thuật được tiến hành dựa trên nguyên tắc tương tự, theo đó những phân tử có cấu trúc tương tự nhau thường có đặc tính và hoạt động sinh học tương tự nhau. Các hợpchất được xếp hạng dựa trên sự tương đồng với chất mẫu. Độ tương đồng của một chất với chất mẫu có thể phản ánh khả năng có hoạt tính của chất đó.

Hệ số Tanimoto (Còn được gọi là hệ số Jaccard) là hệ số tương đồng được sử dụng để biểu diễn sự giống nhau giữa các chất của CSDL được sàng lọc và chất mẫu rộng rãi nhất trong hóa tin. Hệ số này được tính toán dựa trên công thức:

Hệ số Tanimoto =

Trong đó: là Số lượng các đặc tính xuất hiện trong cấu trúc A

là Số lượng các đặc tính xuất hiện trong cấu trúc B

NC là Số lượng các đặc tính xuất hiện trong cả 2 cấu trúc A và B

Sau khi tiến hành sàng lọc trên PubChem với dữ liệu đầu vào là công thức SMILES của SAHA thu được một dãy các dẫn chất hydroxamics có hệ số tương đồng Tanimoto ≥ 0.85. Lựa chọn ra 120 hợp chất chưa được nghiên cứu về tác dụng ức chế HDAC2. Đặc điểm các chất được nêu trong Phụ lục.

- Sau đó tính toán tham số phân tử cho các hợp chất được lựa chọn với các TSPT 2D là ATS8m, JGI10, SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm), B06[N-O] bằng phần mềm Dragon 6.0. Tiếp theo sử dụng

Từ kết quả sàng lọc này, chọn 10% các hợp chất có IC50 thấp nhất,

mô hình QSAR đã xây dựng được (3.1) để dự đoán hoạt tính cho chúng. Số liệu được xử lý bằng phần mềm Microsoft Excell 2007. Kết quả tính toán TSPT và dự đoán hoạt tính được nêu trong Phụ lục. - được nêu trong bảng 3.2 dưới đây.

Bảng 3.2. Kết quả sàng lọc ảo từ cơ sở dữ liệu PubChem.

Cấu trúc STT Mã CID IC50

(PubChem)

dự đoán (μM)

1 58624316 0.032781

2 20721667 0.0213922

3 85697302 0.012845

4 44359800 0.0231520

5 42637850 0.0326886

6 54753628 0.042486

7 14496775 0.0387043

8 0.0395340 0.0395340

9 88254626 0.003744

10 21302179 0.0380004

11 54077290 0.0240224

12 90889464 0.0044032

0.003756 13 70232351

0.0331159 14 4953736

0.265 SAHA

Như vậy so với SAHA, là một chất ức chế HDAC2 mạnh, đã được ứng dụng trong lâm sàng, các hợp chất sàng lọc được trên CSDL PubChem có hoạt tính ức chế HDAC2 cao hơn rất nhiều. Các hợp chất này là các hydroxamics có cấu tr c tương đồng với SAHA > 85%. Do đó các hơp chất này hoàn toàn có thể tổng hợp được và có nhiều tiềm năng phát triển thành thuốc chống ung thư.

Trong nghiên cứu này, mô hình QSAR xây dựng được giúp phát hiện các hợp chất mới có tiềm năng ức chế HDAC2 chỉ dựa trên thông tin cấu trúc phân tử. Mô hình in silico này có vai trò rất quan trọng trong việc sàng lọc nhanh và hiệu quả các hợp chất mới ngay cả khi ch ng chưa được tổng hợp hay phân lập giúp tiết kiệm thời gian, tiền bạc trong quá trình nghiên cứu, phát triển thuốc chống ung thư.

3.2. Bàn luận

3.2.1. Về mô hình QSAR

QSAR hiện nay đang là một kỹ thuật được ứng dụng trong rất nhiều các lĩnh vực như dược phẩm, y học, hóa học… Kỹ thuật này sử dụng các TSPT, các kỹ thuật xác suất thống kê và trí tuệ nhân tạo để xây dựng các mô hình. Mô hình xây dựng bằng phương pháp hồi quy đa biến tuyến tính, lựa chọn tham số phân tử bằng giải thuật di truyền. Phương pháp này gi p tối ưu hóa mô hình nhằm tìm ra mô hình biểu thị tốt nhất mối quan hệ giữa biến đáp ứng là các tham số phân tử.

Mô hình QSAR xây dựng được gồm 6 TSPT 2D. Tham số 2D mô tả cấu tr c dưới dạng hình học topo, cho phép xác định chính xác thứ tự, vị trí của nguyên tố hay mảnh cấu trúc trong phân tử. Mô tả phân tử 2D không cần tới các thông tin về cấu trúc 3D của phân tử, có tính ổn định cao hơn do các hợp chất được mô tả dưới dạng 3D thường có độ linh động về cấu dạng. Tuy nhiên, do không kết hợp phương pháp protein docking trong xây dựng mô hình QSAR nên không thu được thông tin cấu dạng, không xác định được cơ chế tương tác giữa các chất và enzyme HDAC2.

Bên cạnh đó xây dựng mô hình QSAR còn môt số hạn chế như CSDL thu thập được từ 6 bài báo khác nhau, do đó có thể gặp sai số trong xây dựng

mô hình QSAR; việc giải thích các biến TSPT đôi khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi những hiểu biết chuyên sâu về hóa lượng tử; bên cạnh đó chưa có nhiều tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích.

3.2.2. Về quy trình sàng lọc ảo.

Trong nghiên cứu này, tiến hành sàng lọc các hợp chất ức chế HDAC2 từ CSDL PubChem. Quá trình sàng lọc qua 2 bước cơ bản. CSDL PubChem sau khi sàng lọc bằng phương pháp “Tìm kiếm đồng dạng” với hệ số đồng dạng Tanimoto ≥ 0.85, dữ liệu đầu vào là cấu trúc dạng SMILE của SAHA. Kỹ thuật tìm kiếm đồng dạng là kỹ thuật tìm kiếm các hợp chất có cấu trúc tương tự với hợp chất mẫu (SAHA) trên CSDL (PubChem) về cấu trúc của các hợp chất. Kỹ thuật được tiến hành dựa trên nguyên tắc tương tự, theo đó những phân tử có cấu tr c tương tự nhau thường có đặc tính và hoạt động sinh học tương tự nhau. Các hợpchất được xếp hạng dựa trên sự tương đồng với chất mẫu. Độ tương đồng của một chất với chất mẫu có thể phản ánh khả năng có hoạt tính của chất đó. Kết quả qua phương pháp “tìm kiếm đồng dạng” là một dãy dẫn chất Hydroxamics có cấu tr c tương đồng với SAHA ≥ 0.85. Lựa chọn 120 chất chưa được nghiên cứu về tác dụng ức chế enzym HDAC2 tiếp tục sàng lọc qua mô hình QSAR xây dựng được nhằm dự đoán nồng độ ức chế 50% HDAC2 (IC50). Từ đó tìm được các hợp chất có hoạt tính ức chế HDAC2 dự đoán mạnh nhất có tiềm năng phát triển thành thuốc chống ung thư.

Như vậy từ một CSDL lớn (hơn 31 nghìn chất) qua hệ thống sàng lọc này đã sàng lọc được một tập hợp nhỏ các hợp chất có tiềm năng ức chế enzym HDAC2. Phương pháp này giúp ích nhiều cho việc phát hiện các hợp chất mới có hoạt tính sinh học ngay cả trước khi ch ng được tổng hợp hay phân lập. Từ đó gi p tiết kiệm rất nhiều thời gian và công sức và tiền bạc cho các khâu của quá trình nghiên cứu và phát triển một thuốc mới.

Bên cạnh những ưu điểm trên,mô hình sàng lọc ảo cũng còn gặp một số khó khăn như không tiến hành sàng lọc qua Docking nên không xác định

khả năng tương tác của hợp chất sàng lọc với enzyme HDAC2, không tìm hiểu được cơ chế ức chế HDAC2.

KẾT LUẬN VÀ KIẾN NGHỊ

KẾT LUẬN

Từ những kết quả nghiên cứu đã trình bày trên đây ch ng tôi r t ra các

kết luận sau:

1. Nghiên cứu đã xây dựng thành công mô hình toán học biểu diễn mối quan hệ định lượng giữa cấu trúc và tác dụng ức chế enzyme HDAC2 có phương trình:

LogIC50 = 2.808 + 0.064×ATS8m – 230.167×JGI10 –

1.072×SM15_AEA(bo)– 2.821×SM08_AEA(dm) + 3.519×SM09_AEA(dm) – 0.700×B06[N-O]

2. Nghiên cứu đã đánh giá mô hình xây dựng được theo các nguyên tắc của OECD với R2=0.89, Q2= 0.81, khả năng dự đoán nội 88,85% và khả năng dự đoán ngoại 84,64%. Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độ ổn định và khả năng dự đoán tốt. Mô hình xây dựng được có thể được ứng dụng để sàng lọc các CSDL lớn nhằm tìm kiếm các hợp chất ức chế HDAC2. 3. Nghiên cứu đã sàng lọc được 120 hợp chất từ CSDL Pubchem, 14 trong số đó có hoạt tính mạnh tương đương hoặc hơn SAHA, một thuốc ức chế HDAC đang lưu hành trên thị trường. Đặc biệt, có 3 hợp chất mạnh hơn SAHA 60 -70 lần và chưa từng được nghiên cứu tác dụng chống ung thư. Các hợp chất này có tiềm năng phát triển thành thuốc chống ung thư mới.

KIẾN NGHỊ

Để tiếp tục phát triển các kết quả nghiên cứu của khóa luận trong tìm kiếm các hợp chất có hoạt tính sinh học ức chế HDAC2 cao, chúng tôi xin đưa ra các đề xuất sau:

1. Nghiên cứu bằng phương pháp Docking phân tử để tìm hiểu cơ chế ức chế HDAC2 của 14 hợp chất sàng lọc được.

2. Đánh giá hoạt tính sinh học ức chế HDAC2 của các hợp chất đó trên in vitro.

TÀI LIỆU THAM KHẢO

Tài liệu Tiếng Việt

1. Nguyễn Bá Đức (2001), "Bài giảng UNG TH HỌC", NXB Y Học.

Tài liệu Tiếng Anh

2. Anand P., Kunnumakkara A. B., Sundaram C., Harikumar K. B, Tharakan S. T., Lai O. S. and Sung B. B. (2008), "Cancer is a preventable disease that requires major lifestyle changes", Pharm Res 25(9), 2097 - 2116.

Andrea M., Viviana C., Manuela P. and Todeschini R. (2006), "DRAGON SOFTWARE: an easy approach to molecular descriptor and calculator", MATCH Commun. Math. Comput. Chem. 56, 237-248.

Andrianov V., Gailite V., Lola D., Loza E. and Semenikhina V. (2009), "Novel amide derivatives as inhibitors of histone deacetylase: design, synthesis and SAR", Eur J Med Chem. 44.

Bae H. and Nam S. W. (2014), "HDAC2 (histone deacetylase 2)", Atlas Genet Cytogenet Oncol Haematol 18, 594-597.

Bernstein B. E. and Tong J. K. (2000), "Genomewide studies of histone deacetylase function in yeast", Proc Natl Acad Sci U S A. 97(25), 13708-13.

Bertrand P. (2010), "Inside HDAC with HDAC inhibitors", Eur J Med Chem. 45(6), 2095-116.

Chun P. (2011), "Synthesis and Importance of Bulky Aromatic Cap of Novel SAHA Analogs for HDAC Inhibition and Anticancer Activity", Bulletin of the Korean Chemical Society. 32(6), 1891-1896.

9. Chueh A. C. (2015), "Mechanisms of Histone Deacetylase Inhibitor- Regulated Gene Expression in Cancer Cells", Antioxid Redox Signal. 23(1), 66-84.

10. Claude B. (2005), "Histone deacetylase inhibitors", Eur J Med Chem.

40, 1-13.

11. Dallavalle S., Cincinelli R., Vesci L. and Barbarino M. (2009), "Design, synthesis, and evaluation of biphenyl-4-yl-acrylohydroxamic acid derivatives as histone deacetylase (HDAC) inhibitors", Eur J Med Chem, 1-13.

12.

de Martel C., Ferlay J., Franceschi S., Vignat J., Bray F. and Forman D. M. (2012), "Global burden of cancers attributable to infections in 2008: a review and synthetic analysis.", The Lancet Oncology. 13(6), 607 - 615.

13.

de Ruijter A. J., van Gennip A. H., Caron H. N. and Kemp S. (2003), "Histone deacetylases (HDACs): characterization of the classical HDAC family", Biochem J. 370(Pt 3), 737-49.

14. Do T. M. Dung (2015), "Novel 3-substituted-2-oxoindoline-based N- hydroxypropenamides as Histone Deacetylase Inhibitors and Antitumor Agents", Medicinal Chemistry. 11(8), 725-735.

15. Do Thi Mai Dung, Phan Thi Phuong Dung, Dao Thi Kim Oanh, Tran Khac Vu, Hyunggu Hahn, Byung Woo Han, Minji Pyo, Young Guk Kim, Sang-Bae Han and Nam, N.H. (2015), "Exploration of novel 5'(7')-substituted-2'-oxospiro[1,3]dioxolane-2,3'-indoline-based N- hydroxypropenamides as histone deacetylase inhibitors and antitumor agents", Arabian Journal of Chemistry.

16. Dokmanovic M. (2005), "Prospects: histone deacetylase inhibitors", J

Cell Biochem. 96(2), 293-304.

17. Edwardand C. (2000), "Histone deacetylase transcriptional control and

cancer", Journal of cenlular Physyology. 184(1), 1-16.

18. Eric V. (2006), "Histone Deacetylases Transcriptional Regulation and

Other Cellular Functions".

19. Han van de W. (1995), "Chemometric methods in molecular design",

New York: Wiley-VCH.

20.

John J. I. and Shoichet B. K. (2005), "ZINC – A Free Database of Commercially Available Cosmpounds for Virtual Screening", J Chem Inf Model. 45(1).

21.

Johnstone R. W.(2002), "Histone-deacetylase inhibitors: novel drugs for the treatment of cancer", Nat Rev Drug Discov. 1(4), 287-299.

22. Kamb A., Wee S. and Lengauer C. (2007), "Why is cancer drug

discovery so difficult?", Nat Rev Drug Discov. 6(2), 115-120.

23. Kim S., Thiessen P. A., Bolton E. E., Chen J., Fu G., Gindulyte A., Han L., He J., He S., Shoemaker B. A., Wang J., Yu B., and Zhang J. (2016), "PubChem Substance and Compound databases", Nucleic Acids Res. 44.

24. Lai M.J. (2012), "Synthesis and Biological Evaluation of 1- Arylsulfonyl-5-(N-hydroxyacrylamide)indoles as Potent Histone Deacetylase Inhibitors with Antitumor Activity in Vivo", Medicinal Chemistry. 55(8), 3777–3791.

25. Lee Y. H., Seo D., Choi K. J., Andersen J. B., Won M. A., Kitade M., Gomez-Quiroz L. E., Judge A. D., Marquardt J. U., Raggi C,. Conner E. A., MacLachlan I. and Factor V. M. (2014), "Antitumor effects in hepatocarcinoma of isoform-selective inhibition of HDAC2", Cancer Res. 74(17), 4752-61.

26. Marson C. M., Mahadevan T., Dines J., Sengmany S., Morrell J. M., Alao J. P., Joel S. P. and Vigushin D. M. (2007), "Structure-activity relationships of aryloxyalkanoic acid hydroxyamides as potent inhibitors of histone deacetylase", Bioorg Med Chem Lett. 17(1), 136- 41.

27. Müller B. M., Jana L., Kasajima A., Lehmann A., Prinzler J., Budczies J., Winzer K. J., Dietel M. and Weichert W. (2013), "Differential expression of histone deacetylases HDAC1, 2 and 3 in human breast cancer - overexpression of HDAC2 and HDAC3 is associated with clinicopathological indicators of disease progression", BMC Cancer. 13, 215-220.

28. Organisation for Economic Co-operation and Developme (2007), "Guidance Document on the Validation of (Q)SAR Models ", Environment directorate joint meeting of the chemicals committee and the working party on chemicals, pesticides and biotechnology.

29. Pawan K. and Sasazuki T. (2008), "HDAC2 deficiency sensitizes colon cancer cells to TNFα-induced apoptosis through inhibition of NF-κB activity", Experimental Cell Research. 314(7), 1507–1518.

30. Pingyuan W., Zhiqing L. and Chen H. (2009), "Sulfamides as novel histone deacetylase inhibitors", Bioorganic and Medicinal Chemistry Letters. 17, 1123-1128.

31. Roperoand Santiago (2007), "The role of histone deacetylases

(HDACs) in human cancer", Molecular Oncology. 1, 19-25.

32. Roth S. Y. (2001), "Histone acetyltransferase", Annu.Rev.Biochem.

(120, 81-120e).

33. Stefan B., "Short Manual to the Chemical Drawing Program

ChemDraw®", IfC Department of Chemistry.

34. Sento E. and Glozak M. A. (2007), "Histone deacetylases and cancer",

Oncogene. 26, 5420-5432.

35. The Chemicals Committee and Working Party on Chemicals.(2004), "OECD Principles for the Validation, for Regulatory Purposes, of (Quantitative) Structure-Activity Relationship Models".

36. Thaler F. (2013), "Synthesis and biological characterization of spiro[2H-(1,3)-benzoxazine-2,40-piperidine] based histone deacetylase inhibitors", European journal of medicinal chemistry. 64, 273-84.

37. Todeschini R. and Consonni V. (2000), "Handbook of Molecular

Descriptors 1st", Federal Republic of Germany. 11.

38. Tran T.L. Huong. (2015), "Novel 2-oxoindoline-based hydroxamic acids: Synthesis, cytotoxicity and inhibition of histone deacetylation", Tetrahedron Letters Tetrahedron Letters. 56(16), 6425–6429.

39. WHO, "Cancer Country Profiles, Vietnam, 2014".

40. WHO (2014), "World Cancer Report".

41. Yoshida M., Kijima M., Akita M. and T, B. (1990), "Potent and specific inhibition of mammalian histone deacetylase both in vivo and in vitro by trichostatin A", J Biol Chem. 265(28), 17174-9.

42. Zhang L., Fang H. and W X. (2010), "Strategies in developing inhibitors", Medicinal Research

promising histone deacetylase Reviews. 30(4), 585-602.

43. Zhang L., Han Y. and Q J. (2015), "Trend of Histone Deacetylase Inhibitors in Cancer Therapy: Isoform Selectivity or Multitargeted Strategy", Medicinal research reviews. 35, 63-84.

PHỤ LỤC

Bảng . Sàng lọc CSDL Pubchem các hợp chất giống SAHA (Tanimoto similarity index ≥ 0.85), tính toán tham số phân tử và dự đoán hoạt tính bằng mô hình (3.1)

Cấu trúc JGI10 SM15_

ST T Mã CID ATS 8m B06 [N-O] IC50dự đoán (μM)

SM08_ AEA (dm) SM09_ AEA (dm) AEA (bo) (https://pubchem.ncbi.nlm .nih.gov/compound/)

0.003 -1 -1.282 0 0.4347064 1 10039224 2.865 1

2.94 0.006 -1 -1 0 0.6070787 1 58833044

3 s 0.006 1 -1.179 -1.385 0 0.1895215 87072389 2.784

0.005 0.532 -1.529 -1.796 0 0.2748285 71661014 2.616

0.007 1 -1.167 -1.333 0 0.1758513 46205431 2.882

0.008 1 -1 -1.3 0 0.0824400 53302622 2.992

0.007 1.049 -1.171 -1.373 0 0.1394253 9838671 2.887

0.005 1.049 -1.172 -1.414 0 0.2265910 59507279 2.887

0.007 1 -1 -1.178 0 0.1833417 88576450 2.865

0.008 0.726 -1.549 -1.806 0 0.0847290 66894183 2.711 10

0.004 1.532 0.347 0.111 0 1.0217461 24861500 4.074

0.008 1 -1.193 -1.62 0 58624316 2.683

12 0.032781

0.005 1 -1 -1.173 0 0.3659117 10516731 2.865

2.98 0.006 1.066 -1.169 -1.368 0 0.2061343 85697273

2.98 0.006 1.061 -1.164 -1.229 0 0.3832203 85697290

2.98 0.006 1.049 -1 -1.172 0 0.2664222 85697309

0.1298851 23075284

17 2.98 0.008 1.063 -1.166 -1.321 0

0.006 1.049 -1 -1.171 1 0.0213922 20721667 2.924

0.006 1 -1.172 -1.414 0 0.1726303 44456995 2.877

0.005 1.049 -1.172 -1.414 0 0.2240354 85697255 2.871

0.006 1.043 -1 -1 0 0.6242240 85697257 3.065

2.98 0.008 1.056 -1.149 -1.201 0 0.2119347 20721673

0.008 0.325 -1.766 -1.946 1 85697302 2.463

23 0.012845

0.1661152 23399147 24 3.065 0.009 1.064 -1.141 -1.185 0

0.007 0.608 -1.774 -1.94 0 0.1443687 14496776 2.378

0.007 0.181 -1.939 -2 0 0.3368304 57426850 2.199

0.007 0.349 -1.779 -1.948 0 0.2003737 70379132 2.348

0.003 1 -1 -1.282 0 0.4347064 44359674 2.865 28

1 2.94 0.006 -1 -1 0 0.6070787 44359673

1 0.008 -1 -1.3 0 0.0790071 44431491 2.932

1 0.006 -1 -1.349 0 0.1250892 59835569 2.952

4.01 0.01 1.584 -1 -1 0 0.1492143 56951447

0.006 1 -1.163 -1.358 0 0.2132279 23557326 2.865

0.004 1 -1 -1 0 1.1801555 52936399 2.935

0.01 -1 -1.414 0 0.0231520 1 44359800 2.875

0.004 -1 -1 0 1.2314345 1 85905437 2.995

0.007 1.075 -1 -1.171 0 0.1961748 85697276 3.065

0.008 1 -1.193 -1.62 0 0.0326886 42637850 2.679

0.1167208 24284701

39 2.88 0.006 1 -1 -1.353 0

0.004 0.731 -1.567 -1.799 0 0.3261645 14496777 2.593

2.69 0.003 0.879 -1.38 -1.63 0 0.4118330 14496778

0.007 0.181 -1.939 -2 0 0.3423673 564390 2.222 42

0.003 0.794 -1.597 -1.816 0 0.4245148 68394755 2.563 43

0.008 -1 -1.41 0 1 54753628 2.763

44 0.042486

0.006 -1 -1.325 0 0.1425234 1 71459490 2.982

0.007 1.049 -1 -1 0 0.4610862 46205757 3.121

0.005 1 -1 -1 0 0.8854045 56668788 3.001

3.06 0.006 1.03 -1 -1 0 0.6335470 44431497

0.006 1.733 0.958 0.606 0 0.2773072 52950298 3.763 49

0.005 1.414 -0.283 -0.586 0 0.2389080 71712264 3.267

0.006 -1 -1.349 0 0.1261578 1 89108892 2.964

0.006 -1 -1.349 0 0.1261578 1 88272607 2.964

3.01 0.006 1.049 -1 -1 0 0.5952860 11232029

2.94 0.006 -1 -1.171 0 0.2788060 1 71376590

0.006 -1 -1.349 0 0.1253555 1 88272608 2.955

0.007 0.81 -1.38 -1.598 0 0.1486498 44359788 2.795 56

0.006 1.074 -1 -1.17 0 0.2756449 85697281 3.065

0.006 1.088 -0.824 -1.17 0 0.1359989 85697284 3.065

0.005 1.354 -1 -1 0 0.5804522 9543542 3.111 59

0.006 -1 -1.39 0 0.0962167 1 54789249 2.845

0.007 -1 -1 0 0.4331006 1 54789247 2.935

0.009 1 -1.185 -1.34 0 0.0881255 68232694 2.796

0.004 1 -1.277 -1.414 0 0.4732568 14496779 2.779

0.007 0.349 -1.779 -1.948 0 0.2008003 19422086 2.351

0.009 0.242 -1.776 -1.944 0 0.1236229 17607862 2.387

0.004 0.525 -1.791 -1.949 0 0.4932942 24710930 2.496 66

0.005 1 -1 -1.133 0 0.4612942 71354457 2.935

0.004 0.525 -1.791 -1.949 0 0.4839423 23428 2.469 68

0.003 0.794 -1.597 -1.816 0 0.4290529 5196616 2.578 69

0.004 1 -1 -1.414 0 0.1577748 207164 2.754 70

0.012 0.438 -1.927 -2 0 0.0387043 14496775 2.082

0.007 0.181 -1.939 -2 0 0.3344511 42637654 2.189 72

0.012 -0.126 -2 0 0 977.4688919 57426849 2.017

0.007 1.049 -1 -1 1 0.0395340 46205758 3.164

0.005 1 -1 -1 0 0.8948695 54753629 3.016

0.007 1.21 -1 -1 0 0.3746286 16739374 3.149

0.007 1 -1 -1.102 0 0.2857221 44431493 3.003

0.006 1.03 -1 -1 0 0.6376020 44431496 3.069

0.004 1.242 -0.84 -1 0 0.5570702 56658395 3.239

0.008 0.821 -1.324 -1.389 0 0.2355086 59567106 2.904 80

0.2288591 102191201

81 2.882 0.007 1 -1.329 -1.414 0

0.007 1 -1 -1.502 1 88254626 2.964

82 0.003744

0.003 1 -1 -1.282 0 0.4402888 44415994 2.883 83

4119737

84 2.514 0.007 0.884 -1.656 -1.801 0 0.127857

0.004 1.262 -1 -1 0 0.9000322 54508233 3.075 85

0.006 1 -1.172 -1.414 0 0.1602474 91172933 2.772

0.005 1.414 -0.235 -0.503 0 0.2773776 81275 3.209

0.002 1.404 -0.331 -0.82 0 0.2532248 252600 3.153 88

0.006 1.028 -0.75 -0.77 0 0.7647220 4351049 3.221

0.006 1.388 -0.596 -1 0 0.0808510 15560754 3.093

0.007 -1 -1.512 0 0.0380004 1 21302179 2.789

0.006 -1 -1.176 1 0.0240224 1 54077290 3.022

0.006 1.155 -1 -1 0 0.5103040 58660950 3.004

0.009 1 -1.403 -1.642 1 0.0044032 90889464 2.816

0.006 1 -1 -1 0 0.5959920 3597078 2.914

0.004 1.01 -1 -1 0 1.2642211 3382807 3.052

0.006 1.024 -1 -1 0 0.6407555 17202535 3.064

0.005 1 -1 -1 0 0.8754187 17204914 2.985

0.011 0.731 -1.414 -1.55 0 0.0623897 36656244 2.803 99

70232351

100 2.862 0.008 1 -1 -1.412 1 0.003756

0.005 1.597 0.244 0.103 0 0.7060332 101030013 3.638 101

2.6 0.006 0.54 -1.536 -1.804 0 0.1906166 43125168

102

0.008 1 -1.193 -1.62 0 0.0326423 59838335 2.677

103

0.003 1.414 -0.147 -0.481 0 0.4512904 4518322 3.296 104

3.19 0.004 1.307 -0.537 -0.75 0 0.4694463 3833468

105

0.003 1.45 0.02 -0.298 0 0.5326504 71344197 3.346 106

0.003 0.794 -1.597 -1.816 0 0.4314930 71376591 2.586 107

0.005 0.804 -1.338 -1.61 0 0.2192940 65450231 2.697

108

0.003 1.414 -0.147 -0.481 0 0.4468337 71402929 3.282

109

0.008 0.726 -1.549 -1.806 0 0.0834179 89974472 2.689 110

0.004 0.525 -1.791 -1.949 0 0.4754412 89556224 2.444 111

0.003 1 -1.313 -1.652 0 0.2395842 203897 2.677 112

0.004 -1 -1.139 0 0.5898757 1 94794 2.849 113

0.004 -1 -1.414 0 0.1592355 1 3624549 2.767 114

0.003 1 -1 -1 0 1.6367313 4195216 2.925 115

0 -0.131 -2 0 0 52941.67496 20721653 1.982 116 10

0.009 0.706 -1.251 -1.681 0 0.0331159 4953736 2.655

117

0.006 0.709 -1.249 -1.406 0 0.3323904 1718311 2.746

118

0.003 1 -1.478 -1.69 0 0.3877590 13311491 2.692

119

2.93 0.005 1 -1 -1.133 0 0.4596620 102095300

120