LỜI CAM ĐOAN

Tôi cam đoan luận án này là kết quả nghiên cứu thực sự của cá nhân dưới sự

hướng dẫn của PGS.TS. Phạm Văn Tất, trường Đại học Hoa Sen và PGS. TS. Trần

Dương, trường Đại học Sư Phạm – Đại học Huế.

Luận án được thực hiện tại trường Đại học Khoa Học – Đại học Huế. Chưa từng

có kết quả nghiên cứu tương tự được công bố dưới bất cứ hình thức nào trước khi

thực hiện luận án. Một phần kết quả của công trình này đã được công bố trên: Tạp

chí Hóa học và Ứng dụng, Tạp chí Hóa học, Tạp Chí Khoa học và Công nghệ -

trường Đại học Khoa học – Đại học Huế, Tạp chí Đại học Huế, Tạp chí

Computational Chemistry, Cogent Chemistry, Taylor Francis, Tạp chí Organic &

Medicinal Chemistry International Journal (OMCIJ), Tạp chí Natural products

research.

Ký tên

Bùi Thị Phương Thúy

i

LỜI CẢM ƠN

Để hoàn thành luận án trước hết em xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS.

Phạm Văn Tất, Trường Đại học Hoa Sen; PGS. TS. Trần Dương, Trường Đại học

Sư Phạm Huế đã giao đề tài, hướng dẫn trực tiếp và truyền đạt những kinh nghiệm

và kiến thức quý báu, tận tình chỉ dẫn, động viên và tạo mọi điều kiện thuận lợi giúp

đỡ em hoàn thành luận án này.

Em xin gửi lời cảm ơn chân thành đến GS.TS. Trần Thái Hòa, TS. Trần Xuân

Mậu, TS. Nguyễn Thị Ái Nhung - Khoa Hóa, Trường Đại học Khoa Học Huế. Các

thầy cô đã giúp đỡ, động viên và chỉ dạy nhiều kiến thức quý báu trong quá trình

em học tập tại trường.

Em xin gửi lời cảm ơn các Thầy Cô trong Khoa Hóa, các Thầy Cô trong Khoa

Sau đại học và toàn thể Ban Giám hiệu Trường Đại học Khoa Học Huế đã cho phép

và tạo mọi thuận lợi cho em hoàn thành luận án này.

Em xin gửi lời cảm ơn đến TS. Phùng Văn Trung, TS. Hoàng Thị Kim Dung

Viện Hoá học – Viện Hàn lâm Khoa học và Công nghệ Việt Nam TP. Hồ Chí Minh

đã giúp đỡ em trong quá trình làm luận án.

Em xin gửi lời cảm ơn đến PGS.TS. Nguyễn Hùng Huy, Khoa Hoá, Trường Đại

học Khoa học Tự Nhiên – ĐHQGHN đã giúp đỡ, tận tình chỉ dẫn em trong quá

trình làm luận án.

Tôi xin gửi lời cảm ơn chân thành gia đình, bạn bè đã động viên, giúp đỡ cho tôi

hoàn thành luận án này.

Ký tên

Bùi Thị Phương Thúy

ii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

ANOVA Phân tích phương sai

ARE, % Giá trị tuyệt đối của sai số tương đối

Bond Liên kết

Cal Tính toán (Calculation)

SKC Sắc kí cột

1H-1H (Correlation Spectroscopy)

COSY

d Đỉnh đôi (doublet)

dd Mũi đôi của mũi đôi (duplet of duplet)

DEPT Phổ DEPT (Distortionless Enhancement by Polarisation Transfer)

DMSO Dimethyl sulfoxide (CH3)2S=O

Exp Thực nghiệm (Experiment)

EtOAc Ethyl acetate (CH3COOC2H5)

EtOH Ethanol (C2H5OH)

E-State Trạng thái điện tử (electrotopological state)

Nồng độ thuốc ức chế 50% sự phát triển của tế bào gây ung thư GI50 (50% Growth Inhibition)

pGI50 pGI50= -log(GI50)

pGI50,exp Giá trị pGI50 thực nghiệm

pGI50,pr Giá trị pGI50 dự đoán

Phổ tương tác đa liên kết hai chiều dị hạt nhân (Heteronuclear HMBC Multiple Bond Vorrelation)

Phổ tương tác hai chiều trực tiếp dị hạt nhân (heteronuclear single HSQC quantum coherence)

HPV Vi rút u nhú ở người (Human Papillomavirus)

IR Phổ hồng ngoại (Infrared Spectroscopy)

iii

LV Biến ẩn (Latent Variables)

LogP Giá trị logarit hệ số phân tán

Linear Tuyến tính

m Mũi đa (multiplet)

MM+ Phương pháp cơ học phân tử MM

MARE, % Giá trị trung bình của ARE, %

MSE Sai số trung bình bình phương (Mean Squared Error)

MS Phổ khối (mass spectrometry)

MetOH methanol (CH3OH)

Nonlinear Phi tuyến tính

NMR Phổ cộng hưởng từ hạt nhân

OD Phương pháp đo mật độ quang (Optical Density)

PCA Phân tích thành phần chính (Principal Components Analysis)

PCR Hồi qui thành phần chính (Principal Components Regression)

PLS Bình phương cực tiểu riêng phần (Partial Least Squares)

Quan hệ định lượng cấu trúc - tính chất QSPR (Quantitative Structure - Property Relationship)

Quan hệ định lượng cấu trúc - hoạt tính QSAR (Quantitative Structure - Activity Relationship)

Quan hệ định lượng giữa cấu trúc điện tử và hoạt tính sinh học QESAR (Quantitative Electronic Structure - Activity Relationship)

Quan hệ định lượng giữa cấu trúc phổ NMR và hoạt tính sinh học QSDAR (Quantitative Spectrum Data - Activity Relationship)

Quan hệ định lượng cấu trúc - cấu trúc QSSR (Quantitative Structure - Structure Relationship)

Hệ số tương quan đánh giá chéo (Cross-validation correlation Q2 coefficient)

tr

R2 Hệ số tương quan R2 luyện

pr

R2 Hệ số tương quan R2 dự đoán

iv

hiệu chỉnh

ad

R2 R2

Hệ số lưu giữ (Retention Factor) Rf

Quan hệ cấu trúc hoạt tính (Structure - Activity Relationship) SAR

Đỉnh đơn (singlet) s

Sulforhodamine B SRB

Sắc ký SK

SKLM Sắc ký lớp mỏng

Mũi ba (triplet) t

Trichloroacetic acid TCA

Phổ UV (Ultraviolet Spectroscopy) UV

Hằng số ghép (Hz) (Coupling constant Hz) J (Hz)

1H-NMR

Phổ cộng hưởng từ hạt nhân proton (Hydrogen Nuclear Magnetic

Resonance)

13C-NMR

Phổ cộng hưởng từ hạt nhân cacbon 13 (Carbon Nuclear Magnetic

Resonance)

Độ dịch chuyển hóa học (chemical shift) tính bằng ppm (ppm)

QSARMLR QSARMLR phương trình 3.16 (3.16)

QSARMLR QSARMLR phương trình 3.17 (3.17)

QSARMLR QSARMLR phương trình 3.19 (3.19)

v

DANH MỤC CÁC BẢNG

Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30) ................................................. 63

Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone ................................................... 65

Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2

tr ............................................................................... 67

Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2

tr, R2

pr, SE ................................................................... 67

Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2

tr ..................................................................................... 68

Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2

tr và R2

pr ....................................................................... 68

Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2

tr và R2

pr ........................................................................... 69

Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2

tr .............................................................................. 69

Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê ................................................ 71

Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7) ........................................................... 72

Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các mô hình QESARMLR (với

k = 5 – 7) .......................................................................................................................................................... 73

Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN ........................................ 75

Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê ........................................................................... 76

Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch chuyển hóa học i trong các mô

hình QSDARMLR .............................................................................................................................................. 77

Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các mô hình QSDARMLR (với

k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1) ....................................................................................... 79

Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử............................................ 81

Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất nghiên cứu bằng mô hình

QSSRMLR và các chất dùng để dự đoán ........................................................................................................... 82

Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2

pred và MSE ...................................... 86

Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và GMPmxi,% đối với các tham số mô

tả phân tử 2D và 3D trong các mô hình QSARMLR (với k là 8, 9 và 10) .......................................................... 87

Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.16) và QSARANN(1) ..... 90

Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2

pred và MSE ...................................... 91

Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các tham số mô tả phân tử

2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7) ............................................................................... 92

Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.17), QSARPCR và

QSARPCA-ANN ................................................................................................................................................... 95

, SE và R2

Bảng 3.24 Các mô hình QSARMLR với các giá trị R2

tr

pr tương ứng .................................................. 97

Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của điện tích nguyên tử trong

các mô hình QSARMLR ..................................................................................................................................... 99

Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và

QSARANN(2) .................................................................................................................................................... 100

Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế bào Hela ở các nồng độ

khác nhau ....................................................................................................................................................... 112

vi

Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực nghiệm in vitro ................ 113

Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô hình QESARMLR và

QESARANN..................................................................................................................................................... 114

Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán từ mô hình QSDARMLR

(M1) và QSDARANN (M2) ............................................................................................................................. 116

Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn xuất flavone và isoflavone

tương tự được nghiên cứu từ mô hình QSSRMLR ........................................................................................... 118

Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR ............................................ 119

Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của các dẫn xuất flavonoid chiết

xuất. ............................................................................................................................................................... 120

Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các mô hình QSARMLR (3.16)

và QSARANN(1) .............................................................................................................................................. 121

Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình QSARANN(1 ............................. 122

Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập luteolin và daidzin từ các mô

hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN ....................................................................................... 123

Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô hình QSARPCA-ANN ) .... 124

Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và

QSARANN (2) .................................................................................................................................................. 125

Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn nhóm thế vào vị trí C6,

C3’ của quercetin, dự đoán từ mô hình QSARANN(2) ....................................................................................... 125

vii

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính ................................................ 7

Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93] .................................................... 7

Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66] .............................................................................. 15

Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66] ............................................................................ 18

Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66] ................................................................................................... 19

Hình 1.6 Giải thích F-test [51, 66] .................................................................................................................. 20

Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107] ...................................................................... 24

Hình 1.8 Thành phần chính với p = 2 [51, 106] .............................................................................................. 27

Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106] ........................................................................................... 30

Hình 1.10 Sơ đồ giải thuật di truyền [10] ........................................................................................................ 34

Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76] .................................................. 36

Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76] ..................................... 36

Hình 1.13 Toán tử chéo đơn điểm [76] ........................................................................................................... 37

Hình 1.14 Toán tử chéo hai điểm [76] ............................................................................................................ 37

Hình 1.15 Hệ thống thần kinh sinh học tự nhiên ............................................................................................. 40

Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50] ....................................................................................... 41

Hình 1.17 Cấu trúc mạng nơ ron [101] ........................................................................................................... 42

Hình 1.18 Quá trình học của mạng nơ ron [16] ............................................................................................... 43

Hình 1.19 Mô hình tính toán một nơ ron [69, 77] ............................................................................................ 44

Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74] ............................................................................... 47

Hình 1.21 Một số dẫn xuất flavonoid [20, 74] ................................................................................................. 47

Hình 2.1 Sơ đồ nghiên cứu tổng quát .............................................................................................................. 51

Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2] ................................................................................... 54

Hình 2.3 Xây dựng các mô hình hồi quy đa biến ............................................................................................. 56

Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59] ........................................................................... 57

Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient ............................................................................... 64

Hình 3.2 Ảnh hưởng của k đến R2

và SE.......................................................................................................... 67

Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi .................................................................................. 72

Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính chất hóa lý ..................... 81

Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm ........................................................ 85

Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid trong nhóm kiểm tra ... 88

Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50 ............................................. 94

Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11 ................................................................................................. 102

Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7 ................................................................................................... 103

Hình 3.10 Cấu trúc POL1, C15H10O6 ............................................................................................................. 104

Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9 ......................................................................................... 106

Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50% .............................................. 107

viii

Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6 .......................................................................................... 108

Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50% ................................................ 109

Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) ....................................................................................... 110

Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các flavone, isoflavone mới và

chất mẫu ......................................................................................................................................................... 113

Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2] ................................................. 117

Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2] ......................................... 117

Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2 ..................................... 122

Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) POL1; b) GML1 ............ 123

Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) AIL1; b) CSL1 .............. 126

ix

MỤC LỤC

LỜI CAM ĐOAN ...................................................................................................... i

LỜI CẢM ƠN ........................................................................................................... ii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT........................................ iii

DANH MỤC CÁC BẢNG ...................................................................................... vi

DANH MỤC CÁC HÌNH VẼ............................................................................... viii

MỤC LỤC .................................................................................................................. x

MỞ ĐẦU .................................................................................................................... 1

1.1. BỆNH UNG THƯ CỔ TỬ CUNG........................................................................................... 4

1.1.1. Các nguyên nhân gây ung thư ......................................................................................... 4

1.1.2. Điều trị ............................................................................................................................. 5

1.1.3. Phòng ngừa ...................................................................................................................... 6

1.2. LIÊN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH ....................................................................... 6

1.3. TÍNH TOÁN THÔNG TIN CẤU TRÚC .................................................................................. 9

1.3.1. Cơ học phân tử ................................................................................................................ 9

1.3.2. Cơ học lượng tử ............................................................................................................... 9

1.3.3. Phương pháp bán thực nghiệm ...................................................................................... 11

1.4. CÁC MÔ HÌNH TOÁN HỌC ................................................................................................ 12

1.4.1. Hồi quy đa biến ............................................................................................................. 12

1.4.2. Hồi quy thành phần chính.............................................................................................. 22

1.4.3. Bình phương tối thiểu riêng phần .................................................................................. 25

1.4.4. Giải thuật di truyền ........................................................................................................ 31

1.4.5. Mạng thần kinh nhân tạo (ANN) ................................................................................... 39

1.4.5.1. Khái niệm ............................................................................................................................. 39

1.4.5.2. Cấu trúc mạng ....................................................................................................................... 40

1.4.6. Thống kê đánh giá mô hình ........................................................................................... 45

1.4.7. Tính toán đóng góp của các tham số ............................................................................. 46

1.5. HỢP CHẤT FLAVONOID .................................................................................................... 46

1.5.1. Giới thiệu chung ............................................................................................................ 46

1.5.2. Phân loại dẫn xuất flavonoid ......................................................................................... 47

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 4

x

1.5.3. Phân bố flavonoid trong tự nhiên .................................................................................. 48

1.5.4. Hoạt tính sinh học của flavonoid ................................................................................... 48

1.6. PHÂN LẬP VÀ XÁC ĐỊNH CẤU TRÚC FLAVONOID ....................................................... 50

1.6.1. Phân lập flavonoid ......................................................................................................... 50

1.6.2. Xác định cấu trúc flavonoid .......................................................................................... 50

1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên ................................................................ 50

2.1. SƠ ĐỒ NGHIÊN CỨU ......................................................................................................... 51

2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP .................................................... 52

2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử ..................................................................... 52

2.2.2. Nguyên liệu và phương pháp ......................................................................................... 52

2.2.2.1. Phần mềm ứng dụng ............................................................................................................. 52

2.2.2.2. Hóa chất, thiết bị ................................................................................................................... 52

2.2.2.3. Nguyên liệu .......................................................................................................................... 53

2.3. NGHIÊN CỨU LÝ THUYẾT ................................................................................................. 54

2.3.1. Phương pháp tính toán thông tin cấu trúc ...................................................................... 54

2.3.1.1. Cơ học phân tử...................................................................................................................... 54

2.3.1.2. Hóa lượng tử ......................................................................................................................... 54

2.3.1.3. Các tham số cấu trúc ............................................................................................................. 55

2.3.2. Xây dựng các mô hình QSAR ....................................................................................... 55

2.4. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN ............................................................. 56

2.4.1. Phân lập các hợp chất flavonoid .................................................................................... 56

2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid ........................................................ 58

2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân ........................................................................... 58

2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể .............................................................................................. 59

2.4.3. Kỹ thuật thử hoạt tính in vitro ....................................................................................... 59

2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B ........................................................................ 59

2.4.3.2. Nuôi cấy tế bào ..................................................................................................................... 60

2.4.3.3. Nhuộm SRB .......................................................................................................................... 61

2.4.3.4. Xử lý kết quả ........................................................................................................................ 61

2.4.3.5. Xác định GI50 ........................................................................................................................ 61

2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID .................................................. 62

CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ...................... 51

CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN ............................................................ 63

xi

3.1. NGHIÊN CỨU LÝ THUYẾT ................................................................................................. 63

3.1.1. Tính toán thông tin cấu trúc........................................................................................... 63

3.1.1.1. Khảo sát phương pháp cơ học phân tử.................................................................................. 63

3.1.1.2. Khảo sát phương pháp hóa lượng tử ..................................................................................... 64

3.1.2. Tham số cấu trúc và tính chất phân tử ........................................................................... 65

3.1.2.1. Điện tích .............................................................................................................................. 65

3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dịch chuyển hóa học .......................................................... 66

3.1.2.3. Tham số hóa lý ..................................................................................................................... 66

3.1.2.4. Tham số hình học 2D, 3D ..................................................................................................... 66

3.2. XÂY DỰNG MÔ HÌNH QSAR .............................................................................................. 66

3.2.1. Khảo sát các biến số mô hình ........................................................................................ 66

3.2.2. Xây dựng các mô hình QESAR ..................................................................................... 70

3.2.2.1. Mô hình tuyến tính QESARMLR ............................................................................................ 70

3.2.2.2. Mô hình mạng thần kinh QESARANN ................................................................................... 74

3.2.2.3. Kiểm tra khả năng dự đoán ................................................................................................... 75

3.2.3. Xây dựng các mô hình QSDAR .................................................................................... 75

3.2.3.1. Mô hình tuyến tính QSDARMLR ........................................................................................... 75

3.2.3.2. Mô hình mạng thần kinh QSDARANN ................................................................................... 78

3.2.3.3. Kiểm tra khả năng dự đoán ................................................................................................... 78

3.2.4. Xây dựng mô hình QSSRMLR ........................................................................................ 79

3.2.4.1. Nguyên tắc xây dựng ............................................................................................................ 79

3.2.4.2. Tính toán các tham số hóa lý ................................................................................................ 80

3.2.4.3. Xây dựng mô hình ................................................................................................................ 80

3.2.4.4. Kiểm tra khả năng dự đoán ................................................................................................... 84

3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1) ..................................................... 85

3.2.5.1. Dữ liệu .................................................................................................................................. 85

3.2.5.2. Xây dựng mô hình QSARMLR (3.16) .................................................................................... 85

3.2.5.3. Xây dựng mô hình QSARANN(1) ............................................................................................ 89

3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1) ........................................ 90

3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN ...................... 91

3.2.6.1. Dữ liệu .................................................................................................................................. 91

3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) ......................................................... 91

3.2.6.3. Xây dựng mô hình QSARPCA-ANN ......................................................................................... 94

3.2.6.4. Khả năng dự đoán của các mô hình ...................................................................................... 95

xii

3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2) ......................... 96

3.2.7.1. Dữ liệu .................................................................................................................................. 96

3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20) ..................................................... 96

3.2.7.3. Xây dựng mô hình QSARANN(2) ............................................................................................ 99

3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới .............................................................. 100

3.3. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN ........................................................... 101

3.3.1. Phân lập cynaroside từ actiso ...................................................................................... 101

3.3.2. Phân lập quercetin từ xa kê ......................................................................................... 102

3.3.3. Phân lập luteolin từ tía tô ............................................................................................. 103

3.3.4. Phân lập daidzin từ đậu nành ....................................................................................... 105

3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR........................................................... 105

3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X ........................... 106

3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió ..................................................... 107

3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR ........................ 107

3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo nhiễu xạ tia X ...... 109

3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ gừng gió . 110

3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên .......................... 111

3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CÁC FLAVONOID ................................................ 113

3.4.1. Mô hình QESAR ......................................................................................................... 113

3.4.2. Mô Hình QSDAR ........................................................................................................ 115

3.4.3. Mô hình QSSRMLR ....................................................................................................... 116

3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1) ................................................................ 121

3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN ............................................... 123

3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2) ...................................... 124

KẾT LUẬN VÀ KIẾN NGHỊ .............................................................................. 127

DANH MỤC CÔNG TRÌNH ............................................................................... 129

TÀI LIỆU THAM KHẢO .................................................................................... 131

PHỤ LỤC ............................................................................................................... 144

xiii

MỞ ĐẦU

Các phương pháp phòng và trị bệnh ung thư hiện nay như phẫu thuật, xạ trị,

hóa trị. Tuy nhiên các phương pháp này vẫn có những tác dụng phụ nhất định đối

với bệnh nhân. Nhu cầu về dược chất kháng ung thư có khả năng phòng và trị bệnh

đang rất lớn nhưng khả năng đáp ứng còn hạn chế [70, 71]. Các nhà khoa học, dược

học đã và đang quan tâm nghiên cứu, tìm kiếm các loại dược chất mới. Trong đó

nhóm flavone, isoflavone nói riêng là nhóm dược chất có nhiều trong thực vật với

hoạt tính kháng oxi hóa, kháng ung thư, kháng viêm, … hiệu quả [45, 104]. Các

nghiên cứu thực nghiệm trên thế giới và Việt Nam đã cung cấp một cơ sở dữ liệu

quý giá về nguồn dược chất trong tự nhiên, nhưng các nghiên cứu thực nghiệm

thuần túy còn nhiều hạn chế để tạo ra hợp chất có hoạt tính kháng ung thư hiệu quả,

nhanh chóng, kinh tế [41, 42]. Các nghiên cứu lý thuyết trên thế giới nói chung,

trong nước nói riêng về nhóm flavone và isoflavone có hoạt tính kháng ung thư cổ

tử cung còn khá khiêm tốn [90, 103]. Nghiên cứu mối quan hệ cấu trúc - hoạt tính

nhằm thiết kế các dẫn xuất flavone, isoflavone mới có hoạt tính được cải thiện; các

nghiên cứu lý thuyết là rất cần thiết để thúc đẩy và làm tiền đề cho các nghiên cứu

thực nghiệm, nhằm tìm kiếm các dược chất kháng ung thư hiệu quả [80, 90].

Trong nghiên cứu này, chúng tôi sử dụng các thông tin mô tả cấu trúc điện

tích nguyên tử, độ dịch chuyển hóa học, tính chất hóa lý, tham số 2D và 3D của

phân tử kết hợp các kỹ thuật phân tích hồi quy, mạng nơ ron, phân tích thành phần

chính, giải thuật di truyền, bình phương cực tiểu riêng phần để xây dựng các mối

quan hệ định lượng cấu trúc - hoạt tính (QSAR) [89]. Các flavonoid được xây dựng

và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Các tham số mô tả phân

tử 2D, 3D được sử dụng để xây dựng các mô hình đa biến như hồi quy tuyến tính đa

biến (MLR), phân tích thành phần chính (PCR), bình phương cực tiểu riêng phần

(PLS) và mạng nơ ron nhân tạo (ANN) [80, 90]. Xây dựng các mô hình QSAR

nhằm xác định những yếu tố tham số mô tả phân tử ảnh hưởng đến tác dụng kháng

ung thư cổ tử cung từ đó xác định hướng thiết kế phân tử mang lại hoạt tính cao hơn

[86, 90, 103]. Trong nghiên này cũng đã tiến hành chiết tách và phân lập flavonoid

1

từ gừng gió, đậu nành, tía tô, xa kê, actiso, một vài kỹ thuật phân tích hóa lý cũng

được sử dụng để xác định cấu trúc phân tử các dẫn xuất flavonoid. Các phân tử

flavonoid đã phân lập sẽ được dự báo hoạt tính, và sử dụng làm chất mẫu để thiết kế

hợp chất mới có hoạt tính cao hơn. Từ các cơ sở trên, chúng tôi nghiên cứu đề tài

“Thiết kế, sàng lọc một số dẫn xuất flavonoid và đánh giá hoạt tính gây độc lên

dòng tế bào Hela dựa vào các tính toán hóa lượng tử”.

Mục tiêu của luận án

Tính toán, sàng lọc các tham số mô tả phân tử gồm: tham số điện tích, độ

dịch chuyển hóa học, tính chất hóa lý, tham số 2D, 3D của các dẫn xuất flavonoid.

Xây dựng các mô hình quan hệ cấu trúc – hoạt tính có khả năng dự đoán hoạt tính

kháng ung thư của các dẫn xuất flavone và isoflavone có cấu trúc tương tự.

Sàng lọc, phân lập, xác định cấu trúc và thử nghiệm in vitro hoạt tính kháng

ung thư 6 hợp chất flavonoid từ actiso, xa kê, đậu nành, tía tô, gừng gió.

Thiết kế, sàng lọc các dẫn xuất flavone và isoflavone và đánh giá hoạt tính

kháng ung thư cổ tử cung cũng như các tính chất hóa lý của các dẫn xuất flavonoid

mới thiết kế từ flavonoid mẫu.

Ý nghĩa khoa học của luận án

Nghiên cứu này đã sử dụng các tính toán lý thuyết và xây dựng các mối quan

hệ định lượng cấu trúc - hoạt tính (QSAR). Các flavone và isoflavone được xây

dựng và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Điện tích nguyên

tử, độ dịch chuyển hóa học, các tính chất hóa lý và các tham số mô tả phân tử 2D,

3D từ các phương pháp lý thuyết được sử dụng để xây dựng các mô hình đa biến

như hồi quy tuyến tính đa biến (MLR), hồi quy thành phần chính (PCR), hồi quy

bình phương cực tiểu riêng phần (PLS) và mạng nơ ron nhân tạo (ANN). Các kỹ

thuật thực nghiệm chụp cộng hưởng từ hạt nhân, phổ khối lượng và kỹ thuật đo

nhiễu xạ tia X đơn tinh thể cũng được sử dụng để xác định cấu trúc phân tử các dẫn

xuất flavonoid chiết xuất.

Các mô hình QSAR được xây dựng nhằm xác định được những vị trí nguyên

tử ảnh hưởng đến tác dụng kháng ung thư cổ tử cung từ đó xác định vị trí tác dụng

mạnh để xem xét gắn nhóm thế nhằm tạo ra hợp chất mới và chọn lựa được những

2

hợp chất có hoạt tính cao. Ngoài ra với kỹ thuật QSAR có thể xây dựng các mô hình

khác nhau để dự đoán các tính chất hóa lý khác của các hợp chất. Từ công trình này,

có thể ứng dụng phương pháp, kết quả nghiên cứu trong các nghiên cứu thực

nghiệm, lý thuyết với sự hỗ trợ của công nghệ máy tính nhằm giảm thiểu đáng kể

chi phí cho các nghiên cứu thực nghiệm. Kết quả nghiên cứu của luận án mở ra

hướng nghiên cứu mới, phù hợp với định hướng nghiên cứu trên thế giới và Việt

Nam. Đây là cơ sở khoa học để áp dụng trong thiết kế, sàng lọc các hợp chất hữu cơ

có cấu trúc tương tự, đồng thời dự đoán hoạt tính sinh học và các tính chất hóa lý

của hợp chất làm tiền đề cho các quá trình thực nghiệm một cách hiệu quả.

Những đóng góp mới của luận án

Công trình này xác định được cấu trúc và thử hoạt tính pGI50 in vitro đối

với 6 hợp chất flavonoid phân lập từ lá tía tô, lá xa kê, lá actiso, hạt đậu nành và

củ gừng gió. Đã tính toán và sàng lọc các tham số mô tả cấu trúc phân tử như tham

số điện tích, tham số độ dịch chuyển hóa học, tham số 2D, 3D ảnh hưởng chính đến

hoạt tính kháng ung thư của các dẫn xuất flavonoid. Đã xây dựng và đánh giá thành

công khả năng dự báo của các mô hình QSAR. Các mô hình QESAR, QSDAR,

QSSR, QSARNMR, QSARANN, QSARPCA-ANN, QSARPCR, QSARPLS đã dự đoán được

hoạt tính kháng ung thư và tính chất hóa lý của các hợp chất mới được thiết kế từ

các chất mẫu và hợp chất tự nhiên. Hoạt tính kháng ung thư của các hợp chất mới

tốt hơn hoạt tính kháng ung thư của chất mẫu, hợp chất phân lập từ gừng gió, đậu

nành, tía tô, xa kê, actiso. Như vậy, việc tiến hành nghiên cứu xây dựng các mô

hình QSAR trong nghiên cứu này là một định hướng hữu ích trong nghiên cứu tìm

kiếm và tổng hợp các flavonoid khác nhau từ tự nhiên.

Cấu trúc của luận án gồm các phần sau

- Mở đầu - Chương 1: Tổng quan tài liệu - Chương 2: Nội dung và phương pháp nghiên cứu - Chương 3: Kết quả và thảo luận - Kết luận và kiến nghị - Danh mục các công trình liên quan đến luận án - Tài liệu tham khảo

3

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU

1.1. BỆNH UNG THƯ CỔ TỬ CUNG

1.1.1. Các nguyên nhân gây ung thư

Ung thư là một tập hợp các bệnh liên quan đến sự phân chia tế bào một cách

mất kiểm soát, tiếp theo là quá trình các tế bào đó xâm lấn và di căn đến các mô

khác qua hệ thống bạch huyết và máu [6]. Giai đoạn di căn là nguyên nhân chính

gây tử vong của bệnh nhân ung thư. Hiện nay có trên 100 bệnh ung thư có loại từ

bắp thịt và xương, có loại từ da hoặc lớp lót của các cơ quan, có loại xuất phát từ

máu. Ở nam giới thường gặp ung thư phổi, gan, đại trực tràng, dạ dày, vòm hầu,

thanh quản, thực quản, tuyến tiền liệt, ung thư máu [58, 70]. Ở nữ giới thường gặp

ung thư vú, cổ tử cung, đại trực tràng, phổi, tuyến giáp, buồng trứng, gan, dạ dày,

thân tử cung, da [70]. Ung thư làm cho cơ thể bệnh nhân tử vong bằng nhiều cách,

nhưng đa số là làm cho cơ thể suy kiệt với các bệnh cơ hội. Trong đó, bệnh ung thư

cổ tử cung hình thành ở biểu mô cổ tử cung (cổ tử cung là cơ quan nối giữa âm đạo

với buồng trứng) [57, 96].

Ung thư cổ tử cung bắt đầu ở niêm mạc cổ tử cung, tại đây các tế bào phát

triển bất bình thường và khó kiểm soát dẫn đến hình thành khối u. Phụ nữ trong độ

tuổi từ 30 đến 59 thường dễ mắc bệnh hơn cả. Đây là căn bệnh có thể điều trị và

phòng ngừa nếu phát hiện sớm [96, 112].

Triệu chứng biểu hiện bệnh: âm đạo xuất huyết bất thường, có mùi khó chịu,

cơ thể bệnh nhân gầy gò, da trắng bệch, cơ thể đau nhức [32].

Điều trị bệnh: tuỳ theo giai đoạn phát triển của bệnh mà được điều trị theo

phác đồ khác nhau: giai đoạn 1 ung thư khu trú tại cổ tử cung; giai đoạn 2 ung thư

xâm lấn vùng lân cận; giai đoạn 3 ung thư xâm lấn xa hơn; giai đoạn 3 di căn sang

các bộ phận khác của cơ thể [96].

Giai đoạn 1 và 2: chỉ cần mổ và chiếu xạ thì khả năng khỏi bệnh sẽ rất cao, tỉ

lệ khỏi bệnh là 80 – 90%. Giai đoạn 3 và 4 chủ yếu là xạ trị, tỉ lệ khỏi bệnh rất thấp

từ 3 – 25 %, tuỳ theo mức độ nặng hay nhẹ của bệnh [96].

4

Các yếu tố bên ngoài gây bệnh ung thư bao gồm: các tia X, chất phóng xạ,

tia cực tím, hóa chất gây hư hại cấu trúc gen di truyền. Các sản phẩm công nghiệp

như: amiăng gây ung thư phổi; polivinylclorua gây ung thư gan; nitrosamin gây ung

thư bao tử; các phẩm màu trong bánh kẹo, hay một số sản phẩm trong thuốc nhuộm

tóc, các hoá chất kích thích trong chăn nuôi nhiễm estrogen cũng gây ung thư; thuốc

ngừa thai và các chất kích thích nội tiết tố như DES (diethylstilbestrol) có khả năng

gây ung thư; thuốc trừ sâu, rầy như DDT cũng có khả năng gây ung thư [23, 99]. Ô

nhiễm không khí: các hoá chất gây ô nhiễm không khí như CO2, hidrocacbon,

benzopiren, bụi amiăng, khói thuốc lá gây ung thư phổi [70]. Ngoài ra còn có độc

tố của nấm mốc chứa aflatoxin có trong nấm Aspergillus gây ung thư [26].

Các yếu tố do lối sống có thể là nguyên nhân gây bệnh ung thư như các hoá

chất trong thuốc lá gây ung thư phổi, rượu gây ung thư thực quản; chế độ ăn gây

ung thư: ăn nhiều mỡ động vật, bơ, ăn nhiều calo, ăn thiếu chất xơ, uống rượu, hay

sử dụng thực phẩm không an toàn là nguyên nhân gây ung thư [23, 62].

Yếu tố sinh học gây ung thư thể hiện ở một số ít căn bệnh ung thư ở người

được cho là do vi rút như ung thư gan, ung thư vòm họng, ung thư cổ tử cung [26].

Yếu tố di truyền gây ung thư chiếm tỉ lệ thấp, một số loại như ung thư mắt,

ung thư vú, có khuynh hướng dễ gặp trong cùng một gia đình. Tuy nhiên, yếu tố di

truyền không có tầm quan trọng về mặt thực tiễn [62].

1.1.2. Điều trị

Một số liệu pháp chính trong điều trị ung thư: phẫu trị là dùng lưỡi dao mổ

để loại bỏ tận gốc khối u; xạ trị là phương pháp sử dụng dùng tia phóng xạ tàn tiêu

diệt các tế bào ung thư; hoá trị là dùng hoá chất để tiêu diệt tế bào ung thư; liệu

pháp miễn dịch là liệu pháp tăng cường khả năng đề kháng tự nhiên của cơ thể để

kháng lại sự phát triển của tế bào ung thư [23, 58].

Phẫu thuật và xạ trị có ưu điểm là tấn công mạnh các loại ung thư thời kì còn

khu trú, nhưng phương pháp này không hiệu quả khi ung thư di căn trên cơ thể

người bệnh. Đối với phương pháp hoá trị chỉ cho kết quả tạm thời và không hiệu

5

quả. Liệu pháp miễn dịch chưa được nghiên cứu chuyên sâu nên chỉ là phương pháp

bổ trợ trong điều trị bệnh [58, 96].

1.1.3. Phòng ngừa

Biện pháp phòng ngừa ung thư bao gồm một số biện pháp như: Giảm thiểu

việc tiếp xúc với thuốc lá, rượu, hoá chất công nghiệp; thực hiện các biện pháp bảo

vệ cơ thể chặt chẽ khi tiếp xúc với tia phóng xạ; ngừa ung thư qua việc chọn lựa chế

độ ăn uống an toàn như không nên ăn một số thức ăn được khuyến cáo có thể gây

ung thư, thức ăn có chứa các hóa chất nguy hiểm và các hormon; khám sức khoẻ

định kỳ, tầm soát ung thư sớm đều đặn; tiêm vacxin ngừa ung thư; lối sống lành

mạnh [47, 99].

1.2. LIÊN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH

Liên hệ giữa cấu trúc – hoạt tính là nguyên tắc cơ bản nhất để xây dựng các

mô hình quan hệ cấu trúc – hoạt tính (QSAR) hay mô hình quan hệ cấu trúc – tính

chất (QSPR), mô hình quan hệ cấu trúc - cấu trúc để dự đoán tính chất vì cấu trúc –

tính chất - hoạt tính có mối quan hệ biện chứng với nhau, là các mối liên hệ nhân –

quả có thể được tính toán một cách chính xác và thiết lập theo những mô hình toán

học rõ ràng [17, 93]. Theo Testa và Kier, quan hệ định lượng cấu trúc – tác dụng là

tổng hòa các mối quan hệ thể hiện trên Hình 1.1. Trên cơ sở này nhiều kiểu mô

hình được xây dựng với các thông tin về cấu trúc khác nhau. Mô hình tổng quát

dạng QSXR: X có thể là A – hoạt tính (Activity); tính chất – P (Property); cấu trúc

– S (Structure) [17, 93].

Cấu trúc – tính chất không phải lúc nào cũng được phân định rõ ràng, nên

mối liên quan giữa chúng được biểu hiện bằng phần giao trên giản đồ Venn, Hình

1.2 [17, 93]. Tính chất – tác dụng có thể là một trong một số trường hợp nên mối

liên quan giữa tính chất và tác dụng cũng được diễn tả bằng giản đồ Venn có phần

giao. Cấu trúc – hoạt tính có sự phân định rõ ràng nên mối liên quan giữa cấu trúc

và tác dụng, điều này được mô tả bởi hai vòng tròn không có phần giao nhau mà

tiếp xúc tại một điểm.

6

Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính

Tính chất Cấu trúc

Tác dụng

Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93]

Theo quan điểm hóa học, một phân tử có tác dụng sinh học mang hai nhóm

chức: nhóm tác dụng (thường có cấu tạo đặc biệt) và nhóm ảnh hưởng (thường là

các nhóm có khả năng thay đổi tính chất lý hóa của phân tử như hydroxyl, halogen,

carboxyl, nitro, ...) [17, 93].

Theo quan điểm sinh hóa, một phân tử có tác dụng sinh học có 2 thành phần

chính: Khung phân tử đặc trưng cho tính chất lý hóa, còn nhóm chức quyết định

hoạt tính sinh học [17, 93].

Theo quan điểm hiện đại, phân tử hợp chất là một thể thống nhất (gồm các

nguyên tử tạo khung phân tử, nhóm chức...). Tác dụng sinh học không những do

7

cấu trúc phân tử trực tiếp quyết định mà còn gián tiếp chịu ảnh hưởng bởi các quá

trình như hấp thụ, vận chuyển, phân bố hay chuyển hóa của phân tử trong cơ thể

sinh vật [17, 93]. Do đó, khi nghiên cứu mô hình liên quan giữa cấu trúc với tác

dụng, cấu trúc với hoạt tính người ta không những phải khảo sát cấu trúc mà còn

xem xét những yếu tố ảnh hưởng.

Mô tả cấu trúc phân tử: cấu trúc hóa học là sự sắp xếp trong không gian của

các nguyên tử trong lượng mô tả hay thông tin cấu trúc [17, 93].

Mức hình học: cấu trúc phân tử có thể được trình bày dưới dạng 2 chiều

(thông tin cấu trúc gồm độ liên kết nguyên tử, cấu hình Z/E) hay 3 chiều (thông tin

cấu trúc gồm cấu hình tương đối cũng như cấu hình tuyệt đối). Các thông tin của

cấu trúc 2 chiều (2D) và 3 chiều (3D) hữu ích cho nghiên cứu mối liên quan định

lượng cấu trúc và tác dụng [17, 93].

Mức lập thể điện tử: đó là vật thể có thể tích và hình thù nhất định như cấu

trúc lập thể có tính chất cơ động hay là cấu trúc lập thể với sự phân bố mật độ điện

tử của các nguyên tử [17, 93]. Các thông tin cấu trúc bao gồm thể tích, diện tích bề

mặt, sự thay đổi cấu dạng, sự phân bố điện tử, thế tĩnh điện phân tử, .... Các thông

tin này có thể có từ tính toán trên máy tính, đặc biệt là sử dụng các phương pháp

hóa lượng tử.

Mức tương tác với môi trường: cấu trúc phân tử thể hiện hoạt tính, độc tính,

điểm chảy, điểm sôi, khả năng solvat hóa, tính chất sắc ký, hệ số phân bố, độ tan, áp

suất tới hạn, v.v, trong môi trường sinh học [17, 93].

Cấu trúc phân tử ảnh hưởng đặc biệt quan trọng đối với hoạt tính sinh học,

đó là chìa khóa quan trọng để thiết lập mối quan hệ giữa cấu trúc và hoạt tính. Sự

phát triển của mối liên hệ này làm nền tảng để xây dựng các mô hình có khả năng

dự đoán. Với một chuỗi các hợp chất có cấu trúc tương tự, có thể xây dựng các mô

hình quan hệ giữa cấu trúc - hoạt tính (QSAR) [17, 93].

8

1.3. TÍNH TOÁN THÔNG TIN CẤU TRÚC

1.3.1. Cơ học phân tử

Trong các phương pháp lý thuyết liên quan đến việc tối ưu hóa hình học của

cấu trúc thì phương pháp cơ học phân tử (Molecular Mechanic - MM) khá thông

dụng. Phương pháp MM có thể tính toán chính xác về cấu trúc hình học và năng

lượng tương đối của các phân tử lớn vượt quá khả năng đối với các phương pháp

hóa lượng tử [25].

Năng lượng của phân tử trong trường được tính theo phương trình 1.1 [25]:

E = Eb + Ea + Et + Ev + Eh + Ee (1.1)

Trong đó: Eb là năng lượng do sự biến dạng liên kết; Ea là năng lượng do sự

khép mở góc liên kết; Et là năng lượng do sự xoay quanh liên kết; Ev là năng lượng

tương tác van der Waals; Eh là năng lượng do liên kết hydrogen; Ee là năng lượng

tương tác tĩnh điện.

Giữa cấu trúc và năng lượng có sự liên quan mật thiết với nhau, do đó tối ưu

hóa hình học của cấu trúc sẽ dẫn đến tối thiểu hóa năng lượng của phân tử [102].

Quá trình này tạo một cấu trúc ứng với trạng thái năng lượng tối thiểu (tối ưu về

hình học hay bền về năng lượng) để từ đó có thể xem xét tọa độ của các nguyên tử

của phân tử. Cấu trúc tối ưu về hình học hay bền về năng lượng có thể sử dụng để

tính toán phương pháp lượng tử: phương pháp nguyên lý ban đầu (ab-initio) hay

phương pháp bán thực nghiệm [60] [100].

1.3.2. Cơ học lượng tử

Cơ học lượng tử (Quantum Mechanic - QM) là mô tả toán học chính xác của

trạng thái điện tử và tính chất hóa học. Về lý thuyết, QM có thể dự đoán chính xác

bất kỳ tính chất nào của từng nguyên tử hoặc phân tử [60, 100]. Trong thực tế,

phương pháp QM chỉ được giải quyết chính xác cho một hệ thống điện tử [60,

100]. Vô số các phương pháp đã được phát triển cách giải gần đúng cho các hệ

thống đa điện tử. Hai phương trình QM được phát triển bởi Schrödinger và

Heisenberg. Phương trình Schrödinger là phương trình cơ bản cho hầu hết các

phương pháp hóa tính toán [60, 100].

9

Ĥ = E (1.2)

Trong phương trình Schrödinger Ĥ là toán tử Hamiltoni,  là hàm sóng, E là

năng lượng. Phương trình này được gọi là phương trình riêng.  được gọi là hàm trị

riêng, E là trị riêng.

Hàm sóng  là hàm xác định vị trí của electron và hạt nhân. Electron được

mô tả như một hàm sóng. Nó mô tả xác suất của trạng thái điện tử. Như vậy, nó có

thể mô tả xác suất tìm thấy các electron ở các vị trí nhất định, nhưng nó không thể

đoán chính xác vị trí điện tử. Hàm sóng cũng được gọi là mật độ xác suất bởi vì

bình phương của hàm sóng là hàm xác suất. Đây là ý nghĩa chính xác của hàm sóng.

Để có được một giải pháp vật lý thích hợp có liên quan của phương trình

Schrödinger, hàm sóng phải liên tục, đơn trị [60, 100].

Toán tử Hamilton Ĥ

(1.3)

(1.4)

Với là toán tử Laplac đối với hạt (p) i, các hạt gồm cả điện tử và hạt

nhân, mi và qi là khối lượng và điện tích hạt i, p là tổng số hạt, rij là khoảng cách

giữa các hạt. Số hạng đầu tiên biểu thị cho động năng của hạt trong một phương

trình sóng. Các số hạng bổ sung có thể xuất hiện trong toán tử Hamiltonion tương

tác với bức xạ điện từ hoặc trường được tính đến. Trong phần mềm QSARIS hiện

có, toán tử Hamiltonion ở trên là gần như chưa từng được sử dụng. Vấn đề có thể

được đơn giản hóa bằng cách tách các chuyển động hạt nhân và electron. Điều này

được gọi là xấp xỉ Born – Oppenheimer. Toán tử Hamilton cho một phân tử với các

hạt nhân tĩnh là:

(1.5)

10

Ở đây chỉ xét động năng của electron và lực hút giữa electron và hạt nhân và

lực đẩy của các điện tử. Sự chuyển động của hạt nhân có thể được mô tả bằng cách

xem xét toàn bộ tính toán thế năng khi các hạt nhân di chuyển [60, 100].

Khi hàm sóng đã được xác định, bất kỳ thuộc tính nào của phân tử đều có thể

được xác định. Điều này được thực hiện bằng cách tính giá trị mong muốn của toán

tử cho tính chất đó, được biểu thị bằng dấu ngoặc vuông < >. Ví dụ, năng lượng là

giá trị kỳ vọng của toán tử Hamilton được đưa ra bởi:

(1.6)

Đối với một hàm sóng gần đúng, có thể tính xấp xỉ năng lượng, đó là cơ sở

cho nhiều kỹ thuật được mô tả trong các tính toán khác. Bằng cách thay thế các toán

tử khác, có thể có được các tính chất quan sát rõ ràng, chẳng hạn như moment lưỡng

cực hoặc mật độ electron. Một cách khác để có được tính chất phân tử là sử dụng

định lý Hellmann-Feynman. Định lý này khẳng định rằng các thuộc tính năng lượng

với tính chất P mong muốn được cho bởi:

(1.7)

Mối quan hệ này thường được sử dụng để tính toán tính chất electron. Không

phải tất cả phương pháp xấp xỉ tuân theo định lý Hellmann-Feynman. Chỉ các

phương pháp biến thể tuân theo định lý Hellmann-Feynman [60, 100].

1.3.3. Phương pháp bán thực nghiệm

Các phương pháp bán thực nghiệm sử dụng trong luận án gồm phương pháp

CNDO, INDO, MNDO, AM1, PM3, TNDO (Phụ lục 60) [60, 100].

Phương pháp QM dùng để tính toán các thông tin cấu trúc phân tử như: điện

tích (Qi), cấu trúc phổ NMR (i), tham số hóa lý, …. Phương pháp hóa lượng tử

được chọn phải phù hợp với đối tượng nghiên cứu, mức độ chính xác, thời gian tính

toán cũng như kích thước của hệ [60, 100]. Các tham số cấu trúc phân tử được tính

toán được đưa ra ở Phụ lục 58.

11

1.4. CÁC MÔ HÌNH TOÁN HỌC

1.4.1. Hồi quy đa biến

Trong hồi quy, các biến số độc lập x và biến phụ thuộc y là các giá trị quan

sát. Tương ứng với một giá trị của x chỉ có 1 giá trị y duy nhất lúc này y là hàm của

x có dạng (y = f (x)) [51, 66]. Tuy nhiên, chúng ta hay gặp trường hợp cùng một giá

trị x trong các thí nghiệm có thể có các giá trị y khác nhau do ảnh hưởng của các

yếu tố khác. Khi đó sự phụ thuộc được gọi là xác suất và các giá trị y là một hàm

với các giá trị ngẫu nhiên. Nếu chỉ có trường hợp Y là biến ngẫu nhiên rời rạc và X

là giá trị rời rạc, để xác định y bằng cách sử dụng phân phối như ma trận sau:

X Y … x1 x2 xm

… y1 p1(x1) p1(x2) p1(xm)

… y2 p2(x1) p2(x2) p2(xm)

… … … … …

… yN pN (x1) pN (x2) pN (xm)

Trong đó xk (k = 1, 2, …, m) là các giá trị có thể có của X, yi (i = 1, 2, ..., N)

là các giá trị có thể có Y và pi(xk) là xác suất xuất hiện của yi nếu X = xk , với k bất

kỳ, ta có đẳng thức sau:

(1.8)

Giả sử Y/(X = xk) là biến ngẫu nhiên tương ứng với giá trị của xk. Phân bố

nằm trong cột thứ k của ma trận. Các giá trị trung bình (M) của biến Y được tính:

(1.9)

Và các giá trị X khác nhau, được xem như hàm . Hàm g(X)

được gọi là hàm hồi quy của Y đối với X.

Như đề cập ở phần trên cho trường hợp phụ thuộc ngẫu nhiên của biến Y với

nhiều biến độc lập X1, X2, …, Xp, sự phân bố của Y trong trường hợp này được mô tả

12

bằng xác suất , với là các giá trị khác nhau của các biến X1, X2,

…, Xp. Khi X1 = x1, X2 = x2, …, Xp = xp các giá trị trung bình của Y có dạng:

(1.10)

Các biến X1, X2, …, Xp, là hàm g(X1, X2, …, Xp):

(1.11)

Hàm g(X1, X2, …, Xp) là hàm hồi quy đa biến của Y với các biến độc lập X1, X2,

…, Xp.

Để xây dựng hàm hồi quy của các biến ngẫu nhiên Y phụ thuộc X1, X2, …, Xp,

trên thực tế điều đó là không thể, vì xác suất pi(xk1, xk2, …, xkp) thường không xác

định. Vấn đề đặt ra là xây dựng hàm toán từ hàm g(X1, X2, …, Xp), như

hàm được gọi là mô hình hồi quy tương quan với hàm g cho bởi

phương trình 1.12 [51, 66]:

(1.12)

Với e(X1, X2, …, Xp) là sai số của mô hình.

Mô hình hồi quy được xây dựng trên cơ sở dữ liệu thống kê giữa biến phụ

thuộc Y trên X1, X2, …, Xp. Các giá trị quan sát được trình bày theo ma trận sau:

k … Y X1 X2 Xp

1 … x11 x12 x1p y1

2 … x21 x22 x2p y2

… … … … … …

N … xN1 xN2 xNp yN

Mỗi hàng trong ma trận đại diện cho mỗi quan sát cụ thể (thí nghiệm) được

gọi là mẫu hoặc trường hợp. Các biến độc lập đóng vai trò là một phần của biến dự

đoán, phụ thuộc vào giá trị của chúng, giá trị quan sát Y là các giá trị ngẫu nhiên

(hoặc thuật toán để khác nhau [51, 66]. Vấn đề chọn dạng của hàm

tính toán) để xây dựng mô hình hồi quy là khó khăn nhất. Việc chọn mô hính hồi

quy phải thỏa mãn hai yếu tố sau:

13

1. Hàm mô phỏng phải đại diện được cho hàm hồi quy.

2. Việc tính toán các giá trị của hàm phải dựa trên khả năng đáp ứng của nguồn

dữ liệu tính toán có sẵn.

Nếu mô hình được chọn, giá trị của nó trong trường hợp thứ

k bằng và được xem là giá trị dự đoán của yk. Sự khác biệt giữa

là độ lệch (sai số): . yk và

Các biến độc lập X1, X2, …, Xp ở trên đã được xác định. Khi nhiều thí nghiệm

được thực hiện, các biến độc lập có các giá trị khác nhau (cột trong ma trận). Vì

vậy, có thể xem các biến này là biến ngẫu nhiên và giá trị dự báo Y1, Y2, …, Yp là dựa

trên các biến ngẫu nhiên [51, 66]. Theo quan điểm toán học, điều quan trọng không

phải các giá trị dự đoán là ngẫu nhiên hay không. Trong tất các các tính toán, các

giá trị dự đoán có tính chất tổng quát. Nó giải thích các số hạng cụ thể cho các giá

trị ngẫu nhiên được chuyển sang các giá trị dự đoán xác định. Hơn nữa chúng ta

không chú ý đến các giá trị dự đoán sử dụng.

Các giá trị dự đoán và giá trị quan sát ngẫu nhiên Y, các tham số của các mô

hình được tìm thấy là kết quả của kinh nghiệm lấy mẫu ngẫu nhiên. Vì vậy các tham

số của mô hình cũng được coi là biến ngẫu nhiên [51, 66].

Dạng đơn giản và phổ biến nhất được sử dụng trong mô hình hồi quy tuyến

tính là:

(1.13)

Ở đây là các hàm cơ bản và bi là các hệ số (hoặc các yếu

tố) tính được sao cho mô hình được xây dựng tốt nhất.

Trong thực tế, nếu có nhiều biến độc lập, mô hình tuyến tính của dạng:

, (1.14)

Với được gọi là hệ số tự do trong mô hình.

14

Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66]

Việc lựa chọn các hệ số hồi quy bk đảm bảo tính thích hợp lớn nhất cho mô

hình tuyến tính được xây dựng. Để giải quyết vấn đề này, phương pháp tốt sử dụng

phương pháp bình phương cực tiểu. Lúc này hệ số bk được tìm kiếm từ một điều

kiện để giảm thiểu tổng bình phương độ chênh lệch giữa các giá trị quan sát được

và dự đoán của biến phụ thuộc:

(1.15)

Với (1.16)

Khi p = 2 minh họa hình học đơn giản của phương pháp bình phương cực

tiểu Hình 1.3. Ví dụ, hình ảnh trên cho thấy không gian tiếp cận sự phụ thuộc giữa

hai biến độc lập X1, X2 và biến phụ thuộc Y.

Hồi quy thường là phương pháp đơn giản nhất trong phân tích hồi quy. Nó

được sử dụng để giải quyết các trường hợp với số lượng biến độc lập nhỏ, không

tương quan chặt chẽ [51, 66]. Tuy nhiên, phương pháp này tạo cơ sở để hiểu các

phương pháp hồi quy khác phức tạp hơn. Chúng ta hãy xem xét các ma trận sau đây

đại diện cho các kết quả quan sát:

15

Với Xj là cột thứ j được xem là vec tơ dự đoán và Y là vec tơ biến phụ thuộc.

Giá trị trung bình được tính cho mỗi biến Xj theo phương trình:

(1.17)

và độ lệch chuẩn có dạng sau:

(1.18)

Hệ số tương quan được tính cho các cặp biến khác nhau dưới dạng sau:

(1.19)

Các hệ số tương quan này tạo thành một ma trận tương quan mẫu.

Cột thứ nhất X0 được đưa vào trong ma trận nếu một hệ số trong (1.14) khác

không. Giả sử bỏ qua cột X0. Có thể thu được bằng cách căn giữa các dữ liệu theo

cách sau: , với là giá trị trung bình của biến .

Cách đơn giản nhất để hiểu được bản chất của hồi quy đa biến thường là xem

xét một ví dụ đơn giản với p = 2 và N = 3 với minh họa hình học cụ thể.

Xét ma trận X = (X1 X2) trong đó bao gồm các vec tơ trung tâm dự đoán và

vector Y là một vec tơ trung gian dự đoán. Chúng ta có:

Mô hình hồi quy có dạng , với . Vì vậy, vec

tơ trong không gian P được biểu thị qua các vec tơ X1, X2 (Hình 1.4). Véc tơ độ

lệch: . Chiều dài của vec tơ này là:

(1.20)

Chiều dài này là cực tiểu nếu véc tơ e trực giao với không gian P, nghĩa là

trực giao với vec tơ X1, X2. Điều kiện trực giao có dạng sau:

16

, hay (1.21)

Với là vec tơ chuyển vị của (vec tơ hàng) và là ma trận chuyển vị

của ma trận X.

Từ mối quan hệ thứ hai ta có cách tính các hệ số hồi quy:

(1.22)

Với ma trận gồm các yếu tố:

. (1.23)

Giá trị trung bình của ma trận C tỷ lệ thuận với ma trận hiệp phương sai của

ma trận vec tơ dự báo .

Yếu tố của ma trận C là các yếu tố trong của ma trận . Vì vậy

bằng chiều dài của vec tơ . Ta có:

với φij là góc giữa hai vec tơ Xi, Xj.

Vì vậy, góc giữa hai vec tơ (Hình 1.4) nghĩa là gần 1 (tức

là có tương quan mạnh mẽ giữa các giá trị dự đoán). Ngược lại, nếu không

tương quan, thì các vec tơ tương ứng trực giao. Trường hợp này xảy ra khi các vec

tơ nằm trong không gian siêu phẳng (hiện tượng đa cộng

tuyến), hiện tượng đa cộng tuyến dẫn đến sự suy biến của ma trận C và kết quả là

khó khăn trong thiết lập phương trình (1.23).

17

Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66]

Nếu ma trận C không suy biến, vec tơ b được tính theo phương trình sau:

(1.24)

Công thức cho hệ số hồi quy (1.24) đúng trong trường hợp số lượng biến

trong mô hình bằng p. Xác định hệ số bk được coi là ước lượng thống kê của các hệ

số ngẫu nhiên của hệ số bk trong mô hình tuyến tính (1.14). Một số trường hợp bk

ước tính với giá trị nhỏ ( ). Điều đó chỉ ra rằng bk = 0 (biến không phụ thuộc

biến Xk) và giá trị bk khác không, được xác định từ dữ liệu nhiễu ban đầu. Vì vậy,

cần kiểm tra mức độ ý nghĩa của biến Xk (hoặc của hệ số Bk) trong mô hình được

xem xét [51, 66]. Theo quan điểm thống kê, có nghĩa là cần kiểm tra giả thuyết H0:

[ bk = 0]. Cách đơn giản nhất để minh họa cho nguyên tắc chung của việc kiểm tra

một giả thuyết như vậy là đưa ra một ví dụ về một mô hình một chiều , với

X1 và Y là các giá trị trung bình có ý nghĩa [51, 66]. Về mặt hình học các giá trị X1

và Y không tương quan có nghĩa là các vectơ X1 và Y trực giao. Tuy nhiên, vì quan

sát là ngẫu nhiên, các vectơ X1 và Y có thể không hoàn toàn trực giao, sẽ dẫn đến

một hệ số hồi quy khác không b1 (Hình 1.5).

nhỏ. Độ lớn của góc này có thể được ước Nếu giả thuyết H0 đúng, góc

lượng:

(1.25)

18

Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66]

Tuy nhiên, trong thống kê, xem xét bình phương trung bình sẽ thuận tiện

hơn, có nghĩa là tính tổng của bình phương theo bậc tự do được xem xét.

Bậc tự do DF đặc trưng số lượng các tham số độc lập, ảnh hưởng đến độ lớn

của tổng bình phương. Với tổng bình phương hồi quy SS(hồi quy) độ tự do hồi quy

DF(hồi quy) bằng 1, vì tổng được xác định bởi giá trị của tham số

, độ tự do DF(quan sát) bằng N-1, bởi vì đơn b1. Vì vậy SS(quan sát), bằng

các giá trị quan sát trung tâm được tính bởi phương trình: . Nghĩa là N-1

biến độc lập. Ta có liên hệ sau: SS(quan sát = SS(hồi quy) + SS(dư). Từ đó ta có:

DF(quan sát) = DF(hồi quy) + DF(dư). Vì vậy, SS(dư) có bậc tự do DF(dư) bằng

N-2. Do đó, độ lệch của vector Y trực giao với vector X, (tức là giả thuyết

đúng), theo thống kê sau đây [51, 66]:

(1.26)

Thống kê này được gọi là chuẩn F

Chúng ta hãy xem xét các giả định sau liên quan đến các biến ngẫu nhiên

:

1. ei độc lập với nhau;

. 2. ei có phân phối chuẩn giống nhau

Vì vậy chuẩn F có phân bố F với (1, N-2) bậc tự do.

19

Nếu giả định H0 với b1 bằng 0 là đúng F lớn với xác xuất bé. Chúng ta có thể

chỉ định giới hạn DF(α), có thể vượt quá tiêu chí F chỉ với một xác suất nhỏ. Nếu

giá trị của thống kê F, được tính theo công thức (1.26), lớn hơn DF(α), nó có nghĩa

là giả thuyết H0 sai, các hệ số hồi quy b1 có ý nghĩa [51, 66].

Kiểm tra ý nghĩa biến có thể được khái quát theo các cách khác nhau trong

trường hợp có nhiều biến. Một trong những biến thể của khái quát này đang xem xét

một phần thử nghiệm F-test.

Hình 1.6 Giải thích F-test [51, 66]

Giả sử rằng phương trình hồi quy với hai biến thu được bằng phép chiếu

chính xác của vector Y trong không gian được kéo dài qua các vectơ (Hình

1.5). Phương trình hồi quy này như sau:

(1.27)

Trong trường hợp này, tổng bình phương các giá trị hồi quy bằng với bình

phương của vector được xác định bởi các hệ số :

(1.28)

Nếu chúng ta xem xét mô hình với biến đã lược bỏ X2, giá trị dự đoán sẽ có

dạng sau: , với thu được bằng phép chiếu của véc tơ Y đến vec tơ

khác hệ số X1 (Hình 1.6). Khi đó, hệ số . Khi vec tơ X1 và X2 trực giao (tức

là ), điều đó là ngoại lệ, khi đó . Tổng bình phương do giá trị dự

20

đoán từ hồi quy trong trường hợp thứ hai bằng với chiều dài bình phương của véc tơ

được xác định bởi hệ số . Tổng bình phương này có dạng sau:

(1.29)

Số bình phương phần dư bằng hiệu giữa tổng bình phương trong trường hợp

thứ nhất và thứ hai (nó là hiệu bình phương Hình 1.6) [51, 66]. Giá trị

này gọi là ‘tổng bình phương b2 và b1’ theo phương trình:

(1.30)

Có nghĩa là mô tả tổng dư X2 trong mô hình hồi quy hoặc ý nghĩa

của hệ số hồi quy b2. Kiểm tra ý nghĩa thống kê của hệ số b2 (nghĩa là kiểm tra giả

thuyết ) với kiểm định F-test trong trường hợp cụ thể này được gọi là

một phần F2/1-test và có dạng sau [51, 66]:

(1.31)

Nói chung, hai mô hình được xem xét tương ứng với các biến sau:

và (q

bằng:

(1.32)

Giá trị F tương ứng là:

(1.33)

Thống kê có phân bố sau đây: F(p-q, N-p), để có thể kiểm tra

giả thuyết tại α. Giá trị BF(α) có thể được tính toán bởi một

hàm chuẩn trong Microsoft Excel FDISTINV( ; p-q; N-p). F được sử dụng trong

hồi quy từng bước để thăm dò các biến quan trọng [51, 66].

Một phương pháp ước lượng các hệ số hồi quy là tính các khoảng tin cậy.

Lúc này kiểm định t tính đối với hệ số bk theo công thức:

21

(1.34)

Với SE(bk) là độ lệch chuẩn của hệ số bk, tính toán theo công thức:

(1.35)

Với akk là một phần tử chéo của ma trận A. Ma trận A là ma trận nghịch đảo

của ma trận của đánh giá chéo độ lệch các biến [51, 66].

Hệ số bk là một giá trị mẫu của biến ngẫu nhiên Bk. Khoảng tin cậy cho biến

ngẫu nhiên Bk có thể được tính theo biểu thức sau đây:

Với là một phần tư của thứ tự với t-distribution (phân phối

Student) với độ tự do N-1.

Nếu khoảng tin cậy này chứa a điểm 0, khi đó hệ số bk có nghĩa. Điều

kiện tương đương với : . Khi đó hệ số bk

có thể được coi là quan trọng ở một giá trị khá lớn t(bk), cụ thể là, khi chúng ta có

các điều kiện sau:

(1.36)

Điều kiện (1.36) được gọi là hai phía phân bố t. Quan hệ giữa phân bố t và

phân bố F theo (1.37).

(1.37)

1.4.2. Hồi quy thành phần chính

Phương pháp tính toán phân tích hồi quy cho một biến phụ thuộc dựa trên

một tập hợp các thành phần chính được tính toán từ các biến độc lập. Phương pháp

thành phần chính hữu ích khi các biến độc lập đa lớp hoặc tương quan cao với nhau.

Điều này thường có thể được biết khi thực hiện một số chương trình hồi quy khác.

Sự đa cộng tuyến giữa các biến độc lập cho thấy sự tương quan giữa chúng. Sự

tương quan này được tính thông qua các điểm riêng của ma trận hiệp phương sai

hoặc ma trận chéo [52, 107].

22

là ma trận với cột là các vec Giả sử X = (X1 X2 … Xp)

tơ . Ma trận chéo đối xứng và không xác định được.

Vì vậy, có các cặp vec tơ song song , với p là số biến số z. Các vec tơ

riêng tương ứng với các giá trị dương .

. (1.38)

Các giá trị riêng và vec tơ riêng trong ma trận chéo được tính toán theo

phương pháp Jacobi trong QSARIS.

Các vector p, được gọi là các thành phần chính của quan sát:

. (1.39)

Từ phương trình (1.38) và (1.39) và các thành phần chính trực giao và độ dài

của chúng được :

.

Nếu các thành phần chính được xem như là các vector của một biến độc lập

mới Wk, các mối quan hệ đã đề cập có nghĩa là các biến này là cặp không tương

quan và chúng có chênh lệch bằng [52, 107].

Tương quan giữa các biến độc lập gốc Xk (dự báo) và các thành phần chính

Wk có thể được biểu diễn dưới dạng sau:

W=XZ hay X = WZ’ (1.40)

Trong đó W là ma trận với cột và Z là một ma trận trực

giao với các cột tương đương với các vec tơ riêng

, .

Từ phương trình (1.40) các vec tơ của các biến độc lập Xk là các thành phần

chính theo phương trình sau:

hay (1.41)

và các điểm thành phần chính có giá trị:

23

hay (1.42)

Ý nghĩa hình học của các thành phần chính của một quan sát khi p = 2 và N

= 3. Các thành phần chính w1 và w2 nằm trong cùng mặt phẳng với các vec tơ của

biến độc lập X1 và X2. Góc giữa X1 và X2 nhỏ. Điều đó có nghĩa là các vec tơ này

tương quan chặt chẽ. Đồng thời, các thành phần chính w1 và w2 trực giao với nhau

(không tương quan) và bình phương của chiều dài của chúng bằng với các giá trị

riêng tương ứng của ma trận C, Hình 1.7 [52, 107]. Hồi quy riêng phần tương quan

với w1 theo phương trình: và tương quan với w2 theo phương

trình . Vec tơ dự đoán có dạng:

(1.43)

Bình phương độ dài của vec tơ ảnh hưởng đến giá trị R2 và trực giao của w1 và w2

được tính toán theo phương trình:

(1.44)

. Vec tơ này đóng góp Vec tơ w1 dài, nó tương ứng với trị riêng lớn hơn

quan trọng vào giá trị dự đoán.

Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107]

Vì vậy, mô hình hồi quy được xây dựng với các biến tương ứng có giá trị

riêng lớn hơn. Các biến khác được đưa vào mô hình có tổng tích lũy của các giá trị

riêng gần với tổng của tất cả các giá trị riêng. Rõ ràng không nên xem xét các thành

phần chính tương ứng với các giá trị riêng bằng không. Các điều kiện cần có: các

24

thành phần chính có giá trị riêng thấp thì không đạt yêu cầu. Hệ số hồi quy thành

phần chính được tính toán cho biến Y:

(1.45)

Với C là ma trận chéo mở rộng và Cp+1 là cột thứ (p+1) của ma trận mục tiêu

của biến phụ thuộc. Tương quan giữa thành phần chính wk với biến phụ thuộc Y =

Xp+1 được tính:

(1.46)

Với là sai số của Y.

Ý nghĩa của các thành phần chính trong mô hình được đánh giá thông qua

giá trị F. Nó được thể hiện thông qua giá trị RSS

(1.47)

Tổng bình phương độ lệch của mô hình với k thành phần chính được tính:

(1.48)

Với tổng giá trị hồi quy F với k thành phần chính được tính:

(1.49)

Và F của thành phần chính thứ k được tính:

(1.50)

1.4.3. Bình phương tối thiểu riêng phần

Giống như PCR, bình phương tối thiểu riêng phần (PLS) tạo ra một chuỗi

các mô hình và ước tính nào là tốt nhất với các biến ẩn. Tuy nhiên, tập hợp các mô

hình tạo thành trình tự có trật tự, khác với các mô hình được xây dựng bởi PCR. Giả

sử X = (X1 X2 … Xp) là một ma trận có các cột là vectơ của quan sát trung tâm và

quan sát hiệu chỉnh sai lệch . là một ma trận chéo .

25

Ma trận này đối xứng và không xác định [51, 106]. Do đó, các vector riêng của cặp

vector trực giao với p số vec tơ. Các vec tơ riêng tương ứng với các giá

trị riêng dương , …

(1.51)

Vec tơ

, (1.52)

Là các thành phần chính tính từ (1.51) và (1.39) sau đó:

(1.53)

Từ 1.53 các thành phần chính là N vec tơ trực giao với . Nếu ma trận

bao gồm các thành phần chính và ma trận gồm

các vec tơ riêng , khi đó (1.39) có dạng

(1.54)

Ma trận P là ma trận trực giao, tức là . Vì vậy

(1.55)

Theo (1.55) X gọi là thừa số của ma trận có dạng:

.

Nếu hạng của ma trận X bằng r, khi đó giá trị riêng: và

. Trong trường hợp này:

(1.56)

Từ (1.56) là cột của ma trận X (vec tơ Xj) có thể được trình bày dưới dạng kết hợp

tuyến tính của các thành phần chính trực giao song song tk theo:

26

(1.57)

Ma trận:

(1.58)

Được gọi là “phần thừa thứ m của x”. Vec tơ Em trực giao với vec tơ t1, t2, …,tm-1.

Để minh họa cho tk và pk, một trường hợp cho hai biến X1 và X2, trong không

gian hai chiều P được mở rộng từ hai vec tơ này, chỉ ra trong Hình 1.8 Ma trận

tương quan cho vec tơ chuẩn hóa X1 và X2 là ma trận [51, 106]:

(1.59)

Với là góc giữa vec tơ X1 và X2. Giá trị riêng của ma trận là

và giá trị riêng được tính:

(1.60)

Khi đó các thành phần chính được tính (1.52 và Hình 1.8):

.

Các vec tơ X1 và X2 được tính

(1.61)

Hình 1.8 Thành phần chính với p = 2 [51, 106]

Phương trình (1.61), là phương trình cơ bản trong PLS, có thể tính xấp xỉ các

giá trị riêng với các phần tử không tuyến tính theo phương pháp NIPALS

(Nonlinear Iterative Partial Least Squares).

27

Các tính toán dựa trên các mối quan hệ sau:

(1.62)

Các mối liên hệ từ (1.56), (1.57) và (1.58) áp dụng với ma trận ‘X’ bắt đầu

với :

(1.63)

Mối liên hệ (1.62) gọi là liên hệ ngoài (outer relations), và (1.64) gọi là liên

hệ trong (inner relations), liên kết các biến phụ thuộc và độc lập, cũng được xem

xét để xây dựng một mô hình hồi quy. Trong một trường hợp đơn giản, chúng có

dạng sau:

(1.64)

Với là giá trị dự đoán của y. là phép chiếu của y lên tk,

Khi tiến hành PLS, khi biến phụ thuộc bị giới hạn bởi một bước lặp lại trong

(1.62). các giá trị ban đầu của được tính:

Với (1.65) ; yk-1 là độ lệch.

Sau đó thuật toán PLS (với X và y có ý nghĩa tương quan)

là biến độc lập X và giá trị dự đoán.

Cho k = 1 đến r là một chu kỳ thành lập theo nguyên tắc thành phần chính.

là các vec tơ trọng số để tính thành phần chính thứ k.

là giá trị gần đúng của thành phần chính.

là giá trị gần đúng của vec tơ riêng.

là hệ số hồi quy giữa các thành phần.

là độ lệch của giá trị quan sát.

28

là giá trị dự đoán của biến kế tiếp.

là độ lệch của biến X.

là phần sai số X.

Phần quan trọng của hồi quy là dự đoán sự phụ thuộc của biến phụ thuộc từ

các biến độc lập Xnew.

PLS không cho biết rõ ràng về giá trị dự đoán. Thay vào đó, sự phân tích các

biến độc lập X để tính toán giá trị y.

Đối với vec tơ mục tiêu pk, wk và hệ số hồi quy bk được tính cho bước tiếp

theo. Các biến dự đoán mới Xnew với Nnew mẫu thay vì N.

Giá trị dự đoán trong PLS được thực hiện

khởi tạo độ lệch X và giá trị dự đoán.

Với k từ 1 đến r

; giá trị gần đúng đối với thành phần chính của biến quan sát.

là độ lệch thực tế của X.

là giá trị dự đoán.

Sơ đồ PLS đưa ra trong Hình 1.9. Bước thứ nhất trong thuật toán độ lệch của X:

E0= X= (X1 X2) và độ lệch thứ nhất của giá trị dự đoán y0 = y được tính toán. Sau đó

vec tơ trọng số được tính:

(1.66)

Góc Xk và y, vec tơ t1, được tính

(1.67)

29

, và nó là thành phần chính thứ Trong không gian (P1), dọc theo vec tơ

nhất. vec tơ riêng p1 từ thừa số tính theo phương trình 1.62:

(1.68)

Hệ số hồi quy b1 và mối tương quan của y0 với t1:

(1.69)

Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106]

Hơn nữa, độ lệch và giá trị gần đúng cho biến mục tiêu

được tính toán. Véc tơ để tính giá trị E1 thứ nhất của

khối X được tìm ra như là thành phần chính của , nó trực giao với t1. Cuối

cùng, kiểm tra các vec tơ có phải vec tơ 0 hay không.

Bước thứ hai trong hồi quy là tìm không gian P2, trực giao với t1. Vec tơ t2, là

sự tổ hợp tuyến tính giữa vec tơ , thì trực giao với t1, và hệ số hồi quy b2 từ

lên thu được sau hai bước có phép chiếu y1 t2. Mô hình hồi quy

dạng: . Độ lệch thứ E2 của nhóm X được thành lập từ các

thành phần chính của vec tơ , nó trực giao với t2, nghĩa là vec tơ 0. Hay

đẳng thức là đúng, thuật toán đã hoàn thành. Sử dụng các mô hình với giá

trị dự đoán y với các vec tơ .

30

1.4.4. Giải thuật di truyền

Việc lựa chọn các biến độc lập tối ưu để thu được một mô hình tốt là vấn đề

chính trong mô hình hồi quy hay mô hình mạng thần kinh (ANN) có số lượng lớn

các biến số độc lập [10, 77]. Trong những năm gần đây, giải thuật di truyền

(genetic algorithm - GA) được áp dụng trong chọn lựa biến độc lập bằng phương

pháp hóa tính toán [10]. Thuật toán di truyền dựa trên các nguyên tắc sự tiến hóa

của Darwin, đã được sử dụng rộng rãi để tối ưu hoá tổ hợp biến [10, 77]. GA sử

dụng các quá trình tiến hóa để mô phỏng tiến trình này nhằm giải quyết vấn đề bằng

máy tính [10]. Các quá trình cơ bản sử dụng ở đây là đột biến ngẫu nhiên. Sự kết

hợp di truyền và việc sử dụng chúng dẫn đến việc tối ưu hóa các các tiêu chí lựa

chọn được xác định trước. Sự khác biệt của các phương pháp này từ các chiến lược

tìm kiếm khác là sử dụng một tập hợp các biện pháp trung gian. Sau đó, các biện

pháp này được sử dụng để xây dựng các biện pháp mới và hy vọng cải thiện được

các vấn đề [69, 110]. Về mặt sinh học, các biện pháp riêng biệt được so sánh với

các cá thể trong một quần thể. Các quá trình khác nhau được sử dụng để tạo ra thế

hệ con cái làm tăng sức mạnh của quần thể. Trong tự nhiên, các cá thể phù hợp nhất

để cạnh tranh với các nguồn tài nguyên hạn chế như thực phẩm, không gian để tồn

tại và duy trì nòi giống [110]. Chúng tạo ra thế hệ con cái, cho phép chuyển đổi di

truyền của chúng bằng các gen có trong nhiễm sắc thể. Điều này cần thiết cho mỗi

loài để thích ứng với điều kiện môi trường thay đổi. Do đó, chọn lọc tự nhiên dẫn

đến sự sống còn của các cá thể phù hợp, nhưng nó cũng tiềm ẩn sự sống còn của các

gen thích hợp nhất. Quá trình sinh sản cho phép đa dạng hóa nguồn gen của một

loài. Sự tiến hoá được bắt đầu khi nhiễm sắc thể từ hai cha mẹ tái kết hợp trong quá

trình sinh sản. Sự kết hợp mới của gen được tạo ra từ những gen trước đó và do đó

gen mới được hình thành. Các phân đoạn của hai nhiễm sắc thể mẹ được trao đổi

trong quá trình cắt ngang, tạo ra khả năng kết hợp các gen tốt cho các cá thể tốt hơn.

Các đột biến đưa ra sự thay đổi ít và ngẫu nhiên trong nhiễm sắc thể. Sự lựa chọn,

lai chéo và đột biến lặp lại gây ra sự tiến hoá liên tục của các gen của một loài và

tạo ra những cá thể tồn tại trong một môi trường cạnh tranh [110]. Thuật toán di

truyền vận hành thông qua một chu kỳ đơn giản bao gồm các giai đoạn cơ bản sau:

31

1. Cơ chế mã hoá;

2. Định nghĩa chức năng thể trạng;

3. Tạo quần thể

4. Thao tác di truyền với quần thể

1) Mã hóa

Các chương trình mã hóa được sử dụng trong QSARIS được dựa trên gen cơ

bản. Các mô hình hồi quy có thể (các giải pháp) khác nhau bằng một tập hợp các

biến đang được sử dụng. Nếu tổng số các biến độc lập bằng N, thì một số tương ứng

với bất kỳ giải pháp nào bao gồm một chuỗi các chữ số nhị phân N (bits) được gọi

là các gen [7, 110].

Mỗi giá trị đại diện cho một biến độc lập (0 = vắng mặt, 1 = có mặt).

Ví dụ, nếu một tập tất cả các dự đoán là (X1, X2, X3, X4, X5) thì nhiễm sắc thể của

giải pháp với các dự đoán (X2, X3, X5) sẽ là (0, 1, 1, 0, 1).

Hàm mục tiêu

Mỗi mô hình (giải pháp) có liên quan đến một giá trị mục tiêu phản ánh sự so

sánh tốt với các cá thể khác trong quần thể (các giải pháp khác) [7, 110]. Hai hàm

mục tiêu được sử dụng trong QSARIS. Hàm chức năng thứ nhất hay Fit1 (mô hình)

ad được tính bằng SWR cho mô hình được xác định bởi nhiễm sắc thể của mô

bằng R2

hình. Ưu tiên cho cá thể có giá trị Fit1 lớn. Bất lợi của hàm Fit1 là có thể dẫn đến

các mô hình thừa biến (over-fitting). Hàm chức năng thứ hai Fit2 (mô hình) dựa

trên cơ sở của phương trình của Friedman [7, 110].

(1.70)

Với

(1.71)

Trong hàm LOF: p là số biến số độc lập của mô hình; N là số lượng

mẫu trong bộ dữ liệu;

32

RSSp (mô hình) là tổng bình phương độ lệch của mô hình hồi quy sử dụng các

biến độc lập p, d là số yếu tố (tham số của hàm LOF, xác định bởi quá trình tính

toán). Nhìn chung nếu kích thước nhỏ hơn LOF (lớn hơn Fit2) thì mô hình tốt hơn

[7, 110]. Tất cả các thuật ngữ trong phương trình (1.7.1) khá rõ ràng ngoại trừ yếu

tố d. Có thể thấy rằng với giá trị cho trước d (mặc định là 2), khi N lớn, LOF gần

với giá trị trung bình của RSSp [7, 110]. Mô hình tốt khi giá trị p nhỏ. Như vậy,

LOF tăng khi giá trị (p+1)/N đủ lớn. Đối với một giá trị d nhất định của mô hình,

khi thêm biến mới vào mô hình, RSSp giảm, nhưng khi tỷ số (p+1)/N tăng, LOF đạt

giá trị nhỏ nhất. Với giá trị d xác định ở giá trị tối thiểu. Tuy nhiên, khi p càng nhỏ

thì d càng lớn. Ví dụ, nếu chúng ta giả sử rằng các hệ số hồi quy bk (dựa trên các

thành phần chính) tỉ lệ nghịch với chỉ số k, thì RSSp được tính gần đúng [7, 110]:

(1.72)

(1.73)

Giá trị LOF nhỏ nhất khi:

(1.74)

Rõ ràng là các mô hình tối ưu với số lượng biến nhỏ tương ứng với giá trị d lớn.

Tham số d thường được lựa chọn bằng cách xem xét các trường hợp thực tế. Các

giá trị ban đầu được đề nghị là từ 1 đến 4. Sơ đồ hoạt động khác của các phương

pháp di truyền được mô tả trong Hình 1.10. Sau đây, chúng tôi sẽ xem xét mô tả

các tùy chọn khác nhau của GA.

Tạo dữ liệu nguồn (quần thể nguồn)

Trong việc tạo ra một tập dữ liệu ban đầu, cần phải có hai quyết định: kích cỡ

dữ liệu và dự đoán ban đầu của giải pháp. Hành động chính trong GA là kết hợp hai

33

nhiễm sắc thể để tạo ra một nhiễm sắc thể mới [10, 110]. Ví dụ, tất cả các nhiễm

sắc thể trong quần thể chứa cùng một bit ở một vị trí đặc biệt của chuỗi gen, không

có sự kết hợp của nhiễm sắc thể có thể đưa một giá trị khác vào vị trí đó.

Hình 1.10 Sơ đồ giải thuật di truyền [10]

Điều này làm giảm đáng kể chiều kích của vấn đề tìm kiếm bằng một, vì giá

trị đó sẽ được cố định mãi mãi. Việc giảm kích thước của vấn đề sẽ được gọi là tập

trung. Nếu tập dữ liệu (số lượng quần thể) đủ lớn sẽ chọn lọc được nhiễm sắc thể

ban đầu có sự tương thích tương đối cao và có nhiều điểm chung với các giải pháp

tối ưu. Nếu tập dữ liệu ban đầu quá nhỏ, một cá thể thể ban đầu tương đối tốt có thể

có nhiều giá trị chung với một giải pháp tối ưu và làm tăng khả năng của giải pháp

này [10, 110]. Ngược lại, nếu tập dữ liệu quá lớn, nhiễm sắc thể ban đầu có nhiều

điểm chung với giải pháp tối ưu có thể bị nhiễu bởi các giải pháp khác và có thể

không có ảnh hưởng đến toàn bộ quần thể (dữ liệu) [10, 110].

Thông thường, giải pháp tốt nhất chọn một tỷ lệ phần trăm nhỏ của tất cả các

biến, và sau đó trong nhiễm sắc thể 0 là cao hơn nhiều so với 1. Sự khởi tạo của tập

dữ liệu, trong đó mỗi bit được cho một giá trị 0 hoặc 1 ngẫu nhiên với cùng một xác

suất, sẽ gần như không thể áp dụng được [10, 110]. Vì quần thể ban đầu sẽ được

34

hình thành bởi các nhiễm sắc thể tương ứng với các tập con có chứa trung bình các

biến của bộ dữ liệu.

Thực tế trong một số trường hợp các nhiễm sắc thể này không thể đánh giá

được. Giải pháp áp dụng cho vấn đề này là: ở giai đoạn tạo ra quần thể ban đầu, xác

suất có '1' thấp hơn nhiều so với việc có '0'. Do đó, quần thể ban đầu được hình

thành bởi các nhiễm sắc thể mục tiêu để tập con chứa số ít biến. Với tư cách là

hướng dẫn, cho mỗi gen xác suất là ‘1’ để thiết lập bộ 5 biến [10, 110]. Sau đó,

trung bình 5 biến sẽ được chọn trong mỗi nhiễm sắc thể. Điều này có nghĩa là ở giai

đoạn đầu tiên một số lượng nhiễm sắc thể cao hơn nhiều và được đánh giá và các

biến "xấu" có thể được loại ra dễ dàng hơn, vì chúng không đủ tin cậy đối với

nhiễm sắc thể mục tiêu, trong đó chỉ một vài biến tốt được lựa chọn. Trong mỗi lần

chạy, sự kết hợp của các khối nhỏ, có tính thông tin cao sẽ dẫn đến sự gia tăng dần

dần số lượng các biến được lựa chọn, cho đến khi nó được 'tối ưu' [10, 110].

Chọn thế hệ cá thể ban đầu

Lựa chọn cá thể ban đầu trong một GA là cung cấp khả năng sinh sản tốt

nhất. Có ba cách để thực hiện trong QSARIS.

35

- Phương pháp thông thường là lựa chọn giải pháp di truyền và tiến hóa. Trong đó,

chọn lựa ngẫu nhiên một tập hợp cá thể sau đó chọn ra cá thể tốt nhất.

- Thuật toán di truyền cổ điển cũng sử dụng chương trình lựa chọn bánh xe lăn

(roulette wheel) [10, 76], ở đây xác suất của mỗi thế hệ được lựa chọn tỷ lệ thuận

với khả năng của nó. Để thực hiện loại hình lựa chọn này, các phân đoạn sau bị loại

trên trục [xk-1; xk] (k = 1, 2, …, m). Chiều dài của các đoạn này bằng với số cá thể

(Hình 1.11). Sau đó, một điểm ngẫu nhiên xrand được đưa vào đoạn tổng hợp [0; xm]

và nó có sự phân bố đồng đều dọc theo phân đoạn nhất định. Cá thể tương ứng với

đoạn được chọn làm cha mẹ trong đoạn [0; xm] [10, 110].

Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76]

Sự lựa chọn thế hệ cha mẹ theo phương pháp xếp hạng tuyến tính tương tự

như lựa chọn theo phương pháp bánh xe lăn.

Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76]

Sự khác biệt là xác suất của mỗi cá thể được lựa chọn trực tiếp dự kiến đến số thứ

tự của nó trong tập dữ liệu ban đầu. Do đó, đối với tập hợp của m cá thể các đoạn có

chiều dài m, m-1, m-2, …, 1 được rút ra trên trục (Hình 1.12) [10, 110]. Sau đó,

một điểm n gẫu nhiên với tọa độ xrand được đưa vào phân đoạn [0; xm]. Dấu chấm

ngẫu nhiên này được phân bố đồng đều dọc theo phân đoạn nhất định. Mỗi cá thể

mục tiêu tương ứng với phần mà ngẫu nhiên được chọn làm thế hệ cha mẹ [10, 76].

36

2) Tổ hợp

Hình 1.13 Toán tử chéo đơn điểm [76]

Hình 1.14 Toán tử chéo hai điểm [76]

Tổ hợp là một hoạt động mà hai cá thể được kết hợp để tạo ra các thế hệ mới.

Trong QSARIS, các toán tử chéo được sử dụng trong tổ hợp. Toán tử đơn giản nhất

được gọi là chéo đơn điểm (one-point crossover) [10, 76]. Nó xảy ra khi hai cá thể

cha mẹ (P1, P2) được đổi chỗ sau một điểm cắt được lựa chọn ngẫu nhiên, tạo ra hai

con lai (O1, O2) (Hình 1.13). Trong toán tử chéo hai điểm (Two-point crossover),

hai điểm được chọn ngẫu nhiên và các phân đoạn của nhiễm sắc thể giữa chúng

được trao đổi (Hình 1.14) [10, 76].

Số điểm có thể được tăng liên tục cho đến khi mỗi giá trị cho một con cái

nhất định có thể được lựa chọn độc lập từ cha hoặc mẹ. Thế hệ con lai khác chỉ đơn

giản nhận được giá trị bổ sung. Được gọi là chéo đồng nhất (uniform crossover).

Nếu nó nhận được từ cha và mẹ, nó được gọi là chéo đồng nhất cân bằng (unbiased

37

uniform crossover). Loại crossover (số điểm cắt) cần xác định các vấn đề ảnh

hưởng đến việc tìm kiếm. Ví dụ, chúng ta giả định rằng mục tiêu của sự lựa chọn là

một tập gồm 11 mô tả, không có trong bộ số liệu 100, dự đoán chính xác một số

thuộc tính. Đồng thời chúng ta giả sử rằng bộ mô tả tốt nhất, hoặc chiếm ưu thế là:

(g1, g2, g3, g4, g5, g6, g7, g8, g9, g10, g11) [10, 76].

Nếu một điểm chéo một điểm được sử dụng, với xác suất 0,9 cho các bộ mô

tả liền kề (ví dụ: g4 và g5) sẽ được chuyển sang cùng một dạng lai tạo, và xác suất

bằng không là các mô tả đầu tiên và cuối cùng sẽ được chuyển sang cùng một đứa

con của cha mẹ này. Tương tự, nếu g1 và g3 là bộ mô tả "tốt" và g2 không, thì

không thể tạo ra thế hệ con lai g1 và g3 từ cha mẹ. Trong trường hợp này, một chéo

hai điểm hoặc chéo đồng dạng có thể là thích hợp hơn [76].

GA có thể sử dụng toán tử phối giống với một xác suất nhất định Pmate. Nếu

tổ hợp không xảy ra, sau đó các bản sao của cha mẹ được thêm vào dân số. Những

dòng vô tính này có thể được thay đổi bởi đột biến [76].

3) Đột biến

Đột biến đơn giản sửa đổi một nhiễm sắc thể đơn với xác suất cho trước.

Trong tiêu chuẩn GA, xác suất đột biến (Pmutate trong Hình 1.10) rất nhỏ và hành

động của nó là cố gắng ngăn ngừa hội tụ đến một giải pháp tối ưu [10, 76]. Một đột

biến trong nhiễm sắc thể có thể bổ sung 1 hay nhiều bit. Cũng như lai chéo, có thể

xác định k-đột biến (k = 1 hay 2), khi k gen được chọn ngẫu nhiên 1 hay nhiều lần

với xác suất Pmutate. Hơn nữa, 1 điểm đột biến đồng nhất (uniform mutation) có thể

xảy ra, khi ít nhất 1 gene được thay đổi với xác suất Pmutate. Vì vậy, mỗi bit được

thay đổi với xác suất [10]:

(1.75)

Với m là số gen trong nhiễm sắc thể.

4) Tiến trình lai

Không nhất thiết yêu cầu số các thể lai phải bằng số cá thể ban đầu, hoặc tất

cả cá thể con phải được đưa vào tập dữ liệu. Có thể định nghĩa số cá thể con từ cặp

cá thể gốc (nghĩa là hoàn thành một số chu kỳ lai với cùng một cặp cá thể ban đầu).

38

Nếu số cá thể con trùng với số lượng cá thể ban đầu hiện có thì nó không được coi

là tiếp cận và thu nhập từ việc lai. Tổng số tất cả các cá thể con là riêng biệt. Con số

này nên chia cho số cá thể của cùng một bậc cá thể ban đầu [10].

Cập nhập dữ liệu

Thế hệ cá thể con có thể được thêm vào dữ liệu hiện tại bằng cách chuyển

một thành viên hiện có. Vì các biến thể sau có thể thực hiện được: thay thế một số

thành viên yếu nhất trong tập hợp bằng cá thể con tốt nhất; tăng dữ liệu tiếp theo từ

cá thể lai tốt nhất [76].

Mặc dù lựa chọn thứ hai là phổ biến nhất, nó cũng là tập trung nhất. Vì thế

hệ con sẽ có một số gen chung với thế hệ ban đầu, tất cả được đưa chung vào tập dữ

liệu. Khi gia tăng số lượng các biện pháp lai với một cặp cá thể gốc sau khi mỗi con

được sinh ra. Điều này cũng có lợi thế là thông tin di truyền có giá trị có thể chứa

trong thành viên ít nhất trong tập hợp sẽ bị mất trước khi có cơ hội chuyển thông tin

này cho một cá thể con. Cần hạn chế số lượng quần thể sinh ra để thoát khỏi chu

trình cơ bản và để hoàn thành một thuật toán [76, 107].

1.4.5. Mạng thần kinh nhân tạo (ANN)

1.4.5.1. Khái niệm

Mạng thần kinh nhân tạo (nơ ron) là một hệ thống nhận thức dựa trên sự

nhận thức của hệ thống thần kinh sinh học tự nhiên Hình 1.15.

Ba công cụ trí tuệ nhân tạo gồm mạng thần kinh, logic mờ và thuật toán di

truyền được kết hợp hài hòa trong quá trình thiết lập mô hình liên quan nhân quả tối

ưu. Mạng thần kinh: thiết lập mô hình liên quan nhân quả (X, Y) và dự đoán (Y) từ

(X) là các yếu tố đã biết [30]. Thuật toán di truyền: tối ưu hóa dựa trên mô hình liên

quan nhân quả đã được thiết lập bởi mạng thần kinh, dùng khi cần cải thiện (Y)

bằng cách thay đổi (X). Logic mờ: làm cho mạng thần kinh hiệu quả hơn trong việc

thiết lập mô hình liên quan nhân quả đối với các dữ liệu phức tạp, cả định lượng và

không định lượng đồng thời giúp cho thuật toán di truyền được thuận lợi hơn trong

sự tối ưu hóa với các mục tiêu liên quan [101].

39

Hình 1.15 Hệ thống thần kinh sinh học tự nhiên

1.4.5.2. Cấu trúc mạng

Mạng thần kinh nhân tạo (ANN) có cấu trúc giống hệ thần kinh động vật,

tương tự như bộ não có chức năng xử lý thông tin. ANN gồm nhiều nơ ron gắn kết

cấp cao với nhau để giải quyết các vấn đề một cách rõ ràng. ANN giống như bộ não

người, trải qua quá trình học, tích lũy kinh nghiệm để xử lý các vấn đề trong từng

tình huống phù hợp [30, 50].

Năm 1943 nhà thần kinh học Warren McCulloch và nhà logic học Walter

Pits đã nghiên cứu ANN [50]. Tuy nhiên, các nghiên cứu ANN thời bấy giờ còn

hạn chế. Ngày nay ANN khá phổ biến, phát triển và ứng dụng rộng rãi trong nhiều

lĩnh vực. Một số lĩnh vực điển hình như các ngành khoa học tự nhiên, y học, kinh

tế, quân sự, điện, điện tử, kỹ thuật chế tạo [77]. Mới nhất là các nghiên cứu ứng

dụng trong lĩnh vực khoa học tự nhiên. Tại Việt Nam việc nghiên cứu ứng dụng

ANN vào hóa học chỉ mới bắt đầu trong vài năm gần đây và cần được phát triển.

Điển hình như các lĩnh vực: Hóa học môi trường; Hóa học hữu cơ (phân tích hữu

cơ, tổng hợp hữu cơ…); Hoá học phân tích (phân tích môi trường, giám sát ô

nhiễm…); Công nghệ hóa học ( kỹ thuật nano, kỹ thuật dầu khí, tách chất…); Công

nghệ xử lý môi trường (đánh giá xử lý, mô phỏng xử lý…) [30].

40

Nhóm luyện

Đầu vào (Qi, i..)

Đầu ra (pGI50)

Xử lý đầu ra

Chỉnh mức quan trọng Kết quả

Mạng được luyện

Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50]

Mạng thần kinh nhân tạo ngày nay được ứng dụng trong rất nhiều ngành

khoa học. Trong đó Hóa học là một lĩnh vực có nhiều ứng dụng của mạng thần kinh

nhân tạo mà phương pháp truyền thống không thể giải quyết được, quá trình luyện

mạng thần kinh dẫn ra ở Hình 1.16. Mạng thần kinh có thể thiết lập các mô hình

nhân quả thích hợp và mềm dẻo với nhiều loại số liệu đơn giản hay phức tạp tuyến

tính hay không tuyến tính [101].

Đưa dữ liệu đầu vào gồm biến độc lập (X) và biến phụ thuộc (Y) qua lớp ẩn

để mạng thần kinh định lượng mối quan hệ giữa X và Y để dự đoán Y từ X, quá

trình định lượng này có thể tuyến tính hoặc không trên hệ thống các hàm toán,

thông dụng như hàm Sigmoid, Tanh có phương trình của hàm cụ thể [86]. Quá trình

học (luyện mạng) như vậy tạm hiểu là quá trình học của hệ thần kinh tự nhiên, học,

cải tiến, có kế thừa và phát huy và khả năng ghi nhớ, sao chép, rõ ràng đây là mô

hình tối ưu hơn mô hình tuyến tính thuần túy.[77]

Cấu trúc mạng nơ ron

41

Mạng nơ ron bao gồm các nút mạng cho chức năng xử lý thông tin. Lớp

nhập (input), lớp xuất (output), trọng số của từng lớp input, trọng số tổng của mạng

nơ ron Hình 1.17 [5, 102].

Hình 1.17 Cấu trúc mạng nơ ron [101]

Các hàm toán trong mạng nơ ron có các đặc tính sau: Hàm có tính đơn điệu;

Hàm bị chặn trên và chặn dưới; Hàm phải có tính liên tục và trơn. Một số hàm toán

trong mạng nơ ron [50, 77]:

(1.76)

Hàm Threhold f(u) = 1 nếu u > 0; f(u) = 0 nếu u < 0 Hàm piecewwise – linear f(u) = 1 nếu u > 1/2; f(u) = u nếu 1/2 > u > -1/2; f(u) = 0 nếu u < -1/2

Hàm sigmoid (logistic)

(1.77)

Hàm tanh – hyperbol

(1.78)

Quá trình luyện mạng và thử của mạng nơ ron

Trong tiến trình học, mạng nơ ron nhận diện dữ liệu, các thông số tự do được

thay đổi liên tục do dự thay đổi của môi trường và các giá trị này được ghi nhớ lại

[95], Hình 1.18 [16, 21].

42

Hình 1.18 Quá trình học của mạng nơ ron [16]

Trong quá trình luyện, nhập các giá trị lớp input vào hệ thống luyện nhằm

tạo ra các giá trị output. Tiếp theo mạng nơ ron so sánh các trị output từ mạng nơ

ron với các giá trị đầu ra mong muốn. Nếu hai giá trị này giống nhau thì quá trình

luyện mạng đạt yêu cầu. Nếu sai số giữa hai giá trị này quá lớn thì quá trình luyện

mạng được lặp lại, thay đổi các thông số luyện mạng [5, 21, 30].

Quá trình luyện mạng được lặp lại liên tục, cho đến khi tìm ra các giá trị

trọng số phù hợp sao cho giá trị xuất do mạng nơ ron xuất ra đạt yêu cầu. Do đó

trong quá trình luyện mạng, cần thiết lập yêu cầu về sai số, hoặc yêu cầu về số vòng

lặp cần xác định [97, 114].

Khác với chương trình máy tính khác được lập trình sẵn một cách rành mạch,

mạng thần kinh nhân tạo phải được luyện với các nhóm luyện có sẵn. Quá trình

luyện mạng có tính chất lặp lại, cải thiện chất lượng mô hình một cách liên tục

thường sử dụng thuật toán lan truyền ngược gồm các bước [50]: chọn một cặp đầu

vào – đầu ra từ nhóm luyện để làm vector đầu vào cho đầu vào của mạng thần kinh;

tính đầu ra của mạng; tính sự khác biệt giữa đầu ra của mạng và đầu ra mong muốn;

điều chỉnh mức quan trọng để giảm thiểu sai số; lặp lại bước điều chỉnh cho đến khi

sai số luyện mạng được chấp nhận [50].

Khi luyện mạng các mô hình nhân quả có thể được thiết lập riêng rẽ hay một

lượt. Các mức quan trọng được điều chỉnh cho phù hợp với dữ liệu luyện mạng, có

khả năng mạng thần kinh được luyện quá mức. Khi ấy mạng thần kinh có thể chỉ dự

43

đoán tốt cho nhóm luyện mà không chính xác đối với trường hợp thử. Do đó dữ liệu

nghiên cứu thường được chia thành hai nhóm: luyện và thử, dùng nhóm luyện để

luyện mạng và dùng nhóm thử để đánh giá về mạng. Nếu giá trị dự đoán gần với giá

pr và R2

tr cao) [90].

trị quan sát thì khả năng dự đoán là tốt (R2

Giải thuật lan truyền ngược (Back – Propagation)

Trọng số các kết nối được điều chỉnh bằng thuật toán lan truyền ngược sao

cho sai số E là nhỏ nhất [7, 22].

(1.79)

Với t (xi, w): giá trị của tập mẫu; y (xi): giá trị output của mạng.

Trên từng nơ ron, đều có lớp input và output, các giá trị này đều có một trọng

số để đánh giá mức độ ảnh hưởng của các giá trị [22]. Thuật toán lan truyền ngược

điều chỉnh các trọng số sao cho ej = Tj – yj là nhỏ nhất. Cần xác định vị trí của từng

nơ ron, nơ ron lớp ẩn, lớp output, [5, 21, 90] Hình 1.19.

Hình 1.19 Mô hình tính toán một nơ ron [69, 77]

Trong đó: wij: vector trọng số của nơ ron số đầu vào i.

Giá trị sai số ej của nơ ron tại vòng lặp thứ n:

(1.80) ej (n) = tj (n) – yj (n)

Tổng bình phương sai số của mạng nơ ron:

(1.81)

Tại nơ ron ta có tổng trọng số input (uj):

(1.82)

Giá trị lớp xuất của nơ ron j: yj (n) = fj (uj(n))

44

Tùy theo hàm hoạt động để tính toán các giá trị điều chỉnh trọng số tương

ứng theo thuật toán lan truyền ngược [22, 69].

Mạng thần kinh nhân tạo không thích hợp với vấn đề đòi hỏi về kí tự và bộ

nhớ. Mạng thần kinh cấu tạo bởi nhiều lớp: I(j) – HL(k) – HL(m) – O(n). Trong đó:

I là lớp vào, j là số nút đi vào, HL là lớp ẩn, k là số nút của lớp ẩn thứ nhất, m là số

nút của lớp ẩn thứ hai, O là lớp đi ra, n là số nút đi ra [90].

1.4.6. Thống kê đánh giá mô hình

Kỹ thuật đánh giá chéo loại bỏ dần từng trường hợp: Một hợp chất trong

nhóm luyện được loại bỏ. Mô hình QSAR sau đó được xây dựng từ các phân tử còn

lại và kết hợp với các biến mô tả ban đầu được lựa chọn và hoạt tính của hợp chất bị

loại bỏ được dự đoán bằng phương trình QSAR [51]. Chu kỳ này được lặp đi lặp lại

cho đến khi tất cả các hợp chất được loại bỏ một lần và hoạt tính của chúng được dự

báo [51]. Cuối cùng, mô hình có được kiểm tra khả năng dự báo dựa vào các tham

số PRESS, R2 (Q2), độ lệch chuẩn SDEP tính từ PRESS [72, 73].

(1.83)

(1.84)

(1.85)

Trong phương trình Ytn và Ydd tương ứng với các giá trị thực nghiệm và giá trị

dự đoán, n là số hợp chất, Ytn (luyen), Ydd (luyen) là giá trị thực nghiệm và giá trị dự đoán

của các hợp chất trong nhóm luyện bằng kĩ thuật loại bỏ dần từng trường hợp

(Leave – one – out), giá trị Q2 ≥ 0.5.

Tính R2

pr

Giá trị R dự đoán (Rdd) phản ánh mức độ tương quan giữa giá trị thực nghiệm

và giá trị dự đoán của nhóm chất trong nhóm kiểm tra (kt) [51].

45

(1.85)

Ở đây, Ytn(kt) và Ydd(kt) là giá trị hoạt tính thực nghiệm và giá trị hoạt tính dự

luyen chỉ ra các giá trị hoạt tính thực

đoán của các hợp chất trong tập kiểm tra.

pr cao hơn 0,5

pr càng tiến gần đến 1 càng tốt.

nghiệm trung bình của các chất trong nhóm luyện. Vì vậy giá trị R2

thì mô hình có khả năng dự đoán. Giá trị R2

1.4.7. Tính toán đóng góp của các tham số

Các giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% (3) [90] được

tính toán theo công thức:

với ; ; (1.86)

Trong đó: m là số mô hình kiểm tra tương ứng với số biến số k; k là tổng số

biến số trong mỗi mô hình; n là tổng số mô hình dùng để kiểm tra; Ctotal là tổng

đóng góp của các tham số mô tả trong một hợp chất; P mx i, % là phần trăm đóng

góp trung bình của mỗi tham số mô tả phân tử đối với m mô hình;

MPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả phân tử đối với

từng mô hình; GMPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả

phân tử đối với từng mô hình.

1.5. HỢP CHẤT FLAVONOID

1.5.1. Giới thiệu chung

Flavonoid là các hợp chất C15, gồm hai nhân phenol liên kết với nhau qua

một đơn vị C3. Quy ước đánh số trên khung phân tử flavonoid như Hình 1.20.

Flavonoid là nhóm chất rất phổ biến trong tự nhiên, thường gặp trong dược

liệu có nguồn gốc thực vật, trong đó nhóm chancone anthocyanidin và auronon là

được biết đến là các chất tạo màu sắc cho thực vật [74].

46

Chancon Flavononoid

Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74]

1.5.2. Phân loại dẫn xuất flavonoid

Có một số loại dẫn xuất flavonoid có thể kể tới như: Euflavonoid là các dẫn

xuất flavonoid có gốc aryl ở vị trí C2: flavone, flavonol, flavanone, flavanol,

chalcone, anthocyanin, anthocyanidin, flavane; Isoflavonoid có gốc aryl ở vị trí C3:

isoflavone, isoflavanone, rotenoid. Neoflavonoid có gốc aryl ở vị trí C4:

calophylloid; Biflavonoid là các dẫn xuất flavonoid dimmer; Triflavonoid cấu tạo

bởi 3 monomer flavonoid; Flavolignan là các dẫn xuất flavonoid mà phân tử có một

phần cấu trúc lignan [20].

Anthocyanidin Isoflavone

flavane Aurone

Hình 1.21 Một số dẫn xuất flavonoid [20, 74]

47

1.5.3. Phân bố flavonoid trong tự nhiên

Flavonoid là nhóm chất có mặt trong hầu hết các bộ phận của các loài thực

vật bậc thấp và thực vật bậc cao. Hiện nay có trên 10.000 hợp chất được phân lập và

xác định cấu trúc [81]. Các họ thực vật chứa flavonoid như Leguminosae,

Rutaceae, Moraceae, Ericaceae và Anacardiaceae. Đối với isoflavonoid chỉ xuất

hiện giới hạn trong phân họ Papillionoideae của họ Leguminosae [81].

1.5.4. Hoạt tính sinh học của flavonoid

Flavonoid là nhóm chất có phổ hoạt tính rất phong phú, rộng rãi đặc biệt

trong lĩnh vực y học, dược phẩm, chúng có một số hoạt tính đặc trưng sau:

Hoạt tính chống oxi hoá: flavonoid có khả năng vô hoạt các tác nhân oxi

hoá như các anion O2-, gốc OH., ROO.. Có nhiều nghiên cứu về khả năng chống oxi

hoá của flavonoid, các nghiên cứu mối quan hệ định lượng giữa cấu trúc – hoạt tính

kháng oxi hoá của chúng được thiết lập [67, 81]. Các công trình nghiên cứu này đã

chỉ ra nhóm >C=O (C-4 cacbonyl) và liên kết đôi C-2 và C-3 là các yếu tố quan

trọng ảnh hưởng đến hoạt tính kháng oxi hoá của các dẫn xuất flavonoid [67].

- như protein kinase, xanthin oxidase.

Một số nghiên cứu chỉ ra rằng, flavone có hoạt tính cao hơn isoflavone;

flavonoid ức chế men sản sinh ra anion O2

Bên cạnh đó, một số flavonoid ức chế cyclooxygenase, lipoxygenase, glutathion S-

tranferase, NaDH oxidase là các loại men tham gia tạo gốc oxy hoạt động. Về mặt

nhiệt động học, thế oxi hoá khử của flavonoid thấp nên có thể nhường hidro:

FLA-OH + R. →FLA-O. + RH

Flavonoid trong cơ thể chưa được công bố nhiều, vì việc phân lập khó khăn.

Phần lớn các flavonoid vào cơ thể bị chuyển hoá thành các axit phenolic, các axit

này vẫn có khả năng bắt gốc tự do [12, 81]. Tuy nhiên, các flavonoid đã chuyển

hoá và chưa chuyển hoá đều có tác dụng chống oxi hoá.

Hoạt tính kháng vi sinh vật: Flavonoid và các polyphenol có khả năng bảo

vệ thực vật khỏi sự xâm hại của vi sinh vật. Ngày nay, các nhà khoa học ngày càng

quan tâm đến việc sử dụng flavonoid để phòng, chữa bệnh. Hợp chất baicalin từ cây

Scutelleria baicalensis ức chế trực tiếp virus HIV [54]. Hợp chất biflavone

48

(robustaflavone, hinokiflavone) ức chế các enzym cần thiết cho quá trình phiên mã

của virus IC50 = 65 M. Các nghiên cứu khác cho thấy, flavonol và auron kháng

HIV mạnh, quercetin 5ml ức chế 70% virus HIV [45].

Hoạt tính ức chế emzim: các nghiên cứu chỉ ra rằng, liên kết đôi C-2 và C-

3, nhóm xeton ở C4 và nhóm OH ở vị trí 3’, 4’, 5’ đóng vai trò quan trọng trong hoạt

tính ức chế enzym NADH–oxidase, một số flavonoid ức chế enzym xanthin oxidase

là loại men xúc tác quá trình oxy hoá xanthin, hypoxanthin thành axit uric [42, 56] .

Hoạt tính kháng viêm: flavonoid có hoạt tính ức chế men cyclo-oxygenase,

men 5-lipoxygenase trong quá trình trao đổi chất theo con đường arachinonat. Như

hợp chất 8- hydroxyluteolin ức chế chọn lọc men 5-lipoxygenase với IC50 gần 10

µ[78] Hoặc cyanidin ức chế men prostaglflavonoidin endoperoxid hydrogen

synthase -1 và -2 với IC50 tương ứng là 90 và 60 µApigenin có hoạt tính ức chế

tăng sinh nguyên bào sợi trong khoảng nồng độ từ 0,01 – 100 mg/ml. Ở đây,

nguyên bào sợi đóng vai trò quan trọng trong việc tạo hạt, sẹo và tương tác với hệ

miễn dịch khi cơ thể bị viêm nhiễm. Các nguyên bào sợi làm cho hầu hết các vết

thương lâu lành. Hay như hợp chất quercetin, curcumin có tác dụng làm lành vết

thương trong quá trình thay thận [19].

Hoạt tính kháng u và gây độc tế bào: Chalcone pedicin phân lập từ lá cây

Fissistigma lamguinosum có hoạt tính ức chế sự liên kết của tubulin thành

microtubule với IC50 là 300 µM [74]. Ngoài ra từ lá cây Fissistigma lamguinosum

cũng phân lập được fissistin và isofissistin có hoạt tính gây độc tế bào. Từ lá cây

Baeckea frutescens người ta cũng phân lập được hai hợp chất flavanone có hoạt tính

gây độc tế bào ung thư bạch cầu L210 với IC50 bằng 0,25 µg/ml [105]. Từ rễ cây

Scutellaria baicalensis phân lập được các dẫn xuất flavonone là baicalein và baicalin

có hoạt tính ức chế tế bào ung thư gan, ung thư tụy. Từ cây Wikstroemia indica (L)

C.A. Meyer đã phân lập được kaempferol-3-O-β-D-glucopyranosid và tricin có hoạt

tính ức chế tế bào ung thư máu. Ngoài ra, flavonoid còn có một số hoạt tính khác

như hoạt tính đối với mạch máu, hoạt tính oestrogen và có vai trò quan trọng trong

sự tương tác giữa động vật và thực vật [81].

49

1.6. PHÂN LẬP VÀ XÁC ĐỊNH CẤU TRÚC FLAVONOID

1.6.1. Phân lập flavonoid

Sử dụng phương pháp ngâm ethanol để trích ly các hợp chất ra khỏi nguyên

liệu [105]. Sử dụng phương pháp sắc ký cột với chất nhồi cột là silicagel pha

thường, sephadex LH20, pha đảo Rp18 kết hợp sắc ký lớp mỏng để phân lập các

dẫn xuất flavonoid tinh khiết [3, 59]. Phát hiện dẫn xuất flavonoid bằng đèn tử

ngoại ở hai bước sóng 254 nm và 365 nm và dùng thuốc thử dung dịch

H2SO4/EtOH [37, 94].

1.6.2. Xác định cấu trúc flavonoid

Các phương pháp xác định cấu trúc flavonoid: Phương pháp phổ cộng hưởng

từ hạt nhân, Phụ lục 64 gồm phổ 1H-NMR, phổ 13C-NMR, phổ hai chiều HSQC và

Phổ HMBC. Phương pháp nhiễu xạ tia X đơn tinh thể, Phụ lục 58 [4].

1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên

Quá trình thử nghiệm xác định hoạt tính ung thư Hela của các dẫn xuất

flvonoid được thực hiện theo phương pháp so màu (SRB). Tế bào ung thư Hela

được nuôi cấy trong môi trường E'MEM (Sigma), bổ sung phenol red 0,4%, L-

glutamine 200 mM, NaHCO3 7,5%, HEPES 1M, Penicillin - Streptomycin 200

IU/mL, Amphotericin - B 0,1% và huyết thanh phôi thai bò 5%, trên đĩa 96 giếng

với mật độ 104 tế bào/giếng, trong điều kiện vô trùng, ở 37 oC, 5% CO2 [91, 98].

Sau 24 giờ, tế bào nuôi cấy được xử lý với dung dịch flavonoid 100 µg/mL. Sau 48

h, tế bào Hela được nhuộm SRB, đo mật độ quang (optical density – OD) ở bước

sóng 490 nm và 620 nm. Chất đối chứng dương sử dụng là Camptothecin

0,01µg/mL, chất đối chứng âm là nước cất vô trùng 10% pha trong môi trường và

DMSO 0,25%. Tỉ lệ ức chế tăng trưởng tế bào tính theo công thức (1.87) [91, 98].

I(%) = (1 – (ODThử nghiệm / OD đối chứng)) x 100% (1.87)

Tất cả các thí nghiệm được lặp lại 3 lần. Số liệu được xử lý bằng phần mềm

Microsoft Office Excel 2007.

50

CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. SƠ ĐỒ NGHIÊN CỨU

Sơ đồ nghiên cứu tổng quát được đưa ra ở Hình 2.1. Nghiên cứu lý thuyết

bao gồm: tính các tham số điện tích, tham số độ dịch chuyển hóa học, tham số hóa

lý, tham số 2D, 3D của các dẫn xuất flavonoid; xây dựng các mô hình QSAR: xác

định định lượng các tham số điện tích, tham số độ dịch chuyển hóa học, tham số

hóa lý, tham số 2D, 3D ảnh hưởng quan trọng đến hoạt tính kháng ung thư; kiểm tra

khả năng dự đoán của mô hình.

Hình 2.1 Sơ đồ nghiên cứu tổng quát

Thực nghiệm sàng lọc flavonoid: Phân lập và tinh chế một số flavonoid từ

gừng gió, đậu nành, tía tô, xa kê, actiso, sử dụng các phương pháp sắc ký cột và sắc

ký lớp mỏng [3]. Xác định cấu trúc flavonoid chiết xuất sử dụng phương pháp phổ

cộng hưởng tử hạt nhân 1H-NMR, 13C-NMR NMR, DEPT, HSQC, HMBC và

phương pháp đo nhiễu xạ tia X đơn tinh thể [1, 109]. Thử in vitro hoạt tính kháng

Hela của các flavonoid chiết xuất sử dụng phương pháp so màu SRB [98]. Thiết kế,

sàng lọc flavone và isoflavone mới từ các hợp chất mẫu. Thiết kế, sàng lọc một số

51

dẫn xuất flavonoid mới từ các dẫn xuất flavonoid chiết xuất. Dự đoán hoạt tính

kháng ung thư cổ tử cung của các dẫn xuất flavonoid chiết xuất và hợp chất thiết kế

mới từ hợp chất mẫu chiết xuất ra từ thực vật và hợp chất tổng hợp [80], bằng cách

sử dụng các mô hình QSAR.

2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP

2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử

Dữ liệu sử dụng để xây dựng mô hình QSAR bao gồm các hợp chất flavone

và isoflavone và hoạt tính GI50 (μg/M) (nồng độ ức chế 50 % sự phát triển của tế

bào ung thư) được thu nhận từ nghiên cứu của Wang và cộng sự [80, 103] Phụ lục

1a. Giá trị GI50 được chuyển đổi sang giá trị pGI50 (pGI50 = -log(GI50) nhằm giảm

biên độ biến thiên của tập dữ liệu đồng thời giảm sai số và tăng khả năng dự đoán

của các mô hình QSAR [86, 88].

2.2.2. Nguyên liệu và phương pháp

2.2.2.1. Phần mềm ứng dụng

Các phần mềm được sử dụng trong đề tài này gồm 3 nhóm chính: xây dựng

và tính toán các tham số, xây dựng các mô hình và phân tích, thống kê, vẽ đồ thị.

Phần mềm Ứng dụng

ChemOffice 2008 Tính toán các tính chất hóa lý

HyperChem v8.0 Tính toán điện tích, độ dịch chuyển hóa học

QSARIS Tính toán các tham số cấu trúc 2D, 3D

INForm v2.0 Xây dựng các mô hình mạng nơ ron

Visual Gene Developer v1.7 Xây dựng các mô hình mạng nơ ron

Essential Regression 97 Thiết lập các mô hình tuyến tính

MS-EXCEL 2003 Phân tích thống kê, xây dựng dữ liệu

z

Origin v7.0 Vẽ đồ thị

2.2.2.2. Hóa chất, thiết bị

Hóa chất và dụng cụ sử dụng trong luận án bao gồm:

52

Hóa chất Ứng dụng

Dùng trong sắc ký cột pha thường Silica gel cỡ hạt 40-60 m, 30-50 m hãng

và pha đảo Rp18 Himedia, Scharlau, Merck.

Hexane, chloroform, methanol, ethyl acetate Dung môi sử dụng trong quá trình

ethanol, nước cất (merck) phân lập flaovnoid

Thuốc thử nhận biết vết flavonoid H2SO4/EtOH (Merck) trên bản mỏng

Dụng cụ Ứng dụng

Bản mỏng nhôm tráng sẵn silica gel 60F254 Sắc ký lớp mỏng (Merck) 0,2 mm

Đèn UV tử ngoại cầm tay, hiệu UVITEC hiện màu thuốc thử trên bản mỏng

cột sắc kí đường kính từ 2-5,5 cm máy sắc ký Sắc ký cột trung áp

Bruker AM500 FT-NMR Spectrometer Đo phổ NMR

2.2.2.3. Nguyên liệu

Thu hái nguyên liệu: Các mẫu thực vật được dùng trong nghiên cứu bao

gồm: actiso (Cynara scolymus L.) [2], xa kê (Artocarpus incisa L.) [2], đậu nành

(Glucine max L.) [2], [2], tía tô (Perilla ocymoides L.) [2], gừng gió (Zingiber

zerumbet L.) [2] (Hình 2.2) được thu hái tại Đà Lạt, Việt Nam, tháng 8, 9 năm

2012. Các tiêu bản tươi của nhóm thực vật chiết gồm bộ phận chiết và lá để định

danh thực vật và lưu mẫu [11, 59]. Các mẫu thực vật được định danh thực vật và

lưu tiêu bản tại Viện công nghệ sinh học và môi trường Trường (IBE), Đại học Tây

Nguyên, Phụ lục 11. Nguyên liệu sau khi thu hái được loại bỏ phần đất cát, sâu

bệnh, rửa sạch, để ráo sau đó sấy khô, nghiền hoặc thái nhỏ để sử dụng cho quá

trình chiết và phân lập [59].Tiến hành định lượng nguyên liệu trong từng giai đoạn

để tính toán hiệu quả của quá trình chiết [27, 56, 105].

53

Actiso Xa kê Đậu nành

Tía tô Gừng gió

Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2]

2.3. NGHIÊN CỨU LÝ THUYẾT

2.3.1. Phương pháp tính toán thông tin cấu trúc

2.3.1.1. Cơ học phân tử

Dữ liệu về năng lượng phân tử, điện tích nguyên tử và moment lưỡng cực

được tính toán trên phần mềm HyperChem [38]. Dựa trên kết quả khảo sát, mức

gradient và tùy chọn thích hợp sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu

cơ nghiên cứu. Chọn thuật toán phù hợp với nhóm dẫn xuất nghiên cứu. Phương

pháp phân tích phương sai hai yếu tố không lặp được dùng để khảo sát ảnh hưởng

của các thuật toán: Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton -

Raphson theo năng lượng (kcal/mol) [38]. Phương pháp phân tích phương sai hai

yếu tố không lặp được dùng để khảo sát ảnh hưởng của: các mức gradient bằng 10;

1; 0,1; 0,01 đối với năng lượng (kcal/mol) và tùy chọn lưỡng cực liên kết và điện

tích nguyên tử trên các tham số hóa lượng tử. Dựa trên kết quả khảo sát, thuật toán

sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu cơ nghiên cứu.

2.3.1.2. Hóa lượng tử

Phương pháp hóa lượng tử bán thực nghiệm (CNDO, INDO, MNDO, AM1,

RM1, PM3, TNDO) được sử dụng để xác định các tham số điện tích nguyên tử, độ

dịch chuyển hóa học của phổ 13C-NMR, 15O-NMR, các tham số hóa lý và các tham

54

số 2D, 3D [38]. Sử dụng phương pháp phân tích phương sai 2 yếu tố không lặp

(yếu tố điện tích nguyên tử và momemt lượng cực để thăm dò các phương pháp hóa

lượng tử. Từ đó, chọn lựa phương pháp hóa lượng tử thích hợp để tính toán điện

tích (Qi), độ dịch chuyển hóa học (i) của phổ 13C-NMR, 15O-NMR, tham số hóa lý,

cấu trúc 2D, cấu trúc 3D [38].

2.3.1.3. Các tham số cấu trúc

Sử dụng phương pháp cơ học phân tử MM+ để tối ưu hóa cấu trúc phân tử

flavone và isoflavone. Các tham số mô tả cấu trúc được tính toán bằng các phương

pháp cơ học phân tử [52], phương pháp Grid [28, 48], phương pháp Gasteiger trên

phần mềm QSARIS [28].

2.3.2. Xây dựng các mô hình QSAR

Các mô hình hồi quy đa biến được xây dựng theo các bước như trong Hình

2.3. Tập dữ liệu cấu trúc và hoạt tính kháng ung thư của các dẫn xuất flavone và

isoflavone trong phụ lục 1a được chia thành tập luyện (80 – 85%) và tập kiểm tra

(15-20%) bằng phương pháp chọn lựa ngẫu nhiên hoặc chọn lựa thông minh trên

phần mềm INForm [40, 77]. Khả năng dự đoán của mô hình QSAR (xây dựng từ

tập luyện) được đánh giá chéo bằng kỹ thuật loại bỏ dần từng trường hợp, so sánh

kết quả dự đoán với hoạt tính pGI50 của các hợp chất trong nhóm kiểm tra.

Hồi quy đa biến [51] được sử dụng để xây dựng mô hình quan hệ giữa dữ

liệu điện tích và hoạt tính (QESARMLR); mô hình quan hệ giữa dữ liệu phổ và hoạt

tính (QSDARMLR); mô hình quan hệ giữa cấu trúc - cấu trúc (QSSRMLR), mô hình

quan hệ giữa dữ liệu tham số 2D, 3D và hoạt tính (QSARMLR, QSARPLS).

Chất lượng của mô hình hồi quy tuyến tính đa biến được xác định bằng các

tr, giá trị R2

pr, sai số (SE) [84, 90].

giá trị hệ số xác định bởi R2

55

Hình 2.3 Xây dựng các mô hình hồi quy đa biến

Mạng nơ ron là một công cụ rất mềm dẻo xây dựng mối liên hệ giữa cấu trúc

và hoạt tính bao gồm tính chất tuyến tính và phi tuyến [89, 92]. Mô hình QSAR

(QESARANN, QSDARANN, QSARANN; QSARPCA-ANN) được xây dựng bằng kỹ thuật

neuro-fuzzy kết hợp với thuật toán di truyền trong phần mềm INForm [51]. Mạng

nơ ron cấu tạo thường ba lớp: I(j) – HL(m) – O(n). Trong đó: I là lớp nhập với j là

số nơ ron bằng số tham số mô tả phân tử trong mô hình tuyến tính QSARMLR; HL là

lớp ẩn, m là số nơ ron của lớp ẩn, O là lớp xuất, n là số nơ ron lớp xuất, tức là hoạt

tính pGI50 [51].

Ảnh hưởng của các tham số cấu trúc đến hoạt tính kháng ung thư tính toán từ

các mô hình QSAR tuyến tính theo mục 1.4.7. Kiểm tra khả năng dự đoán của các

mô hình tuyến tính và mô hình mạng thần kinh bằng các kỹ thuật đánh giá thống kê,

kỹ thuật phân tích phương sai, và các giá trị thống kê sai số ARE, % và MARE, %.

2.4. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN

2.4.1. Phân lập các hợp chất flavonoid

Quy trình phân lập và tinh chế các dẫn xuất flavonoid từ actiso, xa kê, tía tô,

đậu nành, gừng gió theo Hình 2.4.

56

Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59]

Nguyên liệu đem ngâm dầm trong dung môi EtOH 96%, lọc bỏ bã, lấy phần

dịch chiết EtOH đem cô loại dung môi dưới áp suất kém thu được cao EtOH [29,

75]. Từ cao EtOH chiết lỏng lỏng với hệ dung môi có độ phân cực tăng dần: n-

hexan, CHCl3, EtOAc, MetOH. Loại bỏ dung môi từ các dịch chiết thu được cao

tương ứng [42, 59]. Cao EtOAc đem SKC silica gel pha thường với hệ dung môi

CHCl3 : MetOH có thể tích CHCl3 thay đổi từ 100%-0%. Dựa vào kết quả SKLM

để gom các phân đoạn (A). Tiếp tục SKC silica gel pha thường lần 2 với hệ dung

môi rửa giải CHCl3 : MetOH theo tỉ lệ thể tích CHCl3 thay đổi từ 100% - 40% thu

được các phân đoạn (B1 - Bn). Tiếp tục SKC silica gel pha thường lần 3 trong hệ

CHCl3 : MetOH với tỉ lệ thể tích CHCl3 giảm dần thu được các phân đoạn. Quá trình

sắc ký được thực hiện liên tục cho đến khi thu được chất kết tinh, đem rửa sạch và

57

kiểm tra bằng SKLM. Quy trình phân lập flavonoid phân lập từ lá actiso, lá xa kê, lá

tía tô, hạt đậu nành, củ gừng gió:

Lá actiso khô (2,2 kg) → cao EtOAc (190 g) → Lấy phân đoạn thứ A7 (17 g)

→ B2 (2,7 g) → C3 ứng với tỉ lệ CHCl3: MetOH là (60 : 40) → 12 mg hợp chất

sạch (CSL1).

Lá xa kê khô 1,7 kg → EtOAc (120 g) → Lấy phân đoạn thứ A5 (10g) → B4

ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 7 mg hợp chất sạch (AIL1).

Lá tía tô khô 2 kg → EtOAc (140g) → Lấy phân đoạn thứ A4 (11,5 g) → B4

(95 mg) → C2 ứng với tỉ lệ CHCl3: MetOH là (95 : 5) → 8 mg hợp chất sạch

(POL1).

Hạt đậu nành khô 2 kg → EtOAc (95 g) → Lấy phân đoạn thứ A3 (8 g) →

B3 (1 g) → C4 (80 mg) ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 8 mg hợp chất

sạch (GML1).

Củ gừng gió khô 1 kg → EtOAc (30 g) → Lấy phân đoạn thứ A2 (4 g) → B3

(80 mg) ứng với tỉ lệ CHCl3: MetOH (85 : 15) → 7 mg hợp chất sạch (ZZL1); B2

(120 mg) ứng với tỉ lệ CHCl3 – MetOH (90 : 10) → 9 mg tinh thể sạch, (ZZL2) .

2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid

Dựa vào cấu trúc phổ 1H-NMR, 13C-NMR, DEPT 90 và 135, HSQC, HMBC

kết hợp với các phương pháp hoá học và phương pháp đo nhiễu xạ tia X đơn tinh

thể để xác định cấu trúc của các hợp chất flavonoid phân lập từ actiso, xa kê, đậu

nành, tía tô, gừng gió [79]. Hoạt tính sinh học các hợp chất flavonoid phân lập được

thử nghiệm in vitro trên dòng tế bào ung thư Hela bằng phương pháp SRB [98].

Nhiệt độ nóng chảy của hợp chất được đo trên máy Electrothermal IA 9000 series,

dùng mao quản không hiệu chỉnh đo tại phòng hợp chất thiên nhiên, Viện công

nghệ Hóa học, số 1, Mạc Đĩnh Chi, Quận 1, TP. HCM.

2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân

Các phương pháp thường sử dụng để xác định cấu trúc hợp chất hữu cơ bao

13C-NMR (125 MHz), DEPT, HSQC, HMBC được ghi trên máy Bruker AM500

gồm các phương pháp như: Phổ cộng hưởng từ hạt nhân [4]: 1H-NMR (500 MHz),

58

FT-NMR Spectrometer [1, 4]. Độ dịch chuyển hoá học  (ppm), hằng số tương tác J

tính bằng Hz, chất nội chuẩn là TMS (Tetrametyl Silan). Viện Hóa học, Viện Khoa

học và Công nghệ Việt Nam. Dung môi được sử dụng bao gồm các dung môi

DMSO-d6, CD3OD-d4, CDCl3, pyridine-d5. Đây là các dung môi có khả năng hòa

tan các dẫn xuất flavonoid chiết xuất [4].

2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể

Kỹ thuật nhiễu xạ tia X gồm ba bước [8, 34]: 1) thu thập tinh thể tốt, các

chiều lớn hơn 100 micron, không có tạp chất, không sứt mẻ và có cấu trúc ổn định.

2) đặt tinh thể vào tâm hướng chiếu của tia X, thường có bước sóng đơn, nhằm tạo

ra các mẫu nhiễu xạ. Tinh thể xoay từ từ và dữ liệu về ảnh nhiễu xạ được ghi nhận.

3) dùng kỹ thuật tính toán, dữ liệu hoá học bổ xung để đưa ra mô hình về sự sắp xếp

các nguyên tử trong đơn tinh thể. Dữ liệu nhiễu xạ đơn tinh thể của các hợp chất

hữu cơ phân lập được đo trên máy Bruker D8 Quest (tại Khoa Hóa học, Trường ĐH

KHTN) ở nhiệt độ 100 K, đối âm cực Mo với bước sóng Kα (λ = 0,71073 Å) [8].

Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi đơn tinh thể được thực

hiện trên phần mềm Apex 2 của máy đo [82, 109]. Cấu trúc được xác định theo

phương pháp trực tiếp. Sử dụng phần mềm XT tích hợp trong Olex2 để tính và tối

ưu hoá cấu trúc [8, 109].

2.4.3. Kỹ thuật thử hoạt tính in vitro

2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B

Xác định khả năng gây độc tế bào: Thực hiện sàng lọc thô, xác định độc tính

tế bào của hợp chất ở nồng độ 100 µg/ml, với dung môi hòa tan là

dimethylsulfoxide (DMSO) trên các dòng tế bào ung thư người bằng phương pháp

Sulforhodamine B (SRB) đã được Viện ung thư Hoa Kỳ (NCI) sử dụng cho chương

trình sàng lọc [33, 65, 98]. Dòng tế bào ung thư HeLa do NCI cung cấp, quá trình

thí nghiệm và kết quả sàng lọc được trình bày dưới dạng tỉ lệ % gây độc tế bào

[98].

Với những chất có khả năng gây độc tế bào cao sẽ tiếp tục xác định nồng độ

của chất có khả năng gây chết 50% trên quần thể tế bào nuôi cấy (GI50). Toàn bộ

59

quá trình thí nghiệm diễn ra trong 3 - 4 tuần. Lượng nguyên liệu cần để xác định

khả năng gây độc tế bào ít nhất là 5 mg/chất [31, 35].

Nguyên tắc: Thử nghiệm Sulforhodamine B (SRB) là một phương pháp so

màu đơn giản và nhạy để xác định độc tính tế bào của một chất. SRB là một thuốc

nhuộm tích điện âm sẽ liên kết tĩnh điện được với các phần điện tích dương của

protein trong tế bào ung thư Hela. Lượng thuốc nhuộm liên kết sẽ phản ánh lượng

protein của tế bào [64]. Trong thử nghiệm, tế bào được cố định trong suốt có màu

hồng. Mật độ quang đo được của dung dịch tương quan với lượng protein tổng hay

số lượng tế bào. Sự thay đổi lượng tế bào ung thư so với mẫu đối chứng phản ánh

hoạt tính gây độc tế bào của các dẫn xuất flavonone và isoflavone [46].

2.4.3.2. Nuôi cấy tế bào

Quy trình khảo sát hoạt tính gây độc bằng phương pháp SRB: Giải đông

nguồn tế bào ung thư bảo quản trong nitơ lỏng, nuôi cấy tế bào đến thế hệ thứ 4

(P4): Nuôi cấy tế bào trong bình cấy đạt độ phủ khoảng 70 – 80%; Phủ tế bào vào

các đĩa 96 giếng với mật độ tế bào/giếng ban đầu là 104 tế bào/giếng (đối với dòng

tế bào HeLa và MCF-7) và 7,5. 103 tế bào/giếng (đối với dòng NCl-H460) theo thiết

kế khảo sát sau: một mẫu đối chứng dương là tế bào với camptothecin ở nồng độ 0,

01 (µg/ml); một mẫu chứng âm là tế bào với dung môi hòa tan chất thử (DMSO

0,25%); các dẫn xuất flavone, isoflavone cần thử nghiệm hoạt tính gây độc. Trong

trường hợp xác định GI50 thì mẫu thử nghiệm sẽ được pha loãng ở các nồng độ 0,1;

3; 6; 9; 10; 12; 20; 30; 40; 50; 100 (μg/ml) [31, 68].

Thiết kế thử nghiệm của 1 mẫu gồm: Hai giếng tế bào có môi trường nuôi

cấy chứa chất thử ở nồng độ khảo sát; 2 giếng không có tế bào có môi trường nuôi

cấy chứa chất thử ở nồng độ khảo sát (2 giếng trắng (blank); Ủ ở 37 oC, 5 % CO2,

24 giờ; Bổ sung môi trường chứa chất thử với nồng độ gấp đôi nồng độ thuốc muốn

thử (không loại bỏ môi trường cũ đã có ở trong giếng); Ủ ở 37 oC, 5 % CO2, 48 giờ

[31, 68, 91]. Cố định tế bào trong giếng với trichloroacetic acid (TCA): Đối với

dòng tế bào Hela là dòng tế bào có bám dính: sử dụng dung dịch TCA 50% vào mỗi

giếng (cho vào từ từ không quá nhanh) [31]: đặt đĩa vào trong tủ lạnh (4oC), 1 đến 3

60

giờ, loại bỏ chất trong mỗi giếng; rửa nhẹ nhàng với nước (200 μl/giếng) 5 lần; để

khô tự nhiên ở nhiệt độ 25 oC, 12 đến 24 giờ.

2.4.3.3. Nhuộm SRB

Quá trình nhuộm SRB được thực hiện theo các bước sau: Cho dung dịch

SRB 0,2% vào mỗi giếng; Ủ ở nhiệt độ phòng, 5-20 phút; Loại bỏ dung dịch SRB;

Rửa nhẹ bằng dung dịch acetic acid 1 % (5 lần); Để khô tự nhiên ở nhiệt độ phòng

12-24 giờ [24]. Đọc kết quả: Cho 200 µl Tris-base 10mM vào mỗi giếng; Lắc trên

máy lắc khoảng 10-15 phút cho đến khi SRB tan hoàn toàn; Đo mật độ quang ở

bước sóng 492 nm và 620 nm [24].

2.4.3.4. Xử lý kết quả

Sau khi có giá trị mật độ quang ở bước sóng 492 nm (OD492) và 620 nm (OD620):

(2.1) - Tính giá trị OD = OD492 - OD620

(2.2) - Tính OD492 (hoặc OD620) = ODtb - ODblank

- Tính tỉ lệ (%) gây độc tế bào theo công thức:

(2.3)

Với: ODtb: giá trị OD của giếng chứa tế bào; ODblank: giá trị OD của giếng

trắng; ODTN: giá trị OD của mẫu thử tính từ công thức (2.1) và (2.2); ODC: giá trị

OD của mẫu đối chứng dương tính từ công thức (2.1) và (2.2).

2.4.3.5. Xác định GI50

GI50 (µg/ml) được xác định như sau: Xây dựng đồ thị biểu diễn tỷ lệ (%)

gây độc tế bào theo nồng độ khảo sát của chất cần thử nghiệm. Từ đồ thị, nội suy ra

giá trị nồng độ cho tỉ lệ gây độc tế bào 50% bằng cách: Tính phương trình đường

thẳng qua 2 điểm có tỉ lệ gây độc tế bào gần 50% nhất (1 điểm có tỉ lệ gây độc tế

bào nhỏ hơn 50%, điểm còn lại có tỉ lệ gây độc tế bào lớn hơn 50%); Từ phương

trình trên (có dạng y = ax + b), thế y = 50 vào, ta suy ra được giá trị nồng độ x chính

là GI50 [98].

61

2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID

Sau khi xây dựng các mô hình QSAR, phân lập các hợp chất tự nhiên, chúng

tôi tiến hành dự báo hoạt tính sinh học nhóm kiểm tra; thiết kế, sàng lọc và dự báo

hoạt tính kháng ung thư từ các chất mẫu và hợp chất tự nhiên trên cơ sở vị trí

nguyên tử cacbon trong phân tử flavonoid còn trống, có thể gắn các nhóm thế mới

khi thiết kế dẫn xuất mới. Các hợp chất mới được thiết kế và các hợp chất chiết xuất

được dự đoán hoạt tính sinh học để xác định hợp chất có hoạt tính sinh học cao.

62

CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN

3.1. NGHIÊN CỨU LÝ THUYẾT

3.1.1. Tính toán thông tin cấu trúc

Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng

chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán

Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được

tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS.

3.1.1.1. Khảo sát phương pháp cơ học phân tử

Chọn lựa gradient

Chọn lựa gradient cũng như thuật toán trong là vô cùng quan trọng, ảnh

hưởng trực tiếp đến các kết quả tính toán thông tin cấu trúc phân tử.

Nhằm tối thiểu hóa năng lượng phân tử bằng phương pháp cơ học phân tử

dựa trên giá trị gradient, thuật toán và tùy chọn phù hợp với cấu trúc phân tử nghiên

cứu. Kết quả thăm dò về ảnh hưởng của mức gradient và thuật toán đối với năng

lượng phân tử của isoflavone (isofla-30) trình bày ở Bảng 3.1.

Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30)

Gradient (A) Thuật toán (B) 1 0,1 10 0,01

Steepest descent 32,119 29,493 56,750 29,388

Fletcher-Reeves 29,743 29,394 46,823 29,386

Polak-Ribiere 47,067 29,698 29,395 29,384

Newton-Raphson 46,000 30,736 29,401 29,385

Bằng phương pháp phân tích phương sai một yếu tố cho thấy mức gradient

có ảnh hưởng đến năng lượng phân tử (F = 63,853 > F0,05 = 3,863) [61, 83].

Sự giảm năng lượng phân tử theo mức gradient thể hiện trên Bảng 3.1, Hình

3.1, cho thấy với gradient ≤ 0,1 năng lượng phân tử thấp nhất và ổn định nhất.

Chính vì vậy trong đề tài này mức gradient ≤ 0,1 được chọn để tối ưu hóa cấu trúc

phân tử cho các dẫn xuất flavonoid.

63

Trong nghiên cứu, này điện tích nguyên tử (Atomic charges) sẽ được chọn vì

phần lớn các tham số hóa lượng tử được dùng để thiết lập mô hình QSAR dựa trên

cấu trúc điện tử của các nguyên tử trên khung phân tử.

Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient

Chọn lựa thuật toán

Kết quả thăm dò về ảnh hưởng của thuật toán trên năng lượng phân tử của

hợp chất isoflavone (isofla-30) Phụ lục 1a cũng được thể hiện trong Bảng 3.1.

Phương pháp phân tích phương sai một yếu tố cho thấy các thuật toán

Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton-Raphson không có ảnh

hưởng đến năng lượng phân tử (F = 1,599 < F0,05 = 3,863).

Như vậy, trong đề tài thuật toán có thể được chọn bất kỳ, chọn thuật toán

Polak – Ribiere để tối ưu hóa cấu trúc phân tử cho các dẫn xuất flavonoid.

3.1.1.2. Khảo sát phương pháp hóa lượng tử

Tính toán các thông tin cấu trúc như điện tích nguyên tử, độ dịch chuyển hóa

học, các tham số hóa lý, tham số hình học 3D, 3D của nhóm dẫn xuất flavone và

isoflavone bằng phương pháp hóa lượng tử phù hợp. Tiếp theo, chúng tôi khảo sát

ảnh hưởng của phương pháp hóa lượng tử trên giá trị moment lưỡng cực phân tử.

64

Kết quả thăm dò về ảnh hưởng của các phương pháp hóa lượng tử bán thực

nghiệm đối với các tham số hóa lượng tử, với tham số chọn làm chuẩn là moment

lưỡng cực được trình bày ở Bảng 3.2.

Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone

Phương pháp hóa lượng tử Hợp chất CNDO INDO MNDO AM1 RM1 PM3 TNDO

fla-1 3,372 3,310 3,525 3,680 3,993 3,128 2,949

fla-2 3,132 3,145 2,939 3,063 3,445 2,836 2,617

isofla-3 4,977 5,250 4,661 4,920 5,100 5,186 4,620

fla-4 4,033 4,381 3,419 3,608 3,597 4,209 3,726

fla-5 3,437 3,475 3,332 3,239 3,500 2,889 2,847

fla-6 4,935 5,030 4,348 4,403 4,617 4,166 4,491

isofla-7 4,851 5,058 4,648 5,009 5,208 5,220 4,578

fla-8 3,935 4,199 3,475 3,826 3,857 4,326 3,738

fla-9 2,927 3,189 2,658 2,963 3,003 3,194 2,510

fla-10 4,060 4,420 4,242 4,113 4,345 4,418 3,685

Phân tích phương sai hai yếu tố không lặp cho thấy các phương pháp hóa

lượng tử bán thực nghiệm: CNDO, INDO, MNDO, AM1, RM1, PM3, TNDO [38]

có F = 0,632 < F0,05 = 2,246 cho thấy các phương pháp hóa lượng tử không ảnh

hưởng đến kết quả tính toán của tham số hóa lượng tử, moment lưỡng cực.

Vì vậy, chúng tôi chọn phương pháp PM3 để tính điện tích (Qi) và tham số

hóa lý, chọn phương pháp TNDO để tính toán độ dịch chuyển hóa học (i) của các

dẫn xuất flavonoid. Đây là các phương pháp cho phép sai số thấp nhất trong quá

trình tính toán như trong một số nghiên cứu trước đó [30, 100].

3.1.2. Tham số cấu trúc và tính chất phân tử

3.1.2.1. Điện tích

Các dẫn xuất flavone và isoflavone trong Phụ lục 1a được xây dựng lại cấu

trúc phân tử, tối ưu hóa cấu trúc và tính toán các tham số điện tích nguyên tử trong

khung phân tử, sử dụng phương pháp cơ học phân tử MM+ và hóa học lượng tử bán

65

thực nghiệm SCF PM3 trong HyperChem [38]. Điện tích nguyên tử sử dụng làm dữ

liệu để xây dựng các mô hình quan hệ giữa cấu trúc điện tử và hoạt tính tuyến tính

(QESARMLR) và mạng thần kinh (QESARANN). Kết quả tính toán được đưa ra ở Phụ

lục 1b.

3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dịch chuyển hóa học

Cấu trúc thực nghiệm của flavone và isoflavone được xây dựng lại và tối ưu

bằng phương pháp cơ học phân tử MM+ ở mức gradient 0,05. Dữ liệu độ dịch

chuyển hóa học i của 13C-NMR và 15O-NMR tính bằng phương pháp hóa lượng tử

phiên bản mới TNDO/2 SCF trên module HyperNMR [38, 39]. Các mô hình quan

hệ giữa cấu trúc phổ và hoạt tính (QSDARMLR và QSDARANN) được xây dựng dựa

trên giá trị độ dịch chuyển hóa học (i) của các nguyên tử carbon và oxy trong

khung phân tử flavone, isoflavone. Kết quả tính toán giá trị độ dịch chuyển hóa học

cho ở Phụ lục 2.

3.1.2.3. Tham số hóa lý

Tính chất hóa lý của một số dẫn xuất trong Phụ lục 1a và một số dẫn xuất trong

các hợp chất tự nhiên được tính toán từ phương trình bán thực nghiệm [15] mục

2.3. Kết quả tính toán trình bày ở Bảng 3.16 và Bảng 3.28.

3.1.2.4. Tham số hình học 2D, 3D

Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng

chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán

Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được

tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS [28, 49].

3.2. XÂY DỰNG MÔ HÌNH QSAR

3.2.1. Khảo sát các biến số mô hình

Chọn loại biến phụ thuộc: Trong quá trình xây dựng mô hình hồi quy tuyến

tính, dạng biến phụ thuộc Y cũng có thể ảnh hưởng đến chất lượng mô hình. Cần

khảo sát các kiểu chuyển dạng của giá trị GI50, 1/GI50 và pGI50 = -log(GI50) kết quả

tr cho ở Bảng 3.3.

khảo sát ảnh hưởng của dạng biến phụ thuộc dựa trên giá trị R2

66

tr

Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2

Biến phụ thuộc (Y) Biến độc lập (X) GI50exp 1/ GI50exp pGI50exp

0,921 0,774 0,938 Điện tích nguyên tử (QESARMLR)

0,906 0,786 0,906 Độ dịch chuyển hóa học (QSDARMLR)

Từ Bảng 3.3 kết quả phân tích ANOVA một yếu tố không lặp cho thấy: các

tr (Ftt = 2,134 < F0,05 = 4,118)

dạng biến phụ thuộc không ảnh hưởng đến giá trị R2

như vậy có thể chọn dạng biến phụ thuộc là pGI50 để xây dựng mô hình [61, 83].

và SE

Hình 3.2 Ảnh hưởng của k đến R2

Chọn số biến số: Sự thay đổi số biến số trong mô hình cũng có thể tác động

đến giá trị hồi quy R2 khi xây dựng các mô hình tuyến tính và mạng thần kinh, kết

quả khảo sát cho ở Hình 3.2, theo đó ta chọn lựa khoảng số biến số (k) từ 5 đến 7 là

tr cao và ổn định.

phù hợp vì R2

tr, R2

pr, SE

Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2

k 2 3 4 5 6 7 8 9 10

tr

R2 0,327 0,484 0,636 0,802 0,861 0,906 0,909 0,921 0,921

pr

R2 0,036 0,204 0,38 0,631 0,673 0,8 0,713 0,678 0,641

SE 0,287 0,257 0,221 0,167 0,143 0,121 0,122 0,118 0,121

Mạng thần kinh nhân tạo

67

Chọn số lớp ẩn: Kết quả thăm dò ảnh hưởng của số nút của lớp ẩn đến giá trị

tr, cấu trúc mạng sử dụng I(6) – HL(m) – O(1), I(7) – HL(m) – O(1) giá trị m thay

R2

đổi từ 1 - 6 kết quả ở Bảng 3.5.

tr

Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2

m 1 2 3 4 5 6

95,569 90,480 88,374 89,146 88,928 88,398 QESARANN

92,423 93,392 93,121 93,417 92,572 92,228 QSDARANN

Phân tích ANOVA một yếu tố cho thấy cấu trúc mạng với số nút của lớp ẩn

tr (Ftt = 0,0335 < F0,05 = 2,7729) [61].

thay đổi không ảnh hưởng đến giá trị R2

tr và R2

pr

Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2

tr

pr

Số lớp ẩn Cấu trúc mạng R2 R2

I(6) - HL(2) - O(1) 0,905 0,837 1

I(6) - HL(2) - HL(2) - O(1) 0,863 0,888 2

I(6) - HL(2) - HL(2) - HL(2)- O(1) -0,23 -0,017 3

I(7) - HL(2) - O(1) 0,924 0,800 1

I(7) - HL(2) - HL(2) - O(1) 0,853 -0,021 2

I(7) - HL(2) - HL(2) - HL(2)- O(1) -0,292 -0,285 3

Kết quả khảo sát chọn lựa số lớp ẩn là 1 để xây dựng mô hình, hơn nữa các

mạng có hai lớp ẩn có thể hiện các hàm với hình dáng bất kỳ, nên về mặt lý thuyết

không có lý do nào cần sử dụng nhiều hơn hai lớp ẩn. Một số nghiên cứu đã chỉ ra

rằng đối với phần lớn các bài toán cụ thể, chỉ cần sử dụng một lớp ẩn cho quá trình

luyện mạng là đủ.

Chọn số nút trên mỗi lớp ẩn: Kết quả khảo sát ảnh hưởng của sự tăng số lớp

tr cho ở Bảng 3. chọn cấu trúc một lớp ẩn để luyện mạng với R2

tr =

ẩn đến giá trị R2

0,905 cao hơn cả.

Chọn hàm truyền: Để xác định loại hàm truyền cho quá trình luyện mạng,

tr và R2

pr kết quả cho

chúng tôi khảo sát ảnh hưởng của loại hàm truyền đến giá trị R2

trong Bảng 3.7

68

tr và R2

pr

Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2

tr

pr

R2 R2

Biến độc lập (k) Hàm truyền (C) Hàm truyền (C)

Linear Sigmoid Tanh Linear Sigmoid Tanh

-3,443 0,905 0,858 -1,660 0,837 0,885 QESAR (k = 6)

QSDAR (k = 7) -2,577 0,9242 -0,578 -73,746 0,800 -0,054

Phân tích ANOVA cho thấy loại hàm truyền có (Ftt = 1,104 < F0,05 = 5,050)

tr. Hàm truyền Sigmoid cho giá trị R2

tr cao nên sẽ

không ảnh hưởng đến giá trị R2

chọn làm hàm truyền cho quá trình luyện mạng với mục đích làm giảm mức độ

phức tạp của các tính toán.

Chọn moment và mức độ sai số luyện: kết quả khảo sát ảnh hưởng của

tr và R2

pr được cho ở Bảng 3.8.

moment và sai số luyện mạng đến giá trị R2

Kết quả phân tích phương sai hai yếu tố không lặp cho thấy các giá trị

moment không ảnh hưởng đến kết quả luyện mạng (Ftt = 0,013 < F0,05 = 3,020), các

mức độ sai số luyện ảnh hưởng đến kết quả luyện mạng (Ftt = 11,736 > F0,05 =

tr = 0,956 và R2

pr = 0,837 vì nếu

3,084). Chọn sai số luyện 0,0001 ứng với giá trị R2

tr và R2

pr hơn nữa các tính

chọn mức độ sai số luyện nhỏ hơn cũng không làm tăng R2

toán lại tốn quá nhiều thời gian và dung lượng đĩa [61].

tr

Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2

Giá trị moment của mô hình QESARANN ứng với k = 6

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

tr

0,917 0,908 0,909 0,909 0,907 0,956 0,905 0,911 0,870 0,907 R2

pr

0,808 0,814 0,819 0,825 0,831 0,837 0,837 0,817 0,884 0,831 R2

Mức độ sai số luyện của mô hình QESARANN ứng với k = 6

0,000001 0,00001 0,0001 0,001 0,01 0,1

tr

0,905 0,905 0,956 0,905 0,869 -0,079 R2

pr

0,837 0,837 0,837 0,836 0,848 -0,842 R2

69

Chọn số vòng lặp, giải thuật lan truyền và tốc độ học: chọn vòng lặp để cải

thiện mô hình mạng thần kinh, kết quả khảo sát về ảnh hưởng của cấu trúc mạng và

tr, được dẫn ra ở phụ lục 3 với yếu tố A là cấu trúc mạng,

số vòng lặp trên giá trị R2

yếu tố B là số vòng luyện.

tr (Ftt =

Phân tích ANOVA cho thấy số vòng luyện ảnh hưởng đến giá trị R2

4,144 > F0,05 = 1,l462), như vậy có thể chọn số nút ẩn tùy từng mô hình sao cho các

tính toán nhanh chóng. Chọn số vòng lặp là 10000 cho quá trình luyện mạng, đây là

tr cao, ổn định, sai số nhỏ hơn.

số vòng lặp có giá trị R2

Chọn giải thuật lan truyền ngược cho quá trình luyện để tính đạo hàm của

hàm lỗi (tổng của tất cả các lỗi tại mỗi mẫu) nhằm giảm thiểu sai số cho quá trình

luyện mạng. Sự thay đổi tham số tốc độ học (learning rate) cũng ảnh hưởng hiệu

suất của mạng đối với số vòng lặp xác định. Giá trị tham số này càng nhỏ thì mạng

hiệu chỉnh trọng số càng chậm. Nhưng muốn đạt đến trạng thái tối ưu thì ta phải

tăng số vòng lặp nhiều hơn ở đây chúng tôi chọn tốc độ học 0,7 do mạng thần kinh

điều chỉnh cho mô hình xây dựng là tốt nhất.

Từ các kết quả thăm dò trên rút ra kết luận: biến phụ thuộc là pGI50; biến độc

lập là điện tích nguyên tử và độ dịch chuyển hóa học; số biến số trong các mô hình

từ 5 đến 7; hàm truyền Sigmoid; số lớp ẩn là 1, số nút trên mỗi lớp ẩn là 2; moment

bằng 0,7; mức độ sai số luyện bằng 0,0001; số vòng lặp bằng 10000; giải thuật lan

truyền ngược; tốc độ học 0,7.

3.2.2. Xây dựng các mô hình QESAR

3.2.2.1. Mô hình tuyến tính QESARMLR

Chọn tập luyện và tập kiểm tra

Chọn tập luyện và tập kiểm tra từ tập dữ liệu về cấu trúc và hoạt tính kháng

ung thư cổ tử cung pGI50 của nhóm dẫn xuất flavone và isoflavone (Phụ lục 1a).

Để khách quan trong quá trình phát triển các mô hình, từ tập dữ liệu về hoạt

tính của nhóm dẫn xuất flavone và isoflavone chọn lựa tập luyện (a) và tập kiểm tra

(b) (19%) bằng phương pháp chọn lựa thông minh trong INForm (smart selection)

kết quả cho ở Phụ lục 4.

70

Xây dựng mô hình và tính toán đóng góp của các tham số

Quá trình thực hiện xây dựng và đánh giá mô hình: Mỗi mô hình QESAR

được thành lập từ nhóm luyện (Phụ lục 4), sử dụng hoạt tính kháng ung thư pGI50

và điện tích nguyên tử cacbon và oxy trong khung phân tử các dẫn xuất flavone và

isoflavone, trên phần mềm Regress [13, 85].

Quá trình này được thực hiện bằng cách thay đổi điện tích nguyên tử trong

cấu trúc phân tử. Lựa chọn điện tích nguyên tử đưa vào mô hình QESAR bằng giải

thuật thêm dần và loại bỏ dần từng biến.

Các quá trình được thực hiện liên tục, tuần hoàn cho đến khi xây dựng được

tr, SE, R2

adj, Ftt, ttt và R2

kiemtra. Các mô hình tuyến

mô hình có giá trị thống kê gồm: R2

tính QESARMLR được trình bày ở Bảng 3.9.

Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê

tr

test

k Nguyên tử trong các mô hình R2 SE R2

2 0,1390 0,816 0,765 O1, C7

3 0,1240 0,860 0,800 O1, C4, C6

4 0,901 0,1070 0,829 O1, C2, C4, C5

5 0,924 0,0957 0,873 O1, C2, C4, C5, C3'

6 0,938 0,0887 0,903 O1, O11, C3, C4, C6, C7

7 0,906 0,0743 0,714 O11, C4, C6, C8, C9, C2', C6'

8 0,970 0,0653 0,696 O11, C3, C6, C7, C8, C9, C10, C3'

9 0,978 0,0574 0,563 O1, O11, C3, C4, C6, C7, C8, C9, C10

10 0,978 0,0595 0,358 O1, O11, C3, C6, C7, C8, C9, C2', C3', C6'

Chúng tôi tiến hành xác định phần trăm đóng góp điện tích các nguyên tử có

mặt trong 3 mô hình tuyến tính QESARMLR (với k = 5, 6, 7).

Giá trị thống kê tương ứng của 3 mô hình QESARMLR (với k = 5 – 7) được

dẫn ra trong Bảng 3.10.

Mô hình QESARMLRứng với k = 5

pGI50 = -0,9332 – 101,2080O1 – 15,4264C2 – 6,8735C4 – 7,9686C5 –

(3.1) 16,1166C3'

71

Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7)

tr

adj

pr

k R2 R2 SE R2

5 0,924 0,905 0,096 0,873

6 0,938 0,919 0,089 0,903

7 0,959 0,943 0,074 0,879

Mô hình QESARMLR ứng với k = 6

pGI50 = 6,7116 – 42,3105O1 – 8,1592O11 + +3,0139C3 – 19,0370C4 + 6,6117C6 +

(3.2) 4,6038C7

Mô hình QESARMLR ứng với k = 7

pGI50 = 4,714 – 32,8026O11 – 60,0703C4 + 20,8772C6 + 16,9016C8 +

95,4205C9 – 24,4720C2' – 25,4219C6' (3.4)

Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi

Giá trị phần trăm đóng góp trung bình MPmxk của các biến độc lập trong mỗi

mô hình QESARMLR (với k = 5 – 7) được xác định từ phần trăm đóng góp Pmxk của

biến số. Giá trị này được xác định qua giá trị đóng góp tổng cộng của các biến số

72

Ctotal trong một hợp chất. Phần trăm đóng góp trung bình toàn cục GMmPmxk của

mỗi biến được mô tả ở Hình 3.3, Bảng 3.11.

Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các

mô hình QESARMLR (với k = 5 – 7)

m = 6, i = 1 - 6 m = 7, i = 1 - 7 GMPmxi,% m = 5, i = 1 - 5

GIÁ TRỊ m = 5,6,7 Hệ số P5xi, % Hệ số P6xi, % Hệ số P7xi, %

tr

R2 0,924 0,938 0,959

adj

R2 0,905 0,919 0,943

SE 0,09569 0,0887 0,0743

pr

R2 0,873 0,903 0,879

hằng số -0,933 6,712 4,714

27,41 -101,21 57,6 -42,31 24,63 O1

-15,43 13,42 4,47 C2

3,014 4,22 1,41 C3

31,98 -6,874 15,12 -19,04 42,45 -60,07 38,39 C4

-7,969 2,06 0,69 C5

6,612 6,57 20,88 5,78 4,12 C6

4,604 3,51 1,17 C7

16,9 5,7 1,9 C8

95,42 22,6 7,53 C9

13,36 -8,159 18,63 -32,8 21,46 O11

-24,47 2,5 0,83 C2

3,93 -16,12 11,8 C3'

1,19 -25,42 3,58 C6'

Sự đóng góp mức độ quan trọng của điện tích nguyên tử trong cấu trúc phân

tử của flavone và isoflavone có mặt trong 3 mô hình QESARMLR được sắp xếp theo

trật tự dựa vào giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3’. Các vị trí C4,

O1 và O11 được xem là vị trí quan trọng trong phân tử vì đó là các nguyên tử thuộc

nhóm carbonyl C4 = O11, nguyên tử O1 có cặp điện tử tự do kết hợp với điện tử 

73

của liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11

có các tính chất phản ứng của hệ carbonyl. Các vị trí trung tâm quan trọng nhất đã

được đưa ra ở Hình 3.3 điều này cũng phù hợp với thực nghiệm [18, 103].

Ngoài ra, C6 là vị trí trí quan trọng và đã được thăm dò gắn các nhóm thế vào

vị trí này [80, 103]. Các C9 và C3’ cũng thể hiện vai trò quan trọng, nhưng C9 không

phải là vị trí còn trống, nên không được chọn để gắn nhóm thế. Như vậy có thể chọn

C6 để gắn nhóm thế mới vào trong một số hợp chất flavone và isoflavone. C3’ còn

trống và cũng có thể sử dụng gắn thêm nhóm thế mới và hy vọng tạo ra một hợp

chất có hoạt tính cao và độc tính thấp. Từ định hướng này, chọn hợp chất flavone 1a

và isoflavone 6b trong Phụ lục 4 để làm chất mẫu có hoạt tính đã biết, tiến hành gắn

thử nhóm thế mới vào C6 và C3’.

tr = 0,938 và R2

pr =

Chọn mô hình QESARMLR (với k = 6) có các giá trị R2

0,903 trong Bảng 3.11 để dự đoán tính hoạt tính sinh học của nhóm dẫn xuất

flavone và isoflavone vì ở mô hình này phù hợp về thống kê nhất, tất cả các hệ số

hồi quy được đánh giá bằng chuẩn student đều có giá trị P < 0,05 (ttt > t0,05) Phụ lục

5, đánh giá sự tương thích của phương trình hồi quy bằng chuẩn Fisher (Ftt > F0,05

hay P < 0,05). Chọn các vị trí O1, O11, C3, C4, C6, C7 để xây dựng mô hình mạng

thần kinh QESARANN.

3.2.2.2. Mô hình mạng thần kinh QESARANN

Mô hình QESARANN được xây dựng trên phần mềm INForm [40, 87].

Kiến trúc mạng thần kinh I(6)-HL(2)-O(1) gồm: lớp nhập I(6) có 6 yếu tố

đầu vào là điện tích nguyên tử O1, O11, C3, C4, C6 và C7 có mặt trong mô hình

QESARMLR; lớp xuất O(1) gồm 1 yếu tố đi ra là giá trị hoạt tính pGI50; lớp ẩn HL(2)

phía trong gồm 2 nút; thuật toán lan truyền ngược và sai số được chọn để luyện

mạng; hàm truyền sigmoid đặt trên mỗi nút mạng của các lớp; tham số luyện mạng

gồm tốc độ học là 0,7; moment là 0,7; sai số giám sát mục tiêu MSE = 0,005882; số

tr = 0,956 và R2

pr = 0,837.

vòng lặp 10000; sau quá trình luyện mạng, giá trị R2

74

3.2.2.3. Kiểm tra khả năng dự đoán

Hoạt tính pGI50 của 6 hợp chất trong nhóm kiểm tra Phụ lục 4 được dự đoán

bằng mô hình QESARMLR và QESARANN, kết quả đưa ra ở Bảng 3.12. Kiểm tra khả

năng dự đoán từ các mô hình QESAR được đánh giá cẩn thận dựa vào các chuẩn

thống kê phù hợp, các giá trị tuyệt đối của các sai số tương đối ARE,%, giá trị trung

bình của các sai số tương đối MARE,%. Giá trị sai số MARE,% của mô hình

QESARANN nhỏ hơn giá trị sai số MARE,% mô hình QESARMLR, cho thấy khả năng

dự đoán của mô hình mạng thần kinh QESARANN tốt hơn mô hình tuyến tính

QESARMLR.

Sau khi sử dụng mô hình tuyến tính QESARMLR và QESARANN để dự đoán

hoạt tính pGI50 của các chất trong nhóm kiểm tra cho thấy mức độ đúng và chính

xác chấp nhận được, sai lệch của dự đoán nằm trong khoảng không chắc chắn của

các phép đo thực nghiệm. Như vậy các mô hình QESARMLR và QESARANN này đáp

ứng yêu cầu dùng để dự đoán các chất mới.

Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN

ARE,% pGI50,pr Hợp chất pGI50,exp QESARMLR QESARANN QESARMLR QESARMLR

1b 5,921 6,008 5,891 1,468 0,513

2b 5,745 5,692 5,743 0,930 0,033

3b 6,097 5,759 5,788 5,549 5,068

4b 5,699 5,651 5,712 0,840 0,221

5b 5,699 5,651 5,735 0,835 0,623

6b 5,137 5,092 5,109 0,883 0,543

MARE,% 1,751 1,167

3.2.3. Xây dựng các mô hình QSDAR

3.2.3.1. Mô hình tuyến tính QSDARMLR

Chọn tập luyện và tập kiểm tra

Tập dữ liệu về tham số độ dịch chuyển hóa học và hoạt tính kháng ung thư

pGI50 của các dẫn xuất flavone và isoflavone trong Phụ lục 1a được chia thành tập

75

luyện và tập kiểm tra. Tập kiểm tra gồm các hợp chất kí hiệu là a1, a2, a3, a4, a5 và a6

(Phụ lục 6).

Xây dựng mô hình và tính toán đóng góp của các tham số

Các mô hình QSDARMLR (với k = 2 đến 10) Bảng 3.13 bằng cách kết hợp

hoạt tính kháng ung thư pGI50 và độ dịch chuyển hóa học (i) sử dụng phần mềm

Regress. Quá trình thực hiện bằng cách thay đổi độ dịch chuyển hóa học (i) của các

nguyên tử oxy và cacbon. Thêm hoặc loại bỏ một biến độ dịch chuyển hóa học (i)

vào hoặc ra khỏi mô hình QSDARMLR. Khi xây dựng xong mô hình tiến hành đánh

giá mô hình bằng kỹ thuật đánh giá chéo loại và bỏ dần từng trường hợp tương tự

như đối với mô hình QESAR. Kiểm tra khả năng dự đoán của các mô hình

tr, R2

pr, R2

ad (R2 hiệu chỉnh), sai số chuẩn SE và

QSDARMLR dựa trên các giá trị R2

chuẩn Fisher, Student.

Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê

tr

ad

pr

k Nguyên tử trong các mô hình R2 R2 SE R2

2 0,327 0,268 0,287 0,036 O1, C4

3 0,484 0,413 0,257 0,204 O1, C4, C11

4 0,636 0,566 0,221 0,38 O1, C4, C5, C6

5 0,802 0,752 0,167 0,631 O1, O11, C4, C6, C7

6 0,861 0,817 0,143 0,673 O1, O11, C3, C4, C6, C7

7 0,906 0,869 0,121 0,800 O1, O11, C2, C3, C6, C7, C2’

8 0,909 0,867 0,122 0,713 O1, O11, C2, C3, C4, C5, C6, C7

9 0,921 0,877 0,118 0,678 O1, O11, C2, C3, C4, C5, C6, C7, C2’

1 0,869 0,121 0,641 O1, O11, C2, C3, C4, C5, C6, C7, C1’,C2’ 0,921

tr càng tăng, SE càng giảm, giá trị R2

tr và SE tương

0 Bảng 3.13 cho thấy khi R2

ứng với số biến số k = 5 trở đi thay đổi không đáng kể, hơn nữa việc đưa quá nhiều

tr lên bao nhiêu. Chính vì vậy

biến số vào mô hình cũng không làm tăng giá trị R2

chúng tôi khảo sát các mô hình ứng với k = 5, 6 và 7 bao gồm các nguyên tử O1,

O11, C2, C3, C4, C6, C7 và C2’, chọn các vị trí này để xác định phần trăm đóng góp

76

của các nguyên tử quan trọng đối với hoạt tính kháng ung thư. Kết quả tính MPmxi,

%, GMPmxi, % và các giá trị thống kê của các mô hình QSDARMLR (với k = 5, 6 và

7) cũng được đưa ra trong Bảng 3.14.

Độ dịch chuyển hóa học quan trọng của các nguyên tử cacbon và oxy trong

phân tử flavone và isoflavone đã thể hiện bằng cách sắp xếp giá trị độ lớn

GMPmxi,% như C4 > C7 > O11 > C6 > C3 > O1 > C2 > C2’.

Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch

chuyển hóa học i trong các mô hình QSDARMLR

QSDARMLR MPxk,% Biến số xi GMPmxi,% m = 5 m = 6 m = 7 m = 5 m = 6 m = 7

tr

0,802 0,861 0,906 - - - R2 -

ad

0,752 0,817 0,869 - - - R2 -

0,167 0,143 0,121 - - - SE -

pr

0,631 0,673 0,800 - - - R2 -

Hệ số 14,459 37,055 32,99 - - - -

0 0,014 0,016 0,133 7,649 9,949 5,91 O1

0,004 0,008 0,006 18,599 11,386 9,501 13,162 O11

- - -0,045 - 16,448 5,483 - C2

- -0,058 -0,063 14,348 17,603 10,65 - C3

-0,068 -0,078 - 71,64 27,471 - 33,037 C4

0,006 -0,059 -0,047 5,169 16,424 14,965 12,186 C6

-0,005 -0,075 -0,059 4,46 22,722 20,312 15,832 C7

- - -0,037 - - 11,222 3,741 C2'

Vị trí O1, C2, C3 và C4 như là các vị trí quan trọng trong phân tử. Bởi vì các

nguyên tử này là các nguyên tử cacbon và oxy của nhóm carbonyl C4 = O11 và

nguyên tử O1 với các electron tự do. Trong trường hợp này các electron  của các

liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11 có

thể thực hiện các phản ứng oxy hóa khử. Điều này phù hợp với các nghiên cứu thực

nghiệm. Hơn nữa, các vị trí C6, C7 và C3 cũng cho thấy rằng các vị trí quan trọng đã

77

khảo sát và nghiên cứu bằng các nhóm thế gắn vào các nguyên tử C3, C6 và C7 để

thiết kế các dẫn xuất mới.

Mô hình QSDARMLR (với k = 7) có giá trị sai số SE thấp nhất, cho giá trị hồi

quy là phù hợp nhất, tất cả các hệ số hồi quy và phương trình hồi quy đều có giá trị

tr = 0,906 và R2

pr = 0,800 cao

P < 0,05 Phụ lục 7, hơn nữa đây là mô hình có giá trị R2

nhất, SE = 0,121 thấp nhất cho thấy đây là mô hình tuyến tính QSDARMLR tốt hơn

cả. Mô hình QSDARMLR (với k = 7) có dạng:

pGI50 = 32,99 + 0,016O1 + 0,006O11- 0,045C2 - 0,063C3 - 0,047C6 - 0,059C7 -

(3.5) 0,037C2'

3.2.3.2. Mô hình mạng thần kinh QSDARANN

Mô hình mạng thần kinh QSDARANN được xây dựng bằng mạng thần kinh

trên phần mềm INForm [40] đã được khảo sát kiến trúc mạng. Kiến trúc I(7)-

HL(2)-O(1) bao gồm lớp nhập I(7) với yếu tố đầu vào đã được chọn là O1, O11, C2,

C3, C6, C7 và C2’ là các biến số trong mô hình tuyến tính QSDARMLR với k = 7 và

một lớp xuất O(1) với yếu tố đầu ra (pGI50) như là biến mục tiêu, cấu trúc một lớp

ẩn HL(2) với hai nút. Giải thuật lan truyền ngược, sai số 0,001 được sử dụng để

luyện kiểu mạng thần kinh này. Các tham số để luyện mạng nơ ron là tốc độ học

0,7; momen = 0,7; vòng lặp 10000 và sai số MSE = 0,0305764. Hàm truyền

sigmoid được sử dụng cho mỗi nơ ron của lớp nhập và lớp xuất. Sau khi luyện mô

pr = 0,800; giá trị R2

tr đạt được 0,924 cao hơn giá trị

hình thần kinh QSDARANN, R2

tr = 0,906 đối với mô hình tuyến tính QSDARMLR.

R2

3.2.3.3. Kiểm tra khả năng dự đoán

Khả năng dự đoán của các mô hình QSDARANN và QSDARMLR được đánh giá

cẩn thận bằng kỹ thuật đánh giá chéo loại bỏ từng trường hợp. Trong trường hợp

này 6 dẫn xuất flavone và isoflavone trong nhóm kiểm tra được chọn ngẫu nhiên

như trong Phụ lục 6. Các giá trị hoạt tính kháng ung thư pGI50 của 6 dẫn xuất trong

nhóm kiểm tra dẫn ra ở Bảng 3.15 nhận được từ mô hình tuyến tính QSDARMLR

được so sánh với các giá trị nhận được từ mô hình mạng nơ ron sử dụng giá trị tuyệt

đối của các sai số tương đối ARE,%.

78

Khả năng dự đoán của 2 mô hình cũng dựa vào giá trị MARE,%. Giá trị

MARE,% = 1,119 đối với mô hình QSDARANN là nhỏ hơn giá trị MARE,% = 2,391

đối với mô hình QSDARMLR. Như vậy các giá trị dự đoán pGI50 nhận được từ mô

hình QSDARANN là gần với các hoạt tính thực nghiệm [80]. Với pGI50,exp và pGI50,pr

là các hoạt tính thực nghiệm và kiểm tra. Sai số MARE,% được sử dụng để đánh giá

sai số toàn cục của các mô hình QSDARMLR và QSDARANN.

Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các

mô hình QSDARMLR (với k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1)

Hợp ARE,% pGI50,pr pGI50,exp chất QSADRMLR QSDARANN QSDARMLR QSDARANN

5,745 5,781 5,789 0,636 0,764 a1

5,699 5,758 5,796 1,039 1,697 a2

5,796 5,808 5,708 0,209 1,515 a3

5,921 6,181 5,957 4,389 0,606 a4

5,699 5,394 5,755 5,344 0,975 a5

5,658 5,503 5,723 2,730 1,157 a6

MARE,% 2,391 1,119

Sau khi sử dụng các mô hình QSDARMLR và QSDARANN để dự đoán hoạt

tính kháng ung thư của các dẫn xuất kiểm tra, độ lệch khoảng dự đoán là có thể

chấp nhận. Các mô hình QSDARMLR và QSDARANN thỏa mãn các đòi hỏi thực tế để

dự đoán hoạt tính kháng ung thư pGI50 của các dẫn xuất mới. Một lần nữa chúng tôi

khẳng định khả năng dự đoán của các mô hình quan hệ cấu trúc hoạt tính là hoàn

toàn đáng tin cậy.

3.2.4. Xây dựng mô hình QSSRMLR

3.2.4.1. Nguyên tắc xây dựng

Xây dựng mô hình quan hệ cấu trúc – cấu trúc (QSSRMLR) để dự đoán hoạt tính

cũng như tính chất hóa lý của các hợp chất flavonoid. Mô hình được xây dựng dựa

vào tính chất tương tự của các cấu trúc phân tử dẫn đến các tính chất hóa học hay

những tính chất khác cũng có mối tương quan, vì vậy có thể xây dựng mối quan hệ

79

cấu trúc với cấu trúc để từ đó xác định được tính chất của một hợp chất chưa biết

dựa vào tính chất của các cấu trúc đã biết. Trong nghiên cứu này có hai nhóm chất

có cấu trúc tương tự là nhóm flavone và isoflavone. Sử dụng quan hệ giữa cấu trúc

– cấu trúc để dự đoán tính chất, hoạt tính kháng ung thư cúa các dẫn xuất flavonoid

trong nhóm kiểm tra và flavonoid phân lập.

3.2.4.2. Tính toán các tham số hóa lý

Các hợp chất trong Phụ lục 1a được xây dựng, tối ưu hóa cấu trúc phân tử bằng

phương pháp cơ học phân tử MM+, mức gradient 0,05. Tham số hóa lý tính toán

như mục 2.3.1 [15] Các tham số cấu trúc này được sử dụng làm dữ liệu để kiểm tra

khả năng dự đoán của các mô hình QSSRMLR.

3.2.4.3. Xây dựng mô hình

Mô hình tuyến tính QSSRMLR cũng được nghiên cứu, phát triển từ các kỹ thuật

hồi quy tuyến tính. Mô hình quan hệ cấu trúc - cấu trúc (QSSRMLR) là mối quan hệ

giữa những hợp chất (y) và các hợp chất có cấu trúc tương tự (x). Các mô hình

QSSRMLR được xây dựng bằng phương pháp hồi quy tuyến tính. Sự phù hợp tốt

tr và khả năng dự đoán của các

nhất của mô hình QSSRMLR được thể hiện ở giá trị R2

pr. Sử dụng các hợp chất trong Phụ lục 1a để xây dựng

mô hình thể hiện ở giá trị R2

các mô hình QSSRMLR.

Mô hình QSSRMLR được xây dựng từ các thay đổi điện tích các nguyên tử

của những hợp chất. Sự xắp xếp dọc theo thứ tự giá trị tương quan của mối quan hệ

tuyến tính giữa những hợp chất sử dụng điện tích nguyên tử và tính chất hóa lý

được chỉ ra ở Hình 3.4.

80

a)

b)

Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính

chất hóa lý

■: fla-A23 và fla-A11; ▲: fla-A15 và isofla-A32; ○: isofla-A32 và isofla-A4.

Những hợp chất trong Phụ lục 1a được lựa chọn ngẫu nhiên để đánh giá mối

tương quan điện tích nguyên tử và tính chất hóa lý giữa các hợp chất. Kết quả tính

toán hệ số tương quan điện tích giữa các hợp chất được cho ở Bảng 3.1 .

Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử

fla-A23 fla-A6 fla-A15 fla-A22 isofla-A32 fla-A28 fla-A5 isofla-A4

1,0000 fla-A23

0,8664 1,0000 fla-A6

0,9220 0,8254 1,0000 fla-A15

0,9984 0,8548 0,9132 1,0000 fla-A22

1,0000 isofla-A32 0,9247 0,7565 0,9659 0,9254

0,9222 0,8259 1,0000 0,9134 0,9656 1,0000 fla-A28

0,9986 0,8696 0,9267 0,9983 0,9261 0,9270 1,0000 fla-A5

0,9250 0,7560 0,9659 0,9257 1,0000 0,9657 0,9264 1,0000 isofla-A4

0,9999 0,8668 0,9225 0,9981 0,9236 0,9227 0,9986 0,9239 fla-A11

Những hợp chất có cấu trúc tương tự có tính chất tương quan tốt với nhau.

Mô hình hồi quy tuyến tính của các hợp chất flavone và isoflavone (Y) được xây

dựng từ điện tích nguyên tử được trình bày ở Bảng 3.17. Mô hình tuyến tính

81

tr = 0,999 và R2

pr = 0,999. Bảng 3.17 đưa

QSSRMLR với các giá trị thống kê rất tốt R2

ra 10 mô hình từ 32 hợp chất nghiên cứu trong Phụ lục 1a đại diện cho khả năng dự

đoán dựa trên mối quan hệ cấu trúc – cấu trúc.

Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất

Phương pháp

ARE%

Tính chất hóa lý và hoạt tính kháng ung thư pGI50

QSSR

Tham khảo [15]

Mô hình QSSR của Fla-A1 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00020159

Fla-A1 = 0,00015 + 1,018 (Fla-A5) -0,513 (Fla-A21)+ 0,497 (Fla-A22 ) (3.6)

Độ khả phân cực bề mặt lưới

68,453

68,120 0,489

5,663

5,699 0,638

pGI50

Mô hình QSSR của Fla-A2 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00035399

Fla-A2 = -0,00020+1,260 (Fla-A6)+0,871 (Fla-A14)-1,134 (Fla-A24) (3.7)

Nhiệt nóng chảy (Tm) ở 1 atm

741,521

745,496 0,533

931,125

934,452 0,356

Nhiệt độ tới hạn (Tc)

Mol Refractivity

8,711

8,715 0,053

978,789

980,510 0,176

Nhiệt độ sôi, (Tb) ở 1 atm

6,473

5,921 9,321

pGI50

pr = 0,9999; SE = 0,00010411

tr = 0,9999; R2

Mô hình QSSR của Fla-A3 với R2 Fla-A3 = 0,00002+0,935 (Fla-A7) +0,582 (Fla-A16) -0,517 (Fla-A28) (3.8)

Nhiệt nóng chảy (Tm) ở 1 atm

737,884

745,496 1,021

932,899

934,452 0,166

Nhiệt độ tới hạn (Tc)

Hiệu ứng nhiệt KJ/mol

-318,085

-313,160 1,573

Hằng số Henry

7,266

7,240 0,355

5,726

5,699 0,469

pGI50

Mô hình QSSR của Fla-A4 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00013747

isoFla-A4 = -0,000002+0,980 (isoFla-A8)-0,233(isoFla-A18)+ 0,252(isoFla-A19) (3.9)

Nhiệt nóng chảy (Tm) ở 1 atm

718,146

745,496 3,669

914,478

934,452 2,138

Nhiệt độ tới hạn (Tc)

nghiên cứu bằng mô hình QSSRMLR và các chất dùng để dự đoán

82

Hằng số Henry

7,237

7,240 0,042

5,084

5,009 1,495

pGI50

Mô hình QSSR của Fla-A5 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00019793

Fla-A5 = -0,00015+0,982 (Fla-A1) +0,499 (Fla-A21) -0,483 (Fla-A22) (3.10)

936,289

913,478 2,497

Nhiệt độ tới hạn (Tc)

Chỉ số khúc xạ phân tử

8,731

9,179 4,884

977,737

933,630 4,724

Nhiệt độ sôi, (Tb) ở 1 atm

Hằng số Henry

7,034

7,110 1,073

LogP

8,731

9,179 4,884

5,734

5,699 0,618

pGI50

Mô hình QSSR của Fla-A6 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00026038

Fla-A6 = 0,00019+0,682 (Fla-A2)-0,587 (Fla-A14)+0,907 (Fla-A24) (3.11)

Nhiệt nóng chảy (Tm) ở 1 atm

730,455

717,167 1,853

927,997

914,743 1,449

Nhiệt độ tới hạn (Tc)

Khối lượng mol

324,833

323,343 0,461

5,772

6,046 4,533

pGI50

Mô hình QSSR của Fla-A7 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00013549

Fla-A7 = -0,00003+1,037 (Fla-A3)+-0,041 (Fla-A16)+0,004 (Fla-A27) (3.12)

743,221

717,167 3,633

Nhiệt nóng chảy (Tm) ở 1 atm

932,252

914,743 1,914

Nhiệt độ tới hạn (Tc)

Hiệu ứng nhiệt KJ/mol

-309,816

-313,790 1,267

Hằng số Henry

7,228

7,240 0,171

5,700

5,658 0,750

pGI50

Mô hình QSSR của Fla-A8 với R2

tr = 0,9999; R2

pr = 0,9999; SE = 0,00119054

isoFla-A8 = 0,0000051+ 1,006(isoFla-A4)+ 0,253(isoFla-A18)-0,259(isoFla-A19) (3.13)

746,066

717,167 4,030

Nhiệt độ sôi, (Tb) ở 1 atm

936,202

914,743 2,346

Nhiệt độ tới hạn (Tc)

Hằng số Henry

7,243

7,240 0,038

4,994

5,071 1,503

pGI50

83

tr = 0,9999; R2

pr = 0,9999; SE = 0,00018592

Mô hình QSSR của Fla-A9 với R2

Fla-A9 = 0,000004+0,047 (Fla-A5) +1,025 (Fla-A11) -0,072 (Fla-A23) (3.14)

836,779 817,055 2,414 Nhiệt nóng chảy (Tm) ở 1 atm

1029,858 1011,888 1,776 Nhiệt độ tới hạn (Tc)

Hằng số Henry 7,052 7,050 0,026

LogP 4,663 4,537 2,772

5,698 5,745 0,810 PGI50

tr = 0,9999; R2

pr = 0,9999; SE = 0,00042716

Mô hình QSSR của Fla-A10 với R2

Fla-A10 = 0,00012+0,977 (Fla-A9) -1,055 (Fla-A21) +1,079 (Fla-A22) (3.15)

815,011 814,381 0,077 Nhiệt nóng chảy (Tm) ở 1 atm

18,820 18,692 0,683 Áp suất tới hạn (Pc), Bar

1003,621 1004,806 0,118 Nhiệt độ tới hạn (Tc)

-404,221 -387,410 4,339 Hiệu ứng nhiệt KJ/mol

Chỉ số khúc xạ phân tử 10,963 10,930 0,305

Log P 3,766 3,740 0,694

Hằng số Henry 7,063 7,050 0,190

5,652 5,678 0,448 PGI50

3.2.4.4. Kiểm tra khả năng dự đoán

Mô hình hồi quy tuyến tính nhận được từ các dẫn xuất flavone và isoflavone

này có thể ứng dụng để dự đoán tính chất hóa lý cũng như hoạt tính kháng ung thư

của các flavone và isoflavone có cấu trúc tương tự.

Các mô tả cấu trúc phân tử của các hợp chất để xây dựng mô hình QSSRMLR

được tính toán một cách cẩn trọng, kết quả dự đoán tính chất hóa lý và pGI50 cho ở

Bảng 3.17, Hình 3.5 chỉ ra rằng mô hình hồi quy tuyến tính QSSRMLR của các hợp

chất flavone và isoflavone là hoàn toàn đáng tin cậy.

Phân tích ANOVA một yếu tố cũng chỉ ra rằng kết quả dự đoán tính chất hóa

lý và hoạt tính kháng ung thư của các dẫn xuất flavone và isoflavone từ mô hình

QSSRMLR thì không khác các giá trị tính chất hóa lý tham khảo, giá trị hoạt tính

kháng ung thư xác định từ thực nghiệm [28] với (Ftt = 0,0010 < F0,05 = 3,9423).

84

Các mô hình QSSRMLR đã được xây dựng và dự đoán thành công tính chất

hóa lý, hoạt tính pGI50 của nhóm dẫn xuất kháng ung thư flavone và isoflavone có

cấu trúc tương tự.

n á o đ ự d ị r t á i G

Giá trị thực nghiệm

Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm

3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1)

3.2.5.1. Dữ liệu

Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất

và hoạt tính kháng tế bào ung thư cổ tử cung GI50/M trong Phụ lục 1a.

Các tham số cấu trúc 2D, 3D được tính toán bằng phương pháp cơ học phân

tử trên phần mềm QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a

đến Phụ lục 10h.

3.2.5.2. Xây dựng mô hình QSARMLR (3.16)

QSARANN(1) thu được thông qua 2 nhóm: nhóm luyện được chọn lựa ngẫu nhiên và

Trong nghiên cứu này, các mô hình QSARMLR (3.16), phương trình 3.16 và

nhóm kiểm tra. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)

được đánh giá bằng cách so sánh kết quả dự đoán và hoạt tính thực nghiệm của các

hợp chất trong nhóm kiểm tra, là nhóm không được sử để thiết lập mô hình

QSARMLR (3.16) và QSARANN(1) từ nhóm luyện.

85

pred và SE trong các mô hình QSARMLR với các

Sự biến thiên các giá trị R2, R2

tham số mô tả 2D và 3D, tương ứng chỉ ra trong Bảng 3.18.

pred và MSE

Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2

pred

k Tham số mô tả phân tử 2D, 3D trong các mô hình MSE R² R²

2 a1, a2 0,063 0,657 0,630

3 0,034 0,820 0,798 a1, a2, a3

4 0,027 0,866 0,843 a2, a3, a4, a5

5 0,023 0,891 0,867 a2, a5, a6, a7, a8

6 0,019 0,914 0,890 a2, a5, a6, a8, a9, a10

7 0,015 0,933 0,910 a2, a5, a6, a8, a9, a10, a11

8 0,015 0,936 0,909 a5, a8, a10, a12, a13, a14, a15, a16

0,012 0,955 0,932 a5, a6, a8, a10, a11, a16, a17, a18, a19 9

10 0,012 0,955 0,928 a5, a6, a8, a10, a11, a15, a16, a17, a18, a19

Kí hiệu a1 là xvc3, a2 là dipole, a3 là xvpc4, a4 là xvp6, a5 là logP, a6 là xp8,

a7 là volume, a8 là knotpv, a9 là xvp8, a10 là SHBa, a11 là Hmaxpos, a12 là xp6, a13 là

SaaCH, a14 là k2, a15 là nvx, a16 là knotp, a17 là ABSQ, a18 là SsOH, a19 là phia.

Để xây dựng các mô hình QSARMLR, các tham số mô tả 2D và 3D được chọn

lựa bằng kĩ thuật hồi quy từng bước. Các tham số mô tả 2D, 3D được chọn dựa trên

cơ sở các giá trị thống kê R2, SE và F-stat. Các mô hình được đánh giá chéo bằng kĩ

pred. 9 mô hình phù

thuật loại bỏ dần từng trường hợp (LOO) để xác định giá trị R2

hợp nhất được chỉ ra trong Bảng 3.18. Các mô hình QSARMLR (với k từ 2 đến 10)

pred. Trong

được xắp xếp một cách trật tự với sự thay đổi các giá trị R2, SE và R2

Bảng 3.18, các mô hình QSARMLR (với k từ 8 đến 10) là các mô hình có giá trị

pred cao hơn cả. Cụ thể, trong mô hình QSARMLR với k = 9 có R2 cao nhất là 0,955

R2

pred là 0,932. Vì vậy, chúng tôi lựa chọn ba mô hình (với k là 8, 9 và 10) để xác

và R2

định giá trị phần trăm đóng góp của các tham số mô tả 2D, 3D đối với hoạt tính

kháng ung thư.

86

Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và

GMPmxi,% đối với các tham số mô tả phân tử 2D và 3D trong các mô hình

QSARMLR (với k là 8, 9 và 10)

QSARMLR MPmxi,% GMPmxi, % m = 8 M = 9 m = 10 m = 8 m = 9 m = 10

tr

R2 0,936 0,955 0,955

pr

R2 0,909 0,932 0,928

SE 0,124 0,107 0,110

Hệ số -13,133 3,044 2,946

k2 -4,926 - 23,638 - 7,879

xp6 -2,899 - 6,399 - 2,133

xp8 8,827 - 4,473 4,282 14,301 12.181

nvx - 3,487 0,036 45,229 1,138 15,456

knotp -8,350 -2,673 -2,794 9,072 7,879 7,325 8,092

knotpv 34,40 15,54 15,917 9,681 11,878 10,813 10,790

2,057 SHBa -0,225 0,019 0,016 4,398 1,004 0,770

2,166 Hmaxpos - -1,203 -1,201 3,439 3,060

0,497 SaaCH -0,166 - - 1,490

ABSQ - -5,982 -5,939 33,101 29,255 20,785

SsOH - 0,359 0,358 2,924 2,609 1,844

phia - 3,067 2,999 21,167 18,413 13,193

logP 0,050 0,839 0,793 0,093 4,308 3,624 2,675

Các giá trị phần trăm đóng góp trung bình MPmxi,%, GMPmxi, % và các giá

trị thống kê khác đối với các mô hình (với k là 8, 9 và 10), được đưa ra trong Bảng

3.19. Giá trị phần trăm đóng góp trung bình MPmxi của các biến độc lập trong mỗi

mô hình QSARMLR (với k là 8, 9 và 10), được xác định từ giá trị phần trăm đóng

góp Pxk của mỗi biến độc lập trong từng trường hợp quan sát tương tứng Pmxi được

tính toán từ giá trị đóng [86] góp tổng cộng Ctotal của mỗi biến trong từng hợp chất

87

[86]. Kết quả tính toán giá trị phần trăm đóng góp trung bình MPmxi,% và giá trị

phần trăm đóng góp trung bình toàn cục GMPmxi,% được đưa ra trong Bảng 3.19.

Giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% [86] trong Bảng

3.19 đã mô tả mức độ quan trọng của các tham số mô tả 2D, 3D của các flavone và

isoflavone. Sự xắp xếp mức độ ảnh hưởng quan trọng của các tham số 2D, 3D trong

các mô hình QSARMLR theo thứ tự là GMPmxi,%: SaaCH < SsOH < SHBa < xp6 <

Hmaxpos < logP < k2 < knotp < xp8 < knotpv < phia < nvx < ABSQ. Các tham số

mô tả ABSQ, nvx, phia, knotpv, xp8, knotp, k2 và LogP được xem là các tham số

mô tả quan trọng nhất trong mỗi phân tử. Ngoài ra, các tham số mô tả phân tử đại

diện cho các nhóm carbonyl C4 = O11 và nguyên tố O1. Các nguyên tố này có các

cặp electron tự do với electron  của liên kết C2 = C3 và C4 = O11 tạo hệ liên hợp.

Nhóm carbonyl C4 = O11 thể hiện toàn bộ phản ứng tự nhiên của nhóm của nhóm

cacbonyl [80, 103].

Vì vậy, các tham số mô tả phân tử cũng chứng minh được định lượng tổng

điện tích trên toàn phân tử bởi giá trị GMPmxi và chúng cũng phù hợp với các giá trị

thực nghiệm [54, 80, 103]. Vì vậy, vị trí các nguyên tử C6 và C3’ còn trống, có thể

gắn các nhóm thế mới trong nghiên cứu dẫn xuất mới [80, 89, 103]. Các vị trí khác

cũng có thể đại điện tác động đến hoạt tính sinh học GI50, nhưng chúng là các vị trí

a)

Hợp chất flavonoid trong nhóm kiểm tra b)

không thể gắn thêm nhóm thế nên không được sử dụng để thiết kế dẫn xuất mới.

Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid

trong nhóm kiểm tra

88

Các vị trí C6 và C3’ được lựa chọn để gắn thêm các nhóm thế mới tạo thành

các flavonoid mới. Tương tự, vị trí C2’ cũng còn trống và có thể sử dụng để gắn các

nhóm mới vào phân tử. Điều này cho phép tạo nên các hợp chất mới có hoạt tính

sinh học cao hơn hợp chất mẫu. Từ đó, các flavonoid chiết xuất có thể chọn lựa làm

hợp chất mẫu để thiết kế thuốc mới có hoạt tính cao hơn. Điều này được chỉ ra trong

phần thảo luận bên dưới.

Các mô tả phân tử được ứng dụng trọng kỹ thuật phân tích hồi quy đa biến để

thiết lập mô hình QSAR với quá trình lựa chọn biến số độc lập bằng cách sử dụng

mô hình MLR [86, 107]. Mô hình QSAR cuối cùng với các tham số mô tả k = 9 là

mô hình tốt nhất [106]. Chín biến số độc lập bao gồm xp8, ABSQ, SsOH,

Hmaxpos, phia, knotp, knotpv, SHBa và LogP được lựa chọn để xây dựng mô hình

QSARMLR. Kết quả dự đoán hoạt tính sinh học được minh chứng qua giá trị R2 dự

Pr) phù hợp với dữ liệu thực nghiệm. Mô hình QSARMLR (3.16) như sau:

đoán (R2

pGI50 = 3,044 + 4,473×xp8 -5,982×ABSQ + 0,359×SsOH - 1,203×Hmaxpos

+ 3,067×phia - 2,673×knotp + 15,540×knotpv + 0,019×SHBa + 0,839×LogP

(3.16)

tr = 0,955; R2

Adj= 0,932; R2

pr = 0,745; SE = 0,107; F = 42,182

Với n = 34; R2

3.2.5.3. Xây dựng mô hình QSARANN(1)

Mô hình QSARANN(1) được xây dựng bằng kỹ thuật neuro-fuzzy với thuật

toán di truyền sử dụng phần mềm INForm [40]. Mô hình mạng thần kinh nhân tạo

có kiến trúc mạng I(9)-HL(5)-O(1) được xây dựng. Kiến trúc mạng này bao gồm

lớp input I(9) với 9 nơ ron tương ứng với 9 biến độc lập xp8, ABSQ, SsOH,

Hmaxpos, phia, knotp, knotpv, SHBa và LogP; lớp ẩn HL(5) với 5 nơ ron và lớp

output O(1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan truyền ngược

được ứng dụng để luyện mạng thần kinh. Hàm truyền cho mỗi nơ ron là đường tiếp

tuyến Hypecbol; mỗi tham số luyện mạng khác nhau được sử dụng cho quá trình

luyện mạng với tốc độ huấn luyện (moment) là 0.7 và tốc độc học là 0.01; sai số

tổng cộng là 0,0003017, sai số dự đoán là 0,00001 với 300000 vòng lặp. Sau khi

89

luyện mạng mô hình mạng thần kinh thu được có kiến trúc I(9)-HL(5)-O(1), với giá

tr là 0,8963 và R2

pr là 0,8883.

trị thống kê R2

3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)

Khả năng dự đoán của các mô hình QSARMLR (3.16) và QSARANN(1) được đánh

pr. Sáu hợp

giá cẩn thận bằng kỹ thuật loại bỏ từng trường hợp (LOO) và giá trị R2

chất trong nhóm kiểm tra được sử dụng để kiểm tra khả năng dự đoán hoạt tính sinh

học của các mô hình QSARMLR (3.16) và QSARANN(1). Hoạt tính dự đoán của các

flavonoid trong nhóm kiểm tra được so sánh với dữ liệu thực nghiệm, cho ở Bảng

3.20. Hoạt tính sinh học dự đoán từ các mô hình QSAR được so sánh với hoạt tính

sinh học thực nghiệm và so sánh giữa các mô hình với nhau bởi giá trị sai số tương

đối trung bình MARE,%. Các giá trị MARE,% cho thấy rằng khả năng dự đoán của

mô hình QSARMLR (3.16) thì thấp hơn của mô hình QSARANN(1) chỉ ra trong Bảng

3.20. Sau khi sử dụng các mô hình QSARMLR (3.16) và QSARANN(1) để dự đoán hoạt

tính sinh học pGI50 của sáu hợp chất trong nhóm kiểm tra chỉ ra khả năng dự đoán

chính xác của các mô hình QSAR với các sai số nằm trong khoảng tin cậy của phép

đo thực nghiệm. Tuy nhiên, các mô hình QSARMLR (3.16) và QSARANN(1) đều có

khả năng dự báo tốt đối với hoạt tính sinh học của các hợp chất mới.

Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR

(3.16) và QSARANN(1)

ARE,% pGI50,pred Hợp chất pGI50,exp M1 M2 M1 M2

Fla-1 5,699 5,3879 5,7371 5,4589 0,6685

Fla-11 5,699 5,9188 6,0478 3,8568 6,1204

Fla-24 5,6198 5,9316 5,7662 5,5482 2,6051

Fla-25 5,6383 5,8627 5,6843 3,9799 0,8158

Fla-26 5,699 5,8841 5,7058 3,2479 0,1193

Fla-30 5,0862 4,8677 4,9365 4,2959 2,9433

MARE,% 4,3979 2,2121

M1: Mô hình QSARMLR (3.16); M2 là mô hình QSARANN (1)

90

3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN

3.2.6.1. Dữ liệu

Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất

và hoạt tính kháng tế bào ung thư cổ tử cung GI50/M (Phụ lục 1a). Các tham số cấu

trúc 2D, 3D được tính toán bằng phương pháp cơ học phân tử trên phần mềm

QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a - 10h. Các tham số

này sử dụng để xây dựng hồi quy tuyến tính (QSARMLR) [86], hồi quy thành phần

chính (QSARPCR) [9] và mạng nơ-ron nhân tạo (mô hình QSARPCA-ANN [40].

3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18)

Dữ liệu ban đầu được chia thành tập luyện và tập kiểm tra bằng phương pháp

lấy mẫu ngẫu nhiên. Các mô hình QSAR xây dựng từ nhóm luyện. Sự thay đổi các

pred và SE trong các mô hình QSARMLR với các tham số 2D và 3D được

giá trị R2, R2

chỉ ra trong Bảng 3.21. Các mô hình QSARMLR, các mô tả phân tử 2D và 3D được

chọn bằng thuật toán hồi quy bằng thuật toán hồi quy.

pred và MSE

Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2

pred

k Tham số mô tả phân tử 2D, 3D trong các mô hình R2 R2 SE

2 0,756 0,731 0,430 a1, a2

3 0,774 0,732 0,417 a1, a2, a3

4 0,805 0,772 0,390 a1, a2, a3, a4

5 0,832 0,756 0,365 a1, a2, a3, a4, a5

6 0,854 0,812 0,342 a1, a4, a5, a6, a7, a8

7 0,836 0,721 0,365 a1, a2, a3, a4, a5, a9, a10

8 0,837 0,693 0,367 a1, a2, a3, a4, a5, a8, a9, a10

9 0,838 0,682 0,369 a1, a2, a3, a4, a5, a8, a9, a10, a11

10 0,841 0,650 0,368 a1, a2, a3, a4, a5, a6, a8, a9, a10, a11

(Với a1 là LogP, a2 là MaxNeg, a3 là ka2, a4 là SdO, a5 là MaxQp, a6 là

Ovality, a7 là SdssC, a8 là ka3, a9 là ABSQ, a10 là ABSQon, a11 là dipole).

91

Quy trình lựa chọn cho mô tả 2D và 3D dựa trên sự thay đổi của các giá trị

thống kê R2, SE và F-stat. Các mô hình QSARMLR đánh giá chéo bằng kỹ thuật

pred được xác định. 9 mô hình phù hợp nhất được đưa ra trong

LOO, các giá trị R2

Bảng 3.21.

Các mô hình QSARMLR (với k từ 2 đến 10) được xắp xếp theo trật tự thay đổi

pred. Trong Bảng 3.21, các mô hình QSARMLR

của các giá trị thống kê R2, SE và R2

pred lớn hơn.

(với k từ 5 đến 7) cho thấy giá trị R2

Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các

Biến số

QSARMLR

MPmxi,%

GMPmxi, %

m

m = 5

m = 6

m = 7

m = 5

m = 6

m = 7

R2

0,832

0,854

0,836

R2

adj

0,820

0,841

0,820

SE

0,365

0,342

0,365

R2

pred

0,756

0,812

0,721

Hệ số

3,883

8,509

4,790

ABSQ

-0,222

-0,257

27,945

18,636

19,005

21,862

-

ABSQon

-

0,0143

-

-

0,433

0,144

-

MaxQp

3,416

2,8540

3,588

24,043

25,862

25,908

25,271

MaxNeg

-

6,122

-

24,203

23,890

16,031

-

SdO

0,0125

0,0247

0,0126

6,192

3,792

3,665

4,550

ka2

0,133

0,143

27,484

17,617

17,426

20,842

-

LogP

0,156

0,2192

0,163

15,651

9,829

9,672

11,717

Ovality

-

-3,6969

-

5,292

4,393

2,315

4,000

SdssC

-

0,2969

-

4,382

5,613

7,236

5,744

ka3

-

0,3635

-

5,351

9,324

3,473

6,049

tham số mô tả phân tử 2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7)

tr là 0,854 và R2

pr

Đặc biệt, mô hình QSARMLR (3.17) R với k = 6 với giá trị R2

là 0,812 cao hơn các mô hình còn lại. Mô hình QSARMLR (3.17) với k = 6:

pGI50 = 8,509 + 2,8540MaxQp + 0,0247SdO + 0,2192LogP - 3,6969Ovality +

0,2969SdssC + 0,3635ka3 (3.17)

92

Vì vậy, ba mô hình tốt nhất (với k của 5, 6 và 7) được chọn để xác định tỷ lệ

phần trăm đóng góp của mô tả 2D, 3D đến hoạt tính kháng ung thư. Tỷ lệ đóng góp

có giá trị MPmxi, GMPmxi và các giá trị thống kê khác nhau của các mô hình (với k

bằng 5, 6 và 7) tương ứng được trình bày trong Bảng 3.22.

Giá trị phần trăm đóng góp MPmxi của biến số độc lập trong từng mô hình

QSARMLR (với k bằng 5, 6 và 7) được xác định từ phần trăm đóng góp phần trăm

Pmxi của từng biến tương ứng trong mỗi trường hợp quan sát [86]. Giá trị này được

xác định từ tổng giá trị đóng góp tổng cộng các biến trong một chất [66, 86]. Như

vậy tỷ lệ đóng góp trung bình MPmxi, và GMPmxi [86] của mỗi biến độc lập cho 3

mô hình được xác định, kết quả cho ở trong Bảng 3.22.

Phần trăm đóng góp trung bình toàn cục GMPmxi,% trong Bảng 3.22 mô tả

mức độ ảnh hưởng của mô tả phân tử 2D và 3D của nhóm dẫn xuất flavone và

isoflavone. Đối với các mô hình QSARMLR, mức độ quan trọng của mô tả phân tử

2D và 3D được sắp xếp theo các giá trị GMPmxi,%: MaxQp > ABSQ > ka2 >

MaxNeg > LogP > ka3 > SdssC > SdO > Ovality > ABSQon.

Các tham số mô tả ABSQ, MaxQp, ka2, MaxNeg và LogP được xem như

các bộ tham số mô tả quan trọng nhất trên mỗi phân tử. Bên cạnh những tham số

mô tả phân tử này còn cho thấy theo bản chất của nhóm cacbonyl C4 = O11 và

nguyên tử O1. Các nguyên tử này có cặp electron tự do liên hợp với điện tử C2 = C3

và C4 = O11 để hình thành hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất phản

ứng hoàn toàn của chất carbonyl [80, 103]. Vì vậy, những mô tả này có thể được

chứng minh tổng điện tích trên phân tử bằng các giá trị GMPmxi,% và chúng cũng

phù hợp với các đánh giá thực nghiệm [80, 103, 113].

Ngoài ra, các vị trí nguyên tử C6 và C3' cũng là vị trí trống và có thể gắn các

nhóm chức mới. Các vị trí khác cũng có thể có ảnh hưởng quan trọng đối với các

hoạt tính sinh học GI50, nhưng chúng không phải là vị trí trống, vì vậy không thể

gắn những nhóm thế mới. Do đó các vị trí C6 và C3' được chọn để gắn các nhóm thế

mới vào tạo thành flavonoid mới. Tương tự, vị trí C2' cũng còn trống và có thể được

sử dụng để gắn nhóm chức mới. Việc này sẽ tạo thành các hợp chất mới và có thể

93

cải thiện hoạt tính sinh học so với chất mẫu. Từ đó, flavonoid phân lập có thể được

lựa chọn như chất mẫu để thiết kế các loại thuốc mới có hoạt tính cao hơn. Điều này

được thể hiện trong phần thảo luận dưới đây.

Các mô tả phân tử được áp dụng bằng kỹ thuật PCR để xây dựng mô hình

QSAR [106, 111]. Mô hình QSAR với số biến số k = 6 là mô hình tốt nhất được

chọn có các tham số mô tả phân tử MaxQp, SdO, ka3, LogP, Ovality và SdssC

h c í t

m ă r t

%

[63].

g n ê i r ị r t á i G

n ầ h P

, y ũ l

Thành phần chính

Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50

pred phù hợp với dữ liệu thực

Kết quả dự đoán hoạt tính sinh học với giá trị R2

nghiệm. Số lượng các thành phần chính được trích ra bằng kỹ thuật phân tích thành

phần chính và tương quan giữa pGI50 và pGI50pred được chỉ ra trong Hình 3.7. Mô

hình hồi quy thành phần QSARPCR (3.18) có dạng:

pGI50 = 5,48356 + 0,38027×PC1 - 0,11868×PC2 + 0,34789×PC3 +

(3.18) 0,06995×PC4 + 0,21850×PC5 + 0,35057×PC6

= 0,833; R2

adj= 0,820, R2

tr

pr =0,812, SE = 0,342, MSE =

với n = 26; R2

0,1236; F = 63,172

3.2.6.3. Xây dựng mô hình QSARPCA-ANN

Mô hình QSARPCA-ANN được xây dựng bằng kỹ thuật neurofuzzy với thuật

toán di truyền bằng chương trình INForm [40, 87]. Kiến trúc mạng nơ-ron nhân tạo

I(6) -HL(9) - O(1) đã được xây dựng. Mô hình QSARPCA-ANN bao gồm lớp đầu vào

I(6) với 6 nơ ron là các biến độc lập PC1, PC2, PC3, PC4, PC5 và PC6 tương ứng với

các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC; lớp ẩn HL(9) với 9 nơ ron

thần kinh và lớp đầu ra O (1) với nơ ron là hoạt tính sinh học pGI50. Thuật toán lan

94

truyền ngược được sử dụng để luyện mạng nơ ron. Hàm truyền trên mỗi nơ ron

được sử dụng là hàm truyền sigmoid; các thông số khác được sử dụng để huấn

luyện mạng thần kinh này bao gồm tỷ lệ luyện là 0,7 và tốc độ học 0,7; sai số MSE

= 0,003447 với số vòng lặp là 5000. Sau khi luyện mạng nơ ron I(6) - HL(9)- O(1),

là 0,897298 và R2

tr

pr là 0,88718.

giá trị R2

3.2.6.4. Khả năng dự đoán của các mô hình

Khả năng dự đoán của các mô hình QSARMLR (3.17), QSARPCR và

QSARPCA-ANN đã được đánh giá cẩn thận bằng kỹ thuật (LOO) với giá trị tương

pred. Năm hợp chất trong nhóm kiểm tra được sử dụng để đánh giá

quan dự đoán R2

khả năng dự đoán của các mô hình QSAR này. Các hoạt tính dự báo cho flavonoid

trong nhóm thử nghiệm được so sánh với dữ liệu thực nghiệm, như được trình bày

trong Bảng 3.23.

Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR

(3.17), QSARPCR và QSARPCA-ANN

Hợp chất ARE,% pGI50,exp pGI50,pred

M1 M2 M3 M1 M2 M3

5,921 5,234 5,526 5,471 3,214 8,979 7,890 Flav-8

5,745 5,485 5,699 5,556 3,755 0,001 2,513

6,097 5,423 5,697 5,351 5,567 10,895 4,161

5,699 5,815 5,895 5,736 1,964 3,362 0,585

5,699 6,034 6,288 6,086 0,773 3,399 0,083

Flav-22 A2 Flav-32 A9 Flav-74 A12 Flav-80 1-3-5-11-15-26 1-3-5-11-15-26 MARE,% 3,055 5,327 3,045

Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR (3.18); M3 là

mô hình QSARPCA-ANN.

Các hoạt tính dự báo từ các mô hình QSAR được so sánh với các hoạt tính

thực nghiệm và so sánh với nhau bằng cách sử dụng giá trị trung bình sai số tương

đối MARE%. Các giá trị MARE,% cho thấy rằng khả năng dự báo của mô hình

QSARPCA-ANN thấp hơn mô hình QSARMLR (3.17), QSARPCR. như trong Bảng 3.23.

Do giá trị MARE,% mô hình QSARPCR là cao nhất. Sau khi sử dụng các mô hình

QSARMLR (3.17), QSARPCR và QSARPCA-ANN để dự đoán các hoạt tính sinh học

95

pGI50 của sáu hợp chất trong nhóm thử nghiệm khả năng dự đoán chính xác của một

mô hình QSAR được thể hiện bởi các sai số có thể chấp nhận được trong khoảng tin

cậy của phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.17), QSARPCR và

QSARPCA-ANN có khả năng dự đoán tính sinh học của các chất mới.

Mối quan hệ giữa các tham số mô tả phân tử 2D, 3D và các hoạt tính kháng

ung thư GI50 (μM) của các dẫn xuất flavonoid. Mô hình QSARMLR (3.18) cho thấy

các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC ảnh hưởng quan trọng đến

sự thay đổi hoạt tính GI50 thử nghiệm in vitro trên tế bào Hela của các dẫn xuất

flavonoid. Mô hình QSARMLR (3.18) cũng tìm ra các vị trí quan trọng nhất C6 và C3

để gắn các nhóm thế mới nhằm tạo ra các flavonoid mới với hoạt tính cao hơn

flavonoid cô lập. Mô hình QSARPCA-ANN với kiến trúc I(6) - HL(9) - O (1) có thể dự

đoán hoạt tính của flavonoid tốt hơn. Các hoạt tính sinh học dự đoán từ các mô hình

QSAR phù hợp với những kết quả từ dữ liệu thực nghiệm.

Các mô hình QSAR được mô tả trong nghiên cứu này hữu ích cho đánh giá

độc tính in vitro đối với tế bào ung thư Hela của flavonoid. Nghiên cứu này đã xây

dựng các mô hình QSAR khác nhau có thể hữu ích cho việc tìm kiếm các tác nhân

trị liệu mới trong bệnh ung thư.

3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2)

3.2.7.1. Dữ liệu

Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 26 hợp chất

và hoạt tính kháng tế bào ung thư cổ tử cung GI50/M (GI50 là nồng độ ức chế 50%

sự phát triển của tế bào ung thư) gồm 32 hợp chất trong Phụ lục 1a.

Điện tích nguyên tử sử dụng làm dữ liệu để xây dựng các mô hình QSARMLR.

QSARPLS và QSARANN thể hiện mối quan hệ giữa cấu trúc điện tử và hoạt tính. Dữ

liệu điện tử cho ở phụ lục 1b.

3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20)

Các mô hình QSARMLR và QSARPLS được xây dựng thể hiện mối quan hệ

của điện tích nguyên tử và các hoạt tính sinh học pGI50 [86]. Các mô hình và các

96

pred và SE với các tham số điện tích nguyên tử được chỉ ra trong Bảng

giá trị R2, R2

3.24.

Để xây dựng các mô hình QSARMLR, các tham số điện tử nguyên tử đã được

chọn sử dụng thuật toán hồi quy từng bước. Quá trình lựa chọn mô tả điện tích

pred và F-stat. Các

nguyên tử dựa trên sự thay đổi của các giá trị thống kê R2, SE, R2

mô hình QSARMLR đã được đánh giá chéo bằng cách sử dụng kỹ thuật LOO để xác

pred, 9 mô hình được thể hiện trong Bảng 3.24. Các mô hình QSARMLR (với k

định R2

và R2

pr.

tr

từ 2 đến 10) được sắp xếp trong một sự thay đổi có trật tự của các giá trị R2

Trong các mô hình ở Bảng 3.24, các mô hình QSARMLR với k từ 5 đến 7 có các giá

pred hơn các mô hình khác.

, SE và R2

trị lớn hơn R2

tr

pr tương ứng

Bảng 3.24 Các mô hình QSARMLR với các giá trị R2

k 2 3 4 5 6 7 8 9 10 R2 tr 0,816 0,86 0,901 0,924 0,938 0,959 0,97 0,978 0,978 SE 0,139 0,124 0,107 0,096 0,089 0,074 0,065 0,057 0,059 R2 pr 0,765 0,8 0,829 0,873 0,903 0,879 0,696 0,563 0,358 Điện tích nguyên tử trong các mô hình O1, C7 O1, C4, C6 O1, C2, C4, C5 O1, C2, C4, C5, C3’ O1, O11, C3, C4, C6, C7, O11, C4, C6, C8, C9, C2’, C6’ O11, C3, C6, C7, C8, C9, C10, C3’ O1, O11, C3, C4, C6, C7, C8, C9, C10 O1, O11, C3, C6, C7, C8, C9, C2’, C3’, C6’

tr là 0,938 và giá trị

Cụ thể, mô hình QSARMLR (3.19) với k = 6 với giá trị R2

pr cao nhất là 0,903.

R2

pGI50 = 6,7116 − 42,3105 O1 − 8,1592O11 + 3,0139 C3 −19,0370 C4 + 6,6117 C6 +4,6038C7 (3.19)

Vì vậy, chúng tôi chọn các mô hình tốt nhất (với k bằng 5, 6 và 7) để xác

định tỷ lệ đóng góp của các điện tích nguyên tử. Giá trị đóng góp MPmxi, GMPmxi và

các giá trị thống kê của các mô hình tương ứng (với k bằng 5, 6 và 7), được trình

bày trong Bảng 3.25.

Giá trị phần trăm đóng góp MPmxi các biến độc lập trong mỗi mô hình

QSARMLR (với k bằng 5, 6 và 7) được xác định từ tỷ lệ đóng góp Pxk tương ứng của

97

các biến trong từng trường hợp. Giá trị Pxk được xác định bởi giá trị đóng góp tổng

cộng các biến trong một chất [18]. Vì vậy, tỷ lệ phần trăm đóng góp trung bình

MPmxi và GMPmxi của mỗi biến được xác định, các kết quả được mô tả trong Bảng

3.25. Phần trăm đóng góp trung bình toàn cục của GMPmxi trong Bảng 3.25 thể hiện

mức độ quan trọng của điện tích nguyên tử trong flavone và isoflavone. Đối với 3

mô hình QSARMLR với k = 5 – 7 biến số, vị trí các nguyên tử quan trọng sắp xếp

theo các giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3. Các nguyên tử C4, O1,

O11 là các các vị trí quan trọng nhất trong các phân tử. Ngoài các nguyên tử trong

nhóm carbonyl C4 = O11 và nguyên tử O1 có cặp electron liên kết điện tử π của C2 =

C3 và C4 = O11 để tạo thành một hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất

phản ứng hoàn toàn của nhóm carbonyl. Vì vậy, các nguyên tử quan trọng này được

chứng minh bằng cách sử dụng các giá trị GMPmxi, % và cũng phù hợp với các dự

đoán từ nghiên cứu thực nghiệm [18, 54, 103].

Ngoài ra, nguyên tử C6 cũng là một vị trí quan trọng và được khám phá để

gắn các chất thay thế mới [80, 103]. Các vị trí nguyên tử C9 và C3 cũng ảnh hưởng

quan trọng đối với các hoạt tính sinh học GI50, nhưng nguyên tử C9 không phải là vị

trí còn trống nên không chọn để gắn các chất thay thế mới. Vì vậy, C6 là vị trí còn

trống có thể được lựa chọn để gắn thêm các nhóm thế vào hợp chất flavone mẫu

trong Phụ lục 1a hoặc flavonoid chiết xuất. Tương tự, vị trí C3' cũng còn trống và có

thể được sử dụng để gắn các nhóm thế mới. Điều này có thể hy vọng sẽ tạo ra các

hợp chất mới với hoạt tính cao hơn. Từ hướng nghiên cứu này, flavonoid cô lập đã

được lựa chọn như là chất mẫu để thiết kế các dẫn xuất mới có hoạt tính cao hơn.

Mô hình QSARPLS cũng được xây dựng từ các tham số điện tích nguyên tử,

các tham số này được lựa chọn cho mô hình QSARPLS theo. Sáu biến số O1, O11, C3,

C4, C6 và C7 cũng được sử dụng để xây dựng mô hình QSARPLS. Mô hình QSARPLS

được có dạng:

pGI50 = 5,168 − 20,643 × O1 − 0,358 × C3 − 7,892 × C4 + 0,425 × C6 − 0,583

× C7 − 3,465 × O11 (3.20)

pr = 0,943; SE = 0,360; R2

pr = 0,912

Với n = 26; R2

98

Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của

điện tích nguyên tử trong các mô hình QSARMLR

Biến MPmxi m = 5 m = 6 m = 7 GMPmxi

QSARMLR m = 6 0,938 0,919 0,089 0,903 6,712

− 57,602 24,629

18,632 21,462

− 13,418 − − −

− −15,426 − −6,874 27,410 13,365 4,473 1,405 31,985

−101,208 −42,311 −8,159 − 3,014 −19,037 − 6,612 4,604 − − − − − − − − − − −16,117 − m = 7 0,959 0,943 0,074 0,879 4,714 − −32,8026 − − −60,070 − 20,877 − 16,902 95,421 −24,472 − −25,422 − 4,216 15,121 42,447 38,387 − 6,572 3,505 − − − − − − 5,779 − 5,696 22,597 2,497 − 3,582 − − − − − 11,801 − 4,117 1,168 1,899 7,532 0,832 3,934 1,194

m = 5 R2tr 0,924 R2 0,905 ad 0,096 SE R2 0,873 pr Hằng số −0,933 O1 O11 C2 C3 C4 C5 C6 C7 C8 C9 C2' C3' C6'

3.2.7.3. Xây dựng mô hình QSARANN(2)

Mô hình QSARANN(2) được xây dựng bằng kỹ thuật neuro-fuzzy với các thuật

toán di truyền sử dụng chương trình Visual Gene Developer v1,7 [43]. Kiến trúc

mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp đầu vào I(6) bao gồm

sáu nơ ron là các tham số O1, O11, C3, C4, C6 và C7; Nơ ron lớp đầu ra O(1) là hoạt

tính sinh học pGI50; Lớp ẩn HL(4) bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử

dụng thuật toán lan truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút

của mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ học 0,7;

sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện mạng thần kinh, giá trị

99

tr là 0,993 và R2

pr là 0,971 trong khi đối với mô hình QSARMLR (3.19), giá trị R2

tr

R2

pr là 0,903.

là 0,938 và R2

3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới

Khả năng dự báo của các mô hình QSARMLR (3.19), QSARPLS và

QSARANN(2) được đánh giá cẩn thận bằng cách sử dụng kỹ thuật LOO để xác định

pred; Các flavonoid được chia ngẫu nhiên từ dữ liệu trong Phụ lục 1a thành

giá trị R2

nhóm luyện gồm 26 hợp chất và nhóm kiểm tra gồm sáu hợp chất.

Các hoạt tính sinh học của 6 chất flavonoid trong nhóm thử nghiệm trong

Phụ lục 1a được dự đoán từ các mô hình QSARMLR, QSARPLS và QSARANN. Các

giá trị dự đoán của các hoạt tính sinh học của những hợp chất này được so sánh với

các giá trị thực nghiệm, được trình bày trong Bảng 3.2 .

Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR

(3.19), QSARPLS (3.20) và QSARANN(2)

Hợp chất pGI50,exp

5,921 5,745 6,097 5,699 5,699 5,137 pGI50,pred M2 5,801 5,608 5,842 5,652 5,655 5,083 M3 5,851 5,741 5,814 5,712 5,719 5,112 M1 6,008 5,692 5,759 5,651 5,651 5,092 ARE,% M2 2,020 2,376 4,188 0,828 0,775 1,046 M1 1,472 0,925 5,548 0,840 0,835 0,877 M3 1,180 0,070 4,646 0,236 0,347 0,490 Fla 2 Fla 9 Fla 12 Fla 15 Fla 16 Isofla 32

1,161 MARE,% 1,749 1,872

Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS; M3 là

mô hình QSARANN(2).

Khả năng dự báo của mô hình QSARMLR (3.19) thấp hơn các mô hình

QSARPLS và QSARANN (2) tương ứng như trong Bảng 3.2 . Mô hình QSARANN (2)

có sai số có giá trị MARE % là 1,161 nhỏ hơn MARE,% của cả hai mô hình

QSARMLR (3.19) và QSARPLS.Vì vậy, khả năng dự báo của mô hình QSARANN (2)

tốt hơn so với mô hình QSARMLR (3.19) và QSARPLS. Sau khi sử dụng các mô hình

QSARMLR (3.19), QSARPLS và QSARANN(2) để dự đoán các hoạt tính sinh học pGI50

của sáu hợp chất trong nhóm thử nghiệm, sai số dự đoán nằm trong khoảng sai số số

100

không chắc chắn của thực nghiệm. Do đó, các mô hình QSARMLR (3.19), QSARPLS

và QSARANN(2) thích hợp để dự đoán các hoạt tính sinh học của các hợp chất

flavonoid mới.

3.3. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN

3.3.1. Phân lập cynaroside từ actiso

CSL1 phân lập và tinh chế từ actiso (mục 2.4.1.) CSL1 kết tinh dạng bột,

trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy

256 – 257 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (60 : 40). hiện màu

bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,6).

Phổ 1H-NMR (500 MHz, DMSO, δ ppm). Các proton trong vòng thơm: Độ

dịch chuyển của H liên kết với Csp2 thơm trung bình là 7,27, tuỳ vào các liên kết với

các nhóm thế khác nhau mà có sự thay đổi từ 6 - 9. Dễ dàng nhận thấy, từ độ dịch

chuyển hoá học của H6 và H8 cho thấy đây là hai mũi proton của nhân thơm, ghép

cặp metha với nhau. Một mũi đôi của proton trong nhân thơm ở H2’ mũi bốn ở H3’ là

hai proton ghép cặp ortho. Một mũi đôi của proton nhân thơm tại δH 6,90 ppm (d, J

= 8,5 Hz) và một mũi bốn của của proton nhân thơm tại δH 7,44 ppm (dd, J = 8,5Hz,

J = 2) chứng tỏ chúng ở vị trí ortho. Mũi đôi proton H6’ và H2’ ghép cặp meta với

nhau. Cụ thể là δ 6.39 (s, H3); 6.44 (d, J = 2 Hz, H6); 6.78 (d, J = 2 Hz, H8); 5.08

(1H, d, J = 7,5Hz , H1"); 7,41 (d, J = 8.5 H6’); 6,90 (d, J = 8,5Hz, H3’); 7,44 (dd, J =

8,5Hz, J = 2, H2’); Các proton của nhóm OH: quan sát trên phổ có mũi proton với

độ dịch chuyển ở 12,89 ppm. Các mũi đa proton trong vòng đường gồm có: 3,489

(1H, m, H2’’); 3,476 (1H, m, H4’’); 3,466 (1H, m, H3’’); 3,500 (1H, m, H5’’); 3,725

(1H, dd, J = 12,3; 2,5 HZ, H6’’); 3,702 (1H, dd, J = 12,4; 6,3 HZ, H6’’); Mũi đôi

proton H1’’ (1H, d, J = 7,5Hz) được suy ra từ phổ 1H-NMR kết hợp với phổ HSQC,

cho thấy đường nối với khung aglycon bằng liên kết β. Mặt khác có tương tác giữa

δH1’’ và C7 trong phổ HMBC. Vậy CSL1 có một đơn vị đường gắn vào khung

glycon ở C7 trong phân tử.

Phổ 13C-NMR (DMSO, δ ppm, 125 MHz) và DEPT: Phổ 13C-NMR (DMSO,

δ ppm,125 MHz) kết hợp phổ DEPT và phổ phổ cộng hưởng từ hạt nhân 2 chiều

101

HSQC VÀ HMBC cho thấy CSL1 là một hợp chất flavonoid có 21 C. Có một nhóm

>C=O: 181,785 (C4). Có một nhóm >CH2: 60,6(C6’’). Có 5 nhóm –CH<: 76,4 (C2’’);

77,2 (C3’’); 69,5 (C4’’); 78 (C5’’); và mũi acetan đặc trưng 99,9 (C1’’) của đường. Có

6 nhóm cacbon bậc ba (–CH=): 105,3(C3); 100,2(C6); 95(C8); 113,6(C2’); 145,7

(C3’); 119,2 (C6’). Có 8 nhóm C bậc 4 (

156,9(C9); 103,1(C10); 121,4(C1’); 149,9 (C4’); 115,9 (C5’); Tương tác của C và H

trong phổ HMBC và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 -

C1’- C3’- C4’ - C6’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’.

Phổ 1H-NMR của cynaroside (Phụ lục 13), phổ 13C-NMR (Phụ lục 15), phổ

DEPT (Phụ lục 14), phổ HMBC P lục 16), phổ HSQC (Phụ lục 17). Tham khảo với

phổ của hợp chất CSL1 trong nghiên cứu phân lập hợp chất cynaroside từ hạt

capparis decidua (forsk) của V. K. SAXENA và cs. [78] cho thấy CSL1 là

cynaroside. Cấu trúc Cynaroside được cho ở Hình 3.8.

Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11

Danh pháp khác của cynaroside là luteolin-7-O-β-d-glucopyranoside hay

2-(3,4-dihydroxyphenyl)-5-hydroxy-7-((2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-

(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one.

3.3.2. Phân lập quercetin từ xa kê

AIL1 phân lập từ xa kê theo mục 2.4.1. AIL1 kết tinh dạng bột, trong hỗn

oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20). Hiện màu bằng dung

hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 314 – 316

dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0.35)

Phổ 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 24), phổ 13C-NMR

(Phụ lục 25), phổ DEPT (Phụ lục 26), kết hợp với phổ HSQC (Phụ lục 27), HMBC

(Phụ lục 28): Có 5 proton trong vòng thơm trong đó:  6,26 (1H, d, J = 1,5 Hz, H6)

102

ghép cặp metha với  6,52 (1H, s giống t, H8);  6,98 (1H, d, J=8,5 Hz, H6') ghép

cặp metha với  7,82 (1H, d, J = 1,5 Hz, H2') và ghép cặp ortho với  7,68 (1H, dd, J

= 8,5 và 2 Hz, H5'). Tín hiệu proton ở  12,16 (1H, s); cho thấy hợp chất có nhóm

OH. Phổ 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phổ DEPT, HSQC, HMBC: hai

cacbon olefin C 146,9 (C2) và C 136,6 (C3). Hai cacbon >C= là: C 146,9 (C2); C

136,6 (C3); 12 cacbon vòng thơm: C 176,5, (C4);  162,2 (C5);  164,9 (C7); 

157,7 (C9); 145,7 (C3');  148,2 (C4'); Trong đó có hai cacbon bậc 4: δC 121,4 (C1')

và  104,0 (C-10); có năm cacbon –CH=:  99,1 (C6);  94,4 (C8);  116,1 (C2'); 

115,6 (C5'); C 123,7 (C6'); Quan sát tương tác của H và C trong phổ HSQC, HMBC

cho thấy phổ nghiệm của AIL1 thì phù hợp. H6-C5-C7-C8-C10; H8-C6-C7-C9-C10, H2’-

C1’-C6’-C3’-C4’-C2; H3’-C2’-C1’-C3’- C4’; H6’-C1’-C2-C2’-C4’-C5’.

Phổ tham khảo từ nghiên cứu sự phân lập quercertin từ lá hồ lô ba (trigonella

foenum-graecum) của Bharathi Sambflavonoidam và cs. [11] và nghiên cứu phân

lập quercertin từ thân cây Costus igneus rhizome (CiREE) của

PazhanichamyKalailingam và cs. [44] cho thấy AIL1 là quercetin. Cấu trúc

quercetin cho ở Hình 3.9.

Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7

Danh pháp: 2-(3,4-dihydroxyphenyl)-3,5,7-trihydroxy-4H-chromne-4-one.

3.3.3. Phân lập luteolin từ tía tô

POL1 phân lập từ tía tô theo mục 2.4.1. POL1 kết tinh dạng bột, trong hỗn

oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (95 : 5) hiện màu bằng dung

hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 327-328

103

dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,34), cho phản ứng dương

tính với thuốc thử FeCl3/EtOH cho thấy đây là một dẫn xuất phenolic.

Phổ 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 29) kết hợp với phổ

HSQC (Phụ lục 33), HMBC (Phụ lục 32): Sáu H trong vòng thơm: δ 6.65 (1H; s,

H3); 6.19 (1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H;

d; J = 8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); bốn H của nhóm OH: 9.4 (1H, s, C4’-

OH ); 9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH), có một H của nhóm OH kiềm nối:

H [12.95 (s; 5-OH)].

Hình 3.10 Cấu trúc POL1, C15H10O6

Danh pháp: 2-(3,4-dihydroxyphenyl)-5,7-dihydroxy-4H-benzopyran-4-one

Phổ 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 30) kết hợp với phổ DEPT (Phụ

lục 31), HSQC, HMBC: Có 5 C thơm –CH=: 98.9(C6); 93.8(C8); 113.4(C2’);

116.0(C5’); 118.9(C6’). Có 6 C bậc 3 liên kết với oxy: δ163.1 (C2); 161.4(C5);

164.1(C7); 157.3 (C9); 145.7(C3’); 149.7(C4’); có 3 C bậc 4: 103.7(C10); 121.5(C1’);

có một cacbon cacbonyl 181.6(C4). Tương tác của C và H trong phổ HMBC và phổ

HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ -

C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. So sánh phổ

chuẩn của POL1 với nghiên cứu sự phân lập luteolin [108], cho thấy POL1 là

luteolin. Cấu trúc luteolin cho ở Hình 3.10.

TÓM TẮT PHỔ

Cấu trúc POL1 được xác định bằng cách sử dụng các phổ khác nhau: 1H-

NMR (DMSO-d6, 500 MHz, δ ppm) with HSQC, HMBC: δ 6.65 (1H; s, H3); 6.19

(1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H; d; J =

8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); 12.95 (1H, s; C5-OH); 9.4 (1H, s, C4’-OH );

9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH). The 13C-NMR (DMSO-d6, 125 Hz) kết

104

hợp với phổ DEPT, HSQC, HMBC: δ163.1 (C2); 102.8(C3); 181.6(C4); 161.4(C5);

98.9(C6); 164.1(C7); 93.8(C8); 157.3 (C9);103.7(C10); 121.5(C1’); 113.4(C2’);

145.7(C3’); 149.7(C4’); 116.0(C5’); 118.9(C6’). Tương tác C – H trong phổ HMBC

và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’

-C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 -C1’ - C2’ - C4’ - C5’.

3.3.4. Phân lập daidzin từ đậu nành

3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR

GML1 được phân lập từ đậu nành theo mục 2.4.1. GML1 kết tinh dạng tinh

thể trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng

chảy 246 - 248 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20) hiện

màu bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,4).

Phổ 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 18): 6 proton trong

vòng thơm: H6 ghép cặp ortho với H5 và ghép cặp metha với H8:  8,06 (1H, d, J =

8,0Hz, H5);  7,15 (1H, d, J = 1,5 Hz, H6);  7,23 (1H, d, J = 2,0Hz, H8); H3’, H5’

ghép cặp metha  6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); H6’, H2’ ghép cặp metha: 

7,42 (2H, d, J = 8,0 Hz, H6’, H2’); có một tín hiệu H trong vòng A δ 6.80 (1H; s,

H2); có một tín hiệu H anomeric  5,10 (1H, m, H1’’), phân tử có một gốc đường với

các tín hiệu H đường  3,70-3,73 (6H, m, H2’’, H3’’, H4’’, H5’’ , H6’’, H6’’).

Phổ 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 19) kết hợp với phổ DEPT (Phụ

lục 20), HSQC (Phụ lục 22), HMBC (Phụ lục 21): Có 7 cacbon –CH= trong vòng

thơm: δ 126,9 (C5), δ 115,6 (C6), δ 103,4 (C8), δ 130,0 (C2’), δ 115,0 (C3’), δ 115,0

(C5’), δ 130,0 (C6’). Có 3 C bậc ba, thơm, liên kết trực tiếp với oxi: δ 157,0 (C9), δ

157,2 (C4’), ), δ 161,3 (C7). Có 1 cacbon cabonyl: δ 174,7 (C4). Có 1 C thơm có H

liên kết trực tiếp với oxy: δ153,2 (C2). Có 2 C bậc 4 thơm: δ 118,5 (C10), δ 123,7

(C1’). Có 1 cacbon bậc 4 không thơm: δ 122,3 (C3). Có 6 C trong gốc đường: δ

100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ 69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’).

So sánh phổ chuẩn của GML1 với nghiên cứu sự phân lập daidzin [53, 55],

cho thấy GML1 là daidzin. Cấu trúc daidzin được đưa ra trong Hình 3.11.

105

Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9

Danh pháp daidzin: 3-(4-hydroxyphenyl)-7-((2S,3R,4S,5S,6R)-3,4,5-

trihydroxy-6-(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one

TÓM TẮT PHỔ

Cấu trúc GML1 được xác định bằng phương pháp đo phổ 1H-NMR: δ8,06 (1H, d, J = 8,0Hz, H5); δ 7,15 (1H, D, J = 1,5 Hz, H6); δ 7,23 (1H, d, J =

2,0Hz, H8); δ 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); δ 7,42 (2H, d, J = 8,0 Hz, H6’,

H2’); phổ 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phổ DEPT, HSQC, HMBC:

δ153,2 (C2), δ 122,3 (C3), δ 174,7 (C4), δ 126,9 (C5), δ 115,6 (C6), δ 161,3 (C7), δ

103,4 (C8), δ 157,0 (C9), δ 118,5 (C10), δ 123,7 (C1’), δ 130,0 (C2’), δ 115,0 (C3’), δ

157,2 (C4’), δ 115,0 (C5’), δ 130,0 (C6’), δ 100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ

69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’).

3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X

Cấu trúc daidzin còn được xác định bằng phương pháp đo nhiễu xạ tia X đơn

tinh thể: Dữ liệu nhiễu xạ đơn tinh thể của daidzin được đo trên máy Bruker D8

Quest (tại Khoa Hóa học, Trường Đại học Khoa Học Tự Nhiên, Hà Nội) ở nhiệt độ

100 K, đối âm cực Mo với bước sóng K = 0,71073 Å). Ảnh nhiễu xạ được ghi

trên detector huỳnh quang dạng đĩa trong đường kính 34 cm, khoảng cách từ tinh

thể đến detector là 10 cm. Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi

đơn tinh thể được thực hiện trên phần mềm chuẩn - Apex 2 của máy đo. Cấu trúc

được xác định theo phương pháp trực tiếp (direct method). Sử dụng phần mềm XT

tích hợp trong Olex2 để tính và tối ưu hoá cấu trúc. Vị trí của nguyên tử hidro được

xác định theo các thông số lý tưởng và được tính bằng phần mềm SHELXL.

Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu xạ

tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất.

106

Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được

trình bày trong Phụ lục 44-50.

Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50%

Kết quả đo về độ dài liên kết, góc liên kết của hợp chất daidzin phù hợp giữa

lý thuyết và thực nghiệm (Ftt= 1,214 < F= 4,734). Kết quả đo độ dài các liên kết

đôi C=C trong daidzin trong khoảng 1,337 – 1,407 Å; liên kết C-C từ 1,509 – 1,530

Å. Các liên kết C=O thực nghiệm đo được đối với C7-O8 là 1,237 Å. Liên kết thực

nghiệm đo được đối với C3-O4 là 1,369 Å; đối với C5-O4 là 1,341 Å. Cấu trúc phân

tử Daidzin dưới dạng elipxoit với xác xuất 50% từ đậu nành (Hình 3.12).

3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió

3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR

ZZL1 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. ZZL1 thu được

dưới dạng tinh thể, màu vàng, điểm nóng chảy 249 – 250 oC; sắc ký lớp mỏng

(TLC) triển khai bằng dung môi CHCl3 – MetOH (85:15) hiện màu bằng dung dịch

H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,3. Phổ 1H-MNR (500

MHz, DMSO, δ ppm) (Phụ lục 34): có H trong nhân thơm: H6 và H8 ghép cặp

metha với nhau δ6,20 (1H, d, J = 2, H6) 6,44 (1H, d, J = 2, H8); H6’ ghép cặp metha

với H2’ và ghép cặp ortho với H5’ 7,93 (2H, d, H6’, H2’); H5’ ghép cặp metha với H3’

6,94 (2H, d, J = 9, H5’,H3’). Có một nhóm OH kiềm nối δ12,68 (1H, s, 5-OH), có 3

H của nhóm methyl 3,78 (3H, s, H11). Phổ 13C-NMR (125MHz, δ ppm) (Phụ lục

35): có 1 C cacbonyl: 177,9 (C4); có 6 C thơm –CH=: 98,5 (C6); 93,7 (C8); 130,1

107

(C2’); 115,6 (C3’); 115,6 (C5’); 130,1 (C6’). Có 2 C thơm bậc 4: 104,2 (C10); 120,5

(C1’); có 6 C thơm bậc 3, liên kết trực tiếp với oxi: δ155,6 (C2); 137,6 (C3); 161,2

(C5); 164,1 (C7 ); 156,3 (C9); 160,1 (C4’); Tương tác của C và H có trong phổ

HMBC (Phụ lục 37) và HSQC (Phụ lục 38): H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 -

C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’;

H6’ - C2 - C1’ - C2’ - C4’ - C5’.

Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6

Danh pháp 5-hydroxy-2-(4-hydroxyphenyl)-7-methoxy-4H- benzopyran-4-

one. Phổ tham khảo từ nghiên cứu sự phân lập kaempferol từ thân cây Costus

igneus rhizome (CiREE) của PazhanichamyKalailingam và cs [44] cho thấy ZZL1

là kaempferol- 3-O-methylether. Cấu trúc ZZL1 được đưa ra trong Hình 3.13.

TÓM TẮT PHỔ

Cấu trúc ZZL1 được xác định từ dữ liệu phổ nghiệm: 1H-MNR (500 MHz,

DMSO, δ ppm): δ6,20 (1H, d, J = 2, H6); 6,44 (1H, d, J = 2, H8); 7,93 (2H, d, H6’,

H2’); 6,94 (2H, d, J = 9, H5’,H3’); 12,68 (1H, s, 5-OH); 3,78 (3H, s, H11). 13C-NMR

(125MHz, δ ppm): δ155,6 (C2); 137,6 (C3); 177,9 (C4); 161,2 (C5); 98,5 (C6); 164,1

(C7 ); 93,7 (C8); 156,3 (C9); 104,2 (C10); 120,5 (C1’); 130,1 (C2’); 115,6 (C3’); 160,1

(C4’); 115,6 (C5’); 130,1 (C6’).

Tương tác dị proton giữa C và H qua nhiều liên kết (HMBC) và qua một liên

kết (HSQC) đã giúp xác định được sự có mặt của các nguyên tố chính xác hơn: H6 -

C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ -

C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’.

108

3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo

nhiễu xạ tia X

Cấu trúc ZZL1 được xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh

thể. Dữ liệu nhiễu xạ đơn tinh thể ZZL1 được đo tương tự như đối với hợp chất

daidzin. Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu

xạ tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất.

Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được

trình bày trong phụ lục 51-57.

Liên kết đôi C=C theo lý thuyết có độ dài liên kết 1,33 Å. Kết quả đo nhiễu

xạ tia X đơn tinh thể C1=C2, C8=C10, C7=C14, C11=C13, C16=C22, C17=C18 có độ dài

thực nghiệm từ 1,360 đến 1,399 Å. Liên kết C – C thông thường có độ dài 1,54 Å,

kết quả thực nghiệm độ dài liên kết C1-C16 là 1,47 Å. Liên kết C=O có độ dài lý

thuyết là 1,20 Å. Kết quả thực nghiệm cho thấy độ dài C5-O6 là 1,264 Å. Liên kết

C-O có độ dài lý thuyết là 1,43 Å. Kết quả thực nghiệm cho thấy độ dài liên liên kết

C2-O3 là 1,3766 Å, liên kết O3-C4 là 1,445 Å, liên kết C8-O9 là 1,3489 Å, liên kết

C11-O12 là1,348 Å, liên kết C19-O20 là 1,362 Å.

Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50%

Các góc của Csp2 theo lý thuyết là 120o; ở đây kết quả đo X-ray cho kết quả

phù hợp. Các tham số cấu trúc: độ dài liên kết, góc liên kết của ZZL1 sau khi tối ưu

hóa được tính toán bằng phương pháp hóa lượng tử PM3 bằng Hyperchem phù hợp

109

với độ dài và góc từ phổ chụp X-ray đơn tinh thể (Ftt = 1,280 < F4,567).

Điều đó cho thấy các kết quả đo về độ dài, về góc giữa lý thuyết và thực

nghiệm là hoàn toàn phù hợp. Cấu trúc phân tử kaempferol gừng gió dưới dạng

elipxoit với xác xuất 50% được chỉ ra trong Hình 3.14.

3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ

gừng gió

ZZL2 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. Hợp chất ZZL2

thu được dưới dạng bột vô định hình, màu vàng, nhiệt độ nóng chảy: 111-114 oC;

sắc kí lớp mỏng (SKLM) triển khai bằng hệ CHCl3 – MetOH (90 : 10) hiện màu

bằng dung dịch H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,42. Phổ

1H-MNR (500 MHz, DMSO, δ ppm) (Phụ lục 39): Có 6 H trong vòng thơm:

Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12)

H6 và H8 ghép cặp metha δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2, H8); H3’

và H5’ ghép cặp metha δH 6,94 (2H, d, J = 8,5, H3’, H5’); H2’ và H6’ ghép cặp metha

δH 6,95 (2H, d, J = 8,5, H2’, H6’). Có H trong nhóm OH kiềm nối δH 12,53 (1H, d,

OH). Có 9 H trong nhóm methyl: δH 0,73 (3H, d, J = 6, H6’’); δH 1,98 (3H, s, H10’’);

δH 2,05 (3H, s, H8’’), dựa vào các tương tác C và H cho thấy hợp chất bị acetyl hoá

tại C2’’ và C4’’. Có 1 proton anome δH 5,40 (1H, d, J = 1, H1’’), xác nhận là đường

α. có 3 H trong –CH< trong phần đường kề oxy: δH 4,60(1H, t, J = 9,5, H4’’)’ δH

5,11 (2H, dd, J = 1,5 H3’’ và 3,5, H2’’) cho thấy ZZL2 có một đơn vị đường.

110

Phổ 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 40) kết hợp với phổ DEPT (Phụ

lục 41), HSQC (Phụ lục 43), HMBC (Phụ lục 42): Có 6 cacbon –CH= trong vòng

thơm: δC 98,8 (C6), δC 93,8 (C8), δC 129,9 (C2’); δC 114,2 (C3’); δC 130,5 (C2’, C6’); δC

115,4 (C3’, C5’). Có 2 cacbon bậc 4 trong vòng thơm: δC 104,0 (C10); δC 120,1 (C1’).

Có 4 cacbon thơm bậc 3 liên kết trực tiếp với oxy δC 156,5 (C9), δC 161,2 (C5), δC

164,3 (C7), δC 160,2 (C4’). Có 2 cacbon bậc 3 trong vòng A liên kết trực tiếp với oxi:

δC 157,4 (C2), δC 133,2 (C3). Có 1 cacbon cacbonyl δC 177,6 (C4). Có 3 cacbon

(CH3): δC 16,9 (C6’’); δC 20,4 (C8’’); δC 20,7 (C10’’ ); Có 2 cacbon cacbonyl trong

vòng đường: δC 169,7 (C7’’); δC 169,4 (C9’’). Có 5 cacbon trong vòng đường: δC 69,9

(C2’’); δC 67,8 (C3’’, C5’’); trong đó có 1 cacbon acetal δC 97,9 (C1’’).

So sánh dữ liệu phổ của ZZL2 với nghiên cứu phân lập kaempferol-3-O-(2,4-

O-diacetyl-alpha-L-rhamnopyranoside cho thấy ZZL2 là kaempferol-3-O-(2,4-O-

diacetyl-alpha-L-rhamnopyranoside (Hình 3.15) [42].

Danh pháp: (3R,4S,6R)-2-(5,7-dihydroxy-2-(4-hydroxyphenyl)-4-oxo-4H-

chromen-3-yloxy)-4-hydroxy-6-methyltetrahydro-2H-pyran-3,5-diyl diacetate

TÓM TẮT PHỔ

Đối với hợp chất ZZL2 được xác định cấu trúc, với dữ liệu phổ nghiệm: 1H-

MNR (500 MHz, DMSO, δ ppm): δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2,

H8); δH 6,94 (2H, d, J = 8,5, H3’, H5’); δH 4,61(1H, t, J = 9,5, H4’); δH 7,15 (2H, d, J =

8,5, H2’, H6’): δH 12,54 (1H, d, OH). δH 5,40 (1H, d, J = 1, H1’); δH 0,74 (3H, d, J = 6,

H6’’); δH 1,98 (3H, s, H10’’); δH 2,05 (3H, s, H8’’). Tương tự, đối với phổ 13C-NMR

(DMSO-d6, 125 Hz) với dữ liệu phổ DEPT, HSQC, HMBC: δC 157,4 (C2), δC 133,2

(C3), δC 177,6 (C4); δC 161,2 (C5), δC 98,8 (C6), δC 164,3 (C7), δC 93,8 (C8), δC 156,5

(C9), δC 104,0 (C10); δC 120,1 (C1’); δC 129,9 (C2’); δC 114,2 (C3’); δC 160,2 (C4’); δC

130,5 (C2’, C6’); δC 115,4 (C3’, C5’); δC 97,9 (C1’’); δC 69,9 (C2’’); δC 67,8 (C3’’, C5’’);

δC 16,9 (C6’’); δC 169,7 (C7’’); δC 20,4 (C8’’); δC 169,4 (C9’’); δC 20,7 (C10’’ );

3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên

Các hợp chất flavonoid phân lập có tác động gây độc tế bào (GI50) ở nồng độ

cao 100 (µg/ml), tiếp tục khảo sát ở các nồng độ khác nhau Bảng 3.27. Với các hợp

111

chất GML1 POL1, CSL1, AIL1, ZZL1, và ZZL2 được phân lập từ actiso, xa kê,

đậu nành, tía tô và gừng gió.

Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế

bào Hela ở các nồng độ khác nhau

Mẫu

CSL1 (cynaroside)

AIL1 (Quercetin)

POL1 (luteolin)

GML1 (daidzin)

ZZL1 (kaempferol-3-O -methylether)

ZZL2 (kaempferol-3-O -(2,4-O-diacetyl -alpha-L -rhamnopyranoside) Nồng độ (µg/ml) 12 9 6 3 1 12 9 6 3 1 9 6 3 1 0,1 9 6 3 1 0,1 50 40 30 20 10 50 40 30 20 10 Phần trăm gây độc tế bào (%) Lần 3 66,13 48,80 55,19 40,25 3,53 68,30 82,78 70,35 42,53 6,27 54,28 58,38 34,32 5,70 -4,10 55,99 42,19 34,44 10,95 54,28 79,82 64,31 60,43 57,58 39,45 65,45 52,34 31,01 17,10 2,39 Lần 2 63,45 51,23 58,97 36,77 4,15 62,22 79,37 61,43 40,25 1,01 50,67 54,82 31,61 10,43 1,35 56,61 39,13 34,64 -3,03 50,67 81,61 63,79 56,50 56,73 42,60 70,74 53,48 35,87 7,17 -1,23 TB 65,97 48,74 57,50 39,87 5,42 66,86 81,72 65,87 39,87 0,97 53,65 56,77 35,34 9,64 -2,01 55,94 39,79 32,39 1,91 53,65 80,49 63,60 58,48 57,45 41,29 66,51 52,17 32,49 11,63 0,13 Lần 1 68,33 46,18 58,35 42,59 8,58 70,05 83,00 65,83 36,82 -4,37 56,01 57,10 40,09 12,79 -3,28 55,23 38,07 28,08 -2,18 56,01 80,03 62,71 58,50 58,03 41,81 63,34 50,70 30,58 10,61 -0,87 ĐLC 2,443 2,528 2,027 2,928 2,753 4,109 2,033 4,459 2,876 5,320 2,721 1,803 4,331 3,610 2,937 0,695 2,141 3,730 7,836 2,721 0,982 0,814 1,966 0,664 1,638 3,813 1,394 2,940 5,043 1,977

Dựa vào kết quả khảo sát ở Bảng 3.27, xây dựng đồ thị biểu diễn tỷ lệ (%)

gây độc tế bào. Từ đồ thị, nội suy giá trị nồng độ cho tỷ lệ gây độc tế bào 50%. Kết

quả nội suy giá trị GI50 (µg/ml) của các flavonoid phân lập từ actiso, xa kê, đậu

nành, tía tô và gừng gió được trình bày trong Bảng 3.28.

112

Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực

nghiệm in vitro

GI50 (µg/ml) Flavonoid

\

CSL1 AIL1 POL1 GML1 ZZL1 ZZL2 Lần 1 Lần 2 Lần 3 4,96 4,79 4,41 3,81 4,38 4,36 4,95 5,38 4,75 7,70 7,87 8,09 15,82 15,24 15,05 38,90 38,03 39,65 TB ± ĐLC 4,72 ± 0,280 4,18 ± 0,327 5,03 ± 0,321 7,88 ± 0,195 15,37 ± 0,401 38,86 ± 0,814 GI50 (µM) TB 10,533 13,839 17,584 18,937 51,223 75,292 pGI50 TB 4,977 4,859 4,755 4,723 4,291 4,123

3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CÁC FLAVONOID

3.4.1. Mô hình QESAR

Thiết kế phân tử flavone và isoflavone mới: thử nghiệm gắn các nhóm thế

vào các vị trí C6 và C3' trong khung phân tử của các chất mẫu flavone 1a, isoflavone

6b (phụ lục 4). Các hợp chất mới thiết kế được dự đoán hoạt tính kháng ung thư

pGI50 [115] bằng các mô hình QESARMLR và QESARANN.

Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các

flavone, isoflavone mới và chất mẫu

Chúng tôi chọn ra các chất mới có hoạt tính cao nhất tính toán điện tích của

các nguyên tử cho ở phụ lục 8, kết quả dự đoán thể hiện ở được trình bày ở Bảng

3.29, Hình 3.16. Như vậy, hợp chất mới thiết kế từ vị trí C6 và C3’ cho hoạt tính

sinh học pGI50 mạnh hơn chất mẫu flavone 1a, isoflavone 6b và hợp chất ZZL1,

ZZL2 phân lập.

113

Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô

hình QESARMLR và QESARANN

Nhóm thế pGI50,pr Hợp chất vị trí C6 vị trí C3' QESARMLR QESARANN

-H -H 5,954 5,709 fla-1a [103]

-OH fla-1c 5,928 5,795 -OCH2CONHCH3

-H fla-2c 5,954 5,814 -OCH2CONHCH3

fla-3c 5,974 5,816 -OCH2(CH3)C=NOH -OH

fla-4c -OH 6,128 5,873 -OCH2CONHCH3

fla-5c -OH 6,172 5,886 -OCH2CH3C=NOH

isofla-6b [103] -H -H 5,092 5,011

isofla-7c -OH 5,328 5,308 -OCH2CONHCH3

isofla-8c -H 5,367 5,341 -OCH2CONHCH3

isofla-9c 5,369 5,350 -OCH2(CH3)C=NOH -OH

isofla-10c -OH 5,502 5,452 -OCH2CONHCH3

isofla-11c -OH 5,543 5,486 -OCH2CH3C=NOH

ZZL1 (*) -H -H 4,291(*) 4,291(*)

Flav-11(n) -OH 4,345 4,387 -OCH2CONHCH3

Flav-12(n) -OH 4,789 4,715 -OCH2CONHCH3

Flav-13(n) 4,963 4,960 -OCH2(CH3)C=NOH -OH

Flav-14(n) -OH 5,528 5,512 -OCH2CONHCH3

Flav-15(n) -OH 5,530 5,513 -OCH2CH3C=NOH

ZZL2 (*) -H -H 4,123 (*) 4,123(*)

Flav-16(n) -OH 4,139 4,159 -OCH2CONHCH3

Flav-17(n) -OH 4,398 4,414 -OCH2CONHCH3

Flav-18(n) 4,615 4,870 -OCH2(CH3)C=NOH -OH

Flav-19(n) -OH 4,980 5,103 -OCH2CONHCH3

Flav-20(n) -OH 5,100 5,231 -OCH2CH3C=NOH

114

(*) Giá trị thử nghiệm in vitro hoạt tính kháng ung thư trên tế bào Hela trong

nghiên cứu của chúng tôi.

Với ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-

O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió.

Bằng các kỹ thuật tính toán cơ học phân tử, hóa lượng tử, hồi quy tuyến tính

và mạng thần kinh nhân tạo đã xây dựng mô hình quan hệ định lượng giữa cấu trúc

điện tử và hoạt tính sinh học kháng ung thư của nhóm flavone và isoflavone thành

công. Mô hình tuyến tính QESARMLR gồm 6 nguyên tử O1, O11, C3, C4, C6 và C7 và

mô hình nơ ron QESARANN có cấu trúc I(6)-HL(2)-O(1). Các mô hình tuyến tính đã

tìm được vị trí quan trọng C6 và C3’ để định hướng gắn thêm nhóm thế tạo ra các

hợp chất mới từ flavone, isoflavone và hợp chất ZZL1, ZZL2 phân lập có hoạt tính

cao hơn chất mẫu (Bảng 3.29).

3.4.2. Mô Hình QSDAR

Thiết kế phân tử flavone và isoflavone mới: Các cấu trúc của 12 flavone và

isoflavone mới được thiết kế từ các dẫn xuất mẫu flavone 22 và isoflavone 26 bằng

cách gắn thử nghiệm nhóm thế vào vị trí C6, C3 còn trống (Bảng 3.30).

Các giá trị hoạt tính pGI50 dự đoán từ các mô hình tuyến tính và mạng thần

kinh của các chất mới có hoạt tính cao hơn chất mẫu.

Tính toán hóa lượng tử, hồi quy tuyến tính và kỹ thuật thần kinh mờ đã được

sử dụng thành lập thành công mối quan hệ định lượng giữa hoạt tính kháng ung thư

13C-NMR và 15O-NMR của các flavone và isoflavone. Mô hình tuyến tính

pGI50 và độ dịch chuyển hóa học i của các nguyên tử oxy và cacbon từ dữ liệu phổ

QSDARMLR với 7 biến số O1, O11, C2, C3, C6, C7 và C2’, mô hình mạng nơ ron

QSDARANN với cấu trúc I(7)-HL(2)-O(1) được sử dụng dự đoán chính xác hoạt tính

kháng ung thư của flavone và isoflavone trong nhóm kiểm tra. 18 dẫn xuất mới

được thiết kế từ vị trí C3, C6 và C7 còn trống của flavone 22 và isoflavone 26. Các

hoạt tính kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn flavone 22 và

isoflavone 26, tương ứng. Các mô hình QSDARMLR và QSDARANN đã phát triển là

tin cậy và có thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50.

115

Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán

pGI50,pr

Cấu trúc phân tử

Nhóm thế

flavone 22 [103] 1b, R1 = Me 2b, R1 = C6H5 3b, R1 = p-F- C6H4 4b, R1 = Me 5b, R1 = C6H5 6b, R1 = p-F- C6H4 7b, R1 = Me 8b, R1 = C6H5 9b, R1 = p-F- C6H4 isoflavone 26 [103] 10b, R1 = Me 11b, R1 = C6H5 12b, R1 = p-F- C6H4 13b, R1 = Me 14b, R1 = C6H5 15b, R1 = p-F- C6H4 16b, R1 = Me 17b, R1 = C6H5 18b, R1 = p-F- C6H4

từ mô hình QSDARMLR (M1) và QSDARANN (M2)

M1 5,3570 5,4157 5,3669 5,3855 6,0412 6,0063 5,9579 7,5843 7,5843 7,6042 5,0698 5,1145 5,0957 5,0973 5,8170 5,7985 5,8204 7,2093 7,1880 7,1716 M2 5,2808 5,8444 5,7736 5,8263 6,0728 6,0622 6,0535 5,9761 5,9749 5,9863 5,08715 5,1742 5,1716 5,1724 5,4754 5,4744 5,4704 5,2362 5,2312 5,2219

3.4.3. Mô hình QSSRMLR

Các nghiên cứu ở trên các mô hình tuyến tính và mạng thần kinh

(QESARMLR, QSDARMLR, QSSRMLR) đã được đánh giá, kiểm tra về độ tin cậy,

chúng tôi tiến hành dự đoán tính chất hóa lý cũng như hoạt tính của một số hợp chất

có trong tự nhiên chưa biết hoạt tính được đưa ra trong tài liệu của Đỗ Tất Lợi [3].

Các hợp chất bao gồm dữ liệu về cấu trúc được cho ở Hình 3.17 và Hình 3.18.

116

Ramnazin

Isoramnetin

;

Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2]

Scutelarein Woogonin (Scutelarin)

Baicalein Baicalin (R là gốc acid)

Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2]

117

Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn

xuất flavone và isoflavone tương tự được nghiên cứu từ mô hình QSSRMLR

Phương Pháp ARE,% Tính chất hóa lý và hoạt tính kháng ung thư pGI50 QSSRMLR Tham khảo [15]

tr = 0,970; R2

pr = 0,945; SE = 0,038

Mô hình QSSRMLR của fla-baicalein với R2

fla-baicalein = 0,01569 + 2,599 (fla-A3) – 1,607 (fla-A27)

920,448 927,250 0,734 Nhiệt chảy (Tm) ở 1 atm

901,978 938,937 3,936 Nhiệt độ tới hạn (Tc)

tr = 0,954 ; R2

pr = 0,876; SE = 0,042

Mô hình QSSRMLR của fla-baicalin với R2

fla-baicalin = 0,01421+ 0,685 (fla-A14) – 0,338 (fla-A29)

851,541 757,617 12,397 Nhiệt chảy (Tm) ở 1 atm

1050,039 952,636 10,225 Nhiệt độ tới hạn (Tc)

tr = 0,901; R2

pr = 0,838; SE = 0,079

Mô hình QSSRMLR của fla-isoramnetin với R2

fla-isoramnetin = 0,02726 + 1,094 (fla-A1) + 0,921 (fla-A16) + -1,019 (fla-A26)

736,333 812,173 9,338 Nhiệt chảy (Tm) ở 1 atm

919,084 1006,060 8,645 Nhiệt độ tới hạn (Tc)

tr = 0,890; R2

pr = 0,840; SE = 0,081

Mô hình QSSRMLR của fla-ramnazin với R2

fla-ramnazin = 0,02519+ 0,947 (fla-A10) – 0,884 (fla-A25) + 0,898 (fla-A28)

1080,891 1074,690 0,577 Nhiệt chảy (Tm) ở 1 atm

964,954 990,614 2,590 Nhiệt độ tới hạn (Tc)

tr = 0,919; R2

pr = 0,840; SE = 0,055

Mô hình QSSRMLR của fla-scutelarein với R2

fla-scutelarein = 0,02209 + 0,343 (fla-A6) + 0,617 (fla-A27)

983,841 1007,870 2,384 Nhiệt chảy (Tm) ở 1 atm

925,409 969,420 4,540 Nhiệt độ tới hạn (Tc)

tr = 0,888; R2

pr = 0,859; SE = 0,074

Mô hình QSSRMLR của fla-woogonin với R2

fla-woogonin = 0,015+ 0,989 (fla-A7) -0,00236 (fla-A21)

920,448 927,250 0,734 Nhiệt chảy (Tm) ở 1 atm

901,978 938,937 3,936 Nhiệt độ tới hạn (Tc)

118

Các hợp chất tự nhiên được xây dựng lại cấu trúc trên phần mềm

HyperChem. Tối ưu hóa cấu trúc phân tử bằng cơ học phân tử MM+ (mức gradient

0,05, thuật toán Polak- Ribiere). Tính toán các tham số điện tích nguyên tử bằng

hóa học lượng tử bán thực nghiệm SCF PM3 trong HyperChem. Tính chất hóa hóa

lý được xác định từ phương trình bán thực nghiệm từ ChemOffice [15].

Mô hình QSSRMLR được xây dựng tương tự như đã trình bày ở mục 3.2.4 kết

quả được cho ở Bảng 3.31, các mô hình hồi quy tuyến tính (QSSRMLR) đều có các

giá trị thống kê phù hợp.

Phân tích ANOVA một yếu tố chỉ ra rằng kết quả dự đoán tính chất hóa lý

của các dẫn xuất flavone và isoflavone từ mô hình QSSRMLR không khác các giá trị

các mô hình QSSRMLR nằm trong khoảng sai số của các phép đo thực nghiệm. Sự khác

nhau giữa các giá trị thực nghiệm và các giá trị dự đoán từ mô hình là không đáng kể. Xây

dựng mô hình QSSRMLR đã dự đoán thành công tính chất hóa lý của các hợp chất tự nhiên

có cấu trúc tương tự. Hoạt tính pGI50 của các hợp chất tự nhiên dự đoán từ mô hình

tính chất hóa lý tham khảo (Ftt = 0,004 < F0,05 = 4,149). Giá trị ARE, % nhận được từ

QSSRMLR, QESARMLR, QSDARMLR được cho ở Bảng 3.32.

Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR

Hợp chất QSSRMLR QESARMLR QSDARMLR

fla-baicalein 6,491 5,129 6,504

fla-baicalin 6,928 4,716 6,018

fla-isoramnetin 5,446 5,078 5,701

fla-ramnazin 5,872 5,175 5,416

fla-scutelarein 6,945 5,829 5,294

fla-woogonin 5,583 6,69 5,594

So sánh khả năng dự đoán hoạt tính kháng ung thư pGI50 của 3 mô hình

tuyến tính QSSRMLR, QSDARMLR và QESARMLR bằng phân tích ANOVA một yếu

tố. Sự khác nhau giữa 3 mô hình là không có ý nghĩa (F = 2,374 < F0,05 = 6,359).

Các mô hình QSSRMLR đã dự đoán thành công hoạt tính kháng ung thư của nhóm

hợp chất tự nhiên.

119

Bằng kỹ thuật phân tích hồi quy tuyến tính đa biến số, các mô hình QSSRMLR

(các phương trình từ 3.21 đến 3.26) được xây dựng dựa trên mối quan hệ cấu trúc

3D với nhau. Các tham số cấu trúc 3D bao gồm: LogP, ABSQ, ABSQon, Dipole;

MaxHp, MaxNeg, MaxQp, Ovality, Polarizability, SpcPolarizability, Surface,

Volume. Với các mô hình QSSRMLR xây dựng được, lần lượt thay thế giá trị nhiệt

độ nóng chảy của các hợp chất đã biết (biến độc lập x) ta dự báo được giá trị nhiệt

độ nóng chảy chưa biết của các hợp chất mục tiêu (biến phụ thuộc Y).

Các mô hình QSSRMLR (các phương trình từ 3.21 đến 3.26) của các hợp chất

flavonoid phân lập được sử dụng để dự đoán nhiệt độ nóng chảy của các hợp chất

phân lập Bảng 3.33. Nhiệt độ nóng chảy thực nghiệm được so sánh với giá trị dự

đoán với giá trị sai số trung bình MARE, % là 0,243 % cho thấy khả năng dự báo rất

tốt của các mô hình QSSRMLR.

Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của

các dẫn xuất flavonoid chiết xuất.

ARE, % Tm (oC) Hợp chất Thực nghiệm QSSRMLR

QSSRMLR 0,447 CSL1 256,500 257,646 0,033 POL1 327,500 327,607 0,418 ZZL1 249,500 248,456 0,167 ZZL2 112,500 112,688 0,075 AIL1 315,000 315,236 0,319 GML1 247,000 247,789

0,243 MARE, %

Với GML1 là daidzin, POL1 là luteolin, CSL1 là cynaroside, AIL1 là

quercetin, ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-

O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô

và gừng gió.

tr = 0,999; R2

pr = 0,999; MSE = 0,00081

Mô hình QSSRMLR của CSL1 với R2

CSL1 = - 0,019 + 1,681(POL1) - 1,377(ZZL1) + 0,450(ZZL2) (3.21)

120

tr = 0,999; R2

pr = 0,999; MSE = 0,0001030

Mô hình QSSRMLR của AIL1 với R2

AIL1 = 0,095 - 0,424(CSL1) + 1,059(POL1) + 0,244(ZZL2) (3.22)

tr = 0,999; R2

pr = 0,999; MSE = 0,000906

Mô hình QSSRMLR của GML1 với R2

GML1 = 0,051 + 0,522(CSL1)+0,412(POL1) - 0,187(ZZL2) (3.23)

tr = 0,999; R2

pr = 0,999; MSE = 0,00010

Mô hình QSSRMLR của POL1 với R2

POL1 = 0,007 + 0,429(CSL1) + 1,120(ZZL1) - 0,329(ZZL2) (3.24)

tr = 0,999; R2

pr = 0,999; MSE = 0,00014

Mô hình QSSRMLR của ZZL1 với R2

ZZL1 = - 0,002 - 0,280(CSL1) + 0,812(POL1) + 0,218(ZZL2) (3.25)

tr = 0,999; R2

pr = 0,999; MSE = 0,0005345

Mô hình QSSRMLR của ZZL2 với R2

ZZL2 = - 1,332 - 7,023(CSL1) + 11,524(POL1) - 5,900(AIL1)

3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1)

Hoạt tính pGI50 của hợp chất ZZL1 và ZZL2 được dự đoán từ các mô hình

QSARMLR (3.16), phương trình 3.16 và QSARANN(1), được thể hiện trong Bảng 3.34.

So sánh khả năng dự báo của các mô hình QSARMLR (3.16) và QSARANN (1) qua giá

trị phần trăm sai số ARE,% (Bảng 3.34). Một lần nữa chúng tôi khẳng định rằng các

mô hình QSARMLR (3.16) và QSARANN (1) xây dựng theo mục 3.2.5 có khả năng dự

báo rất tốt hoạt tính kháng ung thư của các hợp chất tự nhiên.

Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các

mô hình QSARMLR (3.16) và QSARANN(1)

ARE,% pGI50,pr Hợp chất pGI50,exp QSARMLR (3.16) QSARANN(1) QSARMLR QSARANN(1)

(3.17) ZZL1 4,291 4,136 4,251 3,612 0,932

ZZL2 4,123 4,017 4,109 2,571 0,340

Trong công trình này, chúng tôi lựa chọn hợp chất phân lập là ZZL1, ZZL2

với các vị trí còn trống C6, C2’ và C3’ như là một hợp chất mẫu để thiết kế 10 hợp

chất mới, các vị trí C6, C2’ và C3’ được gắn các nhóm thế mới. Hoạt tính sinh học

pGI50 của các hợp chất mới thiết kế được dự đoán bằng mô hình QSARANN(1), được

đưa ra trong Bảng 3.35.

121

QSARANN(1

Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình

Hợp chất mới Phương ppháp C6 C2’ C3’ pGI50

ZZL1 H H H Công trình này 4,291

flav-1(n) H H 5,781 CH3 QSARANN(1)

flav-2(n) H 6,155 CH3CO- OCH3 QSARANN(1)

flav-3(n) H 6,158 CH3CO- OCH3 QSARANN(1)

flav-4(n) H 6,488 CH3 OCH3 QSARANN(1)

flav-5(n) H 6,538 CH3 OCH3 QSARANN(1)

Hợp chất mới Phương pháp C6 C2’ C3’ pGI50

ZZL2 H H H 4,123 Công trình này

flav-6(n) H H 4,231 CH3 QSARANN(1)

flav-7(n) H 4,634 CH3 OCH3 QSARANN(1)

4,639 flav-8(n) H QSARANN(1) CH3CO- OCH3

H 5,238 flav-9(n) QSARANN(1) CH3CO- OCH3

5,424 flav-10(n) H QSARANN(1) CH3 OCH3

Ký hiệu (n) là chất mới; ZZL1 là kaempferol-3-O-methylether và ZZL2 là

kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió.

a) b)

Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2

Kết quả dự đoán giá trị pGI50 của các hợp chất mới được chuyển đổi về giá

trị GI50 (µM) và so sánh với giá trị thực nghiệm của ZZL1, ZZL2 xem Hình 3.19.

Hoạt tính GI50 (µM) của 10 hợp chất mới bằng cách gắn nhóm thế vào các vị trí C6,

122

C2’ và C3’ của ZZL1 và ZZL2 cao hơn hợp chất mẫu tương ứng. Từ đây, các hợp

chất mới thiết kế hứa hẹn trong tổng hợp các dược phẩm mới từ hợp chất tự nhiên.

3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN

Sau khi tách hai chất flavonoid luteolin và daidzin, hoạt tính sinh học pGI50

đã được tiến hành để kiểm tra độc tính in vitro đối với tế bào Hela trong phòng thí

nghiệm sinh học phân tử, trường đại học khoa học tự nhiên, TP. HCM.

Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập

luteolin và daidzin từ các mô hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN

ARE.% Hợp chất pGI50.exp pGI50,pr

M1 M2 M3 M1 M2 M3

luteolin 4,755 4,634 4,715 4,739 2,545 0,841 0,336

daidzin 4,723 4,671 4,729 4,692 1,101 0,127 0,656

(Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR; M3 là mô

a)

b)

hình QSARPCA-ANN).

Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a)

POL1; b) GML1

Các hoạt tính sinh học pGI50 của các chất luteolin và daidzin tính toán từ các

mô hình QSARMLR (3.17) phương trình 3.17, QSARPCR và QSARPCA-ANN được trình

bày trong Bảng 3.3 . Trong nghiên cứu này, chúng tôi chọn luteolin với các vị trí

trống C6, C2' và C3' làm hợp chất mẫu để thiết kế 5 hợp chất mới khác nhau. Các vị

trí C6, C2' và C3' được gắn các nhóm thế mới.

123

Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô

hình QSARPCA-ANN )

Phương pháp Flavonoid C6 C2’ C3’ pGI50

H H H 4.755 Công trình này POL1

H flav-1(n) NO2 5,781 QSARPCA-ANN

flav-2(n) NO2 6,155 QSARPCA-ANN

H flav-3(n) H CH3CO- H CH3CO- NO2 6,158 QSARPCA-ANN

H flav-4(n) NO2 NO2 6,488 QSARPCA-ANN

H flav-5(n) NO2 NO2 6,538 QSARPCA-ANN

Phương pháp Flavonoid C6 C2’ C3’ pGI50

H H H 4.723 Công trình này GML1

H H flav-6(n) NO2 5,238 QSARPCA-ANN

H flav-7(n) 5,413 QSARPCA-ANN

HO- flav-8(n) NO2 H CH3CO- H 5,987 QSARPCA-ANN

H H flav-9(n) NO2 6,176 QSARPCA-ANN

HO- H flav-10(n) NO2 6,376 QSARPCA-ANN

Với (n) là chất mới, GML1 là daidzin, POL1 là luteolin phân lập từ đậu

nành, tía tô.

Hoạt tính sinh học pGI50 của flavonoid mới thiết kế đã được dự đoán bằng

cách sử dụng mô hình QSARPCA-ANN như trong Bảng 3.37, Hình 3.20. Kết quả dự

đoán hoạt tính sinh học pGI50 đối với các chất mới được so sánh với hoạt tính thử

nghiệm của POL1 và GML1, như được mô tả trong Hình 3.20. Hoạt tính kháng ung

thư của năm hợp chất mới được thiết kế bằng cách gắn nhóm thế vào các vị trí C6,

C2' và C3 của luteolin mạnh hơn hoạt tính của POL1 và GML1. Các hợp chất mới

được thiết kế nhằm tạo ra các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên

có hoạt tính sinh học được cải thiện.

3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2)

Sau khi phân lập hai flavonoid cynarosid và quercetin, chúng tôi tiến hành

kiểm tra độc tính in vitro đối với tế bào Hela của chúng trong phòng thí nghiệm sinh

học phân tử, Trường Đại Học Khoa Học Tự Nhiên, TP. Hồ Chí Minh. Hoạt tính

124

pGI50 của hai flavonoid này cũng được dự đoán từ các mô hình QSARMLR (3.19),

QSARPLS và QSARANN (2), như trình bày trong Bảng 3.38.

Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR

(3.19), QSARPLS (3.20) và QSARANN (2)

Hợp chất pGI50,exp

CSL1 AIL1 4,977 4,859 pGI50,pred M2 4,912 4,675 M1 5,191 4,681 M3 5,017 4,740 M1 4,300 3,663 ARE, % M2 1,306 3,787 M3 0,804 2,449

Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS (3.20);

M3 là mô hình QSARANN(2).

Trong nghiên cứu này, chúng tôi chọn quercetin flavonoid với các vị trí C6

và C3' còn trống làm hợp chất mẫu để thiết kế năm hợp chất mới. Các nhóm thế

được gắn vào hai vị trí trống C6 và C3’ , như thể hiện trong Bảng 3.38.

Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn

nhóm thế vào vị trí C6, C3’ của quercetin, dự đoán từ mô hình QSARANN(2)

Phương pháp Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’

pGI50 4,859 Công trình này AIL1 -H -H

Fla-1(n) 5,382 M3 -OH -OCH2CONHCH3

Fla-2(n) 5,382 M3 -H -OCH2CONHC6H4F

Fla-3(n) -OH -OCH2CONHCH3 5,385 M3

Fla-4(n) -OH 5,385 M3 -OCH2(CH3)C=NOH

Fla-5(n) 5,385 M3 -OCH2CONHC6H4OCH3 -H

Phương pháp Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’

CSL1 H pGI50 4,977 Công trình này H

flav-6(n) 5,537 M3 -OH -OCH2CONHCH3

flav-7(n) -OH -OCH2CONHCH3 5,612 M3

flav-8(n) -H 5,613 M3 -OCH2CONHC6H4F

flav-9(n) 5,635 M3 -OCH2CONHC6H4OCH3 -H

-OH 5,665 M3 flav-10(n) -OCH2(CH3)C=NOH

125

Với (n) là chất mới; M3 là mô hình QSARANN(2); CSL1 là cynaroside, AIL1

là quercetin phân lập từ actiso, xa kê.

Các hợp chất được thiết kế mới cũng dự đoán với các hoạt tính sinh học

pGI50 sử dụng mô hình QSARANN (2). Sau đó, các hoạt tính dự báo pGI50 đã được

chuyển về dạng ban đầu GI50 (μM), như Bảng 3.39.

Các kết quả dự đoán pGI50 đối với các chất mới so sánh với hoạt tính thử

nghiệm của hợp chất AIL1 và CSL1 mẫu, trong (Hình 3.21). Do đó, các hợp chất

mới với nhóm thế ở vị trí C6 và C3' trong phân tử quercetin cho thấy hoạt tính mạnh

hơn GI50 (μM) so với mẫu. Ở đây, các hợp chất được thiết kế mới sẽ hứa hẹn đưa ra

a)

b)

một kế hoạch thiết kế cho các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên.

Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu

a) AIL1; b) CSL1

126

KẾT LUẬN VÀ KIẾN NGHỊ

KẾT LUẬN

Luận án đã đạt được các mục tiêu đề ra:

1) tính toán và sàng lọc được các tham số cấu trúc phân tử ảnh hưởng đến

hoạt tính kháng ung thư bao gồm: các tham số điện tích (O1, O11, C3, C4, C6 và C7),

các tham số độ dịch chuyển hóa học (O1, O11, C2, C3, C6, C7 và C2’); các tham số 2D

và 3D (xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa, LogP; MaxQp,

SdO, ka3, LogP, Ovality và SdssC)

2) Đã xây dựng được các mô hình QSAR có khả năng dự báo rất tốt hoạt tính

kháng ung thư gồm: mô hình QESARMLR, QESARANN, QSDARMLR, QSDARANN,

QSSRMLR, QSARMLR (3.16), QSARMLR (3.17), QSARPCA-ANN, QSARMLR (3.19),

QSARPLS (3.20), QSARANN(1), QSARANN(2).

3) Đã phân lập và sàng lọc được các dẫn xuất flavonoid có nguồn gốc tự

nhiên có hoạt tính kháng ung thư gồm 6 hợp chất daidzin, luteolin, cynaroside,

quercetin, kaempferol-3-O-methylether và kaempferol-3-O-(2,4-O-diacetyl-alpha-l-

rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió..

4) Đã thử nghiệm in vitro hoạt tính kháng ung thư của các dẫn xuất flavonoid

phân lập.

5) Đã đánh giá hoạt tính kháng ung thư, tính chất hóa lý, của các dẫn xuất

flavonoid của các dẫn flavonoid phân lập.

6) Đã nghiên cứu, thiết kế các dược chất mới bằng cách gắn các nhóm thế

quan trọng vào các vị trí phân tử ảnh hưởng lớn đến hoạt tính ung thư gồm các vị trí

thế - C3, C6 và C7 và C3’ và các nhóm -OCH2CONHC6H4F;

- OCH2CONHC6H4OCH3; -OCH2(CH3)C=NOH; -OCH2CONHCH3;

OCH2CH3C=NOH; CH3CO- ; -CH3 ; -OCH3; -NO2; -OH.

7) Đã sàng lọc được các hợp chất mới có hoạt tính kháng ung thư cao hơn

hợp chất ban đầu.

127

KIẾN NGHỊ

Những kết quả đạt được trong luận án đã mở ra những định hướng nghiên

cứu triển vọng có thể tiếp cận trong thời gian tới: 1) Mở rộng các kỹ thuật xây dựng

mô hình QSAR. 2) Tiến hành tổng hợp các dẫn xuất flavonoid mới

128

DANH MỤC CÔNG TRÌNH

1. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van

Trung, Hoang Thi Kim Dung, Pham Van Tat (2015), "Prediction of

anticancer activities of luteolin flavonoid daidzin in leaf of plants Perilla

ocymoides L. flavonoid Glucine max L. using 2D, 3D descriptors", Viet Nam

Journal of Chemistry, 6e4(53), pp, 232-239.

2. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Vo Thanh Cong, Phung Van

Trung, Hoang Thi Kim Dung, Tran Duong, Pham Van Tat (2016),

"Anticancer agents of kaempferol-3-O-methylether flavonoid kaempferol-3-

O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) in leaf of plants Zingiber

zerumbet Sm. using 2D, 3D descriptors", Viet Nam Journal of Chemistry,

54(6), pp, 710-718.

3. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van

Trung, Nguyen Minh Quang, Hoang Thi Kim Dung, Pham Van Tat, (2016),

"Prediction of anticancer activities of cynaroside flavonoid quercetin in leaf

of plants Cynara scolymus L. flavonoid Artocarpus incisa L. using structure–

activity relationship", Cogent Chemistry Taylor & Francis 2(1), pp, 1-12.

4. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần

Dương, Phạm Văn Tất (2017), "Nghiên cứu hoạt tính kháng ung thư của

kaempferol-1, daidzin từ Zingiber zerumbet Sm. và Glucine max L. sử dụng

các tham số mô tả phân tử 2D và 3D", Tạp Chí Khoa học và Công nghệ

Trường Đại học Khoa Học Huế: Khoa học Tự nhiên, pp. 1-10. (Đã có giấy

nhận đăng)

5. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần

Dương, Phạm Văn Tất (2017), " Dự báo hoạt tính kháng ung thư cổ tử cung

của các hợp chất flavonoid phân lập từ Cynara scolymus L. Và Artocarpus

incisa L. Sử dụng mô hình QSAR 2D và 3D ", Tạp chí khoa học đại học

Huế, 126 (S 1D), pp. 1-9.

129

6. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung,

Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "In silico Modelling of

2D, 3D Molecular Descriptors for Prediction Of Anticancer Activities Of

Luteolin And Daidzin From Plants Perilla ocymoides L and Glucine max L",

Organic & Medicinal Chemistry International Journal (OMCIJ), pp. 1-13.

ISSN: 2474-7610.

7. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung,

Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "Prediction Of

Anticancer Activities Of Kaempferol-3-O-Methylether And Kaempferol-3-

O-(2,4-O-Diacetyl-Alpha-L-Rhamnopyranoside) Isolating From Plant

15O-NMR Simulation Spectra Data", Organic & Medicinal Chemistry

Rhizome Zingiber Zerumbet Sm using QSDAR Models from 13C-NMR and

International Journal (OMCIJ), pp. 1-15. ISSN: 2474-7610.

8. Thuy, B.T.P., Chau, H.V., Dai, T.T., Nhung, N.T.A., Trung, P.V., Dung,

H.T.K., Duong, T., Tat, P.V. (2018), "Appreciation of cytotoxic activity on

hela cell of flavonoid derivatives using multiple linear regression and

artificial neural network", The 4th International Integated (Web & offline)

Conference & Concert on Convergence (IICCC2018) (ISSN 2384-4418), 4,

pp. 323-332.

130

TÀI LIỆU THAM KHẢO

1. Hồng, N.T. (2007), Các phương pháp phổ trong hóa hữu cơ, NXB Khoa học

và kỹ thuật,Hà Nội

2. Lợi, Đ.T. (2009), Những cây thuốc và vị thuốc Việt Nam,Hà Nội, NXB Khoa

học kỹ thuật.

3. Phụng, N.K.P. (2007), Phương pháp cô lập hợp chất hữu cơ ĐHQG-HCM

4. Phụng, N.K.P. (2005), Phổ NMR sử dụng trong phân tích hữu cơ, NXB ĐH

Quốc gia TP. HCM.

5. 6543Wang, D., Zhang, M., Li, Z., Song, C., Fu, M., Li, J., Chen, X. (2017),

"System impairment compensation in coherent optical communications by

using a bio-inspired detector based on artificial neural network and genetic

algorithm", Optics Communications, 399, pp. 1-12.

6. Avendaño, C.,Menéndez, J.C. (2015), Chapter 1 - General Aspects of

Cancer Chemotherapy, in Medicinal Chemistry of Anticancer Drugs (Second

Edition)Elsevier, Boston, pp. 1-22.

7. Balaga, H., Gupta, N.,Vishwakarma, D.N. (2015), "GA trained parallel

hidden layered ANN based differential protection of three phase power

transformer", International Journal of Electrical Power & Energy Systems,

67, pp. 286-297.

8. Barbour, L.J. (2017), 2.03 - Single-Crystal X-ray Diffraction A2 - Atwood,

Jerry L, in Comprehensive Supramolecular Chemistry IIElsevier, Oxford,

pp. 23-43.

9. Bastien, P., Vinzi, V.E.,Tenenhaus, M. (2005), "PLS generalised linear

regression", Computational Statistics & Data Analysis, 48(1), pp. 17-46.

10. Beheshti, A., Pourbasheer, E., Nekoei, M., Vahdani, S. (2016), "QSAR

modeling of antimalarial activity of urea derivatives using genetic algorithm–

multiple linear regressions", Journal of Saudi Chemical Society, 20(3), pp.

282-290.

131

11. Bharathi, S., Devasena, T., Arivarasan, A., Pachaiappan, R. (2016),

"Extraction and isolation of flavonoid quercetin from the leaves of trigonella

foenum-graecum and their anti-oxidant activity", International Journal of

Pharmacy and Pharmaceutical Sciences, 8(6).

12. Birt, D.F., Hendrich, S.,Wang, W. (2001), "Dietary agents in cancer

prevention: flavonoids and isoflavonoids", Pharmacology & Therapeutics,

90(2–3), pp. 157-177.

13. BMDPnewsystem2.0 (2003), Statistical Solutions Ltd.,USA.

14. Bodor, N.,Huang, M.J. (1992), "An extended version of a novel method for

the estimation of partition coefficients", J Pharm Sci, 81(3), pp. 272-281.

15. CambridgeSoftCorporation (2008), CS Chem3D Ultra,USA.

16. Cao, W., Wang, X., Ming, Z., Gao, J. (2017), "A review on neural networks

with random weights", Neurocomputing, pp. 1-50.

17. Chen, B., Zhang, T., Bond, T., Gan, Y. (2015), "Development of quantitative

structure activity relationship (QSAR) model for disinfection byproduct

(DBP) research: A review of methods and resources", Journal of Hazardous

Materials, 299, pp. 260-279.

18. Chen, I.L., Chen, J.Y., Shieh, P.C., Chen, J.J., Lee, C.H., Juang, S.H., Wang,

T.C. (2008), "Synthesis and antiproliferative evaluation of amide-containing

flavone and isoflavone derivatives", Bioorg Med Chem, 16(16), pp. 7639-

7645.

19. Christensen, L.P.,Christensen, K.B. (2014), Chapter 23 - The Role of Direct

and Indirect Polyphenolic Antioxidants in Protection Against Oxidative

Stress, in Polyphenols in Human Health and DiseaseAcademic Press, San

Diego, pp. 289-309.

20. Corcoran, M.P., McKay, D.L.,Blumberg, J.B. (2012), "Flavonoid basics:

chemistry, sources, mechanisms of action, and safety", J Nutr Gerontol

Geriatr, 31(3), pp. 176-189.

132

21. De Gregorio, M.,Giordano, M. (2017), "Background estimation by

weightless neural networks", Pattern Recognition Letters, 96, pp. 55-65.

22. Devillers, J. (1996), 1 - Strengths and Weaknesses of the Backpropagation

Neural Network in QSAR and QSPR Studies, in Neural Networks in QSAR

and Drug DesignAcademic Press, London, pp. 1-46.

23. El Zoghbi, M., Salameh, P., Stücker, I., Paris, C., Pairon, J.C., Gislard, A.,

Siemiatycki, J., Bonneterre, V., Clin, B., Brochard, P., Delva, F., Lacourt, A.

(2017), "Phenotypes of lung cancer and statistical interactions between

tobacco smoking and occupational exposure to asbestos and crystalline silica

from a large case-only study: The CaProMat study", Lung Cancer, 112, pp.

140-155.

24. Farid, M.M., Hussein, S.R., Ibrahim, L.F., El Desouky, M.A., Elsayed, A.M.,

El Oqlah, A.A., Saker, M.M. (2015), "Cytotoxic activity and phytochemical

analysis of Arum palaestinum Boiss", Asian Pacific Journal of Tropical

Biomedicine, 5(11), pp. 944-947.

25. Feliu, M.,Keiji, M. (1995), "IMOMM: A new integrated ab initio +

molecular mechanics geometry optimization scheme of equilibrium

structures and transition states", Journal of Computational Chemistry, 16(9),

pp. 1170–1179.

26. Fucic, A., Guszak, V.,Mantovani, A. (2017), "Transplacental exposure to

environmental carcinogens: Association with childhood cancer risks and the

role of modulating factors", Reproductive Toxicology, 72, pp. 182-190.

27. Galbas, M., Porzucek, F., Wozniak, A., Slomski, R., Selwet, M. (2013),

"Isolation of low-molecular albumins of 2S fraction from soybean (Glycine

max (L.) Merrill)", Acta Biochim Pol, 60(1), pp. 107-110.

28. Gasteiger, J.,Marsili, M. (1980), "Iterative partial equalization of orbital

electronegativity—a rapid access to atomic charges", Tetrahedron, 36(22),

pp. 3219-3228.

133

29. Ghahari, S., Alinezhad, H., Nematzadeh, G.A., Tajbakhsh, M., Baharfar, R.

(2017), "Chemical Composition, Antioxidant and Biological Activities of the

Essential Oil and Extract of the Seeds of Glycine max (Soybean) from North

Iran", Curr Microbiol, 74(4), pp. 522-531.

30. Ghamali, M., Chtita, S., Ousaa, A., Elidrissi, B., Bouachrine, M., Lakhlifi, T.

(2017), "QSAR analysis of the toxicity of phenols and thiophenols using

MLR and ANN", Journal of Taibah University for Science, 11(1), pp. 1-10.

31. Giau, L.H., Nha To, N.N., Thi, N.D.T., Quang That, T.Q., Phung, N.K.P.,

Nguyen, P.T.K., Duus, F. (2015), "Biological test against breast

adenocarcinoma cells (MCF-7) of acylated products of 3-methyl-4-

thiorhodanine", Journal of Science & Technology Development, 8(1), pp.

63-69.

32. Grce, M. (2009), "Primary and secondary prevention of cervical cancer",

Expert Rev Mol Diagn, 9(8), pp. 851-857.

33. Griffon, G., Merlin, J.L.,Marchal, C. (1995), "Comparison of sulforhodamine

B, tetrazolium and clonogenic assays for in vitro radiosensitivity testing in

human ovarian cell lines", Anticancer Drugs, 6(1), pp. 115-123.

34. Gründer, Y.,Lucas, C.A. (2016), "Surface X-ray diffraction studies of single

crystal electrocatalysts", Nano Energy, 29, pp. 378-393.

35. Hanh, N.T.M., Phung, N.K.P.,Phuong, Q.N.D. (2017), "Studying on

Tyrosinase Inhibition Activity of Some Vietnamese Folk Plants Aims to Use

in Skin-Whitening Cosmetics", American Journal of Plant Sciences, 8(6).

36. Harry, W. (1947), "Structural determination of paraffin boiling points",

Journal of the American Chemical Society, 69(1), pp. 17-20.

37. Hossain, M.A.,Mizanur, R.S.M. (2015), "Isolation and characterisation of

flavonoids from the leaves of medicinal plant Orthosiphon stamineus",

Arabian Journal of Chemistry, 8(2), pp. 218-221.

38. Hypercube, I. (2002), HyperChem computational chemistry, Hypercube, Inc.

134

39. Hypercube.Inc. (2008), HyperChem Release 8.03 for Windows, Gainesville,

Florida, USA.

40. INFormv2.0 (2000), Intelligentsys Ltd.,UK. .

41. Jalal, T.K., Ahmed, I.A., Mikail, M., Momand, L., Draman, S., Isa, M.L.,

Abdull Rasad, M.S., Nor Omar, M., Ibrahim, M., Abdul Wahab, R. (2015),

"Evaluation of antioxidant, total phenol and flavonoid content and

antimicrobial activities of Artocarpus altilis (breadfruit) of underutilized

tropical fruit extracts", Appl Biochem Biotechnol, 175(7), pp. 3231-3243.

42. Jang, D.S., Han, A.R., Park, G., Jhon, G.J., Seo, E.K. (2004), "Flavonoids

and aromatic compounds from the rhizomes of Zingiber zerumbet", Arch

Pharm Res, 27(4), pp. 386-389.

43. Jung, S.K.,McDonald, K. (2011), "Visual gene developer: a fully

programmable bioinformatics software for synthetic gene optimization",

BMC Bioinformatics, 12, pp. 340.

44. Kalailingam, P., Balasubramanian, K., Kannaian, B., Mohammed, A.K.N.,

Meenakshisundram, K., Tamilmani, E., R., K. (2013), "Isolation and

quantification of flavonoids from ethanol extract of Costus igneus rhizome

(CiREE) and impact of CiREE on hypoglycaemic, electron microscopic

studies of pancreas in streptozotocin (STZ)-induced diabetic rats",

Biomedicine & Preventive Nutrition, 3(3), pp. 285-297.

45. Kamdem, W.A.F., Coombes, P.H., Mulholland, D.A., Nkengfack, A.E.,

Fomum, Z.T. (2006), "Flavones and isoflavones from the west African

Fabaceae Erythrina vogelii", Phytochemistry, 67(5), pp. 459-463.

46. Keepers, Y.P., Pizao , P.E., Peters, G.J., Van Ark-Otte, J., Winograd, B.,

Pinedo, H.M. (1991), "Comparison of the sulforhodamine B protein and

tetrazolium (MTT) assays for in vitro chemosensitivity testing", European

Journal of Cancer and Clinical Oncology, 27(7), pp. 897-900.

47. Keyser, E.A., Staat, B.C., Fausett, M.B., Shields, A.D. (2012), "Pregnancy-

Associated Breast Cancer", Rev Obstet Gynecol, 5(2), pp. 94-99.

135

48. Kier, L., Hall, H.,Lowell (1991), The Molecular Connectivity Chi Indices

and Kappa Shape Indices in Structure-Property Modeling. Vol. 2. VCH

publishers New York

49. Kier, L., Hall, H.,Lowell (1986), Molecular connectivity in structure-activity

analysis Vol. 10. Wiley & Sons, Inc.

50. Konar,Amit (2005), Computational Intelligence, Springer.

51. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 2 Statistical Methods in

QSAR/QSPR, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in

Molecular Science, pp. 37-59.

52. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 1 QSAR/QSPR

Methods, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in

Molecular Science, pp. 61-103.

53. Lapčík, O., Kle dus, B., Kokoška, L., Davidová, M., Afandi, K., Kubáň, V.,

Hampl, R. (2005), "Identification of isoflavones in Acca sellowiana and two

Psidium species (Myrtaceae)", Biochemical Systematics and Ecology,

33(10), pp. 983-992.

54. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line

concentration of flavonoids in Brassica oleracea by capillary electrophoresis

using large volume sample stacking", Food Chemistry, 133(1), pp. 205-211.

55. Li-ping, Q., Guo-rong, F., Jin-yong, P., He-ming, M. (2007), "Isolation of six

isoflavones from Semen sojae praeparatum by preparative HPLC",

Fitoterapia, 78(3), pp. 200-204.

56. López-Molina, D., Heering, H.A., Smulevich, G., Tudela, J., Thorneley,

R.N.F., Garcı́a-Cánovas, F., Rodrı́guez-López, J.N. (2003), "Purification and characterization of a new cationic peroxidase from fresh flowers of Cynara

scolymus L", Journal of Inorganic Biochemistry, 94(3), pp. 243-254.

57. Lopez, C.S., Krauskopf, E., Villota, C.E., Burzio, L.O., Villegas, J.E. (2017),

"Cervical cancer, human papillomavirus and vaccines: assessment of the

136

information retrieved from general knowledge websites in Chile", Public

Health, 148, pp. 19-24.

58. Maresso, K.C.,Hawk, E. (2016), "Cancer Prevention Recommendations:

Impact of Adherence", Seminars in Oncology Nursing, 32(3), pp. 306-313.

59. Markham, K.R. (1975), Chapter 1 Isolation Techniques for Flavonoids, in

The FlavonoidsSpringer US, pp. 1-44.

60. Martin, J.F., Paul, A.B.,Martin, K. (1990), "A combined quantum

mechanical and molecular mechanical potential for molecular dynamics

simulations", Journal of Computational Chemistry, 11(6), pp. 700–733.

61. Molugaram, K.,Rao, G.S. (2017), Chapter 11 - ANOVA (Analysis of

Variance), in Statistical Techniques for Transportation

EngineeringButterworth-Heinemann, pp. 451-462.

62. Naik, P.P., Das, D.N., Panda, P.K., Mukhopadhyay, S., Sinha, N., Praharaj,

P.P., Agarwal, R., Bhutia, S.K. (2016), "Implications of cancer stem cells in

developing therapeutic resistance in oral cancer", Oral Oncology, 62, pp.

122-135.

63. P., B., V.V., S.,M., T. (2005), "PLS Generalised Regression. Computational

Statistics and Data Analysis" 48, pp. 17-46.

64. Pauwels, B., Korst, A.E., de Pooter, C.M., Pattyn, G.G., Lambrechts, H.A.,

Baay, M.F., Lardon, F., Vermorken, J.B. (2003), "Comparison of the

sulforhodamine B assay and the clonogenic assay for in vitro chemoradiation

studies", Cancer Chemother Pharmacol, 51(3), pp. 221-226.

65. Perez, R.P., Godwin, A.K., Handel, L.M., Hamilton, T.C. (1993), "A

comparison of clonogenic, microtetrazolium and sulforhodamine B assays

for determination of cisplatin cytotoxicity in human ovarian carcinoma cell

lines", Eur J Cancer, 29A(3), pp. 395-399.

66. QSARIS1.0 (2001), Statistical Solutions Ltd.,USA.

137

67. Raffa, D., Maggio, B., Raimondi, M.V., Plescia, F., Daidone, G. (2017),

"Recent discoveries of anticancer flavonoids", European Journal of

Medicinal Chemistry.

68. Rawat, P., Saroj, L.M., Kumar, A., Singh, T.D., Tewari, S.K., Pal, M.

(2016), "Phytochemicals and Cytotoxicity of Launaea procumbens on

Human Cancer Cell Lines", Pharmacogn Mag, 12(Suppl 4), pp. S431-S435.

69. Raza, A.,Zhong, M. (2017), "Lane-based short-term urban traffic forecasting

with GA designed ANN and LWR models", Transportation Research

Procedia, 25, pp. 1430-1443.

70. Rebecca, L.S., Kimberly, D.M.,Ahmedin, J. (2015), "Cancer Statistic, 2015",

CA: A Cancer journal for Clinicians, 65(1), pp. 5-29.

71. Rebecca, S., Deepa, N.,Ahmedin, J. (2012), "Cancer statistics, 2012", CA: A

Cancer journal for Clinicians, 62(1), pp. 10-29.

72. Roy, K.,Ambure, P. (2016), "The “double cross-validation” software tool for

MLR QSAR model development", Chemometrics and Intelligent Laboratory

Systems, 159, pp. 108-126.

73. Roy, K., Kar, S.,Das, R.N. (2015), Chapter 7 - Validation of QSAR Models,

in Understanding the Basics of QSAR for Applications in Pharmaceutical

Sciences and Risk AssessmentAcademic Press, Boston, pp. 231-289.

74. Sak, K. (2014), "Cytotoxicity of dietary flavonoids on different human

cancer types", Pharmacogn Rev, 8(16), pp. 122-146.

75. Sarawek, S., Feistel, B., Pischel, I., Butterweck, V. (2008), "Flavonoids of

Cynara scolymus possess potent xanthinoxidase inhibitory activity in vitro

but are devoid of hypouricemic effects in rats after oral application", Planta

Med, 74(3), pp. 221-227.

76. Sarkhosh, M., Khorshidi, N., Niazi, A., Leardi, R. (2014), "Application of

genetic algorithms for pixel selection in multivariate image analysis for a

QSAR study of trypanocidal activity for quinone compounds and design new

138

quinone compounds", Chemometrics and Intelligent Laboratory Systems,

139(Supplement C), pp. 168-174.

77. Sarosh, A.,Yun-Feng, D. (2016), "The GA-ANN expert system for mass-

model classification of TSTO surrogates", Aerospace Science and

Technology, 48, pp. 146-157.

78. Saxena, V.K.,Aprajita, G. (2008), "Isolation and study of the flavone

glycoside; luteolin-7- O-β-d-glucopyranoside from the seeds of the capparis

decidua (forsk)", International journal chemical sciences, 6(1), pp. 7-10.

79. Shan, Y. (2016), Chapter 4 - Isolation and Structural Identification of

Flavonoids From Citrus, in Comprehensive Utilization of Citrus By-

ProductsAcademic Press, pp. 59-64.

80. Si, Y.L., Jin, C.C., Li, Q.Y.S., Kang, C.Z. (2008), "QSAR, action mechanism

and molecular design of flavone and isoflavone derivatives with cytotoxicity

against HeLa", European Journal of Medicinal Chemistry, 43, pp. 2159-

2170.

81. Singh, M., Kaur, M.,Silakari, O. (2014), "Flavones: An important scaffold

for medicinal chemistry", European Journal of Medicinal Chemistry, 84, pp.

206-239.

82. Singh, S.K., Srivastava, K., Banerjee, R., Prasad, J. (2017), "Syntheses and

single crystal X-ray diffraction studies of hydroxynicotinic acid based

complexes involving supramolecular interactions", Polyhedron, 133, pp.

222-230.

83. Smalheiser, N.R. (2017), Chapter 11 - ANOVA, in Data LiteracyAcademic

Press, pp. 149-155.

84. Snedecor, G.,Cochran, W. (1967), Statistical methods, Oxford and IBH, New

Delhi.

85. Steppan, D.D., Werner, J.,Yeater, P.R. (2000), Essential Regression and

Experimental Design for Chemists and Engineers, USA.

139

86. Tat, P.V. (2009), Development of Quantitative Structure-Activity

Relationships (QSARs) and Quantitative Structure-Property Relationships

(QSPRs),Hanoi, NXB Natural Science and Technology.

87. Tat, P.V. (2009), "Prediction of thermodynamic properties of similar organic

compounds using artificial neural network", Vietnamese Journal of

Chemistry and Application, 4, pp. 611-616.

88. Tat, P.V. (2009 ), "Models QSAR of the group 6-aminoquinolone: new

anti-HIV agents", Vietnamese Journal of Chemistry and Application, 15, pp.

30-34

89. Tat, P.V. (2009), "QSDAR model: Quantitative Spectrum Data 13C-NMR

and 15O-NMR Activity Relationships (QSDAR) of a set of anti-cancer 3-

aminoflavonoid", Vietnamese Journal of Chemistry and Application, 14, pp.

43-46.

90. Tat, P.V. (2017), Development of new anticancer agents from Leaf of plants

in Viet Nam, LAP Lambert Academic Publishing. 01-80 trang.

91. Thavamani, B.S., Mathew, M.,Dhanabal, S.P. (2013), "In vitro cytotoxic

activity of menispermaceae plants against HeLa cell line", Anc Sci Life,

33(2), pp. 81-84.

92. Thuy, B.T.P.,Tat, P.V. (2012), "Development of QSDAR models for

anticancer flavone and isoflavone analogues Using 13C-NMR and 15O-

NMR", Viet Nam Journal of Chemistry, 50(5A), pp. 203-208.

93. Tomasz, P., Jerzy, L.,Mark, T.D.C. (2010), Recent Advances in QSAR

Studies Methods and Applications, springer.

94. Tong, J., Liu, S., Zhou, P., Wu, B., Li, Z. (2008), "A novel descriptor of

amino acids and its application in peptide QSAR", Journal of Theoretical

Biology, 253(1), pp. 90-97.

95. Torkashvand, A.M., Ahmadi, A.,Nikravesh, N.L. (2017), "Prediction of

kiwifruit firmness using fruit mineral nutrient concentration by artificial

140

neural network (ANN) and multiple linear regressions (MLR)", Journal of

Integrative Agriculture, 16(7), pp. 1634-1644.

96. Ventriglia, J., Paciolla, I., Pisano, C., Cecere, S.C., Di Napoli, M., Tambaro,

R., Califano, D., Losito, S., Scognamiglio, G., Setola, S.V., Arenare, L.,

Pignata, S., Della Pepa, C. (2017), "Immunotherapy in ovarian, endometrial

and cervical cancer: State of the art and future perspectives", Cancer

Treatment Reviews, 59, pp. 109-116.

97. Verma, R.P.,Matthews, E.J. (2015), "Estimation of the chemical-induced eye

injury using a Weight-of-Evidence (WoE) battery of 21 artificial neural

network (ANN) c-QSAR models (QSAR-21): Part II: Corrosion potential",

Regulatory Toxicology and Pharmacology, 71(2), pp. 331-336.

98. Vichai, V.,Kirtikara, K. (2006), "Sulforhodamine B colorimetric assay for

cytotoxicity screening", Nat Protoc, 1(3), pp. 1112-1116.

99. Viens, L.J., Clouston, S.,Messina, C.R. (2016), "Women's autonomy and

cervical cancer screening in the Lesotho Demographic and Health Survey

2009", Social Science & Medicine, 150, pp. 23-30.

100. Vreven, T., Byun, K.S., Komáromi, I., Dapprich, S., Montgomery, J.A.,

Morokuma, K., Frisch, M.J. (2006), "Combining Quantum Mechanics

Methods with Molecular Mechanics Methods in ONIOM", Journal of

Chemical Theory and Computation, 2(3), pp. 815-826.

101. Wang, G., Luo, H.,Peng, K. (2016), "Quality-related fault detection using

linear and nonlinear principal component regression", Journal of the

Franklin Institute, 353(10), pp. 2159-2177.

102. Wang, J., Wang, W., Kollman, P.A., Case, D.A. (2006), "Automatic atom

type and bond type perception in molecular mechanical calculations",

Journal of Molecular Graphics and Modelling, 25(2), pp. 247-260.

103. Wang, T.C., Chen, I.L., Lu, P., Wong, C., Liao, C., Tsiao, K., Chang, K.,

Chen, Y., Tzeng, C. (2005), "Synthesis, antiproliferative, and antiplatelet

141

activities of oxime- and methyloxime-containing flavone and isoflavone

derivatives", Bioorganic & Medicinal Chemistry, 13(21), pp. 6045-6053.

104. Wang, Y., Xu, K., Lin, L., Pan, Y., Zheng, X. (2007), "Geranyl flavonoids

from the leaves of Artocarpus altilis", Phytochemistry, 68(9), pp. 1300-

1306.

105. Weirong, C., Xiaohong, G.,Jian, T. (2010), "Extraction, Purification, and

Characterisation of the Flavonoids from Opuntia milpa alta Skin", Czech

Journal of Food Sciences, 28(2), pp. 108–116.

106. Wold, S. (1995), "PLS for multivariate linear modelling. In: van de

Waterbeemd H. (ed.), QSAR: Chemometric Methods in Molecular Design",

Wiley-VCH, Weinheim, Germany, 2, pp. 195-218.

107. XLSTATversion2014.4.08 (2014), XLSTAT Tutorials, Copyright

Addinsoft,U.S.A.

108. Yang, C., Chen, H., Lu, S., Zhang, M., Tian, W., Wang, M., Zhang, L.,

Song, Y., Shen, A., Zhou, Y., Zhu, J., Zheng, C. (2016), "Structural

modification of luteolin from Flos Chrysanthemi leads to increased tumor

cell growth inhibitory activity", Bioorganic & Medicinal Chemistry Letters,

26(15), pp. 3464-3467.

109. Yoshizawa, T., Hashimoto, H., Shimizu, T., Yamabe, M., Shichijo, N.,

Hanada, K., Hirano, H., Sato, M. (2011), "Purification, crystallization and X-

ray diffraction study of basic 7S globulin from soybean", Acta Crystallogr

Sect F Struct Biol Cryst Commun, 67(Pt 1), pp. 87-89.

110. Zhang, Y. (2014), "An improved QSPR method based on support vector

machine applying rational sample data selection and genetic algorithm-

controlled training parameters optimization", Chemometrics and Intelligent

Laboratory Systems, 134, pp. 34-46.

111. 2014.4.08, X.v. (2014), Copyright Addinsoft 1995-2014,U.S.A.

142

112. Basu, P., Mittal, S., Bhadra Vale, D., Chami Kharaji, Y. "Secondary

Prevention of Cervical Cancer", Best Practice & Research Clinical

Obstetrics & Gynaecology.

113. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line

concentration of flavonoids in Brassica oleraceaby capillary electrophoresis

using large volume sample stacking", Food Chemistry, 133, pp. 205-2011.

114. R.P., V.,E.J., M. (2015), "Estimation of the chemical-induced eye injury

using a weight-of-evidence (WoE) battery of 21 artificial neural network

(ANN) c-QSAR models (QSAR-21): Part I: Irritation potential", Regulatory

Toxicology and Pharmacology, 71(2), pp. 318-330.

115. StatisticalSolutionsLtd (2011), TOXSYS 1.3, USA.

143

PHỤ LỤC

Phụ lục 1a. Hoạt tính pGI50 của nhóm dẫn xuất mẫu flavone và isoflavone

b)

Hợp chất

Khung hợp chất

Vị trí thế Nhóm thế R

pGI50

flavone

5,6990

FLA1

C3

-OCH2CCH3=NOH

flavone

5,9208

FLA2

C6

-OCH2CCH3=NOH

flavone

5,6990

FLA3

C7

-OCH2CCH3=NOH

isoflavone

5,0088

ISOFLA4

C7

-OCH2CCH3=NOH

flavone

5,6990

FLA5

C3

-OCH2CCH3=NOCH3

flavone

6,0458

FLA6

C6

-OCH2CCH3=NOCH3

flavone

5,6576

FLA7

C7

-OCH2CCH3=NOCH3

isoflavone

5,0706

ISOFLA8

C7

-OCH2CCH3=NOCH3

flavone

5,7447

FLA9

C3

-OCH2C(C6H5)=NOH

flavone

5,6778

FLA10

C3

-OCH2C(4-F-C6H4)=NOH

flavone

5,6990

FLA11

C3

-OCH2C(4-CH3O-C6H4)=NOH

flavone

6,0969

FLA12

C6

-OCH2C(C6H5)=NOH

flavone

5,7959

FLA13

C6

-OCH2C(4-F-C6H4)=NOH

flavone

6,0000

FLA14

C6

-OCH2C(4-CH3O-C6H4)=NOH

flavone

5,6990

FLA15

C7

-OCH2C(C6H5)=NOH

flavone

5,6990

FLA16

C7

-OCH2C(4-F-C6H4)=NOH

flavone

5,6990

FLA17

C7

-OCH2C(4-CH3O-C6H4)=NOH

isoflavone

5,0458

ISOFLA18

C7

-OCH2C(C6H5)=NOH

isoflavone

5,1079

ISOFLA19

C7

-OCH2C(4-F-C6H4)=NOH

isoflavone

5,1192

ISOFLA20

C7

-OCH2C(4-CH3O-C6H4)=NOH

flavone

5,7959

FLA21

C3

-OCH2C(C6H5)=NOCH3

flavone

5,6990

FLA22

C3

-OCH2C(4-F-C6H4)=NOCH3

flavone

5,6990

FLA23

C3

-OCH2C(4-CH3O-C6H4)=NOCH3

flavone

5,6198

FLA24

C6

-OCH2C(C6H5)=NOCH3

a) Khung cấu trúc: a) flavone và b) isoflavone

144

flavone

5,6383

FLA25

C6

-OCH2C(4-F-C6H4)=NOCH3

flavone

5,6990

FLA26

C6

-OCH2C(4-CH3O-C6H4)=NOCH3

flavone

5,1805

FLA27

C7

-OCH2C(C6H5)=NOCH3

flavone

5,5686

FLA28

C7

-OCH2C(4-F-C6H4)=NOCH3

flavone

5,6021

FLA29

C7

-OCH2C(4-CH3O-C6H4)=NOCH3

isoflavone

5,0862

ISOFLA30

C7

-OCH2C(C6H5)=NOCH3

isoflavone

5,1938

ISOFLA31

C7

-OCH2C(4-F-C6H4)=NOCH3

isoflavone

5,1367

ISOFLA32

C7

-OCH2C(4-CH3O-C6H4)=NOCH3

Hợp chất

Phụ lục 1b. Điện tích nguyên tử trên khung phân tử flavone và isoflavone

O1

C2

C3

C4

C5

C6

C7

C8

Fla-1

-0,093

0,156

-0,117

0,327

0,018

-0,159

-0,029

-0,154

145

Fla-2

-0,096

0,187

-0,331

0,358

-0,088

0,064

-0,078

-0,114

Fla-3

-0,102

0,181

-0,321

0,364

0,051

-0,202

0,179

-0,253

Isofla-4

-0,081

0,072

-0,178

0,369

0,054

-0,201

0,180

-0,251

Fla-5

-0,093

0,155

-0,116

0,326

0,017

-0,159

-0,029

-0,154

Fla-6

-0,097

0,186

-0,330

0,358

-0,038

0,062

-0,125

-0,113

Fla-7

-0,102

0,181

-0,322

0,364

0,051

-0,202

0,179

-0,253

isofla-8

-0,081

0,072

-0,178

0,369

0,054

-0,201

0,180

-0,251

Fla-9

-0,091

0,153

-0,113

0,334

0,018

-0,161

-0,028

-0,155

Fla-10

-0,091

0,154

-0,113

0,334

0,019

-0,161

-0,027

-0,155

Fla-11

-0,091

0,153

-0,112

0,334

0,018

-0,161

-0,028

-0,155

Fla-12

-0,097

0,185

-0,330

0,358

-0,036

0,061

-0,129

-0,113

Fla-13

-0,097

0,186

-0,330

0,358

-0,036

0,060

-0,129

-0,113

Fla-14

-0,096

0,187

-0,332

0,360

-0,093

0,064

-0,076

-0,115

Fla-15

-0,103

0,180

-0,321

0,365

0,050

-0,200

0,178

-0,258

Fla-16

-0,103

0,181

-0,321

0,364

0,051

-0,200

0,177

-0,257

Fla-17

-0,103

0,180

-0,321

0,365

0,050

-0,200

0,178

-0,258

isofla-18

-0,082

0,072

-0,178

0,370

0,054

-0,200

0,179

-0,255

isofla-19

-0,082

0,071

-0,177

0,369

0,054

-0,199

0,178

-0,255

isofla-20

-0,082

0,072

-0,178

0,370

0,054

-0,200

0,179

-0,255

Fla-21

-0,094

0,150

-0,088

0,338

0,017

-0,162

-0,030

-0,159

Fla-22

-0,094

0,151

-0,088

0,338

0,017

-0,161

-0,030

-0,159

Fla-23

-0,092

0,153

-0,111

0,334

0,018

-0,161

-0,028

-0,155

Fla-24

-0,097

0,185

-0,330

0,358

-0,037

0,061

-0,129

-0,113

Fla-25

-0,097

0,186

-0,330

0,358

-0,036

0,060

-0,129

-0,113

Fla-26

-0,097

0,185

-0,330

0,358

-0,037

0,062

-0,129

-0,113

Fla-27

-0,099

0,182

-0,323

0,365

0,053

-0,252

0,178

-0,206

Fla-28

-0,103

0,181

-0,321

0,364

0,050

-0,200

0,177

-0,257

Fla-29

-0,103

0,180

-0,320

0,365

0,050

-0,200

0,179

-0,258

isofla-30

-0,082

0,072

-0,179

0,370

0,054

-0,200

0,179

-0,255

isofla-31

-0,082

0,071

-0,178

0,369

0,054

-0,200

0,178

-0,255

isofla-32

-0,082

0,072

-0,179

0,370

0,053

-0,200

0,179

-0,255

a

C9

C10

O11

C1'

C2'

C3'

C4'

C5'

C6'

Fla-1

0,127

-0,231

-0,344

-0,073

-0,054

-0,122

-0,071

-0,120

-0,070

146

Fla-2 Fla-3

0,092 0,172

-0,186 -0,266

-0,365 -0,368

-0,078 -0,076

-0,047 -0,049

-0,118 -0,117

-0,070 -0,071

-0,116 -0,116

-0,064 -0,066

Isofla-4 Fla-5

0,147 0,127

-0,271 -0,231

-0,366 -0,343

0,003 -0,072

-0,081 -0,054

-0,113 -0,122

-0,097 -0,072

-0,114 -0,120

-0,118 -0,071

Fla-6 Fla-7

0,091 0,172

-0,187 -0,266

-0,359 -0,368

-0,078 -0,076

-0,048 -0,049

-0,117 -0,117

-0,070 -0,071

-0,116 -0,116

-0,065 -0,066

isofla-8 Fla-9

0,147 0,130

-0,272 -0,235

-0,367 -0,367

0,003 -0,073

-0,081 -0,030

-0,113 -0,136

-0,098 -0,072

-0,114 -0,126

-0,118 -0,069

Fla-10 Fla-11

0,130 0,130

-0,236 -0,235

-0,369 -0,368

-0,073 -0,073

-0,032 -0,029

-0,135 -0,136

-0,072 -0,073

-0,125 -0,126

-0,069 -0,070

Fla-12 Fla-13

0,089 0,091

-0,188 -0,187

-0,359 -0,359

-0,077 -0,078

-0,048 -0,048

-0,118 -0,117

-0,071 -0,070

-0,116 -0,116

-0,065 -0,065

Fla-14 Fla-15

0,090 0,172

-0,186 -0,268

-0,368 -0,369

-0,078 -0,075

-0,048 -0,049

-0,118 -0,117

-0,070 -0,071

-0,116 -0,116

-0,064 -0,066

Fla-16 Fla-17

0,172 0,171

-0,267 -0,268

-0,368 -0,369

-0,076 -0,075

-0,049 -0,066

-0,117 -0,116

-0,071 -0,072

-0,116 -0,117

-0,067 -0,049

isofla-18 isofla-19

0,147 0,147

-0,273 -0,272

-0,367 -0,366

0,003 0,002

-0,081 -0,081

-0,113 -0,113

-0,098 -0,097

-0,114 -0,114

-0,118 -0,118

isofla-20 Fla-21

0,147 0,129

-0,273 -0,230

-0,367 -0,363

0,003 -0,061

-0,081 -0,050

-0,113 -0,122

-0,098 -0,077

-0,114 -0,121

-0,118 -0,080

Fla-22 Fla-23

0,128 0,131

-0,230 -0,234

-0,363 -0,367

-0,062 -0,067

-0,050 -0,029

-0,122 -0,133

-0,076 -0,077

-0,121 -0,127

-0,080 -0,073

Fla-24 Fla-25

0,089 0,090

-0,188 -0,187

-0,360 -0,359

-0,077 -0,077

-0,048 -0,065

-0,118 -0,116

-0,071 -0,071

-0,116 -0,117

-0,065 -0,048

Fla-26 Fla-27

0,089 0,169

-0,188 -0,268

-0,360 -0,371

-0,077 -0,077

-0,065 -0,049

-0,116 -0,118

-0,071 -0,071

-0,118 -0,116

-0,048 -0,065

Fla-28 Fla-29

0,172 0,171

-0,267 -0,268

-0,368 -0,369

-0,076 -0,075

-0,049 -0,049

-0,117 -0,116

-0,071 -0,072

-0,116 -0,116

-0,067 -0,067

0,147 0,147

-0,273 -0,272

-0,367 -0,367

0,003 0,003

-0,081 -0,081

-0,113 -0,113

-0,098 -0,097

-0,114 -0,114

-0,118 -0,118

isofla-30 isofla-31

Phụ lục 2. i của 13C-NMR và 15O-NMR trên khung phân tử flavone và isoflavone

Hợp chất

O1

C2

C3

C4

C5

C6

C7

C8

152,3

164,7

180,4

133,5

134,4

134,1

128,7

302,7

Fla-1

157,6

118,4

176,0

130,1

172,5

129,1

130,8

279,8

Fla-2

147

Fla-3

276,8

159,2

117,2

174,5

132,6

129,7

170,9

125,2

Isofla-4

285,5

174,4

121,2

183,3

134,2

129,5

171,2

125,5

Fla-5

303,7

152,2

164,6

180,3

133,1

134,6

133,9

129,0

Fla-6

279,1

159,9

115,7

178,0

129,5

172,3

133,1

131,9

Fla-7

277,0

160,2

115,9

175,3

133,1

129,3

171,4

124,8

isofla-8

315,4

176,1

119,4

184,6

131,7

130,3

174,0

126,5

Fla-9

301,6

152,6

163,8

181,1

134,2

134,3

134,4

128,5

Fla-10

306,6

152,4

165,4

180,2

134,2

134,3

134,4

128,4

Fla-11

304,5

152,7

164,2

180,3

134,3

134,1

134,4

128,3

Fla-12

277,3

160,6

114,7

178,6

129,8

171,5

133,5

131,4

Fla-13

275,3

161,3

113,5

179,9

130,2

172,1

134,2

131,4

Fla-14

292,8

159,1

117,1

173,7

128,7

172,3

128,7

131,3

Fla-15

268,5

160,1

114,9

177,7

133,0

129,4

171,8

124,7

Fla-16

281,2

161,4

114,2

175,4

132,5

129,2

171,6

124,8

Fla-17

283,4

161,9

113,3

175,4

132,2

129,3

171,8

124,9

isofla-18

287,5

175,2

120,2

183,7

134,1

128,9

171,4

125,0

isofla-19

289,8

175,6

120,0

184,1

134,1

129,0

171,8

125,1

isofla-20

291,1

176,0

119,1

184,8

134,2

128,9

172,3

124,8

Fla-21

291,0

152,4

161,2

181,7

135,1

132,8

134,9

126,9

Fla-22

291,7

152,2

162,3

181,5

135,3

132,8

135,1

126,9

Fla-23

300,4

154,5

161,5

182,8

134,9

134,0

135,9

128,1

Fla-24

276,5

160,7

114,5

178,9

130,0

171,2

133,7

131,2

Fla-25

274,5

161,5

113,3

180,1

130,4

171,7

134,4

131,2

Fla-26

279,0

163,0

111,4

180,3

130,8

171,2

135,7

130,9

Fla-27

287,3

159,2

117,4

171,6

132,6

132,2

169,6

124,7

Fla-28

279,5

161,8

113,7

176,0

133,0

128,7

171,9

124,3

Fla-29

277,8

162,3

112,4

176,9

133,2

128,6

172,4

124,1

isofla-30

286,8

175,3

120,0

183,8

134,3

128,7

171,4

124,8

isofla-31

298,7

176,5

118,7

185,3

133,6

129,0

173,0

125,1

isofla-32

291,7

175,8

119,4

184,5

133,9

129,0

172,1

125,0

a

C9

C10

O11

C1'

C2'

C3'

C4'

C5'

C6'

Fla-1

165,7

129,9

828,2

129,8

134,6

132,6

133,5

133,9

135,3

Fla-2

166,1

133,6

768,6

127,1

135,1

130,8

136,0

133,5

137,2

Fla-3

169,1

131,9

736,3

126,3

135,3

129,4

136,8

133,0

138,3

Isofla-4

166,7

132,0

810,1

132,4

135,6

133,7

129,9

137,8

135,8

148

Fla-5

165,5

130,2

829,7

130,1

134,3

132,8

133,4

134,2

135,3

Fla-6

167,3

129,6

759,8

124,4

137,0

127,4

138,3

131,8

140,1

Fla-7

169,8

131,0

734,4

125,1

135,9

127,9

137,8

132,4

139,7

isofla-8

169,4

130,9

768,0

138,7

136,9

132,3

118,4

143,7

135,0

Fla-9

165,7

129,3

829,3

128,4

133,4

130,7

133,1

133,2

134,8

Fla-10

166,0

129,6

806,2

128,4

133,3

130,6

133,2

133,2

135,1

Fla-11

166,1

129,2

805,0

128,2

133,4

130,4

133,2

133,0

135,1

Fla-12

167,8

128,4

759,1

123,4

137,9

126,2

139,1

131,1

141,0

Fla-13

168,0

127,7

777,3

122,3

138,7

124,9

140,2

130,5

142,2

Fla-14

167,2

134,3

697,0

126,2

134,8

128,7

136,9

133,1

139,1

Fla-15

169,6

130,6

804,7

124,6

136,6

127,1

139,0

132,3

140,4

Fla-16

170,1

130,7

734,3

123,9

136,2

125,8

139,5

132,1

141,7

Fla-17

170,5

130,7

730,4

123,3

142,8

132,0

140,2

124,8

136,0

isofla-18

167,8

131,3

789,1

134,8

134,9

134,9

126,7

140,0

134,6

isofla-19

168,0

131,1

791,2

135,5

135,0

135,0

125,7

140,7

134,5

isofla-20

168,8

130,5

786,0

137,2

134,6

135,6

123,3

142,2

133,7

Fla-21

165,4

126,8

838,3

126,7

135,2

130,1

134,0

132,1

135,4

Fla-22

165,5

126,8

836,8

126,5

135,2

130,0

134,2

132,1

135,6

Fla-23

166,9

128,1

829,6

126,2

134,0

128,5

135,3

132,1

137,2

Fla-24

168,0

128,1

759,0

123,1

138,2

125,9

139,3

130,9

141,2

Fla-25

168,2

127,4

776,6

122,1

142,4

130,3

140,3

124,6

139,0

Fla-26

169,4

126,5

754,5

120,4

144,7

129,5

141,9

122,2

139,5

Fla-27

167,2

132,7

680,5

127,0

134,0

129,3

136,3

133,6

138,5

Fla-28

170,6

130,1

734,0

123,3

136,8

125,2

139,9

131,6

142,2

Fla-29

171,0

129,6

746,7

122,3

137,0

123,8

140,9

131,2

143,4

isofla-30

168,0

131,1

787,5

135,2

134,6

135,2

126,4

140,3

134,4

isofla-31

169,3

130,3

781,4

138,5

135,1

135,1

120,8

143,5

133,6

isofla-32

168,6

130,8

784,0

136,8

134,8

135,2

123,7

141,9

134,0

tr theo sự thay đổi của cấu trúc mạng và số vòng lặp

Vòng luyện(B)

QESARneural

R2

tr

k = 6

Cấu trúc mạng(A) 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

I(6) - HL(1) - O(1)

89,96 90,03 90,16 89,31 89,79 89,05 89,97 89,00 90,52 88,95

Phụ lục 3. Giá trị R2

149

I(6) - HL(2) - O(1)

88,25 88,48 90,97 89,92 90,39 91,19 90,32 89,67 89,65 90,48

I(6) - HL(3) - O(1)

89,89 88,19 88,31 89,52 89,44 91,79 83,70 88,42 89,42 88,37

I(6) - HL(4) - O(1)

86,90 89,35 89,97 91,62 89,87 89,16 85,07 89,62 88,66 89,15

I(6) - HL(5) - O(1)

86,03 89,67 85,36 90,26 83,75 87,47 83,96 87,55 87,90 88,93

I(6) - HL(6) - O(1)

90,04 87,25 86,00 87,23 82,66 86,22 89,83 88,45 89,46 88,40

Vòng luyện(B)

QESARneural

k = 6

R2

tr

Cấu trúc mạng(A)

11000 12000 13000 14000 15000 16000 17000 18000 19000 20000

I(6) - HL(1) - O(1)

90,64 90,36 90,32 90,38 90,46 90,27 88,81 90,20 90,66 89,75

I(6) - HL(2) - O(1)

88,75 89,66 83,94 86,97 88,71 90,29 89,45 87,23 91,53 90,72

I(6) - HL(3) - O(1)

89,19 86,99 90,29 86,42 83,44 89,47 82,18 86,14 88,96 85,42

I(6) - HL(4) - O(1)

85,83 87,16 88,78 91,61 90,04 86,37 87,01 90,48 89,52 89,49

I(6) - HL(5) - O(1)

88,22 90,66 84,10 87,47 82,30 88,03 85,63 86,05 85,65 89,83

I(6) - HL(6) - O(1)

83,80 86,60 88,48 88,52 85,37 87,70 81,51 89,58 90,30 89,92

150

Phụ lục 4. Hoạt tính pGI50 ức chế phát triển tế bào của dẫn xuất flavone và

Thứ tự

Hợp chất

Vị trí thế

Nhóm thế

pGI50

Nhóm chất luyện (a)

flavone

fla-1a

5,699

C3-R2

-OCH2CCH3=NOH

flavone

fla-2a

5,699

C7-R1

-OCH2CCH3=NOH

isofla-3a

isoflavone

5,009

C7-R1

-OCH2CCH3=NOH

flavone

fla-4a

5,699

C3-R2

-OCH2CCH3=NOCH3

flavone

fla-5a

6,046

C3-R2

-OCH2CCH3=NOCH3

flavone

fla-6a

5,658

C7-R1

-OCH2CCH3=NOCH3

isofla-7a

isoflavone

5,071

C7-R1

-OCH2CCH3=NOCH3

flavone

fla-8a

5,678

C3-R2

-OCH2C(4-F-C6H4)=NOH

flavone

fla-9a

5,699

C3-R2

-OCH2C(4-CH3O-C6H4)=NOH

flavone

fla-10a

5,796

C6-R1

-OCH2C(4-F-C6H4)=NOH

flavone

fla-11a

6,000

C6-R1

-OCH2C(4-CH3O-C6H4)=NOH

flavone

fla-12a

5,699

C7-R1

-OCH2C(4-CH3O-C6H4)=NOH

isofla-13a

isoflavone

5,046

C7-R1

-OCH2C(C6H5)=NOH

isofla-14a

isoflavone

5,108

C7-R1

-OCH2C(4-F-C6H4)=NOH

isofla-15a

isoflavone

5,119

C7-R1

-OCH2C(4-CH3O-C6H4)=NOH

flavone

fla-16a

5,796

C3-R2

-OCH2C(C6H5)=NOCH3

flavone

fla-17a

5,699

C3-R2

-OCH2C(4-F-C6H4)=NOCH3

flavone

fla-18a

5,699

C3-R2

-OCH2C(4-CH3O-C6H4)=NOCH3

flavone

fla-19a

5,620

C6-R1

-OCH2C(C6H5)=NOCH3

flavone

fla-20a

5,638

C6-R1

-OCH2C(4-F-C6H4)=NOCH3

flavone

fla-21a

5,699

C6-R1

-OCH2C(4-CH3O-C6H4)=NOCH3

flavone

fla-22a

5,180

C7-R1

-OCH2C(C6H5)=NOCH3

flavone

fla-23a

5,569

C7-R1

-OCH2C(4-F-C6H4)=NOCH3

flavone

fla-24a

5,602

C7-R1

-OCH2C(4-CH3O-C6H4)=NOCH3

isofla-25a

isoflavone

5,086

C7-R1

-OCH2C(C6H5)=NOCH3

isofla-26a

isoflavone

5,194

C7-R1

-OCH2C(4-F-C6H4)=NOCH3

Nhóm chất kiểm tra (b)

fla-1b

flavone

5,921

C6-R1

-OCH2CCH3=NOH

fla-2b

flavone

5,745

C3-R2

-OCH2CC6H5=NOH

isoflavone

151

fla-3b

flavone

6,097

C6-R1

-OCH2CC6H5=NOH

fla-4b

flavone

5,699

C7-R1

-OCH2CC6H5=NOH

fla-5b

flavone

5,699

C7-R1

-OCH2C(4-F-C6H4)=NOH

5,137

isofla-6b

isoflavone

C7-R1

-OCH2C(4-CH3O-C6H4)=NOCH3

152

k = 5

k = 6

k = 7

GIÁ TRỊ

Hệ số

Hệ số

Hệ số

P

Pvalue

Pvalue

hằng số

-0,933

0,6875

6,712

0,01067

4,714

0,003568

-101,21

0,0002

-42,31

0,0009

Phụ lục 5. Giá trị thống kê của mô hình QESARlinear (với k = 5, 6, 7) biến số

O1

-15,43

0,0019

C2

3,014

0,00771

C3

0,0088

-19,04

0,00979

-60,07

0,000001

-6,874

C4

-7,969

0,00002

C5

0,00004

20,88

0,000002

6,612

C6

4,604

0,00067

C7

16,9

0,000499

C8

95,42

0,000017

C9

-8,159

0,03877

-32,8

0,000077

O11

-24,47

0,000396

C2

-16,12

0,0218

C3'

-25,42

0,000141

C6'

153

pGI50

Cấu trúc phân tử

5,699

Nhóm thế 1a: R=OH, R1 = Me

5,745

2(a1): R= OH, R1 = C6H5

5,678

3: R= OH, R1 = p-F- C6H4

5,699

4: R= OH, R1 = p-OMe- C6H4

5,699

5(a2): R= Me, R1 = Me

5,796

6(a3): R= Me, R1 = C6H5

5,699

7: R= Me, R1 = p-F- C6H4

5,699

8: R= Me, R1 = p-OMe- C6H4

5,921

9(a4): R=OH, R2 = Me

6,097

10: R= OH, R2 = C6H5

5,796

11: R= OH, R2 = p-F- C6H4

6,000

12: R= OH, R2 = p-OMe- C6H4

6,046

13: R= Me, R2 = Me

5,62

14: R= Me, R2 = C6H5

5,638

15: R= Me, R2 = p-F- C6H4

5,699

16: R= Me, R2 = p-OMe- C6H4

5,699

17: R=OH, R3 = Me

5,699

18: R= OH, R3 = C6H5

5,699

19: R= OH, R3 = p-F- C6H4

5,699

20(a5): R= OH, R3 = p-OMe- C6H4

5,658

21(a6): R= Me, R3 = Me

5,181

22: R= Me, R3 = C6H5

5,569

23: R= Me, R3 = p-F- C6H4

5,602

24: R= Me, R3 = p-OMe- C6H4

5,009

25: R=OH, R3 = Me

5,046

26: R= OH, R3 = C6H5

5,108

27: R= OH, R3 = p-F- C6H4

5,119

28: R= OH, R3 = p-OMe- C6H4

5,071

29: R= Me, R3 = Me

5,086

30: R= Me, R3 = C6H5

5,194

31: R= Me, R3 = p-F- C6H4

5,137

32: R= Me, R3 = p-OMe- C6H4

Phụ lục 6. Giá trị thực nghiệm pGI50 và cấu trúc của flavone và isoflavone

154

Biến số

P

QSDARlinear

k = 7

k = 5

k = 6

k = 7

k = 5

k = 6

xk

Hệ số

14,4590 37,0550 32,9900 0,0000 0,0002 0,0005

0,0000 0,0140 0,0160 0,9907 0,0858 0,0177

O1

0,0040 0,0080 0,0060 0,2083 0,0204 0,0052

O11

-

-

-0,0450

-

0,0002

-

C2

-

-0,0580 -0,0630

0,0106 0,0002

-

C3

-0,0680 -0,0780

-

0,0275 0,0054

-

C4

0,0060 -0,0590 -0,0470 0,4354 0,0235 0,0351

C6

-0,0050 -0,0750 -0,0590 0,5294 0,0086 0,0175

C7

-

-

-0,0370

-

-

0,0306

C2'

Phụ lục 7. Giá trị thống kê của mô hình QSDARlinear (với k = 5, 6, 7) biến số

155

Hợp chất

Phụ lục 8. Điện tích nguyên tử của 10 dẫn xuất thiết kế từ mô hình QESAR

O1

C2

C3

C4

C5

C6

C7

C8

fla-1c

-0,094

0,184

-0,325

0,358

-0,091

0,055

-0,069

-0,114

fla-2c

-0,095

0,189

-0,333

0,360

-0,091

0,056

-0,069

-0,114

fla-3c

-0,095

0,181

-0,324

0,358

-0,091

0,062

-0,075

-0,115

fla-4c

-0,095

0,185

-0,326

0,357

-0,101

0,084

-0,076

-0,111

fla-5c

-0,096

0,180

-0,321

0,356

-0,101

0,084

-0,077

-0,111

isofla-7c

-0,073

0,087

-0,193

0,368

-0,090

0,058

-0,068

-0,110

isofla-8c

-0,074

0,079

-0,187

0,365

-0,089

0,057

-0,068

-0,111

isofla-9c

-0,074

0,086

-0,194

0,367

-0,090

0,064

-0,074

-0,111

isofla-10c

-0,074

0,086

-0,192

0,368

-0,099

0,085

-0,074

-0,106

isofla-11c

-0,075

0,084

-0,189

0,366

-0,098

0,085

-0,075

-0,107

C9

C10

O11

C1'

C2'

C3'

C4'

C5'

C6'

fla-1c

0,095

-0,188

-0,367

-0,036

-0,098

0,121

-0,181

-0,069

-0,110

fla-2c

0,095

-0,187

-0,370

-0,080

-0,047

-0,118

-0,069

-0,116

-0,063

fla-3c

0,091

-0,187

-0,365

-0,034

-0,098

0,121

-0,182

-0,069

-0,111

fla-4c

0,089

-0,181

-0,364

-0,039

-0,098

0,100

-0,165

-0,076

-0,107

fla-5c

0,089

-0,181

-0,360

-0,036

-0,092

0,092

-0,170

-0,076

-0,106

isofla-7c

0,069

-0,192

-0,371

0,050

-0,189

0,121

-0,140

-0,071

-0,164

isofla-8c

0,069

-0,192

-0,367

0,005

-0,084

-0,113

-0,098

-0,112

-0,119

isofla-9c

0,065

-0,191

-0,369

0,051

-0,189

0,121

-0,141

-0,072

-0,165

isofla-10c

0,064

-0,187

-0,372

0,043

-0,182

0,094

-0,132

-0,075

-0,159

isofla-11c

0,064

-0,187

-0,367

0,043

-0,182

0,101

-0,138

-0,076

-0,161

156

Phụ lục 9. i của 13C-NMR và 15O-NMR 12 dẫn xuất thiết kế từ mô hình QSDAR

flavone

O1

C2

C3

C4

C5

C6

C7

C8

1b

268,4

156,7

119,5

177,1

132,5

170,4

129,3

128,3

2b

268,7

156,9

119,4

177,4

132,7

170,9

129,4

128,5

3b

273,9

157,4

119,4

176,7

132,5

171,3

129,3

128,8

4b

264,7

155,8

120,0

176,7

135,8

132,7

134,9

127,1

5b

265,2

155,8

120,1

176,9

136,0

132,5

135,2

127,1

6b

265,5

155,6

120,1

176,9

136,1

132,4

135,3

127,0

C9

C10

O11

C1'

C2'

C3'

C4'

C5'

C6'

1b

166,6

131,4

769,4

127,5

135,7

133,1

133,8

133,4

134,7

2b

166,6

131,5

770,8

127,5

136,0

133,0

133,9

133,5

134,8

3b

166,7

131,7

753,5

127,5

136,0

132,8

134,0

133,4

135,0

4b

168,5

129,1

762,4

129,6

131,0

171,9

130,1

136,4

134,1

5b

168,7

129,2

763,2

129,8

131,1

172,5

130,2

136,7

134,2

6b

168,8

129,1

765,0

129,9

131,0

173,0

130,1

136,9

134,4

Isoflavone

O1

C2

C3

C4

C5

C6

C7

C8

7b

281,9

173,2

120,9

184,4

133,9

170,4

129,4

128,5

8b

282,2

173,5

120,8

184,6

134,0

170,9

129,5

128,8

9b

286,9

173,7

120,9

184,5

133,8

171,4

129,4

129,0

10b

281,0

172,8

121,0

182,6

136,6

132,7

134,7

127,7

11b

281,3

172,8

121,1

182,6

136,7

132,8

134,7

127,7

12b

282,2

172,9

121,1

182,5

136,7

132,8

134,7

127,7

C9

C10

O11

C1'

C2'

C3'

C4'

C5'

C6'

7b

164,0

131,9

829,2

130,9

133,7

134,5

132,6

135,6

135,5

8b

164,0

132,0

831,0

131,2

133,6

134,9

132,3

135,9

135,4

9b

164,0

132,1

826,9

131,2

133,5

135,0

132,3

136,0

135,5

10b

165,6

129,4

795,6

134,3

131,0

173,2

127,5

135,7

135,3

11b

165,7

129,5

794,2

134,5

131,1

173,8

127,6

135,9

135,4

12b

165,8

129,5

790,5

134,6

131,0

174,4

127,6

136,0

135,5

157

x0

x1

x2

xp3

xp4

xp5

xp6

xp7

pGI50

9,6278 9,7420

7,9232 8,2254

6,7154 5,6544 3,9683 3,0036 9,6198 5,6990 16,2338 11,2027 8,3885 6,4631 5,5899 3,7583 2,8146 9,8006 5,9210 16,2338 11,1690 8,2488 6,5192 5,4483 3,8584 2,8334 9,8006 5,6990 16,2338 11,1690 8,2419 6,6096 5,4563 3,7446 2,7668 9,6922 5,0090 16,2338 11,1859 8,3913 7,1484 5,7643 4,0118 3,0428 5,6990 16,9409 11,7027 10,0002 8,4730 6,8961 5,6998 3,7928 2,9011 6,0460 16,9409 11,6690 10,1811 8,3333 6,9522 5,5581 3,8929 2,9199 5,6580 16,9409 11,6690 10,1811 8,3265 7,0426 5,5661 3,7791 2,8533 8,4758 5,0710 16,9409 11,6859 10,0726 8,8196 7,2239 4,7433 3,6955 5,7450 19,3467 13,7752 11,6728 10,4104 8,9713 7,4480 5,0651 3,8478 5,6780 20,2170 14,1690 12,2946 10,8211 9,2819 7,5583 5,2393 4,0901 5,6990 20,9241 14,7070 12,4637 11,2293 8,5672 7,1412 4,6211 3,4566 6,0970 19,3467 13,7415 11,8536 10,2707 8,7189 7,3652 4,9428 3,6089 5,7960 20,2170 14,1354 12,4755 10,6814 9,0295 7,4755 5,1171 3,8512 6,0000 20,9241 14,6734 12,6446 11,0896 8,6234 6,9995 4,7212 3,4717 5,6990 19,3467 13,7415 11,8536 10,2638 8,7751 7,2235 5,0429 3,6240 5,6990 20,2170 14,1354 12,4755 10,6745 9,0857 7,3338 5,2171 3,8663 5,6990 20,9241 14,6734 12,6446 11,0828 8,7137 7,0075 4,6074 3,4051 5,0460 19,3467 13,7584 11,7452 10,4132 8,8654 7,2315 4,9291 3,5574 5,1080 20,2170 14,1522 12,3671 10,8239 9,1760 7,3418 5,1033 3,7997 5,1190 20,9241 14,6902 12,5362 11,2322 9,0329 7,5004 4,9047 3,8180 5,7960 20,0538 14,2752 12,0532 10,5455 9,1846 7,7244 5,2354 3,9152 5,6990 20,9241 14,6690 12,6751 10,9562 9,4952 7,8347 5,4096 4,1691 5,6990 21,6312 15,2070 12,8442 11,3644 8,5672 7,1412 4,6211 3,4566 5,6200 19,3467 13,7415 11,8536 10,2707 8,9323 7,6417 5,1042 3,7236 5,6380 20,9241 14,6354 12,8559 10,8165 9,2429 7,7520 5,2784 3,9775 5,6990 21,6312 15,1734 13,0250 11,2247 8,8368 7,2760 4,8735 3,6415 5,1800 20,0538 14,2415 12,2341 10,3989 8,9885 7,5000 5,2042 3,7387 5,5690 20,9241 14,6354 12,8559 10,8096 9,2991 7,6103 5,3784 3,9926 5,6020 21,6312 15,1734 13,0250 11,2179 8,9271 7,2840 4,7597 3,5749 5,0860 20,0538 14,2584 12,1256 10,5483 9,0788 7,5080 5,0904 3,6721 5,1940 20,9241 14,6522 12,7475 10,9590 5,1370 21,6312 15,1902 12,9166 11,3672 9,3894 7,6183 5,2647 3,9260 5,3260 23,1540 15,1888 14,3658 12,6969 10,2554 7,9789 6,0359 4,1744 6,8274 5,1656 3,9721 2,4808 5,2980 15,1459 9,9524 4,8130 15,8530 10,5072 7,3578 5,6141 4,2904 2,7435 4,4100 27,0158 17,4553 16,9885 13,1777 11,7282 9,7847 7,0298 5,2259 7,1320 5,5473 4,1134 2,8022 5,3790 16,0161 10,3799 10,0368 8,6116 9,4219 7,6571 5,4352 3,8552 5,1030 21,4135 14,3842 13,2004 11,9491

HC fla1 fla2 fla3 fla4 fla5 fla6 fla7 fla8 fla9 fla10 fla11 fla12 fla13 fla14 fla15 fla16 fla17 fla18 fla19 fla20 fla21 fla22 fla23 fla24 fla25 fla26 fla27 fla28 fla29 fla30 fla31 fla32 CYNA LUTE KEM1 KAEM2 QUER DAID

Phụ lục 10a. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

158

xc3

xv2

xv0

xp9

xch6

xpc4

xp10

xp8 2,1333 1,4731 0,8540 1,2227 3,2999 0,2308 12,5224 2,0930 1,5239 0,9367 1,3646 3,1692 0,2257 12,5224 2,0555 1,5682 0,9388 1,3646 3,1652 0,2257 12,5224 2,0689 1,4976 0,9326 1,2907 3,2783 0,2257 12,5224 2,2318 1,5306 0,9152 1,2227 3,2154 0,2308 13,4835 2,1424 1,5491 1,0067 1,3646 3,0846 0,2257 13,4835 2,1031 1,6083 0,9683 1,3646 3,0807 0,2257 13,4835 2,1166 1,5364 0,9699 1,2907 3,1937 0,2257 13,4835 2,6400 1,8728 1,2234 1,2674 3,7987 0,3328 14,9092 2,6462 1,8999 1,2792 1,5560 4,2070 0,3141 15,2098 2,7942 1,9204 1,2976 1,4715 4,2915 0,3141 16,2401 2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092 2,4954 1,9147 1,2585 1,6979 4,0763 0,3090 15,2098 2,6434 1,9310 1,2993 1,6134 4,1608 0,3090 16,2401 2,4836 1,8432 1,2829 1,4092 3,6640 0,3277 14,9092 2,4865 1,8917 1,3063 1,6979 4,0723 0,3090 15,2098 2,6345 1,9080 1,3471 1,6134 4,1568 0,3090 16,2401 2,4944 1,7872 1,2585 1,3354 3,7771 0,3277 14,9092 2,4974 1,8357 1,2819 1,6241 4,1854 0,3090 15,2098 2,6454 1,8520 1,3227 1,5395 4,2699 0,3090 16,2401 2,7974 1,9892 1,2846 1,2674 3,7499 0,3328 15,8702 2,8890 2,0055 1,3404 1,5560 4,1582 0,3141 16,1708 2,9807 2,0940 1,3589 1,4715 4,2427 0,3141 17,2011 2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092 2,6892 1,9880 1,3286 1,6979 4,0275 0,3090 16,1708 2,7809 2,0723 1,3693 1,6134 4,1120 0,3090 17,2011 2,5901 1,9422 1,3123 1,4092 3,6152 0,3277 15,8702 2,6785 1,9798 1,3358 1,6979 4,0235 0,3090 16,1708 2,7701 2,0642 1,3766 1,6134 4,1080 0,3090 17,2011 2,6009 1,8849 1,2957 1,3354 3,7283 0,3277 15,8702 2,6893 1,9226 1,3192 1,6241 4,1366 0,3090 16,1708 2,7809 2,0069 1,3600 1,5395 4,2211 0,3090 17,2011 3,0496 2,3056 1,6305 2,6687 6,8166 0,2245 16,3214 1,8085 1,2382 0,7968 1,8426 4,0566 0,1792 10,5695 2,1192 1,1889 0,8336 1,7221 3,9473 0,1842 11,5305

xv1 HC 7,1204 5,0756 fla1 7,1084 5,1228 fla2 7,1084 5,1228 fla3 7,1013 5,1264 fla4 7,5112 5,2494 fla5 7,4992 5,2967 fla6 7,4992 5,2967 fla7 7,4921 5,3003 fla8 8,7810 6,1530 fla9 8,8807 6,2939 fla10 9,3041 6,5155 fla11 8,7691 6,2003 fla12 8,8687 6,3412 fla13 9,2921 6,5628 fla14 8,7691 6,2003 fla15 8,8687 6,3412 fla16 9,2921 6,5628 fla17 8,7620 6,2039 fla18 8,8617 6,3448 fla19 9,2850 6,5664 fla20 9,1719 6,3269 fla21 9,2715 6,4677 fla22 9,6949 6,6894 fla23 8,7691 6,2003 fla24 9,2596 6,5150 fla25 9,6830 6,7366 fla26 9,1599 6,3741 fla27 9,2596 6,5150 fla28 9,6830 6,7366 fla29 9,1528 6,3777 fla30 9,2525 6,5186 fla31 9,6759 6,7402 fla32 9,4969 7,3091 CYNA 5,9769 4,5164 LUTE KEM1 6,3716 4,6785 KAEM2 3,9464 2,8367 2,0685 3,4056 6,7122 0,2296 19,9057 11,1273 8,4405 6,1231 4,6504 QUER 9,2093 6,9985 DAID

1,8037 1,2351 0,7568 1,9612 4,7464 0,1690 10,9393 2,7521 2,0727 1,4683 2,2014 5,9070 0,2523 15,5817

Phụ lục 10b. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

159

xvp8

xvp9

xvp5

xvp4

xvp6

xvp10 xvc3

xvp3 xvp7 HC 3,3882 2,2411 1,5731 0,8571 0,5334 0,3141 0,1764 0,0828 0,5256 fla1 3,3753 2,1865 1,5451 0,8145 0,5032 0,3040 0,1775 0,0900 0,5584 fla2 3,3774 2,1865 1,5252 0,8257 0,5048 0,2996 0,1841 0,0878 0,5584 fla3 3,4493 2,2320 1,5444 0,8206 0,5046 0,3045 0,1788 0,0886 0,5638 fla4 3,4647 2,3944 1,5982 0,8690 0,5454 0,3252 0,1845 0,0888 0,5256 fla5 3,4517 2,3398 1,5702 0,8262 0,5177 0,3116 0,1830 0,0955 0,5584 fla6 3,4538 2,3398 1,5503 0,8375 0,5192 0,3072 0,1892 0,0923 0,5584 fla7 3,5257 2,3854 1,5695 0,8323 0,5190 0,3122 0,1840 0,0934 0,5638 fla8 4,3731 2,9766 2,0192 1,0333 0,6496 0,3836 0,2268 0,1220 0,5299 fla9 4,4435 2,9883 2,0390 1,0714 0,6545 0,3831 0,2280 0,1233 0,5929 fla10 4,6893 3,1295 2,1124 1,1493 0,7177 0,4001 0,2333 0,1286 0,5980 fla11 4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627 fla12 4,4306 2,9338 2,0054 1,0456 0,6235 0,3611 0,2226 0,1226 0,6257 fla13 4,6764 3,0749 2,0788 1,1235 0,6867 0,3781 0,2280 0,1285 0,6308 fla14 4,3622 2,9220 1,9657 1,0187 0,6211 0,3584 0,2203 0,1236 0,5627 fla15 4,4327 2,9338 1,9854 1,0568 0,6260 0,3576 0,2225 0,1242 0,6257 fla16 4,6785 3,0749 2,0589 1,1347 0,6892 0,3746 0,2278 0,1301 0,6308 fla17 4,4341 2,9676 1,9849 1,0135 0,6209 0,3630 0,2169 0,1220 0,5681 fla18 4,5046 2,9793 2,0047 1,0517 0,6258 0,3622 0,2191 0,1227 0,6311 fla19 4,7504 3,1204 2,0782 1,1296 0,6890 0,3792 0,2244 0,1286 0,6361 fla20 4,4539 3,0793 2,0941 1,0739 0,6782 0,4043 0,2408 0,1280 0,5299 fla21 4,5243 3,0910 2,1138 1,1123 0,6803 0,4083 0,2411 0,1293 0,5929 fla22 4,7701 3,2321 2,1873 1,1902 0,7435 0,4251 0,2526 0,1346 0,5980 fla23 4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627 fla24 4,5114 3,0364 2,0803 1,0863 0,6517 0,3828 0,2332 0,1280 0,6257 fla25 4,7572 3,1775 2,1537 1,1642 0,7149 0,3997 0,2447 0,1339 0,6308 fla26 4,4430 3,0247 2,0406 1,0592 0,6521 0,3756 0,2313 0,1282 0,5627 fla27 4,5134 3,0364 2,0603 1,0975 0,6543 0,3793 0,2327 0,1288 0,6257 fla28 4,7592 3,1776 2,1338 1,1754 0,7174 0,3962 0,2443 0,1347 0,6308 fla29 4,5149 3,0702 2,0598 1,0540 0,6519 0,3802 0,2279 0,1268 0,5681 fla30 4,5853 3,0819 2,0796 1,0924 0,6541 0,3839 0,2293 0,1275 0,6311 fla31 4,8311 3,2231 2,1531 1,1703 0,7172 0,4008 0,2409 0,1333 0,6361 fla32 5,1440 3,4293 2,2712 1,2881 0,7165 0,4256 0,2635 0,1528 0,9943 CYNA 3,0546 2,0729 1,3590 0,7590 0,4060 0,2333 0,1339 0,0658 0,5908 LUTE KEM1 3,2513 2,2565 1,5076 0,8475 0,4610 0,2753 0,1388 0,0688 0,5715 KAEM2 5,6381 4,0553 2,8046 1,5742 0,9481 0,5703 0,3428 0,1953 1,1730 3,1730 2,1355 1,4097 0,7736 0,4248 0,2324 0,1299 0,0627 0,6309 QUER 5,0251 3,3211 2,2474 1,2284 0,6947 0,4105 0,2528 0,1458 0,8902 DAID

Phụ lục 10c. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

160

xvpc4 ABSQ ABSQon Dipole MaxHp MaxNeg MaxQp Ovality 1,5982 0,9734 1,7309 0,9603 1,6777 0,9613 1,7187 1,0363 1,6329 0,9672 1,7660 0,9541 1,7245 0,9551 1,7569 1,0301 1,6482 1,1895 1,6533 1,2622 1,7029 1,3361 1,7439 1,1763 1,7545 1,2491 1,7948 1,3229 1,7422 1,1774 1,7375 1,2501 1,7706 1,3240 1,7182 1,2524 1,7313 1,3251 1,7957 1,3990 1,6917 1,1864 1,7002 1,2591 1,6970 1,3330 1,7439 1,1763 1,7953 1,2460 1,8383 1,3199 1,7364 1,1743 1,7388 1,2470 1,8159 1,3209 1,7774 1,2493 1,7866 1,3220 1,8398 1,3959 1,8285 1,9313 1,5373 1,0655 1,5684 1,1015 1,8540 2,0875 1,5559 1,1726 1,7843 1,8112

6,1796 8,0858 5,9397 5,6574 5,2716 7,1274 4,4376 4,3371 5,4187 7,2526 8,0366 6,0955 8,0687 8,3968 3,1659 3,9789 4,8887 3,2984 4,5294 5,3592 4,1934 6,2547 5,9079 6,0955 7,6373 7,9833 3,0914 4,5067 5,0137 2,5971 4,6180 5,0940 3,1683 1,3426 4,3692 12,5381 5,9484 1,1196

-0,3921 -0,4050 -0,4050 -0,4043 -0,3921 -0,4050 -0,4050 -0,4043 -0,3921 -0,3921 -0,3921 -0,4050 -0,4050 -0,4050 -0,4050 -0,4050 -0,4050 -0,4043 -0,4043 -0,4043 -0,3921 -0,3921 -0,3921 -0,4050 -0,4050 -0,4050 -0,4050 -0,4050 -0,4050 -0,4043 -0,4043 -0,4043 -0,4034 -0,4034 -0,3933 -0,4045 -0,3890 -0,4042

1,4790 1,5376 1,5375 1,5445 1,4642 1,5227 1,5226 1,5296 1,4729 1,4717 1,8530 1,5314 1,5303 1,9119 1,5313 1,5302 1,9118 1,5383 1,5372 1,9188 1,4580 1,4569 1,8381 1,5314 1,5155 1,8971 1,5165 1,5154 1,8970 1,5234 1,5223 1,9039 4,0815 2,2335 2,1548 4,1640 2,5479 3,3528

3,8385 3,7043 3,7278 3,7314 3,8088 3,6745 3,6981 3,7016 4,3686 4,5444 4,7856 4,2340 4,4099 4,6508 4,2576 4,4335 4,6744 4,2611 4,4370 4,6779 4,3389 4,5147 4,7559 4,2340 4,3802 4,6210 4,2279 4,4038 4,6446 4,2314 4,4073 4,6482 8,2271 4,5338 4,5913 8,2078 5,1736 6,9913

0,2193 0,2193 0,2193 0,2193 0,1955 0,1603 0,1602 0,1675 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,1955 0,1955 0,1955 0,2194 0,1603 0,1603 0,1602 0,1602 0,1602 0,1675 0,1675 0,1675 0,2101 0,1755 0,2102 0,2440 0,2086 0,2101

0,2193 0,2193 0,2193 0,2193 0,0717 0,1094 0,1094 0,1023 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,2194 0,0717 0,0717 0,0727 0,2194 0,1094 0,1094 0,1094 0,1094 0,1094 0,1023 0,1023 0,1023 0,2101 0,1755 0,1776 0,2100 0,1973 0,2101

HC fla1 fla2 fla3 fla4 fla5 fla6 fla7 fla8 fla9 fla10 fla11 fla12 fla13 fla14 fla15 fla16 fla17 fla18 fla19 fla20 fla21 fla22 fla23 fla24 fla25 fla26 fla27 fla28 fla29 fla30 fla31 fla32 CYNA LUTE KEM1 KAEM2 QUER DAID

Phụ lục 10d. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

161

Polarizability SpcPolarizability Surface

xvch6 SdsCH SaaCH

5,8050 5,8050 5,8050 5,8050 6,5790 6,5790 6,5790 6,5790 6,5790 6,4880 7,3530 6,5790 6,4880 7,3530 6,5790 6,4880 7,3530 6,5790 6,4880 7,3530 7,3530 7,2620 8,1270 6,5790 7,2620 8,1270 7,3530 7,2620 8,1270 7,3530 7,2620 8,1270 7,7400 3,8700 4,6440 9,2880 3,8700 7,7400

Volume 0,0205 333,3331 283,2407 0,0726 0,0000 0,0193 376,0768 301,1595 0,0709 1,4741 0,0204 350,5764 284,0417 0,0709 1,4869 0,0195 370,6593 297,7988 0,0709 1,4625 0,0221 351,5565 297,0492 0,0726 0,0000 0,0206 398,7162 318,9987 0,0709 1,4991 0,0218 375,2085 301,7779 0,0709 1,5075 0,0209 393,3637 315,0381 0,0709 1,4875 0,0208 369,4536 315,5677 0,1047 0,0000 0,0203 373,5784 319,3890 0,1004 0,0000 0,0223 392,7971 329,4254 0,1004 0,0000 0,0215 382,5937 305,5504 0,1029 1,4782 0,0209 388,9135 310,3409 0,0986 1,4450 0,0223 414,4890 329,9914 0,0986 1,4716 0,0195 408,6353 337,7878 0,1029 1,4902 0,0196 401,6805 330,5313 0,0986 1,4616 0,0234 396,2264 314,7684 0,0986 1,4845 0,0214 378,1292 306,9938 0,1029 1,4666 0,0208 385,0502 311,8765 0,0986 1,4334 0,0223 414,3353 329,5624 0,0986 1,4601 0,0211 405,2733 348,6615 0,1047 0,0000 0,0206 410,7555 353,1085 0,1004 0,0000 0,0246 392,5103 330,7671 0,1004 0,0000 0,0215 382,5937 305,5504 0,1029 1,4782 0,0220 414,1577 329,4795 0,0986 1,4700 0,0233 440,1802 348,4047 0,0986 1,4966 0,0240 381,7659 306,5485 0,1029 1,5109 0,0212 411,7310 342,6333 0,0986 1,4822 0,0244 421,6354 332,6838 0,0986 1,5052 0,0225 407,4250 326,3386 0,1029 1,4916 0,0219 413,4352 331,0153 0,0986 1,4584 0,0233 440,4050 348,2668 0,0986 1,4851 0,0211 453,6429 367,4498 0,0858 1,1032 0,0186 261,0753 208,1012 0,0596 1,1577 0,0202 284,5858 229,8373 0,0614 0,0000 0,0224 498,6732 414,7864 0,0876 0,0000 0,0179 271,2661 216,4776 0,0576 0,0000 0,0243 402,8370 318,9727 0,0928 1,3003

16,2847 14,4994 14,4439 14,4005 16,5186 14,7067 14,6621 14,6078 25,4665 21,4513 23,2599 23,7859 19,8044 21,5743 23,7547 19,7569 21,5373 23,7053 19,7211 21,4910 26,0903 22,0241 23,8327 23,7859 20,3506 22,1205 24,3628 20,3139 22,0943 24,3025 20,2673 22,0372 6,1253 6,2125 8,2974 7,5773 5,6409 10,5331

HC fla1 fla2 fla3 fla4 fla5 fla6 fla7 fla8 fla9 fla10 fla11 fla12 fla13 fla14 fla15 fla16 fla17 fla18 fla19 fla20 fla21 fla22 fla23 fla24 fla25 fla26 fla27 fla28 fla29 fla30 fla31 fla32 CYNA LUTE KEM1 KAEM2 QUER DAID

Phụ lục 10e. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

162

SdssC

SaasC

k2

k1

k3

k0

ka1

0,5750 0,8330 0,8497 0,8871 0,9862 1,1359 1,1511 1,1847 0,4675 0,1135 0,3684 0,7661 0,5319 0,7009 0,7832 0,5503 0,7184 0,8222 0,5941 0,7587 0,8787 0,5247 0,7796 0,7661 0,8347 1,0037 1,0847 0,8517 1,0198 1,1198 0,8917 1,0563 -0,5621 -0,3573 -0,4782 -3,0291 -1,9188 0,0476

1,6814 2,3045 2,3120 2,2976 1,7789 2,4450 2,4555 2,4381 2,3437 1,5631 2,9209 3,0072 2,1990 3,5928 3,0189 2,2093 3,6058 3,0068 2,2017 3,5954 2,5840 1,8493 3,2070 3,0072 2,5283 3,9221 3,3053 2,5415 3,9380 3,2902 2,5309 3,9247 -1,3488 -0,9230 -0,0737 -1,2350 -1,9610 1,3775

SdO 12,7361 30,1156 17,8112 8,3927 4,1588 15,3016 12,3401 30,1156 17,8112 8,3927 4,5455 15,3016 12,2436 30,1156 17,8112 8,3927 4,5455 15,3016 12,5996 30,1156 17,8112 8,3927 4,3457 15,3016 12,8369 31,9209 18,7811 9,0873 4,6012 16,2646 12,4064 31,9209 18,7811 9,0873 5,0193 16,2646 12,2990 31,9209 18,7811 9,0873 5,0193 16,2646 9,0873 4,8034 16,2646 12,6550 31,9209 18,7811 13,0726 38,1122 21,2404 10,3469 5,0238 18,0053 13,0677 40,0013 22,2031 10,5434 5,2578 18,8922 13,1396 41,9054 23,1680 11,2277 5,5068 19,8774 12,5616 38,1122 21,2404 10,3469 5,3890 18,0053 12,5580 40,0013 22,2031 10,5434 5,6266 18,8922 12,6101 41,9054 23,1680 11,2277 5,8800 19,8774 12,4286 38,1122 21,2404 10,3469 5,3890 18,0053 12,4255 40,0013 22,2031 10,5434 5,6266 18,8922 12,4706 41,9054 23,1680 11,2277 5,8800 19,8774 12,7846 38,1122 21,2404 10,3469 5,2016 18,0053 12,7815 40,0013 22,2031 10,5434 5,4375 18,8922 12,8267 41,9054 23,1680 11,2277 5,6888 19,8774 13,1734 40,0013 22,2031 11,0395 5,4375 18,9590 13,1685 41,9054 23,1680 11,2277 5,6888 19,8487 13,2404 43,8240 24,1349 11,9234 5,9259 20,8367 12,5616 38,1122 21,2404 10,3469 5,3890 18,0053 12,6243 41,9054 23,1680 11,2277 6,0810 19,8487 12,6764 43,8240 24,1349 11,9234 6,3209 20,8367 12,4840 40,0013 22,2031 11,0395 5,8258 18,9590 12,4809 41,9054 23,1680 11,2277 6,0810 19,8487 12,5260 43,8240 24,1349 11,9234 6,3209 20,8367 12,8400 40,0013 22,2031 11,0395 5,6266 18,9590 12,8369 41,9054 23,1680 11,2277 5,8800 19,8487 12,8821 43,8240 24,1349 11,9234 6,1186 20,8367 12,5338 48,1648 25,1037 10,3180 5,1775 22,6371 6,2457 3,2000 13,6247 12,0433 27,7666 15,8790 12,4767 28,3292 16,8438 6,8571 3,2986 14,5816 36,8317 56,8193 29,9700 12,6688 6,8402 26,8807 6,4815 3,1653 14,5432 12,1429 29,5333 16,8438 9,8681 4,8595 20,7887 12,8115 43,1095 23,1680

HC fla1 fla2 fla3 fla4 fla5 fla6 fla7 fla8 fla9 fla10 fla11 fla12 fla13 fla14 fla15 fla16 fla17 fla18 fla19 fla20 fla21 fla22 fla23 fla24 fla25 fla26 fla27 fla28 fla29 fla30 fla31 fla32 CYNA LUTE KEM1 KAEM2 QUER DAID

Phụ lục 10f. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

163

ka2

ka3

Hother

Hmax

Gmax

Hmin

2,6945 2,6663 2,6681 2,6655 1,4629 1,6012 1,6105 1,6349 2,7803 2,8069 2,8015 2,7521 2,7787 2,7733 2,7539 2,7805 2,7751 2,7514 2,7779 2,7726 1,4906 1,5168 1,5001 2,7521 1,6507 1,6473 1,6554 1,6724 1,6691 1,6576 1,6676 1,6657 2,8630 2,7601 2,7856 2,8841 2,8701 2,7582

12,7361 12,3401 12,2436 12,5996 12,8369 12,4064 12,2990 12,6550 13,0726 13,1594 13,1396 12,5616 13,0557 12,6101 12,4286 13,0715 12,4706 12,7846 13,0530 12,8267 13,1734 13,2725 13,2404 12,5616 13,1688 12,6764 12,4840 13,1846 12,5260 12,8400 13,1661 12,8821 12,5338 12,0433 12,4767 13,5259 12,1429 12,8115

0,7651 0,7261 0,7284 0,7251 0,7731 0,7341 0,7364 0,7331 1,2384 1,2698 0,7720 1,2105 1,2284 0,7618 1,2148 1,2351 0,7625 1,2091 1,2298 0,7614 0,8496 0,8706 0,7740 1,2105 0,8495 0,7638 0,8299 0,8509 0,7645 0,8279 0,8489 0,7634 1,0768 1,4778 0,9032 0,8773 1,5111 1,0526

6,6616 6,6616 6,6616 6,6616 7,3138 7,3138 7,3138 7,3138 8,1029 8,2804 8,9391 8,1029 8,2804 8,9391 8,1029 8,2804 8,9391 8,1029 8,2804 8,9391 8,7502 8,9197 9,5928 8,1029 8,9197 9,5928 8,7502 8,9197 9,5928 8,7502 8,9197 9,5928 8,7667 4,8846 5,4501 10,6711 5,1089 8,3415

3,1183 3,4269 3,4269 3,2671 3,5128 3,8520 3,8520 3,6766 3,7080 3,9037 4,1515 3,9952 4,1952 4,4502 3,9952 4,1952 4,4502 3,8476 4,0455 4,2970 4,0720 4,2855 4,5240 3,9952 4,5997 4,8437 4,3815 4,5997 4,8437 4,2225 4,4384 4,6797 4,2537 2,3765 2,4890 5,5727 2,3710 3,9613

14,2173 14,4907 14,5027 14,5290 15,0379 15,2898 15,3037 15,3275 20,4449 19,9245 20,5388 20,6396 20,1308 20,7357 20,6628 20,1554 20,7607 20,6756 20,1673 20,7719 21,3403 20,8378 21,4499 20,6396 21,0226 21,6253 21,5386 21,0490 21,6521 21,5489 21,0585 21,6609 17,7797 9,3564 9,9728 19,9921 7,8932 20,0342

HC fla1 fla2 fla3 fla4 fla5 fla6 fla7 fla8 fla9 fla10 fla11 fla12 fla13 fla14 fla15 fla16 fla17 fla18 fla19 fla20 fla21 fla22 fla23 fla24 fla25 fla26 fla27 fla28 fla29 fla30 fla31 fla32 CYNA LUTE KEM1 KAEM2 QUER DAID

Phụ lục 10g. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

164

Gmin

Hmaxpos

fw

phia

knotp

knotpv

LogP

Name fla1 fla2 fla3 fla4 fla5 fla6 fla7 fla8 fla9 fla10 fla11 fla12 fla13 fla14 fla15 fla16 fla17 fla18 fla19 fla20 fla21 fla22 fla23 fla24 fla25 fla26 fla27 fla28 fla29 fla30 fla31 fla32 CYNA LUTE KEM1 KAEM2 QUER DAID

4,4319 4,4319 4,4319 4,4319 4,9565 4,9565 4,9565 4,9565 5,2105 5,3943 5,9229 5,2105 5,3943 5,9229 5,2105 5,3943 5,9229 5,2105 5,3943 5,9229 5,7205 5,9015 6,4478 5,2105 5,9015 6,4478 5,7205 5,9015 6,4478 5,7205 5,9015 6,4478 6,2016 3,1691 3,6123 7,7526 3,3773 5,7803

-2,0772 -1,8046 -1,8006 -1,9875 -1,9927 -1,7201 -1,7161 -1,9030 -2,5314 -2,6510 -2,8201 -2,2588 -2,3783 -2,5475 -2,2548 -2,3744 -2,5435 -2,4417 -2,5613 -2,7304 -2,4826 -2,6021 -2,7712 -2,2588 -2,3295 -2,4986 -2,2060 -2,3256 -2,4947 -2,3929 -2,5125 -2,6816 -4,1478 -2,2140 -2,2252 -3,3066 -2,7852 -3,7055

-0,4477 -0,4018 -0,4028 -0,4725 -0,4416 -0,3957 -0,3967 -0,4663 -0,6595 -0,6693 -0,7381 -0,6136 -0,6234 -0,6922 -0,6146 -0,6244 -0,6932 -0,6843 -0,6941 -0,7629 -0,6565 -0,6662 -0,7350 -0,6136 -0,6203 -0,6891 -0,6116 -0,6213 -0,6901 -0,6812 -0,6910 -0,7598 -0,9370 -0,4747 -0,5300 -0,9145 -0,5417 -0,9210

3,5667 3,5771 3,5789 3,5527 3,3597 3,6291 3,6037 3,6386 4,6313 4,4724 4,6684 4,6181 4,6932 4,6413 4,5401 4,6469 4,5471 4,5021 4,6616 4,5404 3,7509 3,6648 3,7660 4,6181 4,0615 4,2235 4,1496 4,0111 4,1865 4,1772 4,0687 4,2308 0,7696 2,7887 3,4560 1,4743 2,6359 1,0960

-0,2533 -0,1360 -0,1067 -0,0860 -0,2075 -0,1085 -0,0845 -0,0638 -0,2722 -0,4088 -0,2891 -0,1485 -0,3860 -0,1604 -0,1171 -0,3836 -0,1273 -0,0964 -0,3830 -0,1066 -0,2264 -0,3630 -0,2433 -0,1485 -0,3402 -0,1329 -0,0948 -0,3378 -0,1051 -0,0741 -0,3372 -0,0844 -1,6769 -0,4895 -0,5516 -1,5866 -0,8877 -1,5628

2,6945 2,6663 2,6681 2,6655 1,4629 1,6012 1,6105 1,6349 2,7803 2,8069 2,8015 2,7521 2,7787 2,7733 2,7539 2,7805 2,7751 2,7514 2,7779 2,7726 1,4906 1,5168 1,5001 2,7521 1,6507 1,6473 1,6554 1,6724 1,6691 1,6576 1,6676 1,6657 2,8630 2,7601 2,7856 2,8841 2,8701 2,7582

309,3214 309,3214 309,3214 309,3214 323,3483 323,3483 323,3483 323,3483 371,3923 389,3828 401,4185 371,3923 389,3828 401,4185 371,3923 389,3828 401,4185 371,3923 389,3828 401,4185 385,4192 403,4096 415,4454 371,3923 403,4096 415,4454 385,4192 403,4096 415,4454 385,4192 403,4096 415,4454 448,3832 286,2408 300,2677 516,4584 302,2402 416,3844

Phụ lục 10h. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

165

Phụ lục 11. Định Danh thực vật chiết xuất

166

167

168

169

170

Phụ lục 12. Thử hoạt tính khánh ung thư cổ tử cung (HeLa)

171

172

Phụ lục 13. phổ 1H-NMR CSL1

Phụ lục 14. phổ DEPT CSL1

173

Phụ lục 15. Phổ 13C-NMR CSL1

174

Phụ lục 16. Phổ HMBC CSL1

175

Phụ lục 17. Phổ HSQC CSL1

176

Phụ lục 18. Phổ 1H-NMR GML1

177

Phụ lục 19. Phổ 13C-NMR GML1

178

Phụ lục 20. Phổ DEPT GML1

179

Phụ lục 21. Phổ HMBC GML1

180

Phụ lục 22. Phổ HSQC GML1

181

Phụ lục 24. Phổ 1H-NMR AIL1

182

Phụ lục 25. Phổ 13C-NMR AIL1

183

Phụ lục 26. Phổ DEPT AIL1

184

Phụ lục 27. Phổ HSQC AIL1

185

Phụ lục 28. Phổ HMBC của AIL1

186

Phụ lục 29. 1H-NMR của POL1

187

Phụ lục 30. Phổ 13C-NMR của POL1

188

Phụ lục. 31 Phổ DEPT của POL1

189

Phụ lục 32. Phổ HMBC của POL1

190

Phụ lục 33. Phổ HSQC của POL1

191

Phụ lục 34. Phổ 1H-NMR ZZL1

192

Phụ lục 35. Phổ 13C-NMR ZZL1

193

Phụ lục 36. Phổ DEPT ZZL1

194

Phụ lục 37. Phổ HMBC ZZL1

195

Phụ lục 38. Phổ HSQC ZZL1

196

Phụ lục 39. Phổ 1H-NMR ZZL2

197

Phụ lục 40. Phổ 13C-NMR ZZL2

198

Phụ lục 41. Phổ DEPT ZZL2

199

Phụ lục 42. Phổ HMBC ZZL2

200

Phụ lục 43. Phổ HSQC ZZL2

201

Tham số

Dư liệu

Công thức phân tử

C21H15O11

Khối lượng phân tủ

443,33

ToK

100

Hệ tinh thể

monoclinic

Nhóm không gian

P21

a/Å

14,6876(11)

b/Å

4,3568(3)

c/Å

17,3072(11)

α/°

90

β/°

111,658(3)

γ/°

90

Thể tích/Å3

1029,32(13)

Z

2

1,43

Tỉ khối tính toán ρcalcg/cm3

Hệ số hấp thu μ/mm-1

0,118

F(000)

458

Kích thước tinh thể/mm3

0,1 × 0,05 × 0,05

Bức xạ

MoKα (λ = 0,71073)

Phạm vi thu thập dữ liệu 2Θ /°

5,968 to 64,054

Chỉ số index

-21 ≤ h ≤ 20, -6 ≤ k ≤ 6, -25 ≤ l ≤ 25

Số phản xạ đo được

25478

Số phản xạ độc lập

6681 [Rint = 0,0399, Rsigma = 0,0506]

Dữ liệu/giới hạn/tham số

6681/1/300

Hệ số phù hợp mô hình F2

1,022

Độ sai lệch [I>=2σ (I)]

R1 = 0,0454, wR2 = 0,0962

Độ sai lệch tổng cộng R

R1 = 0,0675, wR2 = 0,1049

Mật độ đỉnh/lỗ / e Å-3

0,48/-0,39

-0,1(3)

Tham số Flack

Phụ lục 44. Dữ liệu cấu trúc tinh thể GML1

202

Phụ lục 45. Tọa độ các nguyên tử (Å2×103) trong phân tử GML1

x

y

z

U(eq)

4394,3(12) 4954,6(13) 5741,4(13) 6278,7(10) 7066,4(14) 7363,0(12) 6808,4(12) 7008,3(9) 5983,0(12) 5395,8(12) 4611,7(12) 3596,4(8) 3257,5(11) 2325,0(11) 1923,3(9) 1899,5(11) 1088,6(8) 2388,4(11) 2110,4(9) 3305,1(12) 3806,3(11) 4667,5(9) 3617,4(8) 8247,6(12) 8876,5(13) 9696,9(13) 9892,4(12) 10709,1(8) 9277,2(12) 8459,1(12) 1799,3(9) -102,8(9)

13,4(4) 19,8(5) 19,4(5) 35,5(5) 29,9(6) 17,7(5) 13,2(4) 16,4(3) 13,9(4) 14,3(4) 14,4(4) 14,3(3) 11,4(4) 11,5(4) 13,6(3) 11,3(4) 15,8(3) 12,1(4) 18,8(3) 11,5(4) 14,2(4) 19,7(3) 12,0(3) 14,3(4) 19,2(5) 17,5(4) 13,3(4) 17,6(3) 14,7(4) 14,7(4) 14,6(3) 17,7(3)

6784,2(15) 7530,0(16) 7502,7(16) 8270,0(13) 8308,2(18) 7627,0(16) 6751,4(15) 6054,2(11) 6759,7(15) 6022,1(15) 6030,7(15) 6717,3(11) 7271,2(14) 6882,9(14) 5909,6(10) 7526,6(14) 7287,6(11) 8611,7(14) 9242,9(11) 8858,6(15) 9916,8(14) 10205,1(12) 8259(1) 7796,5(15) 8660,9(16) 8867,4(16) 8215,1(16) 8470,0(11) 7336,4(15) 7135,3(16) 4774,0(11) 5530,0(12)

6651(5) 4966(6) 4507(6) 2864(6) 2414(7) 3319(6) 4914(5) 5635(4) 5634(5) 7390(5) 7906(5) 7286(4) 5460(5) 6152(5) 5077(4) 4733(5) 6027(4) 5320(5) 3547(4) 4532(5) 5270(5) 4548(4) 6383(4) 2632(5) 3583(6) 2729(6) 897(5) 22(4) -16(5) 853(5) 9985(4) 4463(4)

Nguyên tố C1 C2 C3 O4 C5 C6 C7 O8 C9 C10 C11 O12 C13 C14 O15 C16 O17 C18 O19 C20 C21 O22 O23 C24 C25 C26 C27 O28 C29 C30 O30 O29

203

Phụ lục 46. Các thông số đẳng hướng (Å2×103) trong phân tử GML1

Nguyên tố

U11

U22

U33

U23

U13

U12

14,5(10)

17,3(10)

9,5(9)

0,0(8)

5,6(8)

-1,7(8)

C1

15,2(10)

34,4(13)

12,4(9)

5,4(10)

8,1(8)

9,1(10)

C2

11,4(9)

15,7(10)

30,9(13)

6,3(9)

4,8(8)

8,2(9)

C3

18,9(9)

14,2(7)

29,2(10)

15,9(8)

26,3(9)

69,6(15)

O4

24,6(12)

54,5(18)

12(1)

14,2(11)

19,8(13)

8,3(9)

C5

11,3(9)

16,3(10)

25,7(12)

4,1(9)

5,5(8)

3,7(9)

C6

10,0(8)

15,3(9)

15,3(10)

-1,4(8)

5,9(7)

-2,0(8)

C7

12,1(7)

14,6(7)

24,6(9)

1,7(6)

7,7(6)

2,9(6)

O8

10,2(8)

13,4(9)

19,4(11)

0,2(8)

5,8(8)

-1,5(8)

C9

12,7(9)

12,7(10)

18,5(10)

-0,2(8)

5,9(8)

0,8(8)

C10

14(1)

16,8(11)

13,0(9)

1,9(8)

5,7(8)

3,2(8)

C11

8,9(6)

18,9(8)

16,9(7)

2,2(6)

6,8(6)

3,7(6)

O12

9,3(8)

14,3(10)

12,1(9)

0,9(7)

5,7(7)

-0,5(8)

C13

9,7(8)

12,9(9)

11,4(9)

1,0(7)

3,2(8)

-1,4(8)

C14

14,1(6)

-1,1(6)

15,1(7)

9,9(7)

2,4(5)

-1,4(6)

O15

7,5(8)

13,4(9)

12,5(9)

0,6(7)

3,1(7)

-1,1(8)

C16

7,2(6)

24,5(8)

14,3(7)

2,5(6)

2,2(5)

-4,8(6)

O17

8,8(8)

15,4(10)

12,1(9)

-0,5(7)

4,0(7)

-1,1(8)

C18

15,0(7)

29,0(9)

12,2(7)

-7,1(7)

4,8(6)

0,8(7)

O19

13,3(9)

11,3(9)

10,1(8)

0,2(7)

4,8(7)

1,1(8)

C20

12,7(10)

18,8(11)

9,6(8)

0,7(8)

2,3(7)

-0,7(9)

C21

20,0(8)

24,1(9)

11,1(7)

4,2(6)

1,1(6)

0,6(7)

O22

11,2(7)

15,3(7)

9,9(6)

-1,2(6)

4,3(6)

-0,2(6)

O23

13,8(10)

19,4(11)

10,5(8)

2,7(8)

5,5(8)

5,4(9)

C24

16,3(11)

26,1(12)

16(1)

6,0(9)

6,7(9)

-0,6(9)

C25

15,4(10)

21,3(11)

13,5(9)

1,1(9)

2,6(8)

-2,7(9)

C26

17,7(10)

13,2(10)

9,5(8)

0,2(7)

5,5(8)

1,6(8)

C27

22,5(8)

20,2(8)

9,4(6)

1,8(6)

4,9(6)

-5,4(7)

O28

15,8(10)

16,6(10)

13,1(9)

0,1(8)

6,9(8)

-0,8(9)

C29

14,7(10)

16,8(11)

11,4(9)

-1,5(8)

3,4(8)

0,8(8)

C30

14,1(7)

16,4(7)

15,7(7)

-1,6(6)

8,4(6)

-2,2(6)

O30

204

20,2(8)

21,0(8)

11,7(7)

-0,7(6)

5,5(6)

-3,3(6)

O29

205

Phụ lục 47. Độ dài liên kết trong phân tử GML1

Nguyên tố

Độ dài /Å Nguyên tố

Độ dài /Å 1,419(2) 1,527(3) 1,431(2) 1,525(3) 1,420(3) 1,530(3) 1,509(3) 1,439(2) 1,426(2) 1,396(3) 1,393(3) 1,389(3) 1,381(3) 1,376(2) 1,394(3) 1,388(3)

C2 C11 O12 C3 O4 C9 C5 C6 C7 C24 O8 C9 C10 C11 C13 C14

1,377(3) C14 1,405(3) C14 1,376(2) C16 1,391(3) C16 1,369(3) C18 1,394(3) C18 1,358(3) C20 1,341(3) C20 1,465(3) C21 1,488(3) C24 1,237(3) C24 1,467(3) C25 1,407(3) C26 1,380(3) C27 1,411(2) C27 1,530(3) C29

O15 C16 O17 C18 O19 C20 C21 O23 O22 C25 C30 C26 C27 O28 C29 C30

C1 C1 C1 C2 C3 C3 O4 C5 C6 C6 C7 C7 C9 C10 O12 C13

206

Phụ lục 48. Góc liên kết trong phân tử GML1

Góc

Góc /˚

Góc

Góc/˚

111,58(16)

C1

C11

C2

C14

C13

121,31(18) O15

108,74(16)

C1

C2

O12

C14

C16

123,91(18) O15

111,88(16)

C1

C11

O12

C14

C13

114,78(18) C16

109,99(16)

C2

C3

C1

C16

C14

117,59(19) O17

107,82(15)

C3

C9

C2

C16

C18

123,5(2) O17

111,76(16)

C3

C2

O4

C16

C14

115,22(19) C18

109,69(15)

C3

C9

O4

C18

C20

121,31(18) C16

113,57(16)

O4

C3

C5

C18

C16

118,43(18) O19

107,14(16)

C5

O4

C6

C18

C20

125,6(2) O19

110,37(16)

C6

C7

C5

C20

C18

119,15(18) C21

108,66(15)

C6

C24

C5

C20

C18

118,0(2) O23

107,94(16)

C6

C24

C7

C20

C21

122,85(18) O23

113,55(16)

C7

C9

C6

C21

C20

114,74(18) O22

110,30(15)

C7

C6

O8

O23

C20

123,68(17) C13

120,08(19)

C7

C9

O8

C24

C6

121,57(19) C25

120,94(19)

C9

C7

C3

C24

C6

120,37(19) C30

118,82(19)

C9

C10

C3

C24

C25

117,01(18) C30

120,7(2)

C9

C7

C10

C25

C24

122,60(19) C26

119,7(2)

C10

C9

C11

C26

C25

120,98(19) C27

120,53(18)

C11

C1

C10

C27

C29

119,61(19) C26

117,48(18)

O12

C13

C1

C27

C26

117,73(16) O28

121,99(19)

C13

C14

O12

C27

C29

106,25(16) O28

119,33(19)

C13

O12

O23

C29

C27

108,23(16) C30

120,88(19)

C13

C14

C30

C24

109,40(15) C29

O23

207

Phụ lục 49. Góc xoắn trong phân tử GML1

A

B

C

D

Góc/˚

A

B

C

D

Góc/˚

179,5(2)

C1 C2

C3

O4

-178,9(2) O12 C1

C11 C10

-67,3(2)

C1 C2

C3

C9

0,7(4) O12 C13 C14 O15

170,61(16)

C1 O12 C13 C14

167,23(17) O12 C13 C14 C16

178,62(14)

C1 O12 C13 O23

-75,4(2) O12 C13 O23 C20

-165,89(16)

C2 C1

C11 C10

-1,4(3) C13 C14 C16 O17

-46,2(2)

C2 C1

O12 C13

18,1(3) C13 C14 C16 C18

-66,02(19)

177,9(3) C14 C13 O23 C20

O4

C5

C2 C3

168,12(16)

176,6(2) C14 C16 C18 O19

C9

C7

C2 C3

48,3(2)

-1,8(4) C14 C16 C18 C20

C9

C10

C2 C3

70,4(2)

3,5(5) O15 C14 C16 O17

C5

C6

C3 O4

-169,87(17)

C3 C9

C10 C11

1,3(3) O15 C14 C16 C18

-176,79(17)

-3,9(4) C16 C18 C20 C21

C9

C7

O4 C3

-58,6(2)

177,7(2) C16 C18 C20 O23

C9

C10

O4 C3

-70,9(2)

0,6(5) O17 C16 C18 O19

C6

C7

O4 C5

169,27(17)

-179,8(3) O17 C16 C18 C20

C6

C24

O4 C5

-179,07(17)

174,6(3) C18 C20 C21 O22

C7

O8

C5 C6

69,13(19)

-5,8(3) C18 C20 O23 C13

C7

C9

C5 C6

59,5(2)

C5 C6

C24 C25

54,6(4) O19 C18 C20 C21

177,68(16)

C5 C6

C24 C30

-120,7(3) O19 C18 C20 O23

-171,17(16)

C9

C3

7,4(3) C21 C20 O23 C13

C6 C7

208

Phụ lục 50. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng

(Å2×103) của phân tử GML1

Atom

x

y

z

U(eq)

4809

24

8045

4146

H2

7439

36

8865

1370

H5

5541

17

5511

8234

H10

4221

17

5530

9102

H11

3361

14

7199

3232

H13

2251

14

6882

8429

H14

1874

20

5515

6527

H15

1846

14

7409

2468

H16

769

24

6747

5325

H17

2343

14

8752

7545

H18

1628

28

8929

2893

H19

3364

14

8730

2306

H20

3574

17

10338

4115

H21A

3749

17

10028

7485

H21B

4723

30

9903

2977

H22

8742

23

9113

4827

H25

10122

21

9455

3401

H26

10749

26

8055

-1231

H28

9416

18

6880

-1220

H29

8038

18

6539

225

H30

1936

22

5171

11545

H30A

2111

22

4426

9952

H30B

-15

27

5210

2904

H29A

-611

27

5510

4402

H29B

209

Tham số

Pna21

Công thức phân tử

C16H12O6

Khối lượng phân tử

300,26

ToK

100

Hệ tinh thể

orthorhombic

Nhóm không gian

Pna21

a/Å

7,0060(4)

b/Å

25,9070(14)

c/Å

7,2062(4)

α/°

90

β/°

90

γ/°

90

Thể tích/Å3

1307,96(13)

Z

4

1,525

Tỉ khối tính toán ρcalcg/cm3

0,118

Hệ số hấp thu μ/mm-1

F(000)

624

Kích thước tinh thể /mm3

0,1 × 0,08 × 0,04

Bức xạ

MoKα (λ = 0,71073)

Phạm vi thu thập dữ liệu 2Θ /°

5,868 to 61,67

Chỉ số index

-10 ≤ h ≤ 10, -37 ≤ k ≤ 37, -10 ≤ l ≤ 10

Số phản xạ đo được

44181

Số phản xạ độc lập

4114 [Rint = 0,0465, Rsigma = 0,0199]

Dữ liệu/giới hạn/tham số

4114/1/203

Hệ số phù hợp mô hình F2

1,092

Độ sai lệch [I>=2σ (I)]

R1 = 0,0387, wR2 = 0,0959

Độ sai lệch tổng cộng R

R1 = 0,0427, wR2 = 0,0987

Mật độ đỉnh/lỗ / e Å-3

0,44/-0,24

Tham số Flack

0,0(2)

Phụ lục 51. Dữ liệu cấu trúc tinh thể của ZZL1

210

Phụ lục 52. Tọa độ các nguyên tử trong phân tử ZZL1

x

y

z

U(eq)

Nguyên tố

4775(2)

10,9(3)

7729(2)

3675,6(6)

C1

6392(2)

11,1(3)

8443(2)

3485,4(6)

C2

7788,2(17)

13,7(2)

9062,3(18)

3807,2(5)

O3

9151(3)

20,0(4)

7590(3)

3901,3(7)

C4

6728(2)

10,7(3)

8572(2)

2936,4(6)

C5

8233,1(18)

14,2(2)

9224,5(18)

2758,0(5)

O6

5243(2)

10,7(3)

7914(2)

2611,6(6)

C7

5363(2)

11,1(3)

7974(2)

2063,4(6)

C8

6930,0(18)

16,2(3)

8594(2)

1833,0(5)

O9

3882(3)

12,5(3)

7379(2)

1763,2(6)

C10

2255(2)

12,0(3)

6715(2)

2000,8(6)

C11

869,4(19)

16,4(3)

6171(2)

1683,8(5)

O12

2097(2)

11,7(3)

6619(2)

2537,4(6)

C13

3600(2)

10,4(3)

7222(2)

2829,9(6)

C14

3393,7(18)

12,4(2)

7127,6(18)

3355,0(4)

O15

4268(2)

12,9(3)

7513(2)

4222,1(6)

C16

3133(3)

14,7(3)

5993(2)

4377,7(6)

C17

2589(3)

16,8(3)

5805(3)

4890,1(7)

C18

3183(3)

18,3(3)

7136(3)

5253,5(7)

C19

2576(3)

25,7(3)

6892(2)

5746,0(5)

O20

4328(3)

22,0(4)

8635(3)

5105,0(7)

C21

4862(3)

19,1(3)

8829(3)

4592,3(7)

C22

211

Phụ lục 53. Các thông số đẳng hướng (Å2×103) trong phân tử k ZZL1

U11

U22

U33

U23

U13

U12

Nguyên tố

0,4(5)

1,0(6)

-1,1(5)

10,9(7)

10,0(6)

11,9(7)

C1

-0,1(5)

0,8(6)

-1,1(5)

13,1(7)

9,5(6)

10,9(6)

C2

-1,8(4)

-0,2(4)

-2,0(4)

16,4(6)

13,1(5)

11,7(5)

O3

-3,5(7)

3,6(7)

0,3(7)

23,0(9)

21,7(8)

15,3(8)

C4

1,3(5)

0,9(5)

-0,2(5)

10,3(7)

11,0(6)

10,7(7)

C5

3,1(4)

-2,2(5)

-0,1(4)

18,3(6)

13,3(5)

11,0(5)

O6

0,6(5)

-0,6(5)

-0,2(5)

11,4(7)

10,0(6)

10,8(6)

C7

2,1(5)

0,5(5)

1,0(5)

11,1(7)

10,4(6)

11,7(7)

C8

3,3(4)

-3,4(5)

0,7(4)

23,3(7)

11,5(5)

13,7(6)

O9

-0,2(5)

1,2(6)

0,0(5)

11,6(7)

11,5(6)

14,5(7)

C10

-1,8(5)

0,9(6)

-1,1(5)

10,1(7)

12,8(7)

13,0(7)

C11

-2,8(4)

-5,7(5)

0,1(5)

21,4(6)

12,7(5)

15,2(6)

O12

0,2(5)

-0,9(5)

0,4(5)

12,8(7)

11,8(6)

10,5(6)

C13

0,6(5)

0,4(5)

-0,1(5)

11,0(7)

9,5(6)

10,5(7)

C14

0,8(4)

-2,0(4)

-0,3(4)

16,2(6)

9,5(5)

11,5(5)

O15

1,4(5)

2,0(6)

-0,4(5)

16,5(8)

9,4(6)

12,8(7)

C16

1,0(6)

-0,7(6)

0,4(6)

17,2(8)

12,1(7)

14,9(7)

C17

2,6(6)

0,4(7)

3,1(6)

20,0(8)

12,3(7)

18,1(7)

C18

4,3(6)

5,0(7)

1,2(6)

22,9(8)

10,8(6)

21,2(8)

C19

7,4(5)

2,2(7)

-1,0(5)

30,9(8)

10,2(6)

36,1(8)

O20

5,4(7)

-2,6(7)

-7,8(7)

24,7(9)

14,6(8)

26,8(9)

C21

5,3(7)

-4,3(7)

-4,6(6)

18,6(8)

14,9(7)

23,7(9)

C22

212

Phụ lục 54. Độ dài liên kết trong phân tử ZZL1

Liên kết

Góc/Å

Liên kết

Góc/Å

1,404(2)

C2

1,360(2) C10

C11

C1

1,348(2)

O15

1,3631(19) C11

O12

C1

1,396(2)

C16

1,470(2) C11

C13

C1

1,388(2)

O3

1,3766(19) C13

C14

C2

1,3701(17)

C5

1,446(2) C14

O15

C2

1,402(2)

C4

1,445(2) C16

C17

O3

1,397(2)

O6

1,264(2) C16

C22

C5

1,390(2)

C7

1,437(2) C17

C18

C5

1,393(3)

C8

1,423(2) C18

C19

C7

1,360(2)

C14

1,399(2) C19

O20

C7

1,390(3)

O9

1,3489(19) C19

C21

C8

1,389(2)

C10

1,385(2) C21

C22

C8

213

Phụ lục 55. Góc liên kết trong phân tử ZZL1

Nguyên tố

Góc/˚

Nguyên tố

Góc/˚

122,20(15)

C2

C1

O15

121,24(14) O12

C11

C13

121,37(15)

C2

C1

C16

126,82(15) C13

C11

C10

117,74(15)

O15

C1

C16

111,93(14) C14

C13

C11

123,04(14)

C1

C2

O3

121,51(14) C13

C14

C7

120,67(13)

C1

C2

C5

121,51(14) O15

C14

C7

116,28(14)

O3

C2

C5

116,98(14) O15

C14

C13

120,71(13)

C2

O3

C4

111,96(13) C1

O15

C14

119,98(15)

O6

C5

C2

121,72(14) C17

C16

C1

121,14(15)

O6

C5

C7

122,74(13) C22

C16

C1

118,86(15)

C7

C5

C2

115,54(14) C22

C16

C17

120,71(16)

C8

C7

C5

121,94(14) C18

C17

C16

119,69(17)

C14

C7

C5

120,32(13) C17

C18

C19

116,81(17)

C14

C7

C8

117,73(14) O20

C19

C18

123,10(17)

O9

C8

C7

120,14(14) O20

C19

C21

120,09(16)

O9

C8

C10

119,56(14) C21

C19

C18

120,20(17)

C10

C8

C7

120,30(14) C22

C21

C19

120,44(17)

C8

C10

C11

119,82(14) C21

C22

C16

116,43(14)

O12

C11

C10

214

Phụ lục 56. Góc xoắn trong phân tử ZZL1

A

B

C

D

Angle/˚

A

B

C

D

Angle/˚

-0,7(3)

C1

C2

O3

C4

94,58(19) C8

C10

C11

C13

179,36(15)

C1

C2

C5

O6

-179,57(16) O9

C8

C10

C11

0,6(2)

C1

C2

C5

C7

0,5(2) C10

C11

C13

C14

0,1(2)

C1

C16

C17

C18

-177,82(16) C11

C13

C14

C7

179,36(14)

C1

C16

C22

C21

178,18(18) C11

C13

C14

O15

-179,69(16)

C2

C1

O15

C14

0,2(2) O12

C11

C13

C14

-178,46(14)

C2

C1

C16

C17

-147,34(18) C13

C14

O15

C1

-178,69(15)

C2

C1

C16

C22

34,2(3) C14

C7

C8

O9

0,7(2)

C2

C5

C7

C8

179,25(15) C14

C7

C8

C10

179,63(14)

C2

C5

C7

C14

0,5(2) O15

C1

C2

O3

-0,9(2)

O3

C2

C5

O6

-0,1(2) O15

C1

C2

C5

33,2(2)

O3

C2

C5

C7

-179,99(14) O15

C1

C16

C17

-145,26(17)

C5

C2

O3

C4

-84,94(18) O15

C1

C16

C22

0,2(3)

C5

C7

C8

O9

2,5(2) C16

C1

C2

O3

179,69(15)

C5

C7

C8

C10

-178,10(16) C16

C1

C2

C5

179,73(14)

C5

C7

C14

C13

178,05(16) C16

C1

O15

C14

-0,2(3)

C5

C7

C14

O15

-1,2(2) C16

C17

C18

C19

-0,3(3)

O6

C5

C7

C8

-0,7(3) C17

C16

C22

C21

178,86(17)

O6

C5

C7

C14

-179,43(15) C17

C18

C19

O20

-0,6(3)

C7

C8

C10

C11

0,0(2) C17

C18

C19

C21

1,0(3)

C7

C14

O15

C1

0,8(2) C18

C19

C21

C22

-0,5(3)

C8

C7

C14

C13

-0,7(2) C19

C21

C22

C16

-178,44(19)

C8

C7

C14

O15

-179,95(15) O20

C19

C21

C22

0,7(3)

C10

C11

O12

179,61(15) C22

C16

C17

C18

C8

215

Phụ lục 57. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng

(Å2×103) trong Pna21 của hợp chất ZZL1

Nguyên tố

x

y

z

U(eq)

6661

4147

8650

30

H4A

8166

4044

10279

30

H4B

6944

3576

9449

30

H4C

8902

2059

7709

24

H9

7421

1397

3967

15

H10

5665

1858

18

25

H12

6157

2697

998

14

H13

5082

4130

2731

18

H17

4773

4992

1815

20

H18

7770

5933

2997

39

H20

9530

5355

4746

26

H21

9863

4493

5636

23

H22

216

Phụ lục 58. Tính toán các tham số cấu trúc phân tử

1) ABSQ: Tổng điện tích của nguyên tử trong phân tử

Trong đó Qi là điện tích của nguyên tử i.

2) ABSQon: Là tổng giá trị tuyệt đối điện tích nito (n) và oxy (o) trong phân tử.

3) Dipole: là giá trị moment lưỡng cực của phân tử. Giá trị dipole (μ) được tính dựa

trên cấu trúc 3D và điện tích nguyên tử bằng phương pháp Gasteiger-Marsili thực

hiện trong QSARIS. Đơn vị của nó là (1 D = 3.336 E-30 coulomb-meter).

3) Chỉ số hình học alpha Ka3 (Kappa Alpha 3 hay 3); Ka2 (Kappa Alpha 2 hay

(2))

1kα = [(A+ α)(A+ α – 1)2]/(1Pi + α)2 với m = 1

2kα = [(A+ α – 1)(A+ α – 2)2]/(2Pi + α)2 với m = 2

3kα = (A + α –1)(A + α – 3)2 / (3Pi + α)2 với m = 3 khi A lẻ

3kα = (A + α –3)(A + α – 2)2 / (3Pi + α)2 với m = 3 khi A chẵn

Trường hợp theo số nguyên tử và đường:

Trong đó: A là số lượng các nguyên tử trong phân tử được mô tả;  là bán kính

cộng hóa trị nguyên tử của các nguyên tử trong hợp chất vòng khác carbon; Pi: số

lượng đường bậc m trong phân tử i; m là bậc đường.

Bán kính cộng hóa trị nguyên tử là bán kính được sắp xếp dạng bảng của mỗi

nguyên tử và được sử dụng để tính giá trị  cho chỉ số chỉ số hình học K. Bán kính

cộng hóa trị nguyên tử được định nghĩa như sau:

Với α là tổng Ri và RCsp3; Ri và RCsp3 bán kính nguyên tử thứ i và bán kính Csp3.

217

5) logP là logarithm (cơ số 10) của hệ số phân tán P của octanol - nước [14].

6) MaxNeg là điện tích âm lớn nhất của các các nguyên tử trong một phân tử.

7) MaxQp là điện tích dương lớn nhất của các các nguyên tử trong một phân tử.

8) MolWeight: là phân tử khối của phân tử

9) Polar: là độ phân cực của phân tử, được tính dựa trên phương pháp của Miller,

công thức 1.12.

Trong đó αA là độ phân cực trung bình nguyên tử cho nguyên tử A. Phương

pháp này sử dụng 400 hợp chất chứa H, C, N, O, S, F, Cl, B, I, và P để xác định sai

số của αA với sai số 2,2-2,8% giữa phép phân cực phân tử thực nghiệm và tính toán.

Đơn vị là Å3 (1Å = 10-10 m).

10) Sp.Pol: là độ phân cực cụ thể của một phân tử: Sp.Pol = Polar/Volume

11) Volume: Thể tích của một phân tử. Thể tích phân tử của một phân tử được tính

bằng phương pháp lưới (grid) của Boder. Nó là một kỹ thuật tích hợp sử dụng một

khối lưới trung tâm trên mỗi nguyên tử có cạnh là đường kính của nguyên tử.

Trong đó n là số điểm lưới trong nguyên tử và không tính tính các nguyên tử

khác; nt là tổng số điểm lưới trong một nguyên tử và ri là bán kính van der Waals

của nguyên tử thứ i.

Thể tích của nguyên tử V:

đơn vị là Å3(1Å = 10-10 m)

12) WienI (W): Chỉ số W là một tham số topo theo công thức của H. Wiener [36].

Các chỉ số W được dựa trên khung của phân tử (không có hydrogen). W được định

nghĩa là tổng của khoảng cách giữa hai nguyên tử cacbon trong phân tử, liên quan

đến các liên kết cacbon và cacbon. Phương pháp tính toán như sau: Nhân số nguyên

tử cacbon vào một mặt của bất kỳ liên kết nào bằng các bên ở phía bên kia; W =

tổng của các giá trị này cho tất cả các liên kết. Chỉ số Wiener của một phân tử

218

thường cao hơn đối với các phân tử lớn hơn và cho biết độ phân nhánh của phân tử.

Đặc biệt, W thường lớn cho các phân tử mở phân nhánh và nhỏ cho những phân tử

ít phân nhánh hơn. W tương quan với tham số hình dạng ovality và volume phân tử

và trong một số trường hợp, nó có thể được sử dụng thay cho một hoặc cả hai mô tả

phân tử này. W là một tham số đơn.

13) X1: chỉ số liên kết thứ nhất được tính trên tất cả các liên kết đơn (cạnh) của các

nguyên tử trong phân tử không có hydro. Nó là một trong các tham số mô tả hữu ích

nhất đối với các mô hình QSAR/QSPR. X1 là tổng tất cả các liên kết từ nguyên tử i

đến nguyên tử j được tín theo công thức sau:

δi = ϭ - h: là tổng các liên kết xung quanh nguyên tử i; ϭ là số electron của nguyên

tử i trong orbital ϭ. h là số hydro liên kết với nguyên tử i.

14) X1 là 1 χ trong tính toán của Kier & Hall.

15) X3: là chỉ số liên kết thứ 3.

16) Ovality: là chỉ số hình học oval của phân tử.

Với O là là tham số mô tả kích thước dựa trên tính chất đối với một thể tích cố định,

hình cầu với bề mặt nhỏ nhất; SA là bề mặt phân tử; SA0 là bề mặt phân tử cực tiểu;

VVDW là thể tích an der Waals; R là bán kính nguyên tử.

17) Sdssc: là số chỉ số E-State của nhóm (=C<) trong phân tử .

18) SdO: là số chỉ số E-State của nhóm (=O) trong phân tử .

19) SaaCH là số chỉ số E-State (chỉ số trạng thái điện tử) của nhóm ( CH )

trong phân tử.

20) SsOH là số chỉ số E-State của nhóm OH trong phân tử.

21) xp6 là chỉ số chi đường 6 (6P).

22) k2 hay Kappa 2 (2k) là chỉ số hình học kappa truyền thống (traditional Kappa

Shape Indices).

219

mk= C (mPmax

mPmin)/(mPi)2

Trường hợp theo số đường:

Trong đó:

 Pmax: số lượng đường bậc m trong một phân tử tham chiếu không có nhánh

với cùng một số nguyên tử như phân tử được mô tả.

 Pmin: số lượng đường bậc m trong một phân tử tham chiếu có đặc tính cấu trúc

vô cực và cùng một số nguyên tử như phân tử được mô tả.  Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả.  m là bậc đường  C = 2 (m = 1,2); C = 4 (m = 3)

1k = A(A-1)2/(1Pi)2 với m = 1

2k = A(A-1)(A-2)2/(2Pi)2 với m = 2

3k = A(A-1)(A-3)2/(3Pi)2 với m = 3 khi A lẻ

3k = A(A-3)(A-2)2/(3Pi)2 với m = 3 khi A chẵn

Trường hợp theo số nguyên tử và đường:

Trong đó:

 A là số đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử  Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả

m là bậc đường

23) knotp: sự khác nhau giữa chi nhóm 3 và chi đường/nhóm 4.

27) xp8: chỉ số chi đường 8 (8P) bậc thấp.

28) Knotpv: Sự khác nhau giữa chi nhóm hóa trị 3 và chi đường/nhóm hóa trị 4.

29) Phia: Kappa linh hoạt (. Các đại lượng Kappa Alpha 1 và Kappa Alpha 2

được kết hợp với một số nguyên tử (bình thường) để tạo thành chỉ số Kappa linh

hoạt (Kappa Flexibility),  (phia) . Chỉ số Kappa linh hoạt phia được định nghĩa

như sau:

 = (1k)(2k)/A

220

Trong đó: 1k là giá trị của kappa alpha 1; 2k là giá trị của kappa alpha 2; A là số

đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử

Nvx là số đỉnh của khung (số nguyên tử không phải hydro, số các nhóm hydrua; ví

dụ. - CH3, - OH,…).

221

Phụ lục 59. Các phương pháp bán thực nghiệm

1) CNDO

Phương pháp CNDO (complete neglect of differential overlap) phương pháp

NDO (neglect of differential overlap) đơn giản nhất. Phương pháp này mô hình hóa

các giá trị orbitals chỉ sử dụng một bộ cơ sở tối thiểu của các loại orbitals Slater.

Phương pháp CNDO đã chứng minh kết quả hữu ích trên một số hydrocacbon.

CNDO đôi khi vẫn được sử dụng để tạo ra dự đoán đầu tiên về tính toán ab initio

trên các hydrocarbon.Thực tế tất cả các phép tính CNDO thực sự được thực hiện

bằng cách sử dụng phương pháp CNDO/2, đó là một tham số được cải thiện hơn

phương pháp CNDO/1 ban đầu. Có một phương pháp CNDO/S được tham số để

tính toán tính chất điện tử quang phổ. Phương pháp CNDO/S mang lại dự đoán cải

thiện các dự đoán trạng thái kích thích năng lượng, nhưng khó khăn trong dự đoán

tính chất hình học phân tử. Cũng có những phần mở rộng của phương pháp

CNDO/2 bao gồm các yếu tố có orbitals d. Những kỹ thuật này không sử dụng phổ

biến rộng rãi do tính giới hạn chính xác của kết quả.

2) INDO

Phương pháp INDO (intermediate neglect of diferential overlap) được sử

dụng cho các hợp chất hữu cơ. Ngày nay, nó đã bị thay thế bởi các phương pháp

chính xác hơn. INDO đôi khi vẫn được sử dụng như một phép tính ban đầu trong

các tính toán ab initio.

3) MNDO

Phương pháp MNDO (modified neglect of diatomic overlap) đã được sử

dụng nhiều trong các hợp chất hữu cơ. Nó đã được đưa vào một số chương trình

bán thực nghiệm phổ biến cũng như chương trình MNDO. Ngày nay, nó vẫn được

sử dụng, nhưng các phương pháp AM1 và PM3 chính xác và phổ biến hơn.

Có một số trường hợp mà phương phá MNDO đưa ra kết quả không chính

xác. Tính toán năng lượng kích thích điện tử thấp. Hàng rào năng lượng kích hoạt

thường có xu hướng cao.

222

Không phải luôn luôn tính được năng lượng tối thiểu bằng phương pháp

MNDO. Hàng rào đối với sự quay liên kết thường được tính là quá nhỏ. Các hợp

chất lớn và các hệ phân tử được tính toán không ổn định. Vòng bốn được dự đoán là

bền. Nhóm hàm bão hòa oxy trên vòng được dự đoán ngoài không gian. Liên kết

peroxide thì nhỏ hơn 0,17 Ao. Liên kết C-O-C lớn hơn 9o. Độ dài liên kết giữa các

electron âm thì quá ngắn. Liên kết hydrogem thì quá mạnh và dài.

Phương pháp biến thể của MNDO là MNDO/d. Đây là hàm tương đương bao

gồm các orbital d. Phương pháp này cải thiện tiên đoán hình học của các phân tử

tăng dần. Phương pháp này đôi khi được sử dụng để mô hình hóa các hệ thống kim

loại chuyển tiếp. Phương pháp MNDO cũng bao gồm các tương quan điện tử với

phương pháp MNDO.

4) AM1

Phương pháp AM1 (Austin Model 1) phổ biến trong mô hình hóa các hợp

chất hữu cơ. AM1 thường dùng trong tính toán nhiệt tạo thành ΔHf chính xác hơn

phương pháp MNDO. Tùy thuộc vào cấu trúc phân tử và thông tin cấu trúc tính

toán, một trong hai AM1 hoặc PM3 thường cho kết quả chính xác nhất định.

Có một số ưu điểm và nhược điểm về kết quả thu được từ những phương

pháp này. AM1 đã cải thiện tính toán năng lượng kích hoạt so với phương pháp

MNDO. Phương pháp AM1 có kết quả tính toán đối với nhôm tốt hơn PM3 và tính

toán kém chính xác đối với nitơ, phốt pho hay tính toán nhiệt tạo thành của các

phân tử với có điện tích lớn. Ngoài ra, AM1 thường ứng dụng tính toán cho liên kết

O-Si-O, dự đoán năng lượng nhóm alkyl. Nhìn chung, AM1dự đoán năng lượng và

hình học tốt hơn MNDO, nhưng không bằng như PM3.

5) PM3

Phương pháp PM3 (Parameterization method 3) sử dụng phương trình gần

giống như phương pháp AM1 với bộ tham số được cải thiện. Đây là phương pháp

phổ biến đối với hệ thống hữu cơ. PM3 chính xác hơn AM1 đối với tính các góc độ

liên kết hydro, nhưng AM1 chính xác hơn đối với tính năng lượng liên kết hydro.

223

Các phương pháp PM3 và AM1 cũng phổ biến hơn các phương pháp bán thực

nghiệm khác do có sẵn các thuật toán tính toán năng lượng solvat hóa.

Ngoài ra còn có một số điểm mạnh và hạn chế của PM3. Nói chung, tính

toán nhiệt tạo thành chính xác hơn so với MNDO hoặc AM1. Các phân tử siêu hóa

trị (Hypervalent) cũng được dự đoán chính xác hơn. PM3 có khuynh hướng tiên

đoán rằng rào xoay xung quanh liên kết CaN trong các peptide quá thấp. Liên kết

giữa Si và các nguyên tử halogenua quá ngắn. PM3 cũng có xu hướng dự đoán

trạng thái điện tử không chính xác đối với các hợp chất gecmani. Dự đoán điện tích

nito không chính xác. Khoảng cách không liên kết thì quá ngắn. Liên kết hydro thì

quá ngắn khoảng 0,1 Ao, nhưng định hướng thường chính xác. Nhìn chung, PM3 dự

đoán năng lượng và độ dài liên kết chính xác hơn AM1 hoặc MNDO.

6) TNDO

Phương pháp TNDO (typed neglect of differential overlap) là phương

pháp bán thực nghiệm tham số hóa đặc biệt để để tính toán độ dịch chuyển

hóa học của phổ NMR. Sự tham số hoá này đi cao hơn các phương pháp bán

thực nghiệm khác là phân biệt giữa các nguyên tử của cùng một nguyên tố

nhưng lai hóa khác nhau.Ví dụ, các tham số khác nhau được sử dụng để mô tả

một carbon sp2 và carbon sp3. ó hai phiên bản của phương pháp này: TNDO/1

và TNDO/2.

224

Phân tử

Hoạt tính

Phân tử i Yi

Tính chất / Tham số/ Phân mảnh 1 X1i

Tính chất / Tham số/ Phân mảnh 2 X2i

Tính chất / Tham số/ Phân mảnh 3 X3i

Tính chất / Tham số/ Phân mảnh n Xni

Phân tử ii Yii

X1ii

X2ii

X3ii

Xnii

Phân tử iii Yiii

X1iii

X2iii

X3iii

Xniii

Phân tử n Yn

X1n

X2n

X3n

Xnn

Phụ lục 60. Ma trận dữ liệu trong nghiên cứu QSAR

225

Phụ lục 61. Các loại thông tin bao gồm trong các phương pháp mô phỏng silico

Dữ liệu được mô phỏng

 Tác dụng dược lý

 Tác dụng gây độc

 Tính chất hóa lý

 Các tính chất dược động học, sinh học khả dụng

 Môi trường

Hóa học

 Tính chất hóa lý

 Thuộc tính cấu trúc 2-D và 3-D

 Hiện diện, vắng mặt và đếm các nguyên tử, mảnh, tiểu cấu trúc

 Hoá học lượng tử và tính toán

Mô phỏng

 Thiết kế các nhóm dẫn xuất có cấu trúc tương tự

 Thống kê

 3D/4D QSAR

Các lĩnh vực khác

 Chất lượng và độ tin cậy của dữ liệu

 Mô hình hóa và mô hình dự báo

 Phạm vi áp dụng

 Chất lượng mô hình và độ tin cậy của dự báo

226

Phụ lục 62. Tóm tắt các phương pháp tiếp cận mô hình chính cho sự xây dựng các

QSAR và trong kỹ thuật silico

Phương pháp (Q)SAR

Phân tích Hansch

Free-Wilson

Các mảnh cấu trúc và nhận diện cấu trúc

Sự hình thành và phân loại của nhóm

Phân tích hồi quy tuyến tính

Bình phương cực tiểu riêng phần

Nhận dạng mẫu

Các phương pháp Robust

Dược phẩm

Mô hình 3-D

CoMFA

227

Phụ lục 63. Phương pháp phổ cộng hưởng từ hạt nhân

Phổ 1H-NMR

Phổ 1H-NMR cho biết có bao nhiêu loại proton trong phân tử, đồng thời cho phép

xác định số proton của từng loại. Trong phổ 1H-NMR, phần diện tích vẽ ra bởi mũi

cộng hưởng, tỷ lệ thuận với số lượng proton gây ra tín hiệu cộng hưởng của mũi đó,

được gọi là cường độ tích phân của mũi cộng hưởng. Một tín hiệu cộng hưởng, do

ảnh hưởng của các proton bên cạnh có thể bị chẻ thành nhiều mũi, khi giải phổ cần

tính tổng diện tích các mũi.

Cách giải phổ 1H-NMR

Yêu cầu về mẫu đo phổ 1H-NMR đảm bảo khô, độ tinh khiết trên 95%, chất lỏng

cần kiểm tra độ tinh khiết bằng sắc ký lỏng hiệu năng cao (HPLC) hoặc kiểm tra

bằng SKLM với các hệ dung môi khác nhau cho hiện vết tròn, duy nhất ở Rf = 0,7-

0,8; 0,5-0,6; 0,2-0,3 đối với hệ dung môi giải ly từ phân cực mạnh, phân cực trung

bình, phân cực yếu tương ứng.

Đo phổ 1H-NMR: với máy 200 MHz cần khoảng 5 mg mẫu, nếu máy hoạt động ở

tần số 500 MHz thì lượng mẫu yêu cầu sẽ giảm. Sau khi đo có thể thu hồi mẫu.

Một số dữ liệu cần lưu ý khi giải phổ:

- Đối với proton của cacbon thơm (C=C) có mũi cộng hưởng tại  = 7,0 - 8,5 ppm.

- Đỗi với proton của cacbon mạch thẳng (C=C) có mũi cộng hưởng tại  = 4,5 - 6,0

ppm, tuy nhiên khoảng  = 4,5 - 6,0 cũng có thể do proton gắn vào 2 hay nhiều

nguyên tử có độ âm điện như oxy, halogen.

- Đối với H của nhóm ankin đầu mạch có  = 2,5 ppm.

- Đối với H của cacbon bên cạnh nhóm cacbony có  = 2,1 – 2,5 ppm.

- Đối với H của cacbon liên kết với oxy, halogen có  = 3 – 4 ppm. Nếu proton càng

xa nguyên tử có độ âm điện cao thì  = 1 – 3 ppm

- Đối với H của cacbon nhóm vinyl có  = 5 – 6 ppm.

- Đối với H thuộc nhóm andehit có  = 9 – 10 ppm.

- Đối với H thuộc nhóm axit có  >10 ppm.

228

Phổ 13C-NMR

Mẫu khảo sát khi đo phổ 13C-NMR cần hòa tan trong dung môi đã được deuterium

hóa (0,6 ml) và có thêm chất nội chuẩn TMS (tetrametilsilan) (1µL). Có nhiều loại

dung môi để hòa tan các hợp chất đo phổ 13C-NMR.

Lượng mẫu sử dụng đối với máy 200MHz khoảng 30 mg, máy có tần số 500 MHz

cần khoảng 5-10 mg, mẫu sau khi đo có thể thu hồi.

Các tín hiệu trong phổ 13C-NMR trong khoảng thang đo rất rộng từ 0 - 240 ppm.

Cách giải phổ 13C-NMR:

Phổ 13C-NMR kết hợp với phổ NMR-DEPT 135 và NMR-DEPT 90:

- Phổ 13C-NMR cho biết tổng số cacbon trong phân tử.

- Phổ NMR-DEPT 135 và NMR-DEPT 90 cho biết tổng số Csp3, Csp2.

Sau đây là độ dịch chuyển hóa học của 13C tính bằng ppm (so từ TMS):

+ Đối với C liên kết trực tiếp với nguyên tử có độ âm điện lớn: R-CH3 có  = 8 – 30

ppm; R-CH2-R có  = 15 – 55 ppm; CHR3, CR4 có có  = 20 – 60 ppm

+ Đối với Csp3 liên kết với O có  = 40 – 80 ppm; Csp3 liên kết với Cl có  = 35 –

80 ppm; Csp3 liên kết với Br  = 25 – 65 ppm; Csp3 liên kết với N có  = 30 – 65

ppm.

+ Đối với Csp2 và Csp: nhóm C≡C có  = 65 – 90 ppm; C≡N có  = 110 – 140 ppm;

>C=C< có  = 100 – 150 ppm; ->C=C< thơm có  = 110 – 175 ppm.

+ Đối với C của nhóm aldehit hoặc xeton, axit có  = 155 – 220 ppm.

Phổ hai chiều

Phổ HSQC (Heteronuclear Single Quantum Correlation) cho biết tương quan giữa

các tín hiệu proton với tín hiệu của cacbon qua 1 liên kết. Phổ

HMBC(Heteronuclear Multiple Quantum Correlation) cho biết tương quan giữa các

tin hiệu proton với tín hiệu của cacbon qua 2 hay 3 liên kết. Từ các tín hiệu của

cacbon 13C trên trục tung kẻ các đường song song với trục hoành trong toàn phổ đồ,

từ tín hiệu 1H trên trục hoành kẻ các đường song song với trục tung. Tại các vị trí

229

giao nhau của hai đường kẻ trên có tín hiệu giao, nghĩa là proton này liên kết trực

tiếp với cacbon kia.

230

Phụ lục 64. Phương pháp nhiễu xạ tia X đơn tinh thể

Phương pháp lâu đời nhất và chính xác nhất của tinh thể học tia X là nhiễu

xạ tia X đơn tinh thể, trong đó chùm tia X bị bản hồi từ các mặt phẳng có khoảng

cách đều nhau của một đơn tinh thể, tạo ra một mẫu nhiễu xạ gồm các điểm gọi là

nhiễu xạ. Mỗi nhiễu xạ tương ứng với một tập các mặt phẳng có khoảng cách đều

nhau bên trong tinh thể. Mật độ các electron bên trong tinh thể được xác định từ vị

trí và độ sáng của các nhiễu xạ khác nhau quan sát được khi tinh thể từ từ xoay

quanh chùm tia X; mật độ này, cùng với dữ liệu bổ sung (về thành phần hóa học),

cho phép ta xác định vị trí của các nguyên tử bên trong tinh thể. Nó có thể xác định

lực liên kết hóa học trung bình giữa các nguyên tử và góc giữa chúng trong khoảng

vài ngàn Ångström và vài chục độ.

Kĩ thuật nhiễu xạ tia X đơn tinh thể có 3 bước chính.

Bước 1: là thu thập một tinh thể tốt. Tinh thể phải đủ lớn (thường là lớn hơn

100 micron ở mọi chiều), không có tạp chất và có cấu trúc ổn định, không bị nứt nẻ.

Bước 2: đặt tinh thể vào trong đường đi của chùm tia X cực mạnh, thường có

bước sóng đơn (monochromatic X-rays), để tạo ra các mẫu nhiễu sắc. Tinh thể từ từ

xoay và dữ liệu được thu thập lại. Mỗi ảnh chứa hàng chục ngàn điểm nhiễu xạ với

các cường độ khác nhau.

Bước 3: dùng kĩ thuật tính toán và dữ liệu hóa học bổ sung để đưa ra mô

hình về sự sắp xếp các nguyên tử bên trong tinh thể.

231