LỜI CAM ĐOAN
Tôi cam đoan luận án này là kết quả nghiên cứu thực sự của cá nhân dưới sự
hướng dẫn của PGS.TS. Phạm Văn Tất, trường Đại học Hoa Sen và PGS. TS. Trần
Dương, trường Đại học Sư Phạm – Đại học Huế.
Luận án được thực hiện tại trường Đại học Khoa Học – Đại học Huế. Chưa từng
có kết quả nghiên cứu tương tự được công bố dưới bất cứ hình thức nào trước khi
thực hiện luận án. Một phần kết quả của công trình này đã được công bố trên: Tạp
chí Hóa học và Ứng dụng, Tạp chí Hóa học, Tạp Chí Khoa học và Công nghệ -
trường Đại học Khoa học – Đại học Huế, Tạp chí Đại học Huế, Tạp chí
Computational Chemistry, Cogent Chemistry, Taylor Francis, Tạp chí Organic &
Medicinal Chemistry International Journal (OMCIJ), Tạp chí Natural products
research.
Ký tên
Bùi Thị Phương Thúy
i
LỜI CẢM ƠN
Để hoàn thành luận án trước hết em xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS.
Phạm Văn Tất, Trường Đại học Hoa Sen; PGS. TS. Trần Dương, Trường Đại học
Sư Phạm Huế đã giao đề tài, hướng dẫn trực tiếp và truyền đạt những kinh nghiệm
và kiến thức quý báu, tận tình chỉ dẫn, động viên và tạo mọi điều kiện thuận lợi giúp
đỡ em hoàn thành luận án này.
Em xin gửi lời cảm ơn chân thành đến GS.TS. Trần Thái Hòa, TS. Trần Xuân
Mậu, TS. Nguyễn Thị Ái Nhung - Khoa Hóa, Trường Đại học Khoa Học Huế. Các
thầy cô đã giúp đỡ, động viên và chỉ dạy nhiều kiến thức quý báu trong quá trình
em học tập tại trường.
Em xin gửi lời cảm ơn các Thầy Cô trong Khoa Hóa, các Thầy Cô trong Khoa
Sau đại học và toàn thể Ban Giám hiệu Trường Đại học Khoa Học Huế đã cho phép
và tạo mọi thuận lợi cho em hoàn thành luận án này.
Em xin gửi lời cảm ơn đến TS. Phùng Văn Trung, TS. Hoàng Thị Kim Dung
Viện Hoá học – Viện Hàn lâm Khoa học và Công nghệ Việt Nam TP. Hồ Chí Minh
đã giúp đỡ em trong quá trình làm luận án.
Em xin gửi lời cảm ơn đến PGS.TS. Nguyễn Hùng Huy, Khoa Hoá, Trường Đại
học Khoa học Tự Nhiên – ĐHQGHN đã giúp đỡ, tận tình chỉ dẫn em trong quá
trình làm luận án.
Tôi xin gửi lời cảm ơn chân thành gia đình, bạn bè đã động viên, giúp đỡ cho tôi
hoàn thành luận án này.
Ký tên
Bùi Thị Phương Thúy
ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
ANOVA Phân tích phương sai
ARE, % Giá trị tuyệt đối của sai số tương đối
Bond Liên kết
Cal Tính toán (Calculation)
SKC Sắc kí cột
1H-1H (Correlation Spectroscopy)
COSY
d Đỉnh đôi (doublet)
dd Mũi đôi của mũi đôi (duplet of duplet)
DEPT Phổ DEPT (Distortionless Enhancement by Polarisation Transfer)
DMSO Dimethyl sulfoxide (CH3)2S=O
Exp Thực nghiệm (Experiment)
EtOAc Ethyl acetate (CH3COOC2H5)
EtOH Ethanol (C2H5OH)
E-State Trạng thái điện tử (electrotopological state)
Nồng độ thuốc ức chế 50% sự phát triển của tế bào gây ung thư GI50 (50% Growth Inhibition)
pGI50 pGI50= -log(GI50)
pGI50,exp Giá trị pGI50 thực nghiệm
pGI50,pr Giá trị pGI50 dự đoán
Phổ tương tác đa liên kết hai chiều dị hạt nhân (Heteronuclear HMBC Multiple Bond Vorrelation)
Phổ tương tác hai chiều trực tiếp dị hạt nhân (heteronuclear single HSQC quantum coherence)
HPV Vi rút u nhú ở người (Human Papillomavirus)
IR Phổ hồng ngoại (Infrared Spectroscopy)
iii
LV Biến ẩn (Latent Variables)
LogP Giá trị logarit hệ số phân tán
Linear Tuyến tính
m Mũi đa (multiplet)
MM+ Phương pháp cơ học phân tử MM
MARE, % Giá trị trung bình của ARE, %
MSE Sai số trung bình bình phương (Mean Squared Error)
MS Phổ khối (mass spectrometry)
MetOH methanol (CH3OH)
Nonlinear Phi tuyến tính
NMR Phổ cộng hưởng từ hạt nhân
OD Phương pháp đo mật độ quang (Optical Density)
PCA Phân tích thành phần chính (Principal Components Analysis)
PCR Hồi qui thành phần chính (Principal Components Regression)
PLS Bình phương cực tiểu riêng phần (Partial Least Squares)
Quan hệ định lượng cấu trúc - tính chất QSPR (Quantitative Structure - Property Relationship)
Quan hệ định lượng cấu trúc - hoạt tính QSAR (Quantitative Structure - Activity Relationship)
Quan hệ định lượng giữa cấu trúc điện tử và hoạt tính sinh học QESAR (Quantitative Electronic Structure - Activity Relationship)
Quan hệ định lượng giữa cấu trúc phổ NMR và hoạt tính sinh học QSDAR (Quantitative Spectrum Data - Activity Relationship)
Quan hệ định lượng cấu trúc - cấu trúc QSSR (Quantitative Structure - Structure Relationship)
Hệ số tương quan đánh giá chéo (Cross-validation correlation Q2 coefficient)
tr
R2 Hệ số tương quan R2 luyện
pr
R2 Hệ số tương quan R2 dự đoán
iv
hiệu chỉnh
ad
R2 R2
Hệ số lưu giữ (Retention Factor) Rf
Quan hệ cấu trúc hoạt tính (Structure - Activity Relationship) SAR
Đỉnh đơn (singlet) s
Sulforhodamine B SRB
Sắc ký SK
SKLM Sắc ký lớp mỏng
Mũi ba (triplet) t
Trichloroacetic acid TCA
Phổ UV (Ultraviolet Spectroscopy) UV
Hằng số ghép (Hz) (Coupling constant Hz) J (Hz)
1H-NMR
Phổ cộng hưởng từ hạt nhân proton (Hydrogen Nuclear Magnetic
Resonance)
13C-NMR
Phổ cộng hưởng từ hạt nhân cacbon 13 (Carbon Nuclear Magnetic
Resonance)
Độ dịch chuyển hóa học (chemical shift) tính bằng ppm (ppm)
QSARMLR QSARMLR phương trình 3.16 (3.16)
QSARMLR QSARMLR phương trình 3.17 (3.17)
QSARMLR QSARMLR phương trình 3.19 (3.19)
v
DANH MỤC CÁC BẢNG
Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30) ................................................. 63
Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone ................................................... 65
Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2
tr ............................................................................... 67
Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2
tr, R2
pr, SE ................................................................... 67
Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2
tr ..................................................................................... 68
Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2
tr và R2
pr ....................................................................... 68
Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2
tr và R2
pr ........................................................................... 69
Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2
tr .............................................................................. 69
Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê ................................................ 71
Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7) ........................................................... 72
Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các mô hình QESARMLR (với
k = 5 – 7) .......................................................................................................................................................... 73
Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN ........................................ 75
Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê ........................................................................... 76
Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch chuyển hóa học i trong các mô
hình QSDARMLR .............................................................................................................................................. 77
Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các mô hình QSDARMLR (với
k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1) ....................................................................................... 79
Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử............................................ 81
Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất nghiên cứu bằng mô hình
QSSRMLR và các chất dùng để dự đoán ........................................................................................................... 82
Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2
pred và MSE ...................................... 86
Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và GMPmxi,% đối với các tham số mô
tả phân tử 2D và 3D trong các mô hình QSARMLR (với k là 8, 9 và 10) .......................................................... 87
Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.16) và QSARANN(1) ..... 90
Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2
pred và MSE ...................................... 91
Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các tham số mô tả phân tử
2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7) ............................................................................... 92
Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.17), QSARPCR và
QSARPCA-ANN ................................................................................................................................................... 95
, SE và R2
Bảng 3.24 Các mô hình QSARMLR với các giá trị R2
tr
pr tương ứng .................................................. 97
Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của điện tích nguyên tử trong
các mô hình QSARMLR ..................................................................................................................................... 99
Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và
QSARANN(2) .................................................................................................................................................... 100
Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế bào Hela ở các nồng độ
khác nhau ....................................................................................................................................................... 112
vi
Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực nghiệm in vitro ................ 113
Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô hình QESARMLR và
QESARANN..................................................................................................................................................... 114
Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán từ mô hình QSDARMLR
(M1) và QSDARANN (M2) ............................................................................................................................. 116
Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn xuất flavone và isoflavone
tương tự được nghiên cứu từ mô hình QSSRMLR ........................................................................................... 118
Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR ............................................ 119
Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của các dẫn xuất flavonoid chiết
xuất. ............................................................................................................................................................... 120
Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các mô hình QSARMLR (3.16)
và QSARANN(1) .............................................................................................................................................. 121
Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình QSARANN(1 ............................. 122
Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập luteolin và daidzin từ các mô
hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN ....................................................................................... 123
Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô hình QSARPCA-ANN ) .... 124
Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và
QSARANN (2) .................................................................................................................................................. 125
Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn nhóm thế vào vị trí C6,
C3’ của quercetin, dự đoán từ mô hình QSARANN(2) ....................................................................................... 125
vii
DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính ................................................ 7
Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93] .................................................... 7
Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66] .............................................................................. 15
Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66] ............................................................................ 18
Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66] ................................................................................................... 19
Hình 1.6 Giải thích F-test [51, 66] .................................................................................................................. 20
Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107] ...................................................................... 24
Hình 1.8 Thành phần chính với p = 2 [51, 106] .............................................................................................. 27
Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106] ........................................................................................... 30
Hình 1.10 Sơ đồ giải thuật di truyền [10] ........................................................................................................ 34
Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76] .................................................. 36
Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76] ..................................... 36
Hình 1.13 Toán tử chéo đơn điểm [76] ........................................................................................................... 37
Hình 1.14 Toán tử chéo hai điểm [76] ............................................................................................................ 37
Hình 1.15 Hệ thống thần kinh sinh học tự nhiên ............................................................................................. 40
Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50] ....................................................................................... 41
Hình 1.17 Cấu trúc mạng nơ ron [101] ........................................................................................................... 42
Hình 1.18 Quá trình học của mạng nơ ron [16] ............................................................................................... 43
Hình 1.19 Mô hình tính toán một nơ ron [69, 77] ............................................................................................ 44
Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74] ............................................................................... 47
Hình 1.21 Một số dẫn xuất flavonoid [20, 74] ................................................................................................. 47
Hình 2.1 Sơ đồ nghiên cứu tổng quát .............................................................................................................. 51
Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2] ................................................................................... 54
Hình 2.3 Xây dựng các mô hình hồi quy đa biến ............................................................................................. 56
Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59] ........................................................................... 57
Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient ............................................................................... 64
Hình 3.2 Ảnh hưởng của k đến R2
và SE.......................................................................................................... 67
Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi .................................................................................. 72
Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính chất hóa lý ..................... 81
Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm ........................................................ 85
Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid trong nhóm kiểm tra ... 88
Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50 ............................................. 94
Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11 ................................................................................................. 102
Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7 ................................................................................................... 103
Hình 3.10 Cấu trúc POL1, C15H10O6 ............................................................................................................. 104
Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9 ......................................................................................... 106
Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50% .............................................. 107
viii
Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6 .......................................................................................... 108
Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50% ................................................ 109
Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) ....................................................................................... 110
Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các flavone, isoflavone mới và
chất mẫu ......................................................................................................................................................... 113
Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2] ................................................. 117
Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2] ......................................... 117
Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2 ..................................... 122
Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) POL1; b) GML1 ............ 123
Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) AIL1; b) CSL1 .............. 126
ix
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... i
LỜI CẢM ƠN ........................................................................................................... ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT........................................ iii
DANH MỤC CÁC BẢNG ...................................................................................... vi
DANH MỤC CÁC HÌNH VẼ............................................................................... viii
MỤC LỤC .................................................................................................................. x
MỞ ĐẦU .................................................................................................................... 1
1.1. BỆNH UNG THƯ CỔ TỬ CUNG........................................................................................... 4
1.1.1. Các nguyên nhân gây ung thư ......................................................................................... 4
1.1.2. Điều trị ............................................................................................................................. 5
1.1.3. Phòng ngừa ...................................................................................................................... 6
1.2. LIÊN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH ....................................................................... 6
1.3. TÍNH TOÁN THÔNG TIN CẤU TRÚC .................................................................................. 9
1.3.1. Cơ học phân tử ................................................................................................................ 9
1.3.2. Cơ học lượng tử ............................................................................................................... 9
1.3.3. Phương pháp bán thực nghiệm ...................................................................................... 11
1.4. CÁC MÔ HÌNH TOÁN HỌC ................................................................................................ 12
1.4.1. Hồi quy đa biến ............................................................................................................. 12
1.4.2. Hồi quy thành phần chính.............................................................................................. 22
1.4.3. Bình phương tối thiểu riêng phần .................................................................................. 25
1.4.4. Giải thuật di truyền ........................................................................................................ 31
1.4.5. Mạng thần kinh nhân tạo (ANN) ................................................................................... 39
1.4.5.1. Khái niệm ............................................................................................................................. 39
1.4.5.2. Cấu trúc mạng ....................................................................................................................... 40
1.4.6. Thống kê đánh giá mô hình ........................................................................................... 45
1.4.7. Tính toán đóng góp của các tham số ............................................................................. 46
1.5. HỢP CHẤT FLAVONOID .................................................................................................... 46
1.5.1. Giới thiệu chung ............................................................................................................ 46
1.5.2. Phân loại dẫn xuất flavonoid ......................................................................................... 47
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 4
x
1.5.3. Phân bố flavonoid trong tự nhiên .................................................................................. 48
1.5.4. Hoạt tính sinh học của flavonoid ................................................................................... 48
1.6. PHÂN LẬP VÀ XÁC ĐỊNH CẤU TRÚC FLAVONOID ....................................................... 50
1.6.1. Phân lập flavonoid ......................................................................................................... 50
1.6.2. Xác định cấu trúc flavonoid .......................................................................................... 50
1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên ................................................................ 50
2.1. SƠ ĐỒ NGHIÊN CỨU ......................................................................................................... 51
2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP .................................................... 52
2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử ..................................................................... 52
2.2.2. Nguyên liệu và phương pháp ......................................................................................... 52
2.2.2.1. Phần mềm ứng dụng ............................................................................................................. 52
2.2.2.2. Hóa chất, thiết bị ................................................................................................................... 52
2.2.2.3. Nguyên liệu .......................................................................................................................... 53
2.3. NGHIÊN CỨU LÝ THUYẾT ................................................................................................. 54
2.3.1. Phương pháp tính toán thông tin cấu trúc ...................................................................... 54
2.3.1.1. Cơ học phân tử...................................................................................................................... 54
2.3.1.2. Hóa lượng tử ......................................................................................................................... 54
2.3.1.3. Các tham số cấu trúc ............................................................................................................. 55
2.3.2. Xây dựng các mô hình QSAR ....................................................................................... 55
2.4. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN ............................................................. 56
2.4.1. Phân lập các hợp chất flavonoid .................................................................................... 56
2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid ........................................................ 58
2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân ........................................................................... 58
2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể .............................................................................................. 59
2.4.3. Kỹ thuật thử hoạt tính in vitro ....................................................................................... 59
2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B ........................................................................ 59
2.4.3.2. Nuôi cấy tế bào ..................................................................................................................... 60
2.4.3.3. Nhuộm SRB .......................................................................................................................... 61
2.4.3.4. Xử lý kết quả ........................................................................................................................ 61
2.4.3.5. Xác định GI50 ........................................................................................................................ 61
2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID .................................................. 62
CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ...................... 51
CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN ............................................................ 63
xi
3.1. NGHIÊN CỨU LÝ THUYẾT ................................................................................................. 63
3.1.1. Tính toán thông tin cấu trúc........................................................................................... 63
3.1.1.1. Khảo sát phương pháp cơ học phân tử.................................................................................. 63
3.1.1.2. Khảo sát phương pháp hóa lượng tử ..................................................................................... 64
3.1.2. Tham số cấu trúc và tính chất phân tử ........................................................................... 65
3.1.2.1. Điện tích .............................................................................................................................. 65
3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dịch chuyển hóa học .......................................................... 66
3.1.2.3. Tham số hóa lý ..................................................................................................................... 66
3.1.2.4. Tham số hình học 2D, 3D ..................................................................................................... 66
3.2. XÂY DỰNG MÔ HÌNH QSAR .............................................................................................. 66
3.2.1. Khảo sát các biến số mô hình ........................................................................................ 66
3.2.2. Xây dựng các mô hình QESAR ..................................................................................... 70
3.2.2.1. Mô hình tuyến tính QESARMLR ............................................................................................ 70
3.2.2.2. Mô hình mạng thần kinh QESARANN ................................................................................... 74
3.2.2.3. Kiểm tra khả năng dự đoán ................................................................................................... 75
3.2.3. Xây dựng các mô hình QSDAR .................................................................................... 75
3.2.3.1. Mô hình tuyến tính QSDARMLR ........................................................................................... 75
3.2.3.2. Mô hình mạng thần kinh QSDARANN ................................................................................... 78
3.2.3.3. Kiểm tra khả năng dự đoán ................................................................................................... 78
3.2.4. Xây dựng mô hình QSSRMLR ........................................................................................ 79
3.2.4.1. Nguyên tắc xây dựng ............................................................................................................ 79
3.2.4.2. Tính toán các tham số hóa lý ................................................................................................ 80
3.2.4.3. Xây dựng mô hình ................................................................................................................ 80
3.2.4.4. Kiểm tra khả năng dự đoán ................................................................................................... 84
3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1) ..................................................... 85
3.2.5.1. Dữ liệu .................................................................................................................................. 85
3.2.5.2. Xây dựng mô hình QSARMLR (3.16) .................................................................................... 85
3.2.5.3. Xây dựng mô hình QSARANN(1) ............................................................................................ 89
3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1) ........................................ 90
3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN ...................... 91
3.2.6.1. Dữ liệu .................................................................................................................................. 91
3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) ......................................................... 91
3.2.6.3. Xây dựng mô hình QSARPCA-ANN ......................................................................................... 94
3.2.6.4. Khả năng dự đoán của các mô hình ...................................................................................... 95
xii
3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2) ......................... 96
3.2.7.1. Dữ liệu .................................................................................................................................. 96
3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20) ..................................................... 96
3.2.7.3. Xây dựng mô hình QSARANN(2) ............................................................................................ 99
3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới .............................................................. 100
3.3. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN ........................................................... 101
3.3.1. Phân lập cynaroside từ actiso ...................................................................................... 101
3.3.2. Phân lập quercetin từ xa kê ......................................................................................... 102
3.3.3. Phân lập luteolin từ tía tô ............................................................................................. 103
3.3.4. Phân lập daidzin từ đậu nành ....................................................................................... 105
3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR........................................................... 105
3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X ........................... 106
3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió ..................................................... 107
3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR ........................ 107
3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo nhiễu xạ tia X ...... 109
3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ gừng gió . 110
3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên .......................... 111
3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CÁC FLAVONOID ................................................ 113
3.4.1. Mô hình QESAR ......................................................................................................... 113
3.4.2. Mô Hình QSDAR ........................................................................................................ 115
3.4.3. Mô hình QSSRMLR ....................................................................................................... 116
3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1) ................................................................ 121
3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN ............................................... 123
3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2) ...................................... 124
KẾT LUẬN VÀ KIẾN NGHỊ .............................................................................. 127
DANH MỤC CÔNG TRÌNH ............................................................................... 129
TÀI LIỆU THAM KHẢO .................................................................................... 131
PHỤ LỤC ............................................................................................................... 144
xiii
MỞ ĐẦU
Các phương pháp phòng và trị bệnh ung thư hiện nay như phẫu thuật, xạ trị,
hóa trị. Tuy nhiên các phương pháp này vẫn có những tác dụng phụ nhất định đối
với bệnh nhân. Nhu cầu về dược chất kháng ung thư có khả năng phòng và trị bệnh
đang rất lớn nhưng khả năng đáp ứng còn hạn chế [70, 71]. Các nhà khoa học, dược
học đã và đang quan tâm nghiên cứu, tìm kiếm các loại dược chất mới. Trong đó
nhóm flavone, isoflavone nói riêng là nhóm dược chất có nhiều trong thực vật với
hoạt tính kháng oxi hóa, kháng ung thư, kháng viêm, … hiệu quả [45, 104]. Các
nghiên cứu thực nghiệm trên thế giới và Việt Nam đã cung cấp một cơ sở dữ liệu
quý giá về nguồn dược chất trong tự nhiên, nhưng các nghiên cứu thực nghiệm
thuần túy còn nhiều hạn chế để tạo ra hợp chất có hoạt tính kháng ung thư hiệu quả,
nhanh chóng, kinh tế [41, 42]. Các nghiên cứu lý thuyết trên thế giới nói chung,
trong nước nói riêng về nhóm flavone và isoflavone có hoạt tính kháng ung thư cổ
tử cung còn khá khiêm tốn [90, 103]. Nghiên cứu mối quan hệ cấu trúc - hoạt tính
nhằm thiết kế các dẫn xuất flavone, isoflavone mới có hoạt tính được cải thiện; các
nghiên cứu lý thuyết là rất cần thiết để thúc đẩy và làm tiền đề cho các nghiên cứu
thực nghiệm, nhằm tìm kiếm các dược chất kháng ung thư hiệu quả [80, 90].
Trong nghiên cứu này, chúng tôi sử dụng các thông tin mô tả cấu trúc điện
tích nguyên tử, độ dịch chuyển hóa học, tính chất hóa lý, tham số 2D và 3D của
phân tử kết hợp các kỹ thuật phân tích hồi quy, mạng nơ ron, phân tích thành phần
chính, giải thuật di truyền, bình phương cực tiểu riêng phần để xây dựng các mối
quan hệ định lượng cấu trúc - hoạt tính (QSAR) [89]. Các flavonoid được xây dựng
và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Các tham số mô tả phân
tử 2D, 3D được sử dụng để xây dựng các mô hình đa biến như hồi quy tuyến tính đa
biến (MLR), phân tích thành phần chính (PCR), bình phương cực tiểu riêng phần
(PLS) và mạng nơ ron nhân tạo (ANN) [80, 90]. Xây dựng các mô hình QSAR
nhằm xác định những yếu tố tham số mô tả phân tử ảnh hưởng đến tác dụng kháng
ung thư cổ tử cung từ đó xác định hướng thiết kế phân tử mang lại hoạt tính cao hơn
[86, 90, 103]. Trong nghiên này cũng đã tiến hành chiết tách và phân lập flavonoid
1
từ gừng gió, đậu nành, tía tô, xa kê, actiso, một vài kỹ thuật phân tích hóa lý cũng
được sử dụng để xác định cấu trúc phân tử các dẫn xuất flavonoid. Các phân tử
flavonoid đã phân lập sẽ được dự báo hoạt tính, và sử dụng làm chất mẫu để thiết kế
hợp chất mới có hoạt tính cao hơn. Từ các cơ sở trên, chúng tôi nghiên cứu đề tài
“Thiết kế, sàng lọc một số dẫn xuất flavonoid và đánh giá hoạt tính gây độc lên
dòng tế bào Hela dựa vào các tính toán hóa lượng tử”.
Mục tiêu của luận án
Tính toán, sàng lọc các tham số mô tả phân tử gồm: tham số điện tích, độ
dịch chuyển hóa học, tính chất hóa lý, tham số 2D, 3D của các dẫn xuất flavonoid.
Xây dựng các mô hình quan hệ cấu trúc – hoạt tính có khả năng dự đoán hoạt tính
kháng ung thư của các dẫn xuất flavone và isoflavone có cấu trúc tương tự.
Sàng lọc, phân lập, xác định cấu trúc và thử nghiệm in vitro hoạt tính kháng
ung thư 6 hợp chất flavonoid từ actiso, xa kê, đậu nành, tía tô, gừng gió.
Thiết kế, sàng lọc các dẫn xuất flavone và isoflavone và đánh giá hoạt tính
kháng ung thư cổ tử cung cũng như các tính chất hóa lý của các dẫn xuất flavonoid
mới thiết kế từ flavonoid mẫu.
Ý nghĩa khoa học của luận án
Nghiên cứu này đã sử dụng các tính toán lý thuyết và xây dựng các mối quan
hệ định lượng cấu trúc - hoạt tính (QSAR). Các flavone và isoflavone được xây
dựng và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Điện tích nguyên
tử, độ dịch chuyển hóa học, các tính chất hóa lý và các tham số mô tả phân tử 2D,
3D từ các phương pháp lý thuyết được sử dụng để xây dựng các mô hình đa biến
như hồi quy tuyến tính đa biến (MLR), hồi quy thành phần chính (PCR), hồi quy
bình phương cực tiểu riêng phần (PLS) và mạng nơ ron nhân tạo (ANN). Các kỹ
thuật thực nghiệm chụp cộng hưởng từ hạt nhân, phổ khối lượng và kỹ thuật đo
nhiễu xạ tia X đơn tinh thể cũng được sử dụng để xác định cấu trúc phân tử các dẫn
xuất flavonoid chiết xuất.
Các mô hình QSAR được xây dựng nhằm xác định được những vị trí nguyên
tử ảnh hưởng đến tác dụng kháng ung thư cổ tử cung từ đó xác định vị trí tác dụng
mạnh để xem xét gắn nhóm thế nhằm tạo ra hợp chất mới và chọn lựa được những
2
hợp chất có hoạt tính cao. Ngoài ra với kỹ thuật QSAR có thể xây dựng các mô hình
khác nhau để dự đoán các tính chất hóa lý khác của các hợp chất. Từ công trình này,
có thể ứng dụng phương pháp, kết quả nghiên cứu trong các nghiên cứu thực
nghiệm, lý thuyết với sự hỗ trợ của công nghệ máy tính nhằm giảm thiểu đáng kể
chi phí cho các nghiên cứu thực nghiệm. Kết quả nghiên cứu của luận án mở ra
hướng nghiên cứu mới, phù hợp với định hướng nghiên cứu trên thế giới và Việt
Nam. Đây là cơ sở khoa học để áp dụng trong thiết kế, sàng lọc các hợp chất hữu cơ
có cấu trúc tương tự, đồng thời dự đoán hoạt tính sinh học và các tính chất hóa lý
của hợp chất làm tiền đề cho các quá trình thực nghiệm một cách hiệu quả.
Những đóng góp mới của luận án
Công trình này xác định được cấu trúc và thử hoạt tính pGI50 in vitro đối
với 6 hợp chất flavonoid phân lập từ lá tía tô, lá xa kê, lá actiso, hạt đậu nành và
củ gừng gió. Đã tính toán và sàng lọc các tham số mô tả cấu trúc phân tử như tham
số điện tích, tham số độ dịch chuyển hóa học, tham số 2D, 3D ảnh hưởng chính đến
hoạt tính kháng ung thư của các dẫn xuất flavonoid. Đã xây dựng và đánh giá thành
công khả năng dự báo của các mô hình QSAR. Các mô hình QESAR, QSDAR,
QSSR, QSARNMR, QSARANN, QSARPCA-ANN, QSARPCR, QSARPLS đã dự đoán được
hoạt tính kháng ung thư và tính chất hóa lý của các hợp chất mới được thiết kế từ
các chất mẫu và hợp chất tự nhiên. Hoạt tính kháng ung thư của các hợp chất mới
tốt hơn hoạt tính kháng ung thư của chất mẫu, hợp chất phân lập từ gừng gió, đậu
nành, tía tô, xa kê, actiso. Như vậy, việc tiến hành nghiên cứu xây dựng các mô
hình QSAR trong nghiên cứu này là một định hướng hữu ích trong nghiên cứu tìm
kiếm và tổng hợp các flavonoid khác nhau từ tự nhiên.
Cấu trúc của luận án gồm các phần sau
- Mở đầu - Chương 1: Tổng quan tài liệu - Chương 2: Nội dung và phương pháp nghiên cứu - Chương 3: Kết quả và thảo luận - Kết luận và kiến nghị - Danh mục các công trình liên quan đến luận án - Tài liệu tham khảo
3
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. BỆNH UNG THƯ CỔ TỬ CUNG
1.1.1. Các nguyên nhân gây ung thư
Ung thư là một tập hợp các bệnh liên quan đến sự phân chia tế bào một cách
mất kiểm soát, tiếp theo là quá trình các tế bào đó xâm lấn và di căn đến các mô
khác qua hệ thống bạch huyết và máu [6]. Giai đoạn di căn là nguyên nhân chính
gây tử vong của bệnh nhân ung thư. Hiện nay có trên 100 bệnh ung thư có loại từ
bắp thịt và xương, có loại từ da hoặc lớp lót của các cơ quan, có loại xuất phát từ
máu. Ở nam giới thường gặp ung thư phổi, gan, đại trực tràng, dạ dày, vòm hầu,
thanh quản, thực quản, tuyến tiền liệt, ung thư máu [58, 70]. Ở nữ giới thường gặp
ung thư vú, cổ tử cung, đại trực tràng, phổi, tuyến giáp, buồng trứng, gan, dạ dày,
thân tử cung, da [70]. Ung thư làm cho cơ thể bệnh nhân tử vong bằng nhiều cách,
nhưng đa số là làm cho cơ thể suy kiệt với các bệnh cơ hội. Trong đó, bệnh ung thư
cổ tử cung hình thành ở biểu mô cổ tử cung (cổ tử cung là cơ quan nối giữa âm đạo
với buồng trứng) [57, 96].
Ung thư cổ tử cung bắt đầu ở niêm mạc cổ tử cung, tại đây các tế bào phát
triển bất bình thường và khó kiểm soát dẫn đến hình thành khối u. Phụ nữ trong độ
tuổi từ 30 đến 59 thường dễ mắc bệnh hơn cả. Đây là căn bệnh có thể điều trị và
phòng ngừa nếu phát hiện sớm [96, 112].
Triệu chứng biểu hiện bệnh: âm đạo xuất huyết bất thường, có mùi khó chịu,
cơ thể bệnh nhân gầy gò, da trắng bệch, cơ thể đau nhức [32].
Điều trị bệnh: tuỳ theo giai đoạn phát triển của bệnh mà được điều trị theo
phác đồ khác nhau: giai đoạn 1 ung thư khu trú tại cổ tử cung; giai đoạn 2 ung thư
xâm lấn vùng lân cận; giai đoạn 3 ung thư xâm lấn xa hơn; giai đoạn 3 di căn sang
các bộ phận khác của cơ thể [96].
Giai đoạn 1 và 2: chỉ cần mổ và chiếu xạ thì khả năng khỏi bệnh sẽ rất cao, tỉ
lệ khỏi bệnh là 80 – 90%. Giai đoạn 3 và 4 chủ yếu là xạ trị, tỉ lệ khỏi bệnh rất thấp
từ 3 – 25 %, tuỳ theo mức độ nặng hay nhẹ của bệnh [96].
4
Các yếu tố bên ngoài gây bệnh ung thư bao gồm: các tia X, chất phóng xạ,
tia cực tím, hóa chất gây hư hại cấu trúc gen di truyền. Các sản phẩm công nghiệp
như: amiăng gây ung thư phổi; polivinylclorua gây ung thư gan; nitrosamin gây ung
thư bao tử; các phẩm màu trong bánh kẹo, hay một số sản phẩm trong thuốc nhuộm
tóc, các hoá chất kích thích trong chăn nuôi nhiễm estrogen cũng gây ung thư; thuốc
ngừa thai và các chất kích thích nội tiết tố như DES (diethylstilbestrol) có khả năng
gây ung thư; thuốc trừ sâu, rầy như DDT cũng có khả năng gây ung thư [23, 99]. Ô
nhiễm không khí: các hoá chất gây ô nhiễm không khí như CO2, hidrocacbon,
benzopiren, bụi amiăng, khói thuốc lá gây ung thư phổi [70]. Ngoài ra còn có độc
tố của nấm mốc chứa aflatoxin có trong nấm Aspergillus gây ung thư [26].
Các yếu tố do lối sống có thể là nguyên nhân gây bệnh ung thư như các hoá
chất trong thuốc lá gây ung thư phổi, rượu gây ung thư thực quản; chế độ ăn gây
ung thư: ăn nhiều mỡ động vật, bơ, ăn nhiều calo, ăn thiếu chất xơ, uống rượu, hay
sử dụng thực phẩm không an toàn là nguyên nhân gây ung thư [23, 62].
Yếu tố sinh học gây ung thư thể hiện ở một số ít căn bệnh ung thư ở người
được cho là do vi rút như ung thư gan, ung thư vòm họng, ung thư cổ tử cung [26].
Yếu tố di truyền gây ung thư chiếm tỉ lệ thấp, một số loại như ung thư mắt,
ung thư vú, có khuynh hướng dễ gặp trong cùng một gia đình. Tuy nhiên, yếu tố di
truyền không có tầm quan trọng về mặt thực tiễn [62].
1.1.2. Điều trị
Một số liệu pháp chính trong điều trị ung thư: phẫu trị là dùng lưỡi dao mổ
để loại bỏ tận gốc khối u; xạ trị là phương pháp sử dụng dùng tia phóng xạ tàn tiêu
diệt các tế bào ung thư; hoá trị là dùng hoá chất để tiêu diệt tế bào ung thư; liệu
pháp miễn dịch là liệu pháp tăng cường khả năng đề kháng tự nhiên của cơ thể để
kháng lại sự phát triển của tế bào ung thư [23, 58].
Phẫu thuật và xạ trị có ưu điểm là tấn công mạnh các loại ung thư thời kì còn
khu trú, nhưng phương pháp này không hiệu quả khi ung thư di căn trên cơ thể
người bệnh. Đối với phương pháp hoá trị chỉ cho kết quả tạm thời và không hiệu
5
quả. Liệu pháp miễn dịch chưa được nghiên cứu chuyên sâu nên chỉ là phương pháp
bổ trợ trong điều trị bệnh [58, 96].
1.1.3. Phòng ngừa
Biện pháp phòng ngừa ung thư bao gồm một số biện pháp như: Giảm thiểu
việc tiếp xúc với thuốc lá, rượu, hoá chất công nghiệp; thực hiện các biện pháp bảo
vệ cơ thể chặt chẽ khi tiếp xúc với tia phóng xạ; ngừa ung thư qua việc chọn lựa chế
độ ăn uống an toàn như không nên ăn một số thức ăn được khuyến cáo có thể gây
ung thư, thức ăn có chứa các hóa chất nguy hiểm và các hormon; khám sức khoẻ
định kỳ, tầm soát ung thư sớm đều đặn; tiêm vacxin ngừa ung thư; lối sống lành
mạnh [47, 99].
1.2. LIÊN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH
Liên hệ giữa cấu trúc – hoạt tính là nguyên tắc cơ bản nhất để xây dựng các
mô hình quan hệ cấu trúc – hoạt tính (QSAR) hay mô hình quan hệ cấu trúc – tính
chất (QSPR), mô hình quan hệ cấu trúc - cấu trúc để dự đoán tính chất vì cấu trúc –
tính chất - hoạt tính có mối quan hệ biện chứng với nhau, là các mối liên hệ nhân –
quả có thể được tính toán một cách chính xác và thiết lập theo những mô hình toán
học rõ ràng [17, 93]. Theo Testa và Kier, quan hệ định lượng cấu trúc – tác dụng là
tổng hòa các mối quan hệ thể hiện trên Hình 1.1. Trên cơ sở này nhiều kiểu mô
hình được xây dựng với các thông tin về cấu trúc khác nhau. Mô hình tổng quát
dạng QSXR: X có thể là A – hoạt tính (Activity); tính chất – P (Property); cấu trúc
– S (Structure) [17, 93].
Cấu trúc – tính chất không phải lúc nào cũng được phân định rõ ràng, nên
mối liên quan giữa chúng được biểu hiện bằng phần giao trên giản đồ Venn, Hình
1.2 [17, 93]. Tính chất – tác dụng có thể là một trong một số trường hợp nên mối
liên quan giữa tính chất và tác dụng cũng được diễn tả bằng giản đồ Venn có phần
giao. Cấu trúc – hoạt tính có sự phân định rõ ràng nên mối liên quan giữa cấu trúc
và tác dụng, điều này được mô tả bởi hai vòng tròn không có phần giao nhau mà
tiếp xúc tại một điểm.
6
Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính
Tính chất Cấu trúc
Tác dụng
Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93]
Theo quan điểm hóa học, một phân tử có tác dụng sinh học mang hai nhóm
chức: nhóm tác dụng (thường có cấu tạo đặc biệt) và nhóm ảnh hưởng (thường là
các nhóm có khả năng thay đổi tính chất lý hóa của phân tử như hydroxyl, halogen,
carboxyl, nitro, ...) [17, 93].
Theo quan điểm sinh hóa, một phân tử có tác dụng sinh học có 2 thành phần
chính: Khung phân tử đặc trưng cho tính chất lý hóa, còn nhóm chức quyết định
hoạt tính sinh học [17, 93].
Theo quan điểm hiện đại, phân tử hợp chất là một thể thống nhất (gồm các
nguyên tử tạo khung phân tử, nhóm chức...). Tác dụng sinh học không những do
7
cấu trúc phân tử trực tiếp quyết định mà còn gián tiếp chịu ảnh hưởng bởi các quá
trình như hấp thụ, vận chuyển, phân bố hay chuyển hóa của phân tử trong cơ thể
sinh vật [17, 93]. Do đó, khi nghiên cứu mô hình liên quan giữa cấu trúc với tác
dụng, cấu trúc với hoạt tính người ta không những phải khảo sát cấu trúc mà còn
xem xét những yếu tố ảnh hưởng.
Mô tả cấu trúc phân tử: cấu trúc hóa học là sự sắp xếp trong không gian của
các nguyên tử trong lượng mô tả hay thông tin cấu trúc [17, 93].
Mức hình học: cấu trúc phân tử có thể được trình bày dưới dạng 2 chiều
(thông tin cấu trúc gồm độ liên kết nguyên tử, cấu hình Z/E) hay 3 chiều (thông tin
cấu trúc gồm cấu hình tương đối cũng như cấu hình tuyệt đối). Các thông tin của
cấu trúc 2 chiều (2D) và 3 chiều (3D) hữu ích cho nghiên cứu mối liên quan định
lượng cấu trúc và tác dụng [17, 93].
Mức lập thể điện tử: đó là vật thể có thể tích và hình thù nhất định như cấu
trúc lập thể có tính chất cơ động hay là cấu trúc lập thể với sự phân bố mật độ điện
tử của các nguyên tử [17, 93]. Các thông tin cấu trúc bao gồm thể tích, diện tích bề
mặt, sự thay đổi cấu dạng, sự phân bố điện tử, thế tĩnh điện phân tử, .... Các thông
tin này có thể có từ tính toán trên máy tính, đặc biệt là sử dụng các phương pháp
hóa lượng tử.
Mức tương tác với môi trường: cấu trúc phân tử thể hiện hoạt tính, độc tính,
điểm chảy, điểm sôi, khả năng solvat hóa, tính chất sắc ký, hệ số phân bố, độ tan, áp
suất tới hạn, v.v, trong môi trường sinh học [17, 93].
Cấu trúc phân tử ảnh hưởng đặc biệt quan trọng đối với hoạt tính sinh học,
đó là chìa khóa quan trọng để thiết lập mối quan hệ giữa cấu trúc và hoạt tính. Sự
phát triển của mối liên hệ này làm nền tảng để xây dựng các mô hình có khả năng
dự đoán. Với một chuỗi các hợp chất có cấu trúc tương tự, có thể xây dựng các mô
hình quan hệ giữa cấu trúc - hoạt tính (QSAR) [17, 93].
8
1.3. TÍNH TOÁN THÔNG TIN CẤU TRÚC
1.3.1. Cơ học phân tử
Trong các phương pháp lý thuyết liên quan đến việc tối ưu hóa hình học của
cấu trúc thì phương pháp cơ học phân tử (Molecular Mechanic - MM) khá thông
dụng. Phương pháp MM có thể tính toán chính xác về cấu trúc hình học và năng
lượng tương đối của các phân tử lớn vượt quá khả năng đối với các phương pháp
hóa lượng tử [25].
Năng lượng của phân tử trong trường được tính theo phương trình 1.1 [25]:
E = Eb + Ea + Et + Ev + Eh + Ee (1.1)
Trong đó: Eb là năng lượng do sự biến dạng liên kết; Ea là năng lượng do sự
khép mở góc liên kết; Et là năng lượng do sự xoay quanh liên kết; Ev là năng lượng
tương tác van der Waals; Eh là năng lượng do liên kết hydrogen; Ee là năng lượng
tương tác tĩnh điện.
Giữa cấu trúc và năng lượng có sự liên quan mật thiết với nhau, do đó tối ưu
hóa hình học của cấu trúc sẽ dẫn đến tối thiểu hóa năng lượng của phân tử [102].
Quá trình này tạo một cấu trúc ứng với trạng thái năng lượng tối thiểu (tối ưu về
hình học hay bền về năng lượng) để từ đó có thể xem xét tọa độ của các nguyên tử
của phân tử. Cấu trúc tối ưu về hình học hay bền về năng lượng có thể sử dụng để
tính toán phương pháp lượng tử: phương pháp nguyên lý ban đầu (ab-initio) hay
phương pháp bán thực nghiệm [60] [100].
1.3.2. Cơ học lượng tử
Cơ học lượng tử (Quantum Mechanic - QM) là mô tả toán học chính xác của
trạng thái điện tử và tính chất hóa học. Về lý thuyết, QM có thể dự đoán chính xác
bất kỳ tính chất nào của từng nguyên tử hoặc phân tử [60, 100]. Trong thực tế,
phương pháp QM chỉ được giải quyết chính xác cho một hệ thống điện tử [60,
100]. Vô số các phương pháp đã được phát triển cách giải gần đúng cho các hệ
thống đa điện tử. Hai phương trình QM được phát triển bởi Schrödinger và
Heisenberg. Phương trình Schrödinger là phương trình cơ bản cho hầu hết các
phương pháp hóa tính toán [60, 100].
9
Ĥ = E (1.2)
Trong phương trình Schrödinger Ĥ là toán tử Hamiltoni, là hàm sóng, E là
năng lượng. Phương trình này được gọi là phương trình riêng. được gọi là hàm trị
riêng, E là trị riêng.
Hàm sóng là hàm xác định vị trí của electron và hạt nhân. Electron được
mô tả như một hàm sóng. Nó mô tả xác suất của trạng thái điện tử. Như vậy, nó có
thể mô tả xác suất tìm thấy các electron ở các vị trí nhất định, nhưng nó không thể
đoán chính xác vị trí điện tử. Hàm sóng cũng được gọi là mật độ xác suất bởi vì
bình phương của hàm sóng là hàm xác suất. Đây là ý nghĩa chính xác của hàm sóng.
Để có được một giải pháp vật lý thích hợp có liên quan của phương trình
Schrödinger, hàm sóng phải liên tục, đơn trị [60, 100].
Toán tử Hamilton Ĥ
(1.3)
(1.4)
Với là toán tử Laplac đối với hạt (p) i, các hạt gồm cả điện tử và hạt
nhân, mi và qi là khối lượng và điện tích hạt i, p là tổng số hạt, rij là khoảng cách
giữa các hạt. Số hạng đầu tiên biểu thị cho động năng của hạt trong một phương
trình sóng. Các số hạng bổ sung có thể xuất hiện trong toán tử Hamiltonion tương
tác với bức xạ điện từ hoặc trường được tính đến. Trong phần mềm QSARIS hiện
có, toán tử Hamiltonion ở trên là gần như chưa từng được sử dụng. Vấn đề có thể
được đơn giản hóa bằng cách tách các chuyển động hạt nhân và electron. Điều này
được gọi là xấp xỉ Born – Oppenheimer. Toán tử Hamilton cho một phân tử với các
hạt nhân tĩnh là:
(1.5)
10
Ở đây chỉ xét động năng của electron và lực hút giữa electron và hạt nhân và
lực đẩy của các điện tử. Sự chuyển động của hạt nhân có thể được mô tả bằng cách
xem xét toàn bộ tính toán thế năng khi các hạt nhân di chuyển [60, 100].
Khi hàm sóng đã được xác định, bất kỳ thuộc tính nào của phân tử đều có thể
được xác định. Điều này được thực hiện bằng cách tính giá trị mong muốn của toán
tử cho tính chất đó, được biểu thị bằng dấu ngoặc vuông < >. Ví dụ, năng lượng là
giá trị kỳ vọng của toán tử Hamilton được đưa ra bởi:
(1.6)
Đối với một hàm sóng gần đúng, có thể tính xấp xỉ năng lượng, đó là cơ sở
cho nhiều kỹ thuật được mô tả trong các tính toán khác. Bằng cách thay thế các toán
tử khác, có thể có được các tính chất quan sát rõ ràng, chẳng hạn như moment lưỡng
cực hoặc mật độ electron. Một cách khác để có được tính chất phân tử là sử dụng
định lý Hellmann-Feynman. Định lý này khẳng định rằng các thuộc tính năng lượng
với tính chất P mong muốn được cho bởi:
(1.7)
Mối quan hệ này thường được sử dụng để tính toán tính chất electron. Không
phải tất cả phương pháp xấp xỉ tuân theo định lý Hellmann-Feynman. Chỉ các
phương pháp biến thể tuân theo định lý Hellmann-Feynman [60, 100].
1.3.3. Phương pháp bán thực nghiệm
Các phương pháp bán thực nghiệm sử dụng trong luận án gồm phương pháp
CNDO, INDO, MNDO, AM1, PM3, TNDO (Phụ lục 60) [60, 100].
Phương pháp QM dùng để tính toán các thông tin cấu trúc phân tử như: điện
tích (Qi), cấu trúc phổ NMR (i), tham số hóa lý, …. Phương pháp hóa lượng tử
được chọn phải phù hợp với đối tượng nghiên cứu, mức độ chính xác, thời gian tính
toán cũng như kích thước của hệ [60, 100]. Các tham số cấu trúc phân tử được tính
toán được đưa ra ở Phụ lục 58.
11
1.4. CÁC MÔ HÌNH TOÁN HỌC
1.4.1. Hồi quy đa biến
Trong hồi quy, các biến số độc lập x và biến phụ thuộc y là các giá trị quan
sát. Tương ứng với một giá trị của x chỉ có 1 giá trị y duy nhất lúc này y là hàm của
x có dạng (y = f (x)) [51, 66]. Tuy nhiên, chúng ta hay gặp trường hợp cùng một giá
trị x trong các thí nghiệm có thể có các giá trị y khác nhau do ảnh hưởng của các
yếu tố khác. Khi đó sự phụ thuộc được gọi là xác suất và các giá trị y là một hàm
với các giá trị ngẫu nhiên. Nếu chỉ có trường hợp Y là biến ngẫu nhiên rời rạc và X
là giá trị rời rạc, để xác định y bằng cách sử dụng phân phối như ma trận sau:
X Y … x1 x2 xm
… y1 p1(x1) p1(x2) p1(xm)
… y2 p2(x1) p2(x2) p2(xm)
… … … … …
… yN pN (x1) pN (x2) pN (xm)
Trong đó xk (k = 1, 2, …, m) là các giá trị có thể có của X, yi (i = 1, 2, ..., N)
là các giá trị có thể có Y và pi(xk) là xác suất xuất hiện của yi nếu X = xk , với k bất
kỳ, ta có đẳng thức sau:
(1.8)
Giả sử Y/(X = xk) là biến ngẫu nhiên tương ứng với giá trị của xk. Phân bố
nằm trong cột thứ k của ma trận. Các giá trị trung bình (M) của biến Y được tính:
(1.9)
Và các giá trị X khác nhau, được xem như hàm . Hàm g(X)
được gọi là hàm hồi quy của Y đối với X.
Như đề cập ở phần trên cho trường hợp phụ thuộc ngẫu nhiên của biến Y với
nhiều biến độc lập X1, X2, …, Xp, sự phân bố của Y trong trường hợp này được mô tả
12
bằng xác suất , với là các giá trị khác nhau của các biến X1, X2,
…, Xp. Khi X1 = x1, X2 = x2, …, Xp = xp các giá trị trung bình của Y có dạng:
(1.10)
Các biến X1, X2, …, Xp, là hàm g(X1, X2, …, Xp):
(1.11)
Hàm g(X1, X2, …, Xp) là hàm hồi quy đa biến của Y với các biến độc lập X1, X2,
…, Xp.
Để xây dựng hàm hồi quy của các biến ngẫu nhiên Y phụ thuộc X1, X2, …, Xp,
trên thực tế điều đó là không thể, vì xác suất pi(xk1, xk2, …, xkp) thường không xác
định. Vấn đề đặt ra là xây dựng hàm toán từ hàm g(X1, X2, …, Xp), như
hàm được gọi là mô hình hồi quy tương quan với hàm g cho bởi
phương trình 1.12 [51, 66]:
(1.12)
Với e(X1, X2, …, Xp) là sai số của mô hình.
Mô hình hồi quy được xây dựng trên cơ sở dữ liệu thống kê giữa biến phụ
thuộc Y trên X1, X2, …, Xp. Các giá trị quan sát được trình bày theo ma trận sau:
k … Y X1 X2 Xp
1 … x11 x12 x1p y1
2 … x21 x22 x2p y2
… … … … … …
N … xN1 xN2 xNp yN
Mỗi hàng trong ma trận đại diện cho mỗi quan sát cụ thể (thí nghiệm) được
gọi là mẫu hoặc trường hợp. Các biến độc lập đóng vai trò là một phần của biến dự
đoán, phụ thuộc vào giá trị của chúng, giá trị quan sát Y là các giá trị ngẫu nhiên
(hoặc thuật toán để khác nhau [51, 66]. Vấn đề chọn dạng của hàm
tính toán) để xây dựng mô hình hồi quy là khó khăn nhất. Việc chọn mô hính hồi
quy phải thỏa mãn hai yếu tố sau:
13
1. Hàm mô phỏng phải đại diện được cho hàm hồi quy.
2. Việc tính toán các giá trị của hàm phải dựa trên khả năng đáp ứng của nguồn
dữ liệu tính toán có sẵn.
Nếu mô hình được chọn, giá trị của nó trong trường hợp thứ
k bằng và được xem là giá trị dự đoán của yk. Sự khác biệt giữa
là độ lệch (sai số): . yk và
Các biến độc lập X1, X2, …, Xp ở trên đã được xác định. Khi nhiều thí nghiệm
được thực hiện, các biến độc lập có các giá trị khác nhau (cột trong ma trận). Vì
vậy, có thể xem các biến này là biến ngẫu nhiên và giá trị dự báo Y1, Y2, …, Yp là dựa
trên các biến ngẫu nhiên [51, 66]. Theo quan điểm toán học, điều quan trọng không
phải các giá trị dự đoán là ngẫu nhiên hay không. Trong tất các các tính toán, các
giá trị dự đoán có tính chất tổng quát. Nó giải thích các số hạng cụ thể cho các giá
trị ngẫu nhiên được chuyển sang các giá trị dự đoán xác định. Hơn nữa chúng ta
không chú ý đến các giá trị dự đoán sử dụng.
Các giá trị dự đoán và giá trị quan sát ngẫu nhiên Y, các tham số của các mô
hình được tìm thấy là kết quả của kinh nghiệm lấy mẫu ngẫu nhiên. Vì vậy các tham
số của mô hình cũng được coi là biến ngẫu nhiên [51, 66].
Dạng đơn giản và phổ biến nhất được sử dụng trong mô hình hồi quy tuyến
tính là:
(1.13)
Ở đây là các hàm cơ bản và bi là các hệ số (hoặc các yếu
tố) tính được sao cho mô hình được xây dựng tốt nhất.
Trong thực tế, nếu có nhiều biến độc lập, mô hình tuyến tính của dạng:
, (1.14)
Với được gọi là hệ số tự do trong mô hình.
14
Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66]
Việc lựa chọn các hệ số hồi quy bk đảm bảo tính thích hợp lớn nhất cho mô
hình tuyến tính được xây dựng. Để giải quyết vấn đề này, phương pháp tốt sử dụng
phương pháp bình phương cực tiểu. Lúc này hệ số bk được tìm kiếm từ một điều
kiện để giảm thiểu tổng bình phương độ chênh lệch giữa các giá trị quan sát được
và dự đoán của biến phụ thuộc:
(1.15)
Với (1.16)
Khi p = 2 minh họa hình học đơn giản của phương pháp bình phương cực
tiểu Hình 1.3. Ví dụ, hình ảnh trên cho thấy không gian tiếp cận sự phụ thuộc giữa
hai biến độc lập X1, X2 và biến phụ thuộc Y.
Hồi quy thường là phương pháp đơn giản nhất trong phân tích hồi quy. Nó
được sử dụng để giải quyết các trường hợp với số lượng biến độc lập nhỏ, không
tương quan chặt chẽ [51, 66]. Tuy nhiên, phương pháp này tạo cơ sở để hiểu các
phương pháp hồi quy khác phức tạp hơn. Chúng ta hãy xem xét các ma trận sau đây
đại diện cho các kết quả quan sát:
15
Với Xj là cột thứ j được xem là vec tơ dự đoán và Y là vec tơ biến phụ thuộc.
Giá trị trung bình được tính cho mỗi biến Xj theo phương trình:
(1.17)
và độ lệch chuẩn có dạng sau:
(1.18)
Hệ số tương quan được tính cho các cặp biến khác nhau dưới dạng sau:
(1.19)
Các hệ số tương quan này tạo thành một ma trận tương quan mẫu.
Cột thứ nhất X0 được đưa vào trong ma trận nếu một hệ số trong (1.14) khác
không. Giả sử bỏ qua cột X0. Có thể thu được bằng cách căn giữa các dữ liệu theo
cách sau: , với là giá trị trung bình của biến .
Cách đơn giản nhất để hiểu được bản chất của hồi quy đa biến thường là xem
xét một ví dụ đơn giản với p = 2 và N = 3 với minh họa hình học cụ thể.
Xét ma trận X = (X1 X2) trong đó bao gồm các vec tơ trung tâm dự đoán và
vector Y là một vec tơ trung gian dự đoán. Chúng ta có:
Mô hình hồi quy có dạng , với . Vì vậy, vec
tơ trong không gian P được biểu thị qua các vec tơ X1, X2 (Hình 1.4). Véc tơ độ
lệch: . Chiều dài của vec tơ này là:
(1.20)
Chiều dài này là cực tiểu nếu véc tơ e trực giao với không gian P, nghĩa là
trực giao với vec tơ X1, X2. Điều kiện trực giao có dạng sau:
16
, hay (1.21)
Với là vec tơ chuyển vị của (vec tơ hàng) và là ma trận chuyển vị
của ma trận X.
Từ mối quan hệ thứ hai ta có cách tính các hệ số hồi quy:
(1.22)
Với ma trận gồm các yếu tố:
. (1.23)
Giá trị trung bình của ma trận C tỷ lệ thuận với ma trận hiệp phương sai của
ma trận vec tơ dự báo .
Yếu tố của ma trận C là các yếu tố trong của ma trận . Vì vậy
bằng chiều dài của vec tơ . Ta có:
với φij là góc giữa hai vec tơ Xi, Xj.
Vì vậy, góc giữa hai vec tơ (Hình 1.4) nghĩa là gần 1 (tức
là có tương quan mạnh mẽ giữa các giá trị dự đoán). Ngược lại, nếu không
tương quan, thì các vec tơ tương ứng trực giao. Trường hợp này xảy ra khi các vec
tơ nằm trong không gian siêu phẳng (hiện tượng đa cộng
tuyến), hiện tượng đa cộng tuyến dẫn đến sự suy biến của ma trận C và kết quả là
khó khăn trong thiết lập phương trình (1.23).
17
Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66]
Nếu ma trận C không suy biến, vec tơ b được tính theo phương trình sau:
(1.24)
Công thức cho hệ số hồi quy (1.24) đúng trong trường hợp số lượng biến
trong mô hình bằng p. Xác định hệ số bk được coi là ước lượng thống kê của các hệ
số ngẫu nhiên của hệ số bk trong mô hình tuyến tính (1.14). Một số trường hợp bk
ước tính với giá trị nhỏ ( ). Điều đó chỉ ra rằng bk = 0 (biến không phụ thuộc
biến Xk) và giá trị bk khác không, được xác định từ dữ liệu nhiễu ban đầu. Vì vậy,
cần kiểm tra mức độ ý nghĩa của biến Xk (hoặc của hệ số Bk) trong mô hình được
xem xét [51, 66]. Theo quan điểm thống kê, có nghĩa là cần kiểm tra giả thuyết H0:
[ bk = 0]. Cách đơn giản nhất để minh họa cho nguyên tắc chung của việc kiểm tra
một giả thuyết như vậy là đưa ra một ví dụ về một mô hình một chiều , với
X1 và Y là các giá trị trung bình có ý nghĩa [51, 66]. Về mặt hình học các giá trị X1
và Y không tương quan có nghĩa là các vectơ X1 và Y trực giao. Tuy nhiên, vì quan
sát là ngẫu nhiên, các vectơ X1 và Y có thể không hoàn toàn trực giao, sẽ dẫn đến
một hệ số hồi quy khác không b1 (Hình 1.5).
nhỏ. Độ lớn của góc này có thể được ước Nếu giả thuyết H0 đúng, góc
lượng:
(1.25)
18
Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66]
Tuy nhiên, trong thống kê, xem xét bình phương trung bình sẽ thuận tiện
hơn, có nghĩa là tính tổng của bình phương theo bậc tự do được xem xét.
Bậc tự do DF đặc trưng số lượng các tham số độc lập, ảnh hưởng đến độ lớn
của tổng bình phương. Với tổng bình phương hồi quy SS(hồi quy) độ tự do hồi quy
DF(hồi quy) bằng 1, vì tổng được xác định bởi giá trị của tham số
, độ tự do DF(quan sát) bằng N-1, bởi vì đơn b1. Vì vậy SS(quan sát), bằng
các giá trị quan sát trung tâm được tính bởi phương trình: . Nghĩa là N-1
biến độc lập. Ta có liên hệ sau: SS(quan sát = SS(hồi quy) + SS(dư). Từ đó ta có:
DF(quan sát) = DF(hồi quy) + DF(dư). Vì vậy, SS(dư) có bậc tự do DF(dư) bằng
N-2. Do đó, độ lệch của vector Y trực giao với vector X, (tức là giả thuyết
đúng), theo thống kê sau đây [51, 66]:
(1.26)
Thống kê này được gọi là chuẩn F
Chúng ta hãy xem xét các giả định sau liên quan đến các biến ngẫu nhiên
:
1. ei độc lập với nhau;
. 2. ei có phân phối chuẩn giống nhau
Vì vậy chuẩn F có phân bố F với (1, N-2) bậc tự do.
19
Nếu giả định H0 với b1 bằng 0 là đúng F lớn với xác xuất bé. Chúng ta có thể
chỉ định giới hạn DF(α), có thể vượt quá tiêu chí F chỉ với một xác suất nhỏ. Nếu
giá trị của thống kê F, được tính theo công thức (1.26), lớn hơn DF(α), nó có nghĩa
là giả thuyết H0 sai, các hệ số hồi quy b1 có ý nghĩa [51, 66].
Kiểm tra ý nghĩa biến có thể được khái quát theo các cách khác nhau trong
trường hợp có nhiều biến. Một trong những biến thể của khái quát này đang xem xét
một phần thử nghiệm F-test.
Hình 1.6 Giải thích F-test [51, 66]
Giả sử rằng phương trình hồi quy với hai biến thu được bằng phép chiếu
chính xác của vector Y trong không gian được kéo dài qua các vectơ (Hình
1.5). Phương trình hồi quy này như sau:
(1.27)
Trong trường hợp này, tổng bình phương các giá trị hồi quy bằng với bình
phương của vector được xác định bởi các hệ số :
(1.28)
Nếu chúng ta xem xét mô hình với biến đã lược bỏ X2, giá trị dự đoán sẽ có
dạng sau: , với thu được bằng phép chiếu của véc tơ Y đến vec tơ
khác hệ số X1 (Hình 1.6). Khi đó, hệ số . Khi vec tơ X1 và X2 trực giao (tức
là ), điều đó là ngoại lệ, khi đó . Tổng bình phương do giá trị dự
20
đoán từ hồi quy trong trường hợp thứ hai bằng với chiều dài bình phương của véc tơ
được xác định bởi hệ số . Tổng bình phương này có dạng sau:
(1.29)
Số bình phương phần dư bằng hiệu giữa tổng bình phương trong trường hợp
thứ nhất và thứ hai (nó là hiệu bình phương Hình 1.6) [51, 66]. Giá trị
này gọi là ‘tổng bình phương b2 và b1’ theo phương trình:
(1.30)
Có nghĩa là mô tả tổng dư X2 trong mô hình hồi quy hoặc ý nghĩa
của hệ số hồi quy b2. Kiểm tra ý nghĩa thống kê của hệ số b2 (nghĩa là kiểm tra giả
thuyết ) với kiểm định F-test trong trường hợp cụ thể này được gọi là
một phần F2/1-test và có dạng sau [51, 66]:
(1.31)
Nói chung, hai mô hình được xem xét tương ứng với các biến sau:
và (q
bằng:
(1.32)
Giá trị F tương ứng là:
(1.33)
Thống kê có phân bố sau đây: F(p-q, N-p), để có thể kiểm tra
giả thuyết tại α. Giá trị BF(α) có thể được tính toán bởi một
hàm chuẩn trong Microsoft Excel FDISTINV( ; p-q; N-p). F được sử dụng trong
hồi quy từng bước để thăm dò các biến quan trọng [51, 66].
Một phương pháp ước lượng các hệ số hồi quy là tính các khoảng tin cậy.
Lúc này kiểm định t tính đối với hệ số bk theo công thức:
21
(1.34)
Với SE(bk) là độ lệch chuẩn của hệ số bk, tính toán theo công thức:
(1.35)
Với akk là một phần tử chéo của ma trận A. Ma trận A là ma trận nghịch đảo
của ma trận của đánh giá chéo độ lệch các biến [51, 66].
Hệ số bk là một giá trị mẫu của biến ngẫu nhiên Bk. Khoảng tin cậy cho biến
ngẫu nhiên Bk có thể được tính theo biểu thức sau đây:
Với là một phần tư của thứ tự với t-distribution (phân phối
Student) với độ tự do N-1.
Nếu khoảng tin cậy này chứa a điểm 0, khi đó hệ số bk có nghĩa. Điều
kiện tương đương với : . Khi đó hệ số bk
có thể được coi là quan trọng ở một giá trị khá lớn t(bk), cụ thể là, khi chúng ta có
các điều kiện sau:
(1.36)
Điều kiện (1.36) được gọi là hai phía phân bố t. Quan hệ giữa phân bố t và
phân bố F theo (1.37).
(1.37)
1.4.2. Hồi quy thành phần chính
Phương pháp tính toán phân tích hồi quy cho một biến phụ thuộc dựa trên
một tập hợp các thành phần chính được tính toán từ các biến độc lập. Phương pháp
thành phần chính hữu ích khi các biến độc lập đa lớp hoặc tương quan cao với nhau.
Điều này thường có thể được biết khi thực hiện một số chương trình hồi quy khác.
Sự đa cộng tuyến giữa các biến độc lập cho thấy sự tương quan giữa chúng. Sự
tương quan này được tính thông qua các điểm riêng của ma trận hiệp phương sai
hoặc ma trận chéo [52, 107].
22
là ma trận với cột là các vec Giả sử X = (X1 X2 … Xp)
tơ . Ma trận chéo đối xứng và không xác định được.
Vì vậy, có các cặp vec tơ song song , với p là số biến số z. Các vec tơ
riêng tương ứng với các giá trị dương .
. (1.38)
Các giá trị riêng và vec tơ riêng trong ma trận chéo được tính toán theo
phương pháp Jacobi trong QSARIS.
Các vector p, được gọi là các thành phần chính của quan sát:
. (1.39)
Từ phương trình (1.38) và (1.39) và các thành phần chính trực giao và độ dài
của chúng được :
.
Nếu các thành phần chính được xem như là các vector của một biến độc lập
mới Wk, các mối quan hệ đã đề cập có nghĩa là các biến này là cặp không tương
quan và chúng có chênh lệch bằng [52, 107].
Tương quan giữa các biến độc lập gốc Xk (dự báo) và các thành phần chính
Wk có thể được biểu diễn dưới dạng sau:
W=XZ hay X = WZ’ (1.40)
Trong đó W là ma trận với cột và Z là một ma trận trực
giao với các cột tương đương với các vec tơ riêng
, .
Từ phương trình (1.40) các vec tơ của các biến độc lập Xk là các thành phần
chính theo phương trình sau:
hay (1.41)
và các điểm thành phần chính có giá trị:
23
hay (1.42)
Ý nghĩa hình học của các thành phần chính của một quan sát khi p = 2 và N
= 3. Các thành phần chính w1 và w2 nằm trong cùng mặt phẳng với các vec tơ của
biến độc lập X1 và X2. Góc giữa X1 và X2 nhỏ. Điều đó có nghĩa là các vec tơ này
tương quan chặt chẽ. Đồng thời, các thành phần chính w1 và w2 trực giao với nhau
(không tương quan) và bình phương của chiều dài của chúng bằng với các giá trị
riêng tương ứng của ma trận C, Hình 1.7 [52, 107]. Hồi quy riêng phần tương quan
với w1 theo phương trình: và tương quan với w2 theo phương
trình . Vec tơ dự đoán có dạng:
(1.43)
Bình phương độ dài của vec tơ ảnh hưởng đến giá trị R2 và trực giao của w1 và w2
được tính toán theo phương trình:
(1.44)
. Vec tơ này đóng góp Vec tơ w1 dài, nó tương ứng với trị riêng lớn hơn
quan trọng vào giá trị dự đoán.
Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107]
Vì vậy, mô hình hồi quy được xây dựng với các biến tương ứng có giá trị
riêng lớn hơn. Các biến khác được đưa vào mô hình có tổng tích lũy của các giá trị
riêng gần với tổng của tất cả các giá trị riêng. Rõ ràng không nên xem xét các thành
phần chính tương ứng với các giá trị riêng bằng không. Các điều kiện cần có: các
24
thành phần chính có giá trị riêng thấp thì không đạt yêu cầu. Hệ số hồi quy thành
phần chính được tính toán cho biến Y:
(1.45)
Với C là ma trận chéo mở rộng và Cp+1 là cột thứ (p+1) của ma trận mục tiêu
của biến phụ thuộc. Tương quan giữa thành phần chính wk với biến phụ thuộc Y =
Xp+1 được tính:
(1.46)
Với là sai số của Y.
Ý nghĩa của các thành phần chính trong mô hình được đánh giá thông qua
giá trị F. Nó được thể hiện thông qua giá trị RSS
(1.47)
Tổng bình phương độ lệch của mô hình với k thành phần chính được tính:
(1.48)
Với tổng giá trị hồi quy F với k thành phần chính được tính:
(1.49)
Và F của thành phần chính thứ k được tính:
(1.50)
1.4.3. Bình phương tối thiểu riêng phần
Giống như PCR, bình phương tối thiểu riêng phần (PLS) tạo ra một chuỗi
các mô hình và ước tính nào là tốt nhất với các biến ẩn. Tuy nhiên, tập hợp các mô
hình tạo thành trình tự có trật tự, khác với các mô hình được xây dựng bởi PCR. Giả
sử X = (X1 X2 … Xp) là một ma trận có các cột là vectơ của quan sát trung tâm và
quan sát hiệu chỉnh sai lệch . là một ma trận chéo .
25
Ma trận này đối xứng và không xác định [51, 106]. Do đó, các vector riêng của cặp
vector trực giao với p số vec tơ. Các vec tơ riêng tương ứng với các giá
trị riêng dương , …
(1.51)
Vec tơ
, (1.52)
Là các thành phần chính tính từ (1.51) và (1.39) sau đó:
(1.53)
Từ 1.53 các thành phần chính là N vec tơ trực giao với . Nếu ma trận
bao gồm các thành phần chính và ma trận gồm
các vec tơ riêng , khi đó (1.39) có dạng
(1.54)
Ma trận P là ma trận trực giao, tức là . Vì vậy
(1.55)
Theo (1.55) X gọi là thừa số của ma trận có dạng:
.
Nếu hạng của ma trận X bằng r, khi đó giá trị riêng: và
. Trong trường hợp này:
(1.56)
Từ (1.56) là cột của ma trận X (vec tơ Xj) có thể được trình bày dưới dạng kết hợp
tuyến tính của các thành phần chính trực giao song song tk theo:
26
(1.57)
Ma trận:
(1.58)
Được gọi là “phần thừa thứ m của x”. Vec tơ Em trực giao với vec tơ t1, t2, …,tm-1.
Để minh họa cho tk và pk, một trường hợp cho hai biến X1 và X2, trong không
gian hai chiều P được mở rộng từ hai vec tơ này, chỉ ra trong Hình 1.8 Ma trận
tương quan cho vec tơ chuẩn hóa X1 và X2 là ma trận [51, 106]:
(1.59)
Với là góc giữa vec tơ X1 và X2. Giá trị riêng của ma trận là
và giá trị riêng được tính:
(1.60)
Khi đó các thành phần chính được tính (1.52 và Hình 1.8):
.
Các vec tơ X1 và X2 được tính
(1.61)
Hình 1.8 Thành phần chính với p = 2 [51, 106]
Phương trình (1.61), là phương trình cơ bản trong PLS, có thể tính xấp xỉ các
giá trị riêng với các phần tử không tuyến tính theo phương pháp NIPALS
(Nonlinear Iterative Partial Least Squares).
27
Các tính toán dựa trên các mối quan hệ sau:
(1.62)
Các mối liên hệ từ (1.56), (1.57) và (1.58) áp dụng với ma trận ‘X’ bắt đầu
với :
(1.63)
Mối liên hệ (1.62) gọi là liên hệ ngoài (outer relations), và (1.64) gọi là liên
hệ trong (inner relations), liên kết các biến phụ thuộc và độc lập, cũng được xem
xét để xây dựng một mô hình hồi quy. Trong một trường hợp đơn giản, chúng có
dạng sau:
(1.64)
Với là giá trị dự đoán của y. là phép chiếu của y lên tk,
Khi tiến hành PLS, khi biến phụ thuộc bị giới hạn bởi một bước lặp lại trong
(1.62). các giá trị ban đầu của được tính:
Với (1.65) ; yk-1 là độ lệch.
Sau đó thuật toán PLS (với X và y có ý nghĩa tương quan)
là biến độc lập X và giá trị dự đoán.
Cho k = 1 đến r là một chu kỳ thành lập theo nguyên tắc thành phần chính.
là các vec tơ trọng số để tính thành phần chính thứ k.
là giá trị gần đúng của thành phần chính.
là giá trị gần đúng của vec tơ riêng.
là hệ số hồi quy giữa các thành phần.
là độ lệch của giá trị quan sát.
28
là giá trị dự đoán của biến kế tiếp.
là độ lệch của biến X.
là phần sai số X.
Phần quan trọng của hồi quy là dự đoán sự phụ thuộc của biến phụ thuộc từ
các biến độc lập Xnew.
PLS không cho biết rõ ràng về giá trị dự đoán. Thay vào đó, sự phân tích các
biến độc lập X để tính toán giá trị y.
Đối với vec tơ mục tiêu pk, wk và hệ số hồi quy bk được tính cho bước tiếp
theo. Các biến dự đoán mới Xnew với Nnew mẫu thay vì N.
Giá trị dự đoán trong PLS được thực hiện
khởi tạo độ lệch X và giá trị dự đoán.
Với k từ 1 đến r
; giá trị gần đúng đối với thành phần chính của biến quan sát.
là độ lệch thực tế của X.
là giá trị dự đoán.
Sơ đồ PLS đưa ra trong Hình 1.9. Bước thứ nhất trong thuật toán độ lệch của X:
E0= X= (X1 X2) và độ lệch thứ nhất của giá trị dự đoán y0 = y được tính toán. Sau đó
vec tơ trọng số được tính:
(1.66)
Góc Xk và y, vec tơ t1, được tính
(1.67)
29
, và nó là thành phần chính thứ Trong không gian (P1), dọc theo vec tơ
nhất. vec tơ riêng p1 từ thừa số tính theo phương trình 1.62:
(1.68)
Hệ số hồi quy b1 và mối tương quan của y0 với t1:
(1.69)
Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106]
Hơn nữa, độ lệch và giá trị gần đúng cho biến mục tiêu
được tính toán. Véc tơ để tính giá trị E1 thứ nhất của
khối X được tìm ra như là thành phần chính của , nó trực giao với t1. Cuối
cùng, kiểm tra các vec tơ có phải vec tơ 0 hay không.
Bước thứ hai trong hồi quy là tìm không gian P2, trực giao với t1. Vec tơ t2, là
sự tổ hợp tuyến tính giữa vec tơ , thì trực giao với t1, và hệ số hồi quy b2 từ
lên thu được sau hai bước có phép chiếu y1 t2. Mô hình hồi quy
dạng: . Độ lệch thứ E2 của nhóm X được thành lập từ các
thành phần chính của vec tơ , nó trực giao với t2, nghĩa là vec tơ 0. Hay
đẳng thức là đúng, thuật toán đã hoàn thành. Sử dụng các mô hình với giá
trị dự đoán y với các vec tơ .
30
1.4.4. Giải thuật di truyền
Việc lựa chọn các biến độc lập tối ưu để thu được một mô hình tốt là vấn đề
chính trong mô hình hồi quy hay mô hình mạng thần kinh (ANN) có số lượng lớn
các biến số độc lập [10, 77]. Trong những năm gần đây, giải thuật di truyền
(genetic algorithm - GA) được áp dụng trong chọn lựa biến độc lập bằng phương
pháp hóa tính toán [10]. Thuật toán di truyền dựa trên các nguyên tắc sự tiến hóa
của Darwin, đã được sử dụng rộng rãi để tối ưu hoá tổ hợp biến [10, 77]. GA sử
dụng các quá trình tiến hóa để mô phỏng tiến trình này nhằm giải quyết vấn đề bằng
máy tính [10]. Các quá trình cơ bản sử dụng ở đây là đột biến ngẫu nhiên. Sự kết
hợp di truyền và việc sử dụng chúng dẫn đến việc tối ưu hóa các các tiêu chí lựa
chọn được xác định trước. Sự khác biệt của các phương pháp này từ các chiến lược
tìm kiếm khác là sử dụng một tập hợp các biện pháp trung gian. Sau đó, các biện
pháp này được sử dụng để xây dựng các biện pháp mới và hy vọng cải thiện được
các vấn đề [69, 110]. Về mặt sinh học, các biện pháp riêng biệt được so sánh với
các cá thể trong một quần thể. Các quá trình khác nhau được sử dụng để tạo ra thế
hệ con cái làm tăng sức mạnh của quần thể. Trong tự nhiên, các cá thể phù hợp nhất
để cạnh tranh với các nguồn tài nguyên hạn chế như thực phẩm, không gian để tồn
tại và duy trì nòi giống [110]. Chúng tạo ra thế hệ con cái, cho phép chuyển đổi di
truyền của chúng bằng các gen có trong nhiễm sắc thể. Điều này cần thiết cho mỗi
loài để thích ứng với điều kiện môi trường thay đổi. Do đó, chọn lọc tự nhiên dẫn
đến sự sống còn của các cá thể phù hợp, nhưng nó cũng tiềm ẩn sự sống còn của các
gen thích hợp nhất. Quá trình sinh sản cho phép đa dạng hóa nguồn gen của một
loài. Sự tiến hoá được bắt đầu khi nhiễm sắc thể từ hai cha mẹ tái kết hợp trong quá
trình sinh sản. Sự kết hợp mới của gen được tạo ra từ những gen trước đó và do đó
gen mới được hình thành. Các phân đoạn của hai nhiễm sắc thể mẹ được trao đổi
trong quá trình cắt ngang, tạo ra khả năng kết hợp các gen tốt cho các cá thể tốt hơn.
Các đột biến đưa ra sự thay đổi ít và ngẫu nhiên trong nhiễm sắc thể. Sự lựa chọn,
lai chéo và đột biến lặp lại gây ra sự tiến hoá liên tục của các gen của một loài và
tạo ra những cá thể tồn tại trong một môi trường cạnh tranh [110]. Thuật toán di
truyền vận hành thông qua một chu kỳ đơn giản bao gồm các giai đoạn cơ bản sau:
31
1. Cơ chế mã hoá;
2. Định nghĩa chức năng thể trạng;
3. Tạo quần thể
4. Thao tác di truyền với quần thể
1) Mã hóa
Các chương trình mã hóa được sử dụng trong QSARIS được dựa trên gen cơ
bản. Các mô hình hồi quy có thể (các giải pháp) khác nhau bằng một tập hợp các
biến đang được sử dụng. Nếu tổng số các biến độc lập bằng N, thì một số tương ứng
với bất kỳ giải pháp nào bao gồm một chuỗi các chữ số nhị phân N (bits) được gọi
là các gen [7, 110].
Mỗi giá trị đại diện cho một biến độc lập (0 = vắng mặt, 1 = có mặt).
Ví dụ, nếu một tập tất cả các dự đoán là (X1, X2, X3, X4, X5) thì nhiễm sắc thể của
giải pháp với các dự đoán (X2, X3, X5) sẽ là (0, 1, 1, 0, 1).
Hàm mục tiêu
Mỗi mô hình (giải pháp) có liên quan đến một giá trị mục tiêu phản ánh sự so
sánh tốt với các cá thể khác trong quần thể (các giải pháp khác) [7, 110]. Hai hàm
mục tiêu được sử dụng trong QSARIS. Hàm chức năng thứ nhất hay Fit1 (mô hình)
ad được tính bằng SWR cho mô hình được xác định bởi nhiễm sắc thể của mô
bằng R2
hình. Ưu tiên cho cá thể có giá trị Fit1 lớn. Bất lợi của hàm Fit1 là có thể dẫn đến
các mô hình thừa biến (over-fitting). Hàm chức năng thứ hai Fit2 (mô hình) dựa
trên cơ sở của phương trình của Friedman [7, 110].
(1.70)
Với
(1.71)
Trong hàm LOF: p là số biến số độc lập của mô hình; N là số lượng
mẫu trong bộ dữ liệu;
32
RSSp (mô hình) là tổng bình phương độ lệch của mô hình hồi quy sử dụng các
biến độc lập p, d là số yếu tố (tham số của hàm LOF, xác định bởi quá trình tính
toán). Nhìn chung nếu kích thước nhỏ hơn LOF (lớn hơn Fit2) thì mô hình tốt hơn
[7, 110]. Tất cả các thuật ngữ trong phương trình (1.7.1) khá rõ ràng ngoại trừ yếu
tố d. Có thể thấy rằng với giá trị cho trước d (mặc định là 2), khi N lớn, LOF gần
với giá trị trung bình của RSSp [7, 110]. Mô hình tốt khi giá trị p nhỏ. Như vậy,
LOF tăng khi giá trị (p+1)/N đủ lớn. Đối với một giá trị d nhất định của mô hình,
khi thêm biến mới vào mô hình, RSSp giảm, nhưng khi tỷ số (p+1)/N tăng, LOF đạt
giá trị nhỏ nhất. Với giá trị d xác định ở giá trị tối thiểu. Tuy nhiên, khi p càng nhỏ
thì d càng lớn. Ví dụ, nếu chúng ta giả sử rằng các hệ số hồi quy bk (dựa trên các
thành phần chính) tỉ lệ nghịch với chỉ số k, thì RSSp được tính gần đúng [7, 110]:
(1.72)
và
(1.73)
Giá trị LOF nhỏ nhất khi:
(1.74)
Rõ ràng là các mô hình tối ưu với số lượng biến nhỏ tương ứng với giá trị d lớn.
Tham số d thường được lựa chọn bằng cách xem xét các trường hợp thực tế. Các
giá trị ban đầu được đề nghị là từ 1 đến 4. Sơ đồ hoạt động khác của các phương
pháp di truyền được mô tả trong Hình 1.10. Sau đây, chúng tôi sẽ xem xét mô tả
các tùy chọn khác nhau của GA.
Tạo dữ liệu nguồn (quần thể nguồn)
Trong việc tạo ra một tập dữ liệu ban đầu, cần phải có hai quyết định: kích cỡ
dữ liệu và dự đoán ban đầu của giải pháp. Hành động chính trong GA là kết hợp hai
33
nhiễm sắc thể để tạo ra một nhiễm sắc thể mới [10, 110]. Ví dụ, tất cả các nhiễm
sắc thể trong quần thể chứa cùng một bit ở một vị trí đặc biệt của chuỗi gen, không
có sự kết hợp của nhiễm sắc thể có thể đưa một giá trị khác vào vị trí đó.
Hình 1.10 Sơ đồ giải thuật di truyền [10]
Điều này làm giảm đáng kể chiều kích của vấn đề tìm kiếm bằng một, vì giá
trị đó sẽ được cố định mãi mãi. Việc giảm kích thước của vấn đề sẽ được gọi là tập
trung. Nếu tập dữ liệu (số lượng quần thể) đủ lớn sẽ chọn lọc được nhiễm sắc thể
ban đầu có sự tương thích tương đối cao và có nhiều điểm chung với các giải pháp
tối ưu. Nếu tập dữ liệu ban đầu quá nhỏ, một cá thể thể ban đầu tương đối tốt có thể
có nhiều giá trị chung với một giải pháp tối ưu và làm tăng khả năng của giải pháp
này [10, 110]. Ngược lại, nếu tập dữ liệu quá lớn, nhiễm sắc thể ban đầu có nhiều
điểm chung với giải pháp tối ưu có thể bị nhiễu bởi các giải pháp khác và có thể
không có ảnh hưởng đến toàn bộ quần thể (dữ liệu) [10, 110].
Thông thường, giải pháp tốt nhất chọn một tỷ lệ phần trăm nhỏ của tất cả các
biến, và sau đó trong nhiễm sắc thể 0 là cao hơn nhiều so với 1. Sự khởi tạo của tập
dữ liệu, trong đó mỗi bit được cho một giá trị 0 hoặc 1 ngẫu nhiên với cùng một xác
suất, sẽ gần như không thể áp dụng được [10, 110]. Vì quần thể ban đầu sẽ được
34
hình thành bởi các nhiễm sắc thể tương ứng với các tập con có chứa trung bình các
biến của bộ dữ liệu.
Thực tế trong một số trường hợp các nhiễm sắc thể này không thể đánh giá
được. Giải pháp áp dụng cho vấn đề này là: ở giai đoạn tạo ra quần thể ban đầu, xác
suất có '1' thấp hơn nhiều so với việc có '0'. Do đó, quần thể ban đầu được hình
thành bởi các nhiễm sắc thể mục tiêu để tập con chứa số ít biến. Với tư cách là
hướng dẫn, cho mỗi gen xác suất là ‘1’ để thiết lập bộ 5 biến [10, 110]. Sau đó,
trung bình 5 biến sẽ được chọn trong mỗi nhiễm sắc thể. Điều này có nghĩa là ở giai
đoạn đầu tiên một số lượng nhiễm sắc thể cao hơn nhiều và được đánh giá và các
biến "xấu" có thể được loại ra dễ dàng hơn, vì chúng không đủ tin cậy đối với
nhiễm sắc thể mục tiêu, trong đó chỉ một vài biến tốt được lựa chọn. Trong mỗi lần
chạy, sự kết hợp của các khối nhỏ, có tính thông tin cao sẽ dẫn đến sự gia tăng dần
dần số lượng các biến được lựa chọn, cho đến khi nó được 'tối ưu' [10, 110].
Chọn thế hệ cá thể ban đầu
Lựa chọn cá thể ban đầu trong một GA là cung cấp khả năng sinh sản tốt
nhất. Có ba cách để thực hiện trong QSARIS.
35
- Phương pháp thông thường là lựa chọn giải pháp di truyền và tiến hóa. Trong đó,
chọn lựa ngẫu nhiên một tập hợp cá thể sau đó chọn ra cá thể tốt nhất.
- Thuật toán di truyền cổ điển cũng sử dụng chương trình lựa chọn bánh xe lăn
(roulette wheel) [10, 76], ở đây xác suất của mỗi thế hệ được lựa chọn tỷ lệ thuận
với khả năng của nó. Để thực hiện loại hình lựa chọn này, các phân đoạn sau bị loại
trên trục [xk-1; xk] (k = 1, 2, …, m). Chiều dài của các đoạn này bằng với số cá thể
(Hình 1.11). Sau đó, một điểm ngẫu nhiên xrand được đưa vào đoạn tổng hợp [0; xm]
và nó có sự phân bố đồng đều dọc theo phân đoạn nhất định. Cá thể tương ứng với
đoạn được chọn làm cha mẹ trong đoạn [0; xm] [10, 110].
Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76]
Sự lựa chọn thế hệ cha mẹ theo phương pháp xếp hạng tuyến tính tương tự
như lựa chọn theo phương pháp bánh xe lăn.
Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76]
Sự khác biệt là xác suất của mỗi cá thể được lựa chọn trực tiếp dự kiến đến số thứ
tự của nó trong tập dữ liệu ban đầu. Do đó, đối với tập hợp của m cá thể các đoạn có
chiều dài m, m-1, m-2, …, 1 được rút ra trên trục (Hình 1.12) [10, 110]. Sau đó,
một điểm n gẫu nhiên với tọa độ xrand được đưa vào phân đoạn [0; xm]. Dấu chấm
ngẫu nhiên này được phân bố đồng đều dọc theo phân đoạn nhất định. Mỗi cá thể
mục tiêu tương ứng với phần mà ngẫu nhiên được chọn làm thế hệ cha mẹ [10, 76].
36
2) Tổ hợp
Hình 1.13 Toán tử chéo đơn điểm [76]
Hình 1.14 Toán tử chéo hai điểm [76]
Tổ hợp là một hoạt động mà hai cá thể được kết hợp để tạo ra các thế hệ mới.
Trong QSARIS, các toán tử chéo được sử dụng trong tổ hợp. Toán tử đơn giản nhất
được gọi là chéo đơn điểm (one-point crossover) [10, 76]. Nó xảy ra khi hai cá thể
cha mẹ (P1, P2) được đổi chỗ sau một điểm cắt được lựa chọn ngẫu nhiên, tạo ra hai
con lai (O1, O2) (Hình 1.13). Trong toán tử chéo hai điểm (Two-point crossover),
hai điểm được chọn ngẫu nhiên và các phân đoạn của nhiễm sắc thể giữa chúng
được trao đổi (Hình 1.14) [10, 76].
Số điểm có thể được tăng liên tục cho đến khi mỗi giá trị cho một con cái
nhất định có thể được lựa chọn độc lập từ cha hoặc mẹ. Thế hệ con lai khác chỉ đơn
giản nhận được giá trị bổ sung. Được gọi là chéo đồng nhất (uniform crossover).
Nếu nó nhận được từ cha và mẹ, nó được gọi là chéo đồng nhất cân bằng (unbiased
37
uniform crossover). Loại crossover (số điểm cắt) cần xác định các vấn đề ảnh
hưởng đến việc tìm kiếm. Ví dụ, chúng ta giả định rằng mục tiêu của sự lựa chọn là
một tập gồm 11 mô tả, không có trong bộ số liệu 100, dự đoán chính xác một số
thuộc tính. Đồng thời chúng ta giả sử rằng bộ mô tả tốt nhất, hoặc chiếm ưu thế là:
(g1, g2, g3, g4, g5, g6, g7, g8, g9, g10, g11) [10, 76].
Nếu một điểm chéo một điểm được sử dụng, với xác suất 0,9 cho các bộ mô
tả liền kề (ví dụ: g4 và g5) sẽ được chuyển sang cùng một dạng lai tạo, và xác suất
bằng không là các mô tả đầu tiên và cuối cùng sẽ được chuyển sang cùng một đứa
con của cha mẹ này. Tương tự, nếu g1 và g3 là bộ mô tả "tốt" và g2 không, thì
không thể tạo ra thế hệ con lai g1 và g3 từ cha mẹ. Trong trường hợp này, một chéo
hai điểm hoặc chéo đồng dạng có thể là thích hợp hơn [76].
GA có thể sử dụng toán tử phối giống với một xác suất nhất định Pmate. Nếu
tổ hợp không xảy ra, sau đó các bản sao của cha mẹ được thêm vào dân số. Những
dòng vô tính này có thể được thay đổi bởi đột biến [76].
3) Đột biến
Đột biến đơn giản sửa đổi một nhiễm sắc thể đơn với xác suất cho trước.
Trong tiêu chuẩn GA, xác suất đột biến (Pmutate trong Hình 1.10) rất nhỏ và hành
động của nó là cố gắng ngăn ngừa hội tụ đến một giải pháp tối ưu [10, 76]. Một đột
biến trong nhiễm sắc thể có thể bổ sung 1 hay nhiều bit. Cũng như lai chéo, có thể
xác định k-đột biến (k = 1 hay 2), khi k gen được chọn ngẫu nhiên 1 hay nhiều lần
với xác suất Pmutate. Hơn nữa, 1 điểm đột biến đồng nhất (uniform mutation) có thể
xảy ra, khi ít nhất 1 gene được thay đổi với xác suất Pmutate. Vì vậy, mỗi bit được
thay đổi với xác suất [10]:
(1.75)
Với m là số gen trong nhiễm sắc thể.
4) Tiến trình lai
Không nhất thiết yêu cầu số các thể lai phải bằng số cá thể ban đầu, hoặc tất
cả cá thể con phải được đưa vào tập dữ liệu. Có thể định nghĩa số cá thể con từ cặp
cá thể gốc (nghĩa là hoàn thành một số chu kỳ lai với cùng một cặp cá thể ban đầu).
38
Nếu số cá thể con trùng với số lượng cá thể ban đầu hiện có thì nó không được coi
là tiếp cận và thu nhập từ việc lai. Tổng số tất cả các cá thể con là riêng biệt. Con số
này nên chia cho số cá thể của cùng một bậc cá thể ban đầu [10].
Cập nhập dữ liệu
Thế hệ cá thể con có thể được thêm vào dữ liệu hiện tại bằng cách chuyển
một thành viên hiện có. Vì các biến thể sau có thể thực hiện được: thay thế một số
thành viên yếu nhất trong tập hợp bằng cá thể con tốt nhất; tăng dữ liệu tiếp theo từ
cá thể lai tốt nhất [76].
Mặc dù lựa chọn thứ hai là phổ biến nhất, nó cũng là tập trung nhất. Vì thế
hệ con sẽ có một số gen chung với thế hệ ban đầu, tất cả được đưa chung vào tập dữ
liệu. Khi gia tăng số lượng các biện pháp lai với một cặp cá thể gốc sau khi mỗi con
được sinh ra. Điều này cũng có lợi thế là thông tin di truyền có giá trị có thể chứa
trong thành viên ít nhất trong tập hợp sẽ bị mất trước khi có cơ hội chuyển thông tin
này cho một cá thể con. Cần hạn chế số lượng quần thể sinh ra để thoát khỏi chu
trình cơ bản và để hoàn thành một thuật toán [76, 107].
1.4.5. Mạng thần kinh nhân tạo (ANN)
1.4.5.1. Khái niệm
Mạng thần kinh nhân tạo (nơ ron) là một hệ thống nhận thức dựa trên sự
nhận thức của hệ thống thần kinh sinh học tự nhiên Hình 1.15.
Ba công cụ trí tuệ nhân tạo gồm mạng thần kinh, logic mờ và thuật toán di
truyền được kết hợp hài hòa trong quá trình thiết lập mô hình liên quan nhân quả tối
ưu. Mạng thần kinh: thiết lập mô hình liên quan nhân quả (X, Y) và dự đoán (Y) từ
(X) là các yếu tố đã biết [30]. Thuật toán di truyền: tối ưu hóa dựa trên mô hình liên
quan nhân quả đã được thiết lập bởi mạng thần kinh, dùng khi cần cải thiện (Y)
bằng cách thay đổi (X). Logic mờ: làm cho mạng thần kinh hiệu quả hơn trong việc
thiết lập mô hình liên quan nhân quả đối với các dữ liệu phức tạp, cả định lượng và
không định lượng đồng thời giúp cho thuật toán di truyền được thuận lợi hơn trong
sự tối ưu hóa với các mục tiêu liên quan [101].
39
Hình 1.15 Hệ thống thần kinh sinh học tự nhiên
1.4.5.2. Cấu trúc mạng
Mạng thần kinh nhân tạo (ANN) có cấu trúc giống hệ thần kinh động vật,
tương tự như bộ não có chức năng xử lý thông tin. ANN gồm nhiều nơ ron gắn kết
cấp cao với nhau để giải quyết các vấn đề một cách rõ ràng. ANN giống như bộ não
người, trải qua quá trình học, tích lũy kinh nghiệm để xử lý các vấn đề trong từng
tình huống phù hợp [30, 50].
Năm 1943 nhà thần kinh học Warren McCulloch và nhà logic học Walter
Pits đã nghiên cứu ANN [50]. Tuy nhiên, các nghiên cứu ANN thời bấy giờ còn
hạn chế. Ngày nay ANN khá phổ biến, phát triển và ứng dụng rộng rãi trong nhiều
lĩnh vực. Một số lĩnh vực điển hình như các ngành khoa học tự nhiên, y học, kinh
tế, quân sự, điện, điện tử, kỹ thuật chế tạo [77]. Mới nhất là các nghiên cứu ứng
dụng trong lĩnh vực khoa học tự nhiên. Tại Việt Nam việc nghiên cứu ứng dụng
ANN vào hóa học chỉ mới bắt đầu trong vài năm gần đây và cần được phát triển.
Điển hình như các lĩnh vực: Hóa học môi trường; Hóa học hữu cơ (phân tích hữu
cơ, tổng hợp hữu cơ…); Hoá học phân tích (phân tích môi trường, giám sát ô
nhiễm…); Công nghệ hóa học ( kỹ thuật nano, kỹ thuật dầu khí, tách chất…); Công
nghệ xử lý môi trường (đánh giá xử lý, mô phỏng xử lý…) [30].
40
Nhóm luyện
Đầu vào (Qi, i..)
Đầu ra (pGI50)
Xử lý đầu ra
Chỉnh mức quan trọng Kết quả
Mạng được luyện
Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50]
Mạng thần kinh nhân tạo ngày nay được ứng dụng trong rất nhiều ngành
khoa học. Trong đó Hóa học là một lĩnh vực có nhiều ứng dụng của mạng thần kinh
nhân tạo mà phương pháp truyền thống không thể giải quyết được, quá trình luyện
mạng thần kinh dẫn ra ở Hình 1.16. Mạng thần kinh có thể thiết lập các mô hình
nhân quả thích hợp và mềm dẻo với nhiều loại số liệu đơn giản hay phức tạp tuyến
tính hay không tuyến tính [101].
Đưa dữ liệu đầu vào gồm biến độc lập (X) và biến phụ thuộc (Y) qua lớp ẩn
để mạng thần kinh định lượng mối quan hệ giữa X và Y để dự đoán Y từ X, quá
trình định lượng này có thể tuyến tính hoặc không trên hệ thống các hàm toán,
thông dụng như hàm Sigmoid, Tanh có phương trình của hàm cụ thể [86]. Quá trình
học (luyện mạng) như vậy tạm hiểu là quá trình học của hệ thần kinh tự nhiên, học,
cải tiến, có kế thừa và phát huy và khả năng ghi nhớ, sao chép, rõ ràng đây là mô
hình tối ưu hơn mô hình tuyến tính thuần túy.[77]
Cấu trúc mạng nơ ron
41
Mạng nơ ron bao gồm các nút mạng cho chức năng xử lý thông tin. Lớp
nhập (input), lớp xuất (output), trọng số của từng lớp input, trọng số tổng của mạng
nơ ron Hình 1.17 [5, 102].
Hình 1.17 Cấu trúc mạng nơ ron [101]
Các hàm toán trong mạng nơ ron có các đặc tính sau: Hàm có tính đơn điệu;
Hàm bị chặn trên và chặn dưới; Hàm phải có tính liên tục và trơn. Một số hàm toán
trong mạng nơ ron [50, 77]:
(1.76)
Hàm Threhold f(u) = 1 nếu u > 0; f(u) = 0 nếu u < 0 Hàm piecewwise – linear f(u) = 1 nếu u > 1/2; f(u) = u nếu 1/2 > u > -1/2; f(u) = 0 nếu u < -1/2
Hàm sigmoid (logistic)
(1.77)
Hàm tanh – hyperbol
(1.78)
Quá trình luyện mạng và thử của mạng nơ ron
Trong tiến trình học, mạng nơ ron nhận diện dữ liệu, các thông số tự do được
thay đổi liên tục do dự thay đổi của môi trường và các giá trị này được ghi nhớ lại
[95], Hình 1.18 [16, 21].
42
Hình 1.18 Quá trình học của mạng nơ ron [16]
Trong quá trình luyện, nhập các giá trị lớp input vào hệ thống luyện nhằm
tạo ra các giá trị output. Tiếp theo mạng nơ ron so sánh các trị output từ mạng nơ
ron với các giá trị đầu ra mong muốn. Nếu hai giá trị này giống nhau thì quá trình
luyện mạng đạt yêu cầu. Nếu sai số giữa hai giá trị này quá lớn thì quá trình luyện
mạng được lặp lại, thay đổi các thông số luyện mạng [5, 21, 30].
Quá trình luyện mạng được lặp lại liên tục, cho đến khi tìm ra các giá trị
trọng số phù hợp sao cho giá trị xuất do mạng nơ ron xuất ra đạt yêu cầu. Do đó
trong quá trình luyện mạng, cần thiết lập yêu cầu về sai số, hoặc yêu cầu về số vòng
lặp cần xác định [97, 114].
Khác với chương trình máy tính khác được lập trình sẵn một cách rành mạch,
mạng thần kinh nhân tạo phải được luyện với các nhóm luyện có sẵn. Quá trình
luyện mạng có tính chất lặp lại, cải thiện chất lượng mô hình một cách liên tục
thường sử dụng thuật toán lan truyền ngược gồm các bước [50]: chọn một cặp đầu
vào – đầu ra từ nhóm luyện để làm vector đầu vào cho đầu vào của mạng thần kinh;
tính đầu ra của mạng; tính sự khác biệt giữa đầu ra của mạng và đầu ra mong muốn;
điều chỉnh mức quan trọng để giảm thiểu sai số; lặp lại bước điều chỉnh cho đến khi
sai số luyện mạng được chấp nhận [50].
Khi luyện mạng các mô hình nhân quả có thể được thiết lập riêng rẽ hay một
lượt. Các mức quan trọng được điều chỉnh cho phù hợp với dữ liệu luyện mạng, có
khả năng mạng thần kinh được luyện quá mức. Khi ấy mạng thần kinh có thể chỉ dự
43
đoán tốt cho nhóm luyện mà không chính xác đối với trường hợp thử. Do đó dữ liệu
nghiên cứu thường được chia thành hai nhóm: luyện và thử, dùng nhóm luyện để
luyện mạng và dùng nhóm thử để đánh giá về mạng. Nếu giá trị dự đoán gần với giá
pr và R2
tr cao) [90].
trị quan sát thì khả năng dự đoán là tốt (R2
Giải thuật lan truyền ngược (Back – Propagation)
Trọng số các kết nối được điều chỉnh bằng thuật toán lan truyền ngược sao
cho sai số E là nhỏ nhất [7, 22].
(1.79)
Với t (xi, w): giá trị của tập mẫu; y (xi): giá trị output của mạng.
Trên từng nơ ron, đều có lớp input và output, các giá trị này đều có một trọng
số để đánh giá mức độ ảnh hưởng của các giá trị [22]. Thuật toán lan truyền ngược
điều chỉnh các trọng số sao cho ej = Tj – yj là nhỏ nhất. Cần xác định vị trí của từng
nơ ron, nơ ron lớp ẩn, lớp output, [5, 21, 90] Hình 1.19.
Hình 1.19 Mô hình tính toán một nơ ron [69, 77]
Trong đó: wij: vector trọng số của nơ ron số đầu vào i.
Giá trị sai số ej của nơ ron tại vòng lặp thứ n:
(1.80) ej (n) = tj (n) – yj (n)
Tổng bình phương sai số của mạng nơ ron:
(1.81)
Tại nơ ron ta có tổng trọng số input (uj):
(1.82)
Giá trị lớp xuất của nơ ron j: yj (n) = fj (uj(n))
44
Tùy theo hàm hoạt động để tính toán các giá trị điều chỉnh trọng số tương
ứng theo thuật toán lan truyền ngược [22, 69].
Mạng thần kinh nhân tạo không thích hợp với vấn đề đòi hỏi về kí tự và bộ
nhớ. Mạng thần kinh cấu tạo bởi nhiều lớp: I(j) – HL(k) – HL(m) – O(n). Trong đó:
I là lớp vào, j là số nút đi vào, HL là lớp ẩn, k là số nút của lớp ẩn thứ nhất, m là số
nút của lớp ẩn thứ hai, O là lớp đi ra, n là số nút đi ra [90].
1.4.6. Thống kê đánh giá mô hình
Kỹ thuật đánh giá chéo loại bỏ dần từng trường hợp: Một hợp chất trong
nhóm luyện được loại bỏ. Mô hình QSAR sau đó được xây dựng từ các phân tử còn
lại và kết hợp với các biến mô tả ban đầu được lựa chọn và hoạt tính của hợp chất bị
loại bỏ được dự đoán bằng phương trình QSAR [51]. Chu kỳ này được lặp đi lặp lại
cho đến khi tất cả các hợp chất được loại bỏ một lần và hoạt tính của chúng được dự
báo [51]. Cuối cùng, mô hình có được kiểm tra khả năng dự báo dựa vào các tham
số PRESS, R2 (Q2), độ lệch chuẩn SDEP tính từ PRESS [72, 73].
(1.83)
(1.84)
(1.85)
Trong phương trình Ytn và Ydd tương ứng với các giá trị thực nghiệm và giá trị
dự đoán, n là số hợp chất, Ytn (luyen), Ydd (luyen) là giá trị thực nghiệm và giá trị dự đoán
của các hợp chất trong nhóm luyện bằng kĩ thuật loại bỏ dần từng trường hợp
(Leave – one – out), giá trị Q2 ≥ 0.5.
Tính R2
pr
Giá trị R dự đoán (Rdd) phản ánh mức độ tương quan giữa giá trị thực nghiệm
và giá trị dự đoán của nhóm chất trong nhóm kiểm tra (kt) [51].
45
(1.85)
Ở đây, Ytn(kt) và Ydd(kt) là giá trị hoạt tính thực nghiệm và giá trị hoạt tính dự
luyen chỉ ra các giá trị hoạt tính thực
đoán của các hợp chất trong tập kiểm tra.
pr cao hơn 0,5
pr càng tiến gần đến 1 càng tốt.
nghiệm trung bình của các chất trong nhóm luyện. Vì vậy giá trị R2
thì mô hình có khả năng dự đoán. Giá trị R2
1.4.7. Tính toán đóng góp của các tham số
Các giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% (3) [90] được
tính toán theo công thức:
với ; ; (1.86)
Trong đó: m là số mô hình kiểm tra tương ứng với số biến số k; k là tổng số
biến số trong mỗi mô hình; n là tổng số mô hình dùng để kiểm tra; Ctotal là tổng
đóng góp của các tham số mô tả trong một hợp chất; P mx i, % là phần trăm đóng
góp trung bình của mỗi tham số mô tả phân tử đối với m mô hình;
MPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả phân tử đối với
từng mô hình; GMPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả
phân tử đối với từng mô hình.
1.5. HỢP CHẤT FLAVONOID
1.5.1. Giới thiệu chung
Flavonoid là các hợp chất C15, gồm hai nhân phenol liên kết với nhau qua
một đơn vị C3. Quy ước đánh số trên khung phân tử flavonoid như Hình 1.20.
Flavonoid là nhóm chất rất phổ biến trong tự nhiên, thường gặp trong dược
liệu có nguồn gốc thực vật, trong đó nhóm chancone anthocyanidin và auronon là
được biết đến là các chất tạo màu sắc cho thực vật [74].
46
Chancon Flavononoid
Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74]
1.5.2. Phân loại dẫn xuất flavonoid
Có một số loại dẫn xuất flavonoid có thể kể tới như: Euflavonoid là các dẫn
xuất flavonoid có gốc aryl ở vị trí C2: flavone, flavonol, flavanone, flavanol,
chalcone, anthocyanin, anthocyanidin, flavane; Isoflavonoid có gốc aryl ở vị trí C3:
isoflavone, isoflavanone, rotenoid. Neoflavonoid có gốc aryl ở vị trí C4:
calophylloid; Biflavonoid là các dẫn xuất flavonoid dimmer; Triflavonoid cấu tạo
bởi 3 monomer flavonoid; Flavolignan là các dẫn xuất flavonoid mà phân tử có một
phần cấu trúc lignan [20].
Anthocyanidin Isoflavone
flavane Aurone
Hình 1.21 Một số dẫn xuất flavonoid [20, 74]
47
1.5.3. Phân bố flavonoid trong tự nhiên
Flavonoid là nhóm chất có mặt trong hầu hết các bộ phận của các loài thực
vật bậc thấp và thực vật bậc cao. Hiện nay có trên 10.000 hợp chất được phân lập và
xác định cấu trúc [81]. Các họ thực vật chứa flavonoid như Leguminosae,
Rutaceae, Moraceae, Ericaceae và Anacardiaceae. Đối với isoflavonoid chỉ xuất
hiện giới hạn trong phân họ Papillionoideae của họ Leguminosae [81].
1.5.4. Hoạt tính sinh học của flavonoid
Flavonoid là nhóm chất có phổ hoạt tính rất phong phú, rộng rãi đặc biệt
trong lĩnh vực y học, dược phẩm, chúng có một số hoạt tính đặc trưng sau:
Hoạt tính chống oxi hoá: flavonoid có khả năng vô hoạt các tác nhân oxi
hoá như các anion O2-, gốc OH., ROO.. Có nhiều nghiên cứu về khả năng chống oxi
hoá của flavonoid, các nghiên cứu mối quan hệ định lượng giữa cấu trúc – hoạt tính
kháng oxi hoá của chúng được thiết lập [67, 81]. Các công trình nghiên cứu này đã
chỉ ra nhóm >C=O (C-4 cacbonyl) và liên kết đôi C-2 và C-3 là các yếu tố quan
trọng ảnh hưởng đến hoạt tính kháng oxi hoá của các dẫn xuất flavonoid [67].
- như protein kinase, xanthin oxidase.
Một số nghiên cứu chỉ ra rằng, flavone có hoạt tính cao hơn isoflavone;
flavonoid ức chế men sản sinh ra anion O2
Bên cạnh đó, một số flavonoid ức chế cyclooxygenase, lipoxygenase, glutathion S-
tranferase, NaDH oxidase là các loại men tham gia tạo gốc oxy hoạt động. Về mặt
nhiệt động học, thế oxi hoá khử của flavonoid thấp nên có thể nhường hidro:
FLA-OH + R. →FLA-O. + RH
Flavonoid trong cơ thể chưa được công bố nhiều, vì việc phân lập khó khăn.
Phần lớn các flavonoid vào cơ thể bị chuyển hoá thành các axit phenolic, các axit
này vẫn có khả năng bắt gốc tự do [12, 81]. Tuy nhiên, các flavonoid đã chuyển
hoá và chưa chuyển hoá đều có tác dụng chống oxi hoá.
Hoạt tính kháng vi sinh vật: Flavonoid và các polyphenol có khả năng bảo
vệ thực vật khỏi sự xâm hại của vi sinh vật. Ngày nay, các nhà khoa học ngày càng
quan tâm đến việc sử dụng flavonoid để phòng, chữa bệnh. Hợp chất baicalin từ cây
Scutelleria baicalensis ức chế trực tiếp virus HIV [54]. Hợp chất biflavone
48
(robustaflavone, hinokiflavone) ức chế các enzym cần thiết cho quá trình phiên mã
của virus IC50 = 65 M. Các nghiên cứu khác cho thấy, flavonol và auron kháng
HIV mạnh, quercetin 5ml ức chế 70% virus HIV [45].
Hoạt tính ức chế emzim: các nghiên cứu chỉ ra rằng, liên kết đôi C-2 và C-
3, nhóm xeton ở C4 và nhóm OH ở vị trí 3’, 4’, 5’ đóng vai trò quan trọng trong hoạt
tính ức chế enzym NADH–oxidase, một số flavonoid ức chế enzym xanthin oxidase
là loại men xúc tác quá trình oxy hoá xanthin, hypoxanthin thành axit uric [42, 56] .
Hoạt tính kháng viêm: flavonoid có hoạt tính ức chế men cyclo-oxygenase,
men 5-lipoxygenase trong quá trình trao đổi chất theo con đường arachinonat. Như
hợp chất 8- hydroxyluteolin ức chế chọn lọc men 5-lipoxygenase với IC50 gần 10
µ[78] Hoặc cyanidin ức chế men prostaglflavonoidin endoperoxid hydrogen
synthase -1 và -2 với IC50 tương ứng là 90 và 60 µApigenin có hoạt tính ức chế
tăng sinh nguyên bào sợi trong khoảng nồng độ từ 0,01 – 100 mg/ml. Ở đây,
nguyên bào sợi đóng vai trò quan trọng trong việc tạo hạt, sẹo và tương tác với hệ
miễn dịch khi cơ thể bị viêm nhiễm. Các nguyên bào sợi làm cho hầu hết các vết
thương lâu lành. Hay như hợp chất quercetin, curcumin có tác dụng làm lành vết
thương trong quá trình thay thận [19].
Hoạt tính kháng u và gây độc tế bào: Chalcone pedicin phân lập từ lá cây
Fissistigma lamguinosum có hoạt tính ức chế sự liên kết của tubulin thành
microtubule với IC50 là 300 µM [74]. Ngoài ra từ lá cây Fissistigma lamguinosum
cũng phân lập được fissistin và isofissistin có hoạt tính gây độc tế bào. Từ lá cây
Baeckea frutescens người ta cũng phân lập được hai hợp chất flavanone có hoạt tính
gây độc tế bào ung thư bạch cầu L210 với IC50 bằng 0,25 µg/ml [105]. Từ rễ cây
Scutellaria baicalensis phân lập được các dẫn xuất flavonone là baicalein và baicalin
có hoạt tính ức chế tế bào ung thư gan, ung thư tụy. Từ cây Wikstroemia indica (L)
C.A. Meyer đã phân lập được kaempferol-3-O-β-D-glucopyranosid và tricin có hoạt
tính ức chế tế bào ung thư máu. Ngoài ra, flavonoid còn có một số hoạt tính khác
như hoạt tính đối với mạch máu, hoạt tính oestrogen và có vai trò quan trọng trong
sự tương tác giữa động vật và thực vật [81].
49
1.6. PHÂN LẬP VÀ XÁC ĐỊNH CẤU TRÚC FLAVONOID
1.6.1. Phân lập flavonoid
Sử dụng phương pháp ngâm ethanol để trích ly các hợp chất ra khỏi nguyên
liệu [105]. Sử dụng phương pháp sắc ký cột với chất nhồi cột là silicagel pha
thường, sephadex LH20, pha đảo Rp18 kết hợp sắc ký lớp mỏng để phân lập các
dẫn xuất flavonoid tinh khiết [3, 59]. Phát hiện dẫn xuất flavonoid bằng đèn tử
ngoại ở hai bước sóng 254 nm và 365 nm và dùng thuốc thử dung dịch
H2SO4/EtOH [37, 94].
1.6.2. Xác định cấu trúc flavonoid
Các phương pháp xác định cấu trúc flavonoid: Phương pháp phổ cộng hưởng
từ hạt nhân, Phụ lục 64 gồm phổ 1H-NMR, phổ 13C-NMR, phổ hai chiều HSQC và
Phổ HMBC. Phương pháp nhiễu xạ tia X đơn tinh thể, Phụ lục 58 [4].
1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên
Quá trình thử nghiệm xác định hoạt tính ung thư Hela của các dẫn xuất
flvonoid được thực hiện theo phương pháp so màu (SRB). Tế bào ung thư Hela
được nuôi cấy trong môi trường E'MEM (Sigma), bổ sung phenol red 0,4%, L-
glutamine 200 mM, NaHCO3 7,5%, HEPES 1M, Penicillin - Streptomycin 200
IU/mL, Amphotericin - B 0,1% và huyết thanh phôi thai bò 5%, trên đĩa 96 giếng
với mật độ 104 tế bào/giếng, trong điều kiện vô trùng, ở 37 oC, 5% CO2 [91, 98].
Sau 24 giờ, tế bào nuôi cấy được xử lý với dung dịch flavonoid 100 µg/mL. Sau 48
h, tế bào Hela được nhuộm SRB, đo mật độ quang (optical density – OD) ở bước
sóng 490 nm và 620 nm. Chất đối chứng dương sử dụng là Camptothecin
0,01µg/mL, chất đối chứng âm là nước cất vô trùng 10% pha trong môi trường và
DMSO 0,25%. Tỉ lệ ức chế tăng trưởng tế bào tính theo công thức (1.87) [91, 98].
I(%) = (1 – (ODThử nghiệm / OD đối chứng)) x 100% (1.87)
Tất cả các thí nghiệm được lặp lại 3 lần. Số liệu được xử lý bằng phần mềm
Microsoft Office Excel 2007.
50
CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. SƠ ĐỒ NGHIÊN CỨU
Sơ đồ nghiên cứu tổng quát được đưa ra ở Hình 2.1. Nghiên cứu lý thuyết
bao gồm: tính các tham số điện tích, tham số độ dịch chuyển hóa học, tham số hóa
lý, tham số 2D, 3D của các dẫn xuất flavonoid; xây dựng các mô hình QSAR: xác
định định lượng các tham số điện tích, tham số độ dịch chuyển hóa học, tham số
hóa lý, tham số 2D, 3D ảnh hưởng quan trọng đến hoạt tính kháng ung thư; kiểm tra
khả năng dự đoán của mô hình.
Hình 2.1 Sơ đồ nghiên cứu tổng quát
Thực nghiệm sàng lọc flavonoid: Phân lập và tinh chế một số flavonoid từ
gừng gió, đậu nành, tía tô, xa kê, actiso, sử dụng các phương pháp sắc ký cột và sắc
ký lớp mỏng [3]. Xác định cấu trúc flavonoid chiết xuất sử dụng phương pháp phổ
cộng hưởng tử hạt nhân 1H-NMR, 13C-NMR NMR, DEPT, HSQC, HMBC và
phương pháp đo nhiễu xạ tia X đơn tinh thể [1, 109]. Thử in vitro hoạt tính kháng
Hela của các flavonoid chiết xuất sử dụng phương pháp so màu SRB [98]. Thiết kế,
sàng lọc flavone và isoflavone mới từ các hợp chất mẫu. Thiết kế, sàng lọc một số
51
dẫn xuất flavonoid mới từ các dẫn xuất flavonoid chiết xuất. Dự đoán hoạt tính
kháng ung thư cổ tử cung của các dẫn xuất flavonoid chiết xuất và hợp chất thiết kế
mới từ hợp chất mẫu chiết xuất ra từ thực vật và hợp chất tổng hợp [80], bằng cách
sử dụng các mô hình QSAR.
2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP
2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử
Dữ liệu sử dụng để xây dựng mô hình QSAR bao gồm các hợp chất flavone
và isoflavone và hoạt tính GI50 (μg/M) (nồng độ ức chế 50 % sự phát triển của tế
bào ung thư) được thu nhận từ nghiên cứu của Wang và cộng sự [80, 103] Phụ lục
1a. Giá trị GI50 được chuyển đổi sang giá trị pGI50 (pGI50 = -log(GI50) nhằm giảm
biên độ biến thiên của tập dữ liệu đồng thời giảm sai số và tăng khả năng dự đoán
của các mô hình QSAR [86, 88].
2.2.2. Nguyên liệu và phương pháp
2.2.2.1. Phần mềm ứng dụng
Các phần mềm được sử dụng trong đề tài này gồm 3 nhóm chính: xây dựng
và tính toán các tham số, xây dựng các mô hình và phân tích, thống kê, vẽ đồ thị.
Phần mềm Ứng dụng
ChemOffice 2008 Tính toán các tính chất hóa lý
HyperChem v8.0 Tính toán điện tích, độ dịch chuyển hóa học
QSARIS Tính toán các tham số cấu trúc 2D, 3D
INForm v2.0 Xây dựng các mô hình mạng nơ ron
Visual Gene Developer v1.7 Xây dựng các mô hình mạng nơ ron
Essential Regression 97 Thiết lập các mô hình tuyến tính
MS-EXCEL 2003 Phân tích thống kê, xây dựng dữ liệu
z
Origin v7.0 Vẽ đồ thị
2.2.2.2. Hóa chất, thiết bị
Hóa chất và dụng cụ sử dụng trong luận án bao gồm:
52
Hóa chất Ứng dụng
Dùng trong sắc ký cột pha thường Silica gel cỡ hạt 40-60 m, 30-50 m hãng
và pha đảo Rp18 Himedia, Scharlau, Merck.
Hexane, chloroform, methanol, ethyl acetate Dung môi sử dụng trong quá trình
ethanol, nước cất (merck) phân lập flaovnoid
Thuốc thử nhận biết vết flavonoid H2SO4/EtOH (Merck) trên bản mỏng
Dụng cụ Ứng dụng
Bản mỏng nhôm tráng sẵn silica gel 60F254 Sắc ký lớp mỏng (Merck) 0,2 mm
Đèn UV tử ngoại cầm tay, hiệu UVITEC hiện màu thuốc thử trên bản mỏng
cột sắc kí đường kính từ 2-5,5 cm máy sắc ký Sắc ký cột trung áp
Bruker AM500 FT-NMR Spectrometer Đo phổ NMR
2.2.2.3. Nguyên liệu
Thu hái nguyên liệu: Các mẫu thực vật được dùng trong nghiên cứu bao
gồm: actiso (Cynara scolymus L.) [2], xa kê (Artocarpus incisa L.) [2], đậu nành
(Glucine max L.) [2], [2], tía tô (Perilla ocymoides L.) [2], gừng gió (Zingiber
zerumbet L.) [2] (Hình 2.2) được thu hái tại Đà Lạt, Việt Nam, tháng 8, 9 năm
2012. Các tiêu bản tươi của nhóm thực vật chiết gồm bộ phận chiết và lá để định
danh thực vật và lưu mẫu [11, 59]. Các mẫu thực vật được định danh thực vật và
lưu tiêu bản tại Viện công nghệ sinh học và môi trường Trường (IBE), Đại học Tây
Nguyên, Phụ lục 11. Nguyên liệu sau khi thu hái được loại bỏ phần đất cát, sâu
bệnh, rửa sạch, để ráo sau đó sấy khô, nghiền hoặc thái nhỏ để sử dụng cho quá
trình chiết và phân lập [59].Tiến hành định lượng nguyên liệu trong từng giai đoạn
để tính toán hiệu quả của quá trình chiết [27, 56, 105].
53
Actiso Xa kê Đậu nành
Tía tô Gừng gió
Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2]
2.3. NGHIÊN CỨU LÝ THUYẾT
2.3.1. Phương pháp tính toán thông tin cấu trúc
2.3.1.1. Cơ học phân tử
Dữ liệu về năng lượng phân tử, điện tích nguyên tử và moment lưỡng cực
được tính toán trên phần mềm HyperChem [38]. Dựa trên kết quả khảo sát, mức
gradient và tùy chọn thích hợp sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu
cơ nghiên cứu. Chọn thuật toán phù hợp với nhóm dẫn xuất nghiên cứu. Phương
pháp phân tích phương sai hai yếu tố không lặp được dùng để khảo sát ảnh hưởng
của các thuật toán: Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton -
Raphson theo năng lượng (kcal/mol) [38]. Phương pháp phân tích phương sai hai
yếu tố không lặp được dùng để khảo sát ảnh hưởng của: các mức gradient bằng 10;
1; 0,1; 0,01 đối với năng lượng (kcal/mol) và tùy chọn lưỡng cực liên kết và điện
tích nguyên tử trên các tham số hóa lượng tử. Dựa trên kết quả khảo sát, thuật toán
sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu cơ nghiên cứu.
2.3.1.2. Hóa lượng tử
Phương pháp hóa lượng tử bán thực nghiệm (CNDO, INDO, MNDO, AM1,
RM1, PM3, TNDO) được sử dụng để xác định các tham số điện tích nguyên tử, độ
dịch chuyển hóa học của phổ 13C-NMR, 15O-NMR, các tham số hóa lý và các tham
54
số 2D, 3D [38]. Sử dụng phương pháp phân tích phương sai 2 yếu tố không lặp
(yếu tố điện tích nguyên tử và momemt lượng cực để thăm dò các phương pháp hóa
lượng tử. Từ đó, chọn lựa phương pháp hóa lượng tử thích hợp để tính toán điện
tích (Qi), độ dịch chuyển hóa học (i) của phổ 13C-NMR, 15O-NMR, tham số hóa lý,
cấu trúc 2D, cấu trúc 3D [38].
2.3.1.3. Các tham số cấu trúc
Sử dụng phương pháp cơ học phân tử MM+ để tối ưu hóa cấu trúc phân tử
flavone và isoflavone. Các tham số mô tả cấu trúc được tính toán bằng các phương
pháp cơ học phân tử [52], phương pháp Grid [28, 48], phương pháp Gasteiger trên
phần mềm QSARIS [28].
2.3.2. Xây dựng các mô hình QSAR
Các mô hình hồi quy đa biến được xây dựng theo các bước như trong Hình
2.3. Tập dữ liệu cấu trúc và hoạt tính kháng ung thư của các dẫn xuất flavone và
isoflavone trong phụ lục 1a được chia thành tập luyện (80 – 85%) và tập kiểm tra
(15-20%) bằng phương pháp chọn lựa ngẫu nhiên hoặc chọn lựa thông minh trên
phần mềm INForm [40, 77]. Khả năng dự đoán của mô hình QSAR (xây dựng từ
tập luyện) được đánh giá chéo bằng kỹ thuật loại bỏ dần từng trường hợp, so sánh
kết quả dự đoán với hoạt tính pGI50 của các hợp chất trong nhóm kiểm tra.
Hồi quy đa biến [51] được sử dụng để xây dựng mô hình quan hệ giữa dữ
liệu điện tích và hoạt tính (QESARMLR); mô hình quan hệ giữa dữ liệu phổ và hoạt
tính (QSDARMLR); mô hình quan hệ giữa cấu trúc - cấu trúc (QSSRMLR), mô hình
quan hệ giữa dữ liệu tham số 2D, 3D và hoạt tính (QSARMLR, QSARPLS).
Chất lượng của mô hình hồi quy tuyến tính đa biến được xác định bằng các
tr, giá trị R2
pr, sai số (SE) [84, 90].
giá trị hệ số xác định bởi R2
55
Hình 2.3 Xây dựng các mô hình hồi quy đa biến
Mạng nơ ron là một công cụ rất mềm dẻo xây dựng mối liên hệ giữa cấu trúc
và hoạt tính bao gồm tính chất tuyến tính và phi tuyến [89, 92]. Mô hình QSAR
(QESARANN, QSDARANN, QSARANN; QSARPCA-ANN) được xây dựng bằng kỹ thuật
neuro-fuzzy kết hợp với thuật toán di truyền trong phần mềm INForm [51]. Mạng
nơ ron cấu tạo thường ba lớp: I(j) – HL(m) – O(n). Trong đó: I là lớp nhập với j là
số nơ ron bằng số tham số mô tả phân tử trong mô hình tuyến tính QSARMLR; HL là
lớp ẩn, m là số nơ ron của lớp ẩn, O là lớp xuất, n là số nơ ron lớp xuất, tức là hoạt
tính pGI50 [51].
Ảnh hưởng của các tham số cấu trúc đến hoạt tính kháng ung thư tính toán từ
các mô hình QSAR tuyến tính theo mục 1.4.7. Kiểm tra khả năng dự đoán của các
mô hình tuyến tính và mô hình mạng thần kinh bằng các kỹ thuật đánh giá thống kê,
kỹ thuật phân tích phương sai, và các giá trị thống kê sai số ARE, % và MARE, %.
2.4. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN
2.4.1. Phân lập các hợp chất flavonoid
Quy trình phân lập và tinh chế các dẫn xuất flavonoid từ actiso, xa kê, tía tô,
đậu nành, gừng gió theo Hình 2.4.
56
Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59]
Nguyên liệu đem ngâm dầm trong dung môi EtOH 96%, lọc bỏ bã, lấy phần
dịch chiết EtOH đem cô loại dung môi dưới áp suất kém thu được cao EtOH [29,
75]. Từ cao EtOH chiết lỏng lỏng với hệ dung môi có độ phân cực tăng dần: n-
hexan, CHCl3, EtOAc, MetOH. Loại bỏ dung môi từ các dịch chiết thu được cao
tương ứng [42, 59]. Cao EtOAc đem SKC silica gel pha thường với hệ dung môi
CHCl3 : MetOH có thể tích CHCl3 thay đổi từ 100%-0%. Dựa vào kết quả SKLM
để gom các phân đoạn (A). Tiếp tục SKC silica gel pha thường lần 2 với hệ dung
môi rửa giải CHCl3 : MetOH theo tỉ lệ thể tích CHCl3 thay đổi từ 100% - 40% thu
được các phân đoạn (B1 - Bn). Tiếp tục SKC silica gel pha thường lần 3 trong hệ
CHCl3 : MetOH với tỉ lệ thể tích CHCl3 giảm dần thu được các phân đoạn. Quá trình
sắc ký được thực hiện liên tục cho đến khi thu được chất kết tinh, đem rửa sạch và
57
kiểm tra bằng SKLM. Quy trình phân lập flavonoid phân lập từ lá actiso, lá xa kê, lá
tía tô, hạt đậu nành, củ gừng gió:
Lá actiso khô (2,2 kg) → cao EtOAc (190 g) → Lấy phân đoạn thứ A7 (17 g)
→ B2 (2,7 g) → C3 ứng với tỉ lệ CHCl3: MetOH là (60 : 40) → 12 mg hợp chất
sạch (CSL1).
Lá xa kê khô 1,7 kg → EtOAc (120 g) → Lấy phân đoạn thứ A5 (10g) → B4
ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 7 mg hợp chất sạch (AIL1).
Lá tía tô khô 2 kg → EtOAc (140g) → Lấy phân đoạn thứ A4 (11,5 g) → B4
(95 mg) → C2 ứng với tỉ lệ CHCl3: MetOH là (95 : 5) → 8 mg hợp chất sạch
(POL1).
Hạt đậu nành khô 2 kg → EtOAc (95 g) → Lấy phân đoạn thứ A3 (8 g) →
B3 (1 g) → C4 (80 mg) ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 8 mg hợp chất
sạch (GML1).
Củ gừng gió khô 1 kg → EtOAc (30 g) → Lấy phân đoạn thứ A2 (4 g) → B3
(80 mg) ứng với tỉ lệ CHCl3: MetOH (85 : 15) → 7 mg hợp chất sạch (ZZL1); B2
(120 mg) ứng với tỉ lệ CHCl3 – MetOH (90 : 10) → 9 mg tinh thể sạch, (ZZL2) .
2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid
Dựa vào cấu trúc phổ 1H-NMR, 13C-NMR, DEPT 90 và 135, HSQC, HMBC
kết hợp với các phương pháp hoá học và phương pháp đo nhiễu xạ tia X đơn tinh
thể để xác định cấu trúc của các hợp chất flavonoid phân lập từ actiso, xa kê, đậu
nành, tía tô, gừng gió [79]. Hoạt tính sinh học các hợp chất flavonoid phân lập được
thử nghiệm in vitro trên dòng tế bào ung thư Hela bằng phương pháp SRB [98].
Nhiệt độ nóng chảy của hợp chất được đo trên máy Electrothermal IA 9000 series,
dùng mao quản không hiệu chỉnh đo tại phòng hợp chất thiên nhiên, Viện công
nghệ Hóa học, số 1, Mạc Đĩnh Chi, Quận 1, TP. HCM.
2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân
Các phương pháp thường sử dụng để xác định cấu trúc hợp chất hữu cơ bao
13C-NMR (125 MHz), DEPT, HSQC, HMBC được ghi trên máy Bruker AM500
gồm các phương pháp như: Phổ cộng hưởng từ hạt nhân [4]: 1H-NMR (500 MHz),
58
FT-NMR Spectrometer [1, 4]. Độ dịch chuyển hoá học (ppm), hằng số tương tác J
tính bằng Hz, chất nội chuẩn là TMS (Tetrametyl Silan). Viện Hóa học, Viện Khoa
học và Công nghệ Việt Nam. Dung môi được sử dụng bao gồm các dung môi
DMSO-d6, CD3OD-d4, CDCl3, pyridine-d5. Đây là các dung môi có khả năng hòa
tan các dẫn xuất flavonoid chiết xuất [4].
2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể
Kỹ thuật nhiễu xạ tia X gồm ba bước [8, 34]: 1) thu thập tinh thể tốt, các
chiều lớn hơn 100 micron, không có tạp chất, không sứt mẻ và có cấu trúc ổn định.
2) đặt tinh thể vào tâm hướng chiếu của tia X, thường có bước sóng đơn, nhằm tạo
ra các mẫu nhiễu xạ. Tinh thể xoay từ từ và dữ liệu về ảnh nhiễu xạ được ghi nhận.
3) dùng kỹ thuật tính toán, dữ liệu hoá học bổ xung để đưa ra mô hình về sự sắp xếp
các nguyên tử trong đơn tinh thể. Dữ liệu nhiễu xạ đơn tinh thể của các hợp chất
hữu cơ phân lập được đo trên máy Bruker D8 Quest (tại Khoa Hóa học, Trường ĐH
KHTN) ở nhiệt độ 100 K, đối âm cực Mo với bước sóng Kα (λ = 0,71073 Å) [8].
Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi đơn tinh thể được thực
hiện trên phần mềm Apex 2 của máy đo [82, 109]. Cấu trúc được xác định theo
phương pháp trực tiếp. Sử dụng phần mềm XT tích hợp trong Olex2 để tính và tối
ưu hoá cấu trúc [8, 109].
2.4.3. Kỹ thuật thử hoạt tính in vitro
2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B
Xác định khả năng gây độc tế bào: Thực hiện sàng lọc thô, xác định độc tính
tế bào của hợp chất ở nồng độ 100 µg/ml, với dung môi hòa tan là
dimethylsulfoxide (DMSO) trên các dòng tế bào ung thư người bằng phương pháp
Sulforhodamine B (SRB) đã được Viện ung thư Hoa Kỳ (NCI) sử dụng cho chương
trình sàng lọc [33, 65, 98]. Dòng tế bào ung thư HeLa do NCI cung cấp, quá trình
thí nghiệm và kết quả sàng lọc được trình bày dưới dạng tỉ lệ % gây độc tế bào
[98].
Với những chất có khả năng gây độc tế bào cao sẽ tiếp tục xác định nồng độ
của chất có khả năng gây chết 50% trên quần thể tế bào nuôi cấy (GI50). Toàn bộ
59
quá trình thí nghiệm diễn ra trong 3 - 4 tuần. Lượng nguyên liệu cần để xác định
khả năng gây độc tế bào ít nhất là 5 mg/chất [31, 35].
Nguyên tắc: Thử nghiệm Sulforhodamine B (SRB) là một phương pháp so
màu đơn giản và nhạy để xác định độc tính tế bào của một chất. SRB là một thuốc
nhuộm tích điện âm sẽ liên kết tĩnh điện được với các phần điện tích dương của
protein trong tế bào ung thư Hela. Lượng thuốc nhuộm liên kết sẽ phản ánh lượng
protein của tế bào [64]. Trong thử nghiệm, tế bào được cố định trong suốt có màu
hồng. Mật độ quang đo được của dung dịch tương quan với lượng protein tổng hay
số lượng tế bào. Sự thay đổi lượng tế bào ung thư so với mẫu đối chứng phản ánh
hoạt tính gây độc tế bào của các dẫn xuất flavonone và isoflavone [46].
2.4.3.2. Nuôi cấy tế bào
Quy trình khảo sát hoạt tính gây độc bằng phương pháp SRB: Giải đông
nguồn tế bào ung thư bảo quản trong nitơ lỏng, nuôi cấy tế bào đến thế hệ thứ 4
(P4): Nuôi cấy tế bào trong bình cấy đạt độ phủ khoảng 70 – 80%; Phủ tế bào vào
các đĩa 96 giếng với mật độ tế bào/giếng ban đầu là 104 tế bào/giếng (đối với dòng
tế bào HeLa và MCF-7) và 7,5. 103 tế bào/giếng (đối với dòng NCl-H460) theo thiết
kế khảo sát sau: một mẫu đối chứng dương là tế bào với camptothecin ở nồng độ 0,
01 (µg/ml); một mẫu chứng âm là tế bào với dung môi hòa tan chất thử (DMSO
0,25%); các dẫn xuất flavone, isoflavone cần thử nghiệm hoạt tính gây độc. Trong
trường hợp xác định GI50 thì mẫu thử nghiệm sẽ được pha loãng ở các nồng độ 0,1;
3; 6; 9; 10; 12; 20; 30; 40; 50; 100 (μg/ml) [31, 68].
Thiết kế thử nghiệm của 1 mẫu gồm: Hai giếng tế bào có môi trường nuôi
cấy chứa chất thử ở nồng độ khảo sát; 2 giếng không có tế bào có môi trường nuôi
cấy chứa chất thử ở nồng độ khảo sát (2 giếng trắng (blank); Ủ ở 37 oC, 5 % CO2,
24 giờ; Bổ sung môi trường chứa chất thử với nồng độ gấp đôi nồng độ thuốc muốn
thử (không loại bỏ môi trường cũ đã có ở trong giếng); Ủ ở 37 oC, 5 % CO2, 48 giờ
[31, 68, 91]. Cố định tế bào trong giếng với trichloroacetic acid (TCA): Đối với
dòng tế bào Hela là dòng tế bào có bám dính: sử dụng dung dịch TCA 50% vào mỗi
giếng (cho vào từ từ không quá nhanh) [31]: đặt đĩa vào trong tủ lạnh (4oC), 1 đến 3
60
giờ, loại bỏ chất trong mỗi giếng; rửa nhẹ nhàng với nước (200 μl/giếng) 5 lần; để
khô tự nhiên ở nhiệt độ 25 oC, 12 đến 24 giờ.
2.4.3.3. Nhuộm SRB
Quá trình nhuộm SRB được thực hiện theo các bước sau: Cho dung dịch
SRB 0,2% vào mỗi giếng; Ủ ở nhiệt độ phòng, 5-20 phút; Loại bỏ dung dịch SRB;
Rửa nhẹ bằng dung dịch acetic acid 1 % (5 lần); Để khô tự nhiên ở nhiệt độ phòng
12-24 giờ [24]. Đọc kết quả: Cho 200 µl Tris-base 10mM vào mỗi giếng; Lắc trên
máy lắc khoảng 10-15 phút cho đến khi SRB tan hoàn toàn; Đo mật độ quang ở
bước sóng 492 nm và 620 nm [24].
2.4.3.4. Xử lý kết quả
Sau khi có giá trị mật độ quang ở bước sóng 492 nm (OD492) và 620 nm (OD620):
(2.1) - Tính giá trị OD = OD492 - OD620
(2.2) - Tính OD492 (hoặc OD620) = ODtb - ODblank
- Tính tỉ lệ (%) gây độc tế bào theo công thức:
(2.3)
Với: ODtb: giá trị OD của giếng chứa tế bào; ODblank: giá trị OD của giếng
trắng; ODTN: giá trị OD của mẫu thử tính từ công thức (2.1) và (2.2); ODC: giá trị
OD của mẫu đối chứng dương tính từ công thức (2.1) và (2.2).
2.4.3.5. Xác định GI50
GI50 (µg/ml) được xác định như sau: Xây dựng đồ thị biểu diễn tỷ lệ (%)
gây độc tế bào theo nồng độ khảo sát của chất cần thử nghiệm. Từ đồ thị, nội suy ra
giá trị nồng độ cho tỉ lệ gây độc tế bào 50% bằng cách: Tính phương trình đường
thẳng qua 2 điểm có tỉ lệ gây độc tế bào gần 50% nhất (1 điểm có tỉ lệ gây độc tế
bào nhỏ hơn 50%, điểm còn lại có tỉ lệ gây độc tế bào lớn hơn 50%); Từ phương
trình trên (có dạng y = ax + b), thế y = 50 vào, ta suy ra được giá trị nồng độ x chính
là GI50 [98].
61
2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID
Sau khi xây dựng các mô hình QSAR, phân lập các hợp chất tự nhiên, chúng
tôi tiến hành dự báo hoạt tính sinh học nhóm kiểm tra; thiết kế, sàng lọc và dự báo
hoạt tính kháng ung thư từ các chất mẫu và hợp chất tự nhiên trên cơ sở vị trí
nguyên tử cacbon trong phân tử flavonoid còn trống, có thể gắn các nhóm thế mới
khi thiết kế dẫn xuất mới. Các hợp chất mới được thiết kế và các hợp chất chiết xuất
được dự đoán hoạt tính sinh học để xác định hợp chất có hoạt tính sinh học cao.
62
CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN
3.1. NGHIÊN CỨU LÝ THUYẾT
3.1.1. Tính toán thông tin cấu trúc
Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng
chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán
Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được
tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS.
3.1.1.1. Khảo sát phương pháp cơ học phân tử
Chọn lựa gradient
Chọn lựa gradient cũng như thuật toán trong là vô cùng quan trọng, ảnh
hưởng trực tiếp đến các kết quả tính toán thông tin cấu trúc phân tử.
Nhằm tối thiểu hóa năng lượng phân tử bằng phương pháp cơ học phân tử
dựa trên giá trị gradient, thuật toán và tùy chọn phù hợp với cấu trúc phân tử nghiên
cứu. Kết quả thăm dò về ảnh hưởng của mức gradient và thuật toán đối với năng
lượng phân tử của isoflavone (isofla-30) trình bày ở Bảng 3.1.
Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30)
Gradient (A) Thuật toán (B) 1 0,1 10 0,01
Steepest descent 32,119 29,493 56,750 29,388
Fletcher-Reeves 29,743 29,394 46,823 29,386
Polak-Ribiere 47,067 29,698 29,395 29,384
Newton-Raphson 46,000 30,736 29,401 29,385
Bằng phương pháp phân tích phương sai một yếu tố cho thấy mức gradient
có ảnh hưởng đến năng lượng phân tử (F = 63,853 > F0,05 = 3,863) [61, 83].
Sự giảm năng lượng phân tử theo mức gradient thể hiện trên Bảng 3.1, Hình
3.1, cho thấy với gradient ≤ 0,1 năng lượng phân tử thấp nhất và ổn định nhất.
Chính vì vậy trong đề tài này mức gradient ≤ 0,1 được chọn để tối ưu hóa cấu trúc
phân tử cho các dẫn xuất flavonoid.
63
Trong nghiên cứu, này điện tích nguyên tử (Atomic charges) sẽ được chọn vì
phần lớn các tham số hóa lượng tử được dùng để thiết lập mô hình QSAR dựa trên
cấu trúc điện tử của các nguyên tử trên khung phân tử.
Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient
Chọn lựa thuật toán
Kết quả thăm dò về ảnh hưởng của thuật toán trên năng lượng phân tử của
hợp chất isoflavone (isofla-30) Phụ lục 1a cũng được thể hiện trong Bảng 3.1.
Phương pháp phân tích phương sai một yếu tố cho thấy các thuật toán
Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton-Raphson không có ảnh
hưởng đến năng lượng phân tử (F = 1,599 < F0,05 = 3,863).
Như vậy, trong đề tài thuật toán có thể được chọn bất kỳ, chọn thuật toán
Polak – Ribiere để tối ưu hóa cấu trúc phân tử cho các dẫn xuất flavonoid.
3.1.1.2. Khảo sát phương pháp hóa lượng tử
Tính toán các thông tin cấu trúc như điện tích nguyên tử, độ dịch chuyển hóa
học, các tham số hóa lý, tham số hình học 3D, 3D của nhóm dẫn xuất flavone và
isoflavone bằng phương pháp hóa lượng tử phù hợp. Tiếp theo, chúng tôi khảo sát
ảnh hưởng của phương pháp hóa lượng tử trên giá trị moment lưỡng cực phân tử.
64
Kết quả thăm dò về ảnh hưởng của các phương pháp hóa lượng tử bán thực
nghiệm đối với các tham số hóa lượng tử, với tham số chọn làm chuẩn là moment
lưỡng cực được trình bày ở Bảng 3.2.
Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone
Phương pháp hóa lượng tử Hợp chất CNDO INDO MNDO AM1 RM1 PM3 TNDO
fla-1 3,372 3,310 3,525 3,680 3,993 3,128 2,949
fla-2 3,132 3,145 2,939 3,063 3,445 2,836 2,617
isofla-3 4,977 5,250 4,661 4,920 5,100 5,186 4,620
fla-4 4,033 4,381 3,419 3,608 3,597 4,209 3,726
fla-5 3,437 3,475 3,332 3,239 3,500 2,889 2,847
fla-6 4,935 5,030 4,348 4,403 4,617 4,166 4,491
isofla-7 4,851 5,058 4,648 5,009 5,208 5,220 4,578
fla-8 3,935 4,199 3,475 3,826 3,857 4,326 3,738
fla-9 2,927 3,189 2,658 2,963 3,003 3,194 2,510
fla-10 4,060 4,420 4,242 4,113 4,345 4,418 3,685
Phân tích phương sai hai yếu tố không lặp cho thấy các phương pháp hóa
lượng tử bán thực nghiệm: CNDO, INDO, MNDO, AM1, RM1, PM3, TNDO [38]
có F = 0,632 < F0,05 = 2,246 cho thấy các phương pháp hóa lượng tử không ảnh
hưởng đến kết quả tính toán của tham số hóa lượng tử, moment lưỡng cực.
Vì vậy, chúng tôi chọn phương pháp PM3 để tính điện tích (Qi) và tham số
hóa lý, chọn phương pháp TNDO để tính toán độ dịch chuyển hóa học (i) của các
dẫn xuất flavonoid. Đây là các phương pháp cho phép sai số thấp nhất trong quá
trình tính toán như trong một số nghiên cứu trước đó [30, 100].
3.1.2. Tham số cấu trúc và tính chất phân tử
3.1.2.1. Điện tích
Các dẫn xuất flavone và isoflavone trong Phụ lục 1a được xây dựng lại cấu
trúc phân tử, tối ưu hóa cấu trúc và tính toán các tham số điện tích nguyên tử trong
khung phân tử, sử dụng phương pháp cơ học phân tử MM+ và hóa học lượng tử bán
65
thực nghiệm SCF PM3 trong HyperChem [38]. Điện tích nguyên tử sử dụng làm dữ
liệu để xây dựng các mô hình quan hệ giữa cấu trúc điện tử và hoạt tính tuyến tính
(QESARMLR) và mạng thần kinh (QESARANN). Kết quả tính toán được đưa ra ở Phụ
lục 1b.
3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dịch chuyển hóa học
Cấu trúc thực nghiệm của flavone và isoflavone được xây dựng lại và tối ưu
bằng phương pháp cơ học phân tử MM+ ở mức gradient 0,05. Dữ liệu độ dịch
chuyển hóa học i của 13C-NMR và 15O-NMR tính bằng phương pháp hóa lượng tử
phiên bản mới TNDO/2 SCF trên module HyperNMR [38, 39]. Các mô hình quan
hệ giữa cấu trúc phổ và hoạt tính (QSDARMLR và QSDARANN) được xây dựng dựa
trên giá trị độ dịch chuyển hóa học (i) của các nguyên tử carbon và oxy trong
khung phân tử flavone, isoflavone. Kết quả tính toán giá trị độ dịch chuyển hóa học
cho ở Phụ lục 2.
3.1.2.3. Tham số hóa lý
Tính chất hóa lý của một số dẫn xuất trong Phụ lục 1a và một số dẫn xuất trong
các hợp chất tự nhiên được tính toán từ phương trình bán thực nghiệm [15] mục
2.3. Kết quả tính toán trình bày ở Bảng 3.16 và Bảng 3.28.
3.1.2.4. Tham số hình học 2D, 3D
Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng
chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán
Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được
tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS [28, 49].
3.2. XÂY DỰNG MÔ HÌNH QSAR
3.2.1. Khảo sát các biến số mô hình
Chọn loại biến phụ thuộc: Trong quá trình xây dựng mô hình hồi quy tuyến
tính, dạng biến phụ thuộc Y cũng có thể ảnh hưởng đến chất lượng mô hình. Cần
khảo sát các kiểu chuyển dạng của giá trị GI50, 1/GI50 và pGI50 = -log(GI50) kết quả
tr cho ở Bảng 3.3.
khảo sát ảnh hưởng của dạng biến phụ thuộc dựa trên giá trị R2
66
tr
Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2
Biến phụ thuộc (Y) Biến độc lập (X) GI50exp 1/ GI50exp pGI50exp
0,921 0,774 0,938 Điện tích nguyên tử (QESARMLR)
0,906 0,786 0,906 Độ dịch chuyển hóa học (QSDARMLR)
Từ Bảng 3.3 kết quả phân tích ANOVA một yếu tố không lặp cho thấy: các
tr (Ftt = 2,134 < F0,05 = 4,118)
dạng biến phụ thuộc không ảnh hưởng đến giá trị R2
như vậy có thể chọn dạng biến phụ thuộc là pGI50 để xây dựng mô hình [61, 83].
và SE
Hình 3.2 Ảnh hưởng của k đến R2
Chọn số biến số: Sự thay đổi số biến số trong mô hình cũng có thể tác động
đến giá trị hồi quy R2 khi xây dựng các mô hình tuyến tính và mạng thần kinh, kết
quả khảo sát cho ở Hình 3.2, theo đó ta chọn lựa khoảng số biến số (k) từ 5 đến 7 là
tr cao và ổn định.
phù hợp vì R2
tr, R2
pr, SE
Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2
k 2 3 4 5 6 7 8 9 10
tr
R2 0,327 0,484 0,636 0,802 0,861 0,906 0,909 0,921 0,921
pr
R2 0,036 0,204 0,38 0,631 0,673 0,8 0,713 0,678 0,641
SE 0,287 0,257 0,221 0,167 0,143 0,121 0,122 0,118 0,121
Mạng thần kinh nhân tạo
67
Chọn số lớp ẩn: Kết quả thăm dò ảnh hưởng của số nút của lớp ẩn đến giá trị
tr, cấu trúc mạng sử dụng I(6) – HL(m) – O(1), I(7) – HL(m) – O(1) giá trị m thay
R2
đổi từ 1 - 6 kết quả ở Bảng 3.5.
tr
Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2
m 1 2 3 4 5 6
95,569 90,480 88,374 89,146 88,928 88,398 QESARANN
92,423 93,392 93,121 93,417 92,572 92,228 QSDARANN
Phân tích ANOVA một yếu tố cho thấy cấu trúc mạng với số nút của lớp ẩn
tr (Ftt = 0,0335 < F0,05 = 2,7729) [61].
thay đổi không ảnh hưởng đến giá trị R2
tr và R2
pr
Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2
tr
pr
Số lớp ẩn Cấu trúc mạng R2 R2
I(6) - HL(2) - O(1) 0,905 0,837 1
I(6) - HL(2) - HL(2) - O(1) 0,863 0,888 2
I(6) - HL(2) - HL(2) - HL(2)- O(1) -0,23 -0,017 3
I(7) - HL(2) - O(1) 0,924 0,800 1
I(7) - HL(2) - HL(2) - O(1) 0,853 -0,021 2
I(7) - HL(2) - HL(2) - HL(2)- O(1) -0,292 -0,285 3
Kết quả khảo sát chọn lựa số lớp ẩn là 1 để xây dựng mô hình, hơn nữa các
mạng có hai lớp ẩn có thể hiện các hàm với hình dáng bất kỳ, nên về mặt lý thuyết
không có lý do nào cần sử dụng nhiều hơn hai lớp ẩn. Một số nghiên cứu đã chỉ ra
rằng đối với phần lớn các bài toán cụ thể, chỉ cần sử dụng một lớp ẩn cho quá trình
luyện mạng là đủ.
Chọn số nút trên mỗi lớp ẩn: Kết quả khảo sát ảnh hưởng của sự tăng số lớp
tr cho ở Bảng 3. chọn cấu trúc một lớp ẩn để luyện mạng với R2
tr =
ẩn đến giá trị R2
0,905 cao hơn cả.
Chọn hàm truyền: Để xác định loại hàm truyền cho quá trình luyện mạng,
tr và R2
pr kết quả cho
chúng tôi khảo sát ảnh hưởng của loại hàm truyền đến giá trị R2
trong Bảng 3.7
68
tr và R2
pr
Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2
tr
pr
R2 R2
Biến độc lập (k) Hàm truyền (C) Hàm truyền (C)
Linear Sigmoid Tanh Linear Sigmoid Tanh
-3,443 0,905 0,858 -1,660 0,837 0,885 QESAR (k = 6)
QSDAR (k = 7) -2,577 0,9242 -0,578 -73,746 0,800 -0,054
Phân tích ANOVA cho thấy loại hàm truyền có (Ftt = 1,104 < F0,05 = 5,050)
tr. Hàm truyền Sigmoid cho giá trị R2
tr cao nên sẽ
không ảnh hưởng đến giá trị R2
chọn làm hàm truyền cho quá trình luyện mạng với mục đích làm giảm mức độ
phức tạp của các tính toán.
Chọn moment và mức độ sai số luyện: kết quả khảo sát ảnh hưởng của
tr và R2
pr được cho ở Bảng 3.8.
moment và sai số luyện mạng đến giá trị R2
Kết quả phân tích phương sai hai yếu tố không lặp cho thấy các giá trị
moment không ảnh hưởng đến kết quả luyện mạng (Ftt = 0,013 < F0,05 = 3,020), các
mức độ sai số luyện ảnh hưởng đến kết quả luyện mạng (Ftt = 11,736 > F0,05 =
tr = 0,956 và R2
pr = 0,837 vì nếu
3,084). Chọn sai số luyện 0,0001 ứng với giá trị R2
tr và R2
pr hơn nữa các tính
chọn mức độ sai số luyện nhỏ hơn cũng không làm tăng R2
toán lại tốn quá nhiều thời gian và dung lượng đĩa [61].
tr
Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2
Giá trị moment của mô hình QESARANN ứng với k = 6
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
tr
0,917 0,908 0,909 0,909 0,907 0,956 0,905 0,911 0,870 0,907 R2
pr
0,808 0,814 0,819 0,825 0,831 0,837 0,837 0,817 0,884 0,831 R2
Mức độ sai số luyện của mô hình QESARANN ứng với k = 6
0,000001 0,00001 0,0001 0,001 0,01 0,1
tr
0,905 0,905 0,956 0,905 0,869 -0,079 R2
pr
0,837 0,837 0,837 0,836 0,848 -0,842 R2
69
Chọn số vòng lặp, giải thuật lan truyền và tốc độ học: chọn vòng lặp để cải
thiện mô hình mạng thần kinh, kết quả khảo sát về ảnh hưởng của cấu trúc mạng và
tr, được dẫn ra ở phụ lục 3 với yếu tố A là cấu trúc mạng,
số vòng lặp trên giá trị R2
yếu tố B là số vòng luyện.
tr (Ftt =
Phân tích ANOVA cho thấy số vòng luyện ảnh hưởng đến giá trị R2
4,144 > F0,05 = 1,l462), như vậy có thể chọn số nút ẩn tùy từng mô hình sao cho các
tính toán nhanh chóng. Chọn số vòng lặp là 10000 cho quá trình luyện mạng, đây là
tr cao, ổn định, sai số nhỏ hơn.
số vòng lặp có giá trị R2
Chọn giải thuật lan truyền ngược cho quá trình luyện để tính đạo hàm của
hàm lỗi (tổng của tất cả các lỗi tại mỗi mẫu) nhằm giảm thiểu sai số cho quá trình
luyện mạng. Sự thay đổi tham số tốc độ học (learning rate) cũng ảnh hưởng hiệu
suất của mạng đối với số vòng lặp xác định. Giá trị tham số này càng nhỏ thì mạng
hiệu chỉnh trọng số càng chậm. Nhưng muốn đạt đến trạng thái tối ưu thì ta phải
tăng số vòng lặp nhiều hơn ở đây chúng tôi chọn tốc độ học 0,7 do mạng thần kinh
điều chỉnh cho mô hình xây dựng là tốt nhất.
Từ các kết quả thăm dò trên rút ra kết luận: biến phụ thuộc là pGI50; biến độc
lập là điện tích nguyên tử và độ dịch chuyển hóa học; số biến số trong các mô hình
từ 5 đến 7; hàm truyền Sigmoid; số lớp ẩn là 1, số nút trên mỗi lớp ẩn là 2; moment
bằng 0,7; mức độ sai số luyện bằng 0,0001; số vòng lặp bằng 10000; giải thuật lan
truyền ngược; tốc độ học 0,7.
3.2.2. Xây dựng các mô hình QESAR
3.2.2.1. Mô hình tuyến tính QESARMLR
Chọn tập luyện và tập kiểm tra
Chọn tập luyện và tập kiểm tra từ tập dữ liệu về cấu trúc và hoạt tính kháng
ung thư cổ tử cung pGI50 của nhóm dẫn xuất flavone và isoflavone (Phụ lục 1a).
Để khách quan trong quá trình phát triển các mô hình, từ tập dữ liệu về hoạt
tính của nhóm dẫn xuất flavone và isoflavone chọn lựa tập luyện (a) và tập kiểm tra
(b) (19%) bằng phương pháp chọn lựa thông minh trong INForm (smart selection)
kết quả cho ở Phụ lục 4.
70
Xây dựng mô hình và tính toán đóng góp của các tham số
Quá trình thực hiện xây dựng và đánh giá mô hình: Mỗi mô hình QESAR
được thành lập từ nhóm luyện (Phụ lục 4), sử dụng hoạt tính kháng ung thư pGI50
và điện tích nguyên tử cacbon và oxy trong khung phân tử các dẫn xuất flavone và
isoflavone, trên phần mềm Regress [13, 85].
Quá trình này được thực hiện bằng cách thay đổi điện tích nguyên tử trong
cấu trúc phân tử. Lựa chọn điện tích nguyên tử đưa vào mô hình QESAR bằng giải
thuật thêm dần và loại bỏ dần từng biến.
Các quá trình được thực hiện liên tục, tuần hoàn cho đến khi xây dựng được
tr, SE, R2
adj, Ftt, ttt và R2
kiemtra. Các mô hình tuyến
mô hình có giá trị thống kê gồm: R2
tính QESARMLR được trình bày ở Bảng 3.9.
Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê
tr
test
k Nguyên tử trong các mô hình R2 SE R2
2 0,1390 0,816 0,765 O1, C7
3 0,1240 0,860 0,800 O1, C4, C6
4 0,901 0,1070 0,829 O1, C2, C4, C5
5 0,924 0,0957 0,873 O1, C2, C4, C5, C3'
6 0,938 0,0887 0,903 O1, O11, C3, C4, C6, C7
7 0,906 0,0743 0,714 O11, C4, C6, C8, C9, C2', C6'
8 0,970 0,0653 0,696 O11, C3, C6, C7, C8, C9, C10, C3'
9 0,978 0,0574 0,563 O1, O11, C3, C4, C6, C7, C8, C9, C10
10 0,978 0,0595 0,358 O1, O11, C3, C6, C7, C8, C9, C2', C3', C6'
Chúng tôi tiến hành xác định phần trăm đóng góp điện tích các nguyên tử có
mặt trong 3 mô hình tuyến tính QESARMLR (với k = 5, 6, 7).
Giá trị thống kê tương ứng của 3 mô hình QESARMLR (với k = 5 – 7) được
dẫn ra trong Bảng 3.10.
Mô hình QESARMLRứng với k = 5
pGI50 = -0,9332 – 101,2080O1 – 15,4264C2 – 6,8735C4 – 7,9686C5 –
(3.1) 16,1166C3'
71
Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7)
tr
adj
pr
k R2 R2 SE R2
5 0,924 0,905 0,096 0,873
6 0,938 0,919 0,089 0,903
7 0,959 0,943 0,074 0,879
Mô hình QESARMLR ứng với k = 6
pGI50 = 6,7116 – 42,3105O1 – 8,1592O11 + +3,0139C3 – 19,0370C4 + 6,6117C6 +
(3.2) 4,6038C7
Mô hình QESARMLR ứng với k = 7
pGI50 = 4,714 – 32,8026O11 – 60,0703C4 + 20,8772C6 + 16,9016C8 +
95,4205C9 – 24,4720C2' – 25,4219C6' (3.4)
Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi
Giá trị phần trăm đóng góp trung bình MPmxk của các biến độc lập trong mỗi
mô hình QESARMLR (với k = 5 – 7) được xác định từ phần trăm đóng góp Pmxk của
biến số. Giá trị này được xác định qua giá trị đóng góp tổng cộng của các biến số
72
Ctotal trong một hợp chất. Phần trăm đóng góp trung bình toàn cục GMmPmxk của
mỗi biến được mô tả ở Hình 3.3, Bảng 3.11.
Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các
mô hình QESARMLR (với k = 5 – 7)
m = 6, i = 1 - 6 m = 7, i = 1 - 7 GMPmxi,% m = 5, i = 1 - 5
GIÁ TRỊ m = 5,6,7 Hệ số P5xi, % Hệ số P6xi, % Hệ số P7xi, %
tr
R2 0,924 0,938 0,959
adj
R2 0,905 0,919 0,943
SE 0,09569 0,0887 0,0743
pr
R2 0,873 0,903 0,879
hằng số -0,933 6,712 4,714
27,41 -101,21 57,6 -42,31 24,63 O1
-15,43 13,42 4,47 C2
3,014 4,22 1,41 C3
31,98 -6,874 15,12 -19,04 42,45 -60,07 38,39 C4
-7,969 2,06 0,69 C5
6,612 6,57 20,88 5,78 4,12 C6
4,604 3,51 1,17 C7
16,9 5,7 1,9 C8
95,42 22,6 7,53 C9
13,36 -8,159 18,63 -32,8 21,46 O11
-24,47 2,5 0,83 C2
3,93 -16,12 11,8 C3'
1,19 -25,42 3,58 C6'
Sự đóng góp mức độ quan trọng của điện tích nguyên tử trong cấu trúc phân
tử của flavone và isoflavone có mặt trong 3 mô hình QESARMLR được sắp xếp theo
trật tự dựa vào giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3’. Các vị trí C4,
O1 và O11 được xem là vị trí quan trọng trong phân tử vì đó là các nguyên tử thuộc
nhóm carbonyl C4 = O11, nguyên tử O1 có cặp điện tử tự do kết hợp với điện tử
73
của liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11
có các tính chất phản ứng của hệ carbonyl. Các vị trí trung tâm quan trọng nhất đã
được đưa ra ở Hình 3.3 điều này cũng phù hợp với thực nghiệm [18, 103].
Ngoài ra, C6 là vị trí trí quan trọng và đã được thăm dò gắn các nhóm thế vào
vị trí này [80, 103]. Các C9 và C3’ cũng thể hiện vai trò quan trọng, nhưng C9 không
phải là vị trí còn trống, nên không được chọn để gắn nhóm thế. Như vậy có thể chọn
C6 để gắn nhóm thế mới vào trong một số hợp chất flavone và isoflavone. C3’ còn
trống và cũng có thể sử dụng gắn thêm nhóm thế mới và hy vọng tạo ra một hợp
chất có hoạt tính cao và độc tính thấp. Từ định hướng này, chọn hợp chất flavone 1a
và isoflavone 6b trong Phụ lục 4 để làm chất mẫu có hoạt tính đã biết, tiến hành gắn
thử nhóm thế mới vào C6 và C3’.
tr = 0,938 và R2
pr =
Chọn mô hình QESARMLR (với k = 6) có các giá trị R2
0,903 trong Bảng 3.11 để dự đoán tính hoạt tính sinh học của nhóm dẫn xuất
flavone và isoflavone vì ở mô hình này phù hợp về thống kê nhất, tất cả các hệ số
hồi quy được đánh giá bằng chuẩn student đều có giá trị P < 0,05 (ttt > t0,05) Phụ lục
5, đánh giá sự tương thích của phương trình hồi quy bằng chuẩn Fisher (Ftt > F0,05
hay P < 0,05). Chọn các vị trí O1, O11, C3, C4, C6, C7 để xây dựng mô hình mạng
thần kinh QESARANN.
3.2.2.2. Mô hình mạng thần kinh QESARANN
Mô hình QESARANN được xây dựng trên phần mềm INForm [40, 87].
Kiến trúc mạng thần kinh I(6)-HL(2)-O(1) gồm: lớp nhập I(6) có 6 yếu tố
đầu vào là điện tích nguyên tử O1, O11, C3, C4, C6 và C7 có mặt trong mô hình
QESARMLR; lớp xuất O(1) gồm 1 yếu tố đi ra là giá trị hoạt tính pGI50; lớp ẩn HL(2)
phía trong gồm 2 nút; thuật toán lan truyền ngược và sai số được chọn để luyện
mạng; hàm truyền sigmoid đặt trên mỗi nút mạng của các lớp; tham số luyện mạng
gồm tốc độ học là 0,7; moment là 0,7; sai số giám sát mục tiêu MSE = 0,005882; số
tr = 0,956 và R2
pr = 0,837.
vòng lặp 10000; sau quá trình luyện mạng, giá trị R2
74
3.2.2.3. Kiểm tra khả năng dự đoán
Hoạt tính pGI50 của 6 hợp chất trong nhóm kiểm tra Phụ lục 4 được dự đoán
bằng mô hình QESARMLR và QESARANN, kết quả đưa ra ở Bảng 3.12. Kiểm tra khả
năng dự đoán từ các mô hình QESAR được đánh giá cẩn thận dựa vào các chuẩn
thống kê phù hợp, các giá trị tuyệt đối của các sai số tương đối ARE,%, giá trị trung
bình của các sai số tương đối MARE,%. Giá trị sai số MARE,% của mô hình
QESARANN nhỏ hơn giá trị sai số MARE,% mô hình QESARMLR, cho thấy khả năng
dự đoán của mô hình mạng thần kinh QESARANN tốt hơn mô hình tuyến tính
QESARMLR.
Sau khi sử dụng mô hình tuyến tính QESARMLR và QESARANN để dự đoán
hoạt tính pGI50 của các chất trong nhóm kiểm tra cho thấy mức độ đúng và chính
xác chấp nhận được, sai lệch của dự đoán nằm trong khoảng không chắc chắn của
các phép đo thực nghiệm. Như vậy các mô hình QESARMLR và QESARANN này đáp
ứng yêu cầu dùng để dự đoán các chất mới.
Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN
ARE,% pGI50,pr Hợp chất pGI50,exp QESARMLR QESARANN QESARMLR QESARMLR
1b 5,921 6,008 5,891 1,468 0,513
2b 5,745 5,692 5,743 0,930 0,033
3b 6,097 5,759 5,788 5,549 5,068
4b 5,699 5,651 5,712 0,840 0,221
5b 5,699 5,651 5,735 0,835 0,623
6b 5,137 5,092 5,109 0,883 0,543
MARE,% 1,751 1,167
3.2.3. Xây dựng các mô hình QSDAR
3.2.3.1. Mô hình tuyến tính QSDARMLR
Chọn tập luyện và tập kiểm tra
Tập dữ liệu về tham số độ dịch chuyển hóa học và hoạt tính kháng ung thư
pGI50 của các dẫn xuất flavone và isoflavone trong Phụ lục 1a được chia thành tập
75
luyện và tập kiểm tra. Tập kiểm tra gồm các hợp chất kí hiệu là a1, a2, a3, a4, a5 và a6
(Phụ lục 6).
Xây dựng mô hình và tính toán đóng góp của các tham số
Các mô hình QSDARMLR (với k = 2 đến 10) Bảng 3.13 bằng cách kết hợp
hoạt tính kháng ung thư pGI50 và độ dịch chuyển hóa học (i) sử dụng phần mềm
Regress. Quá trình thực hiện bằng cách thay đổi độ dịch chuyển hóa học (i) của các
nguyên tử oxy và cacbon. Thêm hoặc loại bỏ một biến độ dịch chuyển hóa học (i)
vào hoặc ra khỏi mô hình QSDARMLR. Khi xây dựng xong mô hình tiến hành đánh
giá mô hình bằng kỹ thuật đánh giá chéo loại và bỏ dần từng trường hợp tương tự
như đối với mô hình QESAR. Kiểm tra khả năng dự đoán của các mô hình
tr, R2
pr, R2
ad (R2 hiệu chỉnh), sai số chuẩn SE và
QSDARMLR dựa trên các giá trị R2
chuẩn Fisher, Student.
Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê
tr
ad
pr
k Nguyên tử trong các mô hình R2 R2 SE R2
2 0,327 0,268 0,287 0,036 O1, C4
3 0,484 0,413 0,257 0,204 O1, C4, C11
4 0,636 0,566 0,221 0,38 O1, C4, C5, C6
5 0,802 0,752 0,167 0,631 O1, O11, C4, C6, C7
6 0,861 0,817 0,143 0,673 O1, O11, C3, C4, C6, C7
7 0,906 0,869 0,121 0,800 O1, O11, C2, C3, C6, C7, C2’
8 0,909 0,867 0,122 0,713 O1, O11, C2, C3, C4, C5, C6, C7
9 0,921 0,877 0,118 0,678 O1, O11, C2, C3, C4, C5, C6, C7, C2’
1 0,869 0,121 0,641 O1, O11, C2, C3, C4, C5, C6, C7, C1’,C2’ 0,921
tr càng tăng, SE càng giảm, giá trị R2
tr và SE tương
0 Bảng 3.13 cho thấy khi R2
ứng với số biến số k = 5 trở đi thay đổi không đáng kể, hơn nữa việc đưa quá nhiều
tr lên bao nhiêu. Chính vì vậy
biến số vào mô hình cũng không làm tăng giá trị R2
chúng tôi khảo sát các mô hình ứng với k = 5, 6 và 7 bao gồm các nguyên tử O1,
O11, C2, C3, C4, C6, C7 và C2’, chọn các vị trí này để xác định phần trăm đóng góp
76
của các nguyên tử quan trọng đối với hoạt tính kháng ung thư. Kết quả tính MPmxi,
%, GMPmxi, % và các giá trị thống kê của các mô hình QSDARMLR (với k = 5, 6 và
7) cũng được đưa ra trong Bảng 3.14.
Độ dịch chuyển hóa học quan trọng của các nguyên tử cacbon và oxy trong
phân tử flavone và isoflavone đã thể hiện bằng cách sắp xếp giá trị độ lớn
GMPmxi,% như C4 > C7 > O11 > C6 > C3 > O1 > C2 > C2’.
Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch
chuyển hóa học i trong các mô hình QSDARMLR
QSDARMLR MPxk,% Biến số xi GMPmxi,% m = 5 m = 6 m = 7 m = 5 m = 6 m = 7
tr
0,802 0,861 0,906 - - - R2 -
ad
0,752 0,817 0,869 - - - R2 -
0,167 0,143 0,121 - - - SE -
pr
0,631 0,673 0,800 - - - R2 -
Hệ số 14,459 37,055 32,99 - - - -
0 0,014 0,016 0,133 7,649 9,949 5,91 O1
0,004 0,008 0,006 18,599 11,386 9,501 13,162 O11
- - -0,045 - 16,448 5,483 - C2
- -0,058 -0,063 14,348 17,603 10,65 - C3
-0,068 -0,078 - 71,64 27,471 - 33,037 C4
0,006 -0,059 -0,047 5,169 16,424 14,965 12,186 C6
-0,005 -0,075 -0,059 4,46 22,722 20,312 15,832 C7
- - -0,037 - - 11,222 3,741 C2'
Vị trí O1, C2, C3 và C4 như là các vị trí quan trọng trong phân tử. Bởi vì các
nguyên tử này là các nguyên tử cacbon và oxy của nhóm carbonyl C4 = O11 và
nguyên tử O1 với các electron tự do. Trong trường hợp này các electron của các
liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11 có
thể thực hiện các phản ứng oxy hóa khử. Điều này phù hợp với các nghiên cứu thực
nghiệm. Hơn nữa, các vị trí C6, C7 và C3 cũng cho thấy rằng các vị trí quan trọng đã
77
khảo sát và nghiên cứu bằng các nhóm thế gắn vào các nguyên tử C3, C6 và C7 để
thiết kế các dẫn xuất mới.
Mô hình QSDARMLR (với k = 7) có giá trị sai số SE thấp nhất, cho giá trị hồi
quy là phù hợp nhất, tất cả các hệ số hồi quy và phương trình hồi quy đều có giá trị
tr = 0,906 và R2
pr = 0,800 cao
P < 0,05 Phụ lục 7, hơn nữa đây là mô hình có giá trị R2
nhất, SE = 0,121 thấp nhất cho thấy đây là mô hình tuyến tính QSDARMLR tốt hơn
cả. Mô hình QSDARMLR (với k = 7) có dạng:
pGI50 = 32,99 + 0,016O1 + 0,006O11- 0,045C2 - 0,063C3 - 0,047C6 - 0,059C7 -
(3.5) 0,037C2'
3.2.3.2. Mô hình mạng thần kinh QSDARANN
Mô hình mạng thần kinh QSDARANN được xây dựng bằng mạng thần kinh
trên phần mềm INForm [40] đã được khảo sát kiến trúc mạng. Kiến trúc I(7)-
HL(2)-O(1) bao gồm lớp nhập I(7) với yếu tố đầu vào đã được chọn là O1, O11, C2,
C3, C6, C7 và C2’ là các biến số trong mô hình tuyến tính QSDARMLR với k = 7 và
một lớp xuất O(1) với yếu tố đầu ra (pGI50) như là biến mục tiêu, cấu trúc một lớp
ẩn HL(2) với hai nút. Giải thuật lan truyền ngược, sai số 0,001 được sử dụng để
luyện kiểu mạng thần kinh này. Các tham số để luyện mạng nơ ron là tốc độ học
0,7; momen = 0,7; vòng lặp 10000 và sai số MSE = 0,0305764. Hàm truyền
sigmoid được sử dụng cho mỗi nơ ron của lớp nhập và lớp xuất. Sau khi luyện mô
pr = 0,800; giá trị R2
tr đạt được 0,924 cao hơn giá trị
hình thần kinh QSDARANN, R2
tr = 0,906 đối với mô hình tuyến tính QSDARMLR.
R2
3.2.3.3. Kiểm tra khả năng dự đoán
Khả năng dự đoán của các mô hình QSDARANN và QSDARMLR được đánh giá
cẩn thận bằng kỹ thuật đánh giá chéo loại bỏ từng trường hợp. Trong trường hợp
này 6 dẫn xuất flavone và isoflavone trong nhóm kiểm tra được chọn ngẫu nhiên
như trong Phụ lục 6. Các giá trị hoạt tính kháng ung thư pGI50 của 6 dẫn xuất trong
nhóm kiểm tra dẫn ra ở Bảng 3.15 nhận được từ mô hình tuyến tính QSDARMLR
được so sánh với các giá trị nhận được từ mô hình mạng nơ ron sử dụng giá trị tuyệt
đối của các sai số tương đối ARE,%.
78
Khả năng dự đoán của 2 mô hình cũng dựa vào giá trị MARE,%. Giá trị
MARE,% = 1,119 đối với mô hình QSDARANN là nhỏ hơn giá trị MARE,% = 2,391
đối với mô hình QSDARMLR. Như vậy các giá trị dự đoán pGI50 nhận được từ mô
hình QSDARANN là gần với các hoạt tính thực nghiệm [80]. Với pGI50,exp và pGI50,pr
là các hoạt tính thực nghiệm và kiểm tra. Sai số MARE,% được sử dụng để đánh giá
sai số toàn cục của các mô hình QSDARMLR và QSDARANN.
Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các
mô hình QSDARMLR (với k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1)
Hợp ARE,% pGI50,pr pGI50,exp chất QSADRMLR QSDARANN QSDARMLR QSDARANN
5,745 5,781 5,789 0,636 0,764 a1
5,699 5,758 5,796 1,039 1,697 a2
5,796 5,808 5,708 0,209 1,515 a3
5,921 6,181 5,957 4,389 0,606 a4
5,699 5,394 5,755 5,344 0,975 a5
5,658 5,503 5,723 2,730 1,157 a6
MARE,% 2,391 1,119
Sau khi sử dụng các mô hình QSDARMLR và QSDARANN để dự đoán hoạt
tính kháng ung thư của các dẫn xuất kiểm tra, độ lệch khoảng dự đoán là có thể
chấp nhận. Các mô hình QSDARMLR và QSDARANN thỏa mãn các đòi hỏi thực tế để
dự đoán hoạt tính kháng ung thư pGI50 của các dẫn xuất mới. Một lần nữa chúng tôi
khẳng định khả năng dự đoán của các mô hình quan hệ cấu trúc hoạt tính là hoàn
toàn đáng tin cậy.
3.2.4. Xây dựng mô hình QSSRMLR
3.2.4.1. Nguyên tắc xây dựng
Xây dựng mô hình quan hệ cấu trúc – cấu trúc (QSSRMLR) để dự đoán hoạt tính
cũng như tính chất hóa lý của các hợp chất flavonoid. Mô hình được xây dựng dựa
vào tính chất tương tự của các cấu trúc phân tử dẫn đến các tính chất hóa học hay
những tính chất khác cũng có mối tương quan, vì vậy có thể xây dựng mối quan hệ
79
cấu trúc với cấu trúc để từ đó xác định được tính chất của một hợp chất chưa biết
dựa vào tính chất của các cấu trúc đã biết. Trong nghiên cứu này có hai nhóm chất
có cấu trúc tương tự là nhóm flavone và isoflavone. Sử dụng quan hệ giữa cấu trúc
– cấu trúc để dự đoán tính chất, hoạt tính kháng ung thư cúa các dẫn xuất flavonoid
trong nhóm kiểm tra và flavonoid phân lập.
3.2.4.2. Tính toán các tham số hóa lý
Các hợp chất trong Phụ lục 1a được xây dựng, tối ưu hóa cấu trúc phân tử bằng
phương pháp cơ học phân tử MM+, mức gradient 0,05. Tham số hóa lý tính toán
như mục 2.3.1 [15] Các tham số cấu trúc này được sử dụng làm dữ liệu để kiểm tra
khả năng dự đoán của các mô hình QSSRMLR.
3.2.4.3. Xây dựng mô hình
Mô hình tuyến tính QSSRMLR cũng được nghiên cứu, phát triển từ các kỹ thuật
hồi quy tuyến tính. Mô hình quan hệ cấu trúc - cấu trúc (QSSRMLR) là mối quan hệ
giữa những hợp chất (y) và các hợp chất có cấu trúc tương tự (x). Các mô hình
QSSRMLR được xây dựng bằng phương pháp hồi quy tuyến tính. Sự phù hợp tốt
tr và khả năng dự đoán của các
nhất của mô hình QSSRMLR được thể hiện ở giá trị R2
pr. Sử dụng các hợp chất trong Phụ lục 1a để xây dựng
mô hình thể hiện ở giá trị R2
các mô hình QSSRMLR.
Mô hình QSSRMLR được xây dựng từ các thay đổi điện tích các nguyên tử
của những hợp chất. Sự xắp xếp dọc theo thứ tự giá trị tương quan của mối quan hệ
tuyến tính giữa những hợp chất sử dụng điện tích nguyên tử và tính chất hóa lý
được chỉ ra ở Hình 3.4.
80
a)
b)
Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính
chất hóa lý
■: fla-A23 và fla-A11; ▲: fla-A15 và isofla-A32; ○: isofla-A32 và isofla-A4.
Những hợp chất trong Phụ lục 1a được lựa chọn ngẫu nhiên để đánh giá mối
tương quan điện tích nguyên tử và tính chất hóa lý giữa các hợp chất. Kết quả tính
toán hệ số tương quan điện tích giữa các hợp chất được cho ở Bảng 3.1 .
Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử
fla-A23 fla-A6 fla-A15 fla-A22 isofla-A32 fla-A28 fla-A5 isofla-A4
1,0000 fla-A23
0,8664 1,0000 fla-A6
0,9220 0,8254 1,0000 fla-A15
0,9984 0,8548 0,9132 1,0000 fla-A22
1,0000 isofla-A32 0,9247 0,7565 0,9659 0,9254
0,9222 0,8259 1,0000 0,9134 0,9656 1,0000 fla-A28
0,9986 0,8696 0,9267 0,9983 0,9261 0,9270 1,0000 fla-A5
0,9250 0,7560 0,9659 0,9257 1,0000 0,9657 0,9264 1,0000 isofla-A4
0,9999 0,8668 0,9225 0,9981 0,9236 0,9227 0,9986 0,9239 fla-A11
Những hợp chất có cấu trúc tương tự có tính chất tương quan tốt với nhau.
Mô hình hồi quy tuyến tính của các hợp chất flavone và isoflavone (Y) được xây
dựng từ điện tích nguyên tử được trình bày ở Bảng 3.17. Mô hình tuyến tính
81
tr = 0,999 và R2
pr = 0,999. Bảng 3.17 đưa
QSSRMLR với các giá trị thống kê rất tốt R2
ra 10 mô hình từ 32 hợp chất nghiên cứu trong Phụ lục 1a đại diện cho khả năng dự
đoán dựa trên mối quan hệ cấu trúc – cấu trúc.
Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất
Phương pháp
ARE%
Tính chất hóa lý và hoạt tính kháng ung thư pGI50
QSSR
Tham khảo [15]
Mô hình QSSR của Fla-A1 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00020159
Fla-A1 = 0,00015 + 1,018 (Fla-A5) -0,513 (Fla-A21)+ 0,497 (Fla-A22 ) (3.6)
Độ khả phân cực bề mặt lưới
68,453
68,120 0,489
5,663
5,699 0,638
pGI50
Mô hình QSSR của Fla-A2 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00035399
Fla-A2 = -0,00020+1,260 (Fla-A6)+0,871 (Fla-A14)-1,134 (Fla-A24) (3.7)
Nhiệt nóng chảy (Tm) ở 1 atm
741,521
745,496 0,533
931,125
934,452 0,356
Nhiệt độ tới hạn (Tc)
Mol Refractivity
8,711
8,715 0,053
978,789
980,510 0,176
Nhiệt độ sôi, (Tb) ở 1 atm
6,473
5,921 9,321
pGI50
pr = 0,9999; SE = 0,00010411
tr = 0,9999; R2
Mô hình QSSR của Fla-A3 với R2 Fla-A3 = 0,00002+0,935 (Fla-A7) +0,582 (Fla-A16) -0,517 (Fla-A28) (3.8)
Nhiệt nóng chảy (Tm) ở 1 atm
737,884
745,496 1,021
932,899
934,452 0,166
Nhiệt độ tới hạn (Tc)
Hiệu ứng nhiệt KJ/mol
-318,085
-313,160 1,573
Hằng số Henry
7,266
7,240 0,355
5,726
5,699 0,469
pGI50
Mô hình QSSR của Fla-A4 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00013747
isoFla-A4 = -0,000002+0,980 (isoFla-A8)-0,233(isoFla-A18)+ 0,252(isoFla-A19) (3.9)
Nhiệt nóng chảy (Tm) ở 1 atm
718,146
745,496 3,669
914,478
934,452 2,138
Nhiệt độ tới hạn (Tc)
nghiên cứu bằng mô hình QSSRMLR và các chất dùng để dự đoán
82
Hằng số Henry
7,237
7,240 0,042
5,084
5,009 1,495
pGI50
Mô hình QSSR của Fla-A5 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00019793
Fla-A5 = -0,00015+0,982 (Fla-A1) +0,499 (Fla-A21) -0,483 (Fla-A22) (3.10)
936,289
913,478 2,497
Nhiệt độ tới hạn (Tc)
Chỉ số khúc xạ phân tử
8,731
9,179 4,884
977,737
933,630 4,724
Nhiệt độ sôi, (Tb) ở 1 atm
Hằng số Henry
7,034
7,110 1,073
LogP
8,731
9,179 4,884
5,734
5,699 0,618
pGI50
Mô hình QSSR của Fla-A6 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00026038
Fla-A6 = 0,00019+0,682 (Fla-A2)-0,587 (Fla-A14)+0,907 (Fla-A24) (3.11)
Nhiệt nóng chảy (Tm) ở 1 atm
730,455
717,167 1,853
927,997
914,743 1,449
Nhiệt độ tới hạn (Tc)
Khối lượng mol
324,833
323,343 0,461
5,772
6,046 4,533
pGI50
Mô hình QSSR của Fla-A7 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00013549
Fla-A7 = -0,00003+1,037 (Fla-A3)+-0,041 (Fla-A16)+0,004 (Fla-A27) (3.12)
743,221
717,167 3,633
Nhiệt nóng chảy (Tm) ở 1 atm
932,252
914,743 1,914
Nhiệt độ tới hạn (Tc)
Hiệu ứng nhiệt KJ/mol
-309,816
-313,790 1,267
Hằng số Henry
7,228
7,240 0,171
5,700
5,658 0,750
pGI50
Mô hình QSSR của Fla-A8 với R2
tr = 0,9999; R2
pr = 0,9999; SE = 0,00119054
isoFla-A8 = 0,0000051+ 1,006(isoFla-A4)+ 0,253(isoFla-A18)-0,259(isoFla-A19) (3.13)
746,066
717,167 4,030
Nhiệt độ sôi, (Tb) ở 1 atm
936,202
914,743 2,346
Nhiệt độ tới hạn (Tc)
Hằng số Henry
7,243
7,240 0,038
4,994
5,071 1,503
pGI50
83
tr = 0,9999; R2
pr = 0,9999; SE = 0,00018592
Mô hình QSSR của Fla-A9 với R2
Fla-A9 = 0,000004+0,047 (Fla-A5) +1,025 (Fla-A11) -0,072 (Fla-A23) (3.14)
836,779 817,055 2,414 Nhiệt nóng chảy (Tm) ở 1 atm
1029,858 1011,888 1,776 Nhiệt độ tới hạn (Tc)
Hằng số Henry 7,052 7,050 0,026
LogP 4,663 4,537 2,772
5,698 5,745 0,810 PGI50
tr = 0,9999; R2
pr = 0,9999; SE = 0,00042716
Mô hình QSSR của Fla-A10 với R2
Fla-A10 = 0,00012+0,977 (Fla-A9) -1,055 (Fla-A21) +1,079 (Fla-A22) (3.15)
815,011 814,381 0,077 Nhiệt nóng chảy (Tm) ở 1 atm
18,820 18,692 0,683 Áp suất tới hạn (Pc), Bar
1003,621 1004,806 0,118 Nhiệt độ tới hạn (Tc)
-404,221 -387,410 4,339 Hiệu ứng nhiệt KJ/mol
Chỉ số khúc xạ phân tử 10,963 10,930 0,305
Log P 3,766 3,740 0,694
Hằng số Henry 7,063 7,050 0,190
5,652 5,678 0,448 PGI50
3.2.4.4. Kiểm tra khả năng dự đoán
Mô hình hồi quy tuyến tính nhận được từ các dẫn xuất flavone và isoflavone
này có thể ứng dụng để dự đoán tính chất hóa lý cũng như hoạt tính kháng ung thư
của các flavone và isoflavone có cấu trúc tương tự.
Các mô tả cấu trúc phân tử của các hợp chất để xây dựng mô hình QSSRMLR
được tính toán một cách cẩn trọng, kết quả dự đoán tính chất hóa lý và pGI50 cho ở
Bảng 3.17, Hình 3.5 chỉ ra rằng mô hình hồi quy tuyến tính QSSRMLR của các hợp
chất flavone và isoflavone là hoàn toàn đáng tin cậy.
Phân tích ANOVA một yếu tố cũng chỉ ra rằng kết quả dự đoán tính chất hóa
lý và hoạt tính kháng ung thư của các dẫn xuất flavone và isoflavone từ mô hình
QSSRMLR thì không khác các giá trị tính chất hóa lý tham khảo, giá trị hoạt tính
kháng ung thư xác định từ thực nghiệm [28] với (Ftt = 0,0010 < F0,05 = 3,9423).
84
Các mô hình QSSRMLR đã được xây dựng và dự đoán thành công tính chất
hóa lý, hoạt tính pGI50 của nhóm dẫn xuất kháng ung thư flavone và isoflavone có
cấu trúc tương tự.
n á o đ ự d ị r t á i G
Giá trị thực nghiệm
Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm
3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1)
3.2.5.1. Dữ liệu
Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất
và hoạt tính kháng tế bào ung thư cổ tử cung GI50/M trong Phụ lục 1a.
Các tham số cấu trúc 2D, 3D được tính toán bằng phương pháp cơ học phân
tử trên phần mềm QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a
đến Phụ lục 10h.
3.2.5.2. Xây dựng mô hình QSARMLR (3.16)
QSARANN(1) thu được thông qua 2 nhóm: nhóm luyện được chọn lựa ngẫu nhiên và
Trong nghiên cứu này, các mô hình QSARMLR (3.16), phương trình 3.16 và
nhóm kiểm tra. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)
được đánh giá bằng cách so sánh kết quả dự đoán và hoạt tính thực nghiệm của các
hợp chất trong nhóm kiểm tra, là nhóm không được sử để thiết lập mô hình
QSARMLR (3.16) và QSARANN(1) từ nhóm luyện.
85
pred và SE trong các mô hình QSARMLR với các
Sự biến thiên các giá trị R2, R2
tham số mô tả 2D và 3D, tương ứng chỉ ra trong Bảng 3.18.
pred và MSE
Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2
pred
k Tham số mô tả phân tử 2D, 3D trong các mô hình MSE R² R²
2 a1, a2 0,063 0,657 0,630
3 0,034 0,820 0,798 a1, a2, a3
4 0,027 0,866 0,843 a2, a3, a4, a5
5 0,023 0,891 0,867 a2, a5, a6, a7, a8
6 0,019 0,914 0,890 a2, a5, a6, a8, a9, a10
7 0,015 0,933 0,910 a2, a5, a6, a8, a9, a10, a11
8 0,015 0,936 0,909 a5, a8, a10, a12, a13, a14, a15, a16
0,012 0,955 0,932 a5, a6, a8, a10, a11, a16, a17, a18, a19 9
10 0,012 0,955 0,928 a5, a6, a8, a10, a11, a15, a16, a17, a18, a19
Kí hiệu a1 là xvc3, a2 là dipole, a3 là xvpc4, a4 là xvp6, a5 là logP, a6 là xp8,
a7 là volume, a8 là knotpv, a9 là xvp8, a10 là SHBa, a11 là Hmaxpos, a12 là xp6, a13 là
SaaCH, a14 là k2, a15 là nvx, a16 là knotp, a17 là ABSQ, a18 là SsOH, a19 là phia.
Để xây dựng các mô hình QSARMLR, các tham số mô tả 2D và 3D được chọn
lựa bằng kĩ thuật hồi quy từng bước. Các tham số mô tả 2D, 3D được chọn dựa trên
cơ sở các giá trị thống kê R2, SE và F-stat. Các mô hình được đánh giá chéo bằng kĩ
pred. 9 mô hình phù
thuật loại bỏ dần từng trường hợp (LOO) để xác định giá trị R2
hợp nhất được chỉ ra trong Bảng 3.18. Các mô hình QSARMLR (với k từ 2 đến 10)
pred. Trong
được xắp xếp một cách trật tự với sự thay đổi các giá trị R2, SE và R2
Bảng 3.18, các mô hình QSARMLR (với k từ 8 đến 10) là các mô hình có giá trị
pred cao hơn cả. Cụ thể, trong mô hình QSARMLR với k = 9 có R2 cao nhất là 0,955
R2
pred là 0,932. Vì vậy, chúng tôi lựa chọn ba mô hình (với k là 8, 9 và 10) để xác
và R2
định giá trị phần trăm đóng góp của các tham số mô tả 2D, 3D đối với hoạt tính
kháng ung thư.
86
Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và
GMPmxi,% đối với các tham số mô tả phân tử 2D và 3D trong các mô hình
QSARMLR (với k là 8, 9 và 10)
QSARMLR MPmxi,% GMPmxi, % m = 8 M = 9 m = 10 m = 8 m = 9 m = 10
tr
R2 0,936 0,955 0,955
pr
R2 0,909 0,932 0,928
SE 0,124 0,107 0,110
Hệ số -13,133 3,044 2,946
k2 -4,926 - 23,638 - 7,879
xp6 -2,899 - 6,399 - 2,133
xp8 8,827 - 4,473 4,282 14,301 12.181
nvx - 3,487 0,036 45,229 1,138 15,456
knotp -8,350 -2,673 -2,794 9,072 7,879 7,325 8,092
knotpv 34,40 15,54 15,917 9,681 11,878 10,813 10,790
2,057 SHBa -0,225 0,019 0,016 4,398 1,004 0,770
2,166 Hmaxpos - -1,203 -1,201 3,439 3,060
0,497 SaaCH -0,166 - - 1,490
ABSQ - -5,982 -5,939 33,101 29,255 20,785
SsOH - 0,359 0,358 2,924 2,609 1,844
phia - 3,067 2,999 21,167 18,413 13,193
logP 0,050 0,839 0,793 0,093 4,308 3,624 2,675
Các giá trị phần trăm đóng góp trung bình MPmxi,%, GMPmxi, % và các giá
trị thống kê khác đối với các mô hình (với k là 8, 9 và 10), được đưa ra trong Bảng
3.19. Giá trị phần trăm đóng góp trung bình MPmxi của các biến độc lập trong mỗi
mô hình QSARMLR (với k là 8, 9 và 10), được xác định từ giá trị phần trăm đóng
góp Pxk của mỗi biến độc lập trong từng trường hợp quan sát tương tứng Pmxi được
tính toán từ giá trị đóng [86] góp tổng cộng Ctotal của mỗi biến trong từng hợp chất
87
[86]. Kết quả tính toán giá trị phần trăm đóng góp trung bình MPmxi,% và giá trị
phần trăm đóng góp trung bình toàn cục GMPmxi,% được đưa ra trong Bảng 3.19.
Giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% [86] trong Bảng
3.19 đã mô tả mức độ quan trọng của các tham số mô tả 2D, 3D của các flavone và
isoflavone. Sự xắp xếp mức độ ảnh hưởng quan trọng của các tham số 2D, 3D trong
các mô hình QSARMLR theo thứ tự là GMPmxi,%: SaaCH < SsOH < SHBa < xp6 <
Hmaxpos < logP < k2 < knotp < xp8 < knotpv < phia < nvx < ABSQ. Các tham số
mô tả ABSQ, nvx, phia, knotpv, xp8, knotp, k2 và LogP được xem là các tham số
mô tả quan trọng nhất trong mỗi phân tử. Ngoài ra, các tham số mô tả phân tử đại
diện cho các nhóm carbonyl C4 = O11 và nguyên tố O1. Các nguyên tố này có các
cặp electron tự do với electron của liên kết C2 = C3 và C4 = O11 tạo hệ liên hợp.
Nhóm carbonyl C4 = O11 thể hiện toàn bộ phản ứng tự nhiên của nhóm của nhóm
cacbonyl [80, 103].
Vì vậy, các tham số mô tả phân tử cũng chứng minh được định lượng tổng
điện tích trên toàn phân tử bởi giá trị GMPmxi và chúng cũng phù hợp với các giá trị
thực nghiệm [54, 80, 103]. Vì vậy, vị trí các nguyên tử C6 và C3’ còn trống, có thể
gắn các nhóm thế mới trong nghiên cứu dẫn xuất mới [80, 89, 103]. Các vị trí khác
cũng có thể đại điện tác động đến hoạt tính sinh học GI50, nhưng chúng là các vị trí
a)
Hợp chất flavonoid trong nhóm kiểm tra b)
không thể gắn thêm nhóm thế nên không được sử dụng để thiết kế dẫn xuất mới.
Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid
trong nhóm kiểm tra
88
Các vị trí C6 và C3’ được lựa chọn để gắn thêm các nhóm thế mới tạo thành
các flavonoid mới. Tương tự, vị trí C2’ cũng còn trống và có thể sử dụng để gắn các
nhóm mới vào phân tử. Điều này cho phép tạo nên các hợp chất mới có hoạt tính
sinh học cao hơn hợp chất mẫu. Từ đó, các flavonoid chiết xuất có thể chọn lựa làm
hợp chất mẫu để thiết kế thuốc mới có hoạt tính cao hơn. Điều này được chỉ ra trong
phần thảo luận bên dưới.
Các mô tả phân tử được ứng dụng trọng kỹ thuật phân tích hồi quy đa biến để
thiết lập mô hình QSAR với quá trình lựa chọn biến số độc lập bằng cách sử dụng
mô hình MLR [86, 107]. Mô hình QSAR cuối cùng với các tham số mô tả k = 9 là
mô hình tốt nhất [106]. Chín biến số độc lập bao gồm xp8, ABSQ, SsOH,
Hmaxpos, phia, knotp, knotpv, SHBa và LogP được lựa chọn để xây dựng mô hình
QSARMLR. Kết quả dự đoán hoạt tính sinh học được minh chứng qua giá trị R2 dự
Pr) phù hợp với dữ liệu thực nghiệm. Mô hình QSARMLR (3.16) như sau:
đoán (R2
pGI50 = 3,044 + 4,473×xp8 -5,982×ABSQ + 0,359×SsOH - 1,203×Hmaxpos
+ 3,067×phia - 2,673×knotp + 15,540×knotpv + 0,019×SHBa + 0,839×LogP
(3.16)
tr = 0,955; R2
Adj= 0,932; R2
pr = 0,745; SE = 0,107; F = 42,182
Với n = 34; R2
3.2.5.3. Xây dựng mô hình QSARANN(1)
Mô hình QSARANN(1) được xây dựng bằng kỹ thuật neuro-fuzzy với thuật
toán di truyền sử dụng phần mềm INForm [40]. Mô hình mạng thần kinh nhân tạo
có kiến trúc mạng I(9)-HL(5)-O(1) được xây dựng. Kiến trúc mạng này bao gồm
lớp input I(9) với 9 nơ ron tương ứng với 9 biến độc lập xp8, ABSQ, SsOH,
Hmaxpos, phia, knotp, knotpv, SHBa và LogP; lớp ẩn HL(5) với 5 nơ ron và lớp
output O(1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan truyền ngược
được ứng dụng để luyện mạng thần kinh. Hàm truyền cho mỗi nơ ron là đường tiếp
tuyến Hypecbol; mỗi tham số luyện mạng khác nhau được sử dụng cho quá trình
luyện mạng với tốc độ huấn luyện (moment) là 0.7 và tốc độc học là 0.01; sai số
tổng cộng là 0,0003017, sai số dự đoán là 0,00001 với 300000 vòng lặp. Sau khi
89
luyện mạng mô hình mạng thần kinh thu được có kiến trúc I(9)-HL(5)-O(1), với giá
tr là 0,8963 và R2
pr là 0,8883.
trị thống kê R2
3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)
Khả năng dự đoán của các mô hình QSARMLR (3.16) và QSARANN(1) được đánh
pr. Sáu hợp
giá cẩn thận bằng kỹ thuật loại bỏ từng trường hợp (LOO) và giá trị R2
chất trong nhóm kiểm tra được sử dụng để kiểm tra khả năng dự đoán hoạt tính sinh
học của các mô hình QSARMLR (3.16) và QSARANN(1). Hoạt tính dự đoán của các
flavonoid trong nhóm kiểm tra được so sánh với dữ liệu thực nghiệm, cho ở Bảng
3.20. Hoạt tính sinh học dự đoán từ các mô hình QSAR được so sánh với hoạt tính
sinh học thực nghiệm và so sánh giữa các mô hình với nhau bởi giá trị sai số tương
đối trung bình MARE,%. Các giá trị MARE,% cho thấy rằng khả năng dự đoán của
mô hình QSARMLR (3.16) thì thấp hơn của mô hình QSARANN(1) chỉ ra trong Bảng
3.20. Sau khi sử dụng các mô hình QSARMLR (3.16) và QSARANN(1) để dự đoán hoạt
tính sinh học pGI50 của sáu hợp chất trong nhóm kiểm tra chỉ ra khả năng dự đoán
chính xác của các mô hình QSAR với các sai số nằm trong khoảng tin cậy của phép
đo thực nghiệm. Tuy nhiên, các mô hình QSARMLR (3.16) và QSARANN(1) đều có
khả năng dự báo tốt đối với hoạt tính sinh học của các hợp chất mới.
Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR
(3.16) và QSARANN(1)
ARE,% pGI50,pred Hợp chất pGI50,exp M1 M2 M1 M2
Fla-1 5,699 5,3879 5,7371 5,4589 0,6685
Fla-11 5,699 5,9188 6,0478 3,8568 6,1204
Fla-24 5,6198 5,9316 5,7662 5,5482 2,6051
Fla-25 5,6383 5,8627 5,6843 3,9799 0,8158
Fla-26 5,699 5,8841 5,7058 3,2479 0,1193
Fla-30 5,0862 4,8677 4,9365 4,2959 2,9433
MARE,% 4,3979 2,2121
M1: Mô hình QSARMLR (3.16); M2 là mô hình QSARANN (1)
90
3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN
3.2.6.1. Dữ liệu
Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất
và hoạt tính kháng tế bào ung thư cổ tử cung GI50/M (Phụ lục 1a). Các tham số cấu
trúc 2D, 3D được tính toán bằng phương pháp cơ học phân tử trên phần mềm
QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a - 10h. Các tham số
này sử dụng để xây dựng hồi quy tuyến tính (QSARMLR) [86], hồi quy thành phần
chính (QSARPCR) [9] và mạng nơ-ron nhân tạo (mô hình QSARPCA-ANN [40].
3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18)
Dữ liệu ban đầu được chia thành tập luyện và tập kiểm tra bằng phương pháp
lấy mẫu ngẫu nhiên. Các mô hình QSAR xây dựng từ nhóm luyện. Sự thay đổi các
pred và SE trong các mô hình QSARMLR với các tham số 2D và 3D được
giá trị R2, R2
chỉ ra trong Bảng 3.21. Các mô hình QSARMLR, các mô tả phân tử 2D và 3D được
chọn bằng thuật toán hồi quy bằng thuật toán hồi quy.
pred và MSE
Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2
pred
k Tham số mô tả phân tử 2D, 3D trong các mô hình R2 R2 SE
2 0,756 0,731 0,430 a1, a2
3 0,774 0,732 0,417 a1, a2, a3
4 0,805 0,772 0,390 a1, a2, a3, a4
5 0,832 0,756 0,365 a1, a2, a3, a4, a5
6 0,854 0,812 0,342 a1, a4, a5, a6, a7, a8
7 0,836 0,721 0,365 a1, a2, a3, a4, a5, a9, a10
8 0,837 0,693 0,367 a1, a2, a3, a4, a5, a8, a9, a10
9 0,838 0,682 0,369 a1, a2, a3, a4, a5, a8, a9, a10, a11
10 0,841 0,650 0,368 a1, a2, a3, a4, a5, a6, a8, a9, a10, a11
(Với a1 là LogP, a2 là MaxNeg, a3 là ka2, a4 là SdO, a5 là MaxQp, a6 là
Ovality, a7 là SdssC, a8 là ka3, a9 là ABSQ, a10 là ABSQon, a11 là dipole).
91
Quy trình lựa chọn cho mô tả 2D và 3D dựa trên sự thay đổi của các giá trị
thống kê R2, SE và F-stat. Các mô hình QSARMLR đánh giá chéo bằng kỹ thuật
pred được xác định. 9 mô hình phù hợp nhất được đưa ra trong
LOO, các giá trị R2
Bảng 3.21.
Các mô hình QSARMLR (với k từ 2 đến 10) được xắp xếp theo trật tự thay đổi
pred. Trong Bảng 3.21, các mô hình QSARMLR
của các giá trị thống kê R2, SE và R2
pred lớn hơn.
(với k từ 5 đến 7) cho thấy giá trị R2
Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các
Biến số
QSARMLR
MPmxi,%
GMPmxi, %
m
m = 5
m = 6
m = 7
m = 5
m = 6
m = 7
R2
0,832
0,854
0,836
R2
adj
0,820
0,841
0,820
SE
0,365
0,342
0,365
R2
pred
0,756
0,812
0,721
Hệ số
3,883
8,509
4,790
ABSQ
-0,222
-0,257
27,945
18,636
19,005
21,862
-
ABSQon
-
0,0143
-
-
0,433
0,144
-
MaxQp
3,416
2,8540
3,588
24,043
25,862
25,908
25,271
MaxNeg
-
6,122
-
24,203
23,890
16,031
-
SdO
0,0125
0,0247
0,0126
6,192
3,792
3,665
4,550
ka2
0,133
0,143
27,484
17,617
17,426
20,842
-
LogP
0,156
0,2192
0,163
15,651
9,829
9,672
11,717
Ovality
-
-3,6969
-
5,292
4,393
2,315
4,000
SdssC
-
0,2969
-
4,382
5,613
7,236
5,744
ka3
-
0,3635
-
5,351
9,324
3,473
6,049
tham số mô tả phân tử 2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7)
tr là 0,854 và R2
pr
Đặc biệt, mô hình QSARMLR (3.17) R với k = 6 với giá trị R2
là 0,812 cao hơn các mô hình còn lại. Mô hình QSARMLR (3.17) với k = 6:
pGI50 = 8,509 + 2,8540MaxQp + 0,0247SdO + 0,2192LogP - 3,6969Ovality +
0,2969SdssC + 0,3635ka3 (3.17)
92
Vì vậy, ba mô hình tốt nhất (với k của 5, 6 và 7) được chọn để xác định tỷ lệ
phần trăm đóng góp của mô tả 2D, 3D đến hoạt tính kháng ung thư. Tỷ lệ đóng góp
có giá trị MPmxi, GMPmxi và các giá trị thống kê khác nhau của các mô hình (với k
bằng 5, 6 và 7) tương ứng được trình bày trong Bảng 3.22.
Giá trị phần trăm đóng góp MPmxi của biến số độc lập trong từng mô hình
QSARMLR (với k bằng 5, 6 và 7) được xác định từ phần trăm đóng góp phần trăm
Pmxi của từng biến tương ứng trong mỗi trường hợp quan sát [86]. Giá trị này được
xác định từ tổng giá trị đóng góp tổng cộng các biến trong một chất [66, 86]. Như
vậy tỷ lệ đóng góp trung bình MPmxi, và GMPmxi [86] của mỗi biến độc lập cho 3
mô hình được xác định, kết quả cho ở trong Bảng 3.22.
Phần trăm đóng góp trung bình toàn cục GMPmxi,% trong Bảng 3.22 mô tả
mức độ ảnh hưởng của mô tả phân tử 2D và 3D của nhóm dẫn xuất flavone và
isoflavone. Đối với các mô hình QSARMLR, mức độ quan trọng của mô tả phân tử
2D và 3D được sắp xếp theo các giá trị GMPmxi,%: MaxQp > ABSQ > ka2 >
MaxNeg > LogP > ka3 > SdssC > SdO > Ovality > ABSQon.
Các tham số mô tả ABSQ, MaxQp, ka2, MaxNeg và LogP được xem như
các bộ tham số mô tả quan trọng nhất trên mỗi phân tử. Bên cạnh những tham số
mô tả phân tử này còn cho thấy theo bản chất của nhóm cacbonyl C4 = O11 và
nguyên tử O1. Các nguyên tử này có cặp electron tự do liên hợp với điện tử C2 = C3
và C4 = O11 để hình thành hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất phản
ứng hoàn toàn của chất carbonyl [80, 103]. Vì vậy, những mô tả này có thể được
chứng minh tổng điện tích trên phân tử bằng các giá trị GMPmxi,% và chúng cũng
phù hợp với các đánh giá thực nghiệm [80, 103, 113].
Ngoài ra, các vị trí nguyên tử C6 và C3' cũng là vị trí trống và có thể gắn các
nhóm chức mới. Các vị trí khác cũng có thể có ảnh hưởng quan trọng đối với các
hoạt tính sinh học GI50, nhưng chúng không phải là vị trí trống, vì vậy không thể
gắn những nhóm thế mới. Do đó các vị trí C6 và C3' được chọn để gắn các nhóm thế
mới vào tạo thành flavonoid mới. Tương tự, vị trí C2' cũng còn trống và có thể được
sử dụng để gắn nhóm chức mới. Việc này sẽ tạo thành các hợp chất mới và có thể
93
cải thiện hoạt tính sinh học so với chất mẫu. Từ đó, flavonoid phân lập có thể được
lựa chọn như chất mẫu để thiết kế các loại thuốc mới có hoạt tính cao hơn. Điều này
được thể hiện trong phần thảo luận dưới đây.
Các mô tả phân tử được áp dụng bằng kỹ thuật PCR để xây dựng mô hình
QSAR [106, 111]. Mô hình QSAR với số biến số k = 6 là mô hình tốt nhất được
chọn có các tham số mô tả phân tử MaxQp, SdO, ka3, LogP, Ovality và SdssC
h c í t
m ă r t
%
[63].
g n ê i r ị r t á i G
n ầ h P
, y ũ l
Thành phần chính
Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50
pred phù hợp với dữ liệu thực
Kết quả dự đoán hoạt tính sinh học với giá trị R2
nghiệm. Số lượng các thành phần chính được trích ra bằng kỹ thuật phân tích thành
phần chính và tương quan giữa pGI50 và pGI50pred được chỉ ra trong Hình 3.7. Mô
hình hồi quy thành phần QSARPCR (3.18) có dạng:
pGI50 = 5,48356 + 0,38027×PC1 - 0,11868×PC2 + 0,34789×PC3 +
(3.18) 0,06995×PC4 + 0,21850×PC5 + 0,35057×PC6
= 0,833; R2
adj= 0,820, R2
tr
pr =0,812, SE = 0,342, MSE =
với n = 26; R2
0,1236; F = 63,172
3.2.6.3. Xây dựng mô hình QSARPCA-ANN
Mô hình QSARPCA-ANN được xây dựng bằng kỹ thuật neurofuzzy với thuật
toán di truyền bằng chương trình INForm [40, 87]. Kiến trúc mạng nơ-ron nhân tạo
I(6) -HL(9) - O(1) đã được xây dựng. Mô hình QSARPCA-ANN bao gồm lớp đầu vào
I(6) với 6 nơ ron là các biến độc lập PC1, PC2, PC3, PC4, PC5 và PC6 tương ứng với
các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC; lớp ẩn HL(9) với 9 nơ ron
thần kinh và lớp đầu ra O (1) với nơ ron là hoạt tính sinh học pGI50. Thuật toán lan
94
truyền ngược được sử dụng để luyện mạng nơ ron. Hàm truyền trên mỗi nơ ron
được sử dụng là hàm truyền sigmoid; các thông số khác được sử dụng để huấn
luyện mạng thần kinh này bao gồm tỷ lệ luyện là 0,7 và tốc độ học 0,7; sai số MSE
= 0,003447 với số vòng lặp là 5000. Sau khi luyện mạng nơ ron I(6) - HL(9)- O(1),
là 0,897298 và R2
tr
pr là 0,88718.
giá trị R2
3.2.6.4. Khả năng dự đoán của các mô hình
Khả năng dự đoán của các mô hình QSARMLR (3.17), QSARPCR và
QSARPCA-ANN đã được đánh giá cẩn thận bằng kỹ thuật (LOO) với giá trị tương
pred. Năm hợp chất trong nhóm kiểm tra được sử dụng để đánh giá
quan dự đoán R2
khả năng dự đoán của các mô hình QSAR này. Các hoạt tính dự báo cho flavonoid
trong nhóm thử nghiệm được so sánh với dữ liệu thực nghiệm, như được trình bày
trong Bảng 3.23.
Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR
(3.17), QSARPCR và QSARPCA-ANN
Hợp chất ARE,% pGI50,exp pGI50,pred
M1 M2 M3 M1 M2 M3
5,921 5,234 5,526 5,471 3,214 8,979 7,890 Flav-8
5,745 5,485 5,699 5,556 3,755 0,001 2,513
6,097 5,423 5,697 5,351 5,567 10,895 4,161
5,699 5,815 5,895 5,736 1,964 3,362 0,585
5,699 6,034 6,288 6,086 0,773 3,399 0,083
Flav-22 A2 Flav-32 A9 Flav-74 A12 Flav-80 1-3-5-11-15-26 1-3-5-11-15-26 MARE,% 3,055 5,327 3,045
Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR (3.18); M3 là
mô hình QSARPCA-ANN.
Các hoạt tính dự báo từ các mô hình QSAR được so sánh với các hoạt tính
thực nghiệm và so sánh với nhau bằng cách sử dụng giá trị trung bình sai số tương
đối MARE%. Các giá trị MARE,% cho thấy rằng khả năng dự báo của mô hình
QSARPCA-ANN thấp hơn mô hình QSARMLR (3.17), QSARPCR. như trong Bảng 3.23.
Do giá trị MARE,% mô hình QSARPCR là cao nhất. Sau khi sử dụng các mô hình
QSARMLR (3.17), QSARPCR và QSARPCA-ANN để dự đoán các hoạt tính sinh học
95
pGI50 của sáu hợp chất trong nhóm thử nghiệm khả năng dự đoán chính xác của một
mô hình QSAR được thể hiện bởi các sai số có thể chấp nhận được trong khoảng tin
cậy của phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.17), QSARPCR và
QSARPCA-ANN có khả năng dự đoán tính sinh học của các chất mới.
Mối quan hệ giữa các tham số mô tả phân tử 2D, 3D và các hoạt tính kháng
ung thư GI50 (μM) của các dẫn xuất flavonoid. Mô hình QSARMLR (3.18) cho thấy
các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC ảnh hưởng quan trọng đến
sự thay đổi hoạt tính GI50 thử nghiệm in vitro trên tế bào Hela của các dẫn xuất
flavonoid. Mô hình QSARMLR (3.18) cũng tìm ra các vị trí quan trọng nhất C6 và C3
để gắn các nhóm thế mới nhằm tạo ra các flavonoid mới với hoạt tính cao hơn
flavonoid cô lập. Mô hình QSARPCA-ANN với kiến trúc I(6) - HL(9) - O (1) có thể dự
đoán hoạt tính của flavonoid tốt hơn. Các hoạt tính sinh học dự đoán từ các mô hình
QSAR phù hợp với những kết quả từ dữ liệu thực nghiệm.
Các mô hình QSAR được mô tả trong nghiên cứu này hữu ích cho đánh giá
độc tính in vitro đối với tế bào ung thư Hela của flavonoid. Nghiên cứu này đã xây
dựng các mô hình QSAR khác nhau có thể hữu ích cho việc tìm kiếm các tác nhân
trị liệu mới trong bệnh ung thư.
3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2)
3.2.7.1. Dữ liệu
Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 26 hợp chất
và hoạt tính kháng tế bào ung thư cổ tử cung GI50/M (GI50 là nồng độ ức chế 50%
sự phát triển của tế bào ung thư) gồm 32 hợp chất trong Phụ lục 1a.
Điện tích nguyên tử sử dụng làm dữ liệu để xây dựng các mô hình QSARMLR.
QSARPLS và QSARANN thể hiện mối quan hệ giữa cấu trúc điện tử và hoạt tính. Dữ
liệu điện tử cho ở phụ lục 1b.
3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20)
Các mô hình QSARMLR và QSARPLS được xây dựng thể hiện mối quan hệ
của điện tích nguyên tử và các hoạt tính sinh học pGI50 [86]. Các mô hình và các
96
pred và SE với các tham số điện tích nguyên tử được chỉ ra trong Bảng
giá trị R2, R2
3.24.
Để xây dựng các mô hình QSARMLR, các tham số điện tử nguyên tử đã được
chọn sử dụng thuật toán hồi quy từng bước. Quá trình lựa chọn mô tả điện tích
pred và F-stat. Các
nguyên tử dựa trên sự thay đổi của các giá trị thống kê R2, SE, R2
mô hình QSARMLR đã được đánh giá chéo bằng cách sử dụng kỹ thuật LOO để xác
pred, 9 mô hình được thể hiện trong Bảng 3.24. Các mô hình QSARMLR (với k
định R2
và R2
pr.
tr
từ 2 đến 10) được sắp xếp trong một sự thay đổi có trật tự của các giá trị R2
Trong các mô hình ở Bảng 3.24, các mô hình QSARMLR với k từ 5 đến 7 có các giá
pred hơn các mô hình khác.
, SE và R2
trị lớn hơn R2
tr
pr tương ứng
Bảng 3.24 Các mô hình QSARMLR với các giá trị R2
k 2 3 4 5 6 7 8 9 10 R2 tr 0,816 0,86 0,901 0,924 0,938 0,959 0,97 0,978 0,978 SE 0,139 0,124 0,107 0,096 0,089 0,074 0,065 0,057 0,059 R2 pr 0,765 0,8 0,829 0,873 0,903 0,879 0,696 0,563 0,358 Điện tích nguyên tử trong các mô hình O1, C7 O1, C4, C6 O1, C2, C4, C5 O1, C2, C4, C5, C3’ O1, O11, C3, C4, C6, C7, O11, C4, C6, C8, C9, C2’, C6’ O11, C3, C6, C7, C8, C9, C10, C3’ O1, O11, C3, C4, C6, C7, C8, C9, C10 O1, O11, C3, C6, C7, C8, C9, C2’, C3’, C6’
tr là 0,938 và giá trị
Cụ thể, mô hình QSARMLR (3.19) với k = 6 với giá trị R2
pr cao nhất là 0,903.
R2
pGI50 = 6,7116 − 42,3105 O1 − 8,1592O11 + 3,0139 C3 −19,0370 C4 + 6,6117 C6 +4,6038C7 (3.19)
Vì vậy, chúng tôi chọn các mô hình tốt nhất (với k bằng 5, 6 và 7) để xác
định tỷ lệ đóng góp của các điện tích nguyên tử. Giá trị đóng góp MPmxi, GMPmxi và
các giá trị thống kê của các mô hình tương ứng (với k bằng 5, 6 và 7), được trình
bày trong Bảng 3.25.
Giá trị phần trăm đóng góp MPmxi các biến độc lập trong mỗi mô hình
QSARMLR (với k bằng 5, 6 và 7) được xác định từ tỷ lệ đóng góp Pxk tương ứng của
97
các biến trong từng trường hợp. Giá trị Pxk được xác định bởi giá trị đóng góp tổng
cộng các biến trong một chất [18]. Vì vậy, tỷ lệ phần trăm đóng góp trung bình
MPmxi và GMPmxi của mỗi biến được xác định, các kết quả được mô tả trong Bảng
3.25. Phần trăm đóng góp trung bình toàn cục của GMPmxi trong Bảng 3.25 thể hiện
mức độ quan trọng của điện tích nguyên tử trong flavone và isoflavone. Đối với 3
mô hình QSARMLR với k = 5 – 7 biến số, vị trí các nguyên tử quan trọng sắp xếp
theo các giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3. Các nguyên tử C4, O1,
O11 là các các vị trí quan trọng nhất trong các phân tử. Ngoài các nguyên tử trong
nhóm carbonyl C4 = O11 và nguyên tử O1 có cặp electron liên kết điện tử π của C2 =
C3 và C4 = O11 để tạo thành một hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất
phản ứng hoàn toàn của nhóm carbonyl. Vì vậy, các nguyên tử quan trọng này được
chứng minh bằng cách sử dụng các giá trị GMPmxi, % và cũng phù hợp với các dự
đoán từ nghiên cứu thực nghiệm [18, 54, 103].
Ngoài ra, nguyên tử C6 cũng là một vị trí quan trọng và được khám phá để
gắn các chất thay thế mới [80, 103]. Các vị trí nguyên tử C9 và C3 cũng ảnh hưởng
quan trọng đối với các hoạt tính sinh học GI50, nhưng nguyên tử C9 không phải là vị
trí còn trống nên không chọn để gắn các chất thay thế mới. Vì vậy, C6 là vị trí còn
trống có thể được lựa chọn để gắn thêm các nhóm thế vào hợp chất flavone mẫu
trong Phụ lục 1a hoặc flavonoid chiết xuất. Tương tự, vị trí C3' cũng còn trống và có
thể được sử dụng để gắn các nhóm thế mới. Điều này có thể hy vọng sẽ tạo ra các
hợp chất mới với hoạt tính cao hơn. Từ hướng nghiên cứu này, flavonoid cô lập đã
được lựa chọn như là chất mẫu để thiết kế các dẫn xuất mới có hoạt tính cao hơn.
Mô hình QSARPLS cũng được xây dựng từ các tham số điện tích nguyên tử,
các tham số này được lựa chọn cho mô hình QSARPLS theo. Sáu biến số O1, O11, C3,
C4, C6 và C7 cũng được sử dụng để xây dựng mô hình QSARPLS. Mô hình QSARPLS
được có dạng:
pGI50 = 5,168 − 20,643 × O1 − 0,358 × C3 − 7,892 × C4 + 0,425 × C6 − 0,583
× C7 − 3,465 × O11 (3.20)
pr = 0,943; SE = 0,360; R2
pr = 0,912
Với n = 26; R2
98
Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của
điện tích nguyên tử trong các mô hình QSARMLR
Biến MPmxi m = 5 m = 6 m = 7 GMPmxi
QSARMLR m = 6 0,938 0,919 0,089 0,903 6,712
− 57,602 24,629
18,632 21,462
− 13,418 − − −
− −15,426 − −6,874 27,410 13,365 4,473 1,405 31,985
−101,208 −42,311 −8,159 − 3,014 −19,037 − 6,612 4,604 − − − − − − − − − − −16,117 − m = 7 0,959 0,943 0,074 0,879 4,714 − −32,8026 − − −60,070 − 20,877 − 16,902 95,421 −24,472 − −25,422 − 4,216 15,121 42,447 38,387 − 6,572 3,505 − − − − − − 5,779 − 5,696 22,597 2,497 − 3,582 − − − − − 11,801 − 4,117 1,168 1,899 7,532 0,832 3,934 1,194
m = 5 R2tr 0,924 R2 0,905 ad 0,096 SE R2 0,873 pr Hằng số −0,933 O1 O11 C2 C3 C4 C5 C6 C7 C8 C9 C2' C3' C6'
3.2.7.3. Xây dựng mô hình QSARANN(2)
Mô hình QSARANN(2) được xây dựng bằng kỹ thuật neuro-fuzzy với các thuật
toán di truyền sử dụng chương trình Visual Gene Developer v1,7 [43]. Kiến trúc
mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp đầu vào I(6) bao gồm
sáu nơ ron là các tham số O1, O11, C3, C4, C6 và C7; Nơ ron lớp đầu ra O(1) là hoạt
tính sinh học pGI50; Lớp ẩn HL(4) bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử
dụng thuật toán lan truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút
của mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ học 0,7;
sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện mạng thần kinh, giá trị
99
tr là 0,993 và R2
pr là 0,971 trong khi đối với mô hình QSARMLR (3.19), giá trị R2
tr
R2
pr là 0,903.
là 0,938 và R2
3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới
Khả năng dự báo của các mô hình QSARMLR (3.19), QSARPLS và
QSARANN(2) được đánh giá cẩn thận bằng cách sử dụng kỹ thuật LOO để xác định
pred; Các flavonoid được chia ngẫu nhiên từ dữ liệu trong Phụ lục 1a thành
giá trị R2
nhóm luyện gồm 26 hợp chất và nhóm kiểm tra gồm sáu hợp chất.
Các hoạt tính sinh học của 6 chất flavonoid trong nhóm thử nghiệm trong
Phụ lục 1a được dự đoán từ các mô hình QSARMLR, QSARPLS và QSARANN. Các
giá trị dự đoán của các hoạt tính sinh học của những hợp chất này được so sánh với
các giá trị thực nghiệm, được trình bày trong Bảng 3.2 .
Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR
(3.19), QSARPLS (3.20) và QSARANN(2)
Hợp chất pGI50,exp
5,921 5,745 6,097 5,699 5,699 5,137 pGI50,pred M2 5,801 5,608 5,842 5,652 5,655 5,083 M3 5,851 5,741 5,814 5,712 5,719 5,112 M1 6,008 5,692 5,759 5,651 5,651 5,092 ARE,% M2 2,020 2,376 4,188 0,828 0,775 1,046 M1 1,472 0,925 5,548 0,840 0,835 0,877 M3 1,180 0,070 4,646 0,236 0,347 0,490 Fla 2 Fla 9 Fla 12 Fla 15 Fla 16 Isofla 32
1,161 MARE,% 1,749 1,872
Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS; M3 là
mô hình QSARANN(2).
Khả năng dự báo của mô hình QSARMLR (3.19) thấp hơn các mô hình
QSARPLS và QSARANN (2) tương ứng như trong Bảng 3.2 . Mô hình QSARANN (2)
có sai số có giá trị MARE % là 1,161 nhỏ hơn MARE,% của cả hai mô hình
QSARMLR (3.19) và QSARPLS.Vì vậy, khả năng dự báo của mô hình QSARANN (2)
tốt hơn so với mô hình QSARMLR (3.19) và QSARPLS. Sau khi sử dụng các mô hình
QSARMLR (3.19), QSARPLS và QSARANN(2) để dự đoán các hoạt tính sinh học pGI50
của sáu hợp chất trong nhóm thử nghiệm, sai số dự đoán nằm trong khoảng sai số số
100
không chắc chắn của thực nghiệm. Do đó, các mô hình QSARMLR (3.19), QSARPLS
và QSARANN(2) thích hợp để dự đoán các hoạt tính sinh học của các hợp chất
flavonoid mới.
3.3. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN
3.3.1. Phân lập cynaroside từ actiso
CSL1 phân lập và tinh chế từ actiso (mục 2.4.1.) CSL1 kết tinh dạng bột,
trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy
256 – 257 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (60 : 40). hiện màu
bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,6).
Phổ 1H-NMR (500 MHz, DMSO, δ ppm). Các proton trong vòng thơm: Độ
dịch chuyển của H liên kết với Csp2 thơm trung bình là 7,27, tuỳ vào các liên kết với
các nhóm thế khác nhau mà có sự thay đổi từ 6 - 9. Dễ dàng nhận thấy, từ độ dịch
chuyển hoá học của H6 và H8 cho thấy đây là hai mũi proton của nhân thơm, ghép
cặp metha với nhau. Một mũi đôi của proton trong nhân thơm ở H2’ mũi bốn ở H3’ là
hai proton ghép cặp ortho. Một mũi đôi của proton nhân thơm tại δH 6,90 ppm (d, J
= 8,5 Hz) và một mũi bốn của của proton nhân thơm tại δH 7,44 ppm (dd, J = 8,5Hz,
J = 2) chứng tỏ chúng ở vị trí ortho. Mũi đôi proton H6’ và H2’ ghép cặp meta với
nhau. Cụ thể là δ 6.39 (s, H3); 6.44 (d, J = 2 Hz, H6); 6.78 (d, J = 2 Hz, H8); 5.08
(1H, d, J = 7,5Hz , H1"); 7,41 (d, J = 8.5 H6’); 6,90 (d, J = 8,5Hz, H3’); 7,44 (dd, J =
8,5Hz, J = 2, H2’); Các proton của nhóm OH: quan sát trên phổ có mũi proton với
độ dịch chuyển ở 12,89 ppm. Các mũi đa proton trong vòng đường gồm có: 3,489
(1H, m, H2’’); 3,476 (1H, m, H4’’); 3,466 (1H, m, H3’’); 3,500 (1H, m, H5’’); 3,725
(1H, dd, J = 12,3; 2,5 HZ, H6’’); 3,702 (1H, dd, J = 12,4; 6,3 HZ, H6’’); Mũi đôi
proton H1’’ (1H, d, J = 7,5Hz) được suy ra từ phổ 1H-NMR kết hợp với phổ HSQC,
cho thấy đường nối với khung aglycon bằng liên kết β. Mặt khác có tương tác giữa
δH1’’ và C7 trong phổ HMBC. Vậy CSL1 có một đơn vị đường gắn vào khung
glycon ở C7 trong phân tử.
Phổ 13C-NMR (DMSO, δ ppm, 125 MHz) và DEPT: Phổ 13C-NMR (DMSO,
δ ppm,125 MHz) kết hợp phổ DEPT và phổ phổ cộng hưởng từ hạt nhân 2 chiều
101
HSQC VÀ HMBC cho thấy CSL1 là một hợp chất flavonoid có 21 C. Có một nhóm
>C=O: 181,785 (C4). Có một nhóm >CH2: 60,6(C6’’). Có 5 nhóm –CH<: 76,4 (C2’’);
77,2 (C3’’); 69,5 (C4’’); 78 (C5’’); và mũi acetan đặc trưng 99,9 (C1’’) của đường. Có
6 nhóm cacbon bậc ba (–CH=): 105,3(C3); 100,2(C6); 95(C8); 113,6(C2’); 145,7
(C3’); 119,2 (C6’). Có 8 nhóm C bậc 4 ( 156,9(C9); 103,1(C10); 121,4(C1’); 149,9 (C4’); 115,9 (C5’); Tương tác của C và H trong phổ HMBC và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C1’- C3’- C4’ - C6’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. Phổ 1H-NMR của cynaroside (Phụ lục 13), phổ 13C-NMR (Phụ lục 15), phổ DEPT (Phụ lục 14), phổ HMBC P lục 16), phổ HSQC (Phụ lục 17). Tham khảo với phổ của hợp chất CSL1 trong nghiên cứu phân lập hợp chất cynaroside từ hạt capparis decidua (forsk) của V. K. SAXENA và cs. [78] cho thấy CSL1 là cynaroside. Cấu trúc Cynaroside được cho ở Hình 3.8. Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11 Danh pháp khác của cynaroside là luteolin-7-O-β-d-glucopyranoside hay 2-(3,4-dihydroxyphenyl)-5-hydroxy-7-((2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6- (hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one. 3.3.2. Phân lập quercetin từ xa kê AIL1 phân lập từ xa kê theo mục 2.4.1. AIL1 kết tinh dạng bột, trong hỗn oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20). Hiện màu bằng dung hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 314 – 316 dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0.35) Phổ 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 24), phổ 13C-NMR (Phụ lục 25), phổ DEPT (Phụ lục 26), kết hợp với phổ HSQC (Phụ lục 27), HMBC (Phụ lục 28): Có 5 proton trong vòng thơm trong đó: 6,26 (1H, d, J = 1,5 Hz, H6) 102 ghép cặp metha với 6,52 (1H, s giống t, H8); 6,98 (1H, d, J=8,5 Hz, H6') ghép cặp metha với 7,82 (1H, d, J = 1,5 Hz, H2') và ghép cặp ortho với 7,68 (1H, dd, J = 8,5 và 2 Hz, H5'). Tín hiệu proton ở 12,16 (1H, s); cho thấy hợp chất có nhóm OH. Phổ 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phổ DEPT, HSQC, HMBC: hai cacbon olefin C 146,9 (C2) và C 136,6 (C3). Hai cacbon >C= là: C 146,9 (C2); C 136,6 (C3); 12 cacbon vòng thơm: C 176,5, (C4); 162,2 (C5); 164,9 (C7); 157,7 (C9); 145,7 (C3'); 148,2 (C4'); Trong đó có hai cacbon bậc 4: δC 121,4 (C1') và 104,0 (C-10); có năm cacbon –CH=: 99,1 (C6); 94,4 (C8); 116,1 (C2'); 115,6 (C5'); C 123,7 (C6'); Quan sát tương tác của H và C trong phổ HSQC, HMBC cho thấy phổ nghiệm của AIL1 thì phù hợp. H6-C5-C7-C8-C10; H8-C6-C7-C9-C10, H2’- C1’-C6’-C3’-C4’-C2; H3’-C2’-C1’-C3’- C4’; H6’-C1’-C2-C2’-C4’-C5’. Phổ tham khảo từ nghiên cứu sự phân lập quercertin từ lá hồ lô ba (trigonella foenum-graecum) của Bharathi Sambflavonoidam và cs. [11] và nghiên cứu phân lập quercertin từ thân cây Costus igneus rhizome (CiREE) của PazhanichamyKalailingam và cs. [44] cho thấy AIL1 là quercetin. Cấu trúc quercetin cho ở Hình 3.9. Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7 Danh pháp: 2-(3,4-dihydroxyphenyl)-3,5,7-trihydroxy-4H-chromne-4-one. 3.3.3. Phân lập luteolin từ tía tô POL1 phân lập từ tía tô theo mục 2.4.1. POL1 kết tinh dạng bột, trong hỗn oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (95 : 5) hiện màu bằng dung hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 327-328 103 dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,34), cho phản ứng dương tính với thuốc thử FeCl3/EtOH cho thấy đây là một dẫn xuất phenolic. Phổ 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 29) kết hợp với phổ HSQC (Phụ lục 33), HMBC (Phụ lục 32): Sáu H trong vòng thơm: δ 6.65 (1H; s, H3); 6.19 (1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H; d; J = 8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); bốn H của nhóm OH: 9.4 (1H, s, C4’- OH ); 9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH), có một H của nhóm OH kiềm nối: H [12.95 (s; 5-OH)]. Hình 3.10 Cấu trúc POL1, C15H10O6 Danh pháp: 2-(3,4-dihydroxyphenyl)-5,7-dihydroxy-4H-benzopyran-4-one Phổ 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 30) kết hợp với phổ DEPT (Phụ lục 31), HSQC, HMBC: Có 5 C thơm –CH=: 98.9(C6); 93.8(C8); 113.4(C2’); 116.0(C5’); 118.9(C6’). Có 6 C bậc 3 liên kết với oxy: δ163.1 (C2); 161.4(C5); 164.1(C7); 157.3 (C9); 145.7(C3’); 149.7(C4’); có 3 C bậc 4: 103.7(C10); 121.5(C1’); có một cacbon cacbonyl 181.6(C4). Tương tác của C và H trong phổ HMBC và phổ HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. So sánh phổ chuẩn của POL1 với nghiên cứu sự phân lập luteolin [108], cho thấy POL1 là luteolin. Cấu trúc luteolin cho ở Hình 3.10. TÓM TẮT PHỔ Cấu trúc POL1 được xác định bằng cách sử dụng các phổ khác nhau: 1H- NMR (DMSO-d6, 500 MHz, δ ppm) with HSQC, HMBC: δ 6.65 (1H; s, H3); 6.19 (1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H; d; J = 8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); 12.95 (1H, s; C5-OH); 9.4 (1H, s, C4’-OH ); 9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH). The 13C-NMR (DMSO-d6, 125 Hz) kết 104 hợp với phổ DEPT, HSQC, HMBC: δ163.1 (C2); 102.8(C3); 181.6(C4); 161.4(C5); 98.9(C6); 164.1(C7); 93.8(C8); 157.3 (C9);103.7(C10); 121.5(C1’); 113.4(C2’); 145.7(C3’); 149.7(C4’); 116.0(C5’); 118.9(C6’). Tương tác C – H trong phổ HMBC và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 -C1’ - C2’ - C4’ - C5’. 3.3.4. Phân lập daidzin từ đậu nành 3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR GML1 được phân lập từ đậu nành theo mục 2.4.1. GML1 kết tinh dạng tinh thể trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 246 - 248 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20) hiện màu bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,4). Phổ 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 18): 6 proton trong vòng thơm: H6 ghép cặp ortho với H5 và ghép cặp metha với H8: 8,06 (1H, d, J = 8,0Hz, H5); 7,15 (1H, d, J = 1,5 Hz, H6); 7,23 (1H, d, J = 2,0Hz, H8); H3’, H5’ ghép cặp metha 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); H6’, H2’ ghép cặp metha: 7,42 (2H, d, J = 8,0 Hz, H6’, H2’); có một tín hiệu H trong vòng A δ 6.80 (1H; s, H2); có một tín hiệu H anomeric 5,10 (1H, m, H1’’), phân tử có một gốc đường với các tín hiệu H đường 3,70-3,73 (6H, m, H2’’, H3’’, H4’’, H5’’ , H6’’, H6’’). Phổ 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 19) kết hợp với phổ DEPT (Phụ lục 20), HSQC (Phụ lục 22), HMBC (Phụ lục 21): Có 7 cacbon –CH= trong vòng thơm: δ 126,9 (C5), δ 115,6 (C6), δ 103,4 (C8), δ 130,0 (C2’), δ 115,0 (C3’), δ 115,0 (C5’), δ 130,0 (C6’). Có 3 C bậc ba, thơm, liên kết trực tiếp với oxi: δ 157,0 (C9), δ 157,2 (C4’), ), δ 161,3 (C7). Có 1 cacbon cabonyl: δ 174,7 (C4). Có 1 C thơm có H liên kết trực tiếp với oxy: δ153,2 (C2). Có 2 C bậc 4 thơm: δ 118,5 (C10), δ 123,7 (C1’). Có 1 cacbon bậc 4 không thơm: δ 122,3 (C3). Có 6 C trong gốc đường: δ 100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ 69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’). So sánh phổ chuẩn của GML1 với nghiên cứu sự phân lập daidzin [53, 55], cho thấy GML1 là daidzin. Cấu trúc daidzin được đưa ra trong Hình 3.11. 105 Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9 Danh pháp daidzin: 3-(4-hydroxyphenyl)-7-((2S,3R,4S,5S,6R)-3,4,5- trihydroxy-6-(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one TÓM TẮT PHỔ Cấu trúc GML1 được xác định bằng phương pháp đo phổ 1H-NMR:
δ8,06 (1H, d, J = 8,0Hz, H5); δ 7,15 (1H, D, J = 1,5 Hz, H6); δ 7,23 (1H, d, J = 2,0Hz, H8); δ 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); δ 7,42 (2H, d, J = 8,0 Hz, H6’, H2’); phổ 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phổ DEPT, HSQC, HMBC: δ153,2 (C2), δ 122,3 (C3), δ 174,7 (C4), δ 126,9 (C5), δ 115,6 (C6), δ 161,3 (C7), δ 103,4 (C8), δ 157,0 (C9), δ 118,5 (C10), δ 123,7 (C1’), δ 130,0 (C2’), δ 115,0 (C3’), δ 157,2 (C4’), δ 115,0 (C5’), δ 130,0 (C6’), δ 100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ 69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’). 3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X Cấu trúc daidzin còn được xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh thể: Dữ liệu nhiễu xạ đơn tinh thể của daidzin được đo trên máy Bruker D8 Quest (tại Khoa Hóa học, Trường Đại học Khoa Học Tự Nhiên, Hà Nội) ở nhiệt độ 100 K, đối âm cực Mo với bước sóng K = 0,71073 Å). Ảnh nhiễu xạ được ghi trên detector huỳnh quang dạng đĩa trong đường kính 34 cm, khoảng cách từ tinh thể đến detector là 10 cm. Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi đơn tinh thể được thực hiện trên phần mềm chuẩn - Apex 2 của máy đo. Cấu trúc được xác định theo phương pháp trực tiếp (direct method). Sử dụng phần mềm XT tích hợp trong Olex2 để tính và tối ưu hoá cấu trúc. Vị trí của nguyên tử hidro được xác định theo các thông số lý tưởng và được tính bằng phần mềm SHELXL. Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu xạ tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất. 106 Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được trình bày trong Phụ lục 44-50. Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50% Kết quả đo về độ dài liên kết, góc liên kết của hợp chất daidzin phù hợp giữa lý thuyết và thực nghiệm (Ftt= 1,214 < F= 4,734). Kết quả đo độ dài các liên kết đôi C=C trong daidzin trong khoảng 1,337 – 1,407 Å; liên kết C-C từ 1,509 – 1,530 Å. Các liên kết C=O thực nghiệm đo được đối với C7-O8 là 1,237 Å. Liên kết thực nghiệm đo được đối với C3-O4 là 1,369 Å; đối với C5-O4 là 1,341 Å. Cấu trúc phân tử Daidzin dưới dạng elipxoit với xác xuất 50% từ đậu nành (Hình 3.12). 3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió 3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR ZZL1 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. ZZL1 thu được dưới dạng tinh thể, màu vàng, điểm nóng chảy 249 – 250 oC; sắc ký lớp mỏng (TLC) triển khai bằng dung môi CHCl3 – MetOH (85:15) hiện màu bằng dung dịch H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,3. Phổ 1H-MNR (500 MHz, DMSO, δ ppm) (Phụ lục 34): có H trong nhân thơm: H6 và H8 ghép cặp metha với nhau δ6,20 (1H, d, J = 2, H6) 6,44 (1H, d, J = 2, H8); H6’ ghép cặp metha với H2’ và ghép cặp ortho với H5’ 7,93 (2H, d, H6’, H2’); H5’ ghép cặp metha với H3’ 6,94 (2H, d, J = 9, H5’,H3’). Có một nhóm OH kiềm nối δ12,68 (1H, s, 5-OH), có 3 H của nhóm methyl 3,78 (3H, s, H11). Phổ 13C-NMR (125MHz, δ ppm) (Phụ lục 35): có 1 C cacbonyl: 177,9 (C4); có 6 C thơm –CH=: 98,5 (C6); 93,7 (C8); 130,1 107 (C2’); 115,6 (C3’); 115,6 (C5’); 130,1 (C6’). Có 2 C thơm bậc 4: 104,2 (C10); 120,5 (C1’); có 6 C thơm bậc 3, liên kết trực tiếp với oxi: δ155,6 (C2); 137,6 (C3); 161,2 (C5); 164,1 (C7 ); 156,3 (C9); 160,1 (C4’); Tương tác của C và H có trong phổ HMBC (Phụ lục 37) và HSQC (Phụ lục 38): H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6 Danh pháp 5-hydroxy-2-(4-hydroxyphenyl)-7-methoxy-4H- benzopyran-4- one. Phổ tham khảo từ nghiên cứu sự phân lập kaempferol từ thân cây Costus igneus rhizome (CiREE) của PazhanichamyKalailingam và cs [44] cho thấy ZZL1 là kaempferol- 3-O-methylether. Cấu trúc ZZL1 được đưa ra trong Hình 3.13. TÓM TẮT PHỔ Cấu trúc ZZL1 được xác định từ dữ liệu phổ nghiệm: 1H-MNR (500 MHz, DMSO, δ ppm): δ6,20 (1H, d, J = 2, H6); 6,44 (1H, d, J = 2, H8); 7,93 (2H, d, H6’, H2’); 6,94 (2H, d, J = 9, H5’,H3’); 12,68 (1H, s, 5-OH); 3,78 (3H, s, H11). 13C-NMR (125MHz, δ ppm): δ155,6 (C2); 137,6 (C3); 177,9 (C4); 161,2 (C5); 98,5 (C6); 164,1 (C7 ); 93,7 (C8); 156,3 (C9); 104,2 (C10); 120,5 (C1’); 130,1 (C2’); 115,6 (C3’); 160,1 (C4’); 115,6 (C5’); 130,1 (C6’). Tương tác dị proton giữa C và H qua nhiều liên kết (HMBC) và qua một liên kết (HSQC) đã giúp xác định được sự có mặt của các nguyên tố chính xác hơn: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. 108 3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo nhiễu xạ tia X Cấu trúc ZZL1 được xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh thể. Dữ liệu nhiễu xạ đơn tinh thể ZZL1 được đo tương tự như đối với hợp chất daidzin. Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu xạ tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất. Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được trình bày trong phụ lục 51-57. Liên kết đôi C=C theo lý thuyết có độ dài liên kết 1,33 Å. Kết quả đo nhiễu xạ tia X đơn tinh thể C1=C2, C8=C10, C7=C14, C11=C13, C16=C22, C17=C18 có độ dài thực nghiệm từ 1,360 đến 1,399 Å. Liên kết C – C thông thường có độ dài 1,54 Å, kết quả thực nghiệm độ dài liên kết C1-C16 là 1,47 Å. Liên kết C=O có độ dài lý thuyết là 1,20 Å. Kết quả thực nghiệm cho thấy độ dài C5-O6 là 1,264 Å. Liên kết C-O có độ dài lý thuyết là 1,43 Å. Kết quả thực nghiệm cho thấy độ dài liên liên kết C2-O3 là 1,3766 Å, liên kết O3-C4 là 1,445 Å, liên kết C8-O9 là 1,3489 Å, liên kết C11-O12 là1,348 Å, liên kết C19-O20 là 1,362 Å. Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50% Các góc của Csp2 theo lý thuyết là 120o; ở đây kết quả đo X-ray cho kết quả phù hợp. Các tham số cấu trúc: độ dài liên kết, góc liên kết của ZZL1 sau khi tối ưu hóa được tính toán bằng phương pháp hóa lượng tử PM3 bằng Hyperchem phù hợp 109 với độ dài và góc từ phổ chụp X-ray đơn tinh thể (Ftt = 1,280 < F4,567). Điều đó cho thấy các kết quả đo về độ dài, về góc giữa lý thuyết và thực nghiệm là hoàn toàn phù hợp. Cấu trúc phân tử kaempferol gừng gió dưới dạng elipxoit với xác xuất 50% được chỉ ra trong Hình 3.14. 3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ gừng gió ZZL2 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. Hợp chất ZZL2 thu được dưới dạng bột vô định hình, màu vàng, nhiệt độ nóng chảy: 111-114 oC; sắc kí lớp mỏng (SKLM) triển khai bằng hệ CHCl3 – MetOH (90 : 10) hiện màu bằng dung dịch H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,42. Phổ 1H-MNR (500 MHz, DMSO, δ ppm) (Phụ lục 39): Có 6 H trong vòng thơm: Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) H6 và H8 ghép cặp metha δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2, H8); H3’ và H5’ ghép cặp metha δH 6,94 (2H, d, J = 8,5, H3’, H5’); H2’ và H6’ ghép cặp metha δH 6,95 (2H, d, J = 8,5, H2’, H6’). Có H trong nhóm OH kiềm nối δH 12,53 (1H, d, OH). Có 9 H trong nhóm methyl: δH 0,73 (3H, d, J = 6, H6’’); δH 1,98 (3H, s, H10’’); δH 2,05 (3H, s, H8’’), dựa vào các tương tác C và H cho thấy hợp chất bị acetyl hoá tại C2’’ và C4’’. Có 1 proton anome δH 5,40 (1H, d, J = 1, H1’’), xác nhận là đường 110 Phổ 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 40) kết hợp với phổ DEPT (Phụ lục 41), HSQC (Phụ lục 43), HMBC (Phụ lục 42): Có 6 cacbon –CH= trong vòng thơm: δC 98,8 (C6), δC 93,8 (C8), δC 129,9 (C2’); δC 114,2 (C3’); δC 130,5 (C2’, C6’); δC 115,4 (C3’, C5’). Có 2 cacbon bậc 4 trong vòng thơm: δC 104,0 (C10); δC 120,1 (C1’). Có 4 cacbon thơm bậc 3 liên kết trực tiếp với oxy δC 156,5 (C9), δC 161,2 (C5), δC 164,3 (C7), δC 160,2 (C4’). Có 2 cacbon bậc 3 trong vòng A liên kết trực tiếp với oxi: δC 157,4 (C2), δC 133,2 (C3). Có 1 cacbon cacbonyl δC 177,6 (C4). Có 3 cacbon (CH3): δC 16,9 (C6’’); δC 20,4 (C8’’); δC 20,7 (C10’’ ); Có 2 cacbon cacbonyl trong vòng đường: δC 169,7 (C7’’); δC 169,4 (C9’’). Có 5 cacbon trong vòng đường: δC 69,9 (C2’’); δC 67,8 (C3’’, C5’’); trong đó có 1 cacbon acetal δC 97,9 (C1’’). So sánh dữ liệu phổ của ZZL2 với nghiên cứu phân lập kaempferol-3-O-(2,4- O-diacetyl-alpha-L-rhamnopyranoside cho thấy ZZL2 là kaempferol-3-O-(2,4-O- diacetyl-alpha-L-rhamnopyranoside (Hình 3.15) [42]. Danh pháp: (3R,4S,6R)-2-(5,7-dihydroxy-2-(4-hydroxyphenyl)-4-oxo-4H- chromen-3-yloxy)-4-hydroxy-6-methyltetrahydro-2H-pyran-3,5-diyl diacetate TÓM TẮT PHỔ Đối với hợp chất ZZL2 được xác định cấu trúc, với dữ liệu phổ nghiệm: 1H- MNR (500 MHz, DMSO, δ ppm): δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2, H8); δH 6,94 (2H, d, J = 8,5, H3’, H5’); δH 4,61(1H, t, J = 9,5, H4’); δH 7,15 (2H, d, J = 8,5, H2’, H6’): δH 12,54 (1H, d, OH). δH 5,40 (1H, d, J = 1, H1’); δH 0,74 (3H, d, J = 6, H6’’); δH 1,98 (3H, s, H10’’); δH 2,05 (3H, s, H8’’). Tương tự, đối với phổ 13C-NMR (DMSO-d6, 125 Hz) với dữ liệu phổ DEPT, HSQC, HMBC: δC 157,4 (C2), δC 133,2 (C3), δC 177,6 (C4); δC 161,2 (C5), δC 98,8 (C6), δC 164,3 (C7), δC 93,8 (C8), δC 156,5 (C9), δC 104,0 (C10); δC 120,1 (C1’); δC 129,9 (C2’); δC 114,2 (C3’); δC 160,2 (C4’); δC 130,5 (C2’, C6’); δC 115,4 (C3’, C5’); δC 97,9 (C1’’); δC 69,9 (C2’’); δC 67,8 (C3’’, C5’’); δC 16,9 (C6’’); δC 169,7 (C7’’); δC 20,4 (C8’’); δC 169,4 (C9’’); δC 20,7 (C10’’ ); 3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên Các hợp chất flavonoid phân lập có tác động gây độc tế bào (GI50) ở nồng độ cao 100 (µg/ml), tiếp tục khảo sát ở các nồng độ khác nhau Bảng 3.27. Với các hợp 111 chất GML1 POL1, CSL1, AIL1, ZZL1, và ZZL2 được phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió. Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế bào Hela ở các nồng độ khác nhau Mẫu CSL1
(cynaroside) AIL1
(Quercetin) POL1
(luteolin) GML1
(daidzin) ZZL1
(kaempferol-3-O
-methylether) ZZL2
(kaempferol-3-O
-(2,4-O-diacetyl
-alpha-L
-rhamnopyranoside) Nồng độ
(µg/ml)
12
9
6
3
1
12
9
6
3
1
9
6
3
1
0,1
9
6
3
1
0,1
50
40
30
20
10
50
40
30
20
10 Phần trăm gây độc tế bào (%)
Lần 3
66,13
48,80
55,19
40,25
3,53
68,30
82,78
70,35
42,53
6,27
54,28
58,38
34,32
5,70
-4,10
55,99
42,19
34,44
10,95
54,28
79,82
64,31
60,43
57,58
39,45
65,45
52,34
31,01
17,10
2,39 Lần 2
63,45
51,23
58,97
36,77
4,15
62,22
79,37
61,43
40,25
1,01
50,67
54,82
31,61
10,43
1,35
56,61
39,13
34,64
-3,03
50,67
81,61
63,79
56,50
56,73
42,60
70,74
53,48
35,87
7,17
-1,23 TB
65,97
48,74
57,50
39,87
5,42
66,86
81,72
65,87
39,87
0,97
53,65
56,77
35,34
9,64
-2,01
55,94
39,79
32,39
1,91
53,65
80,49
63,60
58,48
57,45
41,29
66,51
52,17
32,49
11,63
0,13 Lần 1
68,33
46,18
58,35
42,59
8,58
70,05
83,00
65,83
36,82
-4,37
56,01
57,10
40,09
12,79
-3,28
55,23
38,07
28,08
-2,18
56,01
80,03
62,71
58,50
58,03
41,81
63,34
50,70
30,58
10,61
-0,87 ĐLC
2,443
2,528
2,027
2,928
2,753
4,109
2,033
4,459
2,876
5,320
2,721
1,803
4,331
3,610
2,937
0,695
2,141
3,730
7,836
2,721
0,982
0,814
1,966
0,664
1,638
3,813
1,394
2,940
5,043
1,977 Dựa vào kết quả khảo sát ở Bảng 3.27, xây dựng đồ thị biểu diễn tỷ lệ (%) gây độc tế bào. Từ đồ thị, nội suy giá trị nồng độ cho tỷ lệ gây độc tế bào 50%. Kết quả nội suy giá trị GI50 (µg/ml) của các flavonoid phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió được trình bày trong Bảng 3.28. 112 Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực nghiệm in vitro GI50 (µg/ml) Flavonoid \ CSL1
AIL1
POL1
GML1
ZZL1
ZZL2 Lần 1 Lần 2 Lần 3
4,96
4,79
4,41
3,81
4,38
4,36
4,95
5,38
4,75
7,70
7,87
8,09
15,82
15,24
15,05
38,90
38,03
39,65 TB ± ĐLC
4,72 ± 0,280
4,18 ± 0,327
5,03 ± 0,321
7,88 ± 0,195
15,37 ± 0,401
38,86 ± 0,814 GI50 (µM)
TB
10,533
13,839
17,584
18,937
51,223
75,292 pGI50
TB
4,977
4,859
4,755
4,723
4,291
4,123 3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CÁC FLAVONOID 3.4.1. Mô hình QESAR Thiết kế phân tử flavone và isoflavone mới: thử nghiệm gắn các nhóm thế vào các vị trí C6 và C3' trong khung phân tử của các chất mẫu flavone 1a, isoflavone 6b (phụ lục 4). Các hợp chất mới thiết kế được dự đoán hoạt tính kháng ung thư pGI50 [115] bằng các mô hình QESARMLR và QESARANN. Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các flavone, isoflavone mới và chất mẫu Chúng tôi chọn ra các chất mới có hoạt tính cao nhất tính toán điện tích của các nguyên tử cho ở phụ lục 8, kết quả dự đoán thể hiện ở được trình bày ở Bảng 3.29, Hình 3.16. Như vậy, hợp chất mới thiết kế từ vị trí C6 và C3’ cho hoạt tính sinh học pGI50 mạnh hơn chất mẫu flavone 1a, isoflavone 6b và hợp chất ZZL1, ZZL2 phân lập. 113 Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô hình QESARMLR và QESARANN Nhóm thế pGI50,pr Hợp chất vị trí C6 vị trí C3' QESARMLR QESARANN -H -H 5,954 5,709 fla-1a [103] -OH fla-1c 5,928 5,795 -OCH2CONHCH3 -H fla-2c 5,954 5,814 -OCH2CONHCH3 fla-3c 5,974 5,816 -OCH2(CH3)C=NOH -OH fla-4c -OH 6,128 5,873 -OCH2CONHCH3 fla-5c -OH 6,172 5,886 -OCH2CH3C=NOH isofla-6b [103] -H -H 5,092 5,011 isofla-7c -OH 5,328 5,308 -OCH2CONHCH3 isofla-8c -H 5,367 5,341 -OCH2CONHCH3 isofla-9c 5,369 5,350 -OCH2(CH3)C=NOH -OH isofla-10c -OH 5,502 5,452 -OCH2CONHCH3 isofla-11c -OH 5,543 5,486 -OCH2CH3C=NOH ZZL1 (*) -H -H 4,291(*) 4,291(*) Flav-11(n) -OH 4,345 4,387 -OCH2CONHCH3 Flav-12(n) -OH 4,789 4,715 -OCH2CONHCH3 Flav-13(n) 4,963 4,960 -OCH2(CH3)C=NOH -OH Flav-14(n) -OH 5,528 5,512 -OCH2CONHCH3 Flav-15(n) -OH 5,530 5,513 -OCH2CH3C=NOH ZZL2 (*) -H -H 4,123 (*) 4,123(*) Flav-16(n) -OH 4,139 4,159 -OCH2CONHCH3 Flav-17(n) -OH 4,398 4,414 -OCH2CONHCH3 Flav-18(n) 4,615 4,870 -OCH2(CH3)C=NOH -OH Flav-19(n) -OH 4,980 5,103 -OCH2CONHCH3 Flav-20(n) -OH 5,100 5,231 -OCH2CH3C=NOH 114 (*) Giá trị thử nghiệm in vitro hoạt tính kháng ung thư trên tế bào Hela trong nghiên cứu của chúng tôi. Với ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4- O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió. Bằng các kỹ thuật tính toán cơ học phân tử, hóa lượng tử, hồi quy tuyến tính và mạng thần kinh nhân tạo đã xây dựng mô hình quan hệ định lượng giữa cấu trúc điện tử và hoạt tính sinh học kháng ung thư của nhóm flavone và isoflavone thành công. Mô hình tuyến tính QESARMLR gồm 6 nguyên tử O1, O11, C3, C4, C6 và C7 và mô hình nơ ron QESARANN có cấu trúc I(6)-HL(2)-O(1). Các mô hình tuyến tính đã tìm được vị trí quan trọng C6 và C3’ để định hướng gắn thêm nhóm thế tạo ra các hợp chất mới từ flavone, isoflavone và hợp chất ZZL1, ZZL2 phân lập có hoạt tính cao hơn chất mẫu (Bảng 3.29). 3.4.2. Mô Hình QSDAR Thiết kế phân tử flavone và isoflavone mới: Các cấu trúc của 12 flavone và isoflavone mới được thiết kế từ các dẫn xuất mẫu flavone 22 và isoflavone 26 bằng cách gắn thử nghiệm nhóm thế vào vị trí C6, C3 còn trống (Bảng 3.30). Các giá trị hoạt tính pGI50 dự đoán từ các mô hình tuyến tính và mạng thần kinh của các chất mới có hoạt tính cao hơn chất mẫu. Tính toán hóa lượng tử, hồi quy tuyến tính và kỹ thuật thần kinh mờ đã được sử dụng thành lập thành công mối quan hệ định lượng giữa hoạt tính kháng ung thư 13C-NMR và 15O-NMR của các flavone và isoflavone. Mô hình tuyến tính pGI50 và độ dịch chuyển hóa học i của các nguyên tử oxy và cacbon từ dữ liệu phổ QSDARMLR với 7 biến số O1, O11, C2, C3, C6, C7 và C2’, mô hình mạng nơ ron QSDARANN với cấu trúc I(7)-HL(2)-O(1) được sử dụng dự đoán chính xác hoạt tính kháng ung thư của flavone và isoflavone trong nhóm kiểm tra. 18 dẫn xuất mới được thiết kế từ vị trí C3, C6 và C7 còn trống của flavone 22 và isoflavone 26. Các hoạt tính kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn flavone 22 và isoflavone 26, tương ứng. Các mô hình QSDARMLR và QSDARANN đã phát triển là tin cậy và có thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50. 115 Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán pGI50,pr Cấu trúc phân tử Nhóm thế flavone 22 [103]
1b, R1 = Me
2b, R1 = C6H5
3b, R1 = p-F- C6H4
4b, R1 = Me
5b, R1 = C6H5
6b, R1 = p-F- C6H4
7b, R1 = Me
8b, R1 = C6H5
9b, R1 = p-F- C6H4
isoflavone 26 [103]
10b, R1 = Me
11b, R1 = C6H5
12b, R1 = p-F- C6H4
13b, R1 = Me
14b, R1 = C6H5
15b, R1 = p-F- C6H4
16b, R1 = Me
17b, R1 = C6H5
18b, R1 = p-F- C6H4 từ mô hình QSDARMLR (M1) và QSDARANN (M2) M1
5,3570
5,4157
5,3669
5,3855
6,0412
6,0063
5,9579
7,5843
7,5843
7,6042
5,0698
5,1145
5,0957
5,0973
5,8170
5,7985
5,8204
7,2093
7,1880
7,1716 M2
5,2808
5,8444
5,7736
5,8263
6,0728
6,0622
6,0535
5,9761
5,9749
5,9863
5,08715
5,1742
5,1716
5,1724
5,4754
5,4744
5,4704
5,2362
5,2312
5,2219 3.4.3. Mô hình QSSRMLR Các nghiên cứu ở trên các mô hình tuyến tính và mạng thần kinh (QESARMLR, QSDARMLR, QSSRMLR) đã được đánh giá, kiểm tra về độ tin cậy, chúng tôi tiến hành dự đoán tính chất hóa lý cũng như hoạt tính của một số hợp chất có trong tự nhiên chưa biết hoạt tính được đưa ra trong tài liệu của Đỗ Tất Lợi [3]. Các hợp chất bao gồm dữ liệu về cấu trúc được cho ở Hình 3.17 và Hình 3.18. 116 Ramnazin Isoramnetin Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2] Scutelarein Woogonin (Scutelarin) Baicalein Baicalin (R là gốc acid) Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2] 117 Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn xuất flavone và isoflavone tương tự được nghiên cứu từ mô hình QSSRMLR Phương Pháp ARE,% Tính chất hóa lý và hoạt tính kháng ung thư pGI50 QSSRMLR Tham khảo [15] tr = 0,970; R2 pr = 0,945; SE = 0,038 Mô hình QSSRMLR của fla-baicalein với R2 fla-baicalein = 0,01569 + 2,599 (fla-A3) – 1,607 (fla-A27) 920,448 927,250 0,734 Nhiệt chảy (Tm) ở 1 atm 901,978 938,937 3,936 Nhiệt độ tới hạn (Tc) tr = 0,954 ; R2 pr = 0,876; SE = 0,042 Mô hình QSSRMLR của fla-baicalin với R2 fla-baicalin = 0,01421+ 0,685 (fla-A14) – 0,338 (fla-A29) 851,541 757,617 12,397 Nhiệt chảy (Tm) ở 1 atm 1050,039 952,636 10,225 Nhiệt độ tới hạn (Tc) tr = 0,901; R2 pr = 0,838; SE = 0,079 Mô hình QSSRMLR của fla-isoramnetin với R2 fla-isoramnetin = 0,02726 + 1,094 (fla-A1) + 0,921 (fla-A16) + -1,019 (fla-A26) 736,333 812,173 9,338 Nhiệt chảy (Tm) ở 1 atm 919,084 1006,060 8,645 Nhiệt độ tới hạn (Tc) tr = 0,890; R2 pr = 0,840; SE = 0,081 Mô hình QSSRMLR của fla-ramnazin với R2 fla-ramnazin = 0,02519+ 0,947 (fla-A10) – 0,884 (fla-A25) + 0,898 (fla-A28) 1080,891 1074,690 0,577 Nhiệt chảy (Tm) ở 1 atm 964,954 990,614 2,590 Nhiệt độ tới hạn (Tc) tr = 0,919; R2 pr = 0,840; SE = 0,055 Mô hình QSSRMLR của fla-scutelarein với R2 fla-scutelarein = 0,02209 + 0,343 (fla-A6) + 0,617 (fla-A27) 983,841 1007,870 2,384 Nhiệt chảy (Tm) ở 1 atm 925,409 969,420 4,540 Nhiệt độ tới hạn (Tc) tr = 0,888; R2 pr = 0,859; SE = 0,074 Mô hình QSSRMLR của fla-woogonin với R2 fla-woogonin = 0,015+ 0,989 (fla-A7) -0,00236 (fla-A21) 920,448 927,250 0,734 Nhiệt chảy (Tm) ở 1 atm 901,978 938,937 3,936 Nhiệt độ tới hạn (Tc) 118 Các hợp chất tự nhiên được xây dựng lại cấu trúc trên phần mềm HyperChem. Tối ưu hóa cấu trúc phân tử bằng cơ học phân tử MM+ (mức gradient 0,05, thuật toán Polak- Ribiere). Tính toán các tham số điện tích nguyên tử bằng hóa học lượng tử bán thực nghiệm SCF PM3 trong HyperChem. Tính chất hóa hóa lý được xác định từ phương trình bán thực nghiệm từ ChemOffice [15]. Mô hình QSSRMLR được xây dựng tương tự như đã trình bày ở mục 3.2.4 kết quả được cho ở Bảng 3.31, các mô hình hồi quy tuyến tính (QSSRMLR) đều có các giá trị thống kê phù hợp. Phân tích ANOVA một yếu tố chỉ ra rằng kết quả dự đoán tính chất hóa lý của các dẫn xuất flavone và isoflavone từ mô hình QSSRMLR không khác các giá trị các mô hình QSSRMLR nằm trong khoảng sai số của các phép đo thực nghiệm. Sự khác nhau giữa các giá trị thực nghiệm và các giá trị dự đoán từ mô hình là không đáng kể. Xây dựng mô hình QSSRMLR đã dự đoán thành công tính chất hóa lý của các hợp chất tự nhiên có cấu trúc tương tự. Hoạt tính pGI50 của các hợp chất tự nhiên dự đoán từ mô hình tính chất hóa lý tham khảo (Ftt = 0,004 < F0,05 = 4,149). Giá trị ARE, % nhận được từ QSSRMLR, QESARMLR, QSDARMLR được cho ở Bảng 3.32. Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR Hợp chất QSSRMLR QESARMLR QSDARMLR fla-baicalein 6,491 5,129 6,504 fla-baicalin 6,928 4,716 6,018 fla-isoramnetin 5,446 5,078 5,701 fla-ramnazin 5,872 5,175 5,416 fla-scutelarein 6,945 5,829 5,294 fla-woogonin 5,583 6,69 5,594 So sánh khả năng dự đoán hoạt tính kháng ung thư pGI50 của 3 mô hình tuyến tính QSSRMLR, QSDARMLR và QESARMLR bằng phân tích ANOVA một yếu tố. Sự khác nhau giữa 3 mô hình là không có ý nghĩa (F = 2,374 < F0,05 = 6,359). Các mô hình QSSRMLR đã dự đoán thành công hoạt tính kháng ung thư của nhóm hợp chất tự nhiên. 119 Bằng kỹ thuật phân tích hồi quy tuyến tính đa biến số, các mô hình QSSRMLR (các phương trình từ 3.21 đến 3.26) được xây dựng dựa trên mối quan hệ cấu trúc 3D với nhau. Các tham số cấu trúc 3D bao gồm: LogP, ABSQ, ABSQon, Dipole; MaxHp, MaxNeg, MaxQp, Ovality, Polarizability, SpcPolarizability, Surface, Volume. Với các mô hình QSSRMLR xây dựng được, lần lượt thay thế giá trị nhiệt độ nóng chảy của các hợp chất đã biết (biến độc lập x) ta dự báo được giá trị nhiệt độ nóng chảy chưa biết của các hợp chất mục tiêu (biến phụ thuộc Y). Các mô hình QSSRMLR (các phương trình từ 3.21 đến 3.26) của các hợp chất flavonoid phân lập được sử dụng để dự đoán nhiệt độ nóng chảy của các hợp chất phân lập Bảng 3.33. Nhiệt độ nóng chảy thực nghiệm được so sánh với giá trị dự đoán với giá trị sai số trung bình MARE, % là 0,243 % cho thấy khả năng dự báo rất tốt của các mô hình QSSRMLR. Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của các dẫn xuất flavonoid chiết xuất. ARE, % Tm (oC) Hợp chất Thực nghiệm QSSRMLR QSSRMLR
0,447 CSL1 256,500 257,646 0,033 POL1 327,500 327,607 0,418 ZZL1 249,500 248,456 0,167 ZZL2 112,500 112,688 0,075 AIL1 315,000 315,236 0,319 GML1 247,000 247,789 0,243 MARE, % Với GML1 là daidzin, POL1 là luteolin, CSL1 là cynaroside, AIL1 là quercetin, ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4- O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió. tr = 0,999; R2 pr = 0,999; MSE = 0,00081 Mô hình QSSRMLR của CSL1 với R2 CSL1 = - 0,019 + 1,681(POL1) - 1,377(ZZL1) + 0,450(ZZL2) (3.21) 120 tr = 0,999; R2 pr = 0,999; MSE = 0,0001030 Mô hình QSSRMLR của AIL1 với R2 AIL1 = 0,095 - 0,424(CSL1) + 1,059(POL1) + 0,244(ZZL2) (3.22) tr = 0,999; R2 pr = 0,999; MSE = 0,000906 Mô hình QSSRMLR của GML1 với R2 GML1 = 0,051 + 0,522(CSL1)+0,412(POL1) - 0,187(ZZL2) (3.23) tr = 0,999; R2 pr = 0,999; MSE = 0,00010 Mô hình QSSRMLR của POL1 với R2 POL1 = 0,007 + 0,429(CSL1) + 1,120(ZZL1) - 0,329(ZZL2) (3.24) tr = 0,999; R2 pr = 0,999; MSE = 0,00014 Mô hình QSSRMLR của ZZL1 với R2 ZZL1 = - 0,002 - 0,280(CSL1) + 0,812(POL1) + 0,218(ZZL2) (3.25) tr = 0,999; R2 pr = 0,999; MSE = 0,0005345 Mô hình QSSRMLR của ZZL2 với R2 ZZL2 = - 1,332 - 7,023(CSL1) + 11,524(POL1) - 5,900(AIL1) 3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1) Hoạt tính pGI50 của hợp chất ZZL1 và ZZL2 được dự đoán từ các mô hình QSARMLR (3.16), phương trình 3.16 và QSARANN(1), được thể hiện trong Bảng 3.34. So sánh khả năng dự báo của các mô hình QSARMLR (3.16) và QSARANN (1) qua giá trị phần trăm sai số ARE,% (Bảng 3.34). Một lần nữa chúng tôi khẳng định rằng các mô hình QSARMLR (3.16) và QSARANN (1) xây dựng theo mục 3.2.5 có khả năng dự báo rất tốt hoạt tính kháng ung thư của các hợp chất tự nhiên. Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các mô hình QSARMLR (3.16) và QSARANN(1) ARE,% pGI50,pr Hợp chất pGI50,exp QSARMLR (3.16) QSARANN(1) QSARMLR QSARANN(1) (3.17) ZZL1 4,291 4,136 4,251 3,612 0,932 ZZL2 4,123 4,017 4,109 2,571 0,340 Trong công trình này, chúng tôi lựa chọn hợp chất phân lập là ZZL1, ZZL2 với các vị trí còn trống C6, C2’ và C3’ như là một hợp chất mẫu để thiết kế 10 hợp chất mới, các vị trí C6, C2’ và C3’ được gắn các nhóm thế mới. Hoạt tính sinh học pGI50 của các hợp chất mới thiết kế được dự đoán bằng mô hình QSARANN(1), được đưa ra trong Bảng 3.35. 121 QSARANN(1 Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình Hợp chất mới Phương ppháp C6 C2’ C3’ pGI50 ZZL1 H H H Công trình này 4,291 flav-1(n) H H 5,781 CH3 QSARANN(1) flav-2(n) H 6,155 CH3CO- OCH3 QSARANN(1) flav-3(n) H 6,158 CH3CO- OCH3 QSARANN(1) flav-4(n) H 6,488 CH3 OCH3 QSARANN(1) flav-5(n) H 6,538 CH3 OCH3 QSARANN(1) Hợp chất mới Phương pháp C6 C2’ C3’ pGI50 ZZL2 H H H 4,123 Công trình này flav-6(n) H H 4,231 CH3 QSARANN(1) flav-7(n) H 4,634 CH3 OCH3 QSARANN(1) 4,639 flav-8(n) H QSARANN(1) CH3CO- OCH3 H 5,238 flav-9(n) QSARANN(1) CH3CO- OCH3 5,424 flav-10(n) H QSARANN(1) CH3 OCH3 Ký hiệu (n) là chất mới; ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió. a) b) Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2 Kết quả dự đoán giá trị pGI50 của các hợp chất mới được chuyển đổi về giá trị GI50 (µM) và so sánh với giá trị thực nghiệm của ZZL1, ZZL2 xem Hình 3.19. Hoạt tính GI50 (µM) của 10 hợp chất mới bằng cách gắn nhóm thế vào các vị trí C6, 122 C2’ và C3’ của ZZL1 và ZZL2 cao hơn hợp chất mẫu tương ứng. Từ đây, các hợp chất mới thiết kế hứa hẹn trong tổng hợp các dược phẩm mới từ hợp chất tự nhiên. 3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN Sau khi tách hai chất flavonoid luteolin và daidzin, hoạt tính sinh học pGI50 đã được tiến hành để kiểm tra độc tính in vitro đối với tế bào Hela trong phòng thí nghiệm sinh học phân tử, trường đại học khoa học tự nhiên, TP. HCM. Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập luteolin và daidzin từ các mô hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN ARE.% Hợp chất pGI50.exp pGI50,pr M1 M2 M3 M1 M2 M3 luteolin 4,755 4,634 4,715 4,739 2,545 0,841 0,336 daidzin 4,723 4,671 4,729 4,692 1,101 0,127 0,656 (Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR; M3 là mô a) b) hình QSARPCA-ANN). Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) POL1; b) GML1 Các hoạt tính sinh học pGI50 của các chất luteolin và daidzin tính toán từ các mô hình QSARMLR (3.17) phương trình 3.17, QSARPCR và QSARPCA-ANN được trình bày trong Bảng 3.3 . Trong nghiên cứu này, chúng tôi chọn luteolin với các vị trí trống C6, C2' và C3' làm hợp chất mẫu để thiết kế 5 hợp chất mới khác nhau. Các vị trí C6, C2' và C3' được gắn các nhóm thế mới. 123 Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô hình QSARPCA-ANN ) Phương pháp Flavonoid C6 C2’ C3’ pGI50 H H H 4.755 Công trình này POL1 H flav-1(n) NO2 5,781 QSARPCA-ANN flav-2(n) NO2 6,155 QSARPCA-ANN H flav-3(n) H
CH3CO- H
CH3CO- NO2 6,158 QSARPCA-ANN H flav-4(n) NO2 NO2 6,488 QSARPCA-ANN H flav-5(n) NO2 NO2 6,538 QSARPCA-ANN Phương pháp Flavonoid C6 C2’ C3’ pGI50 H H H 4.723 Công trình này GML1 H H flav-6(n) NO2 5,238 QSARPCA-ANN H flav-7(n) 5,413 QSARPCA-ANN HO- flav-8(n) NO2
H
CH3CO- H 5,987 QSARPCA-ANN H H flav-9(n) NO2 6,176 QSARPCA-ANN HO- H flav-10(n) NO2 6,376 QSARPCA-ANN Với (n) là chất mới, GML1 là daidzin, POL1 là luteolin phân lập từ đậu nành, tía tô. Hoạt tính sinh học pGI50 của flavonoid mới thiết kế đã được dự đoán bằng cách sử dụng mô hình QSARPCA-ANN như trong Bảng 3.37, Hình 3.20. Kết quả dự đoán hoạt tính sinh học pGI50 đối với các chất mới được so sánh với hoạt tính thử nghiệm của POL1 và GML1, như được mô tả trong Hình 3.20. Hoạt tính kháng ung thư của năm hợp chất mới được thiết kế bằng cách gắn nhóm thế vào các vị trí C6, C2' và C3 của luteolin mạnh hơn hoạt tính của POL1 và GML1. Các hợp chất mới được thiết kế nhằm tạo ra các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên có hoạt tính sinh học được cải thiện. 3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2) Sau khi phân lập hai flavonoid cynarosid và quercetin, chúng tôi tiến hành kiểm tra độc tính in vitro đối với tế bào Hela của chúng trong phòng thí nghiệm sinh học phân tử, Trường Đại Học Khoa Học Tự Nhiên, TP. Hồ Chí Minh. Hoạt tính 124 pGI50 của hai flavonoid này cũng được dự đoán từ các mô hình QSARMLR (3.19), QSARPLS và QSARANN (2), như trình bày trong Bảng 3.38. Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN (2) Hợp chất pGI50,exp CSL1
AIL1 4,977
4,859 pGI50,pred
M2
4,912
4,675 M1
5,191
4,681 M3
5,017
4,740 M1
4,300
3,663 ARE, %
M2
1,306
3,787 M3
0,804
2,449 Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS (3.20); M3 là mô hình QSARANN(2). Trong nghiên cứu này, chúng tôi chọn quercetin flavonoid với các vị trí C6 và C3' còn trống làm hợp chất mẫu để thiết kế năm hợp chất mới. Các nhóm thế được gắn vào hai vị trí trống C6 và C3’ , như thể hiện trong Bảng 3.38. Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn nhóm thế vào vị trí C6, C3’ của quercetin, dự đoán từ mô hình QSARANN(2) Phương pháp Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’ pGI50
4,859 Công trình này AIL1 -H -H Fla-1(n) 5,382 M3 -OH -OCH2CONHCH3 Fla-2(n) 5,382 M3 -H -OCH2CONHC6H4F Fla-3(n) -OH -OCH2CONHCH3 5,385 M3 Fla-4(n) -OH 5,385 M3 -OCH2(CH3)C=NOH Fla-5(n) 5,385 M3 -OCH2CONHC6H4OCH3 -H Phương pháp Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’ CSL1 H pGI50
4,977 Công trình này H flav-6(n) 5,537 M3 -OH -OCH2CONHCH3 flav-7(n) -OH -OCH2CONHCH3 5,612 M3 flav-8(n) -H 5,613 M3 -OCH2CONHC6H4F flav-9(n) 5,635 M3 -OCH2CONHC6H4OCH3 -H -OH 5,665 M3 flav-10(n) -OCH2(CH3)C=NOH 125 Với (n) là chất mới; M3 là mô hình QSARANN(2); CSL1 là cynaroside, AIL1 là quercetin phân lập từ actiso, xa kê. Các hợp chất được thiết kế mới cũng dự đoán với các hoạt tính sinh học pGI50 sử dụng mô hình QSARANN (2). Sau đó, các hoạt tính dự báo pGI50 đã được chuyển về dạng ban đầu GI50 (μM), như Bảng 3.39. Các kết quả dự đoán pGI50 đối với các chất mới so sánh với hoạt tính thử nghiệm của hợp chất AIL1 và CSL1 mẫu, trong (Hình 3.21). Do đó, các hợp chất mới với nhóm thế ở vị trí C6 và C3' trong phân tử quercetin cho thấy hoạt tính mạnh hơn GI50 (μM) so với mẫu. Ở đây, các hợp chất được thiết kế mới sẽ hứa hẹn đưa ra a) b) một kế hoạch thiết kế cho các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên. Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) AIL1; b) CSL1 126 KẾT LUẬN Luận án đã đạt được các mục tiêu đề ra: 1) tính toán và sàng lọc được các tham số cấu trúc phân tử ảnh hưởng đến hoạt tính kháng ung thư bao gồm: các tham số điện tích (O1, O11, C3, C4, C6 và C7), các tham số độ dịch chuyển hóa học (O1, O11, C2, C3, C6, C7 và C2’); các tham số 2D và 3D (xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa, LogP; MaxQp, SdO, ka3, LogP, Ovality và SdssC) 2) Đã xây dựng được các mô hình QSAR có khả năng dự báo rất tốt hoạt tính kháng ung thư gồm: mô hình QESARMLR, QESARANN, QSDARMLR, QSDARANN, QSSRMLR, QSARMLR (3.16), QSARMLR (3.17), QSARPCA-ANN, QSARMLR (3.19), QSARPLS (3.20), QSARANN(1), QSARANN(2). 3) Đã phân lập và sàng lọc được các dẫn xuất flavonoid có nguồn gốc tự nhiên có hoạt tính kháng ung thư gồm 6 hợp chất daidzin, luteolin, cynaroside, quercetin, kaempferol-3-O-methylether và kaempferol-3-O-(2,4-O-diacetyl-alpha-l- rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió.. 4) Đã thử nghiệm in vitro hoạt tính kháng ung thư của các dẫn xuất flavonoid phân lập. 5) Đã đánh giá hoạt tính kháng ung thư, tính chất hóa lý, của các dẫn xuất flavonoid của các dẫn flavonoid phân lập. 6) Đã nghiên cứu, thiết kế các dược chất mới bằng cách gắn các nhóm thế quan trọng vào các vị trí phân tử ảnh hưởng lớn đến hoạt tính ung thư gồm các vị trí thế - C3, C6 và C7 và C3’ và các nhóm -OCH2CONHC6H4F; - OCH2CONHC6H4OCH3; -OCH2(CH3)C=NOH; -OCH2CONHCH3; OCH2CH3C=NOH; CH3CO- ; -CH3 ; -OCH3; -NO2; -OH. 7) Đã sàng lọc được các hợp chất mới có hoạt tính kháng ung thư cao hơn hợp chất ban đầu. 127 KIẾN NGHỊ Những kết quả đạt được trong luận án đã mở ra những định hướng nghiên cứu triển vọng có thể tiếp cận trong thời gian tới: 1) Mở rộng các kỹ thuật xây dựng mô hình QSAR. 2) Tiến hành tổng hợp các dẫn xuất flavonoid mới 128 1. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van Trung, Hoang Thi Kim Dung, Pham Van Tat (2015), "Prediction of anticancer activities of luteolin flavonoid daidzin in leaf of plants Perilla ocymoides L. flavonoid Glucine max L. using 2D, 3D descriptors", Viet Nam Journal of Chemistry, 6e4(53), pp, 232-239. 2. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Vo Thanh Cong, Phung Van Trung, Hoang Thi Kim Dung, Tran Duong, Pham Van Tat (2016), "Anticancer agents of kaempferol-3-O-methylether flavonoid kaempferol-3- O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) in leaf of plants Zingiber zerumbet Sm. using 2D, 3D descriptors", Viet Nam Journal of Chemistry, 54(6), pp, 710-718. 3. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van Trung, Nguyen Minh Quang, Hoang Thi Kim Dung, Pham Van Tat, (2016), "Prediction of anticancer activities of cynaroside flavonoid quercetin in leaf of plants Cynara scolymus L. flavonoid Artocarpus incisa L. using structure– activity relationship", Cogent Chemistry Taylor & Francis 2(1), pp, 1-12. 4. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần Dương, Phạm Văn Tất (2017), "Nghiên cứu hoạt tính kháng ung thư của kaempferol-1, daidzin từ Zingiber zerumbet Sm. và Glucine max L. sử dụng các tham số mô tả phân tử 2D và 3D", Tạp Chí Khoa học và Công nghệ Trường Đại học Khoa Học Huế: Khoa học Tự nhiên, pp. 1-10. (Đã có giấy nhận đăng) 5. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần Dương, Phạm Văn Tất (2017), " Dự báo hoạt tính kháng ung thư cổ tử cung của các hợp chất flavonoid phân lập từ Cynara scolymus L. Và Artocarpus incisa L. Sử dụng mô hình QSAR 2D và 3D ", Tạp chí khoa học đại học Huế, 126 (S 1D), pp. 1-9. 129 6. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung, Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "In silico Modelling of 2D, 3D Molecular Descriptors for Prediction Of Anticancer Activities Of Luteolin And Daidzin From Plants Perilla ocymoides L and Glucine max L", Organic & Medicinal Chemistry International Journal (OMCIJ), pp. 1-13. ISSN: 2474-7610. 7. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung, Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "Prediction Of Anticancer Activities Of Kaempferol-3-O-Methylether And Kaempferol-3- O-(2,4-O-Diacetyl-Alpha-L-Rhamnopyranoside) Isolating From Plant 15O-NMR Simulation Spectra Data", Organic & Medicinal Chemistry Rhizome Zingiber Zerumbet Sm using QSDAR Models from 13C-NMR and International Journal (OMCIJ), pp. 1-15. ISSN: 2474-7610. 8. Thuy, B.T.P., Chau, H.V., Dai, T.T., Nhung, N.T.A., Trung, P.V., Dung, H.T.K., Duong, T., Tat, P.V. (2018), "Appreciation of cytotoxic activity on hela cell of flavonoid derivatives using multiple linear regression and artificial neural network", The 4th International Integated (Web & offline) Conference & Concert on Convergence (IICCC2018) (ISSN 2384-4418), 4, pp. 323-332. 130 1. Hồng, N.T. (2007), Các phương pháp phổ trong hóa hữu cơ, NXB Khoa học và kỹ thuật,Hà Nội 2. Lợi, Đ.T. (2009), Những cây thuốc và vị thuốc Việt Nam,Hà Nội, NXB Khoa học kỹ thuật. 3. Phụng, N.K.P. (2007), Phương pháp cô lập hợp chất hữu cơ ĐHQG-HCM 4. Phụng, N.K.P. (2005), Phổ NMR sử dụng trong phân tích hữu cơ, NXB ĐH Quốc gia TP. HCM. 5. 6543Wang, D., Zhang, M., Li, Z., Song, C., Fu, M., Li, J., Chen, X. (2017), "System impairment compensation in coherent optical communications by using a bio-inspired detector based on artificial neural network and genetic algorithm", Optics Communications, 399, pp. 1-12. 6. Avendaño, C.,Menéndez, J.C. (2015), Chapter 1 - General Aspects of Cancer Chemotherapy, in Medicinal Chemistry of Anticancer Drugs (Second Edition)Elsevier, Boston, pp. 1-22. 7. Balaga, H., Gupta, N.,Vishwakarma, D.N. (2015), "GA trained parallel hidden layered ANN based differential protection of three phase power transformer", International Journal of Electrical Power & Energy Systems, 67, pp. 286-297. 8. Barbour, L.J. (2017), 2.03 - Single-Crystal X-ray Diffraction A2 - Atwood, Jerry L, in Comprehensive Supramolecular Chemistry IIElsevier, Oxford, pp. 23-43. 9. Bastien, P., Vinzi, V.E.,Tenenhaus, M. (2005), "PLS generalised linear regression", Computational Statistics & Data Analysis, 48(1), pp. 17-46. 10. Beheshti, A., Pourbasheer, E., Nekoei, M., Vahdani, S. (2016), "QSAR modeling of antimalarial activity of urea derivatives using genetic algorithm– multiple linear regressions", Journal of Saudi Chemical Society, 20(3), pp. 282-290. 131 11. Bharathi, S., Devasena, T., Arivarasan, A., Pachaiappan, R. (2016), "Extraction and isolation of flavonoid quercetin from the leaves of trigonella foenum-graecum and their anti-oxidant activity", International Journal of Pharmacy and Pharmaceutical Sciences, 8(6). 12. Birt, D.F., Hendrich, S.,Wang, W. (2001), "Dietary agents in cancer prevention: flavonoids and isoflavonoids", Pharmacology & Therapeutics, 90(2–3), pp. 157-177. 13. BMDPnewsystem2.0 (2003), Statistical Solutions Ltd.,USA. 14. Bodor, N.,Huang, M.J. (1992), "An extended version of a novel method for the estimation of partition coefficients", J Pharm Sci, 81(3), pp. 272-281. 15. CambridgeSoftCorporation (2008), CS Chem3D Ultra,USA. 16. Cao, W., Wang, X., Ming, Z., Gao, J. (2017), "A review on neural networks with random weights", Neurocomputing, pp. 1-50. 17. Chen, B., Zhang, T., Bond, T., Gan, Y. (2015), "Development of quantitative structure activity relationship (QSAR) model for disinfection byproduct (DBP) research: A review of methods and resources", Journal of Hazardous Materials, 299, pp. 260-279. 18. Chen, I.L., Chen, J.Y., Shieh, P.C., Chen, J.J., Lee, C.H., Juang, S.H., Wang, T.C. (2008), "Synthesis and antiproliferative evaluation of amide-containing flavone and isoflavone derivatives", Bioorg Med Chem, 16(16), pp. 7639- 7645. 19. Christensen, L.P.,Christensen, K.B. (2014), Chapter 23 - The Role of Direct and Indirect Polyphenolic Antioxidants in Protection Against Oxidative Stress, in Polyphenols in Human Health and DiseaseAcademic Press, San Diego, pp. 289-309. 20. Corcoran, M.P., McKay, D.L.,Blumberg, J.B. (2012), "Flavonoid basics: chemistry, sources, mechanisms of action, and safety", J Nutr Gerontol Geriatr, 31(3), pp. 176-189. 132 21. De Gregorio, M.,Giordano, M. (2017), "Background estimation by weightless neural networks", Pattern Recognition Letters, 96, pp. 55-65. 22. Devillers, J. (1996), 1 - Strengths and Weaknesses of the Backpropagation Neural Network in QSAR and QSPR Studies, in Neural Networks in QSAR and Drug DesignAcademic Press, London, pp. 1-46. 23. El Zoghbi, M., Salameh, P., Stücker, I., Paris, C., Pairon, J.C., Gislard, A., Siemiatycki, J., Bonneterre, V., Clin, B., Brochard, P., Delva, F., Lacourt, A. (2017), "Phenotypes of lung cancer and statistical interactions between tobacco smoking and occupational exposure to asbestos and crystalline silica from a large case-only study: The CaProMat study", Lung Cancer, 112, pp. 140-155. 24. Farid, M.M., Hussein, S.R., Ibrahim, L.F., El Desouky, M.A., Elsayed, A.M., El Oqlah, A.A., Saker, M.M. (2015), "Cytotoxic activity and phytochemical analysis of Arum palaestinum Boiss", Asian Pacific Journal of Tropical Biomedicine, 5(11), pp. 944-947. 25. Feliu, M.,Keiji, M. (1995), "IMOMM: A new integrated ab initio + molecular mechanics geometry optimization scheme of equilibrium structures and transition states", Journal of Computational Chemistry, 16(9), pp. 1170–1179. 26. Fucic, A., Guszak, V.,Mantovani, A. (2017), "Transplacental exposure to environmental carcinogens: Association with childhood cancer risks and the role of modulating factors", Reproductive Toxicology, 72, pp. 182-190. 27. Galbas, M., Porzucek, F., Wozniak, A., Slomski, R., Selwet, M. (2013), "Isolation of low-molecular albumins of 2S fraction from soybean (Glycine max (L.) Merrill)", Acta Biochim Pol, 60(1), pp. 107-110. 28. Gasteiger, J.,Marsili, M. (1980), "Iterative partial equalization of orbital electronegativity—a rapid access to atomic charges", Tetrahedron, 36(22), pp. 3219-3228. 133 29. Ghahari, S., Alinezhad, H., Nematzadeh, G.A., Tajbakhsh, M., Baharfar, R. (2017), "Chemical Composition, Antioxidant and Biological Activities of the Essential Oil and Extract of the Seeds of Glycine max (Soybean) from North Iran", Curr Microbiol, 74(4), pp. 522-531. 30. Ghamali, M., Chtita, S., Ousaa, A., Elidrissi, B., Bouachrine, M., Lakhlifi, T. (2017), "QSAR analysis of the toxicity of phenols and thiophenols using MLR and ANN", Journal of Taibah University for Science, 11(1), pp. 1-10. 31. Giau, L.H., Nha To, N.N., Thi, N.D.T., Quang That, T.Q., Phung, N.K.P., Nguyen, P.T.K., Duus, F. (2015), "Biological test against breast adenocarcinoma cells (MCF-7) of acylated products of 3-methyl-4- thiorhodanine", Journal of Science & Technology Development, 8(1), pp. 63-69. 32. Grce, M. (2009), "Primary and secondary prevention of cervical cancer", Expert Rev Mol Diagn, 9(8), pp. 851-857. 33. Griffon, G., Merlin, J.L.,Marchal, C. (1995), "Comparison of sulforhodamine B, tetrazolium and clonogenic assays for in vitro radiosensitivity testing in human ovarian cell lines", Anticancer Drugs, 6(1), pp. 115-123. 34. Gründer, Y.,Lucas, C.A. (2016), "Surface X-ray diffraction studies of single crystal electrocatalysts", Nano Energy, 29, pp. 378-393. 35. Hanh, N.T.M., Phung, N.K.P.,Phuong, Q.N.D. (2017), "Studying on Tyrosinase Inhibition Activity of Some Vietnamese Folk Plants Aims to Use in Skin-Whitening Cosmetics", American Journal of Plant Sciences, 8(6). 36. Harry, W. (1947), "Structural determination of paraffin boiling points", Journal of the American Chemical Society, 69(1), pp. 17-20. 37. Hossain, M.A.,Mizanur, R.S.M. (2015), "Isolation and characterisation of flavonoids from the leaves of medicinal plant Orthosiphon stamineus", Arabian Journal of Chemistry, 8(2), pp. 218-221. 38. Hypercube, I. (2002), HyperChem computational chemistry, Hypercube, Inc. 134 39. Hypercube.Inc. (2008), HyperChem Release 8.03 for Windows, Gainesville, Florida, USA. 40. INFormv2.0 (2000), Intelligentsys Ltd.,UK. . 41. Jalal, T.K., Ahmed, I.A., Mikail, M., Momand, L., Draman, S., Isa, M.L., Abdull Rasad, M.S., Nor Omar, M., Ibrahim, M., Abdul Wahab, R. (2015), "Evaluation of antioxidant, total phenol and flavonoid content and antimicrobial activities of Artocarpus altilis (breadfruit) of underutilized tropical fruit extracts", Appl Biochem Biotechnol, 175(7), pp. 3231-3243. 42. Jang, D.S., Han, A.R., Park, G., Jhon, G.J., Seo, E.K. (2004), "Flavonoids and aromatic compounds from the rhizomes of Zingiber zerumbet", Arch Pharm Res, 27(4), pp. 386-389. 43. Jung, S.K.,McDonald, K. (2011), "Visual gene developer: a fully programmable bioinformatics software for synthetic gene optimization", BMC Bioinformatics, 12, pp. 340. 44. Kalailingam, P., Balasubramanian, K., Kannaian, B., Mohammed, A.K.N., Meenakshisundram, K., Tamilmani, E., R., K. (2013), "Isolation and quantification of flavonoids from ethanol extract of Costus igneus rhizome (CiREE) and impact of CiREE on hypoglycaemic, electron microscopic studies of pancreas in streptozotocin (STZ)-induced diabetic rats", Biomedicine & Preventive Nutrition, 3(3), pp. 285-297. 45. Kamdem, W.A.F., Coombes, P.H., Mulholland, D.A., Nkengfack, A.E., Fomum, Z.T. (2006), "Flavones and isoflavones from the west African Fabaceae Erythrina vogelii", Phytochemistry, 67(5), pp. 459-463. 46. Keepers, Y.P., Pizao , P.E., Peters, G.J., Van Ark-Otte, J., Winograd, B., Pinedo, H.M. (1991), "Comparison of the sulforhodamine B protein and tetrazolium (MTT) assays for in vitro chemosensitivity testing", European Journal of Cancer and Clinical Oncology, 27(7), pp. 897-900. 47. Keyser, E.A., Staat, B.C., Fausett, M.B., Shields, A.D. (2012), "Pregnancy- Associated Breast Cancer", Rev Obstet Gynecol, 5(2), pp. 94-99. 135 48. Kier, L., Hall, H.,Lowell (1991), The Molecular Connectivity Chi Indices and Kappa Shape Indices in Structure-Property Modeling. Vol. 2. VCH publishers New York 49. Kier, L., Hall, H.,Lowell (1986), Molecular connectivity in structure-activity analysis Vol. 10. Wiley & Sons, Inc. 50. Konar,Amit (2005), Computational Intelligence, Springer. 51. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 2 Statistical Methods in QSAR/QSPR, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in Molecular Science, pp. 37-59. 52. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 1 QSAR/QSPR Methods, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in Molecular Science, pp. 61-103. 53. Lapčík, O., Kle dus, B., Kokoška, L., Davidová, M., Afandi, K., Kubáň, V., Hampl, R. (2005), "Identification of isoflavones in Acca sellowiana and two Psidium species (Myrtaceae)", Biochemical Systematics and Ecology, 33(10), pp. 983-992. 54. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line concentration of flavonoids in Brassica oleracea by capillary electrophoresis using large volume sample stacking", Food Chemistry, 133(1), pp. 205-211. 55. Li-ping, Q., Guo-rong, F., Jin-yong, P., He-ming, M. (2007), "Isolation of six isoflavones from Semen sojae praeparatum by preparative HPLC", Fitoterapia, 78(3), pp. 200-204. 56. López-Molina, D., Heering, H.A., Smulevich, G., Tudela, J., Thorneley, R.N.F., Garcı́a-Cánovas, F., Rodrı́guez-López, J.N. (2003), "Purification and
characterization of a new cationic peroxidase from fresh flowers of Cynara scolymus L", Journal of Inorganic Biochemistry, 94(3), pp. 243-254. 57. Lopez, C.S., Krauskopf, E., Villota, C.E., Burzio, L.O., Villegas, J.E. (2017), "Cervical cancer, human papillomavirus and vaccines: assessment of the 136 information retrieved from general knowledge websites in Chile", Public Health, 148, pp. 19-24. 58. Maresso, K.C.,Hawk, E. (2016), "Cancer Prevention Recommendations: Impact of Adherence", Seminars in Oncology Nursing, 32(3), pp. 306-313. 59. Markham, K.R. (1975), Chapter 1 Isolation Techniques for Flavonoids, in The FlavonoidsSpringer US, pp. 1-44. 60. Martin, J.F., Paul, A.B.,Martin, K. (1990), "A combined quantum mechanical and molecular mechanical potential for molecular dynamics simulations", Journal of Computational Chemistry, 11(6), pp. 700–733. 61. Molugaram, K.,Rao, G.S. (2017), Chapter 11 - ANOVA (Analysis of Variance), in Statistical Techniques for Transportation EngineeringButterworth-Heinemann, pp. 451-462. 62. Naik, P.P., Das, D.N., Panda, P.K., Mukhopadhyay, S., Sinha, N., Praharaj, P.P., Agarwal, R., Bhutia, S.K. (2016), "Implications of cancer stem cells in developing therapeutic resistance in oral cancer", Oral Oncology, 62, pp. 122-135. 63. P., B., V.V., S.,M., T. (2005), "PLS Generalised Regression. Computational Statistics and Data Analysis" 48, pp. 17-46. 64. Pauwels, B., Korst, A.E., de Pooter, C.M., Pattyn, G.G., Lambrechts, H.A., Baay, M.F., Lardon, F., Vermorken, J.B. (2003), "Comparison of the sulforhodamine B assay and the clonogenic assay for in vitro chemoradiation studies", Cancer Chemother Pharmacol, 51(3), pp. 221-226. 65. Perez, R.P., Godwin, A.K., Handel, L.M., Hamilton, T.C. (1993), "A comparison of clonogenic, microtetrazolium and sulforhodamine B assays for determination of cisplatin cytotoxicity in human ovarian carcinoma cell lines", Eur J Cancer, 29A(3), pp. 395-399. 66. QSARIS1.0 (2001), Statistical Solutions Ltd.,USA. 137 67. Raffa, D., Maggio, B., Raimondi, M.V., Plescia, F., Daidone, G. (2017), "Recent discoveries of anticancer flavonoids", European Journal of Medicinal Chemistry. 68. Rawat, P., Saroj, L.M., Kumar, A., Singh, T.D., Tewari, S.K., Pal, M. (2016), "Phytochemicals and Cytotoxicity of Launaea procumbens on Human Cancer Cell Lines", Pharmacogn Mag, 12(Suppl 4), pp. S431-S435. 69. Raza, A.,Zhong, M. (2017), "Lane-based short-term urban traffic forecasting with GA designed ANN and LWR models", Transportation Research Procedia, 25, pp. 1430-1443. 70. Rebecca, L.S., Kimberly, D.M.,Ahmedin, J. (2015), "Cancer Statistic, 2015", CA: A Cancer journal for Clinicians, 65(1), pp. 5-29. 71. Rebecca, S., Deepa, N.,Ahmedin, J. (2012), "Cancer statistics, 2012", CA: A Cancer journal for Clinicians, 62(1), pp. 10-29. 72. Roy, K.,Ambure, P. (2016), "The “double cross-validation” software tool for MLR QSAR model development", Chemometrics and Intelligent Laboratory Systems, 159, pp. 108-126. 73. Roy, K., Kar, S.,Das, R.N. (2015), Chapter 7 - Validation of QSAR Models, in Understanding the Basics of QSAR for Applications in Pharmaceutical Sciences and Risk AssessmentAcademic Press, Boston, pp. 231-289. 74. Sak, K. (2014), "Cytotoxicity of dietary flavonoids on different human cancer types", Pharmacogn Rev, 8(16), pp. 122-146. 75. Sarawek, S., Feistel, B., Pischel, I., Butterweck, V. (2008), "Flavonoids of Cynara scolymus possess potent xanthinoxidase inhibitory activity in vitro but are devoid of hypouricemic effects in rats after oral application", Planta Med, 74(3), pp. 221-227. 76. Sarkhosh, M., Khorshidi, N., Niazi, A., Leardi, R. (2014), "Application of genetic algorithms for pixel selection in multivariate image analysis for a QSAR study of trypanocidal activity for quinone compounds and design new 138 quinone compounds", Chemometrics and Intelligent Laboratory Systems, 139(Supplement C), pp. 168-174. 77. Sarosh, A.,Yun-Feng, D. (2016), "The GA-ANN expert system for mass- model classification of TSTO surrogates", Aerospace Science and Technology, 48, pp. 146-157. 78. Saxena, V.K.,Aprajita, G. (2008), "Isolation and study of the flavone glycoside; luteolin-7- O-β-d-glucopyranoside from the seeds of the capparis decidua (forsk)", International journal chemical sciences, 6(1), pp. 7-10. 79. Shan, Y. (2016), Chapter 4 - Isolation and Structural Identification of Flavonoids From Citrus, in Comprehensive Utilization of Citrus By- ProductsAcademic Press, pp. 59-64. 80. Si, Y.L., Jin, C.C., Li, Q.Y.S., Kang, C.Z. (2008), "QSAR, action mechanism and molecular design of flavone and isoflavone derivatives with cytotoxicity against HeLa", European Journal of Medicinal Chemistry, 43, pp. 2159- 2170. 81. Singh, M., Kaur, M.,Silakari, O. (2014), "Flavones: An important scaffold for medicinal chemistry", European Journal of Medicinal Chemistry, 84, pp. 206-239. 82. Singh, S.K., Srivastava, K., Banerjee, R., Prasad, J. (2017), "Syntheses and single crystal X-ray diffraction studies of hydroxynicotinic acid based complexes involving supramolecular interactions", Polyhedron, 133, pp. 222-230. 83. Smalheiser, N.R. (2017), Chapter 11 - ANOVA, in Data LiteracyAcademic Press, pp. 149-155. 84. Snedecor, G.,Cochran, W. (1967), Statistical methods, Oxford and IBH, New Delhi. 85. Steppan, D.D., Werner, J.,Yeater, P.R. (2000), Essential Regression and Experimental Design for Chemists and Engineers, USA. 139 86. Tat, P.V. (2009), Development of Quantitative Structure-Activity Relationships (QSARs) and Quantitative Structure-Property Relationships (QSPRs),Hanoi, NXB Natural Science and Technology. 87. Tat, P.V. (2009), "Prediction of thermodynamic properties of similar organic compounds using artificial neural network", Vietnamese Journal of Chemistry and Application, 4, pp. 611-616. 88. Tat, P.V. (2009 ), "Models QSAR of the group 6-aminoquinolone: new anti-HIV agents", Vietnamese Journal of Chemistry and Application, 15, pp. 30-34 89. Tat, P.V. (2009), "QSDAR model: Quantitative Spectrum Data 13C-NMR and 15O-NMR Activity Relationships (QSDAR) of a set of anti-cancer 3- aminoflavonoid", Vietnamese Journal of Chemistry and Application, 14, pp. 43-46. 90. Tat, P.V. (2017), Development of new anticancer agents from Leaf of plants in Viet Nam, LAP Lambert Academic Publishing. 01-80 trang. 91. Thavamani, B.S., Mathew, M.,Dhanabal, S.P. (2013), "In vitro cytotoxic activity of menispermaceae plants against HeLa cell line", Anc Sci Life, 33(2), pp. 81-84. 92. Thuy, B.T.P.,Tat, P.V. (2012), "Development of QSDAR models for anticancer flavone and isoflavone analogues Using 13C-NMR and 15O- NMR", Viet Nam Journal of Chemistry, 50(5A), pp. 203-208. 93. Tomasz, P., Jerzy, L.,Mark, T.D.C. (2010), Recent Advances in QSAR Studies Methods and Applications, springer. 94. Tong, J., Liu, S., Zhou, P., Wu, B., Li, Z. (2008), "A novel descriptor of amino acids and its application in peptide QSAR", Journal of Theoretical Biology, 253(1), pp. 90-97. 95. Torkashvand, A.M., Ahmadi, A.,Nikravesh, N.L. (2017), "Prediction of kiwifruit firmness using fruit mineral nutrient concentration by artificial 140 neural network (ANN) and multiple linear regressions (MLR)", Journal of Integrative Agriculture, 16(7), pp. 1634-1644. 96. Ventriglia, J., Paciolla, I., Pisano, C., Cecere, S.C., Di Napoli, M., Tambaro, R., Califano, D., Losito, S., Scognamiglio, G., Setola, S.V., Arenare, L., Pignata, S., Della Pepa, C. (2017), "Immunotherapy in ovarian, endometrial and cervical cancer: State of the art and future perspectives", Cancer Treatment Reviews, 59, pp. 109-116. 97. Verma, R.P.,Matthews, E.J. (2015), "Estimation of the chemical-induced eye injury using a Weight-of-Evidence (WoE) battery of 21 artificial neural network (ANN) c-QSAR models (QSAR-21): Part II: Corrosion potential", Regulatory Toxicology and Pharmacology, 71(2), pp. 331-336. 98. Vichai, V.,Kirtikara, K. (2006), "Sulforhodamine B colorimetric assay for cytotoxicity screening", Nat Protoc, 1(3), pp. 1112-1116. 99. Viens, L.J., Clouston, S.,Messina, C.R. (2016), "Women's autonomy and cervical cancer screening in the Lesotho Demographic and Health Survey 2009", Social Science & Medicine, 150, pp. 23-30. 100. Vreven, T., Byun, K.S., Komáromi, I., Dapprich, S., Montgomery, J.A., Morokuma, K., Frisch, M.J. (2006), "Combining Quantum Mechanics Methods with Molecular Mechanics Methods in ONIOM", Journal of Chemical Theory and Computation, 2(3), pp. 815-826. 101. Wang, G., Luo, H.,Peng, K. (2016), "Quality-related fault detection using linear and nonlinear principal component regression", Journal of the Franklin Institute, 353(10), pp. 2159-2177. 102. Wang, J., Wang, W., Kollman, P.A., Case, D.A. (2006), "Automatic atom type and bond type perception in molecular mechanical calculations", Journal of Molecular Graphics and Modelling, 25(2), pp. 247-260. 103. Wang, T.C., Chen, I.L., Lu, P., Wong, C., Liao, C., Tsiao, K., Chang, K., Chen, Y., Tzeng, C. (2005), "Synthesis, antiproliferative, and antiplatelet 141 activities of oxime- and methyloxime-containing flavone and isoflavone derivatives", Bioorganic & Medicinal Chemistry, 13(21), pp. 6045-6053. 104. Wang, Y., Xu, K., Lin, L., Pan, Y., Zheng, X. (2007), "Geranyl flavonoids from the leaves of Artocarpus altilis", Phytochemistry, 68(9), pp. 1300- 1306. 105. Weirong, C., Xiaohong, G.,Jian, T. (2010), "Extraction, Purification, and Characterisation of the Flavonoids from Opuntia milpa alta Skin", Czech Journal of Food Sciences, 28(2), pp. 108–116. 106. Wold, S. (1995), "PLS for multivariate linear modelling. In: van de Waterbeemd H. (ed.), QSAR: Chemometric Methods in Molecular Design", Wiley-VCH, Weinheim, Germany, 2, pp. 195-218. 107. XLSTATversion2014.4.08 (2014), XLSTAT Tutorials, Copyright Addinsoft,U.S.A. 108. Yang, C., Chen, H., Lu, S., Zhang, M., Tian, W., Wang, M., Zhang, L., Song, Y., Shen, A., Zhou, Y., Zhu, J., Zheng, C. (2016), "Structural modification of luteolin from Flos Chrysanthemi leads to increased tumor cell growth inhibitory activity", Bioorganic & Medicinal Chemistry Letters, 26(15), pp. 3464-3467. 109. Yoshizawa, T., Hashimoto, H., Shimizu, T., Yamabe, M., Shichijo, N., Hanada, K., Hirano, H., Sato, M. (2011), "Purification, crystallization and X- ray diffraction study of basic 7S globulin from soybean", Acta Crystallogr Sect F Struct Biol Cryst Commun, 67(Pt 1), pp. 87-89. 110. Zhang, Y. (2014), "An improved QSPR method based on support vector machine applying rational sample data selection and genetic algorithm- controlled training parameters optimization", Chemometrics and Intelligent Laboratory Systems, 134, pp. 34-46. 111. 2014.4.08, X.v. (2014), Copyright Addinsoft 1995-2014,U.S.A. 142 112. Basu, P., Mittal, S., Bhadra Vale, D., Chami Kharaji, Y. "Secondary Prevention of Cervical Cancer", Best Practice & Research Clinical Obstetrics & Gynaecology. 113. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line concentration of flavonoids in Brassica oleraceaby capillary electrophoresis using large volume sample stacking", Food Chemistry, 133, pp. 205-2011. 114. R.P., V.,E.J., M. (2015), "Estimation of the chemical-induced eye injury using a weight-of-evidence (WoE) battery of 21 artificial neural network (ANN) c-QSAR models (QSAR-21): Part I: Irritation potential", Regulatory Toxicology and Pharmacology, 71(2), pp. 318-330. 115. StatisticalSolutionsLtd (2011), TOXSYS 1.3, USA. 143 Phụ lục 1a. Hoạt tính pGI50 của nhóm dẫn xuất mẫu flavone và isoflavone b) Hợp chất Khung hợp chất Vị trí thế Nhóm thế R pGI50 flavone 5,6990 FLA1 C3 -OCH2CCH3=NOH flavone 5,9208 FLA2 C6 -OCH2CCH3=NOH flavone 5,6990 FLA3 C7 -OCH2CCH3=NOH isoflavone 5,0088 ISOFLA4 C7 -OCH2CCH3=NOH flavone 5,6990 FLA5 C3 -OCH2CCH3=NOCH3 flavone 6,0458 FLA6 C6 -OCH2CCH3=NOCH3 flavone 5,6576 FLA7 C7 -OCH2CCH3=NOCH3 isoflavone 5,0706 ISOFLA8 C7 -OCH2CCH3=NOCH3 flavone 5,7447 FLA9 C3 -OCH2C(C6H5)=NOH flavone 5,6778 FLA10 C3 -OCH2C(4-F-C6H4)=NOH flavone 5,6990 FLA11 C3 -OCH2C(4-CH3O-C6H4)=NOH flavone 6,0969 FLA12 C6 -OCH2C(C6H5)=NOH flavone 5,7959 FLA13 C6 -OCH2C(4-F-C6H4)=NOH flavone 6,0000 FLA14 C6 -OCH2C(4-CH3O-C6H4)=NOH flavone 5,6990 FLA15 C7 -OCH2C(C6H5)=NOH flavone 5,6990 FLA16 C7 -OCH2C(4-F-C6H4)=NOH flavone 5,6990 FLA17 C7 -OCH2C(4-CH3O-C6H4)=NOH isoflavone 5,0458 ISOFLA18 C7 -OCH2C(C6H5)=NOH isoflavone 5,1079 ISOFLA19 C7 -OCH2C(4-F-C6H4)=NOH isoflavone 5,1192 ISOFLA20 C7 -OCH2C(4-CH3O-C6H4)=NOH flavone 5,7959 FLA21 C3 -OCH2C(C6H5)=NOCH3 flavone 5,6990 FLA22 C3 -OCH2C(4-F-C6H4)=NOCH3 flavone 5,6990 FLA23 C3 -OCH2C(4-CH3O-C6H4)=NOCH3 flavone 5,6198 FLA24 C6 -OCH2C(C6H5)=NOCH3 a)
Khung cấu trúc: a) flavone và b) isoflavone 144 flavone 5,6383 FLA25 C6 -OCH2C(4-F-C6H4)=NOCH3 flavone 5,6990 FLA26 C6 -OCH2C(4-CH3O-C6H4)=NOCH3 flavone 5,1805 FLA27 C7 -OCH2C(C6H5)=NOCH3 flavone 5,5686 FLA28 C7 -OCH2C(4-F-C6H4)=NOCH3 flavone 5,6021 FLA29 C7 -OCH2C(4-CH3O-C6H4)=NOCH3 isoflavone 5,0862 ISOFLA30 C7 -OCH2C(C6H5)=NOCH3 isoflavone 5,1938 ISOFLA31 C7 -OCH2C(4-F-C6H4)=NOCH3 isoflavone 5,1367 ISOFLA32 C7 -OCH2C(4-CH3O-C6H4)=NOCH3 Hợp chất Phụ lục 1b. Điện tích nguyên tử trên khung phân tử flavone và isoflavone Fla-1 -0,093 0,156 -0,117 0,327 0,018 -0,159 -0,029 -0,154 145 Fla-2 -0,096 0,187 -0,331 0,358 -0,088 0,064 -0,078 -0,114 Fla-3 -0,102 0,181 -0,321 0,364 0,051 -0,202 0,179 -0,253 Isofla-4 -0,081 0,072 -0,178 0,369 0,054 -0,201 0,180 -0,251 Fla-5 -0,093 0,155 -0,116 0,326 0,017 -0,159 -0,029 -0,154 Fla-6 -0,097 0,186 -0,330 0,358 -0,038 0,062 -0,125 -0,113 Fla-7 -0,102 0,181 -0,322 0,364 0,051 -0,202 0,179 -0,253 isofla-8 -0,081 0,072 -0,178 0,369 0,054 -0,201 0,180 -0,251 Fla-9 -0,091 0,153 -0,113 0,334 0,018 -0,161 -0,028 -0,155 Fla-10 -0,091 0,154 -0,113 0,334 0,019 -0,161 -0,027 -0,155 Fla-11 -0,091 0,153 -0,112 0,334 0,018 -0,161 -0,028 -0,155 Fla-12 -0,097 0,185 -0,330 0,358 -0,036 0,061 -0,129 -0,113 Fla-13 -0,097 0,186 -0,330 0,358 -0,036 0,060 -0,129 -0,113 Fla-14 -0,096 0,187 -0,332 0,360 -0,093 0,064 -0,076 -0,115 Fla-15 -0,103 0,180 -0,321 0,365 0,050 -0,200 0,178 -0,258 Fla-16 -0,103 0,181 -0,321 0,364 0,051 -0,200 0,177 -0,257 Fla-17 -0,103 0,180 -0,321 0,365 0,050 -0,200 0,178 -0,258 isofla-18 -0,082 0,072 -0,178 0,370 0,054 -0,200 0,179 -0,255 isofla-19 -0,082 0,071 -0,177 0,369 0,054 -0,199 0,178 -0,255 isofla-20 -0,082 0,072 -0,178 0,370 0,054 -0,200 0,179 -0,255 Fla-21 -0,094 0,150 -0,088 0,338 0,017 -0,162 -0,030 -0,159 Fla-22 -0,094 0,151 -0,088 0,338 0,017 -0,161 -0,030 -0,159 Fla-23 -0,092 0,153 -0,111 0,334 0,018 -0,161 -0,028 -0,155 Fla-24 -0,097 0,185 -0,330 0,358 -0,037 0,061 -0,129 -0,113 Fla-25 -0,097 0,186 -0,330 0,358 -0,036 0,060 -0,129 -0,113 Fla-26 -0,097 0,185 -0,330 0,358 -0,037 0,062 -0,129 -0,113 Fla-27 -0,099 0,182 -0,323 0,365 0,053 -0,252 0,178 -0,206 Fla-28 -0,103 0,181 -0,321 0,364 0,050 -0,200 0,177 -0,257 Fla-29 -0,103 0,180 -0,320 0,365 0,050 -0,200 0,179 -0,258 isofla-30 -0,082 0,072 -0,179 0,370 0,054 -0,200 0,179 -0,255 isofla-31 -0,082 0,071 -0,178 0,369 0,054 -0,200 0,178 -0,255 isofla-32 -0,082 0,072 -0,179 0,370 0,053 -0,200 0,179 -0,255 a Fla-1 0,127 -0,231 -0,344 -0,073 -0,054 -0,122 -0,071 -0,120 -0,070 146 Fla-2
Fla-3 0,092
0,172 -0,186
-0,266 -0,365
-0,368 -0,078
-0,076 -0,047
-0,049 -0,118
-0,117 -0,070
-0,071 -0,116
-0,116 -0,064
-0,066 Isofla-4
Fla-5 0,147
0,127 -0,271
-0,231 -0,366
-0,343 0,003
-0,072 -0,081
-0,054 -0,113
-0,122 -0,097
-0,072 -0,114
-0,120 -0,118
-0,071 Fla-6
Fla-7 0,091
0,172 -0,187
-0,266 -0,359
-0,368 -0,078
-0,076 -0,048
-0,049 -0,117
-0,117 -0,070
-0,071 -0,116
-0,116 -0,065
-0,066 isofla-8
Fla-9 0,147
0,130 -0,272
-0,235 -0,367
-0,367 0,003
-0,073 -0,081
-0,030 -0,113
-0,136 -0,098
-0,072 -0,114
-0,126 -0,118
-0,069 Fla-10
Fla-11 0,130
0,130 -0,236
-0,235 -0,369
-0,368 -0,073
-0,073 -0,032
-0,029 -0,135
-0,136 -0,072
-0,073 -0,125
-0,126 -0,069
-0,070 Fla-12
Fla-13 0,089
0,091 -0,188
-0,187 -0,359
-0,359 -0,077
-0,078 -0,048
-0,048 -0,118
-0,117 -0,071
-0,070 -0,116
-0,116 -0,065
-0,065 Fla-14
Fla-15 0,090
0,172 -0,186
-0,268 -0,368
-0,369 -0,078
-0,075 -0,048
-0,049 -0,118
-0,117 -0,070
-0,071 -0,116
-0,116 -0,064
-0,066 Fla-16
Fla-17 0,172
0,171 -0,267
-0,268 -0,368
-0,369 -0,076
-0,075 -0,049
-0,066 -0,117
-0,116 -0,071
-0,072 -0,116
-0,117 -0,067
-0,049 isofla-18
isofla-19 0,147
0,147 -0,273
-0,272 -0,367
-0,366 0,003
0,002 -0,081
-0,081 -0,113
-0,113 -0,098
-0,097 -0,114
-0,114 -0,118
-0,118 isofla-20
Fla-21 0,147
0,129 -0,273
-0,230 -0,367
-0,363 0,003
-0,061 -0,081
-0,050 -0,113
-0,122 -0,098
-0,077 -0,114
-0,121 -0,118
-0,080 Fla-22
Fla-23 0,128
0,131 -0,230
-0,234 -0,363
-0,367 -0,062
-0,067 -0,050
-0,029 -0,122
-0,133 -0,076
-0,077 -0,121
-0,127 -0,080
-0,073 Fla-24
Fla-25 0,089
0,090 -0,188
-0,187 -0,360
-0,359 -0,077
-0,077 -0,048
-0,065 -0,118
-0,116 -0,071
-0,071 -0,116
-0,117 -0,065
-0,048 Fla-26
Fla-27 0,089
0,169 -0,188
-0,268 -0,360
-0,371 -0,077
-0,077 -0,065
-0,049 -0,116
-0,118 -0,071
-0,071 -0,118
-0,116 -0,048
-0,065 Fla-28
Fla-29 0,172
0,171 -0,267
-0,268 -0,368
-0,369 -0,076
-0,075 -0,049
-0,049 -0,117
-0,116 -0,071
-0,072 -0,116
-0,116 -0,067
-0,067 0,147
0,147 -0,273
-0,272 -0,367
-0,367 0,003
0,003 -0,081
-0,081 -0,113
-0,113 -0,098
-0,097 -0,114
-0,114 -0,118
-0,118 isofla-30
isofla-31 Phụ lục 2. i của 13C-NMR và 15O-NMR trên khung phân tử flavone và isoflavone 152,3 164,7 180,4 133,5 134,4 134,1 128,7 302,7 Fla-1 157,6 118,4 176,0 130,1 172,5 129,1 130,8 279,8 Fla-2 147 Fla-3 276,8 159,2 117,2 174,5 132,6 129,7 170,9 125,2 Isofla-4 285,5 174,4 121,2 183,3 134,2 129,5 171,2 125,5 Fla-5 303,7 152,2 164,6 180,3 133,1 134,6 133,9 129,0 Fla-6 279,1 159,9 115,7 178,0 129,5 172,3 133,1 131,9 Fla-7 277,0 160,2 115,9 175,3 133,1 129,3 171,4 124,8 isofla-8 315,4 176,1 119,4 184,6 131,7 130,3 174,0 126,5 Fla-9 301,6 152,6 163,8 181,1 134,2 134,3 134,4 128,5 Fla-10 306,6 152,4 165,4 180,2 134,2 134,3 134,4 128,4 Fla-11 304,5 152,7 164,2 180,3 134,3 134,1 134,4 128,3 Fla-12 277,3 160,6 114,7 178,6 129,8 171,5 133,5 131,4 Fla-13 275,3 161,3 113,5 179,9 130,2 172,1 134,2 131,4 Fla-14 292,8 159,1 117,1 173,7 128,7 172,3 128,7 131,3 Fla-15 268,5 160,1 114,9 177,7 133,0 129,4 171,8 124,7 Fla-16 281,2 161,4 114,2 175,4 132,5 129,2 171,6 124,8 Fla-17 283,4 161,9 113,3 175,4 132,2 129,3 171,8 124,9 isofla-18 287,5 175,2 120,2 183,7 134,1 128,9 171,4 125,0 isofla-19 289,8 175,6 120,0 184,1 134,1 129,0 171,8 125,1 isofla-20 291,1 176,0 119,1 184,8 134,2 128,9 172,3 124,8 Fla-21 291,0 152,4 161,2 181,7 135,1 132,8 134,9 126,9 Fla-22 291,7 152,2 162,3 181,5 135,3 132,8 135,1 126,9 Fla-23 300,4 154,5 161,5 182,8 134,9 134,0 135,9 128,1 Fla-24 276,5 160,7 114,5 178,9 130,0 171,2 133,7 131,2 Fla-25 274,5 161,5 113,3 180,1 130,4 171,7 134,4 131,2 Fla-26 279,0 163,0 111,4 180,3 130,8 171,2 135,7 130,9 Fla-27 287,3 159,2 117,4 171,6 132,6 132,2 169,6 124,7 Fla-28 279,5 161,8 113,7 176,0 133,0 128,7 171,9 124,3 Fla-29 277,8 162,3 112,4 176,9 133,2 128,6 172,4 124,1 isofla-30 286,8 175,3 120,0 183,8 134,3 128,7 171,4 124,8 isofla-31 298,7 176,5 118,7 185,3 133,6 129,0 173,0 125,1 isofla-32 291,7 175,8 119,4 184,5 133,9 129,0 172,1 125,0 a Fla-1 165,7 129,9 828,2 129,8 134,6 132,6 133,5 133,9 135,3 Fla-2 166,1 133,6 768,6 127,1 135,1 130,8 136,0 133,5 137,2 Fla-3 169,1 131,9 736,3 126,3 135,3 129,4 136,8 133,0 138,3 Isofla-4 166,7 132,0 810,1 132,4 135,6 133,7 129,9 137,8 135,8 148 Fla-5 165,5 130,2 829,7 130,1 134,3 132,8 133,4 134,2 135,3 Fla-6 167,3 129,6 759,8 124,4 137,0 127,4 138,3 131,8 140,1 Fla-7 169,8 131,0 734,4 125,1 135,9 127,9 137,8 132,4 139,7 isofla-8 169,4 130,9 768,0 138,7 136,9 132,3 118,4 143,7 135,0 Fla-9 165,7 129,3 829,3 128,4 133,4 130,7 133,1 133,2 134,8 Fla-10 166,0 129,6 806,2 128,4 133,3 130,6 133,2 133,2 135,1 Fla-11 166,1 129,2 805,0 128,2 133,4 130,4 133,2 133,0 135,1 Fla-12 167,8 128,4 759,1 123,4 137,9 126,2 139,1 131,1 141,0 Fla-13 168,0 127,7 777,3 122,3 138,7 124,9 140,2 130,5 142,2 Fla-14 167,2 134,3 697,0 126,2 134,8 128,7 136,9 133,1 139,1 Fla-15 169,6 130,6 804,7 124,6 136,6 127,1 139,0 132,3 140,4 Fla-16 170,1 130,7 734,3 123,9 136,2 125,8 139,5 132,1 141,7 Fla-17 170,5 130,7 730,4 123,3 142,8 132,0 140,2 124,8 136,0 isofla-18 167,8 131,3 789,1 134,8 134,9 134,9 126,7 140,0 134,6 isofla-19 168,0 131,1 791,2 135,5 135,0 135,0 125,7 140,7 134,5 isofla-20 168,8 130,5 786,0 137,2 134,6 135,6 123,3 142,2 133,7 Fla-21 165,4 126,8 838,3 126,7 135,2 130,1 134,0 132,1 135,4 Fla-22 165,5 126,8 836,8 126,5 135,2 130,0 134,2 132,1 135,6 Fla-23 166,9 128,1 829,6 126,2 134,0 128,5 135,3 132,1 137,2 Fla-24 168,0 128,1 759,0 123,1 138,2 125,9 139,3 130,9 141,2 Fla-25 168,2 127,4 776,6 122,1 142,4 130,3 140,3 124,6 139,0 Fla-26 169,4 126,5 754,5 120,4 144,7 129,5 141,9 122,2 139,5 Fla-27 167,2 132,7 680,5 127,0 134,0 129,3 136,3 133,6 138,5 Fla-28 170,6 130,1 734,0 123,3 136,8 125,2 139,9 131,6 142,2 Fla-29 171,0 129,6 746,7 122,3 137,0 123,8 140,9 131,2 143,4 isofla-30 168,0 131,1 787,5 135,2 134,6 135,2 126,4 140,3 134,4 isofla-31 169,3 130,3 781,4 138,5 135,1 135,1 120,8 143,5 133,6 isofla-32 168,6 130,8 784,0 136,8 134,8 135,2 123,7 141,9 134,0 tr theo sự thay đổi của cấu trúc mạng và số vòng lặp Vòng luyện(B) QESARneural R2 tr k = 6 Cấu trúc mạng(A) 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 I(6) - HL(1) - O(1) 89,96 90,03 90,16 89,31 89,79 89,05 89,97 89,00 90,52 88,95 Phụ lục 3. Giá trị R2 149 I(6) - HL(2) - O(1) 88,25 88,48 90,97 89,92 90,39 91,19 90,32 89,67 89,65 90,48 I(6) - HL(3) - O(1) 89,89 88,19 88,31 89,52 89,44 91,79 83,70 88,42 89,42 88,37 I(6) - HL(4) - O(1) 86,90 89,35 89,97 91,62 89,87 89,16 85,07 89,62 88,66 89,15 I(6) - HL(5) - O(1) 86,03 89,67 85,36 90,26 83,75 87,47 83,96 87,55 87,90 88,93 I(6) - HL(6) - O(1) 90,04 87,25 86,00 87,23 82,66 86,22 89,83 88,45 89,46 88,40 Vòng luyện(B) QESARneural k = 6 R2 tr Cấu trúc mạng(A) 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000 I(6) - HL(1) - O(1) 90,64 90,36 90,32 90,38 90,46 90,27 88,81 90,20 90,66 89,75 I(6) - HL(2) - O(1) 88,75 89,66 83,94 86,97 88,71 90,29 89,45 87,23 91,53 90,72 I(6) - HL(3) - O(1) 89,19 86,99 90,29 86,42 83,44 89,47 82,18 86,14 88,96 85,42 I(6) - HL(4) - O(1) 85,83 87,16 88,78 91,61 90,04 86,37 87,01 90,48 89,52 89,49 I(6) - HL(5) - O(1) 88,22 90,66 84,10 87,47 82,30 88,03 85,63 86,05 85,65 89,83 I(6) - HL(6) - O(1) 83,80 86,60 88,48 88,52 85,37 87,70 81,51 89,58 90,30 89,92 150 Phụ lục 4. Hoạt tính pGI50 ức chế phát triển tế bào của dẫn xuất flavone và Thứ tự Hợp chất Vị trí thế Nhóm thế pGI50 Nhóm chất luyện (a) flavone fla-1a 5,699 C3-R2 -OCH2CCH3=NOH flavone fla-2a 5,699 C7-R1 -OCH2CCH3=NOH isofla-3a isoflavone 5,009 C7-R1 -OCH2CCH3=NOH flavone fla-4a 5,699 C3-R2 -OCH2CCH3=NOCH3 flavone fla-5a 6,046 C3-R2 -OCH2CCH3=NOCH3 flavone fla-6a 5,658 C7-R1 -OCH2CCH3=NOCH3 isofla-7a isoflavone 5,071 C7-R1 -OCH2CCH3=NOCH3 flavone fla-8a 5,678 C3-R2 -OCH2C(4-F-C6H4)=NOH flavone fla-9a 5,699 C3-R2 -OCH2C(4-CH3O-C6H4)=NOH flavone fla-10a 5,796 C6-R1 -OCH2C(4-F-C6H4)=NOH flavone fla-11a 6,000 C6-R1 -OCH2C(4-CH3O-C6H4)=NOH flavone fla-12a 5,699 C7-R1 -OCH2C(4-CH3O-C6H4)=NOH isofla-13a isoflavone 5,046 C7-R1 -OCH2C(C6H5)=NOH isofla-14a isoflavone 5,108 C7-R1 -OCH2C(4-F-C6H4)=NOH isofla-15a isoflavone 5,119 C7-R1 -OCH2C(4-CH3O-C6H4)=NOH flavone fla-16a 5,796 C3-R2 -OCH2C(C6H5)=NOCH3 flavone fla-17a 5,699 C3-R2 -OCH2C(4-F-C6H4)=NOCH3 flavone fla-18a 5,699 C3-R2 -OCH2C(4-CH3O-C6H4)=NOCH3 flavone fla-19a 5,620 C6-R1 -OCH2C(C6H5)=NOCH3 flavone fla-20a 5,638 C6-R1 -OCH2C(4-F-C6H4)=NOCH3 flavone fla-21a 5,699 C6-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 flavone fla-22a 5,180 C7-R1 -OCH2C(C6H5)=NOCH3 flavone fla-23a 5,569 C7-R1 -OCH2C(4-F-C6H4)=NOCH3 flavone fla-24a 5,602 C7-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 isofla-25a isoflavone 5,086 C7-R1 -OCH2C(C6H5)=NOCH3 isofla-26a isoflavone 5,194 C7-R1 -OCH2C(4-F-C6H4)=NOCH3 Nhóm chất kiểm tra (b) fla-1b flavone 5,921 C6-R1 -OCH2CCH3=NOH fla-2b flavone 5,745 C3-R2 -OCH2CC6H5=NOH isoflavone 151 fla-3b flavone 6,097 C6-R1 -OCH2CC6H5=NOH fla-4b flavone 5,699 C7-R1 -OCH2CC6H5=NOH fla-5b flavone 5,699 C7-R1 -OCH2C(4-F-C6H4)=NOH 5,137 isofla-6b isoflavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 152 k = 5 k = 6 k = 7 GIÁ TRỊ Hệ số Hệ số Hệ số P Pvalue Pvalue hằng số -0,933 0,6875 6,712 0,01067 4,714 0,003568 -101,21 0,0002 -42,31 0,0009 Phụ lục 5. Giá trị thống kê của mô hình QESARlinear (với k = 5, 6, 7) biến số -15,43 0,0019 C2 3,014 0,00771 0,0088 -19,04 0,00979 -60,07 0,000001 -6,874 -7,969 0,00002 0,00004 20,88 0,000002 6,612 4,604 0,00067 16,9 0,000499 95,42 0,000017 -8,159 0,03877 -32,8 0,000077 -24,47 0,000396 -16,12 0,0218 -25,42 0,000141 153 pGI50 Cấu trúc phân tử 5,699 Nhóm thế
1a: R=OH, R1 = Me 5,745 2(a1): R= OH, R1 = C6H5 5,678 3: R= OH, R1 = p-F- C6H4 5,699 4: R= OH, R1 = p-OMe- C6H4 5,699 5(a2): R= Me, R1 = Me 5,796 6(a3): R= Me, R1 = C6H5 5,699 7: R= Me, R1 = p-F- C6H4 5,699 8: R= Me, R1 = p-OMe- C6H4 5,921 9(a4): R=OH, R2 = Me 6,097 10: R= OH, R2 = C6H5 5,796 11: R= OH, R2 = p-F- C6H4 6,000 12: R= OH, R2 = p-OMe- C6H4 6,046 13: R= Me, R2 = Me 5,62 14: R= Me, R2 = C6H5 5,638 15: R= Me, R2 = p-F- C6H4 5,699 16: R= Me, R2 = p-OMe- C6H4 5,699 17: R=OH, R3 = Me 5,699 18: R= OH, R3 = C6H5 5,699 19: R= OH, R3 = p-F- C6H4 5,699 20(a5): R= OH, R3 = p-OMe- C6H4 5,658 21(a6): R= Me, R3 = Me 5,181 22: R= Me, R3 = C6H5 5,569 23: R= Me, R3 = p-F- C6H4 5,602 24: R= Me, R3 = p-OMe- C6H4 5,009 25: R=OH, R3 = Me 5,046 26: R= OH, R3 = C6H5 5,108 27: R= OH, R3 = p-F- C6H4 5,119 28: R= OH, R3 = p-OMe- C6H4 5,071 29: R= Me, R3 = Me 5,086 30: R= Me, R3 = C6H5 5,194 31: R= Me, R3 = p-F- C6H4 5,137 32: R= Me, R3 = p-OMe- C6H4 Phụ lục 6. Giá trị thực nghiệm pGI50 và cấu trúc của flavone và isoflavone 154 Biến số P QSDARlinear k = 7 k = 5 k = 6 k = 7 k = 5 k = 6 xk Hệ số 14,4590 37,0550 32,9900 0,0000 0,0002 0,0005 0,0000 0,0140 0,0160 0,9907 0,0858 0,0177 O1 0,0040 0,0080 0,0060 0,2083 0,0204 0,0052 O11 - - -0,0450 - 0,0002 - C2 - -0,0580 -0,0630 0,0106 0,0002 - C3 -0,0680 -0,0780 - 0,0275 0,0054 - C4 0,0060 -0,0590 -0,0470 0,4354 0,0235 0,0351 C6 -0,0050 -0,0750 -0,0590 0,5294 0,0086 0,0175 C7 - - -0,0370 - - 0,0306 C2' Phụ lục 7. Giá trị thống kê của mô hình QSDARlinear (với k = 5, 6, 7) biến số 155 Hợp chất Phụ lục 8. Điện tích nguyên tử của 10 dẫn xuất thiết kế từ mô hình QESAR fla-1c -0,094 0,184 -0,325 0,358 -0,091 0,055 -0,069 -0,114 fla-2c -0,095 0,189 -0,333 0,360 -0,091 0,056 -0,069 -0,114 fla-3c -0,095 0,181 -0,324 0,358 -0,091 0,062 -0,075 -0,115 fla-4c -0,095 0,185 -0,326 0,357 -0,101 0,084 -0,076 -0,111 fla-5c -0,096 0,180 -0,321 0,356 -0,101 0,084 -0,077 -0,111 isofla-7c -0,073 0,087 -0,193 0,368 -0,090 0,058 -0,068 -0,110 isofla-8c -0,074 0,079 -0,187 0,365 -0,089 0,057 -0,068 -0,111 isofla-9c -0,074 0,086 -0,194 0,367 -0,090 0,064 -0,074 -0,111 isofla-10c -0,074 0,086 -0,192 0,368 -0,099 0,085 -0,074 -0,106 isofla-11c -0,075 0,084 -0,189 0,366 -0,098 0,085 -0,075 -0,107 fla-1c 0,095 -0,188 -0,367 -0,036 -0,098 0,121 -0,181 -0,069 -0,110 fla-2c 0,095 -0,187 -0,370 -0,080 -0,047 -0,118 -0,069 -0,116 -0,063 fla-3c 0,091 -0,187 -0,365 -0,034 -0,098 0,121 -0,182 -0,069 -0,111 fla-4c 0,089 -0,181 -0,364 -0,039 -0,098 0,100 -0,165 -0,076 -0,107 fla-5c 0,089 -0,181 -0,360 -0,036 -0,092 0,092 -0,170 -0,076 -0,106 isofla-7c 0,069 -0,192 -0,371 0,050 -0,189 0,121 -0,140 -0,071 -0,164 isofla-8c 0,069 -0,192 -0,367 0,005 -0,084 -0,113 -0,098 -0,112 -0,119 isofla-9c 0,065 -0,191 -0,369 0,051 -0,189 0,121 -0,141 -0,072 -0,165 isofla-10c 0,064 -0,187 -0,372 0,043 -0,182 0,094 -0,132 -0,075 -0,159 isofla-11c 0,064 -0,187 -0,367 0,043 -0,182 0,101 -0,138 -0,076 -0,161 156 Phụ lục 9. i của 13C-NMR và 15O-NMR 12 dẫn xuất thiết kế từ mô hình QSDAR 1b 268,4 156,7 119,5 177,1 132,5 170,4 129,3 128,3 2b 268,7 156,9 119,4 177,4 132,7 170,9 129,4 128,5 3b 273,9 157,4 119,4 176,7 132,5 171,3 129,3 128,8 4b 264,7 155,8 120,0 176,7 135,8 132,7 134,9 127,1 5b 265,2 155,8 120,1 176,9 136,0 132,5 135,2 127,1 6b 265,5 155,6 120,1 176,9 136,1 132,4 135,3 127,0 1b 166,6 131,4 769,4 127,5 135,7 133,1 133,8 133,4 134,7 2b 166,6 131,5 770,8 127,5 136,0 133,0 133,9 133,5 134,8 3b 166,7 131,7 753,5 127,5 136,0 132,8 134,0 133,4 135,0 4b 168,5 129,1 762,4 129,6 131,0 171,9 130,1 136,4 134,1 5b 168,7 129,2 763,2 129,8 131,1 172,5 130,2 136,7 134,2 6b 168,8 129,1 765,0 129,9 131,0 173,0 130,1 136,9 134,4 7b 281,9 173,2 120,9 184,4 133,9 170,4 129,4 128,5 8b 282,2 173,5 120,8 184,6 134,0 170,9 129,5 128,8 9b 286,9 173,7 120,9 184,5 133,8 171,4 129,4 129,0 10b 281,0 172,8 121,0 182,6 136,6 132,7 134,7 127,7 11b 281,3 172,8 121,1 182,6 136,7 132,8 134,7 127,7 12b 282,2 172,9 121,1 182,5 136,7 132,8 134,7 127,7 7b 164,0 131,9 829,2 130,9 133,7 134,5 132,6 135,6 135,5 8b 164,0 132,0 831,0 131,2 133,6 134,9 132,3 135,9 135,4 9b 164,0 132,1 826,9 131,2 133,5 135,0 132,3 136,0 135,5 10b 165,6 129,4 795,6 134,3 131,0 173,2 127,5 135,7 135,3 11b 165,7 129,5 794,2 134,5 131,1 173,8 127,6 135,9 135,4 12b 165,8 129,5 790,5 134,6 131,0 174,4 127,6 136,0 135,5 157 x0 x1 x2 xp3 xp4 xp5 xp6 xp7 pGI50 9,6278
9,7420 7,9232
8,2254 6,7154 5,6544 3,9683 3,0036
9,6198
5,6990 16,2338 11,2027
8,3885
6,4631 5,5899 3,7583 2,8146
9,8006
5,9210 16,2338 11,1690
8,2488
6,5192 5,4483 3,8584 2,8334
9,8006
5,6990 16,2338 11,1690
8,2419
6,6096 5,4563 3,7446 2,7668
9,6922
5,0090 16,2338 11,1859
8,3913
7,1484 5,7643 4,0118 3,0428
5,6990 16,9409 11,7027 10,0002
8,4730
6,8961 5,6998 3,7928 2,9011
6,0460 16,9409 11,6690 10,1811
8,3333
6,9522 5,5581 3,8929 2,9199
5,6580 16,9409 11,6690 10,1811
8,3265
7,0426 5,5661 3,7791 2,8533
8,4758
5,0710 16,9409 11,6859 10,0726
8,8196 7,2239 4,7433 3,6955
5,7450 19,3467 13,7752 11,6728 10,4104
8,9713 7,4480 5,0651 3,8478
5,6780 20,2170 14,1690 12,2946 10,8211
9,2819 7,5583 5,2393 4,0901
5,6990 20,9241 14,7070 12,4637 11,2293
8,5672 7,1412 4,6211 3,4566
6,0970 19,3467 13,7415 11,8536 10,2707
8,7189 7,3652 4,9428 3,6089
5,7960 20,2170 14,1354 12,4755 10,6814
9,0295 7,4755 5,1171 3,8512
6,0000 20,9241 14,6734 12,6446 11,0896
8,6234 6,9995 4,7212 3,4717
5,6990 19,3467 13,7415 11,8536 10,2638
8,7751 7,2235 5,0429 3,6240
5,6990 20,2170 14,1354 12,4755 10,6745
9,0857 7,3338 5,2171 3,8663
5,6990 20,9241 14,6734 12,6446 11,0828
8,7137 7,0075 4,6074 3,4051
5,0460 19,3467 13,7584 11,7452 10,4132
8,8654 7,2315 4,9291 3,5574
5,1080 20,2170 14,1522 12,3671 10,8239
9,1760 7,3418 5,1033 3,7997
5,1190 20,9241 14,6902 12,5362 11,2322
9,0329 7,5004 4,9047 3,8180
5,7960 20,0538 14,2752 12,0532 10,5455
9,1846 7,7244 5,2354 3,9152
5,6990 20,9241 14,6690 12,6751 10,9562
9,4952 7,8347 5,4096 4,1691
5,6990 21,6312 15,2070 12,8442 11,3644
8,5672 7,1412 4,6211 3,4566
5,6200 19,3467 13,7415 11,8536 10,2707
8,9323 7,6417 5,1042 3,7236
5,6380 20,9241 14,6354 12,8559 10,8165
9,2429 7,7520 5,2784 3,9775
5,6990 21,6312 15,1734 13,0250 11,2247
8,8368 7,2760 4,8735 3,6415
5,1800 20,0538 14,2415 12,2341 10,3989
8,9885 7,5000 5,2042 3,7387
5,5690 20,9241 14,6354 12,8559 10,8096
9,2991 7,6103 5,3784 3,9926
5,6020 21,6312 15,1734 13,0250 11,2179
8,9271 7,2840 4,7597 3,5749
5,0860 20,0538 14,2584 12,1256 10,5483
9,0788 7,5080 5,0904 3,6721
5,1940 20,9241 14,6522 12,7475 10,9590
5,1370 21,6312 15,1902 12,9166 11,3672
9,3894 7,6183 5,2647 3,9260
5,3260 23,1540 15,1888 14,3658 12,6969 10,2554 7,9789 6,0359 4,1744
6,8274 5,1656 3,9721 2,4808
5,2980 15,1459
9,9524
4,8130 15,8530 10,5072
7,3578 5,6141 4,2904 2,7435
4,4100 27,0158 17,4553 16,9885 13,1777 11,7282 9,7847 7,0298 5,2259
7,1320 5,5473 4,1134 2,8022
5,3790 16,0161 10,3799 10,0368
8,6116
9,4219 7,6571 5,4352 3,8552
5,1030 21,4135 14,3842 13,2004 11,9491 HC
fla1
fla2
fla3
fla4
fla5
fla6
fla7
fla8
fla9
fla10
fla11
fla12
fla13
fla14
fla15
fla16
fla17
fla18
fla19
fla20
fla21
fla22
fla23
fla24
fla25
fla26
fla27
fla28
fla29
fla30
fla31
fla32
CYNA
LUTE
KEM1
KAEM2
QUER
DAID Phụ lục 10a. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 158 xc3 xv2 xv0 xp9 xch6 xpc4 xp10 xp8
2,1333 1,4731 0,8540 1,2227 3,2999 0,2308 12,5224
2,0930 1,5239 0,9367 1,3646 3,1692 0,2257 12,5224
2,0555 1,5682 0,9388 1,3646 3,1652 0,2257 12,5224
2,0689 1,4976 0,9326 1,2907 3,2783 0,2257 12,5224
2,2318 1,5306 0,9152 1,2227 3,2154 0,2308 13,4835
2,1424 1,5491 1,0067 1,3646 3,0846 0,2257 13,4835
2,1031 1,6083 0,9683 1,3646 3,0807 0,2257 13,4835
2,1166 1,5364 0,9699 1,2907 3,1937 0,2257 13,4835
2,6400 1,8728 1,2234 1,2674 3,7987 0,3328 14,9092
2,6462 1,8999 1,2792 1,5560 4,2070 0,3141 15,2098
2,7942 1,9204 1,2976 1,4715 4,2915 0,3141 16,2401
2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092
2,4954 1,9147 1,2585 1,6979 4,0763 0,3090 15,2098
2,6434 1,9310 1,2993 1,6134 4,1608 0,3090 16,2401
2,4836 1,8432 1,2829 1,4092 3,6640 0,3277 14,9092
2,4865 1,8917 1,3063 1,6979 4,0723 0,3090 15,2098
2,6345 1,9080 1,3471 1,6134 4,1568 0,3090 16,2401
2,4944 1,7872 1,2585 1,3354 3,7771 0,3277 14,9092
2,4974 1,8357 1,2819 1,6241 4,1854 0,3090 15,2098
2,6454 1,8520 1,3227 1,5395 4,2699 0,3090 16,2401
2,7974 1,9892 1,2846 1,2674 3,7499 0,3328 15,8702
2,8890 2,0055 1,3404 1,5560 4,1582 0,3141 16,1708
2,9807 2,0940 1,3589 1,4715 4,2427 0,3141 17,2011
2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092
2,6892 1,9880 1,3286 1,6979 4,0275 0,3090 16,1708
2,7809 2,0723 1,3693 1,6134 4,1120 0,3090 17,2011
2,5901 1,9422 1,3123 1,4092 3,6152 0,3277 15,8702
2,6785 1,9798 1,3358 1,6979 4,0235 0,3090 16,1708
2,7701 2,0642 1,3766 1,6134 4,1080 0,3090 17,2011
2,6009 1,8849 1,2957 1,3354 3,7283 0,3277 15,8702
2,6893 1,9226 1,3192 1,6241 4,1366 0,3090 16,1708
2,7809 2,0069 1,3600 1,5395 4,2211 0,3090 17,2011
3,0496 2,3056 1,6305 2,6687 6,8166 0,2245 16,3214
1,8085 1,2382 0,7968 1,8426 4,0566 0,1792 10,5695
2,1192 1,1889 0,8336 1,7221 3,9473 0,1842 11,5305 xv1
HC
7,1204 5,0756
fla1
7,1084 5,1228
fla2
7,1084 5,1228
fla3
7,1013 5,1264
fla4
7,5112 5,2494
fla5
7,4992 5,2967
fla6
7,4992 5,2967
fla7
7,4921 5,3003
fla8
8,7810 6,1530
fla9
8,8807 6,2939
fla10
9,3041 6,5155
fla11
8,7691 6,2003
fla12
8,8687 6,3412
fla13
9,2921 6,5628
fla14
8,7691 6,2003
fla15
8,8687 6,3412
fla16
9,2921 6,5628
fla17
8,7620 6,2039
fla18
8,8617 6,3448
fla19
9,2850 6,5664
fla20
9,1719 6,3269
fla21
9,2715 6,4677
fla22
9,6949 6,6894
fla23
8,7691 6,2003
fla24
9,2596 6,5150
fla25
9,6830 6,7366
fla26
9,1599 6,3741
fla27
9,2596 6,5150
fla28
9,6830 6,7366
fla29
9,1528 6,3777
fla30
9,2525 6,5186
fla31
9,6759 6,7402
fla32
9,4969 7,3091
CYNA
5,9769 4,5164
LUTE
KEM1
6,3716 4,6785
KAEM2 3,9464 2,8367 2,0685 3,4056 6,7122 0,2296 19,9057 11,1273 8,4405
6,1231 4,6504
QUER
9,2093 6,9985
DAID 1,8037 1,2351 0,7568 1,9612 4,7464 0,1690 10,9393
2,7521 2,0727 1,4683 2,2014 5,9070 0,2523 15,5817 Phụ lục 10b. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 159 xvp8 xvp9 xvp5 xvp4 xvp6 xvp10 xvc3 xvp3
xvp7
HC
3,3882 2,2411 1,5731 0,8571 0,5334 0,3141 0,1764 0,0828 0,5256
fla1
3,3753 2,1865 1,5451 0,8145 0,5032 0,3040 0,1775 0,0900 0,5584
fla2
3,3774 2,1865 1,5252 0,8257 0,5048 0,2996 0,1841 0,0878 0,5584
fla3
3,4493 2,2320 1,5444 0,8206 0,5046 0,3045 0,1788 0,0886 0,5638
fla4
3,4647 2,3944 1,5982 0,8690 0,5454 0,3252 0,1845 0,0888 0,5256
fla5
3,4517 2,3398 1,5702 0,8262 0,5177 0,3116 0,1830 0,0955 0,5584
fla6
3,4538 2,3398 1,5503 0,8375 0,5192 0,3072 0,1892 0,0923 0,5584
fla7
3,5257 2,3854 1,5695 0,8323 0,5190 0,3122 0,1840 0,0934 0,5638
fla8
4,3731 2,9766 2,0192 1,0333 0,6496 0,3836 0,2268 0,1220 0,5299
fla9
4,4435 2,9883 2,0390 1,0714 0,6545 0,3831 0,2280 0,1233 0,5929
fla10
4,6893 3,1295 2,1124 1,1493 0,7177 0,4001 0,2333 0,1286 0,5980
fla11
4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627
fla12
4,4306 2,9338 2,0054 1,0456 0,6235 0,3611 0,2226 0,1226 0,6257
fla13
4,6764 3,0749 2,0788 1,1235 0,6867 0,3781 0,2280 0,1285 0,6308
fla14
4,3622 2,9220 1,9657 1,0187 0,6211 0,3584 0,2203 0,1236 0,5627
fla15
4,4327 2,9338 1,9854 1,0568 0,6260 0,3576 0,2225 0,1242 0,6257
fla16
4,6785 3,0749 2,0589 1,1347 0,6892 0,3746 0,2278 0,1301 0,6308
fla17
4,4341 2,9676 1,9849 1,0135 0,6209 0,3630 0,2169 0,1220 0,5681
fla18
4,5046 2,9793 2,0047 1,0517 0,6258 0,3622 0,2191 0,1227 0,6311
fla19
4,7504 3,1204 2,0782 1,1296 0,6890 0,3792 0,2244 0,1286 0,6361
fla20
4,4539 3,0793 2,0941 1,0739 0,6782 0,4043 0,2408 0,1280 0,5299
fla21
4,5243 3,0910 2,1138 1,1123 0,6803 0,4083 0,2411 0,1293 0,5929
fla22
4,7701 3,2321 2,1873 1,1902 0,7435 0,4251 0,2526 0,1346 0,5980
fla23
4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627
fla24
4,5114 3,0364 2,0803 1,0863 0,6517 0,3828 0,2332 0,1280 0,6257
fla25
4,7572 3,1775 2,1537 1,1642 0,7149 0,3997 0,2447 0,1339 0,6308
fla26
4,4430 3,0247 2,0406 1,0592 0,6521 0,3756 0,2313 0,1282 0,5627
fla27
4,5134 3,0364 2,0603 1,0975 0,6543 0,3793 0,2327 0,1288 0,6257
fla28
4,7592 3,1776 2,1338 1,1754 0,7174 0,3962 0,2443 0,1347 0,6308
fla29
4,5149 3,0702 2,0598 1,0540 0,6519 0,3802 0,2279 0,1268 0,5681
fla30
4,5853 3,0819 2,0796 1,0924 0,6541 0,3839 0,2293 0,1275 0,6311
fla31
4,8311 3,2231 2,1531 1,1703 0,7172 0,4008 0,2409 0,1333 0,6361
fla32
5,1440 3,4293 2,2712 1,2881 0,7165 0,4256 0,2635 0,1528 0,9943
CYNA
3,0546 2,0729 1,3590 0,7590 0,4060 0,2333 0,1339 0,0658 0,5908
LUTE
KEM1
3,2513 2,2565 1,5076 0,8475 0,4610 0,2753 0,1388 0,0688 0,5715
KAEM2 5,6381 4,0553 2,8046 1,5742 0,9481 0,5703 0,3428 0,1953 1,1730
3,1730 2,1355 1,4097 0,7736 0,4248 0,2324 0,1299 0,0627 0,6309
QUER
5,0251 3,3211 2,2474 1,2284 0,6947 0,4105 0,2528 0,1458 0,8902
DAID Phụ lục 10c. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 160 xvpc4 ABSQ ABSQon Dipole MaxHp MaxNeg MaxQp Ovality
1,5982
0,9734
1,7309
0,9603
1,6777
0,9613
1,7187
1,0363
1,6329
0,9672
1,7660
0,9541
1,7245
0,9551
1,7569
1,0301
1,6482
1,1895
1,6533
1,2622
1,7029
1,3361
1,7439
1,1763
1,7545
1,2491
1,7948
1,3229
1,7422
1,1774
1,7375
1,2501
1,7706
1,3240
1,7182
1,2524
1,7313
1,3251
1,7957
1,3990
1,6917
1,1864
1,7002
1,2591
1,6970
1,3330
1,7439
1,1763
1,7953
1,2460
1,8383
1,3199
1,7364
1,1743
1,7388
1,2470
1,8159
1,3209
1,7774
1,2493
1,7866
1,3220
1,8398
1,3959
1,8285
1,9313
1,5373
1,0655
1,5684
1,1015
1,8540
2,0875
1,5559
1,1726
1,7843
1,8112 6,1796
8,0858
5,9397
5,6574
5,2716
7,1274
4,4376
4,3371
5,4187
7,2526
8,0366
6,0955
8,0687
8,3968
3,1659
3,9789
4,8887
3,2984
4,5294
5,3592
4,1934
6,2547
5,9079
6,0955
7,6373
7,9833
3,0914
4,5067
5,0137
2,5971
4,6180
5,0940
3,1683
1,3426
4,3692
12,5381
5,9484
1,1196 -0,3921
-0,4050
-0,4050
-0,4043
-0,3921
-0,4050
-0,4050
-0,4043
-0,3921
-0,3921
-0,3921
-0,4050
-0,4050
-0,4050
-0,4050
-0,4050
-0,4050
-0,4043
-0,4043
-0,4043
-0,3921
-0,3921
-0,3921
-0,4050
-0,4050
-0,4050
-0,4050
-0,4050
-0,4050
-0,4043
-0,4043
-0,4043
-0,4034
-0,4034
-0,3933
-0,4045
-0,3890
-0,4042 1,4790
1,5376
1,5375
1,5445
1,4642
1,5227
1,5226
1,5296
1,4729
1,4717
1,8530
1,5314
1,5303
1,9119
1,5313
1,5302
1,9118
1,5383
1,5372
1,9188
1,4580
1,4569
1,8381
1,5314
1,5155
1,8971
1,5165
1,5154
1,8970
1,5234
1,5223
1,9039
4,0815
2,2335
2,1548
4,1640
2,5479
3,3528 3,8385
3,7043
3,7278
3,7314
3,8088
3,6745
3,6981
3,7016
4,3686
4,5444
4,7856
4,2340
4,4099
4,6508
4,2576
4,4335
4,6744
4,2611
4,4370
4,6779
4,3389
4,5147
4,7559
4,2340
4,3802
4,6210
4,2279
4,4038
4,6446
4,2314
4,4073
4,6482
8,2271
4,5338
4,5913
8,2078
5,1736
6,9913 0,2193
0,2193
0,2193
0,2193
0,1955
0,1603
0,1602
0,1675
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,1955
0,1955
0,1955
0,2194
0,1603
0,1603
0,1602
0,1602
0,1602
0,1675
0,1675
0,1675
0,2101
0,1755
0,2102
0,2440
0,2086
0,2101 0,2193
0,2193
0,2193
0,2193
0,0717
0,1094
0,1094
0,1023
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,2194
0,0717
0,0717
0,0727
0,2194
0,1094
0,1094
0,1094
0,1094
0,1094
0,1023
0,1023
0,1023
0,2101
0,1755
0,1776
0,2100
0,1973
0,2101 HC
fla1
fla2
fla3
fla4
fla5
fla6
fla7
fla8
fla9
fla10
fla11
fla12
fla13
fla14
fla15
fla16
fla17
fla18
fla19
fla20
fla21
fla22
fla23
fla24
fla25
fla26
fla27
fla28
fla29
fla30
fla31
fla32
CYNA
LUTE
KEM1
KAEM2
QUER
DAID Phụ lục 10d. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 161 Polarizability SpcPolarizability Surface xvch6 SdsCH SaaCH 5,8050
5,8050
5,8050
5,8050
6,5790
6,5790
6,5790
6,5790
6,5790
6,4880
7,3530
6,5790
6,4880
7,3530
6,5790
6,4880
7,3530
6,5790
6,4880
7,3530
7,3530
7,2620
8,1270
6,5790
7,2620
8,1270
7,3530
7,2620
8,1270
7,3530
7,2620
8,1270
7,7400
3,8700
4,6440
9,2880
3,8700
7,7400 Volume
0,0205 333,3331 283,2407 0,0726 0,0000
0,0193 376,0768 301,1595 0,0709 1,4741
0,0204 350,5764 284,0417 0,0709 1,4869
0,0195 370,6593 297,7988 0,0709 1,4625
0,0221 351,5565 297,0492 0,0726 0,0000
0,0206 398,7162 318,9987 0,0709 1,4991
0,0218 375,2085 301,7779 0,0709 1,5075
0,0209 393,3637 315,0381 0,0709 1,4875
0,0208 369,4536 315,5677 0,1047 0,0000
0,0203 373,5784 319,3890 0,1004 0,0000
0,0223 392,7971 329,4254 0,1004 0,0000
0,0215 382,5937 305,5504 0,1029 1,4782
0,0209 388,9135 310,3409 0,0986 1,4450
0,0223 414,4890 329,9914 0,0986 1,4716
0,0195 408,6353 337,7878 0,1029 1,4902
0,0196 401,6805 330,5313 0,0986 1,4616
0,0234 396,2264 314,7684 0,0986 1,4845
0,0214 378,1292 306,9938 0,1029 1,4666
0,0208 385,0502 311,8765 0,0986 1,4334
0,0223 414,3353 329,5624 0,0986 1,4601
0,0211 405,2733 348,6615 0,1047 0,0000
0,0206 410,7555 353,1085 0,1004 0,0000
0,0246 392,5103 330,7671 0,1004 0,0000
0,0215 382,5937 305,5504 0,1029 1,4782
0,0220 414,1577 329,4795 0,0986 1,4700
0,0233 440,1802 348,4047 0,0986 1,4966
0,0240 381,7659 306,5485 0,1029 1,5109
0,0212 411,7310 342,6333 0,0986 1,4822
0,0244 421,6354 332,6838 0,0986 1,5052
0,0225 407,4250 326,3386 0,1029 1,4916
0,0219 413,4352 331,0153 0,0986 1,4584
0,0233 440,4050 348,2668 0,0986 1,4851
0,0211 453,6429 367,4498 0,0858 1,1032
0,0186 261,0753 208,1012 0,0596 1,1577
0,0202 284,5858 229,8373 0,0614 0,0000
0,0224 498,6732 414,7864 0,0876 0,0000
0,0179 271,2661 216,4776 0,0576 0,0000
0,0243 402,8370 318,9727 0,0928 1,3003 16,2847
14,4994
14,4439
14,4005
16,5186
14,7067
14,6621
14,6078
25,4665
21,4513
23,2599
23,7859
19,8044
21,5743
23,7547
19,7569
21,5373
23,7053
19,7211
21,4910
26,0903
22,0241
23,8327
23,7859
20,3506
22,1205
24,3628
20,3139
22,0943
24,3025
20,2673
22,0372
6,1253
6,2125
8,2974
7,5773
5,6409
10,5331 HC
fla1
fla2
fla3
fla4
fla5
fla6
fla7
fla8
fla9
fla10
fla11
fla12
fla13
fla14
fla15
fla16
fla17
fla18
fla19
fla20
fla21
fla22
fla23
fla24
fla25
fla26
fla27
fla28
fla29
fla30
fla31
fla32
CYNA
LUTE
KEM1
KAEM2
QUER
DAID Phụ lục 10e. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 162 SdssC SaasC k2 k1 k3 k0 ka1 0,5750
0,8330
0,8497
0,8871
0,9862
1,1359
1,1511
1,1847
0,4675
0,1135
0,3684
0,7661
0,5319
0,7009
0,7832
0,5503
0,7184
0,8222
0,5941
0,7587
0,8787
0,5247
0,7796
0,7661
0,8347
1,0037
1,0847
0,8517
1,0198
1,1198
0,8917
1,0563
-0,5621
-0,3573
-0,4782
-3,0291
-1,9188
0,0476 1,6814
2,3045
2,3120
2,2976
1,7789
2,4450
2,4555
2,4381
2,3437
1,5631
2,9209
3,0072
2,1990
3,5928
3,0189
2,2093
3,6058
3,0068
2,2017
3,5954
2,5840
1,8493
3,2070
3,0072
2,5283
3,9221
3,3053
2,5415
3,9380
3,2902
2,5309
3,9247
-1,3488
-0,9230
-0,0737
-1,2350
-1,9610
1,3775 SdO
12,7361 30,1156 17,8112
8,3927 4,1588 15,3016
12,3401 30,1156 17,8112
8,3927 4,5455 15,3016
12,2436 30,1156 17,8112
8,3927 4,5455 15,3016
12,5996 30,1156 17,8112
8,3927 4,3457 15,3016
12,8369 31,9209 18,7811
9,0873 4,6012 16,2646
12,4064 31,9209 18,7811
9,0873 5,0193 16,2646
12,2990 31,9209 18,7811
9,0873 5,0193 16,2646
9,0873 4,8034 16,2646
12,6550 31,9209 18,7811
13,0726 38,1122 21,2404 10,3469 5,0238 18,0053
13,0677 40,0013 22,2031 10,5434 5,2578 18,8922
13,1396 41,9054 23,1680 11,2277 5,5068 19,8774
12,5616 38,1122 21,2404 10,3469 5,3890 18,0053
12,5580 40,0013 22,2031 10,5434 5,6266 18,8922
12,6101 41,9054 23,1680 11,2277 5,8800 19,8774
12,4286 38,1122 21,2404 10,3469 5,3890 18,0053
12,4255 40,0013 22,2031 10,5434 5,6266 18,8922
12,4706 41,9054 23,1680 11,2277 5,8800 19,8774
12,7846 38,1122 21,2404 10,3469 5,2016 18,0053
12,7815 40,0013 22,2031 10,5434 5,4375 18,8922
12,8267 41,9054 23,1680 11,2277 5,6888 19,8774
13,1734 40,0013 22,2031 11,0395 5,4375 18,9590
13,1685 41,9054 23,1680 11,2277 5,6888 19,8487
13,2404 43,8240 24,1349 11,9234 5,9259 20,8367
12,5616 38,1122 21,2404 10,3469 5,3890 18,0053
12,6243 41,9054 23,1680 11,2277 6,0810 19,8487
12,6764 43,8240 24,1349 11,9234 6,3209 20,8367
12,4840 40,0013 22,2031 11,0395 5,8258 18,9590
12,4809 41,9054 23,1680 11,2277 6,0810 19,8487
12,5260 43,8240 24,1349 11,9234 6,3209 20,8367
12,8400 40,0013 22,2031 11,0395 5,6266 18,9590
12,8369 41,9054 23,1680 11,2277 5,8800 19,8487
12,8821 43,8240 24,1349 11,9234 6,1186 20,8367
12,5338 48,1648 25,1037 10,3180 5,1775 22,6371
6,2457 3,2000 13,6247
12,0433 27,7666 15,8790
12,4767 28,3292 16,8438
6,8571 3,2986 14,5816
36,8317 56,8193 29,9700 12,6688 6,8402 26,8807
6,4815 3,1653 14,5432
12,1429 29,5333 16,8438
9,8681 4,8595 20,7887
12,8115 43,1095 23,1680 HC
fla1
fla2
fla3
fla4
fla5
fla6
fla7
fla8
fla9
fla10
fla11
fla12
fla13
fla14
fla15
fla16
fla17
fla18
fla19
fla20
fla21
fla22
fla23
fla24
fla25
fla26
fla27
fla28
fla29
fla30
fla31
fla32
CYNA
LUTE
KEM1
KAEM2
QUER
DAID Phụ lục 10f. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 163 ka2 ka3 Hother Hmax Gmax Hmin 2,6945
2,6663
2,6681
2,6655
1,4629
1,6012
1,6105
1,6349
2,7803
2,8069
2,8015
2,7521
2,7787
2,7733
2,7539
2,7805
2,7751
2,7514
2,7779
2,7726
1,4906
1,5168
1,5001
2,7521
1,6507
1,6473
1,6554
1,6724
1,6691
1,6576
1,6676
1,6657
2,8630
2,7601
2,7856
2,8841
2,8701
2,7582 12,7361
12,3401
12,2436
12,5996
12,8369
12,4064
12,2990
12,6550
13,0726
13,1594
13,1396
12,5616
13,0557
12,6101
12,4286
13,0715
12,4706
12,7846
13,0530
12,8267
13,1734
13,2725
13,2404
12,5616
13,1688
12,6764
12,4840
13,1846
12,5260
12,8400
13,1661
12,8821
12,5338
12,0433
12,4767
13,5259
12,1429
12,8115 0,7651
0,7261
0,7284
0,7251
0,7731
0,7341
0,7364
0,7331
1,2384
1,2698
0,7720
1,2105
1,2284
0,7618
1,2148
1,2351
0,7625
1,2091
1,2298
0,7614
0,8496
0,8706
0,7740
1,2105
0,8495
0,7638
0,8299
0,8509
0,7645
0,8279
0,8489
0,7634
1,0768
1,4778
0,9032
0,8773
1,5111
1,0526 6,6616
6,6616
6,6616
6,6616
7,3138
7,3138
7,3138
7,3138
8,1029
8,2804
8,9391
8,1029
8,2804
8,9391
8,1029
8,2804
8,9391
8,1029
8,2804
8,9391
8,7502
8,9197
9,5928
8,1029
8,9197
9,5928
8,7502
8,9197
9,5928
8,7502
8,9197
9,5928
8,7667
4,8846
5,4501
10,6711
5,1089
8,3415 3,1183
3,4269
3,4269
3,2671
3,5128
3,8520
3,8520
3,6766
3,7080
3,9037
4,1515
3,9952
4,1952
4,4502
3,9952
4,1952
4,4502
3,8476
4,0455
4,2970
4,0720
4,2855
4,5240
3,9952
4,5997
4,8437
4,3815
4,5997
4,8437
4,2225
4,4384
4,6797
4,2537
2,3765
2,4890
5,5727
2,3710
3,9613 14,2173
14,4907
14,5027
14,5290
15,0379
15,2898
15,3037
15,3275
20,4449
19,9245
20,5388
20,6396
20,1308
20,7357
20,6628
20,1554
20,7607
20,6756
20,1673
20,7719
21,3403
20,8378
21,4499
20,6396
21,0226
21,6253
21,5386
21,0490
21,6521
21,5489
21,0585
21,6609
17,7797
9,3564
9,9728
19,9921
7,8932
20,0342 HC
fla1
fla2
fla3
fla4
fla5
fla6
fla7
fla8
fla9
fla10
fla11
fla12
fla13
fla14
fla15
fla16
fla17
fla18
fla19
fla20
fla21
fla22
fla23
fla24
fla25
fla26
fla27
fla28
fla29
fla30
fla31
fla32
CYNA
LUTE
KEM1
KAEM2
QUER
DAID Phụ lục 10g. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 164 Gmin Hmaxpos fw phia knotp knotpv LogP Name
fla1
fla2
fla3
fla4
fla5
fla6
fla7
fla8
fla9
fla10
fla11
fla12
fla13
fla14
fla15
fla16
fla17
fla18
fla19
fla20
fla21
fla22
fla23
fla24
fla25
fla26
fla27
fla28
fla29
fla30
fla31
fla32
CYNA
LUTE
KEM1
KAEM2
QUER
DAID 4,4319
4,4319
4,4319
4,4319
4,9565
4,9565
4,9565
4,9565
5,2105
5,3943
5,9229
5,2105
5,3943
5,9229
5,2105
5,3943
5,9229
5,2105
5,3943
5,9229
5,7205
5,9015
6,4478
5,2105
5,9015
6,4478
5,7205
5,9015
6,4478
5,7205
5,9015
6,4478
6,2016
3,1691
3,6123
7,7526
3,3773
5,7803 -2,0772
-1,8046
-1,8006
-1,9875
-1,9927
-1,7201
-1,7161
-1,9030
-2,5314
-2,6510
-2,8201
-2,2588
-2,3783
-2,5475
-2,2548
-2,3744
-2,5435
-2,4417
-2,5613
-2,7304
-2,4826
-2,6021
-2,7712
-2,2588
-2,3295
-2,4986
-2,2060
-2,3256
-2,4947
-2,3929
-2,5125
-2,6816
-4,1478
-2,2140
-2,2252
-3,3066
-2,7852
-3,7055 -0,4477
-0,4018
-0,4028
-0,4725
-0,4416
-0,3957
-0,3967
-0,4663
-0,6595
-0,6693
-0,7381
-0,6136
-0,6234
-0,6922
-0,6146
-0,6244
-0,6932
-0,6843
-0,6941
-0,7629
-0,6565
-0,6662
-0,7350
-0,6136
-0,6203
-0,6891
-0,6116
-0,6213
-0,6901
-0,6812
-0,6910
-0,7598
-0,9370
-0,4747
-0,5300
-0,9145
-0,5417
-0,9210 3,5667
3,5771
3,5789
3,5527
3,3597
3,6291
3,6037
3,6386
4,6313
4,4724
4,6684
4,6181
4,6932
4,6413
4,5401
4,6469
4,5471
4,5021
4,6616
4,5404
3,7509
3,6648
3,7660
4,6181
4,0615
4,2235
4,1496
4,0111
4,1865
4,1772
4,0687
4,2308
0,7696
2,7887
3,4560
1,4743
2,6359
1,0960 -0,2533
-0,1360
-0,1067
-0,0860
-0,2075
-0,1085
-0,0845
-0,0638
-0,2722
-0,4088
-0,2891
-0,1485
-0,3860
-0,1604
-0,1171
-0,3836
-0,1273
-0,0964
-0,3830
-0,1066
-0,2264
-0,3630
-0,2433
-0,1485
-0,3402
-0,1329
-0,0948
-0,3378
-0,1051
-0,0741
-0,3372
-0,0844
-1,6769
-0,4895
-0,5516
-1,5866
-0,8877
-1,5628 2,6945
2,6663
2,6681
2,6655
1,4629
1,6012
1,6105
1,6349
2,7803
2,8069
2,8015
2,7521
2,7787
2,7733
2,7539
2,7805
2,7751
2,7514
2,7779
2,7726
1,4906
1,5168
1,5001
2,7521
1,6507
1,6473
1,6554
1,6724
1,6691
1,6576
1,6676
1,6657
2,8630
2,7601
2,7856
2,8841
2,8701
2,7582 309,3214
309,3214
309,3214
309,3214
323,3483
323,3483
323,3483
323,3483
371,3923
389,3828
401,4185
371,3923
389,3828
401,4185
371,3923
389,3828
401,4185
371,3923
389,3828
401,4185
385,4192
403,4096
415,4454
371,3923
403,4096
415,4454
385,4192
403,4096
415,4454
385,4192
403,4096
415,4454
448,3832
286,2408
300,2677
516,4584
302,2402
416,3844 Phụ lục 10h. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone 165 Phụ lục 11. Định Danh thực vật chiết xuất 166 167 168 169 170 Phụ lục 12. Thử hoạt tính khánh ung thư cổ tử cung (HeLa) 171 172 Phụ lục 13. phổ 1H-NMR CSL1 Phụ lục 14. phổ DEPT CSL1 173 Phụ lục 15. Phổ 13C-NMR CSL1 174 Phụ lục 16. Phổ HMBC CSL1 175 Phụ lục 17. Phổ HSQC CSL1 176 Phụ lục 18. Phổ 1H-NMR GML1 177 Phụ lục 19. Phổ 13C-NMR GML1 178 Phụ lục 20. Phổ DEPT GML1 179 Phụ lục 21. Phổ HMBC GML1 180 Phụ lục 22. Phổ HSQC GML1 181 Phụ lục 24. Phổ 1H-NMR AIL1 182 Phụ lục 25. Phổ 13C-NMR AIL1 183 Phụ lục 26. Phổ DEPT AIL1 184 Phụ lục 27. Phổ HSQC AIL1 185 Phụ lục 28. Phổ HMBC của AIL1 186 Phụ lục 29. 1H-NMR của POL1 187 Phụ lục 30. Phổ 13C-NMR của POL1 188 Phụ lục. 31 Phổ DEPT của POL1 189 Phụ lục 32. Phổ HMBC của POL1 190 Phụ lục 33. Phổ HSQC của POL1 191 Phụ lục 34. Phổ 1H-NMR ZZL1 192 Phụ lục 35. Phổ 13C-NMR ZZL1 193 Phụ lục 36. Phổ DEPT ZZL1 194 Phụ lục 37. Phổ HMBC ZZL1 195 Phụ lục 38. Phổ HSQC ZZL1 196 Phụ lục 39. Phổ 1H-NMR ZZL2 197 Phụ lục 40. Phổ 13C-NMR ZZL2 198 Phụ lục 41. Phổ DEPT ZZL2 199 Phụ lục 42. Phổ HMBC ZZL2 200 Phụ lục 43. Phổ HSQC ZZL2 201 Tham số Dư liệu Công thức phân tử C21H15O11 Khối lượng phân tủ 443,33 ToK 100 Hệ tinh thể monoclinic Nhóm không gian P21 a/Å 14,6876(11) b/Å 4,3568(3) c/Å 17,3072(11) α/° 90 β/° 111,658(3) γ/° 90 Thể tích/Å3 1029,32(13) Z 2 1,43 Tỉ khối tính toán ρcalcg/cm3 Hệ số hấp thu μ/mm-1 0,118 F(000) 458 Kích thước tinh thể/mm3 0,1 × 0,05 × 0,05 Bức xạ MoKα (λ = 0,71073) Phạm vi thu thập dữ liệu 2Θ /° 5,968 to 64,054 Chỉ số index -21 ≤ h ≤ 20, -6 ≤ k ≤ 6, -25 ≤ l ≤ 25 Số phản xạ đo được 25478 Số phản xạ độc lập 6681 [Rint = 0,0399, Rsigma = 0,0506] Dữ liệu/giới hạn/tham số 6681/1/300 Hệ số phù hợp mô hình F2 1,022 Độ sai lệch [I>=2σ (I)] R1 = 0,0454, wR2 = 0,0962 Độ sai lệch tổng cộng R R1 = 0,0675, wR2 = 0,1049 Mật độ đỉnh/lỗ / e Å-3 0,48/-0,39 -0,1(3) Tham số Flack Phụ lục 44. Dữ liệu cấu trúc tinh thể GML1 202 Phụ lục 45. Tọa độ các nguyên tử (Å2×103) trong phân tử GML1 4394,3(12)
4954,6(13)
5741,4(13)
6278,7(10)
7066,4(14)
7363,0(12)
6808,4(12)
7008,3(9)
5983,0(12)
5395,8(12)
4611,7(12)
3596,4(8)
3257,5(11)
2325,0(11)
1923,3(9)
1899,5(11)
1088,6(8)
2388,4(11)
2110,4(9)
3305,1(12)
3806,3(11)
4667,5(9)
3617,4(8)
8247,6(12)
8876,5(13)
9696,9(13)
9892,4(12)
10709,1(8)
9277,2(12)
8459,1(12)
1799,3(9)
-102,8(9) 13,4(4)
19,8(5)
19,4(5)
35,5(5)
29,9(6)
17,7(5)
13,2(4)
16,4(3)
13,9(4)
14,3(4)
14,4(4)
14,3(3)
11,4(4)
11,5(4)
13,6(3)
11,3(4)
15,8(3)
12,1(4)
18,8(3)
11,5(4)
14,2(4)
19,7(3)
12,0(3)
14,3(4)
19,2(5)
17,5(4)
13,3(4)
17,6(3)
14,7(4)
14,7(4)
14,6(3)
17,7(3) 6784,2(15)
7530,0(16)
7502,7(16)
8270,0(13)
8308,2(18)
7627,0(16)
6751,4(15)
6054,2(11)
6759,7(15)
6022,1(15)
6030,7(15)
6717,3(11)
7271,2(14)
6882,9(14)
5909,6(10)
7526,6(14)
7287,6(11)
8611,7(14)
9242,9(11)
8858,6(15)
9916,8(14)
10205,1(12)
8259(1)
7796,5(15)
8660,9(16)
8867,4(16)
8215,1(16)
8470,0(11)
7336,4(15)
7135,3(16)
4774,0(11)
5530,0(12) 6651(5)
4966(6)
4507(6)
2864(6)
2414(7)
3319(6)
4914(5)
5635(4)
5634(5)
7390(5)
7906(5)
7286(4)
5460(5)
6152(5)
5077(4)
4733(5)
6027(4)
5320(5)
3547(4)
4532(5)
5270(5)
4548(4)
6383(4)
2632(5)
3583(6)
2729(6)
897(5)
22(4)
-16(5)
853(5)
9985(4)
4463(4) 203 Phụ lục 46. Các thông số đẳng hướng (Å2×103) trong phân tử GML1 14,5(10) 17,3(10) 9,5(9) 0,0(8) 5,6(8) -1,7(8) C1 15,2(10) 34,4(13) 12,4(9) 5,4(10) 8,1(8) 9,1(10) C2 11,4(9) 15,7(10) 30,9(13) 6,3(9) 4,8(8) 8,2(9) C3 18,9(9) 14,2(7) 29,2(10) 15,9(8) 26,3(9) 69,6(15) O4 24,6(12) 54,5(18) 12(1) 14,2(11) 19,8(13) 8,3(9) C5 11,3(9) 16,3(10) 25,7(12) 4,1(9) 5,5(8) 3,7(9) C6 10,0(8) 15,3(9) 15,3(10) -1,4(8) 5,9(7) -2,0(8) C7 12,1(7) 14,6(7) 24,6(9) 1,7(6) 7,7(6) 2,9(6) O8 10,2(8) 13,4(9) 19,4(11) 0,2(8) 5,8(8) -1,5(8) C9 12,7(9) 12,7(10) 18,5(10) -0,2(8) 5,9(8) 0,8(8) C10 14(1) 16,8(11) 13,0(9) 1,9(8) 5,7(8) 3,2(8) C11 8,9(6) 18,9(8) 16,9(7) 2,2(6) 6,8(6) 3,7(6) O12 9,3(8) 14,3(10) 12,1(9) 0,9(7) 5,7(7) -0,5(8) C13 9,7(8) 12,9(9) 11,4(9) 1,0(7) 3,2(8) -1,4(8) C14 14,1(6) -1,1(6) 15,1(7) 9,9(7) 2,4(5) -1,4(6) O15 7,5(8) 13,4(9) 12,5(9) 0,6(7) 3,1(7) -1,1(8) C16 7,2(6) 24,5(8) 14,3(7) 2,5(6) 2,2(5) -4,8(6) O17 8,8(8) 15,4(10) 12,1(9) -0,5(7) 4,0(7) -1,1(8) C18 15,0(7) 29,0(9) 12,2(7) -7,1(7) 4,8(6) 0,8(7) O19 13,3(9) 11,3(9) 10,1(8) 0,2(7) 4,8(7) 1,1(8) C20 12,7(10) 18,8(11) 9,6(8) 0,7(8) 2,3(7) -0,7(9) C21 20,0(8) 24,1(9) 11,1(7) 4,2(6) 1,1(6) 0,6(7) O22 11,2(7) 15,3(7) 9,9(6) -1,2(6) 4,3(6) -0,2(6) O23 13,8(10) 19,4(11) 10,5(8) 2,7(8) 5,5(8) 5,4(9) C24 16,3(11) 26,1(12) 16(1) 6,0(9) 6,7(9) -0,6(9) C25 15,4(10) 21,3(11) 13,5(9) 1,1(9) 2,6(8) -2,7(9) C26 17,7(10) 13,2(10) 9,5(8) 0,2(7) 5,5(8) 1,6(8) C27 22,5(8) 20,2(8) 9,4(6) 1,8(6) 4,9(6) -5,4(7) O28 15,8(10) 16,6(10) 13,1(9) 0,1(8) 6,9(8) -0,8(9) C29 14,7(10) 16,8(11) 11,4(9) -1,5(8) 3,4(8) 0,8(8) C30 14,1(7) 16,4(7) 15,7(7) -1,6(6) 8,4(6) -2,2(6) O30 204 20,2(8) 21,0(8) 11,7(7) -0,7(6) 5,5(6) -3,3(6) O29 205 Phụ lục 47. Độ dài liên kết trong phân tử GML1 C2
C11
O12
C3
O4
C9
C5
C6
C7
C24
O8
C9
C10
C11
C13
C14 1,377(3) C14
1,405(3) C14
1,376(2) C16
1,391(3) C16
1,369(3) C18
1,394(3) C18
1,358(3) C20
1,341(3) C20
1,465(3) C21
1,488(3) C24
1,237(3) C24
1,467(3) C25
1,407(3) C26
1,380(3) C27
1,411(2) C27
1,530(3) C29 C1
C1
C1
C2
C3
C3
O4
C5
C6
C6
C7
C7
C9
C10
O12
C13 206 Phụ lục 48. Góc liên kết trong phân tử GML1 111,58(16) C1 C11 C2 C14 C13 121,31(18) O15 108,74(16) C1 C2 O12 C14 C16 123,91(18) O15 111,88(16) C1 C11 O12 C14 C13 114,78(18) C16 109,99(16) C2 C3 C1 C16 C14 117,59(19) O17 107,82(15) C3 C9 C2 C16 C18 123,5(2) O17 111,76(16) C3 C2 O4 C16 C14 115,22(19) C18 109,69(15) C3 C9 O4 C18 C20 121,31(18) C16 113,57(16) O4 C3 C5 C18 C16 118,43(18) O19 107,14(16) C5 O4 C6 C18 C20 125,6(2) O19 110,37(16) C6 C7 C5 C20 C18 119,15(18) C21 108,66(15) C6 C24 C5 C20 C18 118,0(2) O23 107,94(16) C6 C24 C7 C20 C21 122,85(18) O23 113,55(16) C7 C9 C6 C21 C20 114,74(18) O22 110,30(15) C7 C6 O8 O23 C20 123,68(17) C13 120,08(19) C7 C9 O8 C24 C6 121,57(19) C25 120,94(19) C9 C7 C3 C24 C6 120,37(19) C30 118,82(19) C9 C10 C3 C24 C25 117,01(18) C30 120,7(2) C9 C7 C10 C25 C24 122,60(19) C26 119,7(2) C10 C9 C11 C26 C25 120,98(19) C27 120,53(18) C11 C1 C10 C27 C29 119,61(19) C26 117,48(18) O12 C13 C1 C27 C26 117,73(16) O28 121,99(19) C13 C14 O12 C27 C29 106,25(16) O28 119,33(19) C13 O12 O23 C29 C27 108,23(16) C30 120,88(19) C13 C14 C30 C24 109,40(15) C29 O23 207 Phụ lục 49. Góc xoắn trong phân tử GML1 179,5(2) C1 C2 C3 O4 -178,9(2) O12 C1 C11 C10 -67,3(2) C1 C2 C3 C9 0,7(4) O12 C13 C14 O15 170,61(16) C1 O12 C13 C14 167,23(17) O12 C13 C14 C16 178,62(14) C1 O12 C13 O23 -75,4(2) O12 C13 O23 C20 -165,89(16) C2 C1 C11 C10 -1,4(3) C13 C14 C16 O17 -46,2(2) C2 C1 O12 C13 18,1(3) C13 C14 C16 C18 -66,02(19) 177,9(3) C14 C13 O23 C20 O4 C5 C2 C3 168,12(16) 176,6(2) C14 C16 C18 O19 C9 C7 C2 C3 48,3(2) -1,8(4) C14 C16 C18 C20 C9 C10 C2 C3 70,4(2) 3,5(5) O15 C14 C16 O17 C5 C6 C3 O4 -169,87(17) C3 C9 C10 C11 1,3(3) O15 C14 C16 C18 -176,79(17) -3,9(4) C16 C18 C20 C21 C9 C7 O4 C3 -58,6(2) 177,7(2) C16 C18 C20 O23 C9 C10 O4 C3 -70,9(2) 0,6(5) O17 C16 C18 O19 C6 C7 O4 C5 169,27(17) -179,8(3) O17 C16 C18 C20 C6 C24 O4 C5 -179,07(17) 174,6(3) C18 C20 C21 O22 C7 O8 C5 C6 69,13(19) -5,8(3) C18 C20 O23 C13 C7 C9 C5 C6 59,5(2) C5 C6 C24 C25 54,6(4) O19 C18 C20 C21 177,68(16) C5 C6 C24 C30 -120,7(3) O19 C18 C20 O23 -171,17(16) C9 C3 7,4(3) C21 C20 O23 C13 C6 C7 208 Phụ lục 50. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng (Å2×103) của phân tử GML1 4809 24 8045 4146 H2 7439 36 8865 1370 H5 5541 17 5511 8234 H10 4221 17 5530 9102 H11 3361 14 7199 3232 H13 2251 14 6882 8429 H14 1874 20 5515 6527 H15 1846 14 7409 2468 H16 769 24 6747 5325 H17 2343 14 8752 7545 H18 1628 28 8929 2893 H19 3364 14 8730 2306 H20 3574 17 10338 4115 H21A 3749 17 10028 7485 H21B 4723 30 9903 2977 H22 8742 23 9113 4827 H25 10122 21 9455 3401 H26 10749 26 8055 -1231 H28 9416 18 6880 -1220 H29 8038 18 6539 225 H30 1936 22 5171 11545 H30A 2111 22 4426 9952 H30B -15 27 5210 2904 H29A -611 27 5510 4402 H29B 209 Tham số Pna21 Công thức phân tử C16H12O6 Khối lượng phân tử 300,26 ToK 100 Hệ tinh thể orthorhombic Nhóm không gian Pna21 a/Å 7,0060(4) b/Å 25,9070(14) c/Å 7,2062(4) α/° 90 β/° 90 γ/° 90 Thể tích/Å3 1307,96(13) Z 4 1,525 Tỉ khối tính toán ρcalcg/cm3 0,118 Hệ số hấp thu μ/mm-1 F(000) 624 Kích thước tinh thể /mm3 0,1 × 0,08 × 0,04 Bức xạ MoKα (λ = 0,71073) Phạm vi thu thập dữ liệu 2Θ /° 5,868 to 61,67 Chỉ số index -10 ≤ h ≤ 10, -37 ≤ k ≤ 37, -10 ≤ l ≤ 10 Số phản xạ đo được 44181 Số phản xạ độc lập 4114 [Rint = 0,0465, Rsigma = 0,0199] Dữ liệu/giới hạn/tham số 4114/1/203 Hệ số phù hợp mô hình F2 1,092 Độ sai lệch [I>=2σ (I)] R1 = 0,0387, wR2 = 0,0959 Độ sai lệch tổng cộng R R1 = 0,0427, wR2 = 0,0987 Mật độ đỉnh/lỗ / e Å-3 0,44/-0,24 Tham số Flack 0,0(2) Phụ lục 51. Dữ liệu cấu trúc tinh thể của ZZL1 210 Phụ lục 52. Tọa độ các nguyên tử trong phân tử ZZL1 4775(2) 10,9(3) 7729(2) 3675,6(6) C1 6392(2) 11,1(3) 8443(2) 3485,4(6) C2 7788,2(17) 13,7(2) 9062,3(18) 3807,2(5) O3 9151(3) 20,0(4) 7590(3) 3901,3(7) C4 6728(2) 10,7(3) 8572(2) 2936,4(6) C5 8233,1(18) 14,2(2) 9224,5(18) 2758,0(5) O6 5243(2) 10,7(3) 7914(2) 2611,6(6) C7 5363(2) 11,1(3) 7974(2) 2063,4(6) C8 6930,0(18) 16,2(3) 8594(2) 1833,0(5) O9 3882(3) 12,5(3) 7379(2) 1763,2(6) C10 2255(2) 12,0(3) 6715(2) 2000,8(6) C11 869,4(19) 16,4(3) 6171(2) 1683,8(5) O12 2097(2) 11,7(3) 6619(2) 2537,4(6) C13 3600(2) 10,4(3) 7222(2) 2829,9(6) C14 3393,7(18) 12,4(2) 7127,6(18) 3355,0(4) O15 4268(2) 12,9(3) 7513(2) 4222,1(6) C16 3133(3) 14,7(3) 5993(2) 4377,7(6) C17 2589(3) 16,8(3) 5805(3) 4890,1(7) C18 3183(3) 18,3(3) 7136(3) 5253,5(7) C19 2576(3) 25,7(3) 6892(2) 5746,0(5) O20 4328(3) 22,0(4) 8635(3) 5105,0(7) C21 4862(3) 19,1(3) 8829(3) 4592,3(7) C22 211 Phụ lục 53. Các thông số đẳng hướng (Å2×103) trong phân tử k ZZL1 0,4(5) 1,0(6) -1,1(5) 10,9(7) 10,0(6) 11,9(7) C1 -0,1(5) 0,8(6) -1,1(5) 13,1(7) 9,5(6) 10,9(6) C2 -1,8(4) -0,2(4) -2,0(4) 16,4(6) 13,1(5) 11,7(5) O3 -3,5(7) 3,6(7) 0,3(7) 23,0(9) 21,7(8) 15,3(8) C4 1,3(5) 0,9(5) -0,2(5) 10,3(7) 11,0(6) 10,7(7) C5 3,1(4) -2,2(5) -0,1(4) 18,3(6) 13,3(5) 11,0(5) O6 0,6(5) -0,6(5) -0,2(5) 11,4(7) 10,0(6) 10,8(6) C7 2,1(5) 0,5(5) 1,0(5) 11,1(7) 10,4(6) 11,7(7) C8 3,3(4) -3,4(5) 0,7(4) 23,3(7) 11,5(5) 13,7(6) O9 -0,2(5) 1,2(6) 0,0(5) 11,6(7) 11,5(6) 14,5(7) C10 -1,8(5) 0,9(6) -1,1(5) 10,1(7) 12,8(7) 13,0(7) C11 -2,8(4) -5,7(5) 0,1(5) 21,4(6) 12,7(5) 15,2(6) O12 0,2(5) -0,9(5) 0,4(5) 12,8(7) 11,8(6) 10,5(6) C13 0,6(5) 0,4(5) -0,1(5) 11,0(7) 9,5(6) 10,5(7) C14 0,8(4) -2,0(4) -0,3(4) 16,2(6) 9,5(5) 11,5(5) O15 1,4(5) 2,0(6) -0,4(5) 16,5(8) 9,4(6) 12,8(7) C16 1,0(6) -0,7(6) 0,4(6) 17,2(8) 12,1(7) 14,9(7) C17 2,6(6) 0,4(7) 3,1(6) 20,0(8) 12,3(7) 18,1(7) C18 4,3(6) 5,0(7) 1,2(6) 22,9(8) 10,8(6) 21,2(8) C19 7,4(5) 2,2(7) -1,0(5) 30,9(8) 10,2(6) 36,1(8) O20 5,4(7) -2,6(7) -7,8(7) 24,7(9) 14,6(8) 26,8(9) C21 5,3(7) -4,3(7) -4,6(6) 18,6(8) 14,9(7) 23,7(9) C22 212 Phụ lục 54. Độ dài liên kết trong phân tử ZZL1 1,404(2) C2 1,360(2) C10 C11 C1 1,348(2) O15 1,3631(19) C11 O12 C1 1,396(2) C16 1,470(2) C11 C13 C1 1,388(2) O3 1,3766(19) C13 C14 C2 1,3701(17) C5 1,446(2) C14 O15 C2 1,402(2) C4 1,445(2) C16 C17 O3 1,397(2) O6 1,264(2) C16 C22 C5 1,390(2) C7 1,437(2) C17 C18 C5 1,393(3) C8 1,423(2) C18 C19 C7 1,360(2) C14 1,399(2) C19 O20 C7 1,390(3) O9 1,3489(19) C19 C21 C8 1,389(2) C10 1,385(2) C21 C22 C8 213 Phụ lục 55. Góc liên kết trong phân tử ZZL1 122,20(15) C2 C1 O15 121,24(14) O12 C11 C13 121,37(15) C2 C1 C16 126,82(15) C13 C11 C10 117,74(15) O15 C1 C16 111,93(14) C14 C13 C11 123,04(14) C1 C2 O3 121,51(14) C13 C14 C7 120,67(13) C1 C2 C5 121,51(14) O15 C14 C7 116,28(14) O3 C2 C5 116,98(14) O15 C14 C13 120,71(13) C2 O3 C4 111,96(13) C1 O15 C14 119,98(15) O6 C5 C2 121,72(14) C17 C16 C1 121,14(15) O6 C5 C7 122,74(13) C22 C16 C1 118,86(15) C7 C5 C2 115,54(14) C22 C16 C17 120,71(16) C8 C7 C5 121,94(14) C18 C17 C16 119,69(17) C14 C7 C5 120,32(13) C17 C18 C19 116,81(17) C14 C7 C8 117,73(14) O20 C19 C18 123,10(17) O9 C8 C7 120,14(14) O20 C19 C21 120,09(16) O9 C8 C10 119,56(14) C21 C19 C18 120,20(17) C10 C8 C7 120,30(14) C22 C21 C19 120,44(17) C8 C10 C11 119,82(14) C21 C22 C16 116,43(14) O12 C11 C10 214 Phụ lục 56. Góc xoắn trong phân tử ZZL1 -0,7(3) C1 C2 O3 C4 94,58(19) C8 C10 C11 C13 179,36(15) C1 C2 C5 O6 -179,57(16) O9 C8 C10 C11 0,6(2) C1 C2 C5 C7 0,5(2) C10 C11 C13 C14 0,1(2) C1 C16 C17 C18 -177,82(16) C11 C13 C14 C7 179,36(14) C1 C16 C22 C21 178,18(18) C11 C13 C14 O15 -179,69(16) C2 C1 O15 C14 0,2(2) O12 C11 C13 C14 -178,46(14) C2 C1 C16 C17 -147,34(18) C13 C14 O15 C1 -178,69(15) C2 C1 C16 C22 34,2(3) C14 C7 C8 O9 0,7(2) C2 C5 C7 C8 179,25(15) C14 C7 C8 C10 179,63(14) C2 C5 C7 C14 0,5(2) O15 C1 C2 O3 -0,9(2) O3 C2 C5 O6 -0,1(2) O15 C1 C2 C5 33,2(2) O3 C2 C5 C7 -179,99(14) O15 C1 C16 C17 -145,26(17) C5 C2 O3 C4 -84,94(18) O15 C1 C16 C22 0,2(3) C5 C7 C8 O9 2,5(2) C16 C1 C2 O3 179,69(15) C5 C7 C8 C10 -178,10(16) C16 C1 C2 C5 179,73(14) C5 C7 C14 C13 178,05(16) C16 C1 O15 C14 -0,2(3) C5 C7 C14 O15 -1,2(2) C16 C17 C18 C19 -0,3(3) O6 C5 C7 C8 -0,7(3) C17 C16 C22 C21 178,86(17) O6 C5 C7 C14 -179,43(15) C17 C18 C19 O20 -0,6(3) C7 C8 C10 C11 0,0(2) C17 C18 C19 C21 1,0(3) C7 C14 O15 C1 0,8(2) C18 C19 C21 C22 -0,5(3) C8 C7 C14 C13 -0,7(2) C19 C21 C22 C16 -178,44(19) C8 C7 C14 O15 -179,95(15) O20 C19 C21 C22 0,7(3) C10 C11 O12 179,61(15) C22 C16 C17 C18 C8 215 Phụ lục 57. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng (Å2×103) trong Pna21 của hợp chất ZZL1 6661 4147 8650 30 H4A 8166 4044 10279 30 H4B 6944 3576 9449 30 H4C 8902 2059 7709 24 H9 7421 1397 3967 15 H10 5665 1858 18 25 H12 6157 2697 998 14 H13 5082 4130 2731 18 H17 4773 4992 1815 20 H18 7770 5933 2997 39 H20 9530 5355 4746 26 H21 9863 4493 5636 23 H22 216 Phụ lục 58. Tính toán các tham số cấu trúc phân tử 1) ABSQ: Tổng điện tích của nguyên tử trong phân tử Trong đó Qi là điện tích của nguyên tử i. 2) ABSQon: Là tổng giá trị tuyệt đối điện tích nito (n) và oxy (o) trong phân tử. 3) Dipole: là giá trị moment lưỡng cực của phân tử. Giá trị dipole (μ) được tính dựa trên cấu trúc 3D và điện tích nguyên tử bằng phương pháp Gasteiger-Marsili thực hiện trong QSARIS. Đơn vị của nó là (1 D = 3.336 E-30 coulomb-meter). 3) Chỉ số hình học alpha Ka3 (Kappa Alpha 3 hay 3); Ka2 (Kappa Alpha 2 hay (2)) 1kα = [(A+ α)(A+ α – 1)2]/(1Pi + α)2 với m = 1 2kα = [(A+ α – 1)(A+ α – 2)2]/(2Pi + α)2 với m = 2 3kα = (A + α –1)(A + α – 3)2 / (3Pi + α)2 với m = 3 khi A lẻ 3kα = (A + α –3)(A + α – 2)2 / (3Pi + α)2 với m = 3 khi A chẵn Trường hợp theo số nguyên tử và đường: Trong đó: A là số lượng các nguyên tử trong phân tử được mô tả; là bán kính cộng hóa trị nguyên tử của các nguyên tử trong hợp chất vòng khác carbon; Pi: số lượng đường bậc m trong phân tử i; m là bậc đường. Bán kính cộng hóa trị nguyên tử là bán kính được sắp xếp dạng bảng của mỗi nguyên tử và được sử dụng để tính giá trị cho chỉ số chỉ số hình học K. Bán kính cộng hóa trị nguyên tử được định nghĩa như sau: Với α là tổng Ri và RCsp3; Ri và RCsp3 bán kính nguyên tử thứ i và bán kính Csp3. 217 5) logP là logarithm (cơ số 10) của hệ số phân tán P của octanol - nước [14]. 6) MaxNeg là điện tích âm lớn nhất của các các nguyên tử trong một phân tử. 7) MaxQp là điện tích dương lớn nhất của các các nguyên tử trong một phân tử. 8) MolWeight: là phân tử khối của phân tử 9) Polar: là độ phân cực của phân tử, được tính dựa trên phương pháp của Miller, công thức 1.12. Trong đó αA là độ phân cực trung bình nguyên tử cho nguyên tử A. Phương pháp này sử dụng 400 hợp chất chứa H, C, N, O, S, F, Cl, B, I, và P để xác định sai số của αA với sai số 2,2-2,8% giữa phép phân cực phân tử thực nghiệm và tính toán. Đơn vị là Å3 (1Å = 10-10 m). 10) Sp.Pol: là độ phân cực cụ thể của một phân tử: Sp.Pol = Polar/Volume 11) Volume: Thể tích của một phân tử. Thể tích phân tử của một phân tử được tính bằng phương pháp lưới (grid) của Boder. Nó là một kỹ thuật tích hợp sử dụng một khối lưới trung tâm trên mỗi nguyên tử có cạnh là đường kính của nguyên tử. Trong đó n là số điểm lưới trong nguyên tử và không tính tính các nguyên tử khác; nt là tổng số điểm lưới trong một nguyên tử và ri là bán kính van der Waals của nguyên tử thứ i. Thể tích của nguyên tử V: đơn vị là Å3(1Å = 10-10 m) 12) WienI (W): Chỉ số W là một tham số topo theo công thức của H. Wiener [36]. Các chỉ số W được dựa trên khung của phân tử (không có hydrogen). W được định nghĩa là tổng của khoảng cách giữa hai nguyên tử cacbon trong phân tử, liên quan đến các liên kết cacbon và cacbon. Phương pháp tính toán như sau: Nhân số nguyên tử cacbon vào một mặt của bất kỳ liên kết nào bằng các bên ở phía bên kia; W = tổng của các giá trị này cho tất cả các liên kết. Chỉ số Wiener của một phân tử 218 thường cao hơn đối với các phân tử lớn hơn và cho biết độ phân nhánh của phân tử. Đặc biệt, W thường lớn cho các phân tử mở phân nhánh và nhỏ cho những phân tử ít phân nhánh hơn. W tương quan với tham số hình dạng ovality và volume phân tử và trong một số trường hợp, nó có thể được sử dụng thay cho một hoặc cả hai mô tả phân tử này. W là một tham số đơn. 13) X1: chỉ số liên kết thứ nhất được tính trên tất cả các liên kết đơn (cạnh) của các nguyên tử trong phân tử không có hydro. Nó là một trong các tham số mô tả hữu ích nhất đối với các mô hình QSAR/QSPR. X1 là tổng tất cả các liên kết từ nguyên tử i đến nguyên tử j được tín theo công thức sau: δi = ϭ - h: là tổng các liên kết xung quanh nguyên tử i; ϭ là số electron của nguyên tử i trong orbital ϭ. h là số hydro liên kết với nguyên tử i. 14) X1 là 1 χ trong tính toán của Kier & Hall. 15) X3: là chỉ số liên kết thứ 3. 16) Ovality: là chỉ số hình học oval của phân tử. Với O là là tham số mô tả kích thước dựa trên tính chất đối với một thể tích cố định, hình cầu với bề mặt nhỏ nhất; SA là bề mặt phân tử; SA0 là bề mặt phân tử cực tiểu; VVDW là thể tích an der Waals; R là bán kính nguyên tử. 17) Sdssc: là số chỉ số E-State của nhóm (=C<) trong phân tử . 18) SdO: là số chỉ số E-State của nhóm (=O) trong phân tử . 19) SaaCH là số chỉ số E-State (chỉ số trạng thái điện tử) của nhóm ( CH ) trong phân tử. 20) SsOH là số chỉ số E-State của nhóm OH trong phân tử. 21) xp6 là chỉ số chi đường 6 (6P). 22) k2 hay Kappa 2 (2k) là chỉ số hình học kappa truyền thống (traditional Kappa Shape Indices). 219 mk= C (mPmax mPmin)/(mPi)2 Trường hợp theo số đường: Trong đó: Pmax: số lượng đường bậc m trong một phân tử tham chiếu không có nhánh với cùng một số nguyên tử như phân tử được mô tả. Pmin: số lượng đường bậc m trong một phân tử tham chiếu có đặc tính cấu trúc vô cực và cùng một số nguyên tử như phân tử được mô tả.
Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả.
m là bậc đường
C = 2 (m = 1,2); C = 4 (m = 3) 1k = A(A-1)2/(1Pi)2 với m = 1 2k = A(A-1)(A-2)2/(2Pi)2 với m = 2 3k = A(A-1)(A-3)2/(3Pi)2 với m = 3 khi A lẻ 3k = A(A-3)(A-2)2/(3Pi)2 với m = 3 khi A chẵn Trường hợp theo số nguyên tử và đường: Trong đó: A là số đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử
Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả m là bậc đường 23) knotp: sự khác nhau giữa chi nhóm 3 và chi đường/nhóm 4. 27) xp8: chỉ số chi đường 8 (8P) bậc thấp. 28) Knotpv: Sự khác nhau giữa chi nhóm hóa trị 3 và chi đường/nhóm hóa trị 4. 29) Phia: Kappa linh hoạt (. Các đại lượng Kappa Alpha 1 và Kappa Alpha 2 được kết hợp với một số nguyên tử (bình thường) để tạo thành chỉ số Kappa linh hoạt (Kappa Flexibility), (phia) . Chỉ số Kappa linh hoạt phia được định nghĩa như sau: = (1k)(2k)/A 220 Trong đó: 1k là giá trị của kappa alpha 1; 2k là giá trị của kappa alpha 2; A là số đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử Nvx là số đỉnh của khung (số nguyên tử không phải hydro, số các nhóm hydrua; ví dụ. - CH3, - OH,…). 221 Phụ lục 59. Các phương pháp bán thực nghiệm 1) CNDO Phương pháp CNDO (complete neglect of differential overlap) phương pháp NDO (neglect of differential overlap) đơn giản nhất. Phương pháp này mô hình hóa các giá trị orbitals chỉ sử dụng một bộ cơ sở tối thiểu của các loại orbitals Slater. Phương pháp CNDO đã chứng minh kết quả hữu ích trên một số hydrocacbon. CNDO đôi khi vẫn được sử dụng để tạo ra dự đoán đầu tiên về tính toán ab initio trên các hydrocarbon.Thực tế tất cả các phép tính CNDO thực sự được thực hiện bằng cách sử dụng phương pháp CNDO/2, đó là một tham số được cải thiện hơn phương pháp CNDO/1 ban đầu. Có một phương pháp CNDO/S được tham số để tính toán tính chất điện tử quang phổ. Phương pháp CNDO/S mang lại dự đoán cải thiện các dự đoán trạng thái kích thích năng lượng, nhưng khó khăn trong dự đoán tính chất hình học phân tử. Cũng có những phần mở rộng của phương pháp CNDO/2 bao gồm các yếu tố có orbitals d. Những kỹ thuật này không sử dụng phổ biến rộng rãi do tính giới hạn chính xác của kết quả. 2) INDO Phương pháp INDO (intermediate neglect of diferential overlap) được sử dụng cho các hợp chất hữu cơ. Ngày nay, nó đã bị thay thế bởi các phương pháp chính xác hơn. INDO đôi khi vẫn được sử dụng như một phép tính ban đầu trong các tính toán ab initio. 3) MNDO Phương pháp MNDO (modified neglect of diatomic overlap) đã được sử dụng nhiều trong các hợp chất hữu cơ. Nó đã được đưa vào một số chương trình bán thực nghiệm phổ biến cũng như chương trình MNDO. Ngày nay, nó vẫn được sử dụng, nhưng các phương pháp AM1 và PM3 chính xác và phổ biến hơn. Có một số trường hợp mà phương phá MNDO đưa ra kết quả không chính xác. Tính toán năng lượng kích thích điện tử thấp. Hàng rào năng lượng kích hoạt thường có xu hướng cao. 222 Không phải luôn luôn tính được năng lượng tối thiểu bằng phương pháp MNDO. Hàng rào đối với sự quay liên kết thường được tính là quá nhỏ. Các hợp chất lớn và các hệ phân tử được tính toán không ổn định. Vòng bốn được dự đoán là bền. Nhóm hàm bão hòa oxy trên vòng được dự đoán ngoài không gian. Liên kết peroxide thì nhỏ hơn 0,17 Ao. Liên kết C-O-C lớn hơn 9o. Độ dài liên kết giữa các electron âm thì quá ngắn. Liên kết hydrogem thì quá mạnh và dài. Phương pháp biến thể của MNDO là MNDO/d. Đây là hàm tương đương bao gồm các orbital d. Phương pháp này cải thiện tiên đoán hình học của các phân tử tăng dần. Phương pháp này đôi khi được sử dụng để mô hình hóa các hệ thống kim loại chuyển tiếp. Phương pháp MNDO cũng bao gồm các tương quan điện tử với phương pháp MNDO. 4) AM1 Phương pháp AM1 (Austin Model 1) phổ biến trong mô hình hóa các hợp chất hữu cơ. AM1 thường dùng trong tính toán nhiệt tạo thành ΔHf chính xác hơn phương pháp MNDO. Tùy thuộc vào cấu trúc phân tử và thông tin cấu trúc tính toán, một trong hai AM1 hoặc PM3 thường cho kết quả chính xác nhất định. Có một số ưu điểm và nhược điểm về kết quả thu được từ những phương pháp này. AM1 đã cải thiện tính toán năng lượng kích hoạt so với phương pháp MNDO. Phương pháp AM1 có kết quả tính toán đối với nhôm tốt hơn PM3 và tính toán kém chính xác đối với nitơ, phốt pho hay tính toán nhiệt tạo thành của các phân tử với có điện tích lớn. Ngoài ra, AM1 thường ứng dụng tính toán cho liên kết O-Si-O, dự đoán năng lượng nhóm alkyl. Nhìn chung, AM1dự đoán năng lượng và hình học tốt hơn MNDO, nhưng không bằng như PM3. 5) PM3 Phương pháp PM3 (Parameterization method 3) sử dụng phương trình gần giống như phương pháp AM1 với bộ tham số được cải thiện. Đây là phương pháp phổ biến đối với hệ thống hữu cơ. PM3 chính xác hơn AM1 đối với tính các góc độ liên kết hydro, nhưng AM1 chính xác hơn đối với tính năng lượng liên kết hydro. 223 Các phương pháp PM3 và AM1 cũng phổ biến hơn các phương pháp bán thực nghiệm khác do có sẵn các thuật toán tính toán năng lượng solvat hóa. Ngoài ra còn có một số điểm mạnh và hạn chế của PM3. Nói chung, tính toán nhiệt tạo thành chính xác hơn so với MNDO hoặc AM1. Các phân tử siêu hóa trị (Hypervalent) cũng được dự đoán chính xác hơn. PM3 có khuynh hướng tiên đoán rằng rào xoay xung quanh liên kết CaN trong các peptide quá thấp. Liên kết giữa Si và các nguyên tử halogenua quá ngắn. PM3 cũng có xu hướng dự đoán trạng thái điện tử không chính xác đối với các hợp chất gecmani. Dự đoán điện tích nito không chính xác. Khoảng cách không liên kết thì quá ngắn. Liên kết hydro thì quá ngắn khoảng 0,1 Ao, nhưng định hướng thường chính xác. Nhìn chung, PM3 dự đoán năng lượng và độ dài liên kết chính xác hơn AM1 hoặc MNDO. 6) TNDO 224 … Phân tử Hoạt
tính … Phân tử i Yi Tính chất /
Tham số/
Phân mảnh 1
X1i Tính chất /
Tham số/
Phân mảnh 2
X2i Tính chất /
Tham số/
Phân mảnh 3
X3i Tính chất /
Tham số/
Phân mảnh n
Xni … Phân tử ii Yii X1ii X2ii X3ii Xnii … Phân tử iii Yiii X1iii X2iii X3iii Xniii … … … … … … … … Phân tử n Yn X1n X2n X3n Xnn Phụ lục 60. Ma trận dữ liệu trong nghiên cứu QSAR 225 Phụ lục 61. Các loại thông tin bao gồm trong các phương pháp mô phỏng silico Dữ liệu được mô phỏng Tác dụng dược lý Tác dụng gây độc Tính chất hóa lý Các tính chất dược động học, sinh học khả dụng Môi trường Hóa học Tính chất hóa lý Thuộc tính cấu trúc 2-D và 3-D Hiện diện, vắng mặt và đếm các nguyên tử, mảnh, tiểu cấu trúc Hoá học lượng tử và tính toán Mô phỏng Thiết kế các nhóm dẫn xuất có cấu trúc tương tự Thống kê 3D/4D QSAR Các lĩnh vực khác Chất lượng và độ tin cậy của dữ liệu Mô hình hóa và mô hình dự báo Phạm vi áp dụng Chất lượng mô hình và độ tin cậy của dự báo 226 Phụ lục 62. Tóm tắt các phương pháp tiếp cận mô hình chính cho sự xây dựng các QSAR và trong kỹ thuật silico Phương pháp (Q)SAR Phân tích Hansch Free-Wilson Các mảnh cấu trúc và nhận diện cấu trúc Sự hình thành và phân loại của nhóm Phân tích hồi quy tuyến tính Bình phương cực tiểu riêng phần Nhận dạng mẫu Các phương pháp Robust Dược phẩm Mô hình 3-D CoMFA 227 Phụ lục 63. Phương pháp phổ cộng hưởng từ hạt nhân Phổ 1H-NMR Phổ 1H-NMR cho biết có bao nhiêu loại proton trong phân tử, đồng thời cho phép xác định số proton của từng loại. Trong phổ 1H-NMR, phần diện tích vẽ ra bởi mũi cộng hưởng, tỷ lệ thuận với số lượng proton gây ra tín hiệu cộng hưởng của mũi đó, được gọi là cường độ tích phân của mũi cộng hưởng. Một tín hiệu cộng hưởng, do ảnh hưởng của các proton bên cạnh có thể bị chẻ thành nhiều mũi, khi giải phổ cần tính tổng diện tích các mũi. Cách giải phổ 1H-NMR Yêu cầu về mẫu đo phổ 1H-NMR đảm bảo khô, độ tinh khiết trên 95%, chất lỏng cần kiểm tra độ tinh khiết bằng sắc ký lỏng hiệu năng cao (HPLC) hoặc kiểm tra bằng SKLM với các hệ dung môi khác nhau cho hiện vết tròn, duy nhất ở Rf = 0,7- 0,8; 0,5-0,6; 0,2-0,3 đối với hệ dung môi giải ly từ phân cực mạnh, phân cực trung bình, phân cực yếu tương ứng. Đo phổ 1H-NMR: với máy 200 MHz cần khoảng 5 mg mẫu, nếu máy hoạt động ở tần số 500 MHz thì lượng mẫu yêu cầu sẽ giảm. Sau khi đo có thể thu hồi mẫu. Một số dữ liệu cần lưu ý khi giải phổ: - Đối với proton của cacbon thơm (C=C) có mũi cộng hưởng tại = 7,0 - 8,5 ppm. - Đỗi với proton của cacbon mạch thẳng (C=C) có mũi cộng hưởng tại = 4,5 - 6,0 ppm, tuy nhiên khoảng = 4,5 - 6,0 cũng có thể do proton gắn vào 2 hay nhiều nguyên tử có độ âm điện như oxy, halogen. - Đối với H của nhóm ankin đầu mạch có = 2,5 ppm. - Đối với H của cacbon bên cạnh nhóm cacbony có = 2,1 – 2,5 ppm. - Đối với H của cacbon liên kết với oxy, halogen có = 3 – 4 ppm. Nếu proton càng xa nguyên tử có độ âm điện cao thì = 1 – 3 ppm - Đối với H của cacbon nhóm vinyl có = 5 – 6 ppm. - Đối với H thuộc nhóm andehit có = 9 – 10 ppm. - Đối với H thuộc nhóm axit có >10 ppm. 228 Phổ 13C-NMR Mẫu khảo sát khi đo phổ 13C-NMR cần hòa tan trong dung môi đã được deuterium hóa (0,6 ml) và có thêm chất nội chuẩn TMS (tetrametilsilan) (1µL). Có nhiều loại dung môi để hòa tan các hợp chất đo phổ 13C-NMR. Lượng mẫu sử dụng đối với máy 200MHz khoảng 30 mg, máy có tần số 500 MHz cần khoảng 5-10 mg, mẫu sau khi đo có thể thu hồi. Các tín hiệu trong phổ 13C-NMR trong khoảng thang đo rất rộng từ 0 - 240 ppm. Cách giải phổ 13C-NMR: Phổ 13C-NMR kết hợp với phổ NMR-DEPT 135 và NMR-DEPT 90: - Phổ 13C-NMR cho biết tổng số cacbon trong phân tử. - Phổ NMR-DEPT 135 và NMR-DEPT 90 cho biết tổng số Csp3, Csp2. Sau đây là độ dịch chuyển hóa học của 13C tính bằng ppm (so từ TMS): + Đối với C liên kết trực tiếp với nguyên tử có độ âm điện lớn: R-CH3 có = 8 – 30 ppm; R-CH2-R có = 15 – 55 ppm; CHR3, CR4 có có = 20 – 60 ppm + Đối với Csp3 liên kết với O có = 40 – 80 ppm; Csp3 liên kết với Cl có = 35 – 80 ppm; Csp3 liên kết với Br = 25 – 65 ppm; Csp3 liên kết với N có = 30 – 65 ppm. + Đối với Csp2 và Csp: nhóm C≡C có = 65 – 90 ppm; C≡N có = 110 – 140 ppm; >C=C< có = 100 – 150 ppm; ->C=C< thơm có = 110 – 175 ppm. + Đối với C của nhóm aldehit hoặc xeton, axit có = 155 – 220 ppm. Phổ hai chiều Phổ HSQC (Heteronuclear Single Quantum Correlation) cho biết tương quan giữa các tín hiệu proton với tín hiệu của cacbon qua 1 liên kết. Phổ HMBC(Heteronuclear Multiple Quantum Correlation) cho biết tương quan giữa các tin hiệu proton với tín hiệu của cacbon qua 2 hay 3 liên kết. Từ các tín hiệu của cacbon 13C trên trục tung kẻ các đường song song với trục hoành trong toàn phổ đồ, từ tín hiệu 1H trên trục hoành kẻ các đường song song với trục tung. Tại các vị trí 229 giao nhau của hai đường kẻ trên có tín hiệu giao, nghĩa là proton này liên kết trực tiếp với cacbon kia. 230 Phụ lục 64. Phương pháp nhiễu xạ tia X đơn tinh thể Phương pháp lâu đời nhất và chính xác nhất của tinh thể học tia X là nhiễu xạ tia X đơn tinh thể, trong đó chùm tia X bị bản hồi từ các mặt phẳng có khoảng cách đều nhau của một đơn tinh thể, tạo ra một mẫu nhiễu xạ gồm các điểm gọi là nhiễu xạ. Mỗi nhiễu xạ tương ứng với một tập các mặt phẳng có khoảng cách đều nhau bên trong tinh thể. Mật độ các electron bên trong tinh thể được xác định từ vị trí và độ sáng của các nhiễu xạ khác nhau quan sát được khi tinh thể từ từ xoay quanh chùm tia X; mật độ này, cùng với dữ liệu bổ sung (về thành phần hóa học), cho phép ta xác định vị trí của các nguyên tử bên trong tinh thể. Nó có thể xác định lực liên kết hóa học trung bình giữa các nguyên tử và góc giữa chúng trong khoảng vài ngàn Ångström và vài chục độ. Kĩ thuật nhiễu xạ tia X đơn tinh thể có 3 bước chính. Bước 1: là thu thập một tinh thể tốt. Tinh thể phải đủ lớn (thường là lớn hơn 100 micron ở mọi chiều), không có tạp chất và có cấu trúc ổn định, không bị nứt nẻ. Bước 2: đặt tinh thể vào trong đường đi của chùm tia X cực mạnh, thường có bước sóng đơn (monochromatic X-rays), để tạo ra các mẫu nhiễu sắc. Tinh thể từ từ xoay và dữ liệu được thu thập lại. Mỗi ảnh chứa hàng chục ngàn điểm nhiễu xạ với các cường độ khác nhau. Bước 3: dùng kĩ thuật tính toán và dữ liệu hóa học bổ sung để đưa ra mô hình về sự sắp xếp các nguyên tử bên trong tinh thể. 231α. có 3 H trong –CH< trong phần đường kề oxy: δH 4,60(1H, t, J = 9,5, H4’’)’ δH
5,11 (2H, dd, J = 1,5 H3’’ và 3,5, H2’’) cho thấy ZZL2 có một đơn vị đường.
;
KẾT LUẬN VÀ KIẾN NGHỊ
DANH MỤC CÔNG TRÌNH
TÀI LIỆU THAM KHẢO
PHỤ LỤC
O1
C2
C3
C4
C5
C6
C7
C8
C9
C10
O11
C1'
C2'
C3'
C4'
C5'
C6'
Hợp chất
O1
C2
C3
C4
C5
C6
C7
C8
C9
C10
O11
C1'
C2'
C3'
C4'
C5'
C6'
O1
C3
C4
C5
C6
C7
C8
C9
O11
C2
C3'
C6'
O1
C2
C3
C4
C5
C6
C7
C8
C9
C10
O11
C1'
C2'
C3'
C4'
C5'
C6'
flavone
O1
C2
C3
C4
C5
C6
C7
C8
C9
C10
O11
C1'
C2'
C3'
C4'
C5'
C6'
Isoflavone
O1
C2
C3
C4
C5
C6
C7
C8
C9
C10
O11
C1'
C2'
C3'
C4'
C5'
C6'
x
y
z
U(eq)
Nguyên
tố
C1
C2
C3
O4
C5
C6
C7
O8
C9
C10
C11
O12
C13
C14
O15
C16
O17
C18
O19
C20
C21
O22
O23
C24
C25
C26
C27
O28
C29
C30
O30
O29
Nguyên tố
U11
U22
U33
U23
U13
U12
Nguyên tố
Độ dài /Å Nguyên tố
Độ dài /Å
1,419(2)
1,527(3)
1,431(2)
1,525(3)
1,420(3)
1,530(3)
1,509(3)
1,439(2)
1,426(2)
1,396(3)
1,393(3)
1,389(3)
1,381(3)
1,376(2)
1,394(3)
1,388(3)
O15
C16
O17
C18
O19
C20
C21
O23
O22
C25
C30
C26
C27
O28
C29
C30
Góc
Góc /˚
Góc
Góc/˚
A
B
C
D
Góc/˚
A
B
C
D
Góc/˚
Atom
x
y
z
U(eq)
x
y
z
U(eq)
Nguyên
tố
U11
U22
U33
U23
U13
U12
Nguyên
tố
Liên kết
Góc/Å
Liên kết
Góc/Å
Nguyên tố
Góc/˚
Nguyên tố
Góc/˚
A
B
C
D
Angle/˚
A
B
C
D
Angle/˚
Nguyên tố
x
y
z
U(eq)
Phương pháp TNDO (typed neglect of differential overlap) là phương
pháp bán thực nghiệm tham số hóa đặc biệt để để tính toán độ dịch chuyển
hóa học của phổ NMR. Sự tham số hoá này đi cao hơn các phương pháp bán
thực nghiệm khác là phân biệt giữa các nguyên tử của cùng một nguyên tố
nhưng lai hóa khác nhau.Ví dụ, các tham số khác nhau được sử dụng để mô tả
một carbon sp2 và carbon sp3. ó hai phiên bản của phương pháp này: TNDO/1
và TNDO/2.