T¹p chÝ Hãa häc, T. 45 (§B), Tr. 6 - 10, 2007<br />
<br />
<br />
<br />
KH¶O S¸T VAI TRß CñA LùC L¦îNG Tö §ÕN QU¸ TR×NH<br />
G¾N KÕT PHèI Tö L£N C¸C AMINO AXIT CñA PROTEIN<br />
TRONG C¸C TÝNH TO¸N HåI PHôC B¸N L¦îNG Tö<br />
§Õn Tßa so¹n 4-7-2007<br />
NguyÔn H÷u Thä, §Æng øng VËn<br />
Trung t©m øng dông Tin häc trong Hãa häc, §H KHTN, §HQG H- Néi<br />
<br />
<br />
Summary<br />
In the present article, we address the question that how important role do the Quantum<br />
Mechanic (QM) and Molecular Mechanics (MM) forces play in ligand docking on protein, via the<br />
use semi-quantum relaxation approach (SQRA) using different forces, e.g. quantum, Van der<br />
Waals and Coulomb ones, in the process of ligand - protein docking. The QM approximation is<br />
applied to calculate the QM forces of neighbor protein-atoms acting on ligands. The L-J 6-12<br />
empirical potential model and Coulomb rule are applied to calculate the forces from the rest<br />
protein-atoms on each ligand - atom. This work intent to investigate the intrinsic role of QM<br />
forces in the ligand-protein docking calculation then interprets the interaction between ligands<br />
and protein. The calculation results shown that, the ligand-protein complex is kept in by stable<br />
state not by covalent bonding but darling interaction which could be calculated by QM<br />
appoximation.<br />
<br />
<br />
I - Më ®Çu phèi tö ra xa. Phèi tö chØ cã thÓ l¹i gÇn h¬n<br />
kho¶ng c¸ch øng víi cùc tiÓu lùc MM b»ng c¸c<br />
Trong nh÷ng c«ng tr×nh tr íc [1] chóng t«i lùc l îng tö. Lùc l îng tö ® îc tÝnh theo ®Þnh<br />
® tr×nh b y nh÷ng kÕt qu¶ thu ® îc trong viÖc luËt Helmann-Feynman b»ng ®¹o h m riªng cña<br />
kh¶o s¸t bÕn ®ç (docking) cña c¸c ph©n tö nhá n¨ng l îng theo to¹ ®é c¸c nguyªn tö. Kh«ng<br />
(CO, H2O v (NH2)2CO) g¾n kÕt lªn c¸c baz¬ thÓ tÝnh lùc l îng tö cho to n bé c¸c nguyªn tö<br />
nit¬ cña DNA sö dông thuËt gi¶i di truyÒn v cña protein m chØ mét sè nguyªn tö gÇn nhÊt<br />
ph ¬ng ph¸p håi phôc b¸n l îng tö. Nh÷ng kÕt ® îc gi¶ thiÕt l t¹o ®¸m nguyªn tö. Nghiªn cøu<br />
qu¶ nghiªn cøu víi DNA cho thÊy qu¸ tr×nh håi vai trß cña lùc l îng tö trong qu¸ tr×nh g¾n kÕt<br />
phôc phô thuéc hai lo¹i lùc: lùc l îng tö (QM) phèi tö - protein víi gÇn ®óng ®¸m nguyªn tö l<br />
gi÷a c¸c nguyªn tö cña phèi tö v nhãm baz¬ môc ®Ých cña b i b¸o n y.<br />
nit¬ t¹o ®¸m v lùc c¬ häc cæ ®iÓn (MM) gi÷a §èi t îng nghiªn cøu ® îc chän l urª g¾n<br />
c¸c nguyªn tö cña phèi tö v c¸c nguyªn tö cßn kÕt lªn protein (3ptb) cã 222 amino axit ®¬n vÞ,<br />
l¹i trong ph©n tö protein. Lùc l îng tö quyÕt thø tù còng nh vÞ trÝ c¸c liªn kÕt peptid ® îc<br />
®Þnh qu¸ tr×nh g¾n kÕt, tuy nhiªn kh«ng ph¶i lóc chØ râ trong file input (rdat07). CÊu tróc kh«ng<br />
n o còng chi phèi qu¸ tr×nh g¾n kÕt. Lùc cæ ®iÓn gian cña ph©n tö protein phøc t¹p, sù ¸n ng÷<br />
® îc tÝnh theo h m thÕ kinh nghiÖm Lernnard - kh«ng gian l m c¶n trë sù h×nh th nh c¸c liªn<br />
Jones 6-12, Birmingham hoÆc Coulomb, cã vai kÕt t¹o ®¸m, nªn phèi tö ph¶i ® îc ®Æt gÇn vÞ trÝ<br />
trß lín, ® a phèi tö tõ xa tiÕn l¹i gÇn vÞ trÝ g¾n t¹o g¾n kÕt (active site) trong 1 kho¶ng c¸ch ®ñ<br />
kÕt v khi phèi tö ë qu¸ gÇn protein th× l¹i ®Èy nhá ®Ó h×nh th nh ®¸m v trong 1 kh«ng gian<br />
6<br />
tho¸ng kh«ng cã c¸c nhãm thô ®éng (non-active axit amin n y. Lùc cæ ®iÓn MM ® îc tÝnh cho<br />
sites) c¶n trë. t ¬ng t¸c gi÷a urª v c¸c nhãm axit amin kh¸c.<br />
Th«ng th êng, trong qu¸ tr×nh tÝnh håi phôc urª<br />
II - Ph ¬ng ph¸p tÝnh kh«ng dêi xa nhãm ban ®Çu ®Ó tiÕp cËn gÇn h¬n<br />
mét nhãm axit amin kh¸c. V× thÕ chóng ta cã<br />
GÇn ®óng SQMD ® ® îc tr×nh b y chi tiÕt thÓ dÔ d ng tÝnh to¸n biÕn thiªn n¨ng l îng cña<br />
trong nh÷ng c«ng tr×nh tr íc ®©y cña t¸c gi¶ qu¸ tr×nh h×nh th nh ®¸m.<br />
§Æng øng VËn [1, 4]. ThuËt to¸n cho qu¸ tr×nh<br />
g¾n kÕt (docking) ® îc tr×nh b y trong nh÷ng<br />
c«ng tr×nh tr íc [1].<br />
BiÕn thiªn n¨ng l îng cña qu¸ tr×nh g¾n kÕt<br />
phèi tö - protein ® îc x¸c ®Þnh theo 3 yÕu tè:<br />
L îng tö, Van der Waals, Coulomb theo c«ng Urª<br />
thøc:<br />
E = E EL EA + EL J + EC (1)<br />
Trong ®ã: E l n¨ng l îng l îng tö t¹o ®¸m cña<br />
Chuçi Protein<br />
phèi tö v nhãm amino axit gÇn nhÊt cña<br />
protein. EL l n¨ng l îng l îng tö cña phèi tö<br />
®éc lËp. EA l n¨ng l îng l îng tö cña amino<br />
axit ®éc lËp. EL-J, EC l n¨ng l îng t ¬ng t¸c<br />
Van der Waals v Coulomb gi÷a phèi tö v<br />
nguyªn tö cßn l¹i cña protein trong kho¶ng c¸ch<br />
x¸c ®Þnh. H×nh 1: Ph©n tö protein v urª<br />
trong hép m« pháng<br />
Khi phèi tö urª tiÕn l¹i vÞ trÝ cã thÓ g¾n kÕt,<br />
sau mçi b íc håi phôc, c¸c gi¸ trÞ n¨ng l îng, Qu¸ tr×nh håi phôc b¾t ®Çu b»ng c¸c b íc<br />
biÕn thiªn n¨ng l îng còng nh kho¶ng c¸ch tÝnh lùc MM t¹i kho¶ng c¸ch nhá nhÊt gi÷a c¸c<br />
Rmin v ®é d i liªn kÕt N-H trong phèi tö urª ®Òu nguyªn tö trong phèi tö v c¸c nguyªn tö trong<br />
® îc ghi l¹i trong file ouput (energy). T¹i gi¸ trÞ protein (tõ 2,5 ®Õn 3,0 Å), t ¬ng t¸c néi ph©n tö<br />
n¨ng l îng cùc tiÓu t¹i mét ®¸m x¸c ®Þnh cã thÓ cña c¸c nguyªn tö trong phèi tö v t ¬ng t¸c<br />
® îc coi l n¨ng l îng cña cña ®¸m h×nh th nh, gi÷a phèi tö v protein ® îc tÝnh to¸n gÇn ®óng<br />
cÊu tróc hÖ khi ®ã cã thÓ coi l cÊu tróc ®¸m theo lùc MM. Trong ®a sè c¸c tr êng hîp, lùc<br />
® îc h×nh th nh. c¬ häc cæ ®iÓn (MM) ® a phèi tö v o vïng<br />
l îng tö ®èi víi c¸c nguyªn tö cña protein<br />
III - KÕt qu¶ th¶o luËn (kho¶ng c¸ch ® îc chän ®Ó b¾t ®Çu tÝnh l îng<br />
tö). Tuy nhiªn, do yÕu tè ¸n ng÷ kh«ng gian,<br />
Ph©n tö protein ® îc ®Æt trong hép m« phèi tö cã thÓ kh«ng tiÕn ® îc ®Õn vïng l îng<br />
pháng cã tÝnh chÊt tuÇn ho n. KÝch th íc hép tö. Nh÷ng kÕt qu¶ tÝnh to¸n chØ ra r»ng, lùc<br />
m« pháng ® îc ®iÒu chØnh theo kÝch th íc cña l îng tö thÓ hiÖn vai trß quan träng trong<br />
ph©n tö protein: x(-23,00; 23,00); y(-20,00; kho¶ng c¸ch nhá, nã kh«ng chØ ®Èy phèi tö ra<br />
20,00); z(-26,00; 26,00), ®Ó to n bé ph©n tö xa m cßn cã thÓ kÐo phèi tö l¹i gÇn t¹o ra phøc<br />
protein n»m trong hép, (h×nh 1). Kho¶ng c¸ch bÒn (®¸m g¾n kÕt - cluster). BiÕn thiªn n¨ng<br />
RQ (kho¶ng c¸ch l îng tö) ® îc chän l 2,5 Å. l îng t¹o phøc trong c¸c tÝnh to¸n håi phôc cña<br />
Ph©n tö protein ® îc xem l cøng (rigid) tøc l sù g¾n kÕt urª lªn protein 3ptb cã gi¸ trÞ nhá<br />
vÞ trÝ c¸c nguyªn tö cña nã ® îc coi l cè ®Þnh. h¬n 0 ® îc chØ ra trªn b¶ng 1.<br />
Khi urª tiÕp cËn mét axit amin ë kho¶ng c¸ch Trong b¶ng 1, chØ ra c¸c gi¸ trÞ biÕn thiªn<br />
gÇn nhÊt gi÷a c¸c nguyªn tö Rmin RQ, lùc n¨ng l îng ( E < 0), ® îc xÕp theo thø tù t¨ng<br />
l îng tö ® îc tÝnh to¸n cho ®¸m bao gåm urª v dÇn. BiÕn thiªn n¨ng l îng t¹o phøc cã gi¸ trÞ<br />
7<br />
trong kho¶ng -0,00026a.u ®Õn -0,01928a.u. TYR(131). CÊu tróc ®¸m t¹o th nh khi urª g¾n<br />
Phøc t¹o ra bÒn nhÊt ( Emin) l sù g¾n kÕt cña kÕt lªn ASN(54) v TYR(131) ® îc chØ ra trªn<br />
urª lªn ASN(54), tiÕp theo l urª g¾n lªn h×nh 2 (a, b).<br />
<br />
B¶ng 1: N¨ng l îng tæng céng, biÕn thiªn n¨ng l îng tÝnh theo c«ng thøc (1), ®é d i liªn kÕt N-H,<br />
kho¶ng c¸ch nguyªn tö gÇn nhÊt gi÷a phèi tö v protein<br />
Thø r Thø r<br />
AA E E Rmin AA E E Rmin<br />
tù (N-H) tù (N-H)<br />
(ASN) 54 -83,4461 -0,01928 1,0103 2,1156 (VAL) 72 -72,283 -0,00551 1,0152 2,4246<br />
(TYR) 131 -100,469 -0,01683 1,0661 2,1759 (LEU) 96 -77,7836 -0,00542 1,0103 2,4862<br />
(ASN) 31 -83,024 -0,01588 1,0103 2,0299 (GLY) 3 -56,3146 -0,00534 1,0103 2,0846<br />
(SER) 221 -72,6041 -0,01483 1,0103 2,0898 (PRO) 74 -71,6566 -0,00527 1,013 2,1054<br />
(SER) 32 -71,9079 -0,01443 1,0103 2,1468 (ASN) 77 -83,1092 -0,00496 1,0187 2,382<br />
(ASN) 61 -82,9816 -0,01403 1,0389 2,3664 (TYR) 5 -100,555 -0,0049 1,1362 2,4691<br />
(HIS) 40 -87,8849 -0,01384 1,0046 2,2751 (SER) 146 -72,582 -0,0047 1,0103 2,0277<br />
(VAL) 2 -71,7483 -0,01362 1,1532 2,4481 (THR) 218 -77,8007 -0,00431 1,0527 2,0194<br />
(GLY) 193 -56,1685 -0,01341 1,0155 2,3887 (SER) 78 -71,9518 -0,00427 1,1367 2,3534<br />
(PRO) 141 -71,2781 -0,01294 1,1722 2,0561 (SER) 108 -72,0498 -0,00412 1,0679 1,3434<br />
(LEU) 138 -78,2558 -0,01257 1,0486 2,0813 (GLN) 115 -88,249 -0,00404 1,1477 2,2021<br />
(ASN) 19 -83,436 -0,01247 1,0262 2,1558 (ASN) 10 -83,1356 -0,00375 1,037 2,4809<br />
(GLN) 155 -88,4039 -0,01244 1,1626 2,4013 (GLN) 33 -88,3229 -0,00366 1,0141 2,1203<br />
(GLY) 174 -56,3202 -0,01195 1,0103 2,0963 (TRP) 192 -105,144 -0,00353 1,1143 2,3343<br />
(GLY) 195 -56,3012 -0,01173 1,0103 2,1737 (SER) 44 -72,5785 -0,00349 1,0103 2,0727<br />
(SER) 75 -72,4789 -0,01046 1,0764 2,331 (ASN) 83 -83,027 -0,00349 1,1832 1,8746<br />
(ALA) 220 -61,7501 -0,01042 1,035 2,1714 (THR) 129 -78,0718 -0,00349 1,0198 2,0246<br />
(SER) 158 -72,4095 -0,01004 1,0752 2,1249 (GLY) 203 -56,3184 -0,00347 1,0303 2,4125<br />
(THR) 114 -77,6235 -0,00982 1,1472 2,3131 (GLY) 113 -55,6869 -0,00333 0,9974 2,3256<br />
(ASN) 82 -82,8661 -0,00979 1,0103 2,0558 (SER) 183 -72,5742 -0,0033 1,0263 2,4917<br />
(TYR) 76 -100,551 -0,00969 1,197 1,7786 (ASP) 145 -87,1526 -0,00295 1,0103 2,2046<br />
(TYR) 22 -100,848 -0,00946 1,0073 2,4534 (SER) 191 -72,4329 -0,00287 0,897 2,4732<br />
(GLY) 184 -56,2386 -0,00903 1,0099 2,4231 (ILE) 65 -77,799 -0,00283 1,1051 2,2612<br />
(HIS) 73 -87,676 -0,00902 1,0103 2,2162 (SER) 66 -72,3946 -0,00271 1,0293 2,1061<br />
(ASN) 56 -83,2534 -0,00898 1,0284 2,459 (SER) 127 -72,1558 -0,00266 1,0103 2,4044<br />
(ASN) 56 -83,2534 -0,00898 1,0284 2,459 (GLN) 63 -88,2792 -0,00265 1,0152 2,0954<br />
(VAL) 212 -72,6192 -0,00897 1,0074 2,2154 (ILE) 71 -78,2702 -0,00237 1,0103 2,0828<br />
(ASN) 222 -93,351 -0,00849 1,0103 2,3861 (GLN) 217 -88,9332 -0,00188 1,0103 2,0893<br />
(ILE) 103 -78,1792 -0,00832 1,0053 2,3397 (GLY) 8 -55,8104 -0,00149 1,0009 2,3276<br />
(TYR) 211 -100,955 -0,0082 1,01 2,4936 (SER) 104 -72,2643 -0,00122 1,1747 1,8264<br />
(GLY) 45 -56,1547 -0,00776 1,032 2,2871 (GLY) 21 -55,9871 -0,00109 1,0738 2,2653<br />
(GLY) 154 -56,3211 -0,00772 1,0282 2,1157 (SER) 70 -72,3274 -0,00084 1,0103 2,3832<br />
8<br />
Thø r Thø r<br />
AA E E Rmin AA E E Rmin<br />
tù (N-H) tù (N-H)<br />
(SER) 95 -71,7256 -0,00762 1,0706 2,4319 (SER) 171 -72,5869 -0,00076 1,0103 2,4186<br />
(SER) 144 -72,1318 -0,00757 1,0103 2,0958 (GLY) 4 -55,4601 -0,00075 0,9967 2,3721<br />
(GLN) 198 -88,2143 -0,00717 1,0233 2,0258 (SER) 68 -72,5791 -0,00063 1,0103 2,1119<br />
(SER) 176 -72,1651 -0,00713 1,0298 1,9192 (PRO) 153 -71,5333 -0,00059 1,0357 2,4981<br />
(GLN) 47 -88,9258 -0,00708 1,0151 2,0856 (TYR) 14 -100,723 -0,00057 1,0243 2,1667<br />
(PRO) 13 -71,4444 -0,00678 1,1608 2,2265 (ALA) 110 -61,8319 -0,00046 0,9945 2,1746<br />
(GLY) 128 -56,2736 -0,00678 1,0299 2,2764 (GLU) 167 -92,2668 -0,00045 1,0057 2,3364<br />
(SER) 194 -72,5899 -0,00643 0,999 2,4964 (SER) 126 -72,5554 -0,00038 1,025 2,238<br />
(GLN) 173 -88,7707 -0,0064 1,0083 1,997 (THR) 80 -77,7128 -0,00034 1,0633 1,9256<br />
(VAL) 181 -72,7768 -0,00633 1,0575 2,448 (ASN) 159 -83,4046 -0,00033 1,0103 2,1131<br />
(ASN) 79 -82,6442 -0,00583 1,1518 2,2507 (VAL) 57 -72,791 -0,00028 1,0103 2,01<br />
(ALA) 93 -61,7919 -0,00556 1,0103 2,0153 (SER) 102 -72,4568 -0,00026 1,0737 2,3475<br />
<br />
<br />
(a)<br />
(b)<br />
<br />
<br />
<br />
<br />
H×nh 2: CÊu tróc ®¸m khi urª g¾n kÕt lªn ASN(54) -a, v TYR(131) -b<br />
CÊu tróc ®¸m ® îc h×nh th nh (h×nh 2) ®Òu ch ¬ng tr×nh tù ®éng gäi phÇn tÝnh lùc (MM) ®Ó<br />
do c¸c t ¬ng t¸c th«ng th êng Van der Walls v tiÕp tôc qu¸ tr×nh håi phôc. Trong hÇu hÕt c¸c<br />
Coulomb, kh«ng xuÊt hiÖn t ¬ng t¸c b»ng liªn tr êng hîp, qu¸ tr×nh håi phôc tÝnh b»ng MM sÏ<br />
kÕt hi®r« nh c¸c nghiªn cøu vÒ sù g¾n kÕt phèi ® a phèi tö tiÕn l¹i gÇn ph©n tö protein h¬n,<br />
tö lªn DNA. nh ng ®ång thêi l¹i l m ®é d i liªn kÕt N-H<br />
trong urª t¨ng. Khi ®ã n¨ng l îng tæng céng cña<br />
CÊu tróc kh«ng gian ph©n tö protein rÊt phøc<br />
hÖ “urª-protein” sÏ t¨ng, dÉn ®Õn nh÷ng tr¹ng<br />
t¹p, chóng kh«ng cã sù tuÇn ho n, kh«ng cã quy<br />
th¸i kh«ng bÒn nhiÖt ®éng häc. ChØ khi qu¸ tr×nh<br />
luËt chung v kh«ng gièng víi DNA. Theo c¸c håi phôc sö dông lùc l îng tö, ph©n tö urª míi<br />
tÝnh to¸n, cã mét sè tr êng hîp biÕn thiªn n¨ng cã thÓ tiÕn l¹i gÇn vÞ trÝ g¾n kÕt (binding site) ®Ó<br />
l îng t¹o ®¸m d ¬ng, nh ng ®¸m vÉn h×nh t¹o ®¸m, ®ång thêi ®é d i liªn kÕt N-H trong urª<br />
th nh. §iÒu n y cã thÓ gi¶i thÝch, trong cÊu tróc dao ®éng xung quanh gi¸ trÞ c©n b»ng, t¹o nªn<br />
protein cã tån t¹i nh÷ng ræ (pocket), tuú thuéc tr¹ng th¸i bÒn v÷ng nhiÖt ®éng häc cña phøc<br />
v o kÝch th íc cña ræ v kÝch th íc cña phèi tö, “urª-protein”.<br />
®¸m ® îc h×nh th nh nhê nh÷ng lùc hÊp dÉn<br />
yÕu (darling interaction) m kh«ng ph¶i liªn kÕt Sù phô thuéc n¨ng l îng cña ®¸m khi urª<br />
céng hãa trÞ nh ng cã thÓ tÝnh to¸n ® îc b»ng g¾n kÕt lªn ASN(54), ®é d i liªn kÕt N-H v<br />
kho¶ng c¸c Rmin ® îc chØ ra trªn h×nh 3 (a, b, c).<br />
c¸c gÇn ®óng c¬ häc l îng tö. §iÒu n y sÏ ® îc<br />
DÔ d ng nhËn thÊy, khi ®¸m ® îc h×nh th nh,<br />
l m s¸ng tá trong c¸c c«ng tr×nh tiÕp theo.<br />
n¨ng l îng cña ®¸m gÇn nh kh«ng ®æi (h×nh<br />
Trong c¸c tÝnh to¸n, khi SCF kh«ng héi tô, 3a) ®ång thêi ®é d i liªn kÕt N-H, kho¶ng c¸ch<br />
9<br />
nguyªn tö cùc tiÓu tõ urª ®Õn protein Rmin còng trïng víi gi¸ trÞ tÝnh khi sö dông c¸c phÇn mÒm<br />
dao ®éng quanh 1 gi¸ trÞ c©n b»ng x¸c ®Þnh kh¸c (HyperChem, Mopac).<br />
-99.2 1.2 3<br />
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 dN-H(Å) Rmin(Å)<br />
E(a.u) b-íc håi phôc 1.15<br />
2.5<br />
-99.6<br />
1.1<br />
2<br />
-100 1.05<br />
1.5<br />
1<br />
-100.4<br />
1<br />
0.95<br />
<br />
-100.8<br />
0.9 0.5<br />
<br />
b-íc håi phôc b-íc håi phôc<br />
0.85 0<br />
-101.2<br />
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89<br />
<br />
<br />
(a) (b) (c)<br />
H×nh 3: BiÕn thiªn n¨ng l îng theo sè b íc håi phôc (a)<br />
BiÕn thiªn ®é d i liªn kÕt N-H trong ph©n tö urª theo sè b íc håi phôc (b)<br />
BiÕn thiªn kho¶ng c¸ch Rmin tõ urª ®Õn protein theo sè b íc håi phôc (c)<br />
<br />
IV - KÕt luËn (binding site) trong ph©n tö protein v nghiªn<br />
cøu cÊu tróc, b¶n chÊt cña ®¸m h×nh th nh kü<br />
Sö dông ph ¬ng ph¸p håi phôc ®éng lùc b¸n h¬n.<br />
l îng tö nghiªn cøu sù g¾n kÕt cña urª lªn<br />
protein, ®ång thêi xem xÐt vai trß cña lùc l îng T¸c gi¶ xin ch©n th-nh c¶m ¬n Bé Khoa häc<br />
tö trong qu¸ tr×nh g¾n kÕt, chóng t«i thu ® îc v- C«ng nghÖ ®L t-i trî kinh phÝ trong khu«n<br />
c¸c kÕt qu¶ nh sau: khæ ®Ò t-i, mL sè 5.072.06<br />
- B íc ®Çu më réng kh«ng gian nghiªn cøu<br />
®èi víi hÖ phøc t¹p protein. T*i liÖu tham kh¶o<br />
- Kh¶ n¨ng g¾n kÕt cña urª trªn protein<br />
kh«ng cao, sù g¾n kÕt l th«ng th êng theo 1. NguyÔn H÷u Thä, §Æng øng VËn, T. 45 (5),<br />
t ¬ng t¸c Couloub v Van der Waals, kh«ng Tr. 614 - 618 (2007).<br />
h×nh th nh liªn kÕt hi®r«. 2. A. P. Lyubartsev, A. Laaksonen. J. Biomol.<br />
- X¸c ®Þnh ® îc cÊu tróc cña ®¸m khi urª Struc. Dyn., 16, 579 (1998).<br />
g¾n kÕt lªn protein. 3. Taylor R. and others. Computer-Aided Mol.<br />
- Lùc l îng tö cã vai trß quyÕt ®Þnh trong Design, 16, 151 - 166 (2002).<br />
qu¸ tr×nh g¾n kÕt t¹o ®¸m, ® a phèi tö l¹i gÇn vÞ 4. §Æng øng VËn, §éng lùc häc c¸c ph¶n øng<br />
trÝ t¹o g¾n kÕt t¹o ra tr¹ng th¸i bÒn nhiÖt ®éng hãa häc, Nxb. Gi¸o dôc H Néi (2003).<br />
häc ‘Urª-Protein”.<br />
5. H. Luo, M. C. Lin. Chem. Phys. Letters,<br />
- Cã thÓ ph¸t triÓn ®Ó t×m vÞ trÝ g¾n kÕt 343, 219 - 224 (2001).<br />
<br />
<br />
<br />
<br />
10<br />
6.<br />
KH�O SÁT VAI TRÒ C�A L�C LƯ�NG T�<br />
��N QUÁ TRÌNH G�N K�T PH�I T� LÊN CÁC AMINO AXIT<br />
C�A PROTEIN TRONG CÁC TÍNH TOÁN H�I PH�C BÁN LƯ�NG T�<br />
<br />
(ON THE ROLE OF QUANTUM FORCES IN LIGAND – PROTEIN DOCKING<br />
CALCULATION: SEMI-QUANTUM RELAXATION APPROACH)<br />
Nguy�n H�u Th�, ��ng �ng V�n<br />
Trung tâm �ng d�ng Tin h�c trong Hoá h�c, �H KHTN, �HQG Hà n�i<br />
Abstract<br />
In the present article, we address the question that how important role do the<br />
Quantum Mechanic (QM) and Molecular Mechanics (MM) forces play in ligand docking<br />
on protein, via the use semi-quantum relaxation approach (SQRA) using different forces,<br />
e.g. quantum, Van der Waals and Coulomb ones, in the process of ligand - protein docking.<br />
The QM approximation is applied to calculate the QM forces of neighbor protein-atoms<br />
acting on ligands. The L-J 6-12 empirical potential model and Coulomb rule are applied to<br />
calculate the forces from the rest protein-atoms on each ligand - atom. This work intent to<br />
investigate the intrinsic role of QM forces in the ligand-protein docking calculation then<br />
interprets the interaction between ligands and protein. The calculation results shown that,<br />
the ligand-protein complex is kept in by stable state not by covalent bonding but darling<br />
interaction which could be calculated by QM appoximation.<br />
I. M� ��u<br />
Trong nh�ng công trình trư�c [1] chúng tôi �ã trình bày nh�ng k�t qu� thu �ư�c<br />
trong vi�c kh�o sát b�n �� (docking) c�a các phân t� nh� (CO, H2O và (NH2)2CO) g�n k�t<br />
lên các bazơ nitơ c�a DNA s� d�ng thu�t gi�i di truy�n và phương pháp h�i ph�c bán<br />
lư�ng t�. Nh�ng k�t qu� nghiên c�u v�i DNA cho th�y quá trình h�i ph�c ph� thu�c hai<br />
lo�i l�c: l�c lư�ng t� (QM) gi�a các nguyên t� c�a ph�i t� và nhóm bazơ nitơ t�o �ám và<br />
l�c cơ h�c c� �i�n (MM) gi�a các nguyên t� c�a ph�i t� và các nguyên t� còn l�i trong<br />
phân t� protein. L�c lư�ng t� quy�t ��nh quá trình g�n k�t, tuy nhiên không ph�i lúc nào<br />
c�ng chi ph�i quá trình g�n k�t. L�c c� �i�n �ư�c tính theo hàm th� kinh nghi�m Lernnard<br />
- Jones 6-12, Birmingham ho�c Coulomb, có vai trò l�n, �ưa ph�i t� t� xa ti�n l�i g�n v� trí<br />
g�n k�t và khi ph�i t� � quá g�n protein thì l�i ��y ph�i t� ra xa. Ph�i t� ch� có th� l�i g�n<br />
hơn kho�ng cách �ng v�i c�c ti�u l�c MM b�ng các l�c lư�ng t�. L�c lư�ng t� �ư�c tính<br />
theo ��nh lu�t Helmann-Feynman b�ng ��o hàm riêng c�a n�ng lư�ng theo to� �� các<br />
nguyên t�. Không th� tính l�c lư�ng t� cho toàn b� các nguyên t� c�a protein mà ch� m�t<br />
s� nguyên t� g�n nh�t �ư�c gi� thi�t là t�o �ám nguyên t�. Nghiên c�u vai trò c�a l�c<br />
lư�ng t� trong quá trình g�n k�t ph�i t� - protein v�i g�n �úng �ám nguyên t� là m�c �ích<br />
c�a bài báo này.<br />
��i tư�ng nghiên c�u �ư�c ch�n là urê g�n k�t lên protein (3ptb) có 222 amino axit �ơn v�,<br />
th� t� c�ng như v� trí các liên k�t peptid �ư�c ch� rõ trong file input (rdat07). C�u trúc<br />
không gian c�a phân t� protein ph�c t�p, s� án ng� không gian làm c�n tr� s� hình thành<br />
các liên k�t t�o �ám, nên ph�i t� ph�i �ư�c ��t g�n v� trí t�o g�n k�t (active site) trong 1<br />
kho�ng cách �� nh� �� hình thành �ám và trong 1 không gian thoáng không có các nhóm<br />
th� ��ng (non-active sites) c�n tr�.<br />
11<br />
II. Ph��ng pháp tính<br />
G�n �úng SQMD �ã �ư�c trình bày chi ti�t trong nh�ng công trình trư�c �ây c�a tác gi�<br />
��ng �ng V�n [1, 4]. Thu�t toán cho quá trình g�n k�t (docking) �ư�c trình bày trong<br />
nh�ng công trình trư�c [1].<br />
Bi�n thiên n�ng lư�ng c�a quá trình g�n k�t ph�i t� - protein �ư�c xác ��nh theo 3 y�u t�:<br />
Lư�ng t�, Van der Waals, Coulomb theo công th�c:<br />
E = E EL EA + EL J + EC (1)<br />
Trong �ó: E là n�ng lư�ng lư�ng t� t�o �ám c�a ph�i t� và nhóm amino axit g�n nh�t c�a<br />
protein.<br />
EL: là n�ng lư�ng lư�ng t� c�a ph�i t� ��c l�p.<br />
EA: là n�ng lư�ng lư�ng t� c�a amino axit ��c l�p.<br />
EL-J, EC: là n�ng lư�ng tương tác Van der Waals và Coulomb gi�a ph�i t� và nguyên t� còn<br />
l�i c�a protein trong kho�ng cách xác ��nh.<br />
Khi ph�i t� urê ti�n l�i v� trí có th� g�n k�t, sau m�i bư�c h�i ph�c, các giá tr� n�ng lư�ng,<br />
bi�n thiên n�ng lư�ng c�ng như kho�ng cách Rmin và �� dài liên k�t N-H trong ph�i t� urê<br />
��u �ư�c ghi l�i trong file ouput (energy). T�i giá tr� n�ng lư�ng c�c ti�u t�i m�t �ám xác<br />
��nh có th� �ư�c coi là n�ng lư�ng c�a c�a �ám hình thành, c�u trúc h� khi �ó có th� coi là<br />
c�u trúc �ám �ư�c hình thành.<br />
III. K�t qu� th�o lu�n<br />
Phân t� protein �ư�c ��t trong h�p mô<br />
ph�ng có tính ch�t tu�n hoàn. Kích thư�c h�p mô<br />
ph�ng �ư�c �i�u ch�nh theo kích thư�c c�a phân t�<br />
protein: x(-23,00; 23,00); y(-20,00; 20,00); z(-<br />
26,00; 26,00), �� toàn b� phân t� protein n�m<br />
Urª<br />
trong h�p, (hình 1). Kho�ng cách RQ (kho�ng cách<br />
lư�ng t�) �ư�c ch�n là 2,5Å. Phân t� protein �ư�c<br />
xem là c�ng (rigid) t�c là v� trí các nguyên t� c�a<br />
Chuçi Protein nó �ư�c coi là c� ��nh. Khi urê ti�p c�n m�t axit<br />
amin � kho�ng cách g�n nh�t gi�a các nguyên t�<br />
Rmin RQ, l�c lư�ng t� �ư�c tính toán cho �ám<br />
bao g�m urê và axit amin này. L�c c� �i�n MM<br />
�ư�c tính cho tương tác gi�a urê và các nhóm axit<br />
amin khác. Thông thư�ng, trong quá trình tính h�i<br />
Hình 1 : Phân t� protein và urê ph�c urê không d�i xa nhóm ban ��u �� ti�p c�n<br />
trong h�p mô ph�ng g�n hơn m�t nhóm axit amin khác. Vì th� chúng ta<br />
có th� d� dàng tính toán bi�n thiên n�ng lư�ng c�a<br />
quá trình hình thành �ám.<br />
Quá trình h�i ph�c b�t ��u b�ng các bư�c tính l�c MM t�i kho�ng cách nh� nh�t gi�a các<br />
nguyên t� trong ph�i t� và các nguyên t� trong protein (t� 2,5 ��n 3,0Å), tương tác n�i<br />
phân t� c�a các nguyên t� trong ph�i t� và tương tác gi�a ph�i t� và protein �ư�c tính toán<br />
g�n �úng theo l�c MM. Trong �a s� các trư�ng h�p, l�c cơ h�c c� �i�n (MM) �ưa ph�i t�<br />
vào vùng lư�ng t� ��i v�i các nguyên t� c�a protein (kho�ng cách �ư�c ch�n �� b�t ��u<br />
tính lư�ng t�). Tuy nhiên, do y�u t� án ng� không gian, ph�i t� có th� không ti�n �ư�c ��n<br />
12<br />
vùng lư�ng t�. Nh�ng k�t qu� tính toán ch� ra r�ng, l�c lư�ng t� th� hi�n vai trò quan tr�ng<br />
trong kho�ng cách nh�, nó không ch� ��y ph�i t� ra xa mà còn có th� kéo ph�i t� l�i g�n<br />
t�o ra ph�c b�n (�ám g�n k�t - cluster). Bi�n thiên n�ng lư�ng t�o ph�c trong các tính toán<br />
h�i ph�c c�a s� g�n k�t urê lên protein 3ptb có giá tr� nh� hơn 0 �ư�c ch� ra trên b�ng 1.<br />
B�ng 1: N�ng lư�ng t�ng c�ng, bi�n thiên n�ng lư�ng tính theo công th�c (1), �� dài liên<br />
k�t N-H, kho�ng cách nguyên t� g�n nh�t gi�a ph�i t� và protein.<br />
Th� r Th� r<br />
AA E E Rmin AA E E Rmin<br />
t� (N-H) t� (N-H)<br />
(ASN) 54 -83,4461 -0,01928 1,0103 2,1156 (VAL) 72 -72,283 -0,00551 1,0152 2,4246<br />
(TYR) 131 -100,469 -0,01683 1,0661 2,1759 (LEU) 96 -77,7836 -0,00542 1,0103 2,4862<br />
(ASN) 31 -83,024 -0,01588 1,0103 2,0299 (GLY) 3 -56,3146 -0,00534 1,0103 2,0846<br />
(SER) 221 -72,6041 -0,01483 1,0103 2,0898 (PRO) 74 -71,6566 -0,00527 1,013 2,1054<br />
(SER) 32 -71,9079 -0,01443 1,0103 2,1468 (ASN) 77 -83,1092 -0,00496 1,0187 2,382<br />
(ASN) 61 -82,9816 -0,01403 1,0389 2,3664 (TYR) 5 -100,555 -0,0049 1,1362 2,4691<br />
(HIS) 40 -87,8849 -0,01384 1,0046 2,2751 (SER) 146 -72,582 -0,0047 1,0103 2,0277<br />
(VAL) 2 -71,7483 -0,01362 1,1532 2,4481 (THR) 218 -77,8007 -0,00431 1,0527 2,0194<br />
(GLY) 193 -56,1685 -0,01341 1,0155 2,3887 (SER) 78 -71,9518 -0,00427 1,1367 2,3534<br />
(PRO) 141 -71,2781 -0,01294 1,1722 2,0561 (SER) 108 -72,0498 -0,00412 1,0679 1,3434<br />
(LEU) 138 -78,2558 -0,01257 1,0486 2,0813 (GLN) 115 -88,249 -0,00404 1,1477 2,2021<br />
(ASN) 19 -83,436 -0,01247 1,0262 2,1558 (ASN) 10 -83,1356 -0,00375 1,037 2,4809<br />
(GLN) 155 -88,4039 -0,01244 1,1626 2,4013 (GLN) 33 -88,3229 -0,00366 1,0141 2,1203<br />
(GLY) 174 -56,3202 -0,01195 1,0103 2,0963 (TRP) 192 -105,144 -0,00353 1,1143 2,3343<br />
(GLY) 195 -56,3012 -0,01173 1,0103 2,1737 (SER) 44 -72,5785 -0,00349 1,0103 2,0727<br />
(SER) 75 -72,4789 -0,01046 1,0764 2,331 (ASN) 83 -83,027 -0,00349 1,1832 1,8746<br />
(ALA) 220 -61,7501 -0,01042 1,035 2,1714 (THR) 129 -78,0718 -0,00349 1,0198 2,0246<br />
(SER) 158 -72,4095 -0,01004 1,0752 2,1249 (GLY) 203 -56,3184 -0,00347 1,0303 2,4125<br />
(THR) 114 -77,6235 -0,00982 1,1472 2,3131 (GLY) 113 -55,6869 -0,00333 0,9974 2,3256<br />
(ASN) 82 -82,8661 -0,00979 1,0103 2,0558 (SER) 183 -72,5742 -0,0033 1,0263 2,4917<br />
(TYR) 76 -100,551 -0,00969 1,197 1,7786 (ASP) 145 -87,1526 -0,00295 1,0103 2,2046<br />
(TYR) 22 -100,848 -0,00946 1,0073 2,4534 (SER) 191 -72,4329 -0,00287 0,897 2,4732<br />
(GLY) 184 -56,2386 -0,00903 1,0099 2,4231 (ILE) 65 -77,799 -0,00283 1,1051 2,2612<br />
(HIS) 73 -87,676 -0,00902 1,0103 2,2162 (SER) 66 -72,3946 -0,00271 1,0293 2,1061<br />
(ASN) 56 -83,2534 -0,00898 1,0284 2,459 (SER) 127 -72,1558 -0,00266 1,0103 2,4044<br />
(ASN) 56 -83,2534 -0,00898 1,0284 2,459 (GLN) 63 -88,2792 -0,00265 1,0152 2,0954<br />
(VAL) 212 -72,6192 -0,00897 1,0074 2,2154 (ILE) 71 -78,2702 -0,00237 1,0103 2,0828<br />
(ASN) 222 -93,351 -0,00849 1,0103 2,3861 (GLN) 217 -88,9332 -0,00188 1,0103 2,0893<br />
(ILE) 103 -78,1792 -0,00832 1,0053 2,3397 (GLY) 8 -55,8104 -0,00149 1,0009 2,3276<br />
(TYR) 211 -100,955 -0,0082 1,01 2,4936 (SER) 104 -72,2643 -0,00122 1,1747 1,8264<br />
(GLY) 45 -56,1547 -0,00776 1,032 2,2871 (GLY) 21 -55,9871 -0,00109 1,0738 2,2653<br />
<br />
<br />
13<br />
(GLY) 154 -56,3211 -0,00772 1,0282 2,1157 (SER) 70 -72,3274 -0,00084 1,0103 2,3832<br />
(SER) 95 -71,7256 -0,00762 1,0706 2,4319 (SER) 171 -72,5869 -0,00076 1,0103 2,4186<br />
(SER) 144 -72,1318 -0,00757 1,0103 2,0958 (GLY) 4 -55,4601 -0,00075 0,9967 2,3721<br />
(GLN) 198 -88,2143 -0,00717 1,0233 2,0258 (SER) 68 -72,5791 -0,00063 1,0103 2,1119<br />
(SER) 176 -72,1651 -0,00713 1,0298 1,9192 (PRO) 153 -71,5333 -0,00059 1,0357 2,4981<br />
(GLN) 47 -88,9258 -0,00708 1,0151 2,0856 (TYR) 14 -100,723 -0,00057 1,0243 2,1667<br />
(PRO) 13 -71,4444 -0,00678 1,1608 2,2265 (ALA) 110 -61,8319 -0,00046 0,9945 2,1746<br />
(GLY) 128 -56,2736 -0,00678 1,0299 2,2764 (GLU) 167 -92,2668 -0,00045 1,0057 2,3364<br />
(SER) 194 -72,5899 -0,00643 0,999 2,4964 (SER) 126 -72,5554 -0,00038 1,025 2,238<br />
(GLN) 173 -88,7707 -0,0064 1,0083 1,997 (THR) 80 -77,7128 -0,00034 1,0633 1,9256<br />
(VAL) 181 -72,7768 -0,00633 1,0575 2,448 (ASN) 159 -83,4046 -0,00033 1,0103 2,1131<br />
(ASN) 79 -82,6442 -0,00583 1,1518 2,2507 (VAL) 57 -72,791 -0,00028 1,0103 2,01<br />
(ALA) 93 -61,7919 -0,00556 1,0103 2,0153 (SER) 102 -72,4568 -0,00026 1,0737 2,3475<br />
<br />
Trong b�ng 1, ch� ra các giá tr� bi�n thiên n�ng lư�ng ( E