Toán hc, khoa hc tính toán và khoa hc v s sng
Mt cách tương đối có th xem có ba loi toán có đặc đim và động lc phát trin khác nhau.
Mt là toán hc thun túy được nghiên cu vi động lc phát trin ni ti ca toán hc. Toán hc
thun túy phát trin nhanh và sâu theo các chuyên ngành đến mc nếu như các nhà toán hc kit
xut David Hilbert và Henri Poincaré thế k 19 có th hiu sâu được nhiu lĩnh vc toán hc
thi đó, thì ngày nay dường như không ai có th nhìn được bc tranh tng th v toán hc sâu
sc như vy. Hai là toán hc đại chúng, gm nhng kiến thc toán mi người cn cho cuc sng
và công vic hàng ngày. Điu đáng chú ý đây là giáo dc ca ta s đưa th toán đại chúng nào
đưa thế nào đến cho mi người thi máy tính và internet này? Ba là toán cho các khoa hc
khác, có ni dung và động lc phát trin t các vn đề c th ca các khoa hc này. Chính đây,
toán hc th hin vai trò cơ bn ca mình trong khoa hc và nh hưởng sâu sc đến s phát trin
ca xã hi.
Toán hc, khoa hc máy tính và khoa hc tính toán
Khoa hc máy tính (computer science) hay tin hc (informatics) gn đây được gi ta vi tên
công ngh thông tin (information technology) theo nghĩa rng ca t này. Khoa hc máy tính
được xem là “khoa hc v x lý thông tin t động bng máy tính đin t”. V bn cht, x l ý
thông tin là quá trình biến đổi d liu t dng này sang dng khác để thu được thông tin và tri
thc mi.
Ct lõi ca quá trình “biến đổi d liu” chính là các biến đổi toán hc, và do vy ct lõi ca khoa
hc máy tính cũng chính là toán hc. Mt người bn Pháp k khi là sinh viên tin hc, anh đã
bàng hoàng lúc thy giáo cho xem bc nh mt rng cây do không quân M chp Trường Sơn
trong chiến tranh Vit Nam, và qua các phép biến đổi toán hc lp cây xanh đã b bóc đi để l
bên dưới hình các xe tăng ca b đội min Bc. Đây là mt thí d v biến đổi d liu trong x
nh.
Trong khoa hc máy tính ta luôn gp các vn đề toán hc, t bài toán nn tng NP P (mt trong
by bài toán do Vin Toán hc Clay công b vào năm 2000, thách thc các nhà toán hc gii
trong thế k 21) đến các bài toán thiết yếu như lp lch biu thi gian thc, chng bùng n t hp
khi tìm kiếm li gii trong trí tu nhân to, các h hình thc để kim tra tính đúng đắn ca
chương trình trong công ngh phn mm, ...
Nếu như khoa hc máy tính được hiu như trên vi đối tượng nghiên cu là máy tính và các
phương pháp tính toán trên chúng, thì khoa hc tính toán (computational science) li là khoa hc
v vic dùng toán hc khoa hc máy tính để làm vic trong các ngành khoa hc khác. Dưới
tên gi này, có rt nhiu lĩnh vc c th như ngôn ng tính toán (computational linguistics), sinh
hc tính toán (computational biology) hoc tin sinh hc (bioinformatics), tài chính tính toán
(computational finance), khoa hc vt liu tính toán (computational materials science), vt lý
tính toán, hóa hc tính toán, …
Khoa hc tính toán gn đây được nhìn nhn rõ hơn và đang có mt s dch chuyn trong nhiu
ngành khoa hc t thc nghim ti kết hp thc nghim vi tính toán. Có được điu này do
nhiu yếu t, mt trong đó là tiến b rt nhanh ca khoa hc máy tính. Thí d như hin tượng
đặc sc v công ngh GPGPU (các b xđồ ha vi mc tiêu tng quát). Gn đây, các b
GPGPU ca Nvidia Telsa S2070 vi giá hơn 10 nghìn đôla, khi lp vào các máy tính thông
thường có th cho phép ta đạt đến tc độ
hàng nghìn t phép tính giây (Teraflops)
ca các siêu máy tính, chng hn máy
tính Cray XT-3 ra đời năm 2004.
Nhng thành phn cơ bn ca khoa hc
tính toán gm mô hình hóa (modeling)
nhm tìm các mô hình, tc các mô t
khái quát ca mt hin thc khi tách phn không ct yếu ra khi phn ct yếu, mô phng
(simulation) nhm to ra các vt th và hin tượng như tht trên máy tính, và phân tích d liu
(data analysis) nhm rút ra nhng kết lun cn thiết t các tp d liu.
Toán hc vi khoa hc v s sng và sinh-y hc
Sinh hc phân t cho ta biết mi tế bào trong hàng nghìn t tế bào ca mi người cha toàn b
h gen người, khong 20-25 nghìn gen. Các gen này tc các đon đặc bit ca các dãy DNA
nm trong các cp nhim sc th ca tế bào cha mt mã di truyn, điu khin s phát trin và
kế tha ca tế bào. Các protein – các dãy amino acid tng hp t DNA và RNA – là các thành
phn thiết yếu ca các t chc sng và hot động ca chúng. Sinh hc tính toán (computational
biology) hay tin-sinh hc (bioinformatics) là ngành khoa hc liên quan đến vic dùng các
phương pháp toán hc và khoa hc máy tính để nghiên cu các bài toán ca sinh hc.
Khoa hc v s sng bao gm tt c các lĩnh vc khoa hc liên quan đến vic nghiên cu các
sinh vt, trong đó sinh hc và y hc là lĩnh vc trung tâm. Nhìn tng th, khoa hc s sng bao
gm nghiên cu các cp độ: phân t, tế bào, sinh vt sng, qun th, và các h sinh thái. Đặc
trưng ct lõi ca khoa hc v s sng trong thế k 21 là vic nghiên cu đang tr nên có tính
định lượng và da trên d liu. Nhng điu này có được nh vào:
S phát trin và s dng rng rãi các thiết b t động đã to ra rt nhiu d liu tt c các
cp độ ca khoa hc v s sng. Lượng d liu này tăng nhanh theo hàm mũ, gn đây
thường được to ra bi các t chc và đề án ln, lưu tr trong các cơ s d liu cho phép
mi người cùng s dng.
Thành công ca đề án quc tế v h gen người (human genome project) vào năm 2003 đã
to ra nhng ngun d liu trung tâm ca sinh hc.
Các h máy tính hiu năng cao, được ni mng, có trên bàn ca các nhà sinh hc và toán
hc.
Ta đim qua đây nhng thách thc chính ca toán hc trong khoa hc v s sng các cp độ
khác nhau k trên:
(1) Hiu v các phân t: Ba đại phân t đóng vai
trò quan trng nht là DNA, RNA và protein.
Mi phân t DNA hay RNA là mt dãy ca 4
đơn phân t (ký hiu bi các ch các A, G, C,
T hoc U) và mi protein là mt dãy ca 20
amino acid. Các lp bài toán ch yếu cn gii
quyết để có th hiu các phân t gm: (a) phân
tích dãy, (b) phân tích cu trúc phân t, (c)
động hc ca phân t, và (d) tương tác phân t.
Mt s bài toán đây là các thách thc ln cn
s tham gia ca toán hc, như vic d đoán s
xon cun ca protein t dãy amino acid và
thông tin v môi trường (protein folding) được xem là mt trong nhng vn đề hóc búa nht
ca sinh hc và vn chưa có li gii, hay sp thng hàng n dãy (n > 2) là bài toán t hp ti
ưu NP-đầy đủ. Bài toán xác định và xây dng các mng tương tác protein-protein (liên quan
đến lý thuyết đồ th, tôpô, và thng kê) là nn tng để nghiên cu nhiu cơ chế ca bnh tt
và chế thuc.
(2) Hiu v tế bào: Vic này đòi hi ta phi hiu cu trúc các đại phân t trong tế bào, các cơ chế
và mu dng không gian, thi gian ca động hc tế bào, liên quan gia động hc và chc
năng ca tế bào, liên quan gia tế bào và các t chc sng khác mc cao hơn, như mô và
các b phn khác. Hiu v tế bào thm chí còn khó hơn vic hiu các phân t do ta không có
các ngun thông tin như các dãy đơn phân t hay amino acid ca DNA, RNA hay protein.
Vi s tiến b rt nhanh ca công sut máy tính và các thiết b đo đạc y sinh, ta có th xây
dng được hp lý và chính xác các mô hình v động hc ca DNA và protein, trong khi đó
các mô t định lượng ca tế bào mi ch thc hin được mt cách xp x. Thách thc ch
yếu v phân tích toán hc ca tế bào s không nm vic tính toán mà vic mô hình được
nhng th con người quan tâm. Nhng thách thc này mt vài thp k ti chính là vic
thiết lp mt cách h thng các mô hình ca cu trúc và động hc tế bào, xut phát t các d
liu phc tp thu được và các thc nghim v các mô hình này. Đã có mt lch s v nghiên
cu toán hc cho các mô hình tế bào. Nhng bài toán ch yếu được theo đui gm: (a)
nghiên cu cu trúc tế bào, (b) phát hin mng tế bào và chc năng ca chúng, (c) t mng tế
bào đến chc năng tế bào, và (d) t tế bào đến mô. Trng tâm ca sinh hc tế bào ti đây s
là s chuyn dch t các mô t v hin tượng sang các mô hình d đoán tương thích vi
nhng lượng d liu rt ln. Các nghiên cu ti đây s nhn mnh s kết hp cht hơn gia
thc nghim, xây dng và đánh giá mô hình cũng như tích hp d liu.
(3) Hiu v các vt sng: Phân tích toán hc đây liên quan hai vn đề chính, mt là để hiu các
b phn ca mt sinh vt tham gia vào h thng phc tp ca sinh vt này ra sao, và hai là
liên h sinh hc gia tế bào và các b phn ca sinh vt. Tm quan trng ca các mô hình
toán được tha nhn rng rãi trong nghiên cu các t chc rt phc tp ca sinh vt. Nhiu
thí d cho thy khi người làm thc nghim và lý thuyết ngi cùng nhau, h đã có nhng phát
minh quan trng vn không th làm mt mình. Chng hn như s dao động trong chu trình tế
bào dn đến vic phân chia tế bào ra sao hay virus HIV được sinh ra và mt đi trong tế bào
như thế nào? Các mô hình toán hc có trong tt c các hướng nghiên cu để hiu v s sng:
(a) sinh lý hc tim mch, (b) sinh lý hc tun hoàn, (c) sinh lý hc hô hp, (d) sinh lý hc ni
tiết, (e) hình thái hc và s hình thành các mu dng di truyn, (f) s vn động, (g) quá trình
nhim HIV, và (h) ung thư (được tiến hành gen, tế bào và u). cp độ này, thí d v
nhng vn đề cn s đóng góp ca khoa hc tính toán là xác định con đường thuc đi ti tế
bào đích, cơ chế hot động ca thuc, s phát trin và phân chia ca các qun th tế bào, tiến
trin ca s kháng thuc. Vic dùng các mô hình toán hc để mô t quá trình hot động ca
các h thng chc năng sinh lý s ci thin hiu biết ca ta v tương tác động gia các quá
trình này và giúp cho s chuyn dch t khoa hc cơ bn đến các ng dng cha bnh, cũng
như kh năng xut hin các ni dung mi ca toán hc.
(4) Hiu v các qun th: Các ni dung cp độ này đều rt cn đến toán. (a) V di truyn hc
qun th: Cho đến cui nhng năm 1960 các nghiên cu toán ch yếu là phân tích suy din
vi các mô hình di truyn và chn lc t nhiên da trên gi thuyết các qun th sinh hc đã
tiến hóa t mt hai nơi trên trái đất. Gn đây đã có s dch chuyn qua các mô hình quy np
nhm xây dng lch s tiến hóa và bn cht ca quá trình tiến hóa, vi mc tiêu hiu được
các dng ca biến đổi di truyn và các dng ca khác bit di truyn gia các loài. (b) V các
khía cnh sinh thái ca các qun th: Ngay t 1838, Verhulst đã phát trin mt s mô hình v
tăng dân s vi các mô hình toán hc v mt độ, trong đó phương trình logistic vn là mô
hình chun dùng ngày nay. Rt nhiu khía cnh khác liên quan đến các vn đề sinh thái ca
qun th đang thách thc và ch đón đóng góp ca toán hc, như các yếu t không gian, thi
gian, địa lý, khí hu, sông ngòi rng bin. (c) V tng hp sinh thái và tiến hóa: Hin nay
nghiên cu được tp trung nhiu vào các nguyên nhân liên quan đến s sng và không có s
sng trong đa dng sinh hc. Rt nhiu thách thc toán hc khi các quá trình sinh thái và tiến
hóa được xem xét đồng thi.
(5) Hiu v các cng đồng và các h sinh thái: Mt cng đồng sinh thái là mt t tp các qun
th ca nhiu loài (cây ci, động vt, vi khun, …) ti mt nơi và cùng mt thi gian. S kết
hp ca mt cng đồng và mt môi trường thường được xem là mt h sinh thái. Ta vn
thường nói v cân bng sinh thái hoc mt cân bng sinh thái. Toán hc đóng mt vai trò
thiết yếu trong các khái nim ca sinh thái hc cng đồng. T quãng 50 năm tr li đây, có
nhiu mô hình toán hc và kết qu lý thú v liên quan gia tính đa dng và tính n định ca
mt cng đồng sinh thái, hoc rng hơn v mi quan h gia hiu qu sn xut, tính n định
và tính đa dng. Thách thc toán hc tiêu biu đây là các mô hình cho phép mô t vi
nhiu yếu t như tính phi tuyến, hành vi không cân bng, kết cu di truyn, không gian, nhân
khu hc, và tính ngu nhiên ca môi trường.
Nhiu người cho rng toán hc s nh
hưởng đến s phát trin ca sinh hc và y
hc trong thế k này nhiu như s nh
hưởng ca toán đến vt lý trong thế k
va qua. Sinh hc hin đang bước
chuyn pha t cách nghiên cu thc
nghim ti vic kết hp cách tiếp thc
nghim và tính toán để tìm hiu các hin
tượng phc tp ca s sng. Y-sinh hc,
tc vic nghiên cu y hc vi tri thc và
tiến b ca sinh hc phân t, đang dn tr
thành mt hướng đi ch đạo trong nghiên
cu y hc.
Dưới đây là thí d v vài bài toán y sinh chúng tôi tham gia gii quyết trong 10 năm qua. T mt
cơ s d liu lâm sàng rt ln thu thp trong 20 năm (1980-2000) v bnh gan bnh vin đại
hc Chiba (Nht Bn) và nhiu cơ s d liu v thông tin di truyn, mt s bài toán nghiên cu
v viêm gan được đặt ra. Mt bài toán là tìm phương pháp tính toán để đoán nhn cp độ bnh
viêm gan (có 5 cp độ t F0 đến F4) khi ch da vào d liu xét nghim máu nhưng không làm
sinh thiết như cách hin nay. Bài toán khác v vic tìm nguyên nhân mc phân t ti sao nhng
người bnh viêm gan C li kháng thuc hoc không kháng thuc (hin cách điu tr viêm gan C
là phi hp hai loi thuc interferon và ribavirin, tuy nhiên s người kháng thuc vn trên 50%).
Đây là bài toán thi s khi gn đây gii nghiên cu cho rng protein NS5A, mt phn ca virus
viêm gan C, chính là nơi liên quan nhiu nht đến vic nhn hay kháng các loi thuc trên. Bài
toán th ba là vic tìm ra các gen gây bnh. Hu hết các bnh ca con người do ri lon gen, và
mt s trong 20-25 nghìn gen ca người đã được xác định là nguyên nhân gây ra mt s bnh.
Bài toán đặt ra cho tính toán là nhng gen nào trong s còn li cũng gây ra bnh?
Trong hp tác quc tế v nghiên cu y hc, nhiu khi chúng ta ch đóng vai trò cung cp d liu
vì không làm ch được các phương pháp phân tích toán hc. Tuy nhiên, có nhng tình hung
buc chúng ta phi t làm, như khi mt bnh nhit đới bùng phát hay khi dch ln tai xanh xut
hin khp nơi,... Trong mt chuyến thăm gn đây ti Bnh Vin Nhi Trung Ương, chúng tôi vô
cùng khâm phc khi bnh vin đã xây dng các phòng thí nghim v sinh hc phân t, v di
truyn, đã có th đo đạc xác định được d liu t các mu ca người bnh, dù công vic khám
cha bnh đây bn rn vô cùng. Nếu các nhà toán hc, tin hc phi hp được vi các bác sĩ
nghiên cu ca bnh vin, chúng ta có th làm được nhiu nghiên cu thiết thc và giá tr cao
như bt k nơi nào.