64 Cao Xuân Tun, Nguyn Mnh Hùng, Võ Trung Hùng
MT MÔI TRƯỜNG THNG NHT ĐỂ BIU DIN, LƯU TR, SON THO
VÀ X LÝ CÁC CÔNG THC TOÁN HC
A UNIFIED ENVIRONMEN FOR REPRESENTATION, STORAGE, EDITING AND
HANDLING OF MATHEMATICAL FORMULA
Cao Xuân Tun2, Nguyn Mnh Hùng1, Võ Trung Hùng2
1Hc vin Công ngh Bưu chính Vin thông; mhnguyen@ptit.edu.vn
2Đại hc Đà Nng; cxtuan@moet.edu.vn; vthung@dut.udn.vn
Tóm tt - Trong bài báo này, chúng tôi trình bày kết qu nghiên
cu v vic đề xut và xây dng mt môi trường thng nht đ
biu din, lưu tr, son tho và x lý các tài liu có cha công thc
toán hc. Chúng tôi đề xut mt không gian thng nht đ
bi
u
din và lưu tr các công thc toán hc da trên nn tng ca tiêu
chun MathML, đây là mt tiêu chun được W3C khuyến cáo s
dng cho tài liu có cha các công thc toán. Đặc bit, môi trường
này cho phép người s dng d dàng thc hin các chc năng tìm
kiếm, sao chép và chuyn đổi các công thc toán hc gia các
phn mm son tho khác nhau như WinWord, LaTex,... Môi
trường này có nhiu ưu đi
m so vi các phn mm son tho hin
nay và to tin đề để xây dng các h thng tìm kiếm tài liu thông
qua các câu truy vn có cha công thc toán hc.
Abstract - In this paper, we present our research on proposing
and building a unified environment for representation, storage,
editing and handling of documents containing mathematical
formulas. We have proposed a unified space to represent and store
the mathematical formula based on the standard MathML This is
the standard recommended by W3C to use for documents that
contain mathematical formulas. In particular, this environmen
t
enables users easily to perform functions such as searching,
copying and converting the mathematical formula between
different editing software programs such as WinWord, LaTex, ...
This environment has many advantages compared with curren
t
editing software ,and creates prerequisites for building documen
t
search system via the query containing mathematical formulas.
T khóa - công thc toán hc; biu din d liu; tiêu chun lưu
tr; son tho văn bn.
Key words - mathematical formula; data representation; storage
standards; text editing.
1. Đặt vn đề
Trong nhng năm gn đây, cùng vi s phát trin mnh
m ca mng Internet và công ngh Web là sng n
thông tin s. S lượng người s dng và lượng thông tin
sn sinh ra trên mng Internet gia tăng rt nhanh và chúng
ta có th tìm thy hu hết các thông tin cn thiết khi có nhu
cu. Đặc bit, lượng thông tin liên quan đến khoa hc, phc
v hc tp, nghiên cu cũng gia tăng nhanh chóng và
phong phú v lĩnh vc. Vì vy, vic khai thác hiu qu các
tài liu nói chung và các tài liu khoa hc nói riêng trên
Internet có ý nghĩa quan trng trong phát trin khoa hc và
kinh tế nó góp phn đáng k vào vic nâng cao cht
lượng hc tp và nghiên cu. Theo s liu thng kê, trong
quá trình hc tp và nghiên cu con người đã chi phí mt
lượng ln thi gian cho vic tìm kiếm, phân tích và tng
hp các tài liu hin có. Các công c tìm kiếm ph biến
hin nay như Google, Yahoo, Bing… ch h tr mnh vic
tìm kiếm các d liu dưới dng văn bn và hình nh, công
vic tìm kiếm các d liu đặc bit như các công thc toán
hc thì các công c này hu như chưa h tr.
Hin nay, đã có nhiu công c cho phép son tho và
qun lý các công thc toán hc, nhưng vic tìm kiếm còn
gp nhiu khó khăn. Để tìm kiếm mt công thc toán hc,
chúng ta cn có mt cơ chế thng nht để mô t, lưu tr
tìm kiếm theo ng nghĩa tương ng vi công thc đó.
Tương t, đã xut hin mt s công c h tr vic biu din
các công thc toán hc trên môi trường Web, tuy nhiên các
công c này chưa xác định được chun mô hình và cách
biu din chung. Do s đa dng v cách biu din công
thc toán hc trong các tài liu khoa hc, dn đến khó khăn
trong vic din gii công thc cn tìm kiếm đối vi người
dùng và so sánh s tương đồng gia chúng.
Trong bài báo này, chúng tôi đề xut mô hình phù hp,
phát trin các b công c để son tho công thc, son tho
chú thích và tìm kiếm các công thc toán hc cũng như các
gii pháp lưu tr, qun lý và khai thác d liu có cha công
thc toán hc trong các tài liu khoa hc, đặc bit là trên môi
trường Web. Kết qu chúng tôi đã phát trin thành công mt
h son tho văn bn h tr đầy đủ các chc năng liên quan
đến công thc toán hc gm: son tho, sao chép, tìm kiếm
và chuyn đổi qua li vi các phn mm son tho khác.
Ni dung bài báo được t chc thành 5 mc chính. Mc
1 gii thiu lý do nghiên cu và thông tin chung ca bài
báo; mc 2 trình bày mt s kết qu nghiên cu liên quan;
mc 3 trình bày gii pháp đề xut bao gm mô hình tng
quát, lưu tr, son tho và các gii pháp để sao chép, tìm
kiếm, chuyn đổi,...; mc 4 trình bày kết qu th nghim;
mc 5 trình bày kết qu đánh giá; và cui cùng là kết lun
để tng kết ni dung đạt được, ý nghĩa ca nghiên cu và
hướng phát trin.
2. Mt s nghiên cu liên quan
Các nghiên cu liên quan đến các tài liu cha công
thc toán hc tp trung vào 3 hướng chính: 1) Các tiêu
chun để lưu tr công thc toán hc trong các văn bn đin
t; 2) Son tho và hin th các công thc toán hc trên các
văn bn; 3) Tìm kiếm công thc toán hc. Các nghiên cu
trên ch yếu được thc hin bi các nhà khoa hc nước
ngoài, Vit Nam các nghiên cu v vn đềy chưa nhiu
và kết qu còn khá khiêm tn.
Vic nghiên cu các tiêu chun để có th lưu tr và trao
đổi các văn bn có cha công thc toán hc đã được các nhà
khoa hc, các công ty nước ngoài quan tâm t rt sm như:
tiêu chun TeX/LaTeX (đề xut bi Donald Knuth t năm
1969 và đến năm 1991 đã có nhiu phiên bn ra đời và h
tr nhiu ngôn ng khác nhau) [1], [2]; tiêu chun MathML
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGH ĐẠI HC ĐÀ NNG, S 1(110).2017 65
(phát trin và ph biến rng rãi bi W3C - World Wide Web
Consortium do Tim Berners-Lee làm Ch tch) [3].
Bên cnh các tiêu chun lưu tr, vic son tho và x
lý các công thc toán hc được nhiu nhà khoa hc quan
tâm. Hàng lot các gii pháp đã được đề xut và cho ra đời
các công c son tho, xng thc toán như:
MathMagic (phát trin bi InfoLogic, Inc) [3],
GtkMathView (phát trin bi Luca Padovani, Đại hc
Torino, Ý) [4],…
Ngoài ra, vic nghiên cu các công c cho phép có th
lưu tr, lp ch mc, tìm kiếm các công thc toán đã và
đang được nhiu nhà khoa hc, t chc đầu tư nghiên cu
như: WolframAlpha (t động x lý và tính toán giá tr các
biu thc toán hc) [4], [5], Symbolab (tìm kiếm tài liu có
cha công thc toán cho trước) [6],…
Cho đến nay, đã có mt s nghiên cu nhm đưa tiếng
Vit vào TeX và mt sn phm tiêu biu cho hướng này là
VnTeX. VnTeX h tr tiếng Vit cho LaTeX và TeX thun
thông qua các gói macro và phông ch. VnTeX thường
được đóng gói kèm trong các bn phân phi TeX như
teTeX, TeXLive... [8]. Ngoài ra, mt cách son tho công
thc toán và tiếng Vit trong TeX có th được v bng các
lnh ca TeX. Hin đã có mt s nghiên cu liên quan đến
x văn bn tiếng Vit nhưng không nhiu và chưa chú
trng đến x lý các công thc toán hc trên văn bn [9].
3. Gii pháp đề xut
3.1. Mô hình tng quát
T nhu cu thc tin ca vic son tho, tìm kiếm công
thc toán hc trên văn bn và nhng khó khăn do s khác
nhau v chun định dng nên không th sao chép trc tiếp
công thc gia hai trình son tho, chúng tôi đề xut xây
dng mt môi trường son tho có th gii quyết được các
vn đề trên.
Hình 1. Các mô hình hin nay
Hình 1 minh ha thc trng này: công thc toán hc
được son tho trong môi trường MS Word thì ch có th
lưu tr trong văn bn MS Word mà không th sao chép hay
lưu tr sang mt công c son tho hay h thng lưu tr
khác như MathType, LaTeX... và ngược li.
T thc tế này, chúng tôi đề xut mt gii pháp đồng
b biu din và lưu trng thc toán hc như minh ha
trong Hình 2. Theo đó, mô hình bao gm hai mc x lí: (i)
mc x lí công thc toán trong văn bn nm mc thp,
và (ii) mc x lí các văn bn cha công thc toán, nm
mc cao hơn. Mc cao này s được trình bày mc sau.
mc x lí công thc toán trong văn bn, các công
thc toán hc s có mt h thng son tho đồng b chung,
mt h thng lưu tr chung, và mt h thng hin th
chung. Khi đó, có hai vn đề ny sinh:
- Làm sao để chuyn đổi các công thc toán hc ti
trường son tho truyn thng ban đầu sang môi trường
son tho đồng b chung này?
- Làm sao chuyn đổi các công thc toán hc ti
trường lưu tr truyn thng ban đầu sang môi trường lưu
tr đồng b chung này?
Để gii quyết hai vn đề này, chúng tôi đề xut xây
dng mt b chuyn đổi gia cách biu din các công thc
toán hc t dng ban đầu sang dng đồng b chung, và
ngược li, chuyn đổi cách biu din các công thc toán
hc t dng đồng b chung sang các dng biu din đang
tn ti trong thc tế hin nay.
Hình 2. Mô hình đề xut chi tiết
Như vy, mô hình đề xut ca chúng tôi bao gm ba
thành phn được đề xut mi:
- Mt là b son tho công thc toán hc đồng b
chung;
- Hai là h thng biu din và lưu trng thc toán
hc đồng b chung;
- Ba là b chuyn đổi gia các cách biu din công thc
toán hc truyn thng đang tn ti sang dng biu din
đồng b chung, và ngược li.
Trong mô hình này, có mt s vn đề cn phi x
liên quan đến công thc và chúng tôi đề xut như sau.
3.2. Biu din và lưu tr công thc toán vi MathML
MathML [1] là mt ng dng ca XML để th hin ký
hiu và công thc toán hc vi mc đích rng là phương
cách trao đổi thông tin toán hc trên máy tính (để hin th
cũng như để tính toán) và mc đích hp là hin th tài liu
toán hc trên môi trường Web.
Đối vi hin th trên môi trường Web, cu trúc XML
không ngn gn như TeX, nhưng có th được d dàng s
dng bi các trình duyt, cho phép hin th ngay lp tc
công thc toán hc mt cách đẹp mt, đồng thi truyn ti
ý nghĩa toán hc cho các phn mm tính toán.
MathML được h tr bi các phn mm văn phòng như
MS Word, OpenOffice.org cùng vi các phn mm tính
toán k thut như Maple, Mathematica, và MathCad trên
các nn nhiu h điu hành khác nhau như Linux,
Windows,
3.3. Son tho công thc toán vi Amaya
Để son tho văn bn, chúng tôi đề xut s dng phn
mm mã ngun m Amaya [10]. Amaya là phn mm theo
kiu WYSIWYG (What You See Is What You Get), người
66 Cao Xuân Tun, Nguyn Mnh Hùng, Võ Trung Hùng
dùng có th va son tho và va có th xem hin th kết
qu trên trình duyt. Các b công c ca Amaya chế độ
bng la chn tương t như MS Word, OpenOffice.Org
Math,...
3.4. Chuyn đổi công thc toán gia MathML và các
dng khác
Vic chuyn đổi định dng gia MathML và các định
dng khác cho công thc toán hc không gp nhiu khó
khăn khi trin khai trong thc tế. Vn đề là tìm ra s tương
đương gia MathML và chun biu din tương ng trong
TeX, LATEX, MS Word,... để to ánh x khi chuyn đổi.
Ví d, khi chuyn đổi t MathML sang TeX thì mô hình
tng quát như sau:
Hình 3. Mô hình chuyn đổi công thc
Mt đối tượng trong MathML được biu din theo mt
cu trúc được qui định trong mô hình đối tượng tài liu
(DOM) qui định bi W3C [3].
Để thc hin vic chuyn đổi gia MathML và TeX, ta
cn có mt tp tin lưu tr thông tin ánh x mi phn t ca
MathML sang mt phn t tương ng trong TeX. Tp tin
ánh x là mt thành phn có vai trò rt quan trng trong
quá trình chuyn đổi. Nó mô t s tương ng mt – mt
gia mi phn t ca MathML và TeX. Tp tin ánh x cha
mt XML - form và bao gm c mu để biu din c
MathML và TeX.
Cú pháp chung để mô t s tương ng ca các đối tượng
trong MathML và TeX được viết như sau:
<pat:template>
<pat:TeX op="\[TeX macro]"
parameters=" TEX expression"/>
<pat:mml op="mml-element"
mode="math|TeXt|spec">
. . .
[MathML expression]
. . .
</pat:mml>
</pat:template>
3.5. Sao chép công thc toán trong MathML
Amaya là mt trình son tho đồng thi là trình duyt
Web [10]. Vì vy, mi d liu được to ra phi tuân th
theo định dng ca mt trang XHTML. Amaya có kh năng
t sinh th khi sao chép d liu dng chui t ng dng
khác vào trình duyt, nhưng không th t sinh ra các th
ca SVG khi sao chép d liu hình nh t ng dng khác
sang.
Vì vy, chúng tôi đề xut xây dng mt chương trình
thường trú và tích hp vào Amaya để cho phép sao chép
công thc được son tho t mt ng dng khác sang trình
duyt Amaya .
Ý tưởng đề xut là tiến hành sao chép công thc dưới
dng Text vào ClipBoard, ri sau đó x lý trên ClipBoard
để chuyn sang ngôn ng đánh du MathML và cui cùng
chúng ta có th dán vào Amaya.
Cách hot động ca chương trình này như sau:
Hình 4. Mô hình sao chép công thc
V sao chép công thc, chương trình thường trú Math
Clipboard Converter s nhn dng b mã hóa đang dùng và
t động chuyn v chun MathML. Ví d minh ha dưới đây
cho thy chương trình đang thông báo đã nhn dng được
chui d liu ca công thc và thc hin chuyn đổi d liu
sang MathML. sơ đồ trên, khung bên trái là ngôn ng đánh
du công thc toán hc trong văn bn ngun và khung bên
phi là đon mã phát sinh t động khi thc hin lnh dán t
Clipboard và hin th công thc tương ng vi mã lnh.
3.6. Tìm kiếm công thc toán trong tài liu
Để thc hin chc năng tìm kiếm công thc toán hc,
chúng tôi đề xut s dng phương pháp đối sánh mu
(Pattern Matching). Bài toán yêu cu ta tìm ra mt hoc
nhiu v trí xut hin ca mu trên mt văn bn. Trong đó
mu và văn bn là các chui có độ dài m và n (m n). Vic
đối sánh mu din ra vi nhiu ln th trên các đon khác
nhau ca văn bn. Trong đó ca smt chui M ký t
liên tiếp trên văn bn. Mi ln th chương trình s kim tra
s ging nhau gia mu vi ca s hin thi. Tùy theo kết
qu kim tra ca s s được dch đi sang phi trên văn bn
cho ln th tiếp theo.
Nói chung, tìm kiếm các công thc toán hc là mt vn
đề rt khó khăn vì các ký hiu toán hc ph thuc vào ng
cnh. Ví d như biu din h s nh thc có thđến mt
lot các ký hiu mà ph thuc vào bi cnh như n
k
⎝⎠
,
k
n
C
đều có cùng mt nghĩa là
()
!
!!
n
knk. Trong vic tìm kiếm
mt công thc đây ch mun ly tt c hình thc ch
không phân bit các ký hiu.
Để thc hin đối sánh mu, chúng ta có th dùng
phương pháp đối sánh mu chính xác hoc đối sánh mu
xp x.
Bài toán đối sánh mu chính xác có th mô t như sau:
Cho xâu mu P độ dài m (P = P1P2 ... Pm Pi là ký t) và
văn bn T độ dài n (T = T1T2 ... Tn – Ti là ký t). Tìm tt c
các v trí xut hin ca mu P trong xâu T.
Bài toán đối sánh mu xp x có th t như sau: Cho
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGH ĐẠI HC ĐÀ NNG, S 1(110).2017 67
xâu mu P độ dài m và văn bn T độ dài n. Xác định độ
tương t gia hai xâu P và T. Như vy, vic tìm s xut
hin ca mt mu trong văn bn, trong đó s “khp” gia
mu và s xut hin ca nó có th chp nhn “k li” (k là
mt gii hn cho trước). Có th k ra mt vài kiu “li”,
như nhng li đánh máy hay li chính t trong h thng
trích rút thông tin,… Vì trong các h thng tin hc khó có
th tránh được các “li” nên vn đề tìm kiếm xp x càng
tr nên quan trng.
Bài toán trên chúng ta có th đưa vm xâu con chung
dài nht (hay khúc con chung dài nht): Mt xâu w là xâu
con hay khúc con (substring or factor) ca xâu T nếu T =
uwv (xâu u, v có th rng). Xâu w là khúc con chung ca
hai xâu P, T nếu w đồng thi là khúc con ca P và T. Khúc
con chung dài nht ca hai xâu P và T.
Đối vi tim kiếm công thc toán, chúng tôi đề xut s
dng thut toán tìm kiếm xp x vic thay đổi th t các
thành phn trong công thc không có nhiu ý nghĩa như
trong ngôn ng t nhiên. Ví d : trong ngôn ng t nhiên
thì th t ca 2 t “trường”“hc” s to ra 2 cm t
có ý nghĩa hoàn toàn khác nhau“trường hc”“hc
trường”. Tuy nhiên, vi công thc toán thì vic viết “x+y”
hoc “y+x” là có nghĩa như nhau. Mt khác, tìm kiếm xp
x cho phép tìm kiếm được các công thc có cùng ý nghĩa
nhng cách viết khác nhau.
Thut toán tìm kiếm xp x được mô t như sau:
Input: Mu Pđộ dài m; văn bn T có độ dài n.
Output:
- Khúc con chung dài nht gia P và T
- V trí chui mu Substr trong T
Thut toán:
Char chuoicon (char *p, char *T, int m)
{ int len,k, i, j;
Char str[m], tam[m];
len = 1 ;
str=’’ ;
while ( len <= strlen(s1))
{
k=strstr(p,T);
j = 1;
tam=’’;
for ( i= k; i<=strlen(p); i++)
if (p[j]=T[i])
{
Tam[j]=T[i];
j++;
}
Else
if (strlen(tam)>strlen(str))
for (i= 1, i<=j,i++)
str[i]=tam[i];
len ++;
}
}
3.7. Tìm kiếm tài liu cha công thc toán
Hình 5. Kiến trúc modul tìm kiếm văn bn cha công thc toán
Ni dung phn này s trình bày gii pháp tìm kiếm
nhng tài liu hoc trang Web được to ra t mô hình biu
din và lưu tr đồng b công thc toán hc trong văn bn
như đã được đề xut trong phn trước. Mô hình tìm kiếm này
có hai quá trình chính, đó là to ch mc cho các tài liu và
tìm kiếm khi có yêu cu truy vn ca người dùng. Mô hình
tng quát ca quá trình to ch mc và tìm kiếm nh 6.
Tun t các bước thc hin trong mô hình này din ra
theo hai giai đon như sau:
- Giai đon 1: Thu thp văn bn và lp ch mc văn
bn. Quá trình này thu thp các văn bn cha công thc
toán hc t nhiu ngun khác nhau t Internet, t nhiu
dng văn bn khác nhau như PDF, XHTML... Sau đó đánh
ch mc các văn bn theo đặc trưng ca văn bn và lưu vào
CSDL ch mc văn bn. Trước khi trích các đặc trưng ca
văn bn, các ni dung cha công thc toán hc trong văn
bn được tách ra và chuyn đổi v dng thng nht nh b
chuyn đổi công thc toán hc.
- Giai đon 2: Tìm kiếm và hin th kết qu. Giai đon
này cho phép người dùng nhp t khóa hoc công thc toán
hc vào để tìm kiếm. H thng sau đó s tìm và tính đim
tng văn bn liên quan đến công thc mun tìm trong
CSDL ch mc các văn bn. Kết qu s được hin th lên
giao din cho người dùng.
Như vy, trong mô hình đề xut cho chc năng tìm
kiếm công thc toán hc trong văn bn, có 3 mô-đun: Lp
ch mc văn bn, chuyn đổi công thc toán hc, tìm kiếm
và hin th kết qu.
4. Th nghim
Trên cơ s đề xut, chúng tôi đã phát trin mt môi
trường son tho các tài liu có chc công thc toán hc,
bao gm c son tho tài liu Web. Môi trường được phát
trin da trên: tiêu chun lưu tr MathML, phn mm mã
ngun m Amaya và các mô-đun do chúng tôi phát trin
mi tích hp vào để phc v son tho, tìm kiếm, sao chép
và chuyn đổi công thc toán vi các môi trường son tho
khác.
68 Cao Xuân Tun, Nguyn Mnh Hùng, Võ Trung Hùng
Giao din chính ca môi trường son tho bao gm:
- Thc đơn cho phép người s dng chn thc hin các
thao tác x.
- Khung màn hình son tho để cha ni dung tài liu.
- Khung công c bên phi để h tr định dng và gõ các
công thc toán.
Hình 6. Giao din chính màn hình son tho
Trong môi trường son tho này, ngươi dùng có th
xem công thc toán dưới dng trc quan hoc mã MathML.
Hình 7. Biu din công thc toán
Hình 8.d v tìm kiếm công thc trong tài liu
Người s dng cũng dng tìm kiếm các công thc
toán:
Nhìn chung, môi trường do chúng tôi phát trin đã cơ
bn đáp ng các yêu cu cho người s dng khi cn son
tho bt k mt tài liu nào có cha công thc toán hc và
h tr các thao tác x khác.
5. Đánh giá
5.1. D liu đánh giá
B d liu đánh giá được tng hp và xây dng t
ngun gm các bài báo, báo cáo, đề tài nghiên cu khoa
hc, các sách đin t v toán hc ti Đại hc Đà Nng, Giáo
trình ebook và mt s các tài liu khác được thu thp trên
mng. Bng 1 mô t v kho d liu được s dng trong
nghiên cu này như sau:
Bng 1. Mô t d liu thc nghim
Tiêu chí Mô t
Ngun d liu Thư vin Đại hc Đà nng
S lượng 580 file tài liu: giáo trình, báo cáo,
bài báo khoa hc,…
Định dng .doc, .docx, .pdf, .html, .LaTeX
D liu bao gm 580 văn bn t nhiu lĩnh vc khác
nhau (Bng 2): toán, vt lí, công ngh thông tin, đin t
t động hóa...
Bng 2. Bng phân loi d liu
Kiu tài liu S lượng
Toán 210
Vt lí 17
Công ngh thông tin 140
Đin, đin t t động hóa 152
Các ngành khác 61
Tng 580
Các tài liu này khi th nghim trên Semantic Web đã
được chuyn đổi và lưu tr trên Ontology vi các lp là các
kiu tài liu và b sung mô t tóm tt v tài liu, mô t v
các công thc toán có cha trong tài liu.
5.2. Phương pháp
Kch bn đánh giá
Chúng tôi thc hin đánh giá vi hai kch bn như sau:
- Kch bn 1: Nhp truy vn dưới dng ni dung văn
bn.
- Kch bn 2: Nhp truy vn dưới dng công thc: công
thc được gõ trc tiếp t công c WIRIS trên h thng.
Tham s đầu ra
Chúng tôi quan sát các tham s đầu ra như sau:
- S mu đúng tr v (TP - true positive): s lượng văn
bn có cha công thc truy vn xut hin trong kết qu tìm
kiếm.
- S mu sai tr v (FP - false positive): s lượng văn
bn KHÔNG cha công thc truy vn nhưng vn xut hin
trong kết qu tìm kiếm.
- S mu đúng không tr v (FN - false negative): s
lượng văn bn có cha công thc truy vn, nhưng li
KHÔNG xut hin trong kết qu tìm kiếm.
- S mu sai không tr v (TN - true negative): s lượng
các văn bn KHÔNG cha công thc truy vn và KHÔNG