ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGH - ĐẠI HC ĐÀ NẴNG, VOL. 22, NO. 3, 2024 49
MT S BẤT ĐẲNG THC V LI PHÂN LỚP ĐỐI VI BÀI TOÁN
PHÂN LP NH PHÂN
SOME INEQUALITIES ON CLASSIFICATION ERRORS
FOR BINARY CLASSIFICATION
Tôn Tht Tú*
Trường Đại học Sư phạm - Đại học Đà Nẵng, Đà Nẵng, Vit Nam1
*Tác gi liên h / Corresponding author: tttu@ued.udn.vn
(Nhn bài / Received: 10/12/2023; Sa bài / Revised: 31/01/2024; Chp nhận đăng / Accepted: 02/02/2024)
m tt - Bài toán phân lp nh phân một bài toán bn trong
bài toán phân lp thuc nhóm các thut toán hc giám sát.
Người ta s dng mt hàm phân loại để gán mt điểm d liu vi
mt trong 2 lớp đã cho dựa trên mt tp d liu khảo sát được đã
được gán nhãn. Hành động này có th mc sai lm nếu vic gán
nhãn cho các đim d liu không chính xác. Có nhiu thut toán
khác nhau đã được nghiên cứu liên quan đến bài toán phân lp
nh phân. Để đo lường chất lượng ca hàm phân lớp, người ta đưa
ra mt s khái nim v li mc phi khi tiến hành phân lp. bài
báo này, tác gi nghiên cu và xây dng mt s bất đẳng thức để
đánh giá về li phân lp trong bài toán phân lp nh phân.
Abstract - The binary classification problem is a basic problem in
the classification problem of the group of supervised learning
algorithms. One uses a classification function to assign a data point
to one of two given classes based on a labeled collected data set. This
action can be erroneous if the labeling of data points is incorrect.
There are many different algorithms that have been studied related to
the binary classification problem. To measure the quality of the
classification function, people introduce some concepts about the
errors made when performing classification. In this article, the author
researches and builds a number of inequalities to evaluate the
classification errors in the binary classification problem.
T khóa - Phân lp; nh phân; li phân lp; bất đng thc; hc
máy thng kê.
Key words - Classification; binary; classification error;
inequality; statistical machine learning.
1. Gii thiu
i toán phân lp nh phân bài toán bản, được nhiu
tác gi nghiên cu v cách thc tiếp cận cũng như đánh giá
chất lượng ca các thut toán [1, 2, 3]. Gi s
( , )XY
mt
cp biến ngu nhiên nhn giá tr trong
{0,1}.
dR
Để mô t
phân phi ca
( , )XY
ta có th s dng cp giá tr
(,)

,
trong đó
là độ đo xác suất sinh bi biến ngu nhiên
hàm hi quy ca
Y
theo
,X
tc
( ) ( )A P X A
=
vi
A
là tp Borel trên
,
d
R
( ) ( 1| ) ( | ), .
d
x P Y X x E Y X x x
= = = = = R
Mt hàm
: {0,1}
d
gR
đưc gi mt hàm phân
lp (classifier, decision function) và giá tr
( ) ( ( ) )L g P g X Y=
đưc gi xác sut li (error probability, misclassification
error) ca hàm phân lp
Để nh đưc giá tr ca
()Lg
ta cn phi biết phân phi
chính xác ca
( , ).XY
Tuy nhiên, trên thc tế ta thưng không
biết được thông tin này. Tng tin mà ta biết được tng là
d liệu được thu thp t
( , ).XY
Nếu
11
( , ),...,(X , )
nn
X Y Y
mt mu ngu nhiên ca
( , )XY
thì giá tr
{ ( ) }
1
1
() i i
n
n g X
i
Y
L g I
n
=
=
đưc gi xác sut li thc nghim (empirical error
probability) ca hàm phân lp
1 The University of Danang University of Science and Education, Danang, Vietnam (Ton That Tu)
Kí hiu
*( ) 1/1,
() 0,
2
( ) 1/ 2
x
x
gx
=
* * *
( ) ( ( ) ).L L g YP g X= =
Định 1. [2] Vi mi hàm phân lp
: {0,1}
d
gR
ta luôn có:
*
( ( ) ) ( ( ) ),P g X P g XYY
tc là
là hàm phân lp tối ưu.
Hàm
đưc gi hàm phân lp Bayes và giá tr
*
L
đưc gi là xác sut li Bayes.
Vi
d
xR
ta có
{ ( ) 1}
{ ( ) 0}
{ ( ) 1} { ( ) 0}
( ( ) ) 1- ( ( ) | )
1-[ ( 1, ( ) 1| )
( 0, ( ) 0 | )]
1-[ ( 1| )
( 0 | )]
1-[ (1-
|
( ) ( ))].
gx
gx
g x g x
P g X P g X Y X x
P Y g x X x
P Y g x X x
I P Y X x
I P Y X
Y X x
IxI x
x

=
=
==
= = =
= = =
=
=
+ = = =
= = =
+ = =
=+
Do đó,
{ ( ) 1} { ( ) 0}
( ) 1 ( (1 )( )( ) )-
g X g X
XL g E I XI

==
= +
**
{ } { ( ) 1(/ /) 1 2 2}
( ) 1 ( (1- ))
11
min{ }
( ) ( )
( ),1 ( ) ( )| 2 |.
22 1
XX XX
X
L L g
X
E I I
EEX


= = +
= = −−
50 Tôn Tht Tú
Ngoài vic s dng
()Lg
để đo xác suất mc sai lm
khi phân lp, người ta còn s dng các hàm sau để đo
“khoảng cách” giữa hai lp [2]:
i) Khong cách Kolmogorov:
11
| ( 1| ) ( 0 | ) | | 2 ( ) 1|.
22
KO E P Y X P Y X E X
= = = =
ii) Li phân lp tim cận cho “phương pháp người láng
giềng”:
( )(1(2 .))()
NN E XL X

=
iii) Li Matsushita:
( )
( )(1 ( )) .XXE

=
iv) Entropy có điều kin trung bình:
( )ln ( ) (1 ( ))ln(1 (( ))).X X X XE
+ =−
v) Độ khác bit Jeffrey:
()
( ) 1 ln 1( .
)
(2 ) X
XX
JE


=

D thy rng,
*1.
2KO
L
=−
Điều này có nghĩa nếu xác
sut li Bayes gim thì khong cách Kolomogov
KO
s
tăng dn tiến đến
1/ 2
và ngược li.
2. Kết qu chính
Xét các hàm
, , , , :[0,1]f g h e j R
xác định như sau:
( ) { ,1- }, ( ) 2 (1-min ), ( ) (1 ),f x x x g x x x h x x x= = =
ln (1 )ln(1 ), ( ) (2 1)l 1
(n.)x
x x x jx xe xx x
=
= 

D thy rng, vi mi
[0,1]x
ta luôn có:
min{ ( ),() ( )}.h x g xfx
B đề 1: Vi
[0,1]x
ta luôn có:
a)
11
2 ( ) ( ) ( ) 2 ( ).
22
x f x h x f x x h x
b)
ln 2 ( .(2 ))ex gx
Chng minh: Vì vi mi
[0,1]x
ta luôn có
( ) (1 ), ( ) (1 ), ( ) (1 )e x e x f x f x g x g x= = =
( ) (1 )h x h x=−
nên ta ch cn ch ra các bất đẳng thc
trên đúng vi
[0,1/2].x
a) Vi
[0,1/2]x
bất đẳng thc phía trái tr thành:
( )
1
( ) ( ) 2 ( )
2
1
12
2
12
1 2 0.
2
1
h x f x x f x
x x x x x
xx xx






−+

Bất đẳng thức này đúng
[0,1/2]x
1 2.xx +
Tương tự, bt đẳng thc phía phải đưc biến đổi như sau:
( ) ( )
( )
( )
( )
( )
( )
( )
1
( ) ( ) 2 ( )
2
1 1 2 1
12 110
111
1 2 1 0
1 1 1
h x f x x h x
x x x x x x
xx
xx x x
x x x x
x x x x



+


+
Bất đẳng thức này đúng vì
[0, 1/ 2].x
b) Vi
[0, 1/2]x
đặt
ln 2) ()( ( ) .2l e x gx x=−
Lúc đó,
22 [
12
( ) 0, 0, 1/
(1 ) 2]lx
xx
xx
 =
nên
()l x
là hàm li trên
[0, 1/2].
Mt khác, ta li có
0
lm ()i ,
x
xl
+
= +
(1/ 2) 0, (1/ 4) ln(3 / 4) 0ll = =
nên tn ti duy nht
0(0, 1/ 2)x
sao cho
0
( ) 0.xl=
T đó
suy ra
( ) { (0), (1/ 2)} 0, [0, 1/ 2in ]m .l x l l x =
B đề 2. Vi mi
(0,1)x
*
nN
ta luôn có
2
21
1
21
( ) .
(2 1)
ln 2
2
k
k
n
k
e x x
kk
=

−


Chng minh: Vi
1n
đạo hàm cp
n
ca
()ex
bng:
() 1
11
ln ln(1 )
() ( 1) ( 2)! ( 2)! ,1
(1 )
,1
nn
nn
ex nn
n
x
xn
x
x
−−
+−
=
−
=
T đó, suy ra
1n
ta có:
()
2
0, 2 1
(1/ 2) 2 (2 2)!, 2
n
k
nk
ek n k
=+
= =
vi
*.kN
Theo công thc khai trin Taylor [4] vi mi
(0, 1)x
tn ti
nm gia
1/ 2
x
sao cho:
22
( ) (2 2)
21
0
(1/ 2) 1 ( ) 1
() ! 2 (2 2)! 2
kn
kn
n
k
ee
e x x x
kn
+
+
+
=
= +
+
(0, 1)
nên
22
(2 2) ( ) 1 0.
(2 2)! 2
n
n
ex
n
+
+
−

+
Do đó, với mi
(0, 1)x
2
( ) 2 1
21
01
(1/ 2) 1 2 1
( ) .
! 2 (2 1
l2
2)
n
kk
kk
nn
kk
e
e x x x
k k k
+
==
=

B đề đưc chng minh.
ISSN 1859-1531 - TP CHÍ KHOA HC VÀ CÔNG NGH - ĐẠI HỌC ĐÀ NNG, VOL. 22, NO. 3, 2024 51
B đề 3. Vi mi
(0,1)x
*
nN
ta luôn có
2
21
1
21
( ) .
2 1 2
k
k
n
k
j x x
k
+
=

−


Chng minh: Vi
1n
đạo hàm cp
n
ca
ln( / (1 ))xx
bng:
( )
() ( 1)! ( 1) ( 1)!
ln( / (1 )) , (0, 1).
(1 )
n
n
nn
nn
x x x
xx
=
T đó, với
2n
s dng công thức đạo hàm ca tích
ta có:
( )
( )
()
()
( 1)
( ) (2 1)
2
( 2 1)( 2)!
(1 )
( 1) ( 2 1)( 2)!,
ln( / (1 ))
ln( / (1 ))
(0, 1).
n
n
n
n
n
n
j x x
n
n x n
x
nx
xx
x
x
x
x
n
=−
+
+
=
+
+
Suy ra
()
1
0, 2 1
(1/ 2) 2 ( 2)!, 2
n
n
nk
jn n n k
+
=−
=−=
vi
*.kN
Lúc đó, s dng khai trin Taylor [1] vi mi
(0, 1)x
tn ti
nm gia
1/ 2
x
sao cho:
22
( ) (2 2)
21
0
(1/ 2) 1 ( ) 1
() ! 2 (2 2)! 2
kn
kn
n
k
jj
j x x x
kn
+
+
+
=
= +
+
(0, 1)
nên
22
(2 2) ( ) 1 0.
(2 2)! 2
n
n
jx
n
+
+
−

+
Do đó, vi mi
(0, 1)x
2
( ) 2 1
21
11
(1/ 2) 1 2 1
( ) .
! 2 2 1 2
kk
kk
nn
kk
j
j x x x
kk
+
+
==
=

B đề đưc chng minh.
Định lý 1. Độ lch
*
L
tha mãn bt đẳng thc:
2
*2
21
2.( 4
1
)
KO KO KO
ELX
Chng minh: T B đề 1 ta có:
*
( ) ( )
( ) (
1
2 ( )
2
1)2 ( ).
2
Ef
L E h
XX
XX


Áp dng bất đẳng thc Jensen [5], ta được:
2
2
2
11
( ) ( ) ( ) ( )
2
11
()
24
1
4
1
2
11
( ) ( )
2
4
2
.
KO KO
E h E
EE
X X X X
XX


=

−

=
Mt khác,
11
2 , [0, 1/ 2]
22
x x x x x


nên
2
( ) ( )
11
( ) ( )
22
11
( ) ( )
22
1
1
2 ( )
2
1
2E 2
1
2E 2
2.()2
KO
XX
XX
XX
X
Ef
E



=−

−
−−
−−


=−
Định lý đưc chng minh.
Định lý 2. Giá tr entropy tha mãn bất đẳng thc:
ln22.
N
E L
Nói riêng,
**
ln2 ( )4 1.ELL
Chng minh: Bất đẳng thức được suy ra trc tiếp t B
đề 1 và nhn xét:
min min(1 ) { ,1- }(1- { ,1- }), [0, 1].x x x x x x x =
Định 3. Entropy đ khác bit Jeffrey tha mãn các
bất đẳng thc sau:
2
21 *
1
21
(2 1)
n2
l2
k
k
n
k
EL
kk
=

−


2
21 *
1
21
,
2 1 2
k
k
n
k
JL
k
+
=

−


vi mi
*.nN
Chng minh: Vi
(0,1)x
ta luôn có:
22
11
{ ,1- } .
22
minx x x
=
Do đó, t B đề 2 và bất đẳng thc Jensen [5] ta có:
2
21
1
2
21
1
2
21 *
1
( ) ln 2 ( )
ln 2 min ( ),1 ( )
l
21
() (2 1) 2
21
{}
(2 1) 2
21
.
(2 1) 2
n2
k
k
n
k
k
k
n
k
k
k
n
k
XX
XX
E E e E
kk
E
kk
L
kk


=
=
=

=



=−



−


−−
Bất đẳng thc còn li đưc suy ra t B đề 3 đưc
chứng minh tương tự.
Trưng hợp đặc bit khi
1n=
ta được h qu sau:
H qu 1 [2]: Entropy và đ khác bit Jeffrey tha mãn
các bất đng thc sau:
*2
(1 2 )
ln 2 2
L
E
*2
2(1 2 ) .JL−
Để đánh giá xác suất li lý thuyết
()Lg
thông qua xác
sut li thc nghim
()
n
Lg
, ta có th s dng các bất đng
thc v mức độ tp trung (concentration inequalities) cho
52 Tôn Tht Tú
tng ca các biến ngẫu nhiên độc lp.
B đề 4 (Bt đẳng thc Hoeffding) [5, 6]. Cho
1,..., n
XX
c biến ngẫu nhiên độc lp vi
( ) 1
i i i
P a X b =
vi
mi
1, ,in
=
trong đó
, , .
i i i i
a b a bR
Khi đó, với mi
0t
1
()
i
i
n
i
S X EX
=
=−
ta luôn có:
1
22
( ) exp 2 / ( ) ,
n
i
i
i
P S t t b a
=



22
1
(| | ) 2exp 2 / ( ) .
n
i
i
i
P S t t b a
=



H qu 2: Khong tin cy cho xác sut li
()Lg
ca
hàm phân lp
g
với độ tin cy ti thiu
1
là:
11
( ) , ( ) .
22
22
ln ln
nn
L g L g
nn


−+


Chng minh:
Áp dng bất đẳng thc Hoeffding cho các biến ngu
nhiên
{ ( ) }
i i
gX Y
I
, vi mi
0
ta có:
( )
2
{ ( ) }
1
22
()
2( )
2exp 2 .
ii
n
gX
i
n
Y
P I L g n
ne
n
=

−



=


Điều này tương đương với
()
2
2
( ) ( ) 2 n
n
P L g L g e
Hay
()
2
2
( ) ( ) 1 2 .
n
n
P L g L g e
Cho
2
2(0, 1).2 n
e
=
Lúc đó
2
n
1
2l
n
=


1
( ) ( ) .
2
2
ln 1
n
P L g L g n






T đó, ta đưc điu phi chng minh.
Nhn xét 1: Nếu muốn độ dài khong tin cy cho xác
sut li
()Lg
đưc xây dng trên không vượt quá
00
cho trước, ta cn chn
n
sao cho:
0
2
l2.n
1
2n



T đó, ta đưc:
2
0
2
n
2l.n


Nhn xét 2: S dụng định lý gii hn trung tâm [5], ta
có khi
n
ln biến ngu nhiên
( )
( ) ( )
( ).(1 ( ))
n
n
L g L g n
ZL g L g
=
phân phi xp x phân phi chun tc
(0,1).N
Lúc đó, với
độ tin cy
1
khong tin cy cho xác sut li
()Lg
là:
22
/2 /2
22
/2 /2
2 ( ) 2 ( )
,,
2( ) 2( )
nn
nL g z nL g z
n z n z




++
−−


++

trong đó
( )
2
/2 /2
2
/2
4 ( ) 1 ( ) .
2( )
nn
z z nL g L g
nz

+−
=+
Hình 1. Khong tin cy 95% vi
( ) 1/ | 40|
n
L g n=−
T Hình 1 th thy, khong tin cậy được xây dng
bi phép xp x phân phi chun tốt hơn theo nghĩa đ dài
khong tin cy nh hơn. Mặc vy, chất lượng ca
khong tin cy này ph thuc nhiu vào chất lượng ca
phép xp x phân phi chun.
3. Kết lun
Bài báo đã trình bày mt s kết qu nghiên cu v bt
đẳng thức đánh giá lỗi phân lp cho bài toán phân lp nh
phân. S dng bt đng thc Hoeffding định lý gii hn
trung tâm, khong tin cy cho xác sut li thuyết cũng
đưc xây dng. Khi kích thước mu càng ln, phép xp x
phân phi chuẩn càng chính xác lúc đó ta nên s dng
khong tin cy cho xác sut li thuyết đưc xây dng
da trên phép xp x này.
TÀI LIU THAM KHO
[1] A. K. Menon and R. C. Williamson, “The Cost of Fairness in Binary
Classification”, Proceedings of Machine Learning Research, vol.
81, pp. 1-12, 2018.
[2] L. Devroye, L. Gyorfi, and G. Lugosi, A Probabilistic Theory of
Pattern Recognition, Springer-Verlag, 1996.
[3] S. Singh and J. Khim, “Optimal Binary Classification Beyond
Accuracy”, 36th Conference on Neural Information Processing
Systems, 2022.
[4] N. D. Tien, Lectures on Mathematical Analysis (Vol. 1), Hanoi
National University Publishing House, 2004.
[5] M. Sugiyama, Introduction to Statistical Machine Learning,
Elsevier Inc., 2016.
[6] B. Stephane, G. Lugosi, and P. Massart, Concentration Inequalities: A
Nonasymptotic Theory of Independence, Oxford University Press, 2013.