Tuyn tp Hi ngh Khoa hc thường niên năm 2022. ISBN: 978-604-82-7001-8
64
TÍCH HP CƠ S TRI THC XÁC SUT
BNG TOÁN T TRUNG V
Nguyn Văn Thm1, Nguyn Qunh Dip1, Nguyn Đỗ Kiu Loan2
1Trường Đại hc Thy li, email: thamnv@tlu.edu.vn
2Hc vin Tài chính
1. GII THIU CHUNG
Để xây dng và duy trì hot động ca các h
thng da trên tri thc thì cn xem xét các
phương pháp tích hp. Tích hp tri thc
(THTT) có th được hiu như là tiến trình to
ra mt cơ s tri thc (CSTT) nht quán t mt
tp các cơ s tri thc thuc v các h thng
khác nhau. THTT là mt bài toán quan trng
và có rt nhiu các ng dng s dng tiến trình
THTT. Bài báo này tp trung vào phương pháp
THTT trên môi trường xác sut.
Bài toán THTT trong môi trường xác sut
được định nghĩa như sau: Cho mt h sơ tri
thc xác sut . Cn xác định mt CSTT xác
sut chung * đại din tt nht cho tp các
CSTT xác sut đã cho.
Gn đây, có hai cách tiếp cn chính để thc
hin tiến hành tích hp các CSTT xác sut: (i)
tìm phân phi xác sut chung biu din cho
CSTT xác sut kết qu bng cách s dng các
hàm phân k [2,4]; (ii) s dng các toán t tích
hp để tính giá tr trung v ca các giá tr xác
sut trong các ràng buc xác sut đầu vào [1,3].
Trong bài báo này, chúng tôi tp trung vào
phương pháp th hai. Bài báo đề xut mt
toán t tích hp mi và mt thut toán s
dng toán t này để tiến hành tích hp các
CSTT dng xác sut.
2. NI DUNG
2.1. Mt s khái nim
Tp hp tt c các kết qu ca mt phép
th ngu nhiên được gi là không gian mu
ca phép th đó, kí hiu là S. Đặt là mt tp
hu hn các s kin, trong đó mi s kin là
mt tp con ca không gian mu S.
Định nghĩa 1. [4] Đặt F, G


[0,1]
Mt ràng buc xác sut (RBXS) là mt biu
thc có dng c[
], trong đó c=(F|G).
Nếu F độc lp vi G, tc G là lp tha, G T,
kí hiu (F|T). bi (F). Hai RBXS c1 c2
được gi là tương đương v cu trúc, được kí
hiu c1
c2, nếu s kin bên trái ca c1 bng
s kin bên trái ca c2 và s kin bên phi ca
c1 bng s kin bên phi ca c2.
Định nghĩa 2. [4] Mt cơ s tri thc (CSTT)
xác sut K là mt tp hu hn các RBXS:

1n
,k,k
Trong đó: 1
iii
k c[]i ,n

Định nghĩa 3. Mt h sơ TTXS R trên tp
các s kin
là mt b ,, trong đó
là mt tp hu hn gm n s kin và
mt đa tp hu hn gm m CSTT xác sut.
Định nghĩa 4. Mt h sơ TTXS ,
là h sơ TTXS nht quán nếu và ch nếu
: nht quán.
2.2. Toán t tích hp trung v
Da trên công thc Bordley [1,3], Định
nghĩa sau đây phát biu v toán t tích hp
trung v theo h s ca hai giá tr xác sut
trong hai RBXS mà chúng tương đương v
cu trúc, trong đó mi RBXS thuc mt
CSTT xác sut.
Đặt
 
1
11
cc
cc
,


 
Tuyn tp Hi ngh Khoa hc thường niên năm 2022. ISBN: 978-604-82-7001-8
65
Định nghĩa 5. [3] Cho
,
,
12
, ,


11 2 2
F|G ; F|G

.
Toán t tích hp tích hp trung v ca hai
giá tr xác sut 1, 2 trong hai RBXS tha mãn
các tính cht sau:
(CMT)-Giao hoán (Commutativity).
(
1,
2) = (
2,
1)
(IDP) -Lũy đẳng (Idempotence).
(
1,
2) =
1
(MVP)- Giá tr trung v (Mean Value
Property). If
1 <
2 thì
1 < (
1,
2) <
2
(SFS)- T đối xng (Self-Symmetry).
(
1, 1
1) = 0.5
(SM)-Đối xng (Symmetry).
(1
1, 1
2) = 1 (
1,
2)
Định nghĩa 6. Cho ,, 12
, ,


11 2 2
F|G ; F|G

. Khi đó,
RBXS

F
|G [c(
1,
2)] *
. Trong đó,
c(
1,
2) là toán t tích hp trung v theo h
s c ca hai giá tr xác sut
1,
2 trong hai
RBXS được định nghĩa như sau:
c(
1,
2)

1
12 12
1
12 1 2
21
cc cc
cc c c
 




trong đó,
01c; là mt h s.
Định lý 1. Toán t tích hp c tha mãn
tính cht IDP, MVP.
Định nghĩa 7. Cho ,
, 12
, ,
,


11 2 n
F|G , , F|G

 . Khi đó,
RBXS

F
|G [c(
1,…,
n)] *
. Trong đó,
c(
1, …,
n) là toán t tích hp trung v
theo h s c ca n giá tr xác sut (
1, …,
n)
trong n RBXS được định nghĩa như sau:
trong đó,
01c; là mt h s.
Định lý 2. Toán t tích hp tha
mãn tính cht IDP, MVP.
Như vy, toán t tích hp không tha
mãn tính cht CMT, SFS, SM.
Theo Định lý 2, toán t tích hp tha
mãn tính cht MVP nên d dàng có được h
qu sau:
H qu 1.
H qu 1 đảm bo rng giá tr xác sut ca
RBSX mi là giá tr trung bình. Do đó, CSTT
xác sut sau khi tích hp s phn ánh mc
trung bình ca các CSTT xác sut ban đầu.
2.3. Thut toán đề xut
Thut toán đề xut sau đây được s dng
để tích hp các CSTT xác sut trong mt h
sơ TTXS nht quán thành mt CSTT xác sut
nht quán da trên toán t tích hp trung v
hp trung v theo h s .
Thut toán 1. NewBordley
Input: , và toán t
Output: *
1: 0;
2: For each i  do
3: For each
i
c
do
4: temp
;
5: For each j  and
j
i do
6: For each
j
c' '
do
7: If c' c then
8:
9:

jj
\c' '
 ;
11: End if;
12: End for
13: End for
14: End for
15:

ii
\c
 ;
16:

**
ctemp ;
17: End for;
Định lý 2. Cho
,
. Đặt

ii
m max : n. Độ phc
tp ca thut toán NewBordley là

22
nm.
2.3. Bài toán minh ha
Vin K thut tài nguyên nước làm mt
cuc kho sát v tình trng ô nhim các dòng
Tuyn tp Hi ngh Khoa hc thường niên năm 2022. ISBN: 978-604-82-7001-8
66
sông. Các chuyên gia được yêu cu đưa ra
mt s nhn định (tri thc) v: T l mu
“ngun nước b ô nhim” (P), t l mu
“cha nước thi sinh hot” (D), t l mu
“cha nước thi t khu công nghip” (I), t l
mu nước b ô nhim khi dòng sông cha
nước thi sinh hot, t l mu nước b ô
nhim khi dòng sông cha nước thi t các
khu công nghip.
Yêu cu: Cn tìm mt tri thc chung v
các nguyên nhân gây ô nhim ngun nước
ca các sông.
T kết qu ca các chuyên gia cung cp, ta
thu được h sơ CSTT xác sut gm ba cơ s
tri thc 123
,, được th hin trong
Bng 1 cùng vi giá tr xác sut mong đợi
(giá tr trung bình-GTTB) ca mi ràng buc
sau tiến trình tích hp. Kết qu tích hp ca
CSTT xác sut 0 khi s dng toán t tích
hp trung v vi các h s khác nhau
cũng được ch ra trong Bng 1.
Bng 1. Cơ s tri thc xác sut sau
tiến trình tích hp

(P) (D) (I) (P|D) (P|I)
1
0.70 0.80 0.60 0.50 0.80
2
0.80 - 0.50 - 0.60
3
0.60 0.70 - 0.70 -
GTTB 0.70 0.75 0.55 0.60 0.70
0.80 0.70 0.50 0.70 0.60
0.66 0.74 0.54 0.58 0.68
0.63 0.76 0.57 0.54 0.72
0.60 0.80 0.60 0.50 0.80
Ta nhn thy rng, các kết qu đều tha
mãn h qu 1.
Hình 1 th hin nh hưởng ca h s đến
cht lượng ca kết qu tích hp. Đường màu
đỏ sm th hin giá tr xác sut ca các ràng
buc mong mun cn đạt được. Mi đưng
chm còn li th hin giá tr xác sut ca các
ràng buc thu được khi h s thay đổi. Da
trên nhng đường này có th thy rng các kết
qu thu được gn vi kết qu mong mun.
Hình 1. Mô hình tích hp CSTT kh năng
3. KT LUN
Trong bài này, chúng tôi đã đề xut thêm
mt toán t tích hp cho các cơ s tri thc
xác sut. Đồng thi, chúng tôi cũng đề xut
mt thut toán s dng toán t tích hp này
để tiến hành tích hp các cơ s tri thc dng
xác sut. Tuy nhiên, bài báo mi tp trung
khía cnh lý thuyết và toán t tích hp đề
xut mi ch tha mãn hai tính cht đáng
mong đợi. Do đó, trong tương lai chúng tôi s
xây dng b d liu thc tế để kim th các
kết qu đề xut.
4. TÀI LIU THAM KHO
[1] Gabriele Kern-Isberner và công s. 2004.
Belief revision and information fusion on
optimum entropy. International Journal Of
Intelligent Systems. Wiley InterScience.
Volume 19(9):837-857.
[2] Martin Adamcik. 2014. Collective
Reasoning under Uncertainty and
Inconsistency. Lun án tiến sĩ. University of
Manchester, UK.
[3] Van Tham Nguyen và công s. 2019.
Algorithms for Merging Probabilistic
Knowledge Bases. In Proceedings of the
11th Conference ACIIDS 2019. April 8-11,
2019 and Yogyakarta, Indonesia. Springer.
[4] Van Tham Nguyen và công s. 2021. A
model for building probabilistic knowledge-
based systems using divergence distances.
Journal of Expert Systems with
Applications. Volume 174: 114494.
Elsevier.