Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8

PHƯƠNG PHÁP TÍCH HỢP CƠ SỞ TRI THỨC XÁC SUẤT DỰA TRÊN LÝ THUYẾT DEMSPTER-SHAPER

Nguyễn Văn Thẩm Trường Đại học Thủy lợi, email: thamnv@tlu.edu.vn

1. GIỚI THIỆU CHUNG

(i) (ii)

 0  

 1  

 m  m  

 Hàm

  : Γ 

 

xác suất của  trên

 Θ Ε

được gọi là độ đo 0,1    Γ  nếu:    m Ε Θ  Định nghĩa 2. [2] Đặt F, G   and  . Một ràng buộc xác suất (RBXS) là

0,1

một biểu thức có dạng

trong đó

,c 

 F G .

Với sự phát triển của công nghệ máy tính, Internet và các lĩnh vực liên quan khác, công nghệ tổng hợp thông tin đã và đang phát triển vượt bậc. Việc thực hiện hợp nhất thông tin cần phải xử lý rất nhiều thông tin không chắc chắn. Các công cụ lý thuyết hiện có để xử lý thông tin không chắc chắn bao gồm lý thuyết xác suất, lý thuyết tập mờ, lý thuyết bằng chứng Dempster-Shafer, lý thuyết entropy thông tin. Lý thuyết Dempster-Shafer là một công cụ điển hình và được sử dụng rộng rãi để xử lý thông tin không chắc chắn và hợp nhất dữ liệu, và nó được sử dụng rộng rãi trong các lĩnh vực khác nhau.

| c

 Định nghĩa 3. [2] Một cơ sở tri thức (CSTT) xác suất  là một tập hữu hạn các RBXS:

trong đó,

 ,  1,   n  n i  

Bài báo đề xuất một mô hình tích hợp cơ sở tri thức (CSTT) xác suất bằng cách kết hợp lý thuyết xác suất và một số luật hợp nhất được phát triển từ lý thuyết Demspter-Shaper.

 i   c  i i

2. NỘI DUNG

2.1. Một số khái niệm

Đặt

1E ,

1, Định nghĩa 4. [2] Một hồ sơ TTXS  trên tập các sự kiện  là một bộ    , , trong đó  là một tập hữu hạn gồm n sự kiện và  là một đa tập hữu hạn gồm h CSTT xác suất.  , E   n

,

2

Đặt

=1 nếu Θ U , ngược lại

 , U

ˆE

i

i

i

là một tập hợp các sự kiện được biểu thị trong không gian mẫu  . Với F, G   , đặt FG là giao của F và G , F là phủ định của F . Let  n là hội 1  . Đặt h=2n và đầy đủ của  với

E ˆE , E  

Định nghĩa 5. [2] Một hồ sơ TTXS    là hồ sơ TTXS nhất quán nếu và chỉ nếu    :  nhất quán.  =0. Đặt

là ma trận đặc

 , U

A 

ij a

n h 

 Γ

.

1

2

n

j

i

j

, ,     F G i i F G i i  i

 1

 

m

Định nghĩa 1. [1] Hàm

   : Γ 

 trưng của CSTT xác suất  , trong đó   a    ij Định lý 1. [2] Cho CSTT xác suất  . Một  *

BPA của  tương ứng với lời giải tối ưu của bài toán tối ưu:

n

 in rg m a h n  R ) ( , 

i

1 

42

 i Θ E Eˆ ˆ      là tập các hội đầy đủ của  , Θ Θ ,   h 1 E E …E = . Hội đầy đủ thỏa mãn U , kí và hiệu Θ U , nếu U xuất hiện dương trong Θ .  0,1  được gọi là phép gán xác suất cơ bản (Basic probability assignment-BPA) nếu thỏa mãn các tính chất sau:

Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8

2.3. Mô hình đề xuất

Bài toán tích hợp các CSTT xác suất dựa

trên khoảng cách được định nghĩa:

0, 0

với các ràng buộc:     A A              h  0 0,   

i

1 

1,   

 i lý 2. [2] Đặt F, G   . Hàm 

thỏa mãn các luật xác suất:

(1) Đầu vào: Một hồ sơ CSTT xác suất. (2) Đầu ra: Một CSTT xác suất. (3) Phạm vi bài toán: CSTT được biểu

  F Θ

Định   : Γ 

0,1  (P0)

 ,Θ F

Θ Γ 

(P1)

 ,Θ FG

Θ Γ 

FG

G

F G

(P2)

  FG Θ

diễn bằng ràng buộc xác suất. (4) Tiến trình tích hợp: - Bước 1: Tìm các BPA của mỗi CSTT i trong hồ sơ CSTT xác suất  theo Định lý 1.

        

2.2. Một số luật hợp nhất

- Bước 2: Hợp nhất các BPA theo các

Định nghĩa 6, 7, 8.

Định nghĩa 6. [1,3] Đặt

1m và

- Bước 3: Tìm xác suất mới sau tiến trình

tích hợp theo Định lý 2.

2m là hai BPA, luật Dempster (Dempster Rule) DSR được định nghĩa như sau:

Mô hình tổng quát tích hợp các CSTT khả

năng được minh họa như Hình 1.

   NÕu m l Ng−îc ¹ i

trong đó,

i

j

1,    j i ,   h 0          1  m  1 m 2

  

i

j

i

j

1,     j i ,   h m 1 m 2

  

j

i

Định nghĩa 7. [1,3] Đặt

luật hợp

2m là hai 1m và BPA, tổng quát (Generalized Combination Rule) GCR được định nghĩa như sau:

2

 m

    m        

     NÕu m m 1  1 i ¹ Ng−îc l

trong đó,

i

m 1          1  1   m 1 m 2

   j

  

i

j

i

j

    m 1 m 2

  

i

j

Hình 1. Mô hình tích hợp CSTT xác suất

i

j

1,     j i ,   h m 1 m 2

  

2.3. Ví dụ tính toán và thảo luận

i

j

Định nghĩa 8. [1] Đặt

1m và

2m là hai BPA, luật hội chuyển TCR (Transferable Conjunctive Rule) được định nghĩa như sau:  

  

i

j

m  m 2 m 1

  

i

j

trong đó

  

i

 

i

Vietnam Airlines thực hiện một cuộc khảo sát về các chuyến bay bằng cách lấy ý kiến của khách hàng, tiếp viên và phi công (gọi chung là các chuyên gia). Họ được yêu cầu đưa ra một số nhận định (tri thức) về: Tỷ lệ để một chuyến bay theo lịch trình khởi hành đúng giờ (D), tỷ lệ một chuyến bay đến đúng giờ (A); và tỷ lệ một chuyến bay đến đúng giờ khi khởi hành đúng giờ là (A|D).

43

   NÕu   i m ,2 1 N g−îc l¹ i 0  i m     m    1 

Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8

1 và

Từ kết quả của các chuyên gia cung cấp, ta thu được hồ sơ CSTT xác suất gồm hai cơ sở 2 được thể hiện trong Bảng 2 tri thức cùng với giá trị xác suất mong đợi (MĐ) của mỗi RBXS trong CSTT xác suất sau tiến trình tích hợp.

Hình 2 thể hiện kết quả thu được sau tiến trình tích hợp CSTT xác suất và cho thấy khi áp dụng các luật hợp nhất thì giá trị xác xuất của các RBXS (A) và (A|D) kết quả có giá trị gần với kết quả mong muốn. Tuy nhiên, giá trị xác suất của ràng buộc (D) có độ lệnh cao so với giá trị mong đợi.

.

Định lý 1,

2 . Theo 

3

2

1

2

, , ,   ,      4

1

1 và   ,      1 3 1  0.6 0

của

  A         *

Bước 1: Tìm các BPA của   , 0 1 0    0.4 0.6 0.4   0.5 0 0.5  1 tương lời giải tối ưu

1

BPA của bài toán tối ưu: mrg in a  4 3  ) ( , R 

     2 3

Hình 2. So sánh các kết quả tích hợp

với các ràng buộc: A 0,  1

0, 0 i 1,3                 i A  1

3. KẾT LUẬN

4

2

1

1, 0 i             i 3

1, 4 Kết quả được thể hiện trong Bảng 1. Bước 2: Hợp nhất các BPA theo các Định nghĩa 6, 7, 8. Kết quả thể hiện trong Bảng 1.

Bảng 1. Các các BPA của

1 và

2

AD

1m 0.4

2m DSR GSR TCR 0.16 0.4

0.20

0.18

0.4

0.6

0.71

0.73

0.64

AD

0.2

0

0.09

0.09

0.08

0

0

0.00

0.00

0.12

AD 

Trong bài báo này, tôi đã đề xuất một mô hình tích hợp các CSTT xác suất bằng cách sử dụng ba luật hợp nhất được phát triển từ lý thuyết Demspter-Shaper (luật DSR, luật GSR và luật TCR) để hợp nhất các BPA của các CSTT xác suất đầu vào. Từ BPA thu được, tôi sử dụng các luật xác suất để thu được CSTT xác suất kết quả được biểu diễn bằng các RBXS. Tuy nhiên, bài báo mới tập trung ở khía cạnh lý thuyết mà chưa xem xét bài toán dưới góc độ thực hành. Do đó, tôi sẽ xem xét bài toán tích hợp trên bộ dữ liệu thực tế để kiểm thử các kết quả đề xuất.

i

4. TÀI LIỆU THAM KHẢO

theo luật (P0),

Bước 3: Tìm xác suất mới. Xét luật DSR, 0.29.

A 

Theo luật (P1) và (P2),

0.69. Kết

= 0.91, 

  D  

quả thể hiện trong Bảng 2.

[1] Gan, Dingyi & Yang, Bin & Tang, Yongchuan. 2020. An Extended Base Belief Function in Dempster–Shafer Evidence Theory and Its Application in Conflict Data Fusion. Mathematics.

 A D

Bảng 2. CSTT xác suất trước và sau tiến trình tích hợp

building

for

1

2 MD DSR GSR TCR

1.0 1.0

1.0

0.91 0.91 0.80

ic A

[2] Van Tham Nguyen và công sự. 2021. A model probabilistic knowledge-based systems using divergence distances. Journal of Expert Systems with Applications. Elsevier.

0.6 0.4

0.5

0.29 0.27 0.24

0.5

0.69 0.67 0.67

 D A D 0.5 0.5

[3] Zhang, J., Deng, Y. 2017. A method to determine basic probability assignment in the open world and its application in data fusion and classification. Appl Intell 46, 934-951.

44