
Tích hợp cơ sở tri thức xác suất bằng toán tử trung vị
lượt xem 2
download

Bài viết Tích hợp cơ sở tri thức xác suất bằng toán tử trung vị đề xuất một toán tử tích hợp mới và một thuật toán sử dụng toán tử này để tiến hành tích hợp các cơ sở tri thức dạng xác suất.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Tích hợp cơ sở tri thức xác suất bằng toán tử trung vị
- Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 TÍCH HỢP CƠ SỞ TRI THỨC XÁC SUẤT BẰNG TOÁN TỬ TRUNG VỊ Nguyễn Văn Thẩm1, Nguyễn Quỳnh Diệp1, Nguyễn Đỗ Kiều Loan2 1 Trường Đại học Thủy lợi, email: thamnv@tlu.edu.vn 2 Học viện Tài chính 1. GIỚI THIỆU CHUNG của phép thử đó, kí hiệu là S. Đặt là một tập Để xây dựng và duy trì hoạt động của các hệ hữu hạn các sự kiện, trong đó mỗi sự kiện là thống dựa trên tri thức thì cần xem xét các một tập con của không gian mẫu S. phương pháp tích hợp. Tích hợp tri thức Định nghĩa 1. [4] Đặt F, G và [0,1] (THTT) có thể được hiểu như là tiến trình tạo Một ràng buộc xác suất (RBXS) là một biểu ra một cơ sở tri thức (CSTT) nhất quán từ một thức có dạng c[], trong đó c=(F|G). tập các cơ sở tri thức thuộc về các hệ thống Nếu F độc lập với G, tức G là lặp thừa, G T, khác nhau. THTT là một bài toán quan trọng kí hiệu (F|T). bởi (F). Hai RBXS c1 và c2 và có rất nhiều các ứng dụng sử dụng tiến trình được gọi là tương đương về cấu trúc, được kí THTT. Bài báo này tập trung vào phương pháp hiệu c1 c2, nếu sự kiện bên trái của c1 bằng THTT trên môi trường xác suất. sự kiện bên trái của c2 và sự kiện bên phải của Bài toán THTT trong môi trường xác suất c1 bằng sự kiện bên phải của c2. được định nghĩa như sau: Cho một hồ sơ tri Định nghĩa 2. [4] Một cơ sở tri thức (CSTT) thức xác suất . Cần xác định một CSTT xác xác suất K là một tập hữu hạn các RBXS: suất chung * là đại diện tốt nhất cho tập các k1 , ,kn CSTT xác suất đã cho. Trong đó: ki ci [ i ] i 1,n Gần đây, có hai cách tiếp cận chính để thực Định nghĩa 3. Một hồ sơ TTXS R trên tập hiện tiến hành tích hợp các CSTT xác suất: (i) tìm phân phối xác suất chung biểu diễn cho các sự kiện là một bộ , , trong đó CSTT xác suất kết quả bằng cách sử dụng các là một tập hữu hạn gồm n sự kiện và là hàm phân kỳ [2,4]; (ii) sử dụng các toán tử tích một đa tập hữu hạn gồm m CSTT xác suất. hợp để tính giá trị trung vị của các giá trị xác Định nghĩa 4. Một hồ sơ TTXS , suất trong các ràng buộc xác suất đầu vào [1,3]. là hồ sơ TTXS nhất quán nếu và chỉ nếu Trong bài báo này, chúng tôi tập trung vào : nhất quán. phương pháp thứ hai. Bài báo đề xuất một 2.2. Toán tử tích hợp trung vị toán tử tích hợp mới và một thuật toán sử dụng toán tử này để tiến hành tích hợp các Dựa trên công thức Bordley [1,3], Định CSTT dạng xác suất. nghĩa sau đây phát biểu về toán tử tích hợp trung vị theo hệ số của hai giá trị xác suất 2. NỘI DUNG trong hai RBXS mà chúng tương đương về 2.1. Một số khái niệm cấu trúc, trong đó mỗi RBXS thuộc một CSTT xác suất. Tập hợp tất cả các kết quả của một phép 1c Đặt c 1 , c 1 c thử ngẫu nhiên được gọi là không gian mẫu 64
- Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 Định nghĩa 5. [3] Cho , , Theo Định lý 2, toán tử tích hợp thỏa , F|G 1 1 ; F|G 2 2 . 1 , 2 mãn tính chất MVP nên dễ dàng có được hệ Toán tử tích hợp tích hợp trung vị của hai quả sau: giá trị xác suất 1, 2 trong hai RBXS thỏa mãn Hệ quả 1. các tính chất sau: (CMT)-Giao hoán (Commutativity). Hệ quả 1 đảm bảo rằng giá trị xác suất của (1, 2) = (2, 1) RBSX mới là giá trị trung bình. Do đó, CSTT (IDP) -Lũy đẳng (Idempotence). xác suất sau khi tích hợp sẽ phản ánh mức (1, 2) = 1 trung bình của các CSTT xác suất ban đầu. (MVP)- Giá trị trung vị (Mean Value 2.3. Thuật toán đề xuất Property). If 1 < 2 thì 1 < (1, 2) < 2 Thuật toán đề xuất sau đây được sử dụng (SFS)- Tự đối xứng (Self-Symmetry). để tích hợp các CSTT xác suất trong một hồ (1, 1 1) = 0.5 sơ TTXS nhất quán thành một CSTT xác suất (SM)-Đối xứng (Symmetry). nhất quán dựa trên toán tử tích hợp trung vị (1 1, 1 2) = 1 (1, 2) hợp trung vị theo hệ số . Định nghĩa 6. Cho , , 1 , 2 , Thuật toán 1. NewBordley Input: , và toán tử F|G 1 1 ; F|G 2 2 . Khi đó, Output: * RBXS F|G [ c(1, 2)]* . Trong đó, 1: 0 ; c(1, 2) là toán tử tích hợp trung vị theo hệ 2: For each i do số c của hai giá trị xác suất 1, 2 trong hai 3: For each c i do RBXS được định nghĩa như sau: 4: temp ; 1c 2c c(1 , 2) c 1c c 1 2 1 2 c 2 1c 12c 1 5: 6: For each j and j i do For each c' ' j do trong đó, c 0;1 là một hệ số. 7: If c' c then Định lý 1. Toán tử tích hợp c thỏa mãn 8: 9: j j \ c' ' ; tính chất IDP, MVP. Định nghĩa 7. Cho , , 1 , ,2 , 11: End if; 12: End for F|G 1 1 , , F|G 2 n . Khi đó, 13: End for RBXS F|G [ c(1,…, n)]* . Trong đó, 14: End for 15: i i \ c ; c(1,…, n) là toán tử tích hợp trung vị theo hệ số c của n giá trị xác suất (1, …, n) 16: * * c temp ; trong n RBXS được định nghĩa như sau: 17: End for; Định lý 2. Cho , . Đặt m max i : i và n . Độ phức trong đó, c 0;1 là một hệ số. tạp của thuật toán NewBordley là n 2 m 2 . Định lý 2. Toán tử tích hợp thỏa mãn tính chất IDP, MVP. 2.3. Bài toán minh họa Như vậy, toán tử tích hợp không thỏa Viện Kỹ thuật tài nguyên nước làm một mãn tính chất CMT, SFS, SM. cuộc khảo sát về tình trạng ô nhiễm các dòng 65
- Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 sông. Các chuyên gia được yêu cầu đưa ra một số nhận định (tri thức) về: Tỷ lệ mẫu “nguồn nước bị ô nhiễm” (P), tỷ lệ mẫu “chứa nước thải sinh hoạt” (D), tỷ lệ mẫu “chứa nước thải từ khu công nghiệp” (I), tỷ lệ mẫu nước bị ô nhiễm khi dòng sông chứa nước thải sinh hoạt, tỷ lệ mẫu nước bị ô nhiễm khi dòng sông chứa nước thải từ các khu công nghiệp. Hình 1. Mô hình tích hợp CSTT khả năng Yêu cầu: Cần tìm một tri thức chung về các nguyên nhân gây ô nhiễm nguồn nước 3. KẾT LUẬN của các sông. Trong bài này, chúng tôi đã đề xuất thêm Từ kết quả của các chuyên gia cung cấp, ta một toán tử tích hợp cho các cơ sở tri thức thu được hồ sơ CSTT xác suất gồm ba cơ sở xác suất. Đồng thời, chúng tôi cũng đề xuất tri thức 1 ,2 ,3 và được thể hiện trong một thuật toán sử dụng toán tử tích hợp này Bảng 1 cùng với giá trị xác suất mong đợi để tiến hành tích hợp các cơ sở tri thức dạng (giá trị trung bình-GTTB) của mỗi ràng buộc xác suất. Tuy nhiên, bài báo mới tập trung ở sau tiến trình tích hợp. Kết quả tích hợp của khía cạnh lý thuyết và toán tử tích hợp đề CSTT xác suất 0 khi sử dụng toán tử tích xuất mới chỉ thỏa mãn hai tính chất đáng hợp trung vị với các hệ số khác nhau mong đợi. Do đó, trong tương lai chúng tôi sẽ cũng được chỉ ra trong Bảng 1. xây dựng bộ dữ liệu thực tế để kiểm thử các Bảng 1. Cơ sở tri thức xác suất sau kết quả đề xuất. tiến trình tích hợp 4. TÀI LIỆU THAM KHẢO (P) (D) (I) (P|D) (P|I) [1] Gabriele Kern-Isberner và công sự. 2004. 1 0.70 0.80 0.60 0.50 0.80 Belief revision and information fusion on optimum entropy. International Journal Of 2 0.80 - 0.50 - 0.60 Intelligent Systems. Wiley InterScience. 3 0.60 0.70 - 0.70 - Volume 19(9):837-857. [2] Martin Adamcik. 2014. Collective GTTB 0.70 0.75 0.55 0.60 0.70 Reasoning under Uncertainty and 0.80 0.70 0.50 0.70 0.60 Inconsistency. Luận án tiến sĩ. University of 0.66 0.74 0.54 0.58 0.68 Manchester, UK. [3] Van Tham Nguyen và công sự. 2019. 0.63 0.76 0.57 0.54 0.72 Algorithms for Merging Probabilistic 0.60 0.80 0.60 0.50 0.80 Knowledge Bases. In Proceedings of the 11th Conference ACIIDS 2019. April 8-11, Ta nhận thấy rằng, các kết quả đều thỏa 2019 and Yogyakarta, Indonesia. Springer. mãn hệ quả 1. [4] Van Tham Nguyen và công sự. 2021. A Hình 1 thể hiện ảnh hưởng của hệ số đến model for building probabilistic knowledge- chất lượng của kết quả tích hợp. Đường màu based systems using divergence distances. Journal of Expert Systems with đỏ sẫm thể hiện giá trị xác suất của các ràng Applications. Volume 174: 114494. buộc mong muốn cần đạt được. Mỗi đường Elsevier. chấm còn lại thể hiện giá trị xác suất của các ràng buộc thu được khi hệ số thay đổi. Dựa trên những đường này có thể thấy rằng các kết quả thu được gần với kết quả mong muốn. 66

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Đại cương về hàm số
23 p |
780 |
163
-
Độ đo-ôn thi cao học
6 p |
165 |
63
-
Phân tích thành phần thực phẩm
105 p |
203 |
51
-
Bài giảng Toán kinh tế - Chương 3: Toán tối ưu hóa sản xuất và tiêu dùng
48 p |
697 |
45
-
Các phương pháp phân tích vật lý trong hoá học
11 p |
193 |
25
-
Qúa trình đột biến
3 p |
88 |
4
-
Bài giảng ĐẠI SỐ BOOLE – PHẦN 4
14 p |
78 |
3
-
Bài giảng Vi tích phân hàm số một biến: Chương 1 - Vũ Đỗ Huy Cường
18 p |
11 |
3


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
