YOMEDIA
ADSENSE
Suy diễn mờ trong dự báo liên kết đồng tác giả
17
lượt xem 3
download
lượt xem 3
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bài viết Suy diễn mờ trong dự báo liên kết đồng tác giả tập trung nghiên cứu bài toán dự báo liên kết mạng đồng tác giả. Kết quả thu được của bài này đưa ra cách tiếp cận mờ trong việc giải bài toán dự báo liên kết mạng đồng tác giả. Kết quả nghiên cứu có thể làm tiền đề cho các đề xuất mới trong việc giải bài toán liên kết mạng đồng tác giả với các mô hình mờ trực cảm, mờ phức, nhận thức mờ.
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Suy diễn mờ trong dự báo liên kết đồng tác giả
- Tuyển tập Hội nghị Khoa học thường niên năm 2017. ISBN: 978-604-82-2274-1 SUY DIỄN MỜ TRONG DỰ BÁO LIÊN KẾT ĐỒNG TÁC GIẢ Trần Mạnh Tuấn, Nguyễn Văn Nam, Trần Thị Ngân Trường Đại học Thủy lợi, email: tuan_tm@tlu.edu.vn 1. GIỚI THIỆU Trong lĩnh vực khoa học, việc liên kết giữa các tác giả có thể tạo ra những sản phẩm có ý Mạng xã hội ngày càng gắn kết mọi người nghĩa cao về mặt lý thuyết hoặc ứng dụng. trên thế giới. Các dịch vụ trên Internet đã Trên cơ sở những mối liên hệ giữa các tác giả giúp cho con người dễ dàng giao tiếp và trao có xuất bản chung các tác phẩm (các bài báo đổi với nhau thông qua các cộng đồng ảo trên tạp chí) và các tiện ích mà mạng xã hội được biết đến như là mạng xã hội trực tuyến - đem lại, việc dự báo mối liên kết giữa các tác OSN (Online Social Network). Việc sử dụng giả trong tương lai là điều hoàn toàn có thể OSN đã trợ giúp quá trình trao đổi, chia sẻ thực hiện được. thông tin dễ dàng hơn. Các dịch vụ OSN phổ Vì vậy, trong bài báo này, chúng tôi sử biến bao gồm Facebook, DBLP, LinkedIn, dụng một mô hình suy diễn mờ để dự báo các Twitter, Flickr, Youtube… Trong quá trình liên kết trong mạng đồng tác giả. Đồng thời trao đổi và chia sẻ thông tin, người dùng trong bài báo này chúng tôi sẽ thực nghiệm mong muốn thông tin được truyền tải đến và đánh giá. càng nhiều người càng tốt. Việc chia sẻ còn Trong các phần tiếp theo chúng tôi cấu phù thuộc vào mối liên kết của người chia sẻ trúc như sau: phần 2 trình bày chi tiết về bài với những người khác trên OSN. Do vậy toán liên kết đồng tác giả; phần 3 trình bày trong thời gian qua hầu hết các nghiên cứu về một mô hình dựa trên suy diễn mờ; phần 4 dự báo liên kết đã thực hiện đều tập trung chúng tôi trình bày về các kết quả thực giải quyết vấn đề dự báo liên kết trên các nghiệm đánh giá; phần 5 là kết luận. mạng xã hội vô hướng đồng nhất trực tuyến - OHUSNs (Online Homogeneous Undirected 2. BÀI TOÁN DỰ BÁO LIÊN KẾT ĐỒNG Social Networks). OHUSN là một OSN mà TÁC GIẢ các thực thể trong mạng cùng một loại, các liên kết giữa các thực thể là vô hướng và có Định nghĩa 1: Bài toán dự báo liên kết cùng một kiểu. Về một phương diện nào đó, cùng xuất hiện tại một khoảng thời gian trong OHUSNs đem lại cho người dùng một số tiện OHUSN [3] ích bao gồm [1]: hỗ trợ việc tạo ra các kết nối Cho OHUSN G = (V, E, T) và gọi OHUSN bạn bè (Facebook, Twitter…); hỗ trợ cộng tại khoảng thời gian ti là: tác (LinkedIn, ResearchGate,…) và hỗ trợ G t = (V t , E t ) với tiT i i i việc trao đổi thông tin (email…). Do số và: E t {(u , v, t i ) E : u , v V t } ( V t V ). i i i lượng người dùng rất lớn nên OHUSNs đã Hàm S t là một ánh xạ theo thời gian trên i tạo ra một khối lượng dữ liệu khổng lồ theo V ti được xác định bởi S t : V t V t P , i i i thời gian. Những dữ liệu này có những đặc ( u, v ) S t (u, v) . Với P là tập {0, 1}, i trưng dễ nhận biết như là chất lượng cao, dữ liệu lớn, bán cấu trúc, thay đổi theo thời gian S t (u, v) = 1 nếu hai node u, v V t tồn tại i i và được phản ánh một cách trực tiếp bởi con liên kết trong khoảng thời gian ti T. Bài người trong xã hội thực [4]. toán dự báo liên kết cùng xuất hiện tại một 138
- Tuyển tập Hội nghị Khoa học thường niên năm 2017. ISBN: 978-604-82-2274-1 khoảng thời gian trong OHUSN được phát biểu như sau: Data X và các tham số t t Gọi G , S t T là tập các OHUSN và ánh xạ j j j tại các khoảng thời gian tj T. Khả năng cặp Mờ hóa (u, v) VV (với u ≠ v) hình thành liên kết trong khoảng thời gian tN+1 được xác định bởi: (u , v ) arg max S t i k u , v Suy diễn mờ u v ; u , v V T (1) Với V T V t , dễ nhận thấy V T trùng với V. i tiT Giải mờ Những liên kết (những cặp (u,v)) xuất hiện trong khoảng thời gian thứ tN+1 có hai loại: thứ nhất là liên kết mới, tức là cặp node chưa Loại bỏ cạnh đã có liên kết đã có từng được xuất hiện ở các khoảng thời gian trong TN; thứ hai đó là liên kết lặp là những Dự báo các cặp có khả năng liên kết cặp node đã từng xuất hiện trong các khoảng thời gian trong TN. Định nghĩa 2. Bài toán dự báo liên kết Dự báo khả năng liên kết xuất hiện trong các khoảng thời gian khác nhau trên OHUSN Hình 1. Mô hình dự báo liên kết Cho OHUSN G = (V, E, T) và gọi OHUSN tại khoảng thời gian ti là: Từ dữ liệu ban đầu của các năm đã thống kế G t = (V t , E t ) với tiT\{t1} i i i số lượng các đồng tác giả với nhau, sử dụng ti hàm mờ hóa khả năng liên kết giữa các tác giả và: E t {(u , v, t i ) E : u , v V t } ( V t V t , i i i trong từng năm để từ đó suy diễn ra khả năng t t1 liên kết cho năm tiếp theo, từ các cặp nút có với V t là tập các node xuất hiện trong khoảng khả năng liên kết loại bỏ các cạnh đã liên kết t thời gian t T). Hàm S là một ánh xạ theo của năm thống kê khi đó còn lại các liên kết i thời gian trên V được xác định bởi: t i chưa từng là đồng tác giả với nhau. ti S : V V P , ti ti Sơ đồ tổng quan của suy diễn mờ [3] (hình 2): ( u , v ) S t i (u , v ), u V ti , v V t with t t1 , t i 1 . Với P là tập {0,1}, S t (u, v) =1 nếu hai i Đầu vào node u, v tại khoảng thời gian ti T tồn tại liên kết. Bài toán dự báo liên kết xuất hiện trong các khoảng thời gian khác nhau trong Mờ hóa OHUSN được phát biểu như sau: Khả năng lựa chọn cặp (u*, v*) tại khoảng thời gian ti T thoả mãn: Suy diễn mờ (u , v ) arg max S t u , v (2) i uV ti ,vV t with t t1 ,ti 1 , and ( u ,v ,ti )E t i Giải mờ 3. MÔ HÌNH DỰA TRÊN SUY DIỄN MỜ Trong mục này chúng tôi xây dựng một Đầu ra mô hình dự báo liên kết (hình 1) dựa trên suy diễn mờ (FIS) Hình 2. Mô hình suy diễn mờ 139
- Tuyển tập Hội nghị Khoa học thường niên năm 2017. ISBN: 978-604-82-2274-1 Mờ hóa: dựa trên tỉ lệ láng riềng chung Kết quả thực nghiệm chỉ ra với MAE thì trên tổng số láng riềng cao nhất; dựa trên hai PB là phương pháp cho kết quả tốt nhất còn tác giả u, v có chúng một láng riềng trên tổng FIS cho kết quả tốt, thứ 2 cuối cùng là ML. số láng riềng chung. Còn với Accuracy thì FIS cho kết quả tốt nhất, Giải mờ: dựa trên độ thuộc của hàm mức thứ 2 là ML cuối cùng là PB. Do vậy phương độ thuộc, giả trị ngưỡng xác định khả năng pháp nhóm đề xuất cũng đã cho thấy khả năng liên kết có tồn tại liên kết hay không. cải tiến trong quá trình dự báo liên kết. 4. KẾT QUẢ THỰC NGHIỆM 5. KẾT LUẬN Chúng tôi đã xây dựng dữ liệu training và Trong bài báo này, chúng tôi tập trung dữ liệu testing bằng cách sử dụng 8 năm liên nghiên cứu bài toán dự báo liên kết mạng tiếp (trong bảng 1). Nói cách khác, nếu chúng đồng tác giả. Kết quả thu được của bài này ta bắt đầu từ thời điểm t, các liên kết từ t đến đưa ra cách tiếp cận mờ trong việc giải bài t + 6 được cho, và các liên kết xuất hiện trong toán dự báo liên kết mạng đồng tác giả. Kết t + 7 là mục tiêu của dự đoán. Quá trình thực quả nghiên cứu có thể làm tiền đề cho các đề nghiệm trên matlab 2014A với cấu hình của xuất mới trong việc giải bài toán liên kết máy tính Vaio core i5. mạng đồng tác giả với các mô hình mờ trực cảm, mờ phức, nhận thức mờ. Bảng 1. Dữ liệu Năm Số tác giả Số liên kết 6. TÀI LIỆU THAM KHẢO 2003 1743 8168 [1] Lankeshwara Munasinghe (2013), Time- 2004 1804 9368 aware methods for Link Prediction in Social Networks, P.D Thesi, The Graduate 2005 1793 9931 University for Advanced Studies. 2006 1927 11082 [2] Lü, L., & Zhou, T. (2011). Link prediction in complex networks: A survey. Physica A: 2007 1912 10944 statistical mechanics and its 2008 2016 10942 applications, 390(6), 1150-1170. 2009 1979 9840 [3] Sun, C. T. (1994). Rule-base structure identification in an adaptive-network-based 2010 2150 10611 fuzzy inference system. IEEE Transactions on Fuzzy System, 2(1), 64-73. Quá trình đánh giá chúng tôi có cài đặt [4] Wang, P., Xu, B., Wu, Y., & Zhou, X. đánh giá dựa trên 2 độ đo MAE, Accuracy. (2015). Link prediction in social networks: Chúng tôi có so sánh với mô hình khả năng the state-of-the-art. Science China cực đại (Maximum Likelihood: ML) kiểu Information Sciences, 58(1), 1-38. phân cụm phân cấp và mô hình xác suất [5] Wu, Z., Lin, Y., Wang, J., & Gregory, S. (Probabilistic: PB) [2, 5] (2015). Efficient Link Prediction with Node Clustering Coefficient. arXiv preprint ML PB FIS arXiv:1510.07819. MAE 0.783 0.642 0.763 Accuracy (%) 69.67 65.67 71.09 140
ADSENSE
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn