Thuật toán TextRank
-
Bài viết đề xuất mô hình tóm tắt tự động văn bản tiếng Việt thể loại báo mạng điện tử. Văn bản được biểu diễn dưới dạng đồ thị, mỗi đỉnh của đồ thị biểu diễn một câu trong văn bản, trọng số các cạnh nối giữa các đỉnh biểu diễn sự tương tự về ngữ nghĩa giữa hai câu (đỉnh).
5p vijihyo2711 25-09-2021 22 2 Download
-
Nghiên cứu này trình bày kết quả của việc rút trích từ khóa tự động từ văn bản pháp luật Tiếng Việt sử dụng thuật toán TextRank. TextRank là phương pháp rút trích từ khóa không giám sát từ văn bản dựa vào việc xếp hạng trên đồ thị. Văn bản sẽ được biểu diễn thành dạng đồ thị, với các từ là đỉnh và mối quan hệ lân cận giữa các từ là cạnh. Sau đó, các đỉnh trên đồ thị sẽ được xếp hạng dựa trên mối quan hệ với các đỉnh khác trong đồ thị.
5p sotritu 18-09-2021 57 3 Download