Thuật toán khai thác tập phổ biến
-
Khai thác tập phổ biến từ dữ liệu luồng dựa trên thuật toán di truyền sử dụng bit và xử lý song song
Bài viết đề xuất một phương pháp mới để khai thác tập phổ biến từ dữ liệu luồng sử dụng thuật toán di truyền kết hợp với các phép toán bit và xử lý song song. Cốt lõi của phương pháp này sử dụng ThreadPoolExecutor từ Python để xử lý song song, tăng tốc độ tính toán đáng kể và cho phép xử lý các luồng dữ liệu lớn một cách hiệu quả.
14p gaupanda065 03-12-2024 6 2 Download
-
Mục tiêu của luận văn này hướng tới cách giải quyết bài toán: Từ cơ sở dữ liệu có sẵn, làm sao để khai thác toàn bộ các tập phổ biến đóng, quan hệ cha – con giữa các tập này, cải tiến giải thuật khai thác dàn các tập phổ biến đóng để việc khai thác tập luật kết hợp sau này được dễ dàng và hiệu quả hơn.
72p bobietbo 01-06-2022 35 6 Download
-
Luận văn "Phương pháp khai thác theo chiều ngang để trích xuất các tập phổ biến" được hoàn thành với mục tiêu là tìm hiểu các kiến thức nền tảng về khai thác dữ liệu, khai thác tập phổ biến, thuật toán gốc Apriori và các cải tiến của Apriori. Tiếp sau đó người nghiên cứu sẽ tiến hành giai đoạn thứ hai: tập trung tìm hiểu và nghiên cứu thuật toán khai thác tập phổ biến đầy đủ theo chiều ngang, trong thuật toán có sử dụng ma trận bit để nén tập dữ liệu.
73p bobietbo 01-06-2022 31 8 Download
-
Nội dung luận văn có kết cấu gồm 3 chương: Chương 1 - Tổng quan về khai phá dữ liệu và khai phá tập mục phổ biến; Chương 2 - Một số thuật toán hiệu quả khai phá tập mục lợi ích cao; Chương 3 - Chương trình thực nghiệm. Mời các bạn cùng tham khảo!
84p heavysweetness 04-08-2021 16 4 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu và ứng dụng Hadoop để khai thác tập phổ biến được thực hiện với mục tiêu nhằm thực hiện thuật toán Apriori trên một số tập dữ liệu mẫu lớn, tính toán trên hệ thống song song Hadoop/MapReduce. Mời các bạn cùng tham khảo.
114p xusong 12-07-2021 61 3 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến được thực hiện với mục tiêu nhằm tìm hiểu việc khai thác các tập phổ biến (frequent item sets) trong cơ sở dữ liệu lớn, dựa trên cấu trúc dữ liệu mới hay gọi là danh sách mẫu phổ biến PL (requent Pattern List). Mời các bạn cùng tham khảo.
69p xusong 12-07-2021 53 5 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác Top-rank K cho tập đánh trọng trên cơ sở dữ liệu có trọng số được thực hiện với mục tiêu nhằm tập trung vào nghiên cứu các thuật toán khai thác các tập được đánh trọng số dựa trên các thuật toán khai thác tập phổ biến trên cơ sở dữ liệu giao dịch nhị phân. Đề xuất ra thuật toán khai thác các Top-rank-k của các tập được đánh trọng số dựa trên cơ sở dữ liệu giao dịch có trọng số. Mời các bạn cùng tham khảo.
64p xusong 12-07-2021 52 4 Download
-
Đề tài nghiên cứu nhằm phân biệt mô hình tương quan thường xuyên và mô hình tương quan hiếm; sự tích hợp thông minh của hai mô hình đơn điệu và chống đơn điệu; tiếp cận thuật toán Cori để tìm tập phổ biến tương quan hiếm.
19p bautroibinhyen24 20-04-2017 61 2 Download
-
Luận án trình bày về các nội dung: tổng quan về khai thác tập mục, khai thác tập mục phổ biến trên cơ sở dữ liệu số lượng, khai thác tập mục phổ biến trên cơ sở dữ liệu số lượng có sự phân cấp các mục, kết luận và hướng phát triển đề tài. Để biết rõ hơn về nội dung chi tiết, mời các bạn cùng tham khảo.
123p lovivivi000 23-12-2016 88 2 Download
-
Bài giảng kỹ thuật siêu cao tần phần 1 tập trung giới thiệu những kiến thức về kỹ thuật siêu cao tần. Cụ thể là các đơn vị kiến thức liên quan đến quá trình truyền sóng SCT trong các đường truyền phổ biến như ống dẫn sóng, dây song hành, cáp đồng trục. Quá trình dao động điện tử ở dãi SCT của các mạch dao động cộng hưởng khác nhau trong hộp cộng hưởng,bước sóng, độ phẩm chất và các phương pháp kích thích. Các phương pháp phân tích, tổng hợp và tính toán mạng nhiều cực.
8p nhatrangyeuthuong 14-04-2014 191 24 Download
-
ITARM - Incremental Temporal Association Rules Mining dựa trên nền của thuật toán Sliding-Window Filtering, duy trì những tập tập phổ biến sau khi dữ liệu đã được cập nhật. Cùng tìm hiểu thuật toán này qua bài tiểu luận Thuật toán hiệu quả trong việc khai thác những luật kết hợp thời gian - ITARM.
20p wave_12 05-04-2014 75 8 Download
-
Internet ngày nay đã trở thành một công cụ hỗ trợ đắc lực trong các hoạt động giải trí, học tập, làm việc. Bên cạnh đó, đây cũng là môi trường phổ biến để nhiều doanh nghiệp thực hiện chiến dịch "săn đầu người" thông qua các website tìm việc online. Chính điều này đã hình thành nhu cầu khai thác hiệu quả môi trường này để thể hiện năng lực cá nhân của nhiều bạn trẻ, hoặc những nhân sự mong muốn phát triển hình ảnh của mình toàn cầu... Vì sao phải giữ gìn và quảng bá bản...
3p hoangliensonnhi 29-07-2013 69 6 Download
-
Câu 1 : Cho CSDL giao dịch sau và minsupp = 60%, minconf = 70% a) Hãy sử dụng lần lượt các thuật toán Apriori và FP-Growth để tìm tất cả các tập phổ biến . Liệt kê các tập phổ biến tối đại và tập bao phổ biến. b) Tìm các luật kết hợp được xây dựng từ các tập phổ biến tối đại thỏa mãn các ngưỡng minsupp, minconf đã cho TID 100 200 300 400 500 Câu 2 : Cho CSDL huấn luyện sau :. STT Màu tóc Chiều cao (cm) Cân nặng (kg) Có gia đình Kết...
4p abcdef_14 19-07-2011 706 69 Download