Bài toán khai phá mẫu
-
Luận án "Tích hợp đặc trưng ngôn ngữ vào mô hình học thống kê cho phân tích tình cảm" được hoàn thành với mục tiêu nhằm đề xuất các phương pháp và mô hình học máy cho bài toán phân tích tình cảm, trong đó tác giả phân tích các đặc trưng ngôn ngữ được trích chọn dựa trên các mẫu có sẵn và các mẫu học tự động được tích hợp vào các mô hình học thống kê cho phân loại tính chủ quan được áp dụng cho dữ liệu Tiếng Anh và tiếng Việt;
140p khanhchi0912 12-04-2024 6 3 Download
-
Bài viết Khai phá luật kết hợp trên cơ sở dữ liệu gia tăng trình bày về thuật toán khai phá luật kết hợp trên cơ sở dữ liệu gia tăng theo chiều dọc. Sau đó, tác giả xây dựng thực nghiệm trên bộ dữ liệu mẫu để đánh giá so sánh với thuật toán Apriori.
3p vipettigrew 15-03-2023 9 4 Download
-
Bài viết "Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện" đề xuất thuật toán RSFPGrowth khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện. Thuật toán RSFPGrowth cho phép thay vì tìm tập tất cả các tập mục thường xuyên trong cơ sở dữ liệu lớn bằng cách tìm tập chứa hầu hết các tập tập mục thường xuyên từ tập mẫu đại diện các giao tác. Mời các bạn cùng tham khảo!
11p lieuyeuyeu18 23-12-2022 35 6 Download
-
Bài viết Phát hiện mẫu bất thường cho trong doanh nghiệp bán lẻ bằng phân tích motif khai phá motif cho chuỗi thời gian và phát hiện bất thường bằng thuật toán học máy rừng ngẫu nhiên được đề xuất. Một mô hình xác định các mẫu hành vi gian lận và phân loại các đối tượng trong bài toán phát hiện bất thường ở cấp độ tài khoản được mô hình hoá.
12p vizenvo 02-12-2022 13 4 Download
-
Bài giảng Khai phá dữ liệu trong kinh doanh - Chương 1: Tổng quan về khai phá dữ liệu trong kinh doanh. Chương này cung cấp cho học viên những kiến thức về: khai phá dữ liệu; khái niệm kho dữ liệu; một số mẫu dữ liệu trong kinh doanh cần khai phá; tầm quan trọng của khai phá dữ liệu trong kinh doanh; quy trình khai phá dữ liệu trong kinh doanh;... Mời các bạn cùng tham khảo!
21p hidetoshidekisugi 15-06-2022 31 3 Download
-
Luận văn "Sử dụng cây quyết định phân lớp dữ liệu mất cân đối" được thực hiện với mục tiêu chính như thách thức của bài toán phân lớp dữ liệu mất cân đối là vấn đề về đối tượng cần quan tâm nghiên cứu lại có rất ít mẫu - mẫu lớp thiểu số so với các lớp khác trong tập dữ liệu - mẫu lớp đa số.
71p bobietbo 01-06-2022 90 10 Download
-
Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 1 trình bày một số khái niệm cơ bản về khai phá dữ liệu, các loại dữ liệu và kiểu mẫu dùng để khai phá, các bài toán và phương pháp cơ bản trong khai phá dữ liệu, sự tích hợp của khai phá dữ liệu, ứng dựng của kho dữ liệu và khai phá dữ liệu.
30p lavender2022 21-04-2022 33 3 Download
-
Bài giảng Khai phá dữ liệu: Chương 4 Khai phá luật kết hợp, cung cấp cho người học những kiến thức như: Khai phá luật kết hợp (Association rule); Các thuật toán khai phá vô hướng luật kết hợp (giá trị lôgic đơn chiều) trong CSDL giao dịch; Khai phá kiểu đa dạng luật kết hợp/tương quan; Khai phá kết hợp dựa theo ràng buộc; Khai phá mẫu dãy. Mời các bạn cùng tham khảo!
70p caphesuadathemmatong 25-11-2021 27 2 Download
-
Chương 4 - Khai phá luật kết hợp. Những nội dung chính trong chương này gồm có: Bán chéo và bán tăng cường, khái niệm cơ sở: tập phổ biến và luật kết hợp, khái niệm cơ sở: tập phổ biến và luật kết hợp, khái niệm cơ bản: mẫu phổ biến và luật kết hợp, khái niệm khai phá kết hợp, khái niệm khai phá luật kết hợp, mẫu phổ biến và khai phá luật kết hợp là một bài toán bản chất của khai phá dữ liệu,… Mời các bạn cùng tham khảo.
75p lovebychance07 12-07-2021 38 5 Download
-
Mục tiêu của đề tài là tìm hiểu các kiến thức cơ bản về các phương pháp khai phá mẫu dãy thường xuyên, sau đó là các biến thể ràng buộc chi tiết về trọng số, thời gian với top-k mẫu dãy cài đặt thử nghiệm toán khai phá Top-k mẫu dãy thường xuyên trọng số với khoảng cách thời gian.
84p capheviahe27 23-02-2021 34 7 Download
-
Mục tiêu của luận văn "Khai phá mẫu dãy lợi ích cao với khoảng cách thời gian" là tập trung nghiên cứu bài toán khai phá mẫu dãy thường xuyên, mẫu dãy lợi ích cao và mẫu dãy lợi ích cao với khoảng cách thời gian. Mời các bạn cùng tham khảo nội dung chi tiết.
80p capheviahe27 23-02-2021 55 4 Download
-
Bài viết đề xuất một mô hình học máy cho bài toán phân lớp trên tập dữ liệu mất cân bằng, trong đó sử dụng kết hợp kỹ thuật sinh mẫu tổng hợp SMOTE và giải thuật AdaBoost cho thuật toán Cây quyết định.
10p viv2711 14-10-2020 53 2 Download
-
Bài viết sẽ phân tích ưu nhược điểm của các thuật toán và đề xuất một cải tiến cho thuật toán CMSPAM. Thuật toán cải tiến được đặt tên là CMSPAME cho hiệu quả tốt hơn đối với trường hợp dữ liệu thưa và vẫn giữ nguyên được hiệu năng như thuật toán CMSPAM trong các trường hợp khác.
9p vishizuka2711 07-04-2020 43 2 Download
-
Bài viết đã đánh giá tính phức tạp của tập mẫu huấn luyện khi trích chọn từ dữ liệu nghiệp vụ thông qua việc phân tích tính đa dạng của miền trị thuộc tính. Bài viết cũng đã chỉ ra tính phức tạp khi định lượng giá trị ngôn ngữ đặc biệt là các giá trị ngôn ngữ ngoại lai trong tập mẫu huấn luyện.
9p vitomato2711 11-03-2020 28 3 Download
-
Bài viết nhằm đề xuất một phương pháp khai phá mẫu dãy trọng số chuẩn hóa với khoảng cách thời gian, chúng tôi không chỉ quan tâm đến số lần xuất hiện của các dãy (độ hỗ trợ) mà còn quan tâm đến khoảng cách thời gian giữa các dãy và mức độ quan trọng khác nhau (trọng số) của chúng.
11p vitomato2711 11-03-2020 21 2 Download
-
Phân lớp dữ liệu là vấn đề lớn và quan trọng của khai phá dữ liệu. Cây quyết định là giải pháp hữu hiệu của bài toán phân lớp, nó bao gồm từ mô hình cho quá trình học đến các thuật toán huấn luyện cụ thể để xây dựng cây. Luận án tập trung nghiên cứu mô hình linh hoạt cho quá trình huấn luyện cây từ tập mẫu huấn luyện, nghiên cứu phương pháp xử lý giá trị ngôn ngữ và xây dựng các thuật toán học phân lớp dữ liệu bằng cây quyết định mờ đạt nhằm đạt hiệu quả trong dự đoán và đơn giản đối với người dùng. Để tìm hiểu rõ hơn, mời các bạn cùng xem và tham khảo.
120p dtphuongg 10-09-2018 86 11 Download
-
TRong bài viết này, các tác giả phân tích và chỉ ra một số cách chọn tập mẫu huấn luyện tốt từ cơ sở dữ liệu nghiệp vụ, từ đó đưa vào thuật toán học để tạo dựng cây quyết định có khả năng dự đoán cao, nhằm hỗ trợ ra quyết định trong các bài toán phân tích dữ liệu.
10p binhminhmuatrenngondoithonggio 09-06-2017 82 7 Download
-
Bài viết Mô hình mới trên cây nén cho khai phá tập mục lợi ích cao đề xuất mô hình CWU (Candidate Weight Utility) trên cây tiền tố nén mẫu lợi ích. Xây dựng thuật toán CTU-PRO+ dựa trên thuật toán CTU-PRO và sử dụng mô hình bài viết đề xuất CWU.
11p maiyeumaiyeu26 23-12-2016 71 4 Download
-
Bài giảng khai phá dữ liệu web: Giới thiệu môn học sẽ giới thiệu tới các bạn về vấn đề khai phá Text và khai phá Web: khái niệm, đặc trưng và phân loại; một số kiến thức Toán học cho khai phá dữ liệu web: Toán học Internet, Mô hình đồ thị, Học máy xác suất Bayes; khai phá sử dụng web: Phân tích mẫu truy nhập Web, Phân tích xu hướng cá nhân;...
13p codon_02 19-11-2015 105 9 Download
-
Trong bài báo này các tác giả đề nghị thêm một cách dùng PCA như phương pháp trích chọn đặc trưng để giảm chiều, kết hợp với các giải thuật khai phá dữ liệu nhằm cải thiện sự quá khớp (overfitting) khi áp dụng mạng nơron (Mạng nơron nhân tạo -Artificical Neural Network) cho các bài toán dự báo thuộc tính đích dựa trên có tập mẫu nhỏ với không gian mô tả có số chiều cao. Thực nghiệm chi ra rằng việc kết hợp giữa PCA và ANN tỏ ra khá phù hợp.
14p uocvong07 14-10-2015 70 6 Download