
Thuật toán khai phá dữ liệu
-
Bài viết đề xuất một phiên bản cải tiến của thuật toán MMR để gom cụm dữ liệu phân loại, gọi là IMMR (Improved Minimum-Minimum Roughness). Ngoài việc duy trì tất cả các ưu điểm của MMR, thuật toán IMMR có hai cải tiến đáng chú ý.
10p
visherylsandberg
18-05-2022
0
0
Download
-
Bảo vệ tính riêng tư trong khai phá tập mục hữu ích trung bình cao (PPAUIM) có mục đích che giấu đi các thông tin riêng tư/nhạy cảm ẩn chứa trong cơ sở dữ liệu (CSDL) sao cho chúng không thể được khai thác bởi các thuật toán khai phá tập mục hữu ích trung bình cao (HAUIM) khi chia sẻ CSDL ra bên ngoài. Bài viết này tập trung nghiên cứu và đề xuất thuật toán ẩn tập mục hữu ích trung bình cao nhạy cảm có tên gọi là EHSHA-UI dựa trên phương pháp tối ưu cục bộ.
8p
visherylsandberg
18-05-2022
0
0
Download
-
Bài viết đề xuất và áp dụng cấu trúc dữ liệu phù hợp để xây dựng một thuật toán khai thác tập hữu ích cao hiếm, hiệu quả hơn các thuật toán trước đây về cả không gian tìm kiếm và thời gian thực thi.
10p
visherylsandberg
18-05-2022
0
0
Download
-
Bài báo đề xuất một phương pháp học máy cho giải thuật phân lớp này nhằm tăng hiệu quả phân lớp của thuật toán. Cách tiếp cận này về cơ bản đã làm tăng khả năng phân lớp của giải thuật RF, phương pháp đề xuất còn cho thấy khả năng phân lớp tốt hơn một số phương pháp trích chọn đã được công bố. Như vậy, hướng cải tiến mà bài báo đề xuất là có khả thi và thu được kết quả tương đối cao. Mời các bạn cùng tham khảo!
5p
wangziyi_1307
26-04-2022
2
0
Download
-
Khai phá tập phổ biến từ cơ sở dữ liệu giao dịch là một trong các kỹ thuật khai phá dữ liệu và có rất nhiều ứng dụng trong kinh doanh, y tế, giáo dục,... Bài viết trình bày vấn đề liên quan đến khai phá tập lợi ích cao; Mô hình CWU; Đề xuất thuật toán khai phá tập lợi ích cao sử dụng mô hình CWU; Kết quả đạt được và so sánh với các thuật toán khác.
11p
viplato
05-04-2022
7
0
Download
-
Bài giảng Kho dữ liệu và khai phá dữ liệu (2014): Phần 1 có nội dung trình bày giới thiệu về kho dữ liệu và khai phá dữ liệu; các bài toán và phương pháp cơ bản trong khai phá dữ liệu; các công nghệ và kỹ thuật tích hợp cơ sở dữ liệu; mô hình dữ liệu mở rộng XML; chuyển đổi và tích hợp dữ liệu;... Mời các bạn cùng tham khảo!
79p
chenlinong_0310
23-02-2022
26
6
Download
-
"Bài giảng Kho dữ liệu và kỹ thuật khai phá: Phần 1" có nội dung trình bày giới thiệu về kho dữ liệu và khai phá dữ liệu; các bài toán và phương pháp cơ bản trong khai phá dữ liệu; sự tích hợp của khai phá dữ liệu với cơ sở dữ liệu hay kho dữ liệu; các công nghệ và kỹ thuật tích hợp cơ sở dữ liệu; tích hợp các lược đồ dữ liệu; chuyển đổi và tích hợp dữ liệu;... Mời các bạn cùng tham khảo!
85p
chenlinong_0310
23-02-2022
3
2
Download
-
Sự phát triển của công nghệ thông tin (CNTT) và ứng dụng CNTT ở hầu hết các lĩnh vực đồng nghĩa với lượng dữ liệu đã được thu thập và lưu trữ ngày càng lớn. Các hệ quản trị cơ sở dữ liệu (CSDL) truyền thống chỉ khai thác được một lượng thông tin nhỏ không còn đáp ứng đầy đủ những yêu cầu, những thách thức mới. Trong phạm vi bài viết này, tác giả nghiên cứu kỹ thuật phát hiện tri thức trong CSDL việc làm và hỗ trợ định hướng xu hướng việc làm cho sinh viên Trường Đại học Kinh tế Công nghiệp Long An.
10p
vialexanderfleming
09-02-2022
20
2
Download
-
Bài nghiên cứu này cho biết một thuật toán gom cụm được gọi là K-means dựa trên mô hình MapReduce để xử lý dữ liệu hàng hải tàu biển tại khu vực miền Nam, Việt Nam. Với kết quả thu được, chúng tôi đưa ra suy luận hoặc dự đoán về dữ liệu gom cụm mà chúng được thu thập và sau đó là hiển thị dữ liệu của các hàng hải tàu biển, bao gồm quy mô, hướng và phân bố không gian.
7p
bobietbay
22-12-2021
4
0
Download
-
Bài viết đề xuất giải pháp khai phá các nguồn dữ liệu từ điển đang tồn tại để xây dựng nguồn dữ liệu từ điển đồng nhất, có kích thước và số cặp ngôn ngữ lớn hơn nhằm phục vụ khai thác và sử dụng hiệu quả hơn. Giải pháp chúng tôi đề xuất trong phạm vi bài báo này dừng lại ở đề xuất mô hình toán học và thuật toán hợp nhất các từ điển để tạo nguồn dữ liệu từ điển lớn hơn về kích thước, đầy đủ hơn về nghĩa diễn giải và nhiều hơn về số cặp ngôn ngữ.
8p
tomjerry008
11-12-2021
7
0
Download
-
Nghiên cứu này trình bày ý tưởng cải tiến thuật toán phân cụm dữ liệu PK-means, phân tích ưu và nhược điểm của thuật toán này, sau đó trình bày thuật toán cải tiến của chúng tôi SK-meansMR và thực nghiệm đánh giá chất lượng, tốc độ của thuật toán trên dữ liệu lớn.
8p
tomjerry008
11-12-2021
3
0
Download
-
Bài viết tập trung vào vấn đề phân lớp khách hàng, từ đó hỗ trợ tìm ra nhóm khách hàng tiềm năng bằng phương pháp cây quyết định Decision Tree J48, Naïve Bayes Classification và rừng ngẫu nhiên Random Forest.
8p
vimichaeldell
04-12-2021
9
0
Download
-
Nghiên cứu này sẽ tập trung phân tích, khai phá và tìm ra luật kết hợp dựa trên dữ liệu của quá khứ, từ đó đề xuất một số kiến nghị để hỗ trợ cho hoạt động kinh doanh của siêu thị được tối ưu hơn.
6p
vimichaeldell
04-12-2021
21
1
Download
-
Bài giảng Khai phá dữ liệu: Chương 4 Khai phá luật kết hợp, cung cấp cho người học những kiến thức như: Khai phá luật kết hợp (Association rule); Các thuật toán khai phá vô hướng luật kết hợp (giá trị lôgic đơn chiều) trong CSDL giao dịch; Khai phá kiểu đa dạng luật kết hợp/tương quan; Khai phá kết hợp dựa theo ràng buộc; Khai phá mẫu dãy. Mời các bạn cùng tham khảo!
70p
caphesuadathemmatong
25-11-2021
7
0
Download
-
Bài giảng Khai phá dữ liệu: Chương 5 Phân lớp, cung cấp cho người học những kiến thức như: Giới thiệu phân lớp; Các kỹ thuật phân lớp. Mời các bạn cùng tham khảo!
64p
caphesuadathemmatong
25-11-2021
2
0
Download
-
Trong tuyển dụng, hàng ngày nhà tuyển dụng nhận được rất nhiều hồ sơ ứng tuyển. Để có thể tìm được hồ sơ phù hợp, nhà ứng tuyển mất khá nhiều thời gian tìm và lọc hồ sơ. Một website tuyển dụng truyền thống chỉ dựa vào một số thuộc tính mà người dùng chọn lựa trên thanh tìm kiếm để trả về kết quả.
7p
vibigates
31-10-2021
12
0
Download
-
Mục tiêu nghiên cứu của đề tài là việc dự báo kết quả bóng đá cũng sẽ giúp cho người tham gia dự đoán có được những ý kiến gợi ý nhất định, tránh được những sai lầm không đáng có. Trang web dự báo kết quả bóng đá được xây dựng dựa trên hệ tư vấn. Luận văn tiến hành trình bày và phân tích dựa trên thuật toán lọc sử dụng độ đo tương tự để tính toán đưa ra khuyến nghị. Sau đó dựa trên kết quả phân tích để so sánh và đánh giá khả năng dự báo.
62p
tomjerry001
18-10-2021
14
2
Download
-
Bài viết này trình bày cách tiếp cận xây dựng mô hình khai phá mạng dữ liệu không đồng nhất phục vụ cho công tác nghiên cứu khoa học. Cụ thể chú trọng đến việc tìm kiếm sự tương đồng giữa các thực thể trong mạng học thuật không đồng nhất, bao gồm: Hỗ trợ tìm kiếm các đối tượng như là: Tác giả, đồng tác giả, hội nghị tính toán top-k vùng lân cận giữa các đối tượng nhằm hỗ trợ tìm kiếm và biểu diễn trực quan giúp cho người dùng có cái nhìn tổng quan hơn về sự phân bố, độ tương đồng của nhóm tác giả, nhóm hội nghị.
7p
vijihyo2711
25-09-2021
6
0
Download
-
Bài viết trình bày đề xuất một chiến lược mới để tỉa tập ứng viên nhằm giảm không gian tìm kiếm và đề xuất thuật toán ImprovedMinFHM khai phá hiệu quả tập lợi ích cao với số lượng phần tử tối thiểu
6p
vijihyo2711
25-09-2021
7
0
Download
-
Bài viết này sẽ mô hình hóa bộ dữ liệu email bằng một mạng lƣới và phân tích hệ thống theo tiếp cận mạng lưới bằng các thuật toán phân cụm K-core và modularity cực đại. Tìm ra các cụm dữ liệu, phân tích tính môđun để tìm ra các tri thức mới. Đây là một kỹ thuật phân tích mới giúp hiểu rõ về kiến trúc hệ thống và hỗ trợ thiết kế quy trình nghiệp vụ.
7p
vijihyo2711
25-09-2021
11
0
Download
CHỦ ĐỀ BẠN MUỐN TÌM
