Giai đoạn trong khai phá dữ liệu
-
Bài viết "Tổng quan phân tích và khai phá dữ liệu trong giáo dục đại học tiếp cận theo phương pháp trắc lượng thư mục từ cơ sở dữ liệu Scopus giai đoạn 2004-2023" cung cấp đánh giá thư mục về 4023 bài báo đã xuất bản từ cơ sở dữ liệu Scopus trong giai đoạn từ năm 2004 đến năm 2023. Nghiên cứu tập trung chủ yếu vào việc sử dụng các kỹ thuật phân tích và khai thác dữ liệu trong giáo dục đại học tiên tiến để tối ưu hóa các mô hình dự đoán kết quả học tập của người học và phát hiện hành vi của người học để can thiệp kịp thời.
5p xuanphongdacy04 04-09-2024 7 2 Download
-
Mục tiêu chính của luận án "Giải pháp gợi ý trong việc cố vấn học tập" là đề xuất các phương pháp tiếp cận mới cho bài toán dự đoán kết quả học tập của sinh viên từ đó xây dựng hệ thống gợi ý lựa chọn môn học phù hợp cho từng sinh viên cụ thể.
143p thuyduong0620 01-08-2024 3 1 Download
-
Bài giảng Khai phá dữ liệu với mục tiêu giới thiệu cho người học tổng quan về các quá trình khám phá tri thức, khai phá dữ liệu, và quá trình tiền xử lý dữ liệu; Giới thiệu cho người học giá trị lợi ích mà khai phá dữ liệu đóng góp trong các lĩnh vực ứng dụng khác nhau; Trình bày các giải thuật và kỹ thuật chính trong giai đoạn tiền xử lý dữ liệu.
10p conbongungoc09 05-08-2021 61 4 Download
-
Bài giảng Khai phá dữ liệu: Bài 1 Tổng quan về khai phá dữ liệu cung cấp cho người học những kiến thức như: Giới thiệu chung; Khai phá dữ liệu là gì; Quá trình khai phá tri thức; Các kỹ thuật áp dụng trong khai phá dữ liệu; Ứng dụng khai phá dữ liệu. Mời các bạn cùng tham khảo!
34p conbongungoc09 05-08-2021 67 4 Download
-
Bài viết này đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế để xác định các sinh viên có thuộc diện “cảnh báo” hay “không cảnh báo” đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu tiêu biểu như Cây quyết định, láng giềng lân cận và một số phương pháp sinh luật khác. Tiếp cận tập thô cũng đã cho thấy nó rất hiệu quả trong trường hợp dữ liệu mất cân bằng.
8p quenchua9 20-11-2020 41 4 Download
-
Bài viết này đề xuất giải pháp dùng kỹ thuật phân rã ma trận tích hợp mạng xã hội (Social Matrix Factorization) trong xây dựng Hệ trợ giảng thông minh (Intelligent Tutoring System - ITS). Trước hết chúng tôi điểm lại các khái niệm chính trong ITS cũng như Kỹ thuật phân rã ma trận trong Hệ thống gợi ý, sau đó đề xuất mô hình dự đoán kết quả học tập của người học trong ITS. Thực nghiệm trên tập dữ liệu thu thập từ thực tế cho thấy việc tích hợp thêm mối quan hệ xã hội của người học có khả năng làm tăng độ chính xác của mô hình dự đoán trong ITS.
8p quenchua9 20-11-2020 46 3 Download
-
Bài viết đề xuất một mô hình học máy cho bài toán phân lớp trên tập dữ liệu mất cân bằng, trong đó sử dụng kết hợp kỹ thuật sinh mẫu tổng hợp SMOTE và giải thuật AdaBoost cho thuật toán Cây quyết định.
10p viv2711 14-10-2020 53 2 Download
-
Đề tài nghiên cứu tìm hiểu bài toán dự đoán khách hàng tiềm năng cho các gói cước viễn thông và các hướng tiếp cận giải quyết bài toán; phân tích, tìm hiểu và xử lý các đặc trưng, đặc tính của dữ liệu thuê bao, đưa ra các đặc trưng phù hợp nhất với bài toán,... Mời các bạn cùng tham khảo.
50p tamynhan0 04-07-2020 53 5 Download
-
Khám phá itemsets là công việc quan trọng trong khai thác dữ liệu. Nhờ đó mà ta có thể khai thác luật kết hợp từ các itemsets đó. Tuy nhiên, không gian tìm kiếm trong giai đoạn tìm các itemsets cần thiết thì rất lớn theo từng bước, độ dài k của các item.
7p vichoji2711 04-05-2020 52 4 Download
-
Phân lớp dữ liệu là vấn đề lớn và quan trọng của khai phá dữ liệu. Cây quyết định là giải pháp hữu hiệu của bài toán phân lớp, nó bao gồm từ mô hình cho quá trình học đến các thuật toán huấn luyện cụ thể để xây dựng cây. Luận án tập trung nghiên cứu mô hình linh hoạt cho quá trình huấn luyện cây từ tập mẫu huấn luyện, nghiên cứu phương pháp xử lý giá trị ngôn ngữ và xây dựng các thuật toán học phân lớp dữ liệu bằng cây quyết định mờ đạt nhằm đạt hiệu quả trong dự đoán và đơn giản đối với người dùng. Để tìm hiểu rõ hơn, mời các bạn cùng xem và tham khảo.
120p dtphuongg 10-09-2018 86 11 Download
-
Bài viết này đề cập đến mô hình dự báo theo GIS 4D (3D không gian và 1D theo thời gian) về xây dựng nhà trong tương lai. Mô hình đề xuất dựa trên việc khai phá dữ liệu xây dựng giai đoạn giai đoạn 2001 đến 2010 và dữ liệu LIDAR trong khu vực Quận 5 thành phố Hồ Chí Minh.
7p sansan2 26-05-2018 68 7 Download
-
Chương 2 trình bày về giai đoạn tiền xử lý dữ liệu. Sau khi học xong chương này người học có thể biết được: Tại sao phải tiền xử lý dữ liệu? Các vấn đề dữ liệu, các chiều đo chất lượng dữ liệu, nhiệm vụ chính trong tiền xử lý dữ liệu,... Mời các bạn cùng tham khảo.
26p youcanletgo_05 21-01-2016 208 15 Download
-
Chương 2 đề cập đến các vấn đề tiền xử lý dữ liệu. Các nội dung chính trình bày trong chương gồm có: Tổng quan về giai đoạn tiền xử lý dữ liệu, tóm tắt mô tả về dữ liệu, làm sạch dữ liệu, tích hợp dữ liệu, biến đổi dữ liệu, thu giảm dữ liệu,... Mời các bạn cùng tham khảo.
56p youcanletgo_01 04-01-2016 162 12 Download
-
Các dữ liệu lưu trữ hoàn toàn là dưới dạng thô, chưa sẵn sàng cho việc phát hiện, khám phá thông tin ẩn chứa trong đó. Do vậy chúng cần phải qua giai đoạn tiền xử lý dữ liệu trước khi tiến hành bất kỳ một phân tích nào. Trong chương 2 này chúng ta sẽ tìm hiểu rõ hơn về giai đoạn tiền xử lý dữ liệu.
88p kiepnaybinhyen_01 01-12-2015 228 41 Download
-
Bài giảng môn học Khai phá dữ liệu: Bài mở đầu - Tổng quan về khai phá dữ liệu trình bày về nhu cầu khai phá dữ liệu, khái niệm về dữ liệu; mẫu; tri thức và khai phá dữ liệu, các bài toán khai phá dữ liệu cơ bản, các giai đoạn trong khai phá dữ liệu, kiến trúc điển hình của một hệ thống khai phá dữ liệu, các nguồn dữ liệu phục vụ cho khai phá và ứng dụng của khai phá dữ liệu.
36p quangtriyeuthuong32 25-04-2014 195 44 Download
-
Việc hình thành các độ đo hấp dẫn (interestingness measures, quality measures) nhằm đánh giá chất lượng của tri thức dưới dạng luật kết hợp (association rules) đóng một vai trò rất quan trọng trong giai đoạn hậu xử lý (postprocessing) các luật kết hợp của tiến trình khai phá tri thức từ dữ liệu (Knowledge Discovery from Databases - KDD).
12p sunshine_7 22-07-2013 51 2 Download
-
Mở đầu Phân đoạn khách hàng cho phép bạn nhóm khách hàng thành các đoạn các khách hàng tương tự như nhau. Để giải thích tại sao điều này có thể có ích, hãy xem xét kịch bản sau đây. Bạn thu thập dữ liệu về các khía cạnh nhân khẩu học của khách hàng của bạn (tuổi tác, nghề nghiệp, nơi cư trú, v.v..) cũng như dữ liệu về giao dịch của họ (các mặt hàng đã mua, các hợp đồng, v.v..). Một phân tích về dữ liệu đã kết hợp này có thể để lộ ra các nhóm...
22p buncha_1 11-05-2013 102 7 Download
-
Sony lại bị rò rỉ 8.500 tài khoản vì tin tặc tấn công .Hôm 24/5, tập đoàn Sony cho hay, họ lại vừa phát hiện một lỗ hổng bảo mật mới khiến cho 8.500 tài khoản người dùng của trang dịch vụ nhạc giải trí thuộc Sony tại Hy Lạp bị tin tặc khai thác. .Phát ngôn viên Shigenori Yoshida của Sony nói rằng dữ liệu bị mất gồm tên, số điện thoại và địa chỉ email của người dùng, đồng thời cho biết thêm các số thẻ tín dụng không bị ảnh hưởng trong vụ tấn công mới nhất này. Sony...
5p yeutinh98 19-09-2012 69 5 Download
-
Nội dung của luận văn gồm 3 chương và phần phụ lục:Chương 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN TRI THỨC. Chương này đề cập đến các giai đoạn của quy trình phát hiện tri thức, các vấn đề chính của khai phá dữ liệu, các phương pháp, các nhiệm vụ trong khai phá dữ liệu.Chương 2: CƠ SỞ LÝ THUYẾT CỦA LUẬT KẾT HỢP, MỘT SỐ THUẬT TOÁN PHÁT HIỆN LUẬT KẾT HỢP.
78p sunflower_1 06-09-2012 214 100 Download