Khai phá dữ liệu lớn
-
CHƯƠNG 1 Tổng quan về khai phá dữ liệu I. Khai phá dữ liệu (Data Mining) Khai phá dữ liệu (Data mining) là một khái niệm ra đời vào những năm cuối của thập kỷ 80. Nó bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thông tin có giá trị tiềm ẩn trong các tập dữ liệu lớn trong thực tế. Về bản chất, khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình có tính chính quy (regularities) từ các tập dữ liệu lớn...
31p 201630589 23-03-2013 221 64 Download
-
Mở đầu Khi bạn đang làm việc với lượng dữ liệu lớn, điều quan trọng là bạn hiểu rõ các quy tắc về các thực thể khác nhau có liên quan với nhau như thế nào. Thường phát hiện ra các quy tắc này là một quá trình phức tạp. Các quy tắc kết hợp rất đơn giản chỉ là chủ nghĩa hình thức có tác động mạnh đến các quy tắc mô tả các tập dữ liệu vì chúng biểu thị các thực thể nào có thể xuất hiện đồng thời với nhau. Một ví dụ truyền thống về...
23p buncha_1 11-05-2013 113 9 Download
-
Một số khái niệm cơ bản về phần mềm – Phâǹ mềm là gì? – Vai tro ̀ của phần mềm – Đặc trưng của phần mềm – Thuộc tính của phần mềm • Công nghệ phần mềm là gì? – Khái niệm, đặc trưng – Lic̣ h sử • Khủng hoảng phần mềm • Một số quan điểm sai lệch.Phần mềm máy tính (Computer software) là: – Sản phẩm do các nhà phát triển phần mềm thiết kế và xây dựng • So sánh chương trình (program) và phần mềm (software) • Software bao gồm 3 phần: – Programs – Data structure • Internal structure • External structure – Documentation, procedures to setup and operate,.....
30p thienthanoze 12-11-2012 166 28 Download
-
Các tiện ích thu thập dữ liệu tự động và công nghệ cơ sở dữ liệu lớn mạnh dẫn tới một lượng lớn dữ liệu được tích lũy và/hoặc cần được phân tích trong cơ sở dữ liệu, kho dữ liệu và trong các nguồn chứa dữ liệu khác.
40p sakuraphuong 20-05-2013 201 63 Download
-
Mục tiêu nghiên cứu của đề tài "Phương pháp ẩn các tập mục có độ hữu ích cao trong cơ sở dữ liệu giao tác lớn" nhằm tìm hiểu các thông số đánh giá tính hiệu quả của các phương pháp ẩn tập mục có độ hữu ích cao nhạy cảm. Tiến hành cài đặt thử nghiệm phương pháp đề xuất, đánh giá dựa trên các thông số, so sánh với các phương pháp ẩn hiện có.
26p trankora03 05-08-2023 11 4 Download
-
Mục tiêu nghiên cứu của đề tài là phát triển một số phương pháp khai phá dữ liệu trên dữ liệu có cấu trúc, tập trung vào dữ liệu biểu diễn cấu trúc dạng bảng và dạng đồ thị. Đối với dữ liệu dạng bảng, mục tiêu nghiên cứu là các bài toán giảm dư thừa dữ liệu, rút gọn thuộc tính, rút gọn đối tượng để thu được tập dữ liệu nhỏ hơn trong khi vẫn bảo toàn được tính chất rút gọn thuộc tính, sinh cây quyết định trong khai phá dữ liệu lớn.
135p tabicani 13-09-2021 40 4 Download
-
Đề tài “Ứng dụng phân cụm dữ liệu trong quản lý bảo hiểm tại công ty Bảo Việt nhân thọ Hà Nội” ứng dụng thuật toán của phân cụm dữ liệu để đưa ra nhóm khách hàng có sự giống nhau là lớn nhất và từ đó có thể giúp cho các chuyên ra đưa ra các đánh giá về các mẫu khách hàng, trên cơ sở hồ sơ mua bảo hiểm gồm các thông tin độ tuổi, số tiền, số năm mua. Mời các bạn cùng tham khảo!
64p heavysweetness 04-08-2021 45 8 Download
-
Luận văn này tìm hiểu về phụ thuộc hàm xấp xỉ và nghiên cứu thuật toán AFDMCEC, một thuật toán mới tìm các phụ thuộc hàm xấp xỉ trong các CSDL lớn dựa trên độ đo xấp xỉ. Thuật toán này sử dụng một số khái niệm trong lý thuyết thiết kế CSDL quan hệ, đặc biệt là các khái niệm phủ tối thiểu và lớp tương đương. Mời các bạn cùng tham khảo!
69p heavysweetness 04-08-2021 20 3 Download
-
Data mining là lĩnh vực đóng vai trò quan trọng trong việc phân tích và quản lý dữ liệu. Dựa vào đó chúng ta có thể đưa ra những dự đoán cho kế hoạch tương lai. Trong thời buổi công nghệ ngày càng phát triển như hiện nay, việc áp dụng khoa học công nghệ thông tin vào quá trình xử lý và phân tích dữ liệu là vô cùng cần thiết. Data mining chính là một trong số đó. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn các nội dung nghiên cứu.
17p khiemthocu 11-07-2021 170 20 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác mẫu tuần tự nén được thực hiện với nhiệm vụ nhằm mã hóa dữ liệu tuần tự bằng cách gán các codeword đối với các khoảng cách nhỏ, rồi từ đó tiến hành xử lý trên mẫu với khoảng cách lớn hơn, tính toán độ phức tạp của quá trình khai phá mẫu nén trên cơ sở dữ liệu tuần tự, nghiên cứu thuật toán GoKrimp để khai phá trực tiếp trên mẫu đã được nén dựa trên thuật toán tham lam. Mời các bạn cùng tham khảo.
59p xusong 12-07-2021 31 4 Download
-
Mục đích của Luận văn này nghiên cứu và tìm hiểu một số nền tảng của hệ thống dữ liệu lớn. Tìm hiểu một số lĩnh vực phân tích tìm các giá trị của hệ thống dữ liệu lớn (thực chất là khai phá dữ liệu tìm các tri thức). Mời các bạn cùng tham khảo!
81p monsterhunterer 15-06-2021 31 7 Download
-
Mục đích của Luận văn này là nghiên cứu và tìm hiểu một số nền tảng của hệ thống dữ liệu lớn. Tìm hiểu một số lĩnh vực phân tích tìm các giá trị của hệ thống dữ liệu lớn (thực chất là khai phá dữ liệu tìm các tri thức). Nghiên cứu và tìm hiểu một số thuật toán liên quan đến tập rút gọn (tập thuộc tính rút gọn bảo toàn thông tin phân lớp của bảng quyết định). Trên cơ sở này tiến hành xây dựng phần mềm thử nghiệm. Mời các bạn cùng tham khảo!
17p monsterhunterer 15-06-2021 37 4 Download
-
Nội dung của bài tập lớn này với mục đích tìm hiểu và trình bày về một kỹ thuật trong khai phá dữ liệu để phân lớp dữ liệu cũng như tổng quan về khai phá dữ liệu. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn nội dung nghiên cứu.
22p tuyetminhhb 19-03-2021 439 42 Download
-
Phân lớp dữ liệu là vấn đề lớn và quan trọng của khai phá dữ liệu. Cây quyết định là giải pháp hữu hiệu của bài toán phân lớp, nó bao gồm từ mô hình cho quá trình học đến các thuật toán huấn luyện cụ thể để xây dựng cây. Luận án tập trung nghiên cứu mô hình linh hoạt cho quá trình huấn luyện cây từ tập mẫu huấn luyện, nghiên cứu phương pháp xử lý giá trị ngôn ngữ và xây dựng các thuật toán học phân lớp dữ liệu bằng cây quyết định mờ đạt nhằm đạt hiệu quả trong dự đoán và đơn giản đối với người dùng. Để tìm hiểu rõ hơn, mời các bạn cùng xem và tham khảo.
120p dtphuongg 10-09-2018 88 11 Download
-
Phân tích tương ứng được áp dụng rất rộng rãi trong rất nhiều lĩnh vực như phân tích dữ liệu kinh doanh, điều tra xã hội học, khai phá dữ liệu,…. CA cho phép phát hiện các tri thức tiềm ẩn trong khối lượng dữ liệu lớn một cách dễ dàng thông qua phương pháp trực quan hóa (sử dụng bản đồ các điểm).
23p hoanglinh0808 13-06-2017 281 23 Download
-
Trong thời đại công nghệ thông tin hiện nay, sự phát triển của công nghệ kéo theo sự gia tăng rất lớn của lưu lượng thông tin lưu trữ và trao đổi. Do đó, yêu cầu về tổ chức lưu trữ và truy cập thông tin sao cho hiệu quả được đặt lên hàng đầu. Hướng giải quyết được đưa ra là tổ chức, tìm kiếm và phân loại thông tin một cách hiệu quả.
18p thompilu 03-05-2017 259 44 Download
-
Khai phá dữ liệu là một tiến trình khai phá tự động những tri thức tiềm ẩn trong cơ sở dữ liệu, cụ thể hơn là tiến trình lọc sản sinh những tri thức hoặc mẫu tiềm ẩn chứa thông tin hữu ích từ số lượng dữ liệu lớn. Để nắm rõ hơn mời các bạn tham khảo tài liệu.
24p trentroicosao 11-03-2014 161 31 Download
-
Cùng với sự phát triển của khoa học kỹ thuật là sự bùng nổ của công nghệ dữ liệu mới như World Wide Web, data stream… đã đặt ra một yêu cầu cấp thiết cho các kỹ thuật mới và công nghệ tự động để có thể chuyển đổi một lượng lớn dữ liệu thành các thông tin hữu ích và đưa ra các dự báo hữu ích cho người sử dụng, Khai thác dữ liệu ra đời nhằm giải quyết những vấn đề trên. Vì thông tin có thể thay đổi liên tục và rộng lớn nên đây là một ngành khoa học đỏi hỏi phải luôn nâng cấp và tối ưu hóa tri thức hiện có để có thể phục vụ tốt hơn nhu cầu của người sử dụng.
19p online_12 07-11-2013 150 17 Download
-
Sử dụng phương thức gửi thông tin bằng sắc độ của ánh sáng (bước sóng khác nhau), các nhà khai thác mạng Internet2 siêu tốc đang kỳ vọng tăng tốc độ lên 80 lần cho phép các nhà nghiên cứu kết nối kính viễn vọng trên toàn thế giới và thực hiện các tác vụ đòi hỏi băng thông lớn. Người phụ trách chính của Internet2 là Douglas Van Houweling cho biết, mạng thế hệ mới này có thể sẵn sàng đi vào hoạt động từ mùa thu năm 2007. Ông cho biết: theo dự kiến, tuần này các nhà nghiên cứu...
2p bibocumi28 21-01-2013 83 8 Download
-
Sự phát triển mạnh mẽ của công nghệ phần cứng đã tạo nên các máy tính có bộ xử lý tốc độ cao, bộ nhớ dung l−ợng lớn vμ cùng với điều đó, lμ sự phát triển không ngừng các hệ thống mạng viễn thông. Từ các kết quả đó, nhiều hệ thống thông tin phục vụ việc tự động hóa mọi hoạt động
88p bluesky_12 26-12-2012 73 24 Download