Khai phá dữ liệu lớn
-
Mục tiêu nghiên cứu của đề tài "Phương pháp ẩn các tập mục có độ hữu ích cao trong cơ sở dữ liệu giao tác lớn" nhằm tìm hiểu các thông số đánh giá tính hiệu quả của các phương pháp ẩn tập mục có độ hữu ích cao nhạy cảm. Tiến hành cài đặt thử nghiệm phương pháp đề xuất, đánh giá dựa trên các thông số, so sánh với các phương pháp ẩn hiện có.
26p trankora03 05-08-2023 10 4 Download
-
Mục tiêu nghiên cứu của đề tài là phát triển một số phương pháp khai phá dữ liệu trên dữ liệu có cấu trúc, tập trung vào dữ liệu biểu diễn cấu trúc dạng bảng và dạng đồ thị. Đối với dữ liệu dạng bảng, mục tiêu nghiên cứu là các bài toán giảm dư thừa dữ liệu, rút gọn thuộc tính, rút gọn đối tượng để thu được tập dữ liệu nhỏ hơn trong khi vẫn bảo toàn được tính chất rút gọn thuộc tính, sinh cây quyết định trong khai phá dữ liệu lớn.
135p tabicani 13-09-2021 31 4 Download
-
Đề tài “Ứng dụng phân cụm dữ liệu trong quản lý bảo hiểm tại công ty Bảo Việt nhân thọ Hà Nội” ứng dụng thuật toán của phân cụm dữ liệu để đưa ra nhóm khách hàng có sự giống nhau là lớn nhất và từ đó có thể giúp cho các chuyên ra đưa ra các đánh giá về các mẫu khách hàng, trên cơ sở hồ sơ mua bảo hiểm gồm các thông tin độ tuổi, số tiền, số năm mua. Mời các bạn cùng tham khảo!
64p heavysweetness 04-08-2021 45 8 Download
-
Luận văn này tìm hiểu về phụ thuộc hàm xấp xỉ và nghiên cứu thuật toán AFDMCEC, một thuật toán mới tìm các phụ thuộc hàm xấp xỉ trong các CSDL lớn dựa trên độ đo xấp xỉ. Thuật toán này sử dụng một số khái niệm trong lý thuyết thiết kế CSDL quan hệ, đặc biệt là các khái niệm phủ tối thiểu và lớp tương đương. Mời các bạn cùng tham khảo!
69p heavysweetness 04-08-2021 18 3 Download
-
Data mining là lĩnh vực đóng vai trò quan trọng trong việc phân tích và quản lý dữ liệu. Dựa vào đó chúng ta có thể đưa ra những dự đoán cho kế hoạch tương lai. Trong thời buổi công nghệ ngày càng phát triển như hiện nay, việc áp dụng khoa học công nghệ thông tin vào quá trình xử lý và phân tích dữ liệu là vô cùng cần thiết. Data mining chính là một trong số đó. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn các nội dung nghiên cứu.
17p khiemthocu 11-07-2021 154 20 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác mẫu tuần tự nén được thực hiện với nhiệm vụ nhằm mã hóa dữ liệu tuần tự bằng cách gán các codeword đối với các khoảng cách nhỏ, rồi từ đó tiến hành xử lý trên mẫu với khoảng cách lớn hơn, tính toán độ phức tạp của quá trình khai phá mẫu nén trên cơ sở dữ liệu tuần tự, nghiên cứu thuật toán GoKrimp để khai phá trực tiếp trên mẫu đã được nén dựa trên thuật toán tham lam. Mời các bạn cùng tham khảo.
59p xusong 12-07-2021 30 4 Download
-
Mục đích của Luận văn này nghiên cứu và tìm hiểu một số nền tảng của hệ thống dữ liệu lớn. Tìm hiểu một số lĩnh vực phân tích tìm các giá trị của hệ thống dữ liệu lớn (thực chất là khai phá dữ liệu tìm các tri thức). Mời các bạn cùng tham khảo!
81p monsterhunterer 15-06-2021 31 7 Download
-
Mục đích của Luận văn này là nghiên cứu và tìm hiểu một số nền tảng của hệ thống dữ liệu lớn. Tìm hiểu một số lĩnh vực phân tích tìm các giá trị của hệ thống dữ liệu lớn (thực chất là khai phá dữ liệu tìm các tri thức). Nghiên cứu và tìm hiểu một số thuật toán liên quan đến tập rút gọn (tập thuộc tính rút gọn bảo toàn thông tin phân lớp của bảng quyết định). Trên cơ sở này tiến hành xây dựng phần mềm thử nghiệm. Mời các bạn cùng tham khảo!
17p monsterhunterer 15-06-2021 37 4 Download
-
Nội dung của bài tập lớn này với mục đích tìm hiểu và trình bày về một kỹ thuật trong khai phá dữ liệu để phân lớp dữ liệu cũng như tổng quan về khai phá dữ liệu. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn nội dung nghiên cứu.
22p tuyetminhhb 19-03-2021 427 42 Download
-
Phân lớp dữ liệu là vấn đề lớn và quan trọng của khai phá dữ liệu. Cây quyết định là giải pháp hữu hiệu của bài toán phân lớp, nó bao gồm từ mô hình cho quá trình học đến các thuật toán huấn luyện cụ thể để xây dựng cây. Luận án tập trung nghiên cứu mô hình linh hoạt cho quá trình huấn luyện cây từ tập mẫu huấn luyện, nghiên cứu phương pháp xử lý giá trị ngôn ngữ và xây dựng các thuật toán học phân lớp dữ liệu bằng cây quyết định mờ đạt nhằm đạt hiệu quả trong dự đoán và đơn giản đối với người dùng. Để tìm hiểu rõ hơn, mời các bạn cùng xem và tham khảo.
120p dtphuongg 10-09-2018 87 11 Download
-
Phân tích tương ứng được áp dụng rất rộng rãi trong rất nhiều lĩnh vực như phân tích dữ liệu kinh doanh, điều tra xã hội học, khai phá dữ liệu,…. CA cho phép phát hiện các tri thức tiềm ẩn trong khối lượng dữ liệu lớn một cách dễ dàng thông qua phương pháp trực quan hóa (sử dụng bản đồ các điểm).
23p hoanglinh0808 13-06-2017 267 23 Download
-
Trong thời đại công nghệ thông tin hiện nay, sự phát triển của công nghệ kéo theo sự gia tăng rất lớn của lưu lượng thông tin lưu trữ và trao đổi. Do đó, yêu cầu về tổ chức lưu trữ và truy cập thông tin sao cho hiệu quả được đặt lên hàng đầu. Hướng giải quyết được đưa ra là tổ chức, tìm kiếm và phân loại thông tin một cách hiệu quả.
18p thompilu 03-05-2017 253 43 Download
-
Khai phá dữ liệu là một tiến trình khai phá tự động những tri thức tiềm ẩn trong cơ sở dữ liệu, cụ thể hơn là tiến trình lọc sản sinh những tri thức hoặc mẫu tiềm ẩn chứa thông tin hữu ích từ số lượng dữ liệu lớn. Để nắm rõ hơn mời các bạn tham khảo tài liệu.
24p trentroicosao 11-03-2014 160 31 Download
-
Cùng với sự phát triển của khoa học kỹ thuật là sự bùng nổ của công nghệ dữ liệu mới như World Wide Web, data stream… đã đặt ra một yêu cầu cấp thiết cho các kỹ thuật mới và công nghệ tự động để có thể chuyển đổi một lượng lớn dữ liệu thành các thông tin hữu ích và đưa ra các dự báo hữu ích cho người sử dụng, Khai thác dữ liệu ra đời nhằm giải quyết những vấn đề trên. Vì thông tin có thể thay đổi liên tục và rộng lớn nên đây là một ngành khoa học đỏi hỏi phải luôn nâng cấp và tối ưu hóa tri thức hiện có để có thể phục vụ tốt hơn nhu cầu của người sử dụng.
19p online_12 07-11-2013 147 17 Download
-
Cuộc cách mạng của kỹ thuật số cho phép số hóa thông tin dễ dàng và chi phí lưu trữ thấp.Với sự phát triển của phần mềm, phần cứng và trang bị nhanh hệ thống máy tính trong kinh doanh. Số lượng dữ liệu khổng lồ được tập trung và lưu trữ trong cơ sở dữ liệu trên các thiết bị điện tử như: đĩa cứng, băng từ, đĩa quang, CD-ROM,… Tốc độ tăng dữ liệu quá lớn
46p chieuwindows23 01-06-2013 172 59 Download
-
Sử dụng phương thức gửi thông tin bằng sắc độ của ánh sáng (bước sóng khác nhau), các nhà khai thác mạng Internet2 siêu tốc đang kỳ vọng tăng tốc độ lên 80 lần cho phép các nhà nghiên cứu kết nối kính viễn vọng trên toàn thế giới và thực hiện các tác vụ đòi hỏi băng thông lớn. Người phụ trách chính của Internet2 là Douglas Van Houweling cho biết, mạng thế hệ mới này có thể sẵn sàng đi vào hoạt động từ mùa thu năm 2007. Ông cho biết: theo dự kiến, tuần này các nhà nghiên cứu...
2p bibocumi28 21-01-2013 82 8 Download
-
Sự phát triển mạnh mẽ của công nghệ phần cứng đã tạo nên các máy tính có bộ xử lý tốc độ cao, bộ nhớ dung l−ợng lớn vμ cùng với điều đó, lμ sự phát triển không ngừng các hệ thống mạng viễn thông. Từ các kết quả đó, nhiều hệ thống thông tin phục vụ việc tự động hóa mọi hoạt động
88p bluesky_12 26-12-2012 73 24 Download
-
Tính toán song song là một hình thức tính toán trong đó nhiều phép tính được thực hiện đồng thời,[1] hoạt động trên nguyên tắc là những vấn đề lớn đều có thể chia thành nhiều phần nhỏ hơn, sau đó được giải quyết tương tranh ("trong lĩnh vực tính toán"). Có nhiều hình thức khác nhau của tính toán song song: song song cấp bit, song song cấp lệnh, song song dữ liệu, và song song tác vụ.
82p bluesky_12 26-12-2012 158 57 Download
-
Ngày nay, với những tác động to lớn và mạnh mẽ của mạng Internet tới đời sống kinh tế, chính trị và văn hóa của con người, lĩnh vực khai phá dữ liệu Web đã và đang trở thành lĩnh vực nghiên cứu thời sự, thu hút được sự quan tâm của rất nhiều nhà nghiên cứu. Khai phá dữ liệu Web là điểm hội tụ của rất nhiều lĩnh vực nghiên cứu như: cơ sở dữ liệu, truy xuất thông tin (information retrival), trí tuệ nhân tạo, nó còn là một lĩnh vực nhỏ trong học máy (machine learning)...
36p bluesky_12 26-12-2012 94 21 Download
-
Cùng với sự phát triển của Công Nghệ Thông Tin ngày nay, khai phá tri thức trong các cơ sở dư liệu lớn là một trong nhưng lĩnh vực được rất nhiều nhà nguyên cứu và ứng dụng tin học đặc biệt quan tâm. Việc nguyên cứu những phương pháp có thể tự động phát hiện những tri thức mới trong cơ sở dư liệu trên máy tính đã tỏ ra thực sự hữu ích trong việc hỗ trợ quyết định cho con người. Hiện nay, trên thế giới có rất nhiều thuật toán khai phá tri thức bằng cách...
64p bluesky_12 26-12-2012 102 26 Download