Khai thác dữ liệu lớn
-
Thái Nguyên là một tỉnh có nguồn khoáng sản khá dồi dào, nổi bật là sắt, chì kẽm, vàng, bạc… tuy có qui mô từng mỏ không lớn nhưng sự phân bố của các khoáng sản trên tạo thành những vùng quặng có ý nghĩa công nghiệp. Trong những năm qua công nghiệp khai khoáng của Thái Nguyên khá phát triển. Kết quả thăm dò, khảo sát của Đoàn địa chất đã phát hiện trong tỉnh có một số khoáng sản phục vụ cho ngành sản xuất kim loại và vật liệu xây dựng, trong đó khoáng sản kim loại...
25p haejun2040 20-05-2013 189 48 Download
-
Nguyên liệu tinh dầu là các loại thực vật có chứa tinh dầu. Trong thực vật, tinh dầu có thể ở hoa, lá, rễ, thân, củ...Có một số thực vật trong mọi bộ phận của cây đều có chứa tinh dầu. Để khai thác chúng trong công nghiệp, người ta sử dụng bộ phận cây có chứa nhiều tinh dầu nhất và tinh dầu có chất lượng cao nhất. Hàm lượng tinh dầu trong thực vật thường không lớn lắm, có loại chứa 15% và có loại chỉ vài phần nghìn. Những nguyên liệu chứa tinh dầu ít thường quý và đắt tiền (tinh dầu hoa hồng...).
24p dtphuongg 03-09-2018 397 50 Download
-
Đối với nhau theo một thứ tự tuyến tính bất kỳ (poly-peptide chains)... nhanh và mạnh thế nào, được nối ghép, dịch chuyển, và. thay đổi nhanh thế nào, etc.Khai thác dữ liệu trên mạng Internet: Nguyên tắc cơ bản về tìm kiếm thông tin trên Internet. Giới thiệu về CSDL sinh học lớn trên mạng Internet. Khai khác các phần mềm trực tuyến: Blast (tìm kiếm...
31p hongle 24-06-2009 809 388 Download
-
BĐS chưa được khai thác, sử dụng có hiệu quả, gây thất thoát, lãng phí. TTBĐS phát triển tự phát, thiếu lành mạnh, giao dịch ngầm chiếm tỷ lệ lớn. Cung cầu còn mất cân đối, tình trạng đầu cơ nhà đất, kích cầu ảo để nâng giá làm cho thị trường nóng lạnh thất thường, tạo nhiều cơn sốt giá nhà đất. Thông tin không đầy đủ, thiếu minh bạch và khó tiếp cận. Thủ tục phức tạp, qua nhiều khâu trung gian, mất nhiều thời gian, chi phí giao dịch cao. Các dịch vụ BĐS chưa được PL thừa nhận. Các tổ...
0p 123968574 26-06-2012 177 30 Download
-
Khai thác tập phổ biến từ dữ liệu luồng dựa trên thuật toán di truyền sử dụng bit và xử lý song song
Bài viết đề xuất một phương pháp mới để khai thác tập phổ biến từ dữ liệu luồng sử dụng thuật toán di truyền kết hợp với các phép toán bit và xử lý song song. Cốt lõi của phương pháp này sử dụng ThreadPoolExecutor từ Python để xử lý song song, tăng tốc độ tính toán đáng kể và cho phép xử lý các luồng dữ liệu lớn một cách hiệu quả.
14p gaupanda065 03-12-2024 3 2 Download
-
Trong hầu hết các hệ lưu trữ, quản lý dữ liệu, thao tác tìm kiếm thường được thực hiện nhất để khai thác thông tin. Do các hệ thống thông tin thường phải lưu trữ một khối lượng dữ liệu đáng kể, nên việc xây dựng các giải thuật cho phép tìm kiếm nhanh sẽ có ý nghĩa rất lớn. Nếu dữ liệu trong hệ thống đã được tổ chức theo một trật tự nào đó, thì việc tìm kiếm sẽ tiến hành nhanh chóng và hiệu quả hơn....
0p lqvang02 19-02-2013 46 3 Download
-
Tổng hợp và trích lọc những thông tin hữu ích từ một tập hợp những số liệu lớn (Ví dụ trích lọc những đặc trưng lâm phần theo loài cây, nhóm gỗ, khai thác - nuôi dưỡng, lô, khoảnh...)
295p nuber_12 27-08-2013 75 6 Download
-
Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 2)
Bài giảng "Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 2)" trình bày các nội dung chính sau đây: MapReduce với chuỗi các jobs; Toàn cảnh về I/O dữ liệu; RAM có khả năng thay thế ổ đĩa cứng; Một nền tảng xử lý dữ liệu hợp nhất cho dữ liệu lớn;... Mời các bạn cùng tham khảo!
52p gaupanda025 09-04-2024 20 3 Download
-
Bài giảng "Lưu trữ và xử lý dữ liệu lớn: Chương 1 - Tổng quan về lưu trữ và xử lý dữ liệu lớn" trình bày các nội dung chính sau đây: Những con số về tốc độ sinh dữ liệu; Các nguồn tạo ra dữ liệu lớn; Đặc điểm 5’V của dữ liệu lớn; Khai thác dữ liệu lớn trong giáo dục; Khai thác dữ liệu lớn trong khoa học chăm sóc sức khoẻ;... Mời các bạn cùng tham khảo!
43p gaupanda025 09-04-2024 15 2 Download
-
Luận án Tiến sĩ Kinh tế "Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam (trường hợp thành phố Hồ Chí Minh)" trình bày các nội dung chính sau: Xây dựng quy trình thu thập và tổng hợp chỉ số giá tiêu dùng từ nguồn dữ liệu lớn là thông tin giá trên các trang web bán hàng trực tuyến.
282p vimarillynhewson 02-01-2024 17 6 Download
-
Tóm tắt Luận án Tiến sĩ "Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam (trường hợp thành phố Hồ Chí Minh)" được nghiên cứu với mục tiêu: Xây dựng quy trình khai thác thông tin giá từ dữ liệu lớn; Nghiên cứu ứng dụng mô hình hồi quy Hedonic để điều chỉnh sự thay đổi chất lượng hàng hóa hoặc trường hợp hàng hóa không còn xuất hiện trên thị trường phục vụ tính chỉ số giá tiêu dùng.
28p vimarillynhewson 02-01-2024 16 5 Download
-
Mục tiêu nghiên cứu của luận văn "Nghiên cứu phát triển nền tảng tích hợp phân tích dữ liệu dòng" nhằm hiện thực triển khai thực tế giải pháp lưu trữ dữ liệu lớn cho dữ liệu đo đếm phương tiện giao thông song song với việc đánh giá hiệu năng; Hiện thực mô hình dự báo ngắn hạn lưu lượng giao thông sử dụng Support Vector Regression.
26p trankora03 05-08-2023 15 5 Download
-
Mục tiêu nghiên cứu của đề tài "Phương pháp ẩn các tập mục có độ hữu ích cao trong cơ sở dữ liệu giao tác lớn" nhằm tìm hiểu các thông số đánh giá tính hiệu quả của các phương pháp ẩn tập mục có độ hữu ích cao nhạy cảm. Tiến hành cài đặt thử nghiệm phương pháp đề xuất, đánh giá dựa trên các thông số, so sánh với các phương pháp ẩn hiện có.
26p trankora03 05-08-2023 11 4 Download
-
Luận văn "Phân tích ý kiến người dùng theo khía cạnh bằng phương pháp học sâu" được hoàn thành với mục tiêu nhằm đưa ra một cái nhìn sâu sắc ngắn gọn bằng cách đánh giá điểm mạnh và điểm yếu của nhiều phương pháp đang được áp dụng để giải quyết vấn đề. Bằng cách vẽ một so sánh giữa xác loại phương pháp tiếp cận nó nhấn mạnh vào yêu cầu của một khối lượng lớn dữ liệu hoặc một tập hợp số lượng lớn quy tắc quan hệ để khai thác nội dung.
76p dongcoxanh2510 25-10-2022 31 10 Download
-
Đề tài “Ứng dụng phân cụm dữ liệu trong quản lý bảo hiểm tại công ty Bảo Việt nhân thọ Hà Nội” ứng dụng thuật toán của phân cụm dữ liệu để đưa ra nhóm khách hàng có sự giống nhau là lớn nhất và từ đó có thể giúp cho các chuyên ra đưa ra các đánh giá về các mẫu khách hàng, trên cơ sở hồ sơ mua bảo hiểm gồm các thông tin độ tuổi, số tiền, số năm mua. Mời các bạn cùng tham khảo!
64p heavysweetness 04-08-2021 45 8 Download
-
Đề tài này tập trung vào nghiên cứu hệ mã hóa khoá đối xứng (mã hóa khóa bí mật), tập trung vào các thuật toán mã hóa cổ điển, chuẩn mã hóa dữ liệu DES và chuẩn mã hoá nâng cao AES. Hệ mã hóa công khai có nhược điểm là tốc độ mã hóa và giải mã rất chậm, do vậy chỉ phù hợp sử dụng trong trao đổi khóa, trong khi đó hệ mã hóa đối xứng có tốc độ xử lý nhanh hơn rất nhiều và phù hợp với nhu cầu xử lý số lượng lớn tài liệu.
67p heavysweetness 04-08-2021 36 11 Download
-
Luận văn này tìm hiểu về phụ thuộc hàm xấp xỉ và nghiên cứu thuật toán AFDMCEC, một thuật toán mới tìm các phụ thuộc hàm xấp xỉ trong các CSDL lớn dựa trên độ đo xấp xỉ. Thuật toán này sử dụng một số khái niệm trong lý thuyết thiết kế CSDL quan hệ, đặc biệt là các khái niệm phủ tối thiểu và lớp tương đương. Mời các bạn cùng tham khảo!
69p heavysweetness 04-08-2021 20 3 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu và ứng dụng Hadoop để khai thác tập phổ biến được thực hiện với mục tiêu nhằm thực hiện thuật toán Apriori trên một số tập dữ liệu mẫu lớn, tính toán trên hệ thống song song Hadoop/MapReduce. Mời các bạn cùng tham khảo.
114p xusong 12-07-2021 51 3 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến được thực hiện với mục tiêu nhằm tìm hiểu việc khai thác các tập phổ biến (frequent item sets) trong cơ sở dữ liệu lớn, dựa trên cấu trúc dữ liệu mới hay gọi là danh sách mẫu phổ biến PL (requent Pattern List). Mời các bạn cùng tham khảo.
69p xusong 12-07-2021 47 5 Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác mẫu tuần tự nén được thực hiện với nhiệm vụ nhằm mã hóa dữ liệu tuần tự bằng cách gán các codeword đối với các khoảng cách nhỏ, rồi từ đó tiến hành xử lý trên mẫu với khoảng cách lớn hơn, tính toán độ phức tạp của quá trình khai phá mẫu nén trên cơ sở dữ liệu tuần tự, nghiên cứu thuật toán GoKrimp để khai phá trực tiếp trên mẫu đã được nén dựa trên thuật toán tham lam. Mời các bạn cùng tham khảo.
59p xusong 12-07-2021 30 4 Download