Mạng xã hội chia sẻ tài liệu
Danh mục
Giáo dục phổ thông
Tài liệu chuyên môn
Bộ tài liệu cao cấp
Văn bản – Biểu mẫu
Luận Văn - Báo Cáo
Trắc nghiệm Online
Trang chủ
Công Nghệ Thông Tin
Khoa học dữ liệu
Tài liệu Xử lý dữ liệu lớn
Big Data nguồn mở, Phần 1: Hướng dẫn Hadoop: Tạo ứng dụng Hello World với Java, Pig, Hive, Flume, Fuse, Oozie và Sqoop với Informix, DB2 và MySQL
Có rất nhiều điều thú vị về Big Data và cũng có rất nhiều sự nhầm lẫn về nó. Bài này sẽ cung cấp một định nghĩa về Big Data và sau đó thực hiện một loạt các ví dụ để bạn có thể có được những hiểu biết ban đầu về một số khả năng của Hadoop, công nghệ nguồn mở hàng đầu trong lĩnh vực Big Data. Cụ thể, ta tập trung vào những câu hỏi sau:. Big Data, Hadoop, Sqoop, Hive và Pig là gì và tại sao lĩnh vực này lại có nhiều điều...
58 trang
569 lượt xem
93 lượt tải
BÁO CÁO ĐỀ TÀI - TÌM HIỂU HỆ THỐNG TẬP TIN
Lí do là: với kích thước cluster nhỏ, các file sẽ bao gồm nhiều cluster hơn và do đó việc đọc ghi sẽ lâu hơn. Chẳng hạn trong hệ thống có kích thước cluster là 16KB, một file ảnh 320KB sẽ bao gồm 20 cluster, việc mở file này sẽ phải thực hiện 20 lần thao tác đọc cluster. Nhưng nếu kích thước cluster là 2KB thì file đó sẽ bao gồm 160 cluster và việc mở file sẽ phải thực hiện tới 160 lần thao tác đọc cluster. Do đó các ứng dụng có nhiều tác vụ đọc ghi đĩa sẽ chậm đi rõ rệt. Thế nhưng...
47 trang
464 lượt xem
112 lượt tải
Ứng dụng cơ sở dữ liệu trên web với PHP và MYSQL - Hoàng Văn Hiệp
CHAR(size): Chuỗi có độ dài cố định, tham số size chỉ ra độ dài của chuỗi, có giá trị lớn nhất là 255; VARCHAR(size): Chuỗi có độ dài thay đổi, tham số size chỉ ra độ dài lớn nhất của chuỗi, có giá trị lớn nhất là 255; TINYTEXT: Chuỗi có độ dài lớn nhất là 255 ký tự; TEXT: Chuỗi có độ dài lớn nhất là 65,535 ký tự ....
56 trang
389 lượt xem
129 lượt tải
Tìm Hiểu Về DW 2.0 Chương 7, 8 ,9
Là nơi mà xử lý thống kê có thể được thực hiện mà không ảnh hưởng đến hiệu suất của DW 2.0. Có thể đóng băng trong thời gian nếu cần thiết. Thường chứa tập hợp con của dữ liệu lấy từ môi trường DW 2.0. Cơ sở thăm dò lẫy dữ liệu có tính chất hạt thấp nhất. Ngoài ra nó thường sử dụng số lượng lớn dữ liệu lịch sử. Cấu trúc dữ liệu của cstd được trộn lẫn. Một số dữ liệu được đưa vào các bảng trên đĩa lưu trữu. Một số khác được lưu lại thành file. Chứa...
0 trang
107 lượt xem
8 lượt tải
Tìm Hiểu Về DW 2.0 - Chương 16
Liệu có đáng để đầu tư vào DW 2.0? hiển nhiên đã có khá nhiều những cuộc tranh luận về vấn đề này, hầu hết những cuộc tranh luận đều đi tới những kết quả giống như là: Có nhiều chất liệu mới khiến ta phải tốn khá nhiều chi phí. Có chắc là nó có đáng hay không? tại sao tôi lại phải đầu tư nhiều đến như vậy? Một điều rất bình thường mà những nhà quản lý cấp cao đều đặt ra về việc xây dựng môi trường phát triển DW 2.0 có đáng giá hay không....
24 trang
108 lượt xem
8 lượt tải
Tìm Hiểu Về DW 2.0 - Chương 17
Tham khảo bài thuyết trình 'tìm hiểu về dw 2.0 - chương 17', công nghệ thông tin, cơ sở dữ liệu phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả
22 trang
138 lượt xem
6 lượt tải
The critical success factors for big data adoption in government
Over the past decade, governments around the world have been trying to take advantage of Big Data technology to improve public services with citizens. The adoption of Big Data has increased in most countries, but at the same time, the rate of successful adoption and management varies from one country to another.
12 trang
153 lượt xem
3 lượt tải
Các bài toán có dữ liệu vào lớn
Các bài toán có dữ liệu vào rất lớn, thường gây cho ta rất nhiều khó khăn. Để giải được các bài toán đó thì cần phải tìm cấu trúc dữ liệu và giải thuật thật hợp lý. Đa số các bài toán dạng này thì phải vừa đọc vừa xử lý.
3 trang
189 lượt xem
11 lượt tải
Tăng tốc sao chép file dung lượng lớn với TeraCopy
Tăng tốc sao chép file dung lượng lớn với TeraCopy giúp sao chép dữ liệu trong Windows, phù hợp cho việc chép những tập tin lớn như phim HD. Bạn có thể tạm dừng và tiếp tục sao chép về sau trong trường hợp hệ thống gặp lỗi. Tăng tốc sao chép file dung lượng lớn với TeraCopy giúp sao chép dữ liệu trong Windows, phù hợp cho việc chép những tập tin lớn như phim HD. Bạn có thể tạm dừng và tiếp tục sao chép về sau trong trường hợp hệ thống gặp lỗi. ...
3 trang
211 lượt xem
5 lượt tải
Keywords dài bao nhiêu là thì vừa?
Khảo sát này dựa trên 167.300 lượt truy cập vào website Tintuc.etieudung.com thông qua hành vi tìm thông tin. Số liệu cho thấy số lượng các từ khóa ngắn, với 1-3 từ tương đương số lượng từ khóa từ 4 từ khóa trở lên. Lượng truy cập đến từ các keywords có độ dài 1-3 từ chiếm 67%- gấp đôi so với các từ khóa dài.
5 trang
139 lượt xem
7 lượt tải
Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop
Khi Google tung ra tính năng tìm kiếm hình ảnh vào năm 2001, Google đã có 250 triệu hình ảnh được lập chỉ mục. Gần một thập kỷ sau đó, gã khổng lồ tìm kiếm này đã lập chỉ mục hơn 10 tỷ hình ảnh. Ba mươi lăm giờ nội dung được tải lên YouTube mỗi phút. Tính trung bình, Twitter được cho là xử lý 55 triệu mẫu tin ngắn mỗi ngày. Đầu năm nay, 600 triệu truy cập hàng ngày đã đăng nhập vào tính năng tìm kiếm của Twitter. Đó là những gì chúng tôi muốn đưa...
12 trang
223 lượt xem
29 lượt tải
Scribd – website chia sẻ tài liệu lớn nhất thế giới
Trước đây, người ta thường biết trang web DocuFarm như một địa chỉ tốt nhất giúp bạn xem online các tài liệu của mình. Tuy nhiên, DocuFarm vẫn còn có nhiều hạn chế, chẳng hạn hỗ trợ quá ít định dạng file, mỗi lần chỉ xem được một văn bản duy nhất, không có các tuỳ chọn phóng to thu nhỏ khi xem, không hỗ trợ in ra giấy những văn bản không cho tải về,…
10 trang
227 lượt xem
4 lượt tải
Những vấn đề đau đầu về sao lưu dữ liệu : Trả lời cho 10 câu hỏi thường gặp nhất
Trên thực tế, hậu quả của việc không sao lưu các dữ liệu quan trọng lại có thể là một thảm hoạ. Vậy nhưng, việc tiến hành các bước sao lưu dữ liệu lại không hề phức tạp như nhiều người tưởng, và có thể làm giảm nguy cơ một thảm hoạ xuống mức chỉ còn là một mối quan tâm không quá nặng đầu. Hỏi: Tôi nên sao lưu máy tính của tôi và các tệp dữ liệu thường xuyên tới mức nào? Đáp: Câu trả lời phụ thuộc vào tốc độ bạn tạo ra các tệp mới hoặc thay...
4 trang
173 lượt xem
7 lượt tải
Tìm hiểu cỗ máy tìm kiếm kiểu mới Wolfram Alpha
Wolfram Alpha có thể đánh giá một người cao 1,7 m và nặng 70 kg có thừa cân không hoặc liệu trăng có tròn vào tối 4/9 tại thành phố Buenos Aires (Argentina) khi người sử dụng định cầu hôn người yêu. Nó cũng cung cấp thông tin về các loài và giá trị dinh dưỡng của một quả táo hoặc tính toán thời gian dự sinh của một thai nhi. Trong khi Google tổng hợp và liệt kê một loạt trang web liên quan đến câu lệnh tìm kiếm, Wikipedia đưa thông tin dựa trên mỗi từ khóa cụ thể,...
3 trang
195 lượt xem
7 lượt tải
Đề thi giữa kì 1 môn: Cấu trúc dữ liệu và giải thuật
Ghi chú: đề thi gồm tất cả 7 câu. Sinh viên lớp KSTN làm hết 7 câu, thang điểm 12/12. Sinh viên lớp thường làm 6 câu (từ câu 1 đến câu 6), thang diểm 10/10. Câu 1 (1.5 điểm): Tính toán big-O của các hàm dưới đây và sắp xếp chúng theo thứ tự từ nhỏ đến lớn theo big-O: Đáp áp: a) (1 điểm) Tính big-O a. 2 = O(2 ) b. n! = O(n!) c. n3.5 = O(n3.5) d. n + n2 + n3 = O(n3) e. 105 = O(1) f. 150,000 = O(1) g. nlog2(n) = O(nlog2(n)) n...
4 trang
1025 lượt xem
42 lượt tải
Chia sẻ file dung lượng lớn với Pando
Trong quá trình sử dụng Internet, chắc hẳn rằng đôi khi bạn sẽ muốn chia sẻ với bạn bè của mình một vài file. Nếu là 1 file có dung lượng nhỏ hoặc không lớn lắm, bạn có thể sử dụng các dịch vụ chia sẻ file trực tuyến hoặc đính kèm vào email để gửi đi. Tuy nhiên, nếu là 1 file có dung lượng lớn đến vài trăm MB, thậm chí là cả 1 GB thì bạn sẽ gặp khó khăn khi sử dụng những dịch vụ này vì thông thường chúng giới hạn dung lượng upload cũng...
4 trang
161 lượt xem
4 lượt tải
Sao lưu dữ liệu: Những điều doanh nghiệp cần biết
Những số liệu mới đây nhất cho thấy điều đáng lo ngại – dù đã thừa nhận thực tế là có ít nhất 40% dữ liệu của doanh nghiệp sẽ bị tổn thất nếu hệ thống máy tính bị hư hỏng trong hỏa hoạn, thì trung bình các doanh nghiệp vừa và nhỏ (DNVVN) trong khu vực Châu Á – Thái Bình Dương và Nhật Bản chỉ sao lưu 60% lượng dữ liệu về công ty và về khách hàng của họ. Trên thực tế, chỉ một phần tư số doanh nghiệp khảo sát (chiếm 26%) thực hiện sao lưu...
3 trang
166 lượt xem
11 lượt tải
Resize ảnh hàng loạt với Lightning Image Resize
Khi bạn muốn chia sẻ một bức ảnh trên facebook, blog hay trang cá nhân từ chiếc máy ảnh yêu quý, nhưng có một vấn đề gặp phải là những bức ảnh này có kích thước và độ phân giải quá lớn sẽ gây khó khăn cho việc hiển thị hoặc thời gian upload. Có rất nhiều phần mềm có thể resize ảnh chuyên nghiệp nhưng thời gian là vấn đề khá lớn.
6 trang
162 lượt xem
13 lượt tải
Chủ đề liên quan
Xử lý dữ liệu lớn
Bài giảng Xử lý dữ liệu lớn
11
Bài tập Xử lý dữ liệu lớn
1
Đề thi Xử lý dữ liệu lớn
1
Project Xử lý dữ liệu lớn
1
Tài liệu Xử lý dữ liệu lớn
34
Xem thêm