Trang chủ » Công Nghệ Thông Tin » Tin học văn phòng

52 trang

141 lượt xem

4

0

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 2)

Bài giảng "Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 2)" trình bày các nội dung chính sau đây: MapReduce với chuỗi các jobs; Toàn cảnh về I/O dữ liệu; RAM có khả năng thay thế ổ đĩa cứng; Một nền tảng xử lý dữ liệu hợp nhất cho dữ liệu lớn;... Mời các bạn cùng tham khảo!

Chủ đề:

Thủ thuật Excel

Bài giảng Thủ thuật Excel

/

52

Chương 6

Các kĩ thuật xử lý dữ liệu

lớn theo khối -phần 2

Apache Spark

Một nền tảng xử lý dữ liệu hợp nhất cho dữ liệu lớn

MapReduce với chuỗi các jobs

• Iterative jobs với MapReduce đòi hỏi thao tác I/O với dữ liệu

trên HDFS

• Thực tế I/O trên ổ đĩa cứng rất chậm!

CPUs: 10 GB/s

100 MB/s

0.1 ms random

access

$0.35 perGB

600 MB/s

3-12 ms random

access

$0.025 perGB

1 Gb/s or125 MB/s

Network

0.1 Gb/s

Nodesin

another

rack

Nodesin

same

rack

1 Gb/s or125 MB/s

Toàn cảnh về I/O dữ liệu

RAM có khả năng thay thế ổ đĩa

cứng

4

Một nền tảng xử lý dữ liệu hợp

nhất cho dữ liệu lớn

• Hỗ trợ tốt hơn MapReduce trong

• Các giải thuật có tính lặp - Iterative algorithms

• Khai phá dữ liệu trong môi trường tương tác - Interactive data

mining

• Khả năng chịu lỗi, khai thác tính địa phương của dữ liệu,

tính khả mở

• Ẩn đi sự phức tạp cua của môi trường phân tán khi lập trình

Tài liệu liên quan

Bài giảng Microsoft Excel: Hướng dẫn chi tiết và đầy đủ

Bài giảng môn Microsoft Excel

Bài giảng Excel Nguyễn Trọng Hiến: Kinh nghiệm và hướng dẫn

Bài giảng Excel - Nguyễn Trọng Hiến

Biểu đồ: Bài giảng Xử lý bảng tính (Bộ môn Tin học cơ sở) - Bài 6

Bài giảng Xử lý bảng tính (Bộ môn Tin học cơ sở) – Bài 6: Biểu đồ

Bài giảng Xử lý bảng tính: Cơ sở dữ liệu (Bộ môn Tin học cơ sở) - Bài 5

Bài giảng Xử lý bảng tính (Bộ môn Tin học cơ sở) – Bài 5: Cơ sở dữ liệu

Bài giảng Xử lý bảng tính: Các hàm điều khiển (Bài 4) - Bộ môn Tin học cơ sở

Bài giảng Xử lý bảng tính (Bộ môn Tin học cơ sở) – Bài 4: Các hàm điều khiển

Bài giảng Xử lý bảng tính: Các hàm cơ bản (Bài 2) - Bộ môn Tin học cơ sở

Bài giảng Xử lý bảng tính (Bộ môn Tin học cơ sở) – Bài 2: Các hàm cơ bản

Bài giảng Xử lý bảng tính: Tổng quan (Bộ môn Tin học cơ sở)

Bài giảng Xử lý bảng tính (Bộ môn Tin học cơ sở) – Bài 1: Tổng quan

Bài giảng MS Excel đại cương: ThS. Ngô Cao Định

Bài giảng Tin học đại cương: MS Excel - ThS. Ngô Cao Định

Kĩ thuật xử lý luồng dữ liệu lớn: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 7

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 7 - Các kĩ thuật xử lý luồng dữ liệu lớn

Kĩ thuật xử lý dữ liệu lớn theo khối: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 6 (Phần 1)

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 1)

Tài liêu mới

Câu hỏi trắc nghiệm Tin học đại cương có đáp án: Tổng hợp và Giải chi tiết

Câu hỏi trắc nghiệm Tin học đại cương có đáp án

Đề thi Excel: Tổng hợp [Năm] mới nhất, có đáp án, chuẩn nhất

Đề thi môn Excel

Bài giảng Công nghệ thông tin cơ bản

Bài giảng Công nghệ thông tin cơ bản

Bài tập Microsoft Word tự kiểm tra: Hướng dẫn chi tiết

Bài tập tự kiểm tra Microsoft Word

Bài tập Tin học đại cương [kèm lời giải/ đáp án/ mới nhất]

Bài tập Tin học đại cương

Bài giảng Nhập môn Tin học và kỹ năng số [Mới nhất]

Bài giảng Nhập môn Tin học và kỹ năng số

Tài liệu ôn tập Lý thuyết và Thực hành môn Tin học [mới nhất/chuẩn nhất]

Tài liệu ôn tập Lý thuyết và thực hành môn Tin học

Giáo Trình PowerPoint Khải Minh (Biên soạn) - Hướng Dẫn Chi Tiết

Giáo Trình PowerPoint - Khải Minh (Biên soạn)

Giáo trình Tin học dành cho học sinh

Giáo trình Tin học dành cho học sinh

Trắc nghiệm Tin học cơ sở: Tổng hợp bài tập và đáp án [mới nhất]

Trắc nghiệm Tin học cơ sở

Trắc nghiệm Hệ điều hành: Bài tập và câu hỏi ôn luyện

Trắc nghiệm môn Hệ điều hành

Điện toán đám mây Alibaba Cloud: Bài tập lớn tìm hiểu và khai thác dịch vụ

Bài tập lớn: Tìm hiểu và khai thác dịch vụ điện toán đám mây của Alibaba cloud

Giáo trình Lý thuyết PowerPoint: Trung tâm Tin học MS [Chuẩn Nhất]

Giáo trình Lý thuyết PowerPoint - Trung tâm Tin học MS

Tìm hiểu công nghệ ảo hóa đám mây và triển khai dịch vụ máy chủ ảo Cloud Server: Bài tập lớn

Bài tập lớn: Tìm hiểu công nghệ ảo hóa đám mây và triển khai dịch vụ máy chủ ảo Cloud Server

Hướng dẫn cài đặt ROS 2 cho ArduPilot: Tài liệu chi tiết

Tài liệu Hướng dẫn cài đặt ROS 2 cho ArduPilot

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015