Trang chủ » Công Nghệ Thông Tin » Khoa học dữ liệu

40 trang

258 lượt xem

5

0

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 2 - Hệ sinh thái Hadoop

Bài giảng "Lưu trữ và xử lý dữ liệu lớn: Chương 2 - Hệ sinh thái Hadoop" trình bày các nội dung chính sau đây: Apache Hadoop; Hệ thống tệp tin Hadoop (HDFS); Mô thức xử lý dữ liệu MapReduce; Các thành phần khác trong hệ sinh thái Hadoop. Mời các bạn cùng tham khảo!

Chủ đề:

Xử lý dữ liệu lớn

Bài giảng Xử lý dữ liệu lớn

/

40

Chương 2

Hệ sinh thái Hadoop

Nội dung

•Apache Hadoop

• Hệ thống tệp tin Hadoop (HDFS)

• Mô thức xử lý dữ liệu MapReduce

• Các thành phần khác trong hệ sinh thái

Hadoop

Mục tiêu của Hadoop

• Mục tiêu chính

•Lưu trữ dữ liệu khả mở, tin cậy

•Powerful data processing

•Efficient visualization

• Với thách thức

• Thiết bị lưu trữ tốc độ chậm, máy tính thiếu tin cậy,

lập trình song song phân tán không dễ dàng

4

Giới thiệu về Apache Hadoop

•Lưu trữ và xử lý dữ liệu khả mở, tiết kiệm chi phí

•Xử lý dữ liệu phân tán với mô hình lập trình đơn

giản, thân thiện hơn như MapReduce

•Hadoop thiết kế để mở rộng thông qua kỹ thuật

scale-out, tăng số lượng máy chủ

• Thiết kế để vận hành trên phần cứng phổ thông, có khả năng

chống chịu lỗi phần cứng

•Lấy cảm hứng từ kiến trúc dữ liệu của Google

5

Tài liệu liên quan

Đề thi Phân tích dữ liệu lớn học kì 2 năm 2023-2024: Đề thi kết thúc học phần

Đề thi kết thúc học phần học kì 2 môn Phân tích dữ liệu lớn năm 2023-2024

Kĩ thuật xử lý luồng dữ liệu lớn: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 7

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 7 - Các kĩ thuật xử lý luồng dữ liệu lớn

Các kĩ thuật xử lý dữ liệu lớn theo khối: Bài giảng Lưu trữ và xử lý dữ liệu lớn Chương 6 (Phần 2)

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 2)

Kĩ thuật xử lý dữ liệu lớn theo khối: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 6 (Phần 1)

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 6 - Các kĩ thuật xử lý dữ liệu lớn theo khối (Phần 1)

Hệ thống truyền thông điệp phân tán: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 5

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 5 - Hệ thống truyền thông điệp phân tán

Cơ sở dữ liệu NoSQL: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 4 (Phần 3)

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 4 - Cơ sở dữ liệu phi quan hệ NoSQL (Phần 3)

Cơ sở dữ liệu NoSQL: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 4 (Phần 2)

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 4 - Cơ sở dữ liệu phi quan hệ NoSQL (Phần 2)

Cơ sở dữ liệu NoSQL: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 4 (Phần 1)

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 4 - Cơ sở dữ liệu phi quan hệ NoSQL (Phần 1)

Hệ thống tập tin phân tán Hadoop HDFS: Bài giảng Lưu trữ và xử lý dữ liệu lớn, Chương 3.2

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 3.2 - Hệ thống tập tin phân tán Hadoop HDFS

Hệ thống tập tin phân tán Hadoop HDFS: Bài giảng Lưu trữ và xử lý dữ liệu lớn - Chương 3.1

Bài giảng Lưu trữ và xử lý dữ liệu lớn: Chương 3.1 - Hệ thống tập tin phân tán Hadoop HDFS

Tài liêu mới

Giáo trình Hệ quản trị cơ sở dữ liệu (SQL) tốt nhất - Cao đẳng Nghề Cần Thơ (Ứng dụng phần mềm)

Giáo trình môn học Hệ quản trị cơ sở dữ liệu (Nghề: Ứng dụng phần mềm - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình Cơ sở dữ liệu (Cao đẳng Nghề Cần Thơ): Ứng dụng phần mềm

Giáo trình môn học Cơ sở dữ liệu (Nghề: Ứng dụng phần mềm - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình môn học Cơ sở dữ liệu (Nghề: Quản trị mạng máy tính - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình môn học Cơ sở dữ liệu (Nghề: Quản trị mạng máy tính - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình Cấu trúc dữ liệu (Cao đẳng): Ứng dụng phần mềm - Trường Cao đẳng Nghề Cần Thơ

Giáo trình môn học Cấu trúc dữ liệu (Nghề: Ứng dụng phần mềm - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình Hệ quản trị cơ sở dữ liệu (DBMS) Cao đẳng Nghề Cần Thơ: Quản trị cơ sở dữ liệu

Giáo trình môn học Hệ quản trị cơ sở dữ liệu (Nghề: Quản trị cơ sở dữ liệu - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình Lập trình Python (Cao đẳng): Ứng dụng phần mềm - Trường Cao đẳng Nghề Cần Thơ

Giáo trình môn học Lập trình Python (Nghề: Ứng dụng phần mềm - Trình độ Cao đẳng) - Trường Cao đẳng Nghề Cần Thơ

Giáo trình Lập trình cơ sở dữ liệu (CĐ): Ngành Công nghệ thông tin - Trường Cao đẳng Công nghiệp Thanh Hóa

Giáo trình Lập trình cơ sở dữ liệu (Ngành: Công nghệ thông tin - CĐ)- Trường Cao đẳng Công nghiệp Thanh Hóa

Giáo trình Quản trị cơ sở dữ liệu SQL Server (CĐ Công nghệ thông tin Thanh Hóa) chuẩn nhất

Giáo trình Quản trị cơ sở dữ liệu với SQL Server (Ngành: Công nghệ thông tin - CĐ)- Trường Cao đẳng Công nghiệp Thanh Hóa

Tài liệu học tập Cơ sở dữ liệu Vương Thùy Linh đầy đủ, chi tiết

Tài liệu học tập Cơ sở dữ liệu - Vương Thùy Linh

Tài liệu Phân tích dữ liệu Python với Pandas: Hướng dẫn chi tiết

Tài liệu Phân tích dữ liệu với Python sử dụng Pandas

Bài giảng Phân tích dữ liệu: Tổng quan về phân tích dữ liệu - Chương 1

Bài giảng Phân tích dữ liệu - Chương 1: Tổng quan về phân tích dữ liệu

Bài giảng Phân tích dữ liệu: Ngôn ngữ lập trình (Chương 2.1)

Bài giảng Phân tích dữ liệu - Chương 2.1: Ngôn ngữ lập trình

Bài giảng Phân tích dữ liệu: Ngôn ngữ lập trình (Chương 2.2)

Bài giảng Phân tích dữ liệu - Chương 2.2: Ngôn ngữ lập trình

Bài giảng Phân tích Dữ liệu: Ngôn ngữ lập trình (Chương 2.3)

Bài giảng Phân tích dữ liệu - Chương 2.3: Ngôn ngữ lập trình

Trực quan dữ liệu: Bài giảng Phân tích dữ liệu - Chương 3

Bài giảng Phân tích dữ liệu - Chương 3: Trực quan dữ liệu

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu Trực Tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 38/GP-BVHTTDL cấp ngày 09/3/2026