
Copyright (C) 2013 DeNA Co.,Ltd. All Rights
Reserved.
Game mạng xã hội
– Làm thếnào đểxem KPI
Le Kim Dung
DeNA Hanoi
March 15, 2013

Copyright (C) 2013 DeNA Co.,Ltd. All Rights
Reserved.
Nội dung
Hadoop
Hadoop là gì?
Hadoop ho
ạ
t
độ
ng nh
ư
th
ế
nào?
Pig
Kiến trúc phân tích cho game mạng xã hội
References
Q&A

Copyright (C) 2013 DeNA Co.,Ltd. All Rights
Reserved.
Hadoop là gì?
Hadoop là một framework mã nguồn mởtrên nền Java
hỗtrợxửlý dữliệu lớn trong môi trường tính toán phân
tán.
Efficient distribution
to multiple machines
Distributed
Processing
Distributed
Data Storage

Copyright (C) 2013 DeNA Co.,Ltd. All Rights
Reserved.
Hadoop hoạt động như thếnào?
Thành phần chính của Hadoop: HDFS và
MapReduce
Hadoop Distributed File System: lưu trữdữliệu phân cụm
có khả năng tự sửa lỗi với băng thông cao.
MapReduce: quản lý tài nguyên phân tán có khả năng chịu
lỗi và lập lịch xử lý song song lượng dữliệu lớn.

Copyright (C) 2013 DeNA Co.,Ltd. All Rights
Reserved.
Hadoop hoạt động như thếnào?
Hadoop Distributed File System
File dữliệu được chia thành các blocks sau đó được nhân
rộng trên các cụm (Hadoop cluster)