Hadoop

Xem 1-20 trên 24 kết quả Hadoop
  • Có rất nhiều điều thú vị về Big Data và cũng có rất nhiều sự nhầm lẫn về nó. Bài này sẽ cung cấp một định nghĩa về Big Data và sau đó thực hiện một loạt các ví dụ để bạn có thể có được những hiểu biết ban đầu về một số khả năng của Hadoop, công nghệ nguồn mở hàng đầu trong lĩnh vực Big Data. Cụ thể, ta tập trung vào những câu hỏi sau:.     Big Data, Hadoop, Sqoop, Hive và Pig là gì và tại sao lĩnh vực này lại có nhiều điều...

    pdf58p buncha_1 11-05-2013 177 65   Download

  • We are facing an avalanche of data. The unstructured data we gather can contain many insights that might hold the key to business success or failure. Harnessing the ability to analyze and process this data with Hadoop MapReduce is one of the most highly sought after skills in today's job market.

    pdf300p titatu_123 09-03-2013 51 18   Download

  • Ready to unlock the power of your data? With this comprehensive guide, you’ll learn how to build and maintain reliable, scalable, distributed systems with Apache Hadoop. This book is ideal for programmers looking to analyze datasets of any size, and for administrators who want to set up and run Hadoop clusters.

    pdf647p possibletb 29-11-2012 56 9   Download

  • I first encountered Hadoop in the fall of 2008 when I was working on an internet crawl and analysis project at Verisign. My team was making discoveries similar to those that Doug Cutting and others at Nutch had made several years earlier regarding how to efficiently store and manage terabytes of crawled and analyzed data. At the time, we were getting by with our home-grown distributed system, but the influx of a new data stream and requirements to join that stream with our crawl data couldn’t be supported by our existing system in the required timelines....

    pdf0p bachduong1311 12-12-2012 51 3   Download

  • Phát triển một ứng dụng MapReduce của Ruby cho Hadoop M. Tim Jones, Tác giả độc lập, Emulex Tóm tắt: Với việc cấu hình, cài đặt và sử dụng Hadoop trong các kiến trúc một nút và nhiều nút đã thu được, bạn có thể chuyển sang nhiệm vụ phát triển các ứng dụng trong cơ sở hạ tầng Hadoop.

    pdf18p hoathietmoclan 13-09-2011 137 37   Download

  • Khi Google tung ra tính năng tìm kiếm hình ảnh vào năm 2001, Google đã có 250 triệu hình ảnh được lập chỉ mục. Gần một thập kỷ sau đó, gã khổng lồ tìm kiếm này đã lập chỉ mục hơn 10 tỷ hình ảnh. Ba mươi lăm giờ nội dung được tải lên YouTube mỗi phút. Tính trung bình, Twitter được cho là xử lý 55 triệu mẫu tin ngắn mỗi ngày. Đầu năm nay, 600 triệu truy cập hàng ngày đã đăng nhập vào tính năng tìm kiếm của Twitter. Đó là những gì chúng tôi muốn đưa...

    pdf12p bunmam_1 12-05-2013 47 18   Download

  • Authors Jonathan R. Owens Jon Lentz Brian Femiano Reviewers Edward J. Cody Daniel Jue Bruce C. Miller Acquisition Editor Robin de Jongh Lead Technical Editor Azharuddin Sheikh Technical Editor Dennis John Copy Editors Brandt D'Mello Insiya Morbiwala Aditya Nair Alfida Paiva Ruta Waghmare Proofreader Stephen Silk Indexer Monica Ajmera Mehta Graphics Conidon Miranda Layout Coordinator Conidon Miranda Cover Work Conidon Miranda Project Coordinator Abhishek Kori

    pdf316p trac2_123 11-04-2013 34 9   Download

  • Over the past few years, there has been a fundamental shift in data storage, management, and processing. Companies are storing more data from more sources in more formats than ever before. This isn’t just about being a “data packrat” but rather building products, features, and intelligence predicated on knowing more about the world (where the world can be users, searches, machine logs, or whatever is relevant to an organization).

    pdf297p bachduong1311 12-12-2012 46 6   Download

  • Clojure in Action is a hands-on tutorial for the working programmer who has written code in a language like Java or Ruby, but has no prior experience with Lisp. It teaches Clojure from the basics to advanced topics using practical, real-world application examples. Blow through the theory and dive into practical matters like unit-testing and environment set-up, all the way through building a scalable web-application using domain-specific languages, Hadoop, HBase, and RabbitMQ.

    pdf434p stingdau_123 26-01-2013 29 5   Download

  • Hadoop Distributed File System: lưu trữ dữ liệu phân cụm có khả năng tự sửa lỗi với băng thông cao. MapReduce: quản lý tài nguyên phân tán có khả năng chịu lỗi và lập lịch xử lý song song lượng dữ liệu lớn.

    pdf13p volylamsao 22-10-2013 28 4   Download

  • Là một mô hình mới của máy tính có thể chuyển đổi các tài nguyên máy tính thuộc sở hữu tư nhân vào các dịch vụ điện toán tiện ích công cộng.  Một trong những ứng dụng thành công nhất của điện toán đám mây là việc phân tích các bộ dữ liệu rất lớn.

    pdf17p thai_an1828 20-10-2011 254 130   Download

  • Nội dung cơ bản của đề tài tiểu luận Distributed File System trình bày tổng quan hệ thống tập tin phân tán, Google File System, Map reduce, Hadoop distributed file system.

    pdf31p wave_12 05-04-2014 55 19   Download

  • We live in the data age. It’s not easy to measure the total volume of data stored electronically, but an IDC estimate put the size of the “digital universe” at 0.18 zettabytes in 2006 and is forecasting a tenfold growth by 2011 to 1.8 zettabytes.1 A zettabyte is 1021 bytes, or equivalently one thousand exabytes, one million petabytes, or one billion terabytes. That’s roughly the same order of magnitude as one disk drive for every person in the world.

    pdf686p bachduong1311 12-12-2012 56 10   Download

  • kêu vù vù tạo ra và kiểm soát các dịch vụ như điện toán đám mây Hadoop là một cụm xây dựng môi trường của bạn quản lý tại thời gian chạy điện toán đám mây là Clojure

    pdf10p taoxanh10 02-11-2011 25 8   Download

  • Kho dữ liệu đã thực sự là một trận chiến đang diễn ra giữa các tổ chức trong nhiều năm. Làm thế nào để bạn xây dựng nó? Những dữ liệu của bạn có thể tích hợp không? Bạn có nên sử dụng Kimball hoặc Inmon?

    pdf17p tuyetroimuahe123 11-03-2014 30 8   Download

  • This example-driven guide shows you how to set up and configure Hive in your environment, provides a detailed overview of Hadoop andMapReduce, and demonstrates how Hive works within the Hadoop ecosystem. You’ll also find real-world case studies that describe how companies have used Hive to solve unique problems involving petabytes of data.

    pdf350p phungnguyet_123 20-02-2013 26 4   Download

  • In classical data warehousing terms, organizing data is called data integration. Because there is such a high volume of big data, there is a tendency to organize data at its original storage location, thus saving both time and money by not moving around large volumes of data. The infrastructure required for organizing big data must be able to process and manipulate data in the original storage location; support very high throughput (often in batch) to deal with large data processing steps; and handle a large variety of data formats, from unstructured to structured.

    pdf12p yasuyidol 02-04-2013 33 4   Download

  • Oracle Big Data Appliance brings Big Data solutions to mainstream enterprises. Built using industry-standard hardware from Sun and Cloudera’s distribution including Apache Hadoop, the Big Data Appliance is designed and optimized for big data workloads. By integrating the key components of a big data platform into a single product, Oracle Big Data Appliance delivers an affordable, scalable and fully supported big data infrastructure without the risks of a custom built solution.

    pdf27p yasuyidol 02-04-2013 48 4   Download

  • Hadoop has a master-slave architecture (Figure 2), with a unique master host and multiple slave hosts, typ- ically configured as follows. The master host runs two daemons: (1) the JobTracker, which schedules and man- ages all of the tasks belonging to a running job; and (2) the NameNode, which manages the HDFS namespace, and regulates access to files by clients (which are typi- cally the executing tasks).

    pdf14p nhacsihuytuan 06-04-2013 20 4   Download

  • It’s tough to argue with R as a high-quality, cross-platform, open source statistical software product—unless you’re in the business of crunching Big Data. This concise book introduces you to several strategies for using R to analyze large datasets. You’ll learn the basics of Snow, Multicore, Parallel, and some Hadoop-related tools, including how to find them, how to use them, when they work well, and when they don’t.

    pdf122p goshop_123 26-04-2013 31 4   Download

CHỦ ĐỀ BẠN MUỐN TÌM

Đồng bộ tài khoản