《Hadoop MapReduce实战手册》一导读-阿里云开发者社区

《Hadoop MapReduce实战手册》一导读

2017-05-02 2169

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本书目标是帮助读者学会处理大型的复杂数据集。本书虽从简单的例子开始，但仍然可以看到深入的内容。这是一本简单的一站式指南，传授如何完成复杂的事情。它以一种简单而直接的方式呈现了90个攻略，给出了一步步的指导和真实环境的应用示例。

Hadoop MapReduce实战手册
本书目标是帮助读者学会处理大型的复杂数据集。本书虽从简单的例子开始，但仍然可以看到深入的内容。这是一本简单的一站式指南，传授如何完成复杂的事情。它以一种简单而直接的方式呈现了90个攻略，给出了一步步的指导和真实环境的应用示例。

本产品包括在Apache软件基金会（http://www.apache.org/）开发的软件。

本书涵盖的内容
第1章解释了如何以单点模式以及集群模式安装和运行Hadoop。

第2章介绍了一套高级的HDFS操作，在处理大规模数据时，无论是用Hadoop MapReduce还是用非MapReduce用例，这些操作都很有用。

第3章解释了如何改变Hadoop部署的配置和安全性，以及如何调试。

第4章介绍了几种高级的Hadoop MapReduce特性，这些特性将有助于你开发高度定制化的、高效的MapReduce应用程序。

第5章介绍了其他与Hadoop相关的项目，如HBase、Hive和Pig。

第6章解释了如何使用Hadoop来计算基本的统计分析信息。

第7章介绍几种可以与Apache Hadoop协同使用的工具和技术，让你可以进行大规模的搜索和索引。

第8章介绍了如果使用Hadoop实现复杂的算法，如聚类、推荐和关系发现。

第9章解释了如何使用Hadoop和Mahout处理海量文本数据集，以及如何使用Hadoop实现数据预处理和加载操作。

第10章解释了如何使用亚马逊弹性MapReduce（Elastic MapReduce，EMR）和Apache Whirr在云基础设施上部署和执行Hadoop MapReduce、Pig、Hive和HBase计算。

《Hadoop MapReduce实战手册》一导读