华章计算机 + 关注
手机版

《Hadoop与大数据挖掘》一2.7 本章小结

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《Hadoop与大数据挖掘》一2.7 本章小结

华章计算机 2017-06-26 10:48:00 浏览692 评论0

摘要: 本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.7节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.7 本章小结 本章首先介绍了Hadoop的基本概念、原理以及Hadoop生态系统各个框架。

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.7节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.7 本章小结

本章首先介绍了Hadoop的基本概念、原理以及Hadoop生态系统各个框架。接着,介绍了Hadoop的安装配置以及开发环境IDE配置。在此基础上介绍了Hadoop常用的集群命令、Hadoop MapReduce编程开发原理,针对MapReduce编程开发,详细介绍了Map-Reduce原理、单词计数源码分析,结合源码分析了MapReduce原理。在本章的最后两个小节,分别介绍了数据挖掘中的经典算法:K-Means算法、TF-IDF算法,并针对其Hadoop MapReduce实现进行了详细分析。同时,本章中包含大量动手实践章节,这些动手实践章节要求读者自行完成(部分有示例代码参考),通过这些动手实践环节,可以加深读者对Hadoop、Hadoop HDFS、Hadoop MapReduce的理解,同时对如何针对经典算法或者单机算法使用Hadoop MapReduce模式来实现肯定会有自己的心得体会。
相信通过本章的学习,读者不仅可以对Hadoop、Hadoop MapReduce的原理有更深入的了解,而且对开发Hadoop MapReduce程序也可以说初窥门径了。

【云栖快讯】阿里巴巴小程序繁星计划,20亿补贴第一弹云应用免费申请,限量从速!  详情请点击

网友评论