《Hadoop与大数据挖掘》一2.1.3 Hadoop计算—MapReduce

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《Hadoop与大数据挖掘》一2.1.3 Hadoop计算—MapReduce

华章计算机 2017-06-26 09:01:00 浏览1081
展开阅读全文

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.1.3节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.1.3 Hadoop计算—MapReduce

MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(归纳)”以及它们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。
当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归纳)函数,用来保证所有映射的键值对中的每一个共享相同的键组,如图2-6所示。

image


下面将以Hadoop的“Hello World”例程—单词计数来分析MapReduce的逻辑

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属云栖号: 华章计算机