《MapReduce设计模式》一导读

简介: 欢迎阅读《MapReduce设计模式》!这是一本既独特又熟悉的书。首先,这显然是一本关于设计模式的书,为大家提供解决问题的模板或通用指南。我们看了一些以前出版的有关设计模式的书,特别是Gamma等人(1995)编著的《Design Patterns: Elements of Reusable Object-Oriented Software》(通常被成为“四人组”书),从中汲取了灵感。


q2

前 言

MapReduce设计模式
欢迎阅读《MapReduce设计模式》!这是一本既独特又熟悉的书。首先,这显然是一本关于设计模式的书,为大家提供解决问题的模板或通用指南。我们看了一些以前出版的有关设计模式的书,特别是Gamma等人(1995)编著的《Design Patterns: Elements of Reusable Object-Oriented Software》(通常被成为“四人组”书),从中汲取了灵感。在每个模式的描述中,读者都会看到一个我们反复使用的模板,这个模板基本是基于他们这本书的。重复看到类似的模板可以帮助读者获取所需的特定信息。这在以后使用这本书当参考书时特别有用。

这本书相对于“cookbook”类的书要更开放一些,因为本书不是面向解决具体问题的。但与cookbook类的书相似的是,本书涉及的内容同样都是简短的、分门别类的。要解决你所面临的问题需要付出比复制、粘贴我们的代码更多的努力,但是我们希望你可以找到一个模式帮助你解决掉90%的问题。

这本书主要是关于Hadoop或MapReduce的数据分析层面的。我们特意尽量不去引入过多有关Hadoop或MapReduce如何工作的细节,也没有长篇大论地说明我们使用的API。这些主题在互联网和相关出版物中已经有不少的涉及,因此我们决定把重点放在分析上。

考虑到在风格上与其他书籍有所不同,所以我们将在前言里说明如何更好地阅读本书。

目 录

第1章 设计模式与MapReduce
1.1  设计模式
1.2  MapReduce简史
1.3  MapReduce和Hadoop简介
1.4  Hadoop示例:单词计数
1.5  Pig和Hive
第2章 概要模式
第3章 过滤模式
第4章 数据组织模式
第5章 连接模式
第6章 元模式
第7章 输入和输出模式
第8章 最后的思考与设计模式的未来

相关文章
|
存储 SQL 分布式计算
MapReduce设计模式学习
一:概要模式 1:简介 概要设计模式更接近简单的MR应用,因为基于键将数据分组是MR范型的核心功能,所有的键将被分组汇入reducer中 本章涉及的概要模式有数值概要(numerical summarization),倒排索引(inverted index),计数器计数(counting with counter)2:概要设计模式包含       2.
947 0
|
8月前
|
数据采集 分布式计算 搜索推荐
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(一)
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(一)
|
8月前
|
数据采集 缓存 分布式计算
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(二)
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(二)
|
8月前
|
分布式计算 Hadoop 数据处理
Hadoop基础学习---6、MapReduce框架原理(二)
Hadoop基础学习---6、MapReduce框架原理(二)