备案控制台

开发者社区

开发者社区华章出版社文章正文

《Flume日志收集与MapReduce模式》一2.4　小结

2017-05-02 1221

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章出版社《Flume日志收集与MapReduce模式》一书中的第2章，第2.4节，作者［美］史蒂夫·霍夫曼（Steve Hoffman）斯里纳特·佩雷拉（Srinath Perera），更多章节内容可以访问云栖社区“华章计算机”公众号查看

2.4　小结

本章介绍了如何下载Flume二进制分发包。我们创建了一个简单的配置文件，里面包含了一个源，它会将内容写到一个通道中，后者又会将其写到一个接收器中。源监听着一个Socket，等待网络客户端的连接，并向其发送事件数据。这些事件被写到一个内存通道中，然后被写到一个log4j接收器中，从而成为输出。接下来，我们使用Linux netcat工具连接到监听代理上，向Flume代理的源发送一些字符串事件。最后，我们验证基于log4j的接收器成功将事件写出。
下一章将会详细介绍在数据处理工作流中会用到的两个主要通道类型：

内存通道
文件通道

对于每一种类型的通道，我们都会介绍所有相关的配置，何时以及为何要覆盖默认值，更为重要的是，我们会介绍在何种场景下该使用哪一种通道。

文章标签：

日志服务

监控

分布式计算

关键词：

mapreduce模式

开源大数据平台 E-MapReduce flume

Flume模式

开源大数据平台 E-MapReduce模式

Flume日志收集

相关实践学习

日志服务之使用Nginx模式采集日志

本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。

华章计算机

目录

相关文章

让线程再跑一会

|

4月前

|

分布式计算 Hadoop Java

【集群模式】执行MapReduce程序-wordcount

【集群模式】执行MapReduce程序-wordcount

让线程再跑一会

27 1 1

让线程再跑一会

|

4月前

|

分布式计算 Java Hadoop

【本地模式】第一个Mapreduce程序-wordcount

【本地模式】第一个Mapreduce程序-wordcount

让线程再跑一会

23 0 0

阿甘兄

|

5月前

|

分布式计算资源调度 Hadoop

23 MAPREDUCE程序运行模式

23 MAPREDUCE程序运行模式

阿甘兄

33 0 0

安然AR

|

10月前

|

数据采集缓存大数据

大数据数据采集的数据采集（收集/聚合）的Flume之数据采集流程的Selector的多路复用模式

在大数据处理和管理中，数据采集是非常重要的一环。为了更加高效地进行数据采集，Flume作为一种流式数据采集工具得到了广泛的应用。其中，Flume的Sink Processor模块是实现数据输出和处理的核心模块之一。本文将介绍Flume中的Selector多路复用模式，讲解其数据采集流程。

安然AR

109 0 0

安然AR

|

10月前

|

数据采集缓存大数据

大数据数据采集的数据采集（收集/聚合）的Flume之数据采集流程的Selector的复制模式

在大数据处理和管理中，数据采集是非常重要的一环。为了更加高效地进行数据采集，Flume作为一种流式数据采集工具得到了广泛的应用。其中，Flume的Sink Processor模块是实现数据输出和处理的核心模块之一。本文将介绍Flume中的Selector复制模式，讲解其数据采集流程。

安然AR

81 0 0

让线程再跑一会

|

11月前

|

分布式计算 Ubuntu Hadoop

【集群模式】执行MapReduce程序-wordcount

因为是在hadoop集群下通过jar包的方式运行我们自己写的wordcount案例，所以需要传递的是 HDFS中的文件路径，所以我们需要修改上一节【本地模式】中 WordCountRunner类的代码

让线程再跑一会

95 0 0

让线程再跑一会

|

11月前

|

分布式计算 Java Hadoop

【本地模式】第一个Mapreduce程序-wordcount

也就是在windows环境下通过hadoop-client相关jar包进行开发的，我们只需要通过本地自己写好MapReduce程序即可在本地运行。

让线程再跑一会

98 0 0

云祁

|

存储分布式计算安全

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统2

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统2

云祁

269 0 0

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统2

云祁

|

消息中间件缓存监控

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统1

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统1

云祁

337 0 1

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统1

托马斯-酷涛

|

分布式计算监控 Hadoop

四十五、centos安装flume(集群模式)

四十五、centos安装flume(集群模式)

托马斯-酷涛

240 0 0

四十五、centos安装flume(集群模式)

华章出版社

热门文章

最新文章

阿里云E-MapReduce Trino专属集群外连引擎及权限控制踩坑实践

Flume【付诸实践 01】flume1.9.0版配置格式说明+常用案例分享（ExecSource+SpoolingDirectorySource+HDFSSink+AvroSourceSink）

E-MapReduce弹性低成本离线大数据分析

MapReduce过程详细分析

MapReduce InputFormat——DBInputFormat

HBase结合MapReduce批量导入

MapReduce1和Yarn和对比

MapReduce的一对多连接操作

MapReduce中的Join

MapReduce 核心思想| 学习笔记

Flume【付诸实践 01】flume1.9.0版配置格式说明+常用案例分享（ExecSource+SpoolingDirectorySource+HDFSSink+AvroSourceSink）

Flume【基础知识 01】简介 + 基本架构及核心概念 + 架构模式 + Agent内部原理 + 配置格式（一篇即可入门Flume）

Flume【问题记录 02】【java.lang.NoSuchMethodError:com.google.common.base.Preconditions.checkArgument】【避坑指南】

Flume【问题记录 01】【at org.apache.flume.node.Application.main(Application.java:xxx) 类问题整理+其他类型问题总结】【避坑指南】

Flume【部署 02】Flume监控工具Ganglia的安装与配置（CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明）

Flume【环境搭建 01】CentOS Linux release 7.5 安装配置 apache-flume-1.9.0 并验证

flume之avro实践

flume的log4j.properties配置说明

flume采集的一些特性

相关课程

更多

Flume基础应用实战 - 企业全场景解决方案

Hadoop 分布式计算框架 MapReduce

数据采集系统 Flume 快速入门

Hadoop 分布式资源管理框架 YARN

分布式消息系统 Kafka 快速入门

Hadoop 分布式文件系统 HDFS

相关电子书

更多

Dataflow with Apache NiFi

Spark Streaming-as-aService with Kafka and YARN

零基础实现Flume收集网站日志数据到MaxCompute

相关实验场景

更多

搭建Hadoop环境

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）