《Storm实时数据处理》一2.2 创建日志代理

简介:

本节书摘来华章计算机《Storm实时数据处理》一书中的第2章 ,第2.2节,(澳)Quinton Anderson 著 卢誉声 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 创建日志代理

现代企业架构由大量的解决方案组成,而每个方案都包含许多节点。有些MapReduce集群可以包含几百个节点。在操作系统和应用层上,每个节点又包含一组应用和服务。这些服务和应用又会产生大量不同类型的日志数据。如今人们已经越来越认识到日志数据在企业团体中的重要性,原因如下:

  • 对于IT运营团队维护系统运行来说,它是一种关键的信息来源。
  • 它对于在生产和系统测试阶段中发现问题和解决问题至关重要。
  • 它越来越成为一种商业价值来源,有价值的业务数据都包含在这种半结构化数据中,包括:
  • 风险和合规性数据
  • 业务运营数据
  • 网站分析数据
  • 安全信息
  • 财务预测数据

为了利用这些具有价值的日志数据,我们必须先从这些节点中获取数据,然后再把数据安全简单地传送到中央日志服务器中进行存储、索引和分析。本节将通过名为logstash的开源日志代理阐述实现这一过程的方法。
可以找到很多好的商业和开源的日志解决方案。本章只涉及logstash的一部分。欲了解更多logstash技巧,可以访问http://cookbook.logstash.net/http://logstash.net/docs/1.1.13/tutorials/getting-started-centralized。另外还有一个与logstash类似的商业版本叫做Splunk(http://www.splunk.com/)。

2.2.1 实战

Step01 首先,将本地节点上的日志导入Topology。按照下面的链接下载和配置logstash:
image

Step02 然后,使用文本编辑器创建一个名为shipper.conf的文件,文件内容如下:
image
image

Step03 启动Redis本地实例后,执行以下命令启动日志代理:
java –jar logstash-1.1.7-monolithic.jar agent–f shipper.conf

2.2.2 解析

logstash使用可扩展插件列表实现了一个非常简单的“输入-过滤器-输出”(input-filter-output)模型,并基于该模型的三种元素不断进行扩展。配置文件(shipper.conf)至少配置了一组输入值和输出值。
文件输入插件根据指定路径中的文件名或通配符来跟踪(tail)文件的修改。你可以配置很多不同类型的文件输入。日志类型在后期处理和分类时尤为重要。由于我们没有在配置文件中配置任何过滤器,因此原始日志将直接被传输到输出插件。基于Redis的输出插件将日志输出到本地Redis实例中,然后存储到名为rawLogs的列表里。
你可以轻松地在设备节点中安装和配置logstash,包括密匙交换,这样你就可以通过任意传输机制安全地传输日志了。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
7月前
|
网络协议 应用服务中间件 nginx
nginx配置tcp协议代理的日志
nginx配置tcp协议代理的日志
153 0
|
6月前
|
流计算
110 Storm集群的进程及日志熟悉
110 Storm集群的进程及日志熟悉
38 0
Python之scrapy的post请求、日志和代理
Python之scrapy的post请求、日志和代理
Python之scrapy的post请求、日志和代理
|
安全 应用服务中间件 nginx
Nginx代理浏览器可实时查看程序日志
我们经常需要在页面上实时查看nginx的日志输出,并且能在页面上显示,那么如何通过Nginx实现浏览器可实时查看访问日志呢?
Nginx代理浏览器可实时查看程序日志
Linkerd 2.10(Step by Step)—修改代理日志级别
Linkerd 2.10(Step by Step)—修改代理日志级别
143 0
|
消息中间件 监控 NoSQL
搞懂分布式技术24:基于Flume+Kafka+ Elasticsearch+Storm的海量日志实时分析平台:
0背景介绍 随着机器个数的增加、各种服务、各种组件的扩容、开发人员的递增,日志的运维问题是日渐尖锐。通常,日志都是存储在服务运行的本地机器上,使用脚本来管理,一般非压缩日志保留最近三天,压缩保留最近1个月,其它直接删除或迁移到日志服务器上。
|
SQL 监控 关系型数据库
2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《流数据处理:通过StreamSQL分析视频日志》篇
2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《流数据处理:通过StreamSQL分析视频日志》篇
2887 0