《Flume日志收集与MapReduce模式》一第1章 概览与架构

简介:

本节书摘来自华章出版社《Flume日志收集与MapReduce模式》一书中的第1章,第1.1节,作者 [美] 史蒂夫·霍夫曼(Steve Hoffman)斯里纳特·佩雷拉(Srinath Perera),更多章节内容可以访问云栖社区“华章计算机”公众号查看

第1章

概览与架构
如果在阅读本书,那就说明你正在数据的海洋中遨游。创建大量的数据是非常简单的事情,这要归功于Facebook、Twitter、Amazon、数码相机与相机照片、YouTube、Google,以及你能想得到的能够连接到互联网上的任何东西。作为网站的提供者,10年前的应用日志只是用来帮助你解决网站的问题。时至今日,如果你知道如何从大量的数据中浪里淘金,那么相同的数据就会提供关于业务与客户的有价值的信息。
此外,既然在阅读本书,那么你肯定知道创建Hadoop的目的在一定程度上就是为了解决大量数据的筛选问题。当然了,只有可靠地加载Hadoop集群数据并供数据科学家从中选择,这一切才能达成所愿。
将数据存储到Hadoop以及从Hadoop中获取数据(即Hadoop文件系统,HDFS)并不是什么难事——只需要如下一条命令即可:

将数据打包好并准备上传时,使用上面这条命令就可以轻松将数据存储到Hadoop文件系统中。
不过,网站一直在创建着数据,批量将数据加载到HDFS中的频率是多少呢?每天?每小时?无论选择何种处理周期,最终还是会有人问“能否尽快给我数据呢”?你真正需要的是能够处理流式日志/数据的解决方案。
并不是只有你才有这种需求。Cloudera(专业的Hadoop服务提供商,拥有自己的Hadoop分发版本)在与客户的协作过程中不断发现了这种需求。创建Flume的目的就在于满足这种需求,它创建了一个标准、简单、健壮、灵活且可扩展的工具,用于将数据存储到Hadoop中。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
4月前
|
小程序 Java 数据管理
Java前后端分离架构开发的智慧校园电子班牌系统源码(SaaS模式)
.智慧校园设备管理: 设备管理主要对班级中正在使用的电子智慧班牌进行管理,基本功能包含(开关机状态、班级信息、设备型号、开关机信息、电子智慧班牌截屏信息、教师编号、设备ID、在线和离线状态、电子智慧班牌更新时间等)
41 0
|
4月前
|
设计模式 Linux 程序员
Linux驱动的软件架构(一):驱动的软件设计模式理念
Linux驱动的软件架构(一):驱动的软件设计模式理念
42 0
|
4月前
|
存储 缓存 负载均衡
架构的模式
架构的模式
|
14天前
|
设计模式 前端开发 数据库
构建高效Android应用:使用Jetpack架构组件实现MVVM模式
【4月更文挑战第21天】 在移动开发领域,构建一个既健壮又易于维护的Android应用是每个开发者的目标。随着项目复杂度的增加,传统的MVP或MVC架构往往难以应对快速变化的市场需求和复杂的业务逻辑。本文将探讨如何利用Android Jetpack中的架构组件来实施MVVM(Model-View-ViewModel)设计模式,旨在提供一个更加模块化、可测试且易于管理的代码结构。通过具体案例分析,我们将展示如何使用LiveData, ViewModel, 和Repository来实现界面与业务逻辑的分离,以及如何利用Room数据库进行持久化存储。最终,你将获得一个响应迅速、可扩展且符合现代软件工
15 0
|
21天前
|
供应链 安全 大数据
基于B/S架构的云计算技术区域健康云HIS系统源码 SaaS多医院模式
该系统通过区域云HIS的方式,按照信息系统三级等保相关要求统一部署在总院信息中心,通过政务外网和各基层卫生院互通。基层医生打开浏览器即可访问系统。整套系统统一管理统一维护,加强系统安全防护能力,全力保障医疗卫生大数据安全。
22 5
|
24天前
|
存储 人工智能 架构师
数据库架构模式:分片
本文介绍了数据库分片的概念,以及各自的使用场景,分片可提升可扩展性、性能和高可用性。
|
27天前
|
前端开发 安全 JavaScript
计算机软件从 CS 模式到 BS 架构迁移背后的动因
计算机软件从 CS 模式到 BS 架构迁移背后的动因
30 0
|
2月前
|
存储 监控 安全
金石推荐 | 【分布式技术专题】「单点登录技术架构」一文带领你好好认识以下Saml协议的运作机制和流程模式
金石推荐 | 【分布式技术专题】「单点登录技术架构」一文带领你好好认识以下Saml协议的运作机制和流程模式
73 1
|
2月前
|
运维 安全 Linux
LAMP架构调优(八)——Apache Worker模式调优
LAMP架构调优(八)——Apache Worker模式调优
9 0
|
2月前
|
缓存 运维 Linux
LAMP架构调优(七)——Apache Prefork模式调优
LAMP架构调优(七)——Apache Prefork模式调优
25 2