1. 云栖社区>
  2. 全部标签>
  3. #数据采集#
数据采集

#数据采集#

已有2人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

宜信开源|数据库审核软件Themis的规则解析与部署攻略

Themis是宜信公司DBA团队开发的一款数据库审核产品,可帮助DBA、开发人员快速发现数据库质量问题,提升工作效率。本文为其规则解析和部署攻略。

数据存储与数据库 python redis mysql Oracle Json 模块 数据库 开源 配置 supervisor 数据采集 type celery

基于日志服务的GrowthHacking(1):数据埋点和采集(APP、Web、邮件、短信、二维码埋点技术)

数据质量决定运营分析的质量 在上文中,我们介绍了GrowthHacking的整体架构,其中数据采集是整个数据分析的基础,只有有了数据,才能进行有价值的分析;只有高质量的数据,才能驱动高质量的运营分析.可以说,数据质量决定了运营质量。

服务器 日志 日志服务 web logger Image aliyun 运营 数据采集 html GrowthHacking

云上的Growth hacking之路,打造产品的增长引擎

增长关乎产品的存亡 增长!增长!增长!业务增长是每一个创业者每天面临的最大问题。无论你的产品是APP,还是web,或者是小程序,只能不断的维持用户的增长,才能向资本市场讲出一个好故事,融资活下去。活到最后的产品,才有机会盈利。

架构 日志 日志服务 SLS Image aliyun 运营 报表 数据采集 html 存储 增长黑客

DataSimba系列之流式计算

市场变化越来越快,企业对于数据及时性的需求,也越来越大,另一方面,当下数据容量呈几何倍暴增,数据的价值在其产生之后,也将随着时间的流逝,逐渐降低。 因此,我们最好在事件发生之后,迅速对其进行有效处理,实时,快速地处理新产生的数据,帮助企业快速地进行异常管理和有效决策,而不是待数据存储在一起之后,再进行批量处理。

分布式 大数据 架构 监控 hbase 数据库 spark 流式计算 离线计算 数据采集 数据存储 流计算 海量数据 多维分析 数据中台

华米发布两款旗舰新品:均搭载AI芯片“黄山 1 号”

AMAZFIT 智能手表 2 是华米推出的首款搭载 eSIM 功能的智能手表,支持移动、联通、电信三大运营商的 4G 独立通话及蜂窝移动网络服务。

模块 人工智能 语音识别 云服务 数据采集 神经网络

全方位 Logtail 状态监控

作为日志服务的采集 agent,Logtail 目前已运行于上百万的机器,为万级别的应用提供服务,每天采集的数据已达到 PB 级别,这些实战的打磨使得 Logtail 在稳定性和性能上都已非常出色,在机器、网络等环境不变的情况下,配置完成后基本不再需要进行任何运维。

监控 日志 日志服务 SLS 配置 Logtail aliyun 数据采集 html Logtail状态监控

迎接自动驾驶落地 Mobileye新组建的IMS部门要如何做?

IMS的核心方向是智慧出行和大数据。

大数据 数据采集

阿里PB级Kubernetes日志平台建设实践

将在QCon上分享的《阿里PB级Kubernetes日志平台建设实践》整理出来,分享给大家。

日志 配置 集群 容器 Image cdn 数据采集 kubernetes k8s 日志分析

多线程、事件驱动与推荐引擎框架选型

  事件驱动编程是一种编程范式,这里程序的执行流由外部事件来决定。它的特点是包含一个事件循环,当外部事件发生时使用回调机制来触发相应的处理。多线程是另一种常用编程范式,并且更容易理解。   高性能通用型C++网络框架 Nebula 是基于事件驱动的多进程网络框架(适用于即时通讯、数据采集、实时计算、消息推送等应用场景),已有即时通讯、埋点数据采集及实时分析的生产应用案例。

分布式 开发框架与中间件 分布式系统与计算 实时系统 服务器 线程 c++ 多进程 同步 多线程 编程 数据采集 推荐引擎

大数据入门干货

  首先,提及大数据一词的概念。大数据本质还在于数据,但是它有着新的特征亮点。包括:数据来源广,数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等等。

python 分布式 大数据 架构 storm hdfs 集群 spark 流式计算 数据采集 Mapreduce 存储 数据存储

64
GO