1. 云栖社区>
  2. 全部标签>
  3. #离线分析#
离线分析

#离线分析#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Knative 实战:基于阿里云 Kafka 实现消息推送

在 Knative 中已经提供了对 Kafka 事件源的支持,那么如何在阿里云上基于 Kafka 实现消息推送,本文给大家解锁这一新的姿势。

大数据 消息服务 消息队列 Image 控制台 Consumer 离线分析 demo metadata Group serverless Knative

Hadoop生态系统

Hadoop生态系统 首先我们先了解一下Hadoop的起源。然后介绍一些关于Hadoop生态系统中的具体工具的使用方法。

分布式 hbase hdfs hadoop 数据库 数据仓库 集群 数据挖掘 分布式计算 google 分布式文件系统 Hive 离线分析 zookeeper Mapreduce

阿里宜搭发布OCR文字识别插件 助力合作伙伴升级

7月26日,在阿里云合作伙伴峰会上,阿里云发布SaaS生态战略:通过SaaS加速器为合作伙伴提供应用开发、集成、上云、售卖的全链路解决方案,提升开发效率和集成效率,缩短商业化周期。 作为阿里SaaS加速器的重要一环,零代码业务应用搭建平台“宜搭”能助力产品提升开发效率。

云栖社区 大数据 配置 SaaS 解决方案 离线分析 插件 文字识别

通过Spark SQL实时归档SLS数据

流式计算和SQL 简要介绍Spark SQL流式开发语法 实时归档SLS数据到HDFS

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 hdfs SQL SLS 配置 spark 流式计算 离线分析 schema Create

通过Spark SQL实时归档SLS数据

我在前一篇文章介绍过基于Spark SQL实现对HDFS操作的实时监控报警。今天,我再举例说明一下如何使用Spark SQL进行流式应用的开发。

大数据 hdfs SQL SLS 配置 spark 流式计算 分布式计算 离线分析 schema Create 实时数仓

基于Apache Flume Datahub插件将日志数据同步上云

## 简介 Apache Flume是一个分布式的、可靠的、可用的系统,可用于从不同的数据源中高效地收集、聚合和移动海量日志数据到集中式数据存储系统,支持多种Source和Sink插件。本文将介绍如何使用Apache Flume的[Datahub Sink插件](https://github.

日志 LOG Apache 阿里技术协会 配置 agent aliyun 数据同步 离线分析 插件 type 数据存储 MaxCompute datahub 数据上云

阿里云MaxCompute 2019-4月刊

4月新功能发布,精彩技术好文推荐,5月线上线下活动抢先知道,尽在4月刊。

大数据 SQL 正则表达式 aliyun 离线分析 html MaxCompute

4月26日云栖精选夜读 | 阿里开发者招聘节 面试题02-04:给定一个二叉搜索树(BST),找到树中第K小的节点

阿里巴巴资深技术专家们结合多年的工作、面试经验总结提炼而成的笔试真题这一次将陆续放出(面试题答案将在专辑分享结束后统一汇总分享)。并通过这些笔试真题开放阿里巴巴工作机会,让更多的开发者加入到阿里这个大平台。

linux mysql 云服务器 钉钉 开源大数据 多线程 云服务 面试题 离线分析 数据结构

MySQL离线分析工具innochecksum

介绍 innochecksum打印InnoDB文件的校验和。此工具读取InnoDB表空间文件,计算每个页面的校验和,将计算的校验和与存储的校验和进行比较,并报告不匹配,这表明页面已损坏。它最初是为了在停电后加快验证表空间文件的完整性而开发的,但也可以在文件复制后使用。

数据存储与数据库 算法 服务器 mysql innodb 日志 shell test 离线分析 page 磁盘 表空间

大数据薪资一再飙升 学习大数据需要哪些基础?

2018年6月19日,备受关注的个人所得税法修正案草案迎来第七次大修,个税起征点由每月3500元提高至每月5000元(每年6万元)。对于大多数人来说这绝对是个好消息,但人们更愿意参加培训班实现高薪。近年来,随着互联网的飞速发展以及企业需要处理的数据不断增多,大数据人才成为急缺人才,薪资一再飙升。

云栖社区 编程语言 linux python 大数据 Java核心技术 算法 java hadoop 数据仓库 数据挖掘 离线分析 zookeeper

为数据计算提供强力引擎,阿里云文件存储HDFS v1.0公测发布

在2019年3月的北京云栖峰会上,阿里云正式推出全球首个云原生HDFS存储服务—文件存储HDFS,为数据分析业务在云上提供可线性扩展的吞吐能力和免运维的快速弹性伸缩能力,降低用户TCO。阿里云文件存储HDFS的发布真正解决了HDFS文件系统不适应云上场景的缺陷问题,用户无须花费精力维护和优化底层存储。

大数据 hdfs hadoop 性能 集群 云存储 Image 弹性伸缩 spark EMR 分布式文件系统 离线分析 存储 文件存储 存储计算分离

为数据计算提供强力引擎,阿里云文件存储HDFS v1.0公测发布

在2019年3月的北京云栖峰会上,阿里云正式推出全球首个云原生HDFS存储服务—文件存储HDFS,为数据分析业务在云上提供可线性扩展的吞吐能力和免运维的快速弹性伸缩能力,降低用户TCO。阿里云文件存储HDFS的发布真正解决了HDFS文件系统不适应云上场景的缺陷问题,用户无须花费精力维护和优化底层存储。

云栖社区 安全与风控 数据存储与数据库 系统研发与运维 互联网产品及应用 大数据 hdfs 性能 云存储 数据分析 弹性伸缩 test 离线分析 存储 大数据分析

准实时异常检测系统

本文为您介绍利用实时计算设计准实时(延迟在100ms以内)异常检测系统。 背景介绍 比如一家银行要做一个实时的交易检测,判断每笔交易是否是正常交易:如果用户的用户名和密码被盗取,系统能够在盗取者发起交易的瞬间检测到风险来决定是否冻结这笔交易。

架构 算法 实时系统 hbase 离线计算 离线分析 MaxCompute

全栈必备 面向数据的架构

版权声明:本文为半吊子子全栈工匠(wireless_com,同公众号)原创文章,未经允许不得转载。

深度学习 安全 架构 公共云 数据处理 数据仓库 数据分析 专有云 离线分析 报表 存储 数据存储 数据应用

HBase2.0在360的技术改进与应用实践

一、HBase在360的使用情况 从数据来看,360目前共有27个HBase集群,其中在线集群9个,综合集群3个。整个360共有12500个HBase节点,单集群最多有2184个RegionServer。

hbase 配置 集群 Image 索引 离线分析

HBase+Spark技术双周刊第一期

HBase技术双周刊第1期来袭!HBase多模式、HBase内核及能力以及Spark介绍及Spark多数据源分析等精彩直播,HBase 在人工智能场景的使用、HBase2.0重新定义小对象实时存取精彩技术分享!

大数据 架构 hbase 人工智能 spark aliyun 开源大数据 对象存储 索引 离线分析 自然语言处理 存储

HBase+Spark技术双周刊第1期

HBase技术双周刊第1期来袭!HBase多模式、HBase内核及能力以及Spark介绍及Spark多数据源分析等精彩直播,HBase 在人工智能场景的使用、HBase2.0重新定义小对象实时存取精彩技术分享!

大数据 架构 hbase 人工智能 spark 开源大数据 对象存储 索引 离线分析 自然语言处理 存储

6
GO