1. 云栖社区>
  2. 全部标签>
  3. #big#
big

#big#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

下一代企业级云上数据分析服务:Data Lake Analytics

0. Data Warehouse VS Data Lake 0.1 传统数仓 数据来源于各类云数据存储、NoSQL和关系型数据库等系统,比如OSS、Table Store、NAS、 云HBase、RDS、PolarDB等; 数据以实时、分钟、小时、天等级别进行ETL抽取与同步到数仓系统中; 在数仓中进行实时、定时调度、汇总计算分析。

数据存储与数据库 OSS 性能 Image cdn 数据分析 aliyun 数据存储 big data DataLakeAnalytics DataLake DLA

Data Lake Analytics的Geospatial分析函数

0. 简介 为满足部分客户在云上做Geometry数据的分析需求,阿里云Data Lake Analytics(以下简称:DLA)支持多种格式的地理空间数据处理函数,符合Open Geospatial Consortium’s (OGC) OpenGIS规范,支持的常用数据格式包括: WKT WKB GeoJson ESRI Geometry Object Json ESRI Shape DLA采用4326坐标系标准,EPSG 4326使用经纬度坐标,属于地理坐标系。

数据存储与数据库 函数 SQL aliyun varchar big data DataLakeAnalytics DataLake DLA

玩转大数据系列之一:数据采集与同步

数据的采集和同步,是先将数据从设备、或者本地数据源采集、同步到阿里云上,然后在阿里云上对数据进行分析和处理,最终完成您的业务要求。本文向您介绍阿里云各产品的数据采集和同步的操作实战文章,您可以根据您使用阿里云产品,查看相应的文档教程。

大数据 数据可视化 数据处理 大屏 opensearch 数据分析 数加 同步 aliyun DataV 数据同步 BI 报表 big data

玩转大数据系列之三:数据报表与展示

经过了数据采集与数据同步、数据分析和处理,我们应该考虑将处理好的数据做成报表或者大屏更好地展示给老板们看,以便老板们可以更加精准地做出战略决策,为业务的发展指明方向。

大数据 数据可视化 数据处理 大屏 opensearch 数据分析 数加 同步 aliyun DataV 数据同步 BI 报表 big data

玩转大数据系列之四:搜索服务

搜索服务是阿里云产品非常重要的组成部分,也承载了阿里巴巴集团的全部主要的搜索任务。这里的搜索服务主要包含两个产品:阿里云Elasticsearch和开放搜索OpenSearch。本文将介绍如何玩转阿里云搜索的大数据服务。

大数据 数据可视化 数据处理 大屏 opensearch 数据分析 数加 同步 aliyun DataV 数据同步 BI 报表 big data

阿里云实战第二期之数据处理系列

继阿里云实战第一期之轻松上云系列,我们迎来了第二期数据处理系列,本系列分为,数据采集与同步,数据分析和处理,数据报表及大屏展示,搜索等一系列的大数据产品及服务,助力企业在DT时代更敏捷、更智能、更具洞察力!

大数据 数据可视化 数据处理 大屏 opensearch 数据分析 数加 同步 aliyun DataV 数据同步 BI 报表 big data

阿里云只有两种合作伙伴:一种是ITP,一种不是。很荣幸,袋鼠云是第一种。

丁原讲到:感谢一路和阿里云的携手合作,如同今日的主题“驱动数字中国”,袋鼠云会继续和阿里云一起满足更多茅台、新华书店、中航金网这样的客户数字化转型需求,基于数据智能,为中国企业的数字化进程贡献一份力量,驱动数字中国。

深度学习 分布式 大数据 算法 实时系统 数据可视化 云栖大会 技术保障 袋鼠云 解决方案 云服务 big data

搭建企业级大数据平台Cloudera Manager + CDH 5.8 + CentOS7

本文讲述企业级大数据平台Cloudera Manager的安装和使用,Cloudera Manager具有集群管理,监控,报警,集成Hadoop等强大功能,是大部分企业所使用的集群管理平台。

分布式 大数据 架构 分布式系统与计算 java 监控 服务器 mysql 日志 配置 集群 Image rpm big data

BI为什么不是商业“智能”?

真正的智能是使机器能够在一定程度上模拟人类的心智,而不是一些更加规模化或自动化的数据处理流程。

大数据 数据仓库 Image 数据分析 OLAP BI 报表 big data 大数据分析 商业智能

开源大数据周刊-第107期

1月14日,英特尔人工智能大会(AIDC 2018)在北京国贸酒店举行。这是英特尔第三次在中国举行人工智能大会,也是第一次专门面向开发者和技术社区。大会上,英特尔发布了Neural Compute Stick 2(神经计算棒二代),英特尔还展示了如何以底层计算能力赋能百度、腾讯、阿里、微软等合作伙伴,共同推进AI与物联网发展。

云栖社区 深度学习 分布式 安全 hadoop Apache 人工智能 集群 mr spark 开源大数据 kafka big data Livy

【袋鼠云技术团队沙龙第12期】大数据平台实践

双十一成交额2135亿,新的技术力量刚刚开始!今年双11的大数据平台实时计算处理能力已经相当于一秒钟内读完120万本2018年新版的《新华字典》,技术与业务的共振正把我们的生活变得更加地便携与高效。越来越多的企业也逐渐采用大数据的技术架构来进行企业IT架构的升级。

大数据 架构 hadoop 数据仓库 袋鼠云 e-mapreduce 离线计算 big data 海量数据 大数据平台 数据智能 数栈

JSON数据从OSS迁移到MaxCompute最佳实践

本文为您介绍如何利用DataWorks数据集成将JSON数据从OSS迁移到MaxCompute,并使用MaxCompute内置字符串函数GET_JSON_OBJECT提取JSON信息。

大数据 实时系统 OSS 函数 Json 脚本 数据同步 big data MaxCompute DataWorks

开源大数据周刊-第106期

Apache Kylin社区于日前宣布:Apache Kylin v2.5.1 正式发布!Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop 之上的 SQL 查询接口及多维分析(OLAP)能力,支持对超大规模数据进行亚秒级查询。

云栖社区 深度学习 分布式 架构 算法 hadoop 性能 Apache spark 开源大数据 kylin big data Pulsar MMLSpark

Flink 专题 -2 Checkpoint、Savepoint 机制

在新的大数据计算框架flink中关于 checkpoint 和 savepoint 相关的设置、配置和注意事项 ,希望可以帮助到大家。

java hdfs hadoop Apache 配置 集群 存储 big data flink

Flink 专题1 : 搭建Flink 及Flink 简介

搭建Flink 及Flink 简介 包括flink 基本概要信息 以及flink linux 集群安装 flink 标准集群启动模式 flink on yarn 启动模式

linux 大数据 hdfs hadoop Apache 高可用 配置 集群 容器 session big data 流数据

4
GO