1. 云栖社区>
  2. 全部标签>
  3. #开源大数据#
开源大数据

#开源大数据#

已有1人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

1月30日云栖精选夜读 | 《2018年云上挖矿态势分析报告》发布,非Web类应用安全风险需重点关注

近日,阿里云安全团队发布了《2018年云上挖矿分析报告》。该报告以阿里云2018年的攻防数据为基础,对恶意挖矿态势进行了分析,并为个人和企业提出了合理的安全防护建议。

python 安全 Apache 云安全 人工智能 web 集群 阿里中间件 spark 开源大数据 云市场 人机对话

【2018中国计算机大会】阿里云分布式存储架构师谈 自研分布式文件系统服务

10月27日下午,2018中国计算机大会上举办了主题“存储软硬件之国产化挑战与机遇”的技术论坛,一起探讨存储软硬件栈上的关键系统与技术的国产化发展道路。论坛上,阿里云分布式存储团队架构师黄硕针对存储软硬件国产化进行了《云上自研分布式文件系统服务的设计与实践》的报告。

大数据 架构 性能 高可用 Image 弹性计算 aliyun 开源大数据 分布式文件系统 高性能 分布式存储 存储 大数据分析

Apache Flink 干货合集打包好了,速来下载

作者:王绍翾(花名:大沙) 最近的一份市场调查报告显示,Apache Flink 是2018年开源大数据生态中发展“最快”的引擎,和2017年相比增长了125% 。为了让大家更为全面地了解Flink,我们制作了一本电子干货合集:《不仅仅是流计算:Apache Flink实践》,融合了Apache Flink在国内各大顶级互联网公司的大规模

大数据 架构 算法 Apache 阿里技术协会 人工智能 开源大数据 流计算 flink 实时计算

HBase+Spark技术双周刊第一期

HBase技术双周刊第1期来袭!HBase多模式、HBase内核及能力以及Spark介绍及Spark多数据源分析等精彩直播,HBase 在人工智能场景的使用、HBase2.0重新定义小对象实时存取精彩技术分享!

大数据 架构 hbase 人工智能 spark aliyun 开源大数据 对象存储 索引 离线分析 自然语言处理 存储

HBase+Spark技术双周刊第1期

HBase技术双周刊第1期来袭!HBase多模式、HBase内核及能力以及Spark介绍及Spark多数据源分析等精彩直播,HBase 在人工智能场景的使用、HBase2.0重新定义小对象实时存取精彩技术分享!

大数据 架构 hbase 人工智能 spark 开源大数据 对象存储 索引 离线分析 自然语言处理 存储

超燃!Apache Flink 全球顶级盛会强势来袭

12月20日,北京国家会议中心。Flink Forward China 2018 强势来袭~

深度学习 大数据 引擎技术 性能 Apache 开源大数据 流计算 flink 实时计算

开源大数据周刊-第107期

1月14日,英特尔人工智能大会(AIDC 2018)在北京国贸酒店举行。这是英特尔第三次在中国举行人工智能大会,也是第一次专门面向开发者和技术社区。大会上,英特尔发布了Neural Compute Stick 2(神经计算棒二代),英特尔还展示了如何以底层计算能力赋能百度、腾讯、阿里、微软等合作伙伴,共同推进AI与物联网发展。

云栖社区 深度学习 分布式 安全 hadoop Apache 人工智能 集群 mr spark 开源大数据 kafka big data Livy

阿里云开源大数据内核团队招聘人才

此次发布的岗位均是 Hadoop、Spark、HBase、flink等底层引擎内核的研究机会,机会难得,小伙伴们赶紧尝试下。工作地点杭州、北京。简历发给我:dragon.caol@alibaba-inc.com

linux 大数据 java 阿里云 hbase hadoop 源码 数据库 spark 搜索引擎 scala 开源大数据 招聘 Elassearch

ROLAP与大数据

大数据相关的场景比较多,常见的有:ETL(数据提取、转换、加载)、实时流式(监控报警、风控等)、机器学习(推荐引擎、用户画像等)、非结构化分析(视频、图片、语音、文本等)、海量大数据在线存储(HBase)、搜索及我们本文讲的OLAP。 其中OLAP(在线联机分析)在很多企业占住分析类的大部分。

大数据 hbase hdfs hadoop HTTPS SQL 数据仓库 spark 开源大数据 OLAP MPP Hive 存储 presto

开源大数据周刊-第106期

Apache Kylin社区于日前宣布:Apache Kylin v2.5.1 正式发布!Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop 之上的 SQL 查询接口及多维分析(OLAP)能力,支持对超大规模数据进行亚秒级查询。

云栖社区 深度学习 分布式 架构 算法 hadoop 性能 Apache spark 开源大数据 kylin big data Pulsar MMLSpark

开源大数据周刊-第105期

资讯 340亿美元收购红帽,IBM在拥挤的云市场另辟蹊径 Hadoop真的要死了吗?程序员的革命or灾难:机器人在GitHub修复bug、与人不相上下 基于TensorFlow Serving的深度学习在线预估 如期而至!谷歌开源 BERT 模型源代码 4年数据涨万倍,Uber大数据平台四...

云栖社区 深度学习 分布式 大数据 hadoop 人工智能 spark 流式计算 开源大数据 github TensorFlow 谷歌 NLP Streaming Uber

开源大数据周刊-第104期

资讯 谷歌、亚马逊、阿里纷纷入局,边缘计算的潜力如何? 从智能手机到可穿戴设备,从医疗到汽车以及工业制造,边缘计算正在上演一个又一个行业传奇,它的落脚点是要让终端成为更智慧的存在——能够实时处理数据、能够低延时做出反馈——这不就是我们期待中的智能设备吗? 如此多的深度学习框架,为什么我选择PyTorch? 不久前,Facebook 在首届 PyTorch 开发者大会发布了 PyTorch1.0 预览版,标志着这一框架更为稳定可用。

云栖社区 深度学习 分布式 大数据 Apache 数据仓库 spark 解决方案 开源大数据

开源大数据周刊-第103期

Google宣布在2016年发布的数据可视化工具Data Studio,以及2017年发布的的数据预先处理服务Cloud Dataprep,现在都正式可用。

大数据 redis 数据可视化 hadoop spark 开源大数据 大数据平台

DKHadoop大数据开发框架的构成模块

大数据也不是近几年才出现的新东西,只是最近几年才真正意义上变得热门、火爆!而这要得益于互联网信息技术的快速发展,网络改变世界、改变生活,大数据技术的应用让这样的改变更为深刻。

大数据 算法 hadoop 模块 数据处理 互联网 数据安全 spark 搜索引擎 开源大数据 自然语言处理 数据采集 开发框架

阿里巴巴为什么选择Apache Flink?

本文作者:王峰(花名:莫问) 导读:伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值再也难以被计算。时下,谈及大数据,不得不提到热门的下一代大数据计算引擎Apache Flink(以下简称Flink)。本文将结合Flink的前世

大数据 Apache 阿里技术协会 数据处理 流式计算 开源大数据 API 分布式架构 流计算 flink 实时计算

13
GO