1. 云栖社区>
  2. 全部标签>
  3. #开源大数据#
开源大数据

#开源大数据#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

云场景实践研究第79期:熊猫直播

作为知名泛娱乐直播平台,熊猫直播数据纬度多、数据量巨大,通过借助阿里云多项服务,不断优化云上资源,最终建立起灵活配置、高扩展性、易于运维的云上架构。本文将带领大家一同了解熊猫直播大视频数据业务的云上历程。

云栖社区 大数据 云服务器 配置 集群 钉钉 开源大数据 e-mapreduce 离线计算 EMR 存储 数据存储 云场景实践研究

云场景实践研究第23期:掌慧纵盈

2016年,掌慧纵盈通过阿里云产品,率先构建了业界领先的大数据平台。本文将具体分析掌慧纵盈如何选择阿里云E-MapReduce等产品来满足需求和相应业务架构的实现。

大数据 架构 OSS hbase 日志 集群 工单 开源大数据 e-mapreduce slb 云服务 Hive 云平台 带宽 云场景实践研究

开源大数据周刊-第81期

资讯 2018年的5个人工智能趋势 在2018年人工智能会有什么进展?下面是我们观察到的:期待机器学习在方法、理解和教育方面会取得实质性的进展;在硬件方面的进步和更低的花费,将会带来更好的数据收集和更快的深度学习;我们会看到更多的自动化应用案例;人工智能社区将继续解决对于人工智能在隐私、伦理道德和责任方面的担忧。

python 深度学习 hdfs 性能 数据处理 人工智能 集群 开源大数据 CPU 流数据

开源大数据解决方案

表 1. 开源大数据解决方案 解决方案 开发商 类型 描述 Storm Twitter 流式处理 Twitter 的新流式大数据分析解决方案 S4 Yahoo!...

分布式 大数据 storm hadoop Apache 集群 spark 解决方案 开源大数据 Twitter Mapreduce 流计算 大数据分析

开源大数据周刊-第80期

奇虎360正式开源其高性能KV存储平台Zeppelin,Zeppelin 是奇虎 360 开源的一个高性能,高可用的分布式 Key-Value 存储平台,它以高性能、大集群为目标,并希望能在 Zeppelin 的基础上,不仅能够提供 KV 的访问,还可以通过简单的一层转换满足更复杂的协议需求。

深度学习 分布式 大数据 机器学习 hadoop 函数 高可用 人工智能 数据流 集群 spark 开源大数据 Hive kafka 区块链

云数据库HBase企业级安全解析

在2018年1月25日的数据库直播中,Apsara DB-HBase产品技术团队的天斯分享了“云数据库HBase企业级安全解析”的重要课题,通过与开源HBase相比,拥有由Intel和Alibaba合作开发的HAS系统的云HBase系统无论在安全性还是在运维成本上亦或是友好性上都有了较大的提高。

大数据 安全 hbase 加密 高可用 数据库 开源大数据 云数据库 身份认证 权限管理

开源大数据周刊-第79期

资讯 警惕大数据成了互联网的“PX项目” 新年伊始 BAT 三家关于数据安全的新闻就成功的吸引了公众的目光,也引发了公众对于大公司收集并使用用户数据的担忧。这篇文章比较客观的分析了公众的忧虑,以及互联网公司如何使用这些数据,可以说是一个很好数据安全的科普。

深度学习 分布式 大数据 安全 算法 服务器 hadoop 加密 人工智能 数据流 数据安全 容器 spark 开源大数据

浅谈开源大数据平台的演变

一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用、降低使用门槛、带动业界大规模部署的就是Hadoop。

分布式 大数据 算法 hbase hadoop 数据仓库 集群 spark 开源大数据 Hive Mapreduce 存储 海量数据

开源大数据周刊-第77期

资讯 锤炼视频大数据时代的“火眼金睛” 我们身处一个大数据的时代,视频数据的爆炸性增长是这个时代的重要特征之一。如何让计算机看懂视频的内容,实现对海量视频数据的检索和分析是有效管理和利用视频大数据的关键。

分布式 大数据 安全 算法 互联网 人工智能 集群 开源大数据

开源大数据周刊-第78期

新功能预告:EMR Hadoop集群将增加Flink组件,版本1.4.0;EMR Kafka集群将增加Schema Registry和Rest Proxy组件

分布式 大数据 算法 hadoop 性能 日志 Apache 人工智能 集群 数据安全 开源大数据 分布式计算 流计算 流数据

开源大数据周刊-第76期

本期周刊包括开源大数据核心组件Hadoop和Impala的最新消息,以及HBase、Kafka、TensorFlow等主流开源组件的实践分享和技术实现,还有来自京东推荐部门的推荐系统演进史,纯干货分享。

分布式 大数据 安全 架构 hbase hadoop Apache 安全平台 spark 开源大数据 TensorFlow kafka impala

熊猫直播:大视频数据业务的云上历程

在海量数据的大视频行业,如何满足大数据需求?12月20日举办的北京云栖大会“企业云上业务优化”分论坛上,熊猫直播大数据技术专家卢圣刚,分享了熊猫直播不断优化云上资源,建立起灵活配置、高扩展性、易于运维的云上架构的宝贵经验。

大数据 redis 架构 MongoDB mysql 云栖大会 集群 钉钉 开源大数据 e-mapreduce EMR 服务专场 熊猫直播 大视频数据 7x24小时支持

大数据 云计算 等搜集的资料

云计算和大数据 http://www.cstor.cn/textdetail_6067.html http://wenku.baidu.com/link?url=kscWHrJRhI2PdBscQvBmTJTcNcUQpNIk8xFXlkNKWnnTtRLmYPPLBAV4Gp5CmP-H1...

分布式 大数据 算法 storm hdfs hadoop 性能 Apache 数据流 云存储 OpenStack spark 开源大数据 对象存储 并行计算

开源大数据周刊-第75期

中共中央政治局12月8日下午就实施国家大数据战略进行第二次集体学习。中共中央总书记习近平在主持学习时强调,大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。

深度学习 大数据 算法 实时系统 Apache 个性化推荐 数据安全 测试 开源大数据 Core

浅谈开源大数据平台的演变

浅谈开源大数据平台的演变 2015-04-16 腾讯大数据一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。

分布式 大数据 算法 hbase hadoop 数据仓库 集群 spark 开源大数据 Hive Mapreduce 存储 海量数据

开源大数据周刊-第74期

资讯 大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。 百度开源高性能 Python 分布式计算框架 Bigflow百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。

云栖社区 深度学习 分布式 大数据 架构 算法 分布式系统与计算 storm 性能 SQL Apache 开源大数据 分布式计算 google Hive

Apache RocketMQ 深圳沙龙报名开启!

Apache RocketMQ深圳沙龙报名正式开启。12月16日,Apache RocketMQ将在深圳举办线下沙龙!届时,社区里的PMC Member、Committer、深度用户,来自各路的资深专家汇聚一堂,就分布式消息引擎的最佳实践、性能优化、流计算集成、开源大数据生态和 OpenMessaging 规范等,为大家带来一场技术上的饕餮盛宴,促进消息领域与社区的进一步发展。

分布式 性能优化 Apache 开源 阿里中间件 开源大数据 流计算 RocketMQ Aliware OpenMessaging

一共81个,开源大数据处理工具汇总(上)

本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。

分布式 大数据 架构 hbase hadoop 性能 Apache 高可用 数据库 spark 开源大数据 Cassandra google Hive 高性能

一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等

作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。   接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设施、搜索引擎、Iaas和监控管理等大数据开源工具。

RPC 分布式 消息系统 大数据 算法 性能 日志 c++ Apache 配置 集群 容器 搜索引擎 开源大数据 索引

开源大数据周刊-第73期

资讯 国家公布人工智能四大平台 AI的春天到了? 日前,科技部召开新一代人工智能发展规划暨重大科技项目启动会,并公布首批国家新一代人工智能开放创新平台名单,标志着新一代人工智能发展规划和重大科技项目进入全面启动实施阶段。

云栖社区 数据存储与数据库 互联网产品及应用 深度学习 大数据 HTTPS 云栖大会 http 互联网 人工智能 AlphaGo aliyun 开源大数据 facebook 海量数据

9
GO