阿里云E-MapReduce 关注
手机版

开源大数据周刊-第87期

资讯 SIGIR2018高分录用——阿里妈妈公开全新CVR预估模型近期,阿里妈妈算法团队发表了一篇题为《Entire Space Multi-Task Model: An Effective Approach for Estimating...

深度学习 算法 数据处理 高可用 集群 负载均衡 开源大数据 zookeeper 数据存储 推荐系统

如何使用Kafka Connect实现同步RDS binlog数据

本文介绍如何在E-MapReduce上使用Kafka Connect实现同步RDS binlog数据

架构 分布式系统与计算 RDS 数据库 开源 配置 集群 Image 同步 e-mapreduce Server binlog 流计算 kafka 流式系统

开源大数据周刊-第84期

资讯 [神策数据宣布获4400万美元融资](http://www.cbdio.com/BigData/2018-04/12/content_5702056.htm)4月11日,神策数据 C 轮融资发布会在北京举行。

大数据 hbase hadoop Apache 集群 数据分析 开源大数据 e-mapreduce Hive 存储 海量数据

开源大数据周刊-第85期

资讯 美国公布长达35页的《2016-2045年新兴科技趋势报告》, Hadoop社区最新动态

大数据 hbase hadoop Apache 集群 数据分析 spark 开源大数据 e-mapreduce Hive 存储 海量数据

开源大数据周刊-第83期

资讯 最高法院就Microsoft云计算案的法律问题开展口辩论本案对Microsoft的裁决,可能将会要求位于美国的企业提交其存储在国外服务器上的美国执法数据。在这种情况下,位于美国的企业可能将无法为国外提供许多云计算服务。

大数据 机器学习 hadoop Apache 消息中间件 spark 开源大数据 磁盘 Mapreduce

开源大数据周刊-第82期

总理政府工作报告:加强大数据发展和新一代人工智能研发应用。即将发布的 JDK 10 有 109 项新特性,你喜欢哪些?微软宣布在机器翻译方面取得突破,中翻英可达人类水平。推特爆款:谷歌大脑工程师的深度强化学习劝退文。

深度学习 大数据 算法 数据库 人工智能 测试 开源大数据 google service 存储

Step by step,学习EMR集群的fair类型资源池

集群越大,跑的业务越多,越需要资源池管理。资源调度是yarn的核心。 EMR现在支持在业务视角操作yarn资源池了,资源池文档介绍了如何...

大数据 hadoop 配置 集群 BY EMR yarn 大数据分析 资源管理 fair

hive在E-MapReduce集群的实践(二)集群hive参数优化

本文介绍一些常见的集群跑hive作业参数优化,可以根据业务需要来使用。 提高hdfs性能 修改hdfs-site,注意重启hdfs服务 dfs.client.read.shortcircuit=true //直读 d...

大数据 性能优化 性能 集群 数据分析 e-mapreduce Hive optimize

开源大数据周刊-第81期

资讯 2018年的5个人工智能趋势 在2018年人工智能会有什么进展?下面是我们观察到的:期待机器学习在方法、理解和教育方面会取得实质...

python 深度学习 hdfs 性能 数据处理 人工智能 集群 开源大数据 CPU 流数据

开源大数据周刊-第80期

奇虎360正式开源其高性能KV存储平台Zeppelin,Zeppelin 是奇虎 360 开源的一个高性能,高可用的分布式 Key-Valu...

深度学习 分布式 大数据 机器学习 hadoop 函数 高可用 人工智能 数据流 集群 spark 开源大数据 Hive kafka 区块链

开源大数据周刊-第79期

资讯 警惕大数据成了互联网的“PX项目” 新年伊始 BAT 三家关于数据安全的新闻就成功的吸引了公众的目光,也引发了公众对于大公司收...

深度学习 分布式 大数据 安全 算法 服务器 hadoop 加密 人工智能 数据流 数据安全 容器 spark 开源大数据

开源大数据周刊-第78期

新功能预告:EMR Hadoop集群将增加Flink组件,版本1.4.0;EMR Kafka集群将增加Schema Registry和Res...

分布式 大数据 算法 hadoop 性能 日志 Apache 人工智能 集群 数据安全 开源大数据 分布式计算 流计算 流数据

开源大数据周刊-第77期

资讯 锤炼视频大数据时代的“火眼金睛” 我们身处一个大数据的时代,视频数据的爆炸性增长是这个时代的重要特征之一。如何让计算机看懂视频...

分布式 大数据 安全 算法 互联网 人工智能 集群 开源大数据

开源大数据周刊-第76期

本期周刊包括开源大数据核心组件Hadoop和Impala的最新消息,以及HBase、Kafka、TensorFlow等主流开源组件的实践分享...

分布式 大数据 安全 架构 hbase hadoop Apache 安全平台 spark 开源大数据 TensorFlow kafka impala

开源大数据周刊-第74期

资讯 大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。 百度开源高性能 Python 分布式计算框架 Bigflo...

云栖社区 深度学习 分布式 大数据 架构 算法 分布式系统与计算 storm 性能 SQL Apache 开源大数据 分布式计算 google Hive

开源大数据周刊-第73期

资讯 国家公布人工智能四大平台 AI的春天到了? 日前,科技部召开新一代人工智能发展规划暨重大科技项目启动会,并公布首批国家新一代人工智能开放创新平台名单,标志着新一代人工智能发展规划和重大科技项目进入全面启动实施阶段。

云栖社区 数据存储与数据库 互联网产品及应用 深度学习 大数据 HTTPS 云栖大会 http 互联网 人工智能 AlphaGo aliyun 开源大数据 facebook 海量数据

开源大数据周刊-第71期

资讯 我国建成首个国家地质大数据平台“地质云”国土资源部中国地质调查局11月6日发布了我国首个国家地质大数据共享服务平台“地质云”。这也是我国首次将国家核心地质数据库面向社会全领域公开共享,并提供地质信息一站式云端共享服务。

分布式 大数据 hadoop Apache http 互联网 spark 开源大数据 e-mapreduce 身份认证 Blog TensorFlow kerberos Sentry

开源大数据周刊-第70期

资讯: 推动云基础设施创新,英特尔与阿里云的“软硬合唱” 对于一家云服务厂商来说,实现软件、服务与硬件基础设施的完美整合,是在激烈市...

云栖社区 深度学习 分布式 大数据 阿里云 hadoop HTTPS Apache 基础设施 阿里巴巴 容器 spark 开源大数据 云服务

开源大数据周刊-第69期

资讯: 阿里巴巴成立达摩院,三年1000亿旨在创造颠覆性基础技术 10 月 11 日,2017 杭州·云栖大会开幕。会上,阿里巴巴集...

云栖社区 分布式 大数据 阿里云 hadoop HTTPS 云栖大会 Apache 阿里巴巴 数据仓库 开源大数据 KV存储 kafka kylin 神经网络

开源大数据周刊-第68期

资讯: 2020年我国大数据产业将破万亿 近日,《2017中国大数据产业发展白皮书》发布。《每日经济新闻》记者对照工信部及各地出台的...

云栖社区 大数据 阿里云 hadoop HTTPS http spark 开源大数据 磁盘

5
GO