1. 云栖社区>
  2. 全部标签>
  3. #e-mapreduce#
e-mapreduce

#e-mapreduce#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 |

开源大数据周刊-第57期

ECM功能上线北京region,用户可以通过EMR-3.2.0版本创建新集群体验,ECM提供组件的配置修改/起停等操作

深度学习 大数据 阿里云 机器学习 云计算 hbase hadoop 性能 HTTPS Apache http spark 开源大数据 e-mapreduce

搭建Gateway向E-MapReduce集群提交作业

搭建Gateway向E-MapReduce集群提交作业

java jvm hadoop openjdk 安全组 集群 spark e-mapreduce EMR Hive input Gateway

开源大数据周刊-第54期

阿里云E-Mapreduce实践 EMR集群上capacity scheduler的ACL实现 本文介绍了capacity scheduler的设置和其中需要注意的问题,并结合EMR集群做了实际操作实验。

深度学习 大数据 安全 数据可视化 阿里云 HTTPS Apache http 用户体验 集群 钉钉 aliyun 开源大数据 e-mapreduce html

一个助Hadoop集群数据快速上云工具

当前业界有很多公司是以Hadoop技术构建数据中心,所以本文将探讨如何快速的将Hadoop文件系统(HDFS)上的数据迁移到云上。

OSS hdfs hadoop 集群 数据迁移 e-mapreduce

开源大数据周刊-第53期

HBase Phoenix助力海量数据实时分析、HBaseCon West 2017 大会、Spark在ETL中的应用、HBase在阿里搜索团队的应用实践、开源大数据查询分析引擎及Kudu

大数据 阿里云 hbase etl 性能 HTTPS Apache http 阿里巴巴 工单 钉钉 aliyun 开源大数据 e-mapreduce 开发环境

E-MapReduce启动/停止HBase集群

E-MapReduce的HBase集群启动/停止方式

hbase hdfs LOG cluster 集群 e-mapreduce 脚本 Bash

开源大数据周刊-第52期

利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制 本文结合EMR集群,讲述了如何利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源quota限制与管控。

云栖社区 编程语言 数据存储与数据库 深度学习 分布式 分布式系统与计算 实时系统 hbase hdfs hadoop spark e-mapreduce EMR Hive yarn

5月9日云栖精选夜读:不断变化下的阿里云:2017阿里云产品和解决方案全向图(5月版)

近四个月,阿里云变化飞快,那反映在产品上是什么样的?5月份,云栖社区又拿出一张阿里云产品全向图,供大家端倪变化。

云栖社区 大数据 java 阿里云 云服务器 人工智能 安全组 集群 解决方案 e-mapreduce

E-MapReduce集群中HDFS服务集成Kerberos

本文介绍在E-MapReduce集群中HDFS服务集成Kerberos。

hdfs hadoop 配置 集群 e-mapreduce Server xml EMR Security kerberos

E-MapReduce集群启停HDFS/YARN服务

该文章意在帮助大家,在E-MapReduce环境中停止启动yarn,hdfs服务。

云栖社区 大数据 分布式系统与计算 hdfs hadoop shell cluster 集群 e-mapreduce 脚本 EMR Hive awk Bash

开源大数据周刊-第51期

阿里云E-Mapreduce动态 E-MapReduce张北可用区上线服务。 E-MapReduce调度功能强化,支持分钟、小时、天、周、月,多种时间维度的调度。 资讯 Hadoop没有消亡,它是大数据的未来 有人认为 Hadoop 正在失败,但硅谷数据管理公司 Hortonworks 的总经理 Vamsi K. Chemitiganti 并不这么看,为了反驳此前一篇文章《为什么 Hadoop 正在消亡?(Why Hadoop is Failing)》的观点,他在自己的博客上写了一篇论述自己看法的文章,他认为达尔文式的开源生态系统正在确保 Hadoop 成为稳固和成熟的技术平台。

大数据 阿里云 hadoop HTTPS http 高可用 互联网 人工智能 消息中间件 钉钉 开源大数据 e-mapreduce 存储过程 存储

存储与计算分离:OSS构建表 + 计算引擎对接

看到标题,可能有用户要问:OSS不是用来存图片、视频、及文件的吗,还可以在上面建表、数仓?计算效率和经济性表现怎么样? 本文先给出基本结论: OSS是什么? 对象存储(Object Storage Service,简称OSS)是基于阿里云飞天分布式系统的海量、安全和高可靠的云存储服务,是一种面向互联网的大规模、通用存储,提供RESTful API,具备容量和处理的弹性扩展能力。

大数据 阿里云 OSS HTTPS SLS aliyun e-mapreduce 存储 数据存储 Parquet MaxCompute loghub

4月21日云栖精选夜读:【校园头条】第1期:找实习、找工作时,让你脱颖而出的秘籍

你还在为寻找一个工作而苦苦追求吗?你想在面试的时候能脱颖而出吗?现在小编为大家准备了找工作的秘籍,这个秘籍一般人我可是不会告诉他的呢!要知道有时候你与工作的距离仅仅只有一个秘籍的差距,看完这个秘籍也许说不定你就会正式走进程序员的美好世界,成为一名真正的程序员呢~

java 阿里云 mysql RDS 云盾 spring 配置 云翼 开源大数据 openapi e-mapreduce

开源大数据周刊-第48期

资讯 云数据库厂商Snowflake获一亿美元融资,Iconiq领投 Snowflake Computing,是一家提供数据存储和查询服务的云数据库公司,以方便分析师用BI工具进行分析。该公司近日宣布获得一亿美元的融资。

大数据 算法 阿里云 hadoop Apache http 互联网 人工智能 钉钉 spark 开源大数据 e-mapreduce kylin 互联网金融

开源深度学习库BigDL在阿里云E-MapReduce上的实践

近些年来机器学习中的子领域深度学习成为一个热门的话题。本文要介绍Intel开源的深度学习框架BigDL,它也是在Spark上的一个算法库,提供了全面的深度学习算法支持,包括数值计算(Tensor)和高阶神经网络等。

深度学习 算法 阿里云

4月5日云栖精选夜读:Java如何进行垃圾对象回收?小秘书为你揭开谜底

由于JVM中垃圾收集器的存在,使得Java程序员在开发过程中可以不用关心对象创建时的内存分配以及释放过程,当内存不足时,JVM便会自动开启垃圾收集线程,进行垃圾对象的回收。 那么垃圾回收线程到底是什么时候触发,并如何实现垃圾回收的呢?在今天的夜读中,小秘书将用源码分析的方式为你揭开谜底。

深度学习 大数据 java jvm 阿里云 程序员 线程 源码 中间件 数据挖掘 e-mapreduce 数据恢复

E-MapReduce中引导操作安装使用Kylin

目前E-MapReduce的开源组件还未包含Kylin,下面介绍一种通过创建集群时设置的引导操作来完成集群上Kylin的部署。

OSS hbase hadoop HTTPS http 集群 e-mapreduce 脚本 Hive kylin

开源大数据周刊-第46期

阿里云E-MapReduce实践 云HBase建设之开篇 阿里云云HBase团队在2月份推出了云HBase产品,此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化,本系列将会为用户详细介绍这些点。

分布式 大数据 安全 架构 阿里云 hbase hadoop 性能 HTTPS Apache http spark 开源大数据 e-mapreduce

开源大数据周刊-第44期

阿里云E-MapReduce实践 E-MapReduce的HBase集群间迁移 E-MapReduce提供HBase服务,本文介绍了几种HBase集群间迁移的方法。 E-MapReduce中Spark 2.x读写MaxCompute数据 最新的aliyun-emapreduce-sdk将MaxCompute数据以DataSource的方式接入Spark 2.x,用户可以使用类似Spark 2.x中读写json/parquet/csv的方式来访问MaxCompute。

云栖社区 大数据 分布式系统与计算 性能优化 阿里云 hbase hadoop HTTPS http 数据仓库 集群 spark 开源大数据 e-mapreduce Hive

开源大数据周刊-第43期

阿里云E-MapReduce动态 E-MapReduce发布新版本,可以在控制台管理meta表结构。 资讯 人脸识别,要靠哪些技术支撑,是否会泄露个人隐私? 本文介绍人脸识别用到哪些技术,讨论如何保护用户隐私 一图看懂AI阵营:学习AI 站错队可导致自取灭亡 本文介绍现在AI技术阵营,对AI各流派进行细分,梳理了17种方法,并用 图直观展现。

深度学习 大数据 阿里云 hbase HTTPS http 钉钉 开源大数据 e-mapreduce 分布式计算 物联网 分布式系统 html zookeeper 云数据库RDS

4
GO