阿里云E-MapReduce 关注
手机版

开源大数据周刊-第67期

资讯: Google发布了一个新的Tensorflow物体识别API 做图像识别有很多不同的途径。谷歌最近发布了一个使用Tensorfl...

分布式 大数据 架构 阿里云 HTTPS http 人工智能 spark 开源大数据 分布式计算 OLAP Elasticsearch 图像识别 多维分析

开源大数据周刊-第66期

资讯: Python超过R,成为数据科学和机器学习的最常用语言 近期,数据挖掘资讯网站KDnuggets开展了一项调查,问题是“2016...

云栖社区 编程语言 数据存储与数据库 互联网产品及应用 python 大数据 阿里云 hbase HTTPS Apache http 互联网 开源大数据 分布式系统 存储

开源大数据周刊-第65期

EMR Task计算节点发布,更加灵活的调整计算能力;hbase集群在线无感知扩容磁盘。

云栖社区 数据存储与数据库 linux 互联网产品及应用 大数据 阿里云 HTTPS Apache 阿里技术协会 http 高可用 互联网 SaaS 开源大数据 自动化测试

开源大数据周刊-第63期

EMR资讯: 从EMR-3.4.1版本开始本地盘集群。EMR大数据机型整体方案发布,帮助用户更好的使用大数据机型,从数据可靠性,服务可用性...

云栖社区 数据存储与数据库 系统研发与运维 linux 互联网产品及应用 分布式 大数据 分布式系统与计算 监控 阿里云 HTTPS 阿里技术协会 http 人工智能 开源大数据

E-MapReduce HDFS文件快速CRC校验工具介绍

在大数据应用场景下经常有数据文件的迁移工作,如果保障迁移之后数据的完整性是一个很常见的问题。本文就给大家介绍一下在大数据场景下,如何用工具快速对比文件。

大数据 阿里云 OSS hdfs hadoop 云存储 HASH e-mapreduce 分布式文件系统 file list input

开源大数据周刊-第62期

EMR资讯: EMR上线新地域:德国法兰克福 资讯 AI 大师云集!CCAI 2017 中国人工智能大会盛大开幕 7 月 22 - 23...

云栖社区 深度学习 分布式 大数据 阿里云 hbase HTTPS 人工智能 开源 阿里巴巴 spark 开源大数据 e-mapreduce EMR AI

在E-MapReduce集群内运行Spark GraphX作业

Spark GraphX是一个比较流行的图计算框架,如果你使用了阿里云的E-MapReduce服务,可以很方便的运行图计算的作业。 下面以PageRank为例,看看如何运行GraphX作业

阿里云 hadoop 集群 spark scala e-mapreduce

开源大数据周刊-第61期

EMR资讯: 在北京举行的Strata Data 会议上,EMR团队的木艮进行了《Hadoop遇到云上对象存储——实现原理、陷阱和性能优化...

大数据 storm 性能优化 阿里云 hadoop 性能 HTTPS http 开源大数据 对象存储 EMR 数据同步

开源大数据周刊-第60期

本期周刊聚焦Spark新版本以及大数据行业最新的进展,在技术文章中推荐了微博和携程等互联网公司的大数据平台实践。

大数据 架构 监控 阿里云 hdfs hadoop HTTPS http 平台架构 spark 开源大数据

开源大数据周刊-第59期

资讯 2017年SaaS、Relational和大数据连接趋势 上周,Progress发布了一项调查,该调查显示,越来越多的企业采用...

大数据 阿里云 hbase HTTPS Apache http 互联网 spark 开源大数据 KV存储 企业应用 REST 数据类型

开源大数据周刊-第58期

阿里云E-Mapreduce动态: EMR即将在新的版本中支持本地盘机型,大幅降低集群的存储成本。 资讯 借助亚马逊AWS Sno...

分布式 大数据 架构 阿里云 HTTPS http 电商 spark 开源大数据 e-mapreduce 编程 数据存储

TCP的backlog导致的HBase超时问题排查

TCP的backlog导致的超时问题排查

linux 服务器 hbase HTTPS TCP e-mapreduce Server slb backlog

开源大数据周刊-第57期

ECM功能上线北京region,用户可以通过EMR-3.2.0版本创建新集群体验,ECM提供组件的配置修改/起停等操作

深度学习 大数据 阿里云 机器学习 云计算 hbase hadoop 性能 HTTPS Apache http spark 开源大数据 e-mapreduce

搭建Gateway向E-MapReduce集群提交作业

搭建Gateway向E-MapReduce集群提交作业

java jvm hadoop openjdk 安全组 集群 spark e-mapreduce EMR Hive input Gateway

开源大数据周刊-第56期

阿里云E-Mapreduce实践: 使用hadoop restful api实现对集群信息的统计 资讯 全球因Hadoop服务器配...

大数据 阿里云 服务器 云计算 hadoop 性能 HTTPS Apache http 互联网 阿里巴巴 配置 数据挖掘 开源大数据 EMR

使用hadoop restful api实现对集群信息的统计

本文根据hadoop/spark的RESTful API,实现了对集群基本信息的统计功能,包括HDFS文件系统、job情况、资源队列情况的统计。这些API只提供了基础的数据,具体的统计与分析,还需要基于这些基础数据做一些简单的开发。

hadoop Apache http 集群 API EMR type Mapreduce

开源大数据周刊-第55期

云HBase新增支持深圳、上海区域、支持超过2个节点及高配节点。

大数据 架构 阿里云 hbase hadoop HAWQ HTTPS http 数据库 互联网 人工智能 容器 弹性计算 aliyun 开源大数据

开源大数据周刊-第54期

阿里云E-Mapreduce实践 EMR集群上capacity scheduler的ACL实现 本文介绍了capacity sched...

深度学习 大数据 安全 数据可视化 阿里云 HTTPS Apache http 用户体验 集群 钉钉 aliyun 开源大数据 e-mapreduce html

开源大数据周刊-第53期

HBase Phoenix助力海量数据实时分析、HBaseCon West 2017 大会、Spark在ETL中的应用、HBase在阿里搜索...

大数据 阿里云 hbase etl 性能 HTTPS Apache http 阿里巴巴 工单 钉钉 aliyun 开源大数据 e-mapreduce 开发环境

HBase Phoenix助力海量数据实时分析

phoenix满足海量数据实时分析需求,通过建立索引在海量数据上查询少量数据,并且基本实时返回; 支持做一些复杂的SQL操作,包括join,...

架构 hbase SQL Apache 索引 JDBC index 海量数据 实时分析

E-MapReduce是构建于阿里云ECS弹性虚拟机之上,利用开源大数据生态系统,包括Hadoop和Spark,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。

管理员:
鱼跟猫
799
关注
12
成员
157
文章