1. 云栖社区>
  2. 全部标签>
  3. #e-mapreduce#
e-mapreduce

#e-mapreduce#

已有0人关注此标签

内容分类:
博客 | 问答 | 课程 |

E-MapReduce中引导操作安装使用Kylin

目前E-MapReduce的开源组件还未包含Kylin,下面介绍一种通过创建集群时设置的引导操作来完成集群上Kylin的部署。

OSS hbase hadoop HTTPS http 集群 e-mapreduce 脚本 Hive kylin

开源大数据周刊-第46期

阿里云E-MapReduce实践 云HBase建设之开篇 阿里云云HBase团队在2月份推出了云HBase产品,此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化,本系列将会为用户详细介绍这些点。

分布式 大数据 安全 架构 阿里云 hbase hadoop 性能 HTTPS Apache http spark 开源大数据 e-mapreduce

开源大数据周刊-第44期

阿里云E-MapReduce实践 E-MapReduce的HBase集群间迁移 E-MapReduce提供HBase服务,本文介绍了几种HBase集群间迁移的方法。 E-MapReduce中Spark 2.x读写MaxCompute数据 最新的aliyun-emapreduce-sdk将MaxCompute数据以DataSource的方式接入Spark 2.x,用户可以使用类似Spark 2.x中读写json/parquet/csv的方式来访问MaxCompute。

云栖社区 大数据 分布式系统与计算 性能优化 阿里云 hbase hadoop HTTPS http 数据仓库 集群 spark 开源大数据 e-mapreduce Hive

开源大数据周刊-第43期

阿里云E-MapReduce动态 E-MapReduce发布新版本,可以在控制台管理meta表结构。 资讯 人脸识别,要靠哪些技术支撑,是否会泄露个人隐私? 本文介绍人脸识别用到哪些技术,讨论如何保护用户隐私 一图看懂AI阵营:学习AI 站错队可导致自取灭亡 本文介绍现在AI技术阵营,对AI各流派进行细分,梳理了17种方法,并用 图直观展现。

深度学习 大数据 阿里云 hbase HTTPS http 钉钉 开源大数据 e-mapreduce 分布式计算 物联网 分布式系统 html zookeeper 云数据库RDS

E-MapReduce中Spark 2.x读写MaxCompute数据

最新的`aliyun-emapreduce-sdk`将`MaxCompute`数据以`DataSource`的方式接入Spark 2.x,用户可以使用类似Spark 2.x中读写`json/parquet/csv`的方式来访问MaxCompute.

阿里云 SQL Json http odps spark aliyun DataFrame API e-mapreduce read MaxCompute

E-MapReduce的HBase集群间迁移

E-MapReduce提供HBase服务,本文介绍了几种HBase集群间迁移的方法

OSS hbase hdfs hadoop Apache path 集群 数据迁移 迁移 e-mapreduce Driver Create Mapreduce

开源大数据周刊-第42期

阿里云E-MapReduce动态 阿里云HBase支持PB级别的分布式数据库即将开始公测 资讯 云时代的大数据存储-云HBase 纵观数据库发展的几十年,从网状数据库、层次数据库到RDBMS数据库,在最近几年的NewSQL的兴起,加上开源的运动,再加上云的特性,可以说是日新月异。

深度学习 大数据 阿里云 hbase HTTPS http 数据库 互联网 钉钉 aliyun 开源大数据 e-mapreduce 离线分析 分布式数据库 存储

开源大数据周刊-第41期

云数据库HBase公测开始 EMR产品价格全面优惠,价格和ECS自建一致

大数据 分布式系统与计算 阿里云 hbase Oracle 性能 HTTPS Apache http 基础设施 集群 钉钉 spark 开源大数据 e-mapreduce

双研究员带你了解数据库技术现状,及阿里云为什么要推出HBase

纵观整个排行榜,RDBMS牢牢占据了前3席,各个数据库的热度亦一览无余。然而,在这背后,大数据时代下,数据库技术究竟发生了什么样的变化和发展?2月21日,阿里巴巴中间件技术部负责人蒋江伟与阿里巴巴 ApsaraDB 负责人余锋将为你揭开!

RDS e-mapreduce

开源大数据周刊-第40期

阿里云HBase支持PB级别的分布式数据库即将开始公测

大数据 分布式系统与计算 阿里云 hbase Oracle 性能 HTTPS Apache http 基础设施 集群 钉钉 spark 开源大数据 e-mapreduce

用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)

尽管数据科学家经常通过分布式云计算来处理数据,但是即使在一般的笔记本电脑上,只要给出足够的内存,Spark也可以工作正常(在这篇文章中,我使用2016年MacBook Pro / 16GB内存,分配给Spark 8GB内存)。

大数据 e-mapreduce 分析型数据库

基于Alluxio系统的Spark DataFrame高效存储管理技术

在这篇文章中,我们将介绍如何使用Alluxio帮助Spark变得更高效,具体地,我们将展示如何使用Alluxio高效存储Spark DataFrame。

大数据 e-mapreduce

开源大数据周刊-第39期

阿里云E-Mapreduce动态 E-MapReduce 3.0.0镜像版本(已发布) 支持Spark 2.0+版本 支持提供统一的Hive外部Meta数据 HBase 支持PB级别的分布式数据库年后开始公测 E-MapReduce 全体成员祝大家 新年快乐! 资讯 Hadoop黑客赎金事件解读及防范 年关将至,Mongodb数据丢失的事情还在眼前,数以千计的Mongodb数据库已经被删除或者被黑客勒索,就在最近一段时间,黑客也在攻击Hadoop,有不少Hadoop集群的数据全部丢失,这些数据甚至有上TB的数据量,对企业造成了巨大的损失。

大数据 MongoDB 阿里云 hbase hadoop HTTPS Apache 钉钉 aliyun 开源大数据 e-mapreduce 分布式数据库

自定义LOG投递OSS数据Partition,优化你的计算

数据划分Partition OSS数据存储具有高可靠、低成本等优点,是海量数据存储的最佳选择之一,尤其适用于半结构化的日志存储,并可以结合E-MapReduce(使用Hive、Impala等计算引擎)通过schema-on-read方式加载数据做查询分析。

阿里云 OSS HTTPS 日志 日志服务 LOG aliyun e-mapreduce string Hive html 存储 分区 日志投递

Hadoop黑客赎金事件解读及防范

年关将至,Mongodb数据丢失的事情还在眼前,数以千计的Mongodb数据库已经被删除或者被黑客勒索,就在最近一段时间,黑客也在攻击Hadoop,有不少Hadoop集群的数据全部丢失,这些数据甚至有上TB的数据量,对企业造成了巨大的损失。本文讲述这个问题及后续的预防方案。

安全 MongoDB hdfs hadoop HTTPS 安全组 集群 数据安全 spark aliyun e-mapreduce 数据备份 黑客

开源大数据周刊-第38期

本期关注:梨视频基于阿里云E-MapReduce搭建视频推荐系统的实践,Apache Eagle成为新的顶级项目,英特尔开源的分布式深度学习库BigDL,Hadoop 3.0新功能测评

深度学习 分布式 大数据 阿里云 性能 HTTPS Apache http 镜像 集群 钉钉 解决方案 开源大数据 e-mapreduce 大数据分析

开源大数据周刊-第37期

[阿里云E-MapReduce动态] E-MapReduce 2.3.1镜像主版本发布基础镜像CentOS 6.5内核版本升级到2.6.32-642;并支持job failover 资讯 2017年数据领域的八大发展趋势 在2017年数据社区将会有大量的机会出现,并伴随一些危机性的挑战,

分布式 大数据 阿里云 云计算 hbase hadoop HTTPS Apache http spark 开源大数据 e-mapreduce Elasticsearch flink

梨视频:基于阿里云E-MapReduce搭建视频推荐系统的实践

梨视频由前澎湃新闻掌门人邱兵创立。 在上线之前,它就获得了黎瑞刚华人文化近1亿美元投资,旗下《微辣》栏目总播放量已经超过4亿,并在上线1个月后获得“年度视频新媒体”大奖。 这样一款脱胎于传统媒体的创业型短视频软件,在视频领域异军突起,不仅让内人士在感叹梨视频内容生产力之强大的同时,也诧异于是谁在

大数据 阿里云 日志 模块 数据处理 数据流 集群 排序 数据分析 spark e-mapreduce EMR 云平台 推荐系统 梨视频

梨视频:基于阿里云E-MapReduce搭建视频推荐系统的实践

深度解答:梨视频如何基于阿里云快速搭建一个套推荐系统?

阿里云 日志 模块 数据处理 数据流 集群 排序 spark e-mapreduce EMR 云平台 数据中心 存储 推荐系统

Spark入门必学:预测泰坦尼克号上的生还情况

第一次听闻Spark是2013年年末,当时笔者对Scala(Spark的编程语言)感兴趣。一段时间之后做了一个有趣的数据科学项目,试图预测泰坦尼克号上的生还情况(Kaggle竞赛项目,通过使用机器学习预测泰坦尼克号上哪些乘客具备更高的生还可能性)。通过该项目可以更深入地理解Spark的概念和编程方式

大数据 RDS e-mapreduce

3
GO