1. 云栖社区>
  2. 全部标签>
  3. #e-mapreduce#
e-mapreduce

#e-mapreduce#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

使用Ranger对Hive数据进行脱敏

Ranger支持对Hive数据的脱敏处理(Data Masking),它对`select`的返回结果进行脱敏处理,对用户屏蔽敏感信息。

配置 e-mapreduce Hive test Ranger Data-Masking

轻松上云系列之一:本地数据迁移上云

本文档围绕如何将您的本地数据迁移到阿里云,提供了多个场景的迁移实践方案。12月27日新增:物理机平台、VMWare、Xen/KVM/Hyper-V迁移至阿里云ECS

OSS RDS ECS 数据迁移 迁移 e-mapreduce Elasticsearch 云解析 MaxCompute AnalyticDB dts 本地数据 ADAM 在线迁移服务

轻松上云系列之三:阿里云产品间数据迁移

本文档描述如何进行阿里云上跨产品的数据迁移,为您提供了多个场景的实践方案。12月27日新增阿里云ECS实例之间的数据迁移。

redis OSS RDS ECS 数据迁移 迁移 e-mapreduce Elasticsearch 云解析 MaxCompute AnalyticDB dts 本地数据 ADAM 在线迁移服务

轻松上云系列之二:其他云数据迁移至阿里云

本文档围绕如何将您其他云厂商上的数据迁移到阿里云,提供了多个场景的实践方案。12月27日新增各大云厂商数据迁移至阿里云ECS系列。

OSS RDS ECS 数据迁移 迁移 e-mapreduce google 云解析 Azure dts 在线迁移服务 云数据迁移

Spark中的内存管理(一)

Spark应用经常遇到的问题很多都是内存问题,本文对Driver和Executor的内存管理机制进行了相关介绍。

内存管理 spark e-mapreduce Driver memory MemoryMangement

Spark中的资源调度

本文对Spark的资源调度的进行了介绍,涉及到4个维度的调度,包括SparkApplication/pool/TaskSetManager/Task。

算法 SQL 配置 测试 spark e-mapreduce xml EMR scheduler

Apache Spark Meetup China 第1期 最全资料下载

活动时间:2018年12月16日13:30-17:00 活动地点:杭州市余杭区文一西路998号未来科技城海创园4幢801C 主办单位:阿里云、袋鼠云、云栖社区 主题介绍: 主题一、Spark优化实践-13:30 - 14:30阿里云E-MapReduce-王道远介绍阿里云EMR中Spark计算引擎所包含的一系列额外优化工作,包括SmartShuffle、file skip index等。

云栖社区 大数据 Apache 模块 袋鼠云 spark 对象存储 e-mapreduce

阿里云实战第一期之轻松上云系列文章

随着大数据、云计算的到来并逐渐普及,很多企业从要不要上云的转为关注业务系统和数据如何上云的问题。阿里云针对不同规模不同类型的企业,提供丰富的迁移解决方案,满足各种迁移目的的需求。

redis OSS RDS ECS 数据迁移 迁移 e-mapreduce Elasticsearch 云解析 MaxCompute AnalyticDB dts 本地数据 ADAM 在线迁移服务

SparkSQL Catalyst解析

Catalyst Optimizer是SparkSQL的核心组件(查询优化器),它负责将SQL语句转换成物理执行计划,Catalyst的优劣决定了SQL执行的性能。

e-mapreduce 查询优化 Other bigdecimal CBO sparksql catalyst RBO

初学Spark

介绍大数据处理引擎Spark的特点,以及它的技术栈

大数据 hdfs 模块 数据处理 reduce 内存管理 spark DataFrame MLlib e-mapreduce Hive Mapreduce 流计算

HiveServer2集成LDAP做用户认证

HiveServer2支持多种认证方式,通过`hive.server2.authentication`参数来设置,包括`nosasl, none, ldap, kerberos, pam, custom` 本文介绍如何在E-MapReduce中使用LDAP配置HiveServer的认证。

配置 集群 e-mapreduce JDBC Hive Transaction 认证 ldap HiveServer2

【袋鼠云技术团队沙龙第12期】大数据平台实践

双十一成交额2135亿,新的技术力量刚刚开始!今年双11的大数据平台实时计算处理能力已经相当于一秒钟内读完120万本2018年新版的《新华字典》,技术与业务的共振正把我们的生活变得更加地便携与高效。越来越多的企业也逐渐采用大数据的技术架构来进行企业IT架构的升级。

大数据 架构 hadoop 数据仓库 袋鼠云 e-mapreduce 离线计算 big data 海量数据 大数据平台 数据智能 数栈

Hadoop黑客赎金事件解读及防范

年关将至,Mongodb数据丢失的事情还在眼前,数以千计的Mongodb数据库已经被删除或者被黑客勒索,就在最近一段时间,黑客也在攻击Hadoop,有不少Hadoop集群的数据全部丢失,这些数据甚至有上TB的数据量,对企业造成了巨大的损失。本文讲述这个问题及后续的预防方案。

安全 MongoDB hdfs hadoop HTTPS 安全组 集群 数据安全 spark aliyun e-mapreduce 数据备份 黑客

8
GO