1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. H>
  5. hive 更新数据

当前主题:hive 更新数据

hive 更新数据相关的博客

查看更多 写博客

EMR Spark Relational Cache的执行计划重写

背景 EMR Spark提供的Relational Cache功能,可以通过对数据模型进行预计算和高效地存储,加速Spark SQL,为客户实现利用Spark SQL对海量数据进行即时查询的目的。Relational Cache的工作原理类似物化视图,在用户

阅读全文

使用EMR Spark Relational Cache跨集群同步数据

Relational Cache相关文章链接: 使用Relational Cache加速EMR Spark数据分析 背景 Relational Cache是EMR Spark支持的一个重要特性,主要通过对数据进行预组织和预计算加速数据分析,提供了类似传统数据

阅读全文

使用EMR Spark Relational Cache跨集群同步数据

Relational Cache相关文章链接: 使用Relational Cache加速EMR Spark数据分析 背景 Relational Cache是EMR Spark支持的一个重要特性,主要通过对数据进行预组织和预计算加速数据分析,提供了类似传统数据

阅读全文

袋鼠云数据中台专栏V2.0 | 数据中台之数据集成

# 关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型?袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华

阅读全文

Impala——2.架构

标签(空格分隔): Impala Impala Server的组件 Impala服务器是分布式,大规模并行处理(MPP)数据库引擎。它由不同的在群集中的特定主机上运行的守护程序进程组成。 Impala守护进程 核心Impala组件是一个守护进程,它通过imp

阅读全文

Phoenix映射HBase时间戳的一种实现

Phoenix映射HBase时间戳的一种实现 官方实现 Apache Phoenix从4.6版本开始,提供了ROW_TIMESTAMP标签,来映射HBase的原生时间戳。但使用起来有以下限制: 只有主键中的TIME, DATE, TIMESTAMP, BIG

阅读全文

Phoenix在2345的实践

本文介绍Phoenix在2345公司的实践,主要是实时查询平台的背景、难点、Phoenix解决的问题、Phoenix-Sql的优化以及Phoenix与实时数仓的融合思路。具体内容如下: 实时数据查询时客服系统中一个很重要的模块,提供全公司所有主要产品的数据的

阅读全文

零基础学习大数据的路线和方向

大数据本质是:数据挖掘深度和应用广度的结合。对海量数据进行有效的分析和处理,而不单单是数据量大就叫大数据。 随着人们对大数据的认识越来越深入,很多零基础人员看到了大数据的未来,也想学习这个前沿技术,踏入时代的领军行业。但是一直没有一个很好的思路和方向,本文将

阅读全文

hive 更新数据相关问答

查看更多 提问题

【精品问答合集】Hbase热门问答

hbase 大量写入很慢 https://yq.aliyun.com/ask/50074 发现hbase文件大规模的丢失了 https://yq.aliyun.com/ask/46584 hbase启动脚本start-hbase的疑问 htt

阅读全文

Kylin无法更新coprocessor

Kylin创建好cube后执行查询语句报错如下: ```org.apache.hadoop.hbase.exceptions.UnknownProtocolException: org.apache.hadoop.hbase.exceptions.Unkno

阅读全文

[@小川游鱼][¥20]大数据环境中,根据一张表(idList)的数据去修改另一张表的数据(id_label),有没有比较高效的方法?

现在有一个类似的需求,在cloudera环境中,是根据一个表的数据去更新另一个表的对应的行的某个字段。 如在hive中有: 表A(字段有一个,为id),对应数据为(1,2); 表B(字段有两个,分别为 id:label),对应数据为(1:N,

阅读全文

请问Flink里面怎么做到设置初始状态?

请问Flink里面怎么做到设置初始状态? 比如说我要新加一个针对流事件的指标统计,历史数据落到hive,那么怎么基于一个Hive历史数据的基础上做指标值更新。Flink支持批处理+流处理吗?

阅读全文

MaxCompute百问集锦(持续更新20171011)

![fd7e5655f16e03d1198dc492cead625bbfb9af58_jpeg](https://yqfile.alicdn.com/ee78085f2e6a147c3fffcc95038b11a73c609bf1.jpeg) 大数据计算服务

阅读全文

阿里云E-MR执行作业,怎么传入时间参数

我想用阿里云E-MR做ETL,用HIVE中的分区表,以ymd分区,每天更新分区中的数据,如 insert into target_table partition (ymd = 20160425) select * from source_table

阅读全文