发布时间:2019-05-29 22:06:57 浏览:1316 回帖 :0
标签(空格分隔): Impala Impala是什么 官方论文 Impala对存储在HDFS,HBase的Apache Hadoop数据和存储在Amazon S3上的数据提供快速,交互式的SQL查...
发布时间:2019-02-18 11:27:26 浏览:1348 回帖 :0
标签(空格分隔): Spark [toc] intro dataset和operation Spark对数据集合的基本抽象叫做Dataset。Dataset可以从文件直接创建,也可以从其他...
发布时间:2019-02-12 09:35:19 浏览:2519 回帖 :0
[toc] 概念 按照官网翻译,Hive是一个使用SQL管理和使用基于分布式存储的数据集的数据仓库工具软件。注意形容词知道了几个特点: 使用SQL 数据仓库、管理数据集(表) 基于Hadoop ...
发布时间:2017-08-31 13:22:11 浏览:1992 回帖 :0
原文:http://hadoop.apache.org/docs/r2.6.4/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html 概览 ...
发布时间:2017-01-27 19:02:44 浏览:9216 回帖 :0
# 一起爪哇Java 8(三)——好用的Stream 标签(空格分隔): Java --- [toc] --- ## Stream组成 在传统Java编程,或者说是类C...
发布时间:2016-12-14 09:27:49 浏览:8893 回帖 :1
地点:北京ArchSummit会场 人物:行业内的讲师&参会人员 ## 总体趋势 ArchSummit全球架构师峰会,在初冬的北京举行。我们一伙人奔着雾霾和技术前沿的理想追逐而去。我先聊聊这...
opensearch的search和scroll接口,召回的文档数量上限是5000,但是我希望能通过搜索引擎list全部的召回,这个怎么实现