尊渊 + 关注
大数据践行者,前阿里云大数据平台开发,前阿里集团VOC平台技术负责人,现网易考拉数据产品技术打杂

Impala——2.架构

发布时间:2019-06-03 22:18:34 浏览:663 评论 :0

标签(空格分隔): Impala Impala Server的组件 Impala服务器是分布式,大规模并行处理(MPP)数据库引擎。它由不同的在群集中的特定主机上运行的守护程序进程组成。 Impala守护进程 核心Impala组件是一个守护进程,它通过impalad进程在集群的每个DataNode上运行。

大数据 架构 hdfs hadoop 函数 SQL 高可用 数据库 数据仓库 集群 主机 负载均衡 JDBC Hive odbc

Impala——1.概述

发布时间:2019-05-29 22:06:57 浏览:503 评论 :0

标签(空格分隔): Impala Impala是什么 官方论文 Impala对存储在HDFS,HBase的Apache Hadoop数据和存储在Amazon S3上的数据提供快速,交互式的SQL查询。

分布式 大数据 hbase hdfs hadoop SQL Apache 数据库 集群 JDBC Hive odbc 并行查询 Mapreduce 存储

Spark SQL玩起来

发布时间:2019-03-26 15:26:17 浏览:8232 评论 :0

标签(空格分隔): Spark [toc] 前言 Spark SQL的介绍只包含官方文档的Getting Started、DataSource、Performance Tuning和Distributed SQL Engine部分。

大数据 SQL 配置 code spark DataFrame JDBC Hive schema read 数据类型

Spark初窥

发布时间:2019-02-18 11:27:26 浏览:996 评论 :0

标签(空格分隔): Spark [toc] intro dataset和operation Spark对数据集合的基本抽象叫做Dataset。Dataset可以从文件直接创建,也可以从其他dataset经过transform变换而来。

大数据 函数 reduce 集群 code spark string 磁盘 存储

Hive架构

发布时间:2019-02-12 09:35:19 浏览:1409 评论 :0

[toc] 概念 按照官网翻译,Hive是一个使用SQL管理和使用基于分布式存储的数据集的数据仓库工具软件。注意形容词知道了几个特点: 使用SQL 数据仓库、管理数据集(表) 基于Hadoop Hive的组件包括HCatalog和WebHCat。

分布式 架构 hdfs hadoop SQL 数据处理 数据仓库 Hive 分布式存储 Group Blog Mapreduce 存储 big data

YARN-Fair Scheduler

发布时间:2018-02-05 22:16:20 浏览:5223 评论 :0

大数据 配置 集群 容器

Java8 JVM参数解读

发布时间:2018-01-16 16:00:50 浏览:4935 评论 :1

java jvm 线程 Server

YARN-ResourceManager重启

发布时间:2017-11-23 11:42:10 浏览:1612 评论 :0

大数据 服务器 hadoop 配置 容器 Server session zookeeper 存储

上海QCon2017参会分享

发布时间:2017-11-08 16:21:57 浏览:1420 评论 :0

标签(空格分隔): QCon --- 10.17-10.19在上海度过了Qcon的三天。今年的Qcon主题非常的散,这也是近两年无论ArchSummit还是QCon的一个特点,基本涵盖了以互联网技术为主的所有领域。 我个人主要关注还是云计算、机器学习和大数据相关的话题,因此主要参与的topic也集中于此。本文就印象深刻的一些展开一点分享。 会场第一个关注的话题,是复旦危辉教

大数据 架构 算法 阿里技术协会 http 高可用 配置 集群 分布式系统 客服 QCon

YARN-Capacity Scheduler

发布时间:2017-08-31 13:22:11 浏览:1529 评论 :0

原文:http://hadoop.apache.org/docs/r2.6.4/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html 概览 CapacityScheduler被设计用来以一种操作友好的并且最大化吞吐和集群利用率的方式调度一个共享的、多租户集群从而可以支持运行Hadoop应用程序。

大数据 配置 集群

YARN-架构

发布时间:2017-04-26 13:02:14 浏览:2199 评论 :0

大数据 架构 监控 hadoop http 集群 容器 应用管理 插件 磁盘 Mapreduce

HDFS启动

发布时间:2017-04-18 17:07:14 浏览:3629 评论 :0

hdfs hadoop 日志 LOG 线程 Apache Server 脚本 string 存储

HDFS配额

发布时间:2017-03-23 10:38:16 浏览:1727 评论 :0

大数据 hdfs 主机 存储

Java安全——密钥那些事

发布时间:2017-03-14 20:13:16 浏览:14164 评论 :0

安全 Java核心技术 算法 java Security

HDFS扩展属性

发布时间:2017-03-03 17:28:16 浏览:2431 评论 :0

linux 架构 hdfs hadoop 加密 访问限制 Security 数据存储

HDFS权限

发布时间:2017-02-09 22:25:40 浏览:2172 评论 :0

hdfs hadoop path 配置 void 子文件 Group Security

HDFS快照

发布时间:2017-02-04 16:13:05 浏览:2197 评论 :0

java hdfs path API string void

一起爪哇Java 8(三)——好用的Stream

发布时间:2017-01-27 19:02:44 浏览:8282 评论 :0

# 一起爪哇Java 8(三)——好用的Stream 标签(空格分隔): Java --- [toc] --- ## Stream组成 在传统Java编程,或者说是类C语言编程中,我们如何操作一个数组数据呢?或者更泛化的讲,我们如何操作一个“集合”(Collection)数据呢?在Java中我们利用java.

Java核心技术 java 阿里技术协会 数据流 static pipeline stream 数据结构 存储 数组

一起爪哇Java 8(一)——函数式接口

发布时间:2017-01-06 19:31:05 浏览:5387 评论 :0

Java核心技术 java 函数 static void

2