白头雁 + 关注

白头雁 发表了文章:

Sqoop安装

发布时间:2018-09-05 17:09:00 浏览:761 回帖 :0

Sqoop是Hadoop生态里,实现Hive、Hbase等大数据数据库与MySQL、Oracle导入导出的工具。 其实就是包含两部分功能:(1)HDF...

云栖社区 大数据 mysql hadoop path 配置 测试 sqoop

白头雁 发表了文章:

SparkSQL 电影评价数据分析

发布时间:2018-08-31 17:00:00 浏览:573 回帖 :0

当我做了很多Spark Core练习,喜欢写map、reduce,后来又开始用SparkSQL ,感觉SQL比mapReduce简洁优雅很多。 SQL...

SQL 数据分析 spark BY string Group

白头雁 发表了文章:

SparkStream mapWithState编程练习

发布时间:2018-08-29 16:02:00 浏览:673 回帖 :0

SparkStream在处理流数据时,按时间间隔把数据分成小批,在一个小批中利用RDD 的函数完成各种运算。如果要在各小批之间共享数据,或者保存到每批...

函数 string 编程 流计算 流数据

白头雁 发表了文章:

SQL 内连接,外连接(左外连接、右外连接)

发布时间:2018-08-27 09:37:00 浏览:564 回帖 :0

参考https://blog.csdn.net/plg17/article/details/78758593整理笔记 一、内连接 关键字:inner...

mysql SQL 伪代码

白头雁 发表了文章:

并查集路径压缩

发布时间:2018-08-24 08:28:00 浏览:582 回帖 :0

如何描述一个复杂的连接关系?如图,很容易判断紧邻的2个人关系,但中间的连接很多很乱,怎么判断出两个人的关系呢?并查集就是一种结构,通过保存节点以及节点...

函数 class 数组

白头雁 发表了文章:

Flume 日志收集系统 Spooldir-Source HDFS-sink

发布时间:2018-08-23 11:19:00 浏览:645 回帖 :0

日志即log,记录发生的事件。以Nginx为例,有error_log和access_log 2个日志。access_log是访问日志,每条访问记录会产...

大数据 hdfs 日志 配置 主机 source

白头雁 发表了文章:

如何删除乱码文件

发布时间:2018-08-23 08:11:00 浏览:681 回帖 :0

首先执行ls -i命令,此时在文件前面会出现一个数字,这个数字是文件的节点号 接着,执行命令 find -inum 节点号 -delete ...

白头雁 发表了文章:

二叉树的深度优先遍历与广度优先遍历

发布时间:2018-08-22 11:05:00 浏览:547 回帖 :0

先说说为什么要遍历,二叉树不是已经排好序了么?如果大于当前节点值,搜索右子树,小于当前值,继续搜索左子树。 参考两个sql: select id,na...

node 索引 PUT 存储

白头雁 发表了文章:

二叉树添加删除节点Python

发布时间:2018-08-22 08:59:00 浏览:1183 回帖 :0

一棵二叉树,每一个节点都有左子树和右子树,二叉树的操作都可以递归的调用子树来完成。在C中有指针的概念,子树用指针实现,函数用指针作为参数。但是,Pyt...

python 算法 函数 node 伪代码

白头雁 发表了文章:

分享某行软件开发中心的两道python笔试题

发布时间:2018-08-20 18:31:00 浏览:514 回帖 :0

两道笔试题都是选择题,两个知识点,容易做错。 第一题 ## 下面程序执行结果 x = 2 def b(a): x = x+a b(3) pr...

python 软件开发

白头雁 发表了文章:

Python 传值还是传引用

发布时间:2018-08-20 18:22:00 浏览:516 回帖 :0

在实现二叉树的代码时,使用递归调用,当给空叶子节点赋值的时候,发现只修改了局部变量。 因此研究了一下Python中传值和传引用的问题。 实验 实验一...

python 函数 node test 数据结构

白头雁 发表了文章:

二叉树的插入和搜索--python实现

发布时间:2018-08-20 13:16:00 浏览:659 回帖 :0

本文首先介绍了二分查找法,采用“循环”和“递归”2种方法实现。采用递归算法实现了二叉树的插入和搜索算法。 一、二分查找法 查找算法的计算复杂度为O(...

python 算法 node 数据结构 数组

白头雁 发表了文章:

HBase 分布式数据库

发布时间:2018-08-17 17:26:00 浏览:505 回帖 :0

我从来没见过我们单位的主库系统,无论是小机或者EMC。如果哪天在值班时,收到通知主库挂了,我会觉得是一个深藏在机房沉重铁门里的大家伙,冒了几缕青烟,紧...

分布式 大数据 hbase string bloomfilter 分布式数据库 分布式存储 timestamp 存储

白头雁 发表了文章:

Zookeeper 分布式环境中的注册表

发布时间:2018-08-17 10:36:00 浏览:472 回帖 :0

03年,作者大二买了第一台计算机。记得那时候2种主题的书特别多,注册表和Bios。现在想想《教你21天玩转Bios》这样的书名都像个笑话儿。 这么说是...

分布式 函数 path node string 数据节点 Create zookeeper

白头雁 发表了文章:

Kafka API实践

发布时间:2018-08-17 00:19:00 浏览:778 回帖 :0

系统学习三步骤走:理解原理、搭建系统、Api练习。 从哪里找到Api?Document和git。 例如,Kafka在github上的地址github....

函数 线程 Apache API string exception Consumer PUT metadata thread

白头雁 发表了文章:

Kafka-0.10.0.0 集群高可靠实验

发布时间:2018-08-16 14:06:00 浏览:562 回帖 :0

记录实验过程之前,先谈一谈学习Kafka过程的心得。 大数据包含一个生态,需众多组件配合使用。逐个学习各个组件非常费力,想摸索出一种快速入门的方法,可...

大数据 hbase 配置 集群 负载均衡 Server zookeeper

白头雁 发表了文章:

No zuo no die ,用Docker安装Mysql

发布时间:2018-08-02 18:19:00 浏览:679 回帖 :0

话说,小哥接触Mysql也有几年了,但总是感觉Mysql有很多神秘的特性,一直也不太敢折腾这家伙。昨天准备动动手,可安装过程就花了2天时间。 期间,错...

nginx docker mysql 镜像 容器 volume html 存储 BIND

白头雁 发表了文章:

流式计算

发布时间:2018-08-01 10:01:00 浏览:604 回帖 :0

从spark 说起,谈谈“流式”计算的理解 spark是一个大数据分布式的计算框架,有一些并行计算的基础会更容易理解分布式计算框架的概念。对比并行计算,...

分布式 大数据 reduce spark 流式计算 string 分布式计算 Driver 并行计算 数据结构 大数据分析

白头雁 发表了文章:

Intellij idea配置Spark开发环境,统计哈姆雷特词频(2)

发布时间:2018-07-26 17:56:00 浏览:782 回帖 :0

idea 新建maven 项目 输入maven坐标 maven 坐标 编辑maven文件 Spark 体系 中间层S...

java Apache 配置 排序 Maven spark 流式计算 string 开发环境 list IDEA

白头雁 发表了文章:

基于Yarn的Spark环境,统计哈姆雷特词频(1)

发布时间:2018-07-23 10:40:00 浏览:652 回帖 :0

一、最流行的大数据框架Spark Yarn 环境搭建 Spark History Server 以及 Yarn MapReduce History S...

java docker hdfs hadoop 配置 镜像 SSH spark network

2
暂未提供

感兴趣or擅长的领域:

暂无
更多>
更多>
丫丫丫丫丫
丫丫丫丫丫
文章:0丨 粉丝:0丨 话题:0