易虹 + 关注

易虹 发表了文章:

HBase2 使用协处理器删除指定qualifier的全部数据

发布时间:2020-05-27 17:07:14 浏览:201 回帖 :0

用户画像的场景中,通常会开发很多标签,每个标签作为一个qualifier,其中有一些不再使用后需要下线,但hbase提供的delete相关api都只能针对单行,要清理某个qualifier的全部数据...

数据存储与数据库 分布式 大数据 hbase PUT timestamp

易虹 发表了文章:

HBase 如何减少升级时重启rs节点造成的影响

发布时间:2020-05-15 11:39:27 浏览:220 回帖 :0

最近被问到这个问题,一时没有很好的回答,事后仔细思考了下,整理如下。 rs节点重启对于应用的影响可分为如下2个阶段: region不可用 region读取慢 不可用的优化 从rs停止...

数据存储与数据库 大数据 分布式系统与计算 hbase LOG 伪代码 磁盘

易虹 评论了文章:

Hadoop 怎么了,大数据路在何方

发布时间:2020-05-12 13:24:23 浏览:1048 回帖 :1

近期 Hadoop 消息不断,众说纷纭。本文以 Hadoop 的盛衰变化为楔子聊下大数据分析的发展现状和未来趋势。

分布式 大数据 Greenplum hdfs hadoop SQL 数据库 数据仓库 数据分析 对象存储 并行计算 分布式数据库 分布式存储 Mapreduce 存储

“Greenplum比Hadoop早吧,怎么成了第二代。。”

易虹 发表了文章:

phoenix-5.0.0与CDH6.0.1兼容性导致二级索引不可用问题解决

发布时间:2020-05-09 12:10:21 浏览:468 回帖 :0

今天在测试phoenix的二级索引功能时,创建完索引写入数据,出现以下异常: Caused by: org.apache.hadoop.hbase.client.RetriesExhaustedWi...

数据存储与数据库 大数据 分布式系统与计算 java hbase hadoop Apache 索引 class 兼容性 index

易虹 发表了文章:

hbase shell实现原理简析

发布时间:2020-05-05 17:51:40 浏览:471 回帖 :0

hbase的交互式命令行是通过jruby实现的,当我们输入hbase shell时,实际上最终执行的是org.jruby.Main,并以bin/hirb.rb作为参数,注意是根目录下bin目录中的h...

数据存储与数据库 大数据 分布式系统与计算 hbase 根目录 shell ruby class list github

易虹 发表了文章:

HBase sequenceId知识点略记

发布时间:2020-05-03 17:53:04 浏览:495 回帖 :0

在HBase中,sequenceId是实现一致性的灵魂,这里的一致性有两方面意思: 顺序性,即先写的先被读到,未提交的写不能被读到; 完整性,包含如下几点; 未持久化到hfile的数...

数据存储与数据库 大数据 分布式系统与计算 hbase LOG

易虹 发表了文章:

HBase2.0官方文档翻译-RegionServer Sizing Rules of Thumb

发布时间:2020-04-30 23:18:12 浏览:623 回帖 :0

37.1. 热点(Hotspotting) Rows in HBase are sorted lexicographically by row key. This design optimizes ...

数据存储与数据库 大数据 hbase string timestamp

易虹 发表了文章:

HBase2.0 regionServer退出处理流程

发布时间:2020-04-15 21:24:54 浏览:354 回帖 :0

rs主动退出或者宕机超过一定时间后,zk上/hbase/rs目录下对应的znode会被删除; master的RegionServerTracker组件监听到该目录的子节点变化事件,会对zk上的rs节...

数据存储与数据库 分布式 大数据 分布式系统与计算 hbase

易虹 发表了文章:

HBase2.0 procedureV2原理简析

发布时间:2020-04-14 18:51:41 浏览:509 回帖 :0

总体流程图 就绪区: 这部分的核心实现类是MasterProcedureScheduler,主要的作用就是对Procedure进行调度; 从排队的角度看,可以认为存在三层队列调度; t...

数据存储与数据库 大数据 分布式系统与计算 hbase entity Server type

易虹 发表了文章:

HBase2.0 replication wal znode大量积压问题定位解决

发布时间:2020-04-07 19:03:18 浏览:475 回帖 :0

现象 线上有2个集群A和B,配置了双向同步,单活,即业务层某一时刻只会访问其中一个集群;近期A集群的regionserver日志中报了很多异常,但监控页面正常,功能也未受影响。 HBase版本为2....

数据存储与数据库 大数据 分布式系统与计算 java hbase hadoop 日志 Apache 集群 同步 string replication thread SUN

易虹 发表了文章:

HBase scan过程简析

发布时间:2020-04-03 16:38:03 浏览:502 回帖 :0

HBase scan过程简析。 scan过程总体上是分层处理的,与存储上的组织方式一致,脉络比较清晰; 具体来说,就是region->store→hfile/memstore,分别都有对应...

数据存储与数据库 大数据 分布式系统与计算 hbase 序列

易虹 发表了文章:

HBase StochasticLoadBalancer组件介绍

发布时间:2020-04-02 17:51:03 浏览:546 回帖 :0

HBase StochasticLoadBalancer组件介绍。

数据存储与数据库 大数据 分布式系统与计算 hbase 集群 Server

易虹 发表了文章:

HBase blockcache原理介绍

发布时间:2020-04-02 17:46:00 浏览:449 回帖 :0

HBase blockcache原理介绍,包括LruBlockCache和BucketCache。

数据存储与数据库 分布式系统与计算 hbase single

易虹 发表了文章:

HBase 加载Hfile时的读取过程

发布时间:2020-04-02 10:26:14 浏览:497 回帖 :0

Hfile分为4部分,其中loadOnOpen section 和trailer这2部分是open file时就会加载到内存的,本文简述其读取步骤。

数据存储与数据库 算法 分布式系统与计算 hbase bloomfilter index 存储

易虹 发表了文章:

HBase常用导入导出工具图示比较

发布时间:2020-04-02 09:52:57 浏览:344 回帖 :0

HBase常用导入导出工具图示比较

大数据 分布式系统与计算 hbase

易虹 发表了文章:

HBase rpc框架介绍

发布时间:2020-04-02 09:48:21 浏览:909 回帖 :0

HBase的rpc框架有比较好的分层,便于在不同层次上进行实现优化和功能扩展。

数据存储与数据库 RPC 分布式 分布式系统与计算 hbase 线程 模块 handler service

易虹 发表了文章:

HBase中scan的ReadType探究

发布时间:2020-04-01 21:06:38 浏览:456 回帖 :0

HBase中scan的ReadType存在pread和stream两种方式,本文对其原理和实现进行探究。

数据存储与数据库 大数据 分布式系统与计算 hbase open read

易虹 发表了文章:

从数据结构比较HBase的3种memstore实现方案

发布时间:2020-04-01 20:59:46 浏览:409 回帖 :0

HBase的memstore目前存在3种实现:DefaultMemstore、CompactingMemstore、CCSMapMemStore,本文尝试从数据结构的角度对其进行比较。

数据存储与数据库 大数据 分布式系统与计算 hbase Apache 索引 性能测试 数据结构 数组

暂未提供

感兴趣or擅长的领域:

更多>
明朔
明朔
文章:6丨 粉丝:1746丨 话题:0
更多>
游客lvsc3ojkxqlgc
游客lvsc3ojkxqlgc
文章:0丨 粉丝:0丨 话题:0
狂野的河
狂野的河
文章:0丨 粉丝:0丨 话题:0
叶意拔
叶意拔
文章:0丨 粉丝:0丨 话题:0