巴客 + 关注
研究spark/hive/hbase相关技术

巴客 参与了问答:

phoenix想做数据隔离 有什么方案吗?

比如结合 HBase 。

“phoenix使用schema映射HBase的namespace隔离数据,HBase支持rsgroup特性可以实现多租户”

巴客 参与了问答:

有比较系统的HBase 讲解资料整理在哪里?有和书一样吗?

分章节:https://hbase.apache.org/1.2/book.html

“最好的资料还是官网,英文不好可以关注中文社区http://hbase.group/阿里云HBase官网也有很多HBase生态组件的介绍。https://help.aliyun.com/document...查看全部>

巴客 参与了问答:

hbase最新版本是多少,什么时候更新的?

参考 Apache 官方 JIRA :https://issues.apache.org/jira/projects/HBASE?selectedItem=com.atlassian.jira.jir...

“现在最新版本是HBase2.1.1版本,18年10/31 release的。Hbase发展动态可以关注HBase官网https://hbase.apache.org 以及中文社区http://hbas...查看全部>

巴客 参与了问答:

Solr on hbase hbase添加数据以后solr没有数据是什么原因呢?

原因可能有哪些?

“使用的Lily HBase Indexer吗,这个是异步索引实现机制,借助HBase Replication实现的,会存在短暂数据不同步的。同时社区的版本也存在一些bug的。可以使用阿里云的solr二...查看全部>

巴客 参与了问答:

社区 有spark访问hbase 的链接器么?

可以使用 shc 实现,参考: https://github.com/hortonworks-spark/shc/

“目前社区已经把spark hbase connector抽出来独立运维了。”

巴客 参与了问答:

HBCK2 Holes的问题啥时候可以解决?

HBase 2.x 有考虑吗?

“社区已有issue,正在开发中”

巴客 参与了问答:

HBase In memory inpaction ,丢失数据的风险会变大吗?

怎么避免。

“In memory inpaction不会丢失数据的,HBase写数据会先写WAL的,以此保证数据不会丢失。”

巴客 参与了问答:

HBase 2.0 的查询性能怎样优化?

如何调整相关参数?

“建议阅读HBase2.0新特性的详细介绍AssignmentManagerV2:https://yq.aliyun.com/articles/601096?spm=a2c4e.11153940.blo...查看全部>

巴客 参与了问答:

hive on hbase是否可以解决hive修改记录的问题,性能怎么样

hive 的 update 可以使用 kudu 解决,on hbase 的情况不太了解。1、kudu本身就不成熟,用多了就是坑,国内都没有成熟的案例2、建议大家用kudu去付费给商业公司或者自己有特别...

“hive on hbase修改记录其实就是先查询出满足条件的数据,然后新写入一条更新列信息的同一rowkey数据,即每次修改都会有读取然后写入,如果过滤列没有没有索引批量读时会scan全表,性能很差。...查看全部>

巴客 参与了问答:

HBase 1.* 版本上,引起查询的延迟的原因?

写入和查询任务是同一个队列,如果写入任务积压较多时,会引起查询的延迟,这种1版本时候有办法处理吗?

“建议配置读写分离。参考:https://help.aliyun.com/document_detail/71183.html?spm=a2c4g.11186623.6.571.47b11ff05E9O...查看全部>

巴客 参与了问答:

CDH 最新版已经集成了HBase2.0,不知道有没有体统HBCK?

需要查看 CDH 文档:https://www.cloudera.com/documentation/enterprise/latest/topics/hbase.html

“目前社区2.0还没有提供HBCK,还得等一段时间。”

巴客 参与了问答:

hbase2.0这种大的社区版本,敢直接用么,有没有潜在的坑,用hbase2.x是不是更加稳定呢

建议使用 阿里云 HBase。

“社区2.0还有很多问题,不建议上生产环境,可以等hbase2.1.x,会稍微稳定,但仍存在一些问题。如果对hbase源码不熟悉或不能把控的话建议使用阿里云HBase2.0,会有Hbase commit...查看全部>

巴客 参与了问答:

HBase 不同的列簇不是分开储存的吗?

这不算列式存储吗?

“HBase 底层存储为HFile 文件格式,HFile 存储单元为Block,Block有很多KeyValue ,一行数据对应很多KeyValue,简单理解就是一个rowkey+column(还有一些...查看全部>

巴客 参与了问答:

一个客户端 同时访问多集群,如何访问?

一个客户端 同时访问多集群,如何访问?

“HBase客户端访问集群时需要配置zookeeper的地址的,在一个客户端不支持配置多个集群的。”

巴客 参与了问答:

如何导出HBase的表的数据

如何把HBase内的表的数据导出来,有些什么方式?

“HBase提供EXPORT工具的。也可以使用spark读取hbase写到指定存储。”

巴客 参与了问答:

批量删除hbase的数据用什么方式比较快?

如果数据有生命周期,可以用TTL方式删除数据?用批量时间戳的方式 , 好像不行 特别的慢?

“设置TTL方式删除数据比较好。”

巴客 发表了文章:

巴客 发表了文章:

利用EMR Hive关联云HBase

发布时间:2018-10-14 17:59:58 浏览:961 回帖 :0

RDS hbase Apache 高可用 配置 集群 Image 控制台 spark EMR Hive zookeeper 关联分析

巴客 发表了文章:

阿里云EMR异步构建云HBase二级索引

发布时间:2018-09-10 20:33:48 浏览:1936 回帖 :0

一、非HA EMR构建二级索引云HBase借助Phoenix实现二级索引功能,对于Phoenix二级索引的详细介绍可参考https://yq.aliyun.com/articles/536850?sp...

hbase hdfs Apache 配置 集群 索引 xml EMR zookeeper Mapreduce

巴客 发表了文章:

SQuirreL连接Phoenix

发布时间:2018-08-29 16:35:34 浏览:2629 回帖 :1

什么是SQuirrel? SQuirreL SQL Client是一个开源免费软件, 可以通过jdbc对多种数据库进行可视化的管理,查询等。本文主要介绍如何通过SQuirrel连接Phoenix并设置...

index

3
研究spark/hive/hbase相关技术

感兴趣or擅长的领域:

更多>
明朔
明朔
文章:5丨 粉丝:1711丨 话题:0
hbase小能手
hbase小能手
文章:113丨 粉丝:3049丨 话题:0
我是小助手
我是小助手
文章:416丨 粉丝:4787丨 话题:7
焦先
焦先
文章:18丨 粉丝:316丨 话题:0
@dailidong@
@dailidong@
文章:430丨 粉丝:50丨 话题:0
cometwo123
cometwo123
文章:2680丨 粉丝:30丨 话题:0
更多>
Cong Lee
Cong Lee
文章:0丨 粉丝:0丨 话题:0
一个嘉兴仔
一个嘉兴仔
文章:0丨 粉丝:0丨 话题:0
leongood
leongood
文章:0丨 粉丝:0丨 话题:0
游客jrmeyb65dnek4
游客jrmeyb65dnek4
文章:0丨 粉丝:0丨 话题:0
游客enhuyglqmghiw
游客enhuyglqmghiw
文章:0丨 粉丝:0丨 话题:0
ziyouren菜鸟
ziyouren菜鸟
文章:0丨 粉丝:0丨 话题:0