云hbase+spark + 关注
TA参与的回答 | TA的问题

HBase thrift的线程池大小如何设置?线程插入后多久会销毁?

HBase thrift的线程池大小如何设置?线程插入后多久会销毁?

HBase thrift的线程池大小如何设置?线程插入后多久会销毁?

请问一下,并发插入量每秒才3000左右,这里设置了3000,依然大量等待状态。这个值调大之后,线程池大小在哪里设置呢?我想设置小点,这个线程插入完成之后在多久会销毁呢?

hbase中如何每天更新千万级别的用户标签数据?

hbase中如何每天更新千万级别的用户标签数据?

Hbase中将表状态设置为disable的时候报gc的错

Hbase中将表状态设置为disable的时候报gc的错

Hbase中将表状态设置为disable的时候报gc的错

有个hbase 的集群 ,在disable 表的时候,经常出现 waiting 问题,在服务端没有看到有用的信息呢,看到一些gc 。 大家有没有遇到过的?给些方向,监控看到 rpc processit...

hbase 的olap怎么跟kylin结合,通过hive映射吗?

主要用spark 进行olap的。

Hbase中将表状态设置为disable的时候报gc的错

Hbase中将表状态设置为disable的时候报gc的错

求助,phoenix mapping时如何避免产生写请求?

背景:应用场景是 每天查询全部的最新的数据,所以目前每天晚上会将最新的数据表往hbase里到一次,先删除hbase中的表,再bulkload倒入,最后phoenix mapping;导入动作是多张表...

Hive on hbase 分析10亿以上数据不是特别好?Hive on hba

Hive on hbase 分析10亿以上数据不是特别好?

hbase中如何每天更新千万级别的用户标签数据?

请问下,用户画像数据存hbase里面(千万级别的用户),每天的标签数据如何更新会好些?通过API,一条条更新的话,感觉好慢,而且每天buckload前,新建张表,设置TTL,每天都用最新的表。

查看HBase value对应的存储大小 就是后面的16进制吗?

都是16进制吗?

有搭建cdh集群的教程吗? 怎样在 cdh上配置Hbase?

可以参考:https://www.cloudera.com/documentation/enterprise/release-notes/topics/rg_release_notes.html

在 hbase 中存储数据,如果要以 uuid 作为 rowkey 如何进行预分区?

参考:https://hbase.apache.org/1.2/book.html#rowkey.design建表的时候可以用shell里面的SPLITALGO => 'HexStringSpl...

tidb这类new sql 会对hbase造成很大冲击吗?

hbase上也有newsql层Phoenix,同时可以配合Spark做复杂分析。

加盐一般在线上有什么快速读全量数据的思路

1、HBase 建议:https://hbase.apache.org/1.2/book.html#rowkey.design2、Phoenix建议:https://phoenix.apache.or...

HBase 的TTL 参考

查阅官方文档:https://hbase.apache.org/book.html#ttl

加盐一般在线上有什么快速读全量数据的思路

加盐一般在线上有什么快速读全量数据的思路

active-active wal replication(batch && bulkload)

active-active wal replication的feature(batch && bulkload),有小伙伴做过吗?有同学说双向建peer,不知道这种方式是否work。...

批量删除hbase的数据用什么方式比较快

最快的方式就是直接设置TTL如果业务无法满足,建议直接调度delete接口,性能也较快~

hbase的版本号可以是自定义的整形吗?

hbase的版本号可以是自定义的整形吗?我这边想利用他的多版本做一个时间乱序的纠正,但是数据的时间戳毫秒不够用,我想用一个唯一整形来做。

3