HBase+Spark社区 + 关注
手机版

Solr增强HBase检索能力基础介绍及场景

介绍solr如何增强hbase检索能力,通过示例帮助大家快速上手hbase+solr查询应用

hbase 数据库 钉钉 solr aliyun

平台篇-八年磨一剑,重新定义 HBase——HBase 2.0&阿里云 HBase 解读

八年磨一剑1.1 HBase 的前世今生 关系型数据库的发展已经经历了 40 多年的历史了,而 HBase 以及大数据这套东 西的历史大概从 2006 年被认为是大数据的发起时期到现在,也就是 13 年左右而已。

大数据 hbase 性能 数据库 高并发 对象存储 存储

平台篇-58 HBase 平台实践和应用

HBase 是一个基于 Hadoop 的分布式、面向列的 Key-Value 存储系统,可以对需 要实时读写、随机访问大规模数据集的场景提供高可靠、高性能的服务,在大数 据相关领域应用广泛。HBase 可以对数据进行透明的切分,使得存储和计...

技术篇-HBase Coprocessor 的实现与应用

本次分享的内容主要分为以下五点: Coprocessor 简介 Endpoint 服务端实现 Endpoint 客户端实现 Observer 实现二级索引 Coprocessor 应用场景 1.

RPC hbase 函数 Server 索引 service

[Phoenix] 十一、查询计划详解

数据库的使用中了解其查询计划的构成,是进行查询性能调优的必要条件。本文将详细介绍Phoenix的查询计划语法、组成结构,以及一些注意事项

hbase 数据库 索引 phoenix 查询计划

技术篇-HBase 2.0 新特性之 In-Memory Compaction

In-Memory Compaction 是 HBase2.0 中的重要特性之一,通过在内存中引入 LSM 结构,减少多余数据,实现降低 flush 频率和减小写放大的效果。本文根据 HBase2.0 中相关代码以及社区的讨论、博客,介绍 ...

消息队列 hbase 测试 索引 pipeline adaptive 磁盘 数据结构

技术篇-HBase 2.0 之修复工具 HBCK2 运维指南

概述 目前社区已经发布了 HBase 的 2.0 版本,很多公司都希望去尝试新版本上的新功 能,但是不得不面对的问题就是当集群出了问题应该如何解决。在之前的 HBase版本中,我们可以依赖 hbck 来帮助检查问题和修复问题,在新的版本上...

hbase 日志 Apache 集群

技术篇-深入解读 HBase2.0 新功能之高可用读 Region Replica

1.前言 基于时间线一致的高可用读(Timeline-consistent High Available Reads),又称 Region replica。其实早在 HBase-1.2 版本的时候,这个功能就已经开发完毕了, 但是还是不太...

hbase 高可用 配置 集群 数据同步 replication

SparkSQL在有赞的实践

作者: 邹晨俊 有赞大数据离线计算负责人 本文介绍了SparkSQL在有赞数据仓库的实践,以及离线任务从Hive向SparkSQL迁移的一些经验

大数据 STS SQL 数据仓库 集群 spark 分布式计算 Hive sparksql

技术篇-深入解读 HBase2.0 新功能之 AssignmentManagerV2

1.背景 AssignmentManager 模块是 HBase 中一个非常重要的模块,Assignment Manager (之后简称 AM)负责了 HBase 中所有 region 的 Assign,UnAssign,以及 split...

服务器 hbase open zookeeper

技术篇-HBase 最佳实践-读性能优化策略

任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是 HBase 还需要完善的,有些是我们确实对它了解太少。总结起来,大家遇到的主要问题无非是 Fu...

性能优化 hbase hdfs 性能 配置 集群 bloomfilter

案例篇-HBase 实战之 MOB 使用指南

1. 背景 HBase 可以很方便的将图片、文本等文件以二进制的方式进行存储。虽然 HBase 一般可以处理从 1 字节到 10MB 大小的二进制对象,但是 HBase 通常对于读写路径的优化主要是针对小于 100KB 的值。

hbase 配置 Cache file

案例篇-HBase RowKey 设计指南

吴阳平 阿里巴巴 HBase 业务架构师

hbase 排序 timestamp prefix

案例篇-HBase 基本知识介绍及典型案例分析

吴阳平 阿里巴巴 HBase 业务架构师

分布式 hbase 数据库 集群 存储

案例篇-HBase 在人工智能场景的使用

人工智能逐渐火热起来,特别是和大数据一起结合使用。人工智能的 主要场景又包括图像能力、语音能力、自然语言处理能力和用户画像能力等等。

OSS mysql hbase 人工智能 spark 对象存储 存储 数据存储

案例篇-HBase 在滴滴出行的应用场景和最佳实践

李扬 滴滴出行 资深软件开发工程师

hbase 集群 Group 存储 客服

直播:Graph图数据库基础介绍及场景

主题:Graph图数据库基础介绍及场景 讲师:陈江(恬泰)——阿里数据库技术专家 内容概要:阿里云graphDB是构建在HBase基础之上图数据库,基于开源项目hgraphdb及tinkerpop构建而成,本次分享将深入介绍阿里云gra...

hbase 数据库 aliyun

生态篇-HBase 生态介绍

HBase 生态介绍 HBase是受Google公布的BigTable论文而产生的一种分布式、多版本、面向列的开源 KV 数据库。HBase稀疏矩阵的设计使得其特别适合存储非结构化的数据,比如用户画像、日志以及消息等数据。

分布式 大数据 hbase SQL 数据库 spark 索引 物联网 存储 数据存储