Terark—重新定义数据技术

  1. 云栖社区>
  2. 博客列表>
  3. 正文

Terark—重新定义数据技术

云计算小粉 2016-11-17 23:12:45 浏览2187 评论0

摘要: 本文PPT来自Terark Inc. CTO雷鹏于10月15日在2016年杭州云栖大会上发表的《Terark—重新定义数据技术》。

Terark核心技术

可检索压缩 SeComp (Seekable Compression) 技术

这个技术拥有超高的压缩率(⼀一般在5倍以上), 同时可以直接在压缩的数据上进行定点访问(微秒级), 避免了了传统数据库使用的分块压缩技术固有的缺点

索引技术

我们实现了多种独有的索引技术。其中最关键的是“数据即索引,索引即数据” , 从而节

约了空间,同时并保持甚至提高了性能

存储引擎技术

Terark存储引擎可以便便捷的融入各种数据系统, 为其提供高效的核心存储技术,大幅提升

整个系统的容量和性能

 

TerarkDB ——高性能、高压缩的存储引擎

一组800G的数据,Terark压缩后只有47.9G,同时Query延迟达到微秒级。使⽤用Terark,只需要1台普通64G内存的服务器器就够了,而用其它数据库可能就需要搭建一个小集群了。

功能丰富:支持丰富数据类型的Schema定义和灵活的索引, 原生支持正则表达式检索

性能强大:TerarkDB的QPS⽐比同类产品提⾼高1〜2个数量级, 降低延迟, 提高吞吐量

容量大成本低:压缩率5倍以上, 极大的降低IO压⼒力力, 提高数据容量, 降低基础设施成本

索引压缩: Succinct Tree

一种能够在接近于信息论下限的空间内来表达对象的技术,通常使用位图来表示,用位图上的rank和select来定位。

ae10cfec2d46e565c548b6b9602484d85472fa1d

a92aa5045df2123dde6eb9ddf385ad7d64557864

566d5dd1dd829d8b6ec8d53d0d47af6a7ff47aff

2928784eba21075a27e76da7246f41b4985d9122

e7a11befc2258d6b00f99d3ece83079d2e416ebf

74bd3c4782d1d5d4253d15bb435a5790819c9bfb

01d1af5b6c9c8da06e325159c0eae7c8083a0229

0b0471d5baa4af159ffaa02ebec56342333c5d82

b2aa7c16c4335f4793fb8231c04f9bb8bc531b44

635b9b74d0b35d407bf8e2cf2444df5d7eba2615

b704a256b06cbcb18a25337c2715e353cf608d13

aded159c7e9156a22d7714a8a7f897ddea1941f8

47926a4aa3a4c2026ba69a1dc3d31c3453b07499

70b1539fbed90822191feae10da3735e06d17915

11f630b61518a3fc44a9634353f8b59cccbaa7b6

263f70a687c2384bd707f5ce0cea5548196c104e

a13703b677fa905875b076041f99d7cc5237efce

26d4f3eeea4c07126ef0918bd49d8b3620899870

【云栖快讯】阿里云栖开发者沙龙(Java技术专场)火热来袭!快来报名参与吧!  详情请点击

网友评论

云计算小粉
文章227篇 | 关注230
关注
MySQL 是全球最受欢迎的开源数据库,阿里云MySQL版 通过深度的内核优化和独享实例提供... 查看详情
大数据商业智能套件提供海量数据实时在线分析,拖拽式操作、丰富的可视化效果,帮助您轻松自如地完... 查看详情
用于实时预测用户对物品偏好,支持企业定制推荐算法,支持A/B Test效果对比 查看详情
为您提供简单高效、处理能力可弹性伸缩的计算服务,帮助您快速构建更稳定、安全的应用,提升运维效... 查看详情
双12

双12