ApacheCon 2019 Cassandra分会各大议题深度剖析,解读cassandra前沿工作

本文涉及的产品
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 MongoDB,通用型 2核4GB
简介: NGCC 2019摘要 下一代Cassandra会议(NGCC)是ApacheCon 2019大会中的一场分会。 它是由开发人员,贡献者,提交者,驱动程序作者以及对Apache Cassandra开发感兴趣的人组成的年度会议,他们可以聚在一起讨论Cassandra项目的技术和社区发展方向。

NGCC 2019摘要

下一代Cassandra会议(NGCC)是ApacheCon 2019大会中的一场分会。 它是由开发人员,贡献者,提交者,驱动程序作者以及对Apache Cassandra开发感兴趣的人组成的年度会议,他们可以聚在一起讨论Cassandra项目的技术和社区发展方向。NGCC今年在德克萨斯州圣安东尼奥举行。

这次讨论和讨论很大程度上是由大型运营商推动的,这些运营商也为Cassandra代码库做出了巨大贡献,与往年相比,我们发现在Cassandra的可管理性,稳定性和性能方面进行了大量工作。

自从Datastax宣布退出该项目以来,这个NGCC是第一个社区大会。尽管如此,很高兴看到许多Datastax受雇的贡献者以私人身份来到NGCC。

以下是本人为各位带来每个演讲主题的播报,全量的演讲稿下载地址:https://github.com/ngcc/ngcc2019

RocksDB的可插拔存储可显著提高性能

头条是可插拔存储和RocksDB存储引擎。使用RocksDB会将大量存储引擎代码移入C实现中,这将大大降低GC压力,这将能达到Scylla级别的p95延迟低。我不确定性能会提高多少(Instagram仅以20mbps的恒定磁盘I / O负载为基准),但我可能会猜测会有明显的改善。可插拔存储的优点在于,它为集成许多不同和新的存储技术(例如内存存储)开辟了道路。

目前进展

以支持的功能

  • Most of non-nested data types
  • Table schema
  • Point query
  • Range query
  • Mutations
  • Timestamp
  • TTL
  • Deletions/Cell tombstones
  • Streaming
  • Multi-partition query
  • Snapshot
  • Cleanup
  • Truncate
  • Partition deteltion
  • SSTableloader
  • Secondary indexes

将要支持的功能

  • Nested data types
  • Counters
  • Range tombstone
  • Materialized views
  • SASI
  • Row level tombstone
  • Anti-entropy repair

可以看到截至目前为止,还有大量的工作需要做,离真正release还会有一段时间

cassandra sidecar

sidecar主要想解决系统可运维问题,cassandra运维都是通过内核加上待外工具支持,sidecar目标是一站式运维平台,提供如下监控或运维能力

  • Bootstrap and data movement
  • Maintenance
  • Configuration (files, jmx)
  • Monitoring/Metrics
  • Backup/Restore
  • Repair

这方面商业公司做的比较出名的有datastax OpsCenter, 奈飞的CDE self service。开源市场方面方案很多,但互有优缺点,这方面sidecar想做到事实上的统一。如果急需运维平台,可以了解下当前一些开源方案对比
image

sidecar是一个web一站式平台,核心的做法还是通过cassandra内核的jmx接口操作数据库。

CASSANDRA AT INSTAGRAM 2019

该talk先介绍cassandra在INSTAGRAM 怎么使用的,然后着重介绍了改进
我们先来看第一部分怎么使用的,cassandra在instagram大规模部署,拥有

  • 1000个实例
  • 数千万QPS
  • 数百个产品在使用
  • PB级别数据
  • 5个以上数据中心
  • 3.0版本
  • RocksDB 引擎

主要的使用场景有

  • metadata存储中心,类似分布式版mysql
  • 时序数据
  • counter计数器,我们知道instagram有很多点赞,转发数等。

改进可分为这几个部分

  • Pluggable Storage Engine
    instagram把wal,sstable,memtable,compation部分抽象出一个存储引擎层,这样,这个引擎可以被各种实现替代,如我们所知的,有部分rocksdb引擎,将来还可以抽象出一个纯内存版,做一个内存数据库。

  • Global Data Partition
  1. 数据中心全球分布,同样cassandra集群数据也是分布全球的,INSTAGRAM验证了cassandra作为在线数据库很合格。
  • Large scale Cassandra cluster
    大集群下gossip协议很容易产生网络风暴,造成消息堵塞,IG对gossip协议做了大量优化,尽可能的减少gossip消息包,使得大集群成为可能
  • Gateway
    拆解了cordinate角色能力,在社区版cordinate要承担一致性协调角色,还有本地存储节点,IG做法分别拆成独立进程,这样可分开部署,如cpu使用的比较满的节点就不部署cordinate了。
  • Manageability
    主要讲的是IG大范围使用cassandra多dc容灾方式,说明多dc容灾是非常成熟靠谱的。

Row level repair

repair是cassandra比较重要的运维操作,用于探测各副本数据不一致,并修复这种不一致。
这次scylla为我们带来的了行级别的修复改进,当前开源版repair有着各种不足,比如时下稳定版本仍不建议使用增量修复,repair是一个比较重的操作,要以partition粒度,构建出整个merkle tree进行比较,用户使用场景中单partition往往过大,数G,scylla的talk说单partition数据不一致概率很大,并且修复过程需要先找到不一致(checksum),然后streaming阶段修复,需要两次读操作。这个过程效率很低。他们重新设计了行级别的repair,完全摈弃掉了merkle tree方案。
整体思想:
行是在每个节点里是全局有序的,scylla思想就是按行粒度分页顺序scan,先数据对齐,把对齐的行数据加载到内存buffer里面,然后为每行数据计算md5值,在多副本之间由主节点进行数据校正,得出一个全集。再将各副本数据子集推往各副本的working buffer。通过合理的使用内存,即使行数据不一致,也可保证只读一次。

How Netflix Debugs and Fixes Apache Cassandra ... when it breaks

Netflix带来了如何运维,诊断集群,作为该系统的管理员或者运维同学可以重点看看,讲的是如何诊断系统,找出问题的rootcause,里面很多知识点其实都是需要多年系统知识积累,非常推荐相关从业同学看看,能大大提升问题诊断的准确率。但不太适合在本文中展开,不多过阐述了。

How Netflix manages petabyte scale Apache Cassandra in the cloud

Netflix 有自己的一站式运维平台,可以做到很好的监控报警,在sidecar那章节也提到CDE self service,本讲讲的是cassandra如何基于cde自助平台运维PB级别数据,可惜cde做的再好,也没面向大众用户开放,还是静静等待sidecar release吧。对于志在自研运维平台的客户,到时可以了解下哪些是急需解决的痛点。

Next Generation Cassandra Compaction, Going beyond LCS

对于LSM引擎我们知道compaction一直是个痛点,有读写放大问题。该talk主要阐述了主流的size Tiered,Leveled compaction两大策略一些优缺点,谁更优。一般而言leveled要比size有更好的读性能,以及有更好磁盘使用率。
该talk后半程讲述如何设计出下一代compaction,整个设计目标会变成一个目标函数求最优解问题,有一些数学功底的同学可以看看

结语

整个大会为我们展示了当前cassandra社区一些前沿工作,以及cassandra未来一些改进方向。期待这些改进能够尽快落地,造福我们这些终端用户,同时也欢迎个人开发者及各大公司回馈社区,积极参与构建繁荣的社区生态。

入群邀约

为了营造一个开放的 Cassandra 技术交流环境,社区建立了微信群公众号和钉钉群,为广大用户提供专业的技术分享及问答,定期开展专家技术直播,欢迎大家加入。另外阿里云提供免费Cassandra试用:https://www.aliyun.com/product/cds
8a55f5a99463a7276265074b1079d74f4ab3d164

相关文章
|
消息中间件 Apache RocketMQ
RocketMQ 开源爱好者请注意!邀您共探行业应用与生产实践
为了更好的促进社区交流,帮助更多的新老社区成员们更好的学习和使用 RocketMQ,开源案例实践征集活动正在火热进行中,欢迎大家踊跃投稿~
RocketMQ 开源爱好者请注意!邀您共探行业应用与生产实践
|
大数据
开源大数据技术社区召集令
Hadoop生态技术已经俨然成为大数据事实标准,为了给广大同学、朋友提供一些交流学习的环境,沉淀大数据技术相关的资料,特别发起此次关注活动。
8875 0
|
机器学习/深度学习 分布式计算 算法
腾讯大数据将开源高性能计算平台 Angel,机器之心专访开发团队
随着近年来深度学习技术的发展,各种机器学习平台也纷纷涌现或从专用走向了开源。到现在,一家科技巨头没有一个主导的机器学习平台都不好意思跟人打招呼。比如谷歌有 TensorFlow、微软有 CNTK、Facebook 是 Torch 的坚定支持者、IBM 强推 Spark、百度开源了 PaddlePaddle、亚马逊也在前段时间高调宣布了对 MXNet 的支持。 现在,腾讯也加入了这一浪潮。在 12 月 18 日于深圳举办的腾讯大数据技术峰会暨 KDD China 技术峰会上,腾讯大数据宣布推出了面向机器学习的「第三代高性能计算平台」——Angel,并表示将于 2017 年一季度开放其源代码。
417 0
腾讯大数据将开源高性能计算平台 Angel,机器之心专访开发团队
|
存储 前端开发 分布式数据库
首度公开!OceanBase存储系统架构的演进历程及工程实践 | 11月26号云栖号夜读
今天的首篇文章,讲述了:作为一款100%自研的分布式数据库,OceanBase历经了近十年的发展历程。近十年来,OceanBase的存储架构经历了多次演进,以解决业务越来越复杂苛刻的存储需求。本文整理自赵裕众(花名陈群)在2019 SACC中国系统架构师大会中的演讲。
3682 0
首度公开!OceanBase存储系统架构的演进历程及工程实践  | 11月26号云栖号夜读
|
NoSQL Apache
中国Cassandra技术社区第一届Meetup:Apache Cassandra 技术揭秘及实践应用
由中国 Cassandra 技术社区主办,阿里云、DataFun协办的中国Cassandra技术社区第一届Meetup:Apache Cassandra 技术揭秘及实践应用将于2019-11-16日在北京举行,来自阿里云、ScyllaDB、360等4位嘉宾的核心技术分享。
|
NoSQL 分布式计算 Spark
【Cassandra生态】Cassandra强大的支持力量-商业&大公司&云&生态周边
本文将梳理下Cassandra的商业公司、云公司、全球使用的大公司及相关生态的支持。另外有份资料表明,从事Cassandra职业的薪水非常可观,排名第五
【Cassandra生态】Cassandra强大的支持力量-商业&大公司&云&生态周边
免费报名 | 汇聚HBase&大数据最前沿 Apache HBaseConAsia2019盛会火热来袭
HBaseConAsia 2019将于7月20日在北京金隅喜来登大酒店举行,是HBase开发者和使用者不可错过的盛会。本次大会向所有参会者免费开放。欢迎大家前来参加。报名地址请点击链接或扫描下方二维码。
2525 0
蚂蚁金服大规模分布式事务实践和开源详解 | GIAC 实录
详解在分布式架构演进中,蚂蚁金服面对的跨服务、跨数据库的业务数据一致性问题以及应对措施。更有分布式事务 Seata 的 AT、TCC、Saga 和 XA 四种模式分享。ps:文末附分享 PPT 下载地址哟。
1437 0
|
机器学习/深度学习 SQL 人工智能
蚂蚁金服首席架构师何昌华:开源 SQLFlow 是牛刀初试,实时大数据系统才是未来基石
开源 SQLFlow,反哺业界,同时小小秀出AI肌肉。这就是蚂蚁金服近日开源首个将 SQL 应用于 AI 引擎项目 SQLFlow 后,业界给出的反应。
2173 0
|
NoSQL 大数据 分布式数据库
【精彩直播+最全资料下载】阿里云栖开发者沙龙 - BigData NoSQL Meetup(上海站)业内大咖齐聚,各大技术社区支持,与你畅聊 BigData NoSQL
云栖开发者沙龙介绍​ 阿里云栖开发者沙龙是“云栖社区”主办的线下技术沙龙品牌,希望通过技术干货分享来打通线上线下专家和开发者的连接。沙龙每期将定位不同的技术方向,逐步覆盖 云计算,大数据,前端,PHP,Java ,android,AI,运维,测试 等技术领域,并会穿插一些特别专场(开源专场,女性开发者专场,开发者成长专场等)。
8996 0