内存数据库Tokyo Cabinet在电子商务网站中的应用

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介:

摘自:《信息与电脑》杂志2011年3月刊 数据库技术

 

栾志高 张吉

 

(中博信息技术研究院有限公司 信息应用院,江苏南京210012)

 

摘 要:本文介绍了Tokyo Cabinet内存数据库和配套的Tokyo Tyrant数据库接口。结合电子商务网站新技术背景,分析了这种内存数据库的高并发性、负载均衡和故障转移等特性,以及应用前景和优点。

 

关键词:Tokyo Cabinet;Tokyo Tyrant;内存数据库;Web 2.0;高并发性;电子商务

 

中图分类号:TP39 文献标识码:A 文章编号:1003-9767(2011)03-0092-02

 

1. 引言

 

随着Web 2.0概念的不断发展,电子商务网站更倾向于友好的用户体验。随之改变的设计思路是将用户的操作切割成更细的颗粒操作,并辅助以Ajax、延迟加载、局部刷新等一系列技术手段。通过优化用户的视觉观感和操作体验,改善用户的购物体验,并有效刺激用户消费。

 

在这种思路的指引下,对网站系统的设计要求也变得更高。相对于同样的用户访问量,细化操作颗粒,一方面会降低数据库操作的单次数据流量,另一方面,将对数据库产生更频繁的请求,并发请求将变得更大。在一般情况下,数据库的并发能力是相对固定的,虽然可以通过提升硬件性能或负载均衡等方式来提升,但是会增加系统的复杂程度和投入成本。因此,基于这样的背景,内存数据库的使用变得日益重要。通过内存数据库的高并发能力以及负载均衡等特性,不仅可以有效提升电子商务网站的性能,提升用户体验,还可以在节约成本的前提下有效提高系统的可靠性。

 

2. Tokyo Cabinet内存数据库

 

2.1 什么是内存数据库

 

内存数据库抛弃了磁盘数据管理的传统方式,基于全部或大部分数据都在内存中这样的理念,重新设计了体系结构,并且在数据缓存、快速算法、并行操作方面也进行了相应的改进,所以数据处理速度比传统数据库的数据处理速度要快很多,一般都在10倍以上。

 

2.2 内存数据库 Tokyo Cabinet

 

内存数据库Tokyo Cabinet是基于C/C++的开源项目。它包括两个重要的组成部分。一个是数据库内核Tokyo Cabinet和数据库接口Tokyo Tyrant。

 

Tokyo Cabinet是一种DBM数据库,数据是由一系列key-value所组成。它包括了六种数据存储方式,TCHDB(哈希数据库)、TCBDB(B+ Tree数据库)、TCFDB(固定长度的数据库)、TCMDB(内存中的哈希数据库)、TCNDB(内存中的B+ Tree数据库)、TCTDB(表格数据库)。Tokyo Cabinet可以支持每秒10000个并发客户端,以及每秒超过60000次的查询。

 

clip_image002

 

Tokyo Tyrant是Tokyo Cabinet的数据库接口,它为应用程序提供了便捷的数据访问服务。它不仅支持Memcached协议,也可以通过HTTP协议进行数据交换。Tokyo Tyrant可以支持每秒10000个并发请求,吞吐量也超过20000qps,更为重要的是它支持通过主从模式来实现负载均衡,以及热备模式来实现故障转移。

 

3. Tokyo Cabinet在电子商务网站中的应用

 

接下来我们将讨论一下电子商务网站中Tokyo Cabinet的应用前景和应用方式。

 

3.1 提高系统的并发性

 

3.1.1 使用Tokyo Cabinet和Tokyo Tyrant提高吞吐量

 

在传统的电子商务网站中,更多的采用是三层体系。在数据层中,主要是数据的一次性获取,以及数据级缓存。在业务层和展现层中多采用页面级缓存或静态化等技术。而现在随着延迟加载和AJAX等技术的应用,页面的每一次加载时需要查询数据库的事务数明显增多,并且每次请求所获取的数据流明显减少。这就意味着在单台数据库可以服务的事务数固定的情况下,数据库可以支持的用户数明显减少。正因这样的原因,许多大型的网站,包括电子商务和SNS网站,正在借助内存数据库来大幅提高并发能,而Tokyo Cabinet和Tokyo Tyrant就是很好的选择。

 

图2中,分析比较了Memcached、MySQL+Memcached和Tokyo Tyrant这三者的TPS(每秒事务数)。MySQL+Memcached是现在很多网站所采用的,MySQL作为后端数据存储,Memcached用于前端数据缓存。在相同线程数的情况下,Tokyo Cabinet+Tokyo Tyrant的TPS约是MySQL+Memcached的2倍左右,略差于纯内存形式的Memcached。考虑到纯内存的Memcached没有数据持久化的功能,Tokyo Tyrant+Tokyo Cabinet在平衡数据存储和并发性能方面做的是比较成功的。

 

3.1.2 使用负载均衡提高并发

 

当单台Tokyo Cabinet已经无法满足性能需求时,Tokyo Tyrant提供了更为高级的负载均衡方式。这种模式在传统的MySQL服务器集群中采用的较多,但MySQL的配置较为复杂,而Tokyo Tyrant的配置相对简单。如图3所示,Tokyo Cabinet会通过时间戳来标记数据的版本,通过对Log日志的分发,将增量数据同步到从库中。而应用程序根据操作类型的不同,把写入或读取操作分配在不同的Tokyo Tyrant(主从)上进行。

 

clip_image004

 

clip_image006

 

clip_image008

 

另外,因为Tokyo Tyrant提供了HTTP协议的接入方式,在许多实际应用中,也有通过Nginx在前端建立负载均衡层,然后通过Nginx将不同操作,如写入或是读取,分配给不同的Tokyo Tyrant,甚至可以做到为不同的从库设置权重,以平衡在负载均衡时所需要承担的压力。这种方式的缺点是因为多了Nginx来实现负载均衡,性能上必然有损失。但优点是对于应用程序来说,任何对Tokyo Tyrant的读写操作都是透明的,不需要关心底层的Tokyo Tyrant的个数和主从分配方式。

 

3.2 提高系统的可靠性

 

3.2.1 故障转移模式的应用

 

Tokyo Tyrant也提供了通过热备方式来实现故障转移,对提高网站的可靠性来说非常有用。

 

首先客户端通过Memcached协议的addServer方法,向应用程序的服务器池中添加备份Tokyo Tyrant信息。当客户端应用程序通过Memcached协议向活动Tokyo Tyrant发起访问请求后,Memcached协议会判断活动Tokyo Tyrant是否工作正常,并且反馈给客户端。如果活动Tokyo Tyrant出现故障,那么客户端会从服务器池中调用备份Tokyo Tyrant的连接,经备份Tokyo Tyrant来完成相应的操作。而在这种模式中,两台Tokyo Cabinet的数据是自动同步的,所以相对于应用程序来说,是完全透明的。

 

3.2.2 对大数据文件有可靠支持

 

Tokyo Cabinet在64位的系统上。可以管理的数据量可以达到8EB,而在32位的系统上。可以管理的数据量可以达到8TB,而且在64位的系统中。单个数据库文件的大小也不仅仅限于2GB,可以更大,而且对于文件写入校验也非常灵活和高效,可以在保证性能的前提下,增加文件的可靠性,防止数据库文件的损坏。

 

3.3 降低软硬件投入成本

 

3.3.1 节省购买数据库授权的成本

 

当前主流数据库包括Oracle、Microsoft SQL Server和MySQL,MySQL有免费版本可供使用,但Oracle和Microsoft SQL Server均要购买授权。一方面,相对于MySQL来说,Tokyo Cabinet在性能方面有较大的优势。另一方面,相对于Oracle和Microsoft SQL Server来说,Tokyo Cabinet可以在保证并发性能的前提下,节省一笔可观的授权费用。

 

3.3.2 节省DBA的人力成本

 

从另一个角度来说,许多中小型的电子商务网站,对于数据库的使用仅仅限于一般的应用,换句话说仅仅是数据的存储工具。一般的技术人员在开发的同时,即可对数据库进行简单优化,这些优化已经能满足正常的需求。但是为了深入使用数据库自身的负载均衡、故障转移等功能,需要聘请专门的DBA进行开发、管理和维护。而Tokyo Cabinet和Tokyo Tyrant的维护和应用相当简单,一般的技术人员,经过短期的学习和培训,就可以实现负载均衡和故障转移等功能,甚至可以进行配置优化和二次开发。从这点上来说,把部分数据移植到内存数据库后,在人力成本上并不会有特别的增加。这点对于中小电子商务网站来说非常关键。

 

3.3.3 复用现有的硬件资源

 

Tokyo Cabinet和Tokyo Tyrant安装简单,不需要占用很多的系统的资源,而且在运行中自身占用内存和CPU等核心资源非常有限。因此在负载均衡或是故障转移等模式下,可以将从库或备用库安装在一些负载小的多应用服务器上,达到即节省硬件投入又有效提高可用性和可靠性。

 

3.3.4 开发成本小

 

Tokyo Cabinet和Tokyo Tyrant是完全的开源项目。当前Tokyo Cabinet提供了包括了C、C++、JAVA、.NET、Ruby、Perl甚至PHP的接口类库。而Tokyo Tyrant更可支持Memcached客户端协议,也可以通过HTTP协议进行数据交换。Memcached协议已经有比较高的认可度,相关的接口类库也很成熟,从这点来说,使用Memcached协议来连接Tokyo Tyrant是非常简易的。因此,在电子商务网站的开发和维护时,可以节省很多研发时间,有效地提高投入产出比。

 

4. 结论

 

综上,Tokyo Cabinet和Tokyo Tyrant的组合,构成了一款非常高效的内存数据库。它不仅具备优秀的高并发性能,也具备了一定的高可用性和高可靠性,在系统扩展和维护的简易性上也是可圈可点的。在中小电子商务网站中,可以将常用数据库与Tokyo Cabinet相结合,复杂的业务处理、统计事务等安排在常规数据库上,而将需要进行高速查询的数据分散在内存数据库中,从而使压力得以分散。而且,相对于昂贵的Oracle和Microsoft SQL Server,基于Linux的Tokyo Cabinet和Tokyo Tyrant提供了一种非常好的免费解决方案。

 

参考文献:

[1] 平林幹雄. Tokyo Cabinet: a modern implementation of DBM, online at: http://fallabs.com/tokyocabinet/

[2] Matt Yonkovit. MySQL-Memcached or NOSQL Tokyo Tyrant – part 3, online at http://www.mysqlperformanceblog.com/2009/10/19/mysql_memcached_tyrant_part3/
















本文转自UltraSQL51CTO博客,原文链接:http://blog.51cto.com/ultrasql/1643524 ,如需转载请自行联系原作者


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
存储 Oracle 关系型数据库
Oracle数据库的应用场景有哪些?
【10月更文挑战第15天】Oracle数据库的应用场景有哪些?
253 64
|
2月前
|
监控 JavaScript 算法
如何使用内存监控工具来定位和解决Node.js应用中的性能问题?
总之,利用内存监控工具结合代码分析和业务理解,能够逐步定位和解决 Node.js 应用中的性能问题,提高应用的运行效率和稳定性。需要耐心和细致地进行排查和优化,不断提升应用的性能表现。
206 77
|
4天前
|
缓存 NoSQL JavaScript
Vue.js应用结合Redis数据库:实践与优化
将Vue.js应用与Redis结合,可以实现高效的数据管理和快速响应的用户体验。通过合理的实践步骤和优化策略,可以充分发挥两者的优势,提高应用的性能和可靠性。希望本文能为您在实际开发中提供有价值的参考。
25 11
|
2月前
|
存储 缓存 JavaScript
如何优化Node.js应用的内存使用以提高性能?
通过以上多种方法的综合运用,可以有效地优化 Node.js 应用的内存使用,提高性能,提升用户体验。同时,不断关注内存管理的最新技术和最佳实践,持续改进应用的性能表现。
152 62
|
30天前
|
人工智能 容灾 关系型数据库
【AI应用启航workshop】构建高可用数据库、拥抱AI智能问数
12月25日(周三)14:00-16:30参与线上闭门会,阿里云诚邀您一同开启AI应用实践之旅!
|
2月前
|
存储 缓存 监控
如何使用内存监控工具来优化 Node.js 应用的性能
需要注意的是,不同的内存监控工具可能具有不同的功能和特点,在使用时需要根据具体工具的要求和操作指南进行正确使用和分析。
83 31
|
2月前
|
架构师 数据库
大厂面试高频:数据库乐观锁的实现原理、以及应用场景
数据库乐观锁是必知必会的技术栈,也是大厂面试高频,十分重要,本文解析数据库乐观锁。关注【mikechen的互联网架构】,10年+BAT架构经验分享。
大厂面试高频:数据库乐观锁的实现原理、以及应用场景
|
1月前
|
开发框架 .NET PHP
网站应用项目如何选择阿里云服务器实例规格+内存+CPU+带宽+操作系统等配置
对于使用阿里云服务器的搭建网站的用户来说,面对众多可选的实例规格和配置选项,我们应该如何做出最佳选择,以最大化业务效益并控制成本,成为大家比较关注的问题,如果实例、内存、CPU、带宽等配置选择不合适,可能会影响到自己业务在云服务器上的计算性能及后期运营状况,本文将详细解析企业在搭建网站应用项目时选购阿里云服务器应考虑的一些因素,以供参考。
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
83 1
|
2月前
|
JavaScript
如何使用内存快照分析工具来分析Node.js应用的内存问题?
需要注意的是,不同的内存快照分析工具可能具有不同的功能和操作方式,在使用时需要根据具体工具的说明和特点进行灵活运用。
59 3