云场景实践研究第40期:网聚宝

本文涉及的产品
云拨测,每月3000次拨测额度
简介: 作为阿里云的深度用户,网聚宝的成长和阿里云的成长已经深深交织在了一起,在公开的5个产品技术上总投入资源大约是同类产品的1/5。作为一个中小规模的技术团队,客户已有3000多家品牌。本文将详细解读网聚宝在使用阿里云产品4年的过程中,基于云计算的架构心得。
更多云场景实践研究案例,点击这里: 【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽
作为阿里云的深度用户,网聚宝的成长和阿里云的成长已经深深交织在了一起,在公开的5个产品技术上总投入资源大约是同类产品的1/5。作为一个中小规模的技术团队,客户已有3000多家品牌。本文将详细解读网聚宝在使用阿里云产品4年的过程中,基于云计算的架构心得。
“对于创业公司来说,云服务已经比Hadoop这些开源软件成熟,这个时候就会发现,这些会应用阿里云的人,业务创造能力是那些Hadoop的许多倍,直接产生业务价值,而用户最需要的就是这些。从而拥有了竞争优势的成本,和业务拓展的速度,来给用户提供大数据处理的能力。”
“团队规模这么小,怎么去和别人竞争?在云计算时代,网聚宝的实际经验是:上云,至少在技术生产侧,可以提供10倍的生产力”
——刘立兼
上海云贝网络科技有限公司首席架构师 

采用的阿里云产品
  • 阿里云云数据库 Memcache 版 原名OCS
  • 阿里云云数据库 Redis 版
  • 阿里云云数据库 MongoDB 版
  • 阿里云分析型数据库 AnalyticDB 简称ADS
  • 阿里云表格存储 Table Store 原名 OTS 
  • 阿里云大数据计算服务 MaxCompute 原名 ODPS
  • 阿里云云数据库 RDS
  • 阿里云业务实时监控服务 ARMS
  • 阿里云分布式关系型数据库服务DRDS
  • 阿里云数据集成 Data Integration
  • 阿里云推荐引擎 Recommendation Engine
  • 阿里云企业级分布式应用服务 EDAS
  • 阿里云云服务器 ECS
  • 阿里云弹性伸缩 Auto Scaling
  • 阿里云消息队列 MQ
  • 阿里云日志服务 Log Service 
  • 阿里云DataV数据可视化
  • 阿里云数据管理DMS
  • 阿里云Web应用防火墙
  • 阿里云安骑士
  • 阿里云移动安全
  • 阿里云数据风控
  • 阿里云持续交付平台 CRP

为什么使用阿里云
云服务有一个非常明显的特性,即将底层能力与上层应用切割,同时将通用能力与具体业务逻辑分开,在未来开发中,很适合网聚宝创业团队根据业务的需求快速搭建系统。

关于 网聚宝
上海云贝网络科技有限公司正式成立于2011年,是业内领先的全域大数据解决方案服务商,已成功帮助上千家国内外品牌商,搭建以消费者为中心的一站式全域大数据平台,连接品牌在所有渠道中的每一个消费者,助力品牌实现全渠道大数据洞察消费者特征,挖掘人群个性喜好,实现消费者的全渠道互动和CRM精准营销。为品牌在互联网+大数据时代,提供专业的品牌全域大数据服务。

创业之艰难
2011年网聚宝刚开始创业,最初托管几台机器,老是断网。而Hadoop最早也有研究,但是创业公司人力资源有限;同时,如果只招一个两个肯定不够,搭建、运维、开发,至少也得五六个。限于这些原因,创业之初竞争很被动,有人说网聚宝有十五六个在搞Hadoop,数据只需要放在自己的机房中,这些对客户来说都有着很大的吸引力,网聚宝也为要不要从零开始完全上云而动摇过。

为什么选择阿里云?

网聚宝上云之路
在阿里云的强力配合和支持下,网聚宝还是坚持下来,从零开始完全上云,放弃了原有的Hadoop。网聚宝的架构如下图所示,整个架构大致有三个部分, 数据中心云基础设施上层应用服务
ed830b0f8ca7cc273f4d2fbe75ee08bce32e1ce0
数据来源:
最下面是底层可以收到的数据来源,大概有三种类型的数据源支撑我们现在的数据服务:第三方自有的平台,公共的电商平台和公开的信息平台。

数据采集:
我们通过十几个,几十个数据采集服务,把这些原始数据采集到数据中心。数据采集同时也承担了数据清洗和格式化的工作,这对于数据是否可以顺利进入数据中心非常重要。

数据中心:
包含了OLTP层,ETL层和OLAP层这三个数据加工层级。还包含了特定场景的数据分析引擎和特有生态的数据服务。这是最核心的一部分。
在OLTP层,我们将高结构化数据存入关系型数据库集群,这里得益于 阿里云的DRDS的支持,使得数据的水平Sharding变得特别容易。同时我们也会把低结构化数据存储在阿里云的Nosql产品中,我们是用了 OCSRedisOTMongoDB四款阿里云的Nosql产品来应对IO要求和结构化程度不同的各类数据。
在ETL层,我们将加工数据的逻辑写成一个个小的加工服务,配合数加IDE便捷的配置管理,与 ODPS几乎无底洞一般的大数据运算能力,将OLTP层的数据加工为可供上层业务系统使用的数据形式。
在OLAP层,我们分别面对在线分析和离线报表两种场景。对于在线分析,我们分别使用 ADSODPS RDSARMS和部分Nosql产品来组和解决不同的在线分析场景。
数据分析引擎主要提供特定场景下的数据分析的服务。我们是用了公众趋势分析来对品牌的市场舆情做分析,提供给客户关于品牌的最新反馈和决策依据。 推荐引擎在我们的主要客户,零售企业来说非常有用,直接关系到是否提升销售额。

Daas API:
我们通过 阿里云的API服务,将数据中心的基础数据与加工数据,通过1.数据维度,2.业务维度,3.调用维度三个方向进行切分,然后通过API透传给我们的各类合作方。
94774e8e8dab8234d23282fcff195e1f3a3cc877
微服务中间件套件:
这是我们基于云开发应用服务的核心。我们原来使用Dubbo作为我们服务化的框架,目前正在往 阿里云的Edas迁移。上图是基于Edas的架构图。
服务化对于需求高度变化/不确定的业务领域特别重要,云服务作为最底层的基础设施是一级火箭,基于服务化构建的大中台就是二级火箭。云服务推动大中台的快速产生,大中台就推动小前台快速试错、实践、实现各类市场的需求。
ECS配合 弹性伸缩可以非常好的应多系统强度的起伏与扩展。Docker的提供使得部署于调整变得更加方便。其他一些比如网络的弹性扩容,专网可接入等特性,使得给客户提供方案时特别灵活,也增加了我们获得市场机会的几率。
阿里云的消息队列产品使网聚宝基本上不怎么需要关心数据分发量的问题,更不需要去担心宕机的可能了。任务调度产品使网聚宝基本不用担心会不会任务没有定时启动的问题,这也是网聚宝原来使用定时任务最担心的事。

开发套件:
网聚宝使用了阿里云的三个产品来支持公司的开发工作。第一个是 阿里云持续交付平台(CRP)。网聚宝在CRP上开发了文档自动化、代码质量自动检查、异常数据扫描、提交人责任管理等,用于确保每一次代码提交都被监控,代码来源可追溯。
第二个是 阿里云的日志服务,阿里云目前提供的日志服务可以积累最原始的监控信息,网聚宝利用阿里云的 ARMS来加工部分原始信息,特别是性能统计类的信息,最后结合 数加的Datav来做到图形化。
最后一个就是 阿里云的DMS,DMS可以非常直观的表现出SQL的执行状态,会话的状态,最关键的是他可以根据需要生成诊断报告。

运维套件:
阿里云的ROS对于网聚宝的独立部署客户是最有用的。网聚宝针对不同体量和需要的客户,在阿里云的ROS上创建好模板,真正需要部署时只需要稍加调整,就可以自动部署完各种云资源以及配置。网聚宝基于 云监控的SDK结合日志服务,再自己写了一套监控系统。网聚宝把阿里云的日志服务中获取的部分性能数据在 ARMS中做实时的聚合,然后配合 Datav显示出来。

全链路安全套件:
网聚宝目前主要使用了 安骑士增强版web应用防火墙移动安全绿网数据风控这几个安全产品。
f9ca500816c9d9aca6e896a77991a6471626015a
数据应用服务:
这部分服务主要对应OLTP的场景,强调交互简单、响应速度快、易于理解使用等与体验有关的指标。从图上可以看到,记录管理类的服务很多都是数据应用类的服务。这部分服务更多的会依赖于云服务基础设施的能力,对于数据中心的应用大都局限于OLTP数据库的那些产品,比较单纯。

Saas应用:
从图上看起来,许多的服务组成了最终的产品,没有阿里云的数据产品和服务基础设施,网聚宝就无法用比较低的代价,构建出一整套大中台小前台的灵活系统,也就无法灵活地争取市场的机会。

Paas API:
无论是客户本身还是领域的合作方,基于API可以实现数据与应用逻辑的互通,使得解决更深层问题也变得可能。

拥抱阿里云的成效
网聚宝现在公开的5个产品(参照: http://www.wangjubao.com)。技术上总投入资源大约是同类产品的1/5。作为一个中小规模的技术团队,可以同时支撑5个产品,而且这仅仅是公开的市售的标准产品,还不包含定制开发、合作开发和独立拆卖的产品。而网聚宝的客户,已有3000多家品牌了。国际上包括:Nike、哥伦比亚、狼爪、Northface等。国内有佐丹奴、意尔康、丽音坊等。还有像顺丰海淘、美美箱这种纯电商。此外还有零售、快消、线下服务业、金融等各个维度的品牌。

关于网聚宝的更多实践详情: 十则围之,关于上云的实践与思考
原文发布日期:2017-02-23
云栖社区场景研究小组成员:丁匀泰,仲浩。
相关实践学习
数据库实验室挑战任务-初级任务
本场景介绍如何开通属于你的免费云数据库,在RDS-MySQL中完成对学生成绩的详情查询,执行指定类型SQL。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
11月前
|
数据中心 云计算
《云上大型赛事保障白皮书》——第一章 大型赛事云上数字化转型——1.1 历史背景
《云上大型赛事保障白皮书》——第一章 大型赛事云上数字化转型——1.1 历史背景
131 0
|
11月前
|
存储 数据采集 人工智能
数智洞察 | 大国科技博弈,开放科学平台的“四步”开源之旅
编者按: 20世纪末,科学界发起了一系列体现“参与、包容、分享、合作、公开、透明”理念的开放科学运动,包括开源软件、开放获取、开放数据以及开放基础设施和平台等。开放科学运动的发起是为了克服传统封闭的科学模式造成的种种弊端,比如过高付费墙造成知识鸿沟与不平等。 当前,随着时代发展,从开放获取迈向开放科学,已经成为全球共识,全球科研模式也因此发生深刻变革。但我国目前要实现开放科学还面临着许多问题,如何构建开放科学的中国路径、制定互惠共享的国际科技合作战略是我国开放科学发展的未来思路。 本文约3562字,建议阅读时间9分钟。
|
开发者
“共携手,趣挑战!”——阿里云开发者能力评测团队排位赛正式开赛!
阿里云开发者能力评测团队排位赛开始啦!比赛时间为2月28日—3月20日,您可以叫上技术小伙伴一起组团参赛,不断刷新自测成绩,取得好的名次,获取丰厚的奖励!
“共携手,趣挑战!”——阿里云开发者能力评测团队排位赛正式开赛!
|
分布式计算 大数据 关系型数据库
云场景实践研究第83期:众安保险
当传统保险公司还在将“开门红”作为重中之重提前几个月做准备的时候,互联网保险公司关注的则是“双十一”和“双十二”。2017年双十一当日,刚刚在香港上市的众安保险的保单量突破3亿,比2014年增长超过200%。阿里云所输出的服务,则在帮助基础设施建设发挥“乘数效应”。
1891 0
|
监控 BI 分布式数据库
云场景实践研究第81期:大搜车
2017云栖大会HBase专场,大搜车高级数据架构师申玉宝带来阿里云云数据库HBase在大搜车金融业务中的应用实践。本文主要从数据大屏开始谈起,进而分享了GPS风控实践,包括架构、聚集分析等,最后还分享了流式数据统计,包括数据流、数据合流和服务监控等。
2007 0
|
存储 弹性计算 安全
云场景实践研究第80期:华大基因
作为全球最大的基因组学研究中心,华大基因在阿里云的帮助下,实现了海量数据的及时获取、快速分析、安全储存。本文将带领大家一同了解华大基因的基于大数据分析的云计算实践之路。
4354 1
|
运维 分布式数据库 Hbase
云场景实践研究第82期:亿方云科技
2017云栖大会HBase专场,亿方云科技CTO 王成军带来HBase在亿方云客户端同步系统中的应用实践的演讲。本文分析亿方云科技在HBase方面的实践,并对亿方云HBase演进和应用作了分享。
1967 0
|
新零售 机器学习/深度学习 分布式计算
云场景实践研究第87期:汇合营销
借助阿里云数加平台的力量,汇合营销确立了三大优势之一之技术优势,打破了海量数据处理分析和实时查询分析的技术瓶颈,而作为精准营销广告提供商,算法模型的好坏直接与最终收益挂钩,所以借助阿里云数加的机器学习平台可以起到事半功倍的效果。
2093 0
|
安全 NoSQL 大数据
云场景实践研究第51期:趣店
对于像趣店这样的创业团队而言,由于成本问题,自建IDC显然是不现实的,所以趣店在创业之初就选择了上云。如今,趣店对于阿里云存在着深度依赖的关系,只要有需求一来,技术团队首先会去思考阿里云有没有这样的服务,这样的方式帮助趣店将精力集中在自己的业务本身,使得产品能够迅速得以迭代。
2088 0