魅族高级架构师何岳娟:数据分析助电商笑对用户蜂拥而至这件好事

简介:


  WOT2015"互联网+"时代大数据技术峰会于2015年11月28日于深圳前海华侨城JW万豪酒店盛大揭幕,42位业内重量级嘉宾汇聚,重磅解析大数据技术的点睛应用。秉承专注技术、服务技术人员的理念。DBA+社群作为本次大会合作方,将通过图文直播为大家全程跟踪报道这场技术盛宴。   


许多电商平台都会经历相似的过程:流量和业绩每年以几倍至十几倍的速度增长;瞬间访问量可能是平时的几十倍;网络带宽被占满,用户响应很慢;机器负载高甚至宕机;数据库压力过大导致服务不可用……


大数据技术的发展引发众多电商架构师思考,在面对用户蜂拥而至这件好事,如何在海量数据处理中实时发现有效信息,为构建稳定高效的系统架构设计提供指导。在【WOT2015"互联网+"时代大数据技术峰会】 现场,魅族电商平台高级架构师何岳娟就魅族电商平台架构变迁之路的经验和体会和大家进行交流。


>>>> 高速发展下的问题 

何岳娟告诉记者,魅族电商架构分为四个层级:


  • 业务层:第三方天猫,京东,苏宁与官网的商城及APP;

  • 业务服务层:交易,新品发布,手机导购,推荐服务为各平台提供营销策略;

  • 基础服务层:订单,用户,支付,库存,图片等为业务服务与营销层提供基本的服务点;

  • 据层存储层:MySQL, NoSQL, MQ , HBase以及一些分布式文件系统


基于这四个层级产生的数据建立分析平台, 对用户行为用户需求进行分析。


随着魅族近两年的发展,用户对其电商平台的关注度越来越高,用户增长速度非常快。在享受这种进步的同时,平台性能也在经历严峻考验。谈及贯穿平台架构变迁之路的指导思想,何岳娟将提升高可用、高并发、容灾性三个能力的提升视为核心,来实现对网站稳定性能的保障。抢购场景中LVS崩溃、DDoS攻击、刷单带来的高并发以及抢购时服务器如何实现快速扩容等,都是在业务高速发展下迫切需要解决的问题。


>>>> 变迁之路绕了哪些远 

在针对这些问题进行平台架构变迁的过程中,何岳娟和魅族技术团队曾经也走过许多弯路。比如说之前用GLSB、OSPF、智能DS分发解决数据容灾问题。但采用OSPF时,要对整个机房交换部署模式进行变造,影响非常大。而且,OSPF也并不能很好地解决魅族电商平台高并发故障迁移的问题。


这是因为在遭遇高并发时,LS、分发服务器不保证不会崩溃,一旦崩溃,转给其他的分发服务器,其他的分发服务器也不具备承受能力。魅族后来直接放弃了这个方案,结合业务需求和自身能力,改为族采用放弃一部分用户然后采用活动能正常的进行下去来做LS断点的问题。


新方案的优势在于,当一个机房的LS宕或是群宕掉时,可以自动切换到其他机房。何岳娟秀露,魅族计划采用GLSB,进行大LS的方案解决以后更高并发的模式以及以后跨机房容灾的问题。


>>>> 利用数据评级防止误伤 

对于“黄牛”这个世界性难题,魅族在最开始把只它看成功能性防御。但实际上,这种数据请求的模式极有可能出现伪造数据。因此,魅族通过对用户行为数据分析构建了信用分值评估系统,如果用户行为数据是伪造数据的话,在进行分析时可以看到,这些数据非常“死板”。


所谓“死板”,就是说黄牛一般只会注册一个帐户,而不会关注魅族官网,在网站只留下非常有限的行为信息,可以将具有这种特点的用户看作是是死点用户。而如果是在整个官网体系里比较活跃的用户,系统会将他评为优质用户。


一般来讲,面对评级较低的用户,系统在做防杀时会有一些“误伤”的现象。为了避免一些评级较低的用户无法正常方问,在做防杀的时候,魅族不会没有把所有的数据全部“干死”,而是将自有数据与第三方数据进行交换,引入第三方的数据评级,对两者数据分析结果进行对比之后再进行防御。


>>>> 跨机房容灾和数据同步仍待探索 

何岳娟表示,跨机房容灾和跨机房的数据同步问题,仍然是魅族在未来一段时间内关注的重点。魅族在这些方面一直在努力,比如在魅族有一个OKR评级功能,这个评级会根据业务故障时间来评级。这种互联网评级模式不可能做到不产生故障,但可以尽量减少故障产品的产生。


对于技术和工具的选型,何岳娟的建议在选用新功能前,一定要对性能进行前期测试。一旦产生问题,通过测试可以及时暴露出来,引导我们寻找解决方案。对于实在解决不了的问题,魅族会选择直接放弃这种模式,而在上线采用第三方服务。当然,还是要注意对服务进行大规模、全方位的测试,来避免之后突发情况下的措手不及。


本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2015-12-01

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3月前
|
存储 大数据 数据库
电商数据分析-02-电商业务介绍及表结构
电商数据分析-02-电商业务介绍及表结构
|
4月前
|
SQL 分布式计算 数据可视化
Spark SQL案例【电商购买数据分析】
Spark SQL案例【电商购买数据分析】
|
6月前
|
机器学习/深度学习 数据可视化 算法
数据分析和机器学习的11个高级可视化图表介绍
可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。
111 0
|
3天前
|
供应链 搜索推荐 数据挖掘
Pandas实战案例:电商数据分析的实践与挑战
【4月更文挑战第16天】本文通过一个电商数据分析案例展示了Pandas在处理销售数据、用户行为分析及商品销售趋势预测中的应用。在数据准备与清洗阶段,Pandas用于处理缺失值、重复值。接着,通过用户购买行为和商品销售趋势分析,构建用户画像并预测销售趋势。实践中遇到的大数据量和数据多样性挑战,通过分布式计算和数据标准化解决。未来将继续深入研究Pandas与其他先进技术的结合,提升决策支持能力。
|
3月前
|
数据采集 运维 监控
电商数据分析-03-电商数据采集
电商数据分析-03-电商数据采集
|
3月前
|
供应链 UED
电商数据分析-01-电商数据分析指标
电商数据分析-01-电商数据分析指标
|
5月前
|
数据采集 SQL 数据可视化
79 网站点击流数据分析案例(整体技术流程及架构)
79 网站点击流数据分析案例(整体技术流程及架构)
51 0
|
6月前
|
机器学习/深度学习 数据可视化 算法
数据分析和机器学习的11个高级可视化图表介绍
数据分析和机器学习的11个高级可视化图表介绍
|
6月前
|
数据挖掘 索引 Python
【100天精通Python】Day60:Python 数据分析_Pandas高级功能-数据透视表pivot_table()和数据交叉表crosstab()常用功能和操作
【100天精通Python】Day60:Python 数据分析_Pandas高级功能-数据透视表pivot_table()和数据交叉表crosstab()常用功能和操作
107 0
|
6月前
|
存储 并行计算 数据挖掘
【100天精通Python】Day59:Python 数据分析_Pandas高级功能-多层索引创建访问切片和重塑操作,pandas自定义函数和映射功能
【100天精通Python】Day59:Python 数据分析_Pandas高级功能-多层索引创建访问切片和重塑操作,pandas自定义函数和映射功能
69 2