性能对转化率影响评估方法

简介: 性能对转化率影响评估方法

1. 背景

业内已经有丰富的数据证明快速的网页浏览及操作体验对转化率等业务指标有明显的促进作用:

A. Google found out that slowing search results by just 4/10ths of a second would
reduce the number of searches by 8,000,000 per day.

B. You have 5 seconds to engage a customer before they leave your web site.

C. For every 1 second speed improvement to the Amazon website conversions increased +2%

....

AE有面向全世界的用户,这些用户处在参差不齐的网络环境中,且由于跨洲际访问机房的天然的物理距离也会使得AE的用户性能体验无法与淘宝这样内贸网站相提并论。在这种情况下,一方面由于AE性能优化空间更大,对转化率提升的空间也更大;另一这方面由于用户环境的千差万别,以及天然距离,使得AE性能优化的投入成本也会非常距大,比如AE可能需要建立区域机房就近服务于用户才能解决性能问题。

如何精确量化性能回报(即量化性能优化带来的转化率提升最终带来GMV的提升),从而精确计算投入产出比,是AE性能优化工作的前提。业内虽然有较多数据证明性能与转化的关系,但在精确衡量投入产出时,每个网站都是不同的无可比性,且很多数据结果由于数据不足够充分也只能定性不能定量。

基于阿里巴巴ODPS的大数据处理能力的优势,AE性能优化小组@桑植、@跑者、@阿四、@子伟、@冯嘉、@涛明、@震羽、@验钞提出并实现了大数据时代的度量方法,通过采集真实用户访问AE网站的性能Latency数据,以及真实的转化率数据,实现最精确的性能转化度量。

目前这一度量还在内部测试调优过程,且已经在内部性能优化中使用,待稳定成熟后,希望能够贡献出来,让集团内部的用户使用起来。

2. 目标

1)通过大数据的采集、计算、分析,验证性能与转化率等业务指标的关系

2)通过大数据的方法,量化性能对转化率的影响

3)做出通用可复制、业务无关的方案,提供给更多有此类需求的同学使用

3. 方案

3.1 基本思路

_
1)浏览器异步执行JS,JS调用Navigation timing API获取当前页面各阶段Latency,并将Latency数据及当前页面唯一标识ID、当前用户Cookie_id异步发送打点服务器

2)打点服务器通过TT将数据导入ODPS

3)ODPS中按Latency分组,将各请求样本分到其Latency所对应的组中

3)将PV数据按上下游链接关系关联起来,从而计算转化率

4)分别计算各组中样本转化率

5)最终得出曲线,是在页面功能及业务状态基础上,各Latency范转内的转化率趋势

3.2 关键技术要素

A. 浏览器Navigation-timing和Resource-timing API是方案得以实施的关键技术基础,API由W3C在2012年底提出,它可以让我们获取到页面各个重要的Latency数据

B. ODPS及相关大数据附属技术产品的的开放性、易用性、处理能力使得方案得以顺利实施

3.3 实现细节及相关SQL这里暂不详细介绍,欢迎线下交流

3.4 量化性能优化带来的转化率提升

1)已经计算出性能区间内的转化率

2)统计所有样本在各性能区间内的分布,得出各性能区间的样本占比

3)将优化后的样本在性能区间内的占比乘以所在性能区间的转化率,得出A

4)将优化前的样本在性能区间内的占比乘以所在性能区间的转化率,得出B

5)B-A即得出性能优化所带来的转化率提升

通过一段时间的观察,在大的样本集下,性能与转化率曲线保持稳定。

4. 结果

_
图中为真实的AE某一分站的搜索数据,柱状图为各性能区间的样本占比,黑色线为各性能区域的转化率,绿色线为各性能区间的跳出率

5. 常见Q&A

Q1:如何排除性能外的业务因素对转化的影响?

A1:此方案单纯的是按性能进行分组统计,在大的样本下,我们可以假定各性能区间内的业务条件是等同的,因此可以不考虑业务因素的影响。当然,还需要更多的时间去证明

Q2:当业务因素变化时,会使得各性能区间内的转化数据发生变化,一般会提升,那如何随时时间去衡量性能带来的转化提升?

A2:每次度量时,以时间最接近的曲线为主,按3.4的方法进行计算。后续会按需看是否采用线性回归,按自然时间上的表现拟合出一条曲线,这样可以去除掉某一天的波动

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
20天前
|
机器学习/深度学习 监控
大模型开发:你如何在保持模型性能的同时减少过拟合的风险?
为应对大模型过拟合,采用正则化(L1/L2/Dropout)、早期停止训练以监控验证集性能,通过数据增强提升模型泛化能力,选择适合问题复杂度的模型,使用集成方法(如Bagging/Boosting)增强稳定性,以及利用预训练模型进行迁移学习。这些策略结合使用能有效降低过拟合风险,提高模型泛化性能。
22 2
|
算法 数据挖掘 数据库
priori 算法的影响因素分析| 学习笔记
快速学习 priori 算法的影响因素分析。
461 0
priori 算法的影响因素分析| 学习笔记
|
2月前
|
监控 测试技术
“我就优化了下,影响不大的”
“我就优化了下,影响不大的”
12 0
|
7月前
|
机器学习/深度学习 算法
评估系统或算法质量的重要指标
准确性(Accuracy):衡量系统或算法输出结果与真实结果之间的接近程度。通常使用分类准确率、回归误差等指标来评估。 精确率(Precision)和召回率(Recall):主要用于评估分类模型的性能。精确率衡量预测为正例的样本中实际为正例的比例,召回率衡量实际为正例的样本中被正确预测为正例的比例。
147 4
|
8月前
|
机器学习/深度学习 计算机视觉 数据可视化
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
2670 0
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
|
12月前
|
搜索推荐 算法 UED
推荐算法如何影响我们的生活
在生活中,我们经常面对需要决策的问题时,会使用多种策略来帮我们做出决策。诸如“我应该买哪个品牌手机?”,“我应该看哪部电影?”,“中午吃什么好?”等问题。我们做出选择时一般会依赖于朋友的推荐、在线评论、网上搜索和其他方法。 网上购物的兴起只会让这个决策过程变得更加复杂,因为购物者现在面临着更多的选择。互联网让我们从物质匮乏的时代变成了物质丰富的时代! 推荐引擎是帮助我们进行决策的工具。从推荐产品、要观看的电影、微信上的朋友到朋友、要阅读的新闻文章、搜索引擎优化、餐厅等等。在某种程度上,这些算法正在改变我们的决策过程。
166 0
|
测试技术 微服务
测试质量保障的影响因素
测试质量保障的影响因素
150 0
测试质量保障的影响因素
|
存储 传感器 机器学习/深度学习
V2X会是未来趋势吗?看看这种轻量级方法,大幅降低碰撞概率!
本文提出了一种Ledger概念,它通过Ledger信息的广播,在一个资源预留区间(RRI)内向网络中的每辆车传递碰撞信息。碰撞车辆知道它已经与其他车辆相撞,并将在下一个 SPS 期间重新选择。除此之外,其他协议都遵循 SPS。通过引入 Ledger,虽然牺牲了14.29% 的资源,但最终可以降低碰撞概率。本文使用蒙特卡罗模拟器对Ledger系统的性能进行了验证和分析。数值结果表明,遵循 SPS 协议,Ledger 系统可以使碰撞概率在一定数量 RRI 后收敛到零。
V2X会是未来趋势吗?看看这种轻量级方法,大幅降低碰撞概率!
|
数据采集 分布式计算 监控
数据质量影响因素 | 学习笔记
快速学习数据质量影响因素
213 0
数据质量影响因素 | 学习笔记
|
机器学习/深度学习 人工智能 监控
降低模型输出风险的三种方法(Valohai)
地球上的每一项业务和行为都包含风险,包括机器学习,或者更广泛地说人工智能也是如此。但是,出于多种原因,您公司的传统风险管理通常不会处理 AI 风险。 首先,算法通常基于专有数据,模型和技术是在特定(业务)问题的领域范围内开发的。其次,算法可能是复杂的、不可预测的并且难以解释。最后,ML 场景相对较新,因此我们也缺乏最佳实践,同时,监管滞后。