美团生活服务个性化推荐实践

简介:

张彬(美团推荐算法高级研发工程师):2012年3月硕士毕业于北京邮电大学,有过两年的互联网广告工作经历,期间先后参与过user profile挖掘、实时竞价算法、ctr预估等多个核心项目,对RTB、DSP、DMP中的相关技术有较好的理解和认识,积累了丰富的经验。2013年初加入美团网,主要负责美团个性化推荐系统的构建和优化,通过完善召回算法和引入重排序模型等大幅度提高了系统的转化率。

美团作为全国领的本地生活服务平台,在本地生活服务推荐领域已经进行了一些探索,这个分享主要是对这些探索的一些总结。我们看到本地生活服务领域的推荐需要重度使用传统的推荐算法,同时也存在很强的特色。例如,在本地生活服务领域,商户的地理位置对用户的决策影响很大,针对这点我们做了大量基础工作。下面我们一同看下美团是如何实现个性化推荐的。

一、推荐美团的原因

1.活跃用户过亿,移动端交易占80%以上。

图1.美团移动交易占比逐年变化树状图

2.推荐方式:

◎推荐产品:10+推荐产品,每天服务 30M+ 用户

◎推荐形式:User2Items、Item2Items、Personal push、Others

◎推荐实体:

图2.美团推荐实体选用

◎推荐平台:Mobile、PC

◎其他方式:购买完成,评价完成,搜索无结果,附近团购,相关团购

 

 


图3.美团其他推荐方式

 

二、美团如今所面临的问题

1、用户购买与消费的空间距离很小

 


图4.分品类持券80%距离

 

2、用户购买与消费的时间差很短


图5.分品类持券时长

3、用户场景时刻在变化

如:地理位置不断变化,用户需求随位置而变,推荐的内容要适配这种变化等

4、用户行为稀疏,粘性不够强

相邻两次访问的时间间隔长,新用户流失比例高,生命周期偏短

5、数据多,用户请求量大

每天要处理的数据达到T级别,每天千万级的用户,上亿次请求

 

三、应对方案

针对上述诸多面临的问题,可采取如下等方案进行应对,如:强化地理位置特征;提高算法实时性;算法融合,个性化push;框架优化等。

1、地理位置

(1)对于地理位置的维度,可以通过实时地理位置、常去地理位置、工作地、居住地、消费地等位置信息进行确认。

(2)地理位置直接触发

     离线:挖掘区域消费优质deal和区域购买优质deal

 

图6.地理位置触发示意

在线:获取用户的地理位置信息,对区域deal列表进行加

(3)根据用户的地理位置轨迹计算用户相似度,与协同的用户相似度叠加权

   算法示意:

User1:geo1:count1; geo2:count2; geo3:count3 …

 

User2:geo1’:count1’; geo2’:count2’; geo3’:count3’ …

图7.算法示意地理位置信息

 

(4)基于消费poi的相似度计算

      Deal中包含的地理位置信息较弱

      Poi同时包含了用户的偏好与商圈倾向

 

图8.poi的相似度计算图示

(5)作为重排序模型的特征

     用户实时地理位置与deal所在poi的最近距离

     用户常去地理位置与deal所在poi的最近距离

     用户消费地理位置与deal所在poi的最近距离

2、实时推荐

对于实时推荐由于用户场景经常变化,需求随之而变;离线计算好结果的推荐方式适应性差;每次请求都要实时计算。

(1)实时数据流



图9.实时行为:搜索、筛选、收藏、浏览、下单

①算法使用新的用户行为数据进行推荐

未转化行为实时反馈至推荐结果


图10.实时数据流程图

②算法准实时更新

    Itembased cf 小时级更新

    看了又看:6%+ 提升

Userbased cf 准实时更新

增量计算

    4小时更新一次

(2)实时rerank

  子算法计算出来的权重考虑的因素太少

  不同子算法的权重不具有可比性

  模型选择

    线性、非线性结合

  特征

    deal维度的特征

    user维度的特征

    userdeal的交叉特征

    距离特征

  ◎在线特征抽取,模型实时计算

在线学习算法FTRL

 

(3)算法融合&push

①算法融合包括:

  加权型:对各个算法产生的候选集按照权重进行加权

  分级型:优先采用效果好的算法,再使用效果次好的算法,依此类推

  调制型:不同的算法按照不同的比例产生一定量的候选集组成总的候选集

  过滤型:当前的算法对前一级算法产生的候选集进行过滤,依此类推,候选集被逐级过滤,   

         最终产生一个小而精的候选集合

②个性化push

  用户相邻两次访问间隔长

  触及更多的用户,提升日活用户数

  不能过度打扰用户

最初的做法:用户拉取;Push时机不可调;系统压力大;不能实时推荐

改为push以后:根据用户的历史联网时间确定push发送时机,根据用户的实时定位发送,

发出率提高24%,打开率提高21%,综合转化率提高94%

(4)框架优化


图11.框架优化示意图

 

图12.海量数据处理示意图

 

随着日益增长的用户请求,将业务进行拆分,较重的业务独立出来;采用多算法并行;建立统一数据模型,减少冗余请求。

运用触发层与排序层分离;模型训练并行化;参数实时加载,支持快速调参达到快速的效果迭代。

 

 

整个优化方案将地理位置因素的引入:解决用户冷启动和稀疏性,提高推荐精度;

将候选集进行融合:提高了推荐的覆盖度、多样性;引入重排序模型:解决了候选集增加以后deal之间排列顺序的问题。我们争取以数据为基础,用算法去雕琢,发现问题并进行修正,运用良好的基础架构,高效的算法迭代,发挥团队的力量。


PPT http://club.alibabatech.org/resource_detail.htm?topicId=186

 

相关文章
|
4月前
|
边缘计算 人工智能 搜索推荐
大数据与零售业:精准营销的实践
【10月更文挑战第31天】在信息化社会,大数据技术正成为推动零售业革新的重要驱动力。本文探讨了大数据在零售业中的应用,包括客户细分、个性化推荐、动态定价、营销自动化、预测性分析、忠诚度管理和社交网络洞察等方面,通过实际案例展示了大数据如何帮助商家洞悉消费者行为,优化决策,实现精准营销。同时,文章也讨论了大数据面临的挑战和未来展望。
|
5月前
|
机器学习/深度学习 监控 搜索推荐
电商平台如何精准抓住你的心?揭秘大数据背后的神秘推荐系统!
【10月更文挑战第12天】在信息爆炸时代,数据驱动决策成为企业优化决策的关键方法。本文以某大型电商平台的商品推荐系统为例,介绍其通过收集用户行为数据,经过预处理、特征工程、模型选择与训练、评估优化及部署监控等步骤,实现个性化商品推荐,提升用户体验和销售额的过程。
227 1
|
搜索推荐
142 推荐系统架构(淘宝和京东)
142 推荐系统架构(淘宝和京东)
265 0
|
搜索推荐 算法 前端开发
每日好店——淘宝店铺推荐系统实践
每日好店——淘宝店铺推荐系统实践
949 0
|
前端开发 安全 数据挖掘
这是一篇讲解用户行为分析的推荐书单和总结
推荐有关用户行为的书单,对其中一本进行总结:能对用户行为数据发挥价值的过程建立系统的认知,主要是给出了指标体系的建设,针对搜索这个场景举了一个例子。让读者能够快速实践。
446 0
|
SQL 分布式计算 数据可视化
淘宝大数据分析案例
淘宝大数据分析案例
678 0
淘宝大数据分析案例
|
存储 运维 监控
历时三个月,微博推荐引擎架构蜕变之路
可靠性保障是一个复杂的系统工程,特别对于可靠性已经出现问题的线上服务,在业务迭代、成本约束、人力投入等方面的约束下 ,提升其可用性就不再是单纯的技术问题了。
326 0
历时三个月,微博推荐引擎架构蜕变之路
|
机器学习/深度学习 存储 分布式计算
【云栖号案例 | 互联网】网鱼网咖通过大数据架构 极致洞察会员偏好
如何更好的了解会员偏好,更好的服务会员是网鱼网咖的业务焦点。通过大数据赋能业务,为客户提供不同个性化服务,大大的提升客户体验及满意度。
【云栖号案例 | 互联网】网鱼网咖通过大数据架构 极致洞察会员偏好
|
机器学习/深度学习 搜索推荐 算法
优酷视频基于用户兴趣个性化推荐的挑战和实践
本文将介绍一下优酷个性化搜索推荐的服务,优酷在视频个性化搜索推荐里用户兴趣个性化表达碰到的挑战和问题,当前工业界常用的方法,以及我们针对这些问题的尝试。
4136 0
|
搜索推荐
【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战
人工智能千千万,没法落地都白干。 自从上次老司机用神经网络训练了热狗识别模型以后,群众们表示想看一波更加接地气,最好是那种能10分钟上手,一辈子受用的模型。 这次,我们就通过某著名电商公司的公开数据集,在阿里云大数据生态之下快速构建一个基于协同过滤的推荐系统!
5298 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等