Qunar用户画像构建策略及应用实践

简介:


image

 1.用户画像的构建原则

我们做用户画像的目的有两个:

必须从业务场景出发,解决实际的业务问题,之所以进行用户画像要么是获取新用户,或者是提升用户体验,或者是挽回流失用户等有明确的业务目标 。根据用户画像的信息做产品设计,必须要清楚知道用户长什么样子,有什么行为特征和属性,这样才能为用户设计产品或开展营销活动。
一般常见的错误想法是画像维度的数据越多越好,画像数据越丰富越好,费了很大的力气进行画像后,却发现只剩下了用户画像,和业务相差甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说得不偿失。鉴于此,我们的画像的维度和设计原则都是紧紧跟着业务需求去推动。

2.用户画像数据仓库构建

2.1 数据源的集成


image

目前Qunar用户画像数据仓库中的数据源来自业务数据库的数据和用户行为日志数据,目前数据仓库中基本涵盖了机票、酒店、火车票以及保险等业务系统的数据,可以从全方位的了解去哪儿的一个用户的画像。

2.2 我们有哪些数据?-数据维度


image

  2.3 我们有哪些数据?-数据仓库

目前我们画像数据仓库的构建都是基于Qunar基础数据仓库进行构建,并按照维度进行划分。


image

  目前数据仓库中包括的信息如下:

画像数据仓库表20个画像数据仓库国内、国际 2年+数据标签数据每日增量
–基本数据

–业务数据

–搜索

–Booking

2.4 用户唯一标识设计

用户唯一标识是整个用户画像的核心,它把从用户开始使用app到下单到售后整个所有的用户行为轨迹进行关联,可以更好的去跟踪和描绘一个用户的特征。


image

  2.5 ETL过程设计-调度系统

依赖数据平台调度系统定时触发和Job依赖触发两种模式


image

  2.6 ETL过程设计-任务执行

ETL的过程主要是将数据源的清洗到数据仓库表的过程(每天更新增量)Summary表的处理逻辑(每天更新全量)标签库的处理(每周更新,2年全量)

image

  2.7 用户主题分析及数据挖掘

有了丰富的画像数据后,产品和运营人员可以根据用户主题进行数据分析和数据挖掘相关的工作。用户主题Cube的定义如下:

Measure:
–订单数量

–订单金额

–搜索次数

–Booking次数

Dimension:
–下单时间

–出发时间

–航司信息

–舱位信息

–航班(出发地、目的地)

–基本信息(年龄、性别等自然属性)

image

  3.用户画像标签构建策略

3.1用户标签特征属性

用户的特征属性可以是事实的,也可以是抽象的;可以是自然属性,比如性别,年龄,星座等,可以是社会属性,比如职业,社交,出生地等;还可以是财富状况,比如是否高收入人群,是否有豪车豪宅等固定资产,对于机票用户来讲位置特征也是比较重要的属性,比常驻地,常出差地,老家等。这些属性都可以清楚的描绘一个用户的画像特征。


image

画像标签一般根据公司的业务体系来设计,存储有HDFS,HBASE,ES标签的更新频率:每日更新,每周、每月更新标签的生命周期:有的数据随时间衰减迭代
3.2用户标签分类及特征项

提到用户画像就不得不提到一个词“标签”。标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。标签的定义来源于业务目标,基于不同的行业,不同的应用场景,同样的标签名称可能代表了不同的含义,也决定了不同的模型设计和数据处理方式。我们给机票用户画像打标签分类为两大类,基础类标签和个性化标签,这些标签可以有重复,但是都是通过不同的角度去定义和刻画一个用户,来满足不同的业务营销需求。

image

  3.3用户标签库构建流程


image

  4.用户画像技术架构

4.1 技术架构

image

  4.2 实施方法论


image

  5.用户画像数据应用实践

5.1 用户群体特征分析

设计目标
–根据条件可选项,输出筛选用户群体

–图形展示用户群体属性特征

应用场景

–如果筛选的用户群组满足业务的要求,将筛选条件形成参数

–根据参数提供接口查询

image


image

  5.2 客户行为预测

客户行为预测建立步骤

建模数据准备客户流失节点判断模型应用变量确定模型构建模型应用模型验证

image

  可以对用户流失做及时预测指导建议用户维系运营。

5.3 数据和业务在一起

用户画像与业务产品互相依赖,相辅相成

用户画像标签库丰富优化快速提供数据服务数据分析+机器学习+模型训练


image

  6.总结

用户画像作为大数据的根基,它完美的描述了一个用户的信息全貌,为进一步精准、快速的分析用户行为、消费等重要信息,用户画像仓库同时也提供了足够的数据基础,让我们Qunar更好的为用户提供高价值的服务,满足用户智慧出行的需要。

作者介绍李国芳,去哪儿网机票大数据组,精于架构,追求极致。曾先后搭建起机票实时数据处理系统,并主导用户画像项目,指导各业务线精准定位用户。在数据仓库方面,搭建saiku + kylin + hive平台,为运营及业务分析人员提供更快速精确的OLAP工具。技术涉猎广泛,乐于分享和激励新人。

本文转自d1net(转载)

相关文章
|
3月前
|
搜索推荐 数据可视化 数据挖掘
构建精准的目标客户群用户画像构建
构建精准的目标客户群用户画像
81 6
|
存储 SQL 机器学习/深度学习
用户画像标签体系——从零开始搭建实时用户画像(三)
用户画像标签体系——从零开始搭建实时用户画像(三)
1997 0
用户画像标签体系——从零开始搭建实时用户画像(三)
|
11天前
|
敏捷开发 缓存 Devops
构建高效持续集成系统的策略与实践
【4月更文挑战第23天】 在快速迭代的软件开发过程中,持续集成(CI)是确保代码质量和加速交付的关键。本文深入探讨了构建和维护一个高效CI系统的方法和最佳实践。从自动化测试到部署策略,文中细致分析了各环节的优化技巧,并提供了解决常见问题的实用建议。通过案例研究和工具选型,读者将获得构建强大CI流程的具体指导,以支持敏捷和DevOps环境下的高质量软件发布。
|
10天前
|
安全
[AIGC] 如何建立和优化你的工作流?
[AIGC] 如何建立和优化你的工作流?
|
9月前
|
数据采集 SQL 监控
开源大数据分析实验(3)——简单用户画像分析之配置数据质量监控
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
|
SQL 消息中间件 存储
实时标签开发——从零开始搭建实时用户画像(五)
实时标签开发——从零开始搭建实时用户画像(五)
1121 1
实时标签开发——从零开始搭建实时用户画像(五)
|
SQL 存储 分布式计算
如何构建标签画像工程体系及实现方案
本文将按总分的结构进行展开:首先对标签画像的基本概念做简单的说明;其次会从业务需求的角度出发,阐述如何构建一个可用的最小标签画像系统单元;而后会以这个最小单元为基础,对部分重点模块进行扩展介绍;最后进行总结,并对文中未涉及的发展方向简要说明。
64604 1
如何构建标签画像工程体系及实现方案
|
数据采集 存储 大数据
遵循4个构建数据架构的原则将加速企业数据策略实现
数据架构的好坏取决于它的基本原则。如果没有正确的目的、标准和通用的语言,企业的策略很难付诸实施。
遵循4个构建数据架构的原则将加速企业数据策略实现
|
数据采集 存储 监控
电商项目之数据治理流程分析|学习笔记
快速学习电商项目之数据治理流程分析
179 0
电商项目之数据治理流程分析|学习笔记
|
存储 分布式计算 算法
推荐引擎-如何创建推荐业务|学习笔记
快速学习推荐引擎-如何创建推荐业务|学习笔记
94 0
推荐引擎-如何创建推荐业务|学习笔记