《驾驭大数据》一3.3 多个行业:时间数据与位置数据的价值

简介:

本节书摘来异步社区《驾驭大数据》一书中的第3章,第3.3节,作者: 【美】Bill Franks 译者: 黄海 , 车皓阳 , 王悦 , 等 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

3.3 多个行业:时间数据与位置数据的价值

驾驭大数据
随着全球定位系统(GPS)、个人GPS设备、手机的出现,时间和位置的信息一直在增加。从Foursquare到Google Places,再到Facebook Places,它们提供了大量的服务与应用,可以记录每个人在某个时间点的位置。手机应用程序可以记录我们的位置和移动的轨迹。即使手机没有正式开启GPS,我们还是可以使用基站信号来获得相当准确的位置信息。

消费者应用程序中有一些新颖的使用这些信息的方法,这些方法可以捕捉到消费者允许其捕获的信息。例如,有一些应用使我们可以追踪锻炼中行进的路线,路线的长度,以及走完该路线所需要的时间。事实上,如果携带了手机,我们就能记录去过的每一个地方。我们还可以选择把数据公开给他人。当更多的人向公众公开了自己的时间和位置数据,就会出现一些非常有趣的事情。

许多公司已经开始意识到掌握客户的时间与位置数据的威力,它们开始尝试从客户那里收集这类信息。当然,这类信息必须建立在筛选的基础上,并且必须制定明确的隐私政策,并严格地遵守这些政策。许多公司推出了令人难以抗拒的位置价值服务,吸引用户把时间和位置信息开放给它们。

我们并非只想了解消费者的时间和位置信息。卡车车队的领导也想掌握每辆卡车在某个时间点的位置,比萨店肯定想知道每名外送人员某个时间在什么地方,养宠物的人肯定想知道宠物在外面的什么地方,大型宴会中组织人员需要知道侍者四处走动的效率和响应顾客的速度。

从收集个人、资产的时间和位置数据开始,企业可以快速地进入大数据领域。如果这些信息能够频繁地更新就更好了。知道每辆卡车每天早晚的位置是一回事儿,知道每辆卡车每秒钟在哪儿就是另外一回事儿了。时间和位置数据被采用、应用的程度将越来越高,其造成的影响也将越来越大。

使用时间和位置数据
时间和位置数据是对隐私最敏感的一类大数据。我们面对的不仅有隐私问题,还有道德和伦理问题。我们是否要在孩子们的胳膊上安装芯片,以便当他们迷路时可以追踪到他们?老年痴呆患者离家出走或者擅自离开护理机构时我们应该怎么做?当然,时间和位置数据被滥用的可能性会相当高。但从好的方面想,它们被合理使用的可能性同样也会很高。下面我们来看一些例子。

可能很快人们就会在警察局和消防部门注册,并提供自己日常会去哪些地方的信息。这样,如果遇到洪水、火灾或封路这类大事件,人们会收到警察局和消防部门发送的警告信息,告诉他们即将路过的地方有情况,提醒他们绕道。如果人们可以主动避开是非之地,就能使交通中断的时间降到最低,这样每个人的时间都能节省下来。最后,在得到你的许可后,当地政府甚至可以接收你的实时位置信息。

一种初露端倪的数据使用方法是开发对时间和位置信息敏感的消息通知,这个市场的未来空间很大。通知不再局限于当天或本周,而是根据客户的时间和位置信息提供最适合的消息通知。现在的做法一般是由客户签到并告知他们的位置,这样他们就能接收到通知信息了。公司能够持续地跟踪到客户的动向,以做出相应的反应。

例如,可能用户会告诉你,他要在5:30分离开办公室回家,大约5:45到6:00之间会开车通过5号出口。他要找地方吃饭,并且想了解你的商店或餐馆那个时间有什么食物。你需要在那个时间那个地点提供匹配他的需求的可口饭菜。第二天早上才通过电子邮件告诉他相关的信息显然已经太迟了,我们要的是当他通过那个地方的那一刻就主动推送给他通知信息。

按照地点和时间主动推送通知信息

营销领域渐渐显露出来的一个趋势是,只对刚好处在某个时间段和某个地点的客户才针对性地推送通知信息。与根据大范围的时间和地点发送的通知相比,这种通知的效果更好,针对性更强。早期采用这种作法的企业已经取得了令人吃惊的效果。

当然管理这种通知的复杂性要高不少,因为我们要做的不只是跟踪每个人当周的服务推荐这么简单。我们需要关心的是每个用户每时每刻在什么地方,我们在这个时间点为他们推荐什么东西最合适。根据时间和位置推送通知确实大大地增加了复杂性,并且变得难以管理。但我们相信假以时日,如果我们做得不错,这种方式的转化率应该会远远超过传统的个性化推荐。历史经验反复地告诉我们,如果通知信息越精准,转化率就会越高。

使用此类数据的另一种模式是增强型社交网络分析。无线运营公司可以根据语音和文本交流信息识别出用户间的关系,借助时间和位置数据可以识别出哪些人在同一时间出现在了同一个地方。例如,哪些人在听音乐会或看电影?哪些人要去观看某一场体育比赛?哪些人在同一时间同一餐馆就餐?

如果能识别出哪些人大约在同一时间同一地点出现,就能识别出有哪些彼此不认识或者在同一个社交圈子里的人,但是他们都有着很多共同的爱好。想象一下,如果婚介服务能用这样的信息帮助我们找到自己的另一半那该有多好!我们可以鼓励人们建立联系,给他们提供符合个人身份或团体身份的产品推荐。

时间和位置数据不仅可以帮助我们理解客户的历史模式,还可以准确地预测客户未来会出现在什么地方。对于有固定习惯的客户尤其如此。如果我们知道某个人会在哪里出现,要往哪里去,我们就能预测出他们10分钟或一个小时以后会出现在哪里。如果我们知道客户以前在同一条路上去过哪里,我们就能更准确地做出他现在要去往何处的预测。我们最差也能大大地减少列表上的候选路线,这样就能支持更精准的营销。

未来几年间,时间和位置数据的应用会经历爆炸性的增长,面向消费者的选择流程和激励措施终将成熟。现在我们要小心行事,并在我们使用这些信息之前,获得用户的许可。使用时间和位置数据的消息通知将会更有针对性、更个性化。在不远的将来,如果通知信息不是根据时间和位置推送的,也许会被认为很土。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
9天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
13 3
|
12天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
1月前
|
分布式计算 DataWorks 关系型数据库
DataWorks报错问题之dataworks同步rds数据到maxcompute时报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
65 0
|
2月前
|
JSON 分布式计算 MaxCompute
MaxCompute问题之创建数据集失败如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
33 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
3月前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 1