车品觉:用数据,更要养数据

简介:

0?wx_fmt=jpeg


◆ ◆ 

导读


大数据很忠诚,它真实记录人们的每个足迹,深藏功与名;大数据很任性,它的分析有根有据,拒绝流言蜚语;大数据很友好,它提供各种权威参考,它创造绿色经济,让我们的生活更美好。世界已经进入由数据主导的“大时代”。再过两天就迎来一年一次的数博会,小编精选出几篇关于大数据的优质文章,在本周一一分享给各位。


过去,有一些问题一直困扰着我:“现在的企业获取数据如此容易,数据的增长速度如此之快,那么对于企业来说,到底要收集什么样的数据?收集多少数据?收集数据的边界在哪里?”后来,我在美国遇到一位高人,他认为,过去收集数据很难,而现在获取数据资源变得越来越容易,但是如果收集数据的出发点不是为了解决问题,那么收集再多的数据也没有什么意义。


同时,许多企业还有一个疑问:“现在收集数据不难,成本也不高,为什么不先收集了数据再说呢?等以后需要数据来解决问题时,再拿出来用不是也可以吗?”这位高人同样也给出了这个问题的答案,他对此持否定观点,并指出用这样的理念来设计数据应用注定会失败。


数据收集是没有边界的,我为此也痛苦了好一段日子,比如,收集一个人的生日,虽然可以精确到几分几秒,但这么精确的数据又能用在什么领域,又能产生什么价值呢?


事实上,数据是有生命周期的。比如,某网站的母婴频道在主动收集用户的宝宝信息,包含宝宝生日、性别、小名、身高、体重,这里我们就要清楚这几个数据的用途和生命周期,如宝宝的身高和体重,这两个数据的生命周期很短,过了一段时间后就失效了;而宝宝生日和性别这两个数据的生命周期就很长,可以从生日的年份中推算出宝宝的年龄,而性别则基本是终生稳定的。


所以说,在收集数据时,我们必须知道这些数据未来可以用来做什么,如果今天都想不出来的话,日后就更不可能了。


◆ ◆ 

数据应用因小而美


“小”不是指数据量,而是指应用的目标很具体。

 

2011年年底,作为一名数据分析师,我开始思考怎么从“用数据”转变为“养数据”(即从数据化运营转变为运营数据),这段时间我为收集什么样的数据而特别烦恼。而且,我也曾经试图做出一个特别大且适合多数人使用的数据应用,可是后来发现这在数据应用的起步阶段几乎是不可能的:一是找到可以解决大部分人需求的数据应用并不容易;二是当时公司的数据非常丰富,需要考虑的因素很多,因素之间的联系又很复杂。


所以,当开发数据应用的时候,数据就等于原材料;当原材料一直处于变化的情况下,做出来的产品就很容易出问题。体会到数据和应用的关系之后,我最后决定从小角度切入,先把小应用做出来,这就是很好的瞄准器。

 

“小”不是指数据量,而是指应用的目标很具体。许多人在没有获取足够的数据,并且缺乏对数据理解的情况下做出决策,其实是在“享受”自己的无知。打个比方来说,对于一款数据应用,如果我的目的是分辨两种决策谁更好以及差异在哪里,这就是一个很具体的问题;但如果我的目标是想知道如何让公司赢利,这就是一个空泛的目标。


经过这样的一番周折后,按照小角度切入的想法设计数据应用,就可以做得具体而快速,而且可以避免因原材料的变化而导致数据缺失的问题。

 

◆ ◆ 

如何应用框架来做决策


在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(场景)中,才能看出存在的问题。而且,想要解决的问题越复杂,框架也就越复杂。但是,决策最重要的前提是要从小角度切入,从“小”做起。

 

对此,我总结了4步走的方法:


首先确定有什么问题,从解决问题的角度出发去收集数据。


其次,把收集到的数据整理好,放入一个“数据框架”内(这个框架是用来帮助决策者做决定的)。让决策者用框架更清楚地看到数据与决策之间的关系,比如A公司在框架内要知道竞争情况、新老客户的比例情况等因素以及多种因素之间的关系。


再次,看框架与做决策的关系。比如,A公司与导航网站有三种选择——完全不合作、部分合作和全面合作。数据分析师就可以根据数据框架告知A公司该怎么决策。如果发现数据框架与决策不能匹配,就必须返回到第2步。


最后,根据决策行动,然后检查行动是否达到目的。如果行动后发现根本没有达到目的,就要检讨整个链条,寻找问题出在哪里。是数据有问题吗?还是因为框架不对?或者是决策不对?是否还有数据没考虑进去?


所以,想要解决的问题越复杂,框架也就越复杂。对于现在多数还没有开始做数据应用的电商公司来说,框架一开始千万不要过于复杂,在搭建框架前问问自己:“我目前的问题是什么?我的决策是什么?我的框架又该怎样搭建?”最重要的前提是要从小角度切入,从“小”做起。

 

◆ ◆ 

养数据,重要的数据战略


“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策。


“养数据”还有一个重要的含义,就是要决定收集哪些数据。这个决定不容忽视,因为这可能是公司数据战略中非常重要的一个环节。在我看来,被动收集数据的行为是“收集”,而主动收集数据的行为则是“养数据”。再拿上面讲到的某电商母婴频道的例子来说,如果收集主体是一家医院,那么宝宝的姓名、性别、出生年月和妈妈的姓名等数据的收集,就是收集数据,因为在住院档案和出生证明上,这些都是必不可少的。但是,如果是母婴用品要针对家庭进行营销,那么这些信息显然是不够的,宝宝奶粉的品牌、家庭收入、职业等信息则需要企业自己主动去收集,而这些数据也就是“养”出来的数据。


养数据通常有两类,一类是网站自身没有的数据,需要用户主动提供的;另一类是公司拥有的,但没有进行收集的数据。


若要收集公司没有的数据,在“养数据”时通常需要花费更多的精力和技巧。举例来说,现在国内外有很多个性化的手机购物应用,当用户第一次使用这些应用时,界面中会弹出一些问题,通过互动的方式来收集用户的信息数据,比如会出几款衣服,让用户挑选哪一款是更喜欢的。这样,在几个问题之后,应用就知道用户的喜好了。还会让用户点“赞”,这个点赞的功能,就是让用户明确地告诉应用自己喜欢什么,这样用户就可以在过程中,不断地告诉应用自己的偏好。这样一来,应用就可以“养”出用户的核心数据。


对于公司有数据但没有收集的状况,则更多的是因为内部资源协调的问题和公司决策的问题。很多提供餐饮和团购类信息服务的网站,通常会有一个功能是“把信息通过短信发送到手机”,这样就不需要用户进行特别的记录,不过有些网站会记录用户的手机号,而有些网站则不会。我的观点当然是记录这些数据,也即是“养”数据,因为这不仅能够校验用户的手机号码是否有效,还能够慢慢地建立起企业与用户的社交关系。


总之,“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策,数据养的越早,积累的数据也就越多。养数据同样也是一种管理和商业艺术,在养之前可能谁也不确定最终会出现什么后果,但一旦养成,则会产生非常大的商业价值。

原文发布时间为:2016-06-13

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8月前
|
JavaScript 前端开发 程序员
珍藏多年的神网站都捐了,你需要的我都有,有了这些网站工作生活不用愁(二)
珍藏多年的神网站都捐了,你需要的我都有,有了这些网站工作生活不用愁(二)
110 0
|
10月前
|
传感器 小程序 物联网
我们来这里只干一件事:养鱼!
我们来这里只干一件事:养鱼!
86 0
|
传感器 监控 小程序
|
人工智能 算法 机器人
阿里工程师养了只“二哈”,专治讨厌的骚扰电话
前两天3.15晚会上曝光了利用智能机器人,一天打4万个骚扰电话,从而赚取利润的黑色产业链。
4709 0
|
存储 安全 大数据
确认过眼神?上云之路需要遇上对的人!
在“上云就上阿里云”解决了上什么云的问题之后,如何上云成为企业技术人员头疼的问题。业务系统云上应用基础架构应该如何设计、系统存储与数据库如何才能平滑迁移等等成为企业上云之路的障碍。为了解决企业上云前的痛点,阿里云支持与服务团队重磅推出咨询与设计场景下五款专家服务产品。