数据分析师的情怀,一个大数据工作者的感悟

简介:

前言:谈起大数据,知晓它的人,都会说,势头猛,高科技,待遇好。城外的人,迫不及待想一头扎进来。熟不知,城里的大部分人却在坐以待毙,茫然无方向,难产。

前段时间在上海,老罗举行Smartisan M1/1L发布会,基本每一次我都会听大半直播内容。很多人笑话老罗总拿情怀忽悠人,烦不烦(这次低调多了)。我挺喜欢的,执着,尽心,快感和使命感。情怀这东西,每个人都会曾经拥有过,在大数据圈子里,我也有情怀。而把它写出来,共同分享,找到有共鸣的人,这也是一种欣慰,这也是这篇文章的初衷。

最近3个多月,一直围绕着新数据产品的规划、开发、联调和上线,今儿终于上线了一个版本,打心底的高兴惨了。可也的确是累,打趣来说,干着数据挖掘的事,顾着产品经理的活,过得像个项目经理一样。

今天临时加会下班,晚上9点才到家,这一路上总感觉哪儿不对劲一样,缺少点什么,又想说点什么!我一般会隔一段时间才会写一篇文章,我也一般不会这么晚写文章,都是因为考虑到质量,我非常重视每一次的作品,包括文章、分享还是产品,毕竟投入的思考和心思很多。人这个辈子,能折腾的事很少,认真做好每一件罢了。

1、大数据圈子里的毛病

从我接触大数据到现在,我看到了它的兴起,国家政策的大力倡导,以及未来的潜在趋势。但说心里话,我感觉不温不火——像极了便秘,看似吃奶的劲,却半天蹦不出个屁来。而且有些方面朝着一种病态的方向发展,我是挺担忧的,不知道你们了?

一直以来,我都是在接触数据产品相关的事,至始至终,国内真正领悟大数据产品精髓核心的人不多,拿出手有价值的数据产品更是屈指可数(今天也不是谈数据产品的)。难道大数据的价值在一款跨时代的数据产品身上这么难体现?

很纳闷,观察了很久。归根到底,关键性因素是“数据情怀”惹得祸。为什么这样说,很多身处在大数据领域的人,很缺乏真正意义上的那一股劲——“数据情怀”,去推动着这个行业的真正成长,不管是做培训也好,做产品也好,传道授业也好。而这股劲,直接影响你在为这个领域的蓬勃发展,不吹嘘,真才实干,贡献多大的力量罢了。

2、数据分析师的情怀是什么?

谈到这里,不免而然的又需要聊下,我理解中,数据情怀都体现在哪些?概括起来,以下几个词:

初心 | 使命感 | 快感 |共鸣与傲娇

这并不是鸡汤那一套,这只是我本人对待大数据的一种态度,分享而已,寻找共鸣。分别举几个故事吧。

初心:不忘初心,方得始终

谈起当初为什么会选择大数据领域,我也才是一个学通信的人而已!

最近,有位朋友在分答上向我提过这样类似的问题,原话是:你是如何赶上机遇选择这个领域的?是热爱,还是仅仅偶然?(我没回答这个问题,打算今天一起聊了)

我很理解这个提问的出发点,因为我知道现在大数据圈子里,有这样一个现象:

  • 很大一群准大数据人,还正在培训班里或者自己学习着。
  • 一部分转型做数据开发的大数据人,工作年限在5年左右及以上,更多是从Java开发转行过来做大数据框架这套东西的,真正接触大数据时间也就在2年之内。
  • 一部分转型做数据仓库或分析的大数据人,也是从传统BI数据那块转过来做大数据仓库或者数据分析相关的工作。

这样的转型,除了职业规划,也包含着薪酬水平。如果真正纯正的,应该也是在2012年靠后,就开始接触大数据的这一群人,不过很少,很幸运自己就算是一个。

故事一:我与数学的藕断丝连

我的确是学通信的,我也压根没打算学数学专业。可我从小到大数学都很厉害啊,很多时候都是分最高的(太老套路了,数学好的人多去了)。自己一路以来,转变过很多方向,但都是在寻找一个答案(学数学的意义)。

大学以前,数学一直不错,很多时候都是最高分,上了大学后,还曾经为了哥德巴赫猜想熬夜专研过,十分兴奋,当然也没这么容易被我证明出来。但后来想明白了,觉得数学这一套公式的计算、求证和推导,压根不是我感兴趣,想探索的,直接拉倒。

后面在大学,有机会接触到数学建模,顷刻间觉得它是应用数学在实践中的真正应用,是一种知识的融合和思考问题的突破,结果也是获奖无数。总共参加11次比赛,一次去深圳参加夏令营遗憾获得了三等奖(全国很多高校,包括清华、复旦等,百度可搜到我回答问题的照片,被选着成为新闻素材),最后一次无心参加的美国建模二等奖,剩余都是一等奖(其中也包括全国大学生数学建模一等奖)。这里并不是晒优秀,太老套路了,能获好成绩的人多去了。后来想明白了,觉得以比赛性质存在的这应用数学,花几天时间交上去的论文,都是狗屁不通,全是忽悠和抄袭,还是没找到数学真正价值的存在。

这时,大数据来了,我觉得大数据或许能够找到数学,乃至数据真正的意义,这的确是我喜欢瞎折腾的一个初心——我太想在自己身上找到数学存在的意义了,所以当时第一个想法是,玩转数学。刚开始总是围绕数据源打转,做一些类似阿里指数那样的大数据报表,总想把各种大数据生态圈底层的开发技术都了解遍,费力不讨好,压根也没有体现出大数据真正的价值在何处?

后面,在从事大数据领域过程中,也又转变了一些方向,有幸多次参加与一家美妆公司老板,甚至是一些高层的调研,花了一个多月的时间,慢慢领悟到业务真正需要数据为它做什么?业务方需要什么样的数据产品?数据真正的价值,原来潜力很大,只是还少有人去探索成功罢了。

这是自己目前做的事,又找到折腾的事,至少我这一路的初心,都是在寻找数学,乃至数据的价值。并不是每个从事大数据圈子里的人,都必须要像我这样折腾,但至少你需要思考一下,当初选择进入这个圈子的初心,是有执着?还是追潮流罢了?

使命感:人这一辈子,能折腾的事不多,用心做好每一件事

故事二:我微信朋友圈,一些活跃的,有典型的数据人有特别专注智能金融的捷哥,一个从国外回来创业,想在互联网金融这个行业探索数据价值的人群。有天天吟诗作乐,深深陶醉在大数据情怀的高总,一方面也顾着大数据人才思维培养的重任。

有自由职业,但却天天飞这飞那培训的黄老师,一直重视着业务与数据紧密结合,推广着自己写的书(@数据化管理:这好像是说我)。

有想在目前培训行业,做出一番贡献,一直默默筹备着机会的老李,充满了情怀,利志于打破目前大数据培训的混乱。

数据圈子里,有着这样的一些人,我不熟悉的,还会有一些这样的人。他们感觉自己充满了使命感,傻傻的,即使迷途惆怅,也坚信光明就在远方。我喜欢这样的一群人,只是在数据圈子里面,太少太少了。

故事三:一些无心,大忽悠,特立独行的数据人

踏入大数据圈子,也仅仅是为了转型,为了薪酬,为了养老,我并不想真正做出点啥。

躺到一定年限,慢慢也具备一定的忽悠资本,酷爱说一些很潮流的大数据技术,但做起大数据的事,很难产。

拥有一定专业技能,但总在小圈子里钻,认为不断学技术,才是存在感。却不知技术本身的真正意义和价值,难应用于业务。

我这样一个人,对于规划过的产品,写过的文章,做过的培训,我十分重视,觉得它代表我的态度和使命感。特别怕开始做其中的某一件事,因为一旦开始,我都会花很大的心血去做好,会很费心。但人生苦短,能用心折腾的事还多?

快感:一种想到就会小抽搐,跌宕起伏的兴奋

老罗在发布会上,提起了快感,我很认可。曾经看过国外的新闻,一小哥提起,专研出某种技术的快感,胜过和女朋友的相处。

说下自己的故事。

故事四:最近上线的数据产品,让我充满了快感

几年前,领导打趣私下问每个新人,工作这块,你有什么规划?类似的答案从别人口中说出,资深hadoop运维工程师,架构师,数据仓库大牛,等等。那时候,我回答了,我想做一款数据产品,结果可想而知,真被笑了,不切合实际。(却没人知道,我当初为了面试数据产品经理,整整准备了两大页自己的构思和知识点整合。)

前些日子,由于个人发展,我跳槽了,面试过程中,还是有人问起我职业规划。我认为,会有人相信我了,所以我说了自己这几年做了很多准备,就是想在以后成为数据产品经理,做一款有自己色彩的大数据产品。结果出乎意料,都一一被质疑,以及婉绝了。…,不过后面我变聪明了,再被问,我改口说成资深数据挖掘大牛,沉醉于技术海洋里。听者兴奋,说者无心。

很幸运,来公司这段时间里,虽然时间不长,但是充实无比。花了3个多月的时间,真正切切有属于自己特色的数据产品能够落地(互联网金融行业,涉及羊毛党反欺诈监控的数据产品)。从无到有,从需求的调研和分析、系统功能的规划和确定,前后端功能的开发、推动和联调。到现在,5个页面菜单,4个子系统引擎,第一个阶段的功能点算是完成了,大数据挖掘与数据产品的融合。

这个一直以来的梦,开始尝到了点味道,你说兴奋?高兴惨了,工作起来就像个疯子一样,看起它,满满的爱意,就像看着自己的孩子不断茁壮成长。太有快感了,想起来都会抽搐下。

共鸣与傲娇:我们天生傲娇,却在渴望寻找着共鸣的声音

老罗在上一次发布会里,提到了傲娇,那种由心而然的底气真的很强烈,每一次看发布会直播的我,都能深深感受到。因为在大数据圈子里的我,也有这样的一面。就像锤子手机,从创办至今,虽然不怎么被看好,但却在每一次发布会时引起了全国、全世界的关注。

但我也能感受到老罗内心里的渴望,渴望共鸣的声音。即使声音很脆弱,很小,但却急切期待懂他的人能够共鸣,老罗也找到了这样一些共鸣。每一次听他发布会的锤粉们,因为懂他,也都会紧紧捏着一把汗。

回到大数据圈子里,每一个圈子里面的人,都是在做着改变未来世界的事,都有可能引领着大数据科技与生活的完美融合,不管是互联网+、生物医疗、基因工程、智能家居还是人工智能等等,太多新领域充满了太多未知,充满了太多使命感,所以我们真正天生傲娇,每个人都是自己的英雄。

可现在这个圈子并没有健康的茁壮生态,很多人从早就认为它就是一个泡沫,人人谈,人人吹,人人忽悠。就像法国的密西西比公司泡沫、英国的南海公司泡沫。当真正每个人都在吹捧它的时候,那说明大数据已经很危险了。

我很担心,未来的以后,大数据只是数据的积累和整合,一大堆框架性的东西,只是耗钱的东西,高空楼阁。并不是担心着失业,我只是觉得自己一路探索的“数学真正的价值”,仍然还是很难得到满意的答案。那种无助,也只能是弃甲归田罢了。

我说的这些,每一个数据圈的人,你们会有共鸣?


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
5月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
108 1
|
8天前
|
SQL 存储 分布式计算
如何使用MaxCompute进行数据分析?
【5月更文挑战第6天】如何使用MaxCompute进行数据分析?
13 1
|
6月前
|
人工智能 Cloud Native 大数据
构建高性能云原生大数据处理平台:融合人工智能优化数据分析流程
构建高性能云原生大数据处理平台:融合人工智能优化数据分析流程
339 0
|
2月前
|
算法 大数据 数据挖掘
python数据分析——大数据伦理风险分析
大数据伦理风险分析在当前数字化快速发展的背景下显得尤为重要。随着大数据技术的广泛应用,企业、政府以及个人都在不断地产生、收集和分析海量数据。然而,这些数据的利用也带来了诸多伦理风险,如隐私泄露、数据滥用、算法偏见等。因此,对大数据伦理风险进行深入分析,并采取相应的防范措施,对于保障数据安全、维护社会公平正义具有重要意义。
57 0
|
2月前
|
存储 大数据 数据挖掘
python数据分析——大数据和云计算
大数据和云计算作为当代信息技术的两大核心驱动力,正在以前所未有的速度改变着我们的生活、工作和思维方式。它们不仅为各行各业的创新提供了强大的技术支持,更是推动了整个社会的数字化转型。 从大数据的角度来看,它的核心价值在于通过对海量数据的收集、存储、分析和挖掘,发现其中的关联性和趋势,从而为决策提供更为科学、精准的依据。无论是商业领域的市场预测、消费者行为分析,还是公共服务领域的城市规划、交通管理,大数据都发挥着不可或缺的作用。同时,随着物联网、传感器等技术的普及,大数据的来源和种类也在不断扩展,这使得我们能够更全面地认识世界,把握规律。
53 0
|
5月前
|
数据采集 数据可视化 数据挖掘
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
101 0
|
5月前
|
数据采集 分布式计算 数据可视化
【大数据实训】基于赶集网租房信息的数据分析与可视化(七)
【大数据实训】基于赶集网租房信息的数据分析与可视化(七)
81 0
|
5月前
|
分布式计算 Hadoop Java
【大数据实训】基于Hadoop的2019年11月至2020年2月宁波天气数据分析(五)
【大数据实训】基于Hadoop的2019年11月至2020年2月宁波天气数据分析(五)
53 1
|
8月前
|
机器学习/深度学习 数据采集 边缘计算
大数据和数据分析:决策制定的新方式
大数据和数据分析:决策制定的新方式
|
8月前
|
SQL 分布式计算 数据挖掘
玩转MaxCompute SQL! 30分钟搞定数据分析挖掘
本教程将指导开发者通过MaxCompute SQL分析,快速体验MaxCompute产品,完成开通、执行SQL语句查询数据。无需进行数据同步,可直接上手体验数据分析。
984 1