大数据分析的光荣与陷阱——从谷歌流感趋势谈起

  1. 云栖社区>
  2. 大数据文摘>
  3. 博客>
  4. 正文

大数据分析的光荣与陷阱——从谷歌流感趋势谈起

小旋风柴进 2017-05-02 22:07:00 浏览900
展开阅读全文

本文从谷歌流感趋势2009年前后表现差异谈起,讨论了大数据分析容易面临的大数据自大、算法演化、看不见的动机导致数据生成机制变化等陷阱,以及对我国大数据产业发展的借鉴。本文认为,为健康发展大数据产业,我国需要防范大数据自大风险、推动大数据产业和小数据产业齐头并进,并强化提高大数据透明度、审慎评估大数据质量等方面的努力。



◆ ◆ 

一、谷歌流感趋势:未卜先知?


“谷歌流感趋势”(Google Flu Trends,GFT)未卜先知的故事,常被看做大数据分析优势的明证。2008年11月谷歌公司启动的GFT项目,目标是预测美国疾控中心(CDC)报告的流感发病率。甫一登场,GFT就亮出十分惊艳的成绩单。2009年,GFT团队在《自然》发文报告,只需分析数十亿搜索中45个与流感相关的关键词,GFT就能比CDC提前两周预报2007-2008季流感的


































































































网友评论

登录后评论
0/500
评论
小旋风柴进
+ 关注
所属云栖号: 大数据文摘