Bingo大战:决胜大数据时代

简介:

必应(Bing)又一次成为了IT行业的新闻焦点。这次,它以强大的自信发起了一场名为“必应搜索,全球PK赛”的活动,主要针对谷歌PK搜索结果的质量。

据媒体报道,“第三方独立调研机构统计结果显示,中国有75%的参与者首选微软必应提供的结果”。我抱着对这个结果将信将疑的态度参与了这项测试,也许因为之前有多年使用Google的缘故。反复几次之后,有了比较深入的切身体会。刚开始的时候,我输入一些普普通通的词汇,两者搜索结果的区别不大,胜负难分,仅仅在结果排序上表现出其背后的算法差异。随着我对一些敏感词汇和热点关注的时事话题进行搜索PK的时候,高下可以说立现了。诸多事件,诸多主角,搜索结果都是惊人的一致:必应能够立即在不引起争议的前提下,有选择性地给出有价值的答案,帮助搜索者达到了解事件和人物信息的最终目的,而谷歌则一律拒绝显示搜索结果(经直接进入谷歌尝试,结论一致)。无论某轮奸事件的主角,还是更具时代争议的重庆人物,等等等等,都是如此。

从这里我得出结论,无论从算法上,还是对中国市场的了解上,必应都胜出一筹。那么,应该是时候从谷歌移民必应了。讨巧的是,把这场活动双方的首几位字母连成一个单词,居然是Bingo!

整个IT行业都在高谈阔论大数据,探讨大数据带来的营销变革,憧憬大数据将要滋生的机器智能,几乎没有人回过头去关注大数据产生的麻烦。如何从浩如烟海的数据海洋中筛掉数据垃圾,寻求自己真正想要的答案,这个问题重新回到搜索引擎这个生活学习工作都无法离身的“传统”工具上来。微软资深副总裁张亚勤这样指出:“大数据要求人们改变对精准性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求相关关系;这种思维的转变将是革命性的”。

查全率是第一代搜索引擎的竞争关键,所以Yahoo和AltaVista成为了90年代的佼佼者;查准率是第二代搜索引擎的核心任务,所以Google和百度脱颖而出。而在大数据时代,全和准都不是问题了,“价值”这个更加模糊更加人性化的东西成为了搜索引擎的核心竞争尺度。在大数据的背景下,抛弃直接因果和纯粹逻辑,拥抱鱼龙混杂的数据结构和纵横交错的关系脉络,是下一代搜索引擎所不得不具备的典型特征。而这一点,必应让我们感受到了。还记得微软几年前的那个“人立方”吗?虽说只是一个好玩的东西,但其实背后我看到的恰恰是微软对大数据的尊重和人类思维模型的不懈探索。

英国经济学家霍奇逊曾在《现代制度主义经济学》一书中表达了这样的观点,“最大化的进化论,或者说最优行为的达尔文机制是以理性主义行为观为基础的”;但“无论从方法论、心理学、社会学和政治学哪个方面来看”,理性主义都陷入了“自相矛盾”,因为“认知和思维过程的复杂性以及需处理的信息数量,对理性思维来说,都面临着信息太少和资料太多的矛盾”。需要解释的是,霍奇逊这里所讲的“资料太多”就是我们今天的大数据,而“信息太少”的“信息”则是指经过有效处理之后的信息,类似于搜索结果。

鲍尔默前不久表示:“微软数据中心基础设施中服务器的数量已经超过了100万台”。有好事者对此颇有微词,指责其耗电量惊人,“能够为美国2万3千户家庭供电”。此观点实在荒唐,退回到爱迪生时代,说不定足够给全世界的家庭供电;再上溯到刀耕火种的年代,连电都不用,那么这个换算出来的家庭数量该是无穷大吧?在我看来,如此海量的服务器恰恰说明微软为大数据时代的搜索做足了准备。

另外,凡是参悟人生的人都有体会,自身就是一个小宇宙。机器也是一样,大数据不仅仅应该包括向外的互联网,也必须考虑向内的局域网和本地硬盘。记得二十年前,上G就已经称得上是那个年代的大数据了,而今呢?据我所知,从Windows8.1开始,必应不仅对互联网数据进行搜索,也同时对本地和局域网内的数据通过整合方式进行搜索,这一点,也是必应比谷歌更尊重用户、尊重数据的一个侧面表现。


本文转自 瞬雨 51CTO博客,原文链接:http://blog.51cto.com/soorain/1257777


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
人工智能 供应链 监控
“数字化”成两会热词 马化腾杨元庆周鸿祎周云杰等都说了什么?
“数字化”成两会热词 马化腾杨元庆周鸿祎周云杰等都说了什么?
137 0
“数字化”成两会热词 马化腾杨元庆周鸿祎周云杰等都说了什么?
|
机器学习/深度学习 人工智能 算法
互金纷纷跟投金融科技,人工智能加剧了马太效应
与会者中,互联网金融从业者,29岁的凡普金科创始合伙人、爱钱进CEO杨帆就人工智能的应用和社会影响发表了一系列观点。这位年轻的创业者认为,人工智能是当下最大的风口之一,竞争激烈但收获同样会很大,看准了风口的年轻人只要坚持走下去,一定会取得最好的成长。同时,人工智能在很多领域将取代人类,但并不值得恐慌,就如工业革命后大家仍然生活得很好一样,做足迎接人工智能趋势的准备才是最重要的。
互金纷纷跟投金融科技,人工智能加剧了马太效应
|
机器学习/深度学习 人工智能 移动开发
银行业搭上“新基建”东风,IT商迎爆发契机?
2018年中国银行业IT解决方案最领先的企业,市场份额最高也仅为4.9%,一般只有1-3%,其擅长领域也各不相同。这显示有高达70%以上市场,属于“碎片化”的竞争状态,行业龙头的集中度并不高。
|
供应链
腾讯电竞:电竞产业已成风口 良性发展需要靠教育稳固根基
根据市场调研公司NikoPartners的最新报告,2017年中国的电竞市场规模将增长至12.6亿美元。其中移动电竞赛事奖金总额将达950万美元,赛事直播收益将达6.25亿美元。电子竞技的蓬勃发展已经衍生出了以直播、解说、竞猜等等为首的众多周边行业,从业人员的发展及电竞文化的沉淀,能否跟上市场的发展,是现在中国电竞在发展道路上面临的难题。
1499 0
|
机器学习/深度学习 人工智能 机器人