次世代搜索引擎-ChaCha挑战Google

简介:
相信大家都使用过搜索引擎,可能你每天都在用Google,baidu,WindowsLive...面对现在满天的搜索引擎 ( Google、Yahoo搜、百度、搜狗、中搜等 ) 搜出的很多都是海量的垃圾信息,我们要从海量的垃圾信息中十分费力的筛选出我们需要的内容。面对这种情况,Google们也的确一直在努力地改进搜索技术,但它们却没有教会人们更好的使用方法。另一方面,“爬虫”程序、标签及网页分级技术对某些依靠用户输入而产生动态数据的页面一筹莫展,最终它们只能为这个网络上存在的资源中的极小部分加上标签,而大多数用户真正需要的资源都没有被发掘出来。
        使用人工智能去改善机器搜索结果无疑是下一代搜索引擎发展的方向, ChaCha搜索[目前仅仅支持英文]用了一个比较原始但保证有效的方法:"搜索引擎+人工搜索助理",ChaCha收编了大量的搜索向导,并以广告收入的部分作为工作报酬,去协助大量的用户完成一些他们并不熟悉的搜索经历,依靠资深的具备丰富专业知识的向导人工筛选搜索结果,并将机器搜索与人工筛选后的精确结果提交给用户。
        虽然这是一个对提高搜索结果精确度十分行之有效的方法,但有效果并不代表有效率,这种利用人工智能参与的搜索方法最低效的地方在于 没有把人工搜索的经验与行为过程用机器方式保存下来,从而导致下次基于同一搜索任务的时候依然要人工劳动参与其中
        微软的搜索Macros、Google的Co-op等等都是利用人工智能的经验参与到搜索结果的筛选当中,但效果依然未能理想。他们确实利用了计算机的程序去记录下人工智能搜索的部分经验(搜索范围、主要关键字),却无法模拟出人工智能中对结果相关程度的判断,也没有象人工智能那样对搜索关键字进行联想或推理。现时的搜索引擎仅仅依赖于服务器端对互联网页面内容和链接的文字分析,并没有将最终用户的使用结果的反馈和经验(人工智能)纳入其中。
        用烦琐大量的人工智能脑力劳动去解决搜索的问题固然有效,但使用计算机程序来模拟人工的智能达到同样的效果才是根本解决之道。

[以下内容引用于<<China Internet Weekly>>第40期]

        那么,ChaCha的向导们能在多大程度上弥补传统搜索引擎的缺陷呢?例如,一位对游戏一无所知的父亲想为自己的儿子买一款游戏时,他在ChaCha首页中输入“游戏”这个关键词,系统根据关键词分类为其寻找到一位精通游戏的向导,他会告诉这位父亲当下最流行的游戏是什么及在哪里购买,还附上了相关网址。这就是使用ChaCha的典型体验。
  简单来说, ChaCha的搜索结果来自于向导们的经验。而向导们则是根据职业、爱好、特长及经历等要素被分类,并依照相匹配的关键词指定给有需要的用户。一般来说,ChaCha的向导们将用户提出的问题分类,然后在20秒内将他们需要的页面答复给他们。因为ChaCha为所有被提问的问题以及向导们用搜索引擎搜到的答案和资源,包括用户访问的页面都加了标签,所以用户使用ChaCha的次数越多,搜索速度将会越快,结果也会越准确。 http://blog.csdn.net/download/blogweekly/ChaChahome.jpg
  而在推出ChaCha时,斯科特·琼斯就为其向导们设立了一个线上社区ChaCha Underground,以互相评估彼此的工作,共同分享经验和知识。在他看来,这个社区是MySpace.com和 Wikipedia.org的交叉体。而与此相应的,ChaCha这个搜索引擎实际上就是人机智能的结合体。与此相似的还有Yahoo! Answers、Answer Bag以及Google的付费问答服务Google Answers,国内的百度知道和新浪爱问也属于此类。但不同的是,ChaCha的向导所提供的服务是实时的交流,更加方便快捷。
  当然,优质的服务必定是需要付出代价的,但这个代价不需要用户付出,而是由ChaCha来买单。根据用户对向导提供的帮助的满意度,他们被分为4个等级,并依照等级获得每小时5美元至10美元的报酬,而顶尖向导的收入甚至可以达到每小时20美元。如果达到一定等级,向导还可以邀请其他人加入圈子,而他自己则可以获得他们收入的10%作为奖金。这无疑会产生巨大的吸引力。凭借“坐在家里赚钱”口号,ChaCha聚集了大批家庭主妇及在校大学生加入。但 用户还是需要付出代价的,那就是在等待结果的间隙收看一下与搜索关键词相对应的视频广告,ChaCha正是凭借这块广告才能得到生存和发展。
  为了兑现对向导们薪水的承诺,ChaCha于10月23日发布了名为“Pay me now”的即时支付系统。通过这个系统,薪水将会即时打进向导们的银行账户,存在专门的ChaCha借记卡中,而这张卡和其他的借记卡及  信用卡之间可以实现相互转帐,也可以正常消费。 
  将搜索社会化
  实际上,ChaCha反映出了“次世代搜索引擎”的核心特质:搜索的社会化。斯科特·琼斯也不无感慨地表示:“我们意识到,社会化的互动改变了这个游戏的规则。”
  创新在搜索引擎领域内似乎正显现出举步维艰的态势。尽管今天,Google仍在以让人眼花缭乱的频率不断推出新品,尽管它离“整合全球信息”的伟大理想日进一步,然而在如何让用户更快地得到最有用的信息这个问题上,Google以及其他所有的搜索引擎都没有给出明确的回答。
  不难看出,在互联网由Web1.0向Web 2.0进化的过程中,搜索引擎也或多或少地受到了启发。有人称社会化搜索可能是搜索领域里一个里程碑式的转变。如果说对海量网页的分析与储存的计算技术是以Google为代表的第一代搜索引擎的核心因素。那么以ChaCha 为代表的“次世代搜索引擎”则将人脑的智能置于了一个更高的地位,它们信赖人类的反应和分析能力,也满足了特定社群的成员之间分享经验和信息的需求,将搜索功能的主导权真正交给了互联网用户。
  而在这个趋势中,我们也看到了传统搜索引擎巨头们转身的努力。早在去年4月,雅虎就推出了My Web个性化搜索服务,用户可以保存搜索记录、网页访问记录及点评,并可以通过邮件、内容集成和网页等方式共享搜索结果;随后的6月,雅虎又推出了Yahoo!My Web2.0,用户可选择自己喜欢的网站建立标签,并归入不同档案添加评语,日久积累便会形成一个信息库,这样用户的搜索结果就会只限于自己感兴趣的范围,不再是漫天撒网,这被称为MyRank搜索技术。
  无独有偶。微软目前也正在研发一种问答式的社会化搜索工具,通过这种工具用户直接将问题提交给某个相关的社群,获得搜索结果。对微软来说,它有一个巨大的优势,就是其4亿多的MSN和Hotmail的庞大用户群。
  雅虎和微软的举动很明显是在挑战Google。相比之下Google在社区建设和社会化搜索方面投入的力量远远小于Yahoo!,但其已作出了些微的尝试。今年5月,Google发布了测试版的社会化搜索工具“Co-op”和“Notebook”,其共同特点就是使用户之间可以分享彼此的搜索标签。10月,Google又发布了其独立的社会化搜索站点Searchmash。这个网页具备了一些问答式的特征,可以根据用户的搜索行为做出相应的反应及提示,但目前还不允许用户对搜索结果进行编辑和共享。
        大家都在勾勒自己心目中的“次世代搜索引擎”,以期赶上搜索引擎的下一个机会。而跟这些历史悠久的互联网巨头相比,年轻的ChaCha还要面临一个巨大的挑战,那就是如何聚集更多的向导和搜索用户,因为社会化搜索的优势的实现有赖于社群的规模和用户使用的频率。对ChaCha甚或是巨头们来说都需要一个积累的过程,毕竟这需要根据对用户行为的长期观察才能形成一个可以反映其偏好的数据库,从而不断改善搜索精度。
         当然,ChaCha也有其独特优势:实时的交流可以最大限度地发挥人脑智能的力量。斯科特·琼斯坚信一点,人脑永远比机器好使,能给用户更有效的帮助。而对用户来说,如果可以省事儿,那为什么还要费事儿呢?

 

本文转自葛涵涛 51CTO博客,原文链接:http://blog.51cto.com/gehantao/43072 ,如需转载请自行联系原作者

相关文章
|
1月前
|
自然语言处理 搜索推荐 SEO
如何使用 Google 搜索引擎保姆级教程(附链接)
如何使用 Google 搜索引擎保姆级教程(附链接)
155 0
|
SQL 开发框架 搜索推荐
你也可以是小hacker ,Google Hacking,好可怕的搜索引擎!
你也可以是小hacker ,Google Hacking,好可怕的搜索引擎!
142 0
你也可以是小hacker ,Google Hacking,好可怕的搜索引擎!
|
数据采集 人工智能 搜索推荐
要想文章上Google搜索引擎首页,SEO 要做好下面7个点优化
当Google SEO 除了关键字分析,还学会语意判读,你该如何花最少的力气抢占关键字首页?接着,我们会从过往撰写SEO 文章的经验中,汇整出一套SEO 文章的撰写步骤,并且在讲解步骤之前会先一一拆解SEO 文章类型、内容、架构与字数的差异,让你能更理解执行每一步骤的原因。 Google 首页的SEO 文章与一般文章区别是什么?
411 1
要想文章上Google搜索引擎首页,SEO 要做好下面7个点优化
|
文字识别 搜索推荐 前端开发
PyHubWeekly | 第二十二期:利用Python搭建一款无广告、保护隐私的Google搜索引擎
PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。 我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly[1],如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~
PyHubWeekly | 第二十二期:利用Python搭建一款无广告、保护隐私的Google搜索引擎
|
Web App开发 搜索推荐 .NET
识别真假搜索引擎(搜索蜘蛛)方法(baidu,google,Msn,sogou,soso等)
http://www.useragentstring.com/pages/useragentstring.php   今天分析研究了两个网站的 Apache 日志,分析日志虽然很无聊,但却是很有意义的事情,比如跟踪 SPAM 的 User Agent。
3446 0
|
搜索推荐
8月2日科技联播:Google将为中国推出过滤版搜索引擎?40万亿亿亿亿包黄油存在在银河系!
听说互联网圈错觉有三:WP崛起、索尼倒闭、谷歌返华,如今这最后一大错觉要成真了?能做40万亿亿亿亿包黄油,存在在银河系?零售巨头沃尔玛也惹上了盗窃官司,惹谁不好偏偏惹了硅谷公司,今日事今日晓,科技联播带你走进今日大事件!
2260 0
|
Web App开发 搜索推荐

热门文章

最新文章