一分钟了解阿里云产品:阿里云开放云搜索初探

  1. 云栖社区>
  2. 博客>
  3. 正文

一分钟了解阿里云产品:阿里云开放云搜索初探

hayden822 2016-02-27 14:44:18 浏览2507
展开阅读全文

前阶段申请了阿里云开放云搜索(Aliyun OpenSearch)的邀请码,今早收到通过验证了,于是准备试试云搜索。

 

阿里云搜索使用很简单,和Lucene一样,包括索引文档字段几个概念。每个索引可以当成数据库的一个数据库,一条文档当成数据库的一条记录,一个字段就是数据库的一个字段。

 

开放搜索目前支持四种形式的搜索模板,资讯类,小说类,应用类和社区类。模板在这儿就是规定好了索引的字段,也可以自定义。下面我来详细介绍下:

 

我想测试一下,就把自己的博客写的这十几篇POST发上去建立索引吧,使用了资讯类的模板。

 

模板字段如下:

 c1213082513f64b194f90cb3fae25b91b51db14b

 

提供的需要上传的JSON格式示例:

 

[

    {

        "fields": {

            "body": "广大中小企业都有各种结构化的数据需要进行检索,目前一般采用数据库本身提供的搜索功能或者利用open source的搜索软件搭建",

            "display_text": "open search",

            "hit_num": "88888",

            "update_timestamp": "1345448016",

            "type_id": "1",

            "url": "http://www.aliyun.com",

            "cat_id": [1,2],

            "author": "阿里云",

            "grade": "10",

            "comment_count": "1234",

            "tag": {"搜索":10,"阿里云":2,"云搜索":5,"开放搜索":8},

            "source": "阿里云云搜索",

            "focus_count": "8888",

            "title": "阿里云隆重推出开放搜索",

            "boost": "1",

            "id": "id_1",

            "integer_1": "100",

            "create_timestamp": "1345448016"

        },

        "cmd": "ADD"

    }, ...

]

 

 

其中很多字段用不上,可以忽略。我的博客都是在jekyll中的post类型,需要把所有的post转为JSON格式。我写了一个Python,来处理_post文件夹下面的所有文章,最后导出Json。

 

 b28d9501de7a818b4ea267cf90b4906ae7e4f3a2


2157c84128ef2cbdcf5d300fb813059eef9eacc2

e01527a75bfb68ef6057c029b1b11afbaba1814a

 

 

所有的json是直接输出了,也可以输出到一个文件中。然后将文件上传到刚才新建的索引中。刷新,看到文档条数不为0,就可以点击搜索测试了,如果数量仍为0,可以查看错误日志,里面写明了错误的文档和错误原因。最后,可以通过给的API把搜索功能添加到你的产品中。

 

搜索的效率问题现在还没法知道,因为文档数比较少。等有机会可以应用到实际中测测。

 

 

如果您想详细了解开放搜索的内容,请访问:

http://blog.csdn.net/gdhapple/article/details/9228443

 

网友评论

登录后评论
0/500
评论