六大开源搜索引擎工具

简介:

搜索引擎会为用户根据一定的策略、运用特定的计算机程序在互联网海量的信息中进行搜集。对信息进行组织和处理之后,提供检索服务,为用户展示相关的信息。而企业网站上的相关信息要浏览者获得好感,站点上的搜索同样不容忽视。下面,IDC评述网与大家分享6个搜索引擎工具。

1. PhpDig
PhpDig是一个采用PHP开发的Web爬虫和搜索引擎。通过对动态和静态页面进行索引建立一个词汇表。当搜索查询时,它将按一定的排序规则显示包含关键字的搜索结果页面。适用于专业化强、层次深的个性化搜索引擎。

2. Sphider
Sphider是一个轻量级,采用PHP开发的web spider和搜索引擎,使用mysql来存储数据。可以利用它来为自己的网站添加搜索功能。Sphider非常小,易于安装和修改,已经有数千网站在使用它。
3. Sphinx
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL、PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

4. OpenWebSpider
OpenWebSpider是一个PHP开源多线程WebSpider(crawler:爬虫,robot:机器人)和包含许多有趣功能的搜索引擎。目前OpenWebSpider还提供MP3和PDF文件支持,以及增强编码支持等功能。

5. RiSearch PHP 
RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。它检索非常快,能够在不到1秒钟内搜索5000-10000个页面。它能帮用户网站做索引并建立一个数据库来存储网站上所有页面的关键词以便快速搜索。

6.ASPSeek
ASPSeek是一个C++编写的免费开源互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序。

目录
相关文章
|
1月前
|
机器学习/深度学习 Linux 应用服务中间件
开源还是闭源(=°Д°=)!!趋势表明,开源技术在诸多领域中日益受到重视
开源还是闭源(=°Д°=)!!趋势表明,开源技术在诸多领域中日益受到重视
|
2月前
|
前端开发 JavaScript
开源! 基于lowcode行业的开源CMS系统,轻松帮助企业和个人搭建知识管理系统
开源! 基于lowcode行业的开源CMS系统,轻松帮助企业和个人搭建知识管理系统
35 2
|
8月前
|
存储 Kubernetes 架构师
干货!阿里「大型分布式技术手册」现已开源
其实当你真正去使用这些不同的架构方法去解决问题,然后在实践中观察它们的优劣,这确实会是一种很好的成长方式,但这是一个漫长的过程,而且没有哪个大厂会花时间让你自己去探索,所以这些经验又要从哪儿来呢? 答案是:前人的经验。既然别人已经总结了一套通过实践得来的经验,那我们为什么不去用呢?将别人的知识学会再变为自己的,才叫厉害。
|
9月前
|
机器学习/深度学习 人工智能 前端开发
优雅码住!ChatGPT的五大开源替代方案
优雅码住!ChatGPT的五大开源替代方案
295 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
phind——无需注册专为开发者而生的 AI 搜索引擎
phind 是一个为开发人员设计的 AI 搜索引擎,可以帮助工程师更快地找到他们所需的信息
1596 0
|
11月前
|
移动开发 IDE JavaScript
《GaiaX开源解读 | 基于优酷业务特色的跨平台技术》
GaiaX跨端模板引擎,是在阿里优酷、淘票票、大麦内广泛使用的Native动态化方案,其核心优势是性能、稳定和易用。本系列文章《GaiaX开源解读》,带大家看看过去三年GaiaX的发展过程。
238 0
|
移动开发 IDE JavaScript
基于优酷业务特色的跨平台技术 | GaiaX 开源解读
GaiaX 跨端模板引擎,是在阿里优酷、淘票票、大麦内广泛使用的 Native 动态化方案,其核心优势是性能、稳定和易用。本系列文章《GaiaX 开源解读》,将带大家看看过去三年GaiaX的发展过程。 GaiaX 开源地址:https://github.com/alibaba/GaiaX
445 0
基于优酷业务特色的跨平台技术 | GaiaX 开源解读
|
XML SQL 存储
选开源报表开发还是商用?2020报表软件产品整理
开源报表却越来越受到程序员热烈追捧,如ireport、 Jsper report、jfreechart这样的免费,开源的JAVA报表工具,在一下开源的JAVA报表相关的论坛里面都是热火朝天,发问者众多。
选开源报表开发还是商用?2020报表软件产品整理
|
机器学习/深度学习 自然语言处理 TensorFlow
搜狗开源业内最全「阅读理解工具集合」,助力研发人员快速构建高效模型
搜狗搜索在Github上开源“搜狗阅读理解工具集合”,提供了完整的阅读理解任务组件及10+个复现模型,极大降低了复现相关模型的难度。
1397 0