1. 云栖社区>
  2. 全部标签>
  3. #solr#
solr

#solr#

已有2人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

玩转阿里云EMR三部曲-中级篇 集成自有服务

利用EMR引导操作可以使用自定义脚本安装任意自有服务和环境,隔离计算和生产资源,并在极致成本控制下最大化并发和可扩展性。完整的自定义设计可以满足任意自有服务构建的集成需要。

安全与风控 移动开发与客户端 大数据 架构 OSS 高并发 配置 集群 弹性伸缩 钉钉 spark solr 脚本 EMR 安全问道

海量数据搜索---demo展示百度、谷歌搜索引擎的实现

百度、谷歌等网站之所以能很快在海量数据中找到需要的数据,得益于其搜索引擎,本文将介绍搜索引擎的基本知识及中文分词的方法,并通过demo演示如何进行数据检索。

大数据 算法 配置 Image solr 搜索引擎 索引 demo Other lucene 海量数据

玩转阿里云EMR三部曲-中级篇 集成自有服务

玩转阿里云EMR三部曲-中级篇 集成自有服务 作者:邓力,entobit技术总监,八年大数据从业经历,由一代hadoop入坑,深耕云计算应用领域,由从事亚马逊EMR和阿里云EMR应用开发逐步转入大数据架构领域,对大数据生态及框架应用有深刻理解。

大数据 架构 OSS 高并发 配置 集群 spark solr aliyun 脚本 离线计算 EMR 弹性扩展

威胁快报|Solr dataimport成挖矿团伙新型利用方式

近日,阿里云安全团队监测到挖矿团伙利用solr dataimport RCE(CVE-2019-0193)作为新的攻击方式对云上主机进行攻击,攻击成功后下载门罗币挖矿程序进行牟利。该团伙使用的恶意脚本与之前报道的“威胁预警 | watchbog挖矿蠕虫升级,利用Bluekeep RDP等多个漏洞蓄势待发”文章所提团伙使用的基本一致,因此基本认为是同一团伙所为。

安全 模块 主机 runtime solr 脚本 挖矿

阿里云HBase SQL一站式解决复杂查询难题

在大数据场景中,HBase由于其高吞吐,高并发,实时可见等特性往往被作为在线主存储,云HBase团队融合了在线存储引擎和全文引擎的优势,解决了针对在线大数据存储的复杂查询难题,并提供SQL统一表达,降低用户使用门槛。通过一站式产品能力,用户可以更加灵活高效地解决业务问题。

云栖社区 数据存储与数据库 分布式 大数据 分布式系统与计算 实时系统 hbase SQL 同步 solr 索引 数据同步 phoenix big data

威胁快报|Solr dataimport成挖矿团伙新型利用方式

概述 近日,阿里云安全团队监测到挖矿团伙利用solr dataimport RCE(CVE-2019-0193)作为新的攻击方式对云上主机进行攻击,攻击成功后下载门罗币挖矿程序进行牟利。该团伙使用的恶意脚本与之前报道的“威胁预警 | watchbog挖矿蠕虫升级,利用Bluekeep RDP等多个漏洞蓄势待发”文章所提团伙使用的基本一致,因此基本认为是同一团伙所为。

安全 木马 阿里云 模块 漏洞 主机 runtime solr 脚本 挖矿 RCE watchbog

apache最新漏洞可导致网站被入侵该如何解决

apache最近爆出的漏洞越来越多,旗下的solr产品存在远程服务器执行恶意代码漏洞,该漏洞产生的主要原因是因为apache dataimporthandler数据外部收集的一个端口模块,该模块支持从远程的地址进行通信,并多数据进行收集,正因为开放了远程地址,可导致攻击者构造恶意的代码对DIH进行...

安全 服务器 Apache 模块 配置 solr 网站漏洞修复 网站被入侵 网站安全检测 网站安全防护 网站漏洞检测

后端技术杂谈2:搜索引擎工作原理

写在前面 Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。

hadoop 模块 solr 搜索引擎 索引 google lucene

后端技术杂谈4:Elasticsearch与solr入门实践

阮一峰:全文搜索引擎 Elasticsearch 入门教程 阅读 1093 收藏 76 2017-08-23 原文链接:www.ruanyifeng.com 9月7日-8日 北京,与 Google Twitch 等团队技术大咖面对面www.bagevent.com 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。

分布式 数据库 配置 solr 搜索引擎 索引 Elasticsearch 插件 index lucene curl

BigData NoSQL —— ApsaraDB HBase数据存储与分析平台概览

数据库发展有三个明显的趋势:1. 越来越多的数据库会做云原生(CloudNative);2. NoSQL正在解决BigData领域的问题;3. 越来越多的公司或者产品都是融合多个能力。 阿里云HBase经过公共云两年(单独的HBase在阿里内部已经发展快9年)的发展,融合开源Apache HBase、Apache Phoenix、Apache Spark、Apache Solr等开源项目,再加上一系列自研特性,满足 【一体化数据处理平台,提供一站式能力】。

云栖社区 分布式 大数据 分布式系统与计算 NOSQL hbase 性能 数据库 同步 spark solr 数据存储 phoenix

HanLP中文分词Lucene插件

基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

配置 solr class 自然语言处理 插件 index type lucene hanlp分词

Elasticsearch学习笔记(一)之what?

一句话介绍 Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎,能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心,它集中存储您的数据,帮助您发现意料之中以及意料之外的情况。

分布式 大数据 性能 solr 索引 Elasticsearch lucene zookeeper

HBase+Spark技术双周刊 第四期

群直播 线下活动 推荐专家

大数据 hbase 线下活动 数据库 高并发 钉钉 spark solr aliyun 分布式计算 公共云

Solr增强HBase检索能力基础介绍及场景

介绍solr如何增强hbase检索能力,通过示例帮助大家快速上手hbase+solr查询应用

hbase 数据库 钉钉 solr aliyun

海量数据的分库分表技术演进,最佳实践

每个优秀的程序员和架构师都应该掌握分库分表,移动互联网时代,海量的用户每天产生海量的数量 用户表 订单表 交易流水表 以支付宝用户为例,8亿;微信用户更是10亿。

架构 NOSQL hbase 性能 中间件 solr 索引 分区表 存储 海量数据

solr6.6教程-基础环境搭建(一)

目前网上关于solr6.+的安装教程很少,有些6.0之前的教程在应用到6.+的版本中出现很多的问题,所以特别整理出来这一片文章,希望能给各位码农一些帮助! 很少写些文章,如有不对的地方,还希望多多指导。

java tomcat trace solr Server

solr6.6教程-基础环境搭建(二)

在上一篇文章中已经简单介绍了solr在windows的部署,今天我们来下如何新建一个自己core。 1,core理解 如果把solr理解为个数据库的话,那么core可以理解为数据库中的一张表,其实就是数据集合 在写本片文章之前看到网上很多教程都说需要找到solr.xml来配置core的信息,特此说明,那些都是老版本中的solr需要,新版本的solr中不需要配置solr.xml。

根目录 数据库 配置 浏览器 solr 索引 Core xml schema lucene

18
GO