1. 云栖社区>
  2. 全部标签>
  3. #信息检索算法/实践#
信息检索算法/实践

#信息检索算法/实践#

已有3人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

阿里云DataWorks正式推出Stream Studio:为用户提供大数据实时计算的数据中台

5月15日 阿里云DataWorks正式推出Stream Studio,正式为用户提供大数据的实时计算能力,同时标志着DataWorks成为离线、实时双计算领域的数据中台。 据介绍,Stream Studio基于阿里巴巴Flink实时计算引擎,支持DAG和SQL双模式开发流计算作业,并支持DAG与SQL互转;支持Function Studio在线开发UDF并一键发布;支持线上数据采集与本地调试;支持作业运维和智能诊断;极大地降低了流计算作业开发门槛,提高了开发效率。

云栖社区 安全与风控 系统软件 编程语言 数据存储与数据库 系统研发与运维 移动开发与客户端 网络与数据通信 linux 互联网产品及应用 定位原理/算法 信息检索算法/实践 分布式系统与计算 阿里技术协会 阿里云新品发布会

钉钉群直播【Delta Lake:一种新型的数据湖方案】

Delta Lake 是 Databricks 推出的一种新型的数据湖方案,解决了传统数据湖方案中的诸多痛点。其中的核心组件 Delta 也于近期开源。本次分享将围绕 Delta Lake 和 Delta 的诸多细节展开,如 Delta Lake 的适用场景、技术优势,Delta 的原理实现以及一些高级特性等,并就现有解决方案做横向对比。

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 linux 帮助 faq RPC 大数据 信息检索算法/实践 钉钉 spark

如何从 0 到 1 设计、构建移动分析架构

本专题主要围绕蚂蚁金服移动开发平台 mPaaS 移动分析服务 MAS,展开分享如何从 0 到 1 设计、构建移动分析架构。

系统研发与运维 移动开发与客户端 大数据 信息检索算法/实践 架构 日志 数据处理 数据库 数据仓库 平台架构 Jstorm 运营 数据采集 流计算 多维分析

ORACLE大表关联更新提速方法

执行两表关联更新时,oracle一般采用类似nested_loop的更新方式。当依据关联关系将表B的值更新到A表的字段中时,先遍历A表的,对A表的每行记录查询B表的索引,得到b表的结果后再更新到A表。由于存在查询索引的操作,更新每条记录都会至少执行两次io操作。

云栖社区 数据存储与数据库 大数据 空间索引原理 信息检索算法/实践 算法 Oracle 性能 源码 测试 Image 索引 Create big data

java转大数据的学习路线

一、大数据相关的工作介绍二、大数据工程师的技能要求三、大数据学习规划 大数据介绍 大数据本质也是数据,但是又有了新的特征,包括数据来源广、数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等。

云栖社区 编程语言 数据存储与数据库 系统研发与运维 linux python 深度学习 分布式 大数据 信息检索算法/实践 Java核心技术 架构 算法 java hbase

大数据新手的0基础学习路线,从菜鸟到高手的成长之路

大数据作为一个新兴的热门行业,吸引了很多人,但是对于大数据新手来说,按照什么路线去学习,才能够学习好大数据,实现从大数据菜鸟到高手的转变。这是很多想要学习大数据的朋友们想要了解的。 今天我们就来和大家分享下大数据新手从0开始学习大数据,实现菜鸟到高手的转变的学习路线。

数据存储与数据库 网络与数据通信 linux 深度学习 分布式 大数据 信息检索算法/实践 算法 mysql hdfs hadoop 数据库 人工智能 配置 集群

基于Tablestore的海量保险单查询平台

背景 随着人们风险意识的提高与普及,越来越多的人愿意为自己与家人投一份保险,保险行业的飞速发展也带来了许多问题:海量的保险单该如何存储?如何高效地对保险单进行检索?传统的解决方案一般使用MySQL等关系型数据库对数据进行持久化与检索,但是随着数据量的上涨如何进行水平扩展变成了一个问题。

数据存储与数据库 信息检索算法/实践 Java核心技术 java 实时系统 mysql 索引 string 存储 数据类型

单颗GPU计算能力太多、太贵?阿里云发布云上首个轻量级GPU实例

阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例,该实例打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。

云栖社区 系统研发与运维 移动开发与客户端 ios 互联网产品及应用 深度学习 定位原理/算法 信息检索算法/实践 性能 阿里技术协会 技术保障 弹性计算 aliyun 云市场 GPU

MaxCompute推出面向开发者的专属版本,普惠大数据开发者

3月20号,阿里云正式对外宣布推出MaxCompute产品的新规格-开发者版。MaxCompute开发者版是阿里云大数据计算服务发布的开发者专属版本。区别于原有的按量付费、按CU预付费规格,开发者版是面向开发者群体的优惠套餐,为开发版项目免费提供500GB的存储空间和每月100元的免费计算费用。

云栖社区 系统软件 数据存储与数据库 系统研发与运维 网络与数据通信 互联网产品及应用 python 分布式 大数据 信息检索算法/实践 架构 分布式系统与计算 java 引擎技术 数据开发

MySQL · 引擎特性 · B+树并发控制机制的前世今生

前言 B+树是1970年Rudolf Bayer教授在《Organization and Maintenance of Large Ordered Indices》一文中提出的[1]。它采用多叉树结构,降低了索引结构的深度,避免传统二叉树结构中绝大部分的随机访问操作,从而有效减少了磁盘磁头的寻道次数,降低了外存访问延迟对性能的影响。

系统软件 编程语言 数据存储与数据库 空间索引原理 信息检索算法/实践 算法 mysql 线程 数据库 Algorithm node 索引 多线程 index 并发控制

NLPIR挖掘让大数据行业价值起重要作用

NLPIR大数据语义智能分析平台主要有精准采集、文档转化、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档去重、全文检索、编码转换等十余项功能模块

安全与风控 深度学习 大数据 信息检索算法/实践 数据挖掘 云服务 物联网 自然语言理解 移动互联网

阿里云Elasticsearch离线平台化建设

阿里云Elasticsearch提供低成本、灵活的分析和搜索服务,很大程度降低了用户的使用成本和运维成本。美中不足的是缺乏数据场景的支持,用户还是需要花很大的精力去解决数据场景的痛点问题,比如 海量数据源如何对接 复杂的数据计算和处理逻辑 全量数据导入影响在线查询 海量数据导入越来越慢 全量/实时数据无损切换 为了帮助用户解决这些痛点问题,阿里云Elasticsearch离线平台应运而生 。

云栖社区 移动开发与客户端 大数据 信息检索算法/实践 架构 搜索 性能 高可用 集群 索引 离线计算 Elasticsearch 磁盘 海量数据 阿里云Elasticsearch

6
GO