2016国外10家引人注意的大数据初创公司

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介:

大数据技术市场正处于这样一个阶段:Garnter认为是从IT主导的、报告系统转向业务主导、自助式服务分析的最后阶段。其结果是出现了很多新业务智能和分析平台可以满足企业机构对可访问性、敏捷性和更深入的分析洞察力的要求。

大数据

现在有很多初创公司提供这种下一代系统,他们开发新技术用于收集、管理和分析大数据,不管这些数据是结构化的还是非结构化的、动态的还是静态的、本地的还是在云中的。

下面就是2016年引起我们注意的10个很酷的大数据初创公司。

Anodot

CEO: David Drai

Anodot在2015年11月走出隐身模式,推出了实时异常检测和操作智能技术——拥有机器学习专利算法的软件,可以自动进行业务分析、查明性能问题并寻找商业机会。Anodot的目标是从大量数据中查找异常值,并将这些结果转化为有价值的业务洞察。

Anodot的技术旨在用于电子商务网站、数字广告系统和物联网网络,以提高运营效率,最大限度增加收入。

Anodot位于以色列的Ra'Anana,以及加州的桑尼维尔,在9月的B轮融资中获得了800万美元。

Confluent

CEO: Jay Kreps

在大数据管理和分析中,处理实时的流式数据是最大的挑战之一。解决这个问题的其中一项技术就是开源的Apache Kafka通讯代理项目,提供了高吞吐、低延迟的软件,用于处理实时数据。

Confluent是由Apache Kafka创始开发者创建的,提供了一个围绕Kafka的完整实时数据平台,可作为一个容错的、高度可扩展的通讯系统。该软件可用于手机来自用户活动日志、股票行情系统、设备仪表的数据,以及其他广泛用例中的数据。

今年5月,这家位于加州帕洛阿尔托的公司宣布提供Confluent Platform 3.0,通过融合Kafka Streams把流处理能力添加到应用中,还有在企业机构上下操作Kafka的Confluent Control Center。

Koverse

CEO: Jon Matsuo

Koverse开发了一款“盒中数据湖”的平台,并称它可以收集大数据并更快速地运用于生产中,其成本要低于现有的技术和方法。

这家位于西雅图的公司创建于2012年,最早的1.0版本是在两年前首次公布的。Koverse Platform 2.0是在6月发布的,将Apache Accumulo“分布式键值库”技术和该公司自己的Universal Indexing Engine结合到一起。

联合创始人Paul Brown(首席产品官)和Aaron Cordova(首席技术官)曾经是美国国家安全局的数据科学家,在那里他们帮助开发了最早的Accumulo项目,重新架构了国家安全局的数据基础架构,以更好地处理意外的数据分析情况。

Maana

CEO: Babur Ozden

Maana开发了Maana Knowledge Platform,这个数据搜索和发现软件是从大量系统或者“孤岛”中收集数据,并将其转变为可以被业务线应用采用的业务洞察。该系统是构建在Apache Spark处理引擎的。

Maana位于加州帕洛阿尔托,创建于2012年,在2015年5月正式发布,定位是收集和分析由物联网网络生成的大量数据。9月该公司首次公布了其产品的Winter '17版本,Knowledge Applications用于优化像供应链和呼叫中心管理这样的业务流程,Knowledge Assistants用于创建新的分析模型。

Maana在2016年5月进行的B轮融资中获得2600万美元,气走好难过大部分来自该公司的石油和天然气及行业客户,包括壳牌、雪佛龙、沙特阿美、英特尔和通用电气等公司。

Pachyderm

CEO: Joe Doliner

掌握着当前一代大数据技术的初创公司Pachyderm,已经开发出了一种开源分析引擎,采用Docker容器做分布式计算。

这里的重点是提供了一个容器化、模块化、可扩展的数据分析基础设施,采用像Docker和Kubernetes这样的工具作为构建块。该公司的Pachyderm File System和Pachyderm Pipeline System软件帮助数据经理和分析师构建机器学习通道和数据ETL(提取、转换和加载)工作流程。

Pachyderm创建于2014年,位于旧金山,在今年6月的种子轮融资中获得了200万美元。

StreamSets

CEO: Girish Pancha

StreamSets是另外一家解决管理动态数据挑战的公司。更具体地说,StreamSets开发的软件防止“数据漂移”的潜在问题——数据在源头的时候可能会遇到这种不可预测的突变情况,并在应用使用这些数据的时候出现问题。

StreamSets的StreamSets Data Collector软件被用于在任何数据源和任何应用之间构建复杂的数据流。9月,StreamSets首次推出了StreamSets Dataflow Performance Manager用于管理数据流操作。

StreamSets位于旧金山,创建于2014年,创始人包括CEO Girish Pancha、前Informatica首席产品官、现首席技术官Arvind Prabhaker,以及前Cloudera的早期员工、工程负责人。

Striim

President and CEO: Ali Kutay

Striim创建于2012年,创始人包括来自Golden Gate Software、Oracle、Informatica、WebLogic以及其他知名数据管理公司的前高管。

Striim公司位于加州帕洛阿尔托,它的软件将流数据集成与流操作智能结合到一个系统内,实现持续的查询/处理和流式分析。11月,Striimfault了新版本软件,可以配合Google Big Query、Kafka和MapR Technologies使用。

Striim在3月获得了1000万美元的额外资金,使其B轮融资的总金额得到了3000万美元。

Stytch

CEO: Mark Cunningham

Stytch在4月首次推出了自己端到端的数据分析平台,提供系统工具用于自助服务式的数据准备、数据建模、数据发现、报告和仪表板。Stytch得到了Dun & Bradstreet的支持,Stytch系统的主要卖点是它连接到了Dun & Bradstreet庞大业务数据库。

这家位于温哥华的公司创建与2015年8月。创始人、首席执行官Mark Cunningham从1992年就涉足商业智能领域,当时他的家族企业开始开发Crystal Reports,一款早期的、非常成功的Windows报告工具。

Talena

CEO: Nitin Donde

Talena提供了“永远在线”的大数据管理软件,帮助企业保护有价值的数据资产,并基于关键业务应用快速迭代。Talena的技术提供了备份和恢复、测试和开发管理、以及跨Hadoop、NoSQL数据库(例如Cassandra和Couchbase)以及现代数据仓库(例如HPE Vertica)的归档能力。

今年3月Talena发布了针对大数据管理任务的ActiveRx预测分析基础设施。该软件解决了如何将机器学习用于预测数据可用性、如何将备份数据转变为动态数据资产的问题。

Waterline Data

CEO: Alex Gorelik

随着企业机构将基于Hadoop的数据湖聚合起来用于存储海量数据,找到如何以最佳方式利用这些信息就变成一个重大挑战——更不用说随之而来令人头疼的数据治理问题了。

Waterline Data解决了Smart Data Catalog软件的问题,构建了一个完成的数据湖资产库,改善了数据发现和数据监管,让企业更容易从这些资产中获取价值。

Waterline Data创建于2013年,位于加州山景城,在1月的B轮融资中获得1600万美元。


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
存储 NoSQL 大数据
|
人工智能 大数据 数据挖掘
|
大数据
交易大数据初创公司ERN又融得新一轮100万美元
某种程度上,这轮种子轮融资来的比较轻易,但是不管怎样, ERN都在种子轮进一步融得一百万美元,将这个总部位于伦敦的初创企业的融资总金额提升到了560万美元。本轮金额将仅限于用在他们在亚洲市场的扩充。
1011 0
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
46 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
33 0