Teradata整合旗下数据仓库产品和大数据设备

简介:

ZDNet至顶网软件频道消息:Teradata正在扩充其数据仓库和分析产品的用途,做法是在逻辑上将多个数据库合并在一起,以此将数据海洋和数据仓库结合在一起。

 Teradata拓展自己的宇宙在数据的海洋中提供数据仓库产品

这是Teradata统一数据架构总图

Teradata是业界领先的数据仓库供应商,该公司正在将旗下的产品和更新的大数据/Hadoop设备整合在一起,让该公司的数据/商业智能的用户能够在数据的海洋中畅游,并用这种方式实现公司业务的增长。

公司的成长幅度已经不那么明显了,但得益于大数据的大热,公司仍在增长:

Teradata拓展自己的宇宙在数据的海洋中提供数据仓库产品 

2015年第一季度情况还需等待

QueryGrid

Teradata的自助服务QueryGrid可以跨越多个分析引擎和数据库进行查询。它增加了QueryGrid连接器:

  • Teradata-to-MapR
  • 针对Hadoop 的Teradata-to-Cloudera Distribution
  • 针对Hadoop 的Aster-to-Cloudera Distribution
  • Teradata-to-Teradata的可用性
  • 增强现有的Teradata-to-Hortonworks数据平台

这意味着用户可以使用单一查询语言进行更多的查询,而不必为了使用新的分析引擎访问新的库学习新的技能。他们也不必让数据从一个无法使用的仓库转移到可以使用的仓库。这些都让查询的速度变得更快。

Teradata表示将不同平台的——无论是私有的还是开放源代码的——数据和分析结合起来的好处跨越所有的垂直市场和数据源。这意味着不用联合仓库,而是用一个统一的界面使用它们。

软件定义数据仓库

该公司即将推出软件定义数据仓库,这也就是说客户可以“将多个数据仓库整合到一个系统之中,而且不用牺牲安全性或者服务级别性能。”

这对于他的数据库是一种增强。第二项改进是提供安全域,“它将数据和用户组按照不同的实体分开,并在不同的区域之间设置安全的边界”。这帮助客户达到隐私法规的要求,这些法规限制了数据在地理意义上的移动。

Teradata表示这些功能包括:

  • 多租户部署分别管理来自多个业务单位或者组织的数据和用户。
  • B2B分析服务简化托管并且为Teradata客户的伙伴管理B2B分析服务
  • 数据市场整合,提供了“一种更简单的方法,让用户能够获得数据的企业视图,同时能够让每个数据集保持数据、用户、应用和工作负载”,不需要进行数据抽取、转换和加载(ETL)。
  • 产生分析沙箱或者没有数据重复或者不用创建新的仓库的自助服务数据实验室。

针对Hadoop 的Dashboard引擎

ThinkBig,Teradata的大数据咨询业务引入了DEH(Dashboard Engine for Hadoop)。它表示:“Dashboard和在线分析流程(OLAP)会提供在商业智能市场周围徘徊了几十年的摘要。但是……没有一个人从大规模的多结构Big Data中获得OLAP摘要分析,”至少到现在为止。

它处理多种形式的多结构化数据,例如点击流、手机日志、传感器和JSON(JavaScript Object Notation)。

Teradata表示DEH能够以每小时数TB数据的速度提取数据,形成数十亿种聚合,商业用户可以使用它们。ThinkBig的总裁Ron Bodkin表示:“它为组织提供了能够在一秒钟之内总结Hadoop数据的能力,不用经历转换和建模。”

ThinkBig提供了安装和专家实施服务以帮助客户使用DEH。

Data Warehouse Appliance 2800

Teradata表示这款产品——全名:Teradata Data Warehouse Appliance 2800——是一个综合的数据仓库,和之前的版本相比,这款产品拥有两倍以上的计算能力,在同一机架上的数据容量最多高出四倍。

2800对内存处理的分析进行了优化,并且准备好运行装满组件的机架。它可以被用作数据仓库、数据集市、灾难恢复系统或者测试和开发使用的分析沙盒。

它配备了双Intel Xeon Haswell 14核CPU,高达512GB的DDR4内存和SuSE Linux。Teradata表示该系统使用了英特尔的向量指令集和板载缓存以提高性能。互联是Teradata的BYNET V5on InfiniBand。

它可以对Teradata智能记忆进行“自动、实时、基于使用的数据使用监控”,将“使用最频繁的数据放到内存中。”随着系统的扩展,总体可用内存会自动扩展,最多可以有12个节点的机柜,总共可以连接200个节点。

据说数据库管理员不用担心数据防止或者数据重组,因为内存和存储的设计是作为一个单位协同工作。

存储基于Dot Hill的Ultra48 AssuredSAN阵列,可以使用2.5英寸的300GB, 600GB, 900GB 和1.2TB硬盘。该系统可以扩展到54PB以上。盘状设计让磁盘分部在前面和后面,这样做有利于提高容量。

机柜包含了采用了无共享集群设计的Teradata Database、托管服务器和可选的备份技术。客户可以安装可选的第二生产系统,测试并开发能力,或者在同一个机柜中备份并回复存储硬件。

这里可以查阅DWA 2800的数据表。

Teradata实验室的领导即将离职加盟Hortonworks

Scott Gnau自从2011年5月以来就一直担任Teradata实验室的总裁,目前即将离职去担任Hortonworks的首席技术官,Hortonworks是IPO的Hadoop分销商。我们理解他为Teradata的集成数据仓库、Big Data分析和相关的产品提供研发和销售支持活动方面的指导。他也也推动了Teradata从Teradata实验室投资并收购和解决方案相关的技术。

在一段录音中,Gnau表示:“Hortonworks推动了整个Hadoop生态系统,并且推动了企业通过它的产品的集中架构采用这个平台。”。他热衷于数据等。

Teradata会寻找另一个BI/BD(商业智能/大数据)高手来替代他。

可用性

QueryGrid的Hortonworks的功能将于五月份推出。针对Hadoop的Dashboard Engine的测试版目前就可用。GA将在第三季度推出。Teradata Data Warehouse 2800 Appliance全球有售,并且兼容Teradata Database 14.10及以后的版本。

原文发布时间为:2015年4月27日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
14天前
|
分布式计算 运维 数据挖掘
MaxCompute是一个强大的云数据仓库服务
【4月更文挑战第1天】MaxCompute是一个强大的云数据仓库服务
20 1
|
4月前
|
SQL 存储 分布式计算
【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍(图文解释 超详细)
【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍(图文解释 超详细)
143 0
|
14天前
|
存储 数据采集 分布式计算
构建MaxCompute数据仓库的流程
【4月更文挑战第1天】构建MaxCompute数据仓库的流程
21 2
|
1月前
|
分布式计算 大数据 Hadoop
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。
79 2
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
|
1月前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
62 0
|
2月前
|
人工智能 分布式计算 大数据
重磅!阿里云在海外市场推出系列AI大数据产品
重磅!阿里云在海外市场推出系列AI大数据产品
84 1
|
3月前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年1月】
大数据&AI产品技术月刊【2024年1月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
|
4月前
|
人工智能 自然语言处理 分布式计算
大数据&AI产品月刊【2023年12月】
大数据&AI产品技术月刊【2023年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
|
4月前
|
人工智能 分布式计算 Cloud Native
大数据&AI产品月刊【2023年11月】
大数据&AI产品技术月刊【2023年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
46 0