IBM和NVIDIA新款人工智能服务器又把英特尔秒了

简介:

在传统服务器芯片市场,英特尔是个巨无霸,无论是IBMPower还是ARM阵营,所占有的份额都微乎其微。但战线转移到人工智能领域,IBM似乎更有优势。

据外媒报道,近日IBM和NVIDIA联手推出了新服务器IBM Power Systems S822LC for High Performance Computing(还有两款产品分别为IBM Power Systems S821LC和IBM Power Systems S822LC for Big Data),从这一串名字可看出,这并不是一款普通的服务器,它是专门为人工智能、机器学习和高级分析应用场景而推出的。

IBM官方宣称,这款服务器数数据处理速度比其它平台快5倍,和英特尔x86服务器相比,每美元的平均性能高出80%。
image
 这款服务器比英特尔x86强在哪?

据了解,该款服务器使用了两个IBM Power8 CPU和4个NVIDIA TeslaP100 GPU。Power8是目前IBM最强的CPU,从之前媒体的评测数据来看,其性能是要优于英特尔E7 v3的,而Tesla P100是NVIDIA今年才发布的高性能计算(HPC)显卡,这样的配置组合在处理性能上自然不弱。

原因有两个:

其一,相比CISC指令集,采用的RISC指令集的Power处理器可同时执行多条指令,可将一条指令分割成多个进程或线程,交由多个处理器同时执行,因此并行处理性能要优于基于CISC架构的英特尔x86芯片。

另外,这款服务器的巧妙之处还在于Power8和Tesla P100之间的“配合”。

Power架构的另一大特点就是具有充分发挥GPU性能的优势。

实际上,Tesla P100有两个版本,一个是NVIDIA今年4月推出的NVLink版,另一个是6月发布的PCI-E版本,简单来讲,前者是后者的加强版,与IBM Power8配对的正是Tesla P100 NVLink版。

Tesla P100采用的是Pascal架构,能够实现CPU与GPU之间的页面迁移,不过每块NVLink版还配置了4个每秒40 GB NVIDIA NVLink端口,分部接入GPU集群。NVLink是OpenPOWER Foundation独有的高速互连技术,其有效带宽高达40GB/S,堪称PCIE的升级版,足以满足多芯片并行计算的需求。不过支持这一标准的CPU屈指可数,Power8则是其中之一(英特尔不在此之列)。

这就意味着,Power8 CPU能够和Tesla P100 GPU以更高的速度完成通信,这一特性可让IBM Power Systems S822LC for High Performance Computing中的CPU和GPU之间的连接速度远快于普通的在PCIe总线上交换数据的表现。

CPU、GPU这样协作更配,IBM和NVIDIA新款人工智能服务器又把英特尔秒了

IBM表示,“这一功能意味着,不同于在GPU处于PCI-E界面上的x86系统上,数据库应用程序、高性能分析应用程序和高性能计算应用程序运行能够在要大得多的数据集上运行。”

另外,Tesla P100的半精度浮点运算性能达到了每秒21万亿次 —— 比插入现代PCI-E插槽的GPU高出大约14%,这样的处理能力对训练深度神经网络的重要性不言而喻。

IBM还做了个纵向对比,和老款Power S822LC服务器的Tesla K80 GPU加速器相比,新款服务器的加速能力提升了两倍多。

预计明年问世的IBM Power9会延续对CPU+GPU组优化。

为何是“CPU+GPU”?

众所周知,在人工智能人工智能和深度学习等计算任务上,CPU早已不堪重任。因此,不少企业纷纷推出人工智能专用芯片概念,例如谷歌的TPU(Tensor Processing Unit);还有业内人士力挺FPGA更适合深度学习的算法,这也是英特尔以高价收购Altera的主要原因。

不过,上述两个替代CPU的方案都还未成熟,目前大多数企业采用的依然是“CPU+GPU”的组合,或者称为异构服务器。通常来说,在这种异构模式下,应用程序的串行部分在CPU上运行,而GPU作为协处理器,主要负责计算任务繁重的部分。

因为和CPU相比,GPU的优势非常明显:

1.CPU主要为串行指令而优化,而GPU则是为大规模的并行运算而优化。所以,后者在大规模并行运算的速度更快;

2。同等面积下,GPU上拥有更多的运算单元(整数、浮点的乘加单元,特殊运算单元等等);

3。一般情况下,GPU拥有更大带宽的 Memory,因此在大吞吐量的应用中也会有很好的性能。

4.GPU对能源的需求远远低于CPU。

当然,这并不代表人工智能服务器对CPU没有需求,CPU依然是计算任务不可或缺的一部分,在深度学习算法处理任务中还需要高性能的CPU来执行指令并且和GPU进行数据传输,同时发挥CPU的通用性和GPU的复杂任务处理能力,才能达到最好的效果,通俗点说就是实现CPU和GPU的协同计算。

虽然NVIDIA和Intel等芯片商正在为GPU和CPU孰强孰弱陷入了口水战,但实际上这些企业已经开始在异构计算上加大了研发力度,至少在近期内,CPU和GPU的结合将继续成为人工智能领域最有效的方案。
本文转自d1net(转载)

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
7月前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器详细介绍(Nvidia M40/P100/P4/V100)
阿里云GPU服务器详细介绍(Nvidia M40/P100/P4/V100),阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡
1327 0
|
9月前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器NVIDIA T4 GPU卡租用价格表
阿里云GPU服务器NVIDIA T4 GPU卡租用价格表,阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
301 0
|
2月前
|
人工智能 安全 Linux
国产服务器操作系统如何加快发展,迎接人工智能带来的新机遇?
近些年来人工智能的飞速发展正在为服务器操作系统产业带来新的机遇,尤其是云智融合的浪潮正在推动着服务器操作系统产业的发展。而国产操作系统需要与时俱进、面向未来,提供支撑人工智能基础设施的底层能力。那么本文就来探讨一下关于国产服务器操作系统的发展方向,云智融合,以及英特尔与龙蜥的合作如何促进国产操作系统的发展,并介绍阿里云的操作系统产品Alibaba Cloud Linux相关内容。
85 1
国产服务器操作系统如何加快发展,迎接人工智能带来的新机遇?
|
3月前
|
人工智能 监控 PyTorch
如何才能在阿里云服务器搭建自己的人工智能
如何才能在阿里云服务器搭建自己的人工智能
|
3月前
|
人工智能 安全 云计算
【专访英特尔】软硬结合,共赴服务器操作系统的云智未来
国产服务器操作系统崛起,云智融合成为行业方向。
|
5月前
|
存储 Linux 数据库
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
服务器数据恢复环境: IBM某型号存储,6块sas硬盘组建一组raid5,划分一个lun分配给Linux服务器并格式化为OCFS2文件系统,共享给虚拟化使用,存放的数据包括24台liunx和windows虚拟机、压缩包文件和配置文件。 服务器故障: raid5阵列中成员盘坏了多块,阵列失效,数据丢失。
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
|
6月前
|
存储 数据挖掘
服务器数据恢复-IBM Storwize V7000存储数据恢复案例
服务器数据恢复环境: P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。 服务器故障: 存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘数据同步到40%左右时,阵列柜中的另一块磁盘也出现问题,数据同步中断,逻辑盘无法挂接到小型机上,业务中断。存储的管理界面显示2块硬盘故障脱机。 阵列柜中的磁盘共组建了2组Mdisk,加到一个pool中。现在主要数据pool无法加载,有3个通用卷无法挂载。
|
7月前
|
机器学习/深度学习 弹性计算 数据可视化
阿里云GPU服务器详细介绍_ NVIDIA A100_A10_V100_T4 GPU卡
阿里云GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚太第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力
1266 0
|
8月前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器价格表(AMD和Nvidia M40/P100/P4/V100)
阿里云GPU服务器价格表(AMD和Nvidia M40/P100/P4/V100)阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
212 0
|
9月前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器NVIDIA A10 GPU卡租用价格表
阿里云GPU服务器NVIDIA A10 GPU卡租用价格表,阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
367 0

热门文章

最新文章