捷讯技术分享阿里云服务器系列之GPU服务器

  1. 云栖社区>
  2. 博客>
  3. 正文

捷讯技术分享阿里云服务器系列之GPU服务器

捷讯技术17 2018-07-27 10:33:04 浏览1201
展开阅读全文

之前陆陆续续给大家介绍了大家一些阿里云服务器的相关产品,今天我们继续一起来了解下另一款接触比较少,但有所耳闻的产品——GPU服务器。说到这个产品大家可能马上就会想到机器学习、挖矿等热门话题。下面就由阿里云湖北授权服务中心捷讯技术的小编给大家简单的分享下这个新产品吧。

首先,阿里云官方定义这个服务器:GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习,视频处理,科学计算,图形可视化,等应用场景,型号有AMD S7150, Nvidia M40, Nvidia P100,Nvidia P4,Nvidia V100阿里云成为中国首家与NGC GPU加速容器合作的云厂商。

一、GPU服务器应用场景

1、AI深度学习

a、深度学习训练和推理在线服务,图像识别;
b、图像内容鉴别,语音识别。

2、科学计算

a、影视渲染制作,碰撞模拟;

b、计算金融、基因工程、气象预测。

3、视频处理

a、大规模高清视频转码4K/8K高清直播;

b、多人视频会议,片源修复。

4、图形可视化

a、工程设计,非线性编辑;

b、远程教育应用,3D展示。

从上面的应用场景中,我们就会发现GPU服务器主要应用的四大场景都是最近比较热门的行业。正是因为GPU服务器拥有强大的计算能力,深度学习近年来在图像处理、语音识别、自然语言处理等领域取得了重大突破,GPU服务器几乎成了深度学习加速的标配。另外GPU的高清转码能力,也让它更多的应用在视频会议和直播当中。科学计算和图形可是得益于GPU服务器的图像处理、分析能力以及渲染功能。

二、GPU 的产品特性

1、超强计算能力

GA1实例:最多可提供 4 颗AMD S7150 GPU、56 个 vCPU 和 160GB 主机内存,以及共计 32GB 的 GPU显存;

GN4实例:最多可提供 2 个 NVIDIA M40 GPU、56 个 vCPU 和 96GB 主机内存,以及共计 24GB 的 GPU显存;

GN5实例:最多提供 8个NVIDIA P100 GPU,52个vCPU和480GB主机内存,以及共计128GB的GPU显存;

GN5i实例:最多提供2个NVIDIA P4 GPU,56个vCPU和224GB主机内存,以及共计16GB的GPU显存;

GN6实例:最多提供 8个NVIDIA V100 GPU,88个vCPU和256GB主机内存,以及共计128GB的GPU显存。

2、网络性能出色

a、满足计算通路网络性能需求;

b、存储性能强大

3、灵活的购买方式

该产品支持按年支付、按月支付、按小时支付、竞价型支付

4、高性能实例存储( GA1和GN5特有)

GA1规格族在支持挂载云端3副本存储的高可靠性云盘存储的同时,随实例搭配了最大1.4TB的超高性能实例存储,可提供230000的读/写IOPS性能、最大1900MBps的读带宽、1100MBps写带宽,读写延迟可稳定在200us左右。

三、规格类型功能介绍
_

从上图中我们可以看出,GA1和GN5i主要是侧重于视频处理和3D渲染,GN4主要侧重于深度学习和科学计算,GN5和GN6则每个产品特性都有所涉及。但是3D图形渲染GN5(Nvidia P100),GN5i(Nvidia P4),GN6(Nvidia V100)非完全支持,有时间期限,需额外购买License。当然这个功能并不是一成不变的,也可以购买其他的产品来互补。

四、常见的实战场景

1、云端在线渲染(GA1)

通过云桌面,快速介入GA1,获得更好的视觉和操控体验。也可以通过远程桌面连接协议可以实现在线实时的渲染和图形图像编辑,可在任何地点使用多种设备接入。数据存储在NAS或者OSS上,随时内网访问拉取使用,保护数据安全。固定办公场所可通过高速通道和NAT网关进一步的提升网络体验和降低成本。GA1实例目前只支持 windows server 2008r2 系列(64位), windows 7 系列(64位),CentOS7.3 (64位), Ubuntu16.04 (64位)等系统,其他不支持,请关注windows server 2016 和 windows 10 近期上线。

2、通用加速能力(GN4)

GN4实例基于NVIDIA的Maxwell M40 GPU,以最高14TFLOPS的单精浮点计算能力满足了深度学习等通用GPU计算场景下,对大规模并行浮点运算的算力需求。与弹性计算生态的完美结合,为不论是在线还是离线场景提供了通用的解决方案。搭配容器服务使用,简化部署和运维的复杂度,并提供资源调度服务。

3、超强计算超速能力(GN5)

GN5实例基于NVIDIA的Tesla P100 GPU,以最高74.4 TFLOPS的单精浮点计算能力满足了深度学习等通用GPU计算场景下,对大规模并行浮点运算的算力需求。同时提供最高37.6TFLOPS的双精浮点计算能力,满足科学计算等高性能计算场景的需求。支持GPU Direct P2P技术,可通过PCI总线实现GPU之间直接通信,大大降低GPU间的通信延迟。与弹性计算生态的完美结合,为不论是在线还是离线场景提供了通用的解决方案。搭配容器服务使用,简化部署和运维的复杂度,并提供资源调度服务。

4、AI推理计算(GN5i)

GN5i实例基于NVIDIA的Tesla P4 GPU,以最高11 TFLOPS的单精浮点计算能力和44 TOPS的int8定点运算处理能力满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75W,具有极高的性能功耗比。与弹性计算生态的完美结合,为不论是在线还是离线场景提供了通用的解决方案。搭配容器服务使用,简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化用户部署。

好啦,今天的分享到此结束啦!关于GPU 服务器的更多相关知识,小编也会继续学习,下次有机会还会跟大家分享。当然欢迎大家在我们武汉捷讯技术的官网查阅阿里云的相关文档,也可直接咨询我们的在线客服

网友评论

登录后评论
0/500
评论
捷讯技术17
+ 关注