深度学习提速280%!阿里云性能怪兽GN6 V100 GPU实例深度测试

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间。V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷。

高性价比深度学习神器!阿里云GPU实例V100 最深度评测

在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间。V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷。

近期,国内云计算一哥阿里云开启了新一代高性能 GPU 计算云服务器 GN6 系列的公测,也是国内运营商中首个提供最新 NVIDIA V100 GPU 的云服务提供商。

8345939ca2f952dfd6440a24f058a20cbb5538eb

GPU 云服务器 V100

据悉,新的计算实例搭载最新的 NVIDIA V100 计算核心,宣称可带来数倍的深度学习性能提升。究竟搭载英伟达V100的阿里云GPU实例有几把刷子,我们申请了一台最新的GN6系列云服务器,进行了深度测试,一起来看下。

人工智能市场爆发 GPU云服务器成香饽饽

66773c6a849306b24f437d78f813bd9a10408162
国内云厂商上线实例列表

随着人工智能的发展,基于 GPU 的异构计算开始不断升温。特别是传统的 CPU 通用计算由于受到半导体工艺、存储带宽瓶颈等问题,开始在人工智能的运算中显露疲态。而 GPU 由于省去了 CPU 中复杂的控制流,可以将所有算力都投入到深度学习所需要的矢量运算中去,大大提高了算力和算力利用率。

除了性能之外,带来的更多的还是成本的降低。按照传统方案,云服务商可以采购4个机架、共160个CPU服务器,在功耗65千瓦的情况下提供每秒45000张照片的处理能力。而如果换成GPU的产品,你可能只需要一个装有8片GPU的服务器,同样的每秒45000张照片处理能力,但是你只需要7个服务器插槽,总共的功耗也只有3千瓦。

c8df7f3729b2be8d4ca72d22ad0f875579252652

阿里云人工智能布局

在公测期间,用户可以登陆阿里云平台提交测试申请,提交申请的用户会拿到阿里云异构计算平台提供的 GN6 云服务器,进行业务和平台验证。如果你像我一样,忍受不了长时间的计算,那么GN6系列可能是在目前所有的选择中最合适的那一款。

得益于搭载的 NVIDIA V100 GPU 拥有的新的 VOLTA 架构及新增的 Tensor 单元等因素,GN6 云服务器相比前代 GN5 云服务器拥有更加强劲的性能,能够以更少的时间花费来完成计算。

从P100到V100 性能提升近300%

4e7ce3486d838bd5502c296217e2cb5bcd5cea34

 V100 P100 性能对比

我们也通过申请拿到了一台 GN6 云服务器( 实例 ID ecs.gn6p-c8g1.2xlarge,8 vCPU ,32GB 内存)来测试,同时我们还购买了几个同配置的其他机型,来进行对比测试,具体的测试结果如下:

使用 MXNet 框架,测试 Inception-V3 网络在 ImageNet 数据集的图像分类训练的 Benchmark 性能

 6fcc262f95f82c2be27bd26017329c5108967bb0

MXnet 对比结果

使用 NVCaffe 框架,测试 GoogLeNet 网络在 ImagNet 数据集的图像分类训练性能
71ecbdcb485c6cb0cfea31d94244a9935e3b4ced

目前来说,社区的框架还没有更新到能够完全利用 TensorCore 的水平,所以性能无法达到在发布会上声称的十数倍的提升,不过即使是在这种情况下,我们测试到的结果依然表现不俗,性能相比于前代 GN5 云服务器提升了接近 3 倍。同样工作量的训练任务工作时间将压缩过半。

随着后续机器学习框架不断升级优化,TensorCore 的性能将得到全面发挥,将会给机器学习带来再一次大幅度提速。

姗姗来迟的基础镜像 云服务器开箱即用

一直以来,我们购买 GPU 云服务器后,都需要花费大量的时间来进行基础环境的配置、安装 NVIDIA 的驱动。在此处更新中,阿里云还上线了新的基础镜像,新的基础镜像预装了 NVIDIA GPU 驱动和深度学习框架的系统镜像,我们在云服务器启动随即可以准备开始进行深度学习的计算,大大节省了环境配置的时间,减少重复工作,GPU 云服务器也终于做到了开箱即用。

创建云服务器时,开发者可以直接在选择镜像时在镜像市场搜索“深度学习”,就可以找到预装深度学习框架的系统镜像,点击使用就可以直接创建开箱即用的 GPU 云服务器。

d2f11acb6874df611adf6d5e5b38e7eec84ca7bc

 

我们在使用 GPU 云服务器进行深度学习所需要的准备时间从原来的数个小时缩短到了不到五分钟,确确实实节省了大量的工作时间。

总结

就目前人工智能而言,已然进入战国时代,而且各家的产品都有可能在这个广阔的市场中找到自己的定位和细分市场,从跑分来看,阿里云的 GN6系列云服务器是市面上性能最强的GPU云服务器,,没有之一。在易用性上,一键部署、镜像市场等服务都有不俗的表现。

在价格方面,阿里云GN6相比同类的V100服务器要低上不少,让我们看到了作为云计算领军者的诚意。同时我们也相信未来会有更多的云厂商推出类似的服务,让整个人工智能市场拥有强大的计算能力。


 转自:https://mparticle.uc.cn/article.html?spm=a2s0i.db_contents.content.10.223acc71aV9IZJ&uc_param_str=frdnsnpfvecpntnwprdssskt&wm_id=c9c44564ca234df0be219e38392383ae&wm_aid=05c612bc356a4e649bfe6ed6e7d591b9

 

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
11天前
|
机器学习/深度学习 前端开发 算法
利用深度学习技术提升前端图像处理性能
本文将探讨如何利用深度学习技术在前端图像处理中提升性能。通过结合深度学习算法和前端技术,我们可以实现更高效的图像处理功能,提升用户体验和系统性能。
|
11天前
|
弹性计算 大数据 数据处理
阿里云服务器实例哪些属于入门级,哪些是企业级?有何区别?
阿里云服务器的实例规格从级别上来说分为入门级和企业级,从实例规格种类上来说,又分为突发性能型、共享型、计算型、通用型、内存型、大数据型等,2024年截止目前在阿里云的活动中,可选的云服务器实例规格有轻量应用服务器、经济型e、通用算力型u1、计算型c7、计算型c7a、计算型c8a、计算型c8y、通用型g7、通用型g7a、通用型g8a、通用型g8i、通用型g8y、内存型r7、内存型r8y等,有的新手用户不是很清楚2024年阿里云活动中的云服务器实例哪些属于入门级,哪些是企业级?有何区别?下面根据官方的各种资料介绍为大家解答下这些疑问,帮助您能更清楚地了解阿里云服务器,快速找到自己对云服务器产品的需
阿里云服务器实例哪些属于入门级,哪些是企业级?有何区别?
|
2天前
|
存储 监控 Apache
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
网易的灵犀办公和云信利用 Apache Doris 改进了大规模日志和时序数据处理,取代了 Elasticsearch 和 InfluxDB。Doris 实现了更低的服务器资源消耗和更高的查询性能,相比 Elasticsearch,查询速度提升至少 11 倍,存储资源节省达 70%。Doris 的列式存储、高压缩比和倒排索引等功能,优化了日志和时序数据的存储与分析,降低了存储成本并提高了查询效率。在灵犀办公和云信的实际应用中,Doris 显示出显著的性能优势,成功应对了数据增长带来的挑战。
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
|
8天前
|
存储 弹性计算 运维
深度解读:阿里云服务器ECS经济型e实例配置整理和性能参数表
阿里云推出经济型ECS e系列服务器,适用于个人开发者、学生和小微企业。该系列采用Intel Xeon Platinum处理器,支持多种CPU内存配比,性价比高,2核2G3M配置只需99元/年,新老用户不限量购买且续费不涨价。提供相同可用性SLA和安全标准,具备ESSD Entry云盘等企业级特性。适合中小型网站、开发测试和轻量级应用
|
9天前
|
存储 弹性计算 运维
阿里云服务器ECS经济型e实例特点、适用场景和使用常见问题解答
阿里云新推经济型e系列服务器,适用于个人开发者、学生和小微企业。该系列基于Intel Xeon Platinum处理器,提供1:1、1:2、1:4内存比选项,性价比高,不限购,续费不涨价。2核2G3M配置只需99元/年,企业用户2核4G5M服务器199元/年。具备价格优惠、品质保障、充足供应和多样化配置等特点。支持IPv4/IPv6,仅限专有网络VPC。实例规格和性能指标详表见原文,适合中小型网站、开发测试和轻量级应用。更多信息访问阿里云ECS页面。
|
9天前
|
弹性计算 运维 Serverless
Serverless 应用引擎产品使用之在阿里函数计算中,使用阿里云API或SDK从函数计算调用ECS实例的服务如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
35 4
|
9天前
|
存储 弹性计算 运维
阿里云服务器ECS经济型e实例详细介绍
阿里云新推经济型e系列服务器,适用于个人开发者、学生和小微企业。该系列采用Intel Xeon Platinum处理器,支持多种CPU内存配比,性价比高,不限购,续费不涨价。2核2G3M配置仅需99元/年,企业用户2核4G5M服务器199元/年。具备价格优势、品质保障和充足供应,但性能可能不及企业级实例。支持IPv4/IPv6,仅限专有网络VPC。更多规格和性能指标可见官方文档。
阿里云服务器ECS经济型e实例详细介绍
|
9天前
|
消息中间件 运维 Serverless
Serverless 应用引擎产品使用之在阿里云函数计算FC中,函数的执行时间是根据实例的存活时间进行计算如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
29 0
|
9天前
|
关系型数据库 Serverless 异构计算
Serverless 应用引擎产品使用之在阿里云函数计算中使用包含GPU的实例并且镜像超过10GB了如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
31 0
|
11天前
|
运维 云计算 开发者
阿里云实例体验分享
阿里云开发者计划中使用高校身份申请了阿里云服务器,目前已经使用超过一周了。分享下这一周使用以来的亲身感受吧!

热门文章

最新文章