阿里云发布异构计算产品家族,你可以在上面模拟核爆炸

简介: 本文讲的是阿里云发布异构计算产品家族,你可以在上面模拟核爆炸,近一年来,人工智能迎来了史上第三次热潮。移动互联网时代沉淀下来的大量数据和GPU近几年的快速发展,让学界和业界相信,这人工智能时代真的要来了。

本文讲的是阿里云发布异构计算产品家族,你可以在上面模拟核爆炸

image


数据、算力和算法,这是人工智能发展的三大要素。

近一年来,人工智能迎来了史上第三次热潮。移动互联网时代沉淀下来的大量数据和GPU近几年的快速发展,让学界和业界相信,这人工智能时代真的要来了。

由于人工智能模型训练对算力的要求,原有的通用型CPU架构无法满足,不少企业或科研机构在训练模型的时候会通过采用和主处理器(CPU)不同架构的加速器件(也就是所谓“异构”),如GPU、FPGA、ASIC等器件,提供高密度并行计算的运算能力,非常适合当下的人工智能应用体系。


image


算力推动了人工智能发展,产业发展也催生了对计算能力的需求,业界专家预测,到2020年,与人工智能相关的计算力需求将会增长12倍。瞄准了这个巨大的需求,公有云厂商开始提供相关产品。

今天(9月12日),阿里云宣布推出全新一代异构加速平台,这是阿里云首次发布一整套异构计算家族,涵盖GPU、FPGA在内等7款异构实例;还有基于阿里云异构平台的全新高性能计算实例E-HPC,可一键部署大型超算集群环境。

针对不同业务场景开不同的“车”

之前,企业如果需要类似的架构来训练深度学习模型,从服务器和GPU的采购、架构的搭建,到软件的授权付费,都要自己完成。据阿里云方面表示,利用阿里云的服务可将深度学习成本缩减一半,降低人工智能计算门槛。

阿里云这次推出的人工智能解决方案,囊括了云服务的各层级(详见下图)。


image


先说IaaS层提供的服务器层面,跟此前阿里云发布企业级云服务器产品线的总思路类似,便是为不同的计算需求和人工智能业务场景推出不同的实例。

新一代GPU实例GN5i可以将类似场景需求进一步细致化。据阿里云高级技术专家龙欣接受36氪专访时介绍,深度学习模型一般有两个阶段,训练阶段和在线推理阶段,两个阶段对计算力的要求不同,训练阶段处理大量数据,需要服务器有高吞吐量,推理阶段则更需要快速响应用户要求。这就有点像送货,追求大容量可以用卡车,量小但是要求快可以用跑车。

因此,在原有的GPU实例GN5的基础上,阿里云推出了适用于深度学习在线推理阶段的新一代GPU实例GN5i。龙欣介绍,后者采用了专有推理型GPU,英伟达 Pascal架构P4图形处理器,时延最低可达微秒级;另外,GN5i可一键部署TensorFlow、Caffe等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务,降低人工智能在线服务成本50%以上。


image


其中,GPU是目前比较主流的通用并行加速器;FPGA是一种可编程的加速器,让开发者自定义加速算法,提供高效灵活场景化并行计算能力,阿里云高级技术专家游亮介绍,FPGA在低位宽场景有明显优势。相比基于GPU的异构计算产品,FPGA更适合金融分析、基因匹配、深度学习和物联网等对业务有快速迭代计算需求的领域。

阿里云2017年初推出了基于英特尔Arria 10芯片的FPGA计算实例,此次发布的F2实例基于赛灵思Xilinx KU115器件。

开发者版的淘宝:IP市场

有趣的是,阿里云针对FPGA特性,推出了一个FPGA镜像市场,这有点像一个FPGA版的应用市场。

由于FPGA的灵活性,开发者在编好一套加速算法之后,其实可以将这套算法输出。传统大的售卖方式是,为了避免自己的算法写漏,开发者需要从上游购买芯片,然后将芯片电路板烧好,最后卖给终端用户。

阿里云的PFGA镜像市场推出后,开发者可以将自己的加速方案算法(IP)放到这个市场上,终端用户如果需要用可以直接从市场购买算法使用权,然后从阿里云购买FPGA芯片。


image


除了提供一个FPGA版的淘宝之外,阿里云还提供一个弹性的FPGA开发平台,FPGA加速算法的门槛高,技术因素之外,还与其相关开发套件和测试环境的专利授权费高昂有关,后者费用一年可能达到数十万美金,但实际上闲置的时候可能很多,如果阿里云从国外厂商购买版权之后,推出少量使用免费,超量按需求付费模式,降低FPGA IP的开发门槛。


image


此前,阿里云就推出了类似的镜像市场,当时针对Docker的镜像市场。总体而言,这套思路很阿里,开个平台,搭好基础设施让你在上面交易,同时平台提供一堆解决方案。听起来是不是很像一套开发者版的淘宝,况且还依靠公有云本身庞大的客户数和生态,似乎是巨头的生意。

不过,据阿里云的几位专家介绍,国内FPGA的生态尚未完善,虽然懂开发的人不少,但目前跟他们合作到PFGA平台上准备上线产品的企业也不到三位数。这个市场还属于一个抢占未来的产品。尽管GPU还是主流,但是包括AWS、微软和谷歌等公有云厂商,都非常看好FPGA的前景。

云人工智能布局进入生态之争

针对传统对高性能计算有强烈需求的高校科研机构和企业用户,阿里云异构计算家族还包含了弹性高性能计算实例E-HPC。

高性能计算又称为又称为并行计算和超级计算,常应用于解决大规模的科学、工程和商业问题,比如气象预报、工程计算、基因分析、油藏探测、量子化学等领域,可以利用该技术模拟核爆炸、分子运动、汽车撞击等场景。据游亮介绍,异构计算其实最开始是用在高性能计算场景中。

从前,如果企业或者科研机构有使用高性能计算的需求,需要到国家超算中心申请、排队。如今随着高性能计算的需求爆发,制药和汽车企业对此需求增长,但并非所有企业都有能力建设一座超算中心。因此,在云上“建立超算中心”的实践在国外已经相对普遍。

E-HPC属于PaaS层的服务,基于异构计算云平台在高性能虚拟化、并行计算和低延迟网络等方面的特性,提供的是高性能计算集群计算能力、调度能力和软件能力,客户可以按需组建自己的“云上超算中心”,并可实现一键部署和弹性伸缩。阿里云称其为中国首个公共云上的HPC as a Service产品,同时提供混合云解决方案。


image


目前,阿里巴巴集团内部很多业务使用异构计算,比如拍立淘、以图搜图、商品分类等,使用阿里云异构计算的企业客户有数千家,其中包含微博、陌陌、华大基因、中国工程院等。


image

从阿里云这次发布全套异构计算家族的动作来看,显然他们想传递给开发者的并不是我有不同的ECS这么简单。说到底,异构计算云服务器实例总归是花钱就能买到的东西,趋于同质化趋势,公有云厂商能做的是尽量推出最新最高性能的产品,面向不同的场景提供垂直化的方案也是差异化竞争的需要。

除此之外,阿里云还有相应的PaaS层服务,提供相应加速器场景下一键部署、快速研发和弹性伸缩等能力,同时针对人工智能、高性能计算和大数据等业务场景推出了专门的调度平台,以降低企业的使用门槛和运维压力。

同时,阿里云也推出相应的IP交易市场,对接开发者和终端用户。从底层的IaaS到SaaS层的具体解决方案,阿里尝试显然提供一个生态。36氪此前报道就指出,云服务市场将是垂直之争与生态建设,企业对云的需求也更加的垂直化和场景化;同时,未来公有云厂商技术上与其他厂商的差距会逐渐缩小,提供的产品随着市场的成熟也会趋同,因此,要留着客户,也许更重要的是要提供更好的生态和打造自身品牌。

随着产业往人工智能时代越走越深,开发者对相关解决方案的需求也会越来越大,谁在时代初期就抢占“未来”的市场,谁将是赢家。

来源:36氪
本文原标题:阿里云发布异构计算产品家族,你可以在上面模拟核爆炸

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
27天前
|
关系型数据库 分布式数据库 数据库
成都晨云信息技术完成阿里云PolarDB数据库产品生态集成认证
近日,成都晨云信息技术有限责任公司(以下简称晨云信息)与阿里云PolarDB PostgreSQL版数据库产品展开产品集成认证。测试结果表明,晨云信息旗下晨云-站群管理系统(V1.0)与阿里云以下产品:开源云原生数据库PolarDB PostgreSQL版(V11),完全满足产品兼容认证要求,兼容性良好,系统运行稳定。
|
1月前
|
存储 NoSQL 数据库
阿里云数据库Cassandra的产品价格
阿里云数据库Cassandra提供多地域服务,如中国、亚太、欧洲、美洲及中东。计费分为实例主机节点规格费和存储费用,实例价格因节点数和副本数而异,存储费用按挂载云盘计算。生产系统建议配置多节点以确保冗余。公网流量目前免费,具体收费时间未定。详细价格以购买页面为准。
421 3
|
26天前
|
SQL 存储 API
阿里云实时计算Flink的产品化思考与实践【下】
本文整理自阿里云高级产品专家黄鹏程和阿里云技术专家陈婧敏在 FFA 2023 平台建设专场中的分享。
110658 80
阿里云实时计算Flink的产品化思考与实践【下】
|
1天前
|
物联网 云计算
电子好书发您分享《阿里云产品手册2024版》
**《阿里云产品手册2024版》电子书分享:** 探索阿里云最新产品与服务,涵盖云计算、物联网及安全等领域。降价优惠高达55%,详尽指南助你高效利用云资源。[阅读电子版](https://developer.aliyun.com/ebook/8326/116556?spm=a2c6h.26392459.ebook-detail.4.7424272ayuuPGu) ![阿里云手册](https://ucc.alicdn.com/pic/developer-ecology/cok6a6su42rzm_066de4cfe9654074b30718f57e8e27f4.png)
15 3
|
8天前
|
API
阿里云微服务引擎及 API 网关 2024 年 3 月产品动态
阿里云微服务引擎及 API 网关 2024 年 3 月产品动态。
|
9天前
|
安全 云计算
电子好书发您分享《阿里云产品手册2024版.阿里云产品手册2024版》
**《阿里云产品手册2024版》电子书分享:** 探索阿里云最新技术与服务,涵盖云计算、安全、移动研发等领域,详尽指南助您高效上云。[阅读链接](https://developer.aliyun.com/ebook/8326/116556?spm=a2c6h.26392459.ebook-detail.4.176b272aLerqlg)
24 1
|
13天前
|
云安全 数据采集 安全
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
阿里云提供两种关键安全产品:Web应用防火墙和云防火墙。Web应用防火墙专注网站安全,防护Web攻击、CC攻击和Bot防御,具备流量管理、大数据防御能力和简易部署。云防火墙是SaaS化的网络边界防护,管理南北向和东西向流量,提供访问控制、入侵防御和流量可视化。两者结合可实现全面的网络和应用安全。
阿里云安全产品,Web应用防火墙与云防火墙产品各自作用简介
|
15天前
|
消息中间件 人工智能 监控
|
23天前
|
消息中间件 Cloud Native Serverless
飞天发布时刻丨阿里云 ApsaraMQ 全面升级,携手 Confluent 发布全新产品
阿里云在3月29日的飞天发布时刻宣布ApsaraMQ全面升级,实现全系产品Serverless化,与Confluent合作推出新产品,强化云原生消息队列服务。
|
29天前
|
存储 弹性计算 Serverless
什么是阿里云FPGA云服务器?FPGA云服务器产品优势及应用场景介绍
FPGA云服务器是阿里云提供的实例规格,融合现场可编程门阵列的低延迟硬件加速与弹性资源。FaaS平台简化了FPGA开发,提供统一硬件、开发环境和丰富的IP生态。特性包括硬件虚拟化、联合仿真和动态互联配置。产品计费与ECS一致,支持多种计费模式。优势在于分钟级交付、高性能加速、经济性价比和设计复用。应用广泛,如视频转码、人工智能、基因测序等。FPGA云服务器通过FPGA镜像、OSS服务等工具进行管理。
什么是阿里云FPGA云服务器?FPGA云服务器产品优势及应用场景介绍

热门文章

最新文章