1. 聚能聊>
  2. 话题详情

关于GPU虚拟化的发展史,扒出点料出来?

如果在10年前谈起云计算,大部分人的反应是“不知所云“。但是随着云计算场景的普及,概念的深入人心,慢慢的大家都对云计算有一个较清晰的概念和实例化的理解。异构计算场景的应用上来后,对GPU,FPGA,TPU等专业计算芯片也提出了虚拟化和上云的强烈要求。尤其是对最近几年机器学习,深度学习等领域的快速发展,催生了异构计算场景搬迁上云的高潮。

——2008年:序言
VMware的GPU全虚拟化VSGA技术是第一次对GPU共享虚拟化的尝试,在VMware商业化的Workstation 6.5和Fusion2.0 于2008年底首先输出,后续增加了在面向数据中心产品vSphere的输出。

——2012年:开始
随着kernel VFIO 模块的引入和直通设备的慢慢普及,GPU的虚拟化之路开启。而开始更大规模运用,大概跟VFIO模块的普及在同一个时间节点:在2012年左右,事实上GPU的直通技术一直是VFIO模块的一个重要应用场景。

——2013年:第一个产品与群雄逐鹿
NVIDIA 在2013 发布了GRID K1的产品,则标志着GPU虚拟化的成熟并逐渐开启了异构计算虚拟化的快速发展历程。
而事实上在2013同年,Intel OTC 针对HSW 的GVT-d 和GVT-g的GPU虚拟化方案的也已经开发了一年有余。Intel 对GPU行业发展保持着敏锐的技术洞察力。早在2011年便已经开始了GPU虚拟化的提案,然而没有重视。直到三年后的2014年,才有基于GVT-g的XenClient产品问世。
同年: VFIO 模块的社区维护者在KVM Forum上也正式发布了VGA的assignment。(详见:https://www.linux-kvm.org/images/e/ed/Kvm-forum-2013-VFIO-VGA.pdf)
同年初: AMD 也已经开始基于SRIOV的GPU虚拟化方案(Tonga架构),并开始研发SRIOV PF的GIM驱动和vGPU调度系统。两年后,AMD终于迎来了首款GPU SRIOV的产品:FirePro S7150 (2016年初发布)

——2014年:vGPU 分片虚拟化诞生
随着一篇Usenix ATC的论文的发表:”A Full GPU Virtualization Solution with Mediated Pass-Through“ 默默无闻的GPU虚拟化的一个新技术正式进入了大家的视眼:GPU分片虚拟化(中文暂且这么叫吧。因为mediated passh-through的叫法根本就不能让人明白这个到底是什么)。

——2015年:分化
Intel 与Citrix的合作,先后发布了基于GVT-d 和分片虚拟化的GVT-g的XenClient 和 XenServer的产品。这些产品代表着当时Xen社区GPU虚拟化业界的标杆。为什么是Xen社区呢? 因为GVT-g当时还没有发布KVM 版本。
Intel 也开始在各大内外会议推送GVT-g的技术,当然是希望自己技术可以产品化并有一个好的市场前景。
而AMD 继续研发全球首款SRIOV GPU。
当其他人都在玩技术的时候,NVIDIA 已经开始了产业布局。

——2016,2017年: 回报
2016 AMD带来了全球首款GPU的SRIOV显卡FirePro S7150x2。
Intel继续在各大论坛极力宣传Intel GVT-g技术。并在技术上第一次领先行业龙头NVIDIA率先实现了vGPU的热迁移技术,可以说Intel OTC的虚拟化部门在自己力所能及的情况下把GVT-g做到了极致,然而在产品化的道路上却越走越艰难。
NVIDIA此时凭借着AI的风口一路狂奔,日益完善GRID技术和分片虚拟化,并在2016年的KVM Forum的第二天,NVIDIA架构师Neo浓重介绍了GRID vGPU技术。
大家感受一下当时的场景:GRID vGPU听众与GVT-g的听众对比:

_

——2018年:新领域
NVIDIA 继续保持着行业第一的身份把持了绝大部分市场份额。谁让人家有远见早早布局早早收割。AMD 也有后续产品的发布。比如针对老对手NV的对标DeepLearning的MI25 的发布等。
各种新兴行业也开始应用GPU虚拟化技术。最直接的便是车载娱乐系统,简称IVI(In-vehicle Information system )。于是三位老朋友又是老对手,都开始在IVI和自动驾驶领域开始竞争。而这也为Intel GVT-g的技术落地带来了转机。于是Intel率先发布了基于物联网的虚拟化方案(ACRN),并夹带着GVT-g的分片虚拟化技术浩浩荡荡的再次出发。


——商用GPU虚拟化方案
目前流行的可以商用的GPU虚拟化方案可以分为以下几类:GPU 直通模式,GPU SRIOV 模式,GPU 半虚拟化(mediated passthrough:包括Intel GVT-g和Nvidia GRID vGPU),VMWare的GPU全虚拟化(vSGA)。当然也有尚未成熟处于玩票性质的virtioGPU等等。


1. 看完这个发展史,你对GPU虚拟化怎么看?

  1. 阿里云的GPU产品你了解多少?
  2. 关于2018年新领域,你有觉得GPU和新领域会发声什么火花?
参与话题

奖品区域 活动规则 6天后 结束

  • 奖品一

    手机话费 x 2

  • 奖品二

    云栖帽衫 x 1

  • 奖品三

    福禄寿淘公仔 x 1

6个回答

1

微wx笑 复制链接去分享


1、看完这个发展史,你对GPU虚拟化怎么看?
GPU主要实现计算机的图形呈现,具有高性能的多处理器阵列,随着GPU技术的发展,其在3D渲染和大规模并行计算中起着越来越重要的作用。
  虚拟化技术是对传统计算资源使用方式的一次新突破,虚拟计算技术的引入打破了真实计算中软件与硬件之间的紧耦合关系,为不同需求的计算系统架构带来了活力支撑。
目前针对GPU虚拟化的研究仍处于起步阶段,大多数都是针对2D、3D图形处理,在GPU通用计算方面涉及较少。随着GPU性能的提升,其优秀的通用计算能力越来越显著,与图形计算一样成为研究的热点。在信息爆炸的大背景下,安全性成为GPU虚拟化不容忽视的问题,关于GPU虚拟化安全计算的研究同样处于起步阶段。
长远来看,GPU虚拟化将充分释放GPU的并行计算能力,大幅降低企业面对诸如大数据分析、动漫设计、电影特效渲染等高性能计算需求成本,同时提升云计算应用的服务质量。


2、阿里云的GPU产品你了解多少?
了解不多,业务中没有对GPU的需求。


3、关于2018年新领域,你有觉得GPU和新领域会发声什么火花?
基于GPU的虚拟化、视觉计算、深度学习等技术将会是引领IT产业下一个技术创新、产业爆发的增长点?

0

小可同学 复制链接去分享

1. 看完这个发展史,你对GPU虚拟化怎么看?

哈哈,我们现在做的事情都是直接出租带gpu的物理机啦!一台性能强悍的物理机服务器加两块主流的gpu卡,你想怎么用都可以,当然表面上价格肯定会比租用虚拟机贵一点了,但是我们主要面向深度学习这种领域,当用户在线预测,离线训练请求到达一定规模后我们性能,成本的优势就会显现出来啦!所以还是美滋滋的。

2. 阿里云的GPU产品你了解多少?

GPU云服务器,还有一个帮助文档:https://www.aliyun.com/jiaocheng/ios_4697.html

3. 关于2018年新领域,你有觉得GPU和新领域会发声什么火

因为数据分析!!数据带来的价值很大,所以对应的产品就会跟着好啦

0

浮生递归 复制链接去分享

看完这个发展史,你对GPU虚拟化怎么看?
大势所趋。发展迅速,将来又是一个热门产品。特别是英伟达,太牛了,股票从2015年的25块,一直涨到现在的231块!我还能说什么呢。我只是在上周突然想到英伟达的股票可以长期持有个几年,然后就马上查了他们的股票,发现已经太晚了,人家已经爆涨了几年了。25涨到231是什么概念?2015年,你买25万英伟达,现在已经有231万了。

阿里云的GPU产品你了解多少?
阿里云的GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习,视频处理,科学计算,图形可视化,等应用场景,型号有AMD S7150, Nvidia M40, Nvidia P100,Nvidia P4,Nvidia V100
阿里云是中国首家与NGC GPU加速容器合作的云厂商。

关于2018年新领域,你有觉得GPU和新领域会发生什么火花?
计算加速、Volta架构与Tensor核心、TensorRT、搭载Tesla V100的DGX与HGX、Nvidia GPU Cloud云平台、Xavier系统芯片及加深度学习速器开源、丰田汽车正式搭载Nvidia Drive PX,以及ISAAC机器人模拟系统

0

aoteman675 复制链接去分享

1、看完这个发展史,你对GPU虚拟化怎么看?

就和CPU虚拟化一样,就是为了软件和硬件之间的解耦。充分发挥了弹性计算的业务需要,并不是高度耦合的低计算,极大限度的发挥了计算资源的释放。GPU虚拟化加速了计算领域计算能力的提升,不论在数据分析还是图形渲染上都能获得最大限度的计算量,同时满足多业务需求的高度融合。。

2、阿里云的GPU产品你了解多少?

它是个并行计算产品,现在做3D绘制都要买个GPU高的个人电脑。是个相对于云服务器的特殊类产品,打算在后期做3D渲染再购买一个。

3、关于2018年新领域,你有觉得GPU和新领域会发声什么火花?

人工智能是GPU的天下,总之在数据爆发的时期,GPU会领先CPU的应用市场的地位,科学计算,3D,虚拟场景这些都需要GPU。领域的深入会触发产品的升级,我们从GPU的发展可以看出,市场的推动,产品技术不再是挤牙膏了。

0

小明先生. 复制链接去分享

学到了,谢谢你的分享

0

沙漠的热情 复制链接去分享

1,看完这个发展史,你对GPU虚拟化怎么看?
看好,GPU虚拟化不就是云化嘛,就可以用云计算的方式提供服务了。这个,不错。

2,阿里云的GPU产品你了解多少?
知道一个GPU云服务器 链接:https://www.aliyun.com/product/ecs/gpu

3,关于2018年新领域,你有觉得GPU和新领域会发声什么火花?
云计算+大数据+人工智能将驱动新一轮产业升级,数据对各行各业的价值都显而易见,因此强大的算力谁都需要。
医疗算是新领域吗?

7062
浏览
1
收藏
邀请他人互动
关注
27
粉丝
211
话题
11

简介:

为实现“云上超算”的梦想不断努力。
GPU云服务器是基于GPU应用的计算服务,多适用于视频解码,图形渲染,深度学习,科学计算等应用场景,该产品具有实...

主机市场占用率第一,20年专业品质保证

阿里云机器学习是基于阿里云分布式计算引擎的一款机器学习算法平台。用户通过拖拉拽的方式可视化的操作组件来进行试验,...

为您提供简单高效、处理能力可弹性伸缩的计算服务,帮助您快速构建更稳定、安全的应用,提升运维效率,降低 IT 成本...