NVIDIA显卡性能靠频率?GPU Boost是怎么回事?

简介:

影响显卡性能的不外乎架构、工艺这些大方向,不过今天我们这篇超能课堂要关注的不是AMD、NVIDIA显卡架构设计导致的差异,直接影响显卡性能的还有频率这个指标,这次我们来看看AMD、NVIDIA过去几年中不同显卡在频率上有什么差别了。

GPU Boost:动态调节GPU频率

集成电路芯片通常都是固定(最高)频率运行的,这样做其实并不灵活,理想情况应该是频率根据需要调整,这种频率动态调节技术说起来也不新鲜了,Intel处理器所用的Turbo Boost就是频率动态调节技术,我们之前也做过详细介绍,可以参考下。

  NVIDIA的GPU Boost技术不仅可以用于游戏卡,专业卡上也有应用

在GPU上,NVIDIA最先在Kepler架构的GTX 680显卡引入了GPU Boost加速技术,随后在GTX 700系列显卡上发展到了GPU Boost 2.0,而在最新的GTX 1080显卡上推出了GPU Boost 3.0加速技术。此外,该加速技术也不只是GeForce专享,在NVIDIA的Tesla等专业卡上也应用了GPU Boost技术以提高性能,而且部分场合中对性能的提升还是非常明显的,官方表示有40-50%。

实现GPU加速并不是把频率调高调低这么简单,它需要GPU根据当前的使用情况——功耗、温度、电压、转速等多方因素作出抉择,尽可能提高显卡频率以提升性能,而在不需要高性能的情况下则会降低频率以节能。

  功耗是影响GPU加速的一个关键因素

GPU Boost 1.0的算法

在GTX 680显卡上,NVIDIA推出了GPU Boost 1.0加速技术,影响频率提升的主要因素就是显卡TDP功耗,GPU会根据显卡当前的状态来管理频率加速状态。

GPU Boost 2.0把显卡温度也考虑进去了

到了GTX 700系列及GTX Titan显卡上,NVIDIA推出了GPU Boost 2.0技术,与第一代显卡它要考虑的因素更多,不光是功耗,还有显卡的温度,也就是说GPU加速频率要照顾到功耗及温度两方面,不会为了性能而让温度超标,这样可以不仅可以提高性能,也不会导致温度失控进而导致风扇转速飙升,带来额外的噪音。

在我们的测试中,NVIDIA显卡自GTX 700之后温度上限多控制在80-83癈左右,这其中就有GPU Boost技术的考虑。

  GPU Boost 3.0加速

无论GPU Boost 1.0还是GPU Boost 2.0,GPU频率增加的步进都是固定的(之前做过测试,大约是13MHz一个GPU Offset),而在GTX 1080显卡上,NVIDIA又带来了GPU Boost 3.0技术,它的一个关键改变就是Offset频率不再固定,每个电压点都有对应的频率Offset,这样做的一个好处就是GPU实际加速频率可以更接近理论值。

AMD这边对GPU加速技术似乎并不热心,HD 7970最高频率就是925MHz,之后在HD 7970 GHz显卡上AMD也带来了动态频率调节技术,基础频率1000MHz,加速频率1050MHz。不过之后的AMD显卡频率虽然也变成了动态调节的了,但AMD的加速做法不太一样,官方公布的频率实际上是最高频率,而支持GPU Boost加速技术的NVIDIA显卡公布的频率实际上是显卡最低频率,二者主要的区别可以参考下面的表格:

  AMD、NVIDIA最近几代显卡的基础及加速频率

从这张图中我们可以看到,AMD这几代旗舰显卡的频率一直徘徊在1000MHz左右,28nm工艺下升级过的几代显卡都是如此,NVIDIA的显卡有大小两种核心,大核心的GK110、GM200频率设定比较低,小核心的GK104、GM204就高一些,加速频率可达1.2GHz(非公版上1.3GHz甚至1.4GHz也很轻松),这要比AMD显卡高得多。

到了16/14nm工艺时代,双方在频率上都会提升,但NVIDIA显卡明显更激进一些,GTX 1080显卡基础频率1607MHz,加速频率1733Mhz,仅频率方面就比前代GTX 980提升了40%,这也是GTX 1080显卡性能比后者大幅提升的一个重要原因。

  公版GTX 1080显卡日常应用加速频率实际上可以达到1797MHz

NVIDIA Pascal显卡的实际运行频率其实比标称的加速频率还要高很多,GTX 1080显卡在游戏应用中加速频率实际上可达1797Mhz,之前测过的非公版GTX 1080显卡更夸张,游戏中甚至可以稳定在1.9-1.95GHz之间,要比官方宣称的加速频率高很多。

AMD的RX 480显卡频率比前代也有提升,此前曝光的信息显示加速频率可达1266MHz,预售页面上标的参数是1288MHz。不过,与NVIDIA Pascal显卡相比,Polaris显卡相比,AMD显卡的频率还是更加保守一些,并没有N卡这么疯狂。

总的来说,AMD、NVIDIA两家公司的GPU因为架构及厂商衡量的标准不同,频率上确实存在很大差异,这不会是单纯的技术原因,也不会是简单的市场原因,特别是在Polaris及Pascal显卡上,AMD、NVIDIA双方选择了不同的代工厂,前者是三星/GF系的14nm FinFET LPP工艺,后者是TSMC的16nm FinFET Plus工艺,这对显卡的性能也会有一定影响。

另一方面,频率的设定不仅影响性能,还会影响显卡的超频潜力,NVIDIA的Pascal显卡自身的频率已经很高,虽然非公版大都可以突破2GHz,但与显卡加速频率相比,超频带来的性能增幅越来越小。AMD这边因为没有多少实测,超频潜力还不好说,不过看到有爆料称AMD会提供新超频工具,RX 480显卡已经超频到1600MHz了,如果是这样,那么在超频这点上,AMD显卡留给用户的空间更大。
本文转自d1net(转载)

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
2月前
|
弹性计算 人工智能 网络安全
ECS实例问题之增加GPU显卡失败如何解决
ECS实例指的是在阿里云ECS服务中创建的虚拟计算环境,用户可在此环境中运行应用程序和服务;本合集将介绍ECS实例的创建、管理、监控和维护流程,及常见问题处理方法,助力用户保障实例的稳定运行。
|
4月前
|
人工智能 缓存 调度
技术改变AI发展:RDMA能优化吗?GDR性能提升方案(GPU底层技术系列二)
随着人工智能(AI)的迅速发展,越来越多的应用需要巨大的GPU计算资源。GPUDirect RDMA 是 Kepler 级 GPU 和 CUDA 5.0 中引入的一项技术,可以让使用pcie标准的gpu和第三方设备进行直接的数据交换,而不涉及CPU。
134614 6
|
7月前
|
机器学习/深度学习 虚拟化 数据中心
NVIDIA T4和A10:不同应用场景下的GPU加速器选择
在数据中心和云计算领域,GPU加速器扮演着至关重要的角色。NVIDIA T4和A10是两款适用于不同应用场景的GPU加速器。本文将比较它们的性能和适用场景,帮助读者更好地选择适合自己需求的GPU实例。
1727 0
|
24天前
|
人工智能 芯片 异构计算
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
台积电董事长预见到未来15年内GPU性能每瓦提升1000倍,晶体管数量将破万亿,展示半导体行业激动人心的前景。这将增强GPU计算能力,但同时也带来制造工艺复杂性、散热管理和能效提升的挑战。3D集成技术有望解决部分问题,但需克服技术与经济障碍。
22 5
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
|
1月前
|
人工智能 芯片 异构计算
GPU震撼发布:性能飙升,功耗惊人,液冷成新宠?
Blackwell推出新一代GPU,性能比H100提升5倍,浮点运算速度惊人,但最高1200W功耗需液冷散热。产品线包括B100、B200和GB200超级芯片,后者结合72核CPU,计算性能达40petaflops,内存384GB。新NVLink技术助力GB200构建NVL72系统,可处理27万亿参数的AI模型。
19 1
|
1月前
|
机器学习/深度学习 存储 弹性计算
阿里云GPU服务器价格多少钱?2024年阿里云GPU服务器价格配置及性能测评
2024年阿里云GPU服务器是一款高性能的计算服务器,基于GPU应用的计算服务,多适用于视频解码、图形渲染、深度学习、科学计算等应用场景。阿里云GPU服务器具有超强的计算能力、网络性能出色、购买方式灵活、高性能实例存储等特点。 阿里云提供了多种配置的GPU服务器,包括gn6v、gn6i、vgn6i-vws和gn6e等,这些服务器配备了不同型号的GPU计算卡、不同规格的内存和存储空间,可以满足不同用户的计算需求。同时,阿里云还为新用户提供了特惠价格,包年购买更是低至3折起,使得用户可以更加经济地购买到高性能的GPU服务器。
155 0
|
6月前
|
机器学习/深度学习 人工智能 芯片
一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?
近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。
|
3月前
|
弹性计算 并行计算 UED
带你读《弹性计算技术指导及场景应用》——4. 自动安装NVIDIA GPU驱动和CUDA组件
带你读《弹性计算技术指导及场景应用》——4. 自动安装NVIDIA GPU驱动和CUDA组件
|
4月前
|
弹性计算 并行计算 UED
GPU实例使用--自动安装NVIDIA GPU驱动和CUDA组件
GPU 云服务器正常工作需提前安装正确的基础设施软件,对于搭载了 NVIDIA 系列 GPU卡的实例而言,如果把 NVIDIA GPU 用作通用计算,则需安装 NVIDIA GPU 驱动、 CUDA、cuDNN等软件。
100947 3
|
5月前
|
存储 人工智能 安全
探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从?
在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。