谷歌第二代TPU再“飞升” 动摇英伟达GPU市场主导地位

简介:

相较于只能使用在深度学习推论(inferencing)的第一代Tensor Processing Unit (TPU)芯片,Google第二代人工智能(AI)芯片Cloud TPU不仅处理速度更快,还多了训练算法的能力,因此可望对NVIDIA绘图处理器(GPU)芯片在AI市场的主导地位造成更大的威胁。

富比士(Forbes)报导指出,深度学习是一种利用大量资料对算法进行训练的AI技术,并已普遍应用在影像与语音辨识功能上。在TPU问世以前,算法的训练多是交由NVIDIA的GPU负责处理。GPU原本是专为电动游戏等专业图形处理任务所设计,但其能将训练深度学习网络所需时间,从几个星期缩短至几天,因此深受AI开发人员青睐。

不过由4块芯片组成最新的Cloud TPU,每秒浮点运算量号称可达180tera FLOPS,比起NVIDIA最新一代GPU Tesla V100的120tera FLOPS高出不少。此外,Google也正尝试将多个TPU集成为单一的TPU Pod系统。TPU Pod与NVIDIA的NVLink技术概念相似,并可望达到每秒11.5petaFLOPS的运算能力。

对Google而言,GPU训练深度学习模型所需时间还是太长。像是Google翻译应用如果使用市面上最新的32片GPU芯片进行训练,仍需要一整天的时间才能完成训练,但如果换成TPU Pod,只需要8分之1的运算能力,就可在6个小时内完成训练。

Google资深科学家Jeff Dean表示,第二代TPU提供了更强大的运算能力,而Google将能藉此打造规模更大、更准确的机器学习模型。

第二代TPU芯片除了将运用在Google的内部服务外,也将透过Google Cloud开放给外部开发人员,而Cloud TPU的租用方式与费用将与目前GPU的租用规则相似。Google更计划推出TensorFlow Research Cloud,并免费发送1,000份TPU芯片供开放AI研究使用。

尽管Google的云端业务起步较亚马逊(Amazon)及微软(Microsoft)晚了一些,但第二代TPU的加入将可给予Google更多竞争优势。

不过也有不少人对Google的芯片事业发展持较保留的看法。分析师Patrick Moorhead便认为,有监于机器学习框架随时都在改变,且其深度与复杂程度都不是单靠TPU就能应付,Google未来仍将不能完全摆脱对GPU的依赖。

另一方面,由于TPU是专为Google的TensorFlow框架所设计,因此外部开发人员如果要将TPU所开发的AI应用移植至Google外的平台,可能会面临一定的风险,而这也表示Google将更有机会把这些应用锁定在自家的云端平台。

本文转自d1net(转载)

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
1月前
|
人工智能 缓存 机器人
【2024】英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍
英伟达在加州圣荷西的GTC大会上发布了全新的Blackwell GPU,这款拥有2080亿个晶体管的芯片将AI性能推向新高度,是公司对通用计算时代的超越。Blackwell采用多芯片封装设计,通过两颗GPU集成,解决了内存局部性和缓存问题,提供20 petaflops的FP4算力,是上一代产品的5倍。此外,新平台降低了构建和运行大规模AI模型的成本和能耗,使得大型语言模型推理速度提升30倍。黄仁勋表示,Blackwell标志着AI算力在近八年内增长了一千倍,引领了技术边界拓宽的新趋势。
|
5月前
|
存储 人工智能 芯片
多GPU训练大型模型:资源分配与优化技巧 | 英伟达将推出面向中国的改良芯片HGX H20、L20 PCIe、L2 PCIe
在人工智能领域,大型模型因其强大的预测能力和泛化性能而备受瞩目。然而,随着模型规模的不断扩大,计算资源和训练时间成为制约其发展的重大挑战。特别是在英伟达禁令之后,中国AI计算行业面临前所未有的困境。为了解决这个问题,英伟达将针对中国市场推出新的AI芯片,以应对美国出口限制。本文将探讨如何在多个GPU上训练大型模型,并分析英伟达禁令对中国AI计算行业的影响。
|
6月前
|
机器学习/深度学习 人工智能 芯片
一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?
近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。
|
5月前
|
存储 人工智能 安全
探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从?
在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。
|
10月前
|
机器学习/深度学习 存储 人工智能
【玩转 GPU】英伟达GPU架构演变
【玩转 GPU】英伟达GPU架构演变
468 0
【玩转 GPU】英伟达GPU架构演变
|
11月前
|
机器学习/深度学习 人工智能 缓存
英伟达用AI设计GPU算术电路,面积比最先进EDA减少25%,速度更快、更加高效
英伟达用AI设计GPU算术电路,面积比最先进EDA减少25%,速度更快、更加高效
206 0
|
11月前
|
机器学习/深度学习 人工智能 定位技术
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
|
11月前
|
人工智能 分布式计算 算法
详解AI加速器(四):GPU、DPU、IPU、TPU…AI加速方案有无限种可能(2)
详解AI加速器(四):GPU、DPU、IPU、TPU…AI加速方案有无限种可能
457 0
|
11月前
|
机器学习/深度学习 人工智能 并行计算
详解AI加速器(四):GPU、DPU、IPU、TPU…AI加速方案有无限种可能(1)
详解AI加速器(四):GPU、DPU、IPU、TPU…AI加速方案有无限种可能
408 0