ARM公司公布CPU与GPU更新计划——一切为了AI

简介:

芯片设计厂商ARM公司于本周一公布其基于DynamIQ微处理器架构的第一波处理器产品,同时亦提到经过调整的GPU芯片设计方案。

ARM公司公布CPU与GPU更新计划全部针对AI用例进行调整

ARM公司产品营销负责人John Ronco在接受电话采访时解释称,DynamIQ代表着“一种新的CPU整合方式,其能够提供更多配置选项,旨在更为灵活地实现CPU对接。”

Ronco介绍称,这项技术允许各计算核心以不同尺寸形式存在。此举相当于对2011年首次出台的big.LITTLE架构(其中各核心以分组形式存在,且不同分组间允许存在规模差异)进行扩展,且具备一系列潜在优势。举例来说,包含一个大型计算核心与七个小型计算核心的芯片能够利用较小核心执行持续性计算任务,而较大核心则面向性能密集型应用需求。

Ronco进一步解释道,“DynamIQ是一种新的计算核心拼接方式。在它的帮助下,您将能够对各计算核心进行混合与匹配,从而在自有设计方案中实现更多可能性。我们期待着看到更多用户将其中的大型计算核心引入各类中端设备之内。”

使用这种芯片架构设计的最初两款CPU分别为ARM Cortex-A75Cortex-A55,二者将于2018年第一季度开始逐步出现在各硬件制造商发布的设备当中。

Cortex-A75专为性能而生,这套设计方案可用于旗舰级手机设备、其它计算设备、基础设施以及车载系统芯片等等。根据ARM公司的说法,在主频为3 GHz的情况下,其SPECint 2006基准测试成绩可在运行速度方面超过原有Cortex-A73 50%以上。

Cortex-A55则面向效率进行调整。“其拥有极为强大的能源效率与成本效率,”Ronco指出,他同时预计这款芯片将被用于众多中端手机设备。

Ronco强调称,A55的上代产品A53已经成为目前普及范围最广的64CPU方案。

ARM公司宣称,16纳米制程的A55处理器相较于前代28纳米A53处理器,能够将能源效率提升达50%

Ronco解释道,“对于手机而言,由于其所能够提供的电池续航能力非常有限,因此持续使用时长对于用户来说可谓至关重要。”

Mali-G72 GPU

ARM公司还计划公布Mali-G72图形处理单元,以作为其Mali-G71的换代方案。该公司指出,其去年总计售出10亿块GPU,大约相当于2014年出货量的两倍。

G72针对图形密集型移动游戏、移动VR以及手机内机器学习等负载类型进行了优化,ARM公司产品营销主管Anand Patel表示。

根据Ronco的解释,目前正有越来越多的客户对于AI以及机器学习等方向抱有浓厚兴趣。“这在一定程度上改变了我们所处理的计算任务种类。”

最新的Mali设计当中包含用于强化机器学习计算能力的优化机制。举例来说,其通用矩阵到矩阵乘法(简称GEMM)计算的能源效率提升了17%

在接受电话采访时,咨询企业IDC公司分析师Abhi Dugar表示,AI类应用对于高通等大型ARM客户已经变得非常重要。


原文发布时间为: 2017年5月31日

本文作者:孙博

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
1月前
|
人工智能 缓存 机器人
【2024】英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍
英伟达在加州圣荷西的GTC大会上发布了全新的Blackwell GPU,这款拥有2080亿个晶体管的芯片将AI性能推向新高度,是公司对通用计算时代的超越。Blackwell采用多芯片封装设计,通过两颗GPU集成,解决了内存局部性和缓存问题,提供20 petaflops的FP4算力,是上一代产品的5倍。此外,新平台降低了构建和运行大规模AI模型的成本和能耗,使得大型语言模型推理速度提升30倍。黄仁勋表示,Blackwell标志着AI算力在近八年内增长了一千倍,引领了技术边界拓宽的新趋势。
|
10月前
|
存储 机器学习/深度学习 人工智能
COMPUTEX2023|NVIDIA GRACE HOPPER为加速生成式AI而设计的超级芯片全面投产
5 月29 日,英伟达在 2023 台北电脑展大会推出了DGX GH200 AI超级计算机,这是配备256颗Grace Hopper超级芯片和NVIDIA NVLink交换机系统的尖端系统,具有1 exaflop性能和144TB共享内存。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
首次英伟达Hopper基准测试
首次英伟达Hopper基准测试
|
11月前
|
机器学习/深度学习 人工智能 PyTorch
7nm制程,比GPU效率高,Meta发布第一代AI推理加速器
7nm制程,比GPU效率高,Meta发布第一代AI推理加速器
366 0
|
芯片
NVIDIA 或将放弃以 400 亿美元收购 Arm:毫无进展
NVIDIA 或将放弃以 400 亿美元收购 Arm:毫无进展
|
存储 人工智能 5G
三星发布新一代 LPDDR5 内存 满足 AI 和 5G 使用场景
前些时候,三星发布了新一代的移动内存 LPDDR5。该内存采用 10 nm 工艺,峰值传输速率 6400 MHz,是上一代 LPDDR4X 的1.5倍,带宽高达 51.2GB/s!已经可以比肩桌面级内存 DDR4 的水平。在功耗方面,LPDDR5 有两种规格,分别为 1.1V(6400 MHz)和 1.05V(5500 MHz),8GB LPDDR5 DRAM相比LPDDR4X DRAM最高省电30% 。不仅性能更强而且功耗更低,LPDDR5 可以说为新一代智能手机和汽车量身打造,以满足对硬件性能要求更高的 AI 需求。
206 0
三星发布新一代 LPDDR5 内存 满足 AI 和 5G 使用场景
|
边缘计算 架构师 芯片
为了独立GPU Xe,英特尔“挖”了多少前AMD顶级专家?
为了建立图形相关的工程师与营销团队,英特尔聘请了一些前AMD的高管和工程师。
283 0
|
人工智能 内存技术
一窥 ARM 的 AI 处理器
最近,ARM 进一步公开了 ML Procesor 的一些信息。本文从不同角度进行了介绍,值得我们仔细分析。
1395 0

热门文章

最新文章