7年来第一次:PowerVR GPU升级真正全新架构

简介:

在加州圣克拉拉举办的年度技术峰会上,Imagination抛出重磅炸弹,宣布了2010年以来的第一个真正 全新GPU架构,代号“Furian”。

七年前的“Rogue”架构是PowerVR GPU第一次采用统一着色器设计,如今已经遍布全球各个领域,PowerVR 6/7/8系列都是基于它衍生来的。

Furian的设计首要目标是改进功耗和性能,具体来说就是每毫瓦性能、每平方毫米性能,号称相比于7XT Plus可提升35%的着色器性能、80%的填充率性能(没说像素还是纹理)、70-90%的综合性能。

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构总览

Furian架构不是从零开始设计的,而是在Rogue的基础上全面翻新。它还是基于区块延迟渲染(Tile Based Deferred Rendering),但几乎每个模块单元、数据流、整体布局都是新设计的,比如支持多线程多任务数据执行,比如微内核固件控制,比如帧缓冲和几何无损压缩,比如新的安全和虚拟化技术,比如增强的扩展性,这对于未来深挖潜力十分关键。

新架构在最核心的ALU Cluster(算术逻辑单元丛簇)方面大大改进,尤其是在每个单独流水线内将原来成对的MAD ALU换成了一个MAD ALU、一个MUL ALU,前者可做加法和乘法,后者只做乘法。

这样的结构效率更高,也更节能——MAD ALU大得多,也需要更多资源才能喂饱。

同时,新架构将每个丛簇的流水线从16级扩展为32级,可降低控制电路负载,而且整体丛簇少了,纹理单元就可以上去了,每时钟周期的双线性采样翻番到8个。

新架构还支持尚未定案的OpenCL 2.x计算标准,以及全面支持Vulkan、OpenVX。

7年来第一次:PowerVR GPU升级真正全新架构

  ALU丛簇总览

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构布局变化

7年来第一次:PowerVR GPU升级真正全新架构

  ALU密度和效率改进:流水线翻番

Furian架构是面向未来的,可以满足7nm工艺、VR游戏、4K超高清、120fps高帧率、HDR高动态画面、神经网络等等的需求。

不过,Imagination今天只是宣布了新架构,并没有任何新的产品设计(虽然提到了PowerVR 8XT),具体还要看后续规划,以及芯片厂商的设计。

至于基于新架构的实际产品,差不多得到2019年了。

7年来第一次:PowerVR GPU升级真正全新架构

  Furian新架构来也

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构要特点

7年来第一次:PowerVR GPU升级真正全新架构

  架构变换努力方向

7年来第一次:PowerVR GPU升级真正全新架构

  PowerVR进化史

7年来第一次:PowerVR GPU升级真正全新架构

  两代架构提升对比

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构的一些核心特点

7年来第一次:PowerVR GPU升级真正全新架构

  更具灵活性

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

扩展性极强

7年来第一次:PowerVR GPU升级真正全新架构

  GPU计算增强

7年来第一次:PowerVR GPU升级真正全新架构

  单独的固件处理器

7年来第一次:PowerVR GPU升级真正全新架构

  高效率系统集成

7年来第一次:PowerVR GPU升级真正全新架构

  市场方向:下一代自动驾驶、移动、平板、变形产品

7年来第一次:PowerVR GPU升级真正全新架构

  市场方向:下一代VR/AR、AI、神经网络、深度学习

7年来第一次:PowerVR GPU升级真正全新架构

  架构汇总

 


  

本文转自d1net(转载)


相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
2月前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
3月前
|
存储 缓存 关系型数据库
鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级
阿里云RDS率先推出新型存储类型通用云盘,提供低延迟、低成本、高持久性的用户体验。
鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级
|
3月前
|
Cloud Native 关系型数据库 分布式数据库
阿里云瑶池助力九州通B2B电商平台,完成100%云原生架构升级
九州通数字化转型,通过引入阿里云云原生数据库PolarDB,云原生内存数据库Tair等产品,完美支撑了医药电商平台数据库100%云原生化,实现了统一、高效、标准化和可跟踪的B2B医药平台。
385 4
|
4月前
|
弹性计算 运维 监控
GPU实例使用--vGPU驱动自动安装和升级
为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高。
GPU实例使用--vGPU驱动自动安装和升级
|
29天前
|
人工智能 缓存 机器人
【2024】英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍
英伟达在加州圣荷西的GTC大会上发布了全新的Blackwell GPU,这款拥有2080亿个晶体管的芯片将AI性能推向新高度,是公司对通用计算时代的超越。Blackwell采用多芯片封装设计,通过两颗GPU集成,解决了内存局部性和缓存问题,提供20 petaflops的FP4算力,是上一代产品的5倍。此外,新平台降低了构建和运行大规模AI模型的成本和能耗,使得大型语言模型推理速度提升30倍。黄仁勋表示,Blackwell标志着AI算力在近八年内增长了一千倍,引领了技术边界拓宽的新趋势。
|
1月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
2月前
|
机器学习/深度学习 存储 算法
【GPU】深入理解GPU硬件架构及运行机制
【GPU】深入理解GPU硬件架构及运行机制
146 0
|
3月前
|
自然语言处理 Cloud Native 开发者
【2023年度技术盘点】「年终盘点后端系列」探索服务架构体系的技术风向,构建微服务核心能力(升级版)
回顾过去的几年,我们目睹了科技界的快速发展,其势头如同一列驶向前方的高速列车。作为后端开发者,我们见证了每一次技术革新所带来的广阔前景。这些创新不仅深刻影响着我们的工作方式,而且不断引领我们走向未来。
64 1
|
4月前
|
消息中间件 架构师 算法
吊打98%的JAVA同行,这份阿里P8架构师升级手册登上天梯!
前言: 我们都是IT人,所以,我们注定了很像。 前段时间有个朋友去阿里面试,作为一个社招生,太多痛苦了。都知道进大厂最好的时机就是应届生的时候。作为社招生,太难了。 我这位朋友经历了五轮面试最后才上阿里做了P6的职位。我也不得不佩服这位朋友的社交能力,和阿里的一个P8熟悉后,那个大佬看他学习能力强,有上进心,于是把他的个人经验手册给了他学习。为了感谢我之前送给他的P6面试笔记,又把这份文档送给了我。所以今天我分享出来。 对于面试题想要的看我之前的文章:从GitHub火到头条!这份万众期待的阿里内部JAVA面试手册,开源了
|
4月前
|
运维 Kubernetes Cloud Native
冠赢互娱基于 OpenKrusieGame 实现游戏云原生架构升级
冠赢互娱基于 OpenKrusieGame 实现游戏云原生架构升级