AMD力挺OpenCL 用GPU打造通用计算神话

简介: 本文讲的是AMD力挺OpenCL 用GPU打造通用计算神话,日前,中国高性能计算年会在长沙召开,展会公布了2009年最新的中国TOP 100,国防科技大学研制的天河一号超级计算机以1 PFlops(千万亿次)的计算速度夺得了中国超算排行榜的第一名。

 本文讲的是AMD力挺OpenCL 用GPU打造通用计算神话【IT168 专稿】日前,中国高性能计算年会在长沙召开,展会公布了2009年最新的中国TOP 100,国防科技大学研制的天河一号超级计算机以1 PFlops(千万亿次)的计算速度夺得了中国超算排行榜的第一名。各家厂商就目前日渐火热的高性能计算市场做出表示,认为随着金融危机的发生,企业逐步认识到高性能计算在工程和研发领域具有高效率、低成本等特点,从而使得高性能计算市场开始增加。

    大会现场,我们看到了AMD将其新近推出的最新HD5000系列显卡和有关GPU通用高性能计算的相关应用案例做了展示。据了解,已经有很多实验性算法是基于OpenCL标准,面向最新的HD 5000系列GPU架构制作的。AMD举办的中国高校GPU加速计算竞赛中,前后有6个代表队以出色的GPU编程脱颖而出。

    Super-LU-killer团队在稠密矩阵LU分解的OpenCL实现中,使用了HD 5870系列显卡的GPU作为运算核心,使得该算法的核心计算峰值达到了28GFlops(矩阵规模n=10240),相对于传统CPU的穿行LU分解版本得到了很高的加速。AMD的工程市介绍,这组算法的设计充分使用了HD 5870的特点,采用Foat4向量化,Memory Coalescing存储优化等方式提高了程序的性能。

    类似的还有Sokudo团队利用GPU单元上的扫描原语和它在PageRank中的应用。据AMD工程师介绍,Sokudo团队将Google著名的PageRank算法从x86平台迁移到了GPU图形加速架构上,其计算速度相比普通四核CPU处理器,获得了24倍的提升。

    据AMD负责GPU通用计算的工程师介绍,“HD 5870的SIMD阵列从10组增倍到20组,每组依然是16个5-D流处理单元和4个纹理单元,因而总计拥有多达1600个流处理器和80个纹理单元,另外还有32个ROP光栅化单元,是Radeon HD 4800系列的两倍。”

    此外,HD 5870 RV870核心采用台积电40nm工艺制造,集成晶体管超过20亿个,核心面积338平方毫米,而55nm工艺的Radeon HD 4870 RV770为9.56亿个/260平方毫米,Radeon HD 4890 RV790则是9.59亿个/282平方毫米,也就是说新核心的晶体管数量翻了一番还多,核心面积却只增加了20-30%,由此可见40nm工艺功不可没。


原文发布时间为:2009-10-29
本文作者:IT168 孟庆
本文来自云栖社区合作伙伴IT168,了解相关信息可以关注IT168。
原文标题:AMD力挺OpenCL 用GPU打造通用计算神话
相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
25天前
|
人工智能 并行计算 PyTorch
【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比(附代码)
【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比(附代码)
32 0
|
3月前
|
人工智能 弹性计算 PyTorch
【Hello AI】神行工具包(DeepGPU)-GPU计算服务增强工具集合
神行工具包(DeepGPU)是阿里云专门为GPU云服务器搭配的GPU计算服务增强工具集合,旨在帮助开发者在GPU云服务器上更快速地构建企业级服务能力
129537 3
|
1月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
6月前
|
机器学习/深度学习 人工智能 芯片
一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?
近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。
|
2月前
|
并行计算 TensorFlow 算法框架/工具
|
4月前
|
机器学习/深度学习 人工智能 运维
阿里云国际站:阿里云GPU计算型云服务器
简介:@luotuoemo 飞机@TG 【聚搜云】服务器运维专家! 提供便捷的管理工具,用户可以通过阿里云控制台轻松管理云服务器。如何使用阿里云GPU计算型云服务器使用阿里云GPU计算型云服务器,需要以下步骤:
|
7月前
|
弹性计算 云计算 虚拟化
阿里云GPU服务器介绍_GPU服务器_GPU云计算_异构计算_弹性计算
阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠
752 0
|
8月前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器价格表(AMD和Nvidia M40/P100/P4/V100)
阿里云GPU服务器价格表(AMD和Nvidia M40/P100/P4/V100)阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
212 0
|
9月前
|
机器学习/深度学习 存储 弹性计算
阿里云服务器X86计算、ARM计算、GPU/FPGA/ASIC等架构区别及选择参考
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、超级计算集群之分,很多初次接触阿里云服务器的用户并不知道他们之间有何区别,本文来介绍一下阿里云服务器各个架构的特点及适用场景,以供大家了解他们之间的区别,从而对选择哪种架构做一个参考。
986 1
阿里云服务器X86计算、ARM计算、GPU/FPGA/ASIC等架构区别及选择参考
|
9月前
|
弹性计算 虚拟化 云计算
GPU云服务器价格_GPU云计算_异构计算_弹性计算-阿里云
GPU云服务器价格_GPU云计算_异构计算_弹性计算-阿里云,阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠,阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表
204 1

热门文章

最新文章