《OpenACC并行程序设计:性能优化实践指南》一 3.3 激光驱动电子束的粒子单元模拟

简介: 本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.3节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.3 激光驱动电子束的粒子单元模拟

粒子单元代码通过将模拟域划分为网格(单元格)来模拟粒子在电磁场中的运动,同时保持粒子作为自由运动的实体。本章用于性能研究的示例模拟了如何将非常高能量的激光脉冲射入氢气中,并且在其尾流场中加速以产生几乎以光速传播的电子束,并且不需要相当大的常规粒子加速器来加速电子束。
图3-3展示了实际模拟通过离散时间步长的过程,其中每一步涉及四个阶段。首先计算所有粒子在电场(E)和磁场(B)作用下的洛伦兹力(F)。接下来,粒子沿着洛伦兹力方向移动。这些移动的带电粒子产生电流(J),计算产生的电流大小。最后,产生的电流会影响原有电场和磁场,每次开始前都需要重新计算电场和磁场。选择合适的模拟时间步长的持续时间,使得在一个时间步长内粒子移动的距离不超过一个单元大小。

screenshot

PCIonGPU源于一个高中生在HZDR实习期间的概念证明。它是单个GPU CUDA实现,比任何其他PCI代码都要快。从那时起,人们将这个应用移植到多GPU上,并且代码从CUDA C变成了C++ 11。使用本章之前讲述的优化步骤,程序总性能得到进一步提升。PIConGPU功能已经封装成库,可供其他应用调用,使得其他粒子网格模拟的开发者从中受益。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
9月前
如何用晶体管构建异或门
。XOR ,异或的缩写,它是一种逻辑运算,当高电平输入的数量为奇数时,产生高电平输出;当低电平输入的数量为偶数时,产生低电平输出。这种独特的特性使异或门成为各种应用中的重要组成部分,从简单的二进制算术到复杂的数据加密算法。 在本文中,我们将探讨异或门的内部工作原理,包括其真值表、逻辑符号表示、电路图以及使用晶体管的实际构造。
481 0
路径损耗计算模型 | 带你读《大规模天线波束赋形技术原理与设计 》之二十五
本小节介绍 3D 信道的路损模型,是以 ITU 信道为基础拓展得到的。
11568 0
路径损耗计算模型  | 带你读《大规模天线波束赋形技术原理与设计 》之二十五
|
1天前
|
vr&ar Python
物理电学:基础概念与模拟实践
物理电学:基础概念与模拟实践
基于Verilog HDL与虚拟实验平台的计算机组成与CPU实验第九章:多功能运算电路
基于Verilog HDL与虚拟实验平台的计算机组成与CPU实验第九章:多功能运算电路
150 0
基于Verilog HDL与虚拟实验平台的计算机组成与CPU实验第九章:多功能运算电路
|
存储 监控 Android开发
嵌入式软件组件经典架构与存储器分类
嵌入式软件组件经典架构与存储器分类
198 0
嵌入式软件组件经典架构与存储器分类
|
存储 传感器
高效学习传感器|浅谈CCD的工作原理以及常用波
高效学习传感器|浅谈CCD的工作原理以及常用波
654 0
高效学习传感器|浅谈CCD的工作原理以及常用波
|
设计模式 负载均衡 并行计算
|
异构计算
鸟类的大脑处理数据模式,可以启发CPU/GPU的设计
鸟类的大脑处理数据模式,可以启发CPU/GPU的设计
90 0
|
5G 调度
波形设计 |带你读《5G空口特性与关键技术》之四
峰均功率比(PAPR,Peak to Average Power Ratio)是发射机峰值功率和均值功率的比,它由所采用的信号波形决定,对于发射机的能耗影响很大,是发射波形的一项重要指标。峰均功率比越低,对于提高发射机的效率越有好处。这一指标对于上行终端侧具有尤其重要的意义。
波形设计 |带你读《5G空口特性与关键技术》之四
场景建模 | 带你读《大规模天线波束赋形技术原理与设计 》之二十一
本节讲述了3D 信道场景 、 UMa 场景和 UMi 场景 和 Indoor Office 场景 。
 场景建模   | 带你读《大规模天线波束赋形技术原理与设计 》之二十一