《并行计算的编程模型》一3.7.1 选择集合参与者

简介: 本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.7.1 选择集合参与者

要参与一个集合操作,集合的每个成员必须调用具有相同源和目标参数的相同集合函数,并且每个成员必须指定相同的PE集参与集合。每个集合操作需要三个参数描述哪些PE将参与操作:初始PE、log2(PE_跨步)和参与PE的数目。因此,将这三个参数分别设为(0, 2, 6)意味着该集合操作将包含PE0、PE4、PE8、PE12、PE16和PE20,而(1, 0, 6)将包括PE1、PE2、PE3、PE4、PE5和PE6(当log2(PE_跨步)=0,跨步为1)。
识别重量级同步:在OpenSHMEM函数的调用序列中出现同步数组可以认为是出现重量级同步的指示器,这会在某些平台上对可扩展性有负面影响。此外,虽然参与PE数目不要求是2的幂,非2的幂对一些集合操作的实现会产生性能影响。最后,其他不需要同步数组的同步,包括全局同步屏障和对称分配函数。当需要这些函数时(或可以避免)加以仔细对待是利用OpenSHMEM提供的扩展性优势的关键。

相关文章
|
2月前
逻辑模型—第一性原理
逻辑模型—第一性原理
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
这 10 本书,带你了解 ChatGPT 的底层逻辑
作为一门应用型学科,机器学习植根于数学理论,落地于代码实现。这就意味着,掌握公式推导和代码编写,方能更加深入地理解机器学习算法的内在逻辑和运行机制。 本书在对全部机器学习算法进行分类梳理的基础上,分别对监督学习单模型、监督学习集成模型、无监督学习模型、概率模型四个大类共 26 个经典算法进行了细致的公式推导和代码实现,旨在帮助机器学习的学习者和研究者完整地掌握算法细节、实现方法以及内在逻辑。
100 0
|
vr&ar
【计算理论】计算理论总结 ( 上下文无关文法 | 乔姆斯基范式 | 乔姆斯基范式转化步骤 | 示例 ) ★★
【计算理论】计算理论总结 ( 上下文无关文法 | 乔姆斯基范式 | 乔姆斯基范式转化步骤 | 示例 ) ★★
513 0
|
并行计算 程序员
《并行计算的编程模型》一3.7.4 广播
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.4节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2368 0
|
并行计算 程序员
《并行计算的编程模型》一3.6 排序和同步
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.6节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
906 0
|
并行计算 程序员
《并行计算的编程模型》一3.7.6 归约
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.6节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
973 0
|
并行计算
《并行计算的编程模型》一3.7.2 同步数组和工作数组
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7.2节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1060 0
|
并行计算 索引
《并行计算的编程模型》一2.3.5 活动消息
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.3.5节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
956 0
|
并行计算 安全
《并行计算的编程模型》一2.2.1 相关术语
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.2.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
969 0
|
并行计算
《并行计算的编程模型》一3.7 集合操作
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.7节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
934 0