《OpenACC并行程序设计:性能优化实践指南》一 3.4 通过代码插装准备性能测量

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《OpenACC并行程序设计:性能优化实践指南》一 3.4 通过代码插装准备性能测量

华章计算机 2017-09-08 16:39:00 浏览731
展开阅读全文

3.4 通过代码插装准备性能测量

为了获得非常详细的性能数据,需要修改测试应用程序源代码,以便将事件推送到性能监视器。这个过程称为插装。Score-P使用编译器插装,这意味着使用编译器额外选项来生成所有函数入口和出口,Score-P处理这些出/入口的回调。这些回调是之前介绍的事件。这当然需要编译器支持回调注入,而当前大多数编译器都会这么做。
可以使用提供的性能工具接口、包装库或源码转换来自动插装到所有的并行范例(MPI、OpenMP、Pthreads、OpenACC、CUDA、OpenCL、OpenSHMEM或任何组合)中。因此Score-P可以直接记录所有活动,而不需要手动修改测试应用程序的源代码。
为了调用编译器插装,Score-P为大多数常见编译器提供了编译器包装器。这些包装器通过编译器插装必要的回调来添加正确的标志。称为scor

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属云栖号: 华章计算机