在执行kernel的时候(即调用clEnqueueNDRangeKernel函数的时候),有两个参数:global_work_size 和 local_work_size,分别指定NDRange中每维work-item的数量和workgroup中每维work-item的数量。
有关get_global/local_id/size
最新推荐文章于 2024-05-23 07:06:17 发布
本文深入探讨了在使用clEnqueueNDRangeKernel函数进行kernel执行时,如何合理设置global_work_size和local_work_size参数,以优化工作项分布和提升并行性能。
2267

被折叠的 条评论
为什么被折叠?



