CUDA优化策略之-achieved occupancy

    xiaoxiao2021-04-14  72

    概述

    占用率的定义

    /*SM(Streaming Multiprocessor,流式多处理器):构成GPU的基本硬件单元; multiprocessor:在CUDA里概念和SM一样; 激活warp:在warp中的所有线程在核函数中从开始执行到全部结束的过程; 在每个SM中存在允许最大激活warp的数量; */ 占用率(occupancy):在SM上实际激活warp数量与理论最大激活warp数量之比。占用率从warp的使用到结束都在变,不同的SM,占用率也有可能不一样。

    低占用率无法隐藏延时,高占用率使得每个线程计算任务少。因此,对CUDA程序性能分析,首先要判断不同占用率对核函数性能的影响。

    转载请注明原文地址: https://ju.6miu.com/read-669952.html

    最新回复(0)