SM 中 warp调度器 每个 cycle 会挑选 active warp 送去执行,一个被选中的 warp 被称为 selected warp,没被选中,但是已经做好准备被执行的称为 Eligible warp,没准备好要执行的称为 Stalled warp。在GPU编程中,预测变量是一个用于指示分支执行路径的变量,其值为1或0。同一个 warp 中的 thread 必须执行相同的指令,若这些线程在遇到控制流语句时,进入了不同的分支,那么同一时刻除了正在执行的分支外,其余分支都会被阻塞,十分影响性能。