binary_partition
产品支持情况
产品 |
是否支持 |
|---|---|
Atlas 350 加速卡 |
√ |
x |
|
x |
|
x |
|
x |
|
x |
|
x |
功能说明
binary_partition接口用于根据一个标签(0或1)将父组划分为两个子组,标签相同的线程会被分配到同一子组中。
函数原型
1 | coalesced_group binary_partition(const coalesced_group& g, bool pred) |
1 2 | template <unsigned int Size, typename ParentT> coalesced_group binary_partition(const thread_block_tile<Size, ParentT>& g, bool pred) |
参数说明
参数名 |
输入/输出 |
描述 |
|---|---|---|
g |
输入 |
被划分的父组,类型支持coalesced_group、thread_block_tile。 |
pred |
输入 |
标签,用于划分子组。 |
返回值说明
返回划分出的子组coalesced_group对象。
约束说明
无
调用示例
- SIMT编程场景:
1 2 3 4 5 6 7 8 9 10 11 12
using namespace cooperative_groups; __global__ void simt_kernel(int *inputArr) { auto block = this_thread_block(); auto tile32 = tiled_partition<32>(block); // inputArr 中是随机的整数 int elem = inputArr[block.thread_rank()]; // 根据 elem&1 是否为 true 将tile32划分为两个子组 auto subtile = binary_partition(tile32, (elem & 1)); ... }
- SIMD与SIMT混合编程场景:
1 2 3 4 5 6 7 8 9 10 11 12 13
using namespace cooperative_groups; __simt_vf__ inline void simt_kernel(...) { ... auto block = this_thread_block(); auto tile32 = tiled_partition<32>(block); // inputArr 中是随机的整数 int elem = inputArr[block.thread_rank()]; // 根据 elem&1 是否为 true 将tile32划分为两个子组 auto subtile = binary_partition(tile32, (elem & 1)); ... }
父主题: 协作组