GetBlockNum
产品支持情况
产品 |
是否支持 |
|---|---|
√ |
|
√ |
|
√ |
|
√ |
|
x |
|
√ |
功能说明
获取当前任务配置的核数,用于代码内部的多核逻辑控制等。
函数原型
1 | __aicore__ inline int64_t GetBlockNum() |
参数说明
无
返回值说明
当前任务配置的核数。
约束说明
无。
调用示例
1 2 3 4 5 6 7 8 | // srcGm、dstGm为外部输入的gm空间 AscendC::GlobalTensor<float> srcGlobal; AscendC::GlobalTensor<float> dstGlobal; blockNum = AscendC::GetBlockNum(); // 获取核总数 perBlockSize = srcDataSize / blockNum; // 每个核平分处理相同个数 blockIdx = AscendC::GetBlockIdx(); // 获取当前工作的核ID srcGlobal.SetGlobalBuffer(reinterpret_cast<__gm__ float*>(srcGm + blockIdx * perBlockSize * sizeof(float)), perBlockSize); // 分配每个核上的srcGlobal的内存地址 dstGlobal.SetGlobalBuffer(reinterpret_cast<__gm__ float*>(dstGm + blockIdx * perBlockSize * sizeof(float)), perBlockSize); // 分配每个核上的dstGlobal的内存地址 |
父主题: 系统变量访问