GetReduceSumMaxMinTmpSize
功能说明
kernel侧ReduceSum接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。
- 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小。
- 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。该接口最大临时空间当前等于最小临时空间。
函数原型
1
|
void GetReduceSumMaxMinTmpSize(const ge::Shape &srcShape, const ge::DataType dataType, ReducePattern pattern, bool isSrcInnerPad, bool isReuseSource, uint32_t &maxValue, uint32_t &minValue) |
参数说明
返回值
无
支持的型号
调用示例
完整的调用样例请参考更多样例。
1 2 3 4 5 6 7 |
// 输入shape信息为1024;算子输入的数据类型为float;不允许修改源操作数 auto shape = ge::Shape({ 16, 32 }); uint32_t maxValue = 0; uint32_t minValue = 0; bool isSrcInnerPad = true; bool isReuseSource = false; AscendC::GetReduceSumMaxMinTmpSize(shape, ge::DataType::DT_FLOAT, AscendC::ReducePattern::AR, isSrcInnerPad, isReuseSource, maxSize, minSize); |
父主题: ReduceSum