文档
注册
评分
提单
论坛
小AI

GetMeanMaxMinTmpSize

功能说明

kernel侧Mean接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。

  • 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小;
  • 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。该接口最大临时空间当前等于最小临时空间。

函数原型

1
void GetMeanMaxMinTmpSize(const uint32_t n, const uint32_t srcTypeSize,  const uint32_t accTypeSize, const bool isReuseSource, uint32_t &maxSize, uint32_t &minSize)

参数说明

表1 接口参数列表

接口

输入/输出

功能

n

输入

输入数据每行的实际计算个数。

srcTypeSize

输入

算子输入的数据类型大小,单位为字节。比如算子输入的数据类型为half,此处为2。

accTypeSize

输入

accType的数据类型大小,单位为字节,accType参数说明可参考Mean接口参数说明

isReuseSource

输入

是否复用源操作数输入的空间,与Mean接口一致。此处为预留参数。

maxSize

输出

Mean接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。

说明:

maxValue仅作为参考值,有可能大于Unified Buffer剩余空间的大小,该场景下,开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。

minSize

输出

Mean接口能完成计算所需最小临时空间大小。为保证功能正确,接口计算时预留/申请的临时空间不能小于该数值。

返回值

无。

支持的型号

Atlas A2训练系列产品/Atlas 800I A2推理产品

Atlas推理系列产品(Ascend 310P处理器)AI Core

调用示例

// 算子输入的数据类型T为half,accType为float,isReuseSource传入默认值false
uint32_t n = 3;
uint32_t srcTypeSize = 2;
uint32_t accTypeSize = 4;
uint32_t maxValue = 0;
uint32_t minValue = 0;
AscendC::GetMeanMaxMinTmpSize(n, srcTypeSize, accTypeSize, false, maxValue, minValue);
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词