aclnnAddRelu&aclnnInplaceAddRelu
产品支持情况
功能说明
- 接口功能:完成加法计算后得到结果再进行激活。
- 计算公式:
函数原型
aclnnAddRelu和aclnnInplaceAddRelu实现相同的功能,使用区别如下,请根据自身实际场景选择合适的算子。
- aclnnAddRelu:需新建一个输出张量对象存储计算结果。
- aclnnInplaceAddRelu:无需新建输出张量对象,直接在输入张量的内存中存储计算结果。
每个算子分为,必须先调用“aclnnAddReluGetWorkspaceSize”或者“aclnnInplaceAddReluGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnAddRelu”或者“aclnnInplaceAddRelu”接口执行计算。
[object Object][object Object][object Object][object Object]
aclnnAddReluGetWorkspaceSize
参数说明:
[object Object]- [object Object]Atlas 训练系列产品[object Object]:参数
[object Object]、[object Object]、[object Object]、[object Object]的数据类型不支持BFLOAT16。
- [object Object]Atlas 训练系列产品[object Object]:参数
返回值:
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
aclnnAddRelu
aclnnInplaceAddReluGetWorkspaceSize
参数说明:
[object Object]- [object Object]Atlas 训练系列产品[object Object]:参数
[object Object]、[object Object]、[object Object]的数据类型不支持BFLOAT16。
- [object Object]Atlas 训练系列产品[object Object]:参数
返回值:
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
aclnnInplaceAddRelu
约束说明
确定性计算:
- aclnnAddRelu&aclnnInplaceAddRelu默认确定性实现。
针对selfRef数据类型为INT8,other数据类型为INT32的场景: 由于cast算子将INT32转换成INT8类型时存在精度问题(具体参见),该场景下输出结果精度无法保证。
调用示例
[object Object]