将输入Tensor的元素四舍五入到指定的位数。
aclnnRoundDecimals和aclnnInplaceRoundDecimals实现相同的功能,使用区别如下,请根据自身实际场景选择合适的算子。
- aclnnRoundDecimals:需新建一个输出张量对象存储计算结果。
- aclnnInplaceRoundDecimals:无需新建输出张量对象,直接在输入张量的内存中存储计算结果。
每个算子分为,必须先调用“aclnnRoundDecimalsGetWorkspaceSize”或者“aclnnInplaceRoundDecimalsGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnRoundDecimals”或者“aclnnInplaceRoundDecimals”接口执行计算。
[object Object][object Object][object Object][object Object]
参数说明:
[object Object]- [object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
返回值:
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
确定性计算:
- aclnnRoundDecimals&aclnnInplaceRoundDecimals默认确定性实现。
针对decimals不为0的场景: 输入数据超过(-347000, 347000)范围,精度可能会有影响。
参数说明:
[object Object]- [object Object]Atlas 训练系列产品[object Object]:
[object Object]不支持 BFLOAT16。
- [object Object]Atlas 训练系列产品[object Object]:
返回值:
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
针对decimals不为0的场景:输入数据超过(-347000, 347000)范围,精度可能会有影响。
[object Object]