- 接口功能:完成除法计算,并根据mode参数选择舍入操作。
- 计算公式:
aclnnDivMods和aclnnInplaceDivMods实现相同的功能,使用区别如下,请根据自身实际场景选择合适的算子。
- aclnnDivMods:需新建一个输出张量对象存储计算结果。
- aclnnInplaceDivMods:无需新建输出张量对象,直接在输入张量的内存中存储计算结果。
每个算子分为,必须先调用"aclnnDivModsGetWorkspaceSize"或者"aclnnInplaceDivModsGetWorkspaceSize"接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用"aclnnDivMods"或者"aclnnInplaceDivMods"接口执行计算。
[object Object]
[object Object]
[object Object]
[object Object]
参数说明:
[object Object][object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
Atlas 350 加速卡:
- 数据类型需满足[object Object]TensorScalar互推导关系[object Object],推导之后的数据类型为整数类型或布尔类型时,推导之后的数据类型会转换为FLOAT。
- out在mode为0时,支持FLOAT、FLOAT16、DOUBLE、BFLOAT16、COMPLEX128、COMPLEX64;
- mode为1或2时,支持FLOAT、FLOAT16、DOUBLE、INT32、INT64、INT16、INT8、UINT8、BOOL、BFLOAT16、COMPLEX128、COMPLEX64。
返回值:
第一段接口完成入参校验,出现如下场景时报错:
[object Object]
参数说明:
[object Object][object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
Atlas 350 加速卡:
- 数据类型需满足[object Object]TensorScalar互推导关系[object Object]。
- 当mode为0时,selfRef与other推导之后的数据类型为整数类型或布尔类型时,推导之后的数据类型会转换为FLOAT。
- selfRef在mode为0时,支持FLOAT、FLOAT16、DOUBLE、BFLOAT16;mode为1或2时,支持FLOAT、FLOAT16、DOUBLE、INT32、INT64、INT16、INT8、UINT8、BOOL、BFLOAT16。other不支持COMPLEX128、COMPLEX64。
返回值:
第一段接口完成入参校验,出现如下场景时报错:
[object Object]
- 确定性计算:
- aclnnDivMods&aclnnInplaceDivMods默认确定性实现。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:当mode为1(trunc模式)或2(floor模式),因FLOAT16/BFLOAT16数据类型精度有限,无法表示所有小数,在舍入取整/向下取整时存在一定误差,可以选择更高精度的数据类型如FLOAT32。
[object Object]