aclnnAddmm&aclnnInplaceAddmm

产品支持情况

产品	是否支持
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]	√
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]	√
[object Object]Atlas 200I/500 A2 推理产品[object Object]	×
[object Object]Atlas 推理系列产品 [object Object]	√
[object Object]Atlas 训练系列产品[object Object]	√

功能说明

算子功能：计算α 乘以mat1与mat2的乘积，再与β和self的乘积求和。
计算公式：
$out = β self + α (mat1 @ mat2)$
示例：
- 对于aclnnAddmm接口，self的shape是[1, n], mat1的shape是[m, k], mat2的shape是[k, n], mat1和mat2的矩阵乘的结果shape是[m, n], self的shape能broadcast到[m, n]。
- 对于aclnnAddmm接口，self的shape是[m, 1], mat1的shape是[m, k], mat2的shape是[k, n], mat1和mat2的矩阵乘的结果shape是[m, n], self的shape能broadcast到[m, n]。
- 对于aclnnAddmm接口，self的shape是[m, n], mat1的shape是[m, k], mat2的shape是[k, n], mat1和mat2的矩阵乘的结果shape是[m, n]。
- 对于aclnnInplaceAddmm接口，直接在输入张量selfRef的内存中存储计算结果，self的shape是[m, n], mat1的shape是[m, k], mat2的shape是[k, n]。

函数原型

aclnnAddmm和aclnnInplaceAddmm实现相同的功能，使用区别如下，请根据自身实际场景选择合适的算子。
- aclnnAddmm：需新建一个输出张量对象存储计算结果。
- aclnnInplaceAddmm：无需新建输出张量对象，直接在输入张量的内存中存储计算结果。
每个算子分为undefined，必须先调用 “aclnnAddmmGetWorkspaceSize” 或者 “aclnnInplaceAddmmGetWorkspaceSize” 接口获取入参并根据计算流程计算所需workspace大小，再调用 “aclnnAddmm” 或者 “aclnnInplaceAddmm” 接口执行计算。
- aclnnStatus aclnnAddmmGetWorkspaceSize(const aclTensor* self, const aclTensor* mat1, const aclTensor* mat2, const aclScalar* beta, const aclScalar* alpha, aclTensor* out, int8_t cubeMathType, uint64_t* workspaceSize, aclOpExecutor** executor)
- aclnnStatus aclnnAddmm(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, const aclrtStream stream)
- aclnnStatus aclnnInplaceAddmmGetWorkspaceSize(const aclTensor* selfRef, const aclTensor* mat1, const aclTensor* mat2, const aclScalar* beta, const aclScalar* alpha, int8_t cubeMathType, uint64_t* workspaceSize, aclOpExecutor** executor)
- aclnnStatus aclnnInplaceAddmm(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, const aclrtStream stream)

aclnnAddmmGetWorkspaceSize

参数说明：
- self（aclTensor*, 计算输入）：表示公式中的self, Device侧的aclTensor，数据类型需要与 $mat1@mat2$ $ma t 1@ ma t 2$ 构成互相推导关系（参见undefined和undefined），shape需要满足能够broadcast成 $mat1@mat2$ $ma t 1@ ma t 2$ 的结果shape。支持undefined，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- mat1（aclTensor*, 计算输入）：Device侧的aclTensor，且数据类型需要与self，mat2构成互相推导关系（参见undefined和undefined），shape仅支持二维且需要满足与mat2相乘条件。支持undefined，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- mat2（aclTensor*, 计算输入）：Device侧的aclTensor，且数据类型需要与self，mat1构成互相推导关系（参见undefined和undefined），shape仅支持二维且需要满足与mat1相乘条件。支持undefined，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- beta(β)(aclScalar, 计算输入)：Host侧的aclScalar，数据类型支持FLOAT、FLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8。
- alpha(α)(aclScalar, 计算输入)：Host侧的aclScalar，数据类型支持FLOAT、FLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8。
- out（aclTensor*, 计算输出）：Device侧的aclTensor，且数据类型需要与self构成互相推导关系，shape需要与 $mat1@mat2$ $ma t 1@ ma t 2$ 一致，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- cubeMathType(int8_t，计算输入)：Host侧的整型，判断Cube单元应该使用哪种计算逻辑进行运算，数据类型支持INT8，注意：如果输入的数据类型存在互相推导关系，该参数默认对推导后的数据类型进行处理。具体的枚举值如下：
  - 0：KEEP_DTYPE，保持输入的数据类型进行计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：输入的数据类型支持FLOAT16, 当输入是FLOAT32时不支持该选项。
  - 1：ALLOW_FP32_DOWN_PRECISION，支持将输入数据降精度计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：当输入数据类型是FLOAT32，转换为FLOAT16计算；当数据为其他数据类型时，保持输入类型计算。
    - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：当输入数据类型是FLOAT32，会使能HFLOAT32计算；当数据为其他数据类型时，保持输入类型计算。
  - 2：USE_FP16，支持将输入降为FLOAT16精度计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：当输入数据类型是FLOAT32，转换为FLOAT16计算；当数据为其他数据类型时，保持输入类型计算。
    - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：当输入数据类型是FLOAT32，转换为FLOAT16计算；当数据为其他数据类型时，保持输入类型计算。
  - 3：USE_HF32，支持转换数据类型HFLOAT32计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：不支持该选项。
    - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：当输入数据类型是FLOAT32，会使能HFLOAT32计算；当数据为其他数据类型时，不支持该选项。
- workspaceSize(uint64_t *, 出参)：返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor **, 出参)：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

[object Object]

aclnnAddmm

参数说明：
- workspace(void *, 入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnAddmmGetWorkspaceSize获取。
- stream(aclrtStream, 入参)：指定执行任务的Stream。
- executor(aclOpExecutor *, 入参)：op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

aclnnInplaceAddmmGetWorkspaceSize

参数说明：
- selfRef（aclTensor*, 计算输入|计算输出）：即公式中的输入self与out，Device侧的aclTensor，数据类型需要与 $mat1@mat2$ $ma t 1@ ma t 2$ 构成互相推导关系（参见undefined和undefined），shape需要与 $mat1@mat2$ $ma t 1@ ma t 2$ 的结果shape保持一致。支持undefined，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- mat1（aclTensor*, 计算输入）：Device侧的aclTensor，数据类型需要与selfRef，mat2构成互相推导关系（参见undefined和undefined），shape仅支持二维且需要满足与mat2相乘条件。支持undefined，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- mat2（aclTensor*, 计算输入）：Device侧的aclTensor，数据类型需要与selfRef，mat1构成互相推导关系（参见undefined和undefined），shape仅支持二维且需要满足与mat1相乘条件。支持undefined，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]：数据类型支持FLOAT16、FLOAT。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT16、FLOAT、BFLOAT16。
- beta(β)(aclScalar, 计算输入)：Host侧的aclScalar，数据类型支持FLOAT、FLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8。
- alpha(α)(aclScalar, 计算输入)：Host侧的aclScalar，数据类型支持FLOAT、FLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8。
- cubeMathType(int8_t，计算输入)：Host侧的整型，判断Cube单元应该使用那种计算逻辑进行运算，数据类型支持INT8，注意：如果输入的数据类型存在互相推导关系，该参数默认对推导后的数据类型进行处理。具体的枚举值如下：
  - 0：KEEP_DTYPE，保持输入的数据类型进行计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：输入的数据类型支持FLOAT16, 当输入是FLOAT32时不支持该选项。
  - 1：ALLOW_FP32_DOWN_PRECISION，支持将输入数据降精度计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：当输入数据类型是FLOAT32，转换为FLOAT16计算；当数据为其他数据类型时，保持输入类型计算。
    - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：当输入数据类型是FLOAT32，会使能HFLOAT32计算；当数据为其他数据类型时，保持输入类型计算。
  - 2：USE_FP16，支持将输入降为FLOAT16精度计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：当输入数据类型是FLOAT32，转换为FLOAT16计算；当数据为其他数据类型时，保持输入类型计算。
    - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：当输入数据类型是FLOAT32，转换为FLOAT16计算；当数据为其他数据类型时，保持输入类型计算。
  - 3：USE_HF32，支持转换数据类型HFLOAT32计算。
    - [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：不支持该选项。
    - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：当输入数据类型是FLOAT32，会使能HFLOAT32计算；当数据为其他数据类型时，不支持该选项。
- workspaceSize(uint64_t *, 出参)：返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor **, 出参)：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

[object Object]

aclnnInplaceAddmm

参数说明：
- workspace(void *, 入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnInplaceAddmmGetWorkspaceSize获取。
- stream(aclrtStream, 入参)：指定执行任务的Stream。
- executor(aclOpExecutor *, 入参)：op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

约束说明

[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：不支持mat1和mat2两输入其中一个输入为BFLOAT16, 另一个输入为FLOAT或FLOAT16的数据类型推导。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考undefined。

[object Object]