aclnnTriangularSolve

Atlas 训练系列产品。
Atlas A2训练系列产品/Atlas 800I A2推理产品。

接口原型

每个算子分为，必须先调用“aclnnTriangularSolveGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnTriangularSolve”接口执行计算。

aclnnStatus aclnnTriangularSolveGetWorkspaceSize(const aclTensor *self, const aclTensor *A, bool upper, bool transpose, bool unitriangular, aclTensor *xOut, aclTensor *mOut, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnTriangularSolve(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, const aclrtStream stream)

功能描述

算子功能：求解一个具有方形上或下三角形可逆矩阵A和多个右侧b的方程组。
计算公式： $AX = b$ 其中 $A$ 是一个上三角方阵(当upper为false时为下三角方阵)，其主对角线不含0的元素。 $b,A$ 为二维矩阵或者二维矩阵的batch，当输入为batch时，返回输出的X也为对应的batch。当 $A$ 的主对角线含有0，或元素非常接近0，且unitriangular为False时，输出结果可能包含 $NaN s$

aclnnTriangularSolveGetWorkspaceSize

参数说明：
- self(const aclTensor *, 计算输入): 公式中的 $b$ ，数据类型支持FLOAT、DOUBLE、COMPLEX64、COMPLEX128, 且数据类型与A一致，且数据维度至少为2且不大于8。支持，支持ND。
- A(const aclTensor *, 计算输入): 公式中的 $A$ ，数据类型支持FLOAT、DOUBLE、COMPLEX64、COMPLEX128, 且数据类型与self一致，且数据维度至少为2且不大于8。支持，支持ND。
- upper(bool, 计算输入)：计算属性，默认为true， A为上三角方阵，当upper为false时，A为下三角方阵。
- transpose(bool, 计算输入)：计算属性，默认为false，当transpsose为true时，计算 $A^T X=b$ 。
- unitriangular(bool, 计算输入)：计算属性，默认为false，当unitriangular为true时，A的主对角线元素视为1，而不是从A引用，并且unitriangular为true时输入self和A，输出xOut和mOut的数据类型只支持FLOAT。
- xOut(aclTensor *, 计算输出): 公式中的 $X$ ，数据类型支持FLOAT、DOUBLE、COMPLEX64、COMPLEX128,且数据类型与self一致，支持，支持ND，且shape需要与broadcast后的A,b满足 $AX=b$ 约束。
- mOut(aclTensor *, 计算输出): broadcast后A的上三角(下三角)拷贝，数据类型支持FLOAT、DOUBLE、COMPLEX64、COMPLEX128，且数据类型与self一致，支持，支持ND。
- workspaceSize(uint64_t *, 出参)：返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor **, 出参)：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

aclnnTriangularSolve

参数说明：
- workspace(void *, 入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnTriangularSolveGetWorkspaceSize获取。
- executor(aclOpExecutor *, 入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参)：指定执行任务的AscendCL Stream流。
返回值：

aclnnStatus：返回状态码，具体参见。

约束与限制

无。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]