aclnnExpSegsum
产品支持情况
功能说明
接口功能:进行分段和计算。生成对角线为0的半可分矩阵,且上三角为-inf。
计算公式(以4D输入为例):
- 输入self由(N1,N2,N3,N4)升维成(N1,N2,N3,N4,1)。
- 进行广播得到(N1,N2,N3,N4,N4)。
- 生成(N4,N4)类型为bool的三角矩阵A,上三角为True,下三角为False,对角线为True。
- 用0填充输入self里面与矩阵A中值为True的位置相对应的元素。
以self的倒数第二维进行cumsum累加。从维度视角来看的某个元素(其它维度下标不变,当前维度下标依次递增),是输出张量中对应位置的元素。
生成(N4,N4)类型为bool的三角矩阵B,上三角为True,下三角为False,对角线为False。
用-inf填充selfTemp里面与矩阵B中值为True的位置相对应的元素。
计算selfTemp里面每个元素的指数。
函数原型
每个算子分为,必须先调用“aclnnExpSegsumGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnExpSegsum”接口执行计算。
[object Object]
[object Object]
aclnnExpSegsumGetWorkspaceSize
aclnnExpSegsum
约束说明
- 确定性计算:
- aclnnExpSegsum默认确定性实现。
调用示例
[object Object]