aclnnCrossEntropyLossGrad

产品支持情况

[object Object]undefined

ignoreMask_{target(t)}=\begin{cases} 1, &target(t) ≠ ignoreIndex \\ 0, &target(t) = ignoreIndex \end{cases}

smoothLossGrad=\begin{cases} grad / sum(weight_{target}* ignoreMask) * labelSmoothing / C, &reduction = mean \\ grad * labelSmoothing / C, &reduction = sum \\ grad * labelSmoothing / C, &reduction = none \end{cases}

lossOutGrad=\begin{cases} grad * (1-labelSmoothing) / sum(weight_{target}* ignoreMask) * ignoreMask, &reduction = mean \\ grad * (1-labelSmoothing) * ignoreMask, &reduction = sum \\ grad * (1-labelSmoothing) * ignoreMask, &reduction = none \end{cases}

nllLossGrad = lossOutGrad * weight_{target}

logSoftmaxGradLossOutSubPart = exp(logProb) * nllLossGrad

predictionsGradLossOut_{ij}=\begin{cases} nllLossGrad_i, & j=target(i) \\ 0, & j ≠ target(i) \end{cases}

predictionsGradLossOut = logSoftmaxGradLossOutSubPart - predictionsGradLossOut

smoothLossGrad = smoothLossGrad * ignoreMask

logSoftmaxGradSmoothLoss = smoothLossGrad * weight

predictionsGradSmoothLoss = exp(logProb) * sum(logSoftmaxGradSmoothLoss) - logSoftmaxGradSmoothLoss

不涉及zloss场景输出：

xGrad_{out} = predictionsGradLossOut + predictionsGradSmoothLoss

zloss场景：

gradZ=\begin{cases} grad + gradZloss, & 传入gradZloss \\ grad, & 不传gradZloss \end{cases}

zlossGrad=\begin{cases} gradZ / sum(ignoreMask), & &reduction = mean \\ gradZ, & &reduction = sum \\ gradZ, & &reduction = none \end{cases}

lseGrad = 2 * lseSquareScaleForZloss * lseForZloss * ignoreMask * zlossGrad

zlossOutputGrad = exp(logProb) * lseGrad

zloss场景输出：

xGrad_{out} = xGrad_{out} + zlossOutputGrad

每个算子分为，必须先调用“aclnnCrossEntropyLossGradGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnCrossEntropyLossGrad”接口执行计算。

[object Object]

target仅支持类标签索引，不支持概率输入。
gradLoss、logProb、gradZlossOptional、lseForZlossOptional、xGradOut数据类型需保持一致。
当前暂不支持zloss功能，传入相关输入，即gradZlossOptional、lseForZlossOptional、lseSquareScaleForZloss，不会生效。
确定性计算：
- aclnnCrossEntropyLossGrad默认确定性实现。

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]