昇腾社区首页
中文
注册

aclnnCtcLoss

支持的产品型号

  • Atlas 推理系列产品。
  • Atlas 训练系列产品。
  • Atlas A2训练系列产品/Atlas 800I A2推理产品。

接口原型

每个算子分为undefined,必须先调用“aclnnCtcLossGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnCtcLoss”接口执行计算。

  • aclnnStatus aclnnCtcLossGetWorkspaceSize(const aclTensor* logProbs, const aclTensor* targets, const aclIntArray* inputLengths, const aclIntArray* targetlengths, int64_t blank, bool zeroInfinity, aclTensor* negLogLikelihoodOut, aclTensor* logAlphaOut, uint64_t* workspaceSize, aclOpExecutor** executor)
  • aclnnStatus aclnnCtcLoss(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)

功能描述

  • 算子功能:计算连接时序分类损失值。

  • 计算表达式:

    定义ykty_{k}^{t}表示在时刻tt时真实字符为kk的概率。(一般地,ykty_{k}^{t}是经过softmax之后的输出矩阵中的一个元素)。将字符集LL^{'}可以构成的所有序列的集合称为LTL^{'T},将LTL^{'T}中的任意一个序列称为路径,并标记为ππππ的分布为公式(1):

    p(πx)=t=1Tyπtt,πLT.(1)p(π|x)=\prod_{t=1}^{T}y^{t}_{π_{t}} , \forall π \in L'^{T}. \tag{1}

    定义多对一(many to one)映射B: LTLTL^{'T} \to L^{\leq T},通过映射B计算得到lLTl \in L^{\leq T}的条件概率,等于对应于ll的所有可能路径的概率之和,公式(2):

    p(lx)=πB1(l)p(πx).(2)p(l|x)=\sum_{π \in B^{-1}(l)}p(π|x).\tag{2}

    将找到使p(lx)p(l|x)值最大的ll的路径的任务称为解码,公式(3):

    h(x)=lLTarg max p(lx).(3)h(x)=^{arg \ max}_{l \in L^{ \leq T}} \ p(l|x).\tag{3}

aclnnCtcLossGetWorkspaceSize

  • 参数说明:

    • logProbs(aclTensor*, 计算输入): 表示输出的对数概率,Device侧的aclTensor。数据类型支持FLOAT、DOUBLE。shape为(T,N,CT, N, C),TT为输入长度,NN为批处理大小,CC为类别数,必须大于0,包括空白标识。支持undefinedundefined支持ND。
    • targets(aclTensor*, 计算输入): 表示包含目标序列的标签,Device侧的aclTensor。数据类型支持INT64、INT32、BOOL、FLOAT、FLOAT16。当shape为(N,SN, S),SS为不小于targetLengthstargetLengths中的最大值的值;或者shape为(SUM(targetLengthstargetLengths)),假设targetstargets是未填充的而且在1维内级联的。支持undefinedundefined支持ND。
    • inputLengths(aclIntArray*, 计算输入):表示输入序列的实际长度,Host侧的aclIntArray。数组长度为NN,数组中的每个值必须小于等于TT
    • targetlengths(aclIntArray*, 计算输入):表示目标序列的实际长度,Host侧的aclIntArray。数组长度为NN,当targets的shape为(N,SN, S)时,数组中的每个值必须小于等于SS
    • blank(int, 计算输入):表示空白标识,Host侧的整型。数值必须小于CC大于等于0。
    • zeroInfinity(bool, 计算输入):表示是否将无限损耗和相关梯度归零,Host侧的bool类型。
    • negLogLikelihoodOut(aclTensor*, 计算输出): 表示输出的损失值,Device侧的aclTensor。数据类型FLOAT、DOUBLE,且数据类型必须和logProbs一致。shape大小为(NN)的Tensor。支持undefinedundefined支持ND。
    • logAlphaOut(aclTensor*, 计算输出): 表示输入到目标的可能跟踪的概率,Device侧的aclTensor。数据类型支持FLOAT、DOUBLE,且数据类型必须和logProbs一致。shape为3维。支持undefinedundefined支持ND。
    • workspaceSize(uint64_t*, 出参): 返回需要在Device侧申请的workspace大小。
    • executor(aclOpExecutor**, 出参): 返回op执行器,包含了算子计算流程。
  • 返回值:

    aclnnStatus: 返回状态码,具体参见undefined

    [object Object]

aclnnCtcLoss

  • 参数说明:

    • workspace(void*, 入参): 在Device侧申请的workspace内存地址。
    • workspaceSize(uint64_t, 入参): 在Device侧申请的workspace大小,由第一段接口aclnnCtcLossGetWorkspaceSize获取。
    • executor(aclOpExecutor*, 入参): op执行器,包含了算子计算流程。
    • stream(aclrtStream, 入参): 指定执行任务的AscendCL Stream流。
  • 返回值:

    aclnnStatus: 返回状态码,具体参见undefined

约束与限制

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考undefined

[object Object]