昇腾社区首页
中文
注册

aclnnCtcLoss

支持的产品型号

  • Atlas 推理系列产品。
  • Atlas 训练系列产品。
  • Atlas A2训练系列产品。

接口原型

每个算子分为,必须先调用“aclnnCtcLossGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnCtcLoss”接口执行计算。

  • aclnnStatus aclnnCtcLossGetWorkspaceSize(const aclTensor *logProbs, const aclTensor *targets, const aclIntArray *inputLengths, const aclIntArray *targetLengths, int64_t blank, bool zeroInfinity, aclTensor *negLoglikelihoodOut, aclTensor *logAlphaOut, uint64_t *workspaceSize, aclOpExecutor **executor)
  • aclnnStatus aclnnCtcLoss(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, const aclrtStream stream)

功能描述

  • 算子功能:计算连接时序分类损失值。

  • 计算表达式:

    定义ykty_{k}^{t}表示在时刻tt时真实字符为kk的概率。(一般地,ykty_{k}^{t}是经过softmax之后的输出矩阵中的一个元素)。将字符集LL^{'}可以构成的所有序列的集合称为LTL^{'T},将LTL^{'T}中的任意一个序列称为路径,并标记为ππππ的分布为公式(1):

    p(πx)=t=1Tyπtt,πLT.(1)p(π|x)=\prod_{t=1}^{T}y^{t}_{π_{t}} , \forall π \in L'^{T}. \tag{1}

    定义多对一(many to one)映射B: LTLTL^{'T} \to L^{\leq T},通过映射B计算得到lLTl \in L^{\leq T}的条件概率,等于对应于ll的所有可能路径的概率之和,公式(2):

    p(lx)=πB1(l)p(πx).(2)p(l|x)=\sum_{π \in B^{-1}(l)}p(π|x).\tag{2}

    将找到使p(lx)p(l|x)值最大的ll的路径的任务称为解码,公式(3):

    h(x)=lLTarg max p(lx).(3)h(x)=^{arg \ max}_{l \in L^{ \leq T}} \ p(l|x).\tag{3}

aclnnCtcLossGetWorkspaceSize

  • 参数说明:

    • logProbs(aclTensor*): 数据类型支持FLOAT,DOUBLE数据类型,shape为(T,N,CT,N,C),TT为输入长度,NN为批处理大小,CC为类别数,必须大于0,包括空白标识,该Tensor表示输出的对数概率,支持支持ND。
    • targets(aclTensor*): 数据类型支持INT64,INT32,BOOL,FLOAT,FLOAT16数据类型,当shape为(N,SN,S),SS为不小于targetLengthstargetLengths中的最大值的值;或者shape为(SUM(targetLengthstargetLengths)),假设targetstargets是未填充的而且在1维内级联的;支持支持ND。
    • inputLengths(aclIntArray*):数据类型支持UINT8,INT8,INT16,INT32,INT64,数组长度为NN,数组中的每个值必须小于等于TT
    • targetLengths(aclIntArray*):数据类型支持UINT8,INT8,INT16,INT32,INT64,数组长度为NN,当targets的shape为(N,SN,S)时,数组中的每个值必须小于等于SS
    • blank(int):int整型,空白标识,数值必须小于CC大于等于0。
    • zeroInfinity(bool):bool类型,表示是否将无限损耗和相关梯度归零。
    • negLoglikelihoodOut(aclTensor*): 输出的损失值,数据类型FLOAT,DOUBLE(数据类型必须和logProbs一致),输出一个大小为(NN)的Tensor,支持支持ND。
    • logAlphaOut(aclTensor*): 数据类型支持FLOAT,DOUBLE(数据类型必须和logProbs一致),表示输入到目标的可能跟踪的概率,该Tensor为3维,支持支持ND。
    • workspaceSize: 返回用户需要在Device侧申请的workspace大小。
    • executor: 返回op执行器,包含了算子计算流程。
  • 返回值:

    aclnnStatus: 返回状态码,具体参见

    [object Object]

aclnnCtcLoss

  • 参数说明:

    • workspace: 在Device侧申请的workspace内存地址。
    • workspaceSize: 在Device侧申请的workspace大小,由第一段接口aclnnCtcLossGetWorkspaceSize获取。
    • executor: op执行器,包含了算子计算流程。
    • stream: 指定执行任务的 AscendCL Stream流。
  • 返回值:

    aclnnStatus: 返回状态码,具体参见

约束与限制

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]