AOL算子加速库
aclnn接口
- 新增aclnn接口:
- aclnnMlaProlog
- aclnnFusedInferAttentionScoreV3
- aclnnDequantSwigluQuant
- aclnnSwiGluQuant
- aclnnAddRmsNormQuant
- aclnnAddRmsNormDynamicQuant
- aclnnAdaptiveMaxPool3d
- aclnnAdaptiveMaxPool3dBackward
- aclnnAddRelu&aclnnInplaceAddRelu
- aclnnBinaryCrossEntropyWithLogitsTargetBackward
- aclnnMoeDistributeCombine
- aclnnMoeDistributeDispatch
- aclnnGroupedMatmulSwigluQuant
- aclnnGroupedMatmulAdd
- aclnnIou
- aclnnRopeWithSinCosCache
- aclnnDequantRopeQuantKVcache
- aclnnCrossEntropyLoss
- aclnnCrossEntropyLossGrad
- aclnnScaledMaskedSoftmax
- aclnnScaledMaskedSoftmaxBackward
- aclnnCumprod&aclnnInplaceCumprod
- aclnnSignBitsPack
- aclnnSignBitsUnpack
- aclnnGroupNormSwishGrad
- aclnnRoiAlignV2Backward
- aclnnRoiAlignV2
- aclnnAddLora
- aclnnGemmaRmsNorm
- aclnnUpsampleBilinear2dBackwardV2
- aclnnDequantBias
- aclnnAdvanceStep
- aclnnLogitGrad
- aclnnFlatQuant
- aclnnLogit
- aclnnFatreluMul
- aclnnGeluMul
- aclnnUpsampleNearest1dV2
- aclnnUpsampleNearest2dV2
- 如下aclnn接口特性增强:
算子特性
- 新增算子特性:新增池化类AdaptiveMaxPool3dGrad算子。
- 算子特性优化:
- Cast算子在
Atlas 800I A2 推理产品 /Atlas A2 训练系列产品 /Atlas A3 训练系列产品 /Atlas A3 推理系列产品 上支持数据类型FP16 转换为INT64。 - 支持高性能alltoallv MC2融合算子。
Atlas A3 训练系列产品 和Atlas A3 推理系列产品 上支持MC2算子api(allgather和reducescatter)。
- Cast算子在
父主题: 新增特性