昇腾社区首页
中文
注册

变更声明

本章节的接口变更说明包括新增、修改、删除和退出声明。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。

  • 新增:表示此次版本新增的接口。
  • 修改:表示本接口相比于上个版本有修改。
  • 删除:表示该接口在此次版本已经删除。
  • 退出声明:表示该接口自作出退出声明的版本起停止演进,且在后续版本退出并删除。

新增特性

类名/API原型

变更说明

AllGatherVOperation

新增OP。

AllToAllVV2Operation

新增OP。

CohereLayerNormOperation

新增OP。

FaUpdateOperation

新增OP。

FusedAddTopkDivOperation

新增OP。

GatherPreRmsNormOperation

新增OP。

LayerNormWithStrideOperation

新增OP。

MlaPreprocessOperation

新增OP。

MultiLatentAttentionOperation

新增OP。

NormRopeReshapeOperation

新增OP。

RelayAttentionOperation

新增OP。

ReduceScatterVOperation

新增OP。

ReshapeAndCacheOmniOperation

新增OP。

ReshapeAndCacheWithStrideOperation

新增OP。

RmsNormWithStrideOperation

新增OP。

RopeQConcatOperation

新增OP。

SwigluQuantOperation

新增OP。

atb/operation.h

  • SetExecuteStreamId
  • GetExecuteStreamId

atb/operation_infra.h

新增图内多流并行特性。

atb/comm.h

支持创建和删除通信域。

atb/common_op_params.h

新增图间同步特性。

ATB Python API使用说明

新增python使用说明。

修改特性

类名/API原型

变更说明

atb/infer_op_params.h/QuantType

枚举项QUANT_UNDEFINED变更为QUANT_UNQUANT,QUANT_UNDEFINED将在后续版本删除。

AllReduceOperation

其内部枚举类QuantType中枚举项QUANT_TYPE_UNDEFINED变更为QUANT_TYPE_UNQUANT,QUANT_TYPE_UNDEFINED将在后续版本删除。

LinearParallelOperation

其内部枚举类QuantType中枚举项QUANT_TYPE_UNDEFINED变更为QUANT_TYPE_UNQUANT,QUANT_TYPE_UNDEFINED将在后续版本删除。

PagedAttentionOperation

其内部枚举类QuantType中枚举项TYPE_QUANT_UNDEFINED变更为TYPE_QUANT_UNQUANT,TYPE_QUANT_UNDEFINED将在后续版本删除。

SelfAttentionOperation

其内部枚举类QuantType中枚举项TYPE_QUANT_UNDEFINED变更为TYPE_QUANT_UNQUANT,TYPE_QUANT_UNDEFINED将在后续版本删除。