变更声明
本章节的接口变更说明包括新增、修改、删除和退出声明。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。
- 新增:表示此次版本新增的接口。
- 修改:表示本接口相比于上个版本有修改。
- 删除:表示该接口在此次版本已经删除。
- 退出声明:表示该接口自作出退出声明的版本起停止演进,且在后续版本退出并删除。
新增特性
类名/API原型 |
变更说明 |
---|---|
AllGatherVOperation |
新增OP。 |
AllToAllVV2Operation |
新增OP。 |
CohereLayerNormOperation |
新增OP。 |
FaUpdateOperation |
新增OP。 |
FusedAddTopkDivOperation |
新增OP。 |
GatherPreRmsNormOperation |
新增OP。 |
LayerNormWithStrideOperation |
新增OP。 |
MlaPreprocessOperation |
新增OP。 |
MultiLatentAttentionOperation |
新增OP。 |
NormRopeReshapeOperation |
新增OP。 |
RelayAttentionOperation |
新增OP。 |
ReduceScatterVOperation |
新增OP。 |
ReshapeAndCacheOmniOperation |
新增OP。 |
ReshapeAndCacheWithStrideOperation |
新增OP。 |
RmsNormWithStrideOperation |
新增OP。 |
RopeQConcatOperation |
新增OP。 |
SwigluQuantOperation |
新增OP。 |
atb/operation.h
atb/operation_infra.h |
新增图内多流并行特性。 |
atb/comm.h |
支持创建和删除通信域。 |
atb/common_op_params.h |
新增图间同步特性。 |
ATB Python API使用说明 |
新增python使用说明。 |
修改特性
类名/API原型 |
变更说明 |
---|---|
atb/infer_op_params.h/QuantType |
枚举项QUANT_UNDEFINED变更为QUANT_UNQUANT,QUANT_UNDEFINED将在后续版本删除。 |
AllReduceOperation |
其内部枚举类QuantType中枚举项QUANT_TYPE_UNDEFINED变更为QUANT_TYPE_UNQUANT,QUANT_TYPE_UNDEFINED将在后续版本删除。 |
LinearParallelOperation |
其内部枚举类QuantType中枚举项QUANT_TYPE_UNDEFINED变更为QUANT_TYPE_UNQUANT,QUANT_TYPE_UNDEFINED将在后续版本删除。 |
PagedAttentionOperation |
其内部枚举类QuantType中枚举项TYPE_QUANT_UNDEFINED变更为TYPE_QUANT_UNQUANT,TYPE_QUANT_UNDEFINED将在后续版本删除。 |
SelfAttentionOperation |
其内部枚举类QuantType中枚举项TYPE_QUANT_UNDEFINED变更为TYPE_QUANT_UNQUANT,TYPE_QUANT_UNDEFINED将在后续版本删除。 |