昇腾社区首页
中文
注册

变更声明

本章节的接口变更说明包括新增、修改、删除和退出声明。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。

  • 新增:表示此次版本新增的接口。
  • 修改:表示本接口相比于上个版本有修改。
  • 删除:表示该接口在此次版本已经删除。
  • 退出声明:表示该接口自作出退出声明的版本起停止演进,且在后续版本退出并删除。

新增特性

类名/API原型

变更说明

atb/context.h

公共定义

SetExecuteType

GetExecuteType

SetLaunchMode

GetLaunchMode

支持算子Execute拆分成两个阶段,在两个线程上执行。

atb/context.h/CreateContext

新增在当前进程或线程中显式创建一个由用户管理Tiling内存的Context。

atb/infer_op_params.h/operator==

SortOperation和TopkToppSamplingOperation的param更新。

GmmDeqSwigluQuantGmmDeqOperation

新增OP。

LinearOperation

新增QuantMode枚举类型。

LinearParallelOperation

新增MoeInfo枚举类型,ALLTOALLVC_ALL_GATHER_GMM、GMM_REDUCE_SCATTER_ALLTOALLVC、QUANT_TYPE_PER_TOKEN枚举值。

MmDeqSwigluQuantMmDeqOperation

新增OP。

MultiLatentAttentionOperation

新增MASK_TYPE_CAUSAL_MASK、CALC_TYPE_SPEC_AND_RING、CALC_TYPE_PREFILL枚举值。

PagedAttentionOperation

新增MASK_TYPE_MASK_FREE枚举值。

PagedCacheLoadOperation

新增OP。

RazorFusionAttentionOperation

新增OP。

RingMLAOperation

新增OP。

ScatterElementsV2Operation

新增OP。

SelfAttentionOperation

新增MASK_TYPE_CAUSAL_MASK枚举值。

ATB整图下沉

支持OP作为整图下沉的一部分进行更新。

atb/acl.h

新增部分算子C接口。

ATB Python API使用说明/组图接口

支持使用Python调用部分OP组建计算图。

修改特性

类名/API原型

变更说明

AllGatherOperation

commDomain的取值范围修改为0-65535。

AllReduceOperation

AllToAllOperation

AllToAllVOperation

BroadcastOperation

ReduceScatterOperation

LinearParallelOperation

commDomain的取值范围修改为0-65535。

枚举值MAX的值修改为7,QUANT_TYPE_MAX的值修改为4。