变更声明
本章节的接口变更说明包括新增、修改、删除和退出声明。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。
- 新增:表示此次版本新增的接口。
 - 修改:表示本接口相比于上个版本有修改。
 - 删除:表示该接口在此次版本已经删除。
 - 退出声明:表示该接口自作出退出声明的版本起停止演进,且在后续版本退出并删除。
 
新增特性
类名/API原型  | 
变更说明  | 
|---|---|
atb/context.h 公共定义 SetExecuteType GetExecuteType SetLaunchMode GetLaunchMode  | 
支持算子Execute拆分成两个阶段,在两个线程上执行。  | 
atb/context.h/CreateContext  | 
新增在当前进程或线程中显式创建一个由用户管理Tiling内存的Context。  | 
atb/infer_op_params.h/operator==  | 
SortOperation和TopkToppSamplingOperation的param更新。  | 
GmmDeqSwigluQuantGmmDeqOperation  | 
新增OP。  | 
LinearOperation  | 
新增QuantMode枚举类型。  | 
LinearParallelOperation  | 
新增MoeInfo枚举类型,ALLTOALLVC_ALL_GATHER_GMM、GMM_REDUCE_SCATTER_ALLTOALLVC、QUANT_TYPE_PER_TOKEN枚举值。  | 
MmDeqSwigluQuantMmDeqOperation  | 
新增OP。  | 
MultiLatentAttentionOperation  | 
新增MASK_TYPE_CAUSAL_MASK、CALC_TYPE_SPEC_AND_RING、CALC_TYPE_PREFILL枚举值。  | 
PagedAttentionOperation  | 
新增MASK_TYPE_MASK_FREE枚举值。  | 
PagedCacheLoadOperation  | 
新增OP。  | 
RazorFusionAttentionOperation  | 
新增OP。  | 
RingMLAOperation  | 
新增OP。  | 
ScatterElementsV2Operation  | 
新增OP。  | 
SelfAttentionOperation  | 
新增MASK_TYPE_CAUSAL_MASK枚举值。  | 
ATB整图下沉  | 
支持OP作为整图下沉的一部分进行更新。  | 
atb/acl.h  | 
新增部分算子C接口。  | 
ATB Python API使用说明/组图接口  | 
支持使用Python调用部分OP组建计算图。  | 
修改特性
类名/API原型  | 
变更说明  | 
|---|---|
AllGatherOperation  | 
commDomain的取值范围修改为0-65535。  | 
AllReduceOperation  | 
|
AllToAllOperation  | 
|
AllToAllVOperation  | 
|
BroadcastOperation  | 
|
ReduceScatterOperation  | 
|
LinearParallelOperation  | 
commDomain的取值范围修改为0-65535。 枚举值MAX的值修改为7,QUANT_TYPE_MAX的值修改为4。  |