变更声明
本章节的接口变更说明包括新增、修改、删除和退出声明。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。
- 新增:表示此次版本新增的接口。
- 修改:表示本接口相比于上个版本有修改。
- 删除:表示该接口在此次版本已经删除。
- 退出声明:表示该接口自作出退出声明的版本起停止演进,且在后续版本退出并删除。
新增特性
类名/API原型 |
变更说明 |
---|---|
atb/context.h 公共定义 SetExecuteType GetExecuteType SetLaunchMode GetLaunchMode |
支持算子Execute拆分成两个阶段,在两个线程上执行。 |
atb/context.h/CreateContext |
新增在当前进程或线程中显式创建一个由用户管理Tiling内存的Context。 |
atb/infer_op_params.h/operator== |
SortOperation和TopkToppSamplingOperation的param更新。 |
GmmDeqSwigluQuantGmmDeqOperation |
新增OP。 |
LinearOperation |
新增QuantMode枚举类型。 |
LinearParallelOperation |
新增MoeInfo枚举类型,ALLTOALLVC_ALL_GATHER_GMM、GMM_REDUCE_SCATTER_ALLTOALLVC、QUANT_TYPE_PER_TOKEN枚举值。 |
MmDeqSwigluQuantMmDeqOperation |
新增OP。 |
MultiLatentAttentionOperation |
新增MASK_TYPE_CAUSAL_MASK、CALC_TYPE_SPEC_AND_RING、CALC_TYPE_PREFILL枚举值。 |
PagedAttentionOperation |
新增MASK_TYPE_MASK_FREE枚举值。 |
PagedCacheLoadOperation |
新增OP。 |
RazorFusionAttentionOperation |
新增OP。 |
RingMLAOperation |
新增OP。 |
ScatterElementsV2Operation |
新增OP。 |
SelfAttentionOperation |
新增MASK_TYPE_CAUSAL_MASK枚举值。 |
ATB整图下沉 |
支持OP作为整图下沉的一部分进行更新。 |
atb/acl.h |
新增部分算子C接口。 |
ATB Python API使用说明/组图接口 |
支持使用Python调用部分OP组建计算图。 |
修改特性
类名/API原型 |
变更说明 |
---|---|
AllGatherOperation |
commDomain的取值范围修改为0-65535。 |
AllReduceOperation |
|
AllToAllOperation |
|
AllToAllVOperation |
|
BroadcastOperation |
|
ReduceScatterOperation |
|
LinearParallelOperation |
commDomain的取值范围修改为0-65535。 枚举值MAX的值修改为7,QUANT_TYPE_MAX的值修改为4。 |