昇腾社区首页
中文
注册

super_kernel

功能说明

图执行过程中,标记图内能融合为SuperKernel的上下文算子范围,详细功能介绍参见图内标定SuperKernel范围

函数原型

def super_kernel(scope: str, options: str = '')

参数说明

参数

输入/输出

说明

是否必选

scope

输入

字符串类型,表示上下文算子被融合的SuperKernel名,相同的scope代表相同的范围,由用户控制。

必选

options

输入

字符串类型,表示融合的SuperKernel编译选项。缺省情况下,系统编译模式采用所有编译选项(参见表1)的默认值。

同时支持用户自定义组合编译选项,配置格式形如"<option1>=<value1>:<option2>=<value2>:<option3>=......",多个选项时用英文冒号分割。

可选

返回值说明

约束说明

  • 该功能仅适用于静态图场景。
  • 该功能仅适用于Atlas A3 训练系列产品/Atlas A3 推理系列产品
  • 注意,SuperKernel融合会按网络中算子顺序依次识别能否被融合,若识别到不可融合的算子,则生成第一段SuperKernel,同时自动跳过该算子进行第二段SuperKernel融合。