super_kernel
功能说明
图执行过程中,标记图内能融合为SuperKernel的上下文算子范围,详细功能介绍参见图内标定SuperKernel范围。
函数原型
def super_kernel(scope: str, options: str = '')
参数说明
参数 |
输入/输出 |
说明 |
是否必选 |
---|---|---|---|
scope |
输入 |
字符串类型,表示上下文算子被融合的SuperKernel名,相同的scope代表相同的范围,由用户控制。 |
必选 |
options |
输入 |
字符串类型,表示融合的SuperKernel编译选项。缺省情况下,系统编译模式采用所有编译选项(参见表1)的默认值。 同时支持用户自定义组合编译选项,配置格式形如"<option1>=<value1>:<option2>=<value2>:<option3>=......",多个选项时用英文冒号分割。 |
可选 |
返回值说明
无
约束说明
- 该功能仅适用于静态图场景。
- 该功能仅适用于
Atlas A3 训练系列产品/Atlas A3 推理系列产品 。 - 注意,SuperKernel融合会按网络中算子顺序依次识别能否被融合,若识别到不可融合的算子,则生成第一段SuperKernel,同时自动跳过该算子进行第二段SuperKernel融合。
调用示例
父主题: torchair.scope