limit_core_num
功能说明
图执行过程中,指定图内范围内的算子执行时的aicore核数和vectorcore核数,详细功能介绍参见图内设置AI Core和Vector Core核数。
函数原型
def limit_core_num(op_aicore_num: int, op_vectorcore_num: int)
参数说明
参数 |
输入/输出 |
说明 |
是否必选 |
---|---|---|---|
op_aicore_num |
输入 |
整数类型,表示算子运行时的aicore核数,取值范围为[1, max_aicore] |
必选 |
op_vectorcore_num |
输入 |
整数类型,表示算子运行时的vectorcore核数,取值范围为[1, max_vectorcore]。 当AI处理器上仅存在AI Core不存在Vector Core时,此时仅支持取值为0。 |
必选 |
返回值说明
无
约束说明
- 目前仅适用于如下产品:
Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件 Atlas A3 训练系列产品/Atlas A3 推理系列产品
- 配置算子级核数时,不能超过AI处理器本身允许的最大AI Core数量(max_aicore)与最大Vector Core数量(max_vectorcore)。您可以通过“CANN软件安装目录/<arch>-linux/data/platform_config/<soc_version>.ini”文件查看,如下所示,说明AI处理器上存在32个AI Core,不存在Vector Core。
[SoCInfo] ai_core_cnt=32 vector_core_cnt=0
如果配置的算子级核数超过AI处理器本身允许的最大核数,系统默认采用最大核数作为实际运行核数。
调用示例
父主题: torchair.scope