属性名列表
本节所列属性名为通过SetAttr接口可设置的属性名称,级别都为算子级,头文件位于CANN软件安装后文件存储路径下的include/ge/ge_api_types.h。
_enable_inner_parallel
是否允许_user_stream_label内的算子按照GE原有的并发策略分流。
参数取值:
- true:_user_stream_label范围内的算子按照GE原有的并发策略分流。
- false:_user_stream_label范围内的所有算子将不再区分原有并发策略,统一合并到同一计算流中执行。
使用约束:
该属性需要配合_user_stream_label使用,当_enable_inner_parallel属性为true时,_user_stream_label范围内的算子还按照GE原有的并发策略分流(如CMO算子单独分流)
产品支持情况:
全量芯片支持。
_op_aicore_num
用于配置算子编译时使用的AI Core中的Cube Core核数。
参数取值:整数类型,整数需要大于0,小于等于AI处理器包含的最大Cube Core。
[SoCInfo] # 参数配置为默认值,默认值即为最大值 ai_core_cnt=24 cube_core_cnt=24 vector_core_cnt=48
其中,${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。以root用户安装为例,安装后文件默认存储路径为:/usr/local/Ascend/cann。<arch>表示具体操作系统架构,xxx请根据实际产品进行选择。
产品支持情况:
- Atlas 350 加速卡:支持
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 :支持Atlas A2 训练系列产品 /Atlas A2 推理系列产品 :支持Atlas 推理系列产品 :不支持Atlas 训练系列产品 :不支持Atlas 200I/500 A2 推理产品 :不支持
_op_vectorcore_num
用于配置算子编译时使用的AI Core中的Vector Core核数。
参数取值:整数类型,整数需要大于0,小于等于AI处理器包含的最大Vector Core。
不同AI处理器包含的最大VectorCore的数量可从"${INSTALL_DIR}/<arch>-linux/data/platform_config/xxx.ini"文件查看,如下所示,说明AI处理器上存在48个Vector Core。
[SoCInfo] # 参数配置为默认值,默认值即为最大值 ai_core_cnt=24 cube_core_cnt=24 vector_core_cnt=48
其中,${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。以root用户安装为例,安装后文件默认存储路径为:/usr/local/Ascend/cann。<arch>表示具体操作系统架构,xxx请根据实际产品进行选择。
产品支持情况:
- Atlas 350 加速卡:支持
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 :支持Atlas A2 训练系列产品 /Atlas A2 推理系列产品 :支持Atlas 推理系列产品 :不支持Atlas 训练系列产品 :不支持Atlas 200I/500 A2 推理产品 :不支持
_op_exec_never_timeout
设置静态图上的AI Core算子执行时是否受超时时间限制。
参数取值:
- true:算子执行不受超时时间限制,永不超时。
- false:算子执行受超时时间限制。
用户可以通过“aclrtSetOpExecuteTimeOutV2”接口设置算子执行的超时时间。
使用约束:
如果AI Core算子开启了Tiling下沉特性,即开启性能调优中的ge.tiling_schedule_optimize参数,则此类算子不支持设置永不超时属性。
产品支持情况:
全量芯片支持。
_user_stream_label
字符串类型,指定算子执行的目标stream标签(需要切换到的流的标签),相同的标签代表相同的流,由用户控制。
图执行过程中如需开启“图内多流表达功能”,可通过_user_stream_label和_user_stream_priority指定图内多个算子分发到不同stream做并行计算,提高资源利用率。
产品支持情况:
全量芯片支持。
_user_stream_priority
int类型,表示切换到_user_stream_label流的优先级,即Runtime运行时在并发时优先给高优先级的流分配核资源。当前版本为预留参数,建议取默认值0。
图执行过程中如需开启“图内多流表达功能”,可通过_user_stream_label和_user_stream_priority指定图内多个算子分发到不同stream做并行计算,提高资源利用率。
产品支持情况:
全量芯片支持。