函数：init

产品支持情况

产品	是否支持
Atlas A3 训练系列产品 / Atlas A3 推理系列产品	√
Atlas A2 训练系列产品 / Atlas A2 推理系列产品	√
Atlas 训练系列产品	√
Atlas 推理系列产品	√
Atlas 200I/500 A2 推理产品	√

功能说明

初始化函数。

函数原型

C函数原型

        
             aclError aclInit(const char *configPath)

python函数
1

ret = acl.init(config_path)

参数说明

参数名	说明
config_path	配置文件所在的路径，包含文件名。配置文件内容为JSON格式（JSON文件内的“{”的层级最多为10，“[”的层级最多为10）。如果以下的默认配置已满足需求，无需修改，可直接调用acl.init接口不传入参数或者可将配置文件配置为空JSON串（即配置文件中只有{}）。配置文件格式为JSON格式，当前支持以下配置： Dump信息配置，包括以下配置（如果算子输入或输出中包含用户的敏感信息，则存在信息泄露风险）。模型Dump配置（用于导出模型中每一层算子输入和输出数据）、单算子Dump配置（用于导出单个算子的输入和输出数据），导出的数据用于与指定模型或算子进行比对，定位精度问题，配置示例、说明及约束请参见模型Dump配置、单算子Dump配置示例。默认不启用该dump配置。异常算子Dump配置（用于导出异常算子的输入输出数据、workspace信息、Tiling信息），导出的数据用于分析AI Core Error问题，配置示例请参见异常算子Dump配置示例。默认不启用该dump配置。溢出算子Dump配置（用于导出模型中溢出算子的输入和输出数据），导出的数据用于分析溢出原因，定位模型精度的问题，配置示例、说明及约束请参见溢出算子Dump配置示例。默认不启用该dump配置。算子Dump Watch模式配置（用于开启指定算子输出数据的观察模式），在定位部分算子精度问题且已排除算子本身的计算问题后，若怀疑被其它算子踩踏内存导致精度问题，可开启Dump Watch模式，配置示例及约束请参见算子Dump Watch模式配置示例。默认不开启Dump Watch模式。 Profiling采集信息配置，示例、配置说明及约束请参见《性能调优工具用户指南》。默认不启用Profiling采集信息配置。算子缓存信息老化配置，为节约内存和平衡调用性能，可通过“max_opqueue_num”参数配置“算子类型 - 单算子模型”映射队列的最大长度，如果长度达到最大，则会先删除长期未使用的映射信息以及缓存中的单算子模型，再加载最新的映射信息以及对应的单算子模型。如果不配置映射队列的最大长度，则默认最大长度为“20000”。示例及约束说明请参见算子缓存信息老化配置示例。错误信息上报模式配置，用于控制acl.get_recent_err_msg接口按进程或线程级别获取错误信息，默认按线程级别。示例请参见错误信息上报模式配置示例。默认Device配置（用于配置默认的计算设备），配置示例、说明请参见#ZH-CN_TOPIC_0000002518811773/section38127418371。若同时通过set_device接口指定Device，则aclrtSetDevice接口优先级高。如果用户开启默认Device功能后，若需要显式创建Context，则需要调用set_device，否则可能会导致业务异常。 AI Core栈空间大小配置，用于控制进程中Kernel执行时为每个AI Core分配的栈空间大小，默认为32K字节。配置示例、使用说明请参见AI Core栈空间大小配置示例。在编译AI Core算子时，只有打开O0开关，此处配置的AI Core栈空间大小才有效。仅如下型号支持该配置： Atlas A3 训练系列产品 / Atlas A3 推理系列产品 Atlas A2 训练系列产品 / Atlas A2 推理系列产品 Atlas 200I/500 A2 推理产品 Event资源调度模式配置，用于在捕获方式构建模型运行实例场景下控制Event资源的调度方式，配置示例、使用说明请参见Event资源调度模式配置示例。仅如下型号支持该配置： Atlas A3 训练系列产品 / Atlas A3 推理系列产品 Atlas A2 训练系列产品 / Atlas A2 推理系列产品说明：建议不要同时配置dump信息和Profiling采集信息，否则dump操作会影响系统性能，导致Profiling采集的性能数据指标不准确。

参数名

说明

config_path

配置文件所在的路径，包含文件名。

配置文件内容为JSON格式（JSON文件内的“{”的层级最多为10，“[”的层级最多为10）。如果以下的默认配置已满足需求，无需修改，可直接调用acl.init接口不传入参数或者可将配置文件配置为空JSON串（即配置文件中只有{}）。

配置文件格式为JSON格式，当前支持以下配置：

Dump信息配置，包括以下配置（如果算子输入或输出中包含用户的敏感信息，则存在信息泄露风险）。
- 模型Dump配置（用于导出模型中每一层算子输入和输出数据）、单算子Dump配置（用于导出单个算子的输入和输出数据），导出的数据用于与指定模型或算子进行比对，定位精度问题，配置示例、说明及约束请参见模型Dump配置、单算子Dump配置示例。默认不启用该dump配置。
- 异常算子Dump配置（用于导出异常算子的输入输出数据、workspace信息、Tiling信息），导出的数据用于分析AI Core Error问题，配置示例请参见异常算子Dump配置示例。默认不启用该dump配置。
- 溢出算子Dump配置（用于导出模型中溢出算子的输入和输出数据），导出的数据用于分析溢出原因，定位模型精度的问题，配置示例、说明及约束请参见溢出算子Dump配置示例。默认不启用该dump配置。
- 算子Dump Watch模式配置（用于开启指定算子输出数据的观察模式），在定位部分算子精度问题且已排除算子本身的计算问题后，若怀疑被其它算子踩踏内存导致精度问题，可开启Dump Watch模式，配置示例及约束请参见算子Dump Watch模式配置示例。默认不开启Dump Watch模式。

Profiling采集信息配置，示例、配置说明及约束请参见《性能调优工具用户指南》。默认不启用Profiling采集信息配置。
算子缓存信息老化配置，为节约内存和平衡调用性能，可通过“max_opqueue_num”参数配置“算子类型 - 单算子模型”映射队列的最大长度，如果长度达到最大，则会先删除长期未使用的映射信息以及缓存中的单算子模型，再加载最新的映射信息以及对应的单算子模型。如果不配置映射队列的最大长度，则默认最大长度为“20000”。示例及约束说明请参见算子缓存信息老化配置示例。
错误信息上报模式配置，用于控制acl.get_recent_err_msg接口按进程或线程级别获取错误信息，默认按线程级别。示例请参见错误信息上报模式配置示例。
默认Device配置（用于配置默认的计算设备），配置示例、说明请参见#ZH-CN_TOPIC_0000002518811773/section38127418371。
若同时通过set_device接口指定Device，则aclrtSetDevice接口优先级高。

如果用户开启默认Device功能后，若需要显式创建Context，则需要调用set_device，否则可能会导致业务异常。
AI Core栈空间大小配置，用于控制进程中Kernel执行时为每个AI Core分配的栈空间大小，默认为32K字节。配置示例、使用说明请参见AI Core栈空间大小配置示例。在编译AI Core算子时，只有打开O0开关，此处配置的AI Core栈空间大小才有效。
仅如下型号支持该配置：

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas 200I/500 A2 推理产品
Event资源调度模式配置，用于在捕获方式构建模型运行实例场景下控制Event资源的调度方式，配置示例、使用说明请参见Event资源调度模式配置示例。
仅如下型号支持该配置：

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

说明：

建议不要同时配置dump信息和Profiling采集信息，否则dump操作会影响系统性能，导致Profiling采集的性能数据指标不准确。

返回值说明

返回值	说明
ret	int，错误码，返回0表示成功，返回其它值表示失败。

约束说明

使用pyacl接口开发应用时，必须先调用acl.init接口，否则可能会导致后续系统内部资源初始化出错，进而导致其它业务异常。
一个进程内支持多次调用aclInit接口初始化，但需调用aclFinalize或aclFinalizeReference接口去初始化，支持以下场景：
- 每次调用aclInit接口时，配置必须保持一致，否则仅首次调用的配置有效，后续调用aclInit接口可能会导致报错或配置无效。
- 为兼容旧版本，重复调用aclInit接口会返回ACL_ERROR_REPEAT_INITIALIZE错误码，您可以忽略该错误继续处理业务。
- 若调用aclInit、aclFinalize接口分别实现初始化、去初始化，支持重复初始化、去初始化，时序上仅支持顺序调用，接口调用时序如下：
```
aclInit-->业务处理-->aclFinalize-->aclInit-->业务处理-->aclFinalize
```
  该场景下，如果调用多次aclInit接口后，再去初始化，仅需调用一次aclFinalize接口，将aclInit接口的引用计数直接清零。
- 若调用aclInit、aclFinalizeReference接口分别实现初始化、去初始化，则需成对调用aclInit、aclFinalizeReference接口。
  因为aclFinalizeReference接口内部涉及引用计数的实现，aclInit接口每被调用一次，则引用计数加一，aclFinalizeReference接口每被调用一次，则该引用计数减一，当引用计数减到0时，才会真正去初始化。
  
  支持重复初始化、去初始化，时序上支持顺序调用，也支持并发调用，接口调用时序如下：
  - 顺序调用时序图如下：
  - 并发调用时序图如下：

模型Dump配置、单算子Dump配置示例

配置模型Dump、单算子Dump后，导出的Dump数据用于与指定模型或算子进行比对，便于定位精度问题，具体比对方法请参见《精度调试工具用户指南》。

模型Dump配置示例如下：

{                                                                                            
	"dump":{
		"dump_list":[                                                                        
			{	"model_name":"ResNet-101"
			},
			{                                                                                
				"model_name":"ResNet-50",
				"layer":[
				      "conv1conv1_relu",
				      "res2a_branch2ares2a_branch2a_relu",
				      "res2a_branch1",
				      "pool1"
				] 
			}  
		],  
		"dump_path":"$HOME/output",
                "dump_mode":"output",
		"dump_op_switch":"off",
                "dump_data":"tensor"
	}                                                                                        
}

单算子调用场景下，Dump配置示例如下：

{
    "dump":{
        "dump_path":"output",
        "dump_list":[], 
	"dump_op_switch":"on",
        "dump_data":"tensor"
    }
}

表1 acl.json文件格式说明

配置项

参数说明

dump_list

（必选）待dump数据的整网模型列表。

创建模型dump配置信息，当存在多个模型需要dump时，需要每个模型之间用英文逗号隔开。

在单算子调用场景（包括单算子模型执行和单算子API执行）下，dump_list建议为空。

model_name

模型名称，各个模型的model_name值须唯一。

模型加载方式为文件加载时，填入模型文件的名称，不需要带后缀名；也可以配置为ATC模型文件转换后的json文件里的最外层"name"字段对应值。
模型加载方式为内存加载时，配置为ATC模型文件转换后的json文件里的最外层"name"字段对应值。

layer

IO性能较差时，可能会因为数据量过大而导致执行超时，因此不建议进行全量dump，请指定算子进行dump。通过该字段可以指定需要dump的算子名，支持指定为ATC模型转换后的算子名，也支持指定为转换前的原始算子名，配置时需注意：

需按格式配置，每行配置模型中的一个算子名，且每个算子之间用英文逗号隔开。
用户可以无需设置model_name，此时会默认dump所有model下的相应算子。如果配置了model_name，则dump对应model下的相应算子。
若指定的算子其输入涉及data算子，会同时将data算子信息dump出来；若需dump data算子，需要一并填写data节点算子的后继节点，才能dump出data节点算子数据。
当需要dump模型中所有算子时，不需要包含layer字段。

optype_blacklist

配置dump数据黑名单，黑名单中的指定类型的算子的输入或输出数据不会进行数据dump，用户可通过该配置控制dump的数据量。

该功能仅在执行模型数据dump操作，且dump_level为op时生效，同时支持和opname_blacklist配合使用。

配置示例：

{
	"dump":{
		"dump_list":[     
			{                                                                                
				"model_name":"ResNet-50",
				"optype_blacklist":[
				    {
					  "name":"conv"
					  "pos":["input0", "input1"]
					} 
				] 
			}
		],  
		"dump_path":"/home/output",
                "dump_mode":"input",
	}  
}

以上示例表示：不对conv算子的input0数据和input1数据执行dump操作，conv为算子类型。

optype_blacklist中包括name和pos字段，配置时需注意：

name表示算子类型，支持指定为ATC模型转换后的算子类型，配置为空时该过滤项不生效。
pos表示算子的输入或输出，仅支持配置为inputn或outputn格式，其中n表示输入输出索引号。配置为空时该过滤项不生效。
optype_blacklist内最多支持配置100个过滤项。
如果配置了model_name，则仅对该model下的算子生效。如果不配置model_name，则对所有model下的算子生效。

opname_blacklist

配置dump数据黑名单，黑名单中的指定名称的算子的输入或输出数据不会进行数据dump，用户可通过该配置控制dump的数据量。

该功能仅在执行模型数据dump操作，且dump_level为op时生效，同时支持和optype_blacklist配合使用。

配置示例：

{
	"dump":{
		"dump_list":[     
			{                                                                                
				"model_name":"ResNet-50",
				"opname_blacklist":[
				    {
					  "name":"conv"
					  "pos":["input0", "input1"]
					} 
				] 
			}
		],  
		"dump_path":"/home/output",
                "dump_mode":"input",
	}  
}

以上示例表示：不对conv算子的input0数据和input1数据执行dump操作，conv为算子名称。

opname_blacklist中包括name和pos字段，配置时需注意：

name表示算子名称，支持指定为ATC模型转换后的算子名称，配置为空时该过滤项不生效。
pos表示算子的输入或输出，仅支持配置为inputn或outputn格式，其中n表示输入输出索引号。配置为空时该过滤项不生效。
opname_blacklist内最多支持配置100个过滤项。
如果配置了model_name，则仅对该model下的算子生效。如果不配置model_name，则对所有model下的算子生效。

opname_range

配置dump数据范围，对begin到end闭区间内的数据执行dump操作。

该功能仅在执行模型数据dump操作，且dump_level为op时生效。

配置示例：

{
	"dump":{
		"dump_list":[
			{
				"model_name":"ResNet-50",
				"opname_range":[{"begin":"conv1", "end":"relu1" }, {"begin":"conv2", "end":"pool1"}]
			}
		],
		"dump_mode":"output",
        "dump_level": "op",
        "dump_path":"/home/output"
	}
}

以上示例表示对conv1到relu1、conv2到pool1闭区间内的数据执行dump操作，conv1、relu1、conv2、pool1表示算子名称。

配置时需注意：

model_name不允许为空。
begin和end中的参数表示算子名称，支持指定为ATC模型转换后的算子名称。
begin和end不允许为空，且只能配置为非data算子；若begin和end范围内算子的输入涉及data算子，会同时对data算子信息执行dump操作。

dump_path

（必选）dump数据文件存储到运行环境的目录，该目录需要提前创建且确保安装时配置的运行用户具有读写权限。

支持配置绝对路径或相对路径：

绝对路径配置以“/”开头，例如：/home/output。
相对路径配置直接以目录名开始，例如：output。

dump_mode

dump数据模式。

input：dump算子的输入数据。
output：dump算子的输出数据，默认取值output。
all：dump算子的输入、输出数据。
注意，配置为all时，由于部分算子在执行过程中会修改输入数据，例如集合通信类算子HcomAllGather、HcomAllReduce等，因此系统在进行dump时，会在算子执行前dump算子输入，在算子执行后dump算子输出，这样，针对同一个算子，算子输入、输出的dump数据是分开落盘，会出现多个dump文件，在解析dump文件后，用户可通过文件内容判断是输入还是输出。

dump_level

dump数据级别，取值：

op：按算子级别dump数据。
kernel：按kernel级别dump数据。
all：默认值，op和kernel级别的数据都dump。

默认配置下，dump数据文件会比较多，例如有一些aclnn开头的dump文件，若用户对dump性能有要求或内存资源有限时，则可以将该参数设置为op级别，以便提升dump性能、精简dump数据文件数量。

说明：

算子是一个运算逻辑的表示（如加减乘除运算），kernel是运算逻辑真正进行计算处理的实现，需要分配具体的计算设备完成计算。

dump_op_switch

单算子调用场景（包括单算子模型执行和单算子API执行）下，是否开启dump数据采集。

on：开启。
off：关闭，默认取值off。

dump_step

指定采集哪些迭代的dump数据。推理场景无需配置。

不配置该参数，默认所有迭代都会产生dump数据，数据量比较大，建议按需指定迭代。

多个迭代用“|”分割，例如：0|5|10；也可以用“-”指定迭代范围，例如：0|3-5|10。

配置示例：

              
                   {
	"dump":{
		"dump_list":[     
			...... 
		],  
		"dump_path":"/home/output",
                "dump_mode":"output",
		"dump_op_switch":"off",
                "dump_step": "0|3-5|10"
	}  
}

说明：

训练场景下，若通过acl.json中的dump_step参数指定采集哪些迭代的dump数据，又同时在GEInitialize接口中配置了ge.exec.dumpStep参数（该参数也用于指定采集哪些迭代的dump数据），则以最后配置的参数为准。GEInitialize接口的详细介绍请参见《图模式开发指南》的“GEInitialize”。

dump_data

算子dump内容类型，取值：

tensor: dump算子数据，默认为tensor。
stats: dump算子统计数据，结果文件为csv格式，文件中包含算子名称、输入/输出的数据类型、最大值、最小值等。

通常dump数据量太大并且耗时长，可以先对算子统计数据进行dump，根据统计数据识别可能异常的算子，然后再dump算子数据。

dump_stats

当dump_data=stats时，可通过本参数设置收集统计数据中的哪一类数据，本参数取值如下：

Max：dump算子统计数据中的最大值。
Min：dump算子统计数据中的最小值。
Avg：dump算子统计数据中的平均值。
Nan：dump算子统计数据中未定义或不可表示的数值，仅针对浮点类型half、bfloat、float。
Negative Inf：dump算子统计数据中的负无穷值，仅针对浮点类型half、bfloat、float。
Positive Inf：dump算子统计数据中的正无穷值，仅针对浮点类型half、bfloat、float。
L2norm：dump算子统计数据的L2Norm值。

说明：

仅 Atlas A2 训练系列产品 / Atlas A2 推理系列产品支持该参数。
若不指定，默认采集Max、Min、Avg、Nan、Negative Inf、Positive Inf数据。

配置示例：

              
                   {
    "dump":{
	"dump_list":[     
		...... 
	],  
        "dump_path":"/home/output",
        "dump_mode":"output",
        "dump_data":"stats",
        "dump_stats":["Max", "Min"]
    }
}

异常算子Dump配置示例

通过配置dump_scene参数值开启异常算子Dump功能，配置文件中的示例内容如下，表示开启轻量化的exception dump：

{
    "dump":{
        "dump_path":"output",
        "dump_scene":"aic_err_brief_dump"
    }
}

详细配置说明及约束如下：

dump_scene参数支持如下取值：
- aic_err_brief_dump：表示轻量化exception dump，用于导出AI Core错误算子的输入&输出、workspace数据。
- aic_err_norm_dump：表示普通exception dump，在轻量化exception dump基础上，还会导出Shape、Data Type、Format以及属性信息。
- aic_err_detail_dump：在轻量化exception dump基础上，还会导出AI Core的内部存储、寄存器以及调用栈信息。
  配置该选项时，有以下注意事项：
  - 该选项仅支持以下型号，且需配套25.0.RC1或更高版本的驱动才可以使用：
    Atlas A2 训练系列产品 / Atlas A2 推理系列产品
    
    Atlas A3 训练系列产品 / Atlas A3 推理系列产品
    
    您可以单击Link，在“固件与驱动”页面下载Ascend HDK 25.0.RC1或更高版本的驱动安装包，并参考相应版本的文档进行安装、升级。
  - 导出dump文件过程中，会暂停问题算子所在的AI Core，因此可能会影响Device上其它业务进程的正常执行，导出dump文件后，会自行恢复AI Core。因此，多个Host侧用户业务进程指定同一个Device的场景下，不建议使用aic_err_detail_dump选项。
  - 导出dump文件后，会强制退出Host侧用户业务进程，强制退出过程中的报错可不作为AI Core问题分析的输入。
  - 配置aic_err_detail_dump选项后，如果生成了dump文件，但不是*.core文件，则表示aic_err_detail_dump对应的功能没有使能成功，系统自动切换为按aic_err_brief_dump选项dump。
- lite_exception：表示轻量化exception dump，为了兼容旧版本，效果等同于aic_err_brief_dump。
dump_path是可选参数，表示导出dump文件的存储路径。
dump文件存储路径的优先级如下：NPU_COLLECT_PATH环境变量 > ASCEND_WORK_PATH环境变量 > 配置文件中的dump_path > 应用程序的当前执行目录

环境变量的详细描述请参见《环境变量参考》。
若需查看导出的dump文件内容，先将dump文件转换为numpy格式文件后，再通过Python查看numpy格式文件，详细转换步骤请参见《精度调试工具用户指南》中的“查看dump数据文件”章节。
若将dump_scene参数设置为aic_err_detail_dump时，需使用msDebug工具查看导出的dump文件内容，详细方法请参见《算子开发工具用户指南》。
异常算子Dump配置，不能与模型Dump配置或单算子Dump配置同时开启。

溢出算子Dump配置示例

将dump_debug参数设置为on表示开启溢出算子配置，配置文件中的示例内容如下：

{
    "dump":{
        "dump_path":"output",
        "dump_debug":"on"
    }
}

详细配置说明及约束如下：

不配置dump_debug或将dump_debug配置为off表示不开启溢出算子配置。
若开启溢出算子配置，则dump_path必须配置，表示导出dump文件的存储路径。
获取导出的数据文件后，文件的解析请参见《精度调试工具用户指南》中的“溢出算子数据采集与解析”章节。
dump_path支持配置绝对路径或相对路径：
- 绝对路径配置以“/”开头，例如：/home。
- 相对路径配置直接以目录名开始，例如：output。
溢出算子Dump配置，不能与模型Dump配置或单算子Dump配置同时开启，否则会返回报错。
仅支持采集AI Core算子的溢出数据。

算子Dump Watch模式配置示例

将dump_scene参数设置为watcher，开启算子Dump Watch模式，配置文件中的示例内容如下，配置效果为：（1）当执行完A算子、B算子时，会把C算子和D算子的输出Dump出来；（2）当执行完C算子、D算子时，也会把C算子和D算子的输出Dump出来。将（1）、（2）中的C算子、D算子的Dump文件进行比较，用于排查A算子、B算子是否会踩踏C算子、D算子的输出内存。

{
    "dump":{
        "dump_list":[
            {
                "layer":["A", "B"],
                "watcher_nodes":["C", "D"]
            }
        ],
        "dump_path":"/home/",
        "dump_mode":"output",
        "dump_scene":"watcher"
    }
}

详细配置说明及约束如下：

若开启算子Dump Watch模式，则不支持同时开启溢出算子Dump（配置dump_debug参数）或开启单算子模型Dump（配置dump_op_switch参数），否则报错。该模式在单算子API Dump场景下不生效。
在dump_list中，通过layer参数配置可能踩踏其它算子内存的算子名称，通过watcher_nodes参数配置可能被其它算子踩踏输出内存导致精度有问题的算子名称。
- 若不指定layer，则模型内所有支持Dump的算子在执行后，都会将watcher_nodes中配置的算子的输出Dump出来。
- layer和watcher_node处配置的算子都必须是静态图、静态子图中的算子，否则不生效。
- 若layer和watcher_node处配置的算子名称相同，或者layer处配置的是集合通信类算子（算子类型以Hcom开头，例如HcomAllReduce），则只导出watcher_node中所配置算子的dump文件。
- 对于融合算子，watcher_node处配置的算子名称必须是融合后的算子名称，若配置融合前的算子名称，则不导出dump文件。
- dump_list内暂不支持配置model_name。
开启算子Dump Watch模式，则dump_path必须配置，表示导出dump文件的存储路径。
此处收集的dump文件无法通过文本工具直接查看其内容，若需查看dump文件内容，先将dump文件转换为numpy格式文件后，再通过Python查看numpy格式文件，详细转换步骤请参见《精度调试工具用户指南》中的“查看dump数据文件”章节。
dump_path支持配置绝对路径或相对路径：
- 绝对路径配置以“/”开头，例如：/home。
- 相对路径配置直接以目录名开始，例如：output。
通过dump_mode参数控制导出watcher_nodes中所配置算子的哪部分数据，当前仅支持配置为output。

算子缓存信息老化配置示例

通过max_opqueue_num参数配置“算子类型-单算子模型”映射队列的最大长度，实现算子缓存信息老化，配置文件中的示例内容如下：

{
        "max_opqueue_num": "10000"
}

错误信息上报模式配置示例

“err_msg_mode”参数取值范围：“0”为默认值，表示按线程级别获取错误信息；“1”表示按进程级别获取错误信息。

配置文件中的示例内容如下：

{
        "err_msg_mode": "1"
}

默认Device配置示例

default_device参数处设置Device ID，Device ID可设置为0或十进制正整数，用户可调用aclrtGetDeviceCount接口获取可用的Device数量后，这个Device ID的取值范围：[0, (可用的Device数量-1)]。

配置文件中的示例内容如下：

{
    "defaultDevice":{
        "default_device":"0"
    }
}

AI Core栈空间大小配置示例

aicore_stack_size参数处设置栈空间大小，单位为字节，取值有以下要求：

aicore_stack_size是16K的整数倍，若传入aicore_stack_size不是16K的整数倍，则会向上取整，确保其为16K的整数倍。
aicore_stack_size最小值为32K，若传入的aicore_stack_size小于32K，则按默认配置32K处理。
各产品的aicore_stack_size最大值如下：
在昇腾910_95 AI处理器上，aicore_stack_size最大值为128K。

在 Atlas A3 训练系列产品 / Atlas A3 推理系列产品上，aicore_stack_size最大值为192K。

在 Atlas A2 训练系列产品 / Atlas A2 推理系列产品上，aicore_stack_size最大值为192K。

在 Atlas 200I/500 A2 推理产品上，aicore_stack_size最大值为7680K。

配置文件中的示例内容如下：

{
    "StackSize":{
        "aicore_stack_size":32768
    }
}

Event资源调度模式配置示例

event_mode参数取值范围：0为默认值，表示内存模式，即Event资源数量受内存限制；1表示硬件加速模式，即Event资源数量受硬件规格限制，但性能更优。

配置文件中的示例内容如下：

{
    "acl_graph":{
        "event_mode":"0"
    }
}

参考资源

接口调用示例，参见初始化与去初始化。

当前还提供了其它使能Dump或Profiling的接口，如下，与aclInit不同的是，以下这些接口相对灵活，可以在一个进程内调用多次接口，每次调用接口时可以基于不同的Dump配置或Profiling配置。

获取Dump数据，参见函数：init_dump、函数：set_dump、函数：finalize_dump。如果无需将Dump数据写入文件，则可以通过回调函数获取Dump数据，请参见11.2.15-函数：dump_reg_callback。
获取Profiling数据，参见Profiling数据采集。

父主题： 系统配置