参数 |
说明 |
---|---|
INPUT_FORMAT |
输入数据格式。 支持NCHW、NHWC、ND三种格式。 如果同时开启AIPP,在进行推理业务时,输入图片数据要求为NHWC排布。该场景下INPUT_FORMAT参数指定的数据格式不生效。
说明:
该参数仅针对动态BatchSize、动态分辨率和动态维度场景。 上述场景下,INPUT_FORMAT必须设置并且和所有Data算子的format保持一致,否则会导致模型编译失败。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
INPUT_SHAPE |
模型输入的shape信息。 例如:"input_name:n,c,h,w"。指定的节点必须放在双引号中;若模型有多个输入,则不同输入之间使用英文分号分隔,例如,"input_name1:n1,c1,h1,w1;input_name2:n2,c2,h2,w2"。input_name必须是转换前的网络模型中的节点名称。
说明:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
INPUT_SHAPE_RANGE |
该参数后续版本废弃,请勿使用。若涉及指定模型输入数据的shape范围,请使用INPUT_SHAPE参数。 指定模型输入数据的shape range。该功能不能与DYNAMIC_BATCH_SIZE、DYNAMIC_IMAGE_SIZE、DYNAMIC_DIMS同时使用。
产品支持情况: Atlas 200/300/500 推理产品,不支持。 Atlas 训练系列产品,支持。 Atlas 推理系列产品(Ascend 310P处理器),支持。 Atlas 200/500 A2推理产品,支持。 Atlas A2训练系列产品,支持。 |
OP_NAME_MAP |
扩展算子(非标准算子)映射配置文件路径和文件名,不同的网络中某扩展算子的功能不同,可以指定该扩展算子到具体网络中实际运行的扩展算子的映射。 路径和文件名:支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、中划线(-)、句点(.)、中文字符。 文件内容示例如下: OpA:Network1OpA 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
DYNAMIC_BATCH_SIZE |
设置动态batch档位参数,适用于执行推理时,每次处理图片数量不固定的场景。 该参数需要与INPUT_SHAPE配合使用,不能与DYNAMIC_IMAGE_SIZE、DYNAMIC_DIMS同时使用。 最多支持100档配置,每一档通过英文逗号分隔,每个档位数值限制为:[1~2048]。 例如: {ge::ir_option::INPUT_SHAPE, "data:-1,3,416,416"}, {ge::ir_option::DYNAMIC_BATCH_SIZE, "1,2,4,8"} INPUT_SHAPE中的“-1”表示设置动态batch。 其他使用注意事项:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
DYNAMIC_IMAGE_SIZE |
设置输入图片的动态分辨率参数。适用于执行推理时,每次处理图片宽和高不固定的场景。 该参数需要与INPUT_SHAPE配合使用,不能与DYNAMIC_BATCH_SIZE、DYNAMIC_DIMS 同时使用。 最多支持100档配置,每一档通过英文分号分隔。 例如: "imagesize1_height,imagesize1_width;imagesize2_height,imagesize2_width",指定的参数必须放在双引号中,每一组参数中间使用英文分号分隔。 具体使用样例如下, INPUT_SHAPE中的“-1”表示设置动态分辨率。 INPUT_SHAPE="data:8,3,-1,-1" ,DYNAMIC_IMAGE_SIZE="416,416;832,832" 其他使用注意事项:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
DYNAMIC_DIMS |
设置ND格式下动态维度的档位。适用于执行推理时,每次处理任意维度的场景。 该参数需要与INPUT_SHAPE配合使用,不能与DYNAMIC_BATCH_SIZE、DYNAMIC_IMAGE_SIZE同时使用。 参数通过"dim1,dim2,dim3;dim4,dim5,dim6;dim7,dim8,dim9"的形式设置,所有档位必须放在双引号中,每档中间使用英文分号分隔,每档中的dim值与INPUT_SHAPE参数中的-1标识的参数依次对应,INPUT_SHAPE参数中有几个-1,则每档必须设置几个维度。 支持的档位数取值范围为:(1,100],每档最多支持任意指定4个维度,建议配置为3~4档。 例如: {ge::ir_option::INPUT_SHAPE, "data:1,-1"}, {ge::ir_option::DYNAMIC_DIMS, "4;8;16;64"} // 模型编译时,支持的data算子的shape为1,4; 1,8; 1,16;1,64 {ge::ir_option::INPUT_SHAPE, "data:1,-1,-1"}, {ge::ir_option::DYNAMIC_DIMS, "1,2;3,4;5,6;7,8"} // 模型编译时,支持的data算子的shape为1,1,2; 1,3,4; 1,5,6; 1,7,8 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
INSERT_OP_FILE |
输入预处理算子的配置文件路径,例如aipp算子。 若配置了该参数,则不能对同一个输入节点同时使用INPUT_FP16_NODES参数。 配置文件路径:支持大小写字母、数字,下划线;文件名部分:支持大小写字母、数字,下划线和点(.) 配置文件的内容示例如下: aipp_op { aipp_mode:static input_format:YUV420SP_U8 csc_switch:true var_reci_chn_0:0.00392157 var_reci_chn_1:0.00392157 var_reci_chn_2:0.00392157 }
说明:
配置文件详细说明,请参考《ATC工具使用指南》。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
PRECISION_MODE |
选择算子精度模式。
参数默认值:force_fp16 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
PRECISION_MODE_V2 |
设置网络模型的精度模式。不能与PRECISION_MODE同时使用,建议使用PRECISION_MODE_V2参数。
参数默认值:fp16 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
ALLOW_HF32 |
该参数预留,当前版本暂不支持。 是否启用HF32自动代替float32数据类型的功能,当前版本该参数仅针对Conv类算子与Matmul类算子生效。 HF32是华为昇腾推出的专门用于算子内部计算的单精度浮点类型,与其他常用数据类型的比较如下图所示。可见,HF32与float32支持相同的数值范围,但尾数位精度(11位)却接近FP16(10位)。通过降低精度让HF32单精度数据类型代替原有的float32单精度数据类型,可大大降低数据所占空间大小,实现性能的提升。 参数值:
参数默认值:针对Conv类算子,使能FP32转换为HF32;针对Matmul类算子,不使能FP32转换为HF32。 约束:
产品支持情况: Atlas A2训练系列产品:支持 Atlas 200/300/500 推理产品:不支持 Atlas 推理系列产品(Ascend 310P处理器):不支持 Atlas 训练系列产品:不支持 Atlas 200/500 A2推理产品:不支持 |
EXEC_DISABLE_REUSED_MEMORY |
内存复用开关。
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OUTPUT_TYPE |
网络输出数据类型:
模型编译后,在对应的*.om模型文件中,上述数据类型分别以1、4、2枚举值呈现。
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OUT_NODES |
指定输出节点。 如果不指定输出节点(算子名称),则模型的输出默认为最后一层的算子信息,如果指定,则以指定的为准。 某些情况下,用户想要查看某层算子参数是否合适,则需要将该层算子的参数输出,既可以在模型编译时通过该参数指定输出某层算子,模型编译后,在相应.om模型文件最后即可以看到指定输出算子的参数信息,如果通过.om模型文件无法查看,则可以将.om模型文件转换成json格式后查看。 例如:"node_name1:0;node_name1:1;node_name2:0"。 指定的输出节点必须放在双引号中,节点中间使用英文分号分隔。node_name必须是模型转换前的网络模型中的节点名称,冒号后的数字表示第几个输出,例如node_name1:0,表示节点名称为node_name1的第0个输出。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
INPUT_FP16_NODES |
指定输入数据类型为FP16的输入节点名称。该参数必填。 例如:"node_name1;node_name2",指定的节点必须放在双引号中,节点中间使用英文分号分隔。若配置了该参数,则不能对同一个输入节点同时使用INSERT_OP_FILE参数。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
LOG_LEVEL |
设置显示日志的级别。包括如下取值:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OP_COMPILER_CACHE_MODE |
用于配置算子编译磁盘缓存模式。默认值为enable。
使用说明:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OP_COMPILER_CACHE_DIR |
用于配置算子编译磁盘缓存的目录。 路径支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、中划线(-)、句点(.)、中文字符。 如果参数指定的路径存在且有效,则在指定的路径下自动创建子目录kernel_cache;如果指定的路径不存在但路径有效,则先自动创建目录,然后在该路径下自动创建子目录kernel_cache。 默认值:$HOME/atc_data 算子编译磁盘缓存路径,除OP_COMPILER_CACHE_DIR参数设置的方式外,还可以配置环境变量ASCEND_CACHE_PATH,几种方式优先级为 配置参数“OP_COMPILER_CACHE_DIR”>环境变量ASCEND_CACHE_PATH>默认存储路径。 关于环境变量ASCEND_CACHE_PATH的详细说明请参见《环境变量参考》。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
DEBUG_DIR |
用于配置保存算子编译生成的调试相关的过程文件的路径,包括算子.o/.json/.cce等文件。 默认生成在当前路径下。 如果要自行指定算子编译的过程文件存放路径,需DEBUG_DIR参数与OP_DEBUG_LEVEL参数配合使用,且当OP_DEBUG_LEVEL取值为0时,不能使用DEBUG_DIR参数。 算子编译生成的调试文件存储路径,除DEBUG_DIR参数设置的方式外,还可以配置环境变量ASCEND_WORK_PATH,几种方式优先级为: 配置参数“DEBUG_DIR”>环境变量ASCEND_WORK_PATH >默认存储路径。 关于环境变量ASCEND_WORK_PATH的详细说明请参见《环境变量参考》。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OP_DEBUG_LEVEL |
算子debug功能开关,取值:
须知:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
MDL_BANK_PATH |
加载模型调优后自定义知识库的路径。 该参数需要与BUFFER_OPTIMIZE参数配合使用,仅在数据缓存优化开关打开的情况下生效,通过利用高速缓存暂存数据的方式,达到提升性能的目的。 参数值:模型调优后自定义知识库路径。 参数值格式:支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、中划线(-)、句点(.)。 参数默认值:${install_path}/compiler/data/fusion_strategy/custom$ 如果默认路径下不存在自定义知识库,则会查找模型的内置知识库,该路径为:${install_path}/compiler/data/fusion_strategy/built-in 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OP_BANK_PATH |
算子调优后自定义知识库路径。 支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、中划线(-)、句点(.)。默认自定义知识库路径${HOME}/Ascend/latest/data/aoe/custom/op 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
MODIFY_MIXLIST |
配置混合精度黑白灰名单,配置为路径以及文件名,文件为json格式。
allow_mix_precision混合精度模式下,针对全网中float32数据类型的算子,按照内置的优化策略,自动将部分float32的算子降低精度到float16,从而在精度损失很小的情况下提升系统性能并减少内存使用。用户可以在内置优化策略基础上进行调整,自行指定哪些算子允许降精度,哪些算子不允许降精度。
配置示例:
{ge::ir_option::MODIFY_MIXLIST, "/home/test/ops_info.json"} ops_info.json中可以指定算子类型,多个算子使用英文逗号分隔,样例如下: { "black-list": { // 黑名单 "to-remove": [ // 黑名单算子转换为灰名单算子 "Xlog1py" ], "to-add": [ // 白名单或灰名单算子转换为黑名单算子 "Matmul", "Cast" ] }, "white-list": { // 白名单 "to-remove": [ // 白名单算子转换为灰名单算子 "Conv2D" ], "to-add": [ // 黑名单或灰名单算子转换为白名单算子 "Bias" ] } } 上述配置文件样例中展示的算子仅作为参考,请基于实际硬件环境和具体的算子内置优化策略进行配置。混合精度场景下算子的内置优化策略可在“OPP安装目录/opp/built-in/op_impl/ai_core/tbe/config/soc_version/aic-soc_version-ops-info.json”文件中查询,例如: "Conv2D":{ "precision_reduce":{ "flag":"true" }, true:白名单。false:黑名单。不配置:灰名单。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
OP_PRECISION_MODE |
设置指定算子内部处理时的精度模式,支持指定一个算子或多个算子。通过该参数传入自定义的精度模式配置文件op_precision.ini,可以为不同的算子设置不同的精度模式。 ini文件中按照算子类型、节点名称设置精度模式,每一行设置一个算子类型或节点名称的精度模式,按节点名称设置精度模式的优先级高于按算子类型。 配置文件中支持设置如下精度模式:
具体某个算子支持配置的精度/性能模式取值,可以通过CANN软件安装后文件存储路径的opp/built-in/op_impl/ai_core/tbe/impl_mode/all_ops_impl_mode.ini文件查看。 样例如下: [ByOpType] optype1=high_precision optype2=high_performance optype3=enable_hi_float_32_execution optype4=support_out_of_bound_index [ByNodeName] nodename1=high_precision nodename2=high_performance nodename3=enable_hi_float_32_execution nodename4=support_out_of_bound_index 该参数不能与OP_SELECT_IMPL_MODE、OPTYPELIST_FOR_IMPLMODE参数同时使用,若三个参数同时配置,则只有OP_PRECISION_MODE参数指定的模式生效。 该参数不建议配置,若使用高性能或者高精度模式,网络性能或者精度不是最优,则可以使用该参数,通过配置ini文件调整某个具体算子的精度模式。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
SHAPE_GENERALIZED_BUILD_MODE |
图编译时Shape的编译方式。该参数在后续版本废弃、新开发功能请不要使用该参数。
产品支持情况: Atlas 200/300/500 推理产品,支持 Atlas 训练系列产品,支持 Atlas 推理系列产品(Ascend 310P处理器),支持 Atlas 200/500 A2推理产品,支持 Atlas A2训练系列产品,支持 |
CUSTOMIZE_DTYES |
通过该参数自定义模型编译时算子的计算精度,模型中其他算子以PRECISION_MODE指定的精度模式进行编译。该参数需要配置为配置文件路径及文件名,例如:/home/test/customize_dtypes.cfg。 配置文件中列举需要自定义计算精度的算子名称或算子类型,每个算子单独一行,且算子类型必须为基于IR定义的算子的类型。对于同一个算子,如果同时配置了算子名称和算子类型,编译时以算子名称为准。 配置文件格式要求: # 按照算子名称配置 Opname1::InputDtype:dtype1,dtype2,…OutputDtype:dtype1,… Opname2::InputDtype:dtype1,dtype2,…OutputDtype:dtype1,… # 按照算子类型配置 OpType::TypeName1:InputDtype:dtype1,dtype2,…OutputDtype:dtype1,… OpType::TypeName2:InputDtype:dtype1,dtype2,…OutputDtype:dtype1,… 配置文件配置示例: # 按照算子名称配置 resnet_v1_50/block1/unit_3/bottleneck_v1/Relu::InputDtype:float16,int8,OutputDtype:float16,int8 # 按照算子类型配置 OpType::Relu:InputDtype:float16,int8,OutputDtype:float16,int8
说明:
产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
BUILD_INNER_ MODEL |
当前版本暂不支持。 |
OP_DEBUG_CONFIG |
Global Memory内存检测功能开关。
取值为.cfg配置文件路径,配置文件内多个选项用英文逗号分隔:
配置示例:/root/test0.cfg,其中,test0.cfg文件信息为: op_debug_config = ccec_O0,ccec_g,oom
说明:
开启ccec编译选项的场景下(即ccec_O0、ccec_g选项),会增大算子Kernel(*.o文件)的大小。动态shape场景下,由于算子编译时会遍历可能存在的所有场景,最终可能会导致由于算子Kernel文件过大而无法进行编译的情况,此种场景下,建议不要开启ccec编译选项。 由于算子kernel文件过大而无法编译的日志显示如下: message:link error ld.lld: error: InputSection too large for range extension thunk ./kernel_meta_xxxxx.o:(xxxx) 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
EXTERNAL_WEIGHT |
是否将网络中Const/Constant节点的权重保存在单独的文件中,取值包括:
说明:当网络中weight占用内存较大且对模型大小有限制时,建议将此配置项设置为“1”。 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
EXCLUDE_ENGINES |
设置网络模型不使用某个或某些加速引擎。多个以“|”分隔。 NPU集成了多种硬件加速器(也叫加速引擎),比如AiCore/AiVec/AiCpu(按照优先级排列)等,在图编译阶段会按照优先级为算子选择合适的引擎,即当同一个算子被多种引擎支持时,会选择优先级高的那个。 EXCLUDE_ENGINES提供了排除某个引擎的功能,比如在一次训练过程中,为避免数据预处理图和主训练图抢占AiCore,可以给数据预处理图配置不使用AiCore引擎。 取值包括: “AiCore”:AI Core硬件加速引擎 “AiVec”:Vector Core硬件加速引擎 “AiCpu”:AI CPU硬件加速引擎 举例: {ge::ir_option::EXCLUDE_ENGINES, "AiCore|AiVec"} 产品支持情况: Atlas 200/300/500 推理产品:支持 Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas 200/500 A2推理产品:支持 Atlas A2训练系列产品:支持 |
DISTRIBUTED_CLUSTER_BUILD |
大模型分布式编译切分开关,使能该参数后,生成的离线模型将用于分布式部署。“1”表示使能,空或其他值表示未使能。 配置示例: {ge::ir_option::DISTRIBUTED_CLUSTER_BUILD, "1"} 产品支持情况: Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas A2训练系列产品:支持 Atlas 200/300/500 推理产品:不支持 Atlas 200/500 A2推理产品:不支持 |
ENABLE_GRAPH_PARALLEL |
是否对原始模型进行自动切分。“1”表示开启自动切分,空或其他值表示不开启。 DISTRIBUTED_CLUSTER_BUILD参数开启分布式编译后,才支持开启自动切分功能,原始模型会按照GRAPH_PARALLEL_OPTION_PATH文件中的要求进行自动切分。 配置示例: {ge::ir_option::ENABLE_GRAPH_PARALLEL, "1"} 产品支持情况: Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas A2训练系列产品:支持 Atlas 200/300/500 推理产品:不支持 Atlas 200/500 A2推理产品:不支持 |
GRAPH_PARALLEL_OPTION_PATH |
对原始大模型进行切分时,算法切分策略配置文件所在路径。 DISTRIBUTED_CLUSTER_BUILD参数开启分布式编译,且ENABLE_GRAPH_PARALLEL参数开启切分功能后,才支持配置切分策略配置文件路径。 配置示例: {ge::ir_option::GRAPH_PARALLEL_OPTION_PATH, "./parallel_option.json"} 配置文件必须为json格式,示例如下:
参数解释如下:
产品支持情况: Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas A2训练系列产品:支持 Atlas 200/300/500 推理产品:不支持 Atlas 200/500 A2推理产品:不支持 |
MODEL_RELATION_CONFIG |
表达多个切片模型间的数据关联和分布式通信组关系的配置文件及路径。该参数适用于原始模型为切片模型,且切片模型内含通信算子的场景。 该参数在开启分布式编译参数DISTRIBUTED_CLUSTER_BUILD后才生效。 配置示例: {ge::ir_option::MODEL_RELATION_CONFIG, "./model_relation.json"} 配置文件必须为json格式,示例如下: { "deploy_config" :[ //必选,部署模型与目标部署节点的映射关系 { "submodel_name":"submodel1.air", // 前端切分后的文件名称,要和前端切分后的Graph name名称保持一致 "deploy_device_id_list":"0:0:0" // 该模型要部署的目标设备cluster:0 node:0 item:0 }, { "submodel_name":"submodel2.air", "deploy_device_id_list":"0:0:1" } ], "model_name_to_instance_id":[ // 必选 { "submodel_name":"submodel1.air", // 模型对应的id,文件中由用户指定,不同文件对应不同id值即可 "model_instance_id":0 }, { "submodel_name":"submodel2.air", "model_instance_id":1 } ], "comm_group":[{ // 非必选,若前端切分的模型包含通信算子,此处应是切分后模型通信算子的通信域相关信息 "group_name":"tp_group_name_0", // 前端切分模型通信算子的子通信域 "group_rank_list":"[0,1]" // 前端切分模型通信算子的子rank列表 }], "rank_table":[ { "rank_id":0, // rankid与模型id的映射关系 "model_instance_id":0 }, { "rank_id":1, "model_instance_id":1 } ] } 产品支持情况: Atlas 推理系列产品(Ascend 310P处理器):支持 Atlas 训练系列产品:支持 Atlas A2训练系列产品:支持 Atlas 200/300/500 推理产品:不支持 Atlas 200/500 A2推理产品:不支持 |