--auto_tune_mode

昇腾AI软件栈提供了功能更强大、调优效率更高的AOE(Ascend Optimization Engine)自动调优工具,涵盖了Auto Tune的算子自动化调优功能,并同步提供了子图调优、梯度调优等功能。

Auto Tune工具在后续版本中会过期,建议用户使用AOE自动调优工具,详细使用方法可参见AOE工具使用指南

功能说明

设置算子的自动调优模式:控制TBE算子编译时,是否对算子进行调优,以便在昇腾AI处理器上寻找最好的性能配置。

关于Auto Tune工具的原理,支持调优的算子以及详细使用请参见Auto Tune工具使用指南

关联参数

该参数不能与--op_bank_path参数同时使用。

参数取值

参数值:

参数值格式:支持配置多种模式,多种模式放在双引号中,中间用英文逗号分隔,例如"RL,GA"。

推荐配置及收益

使用ATC工具进行模型转换时,如果使能该参数,则模型转换时间会比不使能长(通常一个算子大约需要20分钟左右,具体时间和网络模型大小相关),但使用转换后的离线模型进行推理,性能会优于不调优的离线模型。

示例

--auto_tune_mode="RL,GA"

支持的芯片型号

昇腾310 AI处理器

昇腾310P AI处理器

昇腾910 AI处理器

使用约束