单算子性能仿真流水图
- 执行如下命令进行CAModel性能仿真。
ascendebug kernel --backend simulator --json-file ${op_config_json_file} --chip-version ${chip_version} --repo-type customize --customize-path ${cann_install_path}/latest/opp/vendors/${vendor_name} --core-type ${core_type} --timeout 1200 --block-num 1
命令参数
参数含义
取值说明
--backend
Kernel调测类型。
性能仿真流水场景填写simulator。
--json-file
算子信息配置文件。
具体参见输入配置中的json配置文件。
--chip-version
昇腾AI处理器的版本。
如果无法确定当前版本,则在安装昇腾AI处理器的服务器执行npu-smi info命令进行查询,在查询到的“Name”前增加Ascend信息,例如“Name”对应取值为xxxyy,实际配置的值为Ascendxxxyy。
--repo-type
算子开发场景类型。
标准自定义场景固定配置为customize。
--customize-path
自定义算子包的安装目录。
根据实际自定义算子的部署环境配置,例如${cann_install_path}/latest/opp/vendors/${vendor_name},其中${cann_install_path}为CANN软件安装包路径,${vendor_name}为部署自定义算子包时设置的vendor名。
--core-type
算子类型。
根据实际情况填写,可选值为{AiCore, MixCore, CubeCore, VectorCore, MixVectorCore},MixVectorCore为预留参数,开发者无需关注。本场景以AddCustom为例,设为VectorCore。
--timeout
设置运行超时时间,单位秒。
CAModel运行时间比较长,一般设为1200s, 用户可根据实际情况修改。
--block-num
运行核数设置。
CAModel场景一般单核运行,设置为1。
- 查看CAModel性能仿真结果和流水图,具体示例可以参见“CAModel性能仿真 > 调测产物”。
父主题: 性能调优