昇腾社区首页
中文
注册

使用场景

msprof工具能够对算子性能数据的进行一键式采集,提升开发者对于算子性能的优化效率。

当前支持基于不同运行模式(上板或仿真)和不同文件形式(可执行文件或算子二进制.o文件)进行性能数据的采集和自动解析。

支持如下调用算子的场景:
  • 基于核函数的算子调用方式。
    对<<<>>>内核调用符方式调用的算子,若该算子已在上板运行模式下,但用户又需要对其进行仿真调优,可通过以下操作步骤实现。
    1. 在任意目录下,创建一个指向libruntime_camodel.so的软连接,名称为libruntime.so。
      ln -s /{simulator_path}/lib/libruntime_camodel.so /{so_path}/libruntime.so
    2. 将创建的软链接的父目录加入到环境变量LD_LIBRARY_PATH中。
      export LD_LIBRARY_PATH={so_path}:$LD_LIBRARY_PATH
  • 通过AscendCL单算子调用:单算子API执行模式。
    • 基于单算子API执行的方式调用NN类算子的示例代码,可参考AscendCL应用软件开发指南 (C&C++)中“AscendCL 单算子调用 > 单算子API执行 ”章节。
    • 单算子API执行的场景,先配置好前置条件,然后执行以下命令:
      msprof op simulator ./main  // main为程序名称,包含待调优算子的程序名
  • Pytorch框架单算子直调的场景。
    • 通过PyTorch框架进行单算子调用的场景,详细信息可参考Ascend C自定义算子开发指南中“网络中算子调用 > PyTorch框架”章节。
    • Pytorch场景下暂时不支持使用Atlas 推理系列产品J进行算子仿真调优。
    • 通过PyTorch框架进行单算子调用的场景,先配置好前置条件,然后执行以下命令:
      msprof op simulator python a.py  // a.py为程序名称,包含待调优算子的程序名

当前msprof算子工具支持的产品型号为

Atlas 推理系列产品

Atlas A2训练系列产品