使用场景
msprof工具能够对算子性能数据的进行一键式采集,提升开发者对于算子性能的优化效率。
当前支持基于不同运行模式(上板或仿真)和不同文件形式(可执行文件或算子二进制.o文件)进行性能数据的采集和自动解析。
支持如下调用算子的场景:
- 基于核函数的算子调用方式。
对<<<>>>内核调用符方式调用的算子,若该算子已在上板运行模式下,但用户又需要对其进行仿真调优,可通过以下操作步骤实现。
- 在任意目录下,创建一个指向libruntime_camodel.so的软连接,名称为libruntime.so。
ln -s /{simulator_path}/lib/libruntime_camodel.so /{so_path}/libruntime.so
- 将创建的软链接的父目录加入到环境变量LD_LIBRARY_PATH中。
export LD_LIBRARY_PATH={so_path}:$LD_LIBRARY_PATH
- 在任意目录下,创建一个指向libruntime_camodel.so的软连接,名称为libruntime.so。
- 通过AscendCL单算子调用:单算子API执行模式。
- Pytorch框架单算子直调的场景。
当前msprof算子工具支持的产品型号为:
Atlas 推理系列产品
Atlas A2训练系列产品
父主题: msprof工具