昇腾社区首页
中文
注册

新增特性

命令行算子开发工具

  • msprof op新增单算子调优能力,支持上板精细化数据采集、仿真数据采集、仿真流水图可视化解析等能力。
  • mssanitizer新增单算子异常检测能力,支持内存检测、竞争检测。
  • msdebug新增单算子上板调试能力,支持断点、变量打印等基础能力。
  • mskpp新增单算子理论性能建模能力,支持通过DSL完成基于计算指令、搬运指令性能建模的算子性能建模。

命令行性能分析工具

  • 性能数据解析新增支持解析db格式性能数据文件。
  • 支持AI核频率变化趋势解析呈现(msprof.json文件新增AI Core Freq层级)。
  • 性能数据解析支持以Step为粒度解析。
  • Ascend PyTorch Profiler接口离线解析支持自定义最大进程数。
  • Ascend PyTorch Profiler接口数据精简模式默认情况单机和集群统一为默认开启。

命令行分析迁移工具

PyTorch GPU2Ascend支持输出亲和API的分析报告。

命令行ModelSlim工具

  • 支持输出亲和API的分析报告。
  • 大模型量化新增W8A16量化能力。
  • 大模型量化新增safetensor权重导出功能,可配合加速库模型进行Linear级自动回退。
  • 大模型量化新增NPU量化校准能力。
  • 大模型量化Antioutlier功能增强了模型泛化能力。
  • 稀疏量化的压缩过程新增支持多进程。

Ascend Insight

  • 支持系统级调优五个视图:timeline、memory、operator、summary以及communication。
  • 支持算子级调优,包含仿真级timeline以及算子热点函数显示。