新增特性
命令行算子开发工具
- msprof op新增单算子调优能力,支持上板精细化数据采集、仿真数据采集、仿真流水图可视化解析等能力。
- mssanitizer新增单算子异常检测能力,支持内存检测、竞争检测。
- msdebug新增单算子上板调试能力,支持断点、变量打印等基础能力。
- mskpp新增单算子理论性能建模能力,支持通过DSL完成基于计算指令、搬运指令性能建模的算子性能建模。
命令行性能分析工具
- 性能数据解析新增支持解析db格式性能数据文件。
- 支持AI核频率变化趋势解析呈现(msprof.json文件新增AI Core Freq层级)。
- 性能数据解析支持以Step为粒度解析。
- Ascend PyTorch Profiler接口离线解析支持自定义最大进程数。
- Ascend PyTorch Profiler接口数据精简模式默认情况单机和集群统一为默认开启。
命令行分析迁移工具
PyTorch GPU2Ascend支持输出亲和API的分析报告。
命令行ModelSlim工具
- 支持输出亲和API的分析报告。
- 大模型量化新增W8A16量化能力。
- 大模型量化新增safetensor权重导出功能,可配合加速库模型进行Linear级自动回退。
- 大模型量化新增NPU量化校准能力。
- 大模型量化Antioutlier功能增强了模型泛化能力。
- 稀疏量化的压缩过程新增支持多进程。
Ascend Insight
- 支持系统级调优五个视图:timeline、memory、operator、summary以及communication。
- 支持算子级调优,包含仿真级timeline以及算子热点函数显示。
父主题: 特性变更