内存快照

为了调试内存使用情况,PyTorch提供了生成内存快照的方法,使用户可以更好地了解代码中最耗费内存的地方,并且可以在代码中进行相应的优化,以减少内存使用量。在生成内存快照后,可以使用交互式查看器(memory_viz)来查看快照。

内存快照的使用方法和案例具体请参考LINK。内存快照的API具体用法请参考LINK

在使用支持API接口时,需要将API名称中的cuda变换为NPU形式才能使用:torch.cuda.***变换为torch_npu.npu.***

当前AArch64架构c++堆栈暂不支持,默认仅保存Python堆栈。

除内存快照保存的相关文件外,同目录下还额外保存了CANN相关组件的内存占用信息,文件目录为PROF_XXX,用户可参考《CANN 性能调优工具指南》中的“解析并导出性能数据”章节导出数据对内存进行进一步分析。