总体介绍
本章节提供离线推理场景下,如何通过API方式采集性能数据,支持以下实现方式:
采集方式 |
说明 |
---|---|
方式一:采集并落盘性能数据 |
将采集到的性能数据写入文件,再使用msprof工具解析该文件,并展示性能分析数据。 |
方式二:使用msproftx扩展接口采集并落盘性能数据 |
当用户需要定位应用程序或上层框架程序的性能瓶颈时,可在Profiling采集进程内(aclprofStart接口、aclprofStop接口之间)调用msproftx扩展接口,开启记录应用程序执行期间特定事件发生的时间跨度,并将数据写入性能数据文件,再使用msprof工具解析该文件,并导出展示性能分析数据。 |
方式三:订阅算子信息 |
将采集到的性能数据解析后写入管道,由用户读入内存,再由用户调用API获取性能数据。 |
父主题: 使用acl C&C++接口采集性能数据