图模式是神经网络模型的一种运行模式,在图模式下用户首先将模型的计算过程构造成一张图,然后通过GE将图下发到昇腾硬件执行。相对于单个算子依次下发的方式,图模式下,GE可以通过计算图优化、多流并行、内存复用、模型下沉等技术手段,加速模型执行效率,减少模型内存占用。
算子入图的开发流程如下图所示:算子工程创建完成后,基于工程代码框架完成算子原型定义、kernel侧算子实现、host侧tiling实现并完成算子入图开发,通过工程编译脚本完成算子的编译部署,之后即可基于图IR执行算子,比如IR构图的方式调用自定义算子。该开发流程以为基础,除了需要提供工程化算子开发中的算子实现文件外,还需要额外交付算子入图的代码文件。
环境准备。
算子实现。