全新开发

场景描述

全新开发，指CANN算子库中不包含相应的算子，需要先完成自定义算子的开发，再进行第三方框架的适配。可以查看《AOL算子加速库接口参考》，判断算子库是否包含对应算子。

若用户开发的自定义算子仅用于构造Ascend Graph或者通过AscendCL进行单算子调用，则无需进行第三方框架的适配（即如下开发流程中的“算子适配插件开发”）。

开发流程

通过MindStudio工具进行自定义算子开发的流程，与命令行方式进行自定义算子开发的流程相同。

全新开发场景下，开发的流程如下所示：

图1 基于MindStudio全新开发算子流程

图2 命令行方式全新开发算子流程

表1 算子开发步骤详解
序号	步骤	描述	参考
1	选择算子开发方式	进行算子分析，选择通过什么方式进行算子开发，例如TBE DSL、TBE TIK还是AI CPU。	选择算子开发方式
2	环境准备	准备算子开发及运行验证所依赖的开发环境与运行环境。	环境准备
3	工程创建	创建算子开发工程，有以下几种实现方式：基于MindStudio工具进行算子开发，直接使用MindStudio工具创建算子工程，会自动生成算子工程及代码模板。基于msopgen工具进行开发，会自动生成算子工程及代码模板。基于自定义算子样例工程进行开发，开发者需要自己创建算子相关实现文件，或者基于已有样例进行修改。	工程创建
4	算子原型定义	算子原型定义规定了在昇腾AI处理器上可运行算子的约束，主要体现算子的数学含义，包含定义算子输入、输出、属性和取值范围，基本参数的校验和shape的推导，原型定义的信息会被注册到Graph Engine的算子原型库中。离线模型转换时，GE会调用算子原型库的校验接口进行基本参数的校验，校验通过后，会根据原型库中的推导函数推导每个节点的输出shape与dtype，进行输出tensor的静态内存的分配。	算子原型定义
5	算子代码实现	针对TBE算子，需要实现算子的计算逻辑及调度。 TBE算子的实现文件为Python文件，包含TBE DSL与TBE TIK两种实现方式。针对AI CPU算子，需要进行算子类的定义以及算子的计算实现。 AI CPU算子的实现文件为C++文件。	算子代码实现（TBE DSL）算子代码实现（TBE TIK）算子代码实现（AI CPU）
6	算子信息库定义	算子信息库文件用于将算子的相关信息注册到算子信息库中，包括算子的输入输出dtype、format以及输入shape信息。离线模型转换时，FE会根据算子信息库中的算子信息做基本校验，判断是否需要为算子插入合适的转换节点，并根据算子信息库中信息找到对应的算子实现文件进行编译，生成算子二进制文件进行执行。	TBE算子信息库
7	算子UT测试	仿真场景下验证算子实现代码、算子原型定义的功能及逻辑正确性。 UT测试当前仅支持基于MindStudio进行算子开发的场景。	算子UT测试
8	算子适配插件开发	基于第三方框架（TensorFlow/Caffe）进行自定义算子开发的场景，开发人员需要进行插件的开发，将基于第三方框架的算子映射成适配昇腾AI处理器的算子。	算子适配
9	算子编译部署	编译自定义算子工程，生成自定义算子安装包并进行自定义算子包的安装，将自定义算子部署到算子库。	算子编译部署
10	算子ST测试	系统测试（System Test），在真实的硬件环境中，验证算子的正确性。	算子ST测试
11	算子网络测试	将自定义算子加载到网络模型中进行运行验证。	算子网络测试

父主题： 选择算子开发场景