昇腾社区首页
中文
注册
开发者
下载

单算子API执行

本章介绍了以“单算子API执行”方式调用算子的接口,接口列表如表1所示,包括NN算子接口、融合算子接口、DVPP算子接口,它们是CANN算子库(具体介绍参见《算子库接口参考》)的重要组成部分。

本章通过介绍接口功能、原型、参数、调用示例等,辅助用户快速上手调用算子,支撑AI业务高效应用开发。

算子库接口的调用流程参见单算子API执行接口调用流程,详细的调用示例(以NN算子接口调用为例)参见调用NN/融合算子接口示例代码

  • 算子调用方式:除本章中“单算子API执行”方式调用单算子,还支持其他单算子调用方式,具体参见单算子调用方式:单算子模型执行、单算子API执行、Kernel加载与执行
  • 使用说明:使用本章接口前,请确保已安装驱动、固件和CANN软件包,其他使用说明(如适用产品型号、接口依赖的头文件和库文件等),具体请参见《算子库接口参考》章节。
表1 算子接口列表

接口分类

说明

接口文档

NN算子接口

Neural Network类算子,接口前缀为aclnnXxx,覆盖深度学习算法相关的计算类型,例如常见的Softmax、MatMul、Convolution等。

参考《算子库接口参考》NN算子接口

融合算子接口

融合类算子,接口前缀为aclnnXxx,由多个独立基础“小算子”(如向量Vector、矩阵Cube等)融合而成,大算子功能与多个小算子功能等价,且性能收益往往优于小算子。例如常见的Flash Attention、通算融合算子(简称MC2算子)等。

参考《算子库接口参考》融合算子接口

DVPP算子接口

Digital Vision Pre-Processing类算子,接口前缀为acldvppXxx提供高性能视频/图片编解码、图像裁剪缩放等预处理功能。

参考《算子库接口参考》DVPP算子接口