概述

本节将以Add算子为例,带您快速构建Ascend C矢量算子程序,并学习矢量算子开发的典型场景以及处理方式。涉及的场景包括:

进行数据搬运和Vector计算时,对于搬运的数据长度和操作数的起始地址有如下的对齐要求:

  • 使用DataCopy接口进行数据搬运,搬运的数据长度和操作数的起始地址(Unified Buffer上)必须保证32字节对齐。
  • 通常情况下,进行Vector计算时,操作数的起始地址必须保证32字节对齐,执行计算的基本单位为32字节。