aclnnCumprod&aclnnInplaceCumprod

产品支持情况

产品	是否支持
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]	√
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]	√
[object Object]Atlas 200I/500 A2 推理产品[object Object]	×
[object Object]Atlas 推理系列产品 [object Object]	×
[object Object]Atlas 训练系列产品[object Object]	×

功能说明

算子功能：新增aclnnCumprod接口，cumprod函数用于计算输入张量在指定维度上的累积乘积。例如，如果有一个张量表示一系列的数值，cumprod可以计算出这些数值从开始位置到当前位置的乘积序列。
计算公式：
- 一维张量（向量）情况 当对于一维张量，累积乘积 $y=[y_1,y_2,y_3...,y_n]$ 的计算公式为:
  
  $y_1=x_1$ $y_2=x_1 \times x_2$ $y_3=x_1 \times x_2\times x_3$ ... $y_n=x_1\times x_2\times x_3\times x_n$
  
  用数学公式表示 $y_i=\prod_{j=1}^ix_j, 其中i=1,2...,n$ 。
- 高维张量情况(以二维张量为例， dim=0 沿行方向) 对于二维张量：
  $X=\begin{bmatrix}x_{11}&x_{12}&...&x_{1m}\\x_{21}&x_{22}&...&x_{2m}\\...&...&...&...&\\x_{n1}&x_{n2}&...&x_{nm}&\end{bmatrix}$
  计算后的结果张量：
  $Y=\begin{bmatrix}y_{11}&y_{12}&...&y_{1m}\\y_{21}&y_{22}&...&y_{2m}\\...&...&...&...&\\y_{n1}&y_{n2}&...&y_{nm}&\end{bmatrix}$
  对于第一列(j=1):
  $y_{i1}=x_{11}\times x_{21}\times ...\times x_{i1}(对于i=1,2,....n)$
  所以对于任意列j，也有类似规律，即:
  $y_{ij}=\prod_{k=1}^{i} x_{kj}$
- 高维张量情况(以二维张量为例， dim=1 沿列方向情况) 所以对于任意列j，也有类似规律，即:
  $y_{ij}=\prod_{k=1}^{j} x_{ik}$
- 其它参数可以类似地根据上述规则进行推导

函数原型

每个算子分为undefined，必须先调用“aclnnCumprodGetWorkspaceSize”或者“aclnnInplaceCumprodGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnCumprod”或者“aclnnInplaceCumprod”接口执行计算。

aclnnStatus aclnnCumprodGetWorkspaceSize(const aclTensor* input, const aclScalar* dim, const aclDataType dtype, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor)
aclnnStatus aclnnCumprod(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)
aclnnStatus aclnnInplaceCumprodGetWorkspaceSize(aclTensor* input, const aclScalar* dim, uint64_t* workspaceSize, aclOpExecutor** executor)
aclnnStatus aclnnInplaceCumprod(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)

aclnnCumprodGetWorkspaceSize

参数说明：
- input（aclTensor*, 计算输入）：当前输入值，表示需要计算累积乘积的数据，Device侧的aclTensor，支持undefined，支持空Tensor。数据类型支持FLOAT、FLOAT16、BFLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8、UINT16、UINT32、UINT64。 undefined支持ND。
- dim（aclScalar*, 计算输入）：当前输入值，指定计算累积乘积的维度，对于一个二维张量，dim=0表示沿着行方向计算，dim=1表示沿列方向计算，Device侧的aclScalar, 取值范围 [-rank(input), rank(input))。数据类型支持INT32。
- dtype（aclDataType, 计算输入）：指定计算过程input的数据类型。若为ACL_DT_UNDEFINED，使用传入input的原始类型计算；若指定具体类型（需在input支持数据类型范围内），计算前将input转换为此类型。
- out（aclTensor*, 计算输出）：累积乘积的结果，Device侧的aclTensor，undefined支持ND。dtype=ACL_DT_UNDEFINED时，数据类型必须与input相同；dtype指定时，数据类型必须与dtype相同。out的shape必须与input一致。
- workspaceSize（uint64_t*，出参）：返回用户需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

[object Object]

aclnnCumprod

参数说明：
- workspace(void *，入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t，入参)：在Device侧申请的workspace大小，由第一段接口aclnnCumprodGetWorkspaceSize获取。
- executor(aclOpExecutor *，入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream，入参)：指定执行任务的Stream。
返回值：

aclnnStatus: 返回状态码，具体参见undefined。

aclnnInplaceCumprodGetWorkspaceSize

参数说明：
- input（aclTensor*, 计算输入|计算输出）：表示需要计算累积乘积的数据和结果，Device侧的aclTensor，支持undefined，不支持空Tensor。数据类型支持FLOAT、FLOAT16、BFLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8、UINT16、UINT32、UINT64。 undefined支持ND。
- dim（aclScalar*, 计算输入）：指定计算累积乘积的维度，对于一个二维张量，dim=0表示沿着行方向计算，dim=1表示沿列方向计算，Device侧的aclScalar，取值范围 [-rank(x), rank(x)]。数据类型支持INT32。
- workspaceSize（uint64_t*，出参）：返回用户需要在Device侧申请的workspace大小。
- executor（aclOpExecutor*，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

[object Object]

aclnnInplaceCumprod

参数说明：
- workspace(void *，入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t，入参)：在Device侧申请的workspace大小，由第一段接口aclnnInplaceCumprodGetWorkspaceSize获取。
- executor(aclOpExecutor *，入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream，入参)：指定执行任务的Stream。
返回值：

aclnnStatus: 返回状态码，具体参见undefined。

约束说明

无

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考undefined。

[object Object]