aclnnSignBitsPack

产品支持情况

[object Object]undefined

功能说明

将float16类型或者float32类型的1位Adam打包为uint8。

函数原型

每个算子分为，必须先调用“aclnnSignBitsPackGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnSignBitsPack”接口执行计算。

[object Object]
[object Object]

aclnnSignBitsPackGetWorkspaceSize

参数说明：
- self（aclTensor*，计算输入）：表示用于计算的1D张量，Device侧的tensor，支持空tensor场景，数据类型支持FLOAT16和FLOAT。支持。支持为ND。
- size（int64_t，计算输入）：表示处理维度，reshape时输出张量的第一个维度。
- out（aclTensor*，计算输出）：输出的tensor，只支持二维，数据类型支持UINT8。输出out总长度在self元素个数不被8整除时为（self元素个数 // 8） + 1，在被8整除时为（self元素个数/8）。支持为ND。
- workSpaceSize（uint64_t*，出参）：返回需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

aclnnSignBitsPack

参数说明：
- workspace(void *, 入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnSignBitsPackGetWorkspaceSize获取。
- executor(aclOpExecutor *, 入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参)：指定执行任务的Stream。
返回值：

aclnnStatus：返回状态码，具体参见。

约束说明

无。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]