vec_cpadd
功能说明
相邻内对(奇偶)elements求和:
函数原型
vec_cpadd(mask, dst, src, repeat_times, dst_rep_stride, src_rep_stride)
参数说明
请参见参数说明,且dst和src数据类型需保持一致。
Atlas 200/300/500 推理产品,dst/src支持的数据类型为:Tensor(float16)。
Atlas 训练系列产品,dst/src支持的数据类型为:Tensor(float16)。
Atlas推理系列产品(Ascend 310P处理器)AI Core,dst/src支持的数据类型为:Tensor(float16/float32)。
Atlas推理系列产品(Ascend 310P处理器)Vector Core,dst/src支持的数据类型为:Tensor(float16/float32)。
Atlas A2训练系列产品/Atlas 800I A2推理产品,dst/src支持的数据类型为:Tensor(float16/float32)
Atlas 200/500 A2推理产品,dst/src支持的数据类型为:Tensor(float16/float32)
,dst/src支持的数据类型为:Tensor(float16/float32)
返回值
无
支持的型号
Atlas 200/300/500 推理产品
Atlas 训练系列产品
Atlas推理系列产品(Ascend 310P处理器)AI Core
Atlas推理系列产品(Ascend 310P处理器)Vector Core
Atlas A2训练系列产品/Atlas 800I A2推理产品
Atlas 200/500 A2推理产品
注意事项
请参见注意事项。
调用示例
此样例只说明基础功能,详细参数用例可参见调用示例
from tbe import tik tik_instance = tik.Tik() src_gm = tik_instance.Tensor("float16", (128,), name="src_gm", scope=tik.scope_gm) dst_gm = tik_instance.Tensor("float16", (64,), name="dst_gm", scope=tik.scope_gm) src_ub = tik_instance.Tensor("float16", (128,), name="src_ub", scope=tik.scope_ubuf) dst_ub = tik_instance.Tensor("float16", (64,), name="dst_ub", scope=tik.scope_ubuf) # 将用户输入数据从gm搬运到ub tik_instance.data_move(src_ub, src_gm, 0, 1, 8, 0, 0) tik_instance.vec_cpadd(128, dst_ub, src_ub, 1, 4, 8) # 将计算结果从ub搬运到gm tik_instance.data_move(dst_gm, dst_ub, 0, 1, 4, 0, 0) tik_instance.BuildCCE(kernel_name="vec_cpadd", inputs=[src_gm], outputs=[dst_gm])
结果示例:
输入数据(src_gm): [-1.899 3.43 6.39 2.61 -1.996 9.68 0.699 4.395 -0.2384 5.39 -5.58 -0.592 -8.52 -1.713 -0.977 8.53 -7.043 4.348 -2.475 4.16 -7.48 -3.48 0.7246 9.266 7.566 2.225 0.07605 -8.59 -3.506 0.1312 -7.598 -7.668 -8.76 -8.9 0.3625 7.906 9.26 2.357 6.71 0.5034 -9.484 -2.215 -5.188 4.316 -9.96 7.254 5.855 3.146 -4.613 -4.715 -4.637 7.99 -9.11 7.59 -2.705 -8.26 -7.84 7.047 3.244 7.31 1.431 -1.55 6.465 1.723 2.998 4.51 -7.445 -3.293 3.705 -4.11 3.783 0.5117 1.835 6.62 0.6226 7.043 1.572 -8.58 -3.37 -5.836 9.72 -6.047 -2.977 9.86 -9.55 -2.402 -4.71 3.793 8.625 -0.3523 7.88 -1.134 7.465 -4.598 -7.055 -9.04 -0.979 -0.6177 -6.355 -1.605 -8.92 1.049 -0.723 7.066 8.984 9.74 9.49 6.133 -6.87 -7.582 -4.863 2.217 8.46 9.84 5.785 4.992 8.68 -1.767 2.395 8.414 9.375 2.877 -3.016 -4.137 -1.899 6.22 -7.426 4.99 ] 输出数据(dst_gm): [ 1.53 9. 7.684 5.094 5.152 -6.17 -10.234 7.555 -2.695 1.686 -10.96 9.99 9.79 -8.516 -3.375 -15.266 -17.66 8.266 11.62 7.215 -11.7 -0.871 -2.707 9. -9.33 3.352 -1.52 -10.96 -0.793 10.555 -0.11914 8.19 7.508 -10.734 -0.4043 4.297 8.45 7.664 -7.008 -9.2 3.672 6.883 -11.95 -0.918 8.27 6.746 2.867 -16.1 -1.597 -7.96 -7.875 6.344 18.72 15.625 -14.45 -2.646 18.31 10.78 6.914 10.81 12.25 -7.152 4.32 -2.438 ]
父主题: 对归约