Not

产品支持情况

产品	是否支持
Atlas 350 加速卡	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	x
Atlas A2 训练系列产品/Atlas A2 推理系列产品	x
Atlas 200I/500 A2 推理产品	x
Atlas 推理系列产品AI Core	x
Atlas 推理系列产品Vector Core	x
Atlas 训练系列产品	x

功能说明

本节介绍两种接口，分别用于对RegTensor和MaskReg进行操作：

对RegTensor操作：
对输入srcReg中的每个有效数据按位取反，将结果写入dstReg。
对MaskReg操作：
对输入src中的每个有效位（bit）取反，将结果写入dst。

函数原型

对RegTensor进行操作

template <typename T = DefaultType, MaskMergeMode mode = MaskMergeMode::ZEROING, typename U>
__simd_callee__ inline void Not(U& dstReg, U& srcReg, MaskReg& mask)

对MaskReg进行操作

__simd_callee__ inline void Not(MaskReg& dst, MaskReg& src, MaskReg& mask)

参数说明

对RegTensor进行操作

表1 模板参数说明
参数名	描述
T	操作数数据类型。 Atlas 350 加速卡，支持的数据类型为：int8_t/uint8_t/int16_t/uint16_t/int32_t/uint32_t/int64_t/uint64_t/half/float
mode	选择MERGING模式或ZEROING模式。 ZEROING，mask未筛选的元素在dst中置零。 MERGING，当前不支持。
U	目的操作数的RegTensor类型，例如RegTensor<half>，由编译器自动推导，用户不需要填写。

表2 参数说明
参数名	输入/输出	描述
dstReg	输出	目的操作数。类型为RegTensor。
srcReg	输入	源操作数。类型为RegTensor。源操作数的数据类型需要与目的操作数保持一致。
mask	输入	源操作数元素操作的有效指示，详细说明请参考MaskReg。

对MaskReg进行操作
表3 参数说明
参数名

描述

dst

目的操作数。

src

源操作数。

mask

指示在计算过程中哪些bit有效。

表3 参数说明
参数名	描述
dst	目的操作数。
src	源操作数。
mask	指示在计算过程中哪些bit有效。

返回值说明

无

约束说明

无

调用示例

对RegTensor进行操作

template <typename T>
__simd_vf__ inline void NotVF(__ubuf__ T* dstAddr, __ubuf__ T* srcAddr, uint32_t count, 
 uint32_t oneRepeatSize, uint16_t repeatTimes)
{
    AscendC::Reg::RegTensor<T> srcReg;
    AscendC::Reg::RegTensor<T> dstReg;
    AscendC::Reg::MaskReg mask;
    for (uint16_t i = 0; i < repeatTimes; i++) {
        mask = AscendC::Reg::UpdateMask<T>(count);
        AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize);
        AscendC::Reg::Not(dstReg, srcReg, mask);
        AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, dstReg, mask);
    }
}

对MaskReg进行操作

template <typename T>
__simd_vf__ inline void NotVF(__ubuf__ T* dstAddr, __ubuf__ T* srcAddr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes)
{
    AscendC::Reg::RegTensor<T> srcReg;
    AscendC::Reg::MaskReg src = AscendC::Reg::CreateMask<T, AscendC::Reg::MaskPattern::ALLF>();
    AscendC::Reg::MaskReg dst;
    AscendC::Reg::MaskReg mask;
    for (uint16_t i = 0; i < repeatTimes; ++i) {
        mask = AscendC::Reg::UpdateMask<T>(count);
        AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize);
        AscendC::Reg::Not(dst, src, mask);
        AscendC::Reg::Adds(srcReg, srcReg, 0, dst);
        AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, srcReg, mask);
    }
}

父主题： 逻辑计算