Where
产品支持情况
产品 |
是否支持 |
|---|---|
Atlas 350 加速卡 |
√ |
x |
|
x |
|
x |
|
x |
|
x |
|
x |
功能说明
根据指定的条件,从两个源操作数中选择元素,生成目标操作数。两个源操作数均可以是LocalTensor或标量。

函数原型
1 2 | template <typename T, typename U, typename S, typename V> __aicore__ inline void Where(const LocalTensor<T>& dst, const U& src0, const S& src1, const LocalTensor<V>& condition, const uint32_t count) |
参数说明
参数名 |
描述 |
|---|---|
T |
目的操作数数据类型。 Atlas 350 加速卡,支持的数据类型为:bool、int8_t、uint8_t、int16_t、uint16_t、half、bfloat16_t、int32_t、uint32_t、float、int64_t、uint64_t。 |
U |
LocalTensor类型或标量类型。根据输入参数src0自动推导类型,开发者无需配置该参数,保证src0的数据类型与目的操作数保持一致即可。 |
S |
LocalTensor类型或标量类型。根据输入参数src1自动推导类型,开发者无需配置该参数,保证src1的数据类型与目的操作数保持一致即可。 |
V |
条件的数据类型,当前支持的数据类型为:bool。 |
参数名称 |
类型 |
说明 |
|---|---|---|
dst |
输出 |
目的操作数。 类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。 |
src0、src1 |
输入 |
源操作数。类型为标量或LocalTensor,当类型为LocalTensor时,支持的TPosition为VECIN/VECCALC/VECOUT。 数据类型需要与目的操作数保持一致。 |
condition |
输入 |
条件操作数。 类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。 |
count |
输入 |
参与计算的元素个数。 |
返回值说明
无
约束说明
- 不支持源操作数与目的操作数地址重叠。
- 操作数地址偏移对齐要求请参见通用说明和约束。
调用示例
1 2 3 4 | AscendC::LocalTensor<half> dst, src0, src1; AscendC::LocalTensor<bool> condition; uint32_t count = 512; // 参与计算的元素个数 AscendC::Where(dst, src0, src1, condition, count); |
结果示例如下:
1 2 3 4 5 6 7 8 | 输入数据(src0): [1, 2, 3, ... 511, 512] 输入数据(src1): [-1, -2, -3, ... -511, -512] 条件输入数据(condition),为0时选择src1,为1时选择src0: [0, 1, 0, ... 0, 1] 输出数据(dst): [-1, 2, -3, ... -511, 512] |