参数列表

在使用时应带有命名空间atb::infer::SelfAttentionParam的参数,成员描述如下:

成员名称

类型

默认值

描述

quantType

QuantType

TYPE_QUANT_UNDEFINED

quant类型。

outDataType

aclDataType

ACL_DT_UNDEFINED

output数据类型。

headNum

int32_t

0

query头大小, 需大于0

kvHeadNum

int32_t

0

kv头数量,该值需要用户根据使用的模型实际情况传入。

qScale

float

1

query缩放系数。

qkScale

float

1

算子tor值, 在Q*K^T后乘。

batchRunStatusEnable

bool

false

是否开启动态batch。

isTriuMask

uint32_t

0

是否开启倒三角优化, 只有mask为倒三角的时候才能开启优化。

calcType

CalcType

UNDEFINED

计算类型。

kernelType

KernelTpye

KERNELTYPE_DEFAULT

内核精度类型。

clampType

ClampTpye

CLAMP_TYPE_UNDEFINED

clamp类型。

clampMin

float

0

clamp功能最小值。

clampMax

float

0

clamp功能最大值。

maskType

MaskType

MASK_TYPE_UNDEFINED

mask类型。

kvcacheCfg

KvCacheCfg

K_CACHE_V_CACHE

kvcache配置。

scaleType

ScaleType

SCALE_TYPE_TOR

scale类型。

inputLayout

InputLayout

TYPE_BSND

数据排布格式默认为BSND。

上表中类型为自定义类型的,其描述如下: