参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
input |
[m, k]/[batch, m, k] |
|
ND |
矩阵乘运算的A矩阵。 k为32的整数倍。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时,不支持量化。 |
weight |
[k, n] NZ:浮点额外支持[1, n/16, k, 16] |
|
|
权重,矩阵乘的B矩阵。“backend”为“lcoc”时float16/bf16支持NZ;“backend”为“hccl”或“lccl”时仅float16支持NZ。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时,不支持量化。 |
bias |
|
|
ND |
叠加的偏置矩阵。 n为16的整数倍。 ALL_GATHER_LINEAR_REDUCE_SCATTER时,不支持。 |
deqScale |
|
|
ND |
反量化的scale。 量化时输入。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时不支持。 |
residual |
[n] |
float16/bf16 |
ND |
残差,用于叠加到最后的输出结果上。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时不支持。 |
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
output |
|
float16/bf16 |
ND |
输出tensor,维度数与x一致。 |
intermediateOutput |
[m*rankSize, n]/[batch*rankSize, m, n] |
float16/bf16 |
ND |
输出tensor,维度数与x一致。 “keepIntermediate”为true且“ParallelType”使用“ALL_GATHER_LINEAR”时生效。 |