输入输出
当参数type为LINEAR_ALL_REDUCE、LINEAR_REDUCE_SCATTER、ALL_GATHER_LINEAR、PURE_LINEAR、ALL_GATHER_LINEAR_REDUCE_SCATTER时输入输出。
输入
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
input |
[m, k]/[batch, m, k] |
|
ND |
矩阵乘运算的A矩阵。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时,不支持量化。 |
weight |
ND:[k, n] NZ:非量化:[1,n/16, k,16];量化:[1,n/32, k, 32] |
|
ND/NZ |
权重,矩阵乘的B矩阵。
|
bias |
|
|
ND |
叠加的偏置矩阵。 ALL_GATHER_LINEAR_REDUCE_SCATTER时,不支持。 |
deqScale |
|
|
ND |
反量化的scale。 仅量化时需要此参数。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时不支持。 allgatherV2不支持量化,allgatherV2是指type为ALL_GATHER_LINEAR,keepIntermediate参数为true的场景。 |
residual |
[n] |
float16/bf16 |
ND |
残差,用于叠加到最后的输出结果上。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时不支持。 |
perTokenScale |
[m] |
float |
ND |
perToken反量化scale,量化时输入,只有当quantType是QUANT_TYPE_PER_TOKEN的时候才需要。 |
输出
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
output |
|
float16/bf16 |
ND |
输出tensor,维度数与x一致。 |
intermediateOutput |
[m*rankSize, n]/[batch*rankSize, m, n] |
float16/bf16 |
ND |
输出tensor,维度数与x一致。 “keepIntermediate”为true且“ParallelType”使用“ALL_GATHER_LINEAR”时生效。 |