输入输出
当参数type为LINEAR_ALL_REDUCE、LINEAR_REDUCE_SCATTER、ALL_GATHER_LINEAR、PURE_LINEAR、ALL_GATHER_LINEAR_REDUCE_SCATTER时输入输出。
输入
参数  | 
维度  | 
数据类型  | 
格式  | 
描述  | 
|---|---|---|---|---|
input  | 
[m, k]/[batch, m, k]  | 
  | 
ND  | 
矩阵乘运算的A矩阵。 
  | 
weight  | 
ND:[k, n] NZ: 
 mc2时: 
  | 
  | 
ND/NZ  | 
权重,矩阵乘的B矩阵。 
  | 
bias  | 
  | 
  | 
ND  | 
叠加的偏置矩阵。 ALL_GATHER_LINEAR_REDUCE_SCATTER时,不支持。  | 
deqScale  | 
  | 
  | 
ND  | 
反量化的scale。 仅量化时需要此参数。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时不支持。 allgatherV2不支持量化,allgatherV2是指type为ALL_GATHER_LINEAR,keepIntermediate参数为true的场景。  | 
residual  | 
[n]  | 
float16/bf16  | 
ND  | 
残差,用于叠加到最后的输出结果上。 当type为ALL_GATHER_LINEAR_REDUCE_SCATTER时不支持。 非量化不支持残差。  | 
perTokenScale  | 
[m]  | 
float  | 
ND  | 
perToken反量化scale,量化时输入,只有当quantType是QUANT_TYPE_PER_TOKEN的时候才需要。  | 
输出
参数  | 
维度  | 
数据类型  | 
格式  | 
描述  | 
|---|---|---|---|---|
output  | 
  | 
float16/bf16  | 
ND  | 
输出tensor,维度数与x一致。  | 
intermediateOutput  | 
[m*rankSize, n]/[batch*rankSize, m, n]  | 
float16/bf16  | 
ND  | 
输出tensor,维度数与x一致。 “keepIntermediate”为true且“ParallelType”使用“ALL_GATHER_LINEAR”时生效。  |