昇腾社区首页
中文
注册

功能说明

将A、B两个矩阵进行矩阵乘运算,同时可以选择对矩阵乘的运算结果添加偏置、InplaceAdd融合或反量化操作。

算子本质上是接收x和weight两个输入tensor作为A矩阵和B矩阵进行矩阵乘运算,可通过参数“transposeA”“transposeB”控制做矩阵乘前是否需要对A矩阵和B矩阵进行行列转置,根据参数转置后的A矩阵和B矩阵需满足矩阵乘维度关系,例如,当“transposeA”为false,“transposeB”为true时,x和weight的shape可以分别为[m, k]和[n, k]。

该算子支持浮点和量化场景,当参数“outDataType”值为ACL_DT_UNDEFINED时为浮点场景,否则为量化场景。

该算子支持两种量化场景,当参数“quantMode”值为QUANT_UNDEFINED或PER_CHANNEL时为per_channel量化场景,值为PER_TOKEN时为per_token量化场景。

该算子支持爱因斯坦乘场景,当参数“matmulType”值为MATMUL_EIN_SUM时为爱因斯坦乘场景。

图1 LinearOperation