PadWithHiddenStateOperation

PadWithHiddenState是带隐藏层的pad，这个算子的主要作用是将变长的序列填充为固定长度，便于批处理和模型训练。

struct PadWithHiddenStateParam {
    std::vector<int32_t> qSeqLen;
    int32_t  maxSeqLen = 4096;
    uint8_t rsv[12] = {0};
};

成员名称	类型	默认值	描述
qSeqLen	std::vector<int32_t>	-	每个batch的实际输入长度。元素个数为batchSize。batchSize的值最大不超过32。
maxSeqLen	int32_t	4096	qSeqLen中最大输入长度。取值不超过4096。
rsv[12]	uint8_t	{0}	预留参数。

参数	维度	数据类型	格式	描述
x	[nTokens, hiddenSize]	float16	ND	pad前不带冗余的tensor。与unpad输出shape一致。

参数	维度	数据类型	格式	描述
output	[batchSize, maxSeqLen, hiddenSize]	float16	ND	pad后带冗余的tensor。与unpad输入shape一致。

父主题： atb/train_op_params.h