参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
probs |
[batch, voc_size] |
float16/bf16 |
ND |
输入,词表概率。 |
topp |
[batch, 1] |
float16/bf16 |
ND |
输入topp,topp截取的概率,batch的值需与probs的一致。 |
sampled_indices |
[batch, 1] |
int32 |
ND |
输出,取样的idx。 |
sampled_probs |
[batch, 1] |
float16/bf16 |
ND |
输出,取样的值。 |
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
probs |
[batch, voc_size] |
float16/bf16 |
ND |
输入,词表概率。 |
topk |
[batch, 1] |
int32 |
ND |
输入top-k,topk截取的位置,batch的值需与probs的一致。 |
topp |
[batch, 1] |
float16/bf16 |
ND |
输入,topp截取的概率,batch的值需与probs的一致。 |
sampled_indices |
[batch, 1] |
int32 |
ND |
输出,取样的idx。 |
sampled_probs |
[batch, 1] |
float16/bf16 |
ND |
输出,取样的值。 |
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
probs |
[batch, voc_size] |
float16/bf16 |
ND |
输入,词表概率。 |
topk |
[batch, 1] |
int32 |
ND |
输入top-k,topk截取的位置,batch的值需与probs的一致。 |
topp |
[batch, 1] |
float16/bf16 |
ND |
输入,topp截取的概率,batch的值需与probs的一致。 |
exp |
[batch, voc_size] |
float16/bf16 |
ND |
输入,所除的指数分布,维度需与probs的一致。 |
sampled_indices |
[batch, 1] |
int32 |
ND |
输出,取样的idx。 |
sampled_probs |
[batch, 1] |
float16/bf16 |
ND |
输出,取样的值。 |
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
probs |
[batch, voc_size] |
float16/bf16 |
ND |
输入,词表概率。 |
topk |
[batch, 1] |
int32 |
ND |
输入top-k,top-k截取的位置,batch的值需与probs的一致。 |
topp |
[batch, 1] |
float16/bf16 |
ND |
输入top-p,top-p截取的概率,batch的值需与probs的一致。 |
rand |
[batch, 1] |
float |
ND |
输入,值域为[0, 1],参考rand() / RAND_MAX。 |
sampled_indices |
[batch, 1] |
int32 |
ND |
输出,取样的序号。 |
sampled_probs |
[batch, 1] |
float16/bf16 |
ND |
输出,取样的值。 |
sampled_logprobs |
[batch, logProbsSize] |
float |
ND |
输出,topkToppSamplingType = BATCH_TOPK_MULTINOMIAL_LOGPROBS_SAMPLING时有效。值为对应概率值的对数。 |
参数 |
维度 |
数据类型 |
格式 |
描述 |
---|---|---|---|---|
probs |
[batch, voc_size] |
float16/bf16 |
ND |
输入,词表概率。 |
topk |
[batch, 1] |
int32 |
ND |
输入top-k,top-k截取的位置,batch的值需与probs的一致。 |
topp |
[batch, 1] |
float16/bf16 |
ND |
输入top-p,top-p截取的概率,batch的值需与probs的一致。 |
exp |
[batch, voc_size] |
float16/bf16 |
ND |
输入,所除的指数分布,维度需与probs的一致。 |
sampled_indices |
[batch, 1] |
int32 |
ND |
输出,取样的序号。 |
sampled_probs |
[batch, 1] |
float16/bf16 |
ND |
输出,取样的值。 |
sampled_logprobs |
[batch, logProbsSize] |
float |
ND |
输出,topkToppSamplingType = BATCH_TOPK_EXPONENTIAL_LOGPROBS_SAMPLING时有效。值为对应概率值的对数。 |