kernel侧GeGLU接口的计算需要开发者预留/申请临时空间,最大临时空间(maxTmpBuffer)和输入所占空间(inputSize * typeSize)存在以下关系:
maxTmpBuffer = maxLiveNodeCnt * inputSize * typeSize + extraBuf
其中maxLiveNodeCnt表示最大临时空间是输入所占空间的多少倍;extraBuf表示使用的额外临时空间大小。
该接口用于获取maxLiveNodeCnt和extraBuf,在固定空间大小的情况下,通过maxLiveNodeCnt和extraBuf可以推算算子单次最大计算元素数量。
示例如下:
算子实现需要调用GeGLU接口,开发者为其预留currBuff大小的空间,利用GetGeGLUTmpBufferFactorSize接口得到maxLiveNodeCnt 、extraBuf输出值,反推GeGLU算子单次最大计算元素数量为:
currentShapeSize = (currBuff - extraBuf) / maxLiveNodeCnt / typeSize
1 | void GetGeGLUTmpBufferFactorSize(const uint32_t typeSize, uint32_t &maxLiveNodeCnt, uint32_t &extraBuf) |
接口 |
输入/输出 |
功能 |
---|---|---|
typeSize |
输入 |
算子输入的数据类型大小,单位为字节。比如算子输入的数据类型为half,此处应传入2。 |
maxLiveNodeCnt |
输出 |
最大存活节点数,最大临时空间是输入所占空间的多少倍。 |
extraBuf |
输出 |
使用的额外临时空间大小,单位为字节。 |
无
当利用maxLiveNodeCnt,extraBuf反推出的currentShapeSize * typeSize < 256B时,currentShapeSize按照256B/ typeSize的值向上取整。
1 2 3 4 5 | uint32_t typeSize = sizeof(half); uint32_t maxLiveNodeCnt = 0; uint32_t extraBuf = 0; AscendC::GetGeGLUTmpBufferFactorSize(typeSize, maxLiveNodeCnt, extraBuf); |