LocalMemAllocator简介
LocalMemAllocator是在使用静态Tensor编程方式时用于内存管理的类,用户无需构建TPipe/TQue,而是直接创建LocalTensor对象(也可以直接通过LocalTensor构造函数进行构造)并开发算子,从而减少运行时的开销,实现更优的性能。
LocalMemAllocator仅支持在Ascend C静态Tensor编程方式中使用,不可以与TPipe等接口混用。
需要包含的头文件
1
|
#include "kernel_operator.h" |
原型定义
1 2 3 4 5 6 7 8 9 10 11 |
template<Hardware hard = Hardware::UB> class LocalMemAllocator { public: __aicore__ inline LocalMemAllocator(); __aicore__ inline uint32_t GetCurAddr() const; template <class DataType, uint32_t tileSize> LocalTensor<DataType> __aicore__ inline Alloc(); template <TPosition pos, class DataType, uint32_t tileSize> __aicore__ inline LocalTensor<DataType> Alloc(); template <class DataType> LocalTensor<DataType> __aicore__ inline Alloc(uint32_t tileSize); template <TPosition pos, class DataType> LocalTensor<DataType> __aicore__ inline Alloc(uint32_t tileSize); template <class TensorTraitType> LocalTensor<TensorTraitType> __aicore__ inline Alloc(); }; |
模板参数
|
参数名 |
描述 |
||
|---|---|---|---|
|
hard |
用于表示数据的物理位置,Hardware枚举类型,定义如下,合法位置为:UB、L1、L0A、L0B、L0C、BIAS、FIXBUF。
|
父主题: LocalMemAllocator