model.h

  1
  2
  3
  4
  5
  6
  7
  8
  9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 29
 30
 31
 32
 33
 34
 35
 36
 37
 38
 39
 40
 41
 42
 43
 44
 45
 46
 47
 48
 49
 50
 51
 52
 53
 54
 55
 56
 57
 58
 59
 60
 61
 62
 63
 64
 65
 66
 67
 68
 69
 70
 71
 72
 73
 74
 75
 76
 77
 78
 79
 80
 81
 82
 83
 84
 85
 86
 87
 88
 89
 90
 91
 92
 93
 94
 95
 96
 97
 98
 99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
#ifndef MODEL_H
#define MODEL_H

#include <map>
#include <acl/acl.h>
#include <atb/atb_infer.h>
#include <atb/types.h>
#include <atb/utils.h>
#include "atb/infer_op_params.h"
#include "utils/log.h"

enum class TensorType
{
    INTERNAL_TENSOR = 0,
    NOT_INTERNAL_TENSOR,
};

// 图节点,每个Node表示一个Operation或者GraphOperation
struct Node
{
    // Node对应的operation或者graphOperation。
    atb::Operation *operation_ = nullptr;

    // Node的输入tensors
    atb::SVector<atb::Tensor *> inTensors_{};

    // Node的输出tensors
    atb::SVector<atb::Tensor *> outTensors_{};

    // Node的输出是中间tensor类型
    atb::SVector<TensorType> outTensorTypes_{};

    atb::VariantPack variantPack_{};

    uint64_t workspaceSize_ = 0;
    int workspaceBlockId_ = -1;
    void *workspace_ = nullptr;
};

// 所有的Node组成一个完整的图。
class Model
{
public:
    // 描述该模型的输入
    enum InTensorId : int
    { // 定义各TensorID
        IN_TENSOR_A = 0,
        IN_TENSOR_B,
        IN_TENSOR_C,
        IN_TENSOR_D,
        Mode_INPUT_SIZE,
    };

    enum OutTensorId : int
    {
        GLUE_OUT = 0,
        Mode_OUTPUT_SIZE,
    };

    explicit Model(std::string &&modelName = "") : modelName_(std::move(modelName))
    {
        LOG_INFO("Create model: " + modelName_);
    }

    // 模型初始化,设置模型的
    void InitResource(uint32_t deviceId);

    // 创建模型图
    void CreateModelGraph();

    // 创建模型的输入tensors
    void CreateModelInput();

    // 创建模型的输入tensors
    void CreateModelOutput();

    // modle执行
    void Execute();

    // stream流同步
    void WaitFinish();

    // 资源释放
    void FreeResource();

    // 模型的输入tensors
    atb::SVector<atb::Tensor> modelInTensors_;

    // 模型的输出tensors
    atb::SVector<atb::Tensor> modelOutTensors_;

private:
    // 创建图算子的opreation
    void CreateGraphOpLayer(size_t nodeId);

    // 创建aclnn算子的opreation
    void CreateAclnnOpLayer(size_t nodeId);

    // 构造对应nodeId的node的VariantPack
    void BuildNodeVariantPack(int nodeId);

    // 下发nodeId对应的Operation
    atb::Status ExecuteNode(int nodeId);

    // workspace创建函数
    void CreateWorkspaceBuffer(int nodeId, int workspaceSizeNeeded);

    // 模型图的shape推导函数
    atb::Status InferShape(
        const atb::SVector<atb::TensorDesc> &inTensorDescs, atb::SVector<atb::TensorDesc> &outTensorDescs);

    std::string modelName_;
    uint32_t deviceId_ = 1;
    atb::Context *modeContext_ = nullptr;
    aclrtStream modelStream_ = nullptr;
    std::vector<Node> nodes_;

    // 模型的中间tensors,layer之间以internalTensors进行连接,这里要注意顺序
    std::vector<atb::Tensor> internalTensors_;
};

#endif