SetDequantType

功能说明

当输入为int8数据类型,输出为half数据类型时,需要进行反量化操作。反量化时有两种模式: 一种是单个元素的反量化方式,一种是向量的反量化方式。

该接口用于设置反量化的模式。

函数原型

1
int32_t SetDequantType(DequantType dequantType)

参数说明

表1 参数说明

参数名

输入/输出

描述

dequantType

输入

设置反量化时的模式。DequantType类型,该类型的定义如下。

1
2
3
4
enum class DequantType {
    SCALAR = 0,
    TENSOR = 1,
};

参数的取值及含义如下:

  • SCALAR:表示单个元素的反量化模式。
  • TENSOR:表示向量的反量化模式。

返回值

-1表示设置失败;0表示设置成功。

约束说明

本接口支持的单个元素的反量化模式、向量的反量化模式分别与Kernel侧接口SetQuantScalarSetQuantVector对应,本接口设置的反量化模式必须与Kernel侧使用的接口保持一致。

调用示例

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo());
matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); 
tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT8);
tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT8);   
tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16);   
tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT32);   
tiling.SetShape(1024, 1024, 1024);   
tiling.SetOrgShape(1024, 1024, 1024);  
tiling.SetBias(true);
tiling.SetDequantType(DequantType::TENSOR);  // 设置反量化的模式
tiling.SetBufferSpace(-1, -1, -1);
optiling::TCubeTiling tilingData;   
int ret = tiling.GetTiling(tilingData);