当输入为int8数据类型,输出为half数据类型时,需要进行反量化操作。反量化时有两种模式: 一种是单个元素的反量化方式,一种是向量的反量化方式。
该接口用于设置反量化的模式。
1 | int32_t SetDequantType(DequantType deqType) |
参数名 |
输入/输出 |
描述 |
---|---|---|
deqType |
输入 |
设置反量化时的模式。可选值: enum class DequantType { SCALAR = 0, // 单个元素的反量化方式 TENSOR = 1, // 向量的反量化方式 }; |
-1表示设置失败; 0表示设置成功。
无
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT8); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT8); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT32); tiling.SetShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetDequantType(DequantType::TENSOR); // 设置反量化的模式 tiling.SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData);