Sqr
函数功能
图像处理类算法,张量平方计算Sqr,支持float16、float32、uint8。支持异步调用。不支持inplace操作。
当前支持Atlas 推理系列产品和Atlas 200I/500 A2 推理产品。
在Atlas 200I/500 A2 推理产品上,支持预加载(请参见初始化算子预加载文件示例)。
使用时需满足以下条件:
- 接口中的输入输出Tensor必须在Device或DVPP侧且各参数(stream及数据内存)需位于同一Device中。
 - 同步场景下,数据内存所在Device需与初始化的Device一致。
 - 请注意处理数据类型越界问题。
 - 各输入、输出参数对应Tensor形状(Shape)相等、类型一致且不超过4维。
 - 在Atlas 推理系列产品上,当输入尺寸在480P(640*480)时,Sqr计算性能优于cv::pow(src, 2, dst)在CPU上的性能。
 - 在Atlas 200I/500 A2 推理产品上,当输入尺寸在720P(720*1280)时,计算性能优于cv::pow在CPU上的性能。
 
函数原型
1 | APP_ERROR Sqr(const Tensor &src, Tensor &dst, AscendStream& stream = AscendStream::DefaultStream());  | 
参数说明
参数名  | 
输入/输出  | 
说明  | 
|---|---|---|
src  | 
输入  | 
Tensor类,输入张量,支持float16、float32、uint8类型输入。  | 
dst  | 
输出  | 
Tensor类,输出张量,支持float16、float32、uint8类型输出,支持传入空Tensor,如果dst不为空Tensor,需要调用Tensor.Malloc()接口提前分配内存。  | 
stream  | 
输入  | 
AscendStream类型,默认值为“AscendStream::DefaultStream()”。当参数值为默认值时,接口为同步操作,其他情况下,接口为异步操作。  | 
返回参数说明
数据结构  | 
说明  | 
|---|---|
APP_ERROR  | 
程序执行返回的错误码,请参考APP_ERROR说明。  | 
父主题: TensorOperations