本节仅描述各产品对应的昇腾AI处理器的性能指标参考数据,各产品由于其内存、CPU等配置不同,在性能规格上会存在差异,详细产品的性能规格请查阅昇腾社区的官方说明。
本节以单个昇腾AI处理器为例,描述基本场景性能指标参考,如下表所示,其它分辨率可以等量估算。
性能指标说明(Atlas 推理系列产品)
以下性能数据,是基于一个stream上下发64个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口,且Host服务器配置为:CPU主频为Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz,CPU核心数为14。
单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表3 Atlas 推理系列产品的昇腾AI处理器性能指标参考数据场景举例
|
总帧率
|
- 输入图片分辨率:1080p(1920*1080)
- 输出图片分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(1≤n≤12)
|
n*360fps
|
- 输入图片分辨率:1080p(1920*1080)
- 输出图片分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n>12)
|
4320fps
|
- 输入图片分辨率:4K图像(3840*2160)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(1≤n≤12)
|
n*90fps
|
- 输入图片分辨率:4K图像(3840*2160)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n>12)
|
1080fps
|
- 输入图片分辨率:8K图像(7680*4320)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(1≤n≤12)
|
n*22.5fps
|
- 输入图片分辨率:8K图像(7680*4320)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n>12)
|
270fps
|
调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas 训练系列产品)
以下性能数据,是基于一个stream上下发10个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口。
- 对于非8K图像,单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表4 Atlas 训练系列产品的昇腾AI处理器性能指标参考数据场景举例
|
总帧率
|
- 输入图像分辨率:1080p(1920*1080)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
|
n*360fps
|
- 输入图像分辨率:1080p(1920*1080)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
|
5760fps
|
- 输入图像分辨率:4K图像(3840*2160)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
|
n*90fps
|
- 输入图像分辨率:4K图像(3840*2160)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
|
1440fps
|
- 对于8K图像,单个Device的典型场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表5 Atlas 训练系列产品的昇腾AI处理器性能指标参考数据场景举例
|
总帧率
|
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
|
n*25fps
|
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
|
400fps
|
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
|
n*25fps
|
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
|
400fps
|
调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas 200/500 A2推理产品)
单个Device场景下的性能指标参考如下(1路对应一个通道,一个通道对应一个线程,或者n路对应一个通道,一个通道对应n个线程):
表6 Atlas 200/500 A2推理产品的昇腾AI处理器性能指标参考数据场景举例
|
总帧率
|
- 输入图片分辨率:1080p(1920*1080)
- 输出图片分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<2)
|
n*800fps
|
- 输入图片分辨率:1080p(1920*1080)
- 输出图片分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥2)
|
1600fps
|
- 输入图片分辨率:4K图像(3840*2160)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<2)
|
n*200fps
|
- 输入图片分辨率:4K图像(3840*2160)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥2)
|
400fps
|
- 输入图片分辨率:8K图像(7680*4320)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<2)
|
n*100fps
|
- 输入图片分辨率:8K图像(7680*4320)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥2)
|
200fps
|
调用VPC批处理接口(接口命名中包含batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas A2训练系列产品/Atlas 800I A2推理产品)
表7 Atlas A2训练系列产品/Atlas 800I A2推理产品的昇腾AI处理器性能指标参考数据场景举例
|
总帧率
|
- 输入图片分辨率:1080p(1920*1080)
- 输出图片分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(1≤n≤10)
|
n*1440fps
|
- 输入图片分辨率:1080p(1920*1080)
- 输出图片分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n>10)
|
14400fps
|
- 输入图片分辨率:4K图像(3840*2160)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(1≤n≤10)
|
n*360fps
|
- 输入图片分辨率:4K图像(3840*2160)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n>10)
|
3600fps
|
- 输入图片分辨率:8K图像(7680*4320)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(1≤n≤10)
|
n*90fps
|
- 输入图片分辨率:8K图像(7680*4320)
- 输出图片分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n>10)
|
900fps
|