性能指标说明
本节仅描述各产品对应的昇腾AI处理器的性能指标参考数据,各产品由于其内存、CPU等配置不同,在性能规格上会存在差异,详细产品的性能规格请查阅昇腾社区的官方说明。
本节以单个昇腾AI处理器为例,描述基本场景性能指标参考,其它分辨率可以等量估算。
下表中的1路对应一个通道,一个通道对应一个线程;各分辨率的含义为:720p指分辨率为1280 * 720的图片,1080p指分辨率为1920 * 1080的图片,4K指分辨率为3840 * 2160的图片。
性能指标说明(Atlas 200/300/500 推理产品)
- 针对如下典型场景下各分辨率的码流,单个Device的VDEC解码的路数推荐如下值:
表1 Atlas 200/300/500 推理产品 的昇腾AI处理器性能指标参考数据分辨率
总性能
单路性能(n路)
每路VDEC解码的最大内存消耗(此处以H.265格式的输入码流、参考帧数量9个为例,作为参考值)
4k
120fps
120fps / n(推荐n = 4,每路30fps)
约182MB
1080p
480fps
480fps / n(推荐n = 16,每路30fps)
约56MB
≤ 720p
960fps
960fps / n(推荐n = 32,每路30fps)
约35MB
下表以1080P分辨率的输入码流为例,说明每路VDEC解码的最大内存消耗的计算公式,在计算公式中:- 输入码流缓存大小:1080P分辨率及以下的输入码流,输入码流缓存大小默认为6M;1080P分辨率以上的输入码流,输入码流缓存大小默认为9M。
 - 解码图像帧存大小:1080P分辨率的输入码流,该参数值为3MB。其它分辨率时参数值可等量折算。
 - 视频解码图像Tmv缓存大小:H.264格式、1080P分辨率的输入码流,该参数值为0.5MB;H.265格式、1080P分辨率的输入码流,该参数值为1MB。其它分辨率时参数值可等量折算。
 - 参考帧数量:以最大参考帧个数为例,系统内部会根据实际码流的参考帧个数自适应。
 
每路VDEC解码的内存消耗计算公式
场景举例
内存消耗(单位为MB)
4MB + 输入码流缓存大小 * 2 + (解码图像帧存大小 + 视频解码图像Tmv缓存大小) * (参考帧数量 + 1 )
- 输入码流格式H.264
 - 输入码流分辨率1080P
 - 输入码流缓存大小为6M
 - 解码图像帧存大小为3MB
 - 视频解码图像Tmv缓存大小为0.5MB
 
51MB(参考帧数量9个)
26.5MB(参考帧数量2个)
- 输入码流格式H.265
 - 输入码流分辨率1080P
 - 输入码流缓存大小为6M
 - 解码图像帧存大小为3MB
 - 视频解码图像Tmv缓存大小为1MB
 
56MB(参考帧数量9个)
28MB(参考帧数量2个)
 - 关于解码路数与帧率的建议
 下表中给出的规格建议供参考,如果单进程内启动的路数超过下表中的建议,则可能出现内存不足或性能不够的问题,进而导致创建解码通道失败或执行解码缓慢。
- 720p指分辨率为1280 * 720的图片。
 - 1080p指分辨率为1920 * 1080的图片。
 - 4K指分辨率为3840 * 2160的图片。
 
典型分辨率
单进程内各启动路数时的规格建议(依据输入帧率得出)
-
输入帧率 ≥ 25fps
20fps < 输入帧率 < 25fps
15fps < 输入帧率 ≤ 20fps
10fps < 输入帧率 ≤ 15fps
输入帧率 ≤ 10fps
≤ 720p
32路
32路
32路
32路
32路
1080p
16路
19路
24路
32路
32路
4K
4路
4路
6路
8路
12路
 
性能指标说明(Atlas 推理系列产品 )
以下性能数据,基于以下Host服务器配置:CPU主频为Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz,CPU核心数为14。
场景举例  | 
总帧率  | 
|---|---|
720p * n路(1 ≤ n ≤ 12)  | 
n * 480fps  说明:  
针对 Atlas 300V 视频解析卡,当1 < n ≤ 12时,总帧率都为n * 400fps。  | 
720p * n路(n > 12)  | 
5760fps  说明:  
针对 Atlas 300V 视频解析卡,当n > 12时,总帧率都为4800fps。  | 
1080p * n路(1 ≤ n ≤ 12)  | 
n * 240fps  说明:  
针对 Atlas 300V 视频解析卡,当1 < n ≤ 12时,总帧率都为n * 200fps。  | 
1080p * n路(n > 12)  | 
2880fps  说明:  
针对 Atlas 300V 视频解析卡,当n > 12时,总帧率都为2400fps。  | 
4k * n路(1 ≤ n≤ 12)  | 
n * 60fps  | 
4k * n路(n > 12)  | 
720fps  | 
- 输入码流缓存大小:等于输入码流的宽 * 高 * 2。
 - 解码图像帧存大小:1080P分辨率的输入码流,该参数值为3MB。其它分辨率时参数值可等量折算。
 - 视频解码图像Tmv缓存大小。
- H.264格式、1080P分辨率的输入码流,该参数值为0.5MB。
 - H.265格式、1080P分辨率的输入码流,该参数值为1MB。
 
其它分辨率时参数值可等量折算。
 - 参考帧数量可由用户调用acl.media.vdec_set_channel_desc_ref_frame_num接口设置。
 - 解码后缓存图像帧数固定为2个。
 
每路VDEC解码的内存消耗计算公式  | 
场景举例  | 
内存消耗(单位为MB)  | 
|---|---|---|
6MB + 输入码流缓存大小 * 2 + (解码图像帧存大小 + 视频解码图像Tmv缓存大小) * (参考帧数量 + 解码后缓存图像帧数 +1 )  | 
  | 
52.5MB(参考帧数量8个) 31.5MB(参考帧数量2个)  | 
  | 
58MB(参考帧数量8个) 34MB(参考帧数量2个)  | 
性能指标说明(Atlas 训练系列产品 )
场景举例  | 
总帧率  | 
|---|---|
1080p * n路 * 4进程 (n ≤ 32)  | 
n * 30 * 4fps  | 
4k * n路 * 4进程 (n ≤ 8)  | 
n * 30 * 4fps  | 
- 输入码流缓存大小:1080P分辨率及以下的输入码流,输入码流缓存大小默认为6M;1080P分辨率以上的输入码流,输入码流缓存大小默认为9M。
 - 解码图像帧存大小:1080P分辨率的输入码流,该参数值为3MB。其它分辨率时参数值可等量折算。
 - 视频解码图像Tmv缓存大小:H.264格式、1080P分辨率的输入码流,该参数值为0.5MB;H.265格式、1080P分辨率的输入码流,该参数值为1MB。其它分辨率时参数值可等量折算。
 - 参考帧数量:以最大参考帧个数为例,系统内部会根据实际码流的参考帧个数自适应。
 
每路VDEC解码的内存消耗计算公式  | 
场景举例  | 
内存消耗(单位为MB)  | 
|---|---|---|
4MB + 输入码流缓存大小 * 2 + (解码图像帧存大小 + 视频解码图像Tmv缓存大小) * (参考帧数量 + 1 )  | 
  | 
51MB(参考帧数量9个) 26.5MB(参考帧数量2个)  | 
  | 
56MB(参考帧数量9个) 28MB(参考帧数量2个)  | 
性能指标说明(Atlas 200I/500 A2 推理产品 )
场景举例  | 
总帧率  | 
|---|---|
720p * n路(1 ≤ n ≤ 4)  | 
n * 600fps  | 
720p * n路(n > 4)  | 
2400fps  | 
1080p * n路(1 ≤ n ≤ 4)  | 
n * 300fps  | 
1080p * n路(n > 4)  | 
1200fps  | 
4k * n路(1 ≤ n ≤ 4)  | 
n * 75fps  | 
4k * n路(n > 4)  | 
300fps  | 
- 输入码流缓存大小:等于输入码流的宽 * 高 * 2。
 - 解码图像帧存大小:1080P分辨率的输入码流,该参数值为3MB。其它分辨率时参数值可等量折算。
 - 视频解码图像Tmv缓存大小:H.264格式、1080P分辨率的输入码流,该参数值为0.5MB;H.265格式、1080P分辨率的输入码流,该参数值为1MB。其它分辨率时参数值可等量折算。
 - 参考帧数量可由用户调用acl.media.vdec_set_channel_desc_ref_frame_num接口设置。
 - 解码后缓存图像帧数固定为2个。
 
每路VDEC解码的内存消耗计算公式  | 
场景举例  | 
内存消耗(单位为MB)  | 
|---|---|---|
16MB + 输入码流缓存大小 * 2 + (解码图像帧存大小 + 视频解码图像Tmv缓存大小) * (参考帧数量 + 解码后缓存图像帧数 +1 )  | 
  | 
52.5MB(参考帧数量8个) 31.5MB(参考帧数量2个)  | 
  | 
58MB(参考帧数量8个) 34MB(参考帧数量2个)  | 
性能指标说明(Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件 )
场景举例  | 
总帧率  | 
|---|---|
720p * n路(1 ≤ n ≤ 2)  | 
n * 480fps  | 
720p * n路(n>2)  | 
960fps  | 
1080p * n路(1 ≤ n ≤ 2)  | 
n * 240fps  | 
1080p * n路(n > 2)  | 
480fps  | 
4k * n路(1 ≤ n ≤ 2)  | 
n * 60fps  | 
4k * n路(n > 2)  | 
120fps  | 
- 输入码流缓存大小:等于输入码流的宽 * 高 * 2。
 - 解码图像帧存大小:1080P分辨率的输入码流,该参数值为3MB。其它分辨率时参数值可等量折算。
 - 视频解码图像Tmv缓存大小:
- H.264格式、1080P分辨率的输入码流,该参数值为0.5MB
 - H.265格式、1080P分辨率的输入码流,该参数值为1MB。
 
其它分辨率时参数值可等量折算。
 - 参考帧数量可由用户调用acl.media.vdec_set_channel_desc_ref_frame_num接口设置。
 - 解码后缓存图像帧数固定为2个。
 
每路VDEC解码的内存消耗计算公式  | 
场景举例  | 
内存消耗(单位为MB)  | 
|---|---|---|
6MB + 输入码流缓存大小 * 2 + (解码图像帧存大小 + 视频解码图像Tmv缓存大小) * (参考帧数量 + 解码后缓存图像帧数 +1 )  | 
  | 
52.5MB(参考帧数量8个) 31.5MB(参考帧数量2个)  | 
  | 
58MB(参考帧数量8个) 34MB(参考帧数量2个)  |