术语和缩略语

A

术语/缩略语

含义

AccDECS

Accelerator for Device Edge Cloud Synergy,端边云协同加速器。

ACP

Async Checkpoint Persistence,异步CheckPoint保存。

AscendCL

Ascend Computing Language,昇腾编程语言。

提供Device管理、Context管理、Stream管理、内存管理、模型加载与执行、算子加载与执行、媒体数据处理等C语言的API库供用户开发深度神经网络应用,用于实现目标识别、图像分类等功能。

AI

Artificial Intelligence,人工智能。

研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

AI CPU

主要用于AICPU算子的计算和确定性调度的任务。

AIPP

Artificial Intelligence Pre-Processing,AI预处理。AIPP用于在AI Core上完成图像预处理,包括改变图像尺寸、色域转换(转换图像格式)、减均值/乘系数(改变图像像素),数据处理之后再进行真正的模型推理。

AMP

Asymmetric multiprocessing,非对称多处理。

在这种架构下,存在多个处理器;每个中央处理器在某个特定时间内,被指定一个特定的任务去执行。

APIG

API Gateway,API网关。

Ascend EP

Ascend Endpoint,昇腾AI处理器作为终端节点(从控节点)。

主要功能是配合主设备(X86,ARM等各种Server),快速高效的处理推理、训练、图像识别等工作,例如PCIe加速卡。

Ascend RC

Ascend Root Complex,昇腾AI处理器作为根组件(主控节点)。

提供主机控制功能,主要应用于移动端侧,例如Atlas 200 DK。

ASLR

Address Space Layout Randomization,内存地址随机化机制。

ATC

Ascend Tensor Compiler,昇腾张量编译器。

  • 通过ATC,可以将开源框架的网络模型(如Caffe、TensorFlow等)转换成昇腾AI处理器支持的离线模型。模型转换过程中可以实现算子调度的优化、权值数据重排、内存使用优化等
  • 通过ATC,可以进行算子编译。

ARF

Air Refuelling,空中加油。

ARM

Advanced RISC Machine,高级精简指令集机器。

B

术语/缩略语

含义

Batch

模型训练的一次迭代(即一次梯度更新)中使用的样本集。

Batch size

模型迭代一次,使用的样本集的大小。

BIOS

Basic Input Output System,基本输入输出系统。

存于计算机主板上的一种固件。包括基本输入输出控制程序、上电自检程序、系统启动自举程序、系统设置信息,为计算机提供底层的硬件设置和控制功能。

Bus

总线,传输信号路径或信道。

C

术语/缩略语

含义

CA

Certificate Authority,数字证书认证机构。

签发证书、认证证书、管理已颁发证书的机构。

CANN

Compute Architecture for Neural Networks,AI异构计算架构。

CANN是针对AI场景推出的异构并行计算架构,通过提供多层次的编程接口,支持用户快速构建基于Ascend平台的AI应用和业务。

CC

Cluster Computing,集群计算。

CCAE

Cluster Computing Autonomous Engine,集群自智引擎。

集群运维管理单元,提供集群系统的整体资源、性能的展示,提供集群业务的智能分析,进行集群的检查,故障的定位等。

CNN

Convolutional Neural Network,卷积神经网络。

是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理。

Container

容器是一种操作系统虚拟化形式,可以使用一个容器来运行从小型微服务或软件进程到大型应用程序的所有内容。容器包含所有必要的可执行文件、二进制代码、库和配置文件。

CPU

Central Processing Unit,中央处理单元。

是计算机的主要设备之一,其功能是解释计算机指令以及处理计算机软件中的数据,与内部存储器、输入及输出设备成为现代电脑的三大部件。

CTRL CPU

Control CPU,用于外部通信、管理面以及非确定性调度的任务。

CRI

Container Runtime Interface,容器运行时接口。

CRD

Custom Resource Definitions,Kubernetes客户资源定义。

D

术语/缩略语

含义

DDP

Distributed Data Parallel,分布式训练。

同时利用一台或者多台机器上的GPU/NPU进行并行计算。

DECS

Device Edge Cloud Synergy,端边云协同。

Device

Device指安装了昇腾AI处理器的硬件设备,利用PCIe接口与Host侧连接,为Host提供NN计算能力。若存在多个Device,多个Device之间的内存资源不能共享。

DL

Deep Learning,深度学习。

是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

Docker

Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的Linux或Windows机器上,也可以实现虚拟化。

Dockerfile

Dockerfile是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。

Docker image

Docker image是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。

DP

Data Parallelism,数据并行。

DPC

Distributed Parallel Client,分布式并行客户端。

DSMI

Device System Manage Interface,设备系统管理接口。

DVPP

Digital Vision Pre-Processing,数字视觉预处理。

提供对特定格式的视频和图像的进行解码、缩放等预处理操作,以及对处理后的视频、图像进行编码再输出的能力。

大库检索/非精确搜索

基于IVF(Inverted File System)开发的,底库规模高于千万级别的检索库类型,当前支持IVFSQ算法。

底库保存/底库落盘

实现用户底库特征和索引保存在本地的功能,业务恢复时可以不用进行训练和建库操作。

底库恢复/底库加载

实现把已经保存的特征库和索引恢复到Ascend平台的功能。

底库删除

根据指定的索引,删除底库中该索引对应的特征向量,支持多条删除功能。

底库添加

底库添加是在现有的底库基础上添加新的特征数据到Ascend平台。

动态维度(ND格式)

为了支持Transformer等网络在输入格式的维度不确定的场景,需要支持ND格式下任意维度的动态设置。

ND表示支持任意格式,当前N ≤ 4。

动态Batch/动态分辨率

在某些场景下,模型每次输入的batch size或分辨率是不固定的,如检测出目标后再执行目标识别网络,由于目标个数不固定导致目标识别网络输入BatchSize不固定。

  • 动态Batch:用户执行推理时,其batch size是动态可变的。
  • 动态分辨率: 用户执行推理时,每张图片的分辨率H * W是动态可变的。

E

术语/缩略语

含义

ESN

Equipment Serial Number,设备序列号。

唯一标识设备的字符串,用以保证将License授权给指定设备的关键,又称“设备指纹”。

EP

Endpoint,终端节点。

EP是具有PCIe接口的网卡、SATA控制器等。

Epoch

数据集的一次完整遍历。

EULA

End User License Agreement,华为企业业务最终用户许可协议。

F

术语/缩略语

含义

Faiss

Facebook开源检索框架。

FLOPS

Floating-Point Operations Per Second,每秒所执行的浮点运算次数。

常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。

Framework

NN框架执行引擎。

包括开源主流框架TensorFlow、PyTorch、Caffe等,自研框架MindSpore。系统针对开源主流框架提供适配插件,从而可利用昇腾AI处理器加速计算能力。

FUSE

Filesystem in Userspace,用户空间文件系统。

FUSE是操作系统中的概念,指完全在用户态实现的文件系统。目前Linux通过内核模块对此进行支持。一些文件系统如ZFS,glusterfs和lustre使用FUSE实现。

G

术语/缩略语

含义

GDB

GNU Debugger,GNU调试器。

UNIX及UNIX-like下的命令行调试工具,可以执行程序、管理断点、检查变量赋值、调用函数等。

GE

Graph Engine,图引擎。

提供了Graph/Operator IR作为安全易用的构图接口集合,用户可以调用这些接口构建网络模型,设置模型所包含的图、图内的算子、以及模型和算子的属性。

GPU

Graphics Processing Unit,图形处理器。

GPU是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。

H

术语/缩略语

含义

HCCL

Huawei Collective Communication Library,华为集合通信库。

HCCL提供了深度学习训练场景中服务器间高性能集合通信的功能。

HPA

Horizontal Pod Autoscaler,Kubernetes Pod 水平自动扩缩。

Host

Host指与Device相连接的x86_64服务器、Arm服务器,会利用Device提供的NN(Neural-Network )计算能力,完成业务。

I

术语/缩略语

含义

ICS

Intellectual Collaborative Service,智能协同服务。

Index

AscendFaiss/Faiss封装的一组向量,可以通过此对象对这组向量进行管理并执行高效检索。

ISV

Independent Software Vendors,独立软件开发商。

J

术语/缩略语

含义

JPEGD

JPEG Decoder,JPEG图像解码器。

提供对JPEG格式的图像进行解码的能力。

JPEGE

JPEG Encoder,JPEG图像编码器。

提供对图像进行编码输出为JPEG格式的能力。

建库

建库是将数以百万、千万级特征底库添加到Ascend平台的操作。

K

术语/缩略语

含义

KMC

Key Management CBB,密钥管理组件。

为实现密钥管理的代码共享、简化开发而设计的密钥管理模块,该模块实现了密钥的加密保存、加密解密等基本功能,方便产品快速集成密钥功能。

KubeEdge

KubeEdge是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。云和边缘之间的部署和元数据同步。

Kubernetes

Kubernetes是用于自动部署、扩展和管理容器化(containerized)应用程序的开源系统。它旨在提供“跨主机集群的自动部署、扩展以及运行应用程序容器的平台”。

L

术语/缩略语

含义

LLM

Large Language Model,大语言模型。

Loss

损失,预测值与实际值的偏差,深度学习用于判断模型好坏的一个标准。

蓝图

用于实现单个应用的视图、模板、静态文件的集合。

M

术语/缩略语

含义

MemFS

内存文件系统。

MindIO

内存缓存系统,可以提升训练CheckPoint读写速度。

minio

基础对象存储服务组件。

MCU

microcontroller unit,微控制器单元。

N

术语/缩略语

含义

NN

Neural Network,神经网络。

在机器学习和认知科学领域,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。

NPU

Neural-Network Processing Unit,神经网络处理器单元。

采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体业数据,专门用于处理人工智能应用中的大量计算任务。

NUMA

Non-Uniform Memory Access,非一致内存访问。

是一种用于SMP系统的内存设计,内存访问时间取决于处理器的内存位置。在NUMA结构下,处理器访问它自己的本地内存的速度比非本地内存(另一个处理器的本地内存或处理器之间共享的内存)更快。

O

术语/缩略语

含义

OCI

Open Container Initiative,开放容器计划。

Linux基金会于2015年6月成立OCI组织,旨在围绕容器格式和运行时制定一个开放的工业化标准。

OCK

Open Computing Kit,开放计算套件。

om

offline model,离线模型。

onnx

Open Neural Network Exchange,开放神经网络交换。

OOM

Out Of Memory,内存不足。

OP

Operator,算子。

操作运算,比如AI的ReLU、Conv、Pooling、Scale、Softmax等。

OpenBLAS

OpenBLAS开源BLAS (Basic Linear Algebra Subprograms) 和LAPACK API数学计算包。

OpenPGP

Open Pretty Good Privacy,开放优良保密协议

PGP(Pretty Good Privacy)是一个加密程序,为数据通信提供了加密和验证功能。PGP通常用于签名、加密和解密文本、电子邮件和文件。OpenPGP是一种非专有协议,为加密消息、签名、私钥和用于交换公钥的证书定义了统一标准。

OPP

Operator Package,算子库。

OS

Operating System,操作系统。

OS

Optimizer State,优化器状态。

P

术语/缩略语

含义

PCIe

Peripheral Component Interconnect Express,快捷外围部件互连标准。

PCIe属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,主要支持主动电源管理,错误报告,端对端的可靠性传输,热插拔以及服务质量(QOS)等功能。

PNGD

PNG Decoder,PNG图像解码器。

提供对PNG格式的图像进行解码的能力。

Pod

Pod是Kubernetes中可以创建的最小部署单元,也是 Kubernetes REST API中的顶级资源类型。

Prometheus

Prometheus是一个开源系统,能够提供一套产品化的、用来量化管理技术、业务的解决方案。

Protobuf

Google开源数据序列化框架。

R

术语/缩略语

含义

RAM

Random Access Memory,随机存储器。

基于半导体的可被CPU或者其他硬件设备读写的内存。可以任何顺序访问存储位置。

RC

Root Complex,根组件。

在PCI Express(PCIe)系统中,根组件设备将处理器和存储器子系统连接到由一个或多个交换设备组成的PCI Express交换结构。类似于PCI系统中的主机桥,根组件代表处理器生成事务请求,处理器通过本地总线互连。根组件功能可以实现为分立设备,或者可以与处理器集成。

Runtime

Runtime运行于APP进程空间,为APP提供了针对昇腾AI处理器或BS9SX1A AI处理器SoC设备的Memory管理、Device管理、Stream管理、Event管理、Kernel执行等功能。

runC

runC是一个根据OCI(Open Container Initiative)标准创建并运行容器的client工具。

S

术语/缩略语

含义

SDK

Software Development Kit,软件开发工具包。

一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。

SMP

Symmetric Multi-Processing,对称多处理技术。

是指在一台计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。操作系统必须支持多任务和多线程处理,以使得SMP系统发挥高效的性能。数据库领域的SMP并行技术,一般指利用多线程技术实现查询的并行执行,以充分利用CPU资源,从而提升查询性能。

SoC

System on Chip,片上系统。

这是ENP成本低的关键技术,通过强大的芯片技术能力,把一个交换机单板的包转发功能全部集成到了一个芯片中,获得了软件灵活性+交换机的低成本。

SSL

Secure Sockets Layer,安全套接层。

工作于套接字层的安全协议。该层位于TCP层和应用层之间,用于数据的加解密以及相关实体的认证。

Stream

Stream用于维护一些异步操作的执行顺序,确保按照应用程序中的代码调用顺序在Device上执行。

spine-leaf

叶脊网络架构。在leaf-spine架构中有两个重要组件,leaf(叶)交换机和spine(脊)交换机。 其中spine交换机可以当做传统三层架构中的核心交换机,这里的spine交换机不再是三层架构中的大型机箱式交换机,而是高端口密度的交换机。而leaf交换机就是接入层,leaf交换机提供网络连接给终端、服务器,同时上联给spine交换机。 leaf-spine拓扑网络结构主要为解决数据中心内流量的快速增长和数据中心规模的不断扩大,满足传统的三层网络拓扑结构不能满足的数据中心内部高速互连的需求。

T

术语/缩略语

含义

TBE

Tensor Boost Engine,张量加速引擎。

提供通过Python语言实现算子的接口,能够编译生成CCE算子。

TCP

Transmission Control Protocol,传输控制协议。

Tensor

张量。

TensorFlow程序中的主要数据结构。张量是N维(其中N可能非常大)数据结构,最常见的是标量、向量或矩阵。张量的元素可以包含整数值、浮点值或字符串值。

TFT

Training Fault Tolerance,训练容错框架。

TOPS

Trillion operations per second,每秒万亿次的运算。

用于衡量CPU、GPU、NPU的计算能力。

TLS

Transport Layer Security,传输层安全性协议。

TTP

Try To Persist,临终CheckPoint保存。

特征向量查询

用户输入待查询的特征向量后,大小库检索将待查询的特征向量,与底库中的向量进行距离计算并选取相似度最高的Top K个结果返回,从而完成一次特征向量的检索。

特征检索(FeatureRetrieval/AscendFaiss)

昇腾平台上基于Faiss开源相似度检索框架的异构检索组件。

同步/异步

Vision SDK中提及的同步、异步是站在调用者和执行者的角度,在当前场景下,若在调用接口后不等待Device执行完成再返回,则表示调度是异步的;若在调用接口后需等待Device执行完成再返回,则表示调度是同步的。

通道

在RGB色彩模式下,图像通道就是指单独的红色R、绿色G、蓝色B部分。也就是说,一幅完整的图像,是由红色绿色蓝色三个通道组成的,它们共同作用产生了完整的图像。同样在HSV色系中指的是色调H,饱和度S,亮度V三个通道。

U

术语/缩略语

含义

UCE

Uncorrectable Memory Error,不可纠正内存错误。

UUID

Universally Unique Identifier,通用唯一识别码。

通用唯一识别码是一个软件建构的标准,也是被开源软件基金会 (Open Software Foundation, OSF) 的组织应用在分布式计算环境 (Distributed Computing Environment, DCE) 领域的一部份。

V

术语/缩略语

含义

vcjob

Volcano Job,Kubernetes中的Volcano任务。

VDEC

Video Decoder,视频解码器。

提供对特定格式的视频进行解码的能力。

VENC

Video Encoder,视频编码器。

提供对特定格式的视频进行编码的能力。

VECTOR

向量运算。

VPC

Vision Preprocessing Core,视觉预处理核心。

提供对图像进行缩放、色域转换、降bit数处理、存储格式转换、区块切割转换等能力。

W

术语/缩略语

含义

WFE

WorkFlow Engine,工作流引擎。

X

术语/缩略语

含义

小库检索/精确搜索

全局遍历的,底库规模通常在30万~100万条的检索库类型,当前支持Flat/SQ/INT8等暴力搜索算法。

Y

术语/缩略语

含义

YUV

Luminance-Chrominance,明亮度-带宽-色度。

Y表示明亮度(Luminance),即灰阶值,U和V表示色度(Chrominance),描述影像色彩及饱和度,用于指定像素的颜色。

Z

术语/缩略语

含义

ZeRO

Zero Redundancy Optimizer,零冗余优化器