API列表
同步与内存栅栏
接口名 |
功能描述 |
|---|---|
等待当前thread block内所有thread代码都执行到该函数位置。 |
接口名 |
功能描述 |
|---|---|
用于保证不同核对同一份全局、共享内存的访问过程中,写入操作的时序性。 |
|
用于协调同一线程块(Thread Block)内线程之间的内存操作顺序,确保某一线程在调用asc_threadfence_block()之前的所有内存读写操作对同一线程块内的其他线程可见。 |
原子操作
接口名 |
功能描述 |
|---|---|
对Unified Buffer或Global Memory上的数据与指定数据执行原子加操作,即将指定数据累加到Unified Buffer或Global Memory的数据中。 |
|
对Unified Buffer或Global Memory上的数据与指定数据执行原子减操作,即在Unified Buffer或Global Memory的数据上减去指定数据。 |
|
对Unified Buffer或Global Memory地址做原子赋值操作,即将指定数据赋值到Unified Buffer或Global Memory地址中。 |
|
对Unified Buffer或Global Memory数据做原子求最大值操作,即将Unified Buffer或Global Memory的数据与指定数据中的最大值赋值到Unified Buffer或Global Memory地址中。 |
|
对Unified Buffer或Global Memory数据做原子求最小值操作,即将Unified Buffer或Global Memory的数据与指定数据中的最小值赋值到Unified Buffer或Global Memory地址中。 |
|
对Unified Buffer或Global Memory上address的数值进行原子加1操作,如果address上的数值大于等于指定数值val,则对address赋值为0,否则将address上数值加1。 |
|
对Unified Buffer或Global Memory上address的数值进行原子减1操作,如果address上的数值等于0或大于指定数值val,则对address赋值为val,否则将address上数值减1。 |
|
对Unified Buffer或Global Memory上address的数值进行原子比较赋值操作,如果address上的数值等于指定数值compare,则对address赋值为指定数值val,否则address的数值不变。 |
|
对Unified Buffer或Global Memory上address的数值与指定数值val进行原子与(&)操作,即将address数值与(&)val的结果赋值到Unified Buffer或Global Memory上。 |
|
对Unified Buffer或Global Memory上address的数值与指定数值val进行原子或(|)操作,即将address数值或(|)val的结果赋值到Unified Buffer或Global Memory上。 |
|
对Unified Buffer或Global Memory上address的数值与指定数值val进行原子异或(^)操作,即将address数值异或(^)val的结果赋值到Unified Buffer或Global Memory上。 |
Warp函数
接口名 |
功能描述 |
|---|---|
判断是否所有活跃线程的输入均不为0。 |
|
判断是否有活跃线程的输入不为0。 |
|
判断Warp内每个活跃线程的输入是否不为0。 |
|
查看Warp内所有线程是否为活跃状态。 |
接口名 |
功能描述 |
|---|---|
获取Warp内指定线程srcLane输入的用于交换的var值。 |
|
获取Warp内当前线程向前偏移delta(当前线程LaneId-delta)的线程输入的用于交换的var值。 |
|
获取Warp内当前线程向后偏移delta(当前线程LaneId+delta)的线程输入的用于交换的var值。 |
|
获取Warp内当前线程LaneId与输入laneMask做异或操作(LaneId^laneMask)得到的dstLaneId对应线程输入的用于交换的var值。 |
接口名 |
功能描述 |
|---|---|
对Warp内所有活跃线程输入的val求和。 |
|
对Warp内所有活跃线程输入的val求最大值。 |
|
对Warp内所有活跃线程输入val求最小值。 |
数学函数
接口名 |
功能描述 |
|---|---|
获取输入数据的绝对值。 |
|
对输入数据x、y、z,计算x与y相乘加上z的结果。 |
|
计算两个half类型数据的相加结果,并遵循CAST_RINT模式舍入。 |
|
计算两个half类型数据的相减结果,并遵循CAST_RINT模式舍入。 |
|
计算两个half类型数据的相乘结果,并遵循CAST_RINT模式舍入。 |
|
计算两个half类型数据的相除结果,并遵循CAST_RINT模式舍入。 |
|
获取输入half类型数据的负值。 |
|
对输入half类型数据x、y、z,计算x与y相乘加上z的结果,并遵循CAST_RINT模式舍入。负数结果置为0。 |
接口名 |
功能描述 |
|---|---|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最小值。 |
|
判断浮点数是否为nan。 |
|
判断浮点数是否为无穷。 |
|
比较两个half类型数据是否相等,相等时返回true。 |
|
比较两个half类型数据是否不相等,不相等时返回true。 |
|
比较两个half类型数据,仅当第一个数小于或等于第二个数时返回true。 |
|
比较两个half类型数据,仅当第一个数大于或等于第二个数时返回true。 |
|
比较两个half类型数据,仅当第一个数小于第二个数时返回true。 |
|
比较两个half类型数据,仅当第一个数大于第二个数时返回true。 |
|
比较两个half类型数据是否相等,相等时返回true。若任一输入为nan,返回true。 |
|
比较两个half类型数据是否不相等,不相等时返回true。若任一输入为nan,返回true。 |
|
比较两个half类型数据,当第一个数小于或等于第二个数时返回true。若任一输入为nan,返回true。 |
|
比较两个half类型数据,当第一个数大于或等于第二个数时返回true。若任一输入为nan,返回true。 |
|
比较两个half类型数据,当第一个数小于第二个数时返回true。若任一输入为nan,返回true。 |
|
比较两个half类型数据,当第一个数大于第二个数时返回true。若任一输入为nan,返回true。 |
|
获取两个输入数据中的最大值。任一输入为nan时返回nan。 |
|
获取两个输入数据中的最小值。任一输入为nan时返回nan。 |
接口名 |
功能描述 |
|---|---|
获取输入数据的三角函数双曲正切值。 |
|
指定输入x,获取e的x次方。 |
|
指定输入x,获取2的x次方。 |
|
指定输入x,获取10的x次方。 |
|
获取以e为底,输入数据的对数。 |
|
获取以2为底,输入数据的对数。 |
|
获取以10为底,输入数据的对数。 |
|
获取输入数据的三角函数余弦值。 |
|
获取输入数据的三角函数正弦值。 |
|
获取输入数据x的平方根。 |
|
获取输入数据x的平方根的倒数。 |
|
获取输入数据x的倒数。 |
|
获取与输入数据最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取小于或等于输入数据的最大整数值。 |
|
获取大于或等于输入数据的最小整数值。 |
|
获取对输入数据的浮点数截断后的整数。 |
接口名 |
功能描述 |
|---|---|
获取输入遵循CAST_RINT模式转换成的半精度浮点数。 |
|
获取输入遵循CAST_RINT模式转换成的半精度浮点数。 |
|
饱和模式下获取输入遵循CAST_RINT模式转换成的半精度浮点数。 |
|
饱和模式下获取输入的两个分量遵循CAST_RINT模式转换成的half2类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的半精度浮点数。 |
|
饱和模式下获取输入遵循CAST_TRUNC模式转换成的半精度浮点数。 |
|
获取输入的两个分量遵循CAST_TRUNC模式转换成的half2类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_TRUNC模式转换成的half2类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的半精度浮点数。 |
|
饱和模式下获取输入遵循CAST_FLOOR模式转换成的半精度浮点数。 |
|
获取输入的两个分量遵循CAST_FLOOR模式转换成的half2类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_FLOOR模式转换成的half2类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的半精度浮点数。 |
|
饱和模式下获取输入遵循CAST_CEIL模式转换成的半精度浮点数。 |
|
获取输入的两个分量遵循CAST_CEIL模式转换成的half2类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_CEIL模式转换成的half2类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的半精度浮点数。 |
|
饱和模式下获取输入遵循CAST_ROUND模式转换成的半精度浮点数。 |
|
获取输入的两个分量遵循CAST_ROUND模式转换成的half2类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_ROUND模式转换成的half2类型数据。 |
|
获取输入遵循CAST_ODD模式转换成的半精度浮点数。 |
|
饱和模式下获取输入遵循CAST_ODD模式转换成的半精度浮点数。 |
|
获取输入的两个分量遵循CAST_ODD模式转换成的half2类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_ODD模式转换成的half2类型数据。 |
|
获取输入转换成的浮点数。 |
|
获取输入遵循CAST_RINT模式取整后的half类型数据。 |
|
获取输入遵循CAST_TRUNC模式取整后的half类型数据。 |
|
获取输入遵循CAST_FLOOR模式取整后的half类型数据。 |
|
获取输入遵循CAST_CEIL模式取整后的half类型数据。 |
|
获取输入遵循CAST_ROUND模式取整后的half类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的无符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的无符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的无符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的无符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的无符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的有符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的有符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的有符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的有符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的有符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的half类型数据。 |
|
饱和模式下获取输入遵循CAST_RINT模式转换成的half类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的half类型数据。 |
|
饱和模式下获取输入遵循CAST_TRUNC模式转换成的half类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的half类型数据。 |
|
饱和模式下获取输入遵循CAST_FLOOR模式转换成的half类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的half类型数据。 |
|
饱和模式下获取输入遵循CAST_CEIL模式转换成的half类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的half类型数据。 |
|
饱和模式下获取输入遵循CAST_ROUND模式转换成的half类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的half类型数据。 |
|
饱和模式下获取输入的uint32数据转换成的half数据,并遵循CAST_RINT模式。 |
|
获取输入遵循CAST_TRUNC模式转换成的half类型数据。 |
|
饱和模式下获取输入的uint32数据转换成的half数据,并遵循CAST_TRUNC模式。 |
|
获取输入遵循CAST_FLOOR模式转换成的half类型数据。 |
|
饱和模式下获取输入的uint32数据转换成的half数据,并遵循CAST_FLOOR模式。 |
|
获取输入遵循CAST_CEIL模式转换成的half类型数据。 |
|
饱和模式下获取输入的uint32数据转换成的half数据,并遵循CAST_CEIL模式。 |
|
获取输入遵循CAST_ROUND模式转换成的half类型数据。 |
|
饱和模式下获取输入的uint32数据转换成的half数据,并遵循CAST_ROUND模式。 |
|
获取输入遵循CAST_RINT模式转换成的half类型数据。 |
|
饱和模式下获取输入的int32数据转换成的half数据,并遵循CAST_RINT模式。 |
|
获取输入遵循CAST_TRUNC模式转换成的half类型数据。 |
|
饱和模式下获取输入的int32数据转换成的half数据,并遵循CAST_TRUNC模式。 |
|
获取输入遵循CAST_FLOOR模式转换成的half类型数据。 |
|
饱和模式下获取输入的int32数据转换成的half数据,并遵循CAST_FLOOR模式。 |
|
获取输入遵循CAST_CEIL模式转换成的half类型数据。 |
|
饱和模式下获取输入的int32数据转换成的half数据,并遵循CAST_CEIL模式。 |
|
获取输入遵循CAST_ROUND模式转换成的half类型数据。 |
|
饱和模式下获取输入的int32数据转换成的half数据,并遵循CAST_ROUND模式。 |
|
获取输入遵循CAST_RINT模式转换成的half类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的half类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的half类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的half类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的half类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的half类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的half类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的half类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的half类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的half类型数据。 |
|
将输入的数据x,y遵循CAST_RINT模式分别转换为bfloat16类型并填充到half2的前后两部分,返回转换后的half2类型数据。 |
|
将float2类型数据遵循CAST_RINT模式转换为half2类型,返回转换后的half2类型数据。 |
|
返回输入数据的低16位。 |
|
将输入数据的低16位填充到half2并返回。 |
|
将输入数据的低16位转换为浮点数并返回结果。 |
|
将输入数据的高低16位进行交换并返回。 |
|
提取输入half2的高16位,并返回 |
|
将输入数据的高16位填充到half2并返回结果。 |
|
将输入数据的高16位转换为float类型并返回结果。 |
|
分别提取两个half2输入的高16位,并填充到half2中。返回填充后的数据。 |
|
分别提取两个half2输入的低16位,并填充到half2中。返回填充后的数据。 |
|
将输入的数据分别填充为half2前后两个分量,返回填充后数据。 |
|
将half2的两个分量分别转换为float,并填充到float2返回。 |
|
将unsigned short int的按位重新解释为half,即将unsigned short int的数据存储的位按照half的格式进行读取。 |
接口名 |
功能描述 |
|---|---|
计算两个half2类型数据各分量的相加结果,并遵循CAST_RINT模式舍入。 |
|
计算两个half2类型数据各分量的相减结果,并遵循CAST_RINT模式舍入。 |
|
计算两个half2类型数据各分量的相乘结果,并遵循CAST_RINT模式舍入。 |
|
计算两个half2类型数据各分量的相除结果,并遵循CAST_RINT模式舍入。 |
|
计算输入half2类型数据各分量的绝对值。 |
|
计算两个half2类型数据各分量的乘加的结果(前两个输入相乘后与第三个输入相加),并遵循CAST_RINT模式舍入。 |
|
获取输入half2类型数据各分量的负值。 |
|
计算两个half2类型数据各分量的乘加的结果(前两个输入相乘后与第三个输入相加),并遵循CAST_RINT模式舍入。负数结果置为0。 |
|
将三个half2输入视为复数(第一个分量为实部,第二个分量为虚部),执行复数乘加运算x*y+z。 |
接口名 |
功能描述 |
|---|---|
比较两个half2类型数据的两个分量是否相等,仅当两个分量均相等时返回true。 |
|
比较两个half2类型数据的两个分量是否不相等,仅当两个分量均不相等时返回true。 |
|
比较两个half2类型数据的两个分量,仅当两个分量均满足第一个数小于或等于第二个数时返回true。 |
|
比较两个half2类型数据的两个分量,仅当两个分量均满足第一个数大于或等于第二个数时返回true。 |
|
比较两个half2类型数据的两个分量,仅当两个分量均满足第一个数小于第二个数时返回true。 |
|
比较两个half2类型数据的两个分量,仅当两个分量均满足第一个数大于第二个数时返回true。 |
|
比较两个half2类型数据的两个分量是否相等,当两个分量均相等时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个half2类型数据的两个分量是否不相等,当两个分量均不相等时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个half2类型数据的两个分量,当两个分量均满足第一个数小于或等于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个half2类型数据的两个分量,当两个分量均满足第一个数大于或等于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个half2类型数据的两个分量,当两个分量均满足第一个数小于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个half2类型数据的两个分量,当两个分量均满足第一个数大于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个half2类型数据的两个分量,如果分量相等,则对应比较结果为1.0,否则为0.0。 |
|
比较两个half2类型数据的两个分量,如果分量不相等,则对应比较结果为1.0,否则为0.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数小于或等于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数大于或等于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数小于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数大于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个half2类型数据的两个分量,如果分量相等,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个half2类型数据的两个分量,如果分量不相等,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数小于或等于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数大于或等于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数小于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个half2类型数据的两个分量,如果分量满足第一个数大于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量相等,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量不相等,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量相等,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量不相等,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个half2类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
判断half2类型数据的两个分量是否为nan。 |
|
获取两个half2类型数据各分量的最大值。 |
|
获取两个half2类型数据各分量的最大值。任一分量为nan时对应结果为nan。 |
|
获取两个half2类型数据各分量的最小值。 |
|
获取两个half2类型数据各分量的最小值。任一分量为nan时对应结果为nan。 |
接口名 |
功能描述 |
|---|---|
获取输入数据各元素的三角函数双曲正切值。 |
|
指定输入x,对x的各元素,获取e的该元素次方。 |
|
指定输入x,对x的各元素,获取2的该元素次方。 |
|
指定输入x,对x的各元素,获取10的该元素次方。 |
|
获取以e为底,输入数据各元素的对数。 |
|
获取以2为底,输入数据各元素的对数。 |
|
获取以10为底,输入数据各元素的对数。 |
|
获取输入数据各元素的三角函数余弦值。 |
|
获取输入数据各元素的三角函数正弦值。 |
|
获取输入数据x各元素的平方根。 |
|
获取输入数据x各元素的平方根的倒数。 |
|
获取输入数据x各元素的倒数。 |
|
获取与输入数据各元素最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取小于或等于输入数据各元素的最大整数值。 |
|
获取大于或等于输入数据各元素的最小整数值。 |
|
获取对输入数据各元素的浮点数截断后的整数。 |
接口名 |
功能描述 |
|---|---|
获取输入数据的绝对值。 |
|
对输入数据x、y、z,计算x与y相乘加上z的结果。 |
|
计算两个bfloat16类型数据的相加结果,并遵循CAST_RINT模式舍入。 |
|
计算两个bfloat16类型数据的相减结果,并遵循CAST_RINT模式舍入。 |
|
计算两个bfloat16类型数据的相乘结果,并遵循CAST_RINT模式舍入。 |
|
计算两个bfloat16类型数据的相除结果,并遵循CAST_RINT模式舍入。 |
|
获取输入bfloat16类型数据的负值。 |
|
对输入bfloat16类型数据x、y、z,计算x与y相乘加上z的结果,并遵循CAST_RINT模式舍入。负数结果置为0。 |
接口名 |
功能描述 |
|---|---|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最小值。 |
|
判断浮点数是否为nan。 |
|
判断浮点数是否为无穷。 |
|
比较两个bfloat16类型数据是否相等,相等时返回true。 |
|
比较两个bfloat16类型数据是否不相等,不相等时返回true。 |
|
比较两个bfloat16类型数据,仅当第一个数小于或等于第二个数时返回true。 |
|
比较两个bfloat16类型数据,仅当第一个数大于或等于第二个数时返回true。 |
|
比较两个bfloat16类型数据,仅当第一个数小于第二个数时返回true。 |
|
比较两个bfloat16类型数据,仅当第一个数大于第二个数时返回true。 |
|
比较两个bfloat16类型数据是否相等,相等时返回true。若任一输入为nan,返回true。 |
|
比较两个bfloat16类型数据是否不相等,不相等时返回true。若任一输入为nan,返回true。 |
|
比较两个bfloat16类型数据,当第一个数小于或等于第二个数时返回true。若任一输入为nan,返回true。 |
|
比较两个bfloat16类型数据,当第一个数大于或等于第二个数时返回true。若任一输入为nan,返回true。 |
|
比较两个bfloat16类型数据,当第一个数小于第二个数时返回true。若任一输入为nan,返回true。 |
|
比较两个bfloat16类型数据,当第一个数大于第二个数时返回true。若任一输入为nan,返回true。 |
|
获取两个输入数据中的最大值。任一输入为nan时返回nan。 |
|
获取两个输入数据中的最小值。任一输入为nan时返回nan。 |
接口名 |
功能描述 |
|---|---|
获取输入数据的三角函数双曲正切值。 |
|
指定输入x,获取e的x次方。 |
|
指定输入x,获取2的x次方。 |
|
指定输入x,获取10的x次方。 |
|
获取以e为底,输入数据的对数。 |
|
获取以2为底,输入数据的对数。 |
|
获取以10为底,输入数据的对数。 |
|
获取输入数据的三角函数余弦值。 |
|
获取输入数据的三角函数正弦值。 |
|
获取输入数据x的平方根。 |
|
获取输入数据x的平方根的倒数。 |
|
获取输入数据x的倒数。 |
|
获取与输入数据最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取小于或等于输入数据的最大整数值。 |
|
获取大于或等于输入数据的最小整数值。 |
|
获取对输入数据的浮点数截断后的整数。 |
接口名 |
功能描述 |
|---|---|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
饱和模式下获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_RINT模式转换成的bfloat16x2_t类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
饱和模式下获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
获取输入的两个分量遵循CAST_TRUNC模式转换成的bfloat16x2_t类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_TRUNC模式转换成的bfloat16x2_t类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
饱和模式下获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
获取输入的两个分量遵循CAST_FLOOR模式转换成的bfloat16x2_t类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_FLOOR模式转换成的bfloat16x2_t类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
饱和模式下获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
获取输入的两个分量遵循CAST_CEIL模式转换成的bfloat16x2_t类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_CEIL模式转换成的bfloat16x2_t类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
饱和模式下获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
获取输入的两个分量遵循CAST_ROUND模式转换成的bfloat16x2_t类型数据。 |
|
饱和模式下获取输入的两个分量遵循CAST_ROUND模式转换成的bfloat16x2_t类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
获取输入转换为浮点数的结果。 |
|
获取输入遵循CAST_RINT模式取整后的bfloat16_t类型数据。 |
|
获取输入遵循CAST_TRUNC模式取整后的bfloat16_t类型数据。 |
|
获取输入遵循CAST_FLOOR模式取整后的bfloat16_t类型数据。 |
|
获取输入遵循CAST_CEIL模式取整后的bfloat16_t类型数据。 |
|
获取输入遵循CAST_ROUND模式取整后的bfloat16_t类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的无符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的无符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的无符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的无符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的无符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的有符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的有符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的有符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的有符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的有符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_RINT模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_TRUNC模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_FLOOR模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_CEIL模式转换成的bfloat16类型数据。 |
|
获取输入遵循CAST_ROUND模式转换成的bfloat16类型数据。 |
|
将float类型数据遵循CAST_RINT模式转换为bfloat16类型并填充到bfloat16x2的前后两部分,返回填充后的bfloat16x2类型数据。 |
|
将输入的数据x,y遵循CAST_RINT模式分别转换为bfloat16类型并填充到bfloat16x2的前后两部分,返回转换后的bfloat16x2类型数据。 |
|
将float2类型数据遵循CAST_RINT模式转换为bfloat16x2类型,返回转换后的bfloat16x2类型数据。 |
|
将输入的数据的填充为bfloat16x2前后两个分量,返回转换后的bfloat16x2类型数据。 |
|
将输入的数据分别填充为bfloat16x2前后两个分量,返回填充后数据。 |
|
提取输入bfloat16x2的高16位,并返回。 |
|
将输入数据的高16位填充到bfloat16x2并返回结果。 |
|
将输入数据的高16位转换为float类型并返回结果。 |
|
分别提取两个bfloat162输入的高16位,并填充到bfloat162中。返回填充后的数据。 |
|
返回输入数据的低16位。 |
|
将输入数据的低16位填充到bfloat16x2并返回。 |
|
将输入数据的低16位转换为浮点数并返回结果。 |
|
将输入数据的高低16位进行交换并返回。 |
|
分别提取两个bfloat162输入的低16位,并填充到bfloat162中。返回填充后的数据。 |
|
将bfloat16x2的两个分量分别转换为float,并填充到float2返回。 |
|
将unsigned short int的按位重新解释为bfloat16,即将unsigned short int的数据存储的位按照bfloat16的格式进行读取。 |
接口名 |
功能描述 |
|---|---|
计算两个bfloat16x2_t类型数据各分量的相加结果,并遵循CAST_RINT模式舍入。 |
|
计算两个bfloat16x2_t类型数据各分量的相减结果,并遵循CAST_RINT模式舍入。 |
|
计算两个bfloat16x2_t类型数据各分量的相乘结果,并遵循CAST_RINT模式舍入。 |
|
计算两个bfloat16x2_t类型数据各分量的相除结果,并遵循CAST_RINT模式舍入。 |
|
计算输入bfloat16x2_t类型数据各分量的绝对值。 |
|
计算两个bfloat16x2_t类型数据各分量的乘加的结果(前两个输入相乘后与第三个输入相加),并遵循CAST_RINT模式舍入。 |
|
获取输入bfloat16x2_t类型数据各分量的负值。 |
|
计算两个bfloat16x2_t类型数据各分量的乘加的结果(前两个输入相乘后与第三个输入相加),并遵循CAST_RINT模式舍入。负数结果置为0。 |
|
将三个bfloat16x2_t输入视为复数(第一个分量为实部,第二个分量为虚部),执行复数乘加运算x*y+z。 |
接口名 |
功能描述 |
|---|---|
比较两个bfloat16x2_t类型数据的两个分量是否相等,仅当两个分量均相等时返回true。 |
|
比较两个bfloat16x2_t类型数据的两个分量是否不相等,仅当两个分量均不相等时返回true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,仅当两个分量均满足第一个数小于或等于第二个数时返回true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,仅当两个分量均满足第一个数大于或等于第二个数时返回true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,仅当两个分量均满足第一个数小于第二个数时返回true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,仅当两个分量均满足第一个数大于第二个数时返回true。 |
|
比较两个bfloat16x2_t类型数据的两个分量是否相等,当两个分量均相等时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个bfloat16x2_t类型数据的两个分量是否不相等,当两个分量均不相等时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,当两个分量均满足第一个数小于或等于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,当两个分量均满足第一个数大于或等于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,当两个分量均满足第一个数小于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,当两个分量均满足第一个数大于第二个数时返回true。若任一输入的分量为nan,该分量的比较结果为true。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量相等,则对应比较结果为1.0,否则为0.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量不相等,则对应比较结果为1.0,否则为0.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数小于或等于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数大于或等于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数小于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数大于第二个数,则对应比较结果为1.0,否则为0.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量相等,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量不相等,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数小于或等于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数大于或等于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数小于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,如果分量满足第一个数大于第二个数,则对应比较结果为1.0,否则为0.0。若任一输入的分量为nan,该分量的比较结果为1.0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量相等,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量不相等,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于第二个数,则对应16位掩码为0xFFFF,否则为0x0。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量相等,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量不相等,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于或等于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数小于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
比较两个bfloat16x2_t类型数据的两个分量,结果以unsigned int形式返回,低16位为第一个分量的掩码结果,高16位为第二个分量的掩码结果。如果分量满足第一个数大于第二个数,则对应16位掩码为0xFFFF,否则为0x0。若任一输入的分量为nan,对应16位掩码为0xFFFF。 |
|
判断bfloat16x2_t类型数据的两个分量是否为nan。 |
|
获取两个bfloat16x2_t类型数据各分量的最大值。 |
|
获取两个bfloat16x2_t类型数据各分量的最大值。任一分量为nan时对应结果为nan。 |
|
获取两个bfloat16x2_t类型数据各分量的最小值。 |
|
获取两个bfloat16x2_t类型数据各分量的最小值。任一分量为nan时对应结果为nan。 |
接口名 |
功能描述 |
|---|---|
获取输入数据各元素的三角函数双曲正切值。 |
|
指定输入x,对x的各元素,获取e的该元素次方。 |
|
指定输入x,对x的各元素,获取2的该元素次方。 |
|
指定输入x,对x的各元素,获取10的该元素次方。 |
|
获取以e为底,输入数据各元素的对数。 |
|
获取以2为底,输入数据各元素的对数。 |
|
获取以10为底,输入数据各元素的对数。 |
|
获取输入数据各元素的三角函数余弦值。 |
|
获取输入数据各元素的三角函数正弦值。 |
|
获取输入数据x各元素的平方根。 |
|
获取输入数据x各元素的平方根的倒数。 |
|
获取输入数据x各元素的倒数。 |
|
获取与输入数据各元素最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取小于或等于输入数据各元素的最大整数值。 |
|
获取大于或等于输入数据各元素的最小整数值。 |
|
获取对输入数据各元素的浮点数截断后的整数。 |
接口名 |
功能描述 |
|---|---|
获取输入数据的三角函数正切值。 |
|
获取输入数据的三角函数双曲正切值。 |
|
获取输入数据与π相乘的正切值。 |
|
获取输入数据的反正切值。 |
|
获取输入数据y/x的反正切值。 |
|
获取输入数据的反双曲正切值。 |
|
指定输入x,获取e的x次方。 |
|
指定输入x,获取2的x次方。 |
|
指定输入x,获取10的x次方。 |
|
指定输入x,获取e的x次方减1。 |
|
获取以e为底,输入数据的对数。 |
|
获取以2为底,输入数据的对数。 |
|
获取以10为底,输入数据的对数。 |
|
获取以e为底,输入数据加1的对数。 |
|
计算以2为底,输入数据的对数,并对结果向下取整,返回浮点数。 |
|
计算以2为底,输入数据的对数,并对结果向下取整,返回整数。 |
|
获取输入数据的三角函数余弦值。 |
|
获取输入数据的双曲余弦值。 |
|
获取输入数据与π相乘的余弦值。 |
|
获取输入数据的反余弦值。 |
|
获取输入数据的双曲反余弦值。 |
|
获取输入数据的三角函数正弦值。 |
|
获取输入数据的双曲正弦值。 |
|
获取输入数据与π相乘的正弦值。 |
|
获取输入数据的反正弦值。 |
|
获取输入数据的双曲反正弦值。 |
|
获取输入数据的三角函数正弦值和余弦值。 |
|
获取输入数据与π相乘的三角函数正弦值和余弦值。 |
|
将x转换为归一化[1/2, 1)的有符号数乘以2的积分幂。 |
|
获取输入x乘以2的exp次幂的结果。 |
|
获取输入数据x的平方根。 |
|
获取输入数据x的平方根的倒数。 |
|
获取输入数据x、y的平方和x^2 + y^2的平方根。 |
|
获取输入数据x、y的平方和x^2 + y^2的平方根的倒数。 |
|
获取输入数据x的y次幂。 |
|
获取输入数据a、b、c的平方和a^2 + b^2 + c^2的平方根。 |
|
获取输入数据a、b、c的平方和a^2 + b^2 + c^2的平方根的倒数。 |
|
获取输入数据a、b、c、d的平方和a^2 + b^2+ c^2+ d^2的平方根。 |
|
获取输入数据a、b、c、d的平方和a^2 + b^2 + c^2 + d^2的平方根的倒数。 |
|
获取输入数据a中前n个元素的平方和a[0]^2 + a[1]^2 +...+ a[n-1]^2的平方根。 |
|
获取输入数据a中前n个元素的平方和a[0]^2 + a[1]^2 + ...+ a[n-1]^2的平方根的倒数。 |
|
获取输入数据x的立方根。 |
|
获取输入数据x的立方根的倒数。 |
|
获取输入数据的误差函数值。 |
|
获取输入数据的互补误差函数值。 |
|
获取输入数据的逆误差函数值。 |
|
获取输入数据的逆互补误差函数值。 |
|
获取输入数据的缩放互补误差函数值。 |
|
获取输入数据x的伽马函数值。 |
|
获取输入数据x伽马值的绝对值并求自然对数。 |
|
获取输入数据x的0阶常规修正圆柱贝塞尔函数的值。 |
|
获取输入数据x的1阶常规修正圆柱贝塞尔函数的值。 |
|
获取输入数据x的标准正态分布的累积分布函数值。 |
|
获取输入数据x的标准正态累积分布的逆函数 |
|
获取输入数据x的0阶第一类贝塞尔函数j0的值。 |
|
获取输入数据x的1阶第一类贝塞尔函数j1的值。 |
|
获取输入数据x的n阶第一类贝塞尔函数jn的值。 |
|
获取输入数据x的0阶第二类贝塞尔函数y0的值。 |
|
获取输入数据x的1阶第二类贝塞尔函数y1的值。 |
|
获取输入数据x的n阶第二类贝塞尔函数yn的值。 |
|
获取输入数据的绝对值。 |
|
对输入数据x、y、z,计算x与y相乘加上z的结果。 |
|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最小值。 |
|
获取输入数据的差值,差值小于0时,返回0。 |
|
获取输入数据x除以y的余数。求余数时,商取最接近x除以y浮点数结果的整数,当x除以y的浮点数结果与左右最接近的整数距离相等时,商取偶数,同时将商赋值给指针变量quo。 |
|
获取输入数据x除以y的余数。求余数时,商取x除以y浮点数结果的整数部分。 |
|
获取输入数据x除以y的余数。求余数时,商取最接近x除以y浮点数结果的整数,当x除以y的浮点数结果与左右最接近的整数距离相等时,商取偶数。 |
|
获取由第一个输入x的数值部分和第二个输入y的符号部分拼接得到的浮点数。 |
|
获取与输入浮点数最接近的整数,输入浮点数与左右整数的距离相等时,返回偶数。 |
|
如果y大于x,返回比x大的下一个可表示的浮点值,即浮点数二进制最低位加1。 如果y小于x,返回比x小的下一个可表示的浮点值,即浮点数二进制最低位减1。 如果y等于x,返回x。 |
|
获取输入数据x与2的n次方的乘积。 |
|
获取输入数据x与2的n次方的乘积。 |
|
将输入数据分解为小数部分和整数部分。 |
|
获取两个输入数据相除的结果。 |
|
获取输入数据的符号位。 |
|
将输入数据钳位到[0.0, 1.0]区间。 |
|
获取两个输入数据相除的结果。 |
|
获取与输入数据最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取与输入数据最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取与输入数据最接近的整数,若存在两个同样接近的整数,则获取其中的偶数。 |
|
获取对输入数据四舍五入后的整数。 |
|
获取对输入数据四舍五入后的整数。 |
|
获取对输入数据四舍五入后的整数。 |
|
获取小于或等于输入数据的最大整数值。 |
|
获取大于或等于输入数据的最小整数值。 |
|
获取对输入数据的浮点数截断后的整数。 |
|
判断浮点数是否为有限数(非inf、非nan)。 |
|
判断浮点数是否为nan。 |
|
判断浮点数是否为无穷。 |
接口名 |
功能描述 |
|---|---|
获取输入遵循CAST_RINT模式取整后的浮点数。 |
|
获取输入遵循CAST_TRUNC模式取整后的浮点数。 |
|
获取输入遵循CAST_FLOOR模式取整后的浮点数。 |
|
获取输入遵循CAST_CEIL模式取整后的浮点数。 |
|
获取输入遵循CAST_ROUND模式取整后的浮点数。 |
|
获取输入遵循CAST_RINT模式转换成的无符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的无符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的无符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的无符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的无符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的有符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的有符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的有符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的有符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的有符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的64位无符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_TRUNC模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_FLOOR模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_CEIL模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_ROUND模式转换成的64位有符号整数。 |
|
获取输入遵循CAST_RINT模式转换成的浮点数。 |
|
获取输入遵循CAST_TRUNC模式转换成的浮点数。 |
|
获取输入遵循CAST_FLOOR模式转换成的浮点数。 |
|
获取输入遵循CAST_CEIL模式转换成的浮点数。 |
|
获取输入遵循CAST_ROUND模式转换成的浮点数。 |
|
获取输入遵循CAST_RINT模式转换成的浮点数。 |
|
获取输入遵循CAST_TRUNC模式转换成的浮点数。 |
|
获取输入遵循CAST_FLOOR模式转换成的浮点数。 |
|
获取输入遵循CAST_CEIL模式转换成的浮点数。 |
|
获取输入遵循CAST_ROUND模式转换成的浮点数。 |
|
获取输入遵循CAST_RINT模式转换成的浮点数。 |
|
获取输入遵循CAST_TRUNC模式转换成的浮点数。 |
|
获取输入遵循CAST_FLOOR模式转换成的浮点数。 |
|
获取输入遵循CAST_CEIL模式转换成的浮点数。 |
|
获取输入遵循CAST_ROUND模式转换成的浮点数。 |
|
获取输入遵循CAST_RINT模式转换成的浮点数。 |
|
获取输入遵循CAST_TRUNC模式转换成的浮点数。 |
|
获取输入遵循CAST_FLOOR模式转换成的浮点数。 |
|
获取输入遵循CAST_CEIL模式转换成的浮点数。 |
|
获取输入遵循CAST_ROUND模式转换成的浮点数。 |
|
将整数中的位重新解释为浮点数。 |
|
将无符号整数中的位重新解释为浮点数。 |
|
将浮点数中的位重新解释为有符号整数。 |
|
将浮点数中的位重新解释为无符号整数。 |
接口名 |
功能描述 |
|---|---|
获取输入数据的绝对值。 |
|
获取输入数据的绝对值。 |
|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最小值。 |
|
获取两个输入数据中的最小值。 |
|
获取两个输入数据中的最小值。 |
|
获取输入int32类型数据x和y乘积的高32位。 |
|
获取输入uint32类型数据x和y乘积的高32位。 |
|
获取输入int64类型数据x和y乘积的高64位。 |
|
获取输入uint64类型数据x和y乘积的高64位。 |
|
计算输入32位整数x和y的乘积,返回64位结果。 |
|
将输入数据的位序反转,返回反转后的值。 |
|
从输入数据的二进制最高有效位开始,返回连续的前导零的位数。 |
|
从二进制输入数据的最低位开始,查找第一个值为1的比特位的位置,并返回该位置的索引,索引从1开始计数;如果二进制数据中没有1,则返回0。 |
|
统计输入数据从二进制的高位到低位比特位为1的数量。 |
|
由输入的两个4字节的uint32_t类型数据组成一个8个字节的64比特位的整数,通过选择器s指定选取其中的4个字节,将这4个字节从低位到高位拼成一个uint32_t类型的整数。 |
|
对输入数据x、y、z,计算|x - y|+z的结果,即第一个入参和第二个入参之差的绝对值与第三个入参的和。 |
|
对输入数据x、y、z,计算|x - y|+z的结果,即第一个入参和第二个入参之差的绝对值与第三个入参的和。 |
|
获取输入int32类型数据x和y低24位乘积的低32位结果。x和y的高8位被忽略。 |
|
获取输入uint32类型数据x和y低24位乘积的低32位结果。x和y的高8位被忽略。 |
|
获取输入int32类型数据x和y的平均值,避免中间求和溢出。 |
|
获取输入int32类型数据x和y的向上取整平均值,避免中间求和溢出。 |
|
获取输入uint32类型数据x和y的平均值,避免中间求和溢出。 |
|
获取输入uint32类型数据x和y的向上取整平均值,避免中间求和溢出。 |
|
获取两个输入数据中的最大值。 |
|
获取两个输入数据中的最小值。 |
地址空间谓词函数
接口名 |
功能描述 |
|---|---|
判断输入的指针是否指向Global Memory内存空间的地址。 |
|
判断输入的指针是否指向Unified Buffer内存空间的地址。 |
|
判断输入的指针是否指向栈空间的地址。 |
地址空间转换函数
接口名 |
功能描述 |
|---|---|
将输入的指针转换为其指向的Global Memory内存空间的地址值并返回。 |
|
将输入的指针转换为其指向的Unified Buffer内存空间的地址值并返回。 |
|
将输入的指针转换为其指向的栈空间地址的值并返回。 |
|
将Global Memory内存空间的地址值转换为对应的指针。 |
|
将Unified Buffer内存空间的地址值转换为对应的指针。 |
|
将栈空间的地址值转换为对应的指针。 |
访存函数
接口名 |
功能描述 |
|---|---|
从L2 Cache加载缓存的数据,如果缓存命中,则直接返回数据。若未命中,则从Global Memory地址预加载数据缓存至L2 Cache,并返回数据。 |
|
首先从Data Cache加载缓存数据,若未命中,则尝试从L2 Cache加载。如果Data Cache和L2 Cache中均未找到所需数据,则从Global Memory中读取数据,然后将其缓存到L2 Cache和Data Cache中。 |
|
将指定数据存储到Global Memory的地址address中,并缓存到L2 Cache,但不缓存至Data Cache。 |
|
将指定数据存储到Global Memory的地址address中,并缓存至Data Cache和L2 Cache。 |
协作组
接口名 |
功能描述 |
|---|---|
将一个线程组按指定大小划分为多个子组。 |
|
根据一个标签(0或1)将父组划分为两个子组。 |
接口名 |
功能描述 |
|---|---|
获取当前线程块协作组对象。 |
|
同步线程块内所有线程。 |
|
获取线程块内线程总数。 |
|
获取线程块内线程总数。 |
|
获取当前线程在线程块内的排名。 |
|
获取当前线程在线程块内的三维索引。 |
|
获取当前线程块在网格中的三维索引。 |
|
获取线程块的维度。 |
|
获取线程块内线程的三维维度。 |
接口名 |
功能描述 |
|---|---|
获取当前活跃线程组成的协作组对象。 |
|
同步组内所有线程。 |
|
获取组内线程总数。 |
|
获取组内线程总数。 |
|
获取当前线程在组内的排名。 |
|
获取当前协作组在父组的排名。 |
|
获取父组被划分时创建的子组数量。 |
|
组内线程的数据交换,直接读取组内指定线程的数据。 |
|
获取组内当前线程向前偏移delta的线程的数据。 |
|
获取组内当前线程向后偏移delta的线程的数据。 |
|
判断组内每个活跃线程的输入是否非零。 |
|
判断是否有组内线程的输入不为0。 |
|
判断是否所有组内线程的输入均不为0。 |
接口名 |
功能描述 |
|---|---|
创建指定大小的thread_block_tile协作组。 |
|
同步组内所有线程。 |
|
获取组内线程总数。 |
|
获取组内线程总数。 |
|
获取当前线程在组内的排名。 |
|
获取当前协作组在父组的排名。 |
|
获取父组被划分时创建的子组数量。 |
|
组内线程的数据交换,直接读取组内指定线程的数据。 |
|
获取组内当前线程向前偏移delta的线程的数据。 |
|
获取组内当前线程向后偏移delta的线程的数据。 |
|
获取组内与当前线程rank做异或运算后的线程的数据。 |
|
判断组内每个活跃线程的输入是否非零。 |
|
判断是否有组内线程的输入不为0。 |
|
判断是否所有组内线程的输入均不为0。 |