vtranspose指令抽象。
从输入地址x(32字节对齐)开始转置一个16x16矩阵,每个元素为16位,结果输出到y中,输入输出都是连续的512B存储空间。
class Vtranspose (x, y)
参数名 |
输入/输出 |
数据类型 |
说明 |
---|---|---|---|
x |
输入 |
tensor变量 |
输入x向量tensor。支持INT16。 |
y |
输出 |
tensor变量 |
输出向量tensor。支持INT16。 |
ub_x, ub_y = Tensor("UB"), Tensor("UB") ub_x.load(gm_x) out = vtranspose (ub_x, ub_y)()