OP里写明了
Sub CPU计算 – "- 支持相同输入shape计算。
- 支持输入1是标量或者输入2是标量的计算。
- 支持broadcast计算,最大维度是5。"
X3的BPU不支持减法,但是支持加法。那是否有什么办法能够等效实现BPU上的减法? X3的BPU上支持补码吗?
OP里写明了
Sub CPU计算 – "- 支持相同输入shape计算。
X3的BPU不支持减法,但是支持加法。那是否有什么办法能够等效实现BPU上的减法? X3的BPU上支持补码吗?
从X5经验看,一般是先*-1,再相加,工具链会将其等价于lut算子,然后编译器会将多个lut融合为一个lut