根据这一发现,推土机2.0将会支持的新扩展有:
- BMI:Bit Manipulation Instructions,位操作类指令
- TBM:Trailing Bit Manipulation,追踪位操作
- FMA3:three operand FMA [fused multiply-add] instructions,三操作乘加指令
我们知道,推土机将会支持四操作乘加指令的FMA4,实现非破坏性DEST并降低寄存器的压力,今后再增加FMA3应该是为了实现与Intel Sandy Bridge/Ivy Bridge的兼容性,后者都支持FMA3。
FMA4指令可以允许a、b、c、d处于四种不同的寄存器状态,FMA3指令则要求d必须与a、b、c其中之一处于相同的寄存器状态。前者可以提供更好的编程弹性,后者则可以缩短代码长度,硬件支持也稍微简单一些。
文/驱动之家