FPGA实时光追演示:Artix平台效能是锐龙R9-4900H CPU软解的50倍
尽管在传统硬件仿真领域,“可编程逻辑门阵列”(FPGA)的名气要更高一些。但近期一些成功的 FPGA 光追游戏运算演示,再次吸引了许多人的目光,因为这通常是图形处理器(GPU)的优势领域。TechSpot 报道称,来自两位开发者的新工作流工具,使得一枚普通的 FPGA、能够实现较传统 x86 处理器更惊人的效率提升,为多个行业的节能运营开辟了新经验。
Arty A7 FPGA 开发板资料图
本次演示选择了一个在棋盘上弹跳的闪亮球形物体,且它用到了实时光线追踪功能 —— 之前没人指望过一款中型 FPGA 芯片能够轻松应对此类应用。
不过更值得称道的,还是 FPGA 运行游戏所消耗的能量,远低于功能更强大的 AMD 笔记本电脑处理器。
在 Artix 7 100T 硬件上,Victor Suarez Rovere 和 Julian Kemmerer 借助他们的 CflexHDL / PipelineC 工具,用 C 语言构建了这一演示所需的 FPGA 固件代码。
作为比较,两位开发者搬来了 AMD 锐龙 R9-4900H 平台、并编译了基于 CPU 软解(不使用集成的核显)的相同演示。
两者均在 1080p 下以大约 60 FPS 的帧速率运行游戏,但需要截然不同的性能配置文件来完成任务。
Sphery vs. Shapes - Victor Suarez Rovere(via)
据悉,Artix 平台采用了 28nm 节点工艺的 FPGA 芯片,主频为 148 MHz、具有约 10 万个逻辑元件。
相比之下,锐龙 R9-4900H 是一款 8C / 16T 的 7nm 处理器。开发人员在 4.2 GHz 的加速频率附近,调用了该芯片的所有核心线程。
Rovere 和 Kemmerer 估计,Artix 的晶体管数量,大约只有这枚锐龙移动芯片的 1 / 15 。
尽管硬件规模上存在相当大的差距,但 FPGA 演示仅消耗了 660 mW 的功率。而且就算没用到主动式散热解决方案,该芯片仍“几乎没有发热”。
另一方面,x86 架构的锐龙 R9-4900H 的功耗达到了 33 W —— 不仅 50 倍于 FPGA,风扇也在 88℃ 的高温下猛转以实现相同的性能。
Rovere 和 Kemmerer 据此推测,7nm FPGA 芯片可进一步将能效差距扩大至 6 倍、同时功耗低至锐龙 R9-4900H 的 1/300 。
当然,我们不该彻底无视 APU 上的核芯显卡、或在搭配专用独显(GPU 加速卡)下可实现的更高效能。
但这么做仍无法消除与 Artix 平台的差距,更别提采用更先进的 FPGA 解决方案来发起挑战了。
最后,感兴趣的朋友,可移步至 PipelineC-Graphics 的 GitHub 项目主页(白皮书),以获知更多细节。