NVIDIA GeForce RTX 50 系列因放弃 32 位支持而面临计算性能问题

摘要:

PassMark 软件已经确定了 NVIDIA 新一代 GeForce RTX 5090、RTX 5080 和 RTX 5070 Ti GPU 意外降低计算性能的根本原因。 究其原因是英伟达在其 "Blackwell "架构中悄悄停止了对 32 位 OpenCL 和 CUDA 的支持,从而导致与现有基准测试工具和应用程序的兼容性问题。

当 PassMark 的 DirectCompute 基准在 RTX 5000 系列显卡上返回错误代码 "CL_OUT_OF_RESOURCES (-5) "时,问题就显现出来了。

经过调查,开发人员确认,虽然该基准的主要应用程序多年来一直是 64 位的,但几个计算子基准仍然使用 32 位代码,而这些代码以前在 RTX 4000 和更早的 GPU 上可以正常运行。 英伟达并没有明确记录这一架构变化,尽管取消了实际支持,但英伟达的开发者网站仍继续显示 32 位代码示例和文档。

因此,基于传统 CUDA 基础架构(包括 PhysX 等技术)构建的应用程序将经历显著的性能下降,因为计算任务将退回到 CPU 处理,而不是利用 GPU 的并行架构。 虽然这种回退机制允许旧版应用程序在 RTX 40 系列和以前的硬件上运行,但 RTX 5000 系列完全通过 CPU 处理这些任务,从而导致性能大幅降低。

PassMark 正在努力将受影响的 OpenCL 代码移植到 64 位,以便对新 GPU 的计算能力进行适当的测试。 不过,他们警告说,如果不修改源代码,许多包含 32 位 OpenCL 组件的现有应用程序可能永远无法在 RTX 5000 系列显卡上正常运行。

该基准测试开发商还指出,这一变化并不能完全解释 DirectX9 性能不佳的原因,表明其他架构变化可能会影响传统的渲染路径。

PassMark 今天更新了其软件,但传统基准仍可能受到影响。 以下是在未使用最新 PassMark V11.1 build 1004 补丁的情况下运行的旧版基准测试,显示了最新一代产品在没有适当软件支持的情况下所受到的影响。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan