PCIe瓶颈导致NVIDIA GeForce RTX 5090内容创作性能下降 25%
PCIe 带宽不足会导致 RTX 5090 在视频编辑和 3D 工作负载下的性能下降高达 25%。Puget Systems 对 NVIDIA 的 GeForce RTX 5090 进行了一系列测试,比较了不同的 PCIe 版本和通道配置,以评估其对内容创作工具的影响。
TechPowerUp 的扩展测试指出,GeForce RTX 5090 是首款采用 PCIe 5.0 x16 的高端显卡,可提供 64 GB/s 的双向带宽,是 RTX 4090 在 PCIe 4.0 x16 上 32 GB/s 的两倍,测试表明,当使用有限的 PCIe 带宽时,性能可能会受到影响高达 25%。Puget Systems 今天对该接口进行了测试,证实了当通道或代数受限时,它对视频编辑工作流程的实际影响。
在 DaVinci Resolve 基准测试中,Puget Systems 发现在 PCIe 5.0 x16、PCIe 5.0 x8 或 PCIe 4.0 x16 上运行的配置产生的渲染时间几乎相同。降至 PCIe 5.0 x4、PCIe 4.0 x8 或 PCIe 3.0 x16 会导致速度略微下降 10%。进一步将带宽降低至 PCIe 4.0 x4 或 PCIe 3.0 x8 会导致渲染时间增加约 25%。当带宽降至 8 GB/s 以下时,After Effects 仅会出现轻微的速度下降。虚幻引擎 5.5 虚拟制作测试记录到,在最低通道数下,平均帧速率下降了约 7%。相比之下,Blender 离线渲染和 OctaneBench 得分基本保持不变,Llama LLM 基准测试显示对 PCIe 速度没有可测量的依赖性。
RTX 5090 上的 PCIe 5.0 采用与 PCIe 4.0 相同的 NRZ 信令,但采用了更严格的信号完整性措施,包括判决反馈均衡和更严格的时序控制。尽管 RTX 5090 完全向后兼容 PCIe 4.0、3.0 甚至更早的标准,但它巨大的带宽余量引发了一个问题:在传统插槽上或与 NVMe 驱动器共享通道时,性能会损失多少。
这些发现揭示了现代主板的一个常见限制:大多数主板为单个插槽保留了完整的 x16 通道,迫使任何额外的设备或驱动器以一半或四分之一的速度运行。因此,旗舰 GPU 可能会在不知情的情况下以 PCIe 4.0 x4 的速度运行,从而延长了处理高分辨率时间线或复杂 3D 场景的专业人士的项目周转时间。对于计划多卡配置的工作室和高级用户,明确的建议是验证 RTX 5090 是否保持在全带宽插槽中。