苹果M3在CPU测试中暴露出的一个问题

摘要:

苹果的 M3 系列芯片已开始进入 PassMark 的 CPU 基准数据库,并延续了其前辈在单线程工作负载方面领先于所有竞争对手的传统。不幸的是,对于苹果来说,它的M3 Max处理器没有机会与英特尔和AMD的旗舰产品抗衡,当然,在多线程工作负载中,它们更耗电。

目前,苹果的 11 核 M3 Pro 以 4910 分领先于 PassMark 的单线程 CPU 基准测试,比英特尔的酷睿i9-14900KF的4852分快约 1.2%。苹果的M3 Pro具有8位执行、150 GB/s内存带宽和4.05GHz的主频,而英特尔的酷睿i9-14900KF拥有6位执行、89.6 GB/s内存带宽和6.0 GHz加速时钟。鉴于M3 Pro是一款功耗适中的笔记本电脑片上系统 (SoC),苹果的胜利似乎更加令人印象深刻。


苹果的 12 核 M3 Pro 和 16 核 M3 Max 处理器略微落后于他们的“弟弟”,但仍领先于英特尔的第 13 代和第 14 代酷睿处理器。有趣的是,即使是苹果面向智能手机的 A17 Pro SoC 在单线程 PassMark CPU 基准测试中也击败了英特尔的酷睿i9-13900F和i7-14700K。


就苹果的16核M3 Max SoC在PassMark的多线程CPU基准测试中的表现而言,它得分为39,921分,足以击败英特尔的酷睿i7-13700F(39,825分),或多或少与20核M2 Ultra(40,893分)相当。然而,AMD和英特尔的旗舰台式机产品——Ryzen 9 7950X(63,230分)和Core i9-14900K(60,823分)——分别比M3 Max高出58%和52%。当然,这些部件比苹果的M3 Max消耗更多的功率,但对于那些需要最高性能的人来说,这并不重要。

对苹果来说可能是个好消息。该公司的 24 核 M2 Ultra 系统级封装具有两个 M2 Max,与一个 M2 Max 相比,具有出色的+85%可扩展性。如果苹果的 32 核 M3 Ultra 表现出类似的可扩展性,那么在 PassMark 的 CPU 基准测试中,多线程工作负载约为 73,000 点,它将能够以极低的功率与 AMD 的 32 核 Ryzen Threadripper Pro 5975WX(75,777 点)和英特尔的 36 核 Xeon W9-3475X(67,227 点)相媲美。然而,AMD 的 96 核 Ryzen Threadripper Pro 7995WX(153,301 分)和英特尔的 56 核 Xeon W9-3495X(98,285 分)仍将遥遥领先于苹果的旗舰产品。

自从苹果于2020 年发布自己的用于台式机和笔记本电脑的 M 系列处理器以来,这些 SoC 因其8位宽执行以及先进的缓存和内存子系统而在单线程性能基准测试中占据主导地位。苹果的 M3 仍然可以在单线程工作负载中击败所有产品,但是,当涉及到使用所有内核和功能的多线程工作负载的性能时,苹果处理器明显落后于竞争对手。


M3系列性能详解

M3 系列芯片中的新一代GPU与传统GPU不同,它具有动态缓存功能,可以实时分配硬件中本地内存的使用。通过动态缓存,每个任务仅使用所需的确切内存量。这是业界首创,对开发人员透明,也是新 GPU 架构的基石。它提高了 GPU 的平均利用率,从而显著提高了最苛刻的专业应用程序和游戏的性能。

借助 M3 系列芯片,硬件加速光线追踪首次出现在 Mac 上。光线追踪对光与场景交互时的属性进行建模,使应用程序能够创建极其逼真且物理精确的图像。再加上新的图形架构,专业应用程序的速度可达 M1 系列芯片的 2.5 倍。游戏开发人员可以使用光线追踪来获得更准确的阴影和反射,从而创建深度沉浸式环境。此外,新的 GPU 为 Mac 带来了硬件加速的网格着色,为几何处理提供了更强大的功能和效率,并在游戏和图形密集型应用程序中实现了视觉上更复杂的场景。这GPU架构实现了所有这些增强功能。事实上,M3 GPU 能够以近一半的功耗提供与 M1 相同的性能,并且在峰值时性能提高高达 65%。

更高效的CPU

M3、M3 Pro 和 M3 Max 中的新一代 CPU 对性能和效率核心进行了架构改进。性能核心比 M1 系列的核心快 30%,因此,在 Xcode 中编译和测试数百万行代码等任务甚至更快,音乐家可以在其中使用数百个音轨、插件和虚拟乐器。逻辑专业版。效率核心比 M1 中的效率核心快 50%,因此,日常任务比以往更快,同时使系统能够最大限度地延长电池寿命。这些内核共同打造出一款 CPU,可提供与 M1 相同的多线程性能,而功耗仅为 M1 的一半,并且在峰值功率下性能提高高达 35%。

统一内存架构

M3 系列中的每个芯片都采用统一的内存架构,这是 苹果 芯片的标志。这可提供高带宽、低延迟和高功效。在定制封装内拥有单个内存池意味着芯片中的所有技术都可以访问相同的数据,而无需在多个内存池之间进行复制,从而进一步提高性能和效率,并减少大多数系统所需的内存量的任务。此外,对高达 128GB 内存的支持解锁了以前在笔记本电脑上无法实现的工作流程,例如人工智能开发人员使用具有数十亿参数的更大变压器模型。

人工智能和视频的定制引擎

M3、M3 Pro 和 M3 Max 还具有增强的神经引擎,可加速强大的机器学习 (ML) 模型。神经引擎比 M1 系列芯片快 60%,使 AI/ML 工作流程更快,同时将数据保留在设备上以保护隐私。强大的人工智能图像处理工具,例如 Topaz 中的降噪和超分辨率,速度更快。Adobe Premiere 中的场景编辑检测和 Final Cut Pro 中的 Smart Conform 也获得了性能提升。

M3 系列中的所有三款芯片还具有先进的媒体引擎,为最流行的视频编解码器提供硬件加速,包括 H.264、HEVC、ProRes 和 ProRes RAW。并且媒体引擎首次支持AV1解码,实现流媒体服务的节能播放,进一步延长电池寿命。

查看评论
created by ceallan