M1 Ultra 深度探索:以一小部分功耗实现工作站性能

M1 Ultra

在本周的“Peek Performance”活动上,Apple 推出了为我们准备的不仅仅是新款 iPhone SE 和超厚的 Mac mini,也称为 Mac Studio。但苹果最新的台式 Mac 比 Mac mini 更大是有充分理由的:它旨在容纳和冷却 M1 Ultra,这是一款令人惊喜的新型高性能芯片。或者更确切地说是更高的性能,因为 M1 Max 已经引人注目。

与 M1 系列的其他产品一样,令人印象深刻的不仅仅是苹果全新多芯片封装所声称的性能。问题在于,苹果公司只用其竞争对手的一小部分力量来完成这一切。凭借 M1 Ultra,苹果将与使用数百瓦功率但功耗远低于 100 瓦的高性能 PC 硬件展开对峙。 AMD、英特尔和 Nivida 在一段时间内不太可能赶上每瓦性能优势。

既然可以买两台,为什么还要买一台 M1 Max?

令人印象深刻的 M1 Max 采用 M1 架构,炸毁它。有 10 个 CPU 核心(8 个性能和 2 个效率)、32 个 GPU 核心、两个媒体/视频引擎、一个 16 核神经引擎,全部连接到 32 或 64GB 内存,并具有可提供令人惊叹的 400GB 的超宽接口/秒带宽。

它也非常庞大,有 570 亿个晶体管。这大约是 GeForce GTX 3090 等大型消费 GPU 尺寸的两倍。通过制造更大的芯片来提高性能将是一场经济灾难……苹果能够以消费者价格出售 570 亿美元的晶体管芯片,即使是在高价的情况下,这也是一个奇迹。结尾。

那么苹果做了什么?它设计的 M1 Max 具有真正的高速互连,因此它实际上可以将其中两个放入同一个封装中,将它们捆绑在一起,然后繁荣起来:一个巨大的 1140 亿晶体管芯片,性能翻倍!

M1 系列

苹果

当然,事情没那么简单。苹果的互连被称为 UltraFusion,它将两个芯片放在同一个封装中,它们之间的带宽高达 2.5TB/秒。苹果声称其互连密度是任何其他技术的两倍。这个速度足以使整个系统在软件看来就像一个大芯片,并让一个芯片上的所有内核不受限制地访问连接到另一芯片的内存。

这类似于 AMD 在现代 Zen 处理器上的小芯片设计,具有”无限结构”连接,只是速度更快。

所有内核,所有带宽

事实上,M1 Ultra 是将两颗 M1 Max 芯片捆绑在一个封装中,并具有非常高速的互连,这意味着它基本上具有 M1 Max 所拥有的一切的两倍。其中包括 20 个 CPU 核心(16 个性能、4 个效率)、64 个 GPU 核心、32 个神经引擎核心、64GB 或 128GB RAM 以及令人惊叹的 800 GB/秒带宽。这比最快的台式机 CPU 的带宽高出很多倍,而且比最昂贵的千美元显卡还要低。

M1 Ultra CPU 功率 苹果声称它将大大超越 Core i9-12900K 的性能,并且在匹配其性能时功耗减少 100W。

苹果

这也意味着媒体处理引擎加倍:四个而不是两个。它们负责编码和解码 ProRes、H.264、AVC 和其他常见媒体格式。如果您以视频制作为生,M1 Ultra 将使那些大型复杂的 4K 视频导出工作快得惊人。事实上,苹果表示 M1 Ultra 可以同时播放 18 个 8K ProRes 422 视频流。如果您是那种了解这意味着什么的视频专业人士,您可能会把咖啡从鼻子里吐出来。

不仅仅是性能,还有每瓦性能

当然,您会期望 M1 Ultra 的性能大约是 M1 Max 的两倍,而这基本上正是 Apple 所声称的。这意味着您可以预期 Geekbench 5 单线程得分仍略低于 1,800(单个核心并未变得更快,只是数量更多),而多核心得分约为 24,000。这比 AMD 或 Intel 的领先消费级台式机处理器快约 80%。

为了获得更高的性能,您必须寻求 Intel 的 Xeon 或 AMD 的 Threadripper 工作站处理器或服务器 CPU,所有这些处理器都具有更多的内核并使用数百瓦的功率。

这确实是 M1 Ultra 的关键。从 Apple 的图表来看,它的功耗似乎从未真正超过 100 瓦。这是 Xbox Series X 或 PlayStation 5 的一半,并且

据 Apple 称,该 GPU 具有 64 个核心和 800 GB/秒的带宽,能够实现约 21 teraflops。这大约是 PlayStation 5 的两倍,与 GeForce GTX 3070 或 Radeon 6800 XT 相当。当然,苹果的 GPU 并不具备与 Nvidia 或 AMD 最新产品相同的功能(首先没有光线追踪加速功能),而且万亿次浮点运算并不是衡量 GPU 性能的最佳方式。但苹果的芯片在提供这种性能的同时,功耗却减少了几百瓦。

M1 Ultra GPU 性能 我们对 M1 Ultra 与 GTX 3090 性能的匹配持怀疑态度,但每瓦性能可能相差甚远。

苹果

我们必须对第一手基准测试保留判断,尽管 未经验证的 Geekbench 分数于周二深夜出现,看起来非常有希望。根据结果​​,M1 Ultra 与 AMD 的 Ryzen Threadripper 3990X 64 核处理器,其成本与整个 Mac Studio 一样高。苹果在这里提供的芯片似乎可以提供与工作站级 CPU 和高端游戏 GPU 相同的性能,而功耗却只有其一小部分。几乎可以肯定,不久之后我们就会看到来自英特尔或 AMD 的更快芯片,并且桌面 GPU 的运行速度已经更快,但在使用如此小的功耗的同时,它们还需要相当长的一段时间才能达到这种性能。

这看起来就像是游戏笔记本电脑功率水平下的工作站桌面性能。 Windows PC 超级粉丝们是时候再次拿起他们的借口和警告了。