极客前沿

极客资讯 正文

亚马逊自研芯片Graviton5曝光:192核3nm,剑指AI推理

2026-06-12 00:33 | TechPowerUp ...

亚马逊云服务(AWS)的自研芯片之路越走越宽。近日,其第五代服务器处理器Graviton5的实物图首次曝光,这款由Annapurna Labs设计的芯片,不仅承载着AWS自身服务器基础设施的升级重任,更瞄准了AI推理这一快速增长的市场。

四芯粒合体,3nm工艺加持

从曝光的图片来看,Graviton5采用了四芯粒(chiplet)封装,每个芯粒均基于台积电3nm工艺制造。这种设计在AMD的EPYC处理器上已屡见不鲜,但AWS更进一步——通过高达420 GB/s的die-to-die互联带宽,实现了四芯粒间的完全缓存一致性,让整个192核的庞然大物如同一个统一的处理器。

每个芯粒包含48个Arm V3架构的性能核心,每个核心拥有1MB专用缓存,四芯粒合计共192核。内存方面,Graviton5支持12通道DDR5,频率高达DDR5-8800,总内存带宽超过800 GB/s。此外,它还集成了96条PCIe Gen 6通道,为高速网络和存储设备提供了充足的带宽。

值得注意的是,Graviton5的每个芯粒都独立集成了3通道DDR5内存控制器和24条PCIe Gen 6通道,这意味着即便部分芯粒发生故障,系统仍能降级运行,大幅提升了可靠性。

性能提升25%,目标直指Intel和AMD

AWS宣称,Graviton5将比其现有的G4实例(搭载Intel Xeon Scalable Cascade Lake或AMD EPYC Genoa处理器)性能提升25%。考虑到G4实例主要面向通用计算和AI推理,这一提升幅度颇具吸引力。

News Image

实际上,AWS自研芯片的历史可追溯到2015年收购Annapurna Labs。此后,Graviton系列从第一代的16核ARM Cortex-A72,发展到如今的192核自研Arm V3核心,性能每代翻倍。而Graviton5的3nm工艺和PCIe Gen 6支持,使其在能效比和I/O带宽上进一步领先。

不过,25%的对比基准是“G4实例”,而G4实例使用的Intel Cascade Lake发布于2019年,AMD Genoa发布于2022年。若与最新Intel Granite Rapids或AMD EPYC Turin相比,Graviton5的优势可能不会如此明显。但AWS的优势在于软硬件协同优化——Graviton芯片与AWS Nitro系统深度集成,可提供更低延迟和更高安全性。

AI推理的“隐形冠军”

Graviton5最值得关注的是其对AI推理场景的针对性优化。虽然AWS在AI训练领域有Trainium芯片,但推理工作负载通常需要高吞吐、低延迟的通用计算核心。Graviton5的192个高性能Arm核心,配合巨大的内存带宽,非常适合部署大规模推理模型,例如AWS的SageMaker和Bedrock服务。

此外,Arm架构在功耗上的优势,使得Graviton5能在相同功耗下提供更高的计算密度。对于AWS这样运营着全球最大云基础设施的厂商,每一点能效提升都意味着巨大的成本节约。

目前AWS尚未公布Graviton5的具体上市时间,但考虑到3nm工艺的产能和测试进度,预计最迟2025年将出现在EC2实例中。届时,用户或许能以更低的价格获得比肩Intel/AMD旗舰的性能,尤其是在AI推理场景下。

总之,Graviton5的亮相,再次印证了AWS“自研芯片+云服务”的闭环战略。在云计算的下半场,硬件定制化已成为巨头们拉开差距的关键。而对于开发者而言,一个更高效、更开放的Arm生态,或许正在加速到来。