极客前沿

极客资讯 正文

Tenstorrent黑科技翻车?AI加速卡核心数竟被固件“阉割”

2026-02-06 00:32 | Tom's Hardware ...

AI芯片新贵的“反向升级”

在AI加速器领域,Jim Keller创立的Tenstorrent一直被视为“实干派”——当其他初创公司还在画饼时,他们已经拿出了基于RISC-V架构的Blackhole系列AI加速卡。然而最近一则公告却让这个技术新贵陷入了争议漩涡:从2026年1月开始,所有Blackhole p150加速卡(包括已售出的)都将通过固件更新,将张量核心数量从140个“优化”为120个。

News Image

“非实质性影响”的数学谜题

Tenstorrent在给用户的邮件中轻描淡写地表示,这一改动对典型工作负载的“影响不大”,性能下降约1-2%。但细心的用户很快发现了问题:140个核心减少20个,相当于硬件规格直接缩水14%。更令人困惑的是,产品页面显示的理论算力从774 TFLOPS降至664 TFLOPS,这个降幅怎么看都不像“非实质性”。

News Image

有用户在Discord社区犀利提问:“你们的SDK真的能完全利用这些硬件吗?”另一位开发者则担心,核心网格布局的改变可能会破坏现有经过测试的代码。用户面临的选择颇为无奈:要么更新固件接受“核心阉割”,要么放弃这个尚在开发中的产品的所有新功能。

News Image

技术背后的可能真相

为什么要在产品上市后降低硬件规格?业内猜测可能有几种原因:

News Image
  • 良率问题:虽然Blackhole芯片采用相对成熟的6nm工艺,但可能某些核心存在缺陷,不得不通过固件屏蔽
  • 功耗与散热平衡:140个核心全开可能导致功耗超标,影响产品稳定性
  • 软件优化瓶颈:当前的TT-Metalium开发套件可能确实无法充分利用所有核心

有趣的是,Tenstorrent已经在与多家2nm芯片制造商洽谈下一代产品,而承诺中的双芯片、64GB显存的Blackhole p300至今仍未交付。这让人不禁想起科技圈那句老话:“别太相信PPT上的参数”。

News Image

性价比还是“性价坑”?

抛开这次争议,Blackhole p150的性价比确实令人印象深刻:32GB显存、664 TFLOPS算力,售价仅1399美元。这个价格大约是RTX 5090的三分之一,理论性能却可能高出数倍。卡片还能通过互联技术合并显存,芯片设计更是创新性地将CPU和张量核心集成在同一晶片上,绕过了传统架构的诸多限制。

但这次“固件降级”事件给潜在买家提了个醒:在评估AI加速器时,不能只看纸面参数。硬件规格、软件成熟度、长期支持承诺,一个都不能少。

初创公司的成长阵痛

Tenstorrent的定位很明确:为中小企业、实验室和个人开发者提供本地AI加速解决方案。这个市场细分确实存在需求缺口——不是每个团队都需要(或负担得起)英伟达的顶级方案。

然而,打造全新的AI加速器架构及其配套软件,本就是一场高难度的技术马拉松。从RISC-V指令集到特殊的芯片布局,每一步都是挑战。这次的核心数调整,或许只是成长路上的一次必要调整,但也暴露了硬件与软件协同优化的重要性。

对于已经购买p150的用户来说,1-2%的性能损失或许真的可以接受——如果他们相信Tenstorrent的长期技术路线图。毕竟在AI加速这个快速进化的领域,今天的妥协可能是为了明天更好的兼容性。

但无论如何,这次事件给所有硬件初创公司上了一课:透明沟通永远比技术参数更重要。当你在GitHub更新日志里悄悄修改核心数时,最好准备好回答那个最直接的问题:“为什么?”