英伟达Blackwell B300 AI GPU或将采用插槽设计

【深铭易购】资讯：根据TrendForce的报道，英伟达正在考虑为其即将推出的人工智能（AI）和高性能计算（HPC）应用的Blackwell B300 GPU采用新的插槽设计。这一设计考虑了AI GPU在高负载下的故障率、主板更换成本以及散热问题。因此，英伟达和其他AI GPU设计师可能会在下一代GPU中选择插槽设计，而非将GPU焊接到主板上。

然而，插槽式设计通常会导致功耗和散热问题的增加，尤其是最耗电的GPU通常采用BGA封装。供应链消息显示，里昂证券（CLSA）分析师陈硕文提到，英伟达一直在为其产品设计GPU插槽，可能从GB200 Ultra开始。他提到，英伟达有一个带有CPU主板的四路GPU设计，尽管考虑到DGX服务器，其拥有一个八路GPU主板和一个双路CPU主板，但这样的设计仍显得不太现实。

英伟达的数据中心命名法将公司GPU（如A100、H100、B100/B200）与Grace CPU + GPU平台（如GH100、GB200）进行了明确区分。目前，GB200平台的CPU和GPU均采用BGA封装；尚不确定B200 Ultra更新后是否会有所改变，特别是下半年可能推出的GB200 Ultra。

标准的CPU插槽在维修和升级上具有便利性，但在服务器中，相较于BGA封装或SXM/OAM模块，它们占用的空间更大，且在功耗和散热方面的限制也更为严格。尽管模块可修复，但具体过程可能因主板设计而异，而且拆卸SXM/OAM模块时需要小心操作，因此它们的使用便利性不及插槽设计。

需要指出的是，附加卡、SXM/OAM模块的制造难度大且成本高。目前，大多数英伟达SXM模块均由富士康制造。将板卡或模块迁移至插槽设计有助于降低成本，但性能可能受到限制。

英伟达已正式推出B200 GPU（功率超过1000W），将用于GB200板卡（代号为Bianca，配备一个Grace CPU和两个Blackwell GPU，以及Ariel，配备一个Ariel CPU和一个Blackwell GPU），采用BGA封装。此外，英伟达还推出了支持八个B200（1000W）和B100（700W）SXM模块尺寸的Umbriel GPU板，并且还有代号为Miranda的平台（提供更高性能、更高TDP、PCIe 6.0和800G网络）以及代号为Oberon GB200的平台。

尽管英伟达的H100甚至H200附加卡（基于Hopper架构）在性能上有所降低，以适应经典服务器的功耗和散热预算，但英伟达从未宣布过任何基于Blackwell GPU的附加卡。

根据爆料，英伟达正在准备代号为B200A的产品，该产品基于单片B102处理器，采用台积电的CoWoS-S封装技术，连接四个HBM3E内存堆栈。这与双芯片的B100/B200设计形成了鲜明对比，后者则是采用台积电的CoWoS-L封装技术，将两个芯片连接到八个HBM3E内存堆栈。