【深铭易购】资讯:根据TrendForce的报道,英伟达正在考虑为其即将推出的人工智能(AI)和高性能计算(HPC)应用的Blackwell B300 GPU采用新的插槽设计。这一设计考虑了AI GPU在高负载下的故障率、主板更换成本以及散热问题。因此,英伟达和其他AI GPU设计师可能会在下一代GPU中选择插槽设计,而非将GPU焊接到主板上。
然而,插槽式设计通常会导致功耗和散热问题的增加,尤其是最耗电的GPU通常采用BGA封装。供应链消息显示,里昂证券(CLSA)分析师陈硕文提到,英伟达一直在为其产品设计GPU插槽,可能从GB200 Ultra开始。他提到,英伟达有一个带有CPU主板的四路GPU设计,尽管考虑到DGX服务器,其拥有一个八路GPU主板和一个双路CPU主板,但这样的设计仍显得不太现实。
英伟达的数据中心命名法将公司GPU(如A100、H100、B100/B200)与Grace CPU + GPU平台(如GH100、GB200)进行了明确区分。目前,GB200平台的CPU和GPU均采用BGA封装;尚不确定B200 Ultra更新后是否会有所改变,特别是下半年可能推出的GB200 Ultra。
标准的CPU插槽在维修和升级上具有便利性,但在服务器中,相较于BGA封装或SXM/OAM模块,它们占用的空间更大,且在功耗和散热方面的限制也更为严格。尽管模块可修复,但具体过程可能因主板设计而异,而且拆卸SXM/OAM模块时需要小心操作,因此它们的使用便利性不及插槽设计。
需要指出的是,附加卡、SXM/OAM模块的制造难度大且成本高。目前,大多数英伟达SXM模块均由富士康制造。将板卡或模块迁移至插槽设计有助于降低成本,但性能可能受到限制。
英伟达已正式推出B200 GPU(功率超过1000W),将用于GB200板卡(代号为Bianca,配备一个Grace CPU和两个Blackwell GPU,以及Ariel,配备一个Ariel CPU和一个Blackwell GPU),采用BGA封装。此外,英伟达还推出了支持八个B200(1000W)和B100(700W)SXM模块尺寸的Umbriel GPU板,并且还有代号为Miranda的平台(提供更高性能、更高TDP、PCIe 6.0和800G网络)以及代号为Oberon GB200的平台。
尽管英伟达的H100甚至H200附加卡(基于Hopper架构)在性能上有所降低,以适应经典服务器的功耗和散热预算,但英伟达从未宣布过任何基于Blackwell GPU的附加卡。
根据爆料,英伟达正在准备代号为B200A的产品,该产品基于单片B102处理器,采用台积电的CoWoS-S封装技术,连接四个HBM3E内存堆栈。这与双芯片的B100/B200设计形成了鲜明对比,后者则是采用台积电的CoWoS-L封装技术,将两个芯片连接到八个HBM3E内存堆栈。
深圳市深铭易购商务有限公司
©粤ICP备17023760号-2