正文咨询
英伟达Rubin CPX GPU发布:专为长上下文与视频生成
发布日期:2025-09-10浏览量:2

【深铭易购】资讯9月9日,英伟达正式宣布推出专为长上下文推理和视频生成设计的全新GPU——Rubin CPX。该GPU能够显著提升AI推理计算效率,尤其适用于编程、视频生成等需要超长上下文窗口的应用场景。

英伟达创始人兼CEO黄仁勋表示:“就像RTX在图形和物理AI领域带来的革命性变革一样,Rubin CPX是首款专为海量上下文AI设计的CUDA GPU,可同时处理数百万知识token的推理任务。”

image.png

Rubin CPX预计将于2026年底量产,基于英伟达下一代顶级算力芯片Rubin开发。与此同时,英伟达下一代旗舰AI服务器NVIDIA Vera Rubin NVL144 CPX也正式亮相,该平台集成了36颗Vera CPU、144块Rubin GPU及144块Rubin CPX GPU,专为超大规模AI计算打造。

Rubin CPX配备128GB GDDR7高速内存,在NVFP4精度下,AI算力可达30PFLOPS,可轻松处理超过100万个token的长上下文任务以及复杂视频生成工作。

Vera Rubin NVL144 CPX平台在单机架内可实现8EFLOPS(NVFP4精度)AI性能,内存容量高达100TB,内存带宽高达1.7PB/s。与上一代Vera Rubin NVL144平台相比,其AI性能提升超过2倍;与基于Blackwell Ultra的GB300 NVL72系统相比,性能提升高达7.5倍,同时注意力机制处理速度提高3倍,全面强化大规模AI推理与生成能力。