作者:原创

英伟达在AI基础设施峰会上发布了Rubin CPX GPU,这款GPU主要面向长文本上下文AI推理,并且将与Rubin GPU和Vera CPU共同使用。英伟达声称,这款芯片将为高效执行AI推理带来一场“革命”。
从规格来看,Rubin CPX具备30 petaFLOPs的NVFP4计算能力、128 GB的GDDR7内存,并将被集成在专属的NVIDIA Vera Rubin NVL144 CPX机架中。该机架将整合144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,以提供8 exaFLOPs的NVFP4计算能力。这一数字比Blackwell Ultra高出7.5倍,借助Spectrum-X以太网等技术,NVIDIA计划实现百万级token上下文的AI推理工作负载,将性能提升到新的水平。
该平台声称可实现“30-50倍的投资回报率”,而Vera Rubin NVL144 CPX机架将打破“构建下一代生成式AI应用”的计算障碍。Rubin CPX还将提供其他配置,但尚未公布。不过,考虑到其采用了GDDR7内存而非HBM,这款芯片被视作一种相对低成本的解决方案。
英伟达正在全面覆盖AI行业,几乎没有给竞争对手留下超越的空间。随着英伟达迅速转向专注于推理,以及明年新一代Rubin AI系列的推出,我们有望看到计算能力的巨大飞跃。