作者:原创

AI加速卡市场火爆,特别是需要大规模集群构建AI系统,从而获得更强大的AI算力。作为市场上最富性能亮点的NVIDIA DGX系统,最新型号已经升级到B300核心,而就在这个时候,其产品核心却出现了新变化。
随着NVIDIA更新其超算平台DGX至B300核心,该系统的整体架构也迎来了重大升级——英特尔至强6系列处理器,将在2U及以上系统中,成为衔接各片AI加速器、数据传输和吞吐的核心主控芯片。除了DGX,NVIDIA MGX系统也已经使用至强6系列的处理器作为主控CPU。
实际上,NVIDIA DGX系统不是唯一采用至强6处理器作为主控CPU的AI系统,近期英特尔专门推出了3款拥有更高定制特性的至强6家族产品,将PCT这一重要特性引入,为AI系统更高效发挥加速卡的效能创造可能。
PCT(Priority Core Turbo,优先核心睿频)并非传统意义上的将处理器中的部分核心提升到更高运行频率,它基于Speed Select(SST)技术,将一颗处理器中数十乃至过百个核心,根据系统、应用需求而进行性能划分。具体来说,就是可根据软件或BIOS定义,从DGX B300系统所使用的至强6776P处理器的64个核心中,配置8个核心,使其运行速度从最大睿频的3.9GHz进一步提升到4.6GHz、提升性能,而整颗处理器并不会因此而面临更严峻的散热问题。
相比AI加速芯片的AI专用算力,主控CPU更扮演着AI加速系统“中枢神经”的角色,它不仅自身可为AI系统的数据进行执行管理、优化、预处理、处理和卸载等各种任务,更是整个系统的内存、I/O、高效存储与高吞吐、低延迟性能的关键控制环节,对AI系统的性能与能效优化有着决定性作用。
至强6处理器作为AI系统的主控CPU,拥有5方面的核心优势:
1. 更多PCI-E通道。至强6的每个处理器提供多达192条PCI-E 5.0通道,比上代增加20%,I/O拓展和吞吐能力更强。
2. 更高内存带宽和容量。至强6支持达8800 MT/s的MRDIMM和CXL技术,可提供更大内存带宽和更大内存容量。以NVIDIA DGX B300为例,它选用了2DPC(每通道2个DIMM)模式,最大可支持8TB的内存池。
3. 在优异的高单线程处理能力的基础上增加了PCT的能力。至强6处理器的PCT核心是其64或72核心中的8个,匹配DGX等AI系统的8片AI加速器。提高的PCT频率,对数据填喂AI加速器这一无法多线程进行的流程,有着显著的加速优势。新款至强6处理器支持双路或单路系统,至多可达128个性能核心/256线程,SST-PP与PCT灵活配置各个核心。
4. 专门的RAS支持。可靠性、可用性和可维护性(RAS)对发挥AI系统商业价值起到了很好的保障作用,可减少大规模AI系统的停机时间。RAS 技术支持多项高级管理功能,包括遥测、平台监控、共享资源控制和实时固件更新等。
5. AMX特性。至强6系列处理器最大配备504MB L3 Cache,并且整合AMX(Intel Advanced Matrix Extensions,英特尔高级矩阵拓展)引擎。随着英特尔将FP16精度运算特性下放,处理器能为AI工作负载中的数据预处理及关键CPU任务提供高效支持。
随着使用带有PCT新特性的至强6处理器进入NVIDIA DGX B300为代表的AI系统,主控CPU对于提升整体AI系统性能发挥着重要作用。该产品并非实验性的产品,而是已经确定了产品化过程,即将走向市场。
至强6处理器,凭借其卓越的性能和能效、创新的PCT功能、增强的I/O以及自身AI能力,在风起云涌的AI浪潮中掀起又一朵浪花。