CHIP奇谱 CHIP奇谱

CHIP奇谱
关注产品与技术 分享体验与新知
广告

旧瓶装新酒的11代酷睿桌面级处理器

作者:原创

把时间倒回到2年半前,彼时AMD的在桌面CPU市场的主力还是Zen+架构的Ryzen 2000系列,尽管凭借着“核战争”的策略在并发性能上已经有了可以与英特尔扳手腕的底气,但受限于羸弱的单核性能,在一众游戏和生产力软件中依然无法如日中天的“14nm + Skylake微架构”这对“修炼”多年的黄金组合相提并论,后者最新发布的9代酷睿,继续维持了其在桌面领域拥有无可撼动的地位。


然而襁褓中的Zen2架构已经蓄势待发。更重要的是,在芯片工艺的领域,TSMC在7nm制程上的突飞猛进,使得英特尔在进入21世纪后,第一次失去了芯片工艺全球领导者的地位——自从2008年第一代酷睿Nehalem微架构加上Tick-Tock战略开始就矗立起来的桌面CPU市场的统治力,终于被翘掉了第一块基石。


Zen2架构(Ryzen 3000系列)处理器在2019年的ComputeX上正式发布,再次证明了Zen系列架构的强大潜力:单核心同频性能已经开始追上酷睿的脚步。英特尔显然意识到了潜在的危机。Rocket Lake-S甚至早在2019年2月就正式立项,希望凭借核心架构的革新来保持对AMD的持续压制,同时引入了大量新的技术特性。只可惜10nm工艺的举步维艰,使得还是必须要用“优化”到了极致的14nm工艺来承载Rocket Lake-S。等到Zen3架构的Ryzen 5000系列带着令人惊喜的IPC提升登场亮相的时候,Rocket Lake-S已经研发超过了21个月,可以说是箭在弦上,不得不发了。

自从8代酷睿之后,英特尔在产品线的区隔上是比较混乱的,几乎每一代的区分规则都有变化。例如8代的i5和i7之间的最大区别是是否搭载超线程技术。而9代时候的差别则主要体现在核心数量,而拥有超线程的“荣耀”则留给了新引入的i9。到10代酷睿,为了对抗AMD的“核战争”,超线程又变成了全系列标配,i9/7/5/3的核心按照10、8、6、4的数量以此递减。而到了11代的Rocket Lake-S中,受限于核心数量最多只能到8个,因此i9和i7之间的差异只有主频和睿频上限,以及是否TVB这样的频率提升技术。i5除了核心/线程降低到6C/12T之外,还拿掉了Turbo Boost Max 3.0,进一步限制了频率的提升幅度。

11代酷睿还放弃掉了i3的产品线,取而代之的是在Comet Lake架构的基础上推出了一批新的10代Core i3,在频率上做了一些象征性的提升。考虑到Rocket Lake-S注定是一代非常短命的产品,在对性能需求不强烈的入门级市场削减产品型号也是可以理解的。


IPC:终于不再挤牙膏


11代酷睿相比于10代最大的变化就是内核架构升级到了Cypress Cove,新架构改进了预取器与分支预测器的性能,相比Skylake架构,一级数据缓存增大50%,一级缓存存储带宽增大100%,二级缓存增大100%,微指令缓存增大50%,每周期能够加进乱序重排缓冲区的微指令多了25%,乱序重排缓冲区大了57%,后端执行端口多了25%。我们可以将其看作是Ice Lake上的Sunny Core的14nm工艺复刻版,与Tiger Lake上的Willow Cove各有侧重,相比Comet Lake上多年未换的Skyake架构,会带来显著的性能提升——英特尔的官方数据是IPC提升了19%。

Skylake(左)与Cyperss Cove(右)的内核架构对比


但IPC(Instruction Per Clock,即每个周期所能执行的指令数量)其实是个比较微妙的数据,因为其中的“Instruction”其实并没有统一的标准,因此直接对比IPC提升数据并没有实际意义。所以在这里我们挑选一种更容易理解和实现的方式:测试CPU的同核同频性能。


为了保证核心数量的统一,所以我们只能选择Core i7-10700K和Ryzen 7 5800X来做Core i9-11900K的测试对照组。测试的所有CPU都关掉超线程技术,同时把工作频率锁定在4GHz,并关闭所有自动超频或降频节能相关技术。从而极可能保证物理参数的一致性。


测试中有个意外情况是我们手里这块ROG Maximus XIII Hero主板的BIOS里,把Turbo Boost 技术绑定在了SpeedStep技术上,如果关掉SpeedStep,则Turbo Boost会被连带关闭,CPU的频率将被锁死在3.5GHz,即使手动设置了超频到4GHz也无效。而如果开启SpeedStep,那么进系统后CPU将无法维持在4GHz,需要在有负载的情况下,CPU才能睿频到4GHz。目前我们尚未从华硕得到答复,这究竟是BIOS的早期BUG还是11代酷睿确实改变了Turbo Boost的启动策略。但至少从目前更新的2版BIOS来看,该问题依然存在。

SpeedStep从Auto模式修改为Enable,就找不回TB Max 3.0的选项,而关掉SpeedStep之后,TB的选项也被连带关闭了

因此在这个环节的测试中,Core i9-11900K的成绩将受到小幅度的影响,依照以往的经验这将会导致测试成绩偏低1%~2%,还好这样的偏差幅度不足以影响我们的测试结论。

理论测试中,Core i9-11900K展现出了相比Core i7-10700K的巨大提升,特别是在单核心性能上,Cinebench系列的单核心成绩分别提升了12.5%,15.1%和16.1%,越重的计算负载,提升比例越高。多线程下情况类似,只是提升比例要小一些。只是这样的提升比例在Ryzen 7 5800X就显得有些不够看了,后者在CB系列中对Core i7-10700K的性能优势都在20%以上。GeekBench测试中Core i9-11900K的IPC表现稍好,至少在单核上赢过了Ryzen 7 5800X。

场面在游戏环节得到了缓解:尽管CSGO还是被Ryzen 7 5800X远远甩在身后,但Core i9-11900K在Dota2翻了身,相比Core i7-10700K提升超过1/3,同时也领先Ryzen 7 5800X约13.8%。


综合来看,英特尔宣称的19%的IPC提升确实所言非虚,只是单靠IPC上的提升,也只能算是追上了AMD的脚步,想要重夺性能王座,还得靠传统的频率优势。


ABT:架构不够频率凑


Cypress Cove带来的IPC提升足以令人满意——如果没有Zen3架构在一旁衬托的话。所以为了确保能够重新登顶MSDT平台性能之王的宝座,英特尔还为Core i9-11900K准备了更强的自动超频技术ABT(Adaptive Boost Technology)。仿佛是为了表达在14nm工艺的优化上“我们一直在努力”,每次14nm后缀多一个“+”号,我们就能迎来一项新的超频技术。

ABT与Turbo Boost Max 3.0和TVB不同,并不是用来在单/双线程下冲击极限频率的,而是允许CPU在规范的电流和温度限制内进一步提升多核心的睿频频率,提升的频率和持续的时间则由工作负载、当前功率和散热效率共同决定。在开启该技术后,Core i9-11900K的全核频率能够达到惊人的5.1GHz,同时ABT的持续时间要比TVB更长,因此能够显著提升Core i9-11900K在多线程负载下的性能表现。毕竟它跟Core i7-11700K的差距也就只有这些了。换句话说,为了买这个ABT技术,你差不多要多掏1750元。这还只是官方发售价格,如果按照市价,那这个技术“价值”超过3500块!

从测试结果来看,ABT确实能够一定程度上提升并行计算任务的性能表现,同时也基本上代表了Core i9-11900K的频率极限。在基于水冷散热器的手动超频测试中,即使解锁了所有的功耗和温度限制,能够稳定通过测试的全核频率也仅有5.2GHz。但这样的频率并不能在Benchmark中保持,因此测试成绩并不比全默认设置+开启ABT来得更高。因此可以说Core i9-11900K是真正意义上的出场即“灰烬”。


在Core i9-10900K和Core i7-10700K上,手动超频的频率上线也基本停留在5.2GHz~5.3GHz,这很大可能意味着英特尔的14nm工艺的潜力已经挖掘殆尽,好在Core i9-11900K已经是14nm的末代皇帝。


Gear 1/2:内存冲高频要注意延迟陷阱


Rocket Lake-S的默认内存支持频率从DDR4-2933提升到了DDR4-3200,与友商看齐。但同时把友商的内存分频设计也一并抄来:之前英特尔的内存控制器与内存频率都是1:1(Gear1)的,但Rocket Lake-S引入了1:2模式(Gear 2)。后一种模式可以带来更好的高频内存支持,但也会带来更高的延迟,使得高频内存的价值受损,毕竟像游戏这类应用对内存延迟比带宽更敏感。

基于默认内存Gear设置,我们把内存参数固定在CL19后,对内存频率进行调节,来观察内存带宽和延迟的变化。可以看到,Core i9-11900K使用的新内存控制器在内存带宽效率上比Core i7-10700K的更出色,同频率下能提供更大的内存读写带宽。


对于普通用户来说,需要注意的主板会有个默认的分频点,比如我们手里的M13H默认的分频为3600MHz,内存在这个频率或更低频率的时候会被设定在Gear1模式,一旦超过这个频率则会自动变为Gear2模式。此时内存延迟会出现明显的增加。

BIOS里提供了手动修改分频设定的权限,但成功与否是极度依赖内存控制器的体质的,目前看来把BCKL频率和内存频率设定在100:133时,是可以在3733MHz下实现Gear1模式并成功运行测试的,但再高的频率就很难实现了。所以对于一般玩家来说,低时序的DDR4-3600内存能够在频率、延迟和价格方面达到很好的平衡点,是11代酷睿的最佳拍档


AVX512:终于下放到主流平台


除了架构方面的变革,Rocket Lake-S在扩展指令集方向上也相当慷慨。包括AVX512、DL-Boost、GAN2.0等原本只停留在HEDT平台的指令集这次一股脑的下放到了MSDT平台。慷慨的背后显然有着精明的打算:只有搭载这些指令集的设备的拥有一定的普及度,才能推动软件厂商愿意去在应用软件中调用并进行针对性优化,而英特尔也能得以凭借软件的深度优化而拉开与竞争对手的关系。

其中最重要的当属AVX512指令集,发布于2013年的AVX512在指令宽度上相比AVX2进一步扩展了指令宽度,理论上浮点性能直接翻倍,整数计算性能也能提升1/3之多。因此AVX512在多媒体处理、数据分析、科学计算、数据压缩、加密解密以及深度学习这样的密集型计算应用场景中都将能够带来显著的性能提升。


Sandra测试中的科学计算、金融数据分析和数据加密等测试都能够很好的支持AVX512指令集。同时在3DMark TimeSpy Extreme测试中,我们还能够手动指定运行的指令集来观察AVX512为Core i9-11900K带来的加成:

当基于AVX2指令集进行测试时,Core i9-11900K相比Core i7-10700K和Ryzen 7 5800X分别领先15.8%和4.8%,而指定使用AVX512指令集运行时,对照组的2款产品因为不支持该指令级,因此成绩稳定在测试误差范围内,而Core i9-11900K的成绩则提高了18.0%,因此相比对照组的两款产品的优势也扩大到了和36.9%和23.3%。由此可见AVX512的巨大潜力,一旦能够被应用软件很好的支持,将为英特尔处理器带来巨大的性能增益


UHD 750:提升巨大,但还是亮机卡


相比于和Sunny Cove一脉相承的CPU微架构,Rocket Lake-S在核芯显卡上的进步幅度要更大一些,直接沿用了Willow Cove的Xe-LP架构,当然因为桌面平台不需要那么强的集成图形性能,以及芯片尺寸的限制,在规格上进行了“大刀阔斧”的“阉割”。


Xe-LP架构兼具着作为英特尔冲击独立显卡市场的敲门砖的作用,因此在架构上相比之前Gen 11有了大幅的革新。例如在EU单元上,在Gen 11的2×4 wide SIMD(负责常规的整数及浮点运算)基础上,额外添加了一组负责特殊函数运算的2 wide SIMD,且两部分互相独立运行,从而提升并行计算性能。

多媒体引擎方面,编解码性能提升了一倍,同时引入了AV1硬解码,以保证对下一代主流编码格式的支持。接口方面,4×4K的输出管线对于普通用户来说已然足够,同时对8K、HDR10、Dolby Vision、12bit BT2020色彩空间都提供了支持。只是HDMI 2.1的缺失,使得想要组建HTPC接8K60Hz电视的用户还是不得不去考虑增加一块NVIDIA的独立显卡。

Core i9-11900K上的UHD 750凭借新架构,性能相比Core i7-10700K上的UHD 630有了长足的进步,在3DMark 的Fire Strike和TimeSpy两个测试项目中,性能提升比例分别为69.6%和42.6%。仅从性能提升比例来说不可谓不惊人,然而脱离基准线谈比例都是耍流氓,单纯以UHD 750的性能来评估,还是一块“亮机卡”的水平,难堪大用


综合比拼:微弱优势重夺王座


尽管架构带来的性能提升颇为喜人,但工艺的限制导致Core i9-11900K在核心数量上不得不做出了妥协,这也是我们第一次见到新一代的旗舰CPU型号在核心/线程数量上相比上一代有所缩减的情况。好在除去一些并发性能优化很好的视频编辑或渲染类应用之外,大多数日常应用对超过8个以上核心的调度效率并不高,因此Core i9-11900K在综合性能上,仍然无愧于新一代旗舰的地位。

首先是在同核心数量的时候赢下了Cinebench系列测试。CB20里 Core i9-11900K在单核心下可以拿到636的高分,同时总分也超过了6000分,算是全面压制了Ryzen 7 5800X。Core i7-11700K也跨过了单核心600分大关,相比Core i7-10700K提升了19.3%。对比同样是Rocket Lake-S的两款新品,还能够看出来ABT技术的巨大威力:没有ABT技术的Core i7-11700K的多核-单核成绩比只有9.44,而ABT加持的Core i9-11900K则达到了9.58。


所有的渲染类测试中,基本都得到了与上述类似的结果,包括Blender、 Corona和V-Ray,唯一例外的是英特尔阵营的看家测试POV-Ray,毕竟在这个项目中Core i7-10700K都能够小胜Ryzen 7 5800X,更遑论两款11代的新品了。

3DMark的物理测试,Ryzen 7 5800X表现出了极大的跳跃性,Fire Strike中成绩最好,到了TimeSpy的时候又垫了底。只看英特尔阵营,Core i9-11900K和Core i7-11700K在FS中分别领先Core i7-10700K大概20%和10.7%,在TS中领先幅度有所降低,分别只有8.3%和6.9%。

游戏测试中,几乎仍然是固守各自阵营的状态,在CSGO和《极限竞速:地平线4》中,Ryzen 7 5800X仍然是表现最好的,但Core i9-11900K在Dota 2和《全战:三国》又扳回一城。Core i7-11700K整体表现要稍逊一筹,但其实输的差距并不大,从游戏体验角度上来说,测试的几款处理器都没有本质上的差异。


总体来看,Core i9-11900K确实凭借先进的微架构加上ABT频率提升技术,在大多数测试中夺回了性能的王座,但如果把价格因素考虑进去,那么Core i7-11700K凭借不到3000元的售价,成为了更值得推荐购买的产品


从产品本身来说,Rocket Lake-S属于典型的过渡性产品,考虑到年底新的12代酷睿Alder Lake即将面世,不仅会换用大小核的革命性架构,还会带来诸如DDR5、PCI-E 5.0等全新技术特性,让只有半年皇座的Rocket Lake-S多了一些悲情的意味。不过Alder Lake本身的性能如何还未尝可知,毕竟Windows的多核心调度能力一直以来都不是强项,当初AMD的Zen+和Zen2使用的4+4 CCX结构,尚且还需要Windows打补丁来优化核心调度,Alder Lake的大小核架构,想必也会给Windows操作系统的指令调度提出了不小的挑战。如此看来Rocket Lake-S更像是一个保险,即使Alder Lake短期内“翻车”,靠着Rocket Lake-S,英特尔也依然能在MSDT市场提供足够的产品竞争力。



赞(1)
未经允许不得转载:CHIP奇谱 » 旧瓶装新酒的11代酷睿桌面级处理器
分享到:
广告