CHIP中文版 CHIP中文版

CHIP
专业分享与交流
广告

为了游戏:频率与核心再平衡

作者:原创

又到了每年一度的选择困难期,英特尔发了十代酷睿新产品,不仅核心数量按部就班增加,而且不断优化再优化的制程,带来了难得的极限频率,特别是稳定极限频率的提升。另一方面,AMD也透露了其XT系列Ryzen处理器产品,频率提升同样是主要卖点,而核心数量没有变化。
   

而做为游戏玩家,关心的是如何让游戏在更华丽的画面下运行的速度更快也就是更流畅,其他技术指标都是辅助这一目标达成的工具。游戏性能等于什么,是一个拷问灵魂的问题。通常来说,性能="运行"频率×"使用"核心数量×"优化"效率,每个场景下3个乘数的修饰词各有不同,甚至在应用过程中数量都有变化。

为了游戏:频率与核心再平衡    


   

具体到游戏中,波动特别是持续大幅度波动是此类应用非常典型的特征。由于游戏的主体是一个人,所有吃掉计算力的信息和画面都围绕人的行动因果生成,因此游戏是高度线性化的应用,即前后信息高度关联,难以实现全面并行化转变。目前,市面上仍有超过60%的游戏完全按照单线程逻辑设计优化,其余支持多线程优化的游戏也主要讲并行性优化放在AI(仿真多个"用户")、画面处理(GPU领域)方面,这也是至今为止,游戏仍是频率敏感性应用的原因,而CPU核心有限调用。

今年的处理器新产品,无论是A还是I,频率提升是最主要的话题。其中AMD新的XT系列产品,同级别并未提升基础运行频率,而仅在"最高加速时钟频率"上意思了100MHz~200MHz,并因此3800XT及以上产品的TDP全部为105W,且取消了附赠的Wraith风扇。相比之下,自主掌控制程工艺的英特尔就显得更为激进,账面基础频率和最大睿频均提升了200MHz量级,并且打出了全面超越5GHz、最高5.3GHz的频率新高度。要知道,包括高性能移动版酷睿产品在内,都达到了5GHz这一性能水平。

为了游戏:频率与核心再平衡    


   

另外,随着Turbo Boost Max 3.0、Thermal Velocity Boost等频率提升技术逐步从酷睿i9独享下放到酷睿i7及移动版产品,只要保证散热,处理器运行频率,以及稳定运行能力,都能得到保证,这就牵出频率的"运行"概念。除非锁定频率,多数情况下处理器的运行频率是毫秒级时时变动的,这种变动由"系统"因负载而进行的调整,游戏负载的特点就是高频、大幅波动,这将使系统的自动随动调整应接不暇,甚至步步落后。类似下图所示状态。

另外,高低频率切换是需要时间的,频繁的切换会将会进一步放大性能的延迟,测试软件很难模拟这样的负载波动,除非它自己就是真实互动进行的游戏,非程序化的脚本安排。

超频或者锁定频率时,实际是关闭了频率动态调节功能,以持续高功耗为代价,减少了从负载提升到频率提升的延迟,这也是超频或锁频系统,性能更好的原因之一。

为了游戏:频率与核心再平衡    


   

通过与操作系统、游戏开发者在生态层面的合作,优化出色的处理器能够"预知"高负载的到来,主动保持在高"运行"频率、输出高性能。这也是历代酷睿能够在同频、同数量核心情况下,有更好的游戏表现的深层因素。

根据AMD的说明,提升频率后的XT系列产品,单线程性能提升4%,与其最高加速频率从4.6GHz提升到4.7GHz的幅度基本吻合。英特尔这边情况类似,单线程性能提升幅度在7%~9%左右。这样的性能提升,完全依赖频率提升而来。在更多核心工作甚至全核状态下,处理器运行频率比单核低,其中十代酷睿这一差值"基础"为300MHz,而AMD并不公布全核运行频率这一参数,根据测算,三代锐龙的3900X为500MHz,3900XT系列可能扩大达到600MHz——多线程Boost频率无提升!单核与全核频率差的幅度越大,说明处理器受多核心的散热不足,特别是发热过于集中的负面影响越大。

为了游戏:频率与核心再平衡    


   

针对游戏单线程高速度的应用特点,英特尔及时下放的两项睿频技术非常受用。Turbo Boost Max 3.0(下图)能够自动"挑选"性能最高的核心,使其单/双核运行在频率额外高100MHz的速度下,即针对少量核心的升频技术,是主动技术;Thermal Velocity Boost则是在散热允许的情况下,进一步释放包括全核在内的整个处理器频率,是被动技能。根据产品档次,英特尔逐一将它们下放给十代酷睿产品,其中酷睿i9两者都具备、酷睿i7只有前者,而酷睿i5/i3都没有,智能使用标准版睿频(Turbo Boost)2.0技术。

为了游戏:频率与核心再平衡    


   

AMD也有类似的技术,叫做精准超频(Precision Boost Overdrive,PBO),从特性上来说更接近TVB,处理器频率发挥非常依赖于强劲的散热。这也不难理解为何XT系列发布时,AMD专门强调要使用液冷散热器,同时顺手取消了曾经的卖点——附赠的Wraith幽灵散热器。同时3900XT/3800XT的上市价格较3900X/3800X的现价,均提高了500元。

为了游戏:频率与核心再平衡    


   

目前,主要的游戏开发引擎都已经开始支持多线程。不过由于游戏按时间线顺序进行的特性,因此CPU的不同核心难以完成对单一线程的加速工作,而往往整个游戏的顺滑体验就受制于某个短板。跟多的CPU线程可被分配到游戏的其他线程,如玩家之外的AI角色或场景的预读取。从下图《战地5》的CPU占用率情况不难看出,只有一半(12个)线程是有游戏工作负载的,其中多数处于不饱和状态、高负载的核心曲线也不尽相同。

为了游戏:频率与核心再平衡    


   

十代酷睿i9增加到10核20线程,同时九代产品上被取消超线程技术重新回到了十代酷睿i7上,线程达到16个、可提供30%的多线程性能增益。再加上Turbo Boost Max 3.0和TVB的加速,从游戏到视频,性能提升幅度之大令人咋舌——账面上只有200MHz或300MHz的频率提升。实际上,游戏中大幅的性能增益,更多地来自性能水桶上的频率短板。

为了游戏:频率与核心再平衡    


   

另外,对于游戏体验,所谓流畅度、顺滑更多地是形容帧率高且波动小,前者非常容易理解和通过测试平均帧率获得,而后者则涉及到运行品质问题。通常,我们用特定比例的最低速帧帧率,即运行品质最差部分的帧速来体现。它与平均帧率差距越大,说明系统最差状态下的体验越差;速度波动特定量的帧数比例,数值越大,代表体验变差的帧数越多。

以下一组数据来自最新的3A大作《使命召唤:战区》,分别为九代酷睿的K系列和三代锐龙的X系列产品,比较基准为6C/6T的AMD处理器(大家自行对位)等效平均运行帧率。

为了游戏:频率与核心再平衡    

(以上测试数据,数越大越好)

Intel测试平台:华硕ROG M11H、GeForce RTX 2080 Ti、8GB×4 DDR4-3200、1TB NVMe SSD、Windows 10 Pro 1909

AMD测试平台:华硕ROG C8H、GeForce RTX 2080 Ti、8GB×4 DDR4-3200、1TB NVMe SSD、Windows 10 Pro 1909

平台配置相同,特别是显示卡相同情况下,看似两个平台的平均帧率各自稳定,但实际上两者的游戏运行品质差异较大,更高的处理器速度/频率,对品质最差帧的帮助最大,即能很好地改善画面突然的顿挫,这就是所谓关键帧性能改善靠处理器频率,提升整体性能水平靠多核心。

这组数据同时还说明了另外一个问题:CPU可以更大化发挥显示卡的价值。相同的显示卡配置情况下,仅仅是换用酷睿平台,就能得到10%的性能提升!要知道越是高性能的平台,资金的投入与性能的提升越不成比例,"凭空"而来的性能跃升,相当令人艳羡,这就是生态优化的力量。

为了游戏:频率与核心再平衡    


   

《使命召唤:战区》是完全针对多核心进行完全优化的全新游戏,能够利用到的最大核心数量在8个左右,更多核心/线程对游戏体验提升没有直接帮助。

如果强要释放更多的CPU核心力量,那么FPS类游戏并不是合适之选,《战争机器:战略版》这样的即时战略游戏更为合适一些。可惜此类游戏对系统性能要求不高,开发商也从未认真对多线程进行优化。

为了游戏:频率与核心再平衡    


   

随着主流游戏平台从最初的台式电脑,向更为便携的笔记本电脑迁移,频率与核心数量的竞合平衡点出现了新的变化。特别是移动平台上难以承受更多核心带来的高热问题,笔记本电脑更早地遇到了相应的瓶颈,单纯的依靠制程无法解决次问题。这也不难理解为何移动版处理器目前设计为8核,其中十代酷睿高性能版更倾向于将运行频率拉升到5GHz这样的高水平上,制程仍是14nm,而10nm产品则定位在低功耗的优势上了。由于发热过于集中,7nm制程的锐龙没有提升频率的基础,不能说不是一种遗憾。


赞(0)
未经允许不得转载:CHIP中文版 » 为了游戏:频率与核心再平衡
分享到:
广告