CHIP 首页 资讯 查看内容
253

初露峥嵘 麒麟980性能详解

初露峥嵘 麒麟980性能详解
收藏 分享 邀请

2018-9-10 15:55   -Aa +Aa

95日,在IFA上就吸引关注目光的华为新一代手机处理器麒麟980回到国内,华为fellow艾伟曝光更多产品细节和特性,这款即将在1016日正式随新旗舰Mate 20一同上市的产品更加令人期待。

麒麟910920930950970,一路走来华为手机处理器不断地推高这一市场的门槛,到这一代麒麟980,更有底气地一口气讲出6第一。艾伟强调,华为不考虑将麒麟产品授权给其他厂家使用,这样更有利于专注提升从SoC到终端产品的整体素质。目前,中高端移动处理器市场基本被高通、华为和苹果瓜分,三星、MTK等产品已经被边缘化,难以形成整体市场竞争力。其中高通专注提供平台解决方案,为各家手机厂商提供关键芯片和配套解决方案,而华为和苹果,均只为自家供应芯片,同时华为采用多供应商策略,除了麒麟之外,也在部分使用其他厂商产品。

虽然没有直接表明具体投入金额数量,但艾伟明确表示,在新一代7nm制程的麒麟980处理器上的研发投入远高于外界所猜测的3亿美元,投入周期已经超过3年;高额投入是确保产品性能和按计划上市的必要保障,此前台积电晶圆厂的中毒停产事故没有影响到麒麟980的出货进度,1016日首款配备麒麟980处理器的Mate 20就将在伦敦发布,随即批量上市;同时在明年1季度之前,该产品也不会遇到产能竞争的问题。把这些话翻译出来,就是华为拿到TSMC 7nm产能时间较早,良品率不是问题;目前已经有相当多成品备货;半年内其他竞争品牌没有7nm产能需求,升级制程需要巨大的资金投入,不是每个人都玩得起的。

在半导体领域,制程和集成晶体管的数量,是产品性能的直接体现。提前3年对新制程进行规划和研发投入,并且按照既定节奏出货,也体现出华为对产业链的掌控能力大大提升。麒麟980可谓是目前集成晶体管数量最多的移动SoC产品.7nm制程帮助下,其更多的69亿晶体管、更高的2.6GHz工作频率,功耗水平还进一步下降,为后期终端产品开发提供了更宽的冗余度。回顾4年以来麒麟系列产品走过的制程升级道路,可谓是一步一个脚印、一步一个台阶。当然,艾伟也承认,未来继续制程升级所需要投入的成本将更高,无论是资金、人力还是时间,都将成倍提升,华为在研发方面的投入还会继续增加,以保持业界领先地位。

敢于使用新技术,并且能够消化新技术,还可以根据自身需要,将优势技术进一步集成、调度有方,华为在麒麟系列产品上越来越自信。在麒麟980上,华为率先使用了新一代的Cortex-A76架构,并且创新地使用了2高频+2低频大核的组合方式,再加上4MB L3 CacheDSUDynamIQ Shared Unit)帮助下打通8个核心共同缓存,直接性能及架构,都具有明显的优势。艾伟明确回复CHIP,两簇A76架构完全相同,只有频率方面的差异。

根据分析,这两簇A76核心的描述上的“Based”字样,结合仅频率上差异的表述,实际是是加入了AI的智能预调度机制,从被动的先负载增加再切换核心/调升频率,变为预判高负载来临、提前调度核心,这个提前量很大程度上依赖数据在L3 Cache内存储过程的分析,两者互为因果。同时,由于两簇大核架构上完全相同,因此在特定时间节点上,指令无需任何加工可以同时分别发射给两簇核心,不会因为分支预测错误、重新分配任务而造成QoS下降,转换为用户端的体验就是性能平滑、波动小。当然,更大的Cache有利于提高预测命中率,晶体管代价也就更大,4MB容量至少消耗2亿个晶体管。CPU只是麒麟980中的很小一部分功能,2亿个晶体管已经相当可观——都是钱呀!

麒麟9808个核心的调度机制叫做Flex-Schedulingscheduling字面上就带有预先安排的意味。的确,按照华为给出的3簇核心所执行任务的分配情况来看,是否启用相关核心,是有相关预案的。结合EMUI系统,手机将从用户行为和云端大数据两个数据来源来优化调度过程,提升产品使用体验。从华为提供的示意图来看,3簇核心竟然是可以并行使用的,在这个特性上,CHIP对此持保留态度。

AI预判、智能调度机制支撑下,华为宣称可将下图中白色传统负载预测记过优化为橙色的AI负载预测结果,实际效果有待进一步观察。

根据CHIP此前的测试结果,运行于手机上的主要游戏,还保持着重载CPU的模式,而像GPU的负载迁移还不多。这也可以解读为,更多的游戏还比较依赖CPU,而手机端GPU应用还局限在部分游戏上,PC上常见的视频处理、GPU加速和通用计算任务,在手机上不会出现或是早已有专用硬件处理单元,不劳GPU参与。

移动处理器中图形性能提升幅度克制,从侧面反映了GPU应用有限的现状,这也是过去麒麟系列产品被抱怨图形性能不足却不大影响用户体验的原因。现在好了,麒麟980开出了两剂良方:GPU Turbo和首款Mali-G76,而且还是MP10720MHz)。前者已经被广泛用于麒麟970Mali-G72MP12上,细节随不透明但效果很好,实测图形性能提升幅度达50%~70%,对用户体验更为直接的帧率稳定性上的表现更为出色。而首款Mali-G76首度商用,据称同频率同管线情况下的性能提升50%!华为公布的数据为G76MP10@720MHzG72MP12@746MHz直接提升幅度为46%,折算频率和管线后的提升幅度为80%G76也是ARM首款专为7nm制程优开发的产品,晶体管数量增加全靠制程消纳。


 

GFXBench对游戏功耗的预测(上表),对比华为公布的麒麟980数据(下图),稍微变换一下单位,就是G76MP1222.88fps/W,当然S9+所代表的骁龙845(芯片1)应该是15.50fps/W。个中数据偏差,CHIP就不过度解释了,毕竟测试条件有所不同。等比放大后,与上表的预计,在数值上是吻合的,差别是在MP10 vs. MP12上。

麒麟970是一款非常成功的产品,于今天这个时间点再评论性能因素更是没有意义,它成功地成为华为手机的旗舰标配,不仅自身是旗舰,同时也被广泛配备到华为各个系列的旗舰产品中,价位覆盖下至2000元上过万的范围。从长期来看,麒麟980也将是这样的布局,寿命周期1年以上。

在这样的大背景下,局部突出的规格规划是非常有风险的,平衡或者说均衡非常重要,麒麟970就是这么成功的,麒麟980延续着这个套路。从这个方面来解读麒麟9806个第一就不难理解了——一定程度和时期的超前,确保在更广市场和更长时段内的产品稳定。

基于这一考虑,在率先引入了7nm制程、A76架构、G76架构之后,被麒麟980拿到显眼位置提升的性能硬件就是内存了。LPDDR4X-2133的引入,显得那么理所应当,而且非常务实,带宽的提升和延迟的下降都非常直接,并且直接缓解CPUGPUNPU的吞吐压力,只要供应链跟得上,全线普及没有难度。预计其他厂商也将很快跟进,毕竟三星海力士们乐见。在频率提升的趋势下,双通道内存更没机会出现在手机产品上,功耗、空间、内存控制器、收益,都明显消耗比收益高,毕竟内存频率提升的前提就是功耗和封装均不变。目前,东芝和海力士都已经可以品量供应LPDDR4X-2133 128Gb的产品,8GB内存标配的时代来临了。

严格意义上来说,LPDDR4X只是LPDDR4的电压/功耗降低版,而非下一代产品。下一代的LPDDR5今年年中刚刚发布,距离量产还有些时日。

类似情况也发生在存储接口上,比肩PCI-E性能的UFS 3.0看起来很美,不过它也是刚刚发布几个月的技术,批量供应还是问题,要不然苹果也不会放出风来,要甩开三星海力士自己在iPhone上搞PCI-E存储。这条路好不好走,下周iPhone发布就知道了。

在产业链、供应链可靠之前,小步快跑的麒麟980,选择的是稳妥。

与提升速度不同的是,麒麟980ISP(图像处理器)、NPU(神经网络处理器)却走上了核心数量增加的道路。双ISP+双核NPU,表述不同,原因是相应单元在核心架构上的位置差异,下图是麒麟980的核心架构示意图,比较准确传神地说明了问题。

NPU很神奇,苹果、高通也都先后在移动处理器中加入了相应的硬件单元,但是如何用好却是问题。发布1年以来,麒麟970NPU应用基本集中在华为自家的拍照及相关应用中,如果麒麟980仍局限于此,那这一年过得就太没价值了。

CHIP编辑还在怨念着NPUSDK(软件开发工具),华为又放了大招。华为公布了麒麟980IA性能参数,并开放从拍照、ARAIHiAI架构)的整个融合架构及相应功能的DDK(设备开发工具)。一字(母)之差,价值可差远了。使用DDK,第三方应用开发者可直接使用汇编级的语言调用底层硬件,效率和可控资源不可同日而语。特别是华为直接提供了SLAM算子及其数量信息,换言之开发者不仅知道用什么工具还知道麒麟980有多少计算能力,能做什么、能调用多少,就看应用了。从这点来说,华为的心态真是相当开放,毕竟基于其AI功能和性能开发出的优秀应用,会为采用麒麟980芯片的手机添彩、给华为加分。

从华为公布的AI架构以及慧眼2.0图像识别架构来看,麒麟980切实落实了以视觉为主的加速特性。NPU核心数量的增加,主要提升了物体识别的实时性、提高实时分割的精准性 ,以及从静态的照片识别提升到动态的视频识别。目前,无论是广义的AI应用,还是终端的AI应用,能够大量消耗处理能力的仍然只有图形图像识别这一类。好在各家AI体系逐步开放后,软件开发者会让应用丰富起来,让我们拭目以待。

除了后端的AI,麒麟980的双ISP也着眼增强拍照同时的视频处理能力,即一个管静态,另一个管动态,管它们实时的优化处理工作。真是因为两个ISP是分头工作的,单个性能无明显证据提升,因此其4K视频拍摄能力到底是30Hz还是更高的60Hz还有待观察,同时这一性能还需要索尼配合——提供具有相应处理能力的IMX传感器,比如7月刚发布的那块IMX 586,支持4K@90Hz,正好9

最新评论 微博评论

Copyright (C) 2009-2012 chip.cn, All Rights Reserved.弗戈博达(北京)广告有限公司 京ICP备14006847号-3