换肤

logo

logo

突破极限 自研架构是成神之路

2018-08-30 10:10:07 | 来源:cfan | 作者:
  • 广告合作请联系QQ755851098
  • 广告合作请联系QQ755851098
未来手机处理器的竞争将是综合实力的较量,自研CPU架构只能抢占先机,而最终结果还要受到SoC内的其它单元影响。

来源:cfan

虽然很不愿意承认,但苹果iPhone 8和iPhone X的确代表了当前智能手机领域的最强性能,哪怕是还未量产的高通骁龙845都难以撼动苹果A11 Bionic处理器的皇者地位。要知道,A11 Bionic明明只是一颗六核处理器(图1),它又是凭什么秒杀一众八核甚至十核竞争对手的呢?

01

 

追本溯源 苹果之强并非先天

很多人只看到了今天iPhone在性能上的辉煌,认为它天生骄傲。实际上,早期的iPhone在性能上并没有领先Android阵营多少,(多核性能)甚至还曾一度落后过。

iPhone也曾随波逐流

还记得第一代iPhone带给我们的震撼吗?超大且支持多点触控的3.5英寸屏幕、可实现全时连接的2G+Wi-Fi网络、完整的Web体验,简直可以吊打当年的塞班和Windows Mobile系统的任何对手。要知道,当年塞班手机清一色还都需要用按键操作,Windows Mobile手机也需要触控笔才能谈得上体验。

那么,当时的iPhone性能很强吗?

的确很强,iPhone搭载了来自三星旗下的S5L8900处理器(图2),并集成PowerVR MBX-Lite GPU模块。这款芯片基于ARM11架构设计,拥有412MHz的主频,再加上128MB内存,堪称无敌配置。可惜,苹果第二代iPhone 3G选择了原地踏步,它的硬件规格不变,只是加入了对新兴3G网络的支持,App Store的诞生则改写了智能手机的玩法。

02

同一时间,谷歌推出了Android系统,以HTC G1为代表的竞争对手在第一时间就实现了配置上的反超(图3):搭载高通MSM7201处理器,集成Adreno 130 GPU,内置更大的192MB内存。也就是从这个时期开始,iPhone和Android手机间的军备竞赛正式拉开了序幕。

03

2009年,iPhone 3GS携代号为“蜂鸟”的三星S5PC110处理器来袭,这颗芯片首次尝鲜AMR最新的Cortex-A8架构,600MHz的主频,再加上PowerVR SGX535 GPU和256GB内存的组合,将智能手机的流畅度发挥到了极致。另一方面,在App Store中还涌现出了无数好玩的iOS独占游戏,至此iPhone游戏多、更流畅,就成为了果粉抵制Android手机的绝佳理由。

那么,Android阵营是如何回击的呢?摩托罗拉推出的Milestone搭载德州仪器OMAP3430处理器(图4),同样集成PowerVR SGX535 GPU并内置256MB内存;HTC从G2开始改用高通MSM7200A处理器,集成Adreno 200 GPU,内置288MB内存。也就是从这个时期开始,让玩家们认识到手机GPU和系统优化的重要性,因为HTC G2玩游戏没有Milestone快,而Milestone又不如iPhone 3GS。

04

开启自研CPU之路

面对Android阵营咄咄逼人的进攻态势,苹果做出了一个重要决定:通过自主研发CPU,逐渐摆脱来自三星芯片方面的依赖。于是,从iPhone 4开始,苹果A系列处理器终于正式与我们见面了。

iPhone 4搭载Apple A4处理器,它基于ARM官方Cortex-A8架构设计,我们可以将它看做是三星S5PC110的定制版(图5);从iPhone 4s的Apple A5开始,苹果A系列处理器跨入了双核时代,由Cortex-A9同步双核心架构组成,基本与同期Android阵营高端手机的规格持平。

05

步入2012年后,NVIDIA、三星和高通纷纷祭出了四核处理器,而苹果却不愿意盲目追随市场潮流,打算坚持既有产品设计原则的态度。为了不让双核战四核输的太难看,苹果从Apple A6开始,才算进入了真正意义上的自研CPU之路上。因为,Apple A6不再使用ARM公版的Cortex-A系列架构,而是改用苹果基于ARMv7s指令集自主研发的“Swift”架构核心(图6)。

06

苹果自研的架构有多强?我们不妨参考一下它与同期Android阵营标杆三星Galaxy S的跑分对比(表1),从Apple A6开始苹果处理器总能在单核性能上保持绝对的优势,只是受制于核心数量偏少以及核心调度策略(同一时间点上只有高性能核心或低功耗核心运行)上的先天缺陷,导致苹果A系列处理器在多核性能上就很难与同期的对手拉开差距。

t2

但是,这已经足够说明问题了。苹果从Apple A6开始,在核心数量少、内存容量低的绝对劣势下,却能在CPU跑分层面保持一定的优势,可见ARM官方Cortex-A架构并没有挖掘出ARMv7/ARMv8指令集的全部潜力,而这就给了芯片厂商自研架构核心的空间。到了AppleA11 Bionic时代,更是成就了苹果处理器秒天秒地的威望,成为了一个似乎无法战胜的存在(表2)。

t3

苹果为何钟情于自研

智能手机是一种极为精密的电子设备,它的PCB主板是一个整体,除了处理器芯片外还要涉及到其它器件的布局和走线(图7)。此时,如果直接使用高通或三星的处理器,就必须按照对方的芯片规格设计PCB,一旦芯片厂的下一代产品发生较大变化,苹果方面也会因此而产生不必要的重新设计的成本。

07

另一方面,苹果从很早以前就发现,现在根本就没有厂商在做自己所需要的处理器,苹果需要比竞品更强的性能,计划通过追求深度无序的执行和广泛的问题宽度来走向ARM不曾走过之路。于是,在HTC和摩托罗拉等品牌都在依赖高通提供的处理器时,苹果就展开了各种收购和组建自己工程师团队之旅,最终在Apple A4上引入了以早前收购为基础而开发出的专用芯片组和控制器。

正如前文所述,Apple A6是苹果自研处理器道路上的关键节点,它虽然使用了ARM指令集但却不再沿用现成的公版设计。凭借着资本优势,苹果在2013年发布了全球首款64位智能手机芯片Apple A7,同时还衍生出了配备更强大图形处理性能的X变种型号(应用在iPad身上)。到了A10 Fusion时代,苹果正式迈入了四核时代,在全新动态电压频率调节模式和性能控制器的帮之下,可更有针对性对核心负载进行智能管理,比如做到让某些核心完全关闭,能耗管控能力远超Android阵营芯片(图8)。

08

苹果的自研野望

不要以为苹果只专注于手机处理器的研发,第一代Apple Watch所搭载的也是苹果自主研发的Apple S1,一颗针对可穿戴设备量身设计的超微型芯片(图9),随后的Apple Watch2则升级到了双核心的Apple S2,拥有2倍于前辈的图形性能。在AirPods无线耳机身上,我们还看到了革命性的超低功耗Apple W1芯片(图10),它解决了普通蓝牙耳机的断续情况,还可提供更好的音质和更低的功耗。

09

09-1(和09拼一起)

10

总之,通过A系列处理器的研发经验积累,苹果已经奠定好了为旗下产品自主设计硬件“垂直整合”战略的基础。从AppleA11 Bionic开始,苹果更是抛弃了最紧密合作伙伴 Imagination Technologies,开始定制自主的GPU架构,一旦取得重大的技术突破,苹果自研的GPU无论是芯片面积还是性能,都能比之前Imagination Technologies提供的GPU内核更适合Apple A系列SoC整体芯片的结构设计。

此外,苹果还展开了自主研发调制解调器的计划,从而摆脱高通和英特尔的掣肘。可以说,苹果未来的野望就是将整个SoC内全部模块的主动权都收集到自己手中,在恰当的时机甚至会将它们应用Mac系列的PC领域,打通Mac OS和iOS系统之间的兼容壁垒,届时我们使用PC的习惯也将因此而产生质变。

不让苹果独美于前 来自竞争对手的挑战

细心的读者不难发现,对手机处理器而言,只要核心架构相同,主频相近,它们在跑分性能上就很难拉开差距。为了不让苹果A系列处理器独美于前,以高通和三星为代表的芯片厂纷纷展开了反击。

高通的BoC战略

在上个章节我们介绍过,高通旗下的Kryo内核在骁龙820时代就实现了完全自主的定制化,为何从骁龙835身上又改用BoC的半定制化战略呢?很简单,高通的每一代处理器,都会根据时间和市场需求来选择最合适的CPU设计。通过指令集授权而完全自主定制处理器不太经济,而高通又觉得ARM big.LITTLE技术已经不符合实际应用环境的需求,所以才促成了基于BoC授权而生的骁龙835(图11)。

11

简单来说,骁龙835和骁龙820一样都是两簇核心,分别为四颗Kryo 280(2.45GHz)性能核心和四颗Kryo 280(1.9GHz)效能核心,与ARM官方架构遵循的Big.LITTLE大小核技术不同,这八颗核心均为大核心设计。高通认为,智能手机无时无刻都在与多媒体打交道,哪怕运行微信也会涉及到大量的文字、图片和视频处理,而公版Cortex-A53核心连乱序执行都没有,需要借助更高的频率才能满足微信突发的性能请求。高不成低不就的LITTLE小核心在处理社交类APP经常面临吃力不讨好的尴尬局面,最终还是需要Big大核心登场。

于是,高通自行设计了骁龙835的内存控制器,保证了I/O性能并加大了二级缓存,可减少读取内存,在APP加载、网页浏览、VR下能提高20%性能,手机应用中80%的任务可交由1.9GHz的效能核心处理,能耗比远在传统big.LITTLE技术之上。

对于即将量产的骁龙845,高通带来了全新的Kryo 385架构内核,从已知的资料来看它应该是基于ARM最新的Cortex-A75和A55魔改而来,最大的特色就是引入了DyanmIQ技术(图12)。和Big.LITTLE相比,DyanmIQ重新定义了多核微架构,允许DynamIQ 任意丛集中核心数量可以从单核到八核不等,并且还支持异构CPU之间的混搭。有了更灵活分配核心资源的DyanmIQ技术的帮忙,高通才敢在10nm工艺不变的基础上,将最高主频从2.45GHz一下子提升到2.8GHz。

12

据悉,高通在2018年计划推出更多基于BoC授权的处理器,包括骁龙670、骁龙640和骁龙460(图13)。其中,骁龙670将采用四颗Kryo 360 Gold(Cortex-A75公版架构魔改)和四颗Kryo 385 Silver(A55魔改)组成的八核心架构,集成Adreno 620 GPU;骁龙640采用两颗Kryo 360 Gold和六颗 Kryo 360 Silver(A55魔改)组成的八核心架构,集成Adreno 610 GPU;骁龙460由四颗高频Kryo 360 Silver和四颗低频Kryo 360 Silver核心构成(均由A55魔改),集成Adreno 605 GPU。

t4

遗憾的是,从网上曝光的骁龙845性能来看,它的单核/多核性能分别为2422和8351,和公版Cortex-A75的理论性能相似,距离苹果A11 Bionic单核超4000,多核破万的成绩相比还很遥远。希望随着固件和驱动的优化,等骁龙845正式上市时能给我们带来性能上的惊喜吧。

三星的自研大核计划

三星从Exynos 8890开始就学习苹果展开了自研CPU的旅程,基于ARMv8指令集推出了名为猫鼬(Mongoose)的架构核心。从Exynos 8890、Exynos 8895到Exynos 9810,猫鼬架构也经历了不断升级,即将随Galaxy S9与我们见面的,就是基于三星第三代自研架构——Mongoose M3设计的Exynos 9810(图14)。

14

简单来说,Exynos 9810基于10nm LPP工艺打造,由四颗Mongoose M3(2.9GHz)和四颗Cortex-A55(1.9GHz)组成的八核心架构,集成ARM Mali-G72MP12 GPU。据悉,Mongoose M3自研架构的性能极为强悍,在GeekBench 4跑分中单核成绩可达4000分,多核性能有望破万。如果属实,Exynos 9810将具备和苹果A11 Bionic分庭抗礼的实力。

可惜,三星从Exynos 8890时代起自研架构就仅限于大核部分,而小核总是套用ARM公版A53/A55架构。如果三星可以参考苹果和高通,将大小核全部换成自研核心(哪怕小核是BoC),相信综合性能还能再上层楼。

小结

对智能手机而言,更高的跑分成绩虽然并不具备什么实际意义,但对于新款手机而言,跑分成绩低却是万万不成的,而将CPU架构从公版换成自研,无疑就是一条捷径。除了高通和三星,有消息称华为也开展了自研内核计划,也许很快就会有相关的芯片与我们见面。

当然,我们也不鼓励盲目的自研,毕竟研发成本最终是要转嫁到每一个消费者头上,而且影响手机实际体验的,除了CPU部分外还有CP U、ISP、DSP、调制解调器和AI相关单元(图15)。未来手机处理器的竞争将是综合实力的较量,自研CPU架构只能抢占先机,而最终结果还要受到SoC内的其它单元影响。

15

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
  • 广告合作请联系QQ755851098
  • 广告合作请联系QQ755851098

我要评论

共有 0 条评论

最新评论

会员登录 ×