作者 |??ZeR0,編輯?|??漠影
安卓旗艦啟動(dòng)性能一致性超越蘋果,讓計(jì)算單元更多運(yùn)行在最佳能效的甜點(diǎn)區(qū)間。
芯東西12月27日報(bào)道,自研芯片技術(shù)已經(jīng)是優(yōu)化手機(jī)終端體驗(yàn)的重要途徑。27日下午,OPPO亮出芯片調(diào)校技術(shù)的最新進(jìn)展,首度公布其自研芯片軟硬融合技術(shù)棧關(guān)鍵的潮汐架構(gòu)。
潮汐架構(gòu)能有效解決影響SoC計(jì)算效率提升的存算分離、芯片調(diào)度兩大瓶頸:
1、對性能的優(yōu)化深入到傳統(tǒng)手機(jī)廠商無法精細(xì)化的片上緩存系統(tǒng),首次實(shí)現(xiàn)系統(tǒng)級緩存及L3緩存的動(dòng)態(tài)匹配,可將平均能效節(jié)約8%。
2、精準(zhǔn)動(dòng)態(tài)調(diào)度SoC計(jì)算單元,使得快手、高德地圖、微博、瀏覽器等應(yīng)用均能效提升明顯。
3、解決了影響系統(tǒng)流暢性的GPU控制顯示時(shí)延一致性難題,讓安卓旗艦手機(jī)的啟動(dòng)性能一致性體驗(yàn)超越蘋果。
除了潮汐架構(gòu)外,面向安全隱私,OPPO獨(dú)家VIP模式提供芯片級權(quán)限加密,內(nèi)置國密認(rèn)證安全芯片,實(shí)現(xiàn)隱私信息獨(dú)立存儲(chǔ)、物理隔離。此外,OPPO預(yù)告潮汐架構(gòu)還會(huì)有重大升級,將進(jìn)一步拓展與聯(lián)發(fā)科的合作伙伴關(guān)系,深度參與下一代天璣旗艦芯片相關(guān)硬件的設(shè)計(jì)。
01.緩存機(jī)制:精細(xì)化利用片上緩存,平均能效節(jié)約8%
OPPO軟件技術(shù)規(guī)劃與架構(gòu)設(shè)計(jì)總監(jiān)洪漢生說,做好芯片調(diào)校,需要兼具好的芯片和軟件能力。當(dāng)前SoC芯片計(jì)算效率提升困難有兩大瓶頸:
1)智能手機(jī)性能鏈路沿用經(jīng)典的馮·諾依曼式結(jié)構(gòu),存算分離,存儲(chǔ)讀寫速度遠(yuǎn)低于CPU計(jì)算速度;
2)芯片的調(diào)度方案缺乏場景級的認(rèn)知。對此,OPPO帶來自研的軟硬芯片融合技術(shù)棧——潮汐架構(gòu)。
據(jù)洪漢生分享,潮汐架構(gòu)是OPPO在手機(jī)芯片調(diào)校領(lǐng)域鉆研多年的綜合成果。這些年,OPPO一直讓一些做系統(tǒng)軟件的工程師學(xué)習(xí)芯片技術(shù),又招聘了大量的芯片設(shè)計(jì)工程師,讓他們理解軟件場景。所以潮汐架構(gòu)是由一群懂軟件、懂系統(tǒng)、懂芯片的技術(shù)專家們共同打造出來的。針對典型馮·諾依曼計(jì)算機(jī)體系結(jié)構(gòu)普遍存在的存算分離問題,洪漢生認(rèn)為,緩存的使用是所有策略中最沒有副作用的、最有效的一個(gè)辦法。
存儲(chǔ)器的金字塔,越往高處,速度越快。因?yàn)閮r(jià)格貴,所以上面幾層容量越來越小。越往下,因?yàn)槌杀緝?yōu)勢,容量能做的比較大。相比內(nèi)存存儲(chǔ),緩存的讀寫速度優(yōu)勢能達(dá)到10倍甚至百倍。如果讓數(shù)據(jù)讀取發(fā)生在金字塔上層,那么整個(gè)計(jì)算鏈路的效率能得到很大提升。用好緩存,有助于實(shí)現(xiàn)性能和功耗的兼顧。OPPO過去幾年在這方面取得了進(jìn)步。相對傳統(tǒng)手機(jī)公司僅能在ROM或RAM進(jìn)行性能優(yōu)化,潮汐架構(gòu)深入到了片上系統(tǒng)緩存及L3緩存。
“里面的辛酸,可能只有我自己知道?!睋?jù)洪漢生回憶,兩年前OPPO團(tuán)隊(duì)決定做的時(shí)候,沒有仿真平臺,更不要說代碼或者開放接口,工程師們只能通過調(diào)整CPU、GPU、DDR的參數(shù),改變投票策略,看緩存的命中和缺失,改一組數(shù)據(jù)就測一個(gè)結(jié)果,硬是用這種“笨辦法”,足足整理了一整年的數(shù)據(jù),進(jìn)行數(shù)據(jù)建模,看明白其中的規(guī)律和原理,從入門到精通,真正理解了技術(shù)。然后,OPPO團(tuán)隊(duì)與芯片廠商深入合作,成立性能和功耗的聯(lián)合實(shí)驗(yàn)室,一起設(shè)計(jì)了從L3緩存到系統(tǒng)緩存的分區(qū)管理機(jī)制。潮汐架構(gòu)基于單場景去判斷當(dāng)前應(yīng)用對系統(tǒng)資源的需求,緩存能夠根據(jù)CPU和GPU進(jìn)行動(dòng)態(tài)配比,并使CPU、GPU等計(jì)算核心在最優(yōu)頻點(diǎn)區(qū)間運(yùn)行。如果是計(jì)算型任務(wù)占多,則主動(dòng)分配更多緩存給CPU;如果渲染型任務(wù)占多,則將資源傾斜給GPU。
洪漢生說,這些方案看上去不復(fù)雜,但如果回到兩年前,“黑盒子”曾經(jīng)就像一座大山一樣擋住了道路,不翻過去,永遠(yuǎn)不會(huì)知道山的那邊是什么樣子的,所幸OPPO團(tuán)隊(duì)翻過了那座大山。經(jīng)測算,在性能無損的情況下,潮汐架構(gòu)可實(shí)現(xiàn)8%的平均能效節(jié)約。
02.算力調(diào)度:動(dòng)態(tài)調(diào)度SoC計(jì)算單元,明顯提升日常應(yīng)用能效
下一個(gè)問題是芯片怎樣做算力調(diào)度。計(jì)算機(jī)CPU有一個(gè)甜點(diǎn)區(qū)間,在這個(gè)區(qū)間里,能效比是最佳的;在這個(gè)區(qū)間外,有時(shí)候?yàn)榱艘稽c(diǎn)點(diǎn)的性能提升,要付出極大的功耗損失。如果一個(gè)場景變得復(fù)雜,計(jì)算需求如何在多個(gè)計(jì)算單元里以最低能耗執(zhí)行?怎樣讓多個(gè)核心都處于這樣的甜點(diǎn)區(qū)間?這是一門復(fù)雜的學(xué)問。
據(jù)洪漢生透露,在OPPO新一代旗艦上,有1+2+3+2的架構(gòu),也有全大核的架構(gòu)。由OPPO與芯片廠商深度合作打造的潮汐架構(gòu),通過對應(yīng)用具體場景的準(zhǔn)確識別,精細(xì)化地進(jìn)行場景調(diào)度分析和精準(zhǔn)的算力功耗匹配,實(shí)現(xiàn)SoC計(jì)算單元的動(dòng)態(tài)調(diào)度,讓計(jì)算單元更多地運(yùn)行在最佳能效的甜點(diǎn)區(qū)間。
在跨平臺的CPU頻率映射上,潮汐架構(gòu)幫助避免了一些過度的算力消耗。
如圖是實(shí)測在重載游戲下滿幀情況的一個(gè)頻點(diǎn)分布??梢钥吹?,性能該釋放時(shí),高頻點(diǎn)不吝嗇,但其他時(shí)候,其調(diào)度控制得非常精細(xì),能夠把整個(gè)頻率能夠壓到非常低。從其他常用的快手、高德地圖、相冊、微博、瀏覽器等各種頭部應(yīng)用測試結(jié)果看,潮汐架構(gòu)使其在SoC整體能耗上取得了3%以上的收益。
洪漢生解釋說,這些數(shù)據(jù)看起來不多,是因?yàn)樾酒苄Р皇悄敲慈菀滋嵘?,而這些,都是真真實(shí)實(shí)的數(shù)據(jù)。
03.流暢性:讓安卓旗艦啟動(dòng)性能一致性超越蘋果
除了能效外,潮汐架構(gòu)還給安卓旗艦手機(jī)帶來了流暢性上的顯著進(jìn)步。洪漢生提到蘋果手機(jī)總是給人以更加流暢的意向。在他看來,安卓手機(jī)的流暢性如果想要超越蘋果,最大的鴻溝就是“總是”這兩個(gè)字。做一次流暢很容易,做百次、千次、萬次也不難,但是做到十萬次、百萬次,需要解決看不到的問題,要實(shí)現(xiàn)基本環(huán)節(jié)的體驗(yàn)始終保持一致。
OPPO是怎么做的?洪漢生分享說,日常使用手機(jī)點(diǎn)開一個(gè)應(yīng)用,從點(diǎn)擊那一刻到這個(gè)應(yīng)用的圖標(biāo)展開,區(qū)間大概是100多毫秒。經(jīng)過長時(shí)間的分析,OPPO團(tuán)隊(duì)發(fā)現(xiàn)要把它做流暢,可能比做一個(gè)游戲120幀還要難。這是因?yàn)橛腥齻€(gè)行業(yè)難題:一是觸控響應(yīng)一致性,二是軟件上的線程調(diào)度一致性,三是GPU顯示時(shí)延一致性。跟GPU強(qiáng)相關(guān)的顯示時(shí)延一致性怎么做呢?安卓手機(jī)采用的是分層次渲染,每一幀的動(dòng)畫顯示都要經(jīng)歷過多次軟件合成、硬件合成,會(huì)在GPU里進(jìn)進(jìn)出出。如果說這是一條生產(chǎn)線,GPU就像是控制中臺,必須有能力根據(jù)整個(gè)生產(chǎn)線上所有環(huán)節(jié)可能產(chǎn)生的任何偏差進(jìn)行及時(shí)糾正,去動(dòng)態(tài)增加時(shí)鐘信號、動(dòng)態(tài)增強(qiáng)GPU驅(qū)動(dòng)能力,只有這樣,才能保證小到幾毫秒級別的時(shí)延,做到始終一致性。
否則,如果整個(gè)生產(chǎn)線錯(cuò)過了一個(gè)時(shí)鐘信號,就會(huì)導(dǎo)致整個(gè)工序往右移,會(huì)出現(xiàn)丟幀和延遲感,帶給終端用戶不好的體驗(yàn),比如點(diǎn)擊圖標(biāo)后沒有響應(yīng),整個(gè)頁面的顯示是姍姍來遲的。在解決掉這三個(gè)問題后,OPPO參考了蘋果的設(shè)計(jì),把響應(yīng)時(shí)間調(diào)到了一個(gè)比較舒適的時(shí)間,不快也不慢,然后用高速攝像機(jī)反復(fù)進(jìn)行測試,最后成功將整個(gè)應(yīng)用的啟動(dòng)響應(yīng)時(shí)間控制得像蘋果那樣非常平穩(wěn)。通過精準(zhǔn)的芯片算力調(diào)度,基于場景動(dòng)態(tài)增強(qiáng)GPU驅(qū)動(dòng)能力,潮汐架構(gòu)解決了影響系統(tǒng)流暢性的GPU控制顯示時(shí)延一致性難題,從而保證了啟動(dòng)性能的一致性。在模擬1天使用的320次應(yīng)用啟動(dòng)測試,OPPO Find X7以低至11ms的啟動(dòng)響應(yīng)標(biāo)準(zhǔn)差,做到了所有旗艦的第一名,甚至超越了以穩(wěn)定流暢著稱的蘋果。
04.國密二級認(rèn)證安全芯片加持,實(shí)現(xiàn)硬件級安全加密
在保障用戶隱私安全方面,OPPO致力于通過全鏈路的應(yīng)用、數(shù)據(jù)管控和軟硬件結(jié)合的創(chuàng)新功能,已取得多項(xiàng)國內(nèi)外安全隱私領(lǐng)域頂級認(rèn)證。
在今年10月發(fā)布Find N3典藏版時(shí),OPPO推出了行業(yè)首創(chuàng)的“VIP模式”,通過三段式物理開關(guān),一鍵就能關(guān)閉麥克風(fēng)、攝像頭、定位等敏感權(quán)限,為用戶隱私進(jìn)行硬件級安全加密。VIP模式也將登陸下一代Find X系列旗艦。OPPO為“VIP模式”加持了一個(gè)通過手機(jī)領(lǐng)域最高認(rèn)證等級的國密二級認(rèn)證安全芯片。該芯片能夠獨(dú)立存儲(chǔ)各種敏感信息,相比傳統(tǒng)的軟件安全方案,芯片級的加密方式可以將敏感權(quán)限的管理、授權(quán)開關(guān),與操作系統(tǒng)分離,鎖進(jìn)安全芯片的硬件層,由芯片級安全子系統(tǒng)進(jìn)行管理。
安全芯片配合通話隱私雙向保護(hù)、隱私信息自動(dòng)打碼、證件照片一鍵水印等隱私功能,從硬件到一系列軟件功能,全方面守護(hù)用戶的隱私安全。
05.結(jié)語:手機(jī)競爭卷向芯片調(diào)校
同一顆芯片,不同的芯片調(diào)校能力,影響了手機(jī)在實(shí)際使用中能夠發(fā)揮的芯片性能。隨著摩爾定律瀕臨失效,每一代芯片制程提升,背后有行業(yè)千億級美元的投入、百萬級工程師的努力,也只能把芯片的整體能效提升百分之十幾。
OPPO實(shí)現(xiàn)8%的平均能效節(jié)約,足見芯片調(diào)校對于優(yōu)化能效表現(xiàn)的重要性。在有限的芯片選擇中,通過軟硬件協(xié)同實(shí)現(xiàn)手機(jī)體驗(yàn)差距的芯片調(diào)校能力競爭,已經(jīng)從手機(jī)巨頭們之間暗戰(zhàn)轉(zhuǎn)化為臺前“秀肌肉”的焦點(diǎn)。
這些終端用戶“看不見”的優(yōu)化,拼得是不止是軟硬件技術(shù)實(shí)力,還考驗(yàn)了手機(jī)大廠們的場景級認(rèn)知、與芯片原廠合作深度等綜合能力。隨著芯片調(diào)校愈發(fā)精細(xì)化,更高的性能、更優(yōu)的能效,更穩(wěn)定的流暢性,結(jié)合越來越多引入的智能優(yōu)化技術(shù),最終將使用戶受益。