目前,高端智能手機 CPU 都有一個叫做“神經(jīng)處理單元”的處理架構(gòu),但這真的會影響你嗎?
科技巨頭們已經(jīng)完全接受了人工智能革命。蘋果(Apple)、高通(Qualcomm)和華為(Huawei)生產(chǎn)的移動芯片,旨在更好地解決機器學(xué)習(xí)任務(wù),每種芯片都采用了略有不同的方法。華為今年在 IFA 上推出了麒麟 970,其被稱為第一個有專門的神經(jīng)處理單元(NPU)的芯片。接著,蘋果推出了 A11 仿生芯片,iPhone 8、8 Plus 和 X 搭載的都是這款芯片。A11 仿生特性就是蘋果所說的“專為機器學(xué)習(xí)而設(shè)計”的神經(jīng)引擎。
上周,高通宣布推出 Snapdragon 845,它將 AI 任務(wù)發(fā)送到最合適的內(nèi)核。這三家公司的做法并沒有太大的差別,最終歸結(jié)為每個公司向開發(fā)者提供的接入水平,以及每個設(shè)備的耗電量。
在討論之前,讓我們來看看 AI 芯片是否與現(xiàn)有的 CPU 完全不同。最近,在行業(yè)中,經(jīng)??梢月牭降年P(guān)于人工智能的術(shù)語是“異構(gòu)計算”。它指的是使用多種類型的處理器的系統(tǒng),每個處理器都有專門的功能,以獲得高性能或降低功耗。這個想法并不新穎,現(xiàn)在許多芯片組都使用異構(gòu)計算,蘋果、高通、華為這三家新推出的芯片只是在不同程度上使用了這個概念。
過去三年,智能手機 CPU 一般都采用了 Arm 的 big.LITTLE 架構(gòu),該架構(gòu)將速度相對較慢、節(jié)能的核心與更快、耗電更快的內(nèi)核進行配對。主要的目標(biāo)是盡可能少的使用電源,以獲得更好的電池壽命。第一批使用這種架構(gòu)的手機包括擁有自主研發(fā)手機處理器 Exynos5 芯片的三星 Galaxy S4,以及華為的 Mate8 和 Honor6。
今年的“人工智能芯片”將這一概念向前推進了一步:要么增加了一個專門的組件來執(zhí)行機器學(xué)習(xí)任務(wù);要么,在 Snapdragon 845 的情況下,使用其他低功耗內(nèi)核來執(zhí)行。例如,Snaplong 845 可以利用它的數(shù)字信號處理器(DSP)來處理需要大量重復(fù)計算的長時間運行的任務(wù),比如偵聽熱詞。高通公司產(chǎn)品管理總監(jiān) Gary Brotman 表示,像圖像識別這樣的活動,是由 GPU 更好的管理的。Brotman 負責(zé) Snapdragon 平臺的 AI 和機器學(xué)習(xí)。
與此同時,蘋果的 A11 仿生應(yīng)用在其 GPU 中使用了一個神經(jīng)引擎,以加快人臉識別,Animoji 和一些第三方應(yīng)用的速度。這意味著,當(dāng)啟動 iPhone X 上這些過程時,A11 就會打開神經(jīng)引擎,進行必要的計算,要么驗證你是誰,要么把你的面部表情映射到對話框。
在麒麟 970 上,NPU 接管了一些任務(wù),比如掃描和翻譯用微軟翻譯器拍攝的圖片中的單詞。微軟翻譯器是目前為止唯一針對該芯片組進行了優(yōu)化的第三方應(yīng)用程序。華為表示,“HiAI”異構(gòu)計算結(jié)構(gòu)最大限度地提高了其芯片組中大多數(shù)組件的性能,因此,它可能會將人工智能任務(wù)不僅僅分配給 NPU。
A11 仿生的兩個“性能”核心和四個“效率”核心
除了差異之外,這個新的架構(gòu)意味著,以前在云端處理的機器學(xué)習(xí),現(xiàn)在可以在設(shè)備上更高效地執(zhí)行了。通過使用 CPU 以外的部分來運行 AI 任務(wù),手機可以同時做更多的事情,因此在等待翻譯或找到要找的圖片時,不太可能會遇到延遲。
另外,在手機上運行這些過程,而不是把它們發(fā)送到云端,對保護用戶隱私也有好處,因為這減少了黑客獲取用戶數(shù)據(jù)的潛在機會。
這些 AI 芯片的另一大優(yōu)勢是節(jié)省能源。電力是一種寶貴的資源,需要審慎分配。GPU 傾向于吸收更多功率,所以如果 DSP 的能效更高,效果相似,那么最好是利用后者。
需要說明的是,在執(zhí)行某些任務(wù)時,并不是芯片組本身決定要使用哪個內(nèi)核。Brotman 說:“今天,這取決于開發(fā)者或 OEMs 的運行方式?!背绦騿T可以使用支持的庫,比如谷歌的 TensorFlow(或者更確切地說,它的 Lite 移動版本)支持的庫來指定在哪些內(nèi)核上運行他們的模型。
高通、華為和蘋果都在使用 TensorFlow Lite 和 Facebook 的 Caffe2 這樣最受歡迎的神經(jīng)網(wǎng)絡(luò)庫。高通還支持較新的開放神經(jīng)網(wǎng)絡(luò)交換(ONNX),而蘋果通過其核心的 ML 框架為更多機器學(xué)習(xí)模型增加兼容性。
到目前為止,這些芯片都沒有帶來很明顯的好處。不管芯片制造商吹噓他們自己的測試結(jié)果和基準(zhǔn),這些最終都是毫無意義的,直到人工智能成為我們?nèi)粘I钪懈匾囊徊糠?。我們正處于設(shè)備上機器學(xué)習(xí)的早期階段,而且使用新硬件的開發(fā)人員寥寥無幾。
不過,顯而易見的是,這場使在設(shè)備上執(zhí)行機器學(xué)習(xí)相關(guān)的任務(wù)更快,更省電的競賽正在進行。我們只需要再等一段時間,就能看到這個架構(gòu)對 AI 的真正好處。
更多相關(guān)內(nèi)容,歡迎點擊人工智能繼續(xù)閱讀!
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!