三级国产片在线观看,91精品国产丝袜在线国语

Waymo早在2008年就開始投入自動駕駛，當(dāng)時還屬于谷歌X事業(yè)部，不過14年過去，Waymo幾乎一事無成，聲音也越來越小，根本的原因就是Waymo對軟件算法過分重視，忽視了硬件平臺。這幾年英偉達、高通自動駕駛芯片的崛起與Waymo的沒落形成鮮明對比。自動駕駛的軟件和硬件是硬幣的兩面，無法分割，整套解決方案必然包括軟件和硬件。單獨提供軟件或硬件都沒有出路，因為自動駕駛軟硬件配合度要求太高，很難移植。這主要是深度學(xué)習(xí)算法模型與硬件高度捆綁，兩者不匹配很容易導(dǎo)致效率低下，硬件的利用率低到10%以下是經(jīng)常遇到的。

Waymo早期是采用英特爾芯片做計算平臺的，主要是基于服務(wù)器 CPU至強和FPGA加速卡。

圖片來源：互聯(lián)網(wǎng)

Waymo計算平臺，其中以太網(wǎng)交換機應(yīng)該也是用FPGA搭建的，因為這么高帶寬的以太網(wǎng)交換機現(xiàn)在還沒有量產(chǎn)，幾年前更不可能有了。只有FPGA能做到如此高的帶寬，代價是價格很高，至少在1000美元以上。還有兩個至強CPU之間應(yīng)該還需要PCIe交換機。

FPGA可能是Arria 10 1150GX，目前售價大約2000美元，2013年時可能要4000美元以上。Altera的FPGA共有四大系列，分別是頂配的Stratix系列、成本與性能平衡的Arria系列、廉價的Cyclone系列、帶NVM的MAX系列。Stratix系列多在近萬美元以上，Arria系列大約在2000-5000美元之間，Cyclone系列多在10-20美元之間。Arria系列再細分10、V、II、GX四個系列，10系列為最新產(chǎn)品，于2013年推出，采用20納米工藝，GX為第一代產(chǎn)品，2007年推出，采用90納米工藝，II系列為2009年產(chǎn)品，采用40納米工藝，V系列為2011年產(chǎn)品，采用28納米工藝。10系列再分為帶ARM內(nèi)核和不帶ARM內(nèi)核兩大類。ARM內(nèi)核為雙A9內(nèi)核。

1150GX擁有標(biāo)準(zhǔn)FPGA的1150K個邏輯元素外，還擁有1518個硬核單精度浮點運算乘法器/加法器，3036個18*19乘法器。最終能夠獲得3340GMACS（等于每秒百萬次的定點乘累加運算），還有1366 GFLOPS的浮點運算能力。AI算力最高是26TOPS@Int8。在2013年這個算力可以算是非常驚人的，價格當(dāng)然也很驚人。

FPGA是效率最高的運算單元，F(xiàn)PGA之所以比CPU甚至GPU能效高，本質(zhì)上是無指令、無需共享內(nèi)存的體系結(jié)構(gòu)帶來的福利。馮氏結(jié)構(gòu)中，由于執(zhí)行單元（如CPU核）可能執(zhí)行任意指令，就需要有指令存儲器、譯碼器、各種指令的運算器、分支跳轉(zhuǎn)處理邏輯。由于指令流的控制邏輯復(fù)雜，不可能有太多條獨立的指令流，因此GPU使用SIMD（單指令流多數(shù)據(jù)流）來讓多個執(zhí)行單元以同樣的步調(diào)處理不同的數(shù)據(jù)，CPU也支持SIMD指令。而FPGA每個邏輯單元的功能在重編程（燒寫）時就已經(jīng)確定，不需要指令。

FPGA中的寄存器和片上內(nèi)存（BRAM）是屬于各自的控制邏輯的，無需不必要的仲裁和緩存。對于通信的需求，F(xiàn)PGA每個邏輯單元與周圍邏輯單元的連接在重編程（燒寫）時就已經(jīng)確定，并不需要通過共享內(nèi)存來通信。FPGA實際就像是一片SRAM，它沒有AI芯片難以克服的內(nèi)存墻問題，有點像存內(nèi)計算，但要比存內(nèi)計算規(guī)模大太多了。FPGA的硬件利用率可輕松做到80%以上，因此FPGA的頻率都比較低。

但FPGA的布線沒有優(yōu)化，有大面積的硅片資源閑置，浪費了，這導(dǎo)致其成本飛速上升，小規(guī)模的FPGA價格很低，一旦越過30-50萬邏輯單元，價格直線飛升。

Waymo的計算平臺單芯片成本就已超過4000美元，并且都是非車規(guī)的，顯然這無法量產(chǎn)。2019年以后，Waymo的聲音就慢慢沉寂，而軟硬一體的高通和英偉達發(fā)展越來越順利。

眼看英偉達和高通一飛沖天，Waymo也幡然悔悟，2021年就開始籌劃與三星推出自動駕駛芯片，正式推出可能在2023年底。和英偉達、高通相比，Waymo的劣勢在于英偉達和高通都是芯片巨頭，兩者出貨量巨大，特別是高通，能夠大幅度降低芯片成本。Waymo訂制芯片，出貨量必然是很低的，谷歌的TPU用在數(shù)據(jù)中心，成本敏感度不高，但汽車不行。同時谷歌的TPU出貨量相對自動駕駛汽車還是不低的。

要做到商業(yè)化，成本是必須考慮的。Waymo找到了三星做合作伙伴，三星每年手機CPU芯片上億，足以和高通抗衡，足以攤薄成本。三星與谷歌合作是從谷歌第一代手機芯片Tensor開始。高通的Snapdragon Ride平臺目前是SA8540p+SA9000。SA8540p近似于高通手機5納米芯片888，只不過SA8540p可能采用4大核4小核的設(shè)計，即4個Cortex-X1加4個A78。去掉了強調(diào)A55小核。高通以此還衍生出針對筆記本電腦的8cx gen3，與SA8540p非常近似，但去掉了5G modem。

能做手機SoC，就能做自動駕駛芯片，三星、蘋果、聯(lián)發(fā)科都可以。

圖片來源：互聯(lián)網(wǎng)

谷歌第一代Tensor芯片，用于谷歌Pixel 6系列手機上，實際就是基于三星Exynos 2100的修改版。

第一代Tensor與三星Exynos 2100對比

圖片來源：互聯(lián)網(wǎng)

在NPU方面，Exynos 2100是壓倒性優(yōu)勢的26TOPS，谷歌是5.7TOPS。不過在實際測試中，Exynos 2100優(yōu)勢不明顯。

圖片來源：互聯(lián)網(wǎng)

驍龍888、谷歌Tensor與Exynos 2100的NNAPI即神經(jīng)網(wǎng)絡(luò)測試跑分，谷歌Tensor優(yōu)勢明顯。

NLP自然語言處理方面，谷歌Tensor優(yōu)勢非常明顯。

圖片來源：互聯(lián)網(wǎng)

離線圖像分類跑分測試，Tensor差距也不算大。

圖片來源：互聯(lián)網(wǎng)

Waymo的自動駕駛芯片不大可能基于第一代Tensor，因為第二代Tensor已于2022年7月底量產(chǎn)了。Waymo的自動駕駛芯片很有可能基于第二代Tensor，目前未有基于第二代Tensor的消息，但很顯然，三星不會給谷歌做太多工作，應(yīng)該就是Exynos 2200的修改版，畢竟第一代Tensor的具體型號就是Samsung Exynos Tensor GS101，從型號就能看出，這是Exynos2100的修改版。

圖片來源：互聯(lián)網(wǎng)

Waymo的自動駕駛芯片芯片應(yīng)該會基于三星4納米工藝。超大核應(yīng)該還是兩個Cortex-x2，而不是Exynos的1個。兩個Cortex-710的中核，四個A510的小核。GPU方面估計也是基于AMD RNDA2代的GPU，足以和高通的Adreno 730一爭高下。

CPU和GPU沒有太多操作空間，NPU應(yīng)該是谷歌擅長的。

谷歌歷代TPU對比

圖片來源：互聯(lián)網(wǎng)

谷歌從2016年推出第一代TPU，2021年推出第四代，第四代TPU的算力沒有公開數(shù)據(jù)，只說比第三代的兩倍。第三代TPU的算力是360TOPS@Int8，那么第四代應(yīng)該是720TOPS@Int8。不過TPU是針對數(shù)據(jù)中心的。針對邊緣計算，谷歌還有TPU EDGE，價格非常低廉，應(yīng)該不超過10美元。

谷歌沒有公布TPU V4的算力，但給出了下表，用在各種算法模型上的消耗時間，完全可以超越頂級英偉達系統(tǒng)。

備注：這是在2021年中期測試的數(shù)據(jù)。

圖片來源：互聯(lián)網(wǎng)

Waymo的策略應(yīng)該與高通一樣，也是一片SoC加一片加速器。SoC基于二代Tensor也就是基于三星Exynos 2200，其內(nèi)部的NPU算力至少能到30TOPS。加速器應(yīng)該基于4代TPU或5代TPU做修改而來，算力估計360TOPS。這樣一來，成本大大降低，應(yīng)該不高于英偉達系統(tǒng)的成本。此外4代或5代TPU都應(yīng)該委托三星而非臺積電代工，臺積電代工當(dāng)然更好，但價格會遠高于三星，且谷歌的訂單數(shù)量太少，在產(chǎn)能緊張大客戶云集的臺積電那里肯定要排隊等待，因此谷歌一直選弱勢的三星做合作伙伴。

自谷歌開始搞自動駕駛以來，其定位就比較模糊，戰(zhàn)略經(jīng)常變化，最初似乎是想提供全套軟件解決方案，然后是自己制造無人駕駛小車，再后是做無人出租車運營，現(xiàn)在似乎是回歸最初，提供包括硬件計算平臺在內(nèi)的全套解決方案。主要是自動駕駛算法的門檻極低，單獨的算法沒多少價值，自動駕駛軟件里最有價值的應(yīng)該是經(jīng)過人工標(biāo)注的數(shù)據(jù)集，這沒什么技術(shù)含量，完全靠人力和資金。如今Waymo試圖和英偉達或高通競爭，顯然已經(jīng)晚了，Waymo的最終結(jié)局想必大家都已經(jīng)能預(yù)測到。

Waymo幡然悔悟，做自動駕駛必須自研芯片

相關(guān)推薦

Waymo幡然悔悟，做自動駕駛必須自研芯片

相關(guān)推薦

Waymo幡然悔悟，做自動駕駛必須自研芯片