去年,英偉達(dá) GPU 技術(shù)大會(huì)上,首席執(zhí)行官黃仁勛在演講中公布了新的 Pascal GPU 架構(gòu),第一款產(chǎn)品便是 Tesla P100。雖然沒有提及消費(fèi)級(jí)顯卡,但是表示基于 Pascal 的 GTX 1080 將在幾個(gè)月后發(fā)布。
在今年的 GPU 大會(huì)上,英偉達(dá)發(fā)布了最新的 GPU 架構(gòu) Volta。Volta 架構(gòu)的第一款產(chǎn)品是 Tesla V100,將用于數(shù)據(jù)中心。Tesla V100 有兩種,一種是通過英偉達(dá)專有的 NVLink 與服務(wù)器(或者其他 V100)互連的夾層卡(如下圖所示);另一種是雙寬 PCIE 卡。
?
V100 相比 P100,要大一些、更強(qiáng)悍、更具震懾力。芯片面積為 815mm,采用臺(tái)積電先進(jìn)的 12nm FinFET 工藝,擁有 210 億個(gè)晶體管。
對(duì)這個(gè)一時(shí)間走紅的 V100,我們?nèi)绾卫硇钥创?/p>
對(duì)于臺(tái)積電 12nm FinFET 工藝,只是 16nm FF 工藝的一個(gè)稍稍改進(jìn)版。這在晶體管面密度方面,Volta 與 Pascal 近乎相同。工藝的改進(jìn),帶來的優(yōu)勢主要在功率方面。不過,V100 的確是一個(gè)令人印象深刻的芯片。
Volta 獨(dú)特之處在于包含了 640 個(gè)新增的張量核(Tensor Core)。Tensor Core 執(zhí)行專門的矩陣運(yùn)算。谷歌 TPU 以及 ASIC 對(duì)通用 AI 芯片造成威脅。英偉達(dá)的戰(zhàn)略就是,將 TPU 融入自己的產(chǎn)品中,粗暴地將 TPU 作為一個(gè)專門的子處理器融合入其 GPU 中。Tensor Core 的速度非??欤啾?Pascal,速度提升了 5 倍。
Tensor Core 有助于提升推理處理的性能。英偉達(dá)聲稱 V100 在推理處理方面大約是 P100 的 3 倍,但是英偉達(dá)并沒有與谷歌 TPU 進(jìn)行對(duì)比。很明顯,英偉達(dá)盡全力表現(xiàn)自己就是為了否定 TPU 以及 ASIC 的獨(dú)特優(yōu)勢。
去年,英偉達(dá)推出 DGX-1 這個(gè)超級(jí)計(jì)算機(jī),今年 DGX-1 已經(jīng)升級(jí)為 DGX-1V,配備 Volta V100 和新的 NVLink 2.0(帶寬為舊接口的兩倍)。
02
在黃仁勛 GTC 2017 主題演講中,也可以了解到下一代 PX 平臺(tái) Xavier 的細(xì)節(jié)。Xavier 性能表現(xiàn)的關(guān)鍵在于內(nèi)置了 Volta GPU,而 Tensor Core 的存在使 Xavier 的高效能性得以實(shí)現(xiàn)。
自動(dòng)去年 10 月英偉達(dá) Drive PX 2 被特斯拉采用,英偉達(dá)逐漸建立起其在自動(dòng)駕駛領(lǐng)域的地位,并獲得了高速的發(fā)展與增長。
今年,英偉達(dá)似乎會(huì)加快 Xavier 在自動(dòng)駕駛領(lǐng)域的部屬。英偉達(dá)還宣布和豐田合作,豐田將采用英偉達(dá) DRIVE PX 車載 AI 計(jì)算平臺(tái),并希望在 2020 年左右將自動(dòng)駕駛車推向市場。
我相信英偉達(dá)在自駕車的處理器方面遙遙領(lǐng)先,汽車行業(yè)將或多或少將英偉達(dá)的處理平臺(tái)作為標(biāo)準(zhǔn)。即便英特爾將 Mobileye 收入囊中,但似乎已經(jīng)太晚了。
說了這么多,我對(duì)于英偉達(dá)的關(guān)注已經(jīng)很久,我相信消費(fèi)級(jí)基于 Volta 的產(chǎn)品也不會(huì)太遙遠(yuǎn)。
更多有關(guān)英偉達(dá)的資訊,歡迎訪問 與非網(wǎng)英偉達(dá)專區(qū)
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!