長遠(yuǎn)來看,英特爾豪賭 167 億美元收購 FPGA 制造商 Altera 的舉動(dòng)是一筆好買賣。現(xiàn)在,F(xiàn)PGA 已經(jīng)成為深層神經(jīng)網(wǎng)絡(luò)中 GPU 的強(qiáng)力競爭對手;
英偉達(dá)應(yīng)該也已經(jīng)發(fā)現(xiàn)了,微軟新的實(shí)時(shí)云 AI/ 深度學(xué)習(xí)平臺“BrainWave”項(xiàng)目正在采用英特爾的 Stratix 10 FPGA;
在微軟早期進(jìn)行的測試中,其基于 Stratix 10 的“BrainWave”項(xiàng)目中的 FPGA 系統(tǒng)在 FP8 持續(xù)計(jì)算上達(dá)到 39.5 萬億次每秒的運(yùn)算速度;
微軟計(jì)劃向需要實(shí)時(shí)人工智能服務(wù)的 Azure 客戶推介搭載英特爾計(jì)算平臺的“Brain Brain”項(xiàng)目。
預(yù)計(jì)英特爾的 FPGA 將減緩英偉達(dá)數(shù)據(jù)中心 / 汽車業(yè)務(wù)板塊的增長速度。
英特爾收購 Altera 時(shí)豪擲的 167 億美金終于見到回報(bào)了?,F(xiàn)在,Altera 的 FPGA(現(xiàn)場可編程門陣列)產(chǎn)品成為英特爾對抗英偉達(dá)基于 GPU 的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)平臺的利器。與 CPU(中央處理單元)相比,GPU(圖形處理單元)在并行計(jì)算方面存在優(yōu)勢,GPU 專家英偉達(dá)借此躋身為深度學(xué)習(xí)計(jì)算領(lǐng)域的公認(rèn)領(lǐng)導(dǎo)者。
然而,英偉達(dá)的投資者們應(yīng)該注意到,微軟新的實(shí)時(shí)人工智能云平臺“BrainWave 項(xiàng)目”搭載了英特爾的 Stratix 10 FPGA。微軟在選擇深度神經(jīng)網(wǎng)絡(luò)[DNN]處理單元或 DPU 時(shí),沒有選擇英偉達(dá)的 Tesla 或者 Volta GPU,反而選擇了 Stratix 10。 英特爾將從微軟在全球各個(gè)數(shù)據(jù)中心大規(guī)模部署“BrainWave”項(xiàng)目中獲得顯著的經(jīng)濟(jì)效益。英特爾沒有任何獨(dú)立的 GPU 產(chǎn)品,但它擁有的 FPGA 足以加強(qiáng)其未來在超大型深度神經(jīng)網(wǎng)絡(luò)中的作用。
為什么這很重要
現(xiàn)在,以人工智能為中心的數(shù)據(jù)中心和汽車業(yè)務(wù)板塊為英偉達(dá)貢獻(xiàn)的季度收入已經(jīng)超過 5 億美金。微軟在向 Azure 客戶提供的 Brainwave 項(xiàng)目中使用 FPGA 后,也可以為英特爾貢獻(xiàn)同等規(guī)模的季度收入。我估計(jì),除了微軟之外,其它涉足人工智能的公司也會(huì)在其 GPU 加速的深度學(xué)習(xí)平臺中使用英特爾的 FPGA。
英偉達(dá)股價(jià)上升到目前的高度,部分原因來自于它在深度學(xué)習(xí)計(jì)算方面的先發(fā)優(yōu)勢。微軟采用英特爾的 FPGA 加速其深度神經(jīng)網(wǎng)絡(luò)也可以幫助提升其股價(jià)表現(xiàn)。專注 AI 的投資者們現(xiàn)在應(yīng)該正視英特爾,它的 Stratix 10 產(chǎn)品讓英特爾一躍成為深層神經(jīng)網(wǎng)絡(luò)的硬件供應(yīng)商巨頭。
過去三年中,英偉達(dá)的股票大幅跑贏了英特爾。未來,應(yīng)用在微軟 Azure 服務(wù)業(yè)務(wù)中的 Stratix FPGA 將成為英特爾進(jìn)入企業(yè) AI 市場的遲到的船票。
通過 GPU 加速的 Azure 產(chǎn)品,微軟與英偉達(dá)公司建立了合作伙伴關(guān)系。另一方面,BrainWave 項(xiàng)目是微軟使用 FPGA 加速器推進(jìn)其實(shí)時(shí)人工智能商業(yè)服務(wù)的舉措。
訓(xùn)練深度學(xué)習(xí)計(jì)算機(jī)是一個(gè)需要高吞吐量的計(jì)算密集型過程,GPU 優(yōu)異的并行計(jì)算性能使其成為理想選擇。然而,GPU 能夠并行處理復(fù)雜的訓(xùn)練輸入,F(xiàn)PGA 則對加速推理很有效。
加速推理的主要目的是改善服務(wù)器與最終用戶之間的延遲。 微軟對“BrainWave”項(xiàng)目的推廣定位是實(shí)時(shí)(零延遲)AI 平臺。因此,英特爾的 FPGA 比英偉達(dá)的 GPU 更加適合做微軟 BrainWave 項(xiàng)目的 DPU。
BrainWave 項(xiàng)目最終可能用在微軟為百度自主駕駛汽車定制的云框架 / 解決方案上。微軟是百度自主駕駛汽車業(yè)務(wù)上的合作伙伴。和微軟一樣,百度也在其數(shù)據(jù)中心上使用 FPGA?;?FPGA 的 BrainWave 項(xiàng)目被標(biāo)榜為針對計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和深度學(xué)習(xí),它可以滿足未來自動(dòng)駕駛汽車的云基礎(chǔ)設(shè)施需求。
GPU 和 FPGA 是目前雖小但正在快速增長的人工智能服務(wù)行業(yè)的關(guān)鍵元件。 根據(jù) Tractica 的報(bào)告,到 2025 年,與 AI 相關(guān)的產(chǎn)品和服務(wù)市場規(guī)模將增長到 368 億美元。FPGA 可以幫助英特爾在這個(gè)利基市場上更好地競爭。
未來,英特爾真的需要更多 FPGA 產(chǎn)品客戶。它需要這塊收入來幫助支付它在以 167 億美元收購 Altera 時(shí)發(fā)行的 70 億美元債券。每個(gè)新收入來源都可以幫助英特爾恢復(fù)因大舉投資 Altera 而拉下的饑荒。
為什么英特爾的 FPGA 對微軟至關(guān)重要
Stratix 10 的 F32 峰值性能仍然明顯低于英偉達(dá)的 Pascal GPU。 然而,市場正日趨采用緊湊型低精度數(shù)據(jù)類型(低于 32 位或 FP32)。 TensorFlow 和 Caffe 等 DNN 軟件框架支持低精度 FP16(16 位)和 FP8(8 位)數(shù)據(jù)類型。在這些不需要 FP32 級性能的深入學(xué)習(xí) / 機(jī)器學(xué)習(xí)任務(wù)中,F(xiàn)PGA 可以大行其道。
對于非常低精度的 2 位和 1 位 DNN 的持續(xù)改進(jìn)和 FPGA 在 FP8 和 FP9 DNN 框架上的出色表現(xiàn)相輔相成。人工智能 / 深度學(xué)習(xí)并不完全依賴于英偉達(dá) GPU 所擅長的傳統(tǒng)密集 FP32 和 FP64 運(yùn)算。微軟的 Brainwave 項(xiàng)目并沒有使用 GPU,是因?yàn)樗€希望能夠通過低精度 FPGA 實(shí)現(xiàn)更節(jié)能的 DNN。不像可以深度定制的 FPGA,當(dāng)涉及到低精度、稀疏、不規(guī)則的 DNN 時(shí),GPU 的表現(xiàn)很差。
在早期測試中,基于 Stratix 10 的 Brainwave 項(xiàng)目中的 FPGA 硬件持續(xù)計(jì)算性能達(dá)到 39.5 萬億次每秒,這個(gè)測試是微軟在定制的低精度 8 位浮點(diǎn)格式下完成的。隨著繼續(xù)優(yōu)化完善 Brainwave 項(xiàng)目,預(yù)計(jì)性能還可以進(jìn)一步提高。
結(jié)論
微軟長期以來對 FPGA 的興趣是英特爾大舉押注 Altera 的原因之一。BrainWave 項(xiàng)目是微軟 2011 年推出的 Catapult 項(xiàng)目的延續(xù)。六年前,微軟就已經(jīng)在其數(shù)據(jù)中心中配備了 Altera FPGA 加速板?,F(xiàn)在,微軟正在使用英特爾最新的 Stratix 10 FPGA 來加速基于云的深度學(xué)習(xí)任務(wù),而不僅僅是傳統(tǒng)的企業(yè)計(jì)算工作負(fù)載。
微軟早在 2011 年就知道,傳統(tǒng)的 Xeon CPU 無法勝任 AI 計(jì)算任務(wù)。英特爾迅速收購 Altera 的舉措表明,它已準(zhǔn)備好適應(yīng)微軟轉(zhuǎn)向 FPGA 加速超大型數(shù)據(jù)中心的巨大轉(zhuǎn)變。我認(rèn)為,英特爾從來都沒有考慮過購買英偉達(dá)這樣的 GPU 廠商,它看中的是微軟大力推動(dòng) FPGA 加速云計(jì)算背后的趨勢,投資的是 Altera 的潛力和 FPGA 的未來。
在數(shù)據(jù)中心硬件產(chǎn)品上,英特爾不需要拿出自己的 GPU 來與英偉達(dá)競爭,它手中的利器是基于 14nm 工藝、面向數(shù)據(jù)中心加速應(yīng)用的 Stratix 10。英特爾將繼續(xù)向數(shù)據(jù)中心運(yùn)營商兜售 Xeon 處理器,同時(shí)也會(huì)努力爭取為其 FPGA 獲得新的訂單。
更多有關(guān) FPGA 的資訊,歡迎訪問 與非網(wǎng) FPGA 專區(qū)
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!