隨著企業(yè)運營的節(jié)奏日益加快,人們對快速響應(yīng)的期望日益提升,決策逐漸從數(shù)據(jù)中心轉(zhuǎn)向網(wǎng)絡(luò)邊緣。無論是要盡量保障繁忙作業(yè),避免閑置的車間生產(chǎn)線、在手術(shù)室等待分析結(jié)果的醫(yī)生,還是正在待命前往撲滅熊熊山火的消防隊、尋找各種洞察從而幫助修復(fù)珊瑚礁的科學(xué)家,又或是在顧客焦急等待購物服務(wù)的零售環(huán)境中,企業(yè)都必須對系統(tǒng)進(jìn)行相關(guān)配置,以收集信息,獲得可行洞察,并實時幫助做出決策或提供分析結(jié)果。在越來越多的情況下,似乎只有完全自動化決策的及時性才足以滿足要求。
如今,邊緣采集的數(shù)據(jù)量十分龐大。據(jù) Gartner 預(yù)測,到 2025 年,將有多達(dá) 75% 的企業(yè)數(shù)據(jù)會在傳統(tǒng)數(shù)據(jù)中心以外生成1。Gartner 高級研究總監(jiān) Santhosh Rao 表示:“踏上業(yè)務(wù)數(shù)字化之旅的企業(yè)和機構(gòu)已經(jīng)意識到,必須采用去中心化的方法來滿足數(shù)字業(yè)務(wù)基礎(chǔ)設(shè)施的要求。隨著數(shù)據(jù)體量與增長速度的提升,將信息流式傳輸至云端或數(shù)據(jù)中心進(jìn)行處理的效率也愈發(fā)低下1。”
將采用人工智能 (AI) 和機器學(xué)習(xí) (ML) 算法的計算能力轉(zhuǎn)移到更靠近數(shù)據(jù)產(chǎn)生的位置,甚至在許多情況下在數(shù)據(jù)產(chǎn)生的邊緣直接提供上述能力,能夠?qū)崿F(xiàn)全新的實時用例,拓展?jié)撛诘男率杖雭碓?,同時防止敏感數(shù)據(jù)在網(wǎng)絡(luò)中流轉(zhuǎn)后再進(jìn)入數(shù)據(jù)中心。實現(xiàn)對邊緣數(shù)據(jù)的實時響應(yīng)需要至少四種技術(shù)的有效組合:
人工智能 (AI)
高速網(wǎng)絡(luò)
云
企業(yè)必須在整個基礎(chǔ)設(shè)施中整合這些技術(shù),才能獲得云邊協(xié)同智能的全部優(yōu)勢。將更多具有 AI 功能的設(shè)備和算力安排在邊緣,可以在提升數(shù)據(jù)處理量的同時也生成更多數(shù)據(jù),從而實現(xiàn)更復(fù)雜的 AI 用例,進(jìn)而獲得更多可行洞察。
企業(yè)的核心可能位于數(shù)據(jù)中心或云端,但遠(yuǎn)離該核心位置的邊緣卻能涵蓋除此以外的所有數(shù)據(jù)收集、處理、存儲和通信功能。邊緣包含以下部分:
邊緣設(shè)備,即生成、收集、處理和/或使用數(shù)據(jù)的資產(chǎn),包括智能攝像頭、工業(yè)傳感器、機器人、自動駕駛車輛、可穿戴設(shè)備、智能手機、智能揚聲器和無人機等設(shè)備。
邊緣基礎(chǔ)設(shè)施,即能夠從不同來源聚合眾多數(shù)據(jù)流的設(shè)備,如本地服務(wù)器、網(wǎng)關(guān)和網(wǎng)絡(luò)視頻錄像機等。
邊緣的定義
邊緣設(shè)備通常是一些小型設(shè)備(例如,智能手表或智能攝像頭),邊緣環(huán)境中幾乎沒有空間容納又大又重的組件。同時,邊緣設(shè)備的供電也往往十分有限。這意味著邊緣硬件必須要高效利用空間和電能。這些設(shè)備還必須提供高性能,甚至要能足以添加 AI 工作負(fù)載來處理本地收集的數(shù)據(jù)。
雖然在執(zhí)行 AI 推理工作負(fù)載時,邊緣設(shè)備可以且經(jīng)常是獨立運行,但對于 AI 訓(xùn)練而言,連接多個邊緣設(shè)備以實現(xiàn)聯(lián)邦學(xué)習(xí)能帶來眾多益處。聯(lián)邦學(xué)習(xí)使邊緣設(shè)備可協(xié)作學(xué)習(xí)并共享預(yù)測模型,同時所有訓(xùn)練數(shù)據(jù)都位于邊緣設(shè)備,不必存儲在云端,從而提高了數(shù)據(jù)安全性。
能夠以邊緣集群或網(wǎng)絡(luò)服務(wù)器等形式支持更全面或更復(fù)雜的邊緣計算的硬件性能往往高于獨立的邊緣設(shè)備。這類硬件可能也會根據(jù)需要使用安全或連接功能,從而支持指定用例。
以下是兩個在邊緣使用 AI 的真實案例:
在制造業(yè)和工業(yè)領(lǐng)域,邊緣計算蘊含巨大潛力。例如,奧迪的內(nèi)卡蘇爾姆工廠每天要組裝多達(dá) 1,000 輛汽車,而每輛汽車大約有 5,000 個焊點。也就是說,僅一家工廠每天就需要檢查 500 萬個焊點。如果每天都要人工檢查上百萬個焊點,不僅成本高昂,耗時費力,而且也并不現(xiàn)實,更別說奧迪的目標(biāo)是希望能夠以出色的精度實現(xiàn)焊點全檢。
在一些瀕危物種的棲息地,環(huán)保人員進(jìn)入可能會造成問題,而智能攝像頭和視頻分析則有望幫助監(jiān)控與保護(hù)這些地方。例如,珊瑚礁修復(fù)通常需要潛水員下水進(jìn)行監(jiān)控。他們需要潛入水中直接收集數(shù)據(jù),或手動拍攝珊瑚礁的視頻或圖像,供日后分析。這種數(shù)據(jù)收集方法可能會干擾野生動物行為,無意中影響研究結(jié)果。此外,數(shù)據(jù)采集也很有限,因為潛水員一次只能在水下安全停留大約 30 分鐘。菲律賓的 CoRaiL項目通過利用智能攝像頭和 AI 增強型視頻分析來研究珊瑚礁的韌性,成功解決了這些問題。
邊緣 AI 用例
以下是一些邊緣 AI 用例:
在醫(yī)療領(lǐng)域,AI 有許多潛在用途,醫(yī)療影像就是其中非常主流的一種。每天會產(chǎn)生成千上萬的醫(yī)療影像,如 CT 掃描、X 光和 MRI 等,每張影像都需要經(jīng)過仔細(xì)分析來發(fā)現(xiàn)其中異常,實現(xiàn)準(zhǔn)確診斷。
在零售層面,機器視覺能夠可靠地讀取條碼、文本和數(shù)字,以幫助管理、跟蹤和分析庫存水平,確保重要材料由需要的人員掌握。互聯(lián)的響應(yīng)式智能數(shù)字標(biāo)牌可以根據(jù)顧客行為與喜好為顧客推薦產(chǎn)品或優(yōu)惠。這又能促進(jìn)零售商了解他們向消費者發(fā)出的訊息何時真正起到了效果。自助服務(wù)設(shè)施和無人商店可為顧客提供一系列服務(wù),打造個性化購物體驗。與此同時,機器學(xué)習(xí)又可以分析遍布整個商店的攝像頭采集的多個視頻流,幫助實時識別潛在犯罪行為。
在美國,機器人被用來對醫(yī)院表面進(jìn)行紫外線 (UV) 消毒,這樣既能夠有效殺死病毒,也避免了紫外線對人類造成傷害。機器人能夠利用 AI 在醫(yī)院內(nèi)導(dǎo)航,先確認(rèn)所在空間沒人,再用紫外線對該區(qū)域進(jìn)行消毒。在該用例中,AI 的采用有助于確保整個醫(yī)院的安全,同時盡量保持繁忙區(qū)域開放正常運營,以供使用。
具備 AI 功能的智能攝像頭能夠帶來巨大價值,實現(xiàn)重復(fù)性日常任務(wù)的自動化,從而解放員工,使他們能專注于應(yīng)對更復(fù)雜的挑戰(zhàn)。例如,基于 AI 的車牌識別被廣泛應(yīng)用于各種場景,包括防止未經(jīng)授權(quán)車輛進(jìn)入的安保應(yīng)用,以及自動放行,讓注冊用戶能夠直接驅(qū)車進(jìn)入洗車區(qū)等等。
實施 AI 需要滿足哪些要求?
在整個企業(yè)內(nèi)廣泛實施 AI 時,務(wù)必要確保以下三大基礎(chǔ)設(shè)施要素均具備處理 AI 工作負(fù)載的足夠性能。這三大要素分別是:邊緣設(shè)備、邊緣基礎(chǔ)設(shè)施和云。實施 AI 的具體要求包括:
高性能:AI 工作負(fù)載往往計算密集度高,因此在進(jìn)行 AI 訓(xùn)練或推理的地方,必須具備強大的計算性能。
低時延:AI 的一大優(yōu)勢在于能夠支持實時決策。將 AI 工作負(fù)載轉(zhuǎn)移到邊緣位置(即使只是將部分 AI 工作負(fù)載轉(zhuǎn)移到邊緣),有助于降低決策時延。
高容量:AI 依賴大量數(shù)據(jù),因此,運行 AI 的基礎(chǔ)設(shè)施必須確保計算、存儲和內(nèi)存容量能夠勝任任務(wù),從而避免瓶頸。
可靠的安全性:AI 工作負(fù)載需要大量越來越敏感的數(shù)據(jù)(例如,在醫(yī)療或公共安全領(lǐng)域)。無論是何種 AI 工作負(fù)載,運行它們的設(shè)備和軟件都必須安全可靠。
英特爾提供眾多技術(shù)和解決方案,可在滿足上述要求的同時,支持企業(yè)和機構(gòu)實現(xiàn)從邊緣到云的 AI 工作負(fù)載。圖 1 展示了探索英特爾? AI 解決方案的典型初始框架,但最終的解決方案也將取決于低時延或定制板外形等特定要求。面向 AI 的英特爾? 邊緣技術(shù)解決方案能夠在各類設(shè)備上實現(xiàn)高性能推理,這些設(shè)備包括本地服務(wù)器、PC、攝像頭、機器人和無人機等。由于在 AI 領(lǐng)域并不存在“一體適用”的解決方案,因此英特爾推出了包括 CPU、GPU、VPU 和 FPGA 在內(nèi)的產(chǎn)品組合,旨在提供低時延推理,幫助消除數(shù)據(jù)瓶頸。英特爾? oneAPI AI 分析工具套件(AI 套件)和英特爾? 分發(fā)版 OpenVINO? 工具包以一套統(tǒng)一的 AI 開發(fā)工具支持廣泛的英特爾計算設(shè)備。
圖 1. 英特爾的 AI 產(chǎn)品組合框架
為什么 FPGA 是 AI 實施的理想選擇?
人的大腦中有近 1,000 億個神經(jīng)元。盡管這已經(jīng)是個天文數(shù)字,但將這些神經(jīng)元組織成為網(wǎng)絡(luò)的神經(jīng)連接數(shù)量更是達(dá)到了百萬億級,而神經(jīng)連接的數(shù)量顯著影響著大腦的能力。FPGA 內(nèi)的互連性就類似于人腦中的神經(jīng)連接。FPGA 內(nèi)的可編程邏輯結(jié)構(gòu)也以類似的方式相互連接,這就是為什么英特爾? FPGA 是神經(jīng)網(wǎng)絡(luò)和其他 AI 工作負(fù)載實施的理想選擇。在邏輯和線路互連的層面上,F(xiàn)PGA 的比特級動態(tài)可編程性就好比靈活的大腦,可以調(diào)整注意力,專注于當(dāng)前的特定任務(wù)。此外,一直以來,F(xiàn)PGA 的外部 I/O 也具備其他硬件架構(gòu)所不具備的出色靈活性,可以連接到雷達(dá)、音頻、振動和視覺等各種來源的傳感器。這些特性能夠讓信號實時進(jìn)出 FPGA,達(dá)到可媲美人腦的高級智能水平。
英特爾? FPGA 家族包括英特爾? Cyclone? 10 GX FPGA、英特爾? Arria? 10 GX FPGA 和英特爾? Stratix? 10 GX FPGA等。這些產(chǎn)品具備 I/O 靈活性、低功耗(或每次推理的能耗)和低時延,本就可在 AI 推理上帶來優(yōu)勢。這些優(yōu)勢在三個全新的英特爾? FPGA 和片上系統(tǒng) (SoC) 家族的產(chǎn)品中又得到了補充,使得 AI 推理性能進(jìn)一步獲得了顯著提升。這三個家族分別是英特爾? Stratix? 10 NX FPGA 以及英特爾? Agilex? FPGA 家族的新成員:英特爾? Agilex? D 系列 FPGA,和代號為“Sundance Mesa”的全新英特爾? Agilex? 設(shè)備家族。這些英特爾? FPGA 和 SoC 家族包含專門面向張量數(shù)學(xué)運算優(yōu)化的專用 DSP 模塊,為加速 AI 計算奠定了基礎(chǔ)。
第一款采用張量模塊的英特爾? FPGA 是英特爾 2020 年 6 月 18 日推出的英特爾? Stratix? 10 NX FPGA。英特爾? Stratix? 10 NX FPGA 的張量模塊架構(gòu)針對 AI 計算中常用的矩陣-矩陣或矢量-矩陣乘法和加法運算進(jìn)行了優(yōu)化,旨在高效地用于各種不同規(guī)模的矩陣。該張量模塊支持 INT8 和 INT4 數(shù)據(jù)計算,并通過共享指數(shù)支持 FP16 和 FP12 塊浮點的數(shù)字格式。
此前的英特爾? Agilex? 設(shè)備家族就已經(jīng)配備可變精度數(shù)字信號處理 (DSP) 模塊,能夠提供多種 AI 功能,而集成在全新英特爾??Agilex? FPGA 和 SoC FPGA 結(jié)構(gòu)中的 DSP 模塊在此前模塊設(shè)計的基礎(chǔ)上,還引入了英特爾? Stratix? 10 NX FPGA 中所用的張量模塊的多種功能。采用 AI 張量模塊的增強型 DSP 引入了兩種全新的重要運算:面向 AI 的張量處理能力和面向信號處理應(yīng)用的復(fù)數(shù)支持。此類應(yīng)用包括快速傅里葉變換 (FFT) 和復(fù)雜有限脈沖響應(yīng) (FIR) 濾波器等。
第一種模式可通過 INT8 張量模式增強 AI。該模式可在一個采用AI 張量模塊的增強型 DSP 中提供 20 次 INT8 乘法。與之前的英特爾? Agilex? 設(shè)備家族相比,INT8 計算密度提升高達(dá) 5 倍。張量模式使用兩列的張量結(jié)構(gòu),同時具備 INT32 和 FP32 的級聯(lián)和累加功能,還支持塊浮點指數(shù),以改善推理精度和低精度訓(xùn)練。此外,可變精度 DSP 的 AI 功能也有所增強。矢量模式也已經(jīng)從四個 INT9 乘法器 (Multiplier) 升級到了六個 INT9 乘法器。這些模式對以 AI 為中心的張量數(shù)學(xué)運算和各類 DSP 應(yīng)用格外有用。
圖 2. AI 和 DSP 計算密度的數(shù)量級提升
*限英特爾? Agilex? D 系列 FPGA 和代號為 Sundance Mesa 的全新英特爾??Agilex? 設(shè)備家族提供。
第二種新模式是復(fù)數(shù)運算,可在運行復(fù)數(shù)乘法時使張量模塊的性能翻倍。過去,復(fù)數(shù)乘法需要兩個 DSP 模塊,但這一全新英特爾??Agilex? FPGA 和 SoC FPGA 家族產(chǎn)品在一個采用 AI 張量模塊的增強型 DSP 中就可進(jìn)行 16 位定點復(fù)數(shù)乘法運算。
FPGA 十分契合網(wǎng)絡(luò)邊緣及核心眾多終端市場的需求
許多數(shù)據(jù)中心以外的終端市場都很適合采用 FPGA 來實現(xiàn)應(yīng)用和 AI 計算功能所需的邏輯,從而支持在本地處理數(shù)據(jù)。這些終端市場包括:
醫(yī)療和生命科學(xué),包括醫(yī)療監(jiān)護(hù)儀、具有圖像識別和物體檢測功能的 2D 診斷設(shè)備(例如,X 射線設(shè)備和內(nèi)窺鏡),以及其他類型的病理學(xué)檢測、基因組測序、手術(shù)機器人等設(shè)備。
軍事和航空航天,包括無人飛行載具 (UAV)、目標(biāo)檢測、雷達(dá)偵測和分類等。
工業(yè)應(yīng)用,可用于在邊緣增加基于 AI 的檢測和實時控制。
ProAV(專業(yè)影音)系統(tǒng),包括具備人臉識別功能,從而可以實現(xiàn)鏡頭自動平移/縮放和背景消除的視頻會議攝像頭、具備自動人臉檢測,從而可以實現(xiàn)精準(zhǔn)對焦的攝影棚用攝像頭。
廣播視頻,包括從標(biāo)準(zhǔn)動態(tài)范圍 (SDR) 到高動態(tài)范圍 (HDR)的轉(zhuǎn)換、不同視頻分辨率的智能轉(zhuǎn)換,以及可變幀率視頻的采集和顯示。
消費級應(yīng)用,包括具備人眼檢測和跟蹤功能,從而可以實現(xiàn)立體成像的 3D 顯示器。
下面介紹了幾個 AI 在醫(yī)療行業(yè)和工業(yè)/制造業(yè)的深入應(yīng)用示例:
醫(yī)療應(yīng)用中的 AI
患者和醫(yī)護(hù)人員的人口結(jié)構(gòu)正在變化,同時人們愈發(fā)希望在降低醫(yī)療成本的同時改善醫(yī)療成果。這些因素推動著 AI 在醫(yī)療行業(yè)的廣泛應(yīng)用。AI 有助于提高基于 MRI 和 CT 成像的癌癥診斷準(zhǔn)確性;基于 AI 的信息系統(tǒng)和機器人手術(shù)設(shè)備可協(xié)助外科醫(yī)生手術(shù);AI 還能通過基于全球數(shù)據(jù)集的模型改善罕見疾病的治療。
AI 增強型內(nèi)窺鏡攝像頭就是 AI 在醫(yī)療領(lǐng)域應(yīng)用的一個具體示例,它已經(jīng)廣泛用于各個醫(yī)療科室,如神經(jīng)內(nèi)科、骨科、泌尿科和婦科。這種內(nèi)窺鏡攝像頭系統(tǒng)越來越多地能夠支持高級成像功能,包括邊緣增強和色彩校正,為醫(yī)生提供更清晰、更容易解讀的圖像。英特爾? FPGA 的高性能、小尺寸和低能耗特性,能夠為內(nèi)窺鏡攝像平臺額外提供其所需的實時功能。
英特爾? FPGA 還賦能內(nèi)窺鏡攝像頭制造商支持包括以下各種 AI 增強型檢測在內(nèi)的多種 AI 用例:
結(jié)直腸篩查中的息肉檢測
內(nèi)窺鏡食道篩查中與巴雷特食管相關(guān)的異常增生檢測
美國每年要進(jìn)行 1,600 多萬次結(jié)直腸鏡檢查,僅美國每年診斷出的巴雷特食管病例就多達(dá) 20 多萬例。因此,AI 增強型醫(yī)學(xué)成像功能將顯著提升這些內(nèi)窺鏡檢查的效率和準(zhǔn)確性。這些基于 AI的全新功能和優(yōu)化將推動 AI 在內(nèi)窺鏡中應(yīng)用的持續(xù)增長,幫助醫(yī)生滿足日益增長的微創(chuàng)檢查和手術(shù)需求。
工業(yè)和制造業(yè)應(yīng)用中的 AI
現(xiàn)代制造業(yè)是一個復(fù)雜的體系,包含眾多系統(tǒng)。各類傳感器、攝像頭和執(zhí)行器組成了一個相互連接、聯(lián)網(wǎng)控制的分層架構(gòu)。英特爾? FPGA 廣泛用于整個分層架構(gòu),可確保滿足硬實時和安全要求。此外,制造業(yè)正在經(jīng)歷第四次工業(yè)革命,運營技術(shù) (OT) 系統(tǒng)與信息技術(shù) (IT) 系統(tǒng)愈發(fā)融合,構(gòu)成了更智能、更靈活的工廠,提供更高效、更自動化的生產(chǎn),同時需要的人為干預(yù)也更少。
各種工業(yè)應(yīng)用和制造工廠所廣泛使用的通信技術(shù),包括 5G、工業(yè)網(wǎng)關(guān)和智能網(wǎng)卡 (NIC) 等均采用英特爾? FPGA。英特爾? FPGA 被用于工作負(fù)載需要 I/O 靈活性、直接數(shù)據(jù)提取能力、確定性計算能力、更低運行功耗,以及需要在嚴(yán)苛的工業(yè)環(huán)境中運行的場景。在這些場景中,AI 技術(shù)皆可提供支持,并且也越來越多地被用于制造業(yè)應(yīng)用的視覺和非視覺類任務(wù)。
表 1 展現(xiàn)了工業(yè)和制造業(yè)中 AI 的廣泛應(yīng)用。
表 1. AI 在現(xiàn)代工廠中的用例示例
邊緣設(shè)備采用的英特爾? FPGA 可以安裝在其他傳感和控制功能旁邊,或與之集成,協(xié)同實現(xiàn)高能效的 AI 工作負(fù)載。例如,英特爾? FPGA 可直接提取攝像頭或傳感器數(shù)據(jù),以確定性計算、低時延和高吞吐量運行工作負(fù)載。英特爾? FPGA 可直接從一個或多個攝像頭提取視頻數(shù)據(jù),對視頻進(jìn)行預(yù)處理(包括優(yōu)化對比度和曝光、增強邊緣、校正色彩),在視頻流中抓取相關(guān)幀,并進(jìn)行特征或缺陷檢測,這一切都能實時完成。可編程邏輯控制器 (PLC) 制造商已在其新款 PLC 中采用小型 AI 引擎,為下一代控制器添加智能功能。在生產(chǎn)線上,AI 增強型視覺檢測能夠比人工更快、更準(zhǔn)確地進(jìn)行缺陷檢測和質(zhì)量評估。
將 AI 增強型功能與視頻處理管道或其他功能緊密結(jié)合,是建立優(yōu)化的實時工業(yè)系統(tǒng)的重要方式,而低功耗和低時延正是其中的關(guān)鍵因素。表 2 展示了 AI 增強型圖像和視頻處理在工業(yè)和制造業(yè)中的部分用途:
表 2. AI 增強型功能發(fā)揮重要作用的工業(yè)視覺檢查和檢測示例
AI 讓機器人設(shè)置和訓(xùn)練工作變得更加容易,可以教會機器人感知周圍環(huán)境并作出相應(yīng)反應(yīng)。此類場景下,機器人可執(zhí)行的任務(wù)包括根據(jù)示范進(jìn)行學(xué)習(xí)、取放物體、使用直接反饋來控制末端執(zhí)行工具(如焊接工具),以及與其他機器人或工人實現(xiàn)安全的協(xié)作。這些任務(wù)同樣適用于自主移動機器人 (AMR),因為它們也必須實時使用傳感器數(shù)據(jù)來構(gòu)建并持續(xù)更新周邊環(huán)境地圖,從而進(jìn)行相應(yīng)的導(dǎo)航。AMR 使用的 AI 功能必須具備低能耗的特點,以免對機器人電池造成太多負(fù)擔(dān),但同時還必須具備穩(wěn)定性和低時延,能夠與其他工作負(fù)載緊密整合。
工業(yè)邊緣還涉及許多非視覺類的 AI 應(yīng)用。工廠所有者迫切希望提升應(yīng)用效率,從而降低總體擁有成本 (TCO) 并提高產(chǎn)量。影響 TCO 的因素包括盡可能減少故障時間?;?AI 的機器健康狀況評估和預(yù)測性維護(hù)就可以做到這一點。借助電壓、溫度、振動和聲音等非侵入式傳感器,機器學(xué)習(xí)工作負(fù)載可準(zhǔn)確地檢測新出現(xiàn)的問題,并在問題惡化、影響生產(chǎn)或?qū)е律a(chǎn)中斷之前,就對維護(hù)或修理需求進(jìn)行預(yù)測。
英特爾? FPGA 常用在邊緣通過 AI 和機器學(xué)習(xí)來處理這些傳感器信號,以降低工廠的網(wǎng)絡(luò)帶寬需求,并快速識別問題,避免了將未經(jīng)處理的數(shù)據(jù)發(fā)送至云端,再等待云端發(fā)回決策而產(chǎn)生的時延。主流原始設(shè)備制造商 (OEM) 正在使用 AI 來動態(tài)計算能效更高的運動路徑。例如,控制多軸機器人以盡可能高的效率和盡可能低的能耗在規(guī)定時間內(nèi)將物體從 A 點移動到 B 點,AI 可用于增強閉環(huán)控制算法,而低時延 AI 算法和確定性計算能力對此類任務(wù)至關(guān)重要。英特爾? FPGA 非常適合用于實現(xiàn) AI 增強型閉環(huán)算法。
在全球范圍內(nèi),工業(yè)和制造業(yè)客戶都非常關(guān)心以下這些問題:
如何滿足越來越高的產(chǎn)品質(zhì)量要求?
如何優(yōu)化工廠運營,提高產(chǎn)量和效率?
如何更好地預(yù)測并縮短設(shè)備和系統(tǒng)的故障時間?
如何更快地應(yīng)對和適應(yīng)市場需求變化?
AI 有助于解決這些問題。正因如此,英特爾? FPGA 正積極在其原有的傳感和控制功能基礎(chǔ)上新增 AI 功能。這些功能是建立高效工業(yè)系統(tǒng)、滿足工廠邊緣硬實時要求所必備的。
面向英特爾? FPGA 和 SoC 的邊緣就緒型 AI 工具套件
分布式 AI/機器學(xué)習(xí)邊緣解決方案往往十分復(fù)雜,開發(fā)難度非常高。英特爾提供的開發(fā)工具和軟件致力于推動開放標(biāo)準(zhǔn)并支持容器化和云原生開發(fā),從而幫助開發(fā)人員簡化他們的工作流程并加速分布式邊緣解決方案的部署。對于使用英特爾? FPGA 和 SoC進(jìn)行 AI/機器學(xué)習(xí)應(yīng)用開發(fā)的人員,英特爾提供以下開發(fā)工具:
英特爾? oneAPI AI 分析工具套件(AI 套件)為數(shù)據(jù)科學(xué)家、AI 開發(fā)人員和研究人員提供了一套他們熟悉的Python 工具和框架,可加速端到端的數(shù)據(jù)科學(xué)與分析管道。英特爾通過該工具套件提供支持底層計算優(yōu)化的 oneAPI 庫,從而盡可能地提高從預(yù)處理到機器學(xué)習(xí)的各種工作負(fù)載的性能,并提供互操作性以實現(xiàn)高效的模型開發(fā)。
英特爾? 分發(fā)版 Python 支持 TensorFlow、Keras、PyTorch、oneDNN 和 BigDL 等常用庫和框架,可用于在多個英特爾? 計算平臺上創(chuàng)建高速的機器學(xué)習(xí)應(yīng)用。這些工具可支持面向一系列廣泛的 AI/機器學(xué)習(xí)工作負(fù)載快速開發(fā)應(yīng)用。
英特爾? 分發(fā)版 OpenVINO? 工具包支持對邊緣計算機視覺用例至關(guān)重要的深度學(xué)習(xí)應(yīng)用開發(fā)。
英特爾? FPGA AI 套件使 FPGA 設(shè)計人員、機器學(xué)習(xí)工程師和軟件開發(fā)人員能夠高效地優(yōu)化基于英特爾? FPGA 的 AI 設(shè)計。利用常見和主流的行業(yè)框架(如 TensorFlow、PyTorch)以及 OpenVINO? 工具包,英特爾? FPGA AI 套件中的實用程序可加速基于 FPGA 的 AI 推理開發(fā),同時還充分利用了英特爾? Quartus? Prime 軟件強大且成熟的 FPGA 開發(fā)流程。
英特爾? FPGA AI 套件非常靈活,可以針對各種系統(tǒng)級用例進(jìn)行配置。用戶可以通過一鍵式流程,生成優(yōu)化的 AI 推理 IP模塊,并集成到英特爾? Quartus? Prime 軟件中。用戶還可針對英特爾? FPGA AI 套件中的架構(gòu)優(yōu)化器指定設(shè)備資源(DSP、內(nèi)存、邏輯單元)和吞吐量。這種獨特的定制能力對于探索設(shè)計以及嵌入式 AI 應(yīng)用的尺寸、重量和能耗等維度的優(yōu)化都至關(guān)重要。
您可通過以下四種方式利用英特爾提供的開發(fā)工具,將英特爾? FPGA 和 AI/機器學(xué)習(xí)集成至您的系統(tǒng):
1. 采用基于 FPGA 的 AI/機器學(xué)習(xí)加速器,實現(xiàn) CPU 分流。主機 CPU 通過 PCIe 接口與 AI/機器學(xué)習(xí)加速器進(jìn)行通信。英特爾? FPGA 直接支持與主機的英特爾? CPU 進(jìn)行 PCIe連接。
2. 采用英特爾? FPGA 實施 AI 加速器和額外邏輯,實現(xiàn)多功能CPU 分流。英特爾? FPGA 為主機的英特爾? CPU 提供 AI/機器學(xué)習(xí)加速,并實施應(yīng)用所需的任何額外邏輯。與示例 1一樣,主機 CPU 通過 PCIe 接口與 AI/機器學(xué)習(xí)加速器進(jìn)行通信。
3. 提取/內(nèi)聯(lián)處理 + AI。基于 FPGA 的 AI 加速器直接提取數(shù)據(jù),并使用 AI 和算法工作負(fù)載處理數(shù)據(jù),然后再通過 PCIe連接將處理過的數(shù)據(jù)和推理傳輸至主機的英特爾? CPU。
4. 英特爾? SoC FPGA 利用集成的 CPU(ARM 或 Nios? 處理器內(nèi)核)充當(dāng) AI/機器學(xué)習(xí)加速器,直接提取并處理數(shù)據(jù),實施 AI/機器學(xué)習(xí)推理,然后通過以太網(wǎng)網(wǎng)絡(luò)將處理過的數(shù)據(jù)和推理傳輸至云端。FPGA 還負(fù)責(zé)實施應(yīng)用所需的任何額外邏輯電路。
結(jié)論
從構(gòu)建商、集成商、云和網(wǎng)絡(luò)提供商到開發(fā)人員,在整個邊緣價值鏈中,英特爾深耕數(shù)十年,積累了豐富經(jīng)驗。英特爾根據(jù)與各類用例客戶的合作,開發(fā)出了一系列專門用于解決常見集成問題的解決方案,并依托不斷優(yōu)化和創(chuàng)新的成熟開發(fā)人員生態(tài)系統(tǒng)提供數(shù)百個預(yù)配置包。您可通過以下方式利用該生態(tài)系統(tǒng)縮短開發(fā)時間,更快地獲得成果:
使用可立即部署的企業(yè) AI 解決方案。英特爾? AI Builders 涵蓋全球 300 多個主流 AI 軟件、硬件和服務(wù)提供商,提供 150 多款解決方案,涉及各種用例和各個市場,使所有企業(yè)都能快速采用 AI。
確保高水平的 AI 部署。面向 AI 的英特爾? 精選解決方案利用已在英特爾? 至強? 可擴(kuò)展處理器和其他英特爾? 平臺上進(jìn)行優(yōu)化并通過了基準(zhǔn)測試和驗證的解決方案,幫助您簡化和加快基礎(chǔ)設(shè)施部署。
減少開發(fā)和協(xié)作挑戰(zhàn)。英特爾? AI: In Production 利用英特爾? 技術(shù)、軟件工具、開發(fā)套件、代碼樣本和廣泛的英特爾合作伙伴和開發(fā)人員生態(tài)系統(tǒng)的解決方案,幫助加快AI 走向生產(chǎn)之路。
英特爾? FPGA AI 套件和 OpenVINO? 工具包關(guān)注深度學(xué)習(xí)推理 FPGA IP 創(chuàng)建和集成的簡易性,解決了英特爾? FPGA 和 SoC 部署中的“最后一英里”問題。
如果您正在開發(fā)需要 AI 功能的邊緣或核心設(shè)備,歡迎聯(lián)系當(dāng)?shù)氐挠⑻貭柆F(xiàn)場銷售代表,了解英特爾能夠如何為您的團(tuán)隊提供幫助。
注釋:[1]?這些邊緣設(shè)備都可以從 AI 功能中受益。
參考資料:
Rob van der Meulen,“What Edge Computing Means for Infrastructure and Operations”(邊緣計算對基礎(chǔ)設(shè)施和運營意味著什么),2018 年 10 月 3 日。
Carl Zimmer,“100 Trillion Connections: New Eorts Probe and Map the Brain’s Detailed Architecture”(100 萬億個連接:全新研究探索并繪制大腦詳細(xì)結(jié)構(gòu)),《科學(xué)美國人》,2011 年 1 月 1 日。
“Intel? FPGA AI Suite melds with OpenVINO? toolkit to generate heterogeneous inferencing systems”(英特爾? FPGA AI 套件與 OpenVINO? 工具包共同發(fā)力生成異構(gòu)推理系統(tǒng))