楷登電子(美國(guó) Cadence 公司,NASDAQ:CDNS)今日發(fā)布了用于加速人工智能系統(tǒng)級(jí)芯片開發(fā)的 Tensilica® AI 平臺(tái),包括針對(duì)不同的數(shù)據(jù)要求和終端側(cè) (on-device) AI 要求而優(yōu)化的三個(gè)支持產(chǎn)品系列。全面的 Cadence® Tensilica AI 平臺(tái)涵蓋低端、中端和高端市場(chǎng),提供了可擴(kuò)展、節(jié)能的設(shè)備端到邊緣端人工智能處理功能,這是當(dāng)今日益普遍的人工智能系統(tǒng)級(jí)芯片設(shè)計(jì)的關(guān)鍵。與業(yè)界領(lǐng)先的獨(dú)立 Tensilica DSP 相比,新的配套 AI 神經(jīng)網(wǎng)絡(luò)引擎 (NNE) 每次推理的能耗降低了 80%,并提供超過(guò) 4 倍的 TOPS/W性能,而神經(jīng)網(wǎng)絡(luò)加速器 (NNA) 通過(guò)一站式解決方案提供旗艦級(jí)的 AI 性能和能效。
針對(duì)智能傳感器、物聯(lián)網(wǎng) (IoT) 音頻、手機(jī)視覺/語(yǔ)音 AI、物聯(lián)網(wǎng)視覺和高級(jí)駕駛輔助系統(tǒng) (ADAS) 應(yīng)用,Tensilica AI 平臺(tái)通過(guò)一個(gè)通用軟件平臺(tái)提供最佳的功耗、性能和面積 (PPA) 以及可擴(kuò)展性。Tensilica AI 平臺(tái)產(chǎn)品系列依托于大獲成功的 Tensilica DSP,Tensilica DSP 針對(duì)特定的應(yīng)用,已經(jīng)在消費(fèi)、移動(dòng)、汽車和工業(yè)市場(chǎng)的領(lǐng)先人工智能系統(tǒng)級(jí)芯片中投入量產(chǎn),包括:
- AI Base:包括用于音頻/語(yǔ)音的熱門 Tensilica HiFi DSP、Vision DSP 以及用于雷達(dá)/激光雷達(dá)和通信的 ConnX DSP,與 AI 指令集架構(gòu) (ISA) 擴(kuò)展結(jié)合使用。
- AI Boost:增加了一個(gè)配套的 NNE,最初是 Tensilica NNE 110 AI 引擎,可從 64 GOPS 擴(kuò)展到 256 GOPS,并提供并發(fā)信號(hào)處理和高效推理。
- AI Max:包括 Tensilica NNA 1xx AI 加速器系列——目前包括 Tensilica NNA 110 加速器和 NNA 120、NNA 140 以及 NNA 180 多核加速器選項(xiàng)——該系列集成了 AI Base 和 AI Boost 技術(shù)。多核 NNA 加速器可以擴(kuò)展到 32 TOPS,而未來(lái)的 NNA 產(chǎn)品的目標(biāo)是擴(kuò)展到上百 TOPS。
所有的 NNE 和 NNA 產(chǎn)品都包括用于提高性能的隨機(jī)稀疏計(jì)算、旨在減少內(nèi)存帶寬的運(yùn)行時(shí)張量壓縮,以及可以減少模型大小的修剪和聚類功能。
該全面的通用人工智能軟件面向所有目標(biāo)應(yīng)用,簡(jiǎn)化了產(chǎn)品開發(fā),并能隨著設(shè)計(jì)要求的變化而靈活輕松地遷移。該軟件包含 Tensilica Neural Network Compiler,該產(chǎn)品支持以下工業(yè)標(biāo)準(zhǔn)的框架:TensorFlow、ONNX、PyTorch、Caffe2、TensorFlowLite 和 MXNet,用于自動(dòng)生成端到端的代碼;Android Neural Network Compiler;TFLite Delegates,用于實(shí)時(shí)執(zhí)行;以及 TensorFlowLiteMicro,用于微控制器級(jí)設(shè)備。
“AI 系統(tǒng)級(jí)芯片開發(fā)者面臨的挑戰(zhàn)是如何讓具有成本效益、差異化的產(chǎn)品更快地進(jìn)入市場(chǎng),提供更長(zhǎng)的電池壽命和可擴(kuò)展的性能。”Cadence 公司副總裁兼 IP 事業(yè)部總經(jīng)理 Sanjive Agarwala 表示,“我們擁有成熟、可擴(kuò)展且可配置的平臺(tái),基于我們一流的 Tensilica DSP,具有通用的人工智能軟件,Cadence 將幫助AI系統(tǒng)級(jí)芯片開發(fā)者最大限度地降低開發(fā)成本,并滿足緊迫的上市時(shí)間要求。通過(guò)在所有性能和預(yù)算水平上實(shí)現(xiàn) AI 賦能,Cadence 正在推動(dòng)各地人工智能系統(tǒng)實(shí)現(xiàn)快速部署。”
客戶反饋
“擴(kuò)展低功耗的終端側(cè) AI 功能需要極其高效的多傳感計(jì)算。Cadence 和 TensorFlow Lite for Microcontrollers (TFLM) 團(tuán)隊(duì)多年來(lái)一直攜手合作,共同開發(fā)解決方案,以實(shí)現(xiàn)人工智能領(lǐng)域最前沿的高能效應(yīng)用。實(shí)時(shí)音頻網(wǎng)絡(luò)使用基于 LSTM 的神經(jīng)網(wǎng)絡(luò)算子以獲得最佳性能和效率的使用趨勢(shì)就是一個(gè)關(guān)鍵的例子。通過(guò)與 Cadence 密切合作,我們正在 Cadence Tensilica HiFi DSP 上集成一個(gè)高度優(yōu)化的 LSTM 算子,大大改善關(guān)鍵用例(如語(yǔ)音通話降噪)的性能。我們很高興能繼續(xù)這項(xiàng)合作,并在低功耗人工智能領(lǐng)域提供引領(lǐng)行業(yè)的創(chuàng)新。”
- Pete Warden,Google TensorFlow Lite Micro 技術(shù)負(fù)責(zé)人
“在我們的 KLT720 上部署設(shè)備內(nèi)置 AI 是我們的客戶取得成功的關(guān)鍵,也是我們實(shí)現(xiàn)‘讓人工智能無(wú)處不在、惠及所有人’這一使命的關(guān)鍵,KLT720 是具有1.4TOPS性能的人工智能系統(tǒng)級(jí)芯片,專門面向汽車、智能家居、智能安防、工業(yè)控制應(yīng)用、醫(yī)療和 AI 物聯(lián)網(wǎng) (AIoT)。Cadence 的 Tensilica Vision DSP 性能高、功耗低、計(jì)算能力強(qiáng)大、帶有 AI ISA 擴(kuò)展及所需的 AI 軟件,可以應(yīng)對(duì)最新的 AI 挑戰(zhàn)。”
- Albert Liu,Kneron 創(chuàng)始人兼首席執(zhí)行官
“將 Cadence Tensilica HiFi 4 DSP 集成到 NXP的 i.MX RT600 跨界 MCU 中,不僅為廣泛的音頻和語(yǔ)音處理應(yīng)用提供了高性能 DSP 功能,而且還提高了推理性能,即使在超低功耗、電池供電的產(chǎn)品中也能實(shí)現(xiàn)人工智能技術(shù)。HiFi 神經(jīng)網(wǎng)絡(luò)庫(kù)使 NXP 能夠充分利用 HiFi 4 DSP 的 AI 性能,并將其整合到支持 TensorFlow Lite Micro 和 Glow ML 推理引擎的 NXP eIQ 機(jī)器學(xué)習(xí)軟件開發(fā)環(huán)境中。”
- Cristiano Castello,NXP Semiconductors 微控制器產(chǎn)品創(chuàng)新資深總監(jiān)
“隨著人工智能應(yīng)用迅速?gòu)脑贫藬U(kuò)展到邊緣,集成終端側(cè)的人工智能加速器已成為滿足 ADAS、移動(dòng)、智能傳感器和物聯(lián)網(wǎng)低延遲要求的必要條件。AI 系統(tǒng)級(jí)芯片需要使用成熟的加速器 IP,以滿足每個(gè)市場(chǎng)的不同需求,并包含一個(gè)全面的軟件解決方案。應(yīng)對(duì)性能和功耗需求的不斷變化,Cadence 憑借 Tensilica AI Base、AI Boost 和 AI Max 技術(shù)提供了一條清晰的遷移路徑,成為終端側(cè) AI IP 全面解決方案市場(chǎng)上廣受認(rèn)可的 IP 供應(yīng)商。”
- Mike Demler,The Linley Group 高級(jí)分析師
可用性
NNE 110 AI 引擎和 NNA 1xx AI 加速器系列支持 Cadence 的智能系統(tǒng)設(shè)計(jì) (Intelligent System Design™) 戰(zhàn)略,該戰(zhàn)略旨在為系統(tǒng)級(jí)芯片的卓越設(shè)計(jì)提供普適智能支持,預(yù)計(jì)將在 2021 年第四季度全面上市。