“邊緣AI”是席卷IoT、嵌入式和AI市場的最新趨勢,我們也需要更多了解這些邊緣AI方法之間底有什么區(qū)別。一家名為AONDevices的初創(chuàng)公司正在走一條務(wù)實的道路,它的ASIC在功耗、處理能力和識別精度方面表現(xiàn)出色。
光說AI是不夠的。“邊緣AI”被認為是減少延遲和帶寬、提高可靠性、增加數(shù)據(jù)安全和隱私,同時削減邊緣計算功耗的關(guān)鍵。
但不是所有的“邊緣AI”都是一樣的。
關(guān)于在何處以及如何將AI置于邊緣的問題,方法各不相同。一些供應(yīng)商使用自己的MCU,另一些則將AI嵌入到無線SoC中。許多AI初創(chuàng)公司希望將其AI處理器設(shè)計到終端系統(tǒng)中。
AON的CEO Mouna El Khatib提醒說,問題是,由于對OEM們很重視實施結(jié)果,所以其結(jié)果在功耗、處理速度和AI算法性能方面可能會讓系統(tǒng)OEM失望。
特定應(yīng)用的AI處理器
AON是一家位于加州Irvine的fabless公司,專門從事特定應(yīng)用的邊緣AI處理器。AON將其使命描述為“在電池供電的設(shè)備中實現(xiàn)語音激活和聲音識別的邊緣AI”。
許多AI芯片初創(chuàng)公司的主要目標是在探索應(yīng)用之前設(shè)計神經(jīng)網(wǎng)絡(luò)處理器,與此不同,El Khatib從一開始就知道她的處理器必須解決的問題。她說:“我想創(chuàng)造一種解決方案,保證任何模式識別都是開箱即用的。”
對于AON來說,AI不是目標,而是解決特定應(yīng)用問題的手段。
在創(chuàng)建AON之前,El Khatib曾在Connexant和Qualcomm從事語音、音頻和硬件DSP SoC領(lǐng)域擔任首席工程師,此外還曾在Brainchip短暫任職。她的親身經(jīng)歷讓她了解到邊緣AI的局限性和陷阱。
她說,邊緣AI往往會引發(fā)“硬件、軟件和算法開發(fā)者之間彼此推責”。它可以由需要大量手工編碼軟件的音頻DSP處理器和功耗很大的通用CPU實現(xiàn)。一個帶有神經(jīng)網(wǎng)絡(luò)加速器的混合方法可能需要復(fù)雜的調(diào)整。處理器和算法之間的不匹配(硬件不夠強大,無法運行算法,或者第三方算法太大,無法在通用處理器上運行)并不罕見。
最糟糕的結(jié)果是識別性能不佳。El Khatib說:“如果它不能一直工作,或者它不準確,人們就不會信任邊緣AI。”
因此,她解釋說,AON已經(jīng)開發(fā)了將算法嵌入ASIC的解決方案。她指出,“我們認為算法和硬件的共同設(shè)計對于在超低功耗下提供高性能語音和聲音識別至關(guān)重要。”
AON的產(chǎn)品
AON以兩種形式提供其邊緣AI處理器,IP和機器學習芯片。神經(jīng)處理ASIC與深度學習算法緊密耦合。
AON聲稱,其超低功耗和多模態(tài)芯片可以同時處理多個語音指令、聲音事件和傳感器融合。通過添加另一個傳感器(如加速度計)AON的多核AI可以處理手勢識別,為識別的聲音添加上下文。
AON的神經(jīng)處理ASIC稱為AON1100,實現(xiàn)了“通過使用單個麥克風,而不是像許多公司那樣依賴兩個麥克風,在0dB信噪比下的命中率達到90%”。
該芯片采用40nm工藝制造,功耗為260µW。當被問及在產(chǎn)品中添加AON的SoC的成本時,El Khatib表示,根據(jù)數(shù)量,AON1100的成本為1-2美元。
AON的經(jīng)營狀況
在一個習慣于用融資能力來衡量AI芯片初創(chuàng)公司的價值和技術(shù)的行業(yè)氛圍中,AON一直未受關(guān)注。
事實證明,2018年以260萬美元種子資金成立的AON不需要融資,因為它已經(jīng)有了三個付費的大客戶,兩個芯片供應(yīng)商和一個大型移動OEM。
其中一個客戶是Dialog Semiconductor。根據(jù)AON網(wǎng)站上的介紹,Dialog正在將AI集成到該公司的先進無線通信IC中,以“在邊緣為所有應(yīng)用提供語音活動和熱詞檢測”。
當被問及那個大型移動OEM客戶時,El Khatib解釋說,它正在授權(quán)AON的IP,計劃集成到自己的SoC中。
這位CEO指出,AON目前正在進行A輪融資,目標是1000萬-1500萬美元。
AON的管理團隊由經(jīng)驗豐富的高管組成,他們曾在Connexant、Qualcomm、Intel和Broadcom等公司工作。例如,COO Ziad Mansour曾擔任工程高級副總裁,領(lǐng)導(dǎo)Qualcomm的CDMA技術(shù)(QCT)部門的數(shù)字硬件組。Khatib說服他在退休后加入AON。
語音/聲音識別的演變
Fortune Business Insights預(yù)測,語音/聲音識別市場將從2018年的69億美元增長到2026年的2830億美元。
在這一兩位數(shù)的年復(fù)合增長率背后,是促使其發(fā)展的一系列創(chuàng)新。從“Hey Siri”、“OK,Google”等智能音箱和智能手機開始,語音識別技術(shù)已經(jīng)發(fā)展到耳機、智能手機和IoT等設(shè)備上的聲音識別?,F(xiàn)在,該技術(shù)可以在遙控器或耳機上提供有或無喚醒詞的設(shè)備語音指令。
AON認為,未來的方向是支持“同時使用多個喚醒詞、語音指令、聲音識別和傳感器融合”的設(shè)備。這類設(shè)備包括hearables、可穿戴設(shè)備、機器、機器人,甚至是車輛。
鑒于語音識別技術(shù)的快速發(fā)展及其迅速發(fā)展的應(yīng)用,El Khatib為邊緣AI解決方案將變得無處不在的未來提出了一些基本規(guī)則。“首先,它必須永遠開著,而且必須以超低功耗工作。”
其次,她說,“我們需要在不使用降噪的情況下實現(xiàn)語音和聲音識別。”現(xiàn)實世界是混亂和嘈雜的。語音和聲音識別必須能夠經(jīng)受住這種現(xiàn)實。更重要的是,耳機和hearables的聲音識別應(yīng)該能夠通過自動禁用降噪和降低音量來提醒用戶注意外部危險,如鳴笛和嬰兒的苦惱,用音樂質(zhì)量換取安全。
競爭格局
除了一大批新的AI處理器公司,許多MCU供應(yīng)商也在尋求在邊緣實現(xiàn)AI。
一批SoC供應(yīng)商正在考慮將機器學習集成到邊緣設(shè)備中,并稱這種趨勢是“IoT中備受期待的發(fā)展之一”。例如,Silicon Labs正在提供內(nèi)置AI/ML硬件加速器的無線SoC。
添加一個硬件加速器作為協(xié)處理器來減輕MCU負載是實現(xiàn)AI/ML的一個流行方法。但也有需要留意的地方。
El Khatib解釋說:“一般來說,這些硬件加速器仍然需要在MCU中進行大量的處理,造成更高的功耗和更高的延遲。”她說,主要的問題是,這是一個通用系統(tǒng),需要OEM廠商尋找和嵌入自己的算法。芯片公司要求OEM從第三方采購工具,同時繼續(xù)對最終系統(tǒng)負責。El Khatib說:“基本上,購買了這些部件的系統(tǒng)公司必須確保他們組合起來的解決方案有效。”
AON的任務(wù)是通過提供完整的解決方案來避免復(fù)雜化:硬件、算法、工具和軟件被設(shè)計為協(xié)同工作。El Khhatib聲稱:“客戶只需定義用例,向工具組提供數(shù)據(jù),并迅速啟動和運行。”
同時,像Apple這樣的智能手機公司正在其應(yīng)用處理器上運行AI/ML軟件。例如,iPhone可以運行聲音識別,檢測玻璃破碎、煙霧警報或嬰兒哭鬧等情況。在一個視頻演示中,AON將自己的解決方案與基于iOS15的iPhone進行了對比,雖然iPhone在檢測聲音,但用戶無法使用語音識別功能(嘿,Siri)。在演示中,iPhone在聲音檢測和識別方面也出現(xiàn)了延遲。但最大的問題是功耗,El Khatib指出,“在應(yīng)用處理器中運行軟件對電源來說不是最好的選擇。”
AON尚未對外透露其處理架構(gòu)的細節(jié)。但在AI初創(chuàng)公司中,這家公司與眾不同,因為它沒有專注于激烈的TOPS競爭或追逐資金。AON明確專注于特定的應(yīng)用(以超低功耗進行語音和聲音識別),正在采取實用的邊緣AI路線。