加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 造芯,如指尖上造城
    • 一是安防芯片本身競爭力。
    • 二是 AI 芯片與安防芯片的集成方式。
    • 三是開發(fā)工具成熟度與易用性。
    • 四是功耗與價格。
    • 三、功耗與價格
    • 造芯,登高還需防跌重
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

安防急缺AI芯片,國內造芯多領域仍是空白

2020/09/28
285
閱讀需 21 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

“如果再買不到海思芯片,我們這個月至少虧掉 600 萬!”

前不久,雷鋒網(wǎng) AI 掘金志撰文《海思「缺貨」,安防「缺芯」》提到:在 9 月 15 日多家供應商斷供華為之前,安防市場已芯荒意亂。

有人痛罵囤貨漲價無理,也有人感慨后繼無人凄愴。

文章發(fā)布后,不少媒體相繼跟進,大多談到了安防市場缺芯現(xiàn)狀及可能的替代方案。

今天,我們沿著該話題進一步聊聊:

安防為何缺芯?畢竟這并非一個高門檻應用行業(yè),無需苛刻的芯片工藝選擇。

海思缺貨之前,AI 安防芯片混戰(zhàn)常被提及,彎道超車之論屢被談起。

如今,身臨海思難產之際,市場緣何又頓入無芯可選之境?制約 AI 安防芯片規(guī)?;瘧玫暮诵募夹g問題究竟是什么?

造芯,如指尖上造城

作為計算機視覺落地較快的領域之一,安防賽道有一個基本封印的現(xiàn)實需要承認:

海思之外,尚無一款足夠優(yōu)秀且合適的安防前端通用芯片,也尚無一款足夠適用安防后端的 AI 芯片出現(xiàn)。

那么,做一款比肩海思產品線的芯片難在哪兒?換句話說,一款「成功」安防芯片的自我修養(yǎng)是什么?

首先,從應用角度出發(fā)看看這個問題。

眼下,不同玩家們大多都會基于自身資源及優(yōu)勢,選取業(yè)務、性能、生態(tài)等方向作為突破點。

但,造芯之難,除了考察紙面理論、戰(zhàn)略打法外,還需解決一道又一道的實際挑戰(zhàn)。

一、安防市場極度碎片化,且做到 500 萬片以上的出貨數(shù)量才有成本優(yōu)勢;

二、前端、存儲、產品開發(fā)、組織建設,都需要相應時間做充足積累。

一款好的芯片,一定需在實際場景中打磨迭代而出,缺乏經年累月的正向打磨,很難沉淀 AI 工程化交付能力。

衡量一款芯片是否達到 AI 工程化交付能力,考察最明顯的算力之外,還需從端側、云側分開驗證幾個重要指標。

誠然,算力實為衡量 AI 芯片指標的重要因素之一。

時間撥回 2014 年,人工智能落地剛剛興起,端側 AI 芯片算力僅有 0.2Tops,云側 AI 芯片算力僅有 5Tops;如今端側 AI 芯片算力已經達到 4Tops 以上,云側 AI 芯片算力也已達到 256Tops 以上。

但僅看算力指數(shù)顯然遠遠不夠。于端側,安防芯片考察本身競爭力、集成方式、開發(fā)工具成熟度與易用性、功耗與價格等。

一是安防芯片本身競爭力。

安防端側一直用得是安防專用芯片,并不存在通用芯片。即使 AI 時代,端側芯片首先需要的是有競爭力的安防芯片,其次才是在這基礎上疊加 AI 算力。

譬如,OS、安防 SDKISP、編碼皆重要非常,這對芯片廠商提出的綜合要求明顯提高,需要具備完整能力的芯片。

端側芯片,雖然體積小、價格低,但系統(tǒng)復雜度、技術難度絲毫也不低。

二是 AI 芯片與安防芯片的集成方式。

前些年,AI 落地端側,采用的是在主芯片邊上加一顆 AI 協(xié)處理器,即兩顆芯片的方式。

如今,合二為一的方案已是主流,在系統(tǒng)復雜度、成本、功耗上都更有競爭力,實現(xiàn)過程也更加復雜。

三是開發(fā)工具成熟度與易用性。

芯片的軟件開發(fā)工具非常重要。譬如,是否支持 Caffe、Tensorflow、Pytorch 等主流深度學習框架,相關工具是不是易用、穩(wěn)定,對于 AI 應用開發(fā)者來說都非常重要。

如果開發(fā)工具不成熟或不易用,很容易就會被開發(fā)者拋棄。

四是功耗與價格。

端側設備,對功耗和價格都非常敏感。

云側芯片則對解碼能力、大數(shù)據(jù)并發(fā)效率、開發(fā)工具成熟度與易用性、功耗以及價格要求較高。

一、解碼能力

云側芯片處理的是經過編碼的圖片或視頻,需要持續(xù)解碼。

芯片設計上,需要內嵌專門的硬解碼模塊,不占用 AI 算力;另外,解碼能力上必須不能低于 AI 處理能力,不然解碼就會成為瓶頸。

二、大數(shù)據(jù)并發(fā)效率

現(xiàn)在云側芯片的 AI 處理能力非常強,所以大數(shù)據(jù)并發(fā)交互的效率非常重要,大數(shù)據(jù)并發(fā)效率決定了 AI 算力實際能發(fā)揮多少。

三、功耗與價格

云側芯片在這方面雖然沒有端側芯片那么敏感,但低功耗與低價格永遠都是用戶的訴求。

其次,從技術角度看看這個問題。

安防領域存有大量的算法需要前置,而目前的算法訓練基本還是基于后端的深度學習模型。

此外,安防行業(yè)還需實時處理大量連續(xù)圖像數(shù)據(jù)流,數(shù)據(jù)處理在于兩大維度:一、每秒處理幀率要越來越高;二、圖像分辨率要越來越高。

兩大維度之下,安防對于端側芯片提出了一些要求。

針對已經入場的大小玩家,分析他們的產品形態(tài),大致可以分為兩種:一是針對特定應用的 SoC;二是通用加速器做獨立芯片。

應用安防市場,SoC 面向專用市場,在芯片中深度學習加速計算事實上只是一部分,而其他大部分芯片面積則交給了主控處理器、視頻解碼等模塊。

終端通用深度學習加速器芯片市場的應用則剛起步,大多公司的市場布局主要在試錯的同時,培養(yǎng)開發(fā)者生態(tài)。

同時,從業(yè)者們也逐漸發(fā)現(xiàn),芯片中最為關鍵的其實并不是單純提升算力,如果不進行存儲優(yōu)化,那么芯片實際提供的計算力會大大降低。

若想突破 AI 芯片的瓶頸,并不能只是簡單的增加計算算力,而是一定要把數(shù)據(jù)存儲管理做好。對于存儲問題的解決,仍是一個探索中的新方向。

AI 芯片對于傳統(tǒng)芯片帶來的挑戰(zhàn),并不只是計算架構上的,更多是在存儲架構間的。

傳統(tǒng)芯片采用的是馮·諾依曼架構,其核心架構中計算模塊和存儲單元是分離的。CPU 和內存條并不集成在一起,只在 CPU 中設置了容量極小的高速緩存。

也就是說,CPU 在執(zhí)行命令時必須先從存儲單元中讀取數(shù)據(jù)。每一項任務,如果有十個步驟,那么 CPU 會依次進行十次讀取,執(zhí)行,再讀取,再執(zhí)行…

這就造成了延時,以及大量功耗花費在數(shù)據(jù)讀取上,這一問題也被稱為傳統(tǒng)芯片的內存墻問題。

而在 AI 應用中,馮·諾伊曼瓶頸問題顯得愈發(fā)嚴重。

AI 依賴的算法是一個龐大和復雜的網(wǎng)絡,包含很多參數(shù)需要存儲,也需要完成大量的計算,這些計算中又會產生大量數(shù)據(jù)。

在完成大量計算的過程中,一般芯片的設計思路是大量增加并行的運算單元,例如上千個卷積單元,需要調用的存儲資源也在增大。

不夸張地說,AI 初創(chuàng)芯片公司雖然采用不同的路徑打造芯片,但事實上都在努力對這一問題予以解決。大部分針對 AI,尤其是加速神經網(wǎng)絡處理而提出的硬件架構創(chuàng)新,都是在與這個問題做斗爭。

如何解決這一問題呢?目前解決方法有以下幾種:

較為常見的方法是加大存儲帶寬,采用高帶寬的外部存儲;二是從算法入手,設計低比特權重的神經網(wǎng)絡。

除此之外,存算一體化也被看做是未來的發(fā)展方向,在實現(xiàn)上也分為不同的路徑。

其一是 SSD 中植入計算芯片或者邏輯計算單元,可以被叫做存內處理或者近數(shù)據(jù)計算,這其實是深度學習的一種應用場景,并非是 AI 芯片架構的創(chuàng)新。

另一種就是存儲和計算完全結合在一起,使用存儲的器件單元直接完成計算,比較適合神經網(wǎng)絡推理類應用。

也有人不太認同存算一體的處理方式,探境 CEO 魯勇認為,這樣做的成本太高,并不符合市場需求。

“存算一體的處理方式,其實違反了芯片中的成本結構。芯片中,之所以設計和區(qū)分片上的緩存 SRAM,及片外的 DRAM,就是因為如果所有存儲都放入芯片內部,成本就大幅上升,會上升幾十倍到上百倍?!?/p>

就此,他們提出了 SFA(Storage First Architecture,簡稱 SFA),即存儲優(yōu)先架構。

與通常計算的先有計算指令然后提供數(shù)據(jù)相反,SFA 架構考慮數(shù)據(jù)在搬移過程中做計算,也就是由數(shù)據(jù)帶動計算而非由算子帶動數(shù)據(jù)。

這一點與 AI 大神 Lecun 所宣稱的所有的神經網(wǎng)絡都是圖計算問題不謀而合。那么打破傳統(tǒng)馮·諾依曼架構,自研存算一體架構的依據(jù)是什么?

這可以談到人類大腦的存儲和計算方式。從生物角度講,大腦存儲大量的知識,能夠快速提取并訪問,而大腦的內存和計算并不是分開的,更多的是存在一定的相容性。

因此,未來的計算機可能不是基于計算的存儲,而是基于存儲的計算,更多做到融合。不過,因為當前芯片領域對于 AI 算法的關注還較多,針對 AI 的結構改進嘗試還偏少。

造芯,登高還需防跌重

過去幾年,不少企業(yè)針對安防領域紛紛宣布流片之喜,但似乎還未出現(xiàn)強勢的對傳統(tǒng)芯片的替代或繼任者。

從大環(huán)境來看,國內雖有不少公司關注對 AI 芯片的底層架構的研發(fā),但更多只追求有、不追求好,用拼湊的方式做芯片。

甚至于,不少玩家為了順應市場形勢,將自己包裝成一個 AI 芯片公司,給市場徒增泡沫。

同時,國內 AI 芯片企業(yè),眼下普遍缺乏后端設計人才,后端設計相對于前端邏輯設計,更多涉及到芯片的工藝,也相對更需要豐富的經驗。

由此,很多廠商會通過外包的方式做后端服務,來完成生產。這對芯片廠商來說,其實是一個很大的競爭劣勢。

針對安防缺芯之話題,此前 AI 掘金志也采訪了多家有著不同創(chuàng)新路徑的芯片企業(yè),他們或從優(yōu)化芯片的計算、存儲架構入手,或選擇做軟硬一體,或著眼于攝像頭中的 ISP、編解碼芯片。

對于 AI 安防芯片要解決的主要問題和創(chuàng)新路徑,企業(yè)家們有著共識,也有各自不同的選擇和看法。

觸景無限副總裁陳勇:做芯,軟硬件耦合是關鍵?

做一款 AI 安防芯片要從全棧解決方案出發(fā),不僅僅只有芯片,還要有比較完善的軟件生態(tài)來耦合這個芯片,這樣用戶才比較容易、也能動態(tài)部署符合他們需求的方案。

另一個點是芯片的算力能效,芯片不能只單單提供算力,還要在滿足應用算力要求的前提下消耗最少能量。

我覺得,這兩個方面對于 AI 安防芯片來說最重要。

觸景無限做芯片就是為了讓自己的算法和工程經驗找到一個更好耦合的練兵場,達成軟硬件的協(xié)同優(yōu)化,更好地實現(xiàn)前端感知。

以前,我們發(fā)現(xiàn) AI 加速只是前端落地應用需求的一個點,打磨很長時間的 AI 加速芯片產品,用在前端的效果還是不夠好。

就像一條公路,AI 芯片的集成像是鋪上了柏油,但車輛通行時除了對于路面的高要求,還有對于路牌、路標、服務區(qū)的需求,而這些在實際過程中,都沒法得到很好的滿足。

在芯片具體研究中,我認為,對 AI 安防芯片來說,由于多層神經網(wǎng)絡的應用,如何做到各種神經層中間的高效數(shù)據(jù)傳輸是一個難點。

另外,我們認為雖然在攝像頭內,主控芯片很強勢。但 AI 協(xié)處理器有它獨有的靈活性和高效性,并不能簡單地被主控芯片集成。這種通用性和專用性的取舍會一直存在,而這也是 AI 協(xié)處理器存在的機會。

探境科技 CEO 魯勇:芯片的數(shù)據(jù)存儲管理要做好

安防領域的數(shù)據(jù)特點,其實主要在于需要實時的處理大量連續(xù)的圖像數(shù)據(jù)流。

第一是每秒處理幀率要越來越高,第二是圖像分辨率上要高。在這兩個維度上,安防對邊緣芯片提出了要求。

原先很多安防廠商采用 Movidius 的芯片實現(xiàn)前端智能,但我們認為它并不是非常適用于安防前端。不過 Movidius 的火爆,恰好說明了市場對邊緣端芯片的強大需求。

我的看法是,要突破 AI 安防芯片的瓶頸,并不能只是簡單的增加計算算力,而是一定要把數(shù)據(jù)存儲管理做好。

傳統(tǒng)芯片中,采用的是馮·諾伊曼架構,計算模塊和存儲單元是分開的,“內存墻”問題很嚴重。而 AI 依賴的算法是一個龐大和復雜的網(wǎng)絡,有很多參數(shù)要存儲,也需要完成大量的計算,需要巨大存儲容量,高帶寬、低延時的訪存能力。很多 AI 初創(chuàng)芯片公司,實際上都在努力解決這個問題。

而我們的思考是,不能采取通常的先有計算指令然后提供數(shù)據(jù)的方式,應該從存儲子系統(tǒng)的優(yōu)化入手,讓數(shù)據(jù)在存儲之間的搬移過程之中完成計算。

這也可以叫做“基于 memory 的計算”,而不是“基于計算的 memory”。

當前芯片領域對于 AI 算法的關注還較多,針對 AI 的結構改進嘗試還比較少。之后,memory 與 computing 結合的嘗試,我相信會是一個好的方向。?

華夏芯 CEO 李科奕:提升 AI 芯片的易用性 ??

現(xiàn)在的安防市場上,已經出現(xiàn)了很多前端的 AI 加速器,但實際它們在應用上,還存在一些問題。

第一是價格太高。第二是可編程性不足。原先的通用芯片 CPU 很容易能實現(xiàn)編程,但 AI 加速模塊中并沒有指令集,無法編程,需要手工去調整。?

在安防領域也是一樣,廠商普遍反映的,不是 AI 芯片的性能,而是無論 AI 初創(chuàng)企業(yè),還是傳統(tǒng)大廠設計的加速器都很復雜,AI 加速器很難被用起來。

一般來說,通用芯片難以負荷對計算的高要求,AI 專用芯片則在可編程性、靈活性上有所欠缺。目前應用較多的集成度高的 Soc,將不同計算架構芯片集成在一起,需要多套編程程序,運行就容易帶來問題。這也是安防芯片廠商們,尤其是在安防前端應用上面臨的難題。

而業(yè)內目前看好的一種方式,就是將不同的芯片架構結合在一起,這就是“異構計算”。

異構計算的長處在于,能實現(xiàn)比較好的適應性和靈活性,在通用性和專用性上達成一個折衷。既能高效的處理數(shù)據(jù),又能相對保證算法的及時更新和迭代。這也是我們在探索的一個方向。

現(xiàn)在在安防、自動駕駛等這些邊緣端的市場,對芯片的綜合要求非常高。芯片需要處理的數(shù)據(jù)量很大,同時對于性能、性價比、性能功耗比要求也很高。

但我們看好這些新興市場,因為邊緣端的需求量很大,而且相對于手機、云計算、PC 端等這些已經很成熟的市場,給了芯片廠商更多創(chuàng)新,和在新市場中占據(jù)位置的機會。

欣博電子 CEO 梁敏學:很多 AI 安防芯片是同質化的

對于 AI 安防芯片來說,我認為“芯片+算法”的整合是最重要的。而對于具體一款芯片,最主要的指標應該是價格和穩(wěn)定性。

芯片是“硬”的,算法是“軟”的,如何能將兩者更好的結合起來,這就需要加強芯片對底層運算加速算法的適應性。

現(xiàn)有芯片的問題,從技術角度來說,對前端的 AI 芯片算力的要求,對存儲問題的解決,都很重要,都需要靠算法和芯片架構一起來改善,比如說現(xiàn)在的算法就還比較耗帶寬。

再具體應用上,我認為 AI 安防芯片在安防攝像頭中作為協(xié)處理器,目前已經被主控芯片集成了,所以單純提供 AI 加速器并不占優(yōu)勢。

而我們所做的,是開發(fā)編解碼能力、加密及 AI 能力三合一的芯片,為攝像頭提供安全加密。這也是我們相對于其他芯片廠商不同的一點。

從行業(yè)角度來說,現(xiàn)有 AI 芯片在安防行業(yè)應用落地上的主要問題,其實是同質化。

很多 AI 芯片廠商產出的芯片并沒有太大差別,一方面很多芯片達不到現(xiàn)有安防行業(yè)對前端 AI 芯片的要求,一方面又容易陷入芯片同質化競爭。

現(xiàn)在的安防芯片格局下,其實已經存在壟斷的生態(tài),有大的行業(yè)玩家存在,那么做 AI 安防芯片如何找到自己的價值點,并做到差異化還是最難的。

人人智能 CEO 王海增:芯片行業(yè)很殘酷,遵循二元法則?

AI 芯片前兩年很熱,“熱”的同時,也讓市場很浮躁,去年一年,業(yè)內就推出了十幾款 AI 芯片。

但在安防和芯片領域摸爬滾打多年,我們的看法是不去做純碎的單一芯片,而是做融合芯片、算法和系統(tǒng)的 FaceOS 視覺中間件,用在人證比對等。

在我看來,市場上可能只需要一款主流產品。芯片行業(yè)是很殘酷的,有個二元法則,就是老大吃肉,老二喝湯。老三、老四可能找不到名字。

綜合來說,我還是比較看好華為海思。在安防視頻芯片的領域,有華為海思這樣的對手存在,做視覺智能芯片幾乎沒有太多機會,這一事實很難改變。

之前,我們對比過這些芯片,發(fā)現(xiàn)芯片從高端到低端系列,海思的芯片布局很完整,渠道健全,而且功能幾乎比現(xiàn)有的幾個 AI 芯片廠商都更加領先,優(yōu)勢很明顯。兩三年前,我們能看到這個市場很大,但不知道誰能跑出來,現(xiàn)在回過頭來再看,我們依然覺得海思跑的更靠前了。

另外,AI 芯片領域雖然一直在談創(chuàng)新,但實際上,真正的創(chuàng)新還尚未到來。

算法的底層架構,如 TensorFlow、Caffee 等方面幾乎都是采用國外的架構。

底層的算法上面,國內幾乎還處于空白。這涉及很多基礎數(shù)學的問題。就像谷歌談張量計算芯片,是發(fā)覺了卷積使用的張量計算的模型和傳統(tǒng)模型不同,所以需要設計芯片設備,適應它的模型,這是算法型的創(chuàng)新。而且谷歌還發(fā)明了 TensorFlow 這樣的主要架構。

這些在國內還都是空白。

相關推薦

電子產業(yè)圖譜