“算法幾乎沒有什么門檻了。”不少人如此認為。
當AI初創(chuàng)企業(yè)層出不窮,開放式平臺日漸增多,幾年爭奇斗艷下,算法的確不再是九天月,遙不可及。算法、算力、數(shù)據(jù)的人工智能三要素中,算法逐漸被合力攻下。
不再為少數(shù)人獨有的算法,逐漸滲透進蕓蕓產(chǎn)業(yè),落地至萬千場景,新的市場模式誕生:不少企業(yè)做起了“算法商城”的生意,打造計算機視覺領域的APP Store。算法是否真的沒有門檻?像下載APP一樣購買算法的算法商城模式,真的可行嗎?
市場太大,供應太少。
這是催生視覺算法商城的沃土。AI等技術日趨成熟,AI正從安防、交通等領域走向全域。未來5-10年,AI市場將達千億、萬億級別已是不爭事實。人臉識別和車輛識別金字塔尖底下,藏著一個巨大的腰尾市場。海量的碎片化市場里,存在著萬千被忽視的小場景。火焰識別、吸煙識別、樓道障礙物識別、快遞爆倉識別、疲勞駕駛檢測......無數(shù)散落在全國各地區(qū)、各行業(yè)的AI需求,像潺潺流水的小溪,正流淌、貫穿出一副山河巨制。它碎片化、客戶體量小、項目規(guī)模小,營收小,但勝在數(shù)量多,如毛細血管般的市場,正成為腰尾部市場走上臺前的重要砝碼。
但,不僅扎根于AI腰圍部的市場少之又少,也沒有一家公司能涵蓋所有算法。由此,不少人認為,計算機視覺算法平臺,是AI發(fā)展的必然未來式。主張軟件定義的華為便是其中之一。強勢入圈安防的華為不斷亮出新的底牌,包括2019年的算法商城。算法商城,可視為華為軟件定義攝像頭、連接合作伙伴上的進一步延續(xù)。在華為看來,線下場景千千萬,一個硬件一種算法將成為過去。
- 算法快速發(fā)展的需求。AI時代算法、軟件更新?lián)Q代的速度遠遠快于過去,每月乃至每周都有版本升級。需求多樣性。單一算法需要精準度會不斷提升,未來更需要人臉、人體、姿態(tài)等多維度數(shù)據(jù)輔助。運維管理智能化。未來算法多樣性,場景多樣性,以及全網(wǎng)攝像機的管理,需要一個可視、可管理、可遠程控制的產(chǎn)品,與云端互動,實現(xiàn)在線加載、升級、管理。
智能攝像機根據(jù)不同的場景按需加載不同的軟件和算法,通過多特征提取與識別、多攝像機間的協(xié)同、端云間的協(xié)同成倍地提高智能分析效率。通過算法平臺,結合生態(tài)伙伴,賦能千行百業(yè)。不難發(fā)現(xiàn),這與華為對安防碎片化場景的理解一致。華為一直嘗試重新整合安防的碎片化,又或者,重新定義安防市場。段愛國曾對雷鋒網(wǎng)AI掘金志表示,碎片化是傳統(tǒng)安防的思維慣性和遺留問題,歷史時期,數(shù)據(jù)的確是碎片化的。但傳統(tǒng)時代,數(shù)據(jù)不是關鍵。
智能時代,數(shù)據(jù)堪比石油,需要聯(lián)通、共享、匯聚,方能產(chǎn)生更多價值。進入新的時代,碎片化已經(jīng)是一個偽命題。安防需要擁抱云和大數(shù)據(jù),大聯(lián)網(wǎng)、大數(shù)據(jù)、大平臺、大生態(tài)。但不少人對此持觀望態(tài)度。
他們認為,安防場景更多是產(chǎn)品定義。安防行業(yè)并不等于手機行業(yè),不能簡單類比。
算法商城模式或者軟件定義的成立,需要考慮幾個必要問題。
1、細分場景是否有高頻的交互和算法需求。To C 市場,APP Store或者算法商城也許游刃有余,以手機為例,人與產(chǎn)品不停地交互,聽音樂、看視頻、打游戲等,切換、升級、卸載軟件非常頻繁。但To B/P市場,場景需求差異較大,用戶選擇某一產(chǎn)品,是基于其特定的需求和產(chǎn)品的功能。人與產(chǎn)品沒有也不需要頻繁交互,軟件升級迭代頻率也不高。比如超市攝像頭,目的是巡店、貨品管理、輔助結算等功能,切換算法的需求存在,但并不高頻和迫切,也無需人與產(chǎn)品長時間交互。
2、算法隨意切換的前提是硬件的高配置或標準化。要實現(xiàn)設備承載不同的算法運行,要么設備參數(shù)配置高,要么標準化。但即使同為某一品牌,幾百款不同產(chǎn)品,具備不同的芯片、傳感器性能、解析度大小、焦距遠近等,高配置和標準化似乎都難以實現(xiàn)??缭竭@些障礙,承載多算法、多應用需要的時間和技術,算法商城提供商需要考慮的問題。
3、市場大小和成本考量。正如前文所述,海量的腰尾部市場中,碎片化、客戶體量小、項目規(guī)模小,營收小,單個細分領域市場并不大。這對算法商城的算法開發(fā)、研發(fā)成本提出極高要求。算法的成本在于開發(fā)和驗證,目前的算法模型訓練,是否收集到足夠多的場景數(shù)據(jù)是關鍵。針對AI視覺算法商城話題,雷鋒網(wǎng)AI掘金志采訪了數(shù)位業(yè)內專家、企業(yè)高管,對于AI視覺算法商城模式,企業(yè)家們有著共識,也有各自不同的選擇和看法。
業(yè)內某高管
1:邊際成本、客戶能力、行業(yè)知識是關鍵體量大的市場被頭部企業(yè)瓜分,細分場景的市場容量小,而算法投入大,研發(fā)成本要足夠低,邊際成本足夠低,且平臺能力、客戶能力在線,這個理論才有實現(xiàn)的可能,否則業(yè)務難以實現(xiàn)閉環(huán)。以現(xiàn)在深度學習的技術,初步素材積累的工作量驚人。算法平臺的技術可以攻克,核心是客戶的整體能力,否則平臺的意義不大。更重要的是,在垂直領域,關鍵的門檻不是AI算法能力,而是行業(yè)知識。算力、算法、數(shù)據(jù)技術壁壘之外,「場景、應用、知識」成了決定算法能否真正落地的關鍵點。比如識別天氣,需要了解不同類別的云,生成原理,演變過程,還需要模擬測試環(huán)境和測試集;再比如識別豬,需要了解豬的全生長周期,每個周期具體情況。這些都需要長期深耕行業(yè)。這些都需要深入到一線,與客戶溝通交互,獲得具體場景的認知,但這些是單個開發(fā)者不具備的。業(yè)內某高管
2:軟件定義不是一個趨勢,是一種可落地的方式1、在成本面前,海量算法需求并非都能被挖掘且落地。首先,算法的豐富性需要達到一個量級。其次,算法研發(fā)需要巨大的成本投入,比如,可落地的算法需要訓練海量的樣本,但樣本積累的工作量巨大:需要10萬量級的樣本,才能訓練出80%的精確度,且抓取數(shù)據(jù)后,需要以張為單位的甄別樣本,并標定。比如寵物識別,就需要上百萬級別的數(shù)據(jù)和標注工作量。根據(jù)目前深度學習能力,小樣本難以實現(xiàn)高精度。市面上買來小量樣本訓練,可能只達到70%精確度,誤報率非常高,難以落地。目前為止,之所以AI在人、臉、車落地效果較好,是因此類頭部領域積累的樣本足夠豐富。
另外,客戶群體、渠道等問題是變現(xiàn)的核心環(huán)節(jié),并非算法單維度。手機的軟件定義之所以成功,一是足夠多的應用,二是手機APP本身的研發(fā)非常輕量化,且研發(fā)完后變現(xiàn)很快。只有那些掌握了客戶群體,掌握了產(chǎn)品,掌握了渠道,有實力的公司,慢慢去運營,才有可能解決變現(xiàn)問題。
2、攝像機本身的碎片化,讓大規(guī)模應用難度大。與手機僅有兩個系統(tǒng),任何應用都能運行不同,攝像機內在芯片和硬件都不同。比如海思的芯片,從幾美金到幾百美金不等,不同芯片上的算法并不兼容。有些算法需要2T的算力才能運行30幀,有些算法可能只需要0.5T就夠了。把高算力的算法放到低算力的產(chǎn)品上,難以得到想要的效果。而且算法落地后受攝像機的成像影響很大,即使是同一品牌的產(chǎn)品,不同產(chǎn)品型號之間,鏡頭廣角、傳感器等的質量都不一樣,最終對算法的效果都有影響,所以大規(guī)模產(chǎn)品應用較難。軟件定義不是一個趨勢,而是一種可落地的方式。
3:算法商城需要經(jīng)歷教育市場的過程每個新的行業(yè),會先經(jīng)歷供給創(chuàng)造需求,再需求拉動供給的階段。正如蘋果迭代幾代后,才開始在To C市場大面積普及,人工智能落地時也如此,在教育中得到反饋并不斷迭代。算法商城需要經(jīng)歷一個教育市場的過程。智能安防攝像機的應用程序并不是一個新概念。
隨著深度學習技術的進步,基于應用程序的生態(tài)系統(tǒng)與視頻分析的同步興起,更多基于深度學習視頻分析的應用,將被更多攝像機所兼容,算法應用的角色也變得更為突出。
在各種場景上,攝像機與場景的組合十分復雜,但近年來,越來越多的智能硬件產(chǎn)品已在迭代跨越這些障礙。攝像機正從單一功能的終端,向多應用聚合的平臺轉變。當基礎設施完成后,依托云,構建一個類似于APP Store的模式,于用戶,只需要下載算法,就有新的AI支持。對于大公司來講,這也是持續(xù)發(fā)展的優(yōu)選,硬件敲門,軟件做增值服務。在更宏觀的層面上,大廠可利用體量和品牌優(yōu)勢,結合合作伙伴的能力,加速數(shù)據(jù)融合和算法開發(fā)。
初創(chuàng)企業(yè),可以以完全獨立的第三方平臺的角度切入,是能幫助智能化能力不高的企業(yè)在智能化時代立足,是有市場剛需的。大華股份資深算法工程師:深入業(yè)務場景,構建算法全鏈路技術研發(fā)和高質量交付能力無論是行業(yè)算法還是算法商城本質還是希望通過智能化技術讓客戶能快速、精準解決他的業(yè)務痛點。但隨著數(shù)字化轉型的不斷深入,各行各業(yè)對于智能化的需求越來越多,需要產(chǎn)業(yè)提供在更細分場景下的定制算法,導致了需求越發(fā)“碎片化”,并且市場對算法交付要求也不斷提升,需要開發(fā)者在深入理解行業(yè)痛點前提下,進行定制、精準、快速、可控的算法開發(fā)。當前主流算法商城普遍上還是基于圖片識別,有一定可行性,但普適性不高;同時,對于部分通用的成熟型算法,由于應用場景差異較小,基礎模式即可滿足需求。
因此,我們在實現(xiàn)人工智能產(chǎn)業(yè)化落地中,始終貫徹“場景牽引”、“可商用”、“快速定制交付”的理念,聚焦從數(shù)據(jù)管理、算法訓練、人工智能應用開發(fā)、跨平臺部署、產(chǎn)品仿真驗證、發(fā)布交付的全鏈路技術研發(fā)和閉環(huán)管理,在此基礎上我們自研了巨靈一站式人工智能開發(fā)平臺,為各行業(yè)提供一站式算法及方案開發(fā)交付支撐能力,從而實現(xiàn)算法高質量的定制化敏捷交付,大幅提升算法產(chǎn)業(yè)化落地效率。以交通行業(yè)為例,杭州的綠色停車方案(早餐店、便利店等附近車位20分鐘內免費停車)緩解了杭州市民短時停車難的問題,所以一經(jīng)推出,廣受好評。這背后是開發(fā)人員切實理解從違章處罰到便民管理的行業(yè)需求,有針對性的開發(fā)定制,最終提供真正滿足客戶需要的算法方案。非現(xiàn)場違章審核算法更是如此,由于不同地區(qū)判罰標準不一,需要開發(fā)人員重新梳理需求,打磨算法,才可真正降低交警人工復核工作量。目前,通過深耕行業(yè)核心業(yè)務,大華股份已開發(fā)20余個細分行業(yè)算法方案,100多類場景化算法功能,后續(xù)也將持續(xù)加強端邊云算力協(xié)同,加快算法靈活加載到全產(chǎn)業(yè)鏈,滿足成本與性能的行業(yè)智能差異化需求。
曠視高級副總裁陳雪松:初期先有算法后有商城,可用度是關鍵與其說是生態(tài)的問題,不如說是行業(yè)發(fā)展階段的問題。
算法商城應該是有算法之后才有商城,而不是有商城后再有算法。
算法商城應該在整個算法行業(yè)相對穩(wěn)定和固化的背景下成立。比如APP Store,是在有了很多可用的APP之后才開始出現(xiàn)和繁榮,最早大家都是直接在對應的網(wǎng)站下載,是APP的大量產(chǎn)生,催生了Store,這是初期階段的一個關鍵因素。
另外,算法的可用度是商城的關鍵。目前用戶對算法(無論是主流算法還是長尾算法)關注的焦點在可用度上,而非數(shù)量規(guī)模。只要它可用,用戶可以接受,就能快速應用。反之,快速迭代出來的算法不可用,對于用戶來說價值為0。目前算法提供商應該將精力放兩個方面:核心算法的可規(guī)模化、可用度上,長尾算法的快速生產(chǎn)能力和可用度。細分領域有很多細碎的產(chǎn)品,比如城管有36類大的管理事件,共2230個產(chǎn)品。占道經(jīng)營、車輛違停、垃圾溢出、道路基礎、井蓋位移等需求均具備不同環(huán)境,需要不同的產(chǎn)品??焖俚纳a(chǎn)能力和可用性是關鍵,且有一定瓶頸。
目前,在城管領域,垂直行業(yè)的小樣本快速訓練可取得很好的效果,但要賦能全行業(yè),還有很長的路要走。其中涉及方法、訓練平臺,數(shù)據(jù)標定工具和模型生產(chǎn),這是一個系統(tǒng)化的工程。其次,計算模型的優(yōu)化,目前算法商城的提供商在算法的優(yōu)化和匹配上難以達到落地效果。業(yè)務有過一次大測試,結果顯示,算法商城的單一算法運營效率比算法獨立運營效率的慢三倍,也就是說,算法商城需要三臺服務器才能實現(xiàn)后者效果,這意味著用戶要為硬件多付3倍的錢。
云從科技聯(lián)合創(chuàng)始人姚志強:AI通用化和開發(fā)門檻程度不足,可考慮把算法集成到操作系統(tǒng)中AI算法商城不是一個偽命題,但目前看來前景有限,因為人工智能的通用化、開發(fā)門檻與成本還沒到降到一定程度,所以最理想的做法是把AI算法工廠集成在操作系統(tǒng)中,操作系統(tǒng)提供基礎算法+行業(yè)場景+產(chǎn)品模塊。
以云從為例,云從人機協(xié)同操作系統(tǒng),簡稱CWOS(Cloudwalk Operating System),是運行在通用操作系統(tǒng)或云操作系統(tǒng)之上,提供人機協(xié)同相關算力、算法和數(shù)據(jù)管理能力和應用接口的底層軟件系統(tǒng),專為人與計算機之間進行自然交互、協(xié)作完成復雜業(yè)務而構建,同時為開發(fā)者設計研發(fā)人機協(xié)同智能應用提供全面支持,旨在降低人工智能應用門檻、提升人類與機器智能進行協(xié)作的效率和體驗。CWOS目前將研發(fā)方向劃分到七個技術板塊,其中涉及的算法工廠包含了一系列持續(xù)保持業(yè)界領先的基礎AI能力,包括:泛人臉識別、視頻理解、場景化OCR、語音識別與語音合成、自然語言處理等。
另一方面,通過一站式的模型服務,為人機協(xié)同操作系統(tǒng)提供基礎AI技術的生產(chǎn)能力,可以管理全生命周期的AI建模過程,對人工智能生產(chǎn)效率有數(shù)量級的提升,同時顯著降低了人工智能技術門檻。杉地科技 CEO 傅劍輝:共性不是痛點,安防不存在太多模式,靠的是產(chǎn)品和服務算法商城很難做到手機的APP Store,下載就能用。它能夠解決一些場景30-50%的共性需求,但不能解決行業(yè)的特性需求,需要定制化。目前人和車的算法基本能滿足絕大多數(shù)需求,但很多領域不具備共性,比如工業(yè)、水質、環(huán)保等等。
短期看,在這種體系中,商城滿足不了用戶的核心需求。正如目前很多AI攝像頭具備了一定的AI功能或算法,但行業(yè)客戶真正用的時候,不會選擇。長遠看,AI+場景不斷垂直領域化,即行業(yè)化,垂直行業(yè)的算法商城模式是可行的,前提是其長期專注某個領域,聚焦行業(yè)場景算法。即使算法商城與行業(yè)頭部企業(yè)合作,也需要經(jīng)歷較長時間的打磨。共性不是痛點,AI不能顛覆性解決問題,只能在效率提升和流程優(yōu)化上加速。比如AI+醫(yī)療就是一個門檻極高的行業(yè),截止目前全球范圍內,AI在醫(yī)學只是輔助,而不能決策。對于AI算法公司,基礎模型算法開源,但核心競爭力算法不會開放,這些付出了AI企業(yè)巨大是AI企業(yè)的核心競爭力之一。
另外,硬件平臺和操作系統(tǒng)平臺都是對開發(fā)者巨大挑戰(zhàn),即使具備了平臺能力,硬件和芯片等難以統(tǒng)一,真正用起來比較難。安防行業(yè)不存在太多商業(yè)模式,靠的就是產(chǎn)品和服務。極視角 CEO 陳振杰:「算法商城+開發(fā)者生態(tài)」的模式適合90%的碎片化市場根據(jù)Gartner發(fā)布的2020人工智能技術成熟度曲線,計算機視覺技術已趨于成熟,相關產(chǎn)業(yè)正在經(jīng)歷洗牌。人工智能視覺領域已經(jīng)由技術萌芽階段、頭部場景落地階段,發(fā)展到大規(guī)模工程化應用階段。在這一階段,市場對于人工智能技術落地提出了兩大核心訴求:算法品類的豐富度與算法的高性價比。未來會有10萬種以上的算法,每個垂直行業(yè)有幾十種算法需求將成為標配。去到行業(yè)會發(fā)現(xiàn),僅僅交通場景,就有近100種算法。
與游戲行業(yè)類似,AI賽道未來必然有兩個方向:一是專業(yè)化分工,一是平臺的出現(xiàn)。頭部客戶的頭部需求,將由頂級科學家供應;頭部客戶的場景需求和行業(yè)客戶全鏈條需求,將由初級、中級、高級開發(fā)者供應。公安、交通、金融等頭部場景的需求,將由頂級科學家供應,而90%的腰尾部市場需求則更加適合利用“算法商城+開發(fā)者生態(tài)”的模式進行供應。
極視角想要建立的AI算法平臺,將連接算法開發(fā)者和算法需求方,提高視覺算法開發(fā)者效率。極視角的商業(yè)模式,連接了算法需求方與算法開發(fā)者,通過為開發(fā)者提供人工智能底層開發(fā)平臺,與開發(fā)者共創(chuàng)海量視覺算法;B端算法需求方則可以根據(jù)所需場景,在算法商城中自由選擇算法進行部署應用。