機(jī)器視覺(jué)作為驅(qū)動(dòng)中國(guó)制造業(yè)發(fā)展的重要先進(jìn)技術(shù),在半導(dǎo)體、電子制造、汽車、醫(yī)藥和食品包裝等領(lǐng)域得到廣泛應(yīng)用;在此背景下,高工產(chǎn)業(yè)研究所(GGII)預(yù)測(cè)2024年中國(guó)機(jī)器視覺(jué)市場(chǎng)規(guī)模有望突破200億元,同比增速接近12%。
隨著人工智能(AI)技術(shù)的迅猛發(fā)展,多數(shù)制造行業(yè)的機(jī)器視覺(jué)負(fù)責(zé)人認(rèn)為AI機(jī)器視覺(jué)可以實(shí)現(xiàn)更好的性能和更多的功能。因此,為行業(yè)提供機(jī)器視覺(jué)解決方案的合作伙伴們需要進(jìn)一步思考如何為客戶優(yōu)化前沿技術(shù),讓深度學(xué)習(xí)機(jī)器視覺(jué)等技術(shù)在企業(yè)內(nèi)部變得更易于獲取、更便于使用、并部署得更好。此外,云計(jì)算的部署也是推動(dòng)機(jī)器視覺(jué)應(yīng)用的重要一環(huán),盡管仍有一些制造商對(duì)于云計(jì)算的采用躊躇不前,現(xiàn)在正是克服這些顧慮的最佳時(shí)機(jī)。
對(duì)于制造商而言,購(gòu)入機(jī)器視覺(jué)解決方案的方式多種多樣,主要方式之一是在生產(chǎn)地點(diǎn)進(jìn)行現(xiàn)場(chǎng)方案評(píng)估和選擇,后續(xù)進(jìn)入公司的審批流程;或者方案的選擇和審批等主要流程均在生產(chǎn)地點(diǎn)現(xiàn)場(chǎng)進(jìn)行。這種以“現(xiàn)場(chǎng)”為中心的方式有其優(yōu)點(diǎn),但也可能帶來(lái)一些不盡如人意的部署差異。具體而言,即便是相似的工作流程,不同生產(chǎn)地點(diǎn)也可能采用不同的機(jī)器視覺(jué)解決方案,而且這些地點(diǎn)之間可能無(wú)法實(shí)現(xiàn)專業(yè)知識(shí)和數(shù)據(jù)的共享。即便團(tuán)隊(duì)有相關(guān)需求,也很難通過(guò)傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)實(shí)現(xiàn)集成、互通和安全的數(shù)據(jù)共享。
不同的生產(chǎn)地點(diǎn)帶來(lái)的數(shù)據(jù)挑戰(zhàn)
AI,尤其是深度學(xué)習(xí),它們因數(shù)據(jù)而生,大量、多樣的優(yōu)質(zhì)數(shù)據(jù)和快速的數(shù)據(jù)生成、處理速度是訓(xùn)練和測(cè)試深度學(xué)習(xí)模型的關(guān)鍵,這樣我們才可以在實(shí)際部署時(shí)實(shí)現(xiàn)預(yù)期的效果。
不同團(tuán)隊(duì)和生產(chǎn)地點(diǎn)之間的經(jīng)驗(yàn)和可用時(shí)間各不相同,信息孤島由此顯現(xiàn),這加大了獲得優(yōu)質(zhì)數(shù)據(jù)的難度。數(shù)據(jù)需要在存儲(chǔ)、標(biāo)注后用于訓(xùn)練模型,而模型測(cè)試還需要使用其他數(shù)據(jù)集。在這種情況下,處于“孤島”狀態(tài)的企業(yè)數(shù)據(jù)是沒(méi)有意義的,不利于更好地訓(xùn)練機(jī)器視覺(jué)模型。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)應(yīng)盡可能多地接觸到各種變量,包括不同的生產(chǎn)時(shí)間和生產(chǎn)天數(shù)。除非使用能夠模擬訓(xùn)練數(shù)據(jù)的平臺(tái),數(shù)據(jù)集必須混合不同時(shí)間點(diǎn)的隨機(jī)數(shù)據(jù),盡管這需要采集一段時(shí)間內(nèi)的數(shù)據(jù),并且可能會(huì)帶來(lái)不便,但這正是訓(xùn)練一個(gè)強(qiáng)大模型的關(guān)鍵所在。如何才能充分利用各個(gè)生產(chǎn)地點(diǎn),甚至是跨國(guó)家和地區(qū)的所有可用數(shù)據(jù),這是制造商及其機(jī)器視覺(jué)負(fù)責(zé)人面臨的主要挑戰(zhàn)之一。
不同的生產(chǎn)地點(diǎn)帶來(lái)的另一難題在于如何確保深度學(xué)習(xí)模型基于多樣化的對(duì)象集進(jìn)行訓(xùn)練。在一組數(shù)量有限且?guī)缀跸嗤膶?duì)象集上訓(xùn)練而成的模型,難以應(yīng)對(duì)現(xiàn)實(shí)世界的變化和差異。例如,訓(xùn)練一個(gè)模型用以識(shí)別制造組件的缺陷,不能僅依靠20張同一組件的不同角度圖像。訓(xùn)練數(shù)據(jù)中需要有20至50個(gè)真正不同的對(duì)象才能確保模型的有效性,盡管整個(gè)生產(chǎn)場(chǎng)景可能受到地點(diǎn)變化的影響(例如不同的照明和/或不同的傳送帶等),但這些對(duì)象必須有明顯的區(qū)別,除背景之外沒(méi)有任何其他相同元素。
工業(yè)流程還受到各種環(huán)境因素的影響,例如不斷變化的環(huán)境光、材料的細(xì)微差別、振動(dòng)、噪聲、溫度、生產(chǎn)條件的改變等。如果訓(xùn)練數(shù)據(jù)未考慮到這些變化,就會(huì)降低模型的準(zhǔn)確性。每個(gè)地點(diǎn)都可能在清晰度、工作距離、環(huán)境光等因素上有所不同,模型也會(huì)學(xué)習(xí)和處理這些變量,因此訓(xùn)練數(shù)據(jù)集應(yīng)反映模型在現(xiàn)實(shí)場(chǎng)景中可能遇到的各種變化。如果工業(yè)流程涉及到多個(gè)生產(chǎn)地點(diǎn),顯然不能只采集其中一個(gè)地點(diǎn)的數(shù)據(jù),或者將所有生產(chǎn)地點(diǎn)的數(shù)據(jù)孤立保存。因此,實(shí)現(xiàn)不同環(huán)境條件、不同生產(chǎn)地點(diǎn)的數(shù)據(jù)采集和共享也必不可少。
不同的生產(chǎn)地點(diǎn)所帶來(lái)的另一個(gè)問(wèn)題是深度學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)的標(biāo)注。數(shù)據(jù)標(biāo)注不準(zhǔn)確、不清晰和不一致必然會(huì)導(dǎo)致模型表現(xiàn)不佳,可見(jiàn)確保標(biāo)注精確且無(wú)歧義至關(guān)重要,這需要制造業(yè)團(tuán)隊(duì)在標(biāo)注項(xiàng)目上開(kāi)展協(xié)作。在實(shí)際操作中,一個(gè)常見(jiàn)錯(cuò)誤是在不同的圖像上標(biāo)注不同的缺陷類型,而有些缺陷卻又完全沒(méi)有標(biāo)注,而且對(duì)于什么是缺陷的判斷也可能是主觀的,因此交叉驗(yàn)證非常關(guān)鍵。無(wú)論哪種類型的缺陷都應(yīng)清晰地標(biāo)注在所有相關(guān)圖像上。同樣,如果不采取統(tǒng)一的標(biāo)注方法也不利用云技術(shù)的話,跨地點(diǎn)或跨國(guó)家的數(shù)據(jù)標(biāo)注挑戰(zhàn)也將繼續(xù)存在。
深度學(xué)習(xí)云平臺(tái)解決方案
制造行業(yè)的機(jī)器視覺(jué)團(tuán)隊(duì)需要新的方法來(lái)實(shí)施深度學(xué)習(xí)機(jī)器視覺(jué),云技術(shù)便是其中一種新方法。基于云的機(jī)器視覺(jué)平臺(tái)可讓用戶從多個(gè)地點(diǎn)(包括生產(chǎn)地點(diǎn)、國(guó)家和地區(qū))安全地上傳、標(biāo)記和標(biāo)注數(shù)據(jù)。在云平臺(tái)上匯集來(lái)自不同地點(diǎn)和環(huán)境的大量多樣化數(shù)據(jù),更有利于深度學(xué)習(xí)的訓(xùn)練。此類平臺(tái)可以讓指定的用戶開(kāi)展實(shí)時(shí)協(xié)作,共同完成標(biāo)注、訓(xùn)練和測(cè)試項(xiàng)目并共享他們的專業(yè)知識(shí)。
與許多行業(yè)一樣,制造商也面臨著招聘和留用資深機(jī)器視覺(jué)專家的挑戰(zhàn)。試想一下,假如一家企業(yè)能夠更加輕松地利用某個(gè)生產(chǎn)地點(diǎn)、國(guó)家或地區(qū)的個(gè)人和團(tuán)隊(duì)的技能與專業(yè)知識(shí),使所有人受益,尤其是在機(jī)器視覺(jué)人才稀少的地方,這將帶來(lái)多大的益處。協(xié)作型的云平臺(tái)將實(shí)現(xiàn)這一愿景。
基于云的解決方案還實(shí)現(xiàn)了算力的可擴(kuò)展性與可訪問(wèn)性。在使用傳統(tǒng)系統(tǒng)的情況下,只有一部分特定員工的電腦配備了非常強(qiáng)大的GPU卡以執(zhí)行大型訓(xùn)練任務(wù)。而通過(guò)云技術(shù),每個(gè)用戶都可以通過(guò)各自的設(shè)備獲得同樣高的算力。雖然這會(huì)產(chǎn)生一些成本,但通過(guò)按需付費(fèi)的訂閱模式可能會(huì)比企業(yè)投資更多服務(wù)器和雇用更多難得的IT人員更有利。
借助云平臺(tái),具有特定角色、權(quán)限和職責(zé)的用戶便可以在云端訓(xùn)練和測(cè)試深度學(xué)習(xí)模型。借助更優(yōu)質(zhì)的訓(xùn)練和測(cè)試數(shù)據(jù),在某些場(chǎng)景中,這些模型可能提供遠(yuǎn)超基于規(guī)則的傳統(tǒng)機(jī)器視覺(jué)的視覺(jué)檢測(cè)分析水平和精度。這也正是汽車、電池、半導(dǎo)體、電子和包裝等行業(yè)的制造商所追求的。
通過(guò)軟件即服務(wù)模式,機(jī)器視覺(jué)團(tuán)隊(duì)可以靈活、便捷地購(gòu)買云平臺(tái)的訂閱服務(wù),同時(shí)不斷獲得技術(shù)合作伙伴更新的功能和模型。借助基于云的深度學(xué)習(xí)平臺(tái),用戶或團(tuán)隊(duì)無(wú)論位于何處,都能夠在個(gè)人電腦和設(shè)備上將模型部署到邊緣,從而為生產(chǎn)線上的靈活數(shù)字化工作流程提供助力。
想要機(jī)器視覺(jué)系統(tǒng)能夠更好地工作并實(shí)現(xiàn)更多功能,我們需要以新的方式實(shí)施、使用和部署這項(xiàng)技術(shù),而深度學(xué)習(xí)云平臺(tái)正為AI機(jī)器視覺(jué)管理者指明了前進(jìn)的方向。
作者:斑馬技術(shù)大中華區(qū)技術(shù)總監(jiān) 程寧