隨著 5G 和 AI 的快速迭代,機器視覺也進入了高速發(fā)展的新階段。
機器視覺是指利用相機、攝像機等傳感器,配合機器視覺算法賦予智能設備人眼的功能,從而進行物體的識別、檢測、測量等功能。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。
機器視覺是在 20 世紀 50 年代從統(tǒng)計模式識別開始的,當時的工作主要集中在二維圖像分析和識別。如今,隨著 5G、AI 等技術的日益發(fā)展,為機器視覺的升級帶來可能,將加速信息顯示從二維向三維過渡。
三維機器視覺是在二維機器視覺的基礎上增加了物理空間的深度信息,更全面、更真實地記錄了物理世界。因此,業(yè)內一致認為三維機器視覺技術是機器視覺領域新的技術突破,也是機器視覺領域新的商業(yè)風口。
目前,機器視覺是正在快速發(fā)展的一個領域,正處于不斷突破、走向成熟的階段。它的發(fā)展不僅將大大推動智能系統(tǒng)的發(fā)展,提高生產效率和自動化程度,也將拓寬計算機與各種智能機器的研究范圍和應用領域。
3D 視覺如何取代 2D?
縱觀行業(yè)發(fā)展,2D 視覺雖為當前主流,但隨著測量精度要求越來越高,被測物體條件越來越復雜,2D 系統(tǒng)的缺陷也愈發(fā)突出。目前市場上可見的 2D 識別,實質上屬于軟件層面驗證技術,雖然能夠做檢測,但是存在可靠性不高、局限性、安全性差等諸多缺陷。
相比之下,3D 視覺技術在精度、靈活性和速度方面都是 2D 無可比擬的。的盧深視創(chuàng)始人兼 CEO 戶磊向筆者說道,3D 機器視覺能夠精準識別視野內空間每個點位的三維坐標信息,通過算法復原智能獲取三維立體成像。不但可以提高測量和識別的效率,從三個維度獲取信息,更增加了信息的準確性和可靠性。
從技術角度來看,普通的 2D 成像是用平面?zhèn)鞲衅鹘邮毡慌臄z物體反射或者發(fā)出的可見光,從而形成二維圖像。由于現實世界是三維世界,2D 成像存在物體特征信息損失的情況,這意味著 2D 成像并不支持與物體三維信息的測量。例如 3D 人臉識別、三維建模、人機交互、AR、智能安防等功能。
為了彌補 2D 人臉識別的不足,3D 人臉識別應運而生。3D 傳感技術實現了物體實時三維信息的采集,為后期的圖像分析提供了關鍵特征,智能設備能夠根據 3D 傳感復原現實三維世界,并實現后續(xù)的智能交互。
根據 Yole 的數據,2017-2023 年全球 3D 成像和傳感器市場規(guī)模的復合年均增長率為 44%,預計 2023 年,3D 傳感市場規(guī)模將達到 184 億美元。
不難判斷,在此趨勢下,3D 機器視覺將面臨較快的增長趨勢,3D 視覺未來將逐步取代 2D 識別技術,在許多“痛點型應用場景”中大顯身手,發(fā)展成為主流視覺系統(tǒng)。
安全問題凸顯
眾所周知,隨著人臉識別技術的深入,千萬級人臉大庫的重要性日益顯現。采集建庫既是三維人臉識別應用的基礎,也是三維人臉識別技術落地的關鍵。
近日《2019 年中國刷臉支付技術應用社會價值專題研究報告》顯示,2019 年成為刷臉支付的“新元年”,刷臉支付用戶將達到 1.18 億人,到 2022 年有望突破 7 億人,或取代掃碼成為主流支付方式?,F在人臉識別方式越來越為大眾所使用,但關于個人信息安全等問題也隨之而來。
對此,戶磊表示,“人臉識別領域沒有絕對的安全,安全是與成本息息相關的。從商業(yè)層面考慮,安全更多是取決于安全成本與作偽成本之間的考量?!?/p>
安全性上,的盧深視也有布局。一方面其算法已通過 BCTC 增強級認證,滿足國家認證金融支付增強級安全標準,可實現高強度防作偽。
另一方面,的盧深視對于小群體應用場景產品做了針對性的設計,以其 3D-Face ID 一體化解決方案智能門鎖為例,內嵌一顆 AIoT 專用芯片,人臉信息存儲以及人臉比對均在門鎖端完成。借助在金融支付行業(yè)內的豐富終端安全經驗,打造了一個安全、受信的安全比對環(huán)境,外界是無法通過任何物理手段或者其他暴力拆解手段來獲取模組內的私密個人生物特征信息。
基于成熟落地經驗,的盧深視把三維機器視覺技術從高端安防領域切入金融支付、智慧社區(qū)、消費電子、商超零售、虛擬現實等垂直細分領域,要用成熟的三維全棧技術賦能百業(yè)千家。
目前市場上主流的 3D 識別技術
近日,在 2020 全球人工智能產品應用博覽會(AIExpo2020)的現場,的盧深視向與非網全面展示了其三維視覺全棧技術解決方案。
戶磊介紹道,的盧深視深耕三維機器視覺領域近 5 年,是國內唯一打通“真三維”全棧技術、并實現國家級項目落地應用的公司。公司基于“云+端+芯”一體化戰(zhàn)略,布局產品矩陣,下鉆垂直行業(yè)應用領域,實現垂直整合及系統(tǒng)優(yōu)化。公司可提供大規(guī)模普及的、交互距離內高精度的三維視覺感知產品及方案,產品形態(tài)涵蓋 Edge AI 芯片、智能模組、通用產品和行業(yè)解決方案。
談到三維識別技術方案,目前市場上主流的有結構光、ToF、雙目視覺等三種 3D 視覺技術。
- 3D 結構光通過紅外光投射器,將具有一定結構特征的光線投射到被拍攝物體上,再由專門的紅外攝像頭進行采集。主要利用三角形相似的原理進行計算,從而得出圖像上每個點的深度信息,最終得到三維數據。
- 雙目立體視覺則是基于視差原理并由多幅圖像獲取物體三維幾何信息的方法。由雙攝像機從不同角度同時獲得被測物的兩幅數字圖像,并基于視差原理恢復出物體的三維幾何信息,從而得出圖像上每個點的深度信息、最終得到三維數據。
可以看到,三種 3D 視覺測量原理都有各自的優(yōu)缺點。
與非網制圖
?
就目前看來,3D 結構光是各大廠商普遍采用的技術。同樣以的盧深視為例,的盧深視推出了兩款基于 3D 結構光技術,針對安全需求高小型人臉庫場景推出的自研國產 3D CV 相機:高精度 RGBD 相機(標準型)和 3D-Face ID 智能模組。
戶磊進一步指出,公司自研的 3D CV 相機均已實現量產,在 3 米范圍誤差小于 1mm,指標超越國際 3D 相機巨頭,且量產良率超 99%,精度全球領先,具備獨家專利技術,高度自主可控。
的盧深視 3D-Face ID 智能模組
?
其中,高精度 RGBD 相機可用于刷臉支付終端、銀行 ATM、無人貨柜、地鐵刷臉閘機、AR/VR、物品體積測量等場景;3D-Face ID 智能模組可用于家庭智能門鎖、智能保險柜、酒店公寓智能鎖、智能門禁等場景。
此外,對于可靠性和精度要求較高的制造業(yè)等領域來看,戶磊表示,將幾種測量原理結合一起的 3D 視覺技術也是未來發(fā)展的一個方向。
趨勢之外,痛點仍在
- 產業(yè)鏈匹配不完善
相對 2D 成像而言,3D 傳感技術的優(yōu)勢還體現在可產生大量的三維數據,這些數據未來可應用于大數據等行業(yè),具有巨大的行業(yè)應用價值。
但是數據本身的豐富度反過來也會影響數據質量和精度,這也對傳感器和相機提出了較高要求。現階段 3D 視覺行業(yè)的核心難點集中在產業(yè)鏈匹配不完善。
據了解,現階段 3D 視覺行業(yè)的核心難點集中在產業(yè)鏈匹配不完善。和很多新興行業(yè)一樣,在 3D 視覺行業(yè)蓬勃發(fā)展的同時,產業(yè)鏈條體系混亂、產業(yè)關鍵鏈路無法閉環(huán)等問題逐步凸顯,這些問題成為制約行業(yè)發(fā)展的瓶頸。
三維視覺產業(yè)鏈涵蓋核心器件、模組裝配、像機成像系統(tǒng)設計、算法、感知技術方案與模塊、終端產品與行業(yè)方案多個環(huán)節(jié),由于三維機器視覺仍屬于較前沿的技術,供應鏈匹配上存在技術難度高、標準不統(tǒng)一等諸多問題,整合產業(yè)鏈是 3D 視覺產業(yè)化應用的必要路徑。
在產業(yè)鏈環(huán)節(jié),的盧深視定位為三維視覺感知系統(tǒng)技術方案提供商,上游承接相機模組裝配,通過團隊研發(fā)的相機的系統(tǒng)設計和內部算法形成 3D 感知技術模組、3D 通用產品、Edge AI 芯片以及行業(yè)解決方案,對于安防行業(yè)主要提供通用的終端產品,對于其它行業(yè)提供相關智能模組,并由下游的集成商合作伙伴將最終產品供給消費者。
從行業(yè)整體來看,在現階段,如何借著轟轟烈烈的 AI 和 5G 浪潮,為行業(yè)搭建起一個凝聚上下游資源、協(xié)同產業(yè)鏈創(chuàng)新發(fā)展的平臺成為迫在眉睫的事情。
- 硬件價格和系統(tǒng)成本
傳統(tǒng)的機器視覺穩(wěn)定發(fā)展多年,目前處于硬件和軟件的發(fā)展基本匹配的階段。但是隨著檢測需求以及對安全性及可靠性等要求的提高,未來將用到深度學習來完成功能賦能,現在基礎的硬件需要做到領先于軟件一代。
因此,成本高又成為了當前產業(yè)痛點之一。有行業(yè)資深人士表示,從硬件價格和系統(tǒng)成本來看,要突破傳統(tǒng)上所謂二年投入回報周期這一困局。兩年回收成本已經無法撬動行業(yè)需求,一年左右的時間周期才會帶動中小企業(yè)愿意買單。
技術價值最大化的關鍵在于逐漸形成大規(guī)模的普及應用,通過大面積提升行業(yè)的生產力水平和經濟效益獲得,通過給客戶帶來價值而盈利,這是一個較為艱難的過程,但也是一個需要慢慢推進的必要過程。
從機器視覺發(fā)展的客觀現狀來講,其實并不缺市場需求,但是缺少能夠真正落地的、真正發(fā)揮出經濟效益的好產品。那么,應該如何打破這個“緊箍咒”?推動更多的落地應用?
解決核心零部件的性價比,做到系統(tǒng)成熟穩(wěn)定可靠,是迫在眉睫的事情。只要將性價比做到極致,就能滿足目前工業(yè)機器視覺中絕大多數的應用需求。另一方面,也體現在產品的適用性、標準化程度上。需要對視覺應用真正的剛性需求逐漸顯現出來,進而實現降本增效的效果。
寫在最后
在國內如火如荼的科技發(fā)展浪潮和國內經濟發(fā)展的時代大背景下,3D 視覺產業(yè)鏈的優(yōu)化和鏈路閉環(huán)正在加劇進行,產業(yè)形態(tài)的完備也將釋放出巨大的集群紅利,為產業(yè)鏈各環(huán)節(jié)創(chuàng)造新的發(fā)展局面。
在用戶日常觸達較高的刷臉支付方面,中國企業(yè)表現不俗,產業(yè)圍繞 3D 視覺技術研究及應用開展合作,共同推進金融領域科技創(chuàng)新,成為中國金融支付領域實現彎道超車的關鍵。
從智能支付到智能門鎖,包括的盧深視在內的行業(yè)企業(yè)在探索 3D 機器視覺應用的更多新方向。的盧深視配合式三維人臉采集終端填補了國內三維人臉數據采集設備的技術空白,為千萬級大庫時代人臉識別技術及場景奠定了基礎,標志著的盧深視三維全棧閉環(huán)已然成熟,打通了從云端建庫、算法比對、模組方案到終端產品的全鏈條,真正實現了技術應用的“最后一公里”。
如今,中國已突破 3D 人臉識別技術的壁壘,相信在不久的將來,中國 3D 傳感技術定會再上一個臺階,為更多用戶及其行業(yè)帶來更安全、方便、快捷的智慧生活體驗。