加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入

logo

logo

有事離開?不用擔(dān)心

掃一掃繼續(xù)用手機(jī)看

微信掃碼
不再提醒
  • 點(diǎn)贊
  • 評論
  • 分享
《對話》系列
  • 視訊介紹
    • 厘清 3D 識別的概念
    • 那些問題
    • 3D 識別的可能性
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

深度對話,3D識別的想象空間

2020/07/13
361
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

在我們都吐槽蘋果的創(chuàng)新力在衰竭的時(shí)候,2017 年,iPhone X 帶來了 FaceID 人臉識別功能,一度讓上游供應(yīng)商和其它手機(jī)品牌忙不迭的一波技術(shù)和產(chǎn)品更迭,如果不了解這里面的硬件技術(shù),我們會直觀的將這里的 FaceID 納入生物識別的范疇,因?yàn)樗彩腔谌四樳@一生物特征來實(shí)現(xiàn)。在近日的慕尼黑上海電子展期間,通過與非網(wǎng)記者與艾邁斯半導(dǎo)體 OPC 部門業(yè)務(wù)發(fā)展經(jīng)理徐冰博士和曠視科技產(chǎn)品市場總經(jīng)理沈瑄的交流,刷新了我們對 iPhone 人臉識別背后的 3D 結(jié)構(gòu)光技術(shù)的認(rèn)知,也讓我們看到這一技術(shù)未來的更多可能性。

左:艾邁斯半導(dǎo)體 OPC 部門業(yè)務(wù)發(fā)展經(jīng)理徐冰博士 右:曠視科技產(chǎn)品市場總經(jīng)理沈瑄

厘清 3D 識別的概念

徐冰博士首先澄清,人臉識別的實(shí)現(xiàn)方式有多種,如果具體討論 iPhone 人臉識別功能背后,采用的是 3D 結(jié)構(gòu)光的技術(shù),這種技術(shù)本身并不能等同于生物識別。

從手機(jī)的內(nèi)部結(jié)構(gòu)來看,除了基本的前置攝像頭外,還集成了六七個(gè)傳感器。其中點(diǎn)陣投影器會投射出高達(dá) 30000 個(gè)光點(diǎn),紅外鏡頭能就能獲取人臉各個(gè)部分位置的形變數(shù)據(jù),即臉的 “結(jié)構(gòu)”,加上前置鏡頭記錄的人臉圖像,兩者借助算法結(jié)合,就能得出一張精準(zhǔn)的 3D 人臉數(shù)據(jù)圖。比起單純的基于 2D 平面圖進(jìn)行分析,這種三維深度數(shù)據(jù)顯然更加真實(shí)有效,也更有價(jià)值。

搞清楚 3D 結(jié)構(gòu)光的背后原理就會發(fā)現(xiàn),人臉識別解鎖,只是這一技術(shù)的一個(gè)應(yīng)用場景,背后包含了對更高維度信息的掌握和運(yùn)用—讓手機(jī)能夠感知到現(xiàn)實(shí)世界的 3D 信息,才是結(jié)構(gòu)光技術(shù)真正想要達(dá)成的目的。

在這次疫情期間,對那些用慣了人臉識別解鎖的用戶而言,首先帶來的不便就是手機(jī)打不開了,要回到傳統(tǒng)的密碼解鎖模式。而很快我們發(fā)現(xiàn)多家科技公司實(shí)現(xiàn)了戴著口罩也可以進(jìn)行人臉識別的技術(shù)。對此,徐冰博士解釋,“隨著技術(shù)進(jìn)步,這是完全可能而且是可行的。3D 結(jié)構(gòu)光這一技術(shù)是通過光打在人臉或物體上面來探測不同部分的深度,也叫人臉的特征點(diǎn),不戴口罩的情況下,探測的特征點(diǎn)集中在耳朵、鼻子、嘴巴、眼睛這些部分,可以還原出整個(gè)人臉的輪廓特性。現(xiàn)在戴了口罩怎么辦?當(dāng)然有解決辦法,就是把特征點(diǎn)選擇在口罩以上部分,人的眼、眉毛、額頭,都可以作為特征點(diǎn)。這時(shí)可能產(chǎn)生一個(gè)問題,從技術(shù)角度,這些特征點(diǎn)比過去少很多,怎么辦?我們也有技術(shù)解決的路線。比如增加探測的特征點(diǎn),因?yàn)檫@些特征點(diǎn)是通過光照上去的,將點(diǎn)密度增加,以上提到的眼、眉毛、額頭的特征點(diǎn)就會體現(xiàn)的更加完整,更加精確。這就是隨著技術(shù)進(jìn)步說我們戴著口罩在某些場合某些設(shè)備是完完全全可以識別人臉的?!?/p>

沈瑄補(bǔ)充,“實(shí)現(xiàn)戴口罩解鎖,關(guān)鍵點(diǎn)是在瞳孔的距離,瞳孔與鼻尖的距離,這些數(shù)據(jù)其實(shí)都在我們的設(shè)備里面,現(xiàn)在只是來比對口罩以上的部分。引出的另一個(gè)討論是不戴口罩的時(shí)候,半側(cè)臉是否也可以接受,因?yàn)楝F(xiàn)在我們必須要正對著攝像頭才能接受。從誤識率的角度,是完全沒有任何問題的,算法已經(jīng)可以完美的解決戴口罩的識別問題?!?/p>

那些問題

協(xié)同設(shè)計(jì)問題。3D 識別以及手機(jī)里各種傳感部分部分的增多,引出的一個(gè)問題就是處理的數(shù)據(jù)量不斷激增,帶來的是端側(cè)傳感、處理等部分的協(xié)同設(shè)計(jì)問題。對此,沈瑄表示,“解決這個(gè)問題,要盡可能在端側(cè),包括手機(jī)的主芯片里有一個(gè)加密區(qū),以及另一個(gè)趨勢是往 sensor 端,明年會看到很多攝像頭的 sensor 開始有數(shù)據(jù)處理能力,包括人工智能的計(jì)算單元在 sensor 端,可以將一些原始數(shù)據(jù)進(jìn)行預(yù)處理。這樣做的好處是,一方面讓主芯片、邊緣側(cè)以及云端的數(shù)據(jù)量的計(jì)算減少很多;另一方面,我們會把用戶的個(gè)人隱私的數(shù)據(jù)在這部分進(jìn)行剝離,做不可逆的脫敏處理,也是為了保護(hù)個(gè)人隱私。這里數(shù)據(jù)量我覺得不是問題,問題還是把 sensor 端、主芯片、端側(cè)、云側(cè)這些分布式的算力提高上來?!?/p>

“從技術(shù)角度,在光源方面, 3D 人臉識別發(fā)出來的是主動光源,是點(diǎn)狀的光源,用于 3D 人臉識別,有非常多的發(fā)光點(diǎn),這個(gè)時(shí)候信息的處理量就非常大。”徐冰博士從上游芯片供應(yīng)商的角度提到,“我們在重新設(shè)計(jì)光源,可以實(shí)現(xiàn)分片、分區(qū)或分條點(diǎn)亮,這樣的處理帶來兩個(gè)好處,第一是數(shù)據(jù)處理量可以急劇減小,第二是明顯降低功耗?!?/p>

定制和通用的未來。僅就手機(jī)廠商的 3D 人臉識別而言,也存在普遍的定制化現(xiàn)象,而這跟供應(yīng)商想要達(dá)到的規(guī)模效應(yīng)存在一定矛盾,未來是定制化還是通用產(chǎn)品的?“定制化帶來的確實(shí)成本非常高,這個(gè)趨勢現(xiàn)在沒有根本的改變。”徐冰博士稱,“從現(xiàn)在到將來會不會有一款標(biāo)品可以用到所有的應(yīng)用場景,或至少適用于相當(dāng)一部分應(yīng)用場景,在我看起來是完全有可能的。”事實(shí)上艾邁斯半導(dǎo)體正在為此努力,跟上下游的產(chǎn)業(yè)鏈合作,做一款標(biāo)準(zhǔn)的光源、探測器和 3D 的解決方案,但徐冰博士也坦言,“我們不能指望一天、兩天就把這一工作完成,而且應(yīng)用到所有的手機(jī)產(chǎn)品也是不現(xiàn)實(shí)的,但是我們一定會做這方面的努力。”

沈瑄從商業(yè)和市場角度解釋,“廠商定制化的需求背后是希望有一些產(chǎn)品的獨(dú)特性和差異化,但不管是消費(fèi)品還是工業(yè)品,一定是以降低成本為大方向,而通用化、標(biāo)準(zhǔn)化才能規(guī)?;?,才可以降低成本,這個(gè)趨勢是對的;除了徐博士提到的硬件的標(biāo)準(zhǔn)化,另一個(gè)問題是現(xiàn)在人工智能的軟件算法方面,也有很多的定制化,我們現(xiàn)在正在努力把各種 3D 方案做一些標(biāo)準(zhǔn)化,逐漸收斂,讓軟件可以更統(tǒng)一?!?/p>

這一過程中的阻力則在于整個(gè)供應(yīng)鏈、產(chǎn)業(yè)鏈的共識和協(xié)作,以及終端品牌的接受度。因此徐冰博士強(qiáng)調(diào),“但從長遠(yuǎn)來說,如果要實(shí)現(xiàn) 3D 人臉識別的普及,一定會朝標(biāo)準(zhǔn)化方向走?!?/p>

3D 識別的可能性

因?yàn)樯厦嫣岬饺四樧R別背后的 3D 結(jié)構(gòu)光技術(shù),如果了解到這種通過 3D 空間結(jié)構(gòu)探測來實(shí)現(xiàn)識別的技術(shù),就可以理解除了手機(jī),它的應(yīng)用場景可以有無限的想象空間。

沈瑄表示,“手機(jī)當(dāng)然是最大的市場,但其實(shí)只要有攝像頭的地方,都可以做人臉識別。包括安防、無人機(jī)、家電,包括現(xiàn)在量不大,但未來有很大市場空間的汽車電子,以及智能家居,除了電視外,像音箱、掃地機(jī)、門鎖里越來越多的涉及到人臉識別。”

“車載是想象力無限的 3D 應(yīng)用場景。”徐冰博士把 3D 識別的可能從人臉放大到更多的空間:
第一,無人駕駛,開始一定是有人的,需要對駕駛員做人體檢測,出現(xiàn)異常情況時(shí),如過度疲勞或酒駕,可以根據(jù)人臉識別做出及時(shí)的處理,還可以對車內(nèi)乘客進(jìn)行檢測,這是在車內(nèi)的場景;

第二,車周圍環(huán)境的檢測,如果考慮小范圍內(nèi),可以通過 3D 檢測來實(shí)現(xiàn)自動倒車入庫,也是自動駕駛的一部分。但如果把探測的距離拉長到 100 米、150 米,將助推真正的自動駕駛。這將給人們的生活和社會經(jīng)濟(jì)結(jié)構(gòu)帶來巨大的改變,包括“首先,家里是不是還需要擁有車輛?如果擁有車輛需要兩輛及以上嗎?我想一輛車絕對夠了。可以實(shí)現(xiàn)社會資源的統(tǒng)一安排,可以想像通過 3D 檢測,無人車在路上像一個(gè)車隊(duì)前后連在一起,車距非常近,車跟車之間可以相互交流,車的密度可以非常高,車速會非???,這樣整個(gè)社會的車輛保有量會非常低,將完全顛覆我們現(xiàn)在的社會形態(tài)?!?/p>

這里談到的是近場和遠(yuǎn)場檢測的概念,有了這一概念的拓展,3D 檢測在未來的想象空間確認(rèn)無限。

艾邁斯歐司朗

艾邁斯歐司朗

ams OSRAM Group 母公司是 ams AG 的上市公司 OSRAM Licht AG,是全球領(lǐng)先的光學(xué)解決方案供應(yīng)商。公司在全球約有 27,000 名員工,專注于傳感、照明和可視化方面的創(chuàng)新,以使旅程更安全、醫(yī)療診斷更準(zhǔn)確,并幫助人位在日常交流中獲得更豐富的體驗(yàn)。公司擁有超過 110 年的綜合歷史,憑借其超凡的想象力、深厚的工程專業(yè)知識以及在傳感器和光技術(shù)方面提供全球工業(yè)產(chǎn)品的能力,確立了其牢不可破的地位。

ams OSRAM Group 母公司是 ams AG 的上市公司 OSRAM Licht AG,是全球領(lǐng)先的光學(xué)解決方案供應(yīng)商。公司在全球約有 27,000 名員工,專注于傳感、照明和可視化方面的創(chuàng)新,以使旅程更安全、醫(yī)療診斷更準(zhǔn)確,并幫助人位在日常交流中獲得更豐富的體驗(yàn)。公司擁有超過 110 年的綜合歷史,憑借其超凡的想象力、深厚的工程專業(yè)知識以及在傳感器和光技術(shù)方面提供全球工業(yè)產(chǎn)品的能力,確立了其牢不可破的地位。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)總編。所知有限,不斷發(fā)現(xiàn)。抱持對技術(shù)、產(chǎn)業(yè)的熱情和好奇,以我所知、所見,真實(shí)還原電子產(chǎn)業(yè)現(xiàn)狀和前沿趨勢。

微信公眾號