人臉辨識技術(shù)是近年熱門科技。蘋果推出的的Face ID功能取代了指紋辨識,讓一般消費(fèi)者也注意人臉辨識的應(yīng)用。在人臉辨識系統(tǒng)被廣泛討論之下:一張獨(dú)立且唯一的臉,可以確認(rèn)使用者身份,取代傳統(tǒng)的密碼輸入。此技術(shù)快速的運(yùn)用在智能家居,公司門禁,甚至警政系統(tǒng)。
人工智能(AI)技術(shù)加持成就人臉辨識系統(tǒng)
人臉辨識的技術(shù)核心,是在人臉上取出具有“辨別度”的特征值。也就是說,同個人在在不一樣打扮,表情與視角的情境之下,還具有非常類似的特征值。相反地,對于不同人的人臉,因?yàn)榫哂小氨鎰e度”的特征值是不同的,必需很容易區(qū)別出來。人臉辨識的一般步驟為:人臉偵測、人臉校正、人臉特征值的擷取。
在使用人工智能(AI)之前,使用特定算法:每個工程師必須開不同的算法,使用不同的濾波器,去準(zhǔn)確達(dá)到人臉偵測、人臉校正、人臉特征值的擷取以達(dá)到人臉辨識效果。這種方法非常的曠日廢時。而且會因不同的硬體架構(gòu),不同的硬體加速,必須修改不同的演算邏輯,或是運(yùn)動不同的濾波器。所以,此種方式的人臉辨識在跨平臺上的應(yīng)用就會有所限制。而現(xiàn)在廣泛使用人工智能(AI)技術(shù)來實(shí)現(xiàn)人臉辨識。
所謂的人工智能(AI)是電腦科學(xué)的一個領(lǐng)域,達(dá)到學(xué)習(xí)、解決問題和模式辨識。在這過程中必須讓電腦可以做到"機(jī)器學(xué)習(xí)(ML)"甚至"深度學(xué)習(xí)(DL)"。機(jī)器學(xué)習(xí) (ML) 和深度學(xué)習(xí) (DL) 這都是需要強(qiáng)大運(yùn)算能力的t超級電腦與龐大的資料庫。因此,以前的人工智能(AI)系統(tǒng)架構(gòu),必須與云端平臺(例如AWS, Google..)連線才能實(shí)現(xiàn)。而為了使終端設(shè)備(Edge)在不聯(lián)網(wǎng)的情境下也能實(shí)現(xiàn)人工智能(AI), 許多開源公司開始開發(fā)?有的學(xué)習(xí)模型(Model Firmwork)并提供產(chǎn)業(yè)界使?。但仍亟需解決的問題:如何整合各家開源公司所提供的學(xué)習(xí)模型(Model Firmwork)。
以下為基于NXP i.mx8m mini的人工智能架構(gòu)下之人臉辨識解決方案:
在此方案中,先介紹eIQ( edge Intelligence Quotient )這個軟體的平臺。其主要功能為在edge端直接inference(推理) 學(xué)習(xí)模型(Model Firmwork),并得出計算出最終結(jié)果。在不同的開源公司中,其學(xué)習(xí)模型(Model Firmwork)也有所不同。
例如:TensorFlow/TensorFlow Lite: 由谷歌(Google)提供的 Model framework, Caffe/Caffe2: 由臉書(Facebook)提供的 Model framework。
eIQ軟體的平臺,根據(jù)各家開源學(xué)習(xí)模組所擅長的領(lǐng)域,可以直接在NXP產(chǎn)品(MPU與MCU)上執(zhí)行并且完全不受打擾可獨(dú)立的進(jìn)行運(yùn)作,替客戶節(jié)省成本以及開發(fā)時程。 如下:
在此架構(gòu)下:
品佳集團(tuán)將教導(dǎo)客戶在Linux Kernel 4.14.98的基礎(chǔ)上,使?Yocto Project開發(fā)環(huán)境,如何編譯Opencv, tensorflow-lite等應(yīng)?程式及學(xué)習(xí)庫 。接著整合TensorFlow的機(jī)器學(xué)習(xí)過程,訓(xùn)練"MobilFaceNets"模型,將其轉(zhuǎn)換成在TensorFlow Lite人臉辨識學(xué)習(xí)模型。在Yocto Project開發(fā)環(huán)境,整合eIQ人工智能軟體系統(tǒng)。并將上訴得到的人臉辨識學(xué)習(xí)模型 inference(推理) 致i.mx8m mini的系統(tǒng)架構(gòu)之中。這樣一來,客戶即可以在i.mx8m mini的系統(tǒng)架構(gòu)實(shí)現(xiàn)人臉辨識的功能。
以下為部分工具架設(shè)與程式碼編譯:
硬體實(shí)現(xiàn)如下:
應(yīng)用MIPI-CSI的相機(jī)模組,取得即時的人臉影像。并加人臉影像傳輸?shù)?a class="article-link" target="_blank" href="/manufacturer/1000215/">恩智浦的處理芯片i.mx8m mini。i.mx8m mini運(yùn)用芯片中的處理器四核A53(1.6GHz)核芯 與繪圖器GC NanoUltra 3D的加成運(yùn)算能力,運(yùn)行eIQ人工智能軟體系統(tǒng),達(dá)到人臉辨識的功能??梢杂蒑IPI-DSI輸出得到判讀得結(jié)果。
? 場景應(yīng)用圖
? 展示版照片
? 方案方塊圖
? 核心技術(shù)優(yōu)勢
i.mx8m mini 系統(tǒng):
◆ 低功耗且可擴(kuò)展的性能:處理核心A53可以由單核擴(kuò)展至四核。并可微處理器M4單獨(dú)執(zhí)行,達(dá)到更低的功耗。
◆ 強(qiáng)大多媒體功能 音頻/聲音/視頻:內(nèi)建影音1080P的編碼語解碼。聲音解碼可以支持DOLBY ATMOS與DTSX。
◆ 廣泛的系統(tǒng)連通性:支持各種傳輸界面(MIPICSI, MIPI-DSI, USB, SDIO, PCIE),系統(tǒng)連通性更廣泛。
eIQ 軟體平臺: 目的是使客戶能夠開發(fā)機(jī)器學(xué)習(xí)應(yīng)用程序。
◆ 專注于部署開源推論引擎
◆ 集成到我們的標(biāo)準(zhǔn)軟件版本中(Yocto Linux BSP,MCUXpresso SDK)
◆ 支持軟體材料更新,易于使用與開發(fā)
? 方案規(guī)格
◆ 處理器:A53(1.6GHz) x4,M4(400MHz) x1
◆ 儲存器:x16/x32 位元 LPDDR4/DDR4/DDR3L
◆ 繪圖器:GC NanoUltra 3D (1 shader) + GC320 2D
◆ 顯示界面:MIPI-DSI
◆ 影像輸入界面:1x MIPI-CSI (4-lanes)
◆ 解碼器:1080p60 HEVC H.265, VP9, H.264, VP8
◆ 編碼器:1080p60 H.264, VP8
◆ 聲音界面:20x I2S TDM (32b @384KHz)
◆ 一搬界面:USB2.0 x2,SDIO x3,Ethernet x1,PCIE2.0 x1