加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

Socionext 和日本東北大學顯著加快基于深度學習的 SLAM 處理

2021/11/23
187
閱讀需 4 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

Socionext Inc. 與Takayuki Okatani 教授領導的日本東北大學研究小組合作,開發(fā)了一種新方法,可以減少 SLAM(同步定位和映射)所需的處理時間, 這對于執(zhí)行自主控制的設備至關重要,時間僅為傳統(tǒng)技術所需時間的 1/60。這種新方法使得在一些CPU 性能有限以及功耗有限的邊緣設備的 SoC進行高級 SLAM 處理成為可能,例如自動駕駛汽車AGV(自動導引車)、機器人、無人機和其他執(zhí)行自主的設備控制,以及諸如 AR(增強現(xiàn)實)眼鏡之類的設備。

該研究工作已被 ICCV(計算機視覺領域最負盛名的會議之一)接受為演講報告。 這種新方法在 10 月 11 日至 17 日在線舉行的ICCV 2021會議上進行了介紹。

根據(jù)用于獲取物體周圍 3D 信息的傳感方法,SLAM 可以分為兩種主要類型。 一種是 LiDAR(光探測和測距),它使用激光測量距離。 另一種是Visual SLAM,它使用相機圖像。 視覺 SLAM 正在顯著發(fā)展,因為所使用的相機相對便宜,并且除了同時定位之外,還可以將該方法與使用圖像識別的各種控制過程相結合,從而可以期待許多應用。

近年來,隨著深度學習的引入,圖像識別技術取得了顯著的進步,深度學習的應用成為了視覺SLAM演進的重要因素。 然而,基于特征點和相機方向優(yōu)化地標的未知 3D 信息的束調整(BA)所需的大量計算是傳統(tǒng)方法的瓶頸。 對于 CPU 處理能力有限的邊緣型 SoC 設備,這會使實際處理變得困難。 (圖1)

(圖1)

為了應對這一挑戰(zhàn),研究團隊提出了一種使用“圖網(wǎng)絡(GN)"[1] (一種圖神經網(wǎng)絡)通過推理進行近似計算的方法。 新方法包括從 GN block輸入的關鍵幀和地標信息中推斷更新信息(圖 2),并通過多堆棧 GN 結構收斂到最終值(圖 3)。 與使用傳統(tǒng) Levenberg-Marquardt 方法的標準束平差相比,這些使得推理處理所需的計算量更少。

(圖2)

?

(圖3)

研究團隊使用這種新的推理方法實現(xiàn)了 Visual SLAM 捆綁調整,并將其與當今廣泛使用的方法“g2o”[2]進行了比較。 PC 仿真結果證實,與 g2o 相比,新方法可以將處理時間縮短至 1/60。(圖 4)

?

(圖4)

Socionext 將從這項研究工作中積累經驗,并將 Visual SLAM 技術確立為公司定制 SoC 解決方案的產品之一。 該公司將為工業(yè)設備和移動等需要圖像識別領域的客戶系統(tǒng)提出創(chuàng)新的性能改進方案。 此外,公司將繼續(xù)研發(fā)通過新的推理方法提高處理效率,并將其使用擴展到圖像識別以外的新客戶應用。

相關推薦

電子產業(yè)圖譜