目前自動駕駛在場景測試中,比如車道匯入場景,往往會預先設定好周圍車輛與行人的速度以及軌跡等,比如前車以 60 公里每小時的速度沿車道線方向行駛。然而在真實場景中,場景環(huán)境的數據并不能被提前告知,自動駕駛汽車往往還無法根據周圍環(huán)境中其他車輛和人的動作或運行軌跡,進行自動調整。
斯坦福大學的研究人員最近創(chuàng)建了一個名為 LUCIDGames 新項目,這是一種可以預測和規(guī)劃自動駕駛車輛自適應軌跡的計算技術,它集成了一種基于博弈論的算法和一種估計方法,能夠預測周圍的事物(代理)在未來會做什么,并在他們周圍安全地做決策,即使在復雜的場景中也能應對自如。
LUCIDGames 通過在遞歸參數估計框架中建模來解決最優(yōu)逆控制問題。它使用卡爾曼濾波器(UKF)迭代更新其他代理的成本函數的貝葉斯估計,隨著從其他代理商觀察到的軌跡收集到更多數據,在線上改進了該估計。然后,計劃車輛通過規(guī)劃受不確定性橢圓約束的機器人軌跡,來考慮其他代理車輛的貝葉斯參數估計中的不確定性。該算法假定機器人與環(huán)境中的其他主體之間沒有明確的通信或協調。
LUCIDGames 的 MPC 實現以 40 Hz 的更新頻率演示了復雜自動駕駛場景下的實時性能。實驗結果表明,LUCIDGames 相對于現有的游戲理論和傳統 MPC 規(guī)劃方法,可以提高機器人的性能。
這個系統是由一個“估計器”(一種確定駕駛員目標的技術)和一個“決策者”(一種決定自動駕駛車輛轉向角和加速度的算法)組成。決策者根據估算器收集的信息確定最適合車輛的軌跡。首先對軌跡進行預測,然后將其與現實情況進行比較。
經過最初的訓練后,它將對其他車輛代理的軌跡的新猜測進行采樣,使其接近保留的猜測并評估其預測性能。每次重復此過程以完善其猜測,最后得出有關其他周圍因素如何移動的最終預測。
通過這種技術,自動駕駛汽車還可以知道何時可以對自己的猜測充滿信心,以及何時信心較低。在這種不確定的情況下,它將采取更加謹慎的措施,并與其他車輛保持更大的安全距離。
將來,LUCIDGames 有望增強自動駕駛汽車的安全性和可靠性。他們可以通過預測周圍環(huán)境中車輛的移動和動作來以自適應方式移動。到目前為止,該團隊僅在仿真中評估了該技術?,F在,他們還計劃在真正的自動駕駛汽車上進行測試。