要點:
MonoXiver利用單目攝像頭的二維圖片生成可靠的三維環(huán)境地圖。
這種方法先用粗略的框定位對象,再細分框捕捉更多細節(jié),最終校準預測和實際觀測。
該技術可應用于自動駕駛汽車等導航場景,也可擴展到其他領域。
站長之家(ChinaZ.com)10月9日 消息:MonoXiver是北卡羅萊納州立大學劉賢鵬團隊開發(fā)的一種利用AI從二維圖片中提取三維信息的方法。它只需要一個普通的單目攝像頭,就可以構建相機周圍可靠的三維地圖。這對自主駕駛汽車的環(huán)境感知與導航具有重要意義。
由于照片是三維世界的二維表示,它們?nèi)鄙倌繕说膶嶋H尺寸、與相機的距離等深度信息。這對二維攝像頭進行導航是一個嚴峻的問題。目前,一種常用的手段是結合攝像頭與激光雷達,后者通過發(fā)射激光束來測量距離。但是這種系統(tǒng)成本高昂,硬件也難以與車身集成。
MonoXiver使用分步方法。首先,利用單目攝像頭對圖像中的三維幾何進行粗略估計。然后,用三維包圍框標注像車輛等重要目標。這些框幫助表示場景中對象的各種尺度、長寬比和方向。起初,框的位置基于攝像頭的估計。利用這些框作為起點,MonoXiver重新分析框內(nèi)區(qū)域,構建更小的框來捕捉更多細節(jié)。
MonoXiver還可以區(qū)分框內(nèi)元素的重疊情況。最后,它校準預測的細節(jié)框是否與整體框內(nèi)的形狀、顏色、紋理一致。在大規(guī)模圖片數(shù)據(jù)集上的測試表明,該方法可以準確構建三維地圖。
研究團隊期望這種方法可以改變自動駕駛汽車等AI系統(tǒng)感知和導航三維空間的能力。此外,MonoXiver也具有很強的適應性,可以輕松適配不同的單目攝像頭。除自動駕駛外,這種AI方法也可應用于其他領域,如機器人、環(huán)境監(jiān)測、醫(yī)學成像等。
(舉報)