Monocular Plan View Networks for Autonomous Driving (2019)

https://arxiv.org/pdf/1905.06937.pdf

分類

 Object Detection, Autonomous Driving

特徴

・単眼画像からBEV(Bird's Eye View)を推定し、first-person viewとBEVの両方に基づく自動制御を行う。

f:id:deconvo:20190728185314p:plain

 

・ROI Alignを用いた2D検出結果からの3D Bounding Box推定。

  単眼画像からデプスに加え向き・大きさも推定。
  射影幾何に基づきBEVを生成。

・pixel-level attentionにより制御精度が向上。

ネットワーク構造

f:id:deconvo:20190728184659p:plain

f:id:deconvo:20190728184946p:plain

実験

・運転制御の評価にシミュレータGrand Theft Auto Vを使用。
・デプス推定は他手法との比較はなし。64m以内に限定。
・2D検出は、DetectronのMask RCNNをベース。

表:Depth推定精度

f:id:deconvo:20190728185405p:plain

図:歩行者を検出し停止した例

f:id:deconvo:20190728185527p:plain

実装

・なし。