M3D-RPN: Monocular 3D Region Proposal Network for Object (2019)

https://arxiv.org/pdf/1907.06038.pdf

分類

 Object Detection

特徴

・単眼画像だけから3D物体(Bounding Box)検出。

・2D,3D Bounding Boxを同時に1つのNNで推定。
 これらを13パラメータで表現。

f:id:deconvo:20190728183406p:plain

・Depth-aware Convolution

 デプスを用いる代わりに画像を32分割して、各領域でカーネルを変える。

 PyTorchのGroup conv.の実装を流用。

f:id:deconvo:20190728183443p:plain

・Post 3D→2D Optimization
 後処理として3D BBoxの向きを推定し、2D,3D BBoxの整合性を保証。

ネットワーク構造

 

・高次特徴量がデプスによって変わるため、 Depth-aware Convolutionを片方のパスで用いる。

f:id:deconvo:20190728183552p:plain

実験

・KITTIで118~161ms(1080Ti)。

f:id:deconvo:20190728183710p:plain

実装

・PyTorch実装公開予定

http://cvlab.cse.msu.edu/project-m3d-rpn.html