M3D-RPN: Monocular 3D Region Proposal Network for Object (2019)

　Object Detection

・単眼画像だけから3D物体(Bounding Box)検出。

・2D,3D Bounding Boxを同時に1つのNNで推定。
　これらを13パラメータで表現。

f:id:deconvo:20190728183406p:plain

・Depth-aware Convolution

　デプスを用いる代わりに画像を32分割して、各領域でカーネルを変える。

　PyTorchのGroup conv.の実装を流用。

f:id:deconvo:20190728183443p:plain

・Post 3D→2D Optimization
　後処理として3D BBoxの向きを推定し、2D,3D BBoxの整合性を保証。

・高次特徴量がデプスによって変わるため、 Depth-aware Convolutionを片方のパスで用いる。

f:id:deconvo:20190728183552p:plain

・KITTIで118～161ms(1080Ti)。

f:id:deconvo:20190728183710p:plain

・PyTorch実装公開予定