https://arxiv.org/pdf/1907.06038.pdf
分類
Object Detection
特徴
・単眼画像だけから3D物体(Bounding Box)検出。
・2D,3D Bounding Boxを同時に1つのNNで推定。
これらを13パラメータで表現。
・Depth-aware Convolution
デプスを用いる代わりに画像を32分割して、各領域でカーネルを変える。
PyTorchのGroup conv.の実装を流用。
・Post 3D→2D Optimization
後処理として3D BBoxの向きを推定し、2D,3D BBoxの整合性を保証。
ネットワーク構造
・高次特徴量がデプスによって変わるため、 Depth-aware Convolutionを片方のパスで用いる。
実験
・KITTIで118~161ms(1080Ti)。
実装
・PyTorch実装公開予定
http://cvlab.cse.msu.edu/project-m3d-rpn.html