2019-01-01から1年間の記事一覧

Computer Vision/Deep Learning論文千本ノック

今年2月ごろから始めた論文斜め読みが千本を超えたので、リストを掲載。 分野は、物体認識、Deep Learningの軽量化、Neural Architecture Searchがメイン。 適当な掲載方法が見つからず体裁が悪いのだが、とりあえず上げておく。 Year Affiliation Title Cat…

A Comparative Study of High-Recall Real-Time Semantic Segmentation Based on Swift Factorized Network (2019)

https://arxiv.org/pdf/1907.11394.pdf 分類 Semantic Segmentation 関連研究 ・従来のreal-time SSは、軽量base-net+Encoder-Decoderが主流で、精度はDecoderに主に依存していた。 ・画素ごとの難易度の違いが課題。Focal lossが1つの解。合成画像を使った…

Monocular Plan View Networks for Autonomous Driving (2019)

https://arxiv.org/pdf/1905.06937.pdf 分類 Object Detection, Autonomous Driving 特徴 ・単眼画像からBEV(Bird's Eye View)を推定し、first-person viewとBEVの両方に基づく自動制御を行う。 ・ROI Alignを用いた2D検出結果からの3D Bounding Box推定。 …

M3D-RPN: Monocular 3D Region Proposal Network for Object (2019)

https://arxiv.org/pdf/1907.06038.pdf 分類 Object Detection 特徴 ・単眼画像だけから3D物体(Bounding Box)検出。 ・2D,3D Bounding Boxを同時に1つのNNで推定。 これらを13パラメータで表現。 ・Depth-aware Convolution デプスを用いる代わりに画像を32…

Seeing Through Fog Without Seeing Fog: Deep Sensor Fusion in the Absence of Labeled Training Data (2019)

https://arxiv.org/pdf/1902.08913.pdf 分類 Object Detection 特徴 ・物体検出用ネットワークSSDを、RGBとLiDARのFusion用に改良。 ・霧・雪対策として、GANの前処理、少数の悪天候下ラベル付き画像からの学習。 ネットワーク構造 ・LiDAR,RGB2系統のSSDを…

Using Self-Supervised Learning Can Improve Model Robustness and Uncertainty (2019)

https://arxiv.org/pdf/1906.12340.pdf 分類 Adversarial Defences 特徴 ・教師なし学習による、adversarial examples, label corruptionへのロバスト性改善。 アルゴリズム ・PGD training[1]の改良。 ↓ ・ 入力画像に0°, 90°,180°, and 270の回転を与える…

Dynamic Distribution Pruning for Efficient Network Architecture Search (2019)

分類 Neural Architecture Search 特徴 ・構造探索の圧倒的な高速性。 アルゴリズム 探索空間を動的にpruningする。 探索空間はDARTSと同じで、全結合DAGによるnormal/reduction cellの組み合わせ。 EMアルゴリズムライクにSGDで探索。 エッジを表すone-hot …

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks (2019)

分類 Model Scaling 特徴 ・精度低下を最小に抑える構造のパラメータ(width, depth, resolution)調整のバランシング(Compound Scaling)。 ネットワーク構造 MnasNet[1]で構築されたベースネットは以下。 [1]Tan, M., Chen, B., Pang, R., Vasudevan, V.,…

Learning Fully Dense Neural Networks for Image Semantic Segmentation (2019)

分類 Sematic Segmentation 特徴 ・DenseNetの構造を応用。 ・adaptive aggregation(入力の1/8の解像度にそろえてconcat) ネットワーク構造 adaptive aggregationの模式図 性能 ・PASCAL VOC 2012のmIoUで、DeepLabv3+を超える。 ・パラメータ数は113.1M。…

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation (2018)

分類 Sematic Segmentation 特徴 ・精度と速度のトレードオフの解消を目的とし、以下4つの要素から構成される。 ・Spatial Path:3層のConvだけ(解像度1/8)で局所特徴抽出。 ・Context Path:Xception+global average poolingで大域情報を抽出。 ・Attent…

Object Detection in 20 Years: A Survey (2019)

https://arxiv.org/pdf/1905.05055.pdf 特徴 ・90年代からの物体検出技術のサーベイ。ほぼDeep Learningの内容。 ・データセットが網羅的にまとめられている。 ・軽量化・高速化の手法についても詳しく書かれている。 ・要素技術ごとにロードマップが作られ…

BayesNAS: A Bayesian Approach for Neural Architecture Search (2019)

https://arxiv.org/pdf/1905.04919.pdf 分類 Neural Architecture Search (NAS) 特徴 ・One-Shot手法の2つの課題 1.前後レイヤ間の依存性が考慮されていなかった 2.ノードの重みに基づく消去(pruning)は根拠が乏しい ・これらへの対策として、hierarch…

Budgeted Training: Rethinking Deep Neural Network Training Under Resource Constraints (2019)

https://arxiv.org/pdf/1905.04753.pdf 特徴 ・限定されたエポック数で精度を最大にする学習率スケジュールの提案。 ・エポック数を変えた場合の適応的スケジュールはMask R-CNN論文[23]で示唆されていたが、これを一般化し、多様なスケジュールとタスクにお…

Single-Path NAS: Device-Aware Efficient ConvNet Design (2019)

https://arxiv.org/pdf/1905.04159.pdf 特徴 ・探索時のネットワーク構造を、マルチパスからシングルパスに変更。 ・畳み込みのカーネルをサイズ・チャネル数に関して分解した“superkernel”を導入することで、 従来複数カーネルに分岐させていたものをシング…

マルクス・ガブリエル「なぜ世界は存在しないのか」

・本書のテーマ 「世界」についての認識、世界の非存在 ・先行研究 ヴィトゲンシュタインの限界:「世界とは、成立していることがらの総体である」(論理哲学論考) 世界は、対象・物・事実の総体である。 ハイデガーの限界:世界概念をどう根拠づけることが…

Detecting Symmetry and Symmetric Constellations of Features (2006)

http://www.cse.psu.edu/~yul11/CourseFall2006_files/loy_eccv2006.pdf 画像中の局所領域の幾何的対称性を定量化する手法。 以下の3ステップの処理がメイン。 1. 2つの特徴点を抽出 2. 各々に回転を加えて方向をそろえる 3. 各々をある軸に対し反転し[1]、…

Searching for MobileNetV3 (2019)

https://arxiv.org/abs/1905.02244 特徴 ・platform-aware NASで大域構造を探索。 ・NetAdaptで層ごとの探索を行う。 latency変化と精度変化の比をmetricとすることで、速度・精度の両立を図る。 ・semantic segmentationのencoder軽量化の新しい提案。 性能…

塔ノ岳(4/29)