A Comparative Study of High-Recall Real-Time Semantic Segmentation Based on Swift Factorized Network (2019)

　Semantic Segmentation

・recall rate（取りこぼし）向上のために、以下3つの改良を行った。

1. Loss Function

2. Classifier

3. Decision Rules

1. IAL(importance-aware loss)の適用

　・クラスによってlossへの寄与を変える。

f:id:deconvo:20190804101729p:plain

f:id:deconvo:20190804101907p:plain

f:id:deconvo:20190804101835p:plain

2. Graph convolution networkの適用

・グラフ構造でクラス間の相関を表現。

f:id:deconvo:20190804104830p:plain

f:id:deconvo:20190804104949p:plain

・最終層のsoftmaxを最尤推定にし、学習データから算出した検出位置のprior(確率分布)を加える。

f:id:deconvo:20190804102631p:plain

図：prior;p(x)の可視化

f:id:deconvo:20190804102737p:plain

・Swift Factorized Network (SFN)：U-Net構造で、Decorderに工夫。

f:id:deconvo:20190804101231p:plain

上図の'UP'(Upsampling Decoder Block)の詳細

　実験結果の通り、early mergingの方が精度が高い。

f:id:deconvo:20190804101429p:plain

・NVDIA GeForce GTX 1080Ti

・'768×768 crops for Cityscapes, and 448×448 crops for CamVid'

f:id:deconvo:20190804102255p:plain

・著者tensorflow実装

deconvo's blog