Budgeted Training: Rethinking Deep Neural Network Training Under Resource Constraints (2019)

・限定されたエポック数で精度を最大にする学習率スケジュールの提案。

f:id:deconvo:20190519115723p:plain

・エポック数を変えた場合の適応的スケジュールはMask R-CNN論文[23]で示唆されていたが、これを一般化し、多様なスケジュールとタスクにおいて改善効果を検証したのが新規性。

・線形スケジュールが最高性能であることを検証した。

β：学習率、t：エポック、p=t/T、T：変更後の総エポック数、T0：変更前の総エポック数、f：学習率減衰係数（下図参照）

f:id:deconvo:20190519122027p:plain 　

f:id:deconvo:20190519122121p:plain

f:id:deconvo:20190519122523p:plain

左：従来の学習率スケジュール、右：提案された線形スケジュール

[23] K. He, G. Gkioxari, P. Dollar, and R. B. Girshick. Mask r-cnn. ICCV, pages 2980–2988, 2017.

・下表は、5タスクでのstep decayとの比較結果。

　・Budgetはエポック数の縮小比。

f:id:deconvo:20190519122949p:plain

・公開されていない。