あるタスク$\mathcal{T}$を、小規模な$\mathcal{D}=\{(\mathbf{x}n, d_n)\}{n=1,...,N}$のみ用いて効果的に学習したい
例としてクラス分類を考える。
様々なアプローチがあるが、データ拡張と転移学習がメイン。
訓練データが少ないとき、最初に検討すべき方法。
今あるデータ $\mathcal{D}=\{(\mathbf{x}n, d_n)\}{n=1,...,N}$を元に、入力$\mathbf{x}_n$を適当な$\varphi$で変換した${\mathbf{x'}_n} \equiv \varphi(\mathbf{x}_n)$を作り、これを$\mathbf{x}_n$の目標出力$d_n$と組み合わせて新たな訓練サンプル$(\mathbf{x'}_n,d_n)$とし、学習に利用する。
変換$\varphi$には大きな自由度がある。
変換$\phi$は、
ように選ぶのが基本。
これを「基本方針」と呼ぶことにする。
データ拡張は、画像に対して特に有効。
変換の例は、