11.1 はじめに

あるタスク$\mathcal{T}$を、小規模な$\mathcal{D}=\{(\mathbf{x}n, d_n)\}{n=1,...,N}$のみ用いて効果的に学習したい

例としてクラス分類を考える。

様々なアプローチがあるが、データ拡張と転移学習がメイン。

11.2 データ拡張

訓練データが少ないとき、最初に検討すべき方法。

今あるデータ $\mathcal{D}=\{(\mathbf{x}n, d_n)\}{n=1,...,N}$を元に、入力$\mathbf{x}_n$を適当な$\varphi$で変換した${\mathbf{x'}_n} \equiv \varphi(\mathbf{x}_n)$を作り、これを$\mathbf{x}_n$の目標出力$d_n$と組み合わせて新たな訓練サンプル$(\mathbf{x'}_n,d_n)$とし、学習に利用する。

変換$\varphi$には大きな自由度がある。

11.2.1 基本的な考え方

変換$\phi$は、

ように選ぶのが基本。

これを「基本方針」と呼ぶことにする。

11.2.2 主に画像に対して有効な方法

データ拡張は、画像に対して特に有効。

変換の例は、