過学習とは、機械学習モデルが訓練データに対して過度に適合し、新しいデータに対する性能が低下する現象のことです。
訓練データが少ないと、データのノイズや偶然のパターンを学習する可能性があります。訓練データを増やすことで対策できます。
訓練データが持つパターンや特徴に偏りがある場合、その偏りが学習される可能性があります。訓練データに多様性を持たせることで対策できます。
機械学習モデルが複雑で高い表現力を持っている場合、パターンや特徴を過剰に見出す可能性があります。機械学習モデルの表現力を下げるか、訓練データを増やすことで対策できます。
訓練データにノイズが多いと、機械学習モデルがそのノイズを特徴の一つとして学習してしまう可能性があります。訓練データからノイズを除去することで対策できます。
学習回数が多過ぎると、パターンや特徴を過剰に見出す可能性があります。学習し過ぎないことで対策できます。