検証データとは、学習中の機械学習モデルの性能を評価し、過学習が発生していないかを確認するために使用されるデータセットのことです。
検証データは、訓練データとは別に用意します。これにより、検証データは、機械学習モデルにとって新しいデータとなります。
訓練データで評価した機械学習モデルの性能と検証データで評価した機械学習モデルの性能を比較することで、過学習の兆候を検出できます。
過学習が発生している場合、機械学習モデルは訓練データに対しては高い性能を示しますが、検証データに対しては低い性能を示すことが一般的です。