テストデータ(機械学習)

機械学習において、テストデータとは、学習済みモデルの性能を評価するために使用されるデータセットのことです。

テストデータは、訓練データや検証データとは別に用意されることが一般的です。

これにより、機械学習モデルの真に未知のデータに対する性能を適切に評価することができます。

テストデータに検証データを用いてはいけない理由

検証データを使用して、過学習を抑制しながら機械学習モデルの性能を向上させると、間接的に検証データに対して学習が行われることになります。

そのため、検証データに対して、機械学習モデルが過剰に適合する可能性があります。

よって、検証データをテストデータとして使用すると、機械学習モデルの性能を過大評価してしまう可能性があります。

これは、検証データに対する過剰適合が実際の未知データに対する性能評価に影響を与えるためです。

そのため、検証データとテストデータは、別々に使用することが推奨されます。

これにより、機械学習モデルが真に未知のデータに対して、どの程度上手く機能するかを正確に評価することができます。