誤差逆伝播法

誤差逆伝播法とは、隠れ層のパラメーター(重みやバイアスなど)を勾配降下法を使って更新する際に、パラメーターに対する損失関数の勾配を高速に求める手法のことです。

誤差逆伝播法は、以下の手順で実現されます。

1. 順伝播させて、出力層の出力を得ます。

2. 損失関数を使って、出力層の出力と教師データとの差(誤差)を求めます。

3. 連鎖律を使って、各パラメーターに対する損失関数の勾配を求めます。このとき、出力層から入力層へ連鎖律を計算することで効率的に勾配を求められます。そして、誤差は、この連鎖律の起点となります。これが誤差逆伝播法と言われる理由です。

誤差逆伝播法では、隠れ層のパラメーターを入力変数とした合成関数の偏微分を使って、勾配を求めていると言えます。