偏差平方和とは、各データとその平均との差(偏差)を2乗し、すべて足し合わせたものです。
つまり、データ\(x_i\)の偏差平方和は、以下のように表せます。\(\overline{x}\)は、\(x_i\)の平均です。
\[偏差平方和=\sum_{i=1}^{n}(x_i-\overline{x})^2\]
なぜ、2乗するのかと言うと、偏差はすべて足し合わせると0になるため、それぞれの偏差を2乗することにより、符号の影響をなくし、偏差のばらつき具合が分かるようにしています。
偏差平方和は、データのばらつきを表す指標の一つです。
例えば、以下のデータがあったとします。
生徒番号 | 身長 | 偏差 |
---|---|---|
1 | 160cm | -7cm |
2 | 174cm | +7cm |
3 | 156cm | -11cm |
4 | 181cm | +14cm |
5 | 164cm | -3cm |
この場合、偏差平方和は、以下のように求めることができます。
(ー7)^[2]]+7^[2]]+(ー11)^[2]]+14^[2]]+(ー3)^[2]]=424[cm^[2]]]
なお、偏差平方和は、データの個数が多いほど、値が大きくなっていきます。