不偏分散

不偏分散は、偏差の二乗を(データの数-1)で割ります。

標本分散は、偏差の二乗をデータの数で割ります。

不偏分散の方が少し大きくなるのです。

不偏分散の意味

研究では、本来の研究対象となっている人(母集団)と実際に研究に参加した人(標本)を区別して考えます。たとえば、高血圧の人についての研究をする場合は、世界中の何百万、何千万という高血圧の人が母集団で、今回の研究で血圧を測定した100人が標本となります。

標本分散とはこの100人の血圧の分散のことです。

一方、この100人の血圧から母集団全体の分散を考えるときがあります。この母集団の分散のことを不偏分散といいます。

考え方

母集団の分散が分かっていたとします。その中からn個の標本を抜き出した場合、そのn個の標本の分散は、母集団の分散より(n−1)/n倍と少し小さくなることが分かっています。そこで、母集団の分散(不偏分散)を(n−1)/n倍した値を標本分散と考えます。逆に言うと、標本分散を(n−1)/n倍したものが母集団の分散(不偏分散)になるのです。

偏差の二乗の合計をnで割ったのが標本分散ですから、その標本分散を(n−1)/n倍した値、つまり偏差の二乗の合計を(n−1)で割った値が不偏分散になるのです。

参考