正規分布の検定

正規分布を前提とする検定では、母集団が正規分布しているかどうかが問題になります(t検定分散分析など)。

もし、正規分布と見なせない場合は、他の検定(ノンパラメトリック検定)を使わないといけません。

正規分布かどうか検定を行ってから使い分ける?

正規分布かどうかの検定を行ってから使うという方法もありますが、しょせんは検定なので標本数が少ないと仮説を棄却できず(正規分布でないとはいえず)、データが多いと仮説は棄却されやすくなる(正規分布とはいえなくなる)ので、参考程度にしかなりません。

サンプル数が少ないのに正規分布の検定を行って、「p値が0.05より大きいので正規分布と仮定して検定しました」というのをみかけますが、正規分布をしていないと断言するにはサンプル数が少ないというだけで、正規分布としてよいのかは大いに疑問です。

実際にどうする?

常に両方の検定をやってみて結果がどのぐらい違うか調べる。結果が同じだったらそれほどこだわることはないし、結果が違うのであればなぜ違うのか外れ値がないかなど調べてみたらいい。

迷うような分布だったらノンパラメトリック検定をやっておけば問題ないと思う。

p値が0.05ぐらいで検定法によって結果が違うときは悩ましいような気もするが、検定はサンプルサイズによって大きく結果が変わるものだし、0.05なんて勝手に決めた基準でしかないので有意差にこだわりすぎず、信頼区間を求めるべき。

標本の大きさが100以上で、桁外れに影響力がある値がなければ正規分布を仮定してよい?

「標本の大きさが大きい場合(100以上)や、桁外れに影響力のある点(二変量あるいは多変量解析に不釣り合いな影響を及ぼす観測値)がない場合は、分析において正規分布を仮定できる場合と同様に間隔変数を使うことができます68)。標本の大きさが100未満で、間隔変数が正規性の仮定を満たさない場合は、ノンパラメトリック統計を使用してください。」

68として紹介されている本の中に、中心極限定理によって可能とあるらしい。

どの検定でもよいのか?など疑問も残りますが、原書を確認していないので、なんともいえません。ご利用は自己責任で。

ただし、群間で等分散の仮定を満たさなければならない場合もあるので注意。 例えば、普通のt検定は2群の分散が等しいことを仮定しています。もし、2群の分散が等しくない場合は、分散が等しくないt検定(Welch法)を使うこと。

参考文献