1)ある仮説を立てる「明日は雨かな?」
2)その仮説の可能性を計算する「雨が降る確率は1%」
3)その可能性が低ければ仮説を否定する「雨は降らないといっていいだろう」
1)ある仮説を立てる「2群の平均値は同じ?」
2)その仮説の可能性を計算する「2群の平均値が同じである可能性は2%」
3)その可能性が低ければ仮説を否定する「2群の平均値は統計的に有意差がある」
可能性が計算できるような仮説を立てないと意味がない。
例えば「2群の平均値は違う」というばくぜんとした仮説では可能性を計算できない。
計算しやすい仮説として、「2群の平均値は同じ」のような仮説が立てられる。
このような仮説を帰無仮説と呼ぶ。
「2群の平均値は同じ」は、正確には「2群の母集団の平均値は同じ」である。
統計の検定では、実際に測定したデータを母集団から抜き出されたデータと考える。
(実際に測定したデータに差があるかどうかはすでに明らかであり、測定したデータについてはそれ以上解釈する必要はない)
抜き出される元となる母集団に差があるかないかを検定する。
そこで、2群が抜き出される元となった母集団の平均値には差がないという仮説をまず立てる。
実際に測定した2群の平均値が2違とする。
母集団の平均値が同じであった場合に、(そこから抜き出されたと考える)2群の測定値の平均値の差が2以上ある可能性を計算で求める。
※天気予報の降水確率は現在の状況から明日のこと(仮説)を予測しており、仮説が正しいとした上で現在の状況が起こる可能性を計算する統計の検定とは異なるが、ここではわかりやすい例として示している。
どのぐらい可能性が低ければ仮説を否定してよいのか。その基準を有意水準という。
一般的に有意水準には5%が用いられることが多く、仮説の可能性が5%未満の場合、「統計的有意差」があったと表現する。