カイ二乗検定より正確な確率を求める方法。 計算量が多いため、昔は多く使われていなかった。
カイ二乗検定にもカイ二乗検定/Yatesの補正という方法があるが、それよりもFisherの直接確率法の方が正確。
実測値の表
病気 | 病気なし | 合計 | |
暴露あり | 4 | 2 | 6 |
暴露なし | 0 | 6 | 6 |
合計 | 4 | 8 | 12 |
期待値の表
病気 | 病気なし | 合計 | |
暴露あり | 2 | 4 | 6 |
暴露なし | 2 | 4 | 6 |
合計 | 4 | 8 | 12 |
記号の表
病気 | 病気なし | 合計 | |
暴露あり | a | b | R1 |
暴露なし | c | d | R2 |
合計 | C1 | C2 | N |
これからa=0となる場合の確率P(a=0)を計算してみる。
まず、R1とR2がそれぞれ6, 6になる確率P(R0)を求める。 期待値の表をみると、暴露ありの確率は、 暴露なしの確率は、なので、、12人を選んだときそれぞれ6人ずつになる確率は以下のようにして求められる。
C1とC2がそれぞれ4, 8になる確率をP(C0)とすると、
実測値の値、4,2,0,6になる確率をP(M0)とすると、
実測値が出現する確率は、行と列の合計がR, Cとなる場合の中で、a,b,c,dが4,2,0,6となる確率なので、となる。
実際に計算するとP(a=0) = 0.00303となる。
同様にP(a=1, 2, 3, 4)についても計算してみる。
P(a=0) = 0.0303 P(a=1) = 0.2424 P(a=2) = 0.4545 P(a=3) = 0.2424 P(a=4) = 0.0303
a=2となる場合が期待値の通りであり、P値は1となる。ここから外れるほど、P値は低くなる。
a=0なる場合とa=4となる場合は、片側検定ではP値は0.0303となるが、両側検定であれば、a=0とa=4の2つの確率を足した0.0606がP値となる。
a=1またはa=3となる場合は、それよりも偏った場合の確率を足して、片側検定では、0.2424+0.0303=0.2727となり、両側検定では0.5454となる。