信頼区間の計算/比率

正規分布による近似

正規分布の近似は、全体人数が25人以上で、病気あり・なしの両方が5名以上いる場合に用いることができる。つまり少人数には適さない。少人数の場合は下のF分布から算出する。

例えば、100人中20人(割合20%)という病気の有無の割合について信頼区間を求める場合、

標準偏差は、\sqrt[]{\frac{p(p-1)}{n}

となり、95%信頼区間は、割合±1.96×標準偏差となるので、(1.96の数値は、正規分布する集団のの95%が含まれる範囲のz値。詳しくは正規分布を参照)

20\pm1.96\sqrt[]{\frac{0.2(0.2-1)}{100}} = 20\pm7.8 %

F分布から算出する方法

正規分布による近似が使えない小標本の場合でも用いることができる。

\frac{2x}{2x+2(n-x+1)\cdot F_{L}}\leq p\leq \frac{2(x+1)\cdot F_U}{2(n-x)+2(x+1)\cdot F_{U}}

EXCELでは、F分布は、F.INV(1-α/2,自由度1,自由度2)と求める。

例えば、n=18, x=4で、95%信頼区間(α=0.05)を求める場合、

後はそれぞれ計算すると6.4%〜47.7%になる。

実例

F分布から計算する方法で95%を求めた。対象とする比率が1%, 10%, 20%, 50%の場合、95%信頼区間は以下のようになる。

例えば、ある100人の感染率から全体の感染率の信頼区間を求める場合、100人中10人(割合10%)が感染していた場合、全体の感染率の95%信頼区間は5%〜18%になる。

割合1%10%20%50%
10人0%〜45%3%〜56%19%〜81%
20人1%〜32%6%〜44%27%〜73%
50人3%〜22%10%〜34%36%〜64%
100人0.0%〜5.4%5%〜18%13%〜29%40%〜60%
200人0.1%〜3.6%6%〜15%15%〜26%43%〜57%
500人0.3%〜2.3%8%〜13%17%〜24%46%〜54%
1000人0.5%〜1.8%8%〜12%18%〜23%47%〜53%
10000人0.8%〜1.2%9%〜11%19%〜21%49%〜51%

参考文献