サンプルサイズ/G*Power/ロジスティック回帰分析
例として、褥瘡マットを使うと、褥瘡の発症率が減るかという研究を考える。
褥瘡マットを使わないときの褥瘡の発生率が平均で2%
褥瘡マットを使うときの褥瘡の発生率が平均で1%と予測する。
「褥瘡マット使用の有無」がみたい説明変数、それ以外に「性別」、「年齢」、「糖尿病の有無」などの説明変数を加える。
「褥瘡マット使用の有無」を目的変数、「性別」「年齢」「糖尿病の有無」を説明変数とした重回帰分析を行い、決定係数(R2)を使うが、ランダム化介入試験の場合は0に近いはずなので0とする。
値の入力
- Test family : ztests
- Statistical test: Logistic regression
- Type of power analysis: A priori:
Optionsを選択して、Two probabilitiesにチェックを入れておく。
- Tail(s)(両側・片側検定): two
- Pr(Y=1|X=1)H1(説明変数が1のとき、目的変数が1になる確率)対立仮説:0.01
- Pr(Y=1|X=1)H0(説明変数が1のとき、目的変数が1になる確率)帰無仮説: 0.02
- α err prob(有意水準) : 0.05
- Power(1-β err prob)(検出力):0.80
- R2 other X:0 特定の説明変数が他の説明変数でどの程度説明されるかの決定係数
- X distribution: Binominal(二項分布)
- X param π(説明変数が1になる確率): 0.5
今回は褥瘡マット使用した人としなかった人を同数とするので、π=0.5でよい。
もし、褥瘡マットを使用する人30人、使用しない人15人であれば、π=30/45=0.6666とする。
結果
4825人!
褥瘡の発生率が低いので、サンプルサイズも大きくなる。
もし、褥瘡の発生率を20%,介入したら10%とすれば、サンプルサイズは415人。
褥瘡の発生率13%, 介入したら10%ぐらいでも、3,569人なのでかなり大きな人数が必要。
褥瘡マットはかならず褥瘡が減る!という信念の元、片側検定にしてみたら2,811人と少し減る。
もし、みたい説明変数が正規分布の場合は以下のように指定する。
- X distribution: Normal(正規分布)
- X param μ: 説明変数の平均値
- X param σ:説明変数の標準偏差
Options
Input effect size as... (エフェクトサイズの入力方法)
説明変数が変化するとどのぐらい目的変数の確率が変わるかを指定する方法を選ぶ。
ここをチェックすると、入力方法の画面が変わる。
例えば、たばこを吸う(説明変数)と肺がんになる(目的変数)とする場合、
- たばこを吸わない人の肺がんになる確率:0.0001
- たばこを吸う人が肺がんになる確率:0.0002
オッズ比:2となる。
"Odds ratio"で入力する場合は、
- Odds ratio: 2
- Pr(Y=1|X=1) H0 : 0.0001
と入力する。
"Two probabilities"で入力する場合は、
- Pr(Y=1|X=1) H0 : 0.0001
- Pr(Y=1|X=1) H1 : 0.0002
と入力する。
Computation(計算方法)
3種類の方法がある。
- 1.emeration procedure(Lyles et al., 2007)
正確だが遅い。
- 2.large sample approximation: Demidenko(2007)
Xの分布はなんでもよい。
With variance correction
Xの分布が正規分から大きくずれているときにチェックする。
- 3.large sample approximation: Hsieh et al.(1998)
説明変数が2値か正規分布のときのみ。