サンプルサイズ/因子分析

Paul KlineのAn easy guide to factor analysiという本に記述があります。

結論としては、100以上で、変数の数の2~10倍、因子の数の20倍というところですが、多ければ多いほどよいとあります。

相関係数が正しく算出されることが重要で、対象者の中の1人の影響によって相関係数が大きく変わるようでは、因子分析の結果も信用できないということです。そういう意味で設問間の相関係数について、信頼区間や統計的有意差の有無も大事だねと書かれています。

いくつか本文と拙訳を抜粋します。

サンプルサイズ

Guilford(1956) argued that 200 was a minimum figure but in my experience this is pessimistic.In data with a clear factor structure samples of 100 were quite sufficient.

Guilford(1956)は、200が最小数と述べているが、私の経験ではこれは悲観的な数字である。明確な因子構造を持つのであれば、100のサンプルもあれば十分である。

変数の数(設問数)と対象者数

There have been various claims made concerning the ratio of subjects to variables running from as large as 10:1 as the necessary minimum down to 2:1

対象者と変数の比については、最大10:1から最小2:1まで様々な意見がある。

因子数と対象者数

It should be noted that a study by Arrindel and van der Ende(1985) claimed that this ratio was less important than the ratio of subjects to factors. This should be more than 20:1.

Arrindelとvan der Ende(1985)は、対象者数と設問数の比よりも、対象者数と因子数の方が重要であり、この比は20:1以上であるべきだと述べている。

未確認情報

以下は未確認ですが、下記の堀さんの書き込みによると

Hair et al.(1998)では最低で変数の5倍であり、10倍以上ならあまり問題がない。

もしも因子数と変数の数の関係なら、Gorsuch(1988) は1因子あたり6変数という数字をあげてます。これは計画的に因子をだす場合ですが。

参照