信頼性係数

信頼性係数とは、「測定値」の中の「真の値」の割合です。

安定性や一貫性を示すために古典的テスト理論では、「測定値=真の値+誤差」(真の値と誤差を参照)と考え、「測定値の分散」のうちの「真の値の分散」の比率を信頼性係数と定義します(分散については分散の解説を読んでください)。

つまり、信頼性係数は「真の値の分散」÷「測定値の分散」として計算されます。一般に、「測定値の分散=真の値の分散+誤差の分散」なので(真の値と誤差の相関は0と考えるので)、誤差が少ないほど信頼性係数が高くなります。

2種類の信頼性係数

信頼性係数といっても、安定性の指標と一貫性の指標では求めるものが違います。

安定性の指標には、再テスト法による信頼性係数があります。同じテストを時期をあけて2度行う方法で評価します。

一貫性の指標には、クローンバックのαがあります。これは、尺度を構成している複数の質問文が同じような回答傾向を示しているかを数値で表したもので、内的整合性とも呼ばれます。

一口に信頼性といっても、安定性と一貫性とはまったく異なる概念で、安定性は高いほどよい指標といえますが、一貫性は、同じような回答傾向(第1問に高い点数をつけた人は、第2問にも高い点数をつけやすい)ということだけをみており、一概に高いほどよいとはいえません。

一貫性の指標であるクローンバックのαを高くするには、同じような言葉を質問文で使うとよいのですが。たとえば不安の尺度の質問文として、

こうすれば質問文間の相関は高くなり、クローンバックのαも高くなります。

しかし、あまりに高いクローンバックαは、本当に「不安」という概念を測定したことになるのかわかりません。妥当性と共に評価されるべきです。

Cronbachのα係数

尺度開発では、Cronbachのα係数の内的整合性が信頼性指標として使われます。

しかし、Cronbachのαは尺度の質問文が多いほど高くなるという性質があり、質問文が多い尺度と少ない尺度を比較する場合は級内相関係数(ICC)がよいという意見もあります。