重回帰分析/多重共線性

説明変数に相関が高い変数があると、その変数の回帰係数が不安定になること。

説明変数は事前に相関係数を求めておき、高い相関係数があった場合は、

多重共線性の確認

2つの独立変数同士で確認する

「相関が0.9を超えると問題を生じ、0.8から0.9の場合は、問題を生じる可能性がある。」

許容度(トレランス, tolerance)

説明変数が5つあった場合、そのうち1つの変数と残り4つの変数で重回帰分析を行い、重相関係数を求める。

もし、この値が高ければ、その1つの変数は、残り4つの変数と多重共線性を起こしている。

許容度 = 1 - (説明変数間の)重相関係数の2乗

どれぐらいの値であれば危険かは、次のVIFで判断することが多い。

VIF(Variance Inflation Factor,分散拡大要因)を用いる

VIF = 1 / 許容度

「4を超えると問題が生じる可能性があり、10を超えると問題が生じることになる」

「VIF≧10となるようであれば、xを除いた方がよい」

参考文献