欠損値の処理

リストワイズ法(list-wise deletion)
欠損値を一つでも含むケースをすべての分析から除去する
ペアワイズ法(pair-wise deletion)
相関を利用する分析の場合、相関の計算に関係する欠損のみを除いて計算する。
平均値代入法
平均値を代入する方法 :完全情報最尤推定法(full information maximum likelihood method, FIML) :多重代入法(multiple imputation method)

分類は、http://www4.ocn.ne.jp/~murakou/missing_data.pdfhttp://se.naist.jp/achieve/pdf/181.pdfを参考とした。

欠損値の種類(欠損メカニズム)

missing completely at random (MCAR)
欠損がまったくランダムに生じる場合
missing at random (MAR)
欠損を起こす割合が別の変数の値と関係しており、その変数のを調整すると関係がなくなる場合。(反射神経のテストで、視力が悪い人ほど欠損値になりやすいが、視力を調整すると反射神経と欠損には関係がなくなる場合)
missing not at random (MNAR)
別の変数と調整しても、欠損を行う変数と欠損になる確率が関係する場合。(運動能力テストにおいて、運動能力が低いほど欠損になりやすい変数)

EMアルゴリズム

文献