欠損値の処理
- リストワイズ法(list-wise deletion)
- 欠損値を一つでも含むケースをすべての分析から除去する
- ペアワイズ法(pair-wise deletion)
- 相関を利用する分析の場合、相関の計算に関係する欠損のみを除いて計算する。
- 平均値代入法
- 平均値を代入する方法
:完全情報最尤推定法(full information maximum likelihood method, FIML)
:多重代入法(multiple imputation method)
分類は、http://www4.ocn.ne.jp/~murakou/missing_data.pdfとhttp://se.naist.jp/achieve/pdf/181.pdfを参考とした。
欠損値の種類(欠損メカニズム)
- missing completely at random (MCAR)
- 欠損がまったくランダムに生じる場合
- missing at random (MAR)
- 欠損を起こす割合が別の変数の値と関係しており、その変数のを調整すると関係がなくなる場合。(反射神経のテストで、視力が悪い人ほど欠損値になりやすいが、視力を調整すると反射神経と欠損には関係がなくなる場合)
- missing not at random (MNAR)
- 別の変数と調整しても、欠損を行う変数と欠損になる確率が関係する場合。(運動能力テストにおいて、運動能力が低いほど欠損になりやすい変数)
EMアルゴリズム
文献