Box-Cox変換

正規分布していないデータを無理やり正規分布に変換する方法。

下記のような式に、適当なλを入れて変換し、正規分布に見えるようにする。

\left\{\frac{1}{\lambda}(x^\lambda-1), \lambda\neq0 \\ log(x), \lambda=0

一般にデータの変換方法としては、右に裾を引くよう分布、L字型のデータ(例えば、年収データ)などを対数変換する方法がありますが、上記の式はこれを一般化したものです。

λにどんな値をいれるかは、自分でいろいろ試してもいいし、最尤法で計算させる方法もあるようです。

こんな変換やっていいのかどうかは別問題。

文献