箱ひげ図の外れ値
多くの書籍では、箱の長さの1.5倍までがヒゲの長さの限界としている。それを超えると外れ値として、個別にプロットする。
さらに箱の長さの3倍を超えると、別の印としてプロットするという方式もある。
箱の長さの1.5倍と3倍
- 市川(1993).SASによるデータ解析入門[第2版] p115
- SASのPROC UNIVARIATEについて
- 「第1四分位数と第3四分位数の距離を四分位偏差(interquantile range)というが、箱から1.5四分位偏差以内で最も中央値から離れた点までヒゲ(wisker)と呼ばれる垂直線を引く。さらに離れた測定値については、箱から3四分位偏差までは一つ一つをゼロ(0)で表し、それ以上遠い測定値はアスタリスク(*)で表す。」
95%の区間
以下の書籍は独自の書き方を提唱している。
ヒゲの範囲は、95%区間とある。
- [[>Book/1089]]p26
- 「さらに対象者の95%は「頬ひげwhisker」によって区切られた範囲に入ります。(中略)これを内部フェンス inner fenceと呼びます。この例では、1つのはずれ値も書いてあります。このスコアは内部フェンスよりも大きく、98%を限界とする外部フェンスouter fanceよりも小さいのです。最後に2つの極端な外れ地extreme outlierがあります。その得点は上端と下端の1%の外に落ちるものです。」