統計技術 第Ⅲ部 Free Online Caluclator (事例集)
第1章-3 Histogram (データの分布)
データの分布(姿)をみてみよう.
● Free Statistics Software (Calculator) - Web-enabled scientific services & applications
Wessa.net site のTop page から、
https://www.wessa.net
「Descritve Statistics」→「Histgram」を選択.
↓
「Compute」をクリック
↓
図1 出力結果(Histgram)
分布は少し左に偏って右に裾を引いている.
視覚的に、正規分布かどうかが分かったので、正規性の検定をしてみよう.
ここでの方法は、次によりおこなうことが出来る。
「Statistical Dstributions」→「Skewness/Kurtosis」
↓
「Compute」をクリック
出力結果:
***
Skewness(歪度) and Kurtosis(尖度) Test
> agostino
D'Agostino skewness test(ダゴスティーナ)
data: x
skew = 0.57707, z = 2.77943, p-value = 0.005445
alternative hypothesis: data have a skewness(歪度がある)
> anscombe
Anscombe-Glynn kurtosis test(アンスコム)
data: x
kurt = 2.60623, z = -0.96443, p-value = 0.3348
alternative hypothesis: kurtosis is not equal to 3(尖度は3ではない)
***
正規分布の場合、Skewness(歪度) は「0」に、 Kurtosis(尖度) は「3」になるので、
その判断基準として、
歪度(skewness)の絶対値が 0.5以内で、尖度(kurtosis)が 2.5~3.5 の間であれば、正規分布とみて良いだろう.
Skewness(歪度)は、
正のとき→右に長く裾を引く.負のとき→左に長く裾を引く
Kurtosis(尖度 )は、
3 であれば→正規分布と似た尖り、
3以上であれば →正規分布より尖る、
3以下であれば →正規分布よりなだらか
となる.
よって、この例題では図1のヒストグラムのように正規分布とは言えないが、正規分布より、ややなだらかと推定される.
この例題が無視できないほど、正規分布からかけ離れていると判断したなら、何らかの方法で正規分布に近づけるための変換をおこなうことがある.
変換方法の1つに「ボックス=コックス変換」がある.
この変換は、図3の式で表される.
図3 Box-Cox 変換
ラムダによってYデータを変換し、ラムダ=0 の時は ln(Y) の自然対数が適用される.
変換されたサンプルの歪度と尖度をみてみよう.
「Statistical Dstributions」→「Box-Cox Normality Plot」
↓
「Compute」をクリック
出力結果:
***
図3 Box-Cox 変換後のヒストグラム
図4 Box-Cox 変換後のQ-Q Plot