統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計技術 第Ⅲ部:第1章-3 Histogram(データの分布)

2022-04-22 10:00:39 | 日記・エッセイ・コラム

統計技術 第Ⅲ部 Free Online Caluclator (事例集)

第1章-3 Histogram (データの分布)
データの分布(姿)をみてみよう.

● Free Statistics Software (Calculator) - Web-enabled scientific services & applications 
Wessa.net  site のTop page から、
  https://www.wessa.net

「Descritve Statistics」→「Histgram」を選択.

「Compute」をクリック

図1 出力結果(Histgram)

分布は少し左に偏って右に裾を引いている.

視覚的に、正規分布かどうかが分かったので、正規性の検定をしてみよう.
ここでの方法は、次によりおこなうことが出来る。

「Statistical Dstributions」→「Skewness/Kurtosis」

「Compute」をクリック

出力結果:
***
Skewness(歪度) and Kurtosis(尖度) Test
> agostino
 D'Agostino skewness test(ダゴスティーナ)
 data:  x
 skew = 0.57707, z = 2.77943, p-value = 0.005445
 alternative hypothesis: data have a skewness(歪度がある)

> anscombe
 Anscombe-Glynn kurtosis test(アンスコム)
 data:  x
 kurt = 2.60623, z = -0.96443, p-value = 0.3348
 alternative hypothesis: kurtosis is not equal to 3(尖度は3ではない)
***

正規分布の場合、Skewness(歪度) は「0」に、 Kurtosis(尖度) は「3」になるので、
その判断基準として、
歪度(skewness)の絶対値が 0.5以内で、尖度(kurtosis)が 2.5~3.5 の間であれば、正規分布とみて良いだろう.

Skewness(歪度)は、
 正のとき→右に長く裾を引く.負のとき→左に長く裾を引く

Kurtosis(尖度 )は、
 3 であれば→正規分布と似た尖り、 
 3以上であれば →正規分布より尖る、
 3以下であれば →正規分布よりなだらか

となる.
よって、この例題では図1のヒストグラムのように正規分布とは言えないが、正規分布より、ややなだらかと推定される.

この例題が無視できないほど、正規分布からかけ離れていると判断したなら、何らかの方法で正規分布に近づけるための変換をおこなうことがある.
変換方法の1つに「ボックス=コックス変換」がある.
この変換は、図3の式で表される.

図3 Box-Cox 変換


ラムダによってYデータを変換し、ラムダ=0 の時は ln(Y) の自然対数が適用される.

変換されたサンプルの歪度と尖度をみてみよう.

「Statistical Dstributions」→「Box-Cox Normality Plot」

「Compute」をクリック

出力結果:
***
図3 Box-Cox 変換後のヒストグラム

図4 Box-Cox 変換後のQ-Q Plot




最新の画像もっと見る