統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

ビジネスと統計(3)

2014-10-13 17:11:35 | 日記・エッセイ・コラム
大根価格を25年度と26年度で比較して見ましょう。やはり、中四国農政局のHPから引用します。
両年度年度の大根価格の統計量とBoxPlot は表1と図1(前稿参照)の様になりました。


表1では、平均値と中央値の大きさが異なっています。この様に、平均値を大根価格の代表値とすれば26年度の方が高くなり、中央値を代表値とすれば僅かに安くなります。ビジネスにおいても平均値が必ずしも代表値として正しいかどうかは分かりません。平均値は飛び離れた値の影響を受けますので、その様なときは中央値や最頻値などを用いるなど代表値の長所・短所を知って用いるべきでしょう。

表1 の統計量は図1 のBoxPlot で表すことが出来ます。


図1 の「Wilcoxon の検定結果」に付いては別稿で述べますので、ここではBoxPlot での表現法を感じ取って下さい。
BoxPlot(図1)を見ると、25年度の上ひげ(上側の縦線)が長いです。すなわち、高値の方にバラツキが見られる事が分かります。
それに比べて、26年度の上下ひげ(上下の縦線)は同じくらいであり、バラツキが少ないと言えます。
この様にグラフにすると、その違いが分かり易くなりますので、ビジネスにおいても積極的に BoxPlotで統計量を要約しプレセンすれば一目置かれるかも知れませんよ・・・!

データのバラツキ具合は「平均値±標準偏差」で表すのでは・・・? 
それでは計算して見ましょう。
 25年度の場合:平均値±標準偏差=52.8 ~89.58
26年度の場合:平均値±標準偏差=60.54~85.76

平均値を挟んでバラツキが均等な正規分布の時は「平均値±標準偏差」をお勧めします。

たぶん、ビジネスで経験する多くのデータは正規分布でないと思われますので、ここでの例題(野菜価格)では積極的に BoxPlot の方法をご紹介したいと思います。
ちなみに、
BoxPlot は統計学的にノンパラメトリック法に適用されますが、専門用語は今のところパスしておきましょう。

次回に続く!

情報統計研究所はここから