統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

ビジネスと統計(11)

2015-07-13 19:29:16 | 日記・エッセイ・コラム

前号(10)で、最低気温と対数飛散数を相関関係を表す相関係数(r)で示してしまい誤解を招きました。
花粉飛散数と最低気温は回帰分析で表すべきですので、その統計量を記しておきます。
なお、
詳しくは、筆者がお勧めする「統計学入門 第5章 相関と回帰」を是非ご参考になさって下さい。

http://www.snap-tck.com/room04/c01/stat/stat05/stat0501.html


花粉飛散数と最低気温(8.5℃未満)の回帰式
 Log(花粉数)=1.581+0.31×最低気温 (R^2=0.208)

花粉飛散数と最低気温(8.5℃以上)の回帰式
 Log(花粉数)=6.302-0.483×最低気温 (R^2=0.126)


前号の訂正:最低温度は8.5℃で分けていました。

なお、
花粉飛散数と最低気温については、次号(12)で説明しますのでしばらくお待ち下さい。


ビジネスと統計(10)

2015-07-13 14:54:05 | 日記・エッセイ・コラム

「科学の道具箱」


 

http://rikanet2.jst.go.jp/contents/cp0530/contents/04-11-01.html

 からスギ花粉飛散量と気象条件のデータをダウンロードしビジネスに当てはめて見ましょう。

データは表1のようになっています。

表1 花粉飛散量と気象条件

すなわち、
「平均気温、最高気温、最低気温、天気、飛散量」の5つの項目(変数)をビジネス・データに当てはめて下さい。例えば、
飛散量は売上高などであり、他は売上高に影響する因子などです。

飛散量の分布を見て下さい。

図1 飛散量のヒストグラム(SAS-JMP使用)


左のヒストグラムは生データの分布で非常に偏っています。
このままでは分析に用いることが出来ませんので、対数変換「LN(X+0.1)」 し、右のように正規分布に近い型にしました。
そして、
最低気温と対数飛散数の相関関係を見ると図2のようになりました。

図2 最低気温と対数飛散数

図2の青色は「最低気温<8.0℃」、赤色はそれ以上の群です。
この様に、
花粉飛散数は最低気温(8.0℃)を境に異なっています。これを一つにして相関関係を見ると誤った結果になります。
ここでの、
青色の相関係数は r=+0.456(正の相関)、赤色は r=-0.355(負の相関)であり、相関関係が異なっています。

ビジネスにおいても、この様な事例を経験するかも知れません。
この様に、
単に数学的な公式を解くのが統計分析ではありません。色々なビジネスの現場を経験していないと分からない事が沢山あります。
統計分析でも、あなたの経験や知識が求められ、それは統計のセンスを磨くことにつながります。

あなたが日常の仕事の中で統計を活用しておれば、いつの間にかあなたは統計のスペシャリストになっている事でしょう。


情報統計研究所はここから!