商品の売上予測をするのに、単純に考えれば、
いくつかの要因を組み合わせて、それを加減乗除して予測する。
つまり、重回帰分析を行って、予測する。
しかし、統計的に考えると、これは失敗しやすい。
i.i.dに違反することが多い。
i.i.dっていうのは、反復型開発でも、RBB TODAYの会社でもなく、
独立同一分布independent identical distributionのこと。
具体的に考えよう。
いま、自動販売機がある。
・コカコーラ
・ジョージア(コーヒー)
・おーいお茶
・そうけんび茶
→このような伊藤園とコカコーラ合同の自販機はありえませんが、
あったと仮定します。
ここで、自販機全体の販売は、平均1日10(μ=10)本、分散9(σ=3)だったとする
ここから、標本
x_1=コカコーラ
x_2=ジョージア(コーヒー)
x_3=おーいお茶
x_4=そうけんび茶
を考える。このとき、x_1~x_4が独立であれば(i.i.d)、これは、回帰を実行して、予測できる。
でも、たぶん、独立じゃない。
X_3とX_4は、同じお茶なので、選ぶ人は、まず、
x_1=炭酸飲料
x_2=コーヒー
x_3,x_4=お茶
そして、お茶を選んだ人は
x_3=おーいお茶
x_4=そうけんび茶
という、お茶に関しては2段階分類していると考えられる。
だから、x_1,x_2とx_3,x_4は、分布が違う、i.i.dに違反している。
(結果として、まるちこ(多重共線性)を生み出したりするかも
→回帰は失敗する)
商品を購入する場合、ブランドロイヤリティが高ければ、その商品しか買わないが、
多くのケースで、まず、商品カテゴリ(お茶)を選んで、その中からあった商品を買う。
いや、品切れのときもあるし・・・
このような予測、分析の場合は、ネステッド・ロジスティック・モデルを使う。
詳しくは、
階層ベイズによるワンToワンマーケティング入門
http://www.slideshare.net/naoshi5/to-18339227
の38シート目とかを見てね。
で、今日いいたいのは、そこじゃなくって、
このモデルって、マルチレベル分析
でいけるんではなくって?と思った。
マルチレベルなら、
心理統計学
http://norimune.net/psychmetrics
にあるように、結構いろいろソフトも手法もあるし・・・
いくつかの要因を組み合わせて、それを加減乗除して予測する。
つまり、重回帰分析を行って、予測する。
しかし、統計的に考えると、これは失敗しやすい。
i.i.dに違反することが多い。
i.i.dっていうのは、反復型開発でも、RBB TODAYの会社でもなく、
独立同一分布independent identical distributionのこと。
具体的に考えよう。
いま、自動販売機がある。
・コカコーラ
・ジョージア(コーヒー)
・おーいお茶
・そうけんび茶
→このような伊藤園とコカコーラ合同の自販機はありえませんが、
あったと仮定します。
ここで、自販機全体の販売は、平均1日10(μ=10)本、分散9(σ=3)だったとする
ここから、標本
x_1=コカコーラ
x_2=ジョージア(コーヒー)
x_3=おーいお茶
x_4=そうけんび茶
を考える。このとき、x_1~x_4が独立であれば(i.i.d)、これは、回帰を実行して、予測できる。
でも、たぶん、独立じゃない。
X_3とX_4は、同じお茶なので、選ぶ人は、まず、
x_1=炭酸飲料
x_2=コーヒー
x_3,x_4=お茶
そして、お茶を選んだ人は
x_3=おーいお茶
x_4=そうけんび茶
という、お茶に関しては2段階分類していると考えられる。
だから、x_1,x_2とx_3,x_4は、分布が違う、i.i.dに違反している。
(結果として、まるちこ(多重共線性)を生み出したりするかも
→回帰は失敗する)
商品を購入する場合、ブランドロイヤリティが高ければ、その商品しか買わないが、
多くのケースで、まず、商品カテゴリ(お茶)を選んで、その中からあった商品を買う。
いや、品切れのときもあるし・・・
このような予測、分析の場合は、ネステッド・ロジスティック・モデルを使う。
詳しくは、
階層ベイズによるワンToワンマーケティング入門
http://www.slideshare.net/naoshi5/to-18339227
の38シート目とかを見てね。
で、今日いいたいのは、そこじゃなくって、
このモデルって、マルチレベル分析
でいけるんではなくって?と思った。
マルチレベルなら、
心理統計学
http://norimune.net/psychmetrics
にあるように、結構いろいろソフトも手法もあるし・・・