ビッグデータの学問的背景として、よく挙げられるのに統計学と機械学習が挙げられる。
また、ビッグデータの利用として、マーケティングが挙げられる。
しかし、マーケティングも統計学も突き詰めれば、ビッグデータと矛盾する。
統計学は、母集団が大きいとき、いかにデータを少なくしても、有る程度の精度を
保って、母集団の値に近いものが出せるかという発想に立っている。
つまり、ビッグデータのままで取り扱うことを否定し、乱数などを使って、
データを少なくして、処理を行う。
だから、統計学を突き進めて行くと、ビッグデータの意味はなくなってしまう。
一方、マーケティングを突き詰めていくと、マーケティングは平均値を出して、
当たり前のことを知るものではない。それでは、他社と変わらない。
かといって、きわどい特殊事例を狙いすぎると、それは誤差かもしれないという
ことになる。
そこで、モデルをたてて、そのモデルの正当性を検定によって確かめる。
しかし、ビッグデータはあらかじめ、モデルを立てるのではなく、データから
価値有る情報を見出そうとする
だから、マーケティングを突き進めて行くと、モデル(仮説)を立てないで、
抽出させようとしても、当たり前の結果しか、出ないんじゃないの?
ということになる(実際、データ分析すると、結構、当たり前の結果が出てくる)
つまり、統計学やマーケティングを突き進めると、ビッグデータの思想自体を
否定してしまう。
これらの分野から、技術を借用することは可能なのだが、その根本的な思想は、
これらの分野から借りてきたり、敷衍したりすることは、出来ないのだ。
だから、「ビッグデータ学」とでもいうべき、思想のよりどころが必要になる。
なぜ、ビッグなデータをそのまま扱わないといけないのか?それを扱うと、
どんなことが見えてくるのか・・・
この辺がしっかりしないと、学問としても認められないし、教育も出来ない。
単に借用技術の寄せ集めになってしまうということが、意外と論じられていないと思う。
また、ビッグデータの利用として、マーケティングが挙げられる。
しかし、マーケティングも統計学も突き詰めれば、ビッグデータと矛盾する。
統計学は、母集団が大きいとき、いかにデータを少なくしても、有る程度の精度を
保って、母集団の値に近いものが出せるかという発想に立っている。
つまり、ビッグデータのままで取り扱うことを否定し、乱数などを使って、
データを少なくして、処理を行う。
だから、統計学を突き進めて行くと、ビッグデータの意味はなくなってしまう。
一方、マーケティングを突き詰めていくと、マーケティングは平均値を出して、
当たり前のことを知るものではない。それでは、他社と変わらない。
かといって、きわどい特殊事例を狙いすぎると、それは誤差かもしれないという
ことになる。
そこで、モデルをたてて、そのモデルの正当性を検定によって確かめる。
しかし、ビッグデータはあらかじめ、モデルを立てるのではなく、データから
価値有る情報を見出そうとする
だから、マーケティングを突き進めて行くと、モデル(仮説)を立てないで、
抽出させようとしても、当たり前の結果しか、出ないんじゃないの?
ということになる(実際、データ分析すると、結構、当たり前の結果が出てくる)
つまり、統計学やマーケティングを突き進めると、ビッグデータの思想自体を
否定してしまう。
これらの分野から、技術を借用することは可能なのだが、その根本的な思想は、
これらの分野から借りてきたり、敷衍したりすることは、出来ないのだ。
だから、「ビッグデータ学」とでもいうべき、思想のよりどころが必要になる。
なぜ、ビッグなデータをそのまま扱わないといけないのか?それを扱うと、
どんなことが見えてくるのか・・・
この辺がしっかりしないと、学問としても認められないし、教育も出来ない。
単に借用技術の寄せ集めになってしまうということが、意外と論じられていないと思う。