俗物哲学者の独白

学校に一生引きこもることを避けるためにサラリーマンになった自称俗物哲学者の随筆。

データ

2016-10-19 09:56:31 | Weblog
 発言する権利を本人が主張するのであれば原則としてその権利は承認されるべきだが、無闇に発言を奨励すべきとは思えない。現代人の音楽の好みについて調査するなら音楽が好きな人の意見を聞けば充分であり音楽に関心の無い人の意見まで集約する必要は無かろう。同様に政治や司法について関心の無い人の意見を過大評価すべきではなかろう。
 コンビニなどで重視されているPOSのデータは今、何が売れているかについての情報だ。売れていない商品に関する情報は殆んど皆無だ。情報収集と情報廃棄は表裏一体の関係であり、情報処理のためには情報収集と同時に情報廃棄を行わねばならない。それを怠れば情報ではなくゴミを集めることになってしまう。
 販売データを集めるに当って最も注意すべきことは、売ろうとしているのに売れないのか売ろうとしていないから売れないのかを混同しないことだ。目に付かない場所や全く場違いな場所に陳列しても顧客はその商品の存在にさえ気付かない。もっと酷いのは陳列さえしていない、あるいはそもそも取り扱ってさえいない商品を「売れていない」と評価することだ。
 先日「夜のお菓子」という異名を持つ「うなぎパイ」が名古屋駅構内の売店から一旦撤去されその後販売が復活するというドタバタ劇があった。これは一部のマスコミが騒いだからではなくデータ処理の初歩的な間違いに気付いたからだろう。データ処理の鉄則を無視すれば間違った結論が導き出される。
 元々一部の店舗でしかうなぎパイは売られていなかった。扱い店舗が少ないのだから全店合計の売上高は少なくなる。しかし実際に販売をしていた店ではベスト10にも入るほどよく売れていたらしい。全体の状況を把握せずに判断すればこんな幼稚で初歩的なミスを犯す。
 ミスよりも作為のほうが怖い。幸か不幸か、パソコンの機能が充実することによって事象Aと事象Bの相関関係を見付けることが非常に容易になった。データ処理に熟練した人であれば因果と相関の関係を混同することがどれほど危険かを熟知している。しかしデータ分析のド素人はパソコンが弾き出した答を鵜呑みにする。中にはいとも容易く快刀乱麻を断てることの喜びを初めて知ったばかりにとんでもない結論を導き出して大喜びをしている人もいる。例えば健康と食事はかなり複雑な関係なのだから結論を出すためには細心の注意を払う必要がある。しかし彼らはそのことを理解せずに奇説・珍説を安易に丁稚上げる。売れれば良いという商業主義に毒されているマスコミは狂喜してその情報を歓迎するから両者の利害が一致して奇説・珍説が広められる。今後当分の間くだらない偽因果情報が世に氾濫してうんざりさせられることになるだろう。
 禅宗には「隻手の音声を聞け」という言葉がある。常にデータをそこまで深読みする必要は無かろうが、パソコンから大量に放出されるデータの洪水で溺れないためには、遅くとも中学3年生ぐらいまでに確率と統計の基礎について学ばせる必要がある。

コメントを投稿