平成25年7月4日(木)
昨日のNHK、クローズアップ現代は『数字のからくり、データの真実』というテーマだった。
**********************************
私の感想
(1)ビッグデータのなかには、例えば「年齢」など、データが一部欠損しているデータがあり、それは分析に使えないのでゴミデータと呼ばれる。 しかし、欠損していない他のテータから、欠損部分を推測できるようにしたら、ゴミデータは使用できる価値あるデータとなる。
例えば、年齢のデータが欠損していたが、購入商品や来店時間のデータがあれば、年齢を推測できるような算式があるんだろうね。
→というところが、技術的なちょっとしたところだったけれども、興味深かった。
(2)データサイエンティストという仕事が重宝される、ということを考えてみる。
昔の人は、空や昆虫や動植物などを観察して、天気を推測していたけれども、 今では、人工衛星などからのデータを分析した天気予報がほとんどすべてになっているよね。
どっちが良くて、どっちが悪いという問題ではないけれども、「リアル自然」から離れていったように、数字やデータを信頼しすぎると「リアル客、リアル現場」から、どんどん離れていくような気もする。 何事もほどほどが一番か。