goo blog サービス終了のお知らせ 

つまがリズム

きままな、ひとりごと

数字のからくり、データの真実 (3)

2013年07月04日 | 日記・エッセイ・コラム

平成25年7月4日(木)

昨日のNHK、クローズアップ現代は『数字のからくり、データの真実』というテーマだった。

**********************************

私の感想

(1)ビッグデータのなかには、例えば「年齢」など、データが一部欠損しているデータがあり、それは分析に使えないのでゴミデータと呼ばれる。 しかし、欠損していない他のテータから、欠損部分を推測できるようにしたら、ゴミデータは使用できる価値あるデータとなる。
例えば、年齢のデータが欠損していたが、購入商品や来店時間のデータがあれば、年齢を推測できるような算式があるんだろうね。

→というところが、技術的なちょっとしたところだったけれども、興味深かった。

(2)データサイエンティストという仕事が重宝される、ということを考えてみる。
昔の人は、空や昆虫や動植物などを観察して、天気を推測していたけれども、 今では、人工衛星などからのデータを分析した天気予報がほとんどすべてになっているよね。

どっちが良くて、どっちが悪いという問題ではないけれども、「リアル自然」から離れていったように、数字やデータを信頼しすぎると「リアル客、リアル現場」から、どんどん離れていくような気もする。 何事もほどほどが一番か。


数字のからくり、データの真実 (2)

2013年07月04日 | 日記・エッセイ・コラム

平成25年7月4日(木)

昨日のNHK、クローズアップ現代は『数字のからくり、データの真実』というテーマだった。

**********************************

番組の後半は、21世紀の最もセクシーな職業と言われている(らしい)データサイエンティストの工藤卓哉さんが取り上げられていた。

近年、会社は最小のコストで最大の利益を出す事が求められている。また、消費者のニーズも多様化している。

そこで、会社が例えばダイレクトメールを送るケースを考えてみると、以前は同じ内容のものを大量に送っていたが、今では見込み客に、その人に合った内容のものを送るように変わってきている。

このような複雑なことを可能にするのが「ビッグデータの解析」である。 以前は、「勘と経験」でやってきたけどね。

解析でどのようなことができるかというと、
◎街ゆく人の移動のデータから、店の出店場所を決める。
◎天気、オリンピックのスケジュール、曜日など100ものデータを考慮した算式で、広告をだすタイミングを決定する。
◎職業訓練を終えた人のその後の就職状況データなどから、Aさんにどのような訓練が必要かを決定する(現在は訓練を受けた人のアンケートが頼り)。
などが紹介されていた。


数字のからくり、データの真実 (1)

2013年07月04日 | 日記・エッセイ・コラム

平成25年7月4日(木)

昨日のNHK、クローズアップ現代は『数字のからくり、データの真実』というテーマだった。

**********************************

「これを食べた日本人の95%は心筋梗塞になっている。この食物は禁止すべきか」 と尋ねられたら、どう応えるだろうか。

答えは「米」。 
数字が出てくると、何となく惑わされて判断が鈍ることがある。

この質問のようにあからさまではなくても、データの大きさ、誤差、中心値、平均値などをうまく使って作成されたアンケート結果や表やグラフを、私たちは正しく読み取ることが必要ではないだろうか。