先程、めざましTVで、「渋谷で30分間観察したら、マフラーをしている人が43名でした。」とレポートがありました。
私は、「だから何?」と思いました。
何人中、43名と言う情報が無ければ、何の意味もありません。
分かるのは、観測地点をマフラーをしている人が、43名通ったというデータです。
ここに、100名中、43名となると、結構寒いと言うのが分かります。
4割の人が、寒いと感じてマフラーをしていますという情報になります。
5000名中、43名でしたら、どう思いますか?
寒がりの人がいますぐらいの情報です。
まあ、良くくみ取って、マフラーするぐらい寒くなったと言う情報ですかね。
冬でも半袖の人がいますが、その程度の情報になります。
こういう時のサンプリング方法は、ある時点で、カウント人数を20名と決めて、そのうち、マフラーをしている人数を指折りで数える方法です。
サンプリング手法と言われ、意外と実態を表します。
そうしたら、有効な情報になったと考えます。
統計学を知らないと、そんな人数(20名)では意味ないと言いますが、そんなことはありません。
よくメディアが行っている世論調査は、2,000名前後です。
人口1億2千7百万人に対して、2,000名前後です。
この調査の時、大事なのは、無作為であることです。
通行人を、20名としたときに通る人は、無作為となります。
ここに、可愛い女子とか、お洒落な女子のみとすると、意味をなしません。
メディアの人も、統計の基本を学んで欲しいと感じました。
43名、マフラーをしていましたは、データであって、情報ではありません。
情報とは、データをフィルトレーションしたものです。
100名の通行人という標本数のデータがあって、そのうち、約4割の人がマフラーをするぐらい寒いが、情報になります。
追記:
11月1日に、統計を利用した日経新聞の夕刊記事がありました。
タイトルは、「なぜか眠気を誘う京阪特急ZZZZ・・・」
始発駅の淀屋橋から終点の出町柳まで調査している。
最後尾の車両で調査:
京橋から枚方駅までは、27人中7人(26%)が寝ていた。
終点では、14人中6人(43%)と分析していた。
並行して走る阪急特急では、平均21%。JR新快速では、平均25%。
休日も調査:京阪23%、阪急16%、JR22%でした。
特に、%では差がないとして、眠くなる原因が他にあるのではと、仮説して検証。
レール長さと知らべて見たら、どこもロングレールの200mで差は無し。
どうやら、カーブではという内容でした。
それと、眠くなるふかふかの座席。
こうやって、統計を組み入れながら書かれた記事は、読みごたえがありました。
この記事を書かれたのは、女性記者。
夫々の路線を1往復、平日と休日で調査しているので、少なくとも6往復していると考えます。
片道平均47㎞を、6回なので、乗車距離は、282㎞です。
何度も特急に乗ったのを考えると、お疲れ様と慰めたい気持ちになりました。
追記:
11月8日、同じ番組で、このブログを反映した放送がありました。
30分(?)計測し、約100名の通行人の内、マフラーやコートを着た人が43名と、レポートしていました。
今朝の気温の寒さが伝わりました。
Good Job.