「数字をどう読むか、どう見せるか」という点においては、統計学の基本的な知識は不可欠です。
本書では、母集団の特性を表す代表値として「平均値」を用いることの適否や、「相関」と「因果関係」との違いといった初歩的な統計的思考の例が豊富に紹介されています。
たとえば、「太った人ほど年収が高い!」という仮説。実際、肥満度と年収のデータを収集してその分布をみてみると一見「正の相関」があるようです。
(p130より引用) BMIと年収との間に何か関係があるように思えます。しかし、・・・これは見かけだけの可能性があります。
この例では、
(a) 年齢が上がると、BMIが徐々に大きくなる
(b) 年齢が上がると、年収が上がる傾向がある
というように、年齢という、ここには書かれていない変数が、BMIと年収の双方を増やす点が考慮されていませんでした。
このような例は、他にもたくさんあります。
たとえば、血圧と年収の関係を調べたら、おそらく「血圧が高いほど年収が上がる」という傾向が見られることでしょう。
これは、表面に現れる変数の裏に、真の因果関係のある要素が隠れているという好例です。この場合、「同じ年齢」の標本をとってBMIと年収の相関をみなくては、短絡的に「太った人ほど年収が高い!」と言えるかどうか分らないということになります。
ちなみに私の場合は超初心者なので、統計というとまず頭に浮かぶのは「正規分布」のベル型のグラフです。この正規分布を基本にした統計分析はもちろん実用性の高いものですが、もうひとつ、「ポアソン分布」も実社会の現象を説明するには有効なようです。
(p165より引用) 「独立な(互いに無関係に起きる)事件や事故などが、決まった期間に何回起きたか」を記録すると、ポアソン分布というものが現れます。
このポアソン分布では、一つの事象が起きてから再び同様の事象が起きるまでの期間は指数分布になることから、「互いに無関係な事象は連続して起きやすい」という特性が発現するとのこと、このあたり、素人的には「へぇー」という感じですね。
(p170より引用) ポアソン分布の理論が示唆するのは、「関係がなくても連続する傾向がある」ということだけです。言い換えれば、「連続した現象同士が本当に関係しているかどうかを知るためには、別の情報が必要だ」ということを示唆しているのです。
そして、これも重要なことですが、ポアソン分布から外れている場合は、現象の独立性が疑わしいということになります。
さて、最後に本書を読んで思ったこと、それは、統計学的な思考はまさに「リスク管理」を議論するには必要不可欠だとの再認識でした。
先のポアソン分布から導き出される稀少事象生起の特質や、「極値分析」による最悪リスクのレベル想定等は、危機に対する準備にはとても重要な情報となります。また、他方、統計的思考を身につけることによって、因果関係として根拠のない風評にも惑わされない冷静な対応もとることができるようになります。
今回の大震災・福島原発事故を鑑みるに、津波の想定規模や放射能汚染の影響度等の判断の適否、また、各種発表数字・報道内容への反応等については、事実や理論の裏づけのない情緒的行動がそこここに見られました。省みるべき点が数多くありますね。
ウソを見破る統計学 (ブルーバックス) 価格:¥ 945(税込) 発売日:2011-04-21 |
↓の評価ボタンを押してランキングをチェック!
TREviewブログランキング
※コメント投稿者のブログIDはブログ作成者のみに通知されます