Kindle版にて読了。
「統計」というと「データを解析して現状を把握する」営み、というイメージがありますが、著者に言わせればデータ解析は「具体的な行動に繋がる」ものでないと意味がない。
例えば、ビジネスにわざわざ統計解析という手段を用いるのであれば、少なくとも以下の「3つの問い」に対して答えることができるものでなければならない、と言います。
【問1】何かの要因が変化すれば利益は向上するのか?
【問2】そうした変化を起こすような行動は実際に可能なのか?
【問3】変化を起こす行動が可能だとしてそのコストは利益を上回るのか?
逆に言えば、こうした問いに回答をもたらすことができる強力なツールとなり得るからこそ、統計学が「最強」だと言っているわけです。
「どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができる」から「最強」なのだと。
経験や想像に基づいて仮説を立てて喧々諤々議論するよりも、さっさとA/Bテストをやってみるほうがずっと早いし正しい答えを得ることができる。
ところが、著者が「日本全体での統計リテラシー不足」を嘆くように、現実社会で統計学的な考え方が理解されることはなかなかに難しい。
人はどうしても己の経験に基づく感覚論を優先しがち。
先日も、WBCの壮行試合の中継をテレビで視ていたら、解説の桑田真澄氏が「調子のよいバッターだと(振ったかどうか)微妙なスイングをしてもストライクが取られないものなんですよね」などとコメントしていた。
桑田氏のような聡明な人物をしてもこうなんですよね。
このコメントに統計的な根拠は間違いなく無いだろうし、統計解析されればおそらく反証される可能性は高いと思う。
或いは、先日このブログにも書き、本著の中でも触れられている「
平均への回帰」も同様。
昨今流行りのビッグデータへの信仰も然り。
情報技術とハードウェア性能の向上により、膨大な全数データをコンピュータで解析して何がしかの答えを得ようというのがビッグデータの志向ですが、統計的な手法を用いればビッグデータを扱うような高価なハードに莫大な投資をせずとも殆ど精度の変わらない答えを得ることができると言います。
莫大なデータを高速で処理すること自体に意味があるのではなく、解析結果からどれだけの価値を得られるかということこそ本質であるはずだ、と。
回帰分析など統計学の理論については一通り簡単に紹介されています。
これ一冊読んだからといって統計解析の手法を使いこなせるようになるわけではありませんが、考え方は理解できるので、専門書の図表にてよく「*」で表現されている「統計的に有意」の意味は分かるようになるし、単に感覚だけで書かれている与太話を見抜くことはできるようになるでしょう。
著者は1981年生まれで東大医学部出身、大学では生物統計学を専攻して医者ではなく統計家になった、という経歴の持ち主のようです。
読んでいて凄く頭のいい人なんだろうな、というのは伝わってきました。