統計に纏わるどうでもいい話
一口に「統計」といっても2つの意味合いがあります。
一つは政府が公開しているような「統計値」、そしてもう一つが研究に使われる「統計値を求めるために用いられる手法」です。
どちらの統計のことを言っているのかは場面場面で聞き分け、言い分けないといけません。
そもそも統計学はどのように始まってどのように発展してきたのか?
これについては総務省のホームページに簡単に紹介されています。
まずは軍事的な必要性から始まり、国勢を把握するために使われ、その後、数学者達によっていろいろな現象を数学的に示そうと試行錯誤が続いて今に至るという流れのようです。
つまり状況、状態を意味する「Status」に算数・数学の「Arithmetic」「Mathematic」の「tic」をくっついて少し変化させれば「Statistic」となるので、歴史を知っていると頷けます。
では日本に「Statistic」学が導入された時にどのような理由で「統計」をいう文字があてはめられたのか?
これも総務省のホームページで紹介されています。
「スタチスチク」を漢字で表そうとして斬新な漢字も提案されたようで、この造字は笑えました。
まあ結局は「統計」と呼ばれるようになったわけですが、冒頭に記した「統計値」が「Status」で「統」、「統計値を求めるために用いられる手法」が「~tics」で「計」だと考えればいいでしょう。
統計学には
「統計学的な指標は実際に起きている現象を要約するための不完全な数学的指標にすぎない」
「統計学は因果関係を証明する証拠品としては使ってはいけない」
という大原則があり、統計学的な指標だけに基づいて実際に起きている現象をこれこれだと決めつけるのは本末転倒です。
にもかかわらず、この大原則について触れられている情報はほぼありません。
基本中の基本過ぎてアタリマエなので触れないのか?それとも触れたくないのか?
両方があるのだと思います。
触れたくない人の心境に分け入ってみましょう。
まずこの原則が広く知れ渡ると、
「そんな不完全なものだったら勉強する意味ないじゃん」
っと、統計学を学ぶ学生のモチベーションが下がってしまいます。
だから統計学を教えている先生方は生徒の興味とモチベーションを維持しないと仕事がなくなりますので、この大原則は伏せておきたいはずです。
また、世の中には統計を都合よく使うことで嘘を通したい人、人をだましたい人も多く、このような人々にとっては統計は確固たる根拠として存在してもらわなければ都合が悪いのです。
まあそんなところでしょう。
そんなこんなで世の中の99%の人は統計を誤解しているわけで、残る1%のまじめな統計学者たちはこれを少しでも是正しなければならいと考えて2016年のASA声明となりました。
では、どうして統計の勉強をするべきなのか?。
その理由は
①悪用された統計に騙されないために統計を知っておく必要がある。
②科学者は統計の誤用によって無意識のうちに人を騙すことになってしまわないように統計を正しく理解して正しく使えるようになっておかなければならない。
の2つに尽きるでしょう。
③統計学を教える先生が失業しないように。
も理由に含めてもいいのですが、これには心と銀行口座の残額に余裕がある人限定です。
ここまでは、私たちが一般的に見聞きする「統計」の話でした。
統計にはまた別の流れの「統計」があります。「ベイズ統計」です。
実はベイズ統計の歴史も古く、18世紀には普通にデータ解析に用いられていたそうです。
しかし何故かベイズ統計は表舞台で使われることはなくなってしまいました。
っで、なんで今さらにベイズ統計学なのかというと、実はベイズ統計を用いた予測は非常によく当たるとのことです。
ベイズ統計は、戦時中には暗号解読機に組み込まれていたということも今では有名な話です。この暗号解読機こそが、洋画「エニグマ」の中でベネディクト・カンバーバッチ演じるアラン・チューリングが駆使していた電算機です。
ベイズ統計は現代においては、私たちの意識していないところで大活躍しており、迷惑メールの降り分けやAIもベイズの定理に従って動いているとのことです。
ベイズ統計は先に記した2016年のASA声明の中でもP値に代わるアプローチの一つとして推奨されています。
こんなに大活躍する学問がなんでこれまで影を潜めていたのか?不思議ですね。
ベイズ統計には事前確立というパラメータがあり、これが科学者の主観によって設定されるというところがミソなのですが、それが逆に「主観確率を扱うのは科学的でない」として権威ある統計学者から弾圧を受けたと何かで読んだ記憶があります。
それでもベイズ統計の方が良く当たるので科学者たちはまずベイズ統計を用いて研究を行い、論文では一般的な統計手法を用いたように書いていたとの伝聞もあるそうです。
つまりみんなベイズ統計を使ってはいたが権威ある統計学者からの弾圧を受けたくないので表に出さなかっただけということのようです。
これは“開発には品質工学を使うが、説明には統計を用いる。”という現代のスタイルにも通じている気がします。
結局のところ、科学の発展は科学者のセンスある主観に委ねられてきたということにほかならず、センスある科学者の主観を排除した統計学は、科学でも証拠でもなく客観的な目安に過ぎないということでしょう。
ちなみに私はベイジアンでもQE教徒でもなく、いまだに統計学を学び続けているフィッシャーマンであり、統計学を否定しているわけではありませんのであしからず。
※コメント投稿者のブログIDはブログ作成者のみに通知されます