象が転んだ

たかがブロク、されどブロク

数字と統計は平気でウソを付く〜エビデンスやリテラシーという言葉に騙されない為に

2024年09月03日 08時38分24秒 | 数学のお話

 一時、大衆の間でもワイドショーを賑わす専門家被れが過ぎたせいか、リテラシーエビデンスというウケのいい言葉が大いに流行った。更に、この2つの言葉を知らないと、SNSではバカにされるかの様な錯覚に陥ったもんだ。
 まず、エビデンスとは元々医療用語で根拠との意味があったそうだが、今では、証拠や根拠や裏付けの意味で、SNS上を独り歩きする陰謀説やデマを検証する時に大きな武器となる。
 一方で、リテラシーだが、元は読み書きや識字能力を意味する言葉で、今ではSNS上を錯綜するあらゆる情報や知識を収集し、有効活用する能力との意味で使われる。
 結局は両者ともSNSが広めた英語ではあるが、エビデンスはやけに抽象的で曖昧でもあり、リテラシーは個人差が極端である。言い換えれば、この2つの言葉は殆どアテにならないし、平気で嘘をつく。

 愛媛大学のHPにも、「統計学とウソ」について丁寧な説明が成されている。
 エビデンスに基づく思考スタイルは、日本でも定着しつつあるが、このエビデンスを支えるには、数字やデータそれに統計が使われる。特に統計学はエビデンスに基づいて発展してきた学問である。
 一方で、統計には厄介な側面がある。半世紀以上前の事だが、ダレル・ハフ(米)という統計学者は「統計でウソをつく法」という本を出版し、マーク・トウェインは英国首相の言葉を引用し、”世の中には3種類のウソがある。それは嘘・真っ赤な嘘・統計だ”と統計学を皮肉った。
 因みに、第二次世界大戦後、当時の総理大臣だった吉田茂は、GHQの最高司令官マッカーサーに日本の統計のデタラメを酷く責められた。それに対し、吉田は”わが国の統計が完備であったら、あんな無謀な戦争はやらなかったし、やれば戦争に勝ってたかもしれない”と言い返した事はよく知られている。
 21世紀の今でも、統計はウソやデタラメに埋もれ、統計は肝心な所を捉えてない事もよくある。つまり、エビデンスの確証も必要で、正確なエビデンスに基づいて物事を判断するのは、人が思う程に容易ではない。


統計の数字はウソを付く

 前述したダレル・ハフ著の「統計でウソをつく法」(1968)だが、世の中には統計や数字が氾濫し、明らかに怪しいデータも大衆は信じてしまう。更に、”数字とデータは嘘をつかない”と本気で信じてるから、なお厄介である。
 統計数字とは聞こえはいいが、見た目以上の価値があるかも知れないし、見かけほど価値がないのかも知れない。数学も同じで、難しいだけで無機質な学問に過ぎないのかも知れない。もっと言えば、キチガイだけが好む”乞食の学問”かも知れない。
 事実、統計数学で使われるエビデンス(根拠や証拠)がデタラメで捏造されたものならば、統計も数字も平気で嘘を付く。
 そこで登場するのが”統計リテラシー”という言葉で、統計の有用性を理解し、統計データを活用する能力の事である。
 つまり、統計リテラシーが不足してる人は陰謀論やデマに騙され易く、統計や数字を片っ端から信じてアホを見る。言い換えれば、無学と無知はそのまま自分に跳ね返るのだ。

 一方で、これに似た言葉に”データリテラシー”というのがある。
 これは”データを適切に使う能力”の事で、データを”読む力”と”分析する力”と”伝える力”の3つの要素からなるが、データリテラシーは特別に難しい知識ではなく、日常生活の中で身につける事の出来る知識である。似た言葉に”データサイエンス”があるが、これには、より高度な分析をする為の専門的な統計知識やプログラミング知識が必要で、これこそが統計に騙されない知識と言える。

 ここまでくれば私が何を言いたいのか?は勘のいい人なら理解できるかもだが、これこそが”数字リテラシー”の登場である。つまり、数字の裏側やカラクリを知り、数字を正しく理解する能力の事である。
 事実「数字の嘘を見抜く本」(田口勇著)では、社会や健康やお金、暮らしや自然にまつわる数字のウソを丁寧に解説してくれる。つまり、数学には高度なトリック(定義や定理)がある様に、メディアやマスコミで紹介される統計の数字にもトリック(デタラメや嘘)がある。

 例えば、地球上の全人類80億が住む為に必要な土地は中国国土の1/3程で、火星移住は必要ない。”一日に必要な野菜350g”とは、日本人が平均して摂る野菜292gに対し、国の職員が勝手に決めただけの数字で、350gの野菜ジュースには350gの野菜の1/5程度の栄養しかない。
 街角調査では10人の場合には20%、100人では4%、1000人になれば2%の誤差となる。首相の支持率調査で51%と出ても、支持率が過半数を超えるかは誤差の範囲内に過ぎない。また、株価が50%上がり50%下がれば(±0ではなく)トータルで25%下がった事になる。
 保険金1000万円とは、死亡率が1%の時に100人から30万ずつ集め、1人が死亡して1000万を払ったとして、保険会社には2000万余る。故に、保険料はもっと下げられる筈だ。 
 自然動物の生息数は”標識再捕獲法”のトリックを使う。まず、最初に捕まえた熊M匹にマークをして自然に帰し、後日もう一度C匹捕まえ、その中にマークのついた熊がR匹いたとすると、NR=MCの公式から生息数Nが簡単に求まる。

 この様に、統計には数字のトリックを使うが故に、そのトリック(仕掛け)を見抜く必要がある。勿論、数字のトリックを見抜くには、数学の裏側や本質を知り、数学を様々な方向から正しく理解する能力も必要となる。
 つまり、統計に騙されるか否かは、アナタ次第なのである。言い換えれば、統計の数字を使って大衆を騙そうとする事は、大衆の上にのし上がる為の高等な戦術の1つでもあるからだ。


批判は創造の母である

 「統計はこうして嘘を付く」(ジョエルベスト著)は更に突っ込んで、統計と数字の嘘を考察する。
 本書は、批判精神を持つ事の大切さを数字を暴く事で、統計の嘘を証明している。
 つまり、権力者が庶民を利用しようとする時、必ずと言っていい程に、数字を使って信憑性を証明する事で大衆を味方につけようとするが、その数字の出処が問題となる。
 勿論、庶民の知恵が権力者の嘘を見抜いてれば何ら問題はないのだが、故に、大衆がバカだと権力者はやり放題なのである。故に、”批判は権力を撲滅する母”でもある。

 著者は”全ての統計は社会的活動の産物であり、権力者の主張に説得力を持たせる為に用いられてる”と説く。その上で、標本の抽出方法や計測方法などの中に、統計結果(数字)の有効性が損なわれる事を例を挙げて説明する。  
 例えば、米国で銃により殺される子供の数は”1950年以降年ごとに倍増する”とあるが、これが正解なら、1983年には86億人の子供が銃で殺される計算になる。勿論、あり得ない事だが、統計の数字を鵜呑みにすると、バカを見る単純なケースではある。

 当然の事だが、銃規制論者は銃で殺される人の数を、銃規制反対者は銃で身を守った人の数を提示する。つまり、数字は嘘をつかなくても、数字で嘘をつく者はいる。だが、数字が嘘をつこうがつかまいが、結局は統計の数字は権力に使われる。
 つまり、統計は何故どの様にどんな過程で作られたかが重要となるが、著者は①当て推量②定義の調整③計測方法④偏った標本抽出という4つの要素に分けて考えた。
 ①は、大衆の関心を惹こうとして、あえて大きな数字を持ち出す。②は、広い定義を用い、問題の規模を大きく見せる。③は、望み通りの回答をする言い回しで質問をする。④は、標本が小さく偏ると母集団を正確に反映できない。
 つまり、統計の数字は簡単に弄くられ、平気で歪曲でき、極端に飛躍する。これを”突然変異統計”と呼ぶが、例えば”米国のカトリックの司祭の6%が未成年者に性的関心を抱いた事がある”との推定がある。この推定値は性の悩みを抱えた聖職者の治療にあたった心理学者の知識に基づく推量にすぎなかった。
 これをそのまま受け売りした論者たちは”司祭の6%が小児性愛者だ”と論じたのだ。つまり、上の4つの過程を経て、当て推量は既成事実に変形してしまったのだ。


最後に

 当然の事だが、統計には作る側がいて、何らかの意図や目的があって作られる。故に、統計を自分の主張したい数値に調整する事は幾らでも出来る。
 ”XX大学の研究データによれば・・”なんて言われれば、大衆の多くは信用する。事実、コロナ渦もウクライナ戦争も台風の進路予想も専門家の数字は大きく外れてしまった。
 統計は、作る過程でウソが交じる事が多々ある。勿論、ウソを混ぜる事で説得力を増す事もある。更に、誰が作るかでも大きく変わってくる。逆に正しいデータでも、数理モデルが異なれば統計の値も大きく異なる。

 堅い言い方をすれば、統計は社会問題と社会をめぐる政治闘争の武器となる。更に、社会についての統計情報は、政府が賢明な政策を立案する上で非常に重要な要素になった。
 情報の数値化により、拡散する情報のバラツキや曖昧さをなくし、多くの情報を数値化する事でその精度を高める事が出来る。やがて、社会研究は抽象的な理論的側面が小さくなり、絶対的な定量的側面が大きくなっていく。
 つまり、統計の数字は権力者にとっては非常に都合のいい武器だが、大衆にとっては厄介なものである。

 大衆の知恵を進化させる筈の統計が、権力者にいい様に弄くられる。
 従って、我ら大衆は統計の数字に踊らされる事なく、その中に潜むウソを探り出し、信頼できる数字を抽出する必要がある。
 勿論、簡単に出来る事じゃないが、少なくとも巷に氾濫する統計の数字に関して、批判的な目を持つ事は大切であろう。 


補足〜日本警察の殺人事件の検挙率

 ドラマ「美食探偵」Ep1の終りでは、小池栄子演じる殺人犯が”日本の警察は解決しやすい殺人だけを事件にして、高い検挙率をでっち上げてるだけよ。殺人で捕まるのは現行犯かよほどのヘマか・・”と殺人慣れしない若い子を説得するシーンがある。
 ”日本では1年間に17万の死体が見つかるわ。そのうち犯罪と疑われるのが2万千ほど、生死のわからない行方不明者は8千人。その中で犯人が捕まったのは900名弱。つまり、警察が犯人を捕まえる確率は(900/(21000+8000)で)実質3%ほどだわ・・”と諭す。
 但し、この数字には生死不明の8千人を含む合計28000人の死を全て殺人事件(殺害)と見た極端な場合で、警察が認知殺人とみなす数は年間1000件弱に過ぎない。更に(以下でも述べるが)、17万の死体のうち約半分が警察に届け出もされない行方不明者で、100%近い検挙率という(自身に都合のいい)統計上の数字が、如何に不十分で曖昧なのかが推測できる。勿論、3%という数字もドラマ上として大袈裟過ぎる。

 そこで、(Yahoo知恵袋でも紹介されてた)警察の資料を元に考察すると、ここ5年(2013〜18年)でみれば、殺人の認知件数は4717件で検挙件数は4665件となり、検挙率は98.9%。つまり、殆どの殺人犯は捕まり、日本の警察は”世界一優秀だ”となる。
 但し、上述の年間17万の死体が示す様に、認知されていない殺人件数は腐る程ある。因みに、認知されてないとは、遺体が見つからない行方不明扱いか?又はこっそりと自宅の庭や山奥に埋め、生きてる事にしてるものだ。

 そこで、日本の年間の行方不明者数だが、2018年は届け出された行方不明者数87962人のうち、所在確認数は84753人(死亡確認含む)。つまり、届け出が受理されたものだけでも、3000人程は所在が掴めないままだ。
 例えば、年間の殺人認知件数を1000件弱とすると、上の3000人を合わせ、最大で4000件程の殺人が起ったとの極端の仮説では、検挙率が25%ほどに急落する。
 が実際には、年間に2000人弱の認知症不明者がいるから、それら全てを差し引いてたとしても検挙率は50%程で、少なく見積もっても75%程が常識的な線ではないだろうか。

 一方で、1984〜86年のデータだが、殺人事件の検挙率は日本が96.4%とトップで、西ドイツ93.9%、フランス89.4%、英国76.7%、アメリカ70.2%と続く。が、殺人事件の発生率は、米8.6、西独4.5、仏4.4、英4.3に対し日本は1.4となる。つまり、日本は単に犯罪が少ないが故の検挙率の高さとなる。

 従って、統計上の数字は様々な要素を加味して理解する必要がある。日本の警察の検挙率が高いのは、犯罪発生率と犯罪の多様性が低い事との相関関係にあり、日本の警察が優秀だという結論は独立して考える必要がある。
 確かに、日本国内の殺人だけでこれだけのバラツキと誤差がある。これが国家単位での戦争となれば、被害者数の統計上の誤差はもっと膨らむだろう。 
 つまり、統計の数字は平気で嘘を付く。いや、統計が嘘を付くのではなく、数字を鵜呑みにする我ら大衆が統計の仕組みを見抜けないだけの事である。

 日本の農耕島民よ、統計に数字にもっと強くなろうじゃないか。

 


2 コメント

コメント日が  古い順  |   新しい順
死者と統計 (UNICORN)
2024-09-04 09:56:19
人間の死には、病死・事故死・殺害(殺人)・自殺それに自然死(老衰)があるけど
2022年の統計によれば、その内60%近くが病死で、事故・老衰・自殺は合わせて16%ほど。
その他とされる原因不明の死が26%ほどとされてます。
死者の総数が年間約157万人だから、40.8万人が原因不明の死となる。その内17万の死体が見つかるのだから、原因不明の死の42.5%が死体として見つかる計算になる。
更に、見つかった死体の内、事件性と見られるのが生死不明も含め約3万ほど
すなわち、原因不明の死の7%程が事件性と疑われる。そのうち明確な殺人事件とみなされる認知殺人は900件ほどだから、原因不明の40.8万人の死の更に2.2%程が殺人事件として扱われ、その殆どで殺人犯が逮捕される。

こうしてみると、数字の扱い方一つで、統計がはじき出す数字が大きく変わる。
まさに、統計と数字の取り扱いには注意ということになる。
返信する
UNICORNさん (象が転んだ)
2024-09-04 13:07:01
言い換えれば
数学をよりよく理解する事で、統計が弾き出す数字を正確に判断できる訳ですが
数字を理解する為には数学を理解し、数学を理解するにはその本質を理解する必要があります。
勿論とても難しい事ですが、我ら人類はそういう事から逃げられなくなってきた時代にいると思います。
つまり、安全も平和も人類の存続もタダでは手にはいらない時代になったんでしょうかね。
いつもコメント有り難うです。
返信する

コメントを投稿