象が転んだ

たかがブロク、されどブロク

数学は偶然の上に卵を生む(その3)〜ガリレオからパスカルへ、期待値は成功をも見通す?

2025年03月08日 18時19分00秒 | 数学のお話

 前々回「その1」では、「ドランカーズ・ウォーク~日常に潜む”偶然”を科学する」の第1章”ランダムネスという不思議な世界―ベストセラーは<たまたま>生まれる?”の中のR・マリスの本塁打記録だけを簡単に述べたが、少し補足すると、本塁打を打つ確率は打席数が増える程にランダムな要素が平均化され、その平均から度々ズレる事がある。
 こうしたスレの頻度や大きさをランダムさの数理モデルで検証すれば、1961年のマリスがルースの記録に並ぶか破るのは、32シーズンに1度となる。更に、期間をルースの時代からステロイドの時代までの70年間に広げ、才能や実績がマリスに匹敵する選手は3シーズンに1人の割合で存在する。更に、それら全てを加えれば、それらの選手の内の1人が偶然だけでルースの記録に並ぶか破る確率は、何と50%を少し上回る計算になる。
 これは、”並外れた記録に並外れた才能は要らない”事を教えてくれる。つまり、”中よりも少し上”の才能でも歴史的偉業を偶然だけで残せる事を意味する。
 しかし我々は、こうした”幸運な”人を神の様に崇めたりする。直感とは何と愚かなものだろう。


前回までのおさらい

 この事は、出版社はベストセラーを見抜けないし、ハリウッド作品のヒットも全ては運次第である事をも証明している。
 例えば、ハリーポッターの原稿は最初の出版社9社にはねられたし、26や27社にはねられたベストセラーも数多くある。事実、今では伝説となった多くの(いや全ての)ベストセラーが繰り返しハネられ続けていた。
 これは、この様な成功者らが決して諦めない気概を持つ集団である事を意味している。勿論、その陰で途中で挫折し、諦めてしまった無数の傑作が埋もれてる事を我々は忘れてはならない。
 一方、ハリウッドも同様で、元某映画会社のCEOは”作品がヒットする確率はコイン投げと同じ程だろう”と回顧する。例えば、若きルーカス監督の「スターウォーズ」も20世紀FOXの評価は僅か20万ドルに過ぎなかったが、4億ドル半ばを稼ぎ出し、ハリウッドの帝王に君臨した。
 ここで著者はスターウォーズを例にとり、この同じ映画にAとBというタイトルを付加して公開し、互いを競争させた時、どちらが人気を博すか?を2万人のファンを想定して実験した。先ずは、コイン投げの確率に従えば、どちらも半々に近いだろう。だが、ランダムさを数理モデル上で計算すれば、一方の映画がリードする蓋然性は半々の場合よりも88倍も高くなる。つまり、全ての映画が同じだとしても大ヒットする映画が幾つか生まれる事を意味する。

 こうした現象は、パラマウント社のS・ランシングの悲劇をもたらした。彼女は「フォレストガンプ」や「ブレイブハート」や「タイタニック」でオスカーを独占し、年間最高興行収入を2度も記録した。が、その後の市場のシェアは11.4→10.6→11.3→7.4→7.1→6.7%と伸び悩み、”もはやツキは堕ちた”として、7年間の華々しい成功劇も虚しく、彼女は一夜にしてクビになった。しかし、皮肉な事にその翌年、彼女が手掛けていた作品群が大ヒットし、シェアを復活させたのだ。
 一方、コロンビア映画のM・キャントン会長は最初の数年間で期待外れの興行だった為に、後に大ヒットとなる6作を遺し、会社を去った。ハリウッドに蔓延るこうした誤解は世の至る所でも見て取れる。

 これはランダムさの1つの特徴である”平均回帰の錯覚”と言えるが、能力と成功と偶然を混同したケースである。因みに、”平均回帰”とは、結果に浮き沈みがあろうと最終的には偶然誤差はゼロになり、結果の平均はその人の能力に従う事をいう。
 例えば、子供の躾に関する”賞罰効果”では、一般的に賞の方が罰よりも改善が期待できる事が報告されている。要するに、直感や結果だけで人を判断すべきではないのだ。
 こうしたランダムさの不可思議な世界に行き着くまでには何世紀もの時間を要したが、自然の中にも日常の中にもランダムネスが隠れ、科学者らはその道理を理解する様になった。一方で、我々が直感で物事を見ようとすると乱打草の壁に阻まれ、大きな誤解を生む事例を幾つか紹介した。
 本書の第2章”それっぽい話に潜む危険性”以降では、ランダムネスの本質と概念を歴史的文脈で考え、その関連性を著者は述べている。

 
幸運と偶然の一致

 前回「その2」で述べた「ガリレオの原理」は”ある事象の確率はその起き方が何通りあるかの数に依存する”とも言えるが、その原理自体よりも、そのランダムさの作用が如何に大きく、その計算が如何に大変かを教えてくれる。
 例えば、25人の小学生に”ホントかウソか”の問題を10題出した時、ある1人の子供が全問正解するケースが1通り、1問不正解が10通りある。つまり、生徒全員が当てずっぽで回答してる場合、100点の生徒1人に対し、90点の生徒は10人、80点の生徒は45人となる。従って、単純計算だが”少なくとも”1人の生徒が80点以上を取る確率は、1/100+10/90+45/80=約75%にも達する。
 但し、正確に言えば、全ての解答のパターンは2¹⁰通りあり、80点以上のパターンの確率は56/1024=5.5%となり、25人のクラスで80点以上をとる生徒は、僅かに5.5%×25=1.35人となる。つまり、全く何の勉強もせずに解答しても、25人のクラスに1人か2人は80点以上はとれる事になる。それでもアナタは勉強をするのか?

 これに似た様な問題で、「誕生日のパラドクス」というのがある。”何人集まれば、その中に同じ誕生日が2人以上いる確率が50%を超えるか?”との問題だが、50%を超えるに必要な人数は僅かに23人である。
 直感で見れば、”僅か23人で?”ってなりそうだが、23人が同じ誕生日である確率は、背理法を使って23人の誕生日が全て違う確率を求めると、意外な確率が顕になる。
 1人はともかく、2人の誕生日が異なる確率は、1人の誕生日を差し引いた(365−1)/365で、3人も同様に、(365−2)/365を掛け合わせ、3人の誕生日が異なる確率は、(364/365)×(363/365)となる。以下同様に、k人の誕生日が全て異なる確率P(k)は、P(k)=(364/365)×(363/365)×(362/365)×・・・×((365−k+1)/365)。
 従って、23人の誕生日が全て異なる確率は、P(23)=0.492703で、2人以上の誕生日が同じ確率は、1−P(23)=0.507297となる。

 実際に、これと似た様な事件が起きていた。
 数年前に、カナダの宝くじでは500台の自動車をボーナス賞にした所、240万人の応募者が殺到した。職員は公平を期す為に、500個の番号をランダムに選ぶコンピュータ・プログラムを組んだが、”車が2台当った”という人が現れたのだ。
 果たして、プログラムに欠陥があったのか?それとも”たまたま”だったのか?
 「誕生日問題」からすれば、23人と240万人との違いはあるものの、半々でなくともその確率は存在した筈だし、240万人が同じ番号に抽選する確率はずっと低い筈だ。因みに、500台の場合、抽選で2台以上が一致する確率は約5%とされる。故に、1度選択した番号をリストから削除するようプログラムしとけば、何ら問題にはならなかったのだ。

 これと同じ様な宝くじのミステリーが1995年のドイツで起きた。今でもよく知られる”ロト・シックス”で、問題の日(6/21)の当たり数は15,25,27,30,42,48の6つだが、実はこれと全く同じ数の並びが1986年12/20にも引かれてたのだ。同じ当たり数が繰り返されたのは、3016回の宝くじで、その時が初めてでだったという。
 因みに、その確率は約26%とされるが、偶然の一致の確率は、我々が思う程に低くはないのである。一方で、カナダのアルバータ州の55歳の男性は2018年10月、20年以上も同じ番号で購入し続けてきた”ロトMAX”で6000万カナダドル(約48億円)に当選。が、同州では2017年9月にもロトMAXで6000万カナダドルを獲得したという。
 2年続けて、この様な信じ難いミラクルが起きるのだから、天から授かる”幸運の一致”は、我々が思うよりはずっと身近にあるのかも知れない。

 この様に、ランダムなプロセスでは、ある結果の起き方が幾通りあるかが、その結果の蓋然性を決定する大きな鍵となる。だが、ガリレオはその重要性を見過ごしていた。つまり、彼が”サイコロ投げ”以上に、ランダムさの問題を研究する事はなかったのである。
 もし、貧困な環境で育ったガリレオだが、ランダムさの研究に身を投じてたら、大金持ちになってたであろうか?いや、自身の研究を天文学へと推し進め、科学の新たなアプローチが神学と接触する事で、(少なくとも)宗教裁判にかけられる事はなかったかもしれない。
 しかし、ガリレオの次の世代の数学者がランダムネスの科学を新たな頂へと導く事となる。


神童パスカル、ギャンブルにハマる

 今日、統計には欠かせない”標本空間”の考え方はカルダーノによって初めてもたらされたが、ガリレオはトスカーナ大公から命じられ「サイコロゲームの考察」という小論を書いた。が、それ以上の進展はなかった。
 その後、パスカルフェルマーはサイコロ賭博をテーマに書簡をやりとりし、確率論の基礎が芽生える。期待値・推定・検定・標本理論などは、そこから発展していった。
 彼らが基礎を作った確率論はその後、数学の大きなジャンルとなり、18世紀にはベイズ、ラグランジュ、ラプラスといった一流の数学者たちの研究を経て大成。更に、確率論の統計への応用として、ド・モアブルの年金論やD・ベルヌーイによる天然痘の罹病率や死亡率の計算などがある。
 また、オイラーとラプラスは抽出調査を基にした全体の推計方法を考案し、それはフランスの人口の推計に応用された。

 16世紀末の科学革命により、ランダムネスの研究はイタリアからフランスに移り、ヨーロッパ中にその波紋が広がる。
 こうしたランダムさの概念は再びギャンブルという文脈の中で発展されるが、パスカルはカルダーノの様にギャンブラー気質の数学者ではなく、数学者気質のギャンブラーだった。
 しかし、学問好きで信心深い古風なパスカルが、なぜ大都会パリのギャンブルの現場に足を踏み入れる事になったのか?
 元々病弱だったパスカルは、医者から勉学を辞めるよう説得され、亡き父の遺産もあってか、若い時期から放蕩する様になる。そこで、遊び仲間の1人がパスカルにギャンブラー貴族のド・メレを紹介した事が始まりだった。
 当時の彼はギャンブルの難問にぶつかり、パスカルに助言を求めたが、それこそが偶然(ランダムネス)の研究に火をつけた。そして、カルダーノやガリレオの研究では解決できなかった事が次々と解決される事となる。 

 この問題は”勝ち点問題”と呼ばれるが、例えば、2人が同等の確率を有し、先に得点した方が勝ちとするゲームで、リードしてる方が途中でゲームを辞めた時、”掛け金を公平に分ける方法はあるのだろうか?”という事に放蕩貴族は悩んでいた。
 確かに、ゲームが途中で終了した時点の点数から、各プレーヤーがゲームに勝つ確率を計算し、掛け金の分配に反映させる事も出来るが、その公平な計算方法は知られてなかった。
 パスカルは混乱するが、そこで頼りになったのが、1654年に始まったフェルマーとの往復書簡である。因みに、当時のフェルマーは現役の裁判官で、上司たちが次々とペスト病で死に、高い地位に君臨してたが、決して能力があった訳ではない。才能で言えば、アマチュアだが数学の方が傑出していた。
 故に、フェルマーの助言はパスカルの迷いを払拭してくれたのは言うまでもない。

 例えば、その書簡には”2人が同じ掛け金を出し合い、先に3勝した方が勝ちで、既にAが2勝、Bが1勝してる時に警察が踏み込んだとする。この時に掛け金はどの様に配分するべきか?”とある。
 これには色々と考えられるが、勝負がついてないので、同じ金額に分けるやり方があるが、2勝したAから文句が出る。また、勝ち数から2:1に分けるやり方もあるが、Bが0勝の時は、勝負がつかないのにAが総取りとなる。これもまた不公平だ。
 2人は、まだ起こり得ない未来を予測するという問題の解決を往復書簡の中で考え出したが、パスカルは今で言う”期待値”という概念を使って解決した。


1996年のワールドシリーズ

 このパスカルの”勝ち点問題”を上の例で説明する。
 まず、AとBが10万円ずつ賭け、勝った方が20万円をもらうとして、警察が踏み込まなければ、ゲームはどの様に展開しただろうか?
 そこで、3〜5回目の勝敗を考えると、Aが2勝、Bが1勝してる段階で、更に、Aが勝つパターンは”勝ち、負け→勝ち”の2通りで、Bが勝つパターンは”勝ち→勝ち”の1通りのみとなる。
 ここで期待値(確率×掛け金)を考えると、AがBに勝つ確率は1/2で、Bに負けてその後に勝つ確率は1/2×1/2=1/4で、Aの期待値は10万円×(1/2+1/4)=15万円。一方、BがAに連勝する確率は1/2×1/2=1/4で、Bの期待値は10万円×1/4=5万円となる。従って、Aには15万、Bに5万を分配すれば良いとなる。
 但し、本書の第4章”たまたま成功する確率”では”勝ち点問題”を1996年のNYYとATLのWシリーズを使って再現するが、この時はATLが先に連勝して絶対有利だとされた。
 ここで、その後の5試合の勝ち負けのパターンの総数は2⁵=32通りあるが、先ずはNYYがシリーズを制覇するとすれば、残り5試合のうち4勝すればいいから、(NYYの勝ちをN、ATLの勝ちをAと記し)、ANNNN、NANNN、NNANN、NNNAN、NNNNAの5通りのうちの1つか、NNNNNの1つである。
 つまり、NYYが逆転で優勝する確率は、6/32=19%となり、ATLがそのまま制覇する確率は81%となる事が判る。従って、ATLが2連勝した段階で中断した時、パスカルの法則に従えば、この比率で分ければいい。
 事実、NYYはその後4連勝してWシリーズを逆転で制覇する事になるが、神様は19%の確率にサイコロを振った事になる。

 勿論、以上の確率はNYYとATLが互角の戦力を持ってたとの仮定だが、実際のWシリーズ予想にもパスカルの法則は適用できる。但し、相対確率(強さの比率)を加える必要がある。
 例えば、強さの比率が55:45の場合でも、7試合制なら10回に4回は弱い方のチームが勝つとされる。また、強さの比率が3:1の場合でも、同じ7試合制なら5回に1回は弱いチームが勝つという。一方、この弱いチームが優勝する確率を5%以下にするには、最低でも23試合を戦う必要があるとされる。多分、ワイルドカードとはパスカルの確率論を用いて編み出された”天の恵み”であろうか。 
 また、強さの比率が55:45の様な、ほぼ互角のチーム同士で完全決着をつけるには、統計学的に優位な最短のWシリーズは269試合制だとされる。つまり、ワールドとは名ばかりで、Wシリーズを制覇したチームがベストなチームである事の保証はどこにもないのだ。

 因みに、パスカルの確率論に関する偉業は”勝ち点問題”だけでなく、高校で学ぶ”パスカルの三角形”でも十全に発揮される。
 前述の様に、NYYとATLの残り5試合での勝ち負けのパターンを1つ1つ調べたが、5つ目の段の三角形(1.5.10,10,5,1)を辿れば、一目で読み取れる。例えば、NYYが5試合全て勝つのは1通りで、2試合に勝つのは10通りで、1試合に勝つのは5通りである事が判る。
 これは数を大きくしても同様で、異なる100人の中から10人を無作為に選ぶ必要がある時、その組合せは、₁₀₀C₁₀=100×99×…×91/10!=17,310,309,456,440と計算すれば求まるが、こんな天文学的な計算をせずとも、パスカルの三角形の最上列から100列目の11番目がその数となるのだ。
 もし、披露宴に呼ばれた100人の招待客の誰かが10名が座るテーブルの席順に不満を申し出たとすると、全ての席の組合せを再検討するにどれ程の時間が掛かるだろうか?
 多分、1つの組合せに1秒掛かるとして凡そ50万年にもなるが、パスカルの原理を使えば一瞬で求まるのだ。


最後に

 それ以外にも、この手法は様々な場面で応用できる。例えば、商品開発の重要案件を6人のグループだけで決めるとする。ここで仮に、その製品が大衆の半分が興味を引くものとすると、この好みがどれほど正確に6人の意見に反映されるであろうか?
 このケースに関係する三角形の6段目の数字は1,6,15,20,15,6,1だが、新製品を好む(嫌う)0人,1人,2人,3人,4人,5人の可能なサブグループを意味する。そこで、6人の意見が半々に分かれ、大衆の意見を正確に反映する場合、その分かれ方は20通りで、それ以外の大衆の好みを反映しない意見の一致が44通りある事が判る。
 故に、ミスリードする確率が44/64≒70%近くに上る事になるが、6人だけの会議で意見の一致が成されたとしても、このザマである。従って、少人数での閣議決定には十分に注意を要する事も理解するべきだろう。

 以上、またまた長くなりすぎたので、ここで終りにします。
 次回は、パスカルのランダムネスの研究を更に発展させたベルヌーイの推測論について述べたいと思います。

 


6 コメント

コメント日が  古い順  |   新しい順
補足ありがと (tomas)
2025-03-09 09:14:01
ホームランを打つ度に
ランダムな要素が平均化され
その平均から度々ズレる事がある>>
その確率を数理モデルで検証すると
マリスがルースの記録を破るのは
32シーズンに1度の確率で
期間を90年代末の70年間に広げれば
マリスに匹敵する選手は3シーズンに1人の割合で存在し>>>
それら全てを加えれば
偶然だけでルースの記録を破る確率は50%を少し上回る計算になる>>>>

そうかんがえると人類の偉業って
我ら凡人が思うほどに傑出したものでもないのでしょうか。
色々と教えて下さって有難うございます。
返信する
平均回帰の誤謬 (腹打て)
2025-03-09 11:26:58
マリスの偉業の確率もユニークだけど
<平均値の回帰>も興味深い。
平均すれば結局はその人の才能や能力に従う事だが、一見すればランダムさに反する。
試行回数が多くければ、ランダムのズレも収まるという「小数の法則」にも似た現象だが
これは幾ら努力しても天賦の才や能力には敵わないという<才能への回帰>を暗に示唆してくれる。
努力家→エリート(秀才)→天才の順で人は潰されると言われるけど、凡人の方が上手く生き延びるには都合がいい気もする。
他方で、多くのベストセラーにはそれに見合う挫折の数が存在するというのもユニークだ。
これは<決して諦めない>との努力の賜物でもあるけど、それに見合う才能が根底には横たわっている。
スターウォーズの大ヒットは偶然かか才能かって所だけど、今から思うと偶然に近かったような気もする。
返信する
tomasさん (象が転んだ)
2025-03-09 12:12:53
厳密に言えば
1961年のマリスの直前の4年間では、14.7打席で1本の割合で本塁打を放ってましたから、14.7打席で1本の割合で表がでるコイン投げをAIで再現します。
そうする事で、1961年のマリスをランダムに再現できますが、そのモデルは正規分布の曲線を描き、ルースの記録に並ぶか上回る程にズレる確率は1/32となるんですね。
公平を帰す為に期間をステロイド全盛の時代にまでに広げ、マリスが偶然だけで61本を打つ確率を計算する。

勿論、マリス1人だけなら確率は1/32のままですが、彼に匹敵する選手が約3年に1人存在したとされ、70年間で20人はいた事になるから、その確率はずっと大きくなりますよね。
単純計算すれば、20/32で60%を超えるんですが、様々な要素を加味しても50%を少し上回るとなるんでしょうか。

ただ、ルースは154試合制での60本で、マリスの164試合制での61本(154試合時点では59本)は単純に”ルースを超えた”とは言い難い。
また1961年は、アリーグの球団数が8から10に増え、今は16球団に増えた事を考えると、マリスはともかく、昨今の本塁打記録は単にMLBの質の急激な低下がもたらした結果とも言えますね。
そうした諸々を加味すると、大谷の偉業も偉業ではなく”平凡の少し下”なるかもです。
返信する
腹打てサン (象が転んだ)
2025-03-09 12:14:26
<才能への回帰>ですか・・
素晴らしい表現です。
実は平均回避という言葉は初めて知ったんですが、ランダムネスの1つの特徴でもあるんですよね。
気の遠くなる様な莫大な量の努力よりも、一瞬の才能が時代を動かす事が多々あります。
”1%の閃きがなければ99%の努力は無駄になる”というのも、偶然の科学によリ説明できます。
我々が従来信じてきた事や直感や主観で理解してた事が、ランダムさの世界を研究する事で、それらの限界や矛盾が暴かれています。

偶然の科学はまだ若い領域の学問ですが、夢のある研究だと思います。
これから暫くは、「ドランカーズ・ウォーク」に関する記事が続くと思いますが、よろしくお願いします。
返信する
宝くじのミステリー (HooRoo)
2025-03-09 13:23:09
神様もたまには
サイコロを振るっていうのは
とても説得力があると思うの
その”たまたま”を解読する数学者も偉大だけど
”たまたま”の確率に従う
ランダムな世界もとても魅惑的で神秘的な世界なのですね 
返信する
Hooさん (象が転んだ)
2025-03-09 21:24:56
これまで
カルダーノ、ガリレオ、パスカル、フェルマーと4人の数学者を紹介しましたが
ギャンブルが偶然の科学へ直結する過程と歴史も、興味深いものがあります。
更に、彼らの生き様はもっと興味深く神秘的でもありました。
数学者が全てギャンブル好きな訳でもないんですが、ギャンブルが数学を惹きつけ、確率論が誕生したのは事実であり、今や未来を予測する重要な学問へと昇華しました。
「世界を変えた手紙」もオススメの一冊ですよ。
返信する

コメントを投稿