夢のもつれ

なんとなく考えたことを生の全般ともつれさせながら、書いていこうと思います。

はじめの1

2006-07-08 | philosophy

 タイトルとボクシング・マンガとは関係ありません。全く関係ないわけでもないんですが。……黄金比とフィボナッチ数列について何回か書いていますが、その途中でマリオ・リヴィオの「黄金比はすべてを美しくするか」というとてもおもしろい本を読みました。一般的な読み物なんで、数学としての裏づけはやや物足りない面がありますが(お蔭で連載の方はちょっと苦労してるんですが)、著者の博識ぶりは大したもんです。

 その中に出てきたベンフォードの法則というのがびっくりするようなものだったので、紹介しましょう。世の中にはいろんな統計数字があります。農産物の生産量とか、市町村別の人口とか、地震の死者数とか、河川の流域面積とか、株価とか、ボクシング選手の戦績とか、まあなんでもいいんですが、その数字って1から9のどれで始まる(つまりいちばん上の桁の数字ですね)のがいちばん多いと思います?……常識的にはどれも同じ1/9、11.1%だと思いますよね? でも、違うんだそうです。1がいちばん多くて、2がその次で、3がそのまた次とだんだん少なくなって、9はいちばん少ないんだそうです。こういう統計的な数字でなくても、例えば今日の新聞に出ている雑多な数字を全部集めてもそういう傾向があるんだそうです。

 英語のサイトなんですが、このサイトには例えばアメリカの335の河川の流域面積とか、3259の郡の人口から始まって、いろんな物質の比熱といった自然科学についての数値などなど20種類、2万ほどの数値を調べた結果が出ています。で、その最初の数字には登場頻度までが一定の傾向があって、1は30.1%、2は17.6%……9は4.5%前後になります。混ぜればさらに近づいていきます。……これがベンフォードの法則です。きちんと数式化できるフィボナッチ数も最初から2000個を調べると(ご苦労なことです)同じ傾向があります。ウソー?! どこでどんな相談をしてるんだ?って思いました。

 このサイトには数学的な説明もあるんですが、よくわかんないんで、他のサイトも参考にしながら自分で考えてみました。間違っている可能性は高いんですけど、訂正していただければ幸いです。

 まず、いろんな統計とかの数字には最高値があります。上に挙げた例では2000番目のフィボナッチ数がいちばん大きいはずですが、ともかくそれぞれの最高値からバラバラに数字が並んでいるというイメージができると思います。これを箱の中に1から最高値までの数字を書いたカードを入れて、何回も取り出して(戻します。同じ数値がある場合もあるわけですから)いく場合に近いんじゃないかと。市町村別の人口の例で言えば横浜市の人口360万を上限とした360万枚のカードを今の市町村の数1800回抜いて、戻していくわけです。……もちろんいちばん人口の少ない市町村があるわけで(たぶん東京都の青ヶ島村の197人です)、それより小さい数のカードが出たりしますが、あくまでイメージってことで。で、この場合はなんとなく4から9で始まるのは少ないんじゃないかって気がしますよね? だって「100万」ってカードより大きい数字のカード260万枚はすべて1か2か3で始まってるんですから。

 つまりベンフォードの法則は、一定の数字以下からランダムに数字を拾った場合に先頭の数字の分布はどうなっているかっていうことじゃないかって思うんです。だから、先頭の数字を回る的に矢を放って決めている(でいいのかな?w)宝くじには当てはまりません。残念ながらw。実際にもっと小さい数字で様子を見てみましょう。

 1から99までのカードが入った箱で考えます。当然、どの数字も同じ確率で現われます。すると1で始まる数字は、1と10から19で、その確率は11/99ですね。

 次に1から109までの箱だと、1で始まるのは上の数字に100から109までの全部を加えたものですから、21/109です。さらに1から119なら31/119……となって、1から199までの箱の場合まで確率は上がっていって、111/199と半分以上の確率になります。

 他方、2で始まる数字は1から99までの箱でも、1から199の箱でも分子はずっと変わらず、11/99、11/109……と確率は下がって行って、200以降になってやっと増えます。それも1から299までの箱のときに111/299となってようやく1から始まる数字の確率に並ぶわけです。

 この後は、
 3で始まる数字は、1から299までの箱の11/299まで確率が下がり、1から399までの箱になって111/399で1、2と並ぶ。
 4で始まる数字は、1から399までの箱の11/399まで確率が下がり、1から499までの箱になって111/499で1、2、3と並ぶ。
      …………
 9で始まる数字は、1から899までの箱の11/899まで確率が下がり、1から999までの箱になって111/999で1、2……8と並ぶ。

 で、こうしたたくさんの箱の中から次のような9つをピックアップして、1で始まる確率を見ます。

 1から119までの箱:111/199
 1から299までの箱:111/299
 1から399までの箱:111/399
   …………
 1から999までの箱:111/999

 この平均は、0.268(26.8%)になります。以下同様にして、2で始まるのは18.3%、3で始まるのは14.5%で、9で始まるのは3.5%になります。もちろんこれはたった9つの例を取っただけですが、それでもサイトに載っている1で始まる場合の30.1%、2で始まる場合の17.6%、3で始まる場合の12.5%、9で始まる場合の4.6%にわりと近い値になります。

 これらの箱を選ぶのも確率に従うとすると、箱が100個あればどの1個も確率は1/100ですよね。でも、そのうち先頭の数字が1から9まで同じ枚数になっているのは、9枚入ったのと99枚入ったのだけなんです。他はぜんぶ偏りがあるんですね。……こう考えてくると、自然という大きなおもちゃ箱をひっくりかえしてみたくなりません?w



最新の画像もっと見る

4 コメント

コメント日が  古い順  |   新しい順
はずれー、もしくはスカ~ (ぽけっと)
2006-07-11 16:07:40
つまり、その自然のおもちゃ箱がくじ引きのガラガラ回るのだとすると、1のくっついてるのが出てきたら「またティッシュか~」てわけですね。

返信する
確かに~w (夢のもつれ)
2006-07-11 23:36:07
私の母方の親戚はお正月とかに集まるとカブというトランプでやるギャンブルをやってましたが、数字の合計が1の場合はインケツと言って最低で、9がカブで最高でしたね。ベンフォードの法則なんか知らない大阪のおっちゃん、おばちゃんたちですが。……お蔭さまでなつかしいことを思い出しましたw。
返信する
じゃりん子チエ (ぽけっと)
2006-07-12 10:04:40
…みたいな一族ですねえ。

あれは本来花札でやるんですってね。

私も親戚だったか友達にだったかにカブを教えてもらった記憶がかすかにあります。

中学の頃なんて男の子がよくいろんな局面で「インケツやんけ~」と叫んでましたよ。

「サイアク~」くらいの感じでしょうね。
返信する
まあありていに言えば (夢のもつれ)
2006-07-12 13:41:39
花札だと子どもが参加しにくいからという親心だったんですねw。……お年玉の再分配という意味もないことはなかったようですが。



でも、本来は花札でやるなんてところまでご存知なのに、記憶がかすかにありますなんて、わざとらしいようなw。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。