前回の続きです。
(命題-1)すべてのカラスは黒い
∀x{x∈カラス⇒x∈黒いもの}
ベイズ統計による確証度合いの原理的な式はRef-3に書いてあり、Ref-5やRef-6にいきなり出てくる式は、様々な条件の下にRef-3の式から誘導された式です。例えばRef-5では、以下の想定がされています。
・全体集合Sが有限集合
・R(x),B(x)の数がわかっている
・R(x)とB(x)の判定はどちらも容易である
さて、Ref-3によれば、背景知識Gのもとで、事象eが観察されたときに仮説Hが正しい確率(確証度)をP(H/e&G)とすれば、
P(H/e&G)=P(H/G)P(e/H&G)/P(e/G) --式1
ここで
P(H/e&G) 事象eが観察されたときに仮説Hが正しい確率
P(H/G) 観察の前の仮説Hが正しい確率(事前確率)
P(e/H&G) 仮説Hが正しい場合に事象eが観察される確率(Hによる予測)
P(e/G) 事象eが観察される確率(事前確率)
事前確率P(H/G)は背景知識Gにより異なることになりますが、それを忘れなければGは全てに付いているので簡単のために省略しても構わないでしょう。
事象eが観察されたことにより、P(H)であった確率がP(H/e)へと変化するので、確証度の変化は
P(H/e)-P(H)=P(H){P(e/H)/P(e)-1} --式2
この式は、P(H)は適当に決めておいたとしても、その変化比はP(H)によらないことを示しています。そこで、P(e/H)/P(e)をベイズファクター(BF)と呼ぶことにします。すなわち、(BF-1)が確証度の増加になります。
P(H/e)-P(H)=P(H){BF-1} --式2'
次に、事象eが生じる原因としてn個の対立仮説Hi(i=1~n)で全ての可能性を尽くしているとすると、事象eが生じる確率P(e)は、
P(e)=Σ{P(Hi)P(e/Hi)} --式3
すると
BF=P(e/Hk)/Σ{P(Hi)P(e/Hi)} --式4
ここで対立仮説Hiの事前確率P(Hi)が全て等しいと仮定すれば、
分母=(1/n)ΣP(e/Hi) --式4-1
もちろんHiの事前確率が全て等しいかどうかは場合によります。神はいるかいないかのどちらかで確率は共に1/2、なんて仮定を置いた人もいたようですが(^_^)
さて、カラスの逆説-3-で考えたように全体集合sは次の4つに分けられます。
a) R(x)∧B(x) カラスであり黒い
b) R(x)∧¬B(x) カラスであり黒くない
c) ¬R(x)∧B(x) カラスでなくて黒い
d) ¬R(x)∧¬B(x) カラスでなくて黒くない
Ref-5の"Standard Bayesian Solution"では、ここで次の条件の場合を考えます。
全体集合sはN個の対象xからなる有限集合である
カラスの集合{x|R(x)}、すなわち{集合a+集合b}の要素数はr個
黒いものの集合{x|B(x)}、すなわち{集合a+集合c}の要素数はb個
ここで「カラスの中の黒い個体の数がi個である」という仮説、つまり「R(x)&B(x)なるxの数がi」という仮説をHiとすると、i=0~rの(r+1)個の対立仮説で全ての場合が尽くせます。ただし、ここでb<rとするとi>r-bのときにはHi=0となってしまうので、b>>rとしておきます。これは現実的な想定でもあります。
そして、「R(x)である全てのxがB(x)である」という仮説はHrのことになります。
そして、1個の対象xを取り出したときに生じる事象eの種類は、xがa~dのどれに属するかという4種類になります。
以上の想定のもとで、まず仮説Hiの下での事象eの4種類の予測確率を求めます。仮説Hiの下ではa~dの要素数は次のようになります。
a) R(x)&B(x)なるx i
b) R(x)&¬B(x)なるx r-i
c) ¬R(x)&B(x)なるx b-i
ゆえに残りは
d) ¬R(x)&¬B(x)なるx N-i-(r-i)-(b-i)=N-(r+b-i)
ここで事象eをR(a)&B(a)とすると仮説Hiの下での予測確率は、N個の集合からi個の集合aに属するものが選ばれる確率になるので、
P(e/Hi)=i/N i=0~r
各仮説Hiの事前確率が等しいとすれば式4と式4-1から、
BF=P(e/Hk)/(1/(r+1))ΣP(e/Hi)
=(k/N)/(1/(r+1))Σ(i/N)
=k/(1/(r+1)){(r+1)r/2}
=2k/r
したがって、「すべてのカラスは黒い」という仮説HrについてはBF=2となります。これは式2'によれば、R(a)&B(a)が1個、つまり黒いカラスが1羽見つかると事前確率P(Hr)と同じだけ確証度が高まるということになります。
では、カラスでもなく黒くもないものが1つ見つかった場合はどうなるでしょうか。このときは事象eを¬R(a)&¬B(a)とすると、仮説Hiの下での予測確率はN個の集合から{N-(r+b-i)}個の集合dに属するものが選ばれる確率になるので、
P(e/Hi)={N-(r+b-i)}/N
=1-(r/N)-(b/N)+(i/N)
P(e/Hr)=1-(b/N)
したがって式4と式4-1から、
BF={1-(b/N)}/(1/(r+1))Σ{1-(r/N)-(b/N)+(i/N)}
={1-(b/N)}/{1-(r/N)-(b/N)+(r/2N)}
={1-(b/N)}/{1-(b/N)+r/2N)}
したがって、N>>rすなわちr/N≒0の場合にはBF≒1となり、P(H/e)-P(H)≒0、で事後確率は事前確率からほとんど変化しないことになります。つまりカラスの集合が全体集合Sに比べて非常に小さい場合は、カラスでもなく黒くもないものが1つ見つかっても命題-1の確証度はほとんど変化しません。これがベイズ統計によるスタンダードな説明(Standard Bayesian Solution)です。
さて、残り2つの集合bと集合cに属する対象xが見つかった場合はどうなるかも見ておきましょう。長くなりますので、それは次回の話とします。
-----参考文献-------------
1) ウィリアム・パウンドストーン;松浦俊輔(訳)『パラドックス大全-世にも不思議な逆説パズル-』青土社(2004/9/30)
2) 富永裕久『図解雑学パラドクス(図解雑学シリーズ)』ナツメ社(2004/02)
3) 内井惣七『科学哲学入門―科学の方法・科学の目的』世界思想社(1995/04) 6.8節(p173-177)
4) ウィキペディア日本語版での紹介
5) ウィキペディア英語版での紹介
6) A LACUNA IN THE STANDARD BAYESIAN SOLUTION
(命題-1)すべてのカラスは黒い
∀x{x∈カラス⇒x∈黒いもの}
ベイズ統計による確証度合いの原理的な式はRef-3に書いてあり、Ref-5やRef-6にいきなり出てくる式は、様々な条件の下にRef-3の式から誘導された式です。例えばRef-5では、以下の想定がされています。
・全体集合Sが有限集合
・R(x),B(x)の数がわかっている
・R(x)とB(x)の判定はどちらも容易である
さて、Ref-3によれば、背景知識Gのもとで、事象eが観察されたときに仮説Hが正しい確率(確証度)をP(H/e&G)とすれば、
P(H/e&G)=P(H/G)P(e/H&G)/P(e/G) --式1
ここで
P(H/e&G) 事象eが観察されたときに仮説Hが正しい確率
P(H/G) 観察の前の仮説Hが正しい確率(事前確率)
P(e/H&G) 仮説Hが正しい場合に事象eが観察される確率(Hによる予測)
P(e/G) 事象eが観察される確率(事前確率)
事前確率P(H/G)は背景知識Gにより異なることになりますが、それを忘れなければGは全てに付いているので簡単のために省略しても構わないでしょう。
事象eが観察されたことにより、P(H)であった確率がP(H/e)へと変化するので、確証度の変化は
P(H/e)-P(H)=P(H){P(e/H)/P(e)-1} --式2
この式は、P(H)は適当に決めておいたとしても、その変化比はP(H)によらないことを示しています。そこで、P(e/H)/P(e)をベイズファクター(BF)と呼ぶことにします。すなわち、(BF-1)が確証度の増加になります。
P(H/e)-P(H)=P(H){BF-1} --式2'
次に、事象eが生じる原因としてn個の対立仮説Hi(i=1~n)で全ての可能性を尽くしているとすると、事象eが生じる確率P(e)は、
P(e)=Σ{P(Hi)P(e/Hi)} --式3
すると
BF=P(e/Hk)/Σ{P(Hi)P(e/Hi)} --式4
ここで対立仮説Hiの事前確率P(Hi)が全て等しいと仮定すれば、
分母=(1/n)ΣP(e/Hi) --式4-1
もちろんHiの事前確率が全て等しいかどうかは場合によります。神はいるかいないかのどちらかで確率は共に1/2、なんて仮定を置いた人もいたようですが(^_^)
さて、カラスの逆説-3-で考えたように全体集合sは次の4つに分けられます。
a) R(x)∧B(x) カラスであり黒い
b) R(x)∧¬B(x) カラスであり黒くない
c) ¬R(x)∧B(x) カラスでなくて黒い
d) ¬R(x)∧¬B(x) カラスでなくて黒くない
Ref-5の"Standard Bayesian Solution"では、ここで次の条件の場合を考えます。
全体集合sはN個の対象xからなる有限集合である
カラスの集合{x|R(x)}、すなわち{集合a+集合b}の要素数はr個
黒いものの集合{x|B(x)}、すなわち{集合a+集合c}の要素数はb個
ここで「カラスの中の黒い個体の数がi個である」という仮説、つまり「R(x)&B(x)なるxの数がi」という仮説をHiとすると、i=0~rの(r+1)個の対立仮説で全ての場合が尽くせます。ただし、ここでb<rとするとi>r-bのときにはHi=0となってしまうので、b>>rとしておきます。これは現実的な想定でもあります。
そして、「R(x)である全てのxがB(x)である」という仮説はHrのことになります。
そして、1個の対象xを取り出したときに生じる事象eの種類は、xがa~dのどれに属するかという4種類になります。
以上の想定のもとで、まず仮説Hiの下での事象eの4種類の予測確率を求めます。仮説Hiの下ではa~dの要素数は次のようになります。
a) R(x)&B(x)なるx i
b) R(x)&¬B(x)なるx r-i
c) ¬R(x)&B(x)なるx b-i
ゆえに残りは
d) ¬R(x)&¬B(x)なるx N-i-(r-i)-(b-i)=N-(r+b-i)
ここで事象eをR(a)&B(a)とすると仮説Hiの下での予測確率は、N個の集合からi個の集合aに属するものが選ばれる確率になるので、
P(e/Hi)=i/N i=0~r
各仮説Hiの事前確率が等しいとすれば式4と式4-1から、
BF=P(e/Hk)/(1/(r+1))ΣP(e/Hi)
=(k/N)/(1/(r+1))Σ(i/N)
=k/(1/(r+1)){(r+1)r/2}
=2k/r
したがって、「すべてのカラスは黒い」という仮説HrについてはBF=2となります。これは式2'によれば、R(a)&B(a)が1個、つまり黒いカラスが1羽見つかると事前確率P(Hr)と同じだけ確証度が高まるということになります。
では、カラスでもなく黒くもないものが1つ見つかった場合はどうなるでしょうか。このときは事象eを¬R(a)&¬B(a)とすると、仮説Hiの下での予測確率はN個の集合から{N-(r+b-i)}個の集合dに属するものが選ばれる確率になるので、
P(e/Hi)={N-(r+b-i)}/N
=1-(r/N)-(b/N)+(i/N)
P(e/Hr)=1-(b/N)
したがって式4と式4-1から、
BF={1-(b/N)}/(1/(r+1))Σ{1-(r/N)-(b/N)+(i/N)}
={1-(b/N)}/{1-(r/N)-(b/N)+(r/2N)}
={1-(b/N)}/{1-(b/N)+r/2N)}
したがって、N>>rすなわちr/N≒0の場合にはBF≒1となり、P(H/e)-P(H)≒0、で事後確率は事前確率からほとんど変化しないことになります。つまりカラスの集合が全体集合Sに比べて非常に小さい場合は、カラスでもなく黒くもないものが1つ見つかっても命題-1の確証度はほとんど変化しません。これがベイズ統計によるスタンダードな説明(Standard Bayesian Solution)です。
さて、残り2つの集合bと集合cに属する対象xが見つかった場合はどうなるかも見ておきましょう。長くなりますので、それは次回の話とします。
-----参考文献-------------
1) ウィリアム・パウンドストーン;松浦俊輔(訳)『パラドックス大全-世にも不思議な逆説パズル-』青土社(2004/9/30)
2) 富永裕久『図解雑学パラドクス(図解雑学シリーズ)』ナツメ社(2004/02)
3) 内井惣七『科学哲学入門―科学の方法・科学の目的』世界思想社(1995/04) 6.8節(p173-177)
4) ウィキペディア日本語版での紹介
5) ウィキペディア英語版での紹介
6) A LACUNA IN THE STANDARD BAYESIAN SOLUTION
※コメント投稿者のブログIDはブログ作成者のみに通知されます