前回の続きです。
集合b{R(x)&¬B(x)}に属するもの、つまり黒くないカラスが1羽見つかれば、むろん仮説Hrは否定されます。2羽見つかればHr-1も否定されます。ということでこれは簡単な話です。
さて集合c{¬R(x)&B(x)}に属するもの、つまりカラスでなくて黒いものが見つかった場合です。今考えている条件では、この場合は仮説Hrの確証度は下がると考えられます。それは定性的には次の理由によります。
黒いものは全部でb個なので、j個の黒いものを調べると残りは(b-j)個となり、(b-j)が小さくなれば、その中のr個がカラスである確率は小さくなる。極端な話、(b-j)<rとなれば仮説H<sub>rが正しい確率はゼロになる。
では計算をしてみましょう。事象eを¬R(a)&B(a)とすると仮説Hiの下での予測確率は、先の計算と同様に、
P(e/Hi)=(b-i)/N
P(e/Hr)=(b-r)/N
したがって式4と式4-1から、
BF=P(e/Hk)/(1/(r+1))ΣP(e/Hi)
=((b-r)/N)/(1/(r+1))Σ((b-i)/N)
=(b-r)/{b+(r/2)}
=1-(3r/2)/{b+(r/2)}
¬R(a)&B(a)であるとHrの確証度は確かに下がるのです。しかしその程度はbとrが同程度の大きさでないと目に見えてはきません。b>>rの条件ではBF≒1です。
現実的には、つまり現実世界についての我々の背景知識によれば、黒いものの個数や全体集合の個数が有限な定数であるというのはいかにも人工的な前提です。カラスの個体数なら上限値が有限であることは確かですが。
しかし、全体集合における黒いものの密度とか存在確率がわかっているという想定ならば、少しは人工的匂いが減るかも知れません。もちろん正確に密度がわかっているというのは妥当ではありませんが、密度0%でも100%でもないことは確かで、ある程度の範囲に限定できるとは言えそうです。この場合、Hrの確証度が¬R(a)&¬B(a)で上がったり¬R(a)&B(a)で下がったりする理由を、定性的に次のように考えることができます。
1) 何も調べないうちは、黒いものは均等分布していると想定できる。つまり、カラスの集合においてもカラスでない集合においても、黒いものの存在確率は等しいと想定できる。
2) カラスでなく黒くもないものが多数見つかるとカラスでない集合における黒いものの密度が低いことがわかってくる。全体集合における黒いものの密度はわかっているので、カラスでない集合における黒いものの密度が低ければ、カラスにおける黒いものの密度は高いという推定が確からしくなってくる。
3) カラスでない黒いものが多数見つかると2の逆の論理で、カラスにおける黒いものの密度は低いという推定が確からしくなってくる。
しかし今度は、黒いものは現実には均等分布していないという背景知識を我々は知っています。特に「カラスでないもの」という巨大な集合の中ではそうです。
結局のところ、「黒いものの集合の数bが一定」とか「黒いものの密度が一定で均等分布しいる」とかいう仮定が、4つに分けた集合のどれかが見つかれば他の集合についての仮説の確証度が変わる、という結果を支えていることになります。カラスの逆説-6-で述べたエンタングルメントの正体はこの仮定だということになります。
スタンダードなベイズ統計による解釈では、「本当はわずかに確証度が上がるけれどあまりにわずかで無視できるほどなのだ」と結論づけていますが、実のところは、「スタンダードなベイズ統計による解釈を成立させる仮定が現実には成り立たないという背景知識」を我々が知っているから、「カラスでもなく黒くもないものでは命題-1の確証度は上がらない」のではないでしょうか。
なおカラスの逆説-6-で述べたエンタングルメントの例は「黒いカラスが見つかると、黒くないカラスが存在する確証度が下がる」という推測のものでした。この場合は「カラスの集合の数は有限の一定数」ということが推測の前提になっており、この前提は現実的なものだったのです。
話変わって、ここで次の表現の違いを見てみましょう。
A)1羽のカラスを調べて黒かったことが命題-1を確証する程度
B)黒いカラス1羽の発見が命題-1を確証する程度
Aの表現ではカラスか否かの調査と黒いか否かの調査に時間差があり、詳しくはカラスの逆説-2-、カラスの逆説-3-、カラスの逆説-4-、カラスの逆説-5-、カラスの逆説-6-、で述べたように、両調査の難易度を考察する必要が出てきます。一方Bの表現では、ある対象を調べるとカラスか否かと黒いか否かが同時にわかることになります。そしてスタンダードなベイズ統計による解釈ではBの表現が使われています。ちょっとした表現の違いで使われている前提のちがいが出てくるのは恐ろしいところです。
といったところでヘンペルの逆説の話はひとまず終わりとします。
-訂正(2016/09/29)-------------
「両調査の難易度を考察する必要」の引用リンクが抜けていたので追加した。
「ちょっとした表現の違いで使われている前提のちがいが出てくる」の文を赤字で強調した。
集合b{R(x)&¬B(x)}に属するもの、つまり黒くないカラスが1羽見つかれば、むろん仮説Hrは否定されます。2羽見つかればHr-1も否定されます。ということでこれは簡単な話です。
さて集合c{¬R(x)&B(x)}に属するもの、つまりカラスでなくて黒いものが見つかった場合です。今考えている条件では、この場合は仮説Hrの確証度は下がると考えられます。それは定性的には次の理由によります。
黒いものは全部でb個なので、j個の黒いものを調べると残りは(b-j)個となり、(b-j)が小さくなれば、その中のr個がカラスである確率は小さくなる。極端な話、(b-j)<rとなれば仮説H<sub>rが正しい確率はゼロになる。
では計算をしてみましょう。事象eを¬R(a)&B(a)とすると仮説Hiの下での予測確率は、先の計算と同様に、
P(e/Hi)=(b-i)/N
P(e/Hr)=(b-r)/N
したがって式4と式4-1から、
BF=P(e/Hk)/(1/(r+1))ΣP(e/Hi)
=((b-r)/N)/(1/(r+1))Σ((b-i)/N)
=(b-r)/{b+(r/2)}
=1-(3r/2)/{b+(r/2)}
¬R(a)&B(a)であるとHrの確証度は確かに下がるのです。しかしその程度はbとrが同程度の大きさでないと目に見えてはきません。b>>rの条件ではBF≒1です。
現実的には、つまり現実世界についての我々の背景知識によれば、黒いものの個数や全体集合の個数が有限な定数であるというのはいかにも人工的な前提です。カラスの個体数なら上限値が有限であることは確かですが。
しかし、全体集合における黒いものの密度とか存在確率がわかっているという想定ならば、少しは人工的匂いが減るかも知れません。もちろん正確に密度がわかっているというのは妥当ではありませんが、密度0%でも100%でもないことは確かで、ある程度の範囲に限定できるとは言えそうです。この場合、Hrの確証度が¬R(a)&¬B(a)で上がったり¬R(a)&B(a)で下がったりする理由を、定性的に次のように考えることができます。
1) 何も調べないうちは、黒いものは均等分布していると想定できる。つまり、カラスの集合においてもカラスでない集合においても、黒いものの存在確率は等しいと想定できる。
2) カラスでなく黒くもないものが多数見つかるとカラスでない集合における黒いものの密度が低いことがわかってくる。全体集合における黒いものの密度はわかっているので、カラスでない集合における黒いものの密度が低ければ、カラスにおける黒いものの密度は高いという推定が確からしくなってくる。
3) カラスでない黒いものが多数見つかると2の逆の論理で、カラスにおける黒いものの密度は低いという推定が確からしくなってくる。
しかし今度は、黒いものは現実には均等分布していないという背景知識を我々は知っています。特に「カラスでないもの」という巨大な集合の中ではそうです。
結局のところ、「黒いものの集合の数bが一定」とか「黒いものの密度が一定で均等分布しいる」とかいう仮定が、4つに分けた集合のどれかが見つかれば他の集合についての仮説の確証度が変わる、という結果を支えていることになります。カラスの逆説-6-で述べたエンタングルメントの正体はこの仮定だということになります。
スタンダードなベイズ統計による解釈では、「本当はわずかに確証度が上がるけれどあまりにわずかで無視できるほどなのだ」と結論づけていますが、実のところは、「スタンダードなベイズ統計による解釈を成立させる仮定が現実には成り立たないという背景知識」を我々が知っているから、「カラスでもなく黒くもないものでは命題-1の確証度は上がらない」のではないでしょうか。
なおカラスの逆説-6-で述べたエンタングルメントの例は「黒いカラスが見つかると、黒くないカラスが存在する確証度が下がる」という推測のものでした。この場合は「カラスの集合の数は有限の一定数」ということが推測の前提になっており、この前提は現実的なものだったのです。
話変わって、ここで次の表現の違いを見てみましょう。
A)1羽のカラスを調べて黒かったことが命題-1を確証する程度
B)黒いカラス1羽の発見が命題-1を確証する程度
Aの表現ではカラスか否かの調査と黒いか否かの調査に時間差があり、詳しくはカラスの逆説-2-、カラスの逆説-3-、カラスの逆説-4-、カラスの逆説-5-、カラスの逆説-6-、で述べたように、両調査の難易度を考察する必要が出てきます。一方Bの表現では、ある対象を調べるとカラスか否かと黒いか否かが同時にわかることになります。そしてスタンダードなベイズ統計による解釈ではBの表現が使われています。ちょっとした表現の違いで使われている前提のちがいが出てくるのは恐ろしいところです。
といったところでヘンペルの逆説の話はひとまず終わりとします。
-訂正(2016/09/29)-------------
「両調査の難易度を考察する必要」の引用リンクが抜けていたので追加した。
「ちょっとした表現の違いで使われている前提のちがいが出てくる」の文を赤字で強調した。
※コメント投稿者のブログIDはブログ作成者のみに通知されます