ネット情報の「ウソ発見器」を総務省が開発する
ここのニュース
ネット情報「ウソ発見器」 総務省が開発へ
http://www.asahi.com/national/update/0826/TKY200608260179.html
ということは、本家にも書いた。
で、本家では、このシステム、「政府やマスコミが虚偽情報を流すと、本当のことを書いたサイトは、デマになっちゃわないか・・・」ということを書いて、理由は分家に書くと書いた。
ここでは、その理由について書いてみたい。
上記のニュースには、この「ウソ発見器」のしくみをこんな風に書いてある。
ネット上にある関連深い別の情報を探し出し、比較参照することで、情報の「デマ率」などを示す。
この方式を推測すると、こんなかんじ
1.ネット中のキーワードか、共起関係をチェックして、同じような文章をさがしだす
→これは、一般的に行われる。
東京大学のMIMA-searchなどもおんなじようなもんだろう
2.チェックする文章と1で集められた文章の相関を調べる。
→これは、文章の意味的相関になる
冥王星は惑星ではない
冥王星は惑星である
共起関係、キーワードなどでは、この2文は、ほとんど同じだが、意味は正反対で、どっちかがほんとで、どっちかが、デマだ。どっちがデマかは、調査時間によるけど。。
なんで、文章の意味まで考えて、相関関係をとることになる。
というか、共起とかかり受け関係で、2つの文章の相関がきまる(正規化して0から1であらわす)。
で、この文章の命題が、どちらも肯定文、あるいはどちらも否定文なら、相関はプラス(つまり
*1する)、どっちかが肯定、どっちかが疑問ならマイナス(-1)、決められない(どっちかが疑問文など)はノーカウント(*0)とすれば文章の相関はもとまるが、まあ、もっと難しいことをするんだろう。沽券にかけても。。
3.それらの文章の相関の平均(加重平均?)をもとめ、デマ率とする。
ただし、このやりかたは、数の論理であり(多いほうが正しくなる)、この場合だと、いくつか問題がある
・まったく今まで考えたことも無いものは、デマかどうかわかんない
たとえば、ある女優が会社員と結婚とかいうのは、わからない。付き合っているという報道が無い場合、デマかどうかわからない。。付き合ってるとか、熱愛は、もっとわかんない。
そして、芸能ネタというのは、ここをついてきて、デマかどうかわかんないようなところが流れてくるからおもしろい。
・同じようなウソ情報が一斉に出てしまったら、本当の情報のほうが、デマとなってしまう。
たとえば、政府がなにかの情報を隠したいので、ウソの情報を流すようなことがあったと、仮にしよう。そうすると、マスコミもその情報を流す。
ここで、本当のことを1人がブログに書いたとしても、そのブログがウソということになってしまう。なぜなら、関連するニュースは、政府やマスコミという、圧倒的多数、かつ権威が流しているわけで、そうすると、数の論理で調べるこの方式では、ウソ情報を流した政府マスコミのほうが本当で、真実を暴露したブログの方がウソになってしまう。
つまり、このシステムの問題は、デマの判断にある。
証拠の妥当性と、情報発生源を調べるのであれば、正しい判断はできる”かも”しれない。
しかし、数の論理で調べると、デマっていうのは、もともと、多くの人が、ウソをいうので、デマになるんであるから(少ない人が言っても、世の中誰も気にしない)多くの人が同じこといってるからって、デマかどうかはわからない。
ということで、政府がなにかの情報を隠したいので、ウソの情報を流すようなことがあったとしたら、このシステムでは、真実としてしまうんで、このやり方ではあんまり意味ないと思うんだけどお
。。。まさかまさか、それが、本当の目的(>_<!)
。。。きっと、このブログは、そのシステムでしらべたら、デマ率100%になるにちがいない!