さあ、選手入場です。
「赤コーナー、グーグル・ザ・デビルーー!!」
って、違います!
どうも「evil臭」を発しているらしい、という憶測を呼んでいるようです>グーグル
腐敗臭、老人臭などのネガティブイメージがある「臭い」ですが、グーグルさんといえども臭いを嗅ぎつけられることからは避けられないということなのかもしれませんね。
グーグルが収集している280項目以上のユーザーデータ一覧/グーグルのダークサイド(後編) Web担当者Forum
うーん、これだけの情報からは何とも言えないわけですが、多分何かを考えているのだろうと思います。それが一体何なのか、というのは、機械音痴の私にはまるで判らないのですけれどもね(笑)。専門知識のある人たちが見れば、きっとその「何か」を突き止めることが可能かもしれません。
とりあえず私がグーグルだったら、ということで、その立場になって考えてみます。技術的に可能なのか、法的にどうなのか、そういったことは一切無視してみます(どうせ判らないので)。
①cyber seeker
普通、何気なくネットをふらふら移動していたりすると思いますけれども、それは「何らかの選択の結果である」という発想ではないかと思います。単純に言えば、あるページに到達したのは何故なのか、ということを知ろうということかな、と。finalventさんのブログを読みに来る人たちというのは、どういう風に到達できたか、みたいなことです。あるリンクを偶然クリックしたのか、何かの検索語から選択されたのか、そういうデータを膨大に集めてみると、偶然という要素は限りなく少なくなり、逆に「必然性」というものを見出せるのではないか、というようなことです。その到達した人間の特性を知る事ができれば、行動様式?or行動特性?のようなものを予測することが可能になるのではないか、そんなようなことかな。それには、人間モデルみたいなものが必要になるのかも。架空の人間を生み出すことに成功すれば、その架空の人間の振る舞いそのものが人工知能への道を切り開けるのではなかろうか――。そうした架空の人間モデルをとりあえずcyber seekerと名付けよう。グーグルが当面の目標としているのは、完成度の高いcyber seekerを作り上げることなのではなかろうか。
参考記事:政府の○(「猟犬システム」を追加)
②個体としてのモデル
これまでだと、趣味とか興味のあることをアンケートで聞けば、仮に「旅行」を選んでいた人たちは、海外旅行の案内や航空会社のHPを訪れる(クリックする)可能性は高い、みたいなことは知られていたかもしれません。普通に考えれば、多分そうなるだろうな、というのは理解しやすそうです。自分が殆ど関心を持たないものは滅多にクリックしないだろう、という確率的な話だと思いますので。月に1度も洋品店や衣料品屋に行かない、年に○回しか行かない、といった服装・ファッションに関心のない人が頻繁に服を買うかというと、それは難しいだろうというようなことです。これは人数が大きい場合には、より信頼度が上がるということだろうと思いますが、個別の人の振る舞いまでは判りませんよね。cyber seekerは、これではダメなのだと思います。もっと個体レベルの予測精度を高めたいはずですから、マスの確率的な話ではダメなんだろう、ということです。極端に言えば、マスは「人間ではありません」。
喩えていうと、「1ℓの空気」というものがマスであるとすれば、気体分子のそれぞれに目印をつけて、その分子の動きを全部観察する、というのと同じですね。「酸素分子21番」とか、「窒素分子139番」とか、そういうのを観察する、ということです。空気全部の振る舞いを観察するのと、個々の分子を見るのとでは違いますからね。医療での造影検査とか、実験での放射性同位元素の観察とか、そういうのと発想が近いかもしれません。どこを通過し、どこに取り込まれ、どこの組織や細胞に辿りつきやすいのか、みたいなものを突き止めようとするのと似ているのです。
したがって、cyber seekerでより重視されることは、「同一性」ということではなかろうか、と思うのです。
これはどういうことかといえば、ネット上で匿名さんであっても特定のidが通用している、というようなことです。ブログなんかで特定のidを持つ人間の振る舞いは、「同一性」が大体保たれていて、ある行動パターンを形成しているのではないでしょうか、ということです。時間経過を追って観察していると、人間性を帯びてくるみたいなものです。「どういう傾向の人か」「どんな振る舞いをしているか」みたいなことをネット上で観察していれば、好きなものの傾向とか得意分野といった特定個人に関する情報をある程度知ることが可能です。しかもその人物がどういったネットワークを形成しているのか、ということも観察されるようになります。それを調べていくことが、cyber seekerの基本モデルには必須なのではなかろうか、と。
ですので、同一性、特定個体の形成パターン、これを時系列的に追うことがcyber seekerには必要なのだろうな、ということです。
③trace情報を構築すること
ある人物がネット上を移動していく経路は、たった一つの組み合わせしかないだろうと思います。同一の経路を持つ人間は、多分存在していないと思います。そういう「たった一つ」ということそのものが、個体特性ということではないのかな、と。人間がそれぞれに異なっているということと、まさに似ているのです。初めてネット接続して以降、自分が通過してきた経路は、全くの適当に描いた鉛筆の線みたいなもので、どんな風な模様になっているかは判りませんが、同一の模様を持つ人間は世界中に存在していないだろう、というようなことです。
参考記事:続・思考の自由と脳
例えば、画用紙に針の先ほどの、ある一点を設定しておきます。1億人に適当に好きな線を描かせます。幼児みたいにグルグルと何重に円を描いてもいいし、花の絵を描いてもいいし、前衛美術みたいなワケの判らん模様でもいいし、何だっていいですが、その線が「ある一点」を通過しているかどうかを見てみるのです。そうすると、その点を通過した人たちの、特定の集団(集合?)ができあがり、その人たちの個体特性を調べていけば、「何故その模様が描かれたのか」ということを考えることができるようになるかもしれない、と。これまでのコンピュータというのは、事前に「この点を通過する線を描け」というアルゴリズムを組み込んでおかないとならなかったけれども、完成度の高いcyber seekerの基本(1人の人間)モデルであれば、「鉛筆で好きな線を自由に描いて下さい」というと「ある一点」を通過する線を描けてしまう、というようなことです。
こうした時系列的観察は、developmentやevolutionを追っていくのと似ており、その過程をtracingでき再現できるならば、それは限りなく人間に近づく、というようなことではないかと思います。
④偶然と必然
trace情報を分類したり、共通性を見出したりすることができれば、例えば「A地点を通過したことがある人」はかなりの確率でB地点にいずれ到達できるだろう、みたいな予測が可能になっていくのではないかと思います。それが経路の描画パターンみたいなことの意味です。けれど、描画パターンが全くのランダムであり、何らかの法則性とか傾向を見出せていないかもしれません。個体数の情報量が足りないのか、もっと別な因子(ネット上から得られる情報では欠けている要因)によるのか、理由は判りませんが、まだまだ始まったばかりという程度かもしれません。でも、将棋の棋譜データみたいなものと似ていて、ある種の必然性みたいなものは多分あるかもしれないな、と個人的には思っています。将棋ソフトの強いプログラムになれば、詰みは逃しませんよね。数ある手の候補の中から、たった一つの「必然の組み合わせ」が確実に抽出される、ということです。局面の組み合わせとか、膨大な数に上りますけれども、trace情報(過去の膨大な棋譜)が構築されていると、より必然性みたいな部分が多くなってくる、ということです。数手後までの予測精度はかなり高まる、というのと同じです。グーグルは、これをネット世界で行おうとしているのではないだろうか、と。
あるページに特定の情報やリンクなどを組み込んでおけば、「そこをクリックするだろう」ということを事前に予測可能になっていくかもしれない、ということですかね。ある種の誘導手段と言ってもいいかもしれません。本人は偶然そこを「自分の意志で」クリックしたと思い込んでいるかもしれませんが、グーグルさんの手のひらの上でしかなかった、みたいなことになってしまうかも(笑)。
これまでだと、個人の好みがある程度判るので、例えば「料理」「洋服」「化粧品」「バッグ」「下着」「旅行」みたいに自分の好む情報ばかりを送り込んでいたかもしれませんが、好きなものばかりを並べられても選べないということはあるので(レストランなどで注文する時に好物ばかりでは他の全部を諦めることになってしまう、みたいなもんです)、ダミー情報(あまり関心の高くないような情報)なんかも並べておかないと、うまく誘導路に乗ってきてくれないことだってあるかもしれません。特定の一つの色を浮かび上がらせる為には、その他の膨大な無駄な色も必要なのかもしれない、というようなことです。認識の問題?なのかもしれませんが。
ある子どもがいて、一番お気に入りの色は赤だとします。この子どもにクレヨンで絵を描かせる場合、クレヨンのセット全部が赤い色であると、12本のうち特定の1本を選ばせるのは難しくなるかもしれないが、赤いクレヨンが1本しかなく、残りが全部違う色であると、「必ず赤いクレヨンを手に取るだろう」という事前予測は行い易くなる、ということです。「赤い色が好き」という意味は、そういうことを含んでいるということかな、と。
⑤side effect
ある特定個人のネット上での振る舞いをtraceできるとなれば、様々な形で利用できることになります。判りやすいのは要注意人物の割り出しです。ある特定のページや情報を探している人間は、後々の行動結果として「爆弾テロに関与していた」というパターンが発見できれば、当局が行動監視できるようになるでしょう。反政府的立場を取る人間については、何かの弱みを握ったりとかできるかもしれません。
良し悪しは別として、もしも私だったら、ある層を抽出することを考えると思う。全世界で何億人のデータを集めているのかは不明ですが、その中から将棋でいえば「アマ高段者」「プロ棋士クラス」に該当するような個人を探し出してくると思う。そのパターンを再現できれば「人工頭脳」でありながら強い棋士というのを生み出せるかもしれないから。あと、影響力行使の大きさを考えるのではないかと思う。ある程度の核を形成する個人というのを選び出し、その個人向けに「特定情報」の誘導を与えれば、その他大勢に影響を与えることが可能になるから。神経核に該当するような個人、みたいなことかな。その個人は偶然目にした(と本人は思っている)情報から、別の何らかの情報発信を行ってしまう、というようなことです。そうすると、大衆操作を可能にするのではなかろうか、と。あたかも自由意思のように見えて、実は用意された道筋だった、みたいなことです。
現在、これに類することがあって、それはネット上のニュースなんかにそうした傾向のものが、地雷のように置かれているのではなかろうかと思う時がありますね。設置した側は「ほら、踏め、そこだ、踏め」とトラップ体勢で待っていて、まんまとそのニュースを読むと「やっぱりな」とほくそえむ、みたいなことです(笑)。そんなことが現実にあるかどうかは知りませんけど。わざと目につく場所に設置しておく、というのは、情報操作の基本的なことでしょうからね。
⑥その他
グーグルには無関係な話です(evil ではないでしょうから、笑)。
過去に自分が訪れたページやコメントを記入したページが、何処かの知らない誰かに探索されたのではないか、というような、畏れを抱いたことはあります(探索されたからといって、特別に困るわけでもないですが)。実際にそういうことがあるのかどうかは判りません。技術的に可能なのかどうかも判りません。が、ある種の出来事が「ひょっとして自分のせいなのではないか」と怖れたりしたことはあります。
陰謀論だとか、自意識過剰だとか、そういうのは頭では理解しているつもりだし、自分の中でもどうせ世迷言さと思っていても、「誰かにつけられているのではないだろうか」みたいな不安はありますよ。ネット上のストーカーということではないけれど、こちらがネット上で「何を見たか」「何を書いたか」というのを調べられたのではなかろうか、というような山勘というか気配というか、そういうようなことですね。ネット世界で、まさか「風の息吹を感じ取れ」(笑)ってなことは有り得ないと判っているのですが。
そういった意味でも、グーグルのデータ構築というのはちょっと怖いけれど、ある程度手の内がバレてしまうなら、それはそれでしょうがない。でも、検索語が「何故○○なのか?」というのがグーグルさんにはよく判らない場合というのがあるだろう。
検索に入れる語が必ずしも「自分が知りたい事柄」を直接入れているわけではないという場合を、まだ区分できる手段を持っていないと思います。ああ、いや、クリックパターンを見れば、判ってしまうか。
ま、ウチのブログごときは、ネットの海に埋もれて沈んでいくのがオチなので、どうだっていいんですがね。
「赤コーナー、グーグル・ザ・デビルーー!!」
って、違います!
どうも「evil臭」を発しているらしい、という憶測を呼んでいるようです>グーグル
腐敗臭、老人臭などのネガティブイメージがある「臭い」ですが、グーグルさんといえども臭いを嗅ぎつけられることからは避けられないということなのかもしれませんね。
グーグルが収集している280項目以上のユーザーデータ一覧/グーグルのダークサイド(後編) Web担当者Forum
うーん、これだけの情報からは何とも言えないわけですが、多分何かを考えているのだろうと思います。それが一体何なのか、というのは、機械音痴の私にはまるで判らないのですけれどもね(笑)。専門知識のある人たちが見れば、きっとその「何か」を突き止めることが可能かもしれません。
とりあえず私がグーグルだったら、ということで、その立場になって考えてみます。技術的に可能なのか、法的にどうなのか、そういったことは一切無視してみます(どうせ判らないので)。
①cyber seeker
普通、何気なくネットをふらふら移動していたりすると思いますけれども、それは「何らかの選択の結果である」という発想ではないかと思います。単純に言えば、あるページに到達したのは何故なのか、ということを知ろうということかな、と。finalventさんのブログを読みに来る人たちというのは、どういう風に到達できたか、みたいなことです。あるリンクを偶然クリックしたのか、何かの検索語から選択されたのか、そういうデータを膨大に集めてみると、偶然という要素は限りなく少なくなり、逆に「必然性」というものを見出せるのではないか、というようなことです。その到達した人間の特性を知る事ができれば、行動様式?or行動特性?のようなものを予測することが可能になるのではないか、そんなようなことかな。それには、人間モデルみたいなものが必要になるのかも。架空の人間を生み出すことに成功すれば、その架空の人間の振る舞いそのものが人工知能への道を切り開けるのではなかろうか――。そうした架空の人間モデルをとりあえずcyber seekerと名付けよう。グーグルが当面の目標としているのは、完成度の高いcyber seekerを作り上げることなのではなかろうか。
参考記事:政府の○(「猟犬システム」を追加)
②個体としてのモデル
これまでだと、趣味とか興味のあることをアンケートで聞けば、仮に「旅行」を選んでいた人たちは、海外旅行の案内や航空会社のHPを訪れる(クリックする)可能性は高い、みたいなことは知られていたかもしれません。普通に考えれば、多分そうなるだろうな、というのは理解しやすそうです。自分が殆ど関心を持たないものは滅多にクリックしないだろう、という確率的な話だと思いますので。月に1度も洋品店や衣料品屋に行かない、年に○回しか行かない、といった服装・ファッションに関心のない人が頻繁に服を買うかというと、それは難しいだろうというようなことです。これは人数が大きい場合には、より信頼度が上がるということだろうと思いますが、個別の人の振る舞いまでは判りませんよね。cyber seekerは、これではダメなのだと思います。もっと個体レベルの予測精度を高めたいはずですから、マスの確率的な話ではダメなんだろう、ということです。極端に言えば、マスは「人間ではありません」。
喩えていうと、「1ℓの空気」というものがマスであるとすれば、気体分子のそれぞれに目印をつけて、その分子の動きを全部観察する、というのと同じですね。「酸素分子21番」とか、「窒素分子139番」とか、そういうのを観察する、ということです。空気全部の振る舞いを観察するのと、個々の分子を見るのとでは違いますからね。医療での造影検査とか、実験での放射性同位元素の観察とか、そういうのと発想が近いかもしれません。どこを通過し、どこに取り込まれ、どこの組織や細胞に辿りつきやすいのか、みたいなものを突き止めようとするのと似ているのです。
したがって、cyber seekerでより重視されることは、「同一性」ということではなかろうか、と思うのです。
これはどういうことかといえば、ネット上で匿名さんであっても特定のidが通用している、というようなことです。ブログなんかで特定のidを持つ人間の振る舞いは、「同一性」が大体保たれていて、ある行動パターンを形成しているのではないでしょうか、ということです。時間経過を追って観察していると、人間性を帯びてくるみたいなものです。「どういう傾向の人か」「どんな振る舞いをしているか」みたいなことをネット上で観察していれば、好きなものの傾向とか得意分野といった特定個人に関する情報をある程度知ることが可能です。しかもその人物がどういったネットワークを形成しているのか、ということも観察されるようになります。それを調べていくことが、cyber seekerの基本モデルには必須なのではなかろうか、と。
ですので、同一性、特定個体の形成パターン、これを時系列的に追うことがcyber seekerには必要なのだろうな、ということです。
③trace情報を構築すること
ある人物がネット上を移動していく経路は、たった一つの組み合わせしかないだろうと思います。同一の経路を持つ人間は、多分存在していないと思います。そういう「たった一つ」ということそのものが、個体特性ということではないのかな、と。人間がそれぞれに異なっているということと、まさに似ているのです。初めてネット接続して以降、自分が通過してきた経路は、全くの適当に描いた鉛筆の線みたいなもので、どんな風な模様になっているかは判りませんが、同一の模様を持つ人間は世界中に存在していないだろう、というようなことです。
参考記事:続・思考の自由と脳
例えば、画用紙に針の先ほどの、ある一点を設定しておきます。1億人に適当に好きな線を描かせます。幼児みたいにグルグルと何重に円を描いてもいいし、花の絵を描いてもいいし、前衛美術みたいなワケの判らん模様でもいいし、何だっていいですが、その線が「ある一点」を通過しているかどうかを見てみるのです。そうすると、その点を通過した人たちの、特定の集団(集合?)ができあがり、その人たちの個体特性を調べていけば、「何故その模様が描かれたのか」ということを考えることができるようになるかもしれない、と。これまでのコンピュータというのは、事前に「この点を通過する線を描け」というアルゴリズムを組み込んでおかないとならなかったけれども、完成度の高いcyber seekerの基本(1人の人間)モデルであれば、「鉛筆で好きな線を自由に描いて下さい」というと「ある一点」を通過する線を描けてしまう、というようなことです。
こうした時系列的観察は、developmentやevolutionを追っていくのと似ており、その過程をtracingでき再現できるならば、それは限りなく人間に近づく、というようなことではないかと思います。
④偶然と必然
trace情報を分類したり、共通性を見出したりすることができれば、例えば「A地点を通過したことがある人」はかなりの確率でB地点にいずれ到達できるだろう、みたいな予測が可能になっていくのではないかと思います。それが経路の描画パターンみたいなことの意味です。けれど、描画パターンが全くのランダムであり、何らかの法則性とか傾向を見出せていないかもしれません。個体数の情報量が足りないのか、もっと別な因子(ネット上から得られる情報では欠けている要因)によるのか、理由は判りませんが、まだまだ始まったばかりという程度かもしれません。でも、将棋の棋譜データみたいなものと似ていて、ある種の必然性みたいなものは多分あるかもしれないな、と個人的には思っています。将棋ソフトの強いプログラムになれば、詰みは逃しませんよね。数ある手の候補の中から、たった一つの「必然の組み合わせ」が確実に抽出される、ということです。局面の組み合わせとか、膨大な数に上りますけれども、trace情報(過去の膨大な棋譜)が構築されていると、より必然性みたいな部分が多くなってくる、ということです。数手後までの予測精度はかなり高まる、というのと同じです。グーグルは、これをネット世界で行おうとしているのではないだろうか、と。
あるページに特定の情報やリンクなどを組み込んでおけば、「そこをクリックするだろう」ということを事前に予測可能になっていくかもしれない、ということですかね。ある種の誘導手段と言ってもいいかもしれません。本人は偶然そこを「自分の意志で」クリックしたと思い込んでいるかもしれませんが、グーグルさんの手のひらの上でしかなかった、みたいなことになってしまうかも(笑)。
これまでだと、個人の好みがある程度判るので、例えば「料理」「洋服」「化粧品」「バッグ」「下着」「旅行」みたいに自分の好む情報ばかりを送り込んでいたかもしれませんが、好きなものばかりを並べられても選べないということはあるので(レストランなどで注文する時に好物ばかりでは他の全部を諦めることになってしまう、みたいなもんです)、ダミー情報(あまり関心の高くないような情報)なんかも並べておかないと、うまく誘導路に乗ってきてくれないことだってあるかもしれません。特定の一つの色を浮かび上がらせる為には、その他の膨大な無駄な色も必要なのかもしれない、というようなことです。認識の問題?なのかもしれませんが。
ある子どもがいて、一番お気に入りの色は赤だとします。この子どもにクレヨンで絵を描かせる場合、クレヨンのセット全部が赤い色であると、12本のうち特定の1本を選ばせるのは難しくなるかもしれないが、赤いクレヨンが1本しかなく、残りが全部違う色であると、「必ず赤いクレヨンを手に取るだろう」という事前予測は行い易くなる、ということです。「赤い色が好き」という意味は、そういうことを含んでいるということかな、と。
⑤side effect
ある特定個人のネット上での振る舞いをtraceできるとなれば、様々な形で利用できることになります。判りやすいのは要注意人物の割り出しです。ある特定のページや情報を探している人間は、後々の行動結果として「爆弾テロに関与していた」というパターンが発見できれば、当局が行動監視できるようになるでしょう。反政府的立場を取る人間については、何かの弱みを握ったりとかできるかもしれません。
良し悪しは別として、もしも私だったら、ある層を抽出することを考えると思う。全世界で何億人のデータを集めているのかは不明ですが、その中から将棋でいえば「アマ高段者」「プロ棋士クラス」に該当するような個人を探し出してくると思う。そのパターンを再現できれば「人工頭脳」でありながら強い棋士というのを生み出せるかもしれないから。あと、影響力行使の大きさを考えるのではないかと思う。ある程度の核を形成する個人というのを選び出し、その個人向けに「特定情報」の誘導を与えれば、その他大勢に影響を与えることが可能になるから。神経核に該当するような個人、みたいなことかな。その個人は偶然目にした(と本人は思っている)情報から、別の何らかの情報発信を行ってしまう、というようなことです。そうすると、大衆操作を可能にするのではなかろうか、と。あたかも自由意思のように見えて、実は用意された道筋だった、みたいなことです。
現在、これに類することがあって、それはネット上のニュースなんかにそうした傾向のものが、地雷のように置かれているのではなかろうかと思う時がありますね。設置した側は「ほら、踏め、そこだ、踏め」とトラップ体勢で待っていて、まんまとそのニュースを読むと「やっぱりな」とほくそえむ、みたいなことです(笑)。そんなことが現実にあるかどうかは知りませんけど。わざと目につく場所に設置しておく、というのは、情報操作の基本的なことでしょうからね。
⑥その他
グーグルには無関係な話です(evil ではないでしょうから、笑)。
過去に自分が訪れたページやコメントを記入したページが、何処かの知らない誰かに探索されたのではないか、というような、畏れを抱いたことはあります(探索されたからといって、特別に困るわけでもないですが)。実際にそういうことがあるのかどうかは判りません。技術的に可能なのかどうかも判りません。が、ある種の出来事が「ひょっとして自分のせいなのではないか」と怖れたりしたことはあります。
陰謀論だとか、自意識過剰だとか、そういうのは頭では理解しているつもりだし、自分の中でもどうせ世迷言さと思っていても、「誰かにつけられているのではないだろうか」みたいな不安はありますよ。ネット上のストーカーということではないけれど、こちらがネット上で「何を見たか」「何を書いたか」というのを調べられたのではなかろうか、というような山勘というか気配というか、そういうようなことですね。ネット世界で、まさか「風の息吹を感じ取れ」(笑)ってなことは有り得ないと判っているのですが。
そういった意味でも、グーグルのデータ構築というのはちょっと怖いけれど、ある程度手の内がバレてしまうなら、それはそれでしょうがない。でも、検索語が「何故○○なのか?」というのがグーグルさんにはよく判らない場合というのがあるだろう。
検索に入れる語が必ずしも「自分が知りたい事柄」を直接入れているわけではないという場合を、まだ区分できる手段を持っていないと思います。ああ、いや、クリックパターンを見れば、判ってしまうか。
ま、ウチのブログごときは、ネットの海に埋もれて沈んでいくのがオチなので、どうだっていいんですがね。