=日本と世界の子供たちの未来を守る=

政府の都合で報道しないニュース。
「敵」は「英米のEstablishi」支配層 と「中国共産党」と その犬 です。

人力検索エンジン「WikiaSearch」

2008年02月24日 16時14分11秒 | Weblog
seozone引用記事===========

「Wikipedia」の共同創設者の一人,Jimmy Wales氏(写真)らが新たに開発中の検索エンジン「WikiaSearch(仮称)」のリリースが間近に迫っている。シリコンバレー情報を伝えるITブログのTechCrunchは,開発途中のWikiaSearchのスクリーン・ショットを掲載し,「そのサービスが年内には開始されそうだ」と予想している(TechCrunchの記事)。Wales氏はGoogleへの対抗意識をあらわにしているわけではないが,米IT業界では「Googleを脅かすものがあるとすれば,それはWikiaSearchではないか」との見方も出てきた。


オープン・ソースの人力検索エンジン

WikiaSearchとは,Wikiaが開発中のオープン・ソースによる検索エンジンだ。詳細は後述するがWikiaSearchの特徴は,内部の仕組みを公開することで検索結果に到るプロセスの透明性を確保すること。そして一部の検索結果の編集に際して,コミュニティの意見を取り入れることだ。いわゆる「人力検索エンジン」の一種とも言える。これらがGoogleとの最大の違いであり,WikiaSearchがGoogleへの対抗馬と見られるゆえんでもある。
 WikiaSearchが注目を浴びる別の理由は,それを誰が開発しているか,という点にある。厳密にはWikiaは同名のコミュニティ・サイトを運営する営利企業であって,Wikipediaを運営する非営利団体のWikimedia Foundationとは別の組織である。しかしWikipediaの顔とも言えるWales氏がWikiaの共同創設者でもあるため,往々にして外部からは両者が混同されてしまう。今回も「Wikipediaほどの成功を収めた人達が,今度は検索エンジンの開発に乗り出したのから,ひょっとしたらGoogleに勝てるかもしれない」という期待を抱かせてしまうのだ。
 しかしながら,今のGoogleの勢いを見る限り,それに打ち勝つ企業が現れるとはなかなか想像し難い。同社の株式時価総額は11月末時点で1620億ドル余り(約18兆円),手持ちの現金資産だけでも131億ドル(約1兆5000億円)に達する。その潤沢な資力を背景に,最近では携帯電話事業に触手を伸ばし,太平洋を横断する海底ケーブルの敷設プロジェクトに出資し,果ては太陽光や地熱発電など代替エネルギー開発まで手がけようとしている。一体,どんな企業になろうとしているのか,この世界で何をやり遂げるつもりなのか,その野望は計り知れず,その勢いはとどまるところを知らない。


Googleの死角は意外にもコアの検索ビジネス
その一方で,今のGoogleに死角があるとすれば,それは意外にも同社中核の検索エンジン・ビジネスではないか,との見方もある。New York Times紙によると,「確かに今のGoogleは,検索エンジン市場で競合他社を寄せ付けない強さを見せつけている。しかしそれは,1990年代のMicrosoftが基本ソフトでIT業界を支配したような磐石な状態とは異なる。すなわちインターネット検索はしょせん,無料サービスである。その上,どんな検索エンジンでも使い方は,検索窓にキーワードを入力するだけ。つまりユーザー・インタフェースは同じだから,もしもGoogleより格段に便利な検索エンジンが登場すれば,人々は簡単に乗り換えてしまう」というのだ。

 Googleは実に様々な事業に手を伸ばしているが,その収入の大半は,いまだに「Google AdWords」や「Google AdSense」などの検索関連広告からあがっている。万一,この屋台骨が揺らぐようなことがあれば,同社が思い描く壮大なビジョンも砂上の楼閣のように崩れ落ちてしまう。とにかく今のGoogleは,あまりにも多くのことに手を出しすぎている。そのスキを突いて,本丸の検索エンジン市場を思わぬライバルに奪われないとも限らない。
 実際,New York Times紙は,2007年1月時点でシリコンバレーには新しい検索サービスに挑戦する企業が少なくとも79社は存在し,そこにベンチャー・キャピタルから3億5000万ドル(約390億円)が注ぎ込まれていると報じている。これらの中には,自然言語検索のPowersetやhakia,あるいは人力検索のMahalo.comやChaCha Searchなど,従来とは全く異なるアプローチで検索エンジンに取り組む企業もいくつかある。

意外な角度から斬り込んでくるだけに,当たればGoogleに相当の痛手を負わすポテンシャルを秘めている。
既存の検索エンジンは,内部の仕組みがブラック・ボックス状態
WikiaSearchもそうした革新的な検索サービスの一つであり,恐らく最大の期待を集めているチャレンジャーだ。そのプロデューサーであるWales氏は,今年9月に東京で開催された「THE NEW CONTEXT CONFERENCE 2007」における講演でGoogleをはじめとする今までの検索エンジンの問題点を次のように指摘した。


 「これまでの問題点は,検索エンジンの内部で何が起きているのか(一般ユーザーには)全く分からない,つまりブラック・ボックス状態になっていることだ。たとえばGoogleが(検索したWebサイトを)どのようにランキングしているのか,それは外部からは全く知りようがない。もちろん(GoogleのPageRankのように)基本的な原理は公開されているが,(具体的にランキングを決める)アルゴリズムは公開されていない」。
検索エンジンのブラック・ボックス化による弊害としては,検索結果の正当性に関する懸念がある。たとえばGoogleの検索結果に対しては,「なぜ特定のサイトが上位に表示されるのか」といった疑問や,一部サイト運営者から「なぜ我々のサイトが検索結果から外されるのか」といった非難が浴びせられることがある。内部のアルゴリズムが公開されていない以上,そうした不審や不満の声が上がるのもやむを得ない。
 Wales氏は現行検索エンジンのさらなる問題点として,いわゆる「検索エンジン・スパム」を挙げた。これはユーザーが望んでもいない検索結果,たとえば実質的な情報に乏しく,半ば商品広告のような,客観性や中立性に欠けたWebサイトを指す。Googleなど機械的なアルゴリズムに依存する検索エンジンでは,どうしても,こうした検索エンジン・スパムの混入する余地が生まれてしまう。つまり現行のままでは,スパム対策にも限界がある。
 これらの問題に対処するため,Wales氏はWikiaSearchの目標(原則)として次の4点を挙げた。
  1. 透明性:検索アルゴリズムなどの公開により,結果に信頼性を持たせる
  2. コミュニティ:一部検索結果の判断にコミュニティの意見を反映させる
  3. 品質:オープン・ソースの検索エンジンの品質が,Googleのような独自仕様(proprietary)の検索に勝ることを証明する
  4. プライバシー:検索履歴などが秘密裏に悪用されることのないよう,データの管理体制も公開する

WikiaSearchの特徴は,内部の透明性とコミュニティ活用
このうち特筆すべきポイントは(1)の透明性と(2)のコミュニティである。(3)の品質と(4)のプライバシーは,(1)と(2)の延長線上に実現されるとも言えるからだ。まず透明性に関しては,「検索エンジンの全ての部品(component)をオープン・ソース化するとともに,ランキング・アルゴリズムも公開することで,WikiaSearchの検索結果を誰もが信用できるようにする」(Wales氏)という。
 オープン・ソース化による別の利点は,開発コストを抑えられることだ。これは開発に巨費を投じることのできるGoogleに対抗する上で特に重要なことだ。この点についてWales氏は過去を振り返り,次のように語った。
 「もしもWikipediaを立ち上げるのに5万ドルが必要だったとしたら,我々にはできなかっただろう。幸いにもGNUのようなオープンソース・プラットフォームのお陰で,非常にわずかな資金でWikipediaを立ち上げることができた。今回の検索エンジンでも,優れたアイデアとプログラミングのスキルがあれば,お金をかけなくても興味深い成果を挙げることができるはずだ」。
(2)のコミュニティの活用について,Wales氏は「これまでの検索エンジンでは,検索結果のランキングをコンピュータ・プログラムが決めていたが,(WikiaSearchでは)これをある程度,人間の判断に委ねたい。なぜなら,本来は機械より人間の方が正しい判断を下せるからだ。もちろん,人手に任せるのは,全ての検索に対してではなく,検索される回数が非常に多くなりそうな,一部のキーワードに対してだけだ。そのために(検索結果の)編集権をコミュニティに開放して,大々的にユーザーの参加を呼び起こしたい」と語った。
 講演でWales氏はこれ以上の詳細を明らかにしなかったが,「検索結果の編集に関してユーザーの参加を呼び起こす」とは,恐らく次のような形であろう。それはリアルタイムの参加ではなく,使用頻度が多くなりそうな一部のキーワードに対する検索結果をあらかじめ人力で作っておいて,実際の検索があった場合にそれを表示するということである。
 このようにあらかじめ検索結果ページを作成する際には,第1段階として既存の検索エンジンと同じく,想定されるキーワードでもってコンピュータ・プログラムがとりあえず検索サイトの表示ランキングを決める。その結果をコミュニティに公開して,参加者が意見を出し合って上位サイトのみ表示順位を決め直す。この際に,検索スパムのようなWebサイトは人間の判断で排除される。以上が「検索結果の編集」である。このランキングは後日,必要に応じて変更可能だが,とりあえずはその結果をサーバーに保存しておき,実際にユーザーがそのキーワードで検索をかけたときに,保存しておいた編集済みの検索結果ページを表示するのであろう。また,当然ながら検索結果ページの編集プロセスも記録として残され,誰でも見ることができる。
 筆者の予想も若干入っているが,以上が「透明性」と「コミュニティ活用」を特徴とするWikiaSearchのおおまかな輪郭である。

「マシーン」対「人力」の勝負
読者の中にはしかし,いまさら新しい検索エンジンが必要なのか,という意見の方もおられると思う。実際,Googleなど既存の検索エンジンで,かなり満足している人が多いかもしれない。しかしながら,何か新しいものを使ってみて初めて,それまでの不便さが分かるというケースも往々にしてある。
 WikiaSearchのような人力検索の長所は,人間ならではの,きめ細かい編集作業にある。単に検索結果の表示順位を適正化するだけでなく,たとえば「文章」「写真」「ビデオ」などカテゴリーに分けて表示することも可能だ。あるいは,それをさらに一歩進めて,検索結果から情報を抽出・整理して,よりユーザーの要求に合致したホームページを作成・蓄積していくことも可能だ。こうなると単なる検索エンジンというより,むしろWikipediaやWikiaのようなコミュニティ的データベースに近くなる。
 いずれにせよ,人間の判断で検索スパムなど不要なサイトをあらかじめ取り除き,高品質のWebサイトのみを抽出する。それらが美しく整理された表示画面をユーザーが目にしたとき,それ以前の機械的アルゴリズムによる乱雑な検索結果を返す検索エンジンが,急に色褪せて見える可能性は十分にある。
 WikiaSearchの成功は,Web2.0ならではのマンパワーをどこまで集められるかにかかっている。これについてWales氏は,講演の締めくくりで次のようにクギを刺している。
 「WikiaSearchのベータ版は,今年12月末までには公開したいと思っている。しかし当面は,良い結果を期待しないでほしい。初めてWikipediaを公開したときも,投稿された記事は2本しかなかった。最初から,フルスケールの素晴らしいサービスを提供することは不可能だ。まずはコミュニティに開放してから,1,2年の努力が必要だ」。
 しかし知名度ゼロで始まったWikipediaとは異なり,WikiaSearchは当初から多大な注目を浴びながらスタートする。それだけに,コミュニティの成長も早いだろう。Googleを脅かす存在になる日は,意外に早く訪れるかもしれない。