gooブログはじめました!

写真付きで日記や趣味を書くならgooブログ

■国産検索エンジン開発が頓挫した先にあるもの 「仮に検索エンジンが使えない、あるいは、密かにフィルタリングが行われているとしたら」 ITmediaエンタープライズ(2013年02月01日)

2022-05-22 04:36:06 | 日記

 

■国産検索エンジン開発が頓挫した先にあるもの

「仮に検索エンジンが使えない、あるいは、密かにフィルタリングが行われているとしたら」

ITmediaエンタープライズ(2013年02月01日)

https://www.itmedia.co.jp/enterprise/articles/1302/01/news021.html


~~~


「日の丸検索エンジン」とか「国産検索エンジン」「国策検索エンジン」など呼び方は多々あるが、要するに、日本で検索エンジンを作ろうというプロジェクトが2006年に存在していた(技術者視点では正確にはGoogleなどの検索エンジンとは多少趣が違っていたが、区別するほどのものではない)。


結局はうまく行かなかったが、最近になってその必要性が高いと感じるようになった。


・政府が大々的に宣伝したプロジェクト


2006年、さまざまな思惑のもとに経済産業省が検討し、2007年に掲げた大型プロジェクトがあった。「情報大航海プロジェクト」と言われたものである。


その当時にプロジェクトへ参画していた友人に、「今でもサイトが残っているのか?」と聞いたところ、「既に個別のサイトはもうない。でも本家のサイトなら今でも残っている」ということだった。


内容を見てみると、「平成19年度の取り組み」から「平成21年度の取り組み」まで掲載されているが、以降は存在していない。

事務所が2010年3月(平成21年度末)に閉鎖されたものの、サイトはそのまま残されているようである。


また、“残骸”として「情報大航海プロジェクト・コンソーシアム」という、どういう訳か英語サイトも残っている。

このプロジェクトは、50社ほどの民間企業を巻き込み、国家予算300億円を投入して「3年後には実用化しよう」という計画であった。


ところが、残念ながら下馬評通り3年で150億円ほどのお金を投じたものの、撤退するに至った。


・設立当初からあった違和感


当時、筆者は検索エンジンの周辺を開発するという友人の資料を見てある違和感を覚えた。


巨大ソフトメーカーからベンチャー企業までが混在し、一部の企業は明らかに外資系であった。

国産だから外資系がまずいというわけでなく、国防を兼ねた国家戦略としてこのプロジェクトの意義を考えれば、その技術の流出が懸念された。


友人には言えなかったが、「いったい誰が責任を持って手綱を引くのか」と感じた。

船頭は1人で良く、できれば自分の生活が掛かっているベンチャー企業で、技術力や指導力でカリスマ性を持った人間が良いと思っていたからだ。


さまざまな企業が混在する状況では大企業の社員が、音頭取りをせざるを得ない感じがして、本当にプロジェクトがまとまるのかは疑問だったのである。

結果的に、その時の筆者の懸念は現実のものになってしまった。


また周りの評論家の弁を借りるなら、「またか。官庁は懲りないし、学習能力が無いのではないか」という厳しい評価が下った。そして、なぜ「またか」なのか。

過去に頓挫した国家プロジェクトの1つに、「第五世代コンピュータ」がある。


Wikipediaによれば、「第五世代コンピュータ(だいごせだい-)とは、通商産業省(現経済産業省)が1982年に立ち上げた国家プロジェクトの開発目標である。

570億円を費やし、1992年に終結した」とある。


成果は「ほとんど何も無いに等しい」と多数の専門家が指摘している。

570億円の無駄遣い……実にもったいないものだ。


また、「シグマプロジェクト」というものもあった。

これもWikipediaによれば、「Σプロジェクト(シグマプロジェクト)は、1985年に始まった日本の国家プロジェクト。


Σ計画(シグマけいかく)とも呼ばれる。(中略)最終的に250億円(日本経済新聞1992年6月10日朝刊では218億円となっている)の国家予算をつぎ込んだといわれているが、失敗プロジェクトとなってしまった」。


本稿で、「どうして官民共同プロジェクトは成功しづらいのか」というテーマを議論するつもりはない。

国産の検索エンジンができるのを当時心待ちにしていた筆者としては、「自分が主導権を握りたかった」などと妄想してしまうほどに、残念な出来事であった。


・隣国をみてみると


中国は、独自の検索エンジン「百度(バイドゥ)」がある。


既に中国ではデフォルトで利用されている(国家指導という側面やGoogleの撤退という状況もあるが)。

韓国では「NAVER」が有名だ。


日本は恐らく8、9割のインターネット利用者は「Google」ではないだろうか。

周囲に尋ねても、Google以外の回答はほとんど聞かれない。


時々、「私はYahoo! JAPANだ」という人もいるが。今ではYahoo! JAPANの検索エンジンはGoogleになっている。

ちなみに、livedoorのWeb検索エンジンは韓国系のNAVERである。


・もし、自前の検索エンジンが無かったら


Windows 3.1や95のころ、まだPC通信が全盛でようやくPC通信のメニューの1つに「インターネット」があった時代は、アナログ電話器に音響カプラーを取り付けて、通信速度も「1200 baud(ボーと発音する)」といった状況で、画像1つ表示するのでも何十秒もかかった。


そういう時代なら検索エンジンは、あまり重要ではなかったかもしれない。

だが今の時代は、検索エンジンが無ければほとんど何もできない。


URLやIPアドレスを知っていて、じかにURLや数字の羅列を入力できる数少ないサイトを除けば、ほとんどのサイトには訪れることすらできない。

インターネットで何か調べようとするなら、まず「お気に入り」に登録してある検索エンジンサイトから始まるだろう。


その検索が一切できないなら、ほかに術が無いといっても過言ではない。


・「Google八分」の恐怖とSEO対策


「Google八分(グーグルはちぶ)」という言葉がある。

Wikipediaによると、Googleの基準に該当したページが同社のデータベースから外されて、検索結果に表示されない状態になることを指す。


「村八分」になぞらえて呼ばれるもので、Googleの検閲行為という指摘もある。

数年前に筆者に届いたジャンクメールの中に、「私の会社のサイトはGoogle八分にされ、検索結果に表示されない。


グーグルの明らかな不正行為である」というちょっと変わったものがあった。

内容を確認していないので、真偽は定かではないが、「そうしようと思えばできてしまう」という怖さを感じた。


Googleは、「原則そういう行為はしない。しかし、その国の法に抵触したり政府などから要請があれば、その限りではない」と、論理的には可能であることを認めている。

同社がまだ中国に進出していた頃、中国政府の強い要望で検閲を行っていたことは、あまりにも有名な事実だ。


かつて、筆者も実験してみたことがある。

中国のGoogleと日本のGoogleの2つのサイトを立ち上げ、「天安門事件」を日本語と中国語で検索してそのヒット件数を調べたが、その数の差は3ケタも違っていた。


また5、6年ほど前に某テレビ局の社内セミナーで、「日本のGoogleと米国のGoogleには差があるのか?」という話題が出た。

筆者がテレビ局のディレクター(だったと思う)に、「そういう話を聞いたのか? 差がある理由を知っているなら教えてほしい」と尋ねたところ、こう話された。


「CNNに務める友人からのメールですが、『○○ということが真相らしい。アダルトサイトの中にそういう事実を公開している。まだ見られるが、URLが長すぎる。Googleで○○と検索すると、その1ページ目に○○と書いてあるサイトがすぐに出てくるので分かるはずだ』というのです。しかし、見当たらない。メールでまた質問したのですが、まだ回答が無いので分かりません」


筆者は続けて「Googleのオプションを変えていますか」と尋ねると、彼は「いいえ」と答えた。

マスコミの立場で日本のGoogleをそのまま使っているのは、ちょっとマズイのではないかと思った次第である。


なぜなら、かつて中国では中国政府が求めてGoogleがフィルタリングを実施していたものの、当時の日本ではGoogleが自らの意思でフィルタリングを実施していたからである。

検索を行うのであれば、このオプション(日本向け)を外すか、米国のGoogleを利用すべきだったかもしれない。


その当時、日本のGoogleではフィルタリングが適用されており、たしか「中」がデフォルトであった(編集部注:現在は性的コンテンツなどに対しては適用される)。

オプションを外してみると、検索結果の件数は大幅に違った。


こうしたGoogleの施策を逆手にとって商売をしているのが、今でも盛んな「SEO対策(検索エンジン最適化)」である。

Googleは検索エンジンのロジックを公開していないので、さまざまな試行を元に、「こういう処理をすると検索結果が上位にできる」ということを商売にしている。


お金を払えば、小さな会社のサイトでもGoogleの検索順位を1位にできる(可能性だが)からだ。


・国産の検索エンジンは必要か


今回、国産による検索エンジンの開発を取り上げたのは、近年に新聞沙汰となっている「サイバー攻撃」などの影響があるためだ。


別の機会でもお伝えしたいが、今や世界は「サイバー攻撃」というより「サイバー戦争」という様相が強まり始めている。

日本では「SFの世界」とか絵空事のように言われているが、現実の状況がどうであるかは、最近のオバマ米大統領の動きなどを注視していると分かるだろう。


今やインターネットが無ければ、米国はもとより仮想敵国も日本も身動きがとれないという事実がある。

そのインターネットで仮に検索エンジンが使えない、あるいは、密かにフィルタリングが行われているとしたら、その影響は極めて大きい。


どのくらいの被害になるか見当もつかない。

しかも検索エンジンを停止する手間などは、ミサイルを1つ製造するコストに比べたら、はるかに手軽である。


想像力のある人なら「ぞっと」するだろう。

インターネットを使えても検索エンジンが無いというのは、「サイバーリスク」の1つとして考えるべきではないかというのが、筆者の見解である。


こういう視点には、多分に政治的な要素もつきまとうが、一般的な感覚からしても、リスクがあるのに(できる可能性があるのに)そのリスクヘッジをしないというのはおかしいと感じる。

現実の世界には「日米安保」などさまざまな仕組みがあるし、そもそも、米国と日本が敵対してしまう可能性はゼロに近いかもしれない。


一方で、政府はサイバーの世界における日本としての立ち位置をどうしたいか考えるべき時期に来ているだろう。

自前では何もできない国になりたいのだろうか。


食糧の自給率アップ、石油や天然ガスを含めたエネルギーの自給率アップなどと一緒に、「情報の自給率」アップを目指してはどうか。

その一環として、インターネットや衛星回線などの防衛策や国産検索エンジンの実現などが入ってくるだろう。

 

~~~
■国産検索エンジン開発が頓挫した先にあるもの
ITmediaエンタープライズ(2013年02月01日)
https://www.itmedia.co.jp/enterprise/articles/1302/01/news021.html

 

 


■グーグルが握っているあなたの「個人情報」 東洋経済(2018/06/06)The New York Times(執筆:Brian X. Chen記者、翻訳:藤原朝子)

2022-05-22 04:35:48 | 日記

 

■グーグルが握っているあなたの「個人情報」

東洋経済(2018/06/06)The New York Times(執筆:Brian X. Chen記者、翻訳:藤原朝子)

https://toyokeizai.net/articles/-/223696


~~~


グーグルはフェイスブックよりもずっと多くの個人情報を持っている。


それなのに、フェイスブックのような厳しい批判にさらされていない(もちろん最近フェイスブックが批判されているのは、同社が不正に個人情報を流出させていたからなのだが)。

なにしろ私たちは、ありとあらゆる場面でグーグルを利用している。


ネット検索はもとより、メール(Gmail)、カレンダー(グーグル・カレンダー)、地図(グーグル・マップ)、写真アルバム(グーグル・フォト)、動画投稿・閲覧(YouTube)、スマホのOS(アンドロイド)、そしてブラウザ(グーグルクローム)でもグーグルを使っている。


一般的なフェイスブックのユーザーが投稿する赤ん坊の写真やコメントよりも、はるかに幅広い。

 

・フェイスブックの12倍の情報量


それなのになぜ、グーグルの個人情報収集が批判されることは少ないのか。


この疑問に答えるため、私はまず、グーグルとフェイスブックが保有する私の個人情報をすべてダウンロードして、比較してみることにした。

まずわかったのは、グーグルは私について、フェイスブックの約12倍もの情報を持っていたことだ。


ただし、驚くような情報は少なかった。

グーグルが持つ情報のほとんどは、写真、文書、メールなど、私自身がグーグルのプラットフォームに置いたものだったのだ。


一方、フェイスブックに関しては驚きがたくさんあった。ダウンロードしたファイルには、私の連絡先を知っている企業500社のリストや、何年も前に削除したつもりの人を含む「友達」リストがあったのだ。


グーグルの場合は、不安ならいつでも、特定の情報(たとえば過去数年間に開いたAndroidアプリなど)をグーグルのシステムから削除できるとわかった。

ところがフェイスブックの場合、私の閲覧記録の多くは完全には削除できないことがわかった。


グーグルは何年もかけて、ユーザーが自分の情報をダウンロードできるツールを開発してきたと、広報担当のアーロン・スタインは言う。


「ユーザーは、グーグルにある自分のデータを簡単に把握し、管理できるべきだ。グーグルでは、このツールを使って自分にとって最適のプライバシー管理をするようユーザーに奨励している」。


グーグルやフェイスブックといったテクノロジー企業は、とてつもなく大きなパワーを持っている。

それは、彼らが保有する個人情報の量と比例する。


だから、これらの企業が持つあなたの個人情報を定期的にチェックして、取捨選択することを強くお勧めする。

 

(中略)

 

グーグルがあなたのどんな情報を集めているかわかったら、グーグルに保管されているのは不快だと思う情報をピックアップしよう。


これは人によって違うはずだ。

私の場合、グーグルのサービス経由でないウェブ閲覧履歴をグーグルが集めているのは嫌だと思った。


また、アンドロイド・アプリの使用履歴をグーグルが集めているのも、行き過ぎだと感じた。

そこで、「マイ・アクティビティ(myactivity.google.com)」にアクセスして、「広告」の全履歴と、アンドロイドに関する全データを削除することにした。


ついでに、グーグルの音声アシスタントの使用履歴と、グーグル・ニュースとグーグル・クローム経由のウェブ閲覧履歴も削除した。

だがそこで、はて、と思った。


ここで「削除」を選んだら、そのデータはグーグルのシステムから完全に消去されるのか、それとも目に見えない場所に隠されるだけなのか。


「Googleが収集したデータの保持」というページを見ると、ユーザーが削除したデータがグーグルのサーバーから消去されるか、「匿名化された状態で保持」されるかは、グーグルの削除方針によって決まるという。


つまりそれ以降はユーザーにはどうにもできない。

 


~~~
■グーグルが握っているあなたの「個人情報」
東洋経済(2018/06/06)The New York Times(執筆:Brian X. Chen記者、翻訳:藤原朝子)
https://toyokeizai.net/articles/-/223696


■【グーグル八分】『ウィキペディア(Wikipedia)』

2022-05-22 04:35:23 | 日記

 


■【グーグル八分】『ウィキペディア(Wikipedia)』

https://ja.wikipedia.org/wiki/%E3%82%B0%E3%83%BC%E3%82%B0%E3%83%AB%E5%85%AB%E5%88%86


~~~


グーグル八分(グーグルはちぶ)とは、グーグルの基準に該当するウェブサイトが、Googleのデータベースから除かれ、Google検索しても内容が表示されない状態になることである。


Googleの検閲行為とも言われる。

英語では「Censorship by Google」あるいは「Google Censorship」と呼ばれる。


グーグル八分とは、インターネットの検索エンジンサービス提供会社Googleが、提供する検索サービスの検索結果として表示されるはずのサイトの一覧から特定のサイトを取り除き、利用者が検索サービスを利用する際にそれらのサイトを表示しないようにすることである。


Googleは検索情報として提供される情報自体はGoogleが主体的に決定できるものであり、Googleが任意にそのようなことをする権限を持つとしている。


Googleによれば、「Google の方針として、検索結果に対する検閲は行われていません。しかしながら、各国の法律、条例、政策の求めに応じ、これを行うことがあります。」、とあり、具体的には「犯罪にからむサイト」、「SPAM的な手法によって検索順位を向上させるサイト」「個人や法人から『このサイトは自分の権利を侵害している』というクレームがあったサイト」について検索結果に表示されないよう情報を削除することがあると、インタビューで語っている。


また、このようなケースで情報の削除を行った場合については削除した事実は米国の第三者機関に提示し、該当する検索結果のページに告知するとしているが、2005年3月以前に削除された検索結果については、告知されない場合もあるとしている。


削除について、Googleは「法務部が判断し,要求が正当と考えられる場合削除する。」としている。


しかしながら、インターネットの利用に際しては検索エンジンを利用することが多く、また、検索エンジンサービスは事実上寡占状態であるため、一企業の内部的な決定で検索結果が恣意的に変更されることについては異論も多い。

 

(中略)

 

・グーグル八分と検索エンジン・ナショナリズム

 

グーグル八分のような、外国の私企業による情報の制限について危機感を持つ人々もいる。


日本においては2007年10月にCEATEC会場で、経済産業省の研究会から生まれた産学連携プロジェクト「情報大航海プロジェクト」のブースにおいて、Googleの検索結果から特定のWebサイトが表示されなくなる「Google八分」を紹介するビデオが繰り返し流され、「検索結果が海外の特定企業に決められることがどれだけ怖いか分かるだろうか」と訴えた。


同プロジェクトでは50億円をかけて日本発の次世代検索技術を研究・開発し、Googleなど米国企業に独占されている状況を打開したいという。

同様にフランスにおいては同様のプロジェクト「Quaero」(クエロ)が進められている。


~~~
【グーグル八分】『ウィキペディア(Wikipedia)』

https://ja.wikipedia.org/wiki/%E3%82%B0%E3%83%BC%E3%82%B0%E3%83%AB%E5%85%AB%E5%88%86