一般に日本で「プロファイリング(profiling)」と言えば、犯罪捜査において犯罪の性質や特徴から行動科学的に分析し、犯人の特徴を推論することを指す言葉として知られています。
テレビの刑事ドラマでは、しばしばアメリカのFBIなどで訓練を積んだ優秀なプロファイラーなどが登場して、事件現場の細かな状況などから(意外な)犯人像を言い当てたりしています。
もっとも、英単語としてのプロファイリングは、(少なくとも現在では)犯罪分野だけでなくもう少し広い意味で使われることが多いようです。
個人の経歴をまとめた「プロフィール」はフランス語の「Profil」を語源とする言葉で、その名詞形である「プロファイリング(Profiling)」は、「ある分野における能力を評価・予測するため、若しくは人々の分類の識別を支援するために、個人の精神的及び行動的特性を記録・分析すること」にあるとされます。
実際、こうしたプロファイリングはインターネットの登場によって今では広告ビジネスの世界にワールドワイドで広がり、私たちの生活に身近なものとなっています。
ウェブの閲覧履歴などを分析して、性別や年代を推測することはインターネット登場以降盛んに実施されるようになっています。
最近ではSNS上で「いいね!」ボタンを押したデータやリツイートのデータを集めて、個人の趣味嗜好をより高い精度で推測できるようになっているということです。
また、スマートフォンの登場によりそこに位置情報が加わり、現実の世界での行動特性もデータとして収集・分析できるようになったとされています。
こうして、ネット上の閲覧履歴や消費活動、意思表示や移動状況などが匿名の個人に紐づけられ、行動履歴データとして分析・評価される。つまりプロファイリングされることで、(例え犯罪者でなくても)個人の人物像をかなり詳細に描くことが可能となっていると伝えられています。
こうした現実を踏まえ、10月16日の日経新聞のコラム「経済教室」では、「ビッグデータの理想と現実」と題する連載において国立情報学研究所副所長の佐藤一郎氏が(こうして社会に広く普及する)プロファイリングの課題について論じています。
ビッグデータの活用において、パーソナルデータは最も重要な対象であると同時に、ビッグデータが新たなパーソナルデータを作り出してもいると、佐藤氏はこの論考で説明しています。
かつてパーソナルデータ(個人情報)といえば「氏名」や「住所」「年齢」などを指すことが多かった。しかし、あらゆるモノがネットにつながるIoTが広がり、センサーやカメラなどが集めるパーソナルデータがそこに含まれるようになっていると氏は言います。
そして、ビッグデータにおいてこれから重要となるのは、そうしたデータに基づくプロファイリングから得られたパーソナルデータだということです。
ここで言う「プロファイリング」とは、ある個人に関する部分的な情報を何らかの外部情報で補完することにより、その個人の特性などを推定すること。ビッグデータ向けの処理技術を駆使することで、(現在では)多数の個人に関してプロファイリングを行うことが可能になっていると氏はしています。
氏によれば、実はSNSでは、ユーザー本人が入力した書き込みなどのデータよりも、SNS事業者がユーザーをプロファイリングして生成したデータの方がその量が圧倒的に多いということです。
しかし、そこには大きく2つの問題があるというのが佐藤氏の認識です。
氏はその一つを、プロファイリングに使う情報が断片的で、精度が高いとは言えないことだとしています。
佐藤氏によれば、しばしば間違ったプロファイリング結果により、個人の権利・利益の侵害を招いているということです。
例えば、SNSにおける過去の過激な書き込みによって人格が不当に評価されてしまうことがある。プロファイリングでは、本人と類似した行動をする他人の情報を参考にするため、その(他人の)行動に問題(ローンの返済遅延が多いなど)があると、本人も同様に扱われてしまうことがあるということです。
そして、問題の二つ目は、プロファイリングが事業者内部で行われるため、個人は自分自身のプロファイリング内容はもちろんプロファイリングされていることすら知らないことだと氏はしています。
このため、(事業者によって勝手に推定された)プロファイリング結果についての修正や削除には非常な困難が伴うことになるというのが佐藤氏の指摘です。
海外ではクレジットカードなどの支払い状況に加えて、SNSでの言動など多様なパーソナルデータをもとにした個人に対する格付けが進んでいると氏は言います。
例えば、中国では現在、アリババグループの関連企業が開発した個人信用評価システム「芝麻信用」(ジーマ信用、セサミ・クレジット)が、中国では都市部を中心に爆発的に広がっていると伝えられています。
高スコアの格付けを得ることでローンを受けやすくなったり特定のサービスを受けたりすることが可能となるばかりでなく、一般社会においても、お見合いの際にスコアの提示を求められたり好スコアの人は就職が有利になったりする場合もあると聞きます。
人々は、芝麻信用の格付けを上げるべく、借り入れを少なくしたり慈善事業に寄付をしたりと涙ぐましい努力をしているそうですが、格付けの指標となる項目が公開されていないため、本人には自分の評価の根拠がわからないということです。
こうして、ビッグデータがもたらしたバーチャルなプロファイリングに、リアルな社会に生きる自分が振り回されてしまうことにもなりかねない。
そのような社会の到来を前提として、個人が自分に関わるパーソナルデータを把握し、それをコントロールできる仕組みが必要になっていると結ばれた佐藤氏の指摘を、私も興味深く受け止めたところです。
※コメント投稿者のブログIDはブログ作成者のみに通知されます