OSは今後やってくるAI社会で端末の主役では無くなるのか?プレ・シンギュラリティの世界を予見する。
AIエージェントに個人活動の全てを明け渡すことが幸せだろうか?
https://ark-invest.com/articles/analyst-research/generative-ai-a-new-consumer-operating-system
By: ニコラス・グルース、アンドリュー・キム
コンピューティングの歴史は、個人や企業の生産性を向上させることで定義されてきた。 1970年代のコマンドライン・インターフェース(CLI)から1980年代のグラフィカル・ユーザー・インターフェース(GUI)への移行は、複雑な構文を視覚的なアイコンとウィンドウで抽象化することを可能にした。 その後、コンピューティングの学習曲線が平坦化したことで、1990年代にかけてパーソナル・コンピューター(PC)の普及が加速し、ワールド・ワイド・ウェブとその上に構築されたインターネット・アプリケーションが誕生した。 前世紀の終わり、タッチスクリーンの携帯電話とモバイル・オペレーティング・システムによって、コンピューティングのパワーが手のひらに乗るようになった。 今、生成型人工知能(AI)がデジタル・アプリケーションの普及を加速させ、人間とコンピュータの相互作用に次の画期的な変化をもたらしている。
既存企業の製品だけでなく、新規ハードウェア参入企業も、ジェネレーティブAIをオペレーティングシステムに組み込んでいる。 実際、すべてのスマートフォンはAIを中心とした再設計を受ける可能性が高く、製品市場に適合した将来のAIウェアラブルは、スマートフォンそのものと同じくらい一般的になる可能性がある。
消費者が新しいフォームファクターを採用するにつれて、消費者向けハードウェアの異機種混在という新たな時代が到来し、少なくともこの10年間は隆盛を極めるものと思われる。 電話が米国で商業的に発売されてから50%の飽和状態に達するまでに70年近くか
かったのに対し、パーソナル・コンピューターはその1世紀後、50%の飽和状態に達するまでに26年弱、携帯電話は16年、スマートフォンはわずか6年しかかからなかった。
私たちの研究によると、AIエージェントを統合したハードウェアと定義されるAI対応コンシューマー・ハードウェアは、4年以内に米国のインターネット・ユーザーの50%に普及し、2022年にはほぼゼロだった普及率が2030年末には75%近くに達する可能性があります。
本稿では、ジェネレーティブAIと関連ハードウェア・システムの日常的なユーザー・アプリケーションへの組み込みを加速させる、新たな人間とコンピュータのインタラクションに関するARKの研究を紹介する。
セクションIでは、AIエージェントが従来のオペレーティング・システムの複雑さを簡素化することで、新たな商業消費慣行をどのように可能にするかを分析する。
セクションIIでは、AIエージェントが行う広告について議論する。
セクションIIIでは、ジェスチャーと音声を中心とした自然なユーザー・インターフェースの可能性について考察する。
セクションIVでは、オペレーティング・システムの市場シェアを獲得するための過去の戦略について見ていく。
AIエージェントは商取引を簡素化する
我々の見解では、AIエージェントは、(1)自然言語によるクエリを理解し、(2)インターネット上でユーザーが指定したタスクを実行し、(3)ユーザーの嗜好に基づいて継続的に適応するようにプログラムされたソフトウェアである。 現代のオペレーティングシステムがコンピューティングハードウェアとの直接的なインタラクションを簡素化したように、AIエージェントはオペレーティングシステム(OS)の上に位置し、従来のOSのインタラクションの複雑さを抽象化する可能性が高い。 認可されたすべての消費者向けソフトウェアのデジタル・インタラクションにアクセスすることで、AIエージェントは消費財やサービスの購入プロセスを変革し、発見、調査、超パーソナライズされたキュレーションを自動化し、消費者とエンド・アプリケーション間の直接的なインタラクションを仲介しなくなる可能性がある。(記事は続くが引用翻訳はここまで)
AI自身は次のように回答した。
確かに、AIエージェントが消費財やサービスの購入プロセスを大きく変革する可能性は非常に高いです。これには以下のような具体的な要素があります。
### 1. 発見の自動化
AIエージェントは消費者の過去の購入履歴や嗜好データを分析し、それに基づいて新しい商品やサービスを自動的に提案できます。これにより、消費者は自分で大量の情報を探し回ることなく、自分に合った商品やサービスを簡単に見つけることができます。
### 2. 調査の効率化
AIエージェントは大量のデータを高速で処理し、製品のレビュー、評価、価格などの重要な情報を迅速に集約することができます。これにより、消費者は最良の選択をするための情報を即座に入手できるようになります。
### 3. 超パーソナライズされたキュレーション
高度な機械学習アルゴリズムを用いることで、AIエージェントは個々の消費者の嗜好やライフスタイルに合わせた超パーソナライズされた商品やサービスのキュレーションを提供できます。例えば、消費者の特定の健康状態や生活習慣に最適な商品を提案するなどが可能です。
### 4. 直接的なインタラクションの仲介廃止
AIエージェントが普及することにより、消費者は従来の検索エンジンやショッピングサイトを使用する代わりに、AIエージェントを通じて直接商品やサービスを探すことができるようになります。これにより、エンド・アプリケーション(例えば特定のECサイトやレビューサイト)との従来の直接的なインタラクションが減少する可能性があります。
### まとめ
AIエージェントにより、消費者の購買プロセスはさらにシームレスで効率的になり、消費者が必要とする最適な商品やサービスを迅速に提供できるようになります。これにより、エンド・アプリケーションとのインタラクションが最小限に抑えられる可能性があり、消費者の体験が大幅に向上する可能性があると考えられます。
AIエージェントは、自律的に目標を達成するために、大きく4つの重要なコンポーネントから構成されています。これら4つのコンポーネントが有機的に連携することで、AIエージェントは環境の変化に動的に適応しながら、自律的に意思決定と行動を行うことができるのです。
環境
AIエージェントが存在し、相互作用を行う対象となる空間や状況を指します。これは物理的な現実世界であったり、仮想的なデジタル空間であったりします。株式市場の予測を行うAIエージェントなら、株価や経済指標などのデータが環境として機能します。
センサー
環境から情報を取得するための手段です。カメラや赤外線センサー、マイクロフォンなどのデバイスを通じて、AIエージェントは周囲の状態を認識します。オンライン上のエージェントであれば、APIを通じてデータベースや外部サービスからデータを取得することもセンサーの役割といえるでしょう。
意思決定メカニズム
取得した情報をもとに、目標達成のための最適な行動を決定する中核的な仕組みです。ルールベースの単純なアルゴリズムから、強化学習や深層学習などの高度な機械学習モデルまで、様々な方式が用いられます。囲碁で人間のチャンピオンに勝利したAlphaGoは、膨大な棋譜データから学習した深層学習モデルを意思決定に用いた好例といえるでしょう。
アクチュエーター
AIエージェントが環境に働きかけを行うための手段です。ロボットアームや移動機構などの物理的な装置だけでなく、デジタル空間上での操作や外部システムへの指令なども含まれます。例えば、自動運転車のAIエージェントは、ハンドルやアクセル、ブレーキなどを制御するアクチュエーターを備えています。