ウェブ会議でリアルタイム翻訳を利用する様子(画面上部に字幕を自動表示する)
【シアトル=渡辺直樹】
米マイクロソフトは20日、生成AI(人工知能)ソフトを組み込んだ「ウィンドウズ」の新型パソコンを公開した。
特にリアルタイム翻訳と顔の補正といったウェブ会議の使い勝手をよくするツールや、タッチペンを使ったイラスト自動作成など、ビジネスで役立つ自動変換ソフトが充実している。記者が早速、AIの新機能を試してみた。
20日に米シアトルで公開したキーボード付きタブレット端末「Surface(サーフェス)」の目玉となるのはリアルタイム翻訳「ライブキャプションズ」だ。
「Teams(チームズ)」や「Zoom(ズーム)」といったウェブ会議ソフトで海外の社員や取引先と話す場合、同機能をオンにしておけば、画面上部に自動で字幕を表示できる。
ためしにフランス語を話す人が映る動画を再生したり、ドイツ語を話す担当者にパソコンのマイクを使って話してもらったりしたところ、英語の字幕がウインドー上部に表示された。
複数の言語が交じっている会話でも次々に英語に翻訳し、ほぼ遅延がなかった。
これまでにもユーチューブなど個別のサービスごとに字幕を表示する機能はあったが、ソフトをまたいでパソコン全体で翻訳サービスを使えるようにしている点が便利だ。
40以上の言語を翻訳する。日本語への翻訳は今後対応する。
在宅勤務時のウェブ会議で便利なのが画面の修整「スタジオエフェクト」の機能だ。画面下部から設定画面を呼び出して操作する。
疲れた肌もすべすべに
パソコンの内側のカメラが写す自分の顔の明るさを自動で調整したり、背景をぼかしたりといった調整を行う。顔が疲れていても肌がすべすべに表示される。
修整機能特有の背景と自分の顔の境界線がちらつく不自然さがなかった。加工をやりすぎないように修整の度合いをカーソルで調整もできる。
新型AIでは複数の人が写っていても、発言した時に自分の顔が画面の真ん中に来るように追尾する設定もある。
類似の機能は米アップルのiPadにもあるが、カメラが話し手にズームを合わせる認識精度と追尾の速度は驚くほど速かった。
デモではWiFi無線につながっていたが、インターネットの接続を切ってもらったところ、これら2つの機能は動作した
。内蔵する半導体のうち、NPUと呼ばれる機能特化型の半導体が主にAIを動かしているため、読み込みも速く動作もスムーズだ。
このほかに画像生成AIの技術を応用した自動イラスト作成の「コ・クリエーター」機能も使ってみた。
手書きの粗いイメージ図㊧をプロンプトによる指示と組み合わせると、自動できれいなイラスト㊨に変化した
コマンドの入力画面に「ヤシの木が生えたビーチ」と入力して、付属のタッチペンで木の幹や海岸線を簡単な線で描くと、AIが2つを理解してより細かいイラストをつくりだす。
絵心がない人でも簡単に資料などに使うイラストをつくれる。
シアトルの観光名所である塔の「スペースニードル」もプロンプトで入力すると、粗いイラストから本物そっくりに変換した。固有名詞であっても認識する。
頭の中にあるイメージを具体化できるため、絵心のない人にはぴったりのソフトと言えそうだ。
自動イラスト作成はつくったコンテンツが有害なものではないかをチェックする機能があり、一時的にインターネットに接続する必要があるという。
過去の検索履歴を瞬時に提示
このほかにAI履歴検索の「リコール」は過去に検索したウェブページや画像付きの資料を瞬時に探すことができる。
これまでは履歴をたどり、自分で一つ一つファイル名やサイトのタイトルを探す必要があった。
例えば「青い服」や「革製品」などキーワードを入力すると、AIが言葉に合致した画像を探し、過去の履歴のスクリーンショットを提示する。
日付が書かれた上部のバーのカーソルを動かして、最近見たコンテンツを直感的に探せる。
見つけたコンテンツにある画像はそのまま切り出して他の資料に貼り付けるといった操作もできる。
日ごろ「ワード」でつくった仕事の資料や撮影した写真がパソコン内でどこに保存したのかわからなくなることが多く、利便性が高いと感じた。
「青いドレス」と入力すると利用履歴をまとめて表示した
今回、マイクロソフトはハードとソフトを組み合わせた技術モデルを披露した。こうした戦略は米グーグルが自社スマートフォン「ピクセル」を開発し、OS「アンドロイド」に新機能を搭載していく戦略に近い。
ただ近年ではマイクロソフトの「チームズ」と業務ソフト「マイクロソフト365」のセット提供をめぐり欧州連合(EU)が調査をはじめた。
規制当局は独占禁止の観点から過度な自社サービス優遇を懸念視する。
利便性を確保しつつ、他の企業の技術も含め利用者が自由に選択できる仕組みを整えていく必要がある。
【関連記事】
文章や画像を自動作成する生成AIに注目が高まっています。
ChatGPTなど対話型AIやMidjourneyなど画像生成AIがあります。急速な拡大を背景に、国際的な規制や著作権に関わるルールなどの策定が急がれています。
続きを読む
日経記事2024.05.21より引用