gooブログはじめました!

ChatGPT・Whisper・Otter・DeepLのすごい「英語力」、海外取材で効果絶大だった

○ 米OpenAI(オープンAI)の「ChatGPT」をはじめとする高度な言語AI(人工知能)が国内外で大きな話題となっている。英語、日本語、中国語など多言語を操り、人が話した言葉を聞き取ったり、こなれた文章を書いたり、翻訳したりする。近ごろは毎日のようにテレビやインターネットでニュースを見かけるほどだ。様々な言語AIを試しながら、自分なりの活用法を探っている読者の方は少なくないだろう。

筆者も最近、取材活動にChatGPTなどの言語AIがどれだけ役立つのかを検証する機会があった。スペイン・バルセロナで2023年2月27日から3月2日まで開催されたモバイル業界最大級の展示会「MWC Barcelona 2023」に初めて参加した。世界202の国と地域から8万8500人以上が参加したという同イベントは、基本的に英語が使われる。カンファレンス、メディア向けの展示ブースツアー、1対1のインタビューの全てが英語だ。

しかし筆者は英語があまり得意ではない。とりわけ英文を作ったり話したりするのが苦手で、筆者にとってハードルの高い取材になる。そこでChatGPTなどのAIが役に立つのではないかと考えた。

具体的にはChatGPTに加え、同じオープンAIによる高精度の音声認識AI「Whisper」、米Otter.aiのリアルタイムの文字起こしに強い音声認識サービス「Otter(オッター)」、翻訳精度の高さで日本でも人気が高いドイツのDeepL(ディープエル)の機械翻訳サービス「DeepL」という4つのAIを使う。ChatGPTとOtter、DeepLには無料版と有料版があるが、今回はいずれも有料版を利用した。

「MWC Barcelona 2023」の英語取材で筆者が活用したAIツール。英文メールは「ChatGPT」(左上)、インタビューは「Otter」(右上)と「DeepL」(左下)、文字起こしは主に「Whisper」を使用した
画1、「MWC Barcelona 2023」の英語取材で筆者が活用したAIツール。英文メールは「ChatGPT」(左上)、インタビューは「Otter」(右上)と「DeepL」(左下)、文字起こしは主に「Whisper」を使用した。

英文メールの作成をChatGPTが代行。

結果から言うと、筆者は大きく3つのシーンでAIの絶大な効果を実感した。1つめはスペイン渡航前の2023年2月上旬、MWCの取材許可証をオンラインで申し込んだ後だ。MWCの運営事務局の広報担当者から「手続き中の取材許可証が登録システムのエラーによって発行できなくなった」「別のタイプの取材許可証に切り替える必要がある」といった連絡を受け、英文メールを何度かやり取りすることになった。

筆者は当初、自分で英文を考えたりDeepLなどの翻訳サービスを利用したりしながら事務局側と連絡を取り合っていた。だが普段は英文を書く機会が少ないためおっくうになっていた。そこで途中からはChatGPTにメール作成を代行させた。

例えばChatGPTに対して日本語で「あなたは英語が得意なビジネスパーソンです」といった役割を与え、「以下の文章を日本語から英語に訳し、そのうえでビジネスメールにふさわしい言葉を補ってください」などと命令。そのうえで「私は明日の午後3時に会場に到着する予定です」という用件を記述した。するとChatGPTは、以下のように様々な文章やフレーズを追加して例文を出力した。

Dear [Name],

I wanted to inform you that I will be arriving at the venue tomorrow at 3 p.m. I hope this time is suitable for our scheduled meeting.

Please let me know if there are any changes or updates to the meeting agenda, and if there is anything you need from me in advance.

Thank you and I look forward to seeing you tomorrow.

Best regards,
[Your Name]

このようにしてメールのたたき台となる文章をChatGPTで用意し、気になる表現があれば加筆・修正してすぐに相手に送信していった。英文メールをゼロから書くのに比べて作業時間が大幅に短くなり、スムーズなメールのやり取りが可能になった。

英語インタビューではOtterとDeepLを併用。

2つめのシーンは現地での1対1の英語インタビューだ。筆者はこれまでにも何度か海外展示会に参加していて、事前に英文の質問をきっちりと準備したうえで取材していた。だが取材本番では相手が話した内容を聞き取れないことがあり、内容を深掘りしていくのが難しいと痛感していた。

そこで今回の英語インタビューは、ヒアリングを補完するために文字起こし用アプリのOtterを使用した。このアプリは英語の講演や講義などの音声データを記録しながら、リアルタイムで英文を生成する機能を備えている。複数の人が話していても、発話者を識別したうえで記録できるのも特徴だ。

Otterにはスマートフォン向けアプリとパソコンで使えるWeb版がある。1対1の取材中にスマートフォンの画面をじっと眺めているわけにはいかないので、OtterのWeb版をノートパソコンのディスプレーに映して動作させ、Otterによる文字起こしの結果を時々眺めるようにした。

またインタビュー中に日本語で質問を考えて素早く英語に訳すため、必要に応じて翻訳ツールも使った。この用途では前述のChatGPTを使うことも考えたが、筆者の場合は翻訳結果をより高速に表示するDeepLを選択した。

このようにOtterとDeepLを用いながら何度か対面の英語インタビューに臨んだ。いずれのツールもクラウドサービスなので応答速度には少々不安があったが、その点は相手にゆっくり話してもらうことでカバーできた。少なくとも丸腰でのインタビューよりも会話の流れをつかみやすく、会話がスムーズに進むと感じた。

録音データからの文字起こしはWhisperを活用。

言語AIが役に立った3つめのシーンは、カンファレンスやインタビューなどの録音データからの文字起こしだ。前述のOtterを使ってもかなり正確な結果が得られるが、今回はオープンAIの音声認識AIであるWhisperを中心に使用した。以前の「週末スペシャル」でWhisperによる日本語の文字起こしを試し、その精度の高さに驚かされたからだ。

Whipserを利用するのに必要なプログラム実行環境としては、ブラウザー上でプログラミング言語「Python」のコードを記述、実行できる米Google(グーグル)のWebサービス「Google Colaboratory」を利用した。オープンAIはWhisperについて複数の学習済みモデルを用意しており、筆者は最も高精度な「large」を使用した。

ちなみに同一の録音データを使ってOtterとWhisperでの文字起こしを試したところ、少々異なる結果が出た。例えば「CPU」という言葉はどちらも正しく認識した。一方で、米Intel(インテル)が2021年に発表した「IPU(Infrastructure Processing Unit)」のような比較的新しい言葉については、Whisperのほうがより正確な結果を得られた。Whisperは準備やデータ処理に少々時間がかかるが高精度であり、Otterは準備が簡単かつリアルタイムの文字起こしができる。利用シーンによって使い分けるのがよさそうだ。

こうして様々なAIを活用しながら乗り切った今回のMWC取材。手応えを得た背景には現地の通信環境が良好だったこともある。モバイル業界向けの展示会ということもあってか、会場内の隅々まで無線LANが使え、4G(第4世代移動通信システム)の電波もおおむね届いていた。もちろん流ちょうな外国語を操ってコミュニケーションを取るに越したことはないと思うが、それができなくても対話を諦める必要はない、と気付いたのが最大の発見だった。


ランキングに参加中。クリックして応援お願いします!

名前:
コメント:

※文字化け等の原因になりますので顔文字の投稿はお控えください。

コメント利用規約に同意の上コメント投稿を行ってください。

 

  • Xでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最近の「〝 たぬき の 「 スマホ ・ パソコン 」 ワールド 〟」カテゴリーもっと見る

最近の記事
バックナンバー
人気記事