17期生の井上です。
これまでの「スマートスピーカー」に関する他の方の記事と類似した内容になってしまいますが、
この度は、ビジネスにおける音声関連技術の活用についてを記載させて頂きます。
先般、顧客より音声の認識技術を活用した仕組みの提案依頼を頂く機会がありました。
顧客の課題は以下の2つでした。
1.議事録作成の効率化
働き方改革の推進にあたり、業務効率化・残業削減を図るため
会議の議事録作成時間を短縮させたい。
具体的には、会議時の話者を特定し、音声を解析のうえ、
会議の発言内容を高い精度でテキスト情報化・文章化したい。
2.コールセンター業務の品質と効率の向上
サービス力向上のため、オペレーターと顧客の通話内容を見える化し、
関係者と即時に情報共有のうえ、内容を分析して業務改善を行いたい。
具体的には、通話内容をリアルタイムにテキスト情報化し、
さらに自動要約させ、顧客管理システム上で情報共有したい。
働き方改革を進める顧客から課題のお話を聞いているうちに、
AIを活用した音声関連の技術が、ビジネスシーンにおいて
どのように使われているかが気になりましたため、
用途などを少し調べてみました。
まず、音声関連技術について、
音声が認識され解釈し応答するまでの流れを以下にざっくりと記載します。
1.スマートスピーカーなどに内蔵されたマイクが音声を拾い、
LANやインターネットを介してAIエージェントなどの
システムに連携する。
2.システムは、音声情報と言語情報を組み合わせながら
文字情報へと変換し、話者の識別や意図の解釈などを
リアルタイムで行う。
3.そして、最適な回答を文字情報や音声で自動応答する。
また、ビジネス用途の音声関連システムの主な特徴は以下となります。
1.個別の業界・業務や用途に特化した意図解釈技術(AI)を用いることで、
解釈や回答の精度を高めることができる。
2.AIでは解釈や対応ができない内容の場合には、
人との対話に切り替えることができる。
3.情報が一般に公開されないよう、企業内などの閉鎖環境にて
利用することができる。
さて、ビジネスシーンでの主な用途についてですが、
以下の業務や業界などで既に活用されているようです。
<社内>
1.会議などの議事録作成
2.会議室などの施設予約
3.業務マニュアルなどの照会
<顧客とのコミュニケーション>
4.コールセンターでの業務支援
5.ホテルやお店での予約や注文の受付、
6.営業現場や銀行窓口での顧客からの質問への回答
<業界特化>
7.医療業界における診断書やカルテ作成業務
8.設備業界における保守点検作業
9.物流業界での仕分け業務
個人的には、上記3や6と類似する以下のような用途で実際に活用が出来たら、
とても助かるのではと想像をしました。
・会議の場において、
「昨年の受注実績は?」などと聞いたら、
社内情報を検索のうえ、該当する内容をシステムが発話してくれる。
・顧客との打ち合わせの場において、
説明が難しい複雑な製品やサービスの説明が必要となった場合に、
製品概要やメリット、価格情報などをこっそりと教えてくれる。
また、上記「業界特化」は、
手が離せない状況での業務効率化に課題を持つ業界が多く、
自動車業界では、自動車の運転中に音声で各種操作や情報照会ができる技術が進展しています。
なお、音声以外にも、
画像認識、手書き文字認識、顔認識などの技術も高度化が進んでいるようです。
診断士2次筆記試験や口述試験の採点、また診断業務などにおいても、
これら技術が活用される時が近いのではと感じました。