AIプログラミングの予備校

幅広い年齢層の方に基礎から丁寧に指導します。

音声AIビジネス展開

2024-02-26 01:21:35 | 日記

故人の声再現・英語吹き替え

ChatGPTに代表される文章や画像などを自動で作る

生成人工知能(AI)が急速に進化する中、注目されて

いるのが人間の声を自然に再現する「音声生成AI」だ。

亡くなった人や病気などで声を失った人の声も再現

可能で、こうした技術を活用したビジネスは拡大する

見通し。

一方で犯罪に悪用されるとの懸念もある。

なりすましなど悪用懸念

令和元年の紅白歌合戦で、美空ひばりさんの歌声をAIが

再現したことが話題になったが、音声生成AIはその後も

大きく進歩した。

ベンチャー企業のA社は、1時間だけ声の収録をして、

AIを用いて、その人の声を再現するサービスを実用化。

国内で最多の5000種類以上の声をAIで再現して第三者

に提供しており、声を提供したアナウンサーや声優は、

第三者から支払われたサービス料の一部を受け取ること

ができるというビジネスモデルを展開している。

声を失った人が失う前に録音していた声を活用してAIで

再現することもできる。

スマートフォンやパソコンで文字を入力し、AI音声で読み

上げれば、自分の声で他人と会話が可能になる。

一方、同社は日本語を母語とする人の会話を収録してAIに

学習させて、英語など外国の主要言語をAI音声で会話できる

ようにする技術を開発した。

日本の高い技術を持つ人気声優が、海外版のアニメでの中で、

そのままの声を用いて現地の言葉を話すことが可能になる

という。

AIエンジニアによると、音声生成AIの進化はこの5、6年で

急速に進み、学習のためのデータ量が少なくても、人間の

音声に近い高品質なものが作成できるようになった。

ただ、同時に悪用するハードルも下がっており、海外では

企業幹部の声をAIが生成して、その部下に指示する等の方法

で詐欺に使われる事例も出てきたという。

生成AIにできることは多くなっているので、それを一般の

人に知ってもらうことは重要だ。

AIによる音声認識

<定義>

音声認識は、人が発する言葉を音として入力し、これを

AIが言語に変換する事でテキストデータ化する技術である。

キーボードを用いるより、コンピューターへのデータ

入力が早く、タイプミスも起こらないことから、有効な

入力方式として活用されている。

 

<用途>

①会話型AI

AIと人間が会話をする形で作業を進めるロボットを指す。

電話による顧客対応システムとしてコールセンターなど

で用いられている。

 

②議事録作成

音声認識により言語として認識された音素をテキスト化

して出力するサービスとして使われる。

 

③翻訳

言語モデルを通して文章が理解できれば、AIによる自動

翻訳が可能となる。

単語レベルや定型の表現であれば、会話をそのまま多言語

に置き換えることも可能である。

 

④AIアシスタント

音声でコンピューターを作動させる接続部分(インター

フェース)としての音声認識。

スマートフォンやスマートスピーカーで使用されている。

 

AI音声認識の技術と仕組み

音声認識の大きな流れとして、

「発声された言語をデータ化した上で、どの

音声と近いのかを照合し、音を組み合わせ、

単語と照合し、文章を組み立てる」

がある。

これにディープラーニング(深層学習)が加わり、

単語の予測などが可能になる。

以下に利用されている仕組み、技術について紹介

する。

1⃣音響分析

音響分析は、人が発生した言語をマイクを通じて

音声データとして聞き取ることで可能となる。

この時に「声の強弱」「音と音の間」「抑揚」を

データとして収集し、特微量(数字化)を抽出し、

コンピューターが認識できるデータに変換する。

 

2⃣音響モデル

音響モデルは、作成した波形データに対して、

ニューラルネットを用いて、その音素を分析

して言語に変換する。

 

音のつながりを文字列に置き換えるために

母音と子音に分解し、対応する文字記号

(アルファベットなどの文字表記)の表象に

変換する。

 

例えば、「こんばんは」という音声の場合、

人間であれば、誰の言葉でも「こ」で認識

できる。

しかし、厳密には前後の単語や高低などで

音には微妙に違いがある。

そのため、音響モデルでは音響分析で抽出

した特微量(数字化)を元に、「KーO」と

いう音素になるようマッチングさせる必要が

ある。

 

3⃣音声(発音)辞書

音声辞書は、音響モデルでマッチングした音を

組み合わせて、膨大な情報データベースの中

から単語として認識させる。

例えば、

「こ」・「ん」・「ば」・「ん」・「は」

を認識したら、これらを組み合わせて

「こんばんは」という単語を認識する。

 

4⃣言語モデル

言語モデルでは、発音辞書で認識した単語や音響

モデルで認識したことを組み合わせ、音素の繋がり

が言語として成立するように選択する。

この際、事前に膨大な量のデータから単語のつながり

の出現率などを算出して単語を文章化させる。

 

5⃣単語リストと意味予測

言語によっては音素に対応する単語が複数ある。

 

AIは単語同士の結びつきと使用頻度、前後の

文節間の単語の関連性を学習し、適切な組み合

わせを選別。

 

特に日本語は音素の構造が単純で同音異義語

が多く、AIによる学習が難しい。

 

AIによる意味予測を伴う言語選択により、

「しきをたてる」、

「しきがたかい」、

「しきがちかい」は、

それぞれ

「式をたてる」

「士気が高い」

「死期が近い」と

テキスト化される。

AI音声認識の将来性

1⃣翻訳精度の向上

音声認識を活用して機械翻訳を行うことで、

外国人との会話もスムーズにできるように

なる。

 

2⃣緊急時の自動運転

音声だけでなく、心拍や血流の音も認識する

研究が進んでいる。

これにより、例えば車のドライバードライブ

中、運転中に心臓発作が起きた場合、心拍を

認識し、自動運転に切り替えるなど安全を

確保できる。

 

3⃣音声だけで買い物ができる

音声認識による検索の精度も高まっている

結果、話しかけるだけで買い物ができ、委託

してくれること、などが可能になり、より便利

に利用できる。

 

深井ITゼミナール

深井ITゼミナール

大阪府堺市で有名な大学共通テストに必修の高校情報Ⅰからプログラミングやデータ分析など応用に至るまで幅広い年齢層の方まで指導する予備校

深井ITゼミナール

 

 


AIによる裁判は可能か

2024-02-10 04:41:41 | 日記

生成AIで模擬裁判

「Chat-GPT」などの生成AI(人工知能)の活用が急速に

広がる中、司法分野へのAI導入に向けて議論が活発化

している。

昨年には、学生が「AI裁判官」による近未来の法廷を

仮想した模擬裁判を開催。

海外では、弁護士や裁判官の業務支援にAIを活用しよう

という動きもあるが、日本の司法界はデジタル面の環境

整備が遅れており、専門家は「実現のハードルは高い」

と指摘する。

 

<主文、被告人は殺人罪の共犯は認められないため、

無罪とする>

 

交際相手と共謀し、ストーカー行為を受けていた

元交際相手を殺害したとして殺人罪に問われた女性

被告の「裁判」。

判決を読み上げたのは、モニターに映し出された

「AI裁判官」だった。

昨年、行われた模擬裁判のイベントで「AIを使う

こと以外はリアリティーのある設定にし、見た人に

身近な問題として考えてもらいたかった」と

発案者は企画の意図を説明した。

裁判官役には、最新版のChat-GPTを起用。

演出上の理由から、事前に証言などを入力し、

生成させた判決をAI裁判官の「セリフ」として、

合成音声で読み上げる形とし、AIの入力内容や

脚本をイベント後にウェブ上で公開した。

模擬裁判は交流サイト(SNS)などで話題となり、

法曹関係者も含め、さまざまな議論を巻き起こ

した。

「問題提起が広く、深く届いた」

発案者は手応えを口にした。

海外ではトラブル

被告の身体拘束の判断も伴う刑事裁判への「AI裁判官」

の導入は「裁かれる側は納得できるのか」との声も

上がるなど、倫理面での課題が大きいとされる。

これに対し、弁護士や裁判官を補助する手段としての

AI導入は、主に民事訴訟で現実になりつつある。

 

米国では、大手弁護士事務所が法律業務に特化させた

「Chat-GPT」を文献検索や文書作成などに導入。

 

中国では、一部の裁判所でAIを活用した審理が始まって

いる。

 

一方でトラブルも散見される。

 

米ニューヨーク州では、昨年、弁護士が「Chat-GPT」

で作成した民事訴訟の準備書面に、実在しない判例が

含まれていた事が判明した。

判例データ化必須

<「Chat-GPT」は「もっともらしい答え」を出す

ことはできるが「なぜ正しいのか」は説明できない。

正確性は担保されておらず、重要な場面では使え

ないのが現状だ>と、

AIの法学への応用について研究する国立情報学

研究所のB教授は指摘した。

 

生成AIを裁判で利用する際に問題となる、こうした

「思考」過程のブラックボックス」をどう解決する

のか。

一助となりそうなのが、法的推論支援システム

「PROLEG(プロレグ)」だ。

プロレグは、訴訟の事実関係を入力すると、法律の

条文や、最高裁判例を読み込ませて構築した「ルール」

を当てはめ、判決などを導き出す仕組み。

日本語や英語のような「自然言語」で書かれた事実

関係の記述を、コンピューターのプログラミング言語

に置き換えて入力しなければならないが、置き換える

ための処理に生成AIが活用できるという。

 

プロレグと生成AIを組み合わせれば「なぜその判決(結論)

が導き出されたのか」が説明できるようになり、近い将来、

単純な少額訴訟の訴状作成などにAIを活用することは技術

的に可能になる。

ただ、実用的なシステム構築には、判例などの膨大なデータ

のデジタル化が不可欠だ。

 

日本では、1昨年に、民事訴訟手続きをIT化する改正法が

成立。

法務省は凡例のデータベースに向けた有識者検討会を

設置したが、実現は先になりそうだ。

AI裁判「受けたい」23.4%。

裁判へのAI導入について、人々は「高い期待」の一方、

「強い不安」も持っている。

 

国内のある社会調査では、こんな結果も明らかになって

いる。

明治大法学部のC教授らは、令和2年2月、インターネット上

で1600人に「AIによる裁判を受けたいか」などを尋ねた。

 

「受けたい」と回答したのは23.4%、

「受けたくない」は42.8%、

「どちらともいえない」は33.8%、

となった。

 

AI裁判の具体的なメリットとリスクを提示し、期待と

不安を尋ねたところ、

「ブレがなくなる」

「費用が安くなる」などの

メリットに高い期待が寄せられた半面、

「誤判の発生」などの

リスクに強い不安が寄せられた。

 

C教授は「AI裁判に対し、消極的な結果に見えるが、

裁判そのものを<避けたい>という人々の意識も

ベースにあると見られる」と推測。

判断のばらつきの解消やコスト削減などの面では、

AI裁判への期待度が高いと受け取れる。

不安を取り除くようなセーフガードを設けることで、

AIの導入により裁判がより身近なものになる可能性も

ある」と話した。

 

深井ITゼミナール

深井ITゼミナール

大阪府堺市で有名な大学共通テストに必修の高校情報Ⅰからプログラミングやデータ分析など応用に至るまで幅広い年齢層の方まで指導する予備校

深井ITゼミナール