190126 音の不思議とAI <音声合成ソフト もう一度、自分の声で・・がん、ALS患者に光>と<NHK 超AI入門「発想する」>を見聞して
私は仕事柄、知的障害の方や視覚障害の方など、様々な障がいの方のお手伝いというか、成年後見という立場で仕事をしてきました。ただろう者の方については、会議などで手話通訳の方をお願いしたり、速記官によるタイピングでスクリーン表示するといった配慮をしてきましたが、直接お会いする機会はほとんどありませんでした。駅など公共の場で手話をして会話しているのを見かけることはあっても、その人たちの状況はわかっていません。
音を聞き取れない、発声することができないとか、困難であるとか、その大変さは情報としては知っていても、あまり実感がわかないというのが本音です。自分の声が以前より弱々しくなることがあったり、ときに音になりにくいことがあっても、一時的であるため、将来発声できなくなったらといった不安もなかなか現実味がありません。
しかし、喉頭がんや筋萎縮性側索硬化症(ALS)を発症すると、声がでない、あるいは出にくくなるようです。それはいつわが身に起こるかもしれません。そうなったら慌てふためくのか、絶望するのか、人間なかなか絶望の域に達しないかもしれません。それなりにがんばるでしょうね。
そんな人間の気力にいま大きな支えとなっているのが音声合成ソフトのようです。
昨夕の毎日記事<音声合成ソフトもう一度、自分の声で 事前録音した本人の声で再現 がん、ALS患者に光>は後天的な失語の場合、事前に準備していると、声が復活する可能性がでたことを取り上げています。
<病気や手術で失った声を、音声合成ソフトで再現する取り組みが広がっている。事前に録音した本人の声をつなぎ合わせる仕組みで、喉頭がんや筋萎縮性側索硬化症(ALS)の患者らが活用。話し方を本人に似せるソフトもある。親しみのある声がよみがえり、周囲とのコミュニケーションも豊かになると好評だ。>
そのソフトは「ボイスター」という名称です。ではどう準備して利用するのかを記事から引用しましょう。
<ボイスターの利用者は、病状が悪化したり、喉頭摘出などの手術を受けたりする前に400~1000の文章を録音しておく。ボイスターは録音を基に話し方の特徴を分析し、パターン化する。パソコンに文章を入力すると、その人の話し方に最も近い音を選んで再生する。>これは簡単ですね。
ただ問題もあります。値段がまだお高いのです。<
口コミで利用者が増えているボイスターの価格は、録音する声のデータ量などに応じて約36万~95万円。渡辺さんは「もっとリーズナブルに、その人らしさを再現できるよう改善したい」と研究を続けている。>
他方で、ネットで無料ソフトが公開されていて、<東京都立神経病院の作業療法士、本間武蔵さん(56)と、長崎県佐世保市のシステムエンジニアで、自身も言語障害がある吉村隆樹さん(53)が手掛けた「マイボイス」だ。・・・ 本間さんは「録音を通じて、病気に立ち向かう気持ちが湧く人もいる」と、精神面のプラス効果にも期待している。>
では先天性のろう者の場合はどうでしょう。最近、ウェブ文字情報は、音声を選ぶと、勝手に朗読?してくれますね。まあ機会音声のような感じで、人の声のような暖かみを感じることはできませんが、最近のAIの発展からすれば、すでに多様な人間の声を再現することが可能ではないかと思ってしまいます。
それは1月24日放送のNHK<人間ってナンだ?超AI入門 シーズン2 第3回「発想する」>を見て、十分可能というか、すでに相当な段階にあるように思えるのです。
番組では、人間とは何かを問いつつ、AIの機能がもつ最近の実情を紹介しています。今回はマンガという創造的な作品を取り上げつつ、その発想をAIではどのような過程を経て行うかを次々と繰り出すのです。マンガの描き方は素人的にはすでにプロと同等で、しかもどのような作者の絵でも生み出すことができるのはもちろん、新たな作品も可能です。
彩色は、一瞬にしてバックやディテイルも調和のある変化をつけて行うのです。それは漫画家がこの場面で設定したイメージに合う彩色を長い時間かけて作り出すのに比し、一瞬にして漫画家もある程度腑に落ちるものを生み出すのです。
ちょっと余談が長くなりましたが、この番組では、音風景を考案しているAIエンジニアも登場しました。その方はさまざまな建築物や景観に応じて、それに似合う音を的確に生み出すのです。それはAIが膨大なデータを蓄積していて、個々の建築物の室内空間や材質などを認識してそれにあった音楽を提供するのです。
人の声もAIによって調整して、容易に生み出すことが可能ではないかと思うのです。
レンブラントの絵でしたか?たとえば著名な画家の絵画、生涯に何百点かありそれをマイクロ単位かそれ以下のレベルですべて質感、彩色、構成など必要とされる要素を分解、データ化し、それぞれの絵画の再現だけでなく、新たな作品も仕上げることができる段階に来ているそうです。それは囲碁や将棋AIの驚異的な発展をみれば不思議ではありません。
そうなると美空ひばりや吉永小百合(いずれも少し古いですか)の音声・歌・朗読も自由にAIで生み出すことができるかもしれません。
むろん先天的なろう者の方は、自分の声の識別はできないかもしれましれませんが、聞く人の表情を見て自分が好みの音声を選ぶことができるような時代になるかもしれません。
そんなことを少し飛翔した思考で思いふけっていると、悪用のリスクもあるなとつい思うのは悪い癖かもしれません。とはいえ変化はいい面だけ見ていると大きな副作用的な悪影響が生まれるのも、人の住む世界の断りかもしれません。
このへんでおしまい。またあした。
※コメント投稿者のブログIDはブログ作成者のみに通知されます