ヒロです。
本日は雑学、「スマホの声は自分の声じゃない」って知ってた?
以前テレビでもやってましたが、それをちょっと詳しく紹介します。
人間の音声は非常に多くの情報量が含まれ、
現在の電波の通信容量ではこの多くの情報量を送ると大変なことになってしまいます。
そこで現在とられている方法が声の辞書「コードブック」という名の合成音を使うこと。
スマホや携帯電話では話し手に一番似ている「合成の声」が再生されているのです。
「コードブック」とは?
合成処理された音に変換された声の辞書。
そのままの声ではなく、約2000~2500種類の声の中から似ている声が選ばれています。
人の声帯の振動波形・喉の響き・声の大きさなどを様々なパターンに分類したもので、
そのパターンの組み合わせで人の声の特徴を表現しているそうです。
それを「CELP」という技術を使って「声のパターンの情報」だけを送ることによって、
通信データ量を減らして通話を可能にしています。
「CELP」とは?
まず、声の特徴を除いた音韻情報だけをデータに変換します。
これでデータ量を小さくすることができます。
しかし、それでは誰が話しているのか分からなくなってしまいます。
そこで「CELP」では声の特徴、つまり音の見本がついている「コードブック」を使います。
その「コードブック」の中から話し手の声の特徴に最も近い音を選びます。
あとは「コードブック」の番号と「CELP」の音韻情報だけを電波に乗せて送ります。
そして受信した相手のスマホがそれらの情報をもとに音声を合成して再生します。
なので聞こえる声は本人ではなく似ている声、自分の声がそのまま届いてるわけではありませんでした。
よく電話だと家族、兄弟姉妹と間違われるケースもありますよね。
もしかしたら同じ声が使われている可能性もありますよ。
それでは、またー。。。
↑クリックしてくれると「ターちゃんとトルちゃん」がよろこぶよ♪