犬鍋のヨロマル漫談

ヨロマルとは韓国語で諸言語の意。日本語、韓国語、英語、ロシア語などの言葉と酒・食・歴史にまつわるエッセー。

コンピューターの音声機能

2012-04-23 01:10:42 | 言葉

私の大学の友人で、応用物理の大学院を卒業したやつが大手電機メーカーに入社し、配属された部署のミッションは音声認識装置の開発だったそうです。「言語学の知識が必要だ」とか言って、チョムスキーを読んでいました。

(チョムスキーから始めるなんて、ずいぶん気の長い話だなあ)

と思ったことを覚えています。

 彼の努力が実って、音声認識装置は完全に実用化したようですね。最近のスマホは、「犬鍋さんにメール」とつぶやくだけで、私宛のEメール作成画面が出てくるらしい。実際に会社の同僚に、アンドロイド系のスマホで実演してもらいました。

 「認識」のほうはそこまで発達しているようですが、「発声」のほうはどうか。

 日本語は、母音の数や子音の数が少ないので、ほかの言語に比べて発音が簡単だということになっています。しかし、実は高低アクセントがあって、これが正しく発音されないと、変に聞こえる。そして、高低アクセントは文字表記には表れない。単語や構文によってアクセントは変わりますから、機械が発声する場合、機械は文章の意味を正しく認識しなければなりません。おそらくは音声認識と同程度の「認識力」が必要になるでしょう。

 一方タイ語の場合、子音母音が多い上に5つの声調があって、発音は非常に複雑ですが、タイ文字は表音文字には、声調が表示されているのでコンピューターによる認識は楽そうです。

 機械のお手並み拝見ということで、グーグル翻訳についている文章読み上げ機能で遊んでみました。(→リンク


鼻が高い。

 これは6拍で、東京のアクセントは「低高高低高低」。グーグル翻訳の翻訳元の窓に貼り付け、スピーカーボタンをクリックしてみると…。

 正しい東京アクセントで読まれました。

 次に

花が高い。

 花屋さんで花を買ったら高かったという意味ですね。こちらは「花が」の部分が「低高低」になる。こちらも正しく読まれました。

 なかなか優秀ですね。漢字の違いからアクセントを判断しているようです。

 ここで「鼻/花」をひらがなにしてみました。

はなが高い。

 すると、「高低高」となって、「鼻が」でも「花が」でもない、おかしなアクセントになるうえ、どうも第一文字目の「は」の発音が「わ」と発音されているように聞こえます。

「わなが高い???」

 もっとも、「はなが高い」は文章自体が曖昧なので、人間が読むときも迷う。機械が正しく認識できなくて当然かもしれません。

 次に「はな」を「ハナ」にしてみた。

ハナが高い。

 
無理にこじつければ、「ハナ」という名のおばあさん(じゃなくてもいいんだけど)のやっている店は、ほかの店よりも値段が高いという意味とすればありえない文章ではありません。「ハナが」の部分は「高低低」になるはずです。

これは

「高低低」

と正しく発音されました。

 ところがおばあさんは亡くなってしまった。

ハナが他界した。

 これも正しく読まれました。

 「はながたかい」に関して言えば、漢字かなまじり文にしてやると、だいたい正しいアクセントで読まれるようです。

 次に

はしが折れた。

 
「はし」には「箸、端、橋」の三つの可能性があり、「箸が」(高低低)、「端が」(低高高)、「橋が」(低高低)。関西アクセントでは「箸が」と「橋が」が逆になると思われます(よく知りません)。

 まず、

箸が折れた。

 力を込めて食べていたら箸が折れちゃったんですね(どんな怪力だ)。

 これは「が」の高さがあいまいな気がしますが、だいたい正しいようです。

端が折れた。

 
書類の端が折れたんでしょう。これも正しい。

 最後に、

橋が折れた。

 地震で橋が真ん中からポッキリ折れちゃいました。(地震がなくても「聖水大橋」は折れましたが…)

 これは「端が折れた」と同じアクセントになる。東京アクセントとしては間違っています。コンピューターは「橋は折れるはずがない」と思っているのでしょうか。動詞を変えてみましょう。

橋が落ちた。

 
こっちも「端が落ちた。」のように発音され、×。「橋が」は正しく発音できないんでしょうか。

ところが、

橋が流された。

にしてみると、今度はきれいな東京アクセントで発音されます。「橋」は「折れたり、落ちたり」はしないけど、「流される」ことはある、という判断がコンピューターに組み込まれているようです。

 念のため、

箸が流された。

にしてみると、これもちゃんと発音されます。我が家のシンクでは、箸はあまり流されませんが、ティースプーンがよく流されて、排水口のゴミの袋に入ったまま棄てられ、定期的に消費されます。

「箸/端/橋」の実験によると、漢字かなまじり文であっても、きちんと読めない場合があるということになりそうです。


コメント (5)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 新たなマンナム | トップ | アメリカンフットボール観戦 »
最新の画像もっと見る

5 コメント

コメント日が  古い順  |   新しい順
Unknown (トムヤム)
2012-04-24 01:43:11
メロディと歌詞を入力すと合成音で歌ってくれるソフトは随分と出来は良いらしいです。
私は使ったこよはないのですが。
返信する
定期的に消費されます (のりみ)
2012-04-24 09:24:24
やっぱり犬鍋さんは面白すぎます。

私も麻婆豆腐が大好きであちこち食べ歩いているのですが、
これは!という店になかなか巡り会えません。
今のところのベストは、横浜中華街「景徳鎮」ですかね。
そこの味を再現しようと自分で郫県豆板醤や朝天朝天唐辛子を買いこんでまで作ってみたりしていますが、なかなかあの味が出せません…
池袋のおいしいという店のレポを楽しみにしています。
返信する
メロディと歌詞… (犬鍋)
2012-04-25 22:46:46
歌詞をメロディーにのせる場合は、アクセントは無視できる、すなわち構文を分析する必要がないからかな。

どんな人の需要があるのかよくわかりませんが。

作曲家向け?
返信する
麻婆豆腐 (犬鍋)
2012-04-25 23:00:09
食べ歩きですか…

これは好みがあるから、お勧めして口に合うかどうか。

池袋北口の知音という店です。中国人から、中国の味といって紹介されました。

日本人に合わせようという気持ちはぜんぜんなく、四川のディープな味を出してます。

何人か日本人を連れて行きましたが、辛すぎて食べられない人、辛いのは大丈夫だが香辛料が苦手な人など、気に入ってくれた人のほうが少ないです。
返信する
初音ミク (トムヤム)
2012-04-26 23:26:31
CGキャラクターの初音ミクに歌わせて
YouTubeやニコ生で発表するのがブームに
なっているようです。

初音ミクで検索すると山ほど出てきます。

返信する

コメントを投稿

言葉」カテゴリの最新記事