熟年の文化徒然雑記帳

徒然なるままに、クラシックや歌舞伎・文楽鑑賞、海外生活と旅、読書、生活随想、経済、経営、政治等々万の随想を書こうと思う。

新井 紀子著「AI vs. 教科書が読めない子どもたち」機械翻訳の限界

2020年10月02日 | 書評(ブックレビュー)・読書
   グーグルで、New York Timesのページをクリックすると、HPが現れるのだが、瞬時に、日本語に翻訳されたページに変ってしまう。
   他の英文記事を開いても同じで、有り難いはずなのだが、困ったことに、この翻訳が無茶苦茶で、到底読めるような翻訳になっていないのである。
   日本語の体裁を取ってはいるのだが、推測と想像を駆使しても殆ど意味不明で、翻訳されたばっかりに、記事としての意味をなさなくなってしまって、困っている。

   荒井教授によると、機械翻訳と言うようで、この本では、「現状の意味をまったく考えない機械翻訳を見ていると、それが人間による翻訳を代替する日は来ないだろうと思うのです。」と述べている。
   入力 私は先週、山口と広島に行った。
   出力 I went to Yamaguchi and Hiroshima.と、機械翻訳は反応するが、I went to Hiroshima with Yamaguchi.とを判別できないのだという。
   また、
   入力 How many children do you have?
   出力 あなたはどのように多くのこどもがありますか?
   もっと難しいのは、No.の訳で、疑問否定文の応答ならば、「はい」と訳さねばならないのだが、それは、現状の機械翻訳の仕組みでは難しい。と言う。

   オリンピックまでに多言語音声翻訳は完成するか、
   そのためには、機械翻訳に必要なデータ、対訳データが必要で、問題はその数であり、100万組では焼け石に水で、1000万組ぐらい集まればダイヴマシになりそうだが、実用に耐える精度になるかどうか、その先、一体どれだけ集めれば良いのか、誰にも分らない。
   
   著者は、対訳データの収集の難しさやクラウドソーシングの利用など説明しているが、結論として、
   無償のグーグル翻訳に世界中のユーザーが依存して慣れ親しんで、そのエラーを含めて受容した時、有償の機械翻訳がビジネスとして成立するのか。そこは非常に難しい判断で、特に、対訳データが不足し過ぎている現状では、厳密な機械翻訳が求めれれる国際会議やビジネスシーンで使う翻訳機を、統計的手法の翻訳機械で製造して、製造物責任のリスクまで負うのは、得策とは考えられません。と言う。
   要するに、そこそこの機械翻訳は、対訳データの充実があれば可能かも知れないが、人間の通訳や翻訳のように、満足な翻訳は、機械には無理だと言うことであろう。
   従って、「オリンピックまでに多言語音声翻訳は完成するか」という問題だが、全く言葉の分らない外国人にとっては、ないよりは、不完全でも対訳音声通訳器があれば、助かるかも知れないが、さて、それで良いのか、どうであろうか。

   先に書いたNew York Timesの翻訳についてだが、こんないい加減な報道に切り替え翻訳された新聞社が、マイクロソフトにクレイムをしないのであろうか、
   今のところ、もとの英文に返すにはどうすれば良いのか、パソコンの操作が分らないので、その方法を探すとして、私には、もう、New York Timesを読む気もしないし、読めなくなったと言うことである。
   情報量の多い英文のウィキペデイアを使うことが多かったのだが、これも使えなくなってしまった。
   私には、英文は英文であって欲しいのである。

(追記)設定を切り替えて、英文に戻すことができたので安心した。
    いずれにしろ、マイクロソフトの英文和訳の現状は、使用に耐えない状態にあると言うことで、おそらく、他の機械翻訳の状態も、まだまだ、実用化にはほど遠いと言うことであろうと思われる。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする