グーグルで、New York Timesのページをクリックすると、HPが現れるのだが、瞬時に、日本語に翻訳されたページに変ってしまう。
他の英文記事を開いても同じで、有り難いはずなのだが、困ったことに、この翻訳が無茶苦茶で、到底読めるような翻訳になっていないのである。
日本語の体裁を取ってはいるのだが、推測と想像を駆使しても殆ど意味不明で、翻訳されたばっかりに、記事としての意味をなさなくなってしまって、困っている。
荒井教授によると、機械翻訳と言うようで、この本では、「現状の意味をまったく考えない機械翻訳を見ていると、それが人間による翻訳を代替する日は来ないだろうと思うのです。」と述べている。
入力 私は先週、山口と広島に行った。
出力 I went to Yamaguchi and Hiroshima.と、機械翻訳は反応するが、I went to Hiroshima with Yamaguchi.とを判別できないのだという。
また、
入力 How many children do you have?
出力 あなたはどのように多くのこどもがありますか?
もっと難しいのは、No.の訳で、疑問否定文の応答ならば、「はい」と訳さねばならないのだが、それは、現状の機械翻訳の仕組みでは難しい。と言う。
オリンピックまでに多言語音声翻訳は完成するか、
そのためには、機械翻訳に必要なデータ、対訳データが必要で、問題はその数であり、100万組では焼け石に水で、1000万組ぐらい集まればダイヴマシになりそうだが、実用に耐える精度になるかどうか、その先、一体どれだけ集めれば良いのか、誰にも分らない。
著者は、対訳データの収集の難しさやクラウドソーシングの利用など説明しているが、結論として、
無償のグーグル翻訳に世界中のユーザーが依存して慣れ親しんで、そのエラーを含めて受容した時、有償の機械翻訳がビジネスとして成立するのか。そこは非常に難しい判断で、特に、対訳データが不足し過ぎている現状では、厳密な機械翻訳が求めれれる国際会議やビジネスシーンで使う翻訳機を、統計的手法の翻訳機械で製造して、製造物責任のリスクまで負うのは、得策とは考えられません。と言う。
要するに、そこそこの機械翻訳は、対訳データの充実があれば可能かも知れないが、人間の通訳や翻訳のように、満足な翻訳は、機械には無理だと言うことであろう。
従って、「オリンピックまでに多言語音声翻訳は完成するか」という問題だが、全く言葉の分らない外国人にとっては、ないよりは、不完全でも対訳音声通訳器があれば、助かるかも知れないが、さて、それで良いのか、どうであろうか。
先に書いたNew York Timesの翻訳についてだが、こんないい加減な報道に切り替え翻訳された新聞社が、マイクロソフトにクレイムをしないのであろうか、
今のところ、もとの英文に返すにはどうすれば良いのか、パソコンの操作が分らないので、その方法を探すとして、私には、もう、New York Timesを読む気もしないし、読めなくなったと言うことである。
情報量の多い英文のウィキペデイアを使うことが多かったのだが、これも使えなくなってしまった。
私には、英文は英文であって欲しいのである。
(追記)設定を切り替えて、英文に戻すことができたので安心した。
いずれにしろ、マイクロソフトの英文和訳の現状は、使用に耐えない状態にあると言うことで、おそらく、他の機械翻訳の状態も、まだまだ、実用化にはほど遠いと言うことであろうと思われる。
他の英文記事を開いても同じで、有り難いはずなのだが、困ったことに、この翻訳が無茶苦茶で、到底読めるような翻訳になっていないのである。
日本語の体裁を取ってはいるのだが、推測と想像を駆使しても殆ど意味不明で、翻訳されたばっかりに、記事としての意味をなさなくなってしまって、困っている。
荒井教授によると、機械翻訳と言うようで、この本では、「現状の意味をまったく考えない機械翻訳を見ていると、それが人間による翻訳を代替する日は来ないだろうと思うのです。」と述べている。
入力 私は先週、山口と広島に行った。
出力 I went to Yamaguchi and Hiroshima.と、機械翻訳は反応するが、I went to Hiroshima with Yamaguchi.とを判別できないのだという。
また、
入力 How many children do you have?
出力 あなたはどのように多くのこどもがありますか?
もっと難しいのは、No.の訳で、疑問否定文の応答ならば、「はい」と訳さねばならないのだが、それは、現状の機械翻訳の仕組みでは難しい。と言う。
オリンピックまでに多言語音声翻訳は完成するか、
そのためには、機械翻訳に必要なデータ、対訳データが必要で、問題はその数であり、100万組では焼け石に水で、1000万組ぐらい集まればダイヴマシになりそうだが、実用に耐える精度になるかどうか、その先、一体どれだけ集めれば良いのか、誰にも分らない。
著者は、対訳データの収集の難しさやクラウドソーシングの利用など説明しているが、結論として、
無償のグーグル翻訳に世界中のユーザーが依存して慣れ親しんで、そのエラーを含めて受容した時、有償の機械翻訳がビジネスとして成立するのか。そこは非常に難しい判断で、特に、対訳データが不足し過ぎている現状では、厳密な機械翻訳が求めれれる国際会議やビジネスシーンで使う翻訳機を、統計的手法の翻訳機械で製造して、製造物責任のリスクまで負うのは、得策とは考えられません。と言う。
要するに、そこそこの機械翻訳は、対訳データの充実があれば可能かも知れないが、人間の通訳や翻訳のように、満足な翻訳は、機械には無理だと言うことであろう。
従って、「オリンピックまでに多言語音声翻訳は完成するか」という問題だが、全く言葉の分らない外国人にとっては、ないよりは、不完全でも対訳音声通訳器があれば、助かるかも知れないが、さて、それで良いのか、どうであろうか。
先に書いたNew York Timesの翻訳についてだが、こんないい加減な報道に切り替え翻訳された新聞社が、マイクロソフトにクレイムをしないのであろうか、
今のところ、もとの英文に返すにはどうすれば良いのか、パソコンの操作が分らないので、その方法を探すとして、私には、もう、New York Timesを読む気もしないし、読めなくなったと言うことである。
情報量の多い英文のウィキペデイアを使うことが多かったのだが、これも使えなくなってしまった。
私には、英文は英文であって欲しいのである。
(追記)設定を切り替えて、英文に戻すことができたので安心した。
いずれにしろ、マイクロソフトの英文和訳の現状は、使用に耐えない状態にあると言うことで、おそらく、他の機械翻訳の状態も、まだまだ、実用化にはほど遠いと言うことであろうと思われる。