2020年10月2日のブログ記事一覧-熟年の文化徒然雑記帳

新井紀子著「AI vs. 教科書が読めない子どもたち」機械翻訳の限界

2020年10月02日 | 書評（ブックレビュー）・読書

　　　グーグルで、New York Timesのページをクリックすると、HPが現れるのだが、瞬時に、日本語に翻訳されたページに変ってしまう。
　　　他の英文記事を開いても同じで、有り難いはずなのだが、困ったことに、この翻訳が無茶苦茶で、到底読めるような翻訳になっていないのである。
　　　日本語の体裁を取ってはいるのだが、推測と想像を駆使しても殆ど意味不明で、翻訳されたばっかりに、記事としての意味をなさなくなってしまって、困っている。

　　　荒井教授によると、機械翻訳と言うようで、この本では、「現状の意味をまったく考えない機械翻訳を見ていると、それが人間による翻訳を代替する日は来ないだろうと思うのです。」と述べている。
　　　入力　私は先週、山口と広島に行った。
　　　出力　I went to Yamaguchi and Hiroshima.と、機械翻訳は反応するが、I went to Hiroshima with Yamaguchi.とを判別できないのだという。
　　　また、
　　　入力　How many children do you have?
　　　出力　あなたはどのように多くのこどもがありますか？
　　　もっと難しいのは、No.の訳で、疑問否定文の応答ならば、「はい」と訳さねばならないのだが、それは、現状の機械翻訳の仕組みでは難しい。と言う。

　　　オリンピックまでに多言語音声翻訳は完成するか、
　　　そのためには、機械翻訳に必要なデータ、対訳データが必要で、問題はその数であり、100万組では焼け石に水で、1000万組ぐらい集まればダイヴマシになりそうだが、実用に耐える精度になるかどうか、その先、一体どれだけ集めれば良いのか、誰にも分らない。
　　　
　　　著者は、対訳データの収集の難しさやクラウドソーシングの利用など説明しているが、結論として、
　　　無償のグーグル翻訳に世界中のユーザーが依存して慣れ親しんで、そのエラーを含めて受容した時、有償の機械翻訳がビジネスとして成立するのか。そこは非常に難しい判断で、特に、対訳データが不足し過ぎている現状では、厳密な機械翻訳が求めれれる国際会議やビジネスシーンで使う翻訳機を、統計的手法の翻訳機械で製造して、製造物責任のリスクまで負うのは、得策とは考えられません。と言う。
　　　要するに、そこそこの機械翻訳は、対訳データの充実があれば可能かも知れないが、人間の通訳や翻訳のように、満足な翻訳は、機械には無理だと言うことであろう。
　　　従って、「オリンピックまでに多言語音声翻訳は完成するか」という問題だが、全く言葉の分らない外国人にとっては、ないよりは、不完全でも対訳音声通訳器があれば、助かるかも知れないが、さて、それで良いのか、どうであろうか。

　　　先に書いたNew York Timesの翻訳についてだが、こんないい加減な報道に切り替え翻訳された新聞社が、マイクロソフトにクレイムをしないのであろうか、
　　　今のところ、もとの英文に返すにはどうすれば良いのか、パソコンの操作が分らないので、その方法を探すとして、私には、もう、New York Timesを読む気もしないし、読めなくなったと言うことである。
　　　情報量の多い英文のウィキペデイアを使うことが多かったのだが、これも使えなくなってしまった。
　　　私には、英文は英文であって欲しいのである。

（追記）設定を切り替えて、英文に戻すことができたので安心した。
　　　　いずれにしろ、マイクロソフトの英文和訳の現状は、使用に耐えない状態にあると言うことで、おそらく、他の機械翻訳の状態も、まだまだ、実用化にはほど遠いと言うことであろうと思われる。

2020年10月
日	月	火	水	木	金	土
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

熟年の文化徒然雑記帳

徒然なるままに、クラシックや歌舞伎・文楽鑑賞、海外生活と旅、読書、生活随想、経済、経営、政治等々万の随想を書こうと思う。

新井 紀子著「AI vs. 教科書が読めない子どもたち」機械翻訳の限界

goo blog お知らせ

プロフィール

ログイン

goo blog おすすめ

カレンダー

最新記事

カテゴリー

最新コメント

バックナンバー

ブックマーク

新井紀子著「AI vs. 教科書が読めない子どもたち」機械翻訳の限界