新・私に続きを記させて(くろまっくのブログ)

ハイキングに里山再生、れんちゃんとお父さんの日々。

Googleドキュメントの音声認識

2021年04月01日 | 仕事/ビジネス
 3月は、仕事で動画からの文字起こしをひたすらやっていた。単価は個人なら受けるレベルで、企業としては通常なら赤字だ。しかしコロナ禍で市況が悪化した今、仕事の話があるだけでもありがたい。仕事の内容にも興味があった。震災の体験を記録する、一種の記憶遺産のインタビュー記録集である。確かに、あまり予算の出る仕事ではないが、この仕事はいい加減な人に任せたくなかった。

 限られた予算とはいえ、赤字で終わっていいわけがない。効率化をめざして、後輩氏のアドバイスとサポートで、Googleドキュメントの音声認識を利用することにした。結果、儲けもなかったが、赤字も出ないレベルには落ち着いた。



 最初は自動記述させたのを、後から動画を再生しつつリライトしようと思ったが、ところどころ抜けがあったり、一見もっともらしいのだが全然ニュアンスが違ったりする。「あります」とハッキリ言っているのを「ありません」と誤変換する(これがよくある)のは前後の文脈で判断がつくが、予想だにしない誤変換も少なくなかった。それがAIの成果か、一見もっともらしい文章になっているので始末に負えない。

 困ったのは、最初は正しく変換していたのに、後で勝手に再変換してしまうことがある。言い間違いを修正したり、きちんと再解釈できていることもあるのだが、アダルトコンテンツのニーズが多いのか、エロ関係の語彙は無駄に豊富で、トンデモな誤変換も少なくなかった。「事務所に、会社に行きますと」という発言を「熟女に顔射でイカせる」と変換したのには、「このエロガキが!」とツッコミを入れてしまった。「降り」も「取り」も「ロリ」だし、「穴」といえば「アナル」(間違ってはいないが!)だし、エロ系誤変換は枚挙にいとまがない。なぜそうなる。

 「これ、女性社員に使わせられませんね。業務上セクハラじゃないですか」と、傍で見ていた後輩氏もあきれかえっていた。全くそのとおりだ。

 というわけで、手直しは必要だし、女性には推奨しがたいけれど、9割の人の7割がたのことばはきちんと拾える。関西弁もきちんとサポートしている。6割以上機械任せにできるのは、大きな進歩である。一語一語しっかり押さえてくれるから、「プロ」が無造作にきれいに整形してしまう前の、その人となりの発話を再現できる。これは貴重だ。

 もっとも、早口の人だと、変換が追いつかないし、九州のある県出身の方言の強い人の話はきちんとヒアリングできなかった。相性があるらしい。こういう場合は平常どおりに手動入力になる。完全自動化というわけにはいかなかったが、途中からクセがわかってきたし、AIも学習するのか後半の作業はスムーズになった。検索履歴と修正履歴を学習するのか、複数回登場した会社名などは一発変換するようになった。もっと音声認識のユーザーが増えれば、AIも賢くなるだろう。

 若い頃から苦痛で仕方なかったテープ起こしの仕事がなくなるのは大いに結構なことだ。しかしGoogleのAIを賢くすることで、私は自らの手でライターの自分の仕事を減らしていくことに荷担している、ともいえそうだ。


最新の画像もっと見る