NHKは、生放送の番組の字幕制作を音声認識技術を用いる方法と速記タイプ入力を用いる方法を併用したり使い分けている。
ニュースなどスタジオからは、アナウンサーの声をそのまま音声認識技術で字幕制作をしている。ニュース中の中継の音声などは速記タイプ入力を用いている。
しかし、オリンピックや相撲中継、マラソン、ワールドカップなどのスポーツ番組の生中継番組では、音声認識技術を観客の歓声や車両の走行音など雑音も多く、そのまま使えない。
NHKは、「字幕キャスター」による字幕制作を行っている。
「字幕キャスターというのは、聴覚障害者向けの字幕をつくるため、スタジオでモニターを見ながら、音声自動認識装置に、向かって、現場実況を要約してコメントしているアナウンサーだ」(2002年平成14年6月25日日経新聞NHK日本語センター山下俊文氏)
字幕キャスターは、番組のアナウンサーが話したことをそのまま話して字幕にするわけではない。一つは、音声認識で読み取った音が誤変換するからだ。
「日本対トルコの試合」→「日本タイトルこの試合」
もう一つの理由は、放送されている画面を見ている聴覚障害者に分かるような字幕を制作するためだ。
場面の展開の早いシーンでは字幕化には5秒の時差が生じるので字幕になった時にはそのシーンが終わっている場合も多く、見て分かるものは字幕にしていない。
「現場の声を聞き、画面で試合状況を確認しながら、現場実況の修飾語や接続詞などを素早くそぎ落とし、内容を要約する。音声から変換された字幕をチェックする」(引用:同前)
この辺は、要約筆記の要約の考えに似ていなくもない。要約筆記の場合は同時性のために、積極的に要約するのだが、テレビの場合は時差や誤変換が生じるなどの理由だ。
この要約のことを「編集」と言っているが、要約筆記でいうところの「文章の再構築」だ。要約筆記同様集中力を必要とするのは同じだ。
「高い編集能力が必要なため、四十六歳の現役アナウンサーから六十四歳のOBまで、ベテラン四人をそろえた。高い集中力が必要で一人十-十五分が限界のため交代で担当した」(引用:同前)
字幕アナウンサーではなく、字幕キャスターと言っているのは、話す内容についてある程度裁量が任されているからだろう。
「字幕しか流れない情報もある。長身の選手がゴールした後、身長、体重を加えたり、元気に走り回るベテラン選手の年齢を伝えたりするなど、独自情報をつけている」(引用:同前)
しかし、聴覚障害者のことを理解して、音声認識技術や字幕化のプロセスを理解して、狭い画面に少ない文字数で情報を伝えるための字幕制作をするのは立派な専門性だ。ステノキャプショナーは速記同様、音声を文字化するだけでは聴覚障害者の情報保障者になれない。字幕キャスターがステノキャプショナーの入力技術を持ったらどうだろうか。要約筆記者がステノキャプショナーのように持ったらどうか。優れた要約筆記者がパソコン要約をしようとすると日本語変換やその他の理由でその力が発揮できない人は多いのだが。
ラビット 記
ニュースなどスタジオからは、アナウンサーの声をそのまま音声認識技術で字幕制作をしている。ニュース中の中継の音声などは速記タイプ入力を用いている。
しかし、オリンピックや相撲中継、マラソン、ワールドカップなどのスポーツ番組の生中継番組では、音声認識技術を観客の歓声や車両の走行音など雑音も多く、そのまま使えない。
NHKは、「字幕キャスター」による字幕制作を行っている。
「字幕キャスターというのは、聴覚障害者向けの字幕をつくるため、スタジオでモニターを見ながら、音声自動認識装置に、向かって、現場実況を要約してコメントしているアナウンサーだ」(2002年平成14年6月25日日経新聞NHK日本語センター山下俊文氏)
字幕キャスターは、番組のアナウンサーが話したことをそのまま話して字幕にするわけではない。一つは、音声認識で読み取った音が誤変換するからだ。
「日本対トルコの試合」→「日本タイトルこの試合」
もう一つの理由は、放送されている画面を見ている聴覚障害者に分かるような字幕を制作するためだ。
場面の展開の早いシーンでは字幕化には5秒の時差が生じるので字幕になった時にはそのシーンが終わっている場合も多く、見て分かるものは字幕にしていない。
「現場の声を聞き、画面で試合状況を確認しながら、現場実況の修飾語や接続詞などを素早くそぎ落とし、内容を要約する。音声から変換された字幕をチェックする」(引用:同前)
この辺は、要約筆記の要約の考えに似ていなくもない。要約筆記の場合は同時性のために、積極的に要約するのだが、テレビの場合は時差や誤変換が生じるなどの理由だ。
この要約のことを「編集」と言っているが、要約筆記でいうところの「文章の再構築」だ。要約筆記同様集中力を必要とするのは同じだ。
「高い編集能力が必要なため、四十六歳の現役アナウンサーから六十四歳のOBまで、ベテラン四人をそろえた。高い集中力が必要で一人十-十五分が限界のため交代で担当した」(引用:同前)
字幕アナウンサーではなく、字幕キャスターと言っているのは、話す内容についてある程度裁量が任されているからだろう。
「字幕しか流れない情報もある。長身の選手がゴールした後、身長、体重を加えたり、元気に走り回るベテラン選手の年齢を伝えたりするなど、独自情報をつけている」(引用:同前)
しかし、聴覚障害者のことを理解して、音声認識技術や字幕化のプロセスを理解して、狭い画面に少ない文字数で情報を伝えるための字幕制作をするのは立派な専門性だ。ステノキャプショナーは速記同様、音声を文字化するだけでは聴覚障害者の情報保障者になれない。字幕キャスターがステノキャプショナーの入力技術を持ったらどうだろうか。要約筆記者がステノキャプショナーのように持ったらどうか。優れた要約筆記者がパソコン要約をしようとすると日本語変換やその他の理由でその力が発揮できない人は多いのだが。
ラビット 記