リアルタイム字幕放送
[Wikipedia|▼Menu]

リアルタイム字幕放送(リアルタイムじまくほうそう、リアルタイムキャプション放送とも)は、字幕つきの放送のうち、放送時に字幕を作成・付加するシステム。ここでは、主に日本テレビ放送で、受信機で表示を切り替えられるもの(「字幕放送」)を述べる。
概要

日本の文字多重放送(字幕放送)は事前に収録した番組にしか対応していなかった。生放送における字幕放送は、海外の表音文字のみ使用する場合だと音声認識で対応できたが、日本では同じ音でも複数の表記方法がある表語文字が使われ、機械的や技術的な問題があり行われていなかったのである。

聴覚障害者高齢者にも情報バリアフリーを推進していこうとNHK放送技術研究所が音声認識ソフトによる文字放送を開発した。2000年3月27日から日本放送協会(NHK)の一部番組で実施されており[注釈 1]、現在は民間放送(2013年現在は前者の日本テレビTBSテレビフジテレビテレビ朝日テレビ東京各系列と、その番組を同時ネットする一部の独立局や、一部のBS放送局およびCS放送局)やインターネットテレビ配信サービスのAbemaTVでも実施している。
原理

リアルタイム字幕の原理には、人間が聞き取ってキーボードから文字を入力する方式と、音声認識技術を用いた音声認識方式と、の2方式が存在する。

字幕を生成する過程以外では、通常の字幕放送と同じ流れでデータが重畳され、電波に乗せられて届けられる。原理的に字幕を生成する部分での遅延が避けられないので、字幕は発声の数秒遅れで表示される事になる。
キーボード入力方式

放送音声を「ステノキャプショナー(速記字幕入力者)」と呼ばれる入力オペレータが聞きながら同時に打ち込みを行う。入力は複数人で分担して行われるが、方式によって役割分担が異なっている。

主に2つの方式がある。
一般的なキーボードを用いた方式
パソコン要約筆記を応用した方式。複数人のオペレータが交互にリレー入力をする。一般的なOADG仕様のキーボードを使っている[注釈 2] ため、入力者を短期間で養成でき低コストというメリットをもつ。TBSテレビ朝日が採用している。
速記キーボードを用いた方式
スピードワープロ[1] やステンチュラといった速記用に最適化されたキーボードを使う。聞き取った音を入力する人と、その文字を漢字に変換する人に分担されている点が前項とは異なる。このため本方式ではかならず2人単位の人員を要する。トップスピードでは前項の方式に勝るものの、高価な専用キーボードが必要でオペレータの養成に3年程かかるため人件費もかさむ[2]。スピードワープロ研究所[3] やワードワープ[4] が採用しており、NHKやいくつかの民放がこれらの会社と契約をしている[2][5]

通常は打ち込み速度が放送音声より遅れるため、入力オペレータと校正オペレータの組を複数セット用いてリレー方式で入力を行う。
音声認識方式

基本的には音声認識による文字情報の直接生成を用いたものである。音声認識は現在でも100%の変換が難しいものであるが、ニュースにおいては語調や使用される単語などを一定の条件に制限できる事から、この用途に限って音声認識を用いる事で高い変換効率を実現した。開発当初、リアルタイム字幕の付加はスタジオなどでのアナウンサーの発声に限られる場合が多く、VTR映像などの音声には同様の字幕が付かない事が殆どだった。スポーツイベントやNHK紅白歌合戦などの番組では、専門のアナウンサーが字幕生成のためにセリフを再発声する「リスピーク方式」とすることで同様の条件を達成している[6]

NHKでは2012年3月14日放送の一部の『NHKニュース』から、アナウンサーの発声など認識率が高い部分は音声認識システムを使い、聞き取りにくい部分のみ担当者がリスピークを行う「ハイブリッド方式」の導入を開始した[7]

AbemaTVでは2018年12月10日放送の『けやきヒルズ』から、LASSICが開発したリアルタイムAI字幕システム「AIポン」の導入を開始した[8]
通常の字幕放送との違い

音声認識・キーボード入力共に、放送音声から字幕が表示されるまで遅延が発生することは、どうしても避けることができない。
アメリカ合衆国クローズドキャプションも同様。

NHKの生放送番組(ニュース番組以外)などでは、VTR収録部分や予め決めているコメントがあるときは、事前に作成しているためか、遅延なしまたは微妙な遅延程度に抑えて表示することもある[注釈 3]

ニュース番組などで事前に作成されている原稿を、放送されている音声のタイミングに合わせて字幕を送出するものは「テイク方式」と呼ばれる。

NHKでは2020年開始のNHKプラスでリアルタイム字幕放送のニュース番組(一部番組[注釈 4])を見逃し配信する際は、字幕と映像が合うように修正して配信される(テレビ放送から2?3時間後に字幕修正したものを配信)[9]。その後、2024年1月から生字幕同期システムの開発並びに稼働開始により、一部のニュース番組の同時配信において、音声とほぼ同じタイミングで字幕が表示されるようになった[10][11]

NHKでは2020年東京オリンピック・パラリンピック2022年北京オリンピックの放送において「ぴったり字幕」と称するリアルタイム字幕放送を実施した。原理的には、フジテレビで放送されていた『ダウンタウンなう』の「ほぼ生放送」と同じ遅延送出システムにリアルタイム字幕放送を組み合わせたもので、映像を30秒遅れで送出し字幕の作成時間を稼ぐ。なお『ダウンタウンなう』は「ほぼ生放送」時代は字幕放送を実施していない(のちの収録放送から通常の字幕放送をレギュラー実施。ただしリアルタイム字幕は1度のみ使用実績あり)。[12]


民放の番組ではCMに入ると、原理的にCMに入る数秒前の発言は字幕化できない。また、CMから明けてもCM入りする前の字幕から表示されるわけではないため、発言の流れがそこで途切れてしまう[注釈 5]

歌や音楽の音符・効果音の記述「(○○の音)」等、音関係の表示が少ない(一部番組では実施[注釈 6])。

表示位置は半固定。モニタの設定ができる場合をのぞき、常時同じ場所に表示される(NHKではほとんどの番組でテロップなどが隠れないように、字幕の位置を動かしている)。

半角文字は用いられない。カタカナ英数字は無条件で全角になる(TBSテレビを除く[注釈 7])。

注意しないと誰が話しているのかわからないことがある。アメリカのリアルタイム字幕放送同様に話し始めは「>>」(日本テレビ〈一部〉[注釈 8]、フジテレビ〈一部〉[注釈 9]毎日放送〈スポーツ中継を除く〉など)や「≫」(フジテレビ、テレビ朝日など)の記号を挿入するが、実施していない番組もある[注釈 10]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:111 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef