MPEG-4_CELP
[Wikipedia|▼Menu]

MPEG-4 CELPは、MPEG-4 オーディオ(MPEG-4 Part 3)で採用された音声符号化方式である。音声符号化アルゴリズムとして良く知られている CELP(code excited linear prediction)をベースとし、様々なアプリケーションで使えるよう2つのサンプリング周波数と複数のビットレートとをサポートする。人間の音声を 3.85 kbps ? 23.8 kbps に符号化できる。

MPEG-4 CELP は、デジタル放送携帯電話インターネット電話、音声データベースなどの様々な用途に使うことができる。
概要

MPEG-4 CELP は MPEG-4 オーディオの低ビットレート音声符号化方式の1つで、1999年に ISO/IEC 14496-3 Subpart 3 で定義され[1]、その後 MPEG-4 Audio バージョン 2(ISO/IEC 14496-3:1999/Amd 1:2000)でエラー耐性と無音圧縮の拡張が行われた[2][3]

MPEG-4 CELP は人間の音声の符号化を行うためのもので、8 kHz と 16 kHz の 2 種類のサンプリング周波数をサポートする。サンプリング周波数 8 kHz(帯域幅 100 Hz - 3800 Hz)では 3.85?12.2 kbps の 28 種類のビット・レートで、サンプリング周波数 16 kHz(帯域幅 50 Hz - 7000 Hz)では 10.9?23.8 kbps の 30 種類のビット・レートで符号化ができる[4][5]

符号化ビットストリームは階層的な構成になっており、コアとなる基本層とそれに追加されたいくつかの拡張層からなる。基本層は音声の復号に必要な最低限の情報を表し、拡張層はそれに対する追加情報を表現する。使用環境に応じて必要な階層の情報を取り出すことで、同じ符号化結果から音質帯域幅が異なる様々なビットレートの情報を取り出すことができる。

使用する符号化アルゴリズムは、MPE(multipulse excitation、マルチパルス励起)あるいは RPE(regular pulse excitation、レギュラーパルス励起)を用いたもののいずれかを選択できる。 MPE を用いたものは音質と拡張性に優れ、RPE を用いたものはそれらを犠牲にする代わりに符号化に必要な演算量が少ない。

MPEG-4 CELP の特徴は以下の通りである[5]

マルチビットレート、ビットレート拡張性、帯域幅の拡張性がある

サンプリング周波数 8 kHz / 16 kHz、帯域幅 100 Hz-3800 Hz / 50 Hz-7000 Hz

ビットレート 3.85 - 23.8 kbps

フレーム長 10 - 40 ms (ビットレートに依存)

符号化遅延 15 - 45 ms (フレーム長に依存)

MPE と RPE のアルゴリズムを選択可能

また、無音時の情報圧縮のため、無音期間を音声区間検出機能(voice activity detector、VAD)で検出し SID(silence descriptor)と呼ばれるデータのみを使い低いビットレートで符号化する。復号時には、全くの無音を避けるため、SID を検出すると適度なレベルの背景雑音(コンフォートノイズ)を再生する。
MPEG-4 オーディオでの位置付け

MPEG-4 オーディオは多くのツールの組み合わせからなり、MPEG-4 CELP や MPEG-4 HVXC(harmonic vector excitation coding) は人間の自然な音声の符号化を行う自然音声符号化ツール(natural speech coding tools)の1つである[4]

自然音声符号化ツールは、MPEG-4 AAC などの汎用的なオーディオ符号化ツールでは十分な音質が得られない低いビットレートで音声符号化を行うツールである。 HVXC は MPEG-4 CELP がカバーできない超低ビットレート(2 - 4 kbps)での音声符号化を担当し、MPEG-4 CELP はそれ以上のビットレートをカバーする。

さらに低ビットレートでの音声表現が必要な場合は、文字から音声を合成するツールである MPEG-4 TTS Interface(Text-to-speech interface)を使用する。
アルゴリズム

MPEG-4 CELP のアルゴリズムは CELP に MPE(multipulse excitation)あるいは RPE(regular pulse excitation)を組み合わせたものである。

MPEG-4 CELP のベースとなる CELP は、声道に相当する合成フィルターとして線形予測フィルターを用い、有声音のような繰り返しの多い波形を適応型コードブックで効率的にパラメータ化する。線形予測と適応型コードブックで符号化できなかった残差信号の符号化には固定型コードブックを使用する。

最後の残差信号の符号化において、MPE では任意の間隔で並んだ複数のパルス信号の組み合わせ(マルチパルス)をコードブックとして用い、RPE では一定間隔に配置した振幅の異なるパルス信号の組み合わせ(レギュラーパルス)で表現する。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:33 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef