G.719
[Wikipedia|▼Menu]

G.719 は ITU-T が勧告したフルバンドの高音質会話アプリケーション用の音声とオーディオ用の符号化方式で、20 Hz-20 kHz までのフルバンドの音声/オーディオ信号を 32 kbps から 128 kbps に符号化でき、処理に必要な演算量が低い特徴がある[1]

G.719 の正式な名称はLow-complexity, full-band audio coding for high-quality, conversational applications(高品質会話型用途向け低演算量フルバンドオーディオ符号化)である。
概要

G.719 は、テレビ会議テレコンファレンスシステムで使われている G.722.1帯域幅 7kHz)や G.722.1 Annex C帯域幅 14kHz)のような音声符号化方式をさらに高音質化したものである。

この方式は G.722.1 のフルバンド拡張機能の仕様策定の際にポリコム社((Polycom Inc.)が提案した「Siren 22」方式とエリクソン社の提案方式とがベースになっており、最終的に両者の方式が統合され新しい勧告 G.719 となり ITU-T が 2008 年 6 月に勧告した[2]

コーデックの入出力は 16ビット長、サンプリング周波数 48kHzで、人間の聴覚の可聴域と言われている 20 Hz-20 kHzのフルバンドの音声/オーディオ信号を符号化できる。

G.719 の符号化アルゴリズムは知覚符号化((perceptual audio coding)の一種である変換符号化(transeform coding)がベースである。MDCT(modified discrete cosine transform、修正離散コサイン変換)を使用し周波数領域の係数に変換し、適応ビット割り当てと格子ベクトル量子化(lattice vector quantization))を行う。また入力信号の内容に応じ離散コサイン変換の時間分解能を変化させ、変化の激しい音に対する音質向上を行っている。

G.719 の特徴を以下にまとめる。

高品質の音声/オーディオの両方をサポート

符号化/復号の演算量が低い(MP3が100MIPS以上、MPEG4 AAC-LDが130MIPS以上なのに対し、17.7MIPS程度[2]

入出力のサンプリング周波数 48 kHz/16 bit、帯域幅 20 Hz-20 kHz

32から128 kbpsまでの20種類のビットレートをサポート(32-88 kbpsは4 kbpsステップ、88 kbps-128 kbpsは8 kbpsステップ)

20 msのフレーム長、符号化遅延 40 ms

インターネット上での RTP による G.719のペイロードの形式は .mw-parser-output cite.citation{font-style:inherit;word-wrap:break-word}.mw-parser-output .citation q{quotes:"\"""\"""'""'"}.mw-parser-output .citation.cs-ja1 q,.mw-parser-output .citation.cs-ja2 q{quotes:"「""」""『""』"}.mw-parser-output .citation:target{background-color:rgba(0,127,255,0.133)}.mw-parser-output .id-lock-free a,.mw-parser-output .citation .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/6/65/Lock-green.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-limited a,.mw-parser-output .id-lock-registration a,.mw-parser-output .citation .cs1-lock-limited a,.mw-parser-output .citation .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/d/d6/Lock-gray-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-subscription a,.mw-parser-output .citation .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/a/aa/Lock-red-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .cs1-ws-icon a{background:url("//upload.wikimedia.org/wikipedia/commons/4/4c/Wikisource-logo.svg")right 0.1em center/12px no-repeat}.mw-parser-output .cs1-code{color:inherit;background:inherit;border:none;padding:inherit}.mw-parser-output .cs1-hidden-error{display:none;color:#d33}.mw-parser-output .cs1-visible-error{color:#d33}.mw-parser-output .cs1-maint{display:none;color:#3a3;margin-left:0.3em}.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right{padding-right:0.2em}.mw-parser-output .citation .mw-selflink{font-weight:inherit}RFC 5404 で定義されている[3]

また、ISO ベースメディアファイルフォーマットISO/IEC 14496-14、いわゆる MPEG-4 Part 12)の形式が G.719 ANNEX A の仕様で定義されている。これは MP4(audio/mp4 あるいは video/mp4)や 3GP (audio/3GPP と video/3GPP) の各ファイル形式で使用することができる[1]
アルゴリズム

G.719 では、MP3AAC などのオーディオ圧縮方式と同様、MDCT(修正離散コサイン変換)を用いた変換符号化により符号化と復号を行う。

符号化は、48kHz でサンプリングされた信号に対し、大まかに以下のステップで行われる[1][2]
周波数領域のパラメータに変換

信号のトランジェント検出

信号の修正離散コサイン変換(トランジェント部分は時間分解能を上げる)


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:30 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef