ISO/IEC_14496-3
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

AACAAC、HE-AAC、HE-AAC v2 各プロファイルの階層構造と各ツールの関係MPEG-2 AAC LC(Low Complexity)プロファイルと MPEG-4 AAC LC から HE-AAC v2 プロファイルまでの変遷

AAC(Advanced Audio Coding)の基本となる方式として以下のものがある。これらは MPEG-2 の AAC プロファイルをベースとしている。
AAC Main
高音質の AAC 方式。AAC LC の機能を含み、AAC LC より演算量が多い。
AAC LC(Low Complexity)
AAC Main から後方予測(backward prediction)の機能を除いた方式。同じビットレートでの音質は AAC Main より劣るが演算量が少なく伝送誤りに強い。
AAC SSR(Scalable Sample Rate)
周波数帯域の拡張性を持たせるため、4 帯域の帯域分割フィルターを使い帯域ごとに符号化を行う方式。同じビットストリームから帯域の異なる復号結果を得ることができ、用途に応じて演算量の調節ができる。

大まかには、AAC は音楽などの入力信号を MDCT を用いて周波数領域の係数に変換して長期予測などの処理を行い、聴覚心理学上の特性を考慮しながら帯域ごとに正規化量子化を行った後にハフマン符号で符号化する。復号はこの逆の操作を行う。

MPEG-4オーディオでは、量子化符号化の方式として TwinVQ や BSAC(Bit-Sliced Arithmetic Coding)を使う方式も選択できる。また高域成分やステレオ信号を少数のパラメータで符号化し大幅な情報の圧縮を行う HE-AAC プロファイルもある。
TwinVQ

TwinVQ(Transform-domain Weighted Interleave Vector Quantization、変換領域重み付けインターリーブベクトル量子化)はベクトル量子化の一種で、MPEG-4 では汎用オーディオ符号化での量子化と符号化の方式として用いられる。符号長が固定なため通信エラーに比較的強く、圧縮率を状況に応じて変えることができ[18][19]、AAC が不得意な低いビットレート(6 kbps ?)での音質が比較的優れている。
BSAC

BSAC(Bit-Sliced Arithmetic Coding)は、ビットストリームを階層化しビットレート拡張性を持たせるための技術で、AAC のハフマン符号の代わりに用いられる。チャネル当たり 1 kbps の細かいステップのビットレート拡張性が得られる[17]

BSAC では、AACと同様の方法で求めた量子化後の周波数領域の係数のまとまりを、上位ビットから順に階層的にまとめ各階層のビットプレーンごとにエントロピー符号化を行う。エントロピー符号化の方式には算術符号(Arithmetic Code)を用いる。階層が増えるに従って下位のビット情報が追加されてデータの欠落が少なくなり、より高品質の復号結果を得ることができる。

ビットレートを、ネットワーク状況などの環境に応じて細かい単位でダイナミックに変えることができるため、リアルタイムでの QoS 制御などを実現できる[20]

BSAC は DMB(Digital Multimedia Broadcasting)で使用されている。
AAC LD

AAC LD(Low Delay)は符号化遅延を抑えた方式で、通信などリアルタイムで符号化と復号が必要な用途に用いられる。アルゴリズムから決まる符号化遅延はサンプリング周波数 48 KHz の場合で 20ms 以下である[17]

AAC での符号化の単位であるフレーム長を短くするなどの変更を加え、圧縮率の低下と引き換えに符号化遅延を小さくする。
HE-AAC「HE-AAC」も参照

AAC LC をコアに SBR(Spectral Band Replication、スペクトル帯域複製)ツールを組み合わせて圧縮効率を向上させたプロファイルを HE-AAC(High-Efficiency Advanced Audio Coding)、さらに PS(Parametric Stereo)ツールも組み合わせたものを HE-AAC v2 と呼ぶ[21]HE-AAC は aacPlus や AAC+、HE-AAC v2 は aacPlus v2 や eAAC+ の商標名で呼ばれることもある。

SBR は、入力信号の低域成分と高域成分の相関を利用し、高域成分をスペクトル情報など情報を復元するためのわずかな制御情報のみでパラメータ化し、復号時に低域成分の情報から予測復元することで情報の圧縮を行う。

PS は、ステレオ信号について同様の考え方を用いるものである。ステレオ信号の左右チャネルの相関を利用し、左右の両チャネルを足し合わせたモノラル信号とステレオの空間情報をパラメータ化したサイド情報に分けて符号化を行い、復号時はモノラル信号とサイド情報とから両チャネルの信号を復元する。サイド情報は高音質の場合でも 9 kbps 程度で[22]、左右チャネルをそのまま符号化するのに比べ圧縮効率が高くなる。

両方式とも元の信号と物理的に同じものを復元するのではないが、音響心理学的に自然な復元を行うことができ、大幅な情報の圧縮ができる。また、HE-AAC をサポートしていないコーデックでも、AAC LC で符号化されたコア部分のみはデコード可能である。

欧州放送連合が実施した MUSHRA 法による試験では、HE-AAC で符号化された 48 kbps ステレオ信号の評価は 80点 で、 同じビットレートの AAC や mp3PRO より音質が高かった[21]

また、Moving Picture Experts Group による HE-AAC と HE-AAC v2 の MUSHRA 法による比較試験では、24 kbps の HE-AAC v2 は同じビットレートの HE-AAC よりはるかに優れており、32 kbps の HE-AAC と同等か優れた評価だった[21]


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:91 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef