さらにMPEG-4 AAC-LTP(後述)をプロファイルに数える場合がある。 MPEG-4 AAC v3においては、SBR (Spectral Band Replication) やパラメトリックステレオ (Parametric Stereo) 技術によって64 kbpsを下回るような超低ビットレートにおける品質を改善するHE-AAC (High-Efficiency AAC) が追加承認されている (AAC-LC, HE-AAC (aacPlus, AAC+SBR), HE-AAC Version 2 (aacPlus Version 2, Enhanced aacPlus, AAC+SBR+PS))。 MPEG-2 AACは主に日本のBS/110度CS 2Kデジタル放送と地上デジタル波放送のISDB規格やSD-AudioのAACフォーマット、ヨーロッパ圏のDVDなどで利用できる。北米や日本のDVDでは、AACではなくAC-3やDTSが採用されている。 MPEG-4 AACはiPodなどのデジタルオーディオプレーヤー、PlayStation PortableやDSiなどのゲーム機、日本のBS/110度CS 4K/8Kデジタル放送、携帯電話等、多くの機器やソフトウェアがサポートしている。また、第三世代携帯電話用の動画フォーマットである3GPPや3GPP2の音声圧縮方式としても採用されている。 音楽配信サービスでは、パソコン、iPod向けのiTunes Storeや携帯電話向けの着うたでAACが採用されている。ただし、これらのファイルの一部にはDRMが導入され、同じAACであるが互換性がないものがある[7]。デジタルオーディオプレーヤーの代表格であるiPodおよびiTunes(標準でAACを使用する)がAACに対応していることもあり、以前はAACに対応していなかったソニーやパナソニック、ケンウッド(現・JVCケンウッド)などのデジタルオーディオプレーヤーも現在ではAACに対応している。 またアップルでは前述のiTunesでの音楽配信のほか、ワイヤレスイヤホンマイクAirPods・スマートスピーカーHomePodや、FaceTime(AAC-ELD系)[8]などで使用している。 AAC (AAC-LC) の符号化処理は以下の流れで行われる。 AACはドルビーラボラトリーズも共同開発の一員で、AACロゴはドルビーラボラトリーズの登録商標である(日本国特許庁商標登録番号:第4693750号)。AACにはドルビーのほかAT&T、Fraunhofer IIS、ソニー、ノキアの特許技術が使用されている[9]ためソフトウェアメーカーなどから納付されたライセンス料はこれらの企業に分配されている。また、ライセンス管理はドルビーの子会社Via Licensing なおMPEG-4 AACが含まれるMPEG-4 AudioのカテゴリにはNTTサイバースペース研究所が開発したTwinVQが存在するが、これはAACとは別物である。 AACやHE-AACは下記に採用されており、実際に利用されている。
追加技術
MPEG-2/4 HE-AAC (High-Efficiency AAC)
AAC-LCにSBRの機能を追加したもの。SBRは高周波域の波形を補完するツールである。SBRを利用することで低ビットレートでも中?高音質の再生を可能としている。バージョン2が開発されて以降、区別のため、名前の後ろに”version 1”などを付ける場合がある。
MPEG-2/4 HE-AAC v2 (High-Efficiency AAC version 2)
AAC-LCにSBRとPSの機能を追加したもの。PS (Parametric Stereo) はモノラルの音声を擬似的にステレオに復元するツールであり、HE-AACよりもさらに低いビットレートで中 - 高音質の再生を行えるようにする。
MPEG-4 xHE-AAC (eXtended High-Efficiency AAC)
AAC-LCにSBRとPS、USACの機能を追加したもの。USAC (Unified Speech and Audio Coding) は声と音楽のどちらの音質にも重きが置かれるよう作られたツールであり、HE-AAC v2より低いビットレートでもある程度の音質が確保される。
MPEG-4 AAC-LTP
AACにLTPの機能を追加したもの。LTPはすべてのMPEG-4 AACに付加することが可能である。
MPEG-4 AAC-LD (Low Delay)
エンコードなどによる延滞時間を減少させたAAC。テレビ電話などで使用することを目的としている。
MPEG-4 AAC-ELD (Enhanced Low Delay)
MPEG-4 AAC-ELD v2 (version 2)
AAC-LDを改良した方式。
MPEG-4 SLS (Scalable Lossless Coding)
MPEG-4の可逆圧縮の一種。AACと組み合わせたものをHD-AACと呼ぶ場合がある。
利用状況
符号化アルゴリズム
MDCTによる直交変換
入力は窓長 2048 もしくは 256 のMDCTを用いてそれぞれ 1024 点 (long block)、128 点 (short block) の周波数領域のデータに変換される。MP3が一旦時間領域のフィルタで 32 サブバンドに分割した後にMDCTを行っていたのに対し、AACでは入力サンプルに対してそのままMDCTが行われる。
変換長は、入力信号の性質によって切り替えられる(アタック音など時間領域で急峻な変化を見せる信号にはshort blockが使われる)。long blockが576点相当(32 サブバンド × 18 点)、short blockが 192 点相当(32 サブバンド × 6 点)であったMP3と比較してlong blockをより長くすることで周波数解像度の向上による符号化効率の改善がshort blockをより短くする事で時間解像度の向上によるプリエコー抑制力の改善がなされている。
TNS
周波数領域の信号を、時間軸のものと見なした線形予測を行う。
周波数領域でのARモデル
この処理は省く事ができる。
ステレオ・コーディング
入力信号がステレオの場合は、ステレオ特有の性質を利用した符号化が行われる。
なおステレオ・コーディングはサブバンド毎に利用しなかったり、どちらか片方だけを利用したりすることができる。両方同時に使用することはできない。
インテンシティ・ステレオ
左右の信号を、単一の信号と定位情報のみに削減して符号化する。
MSステレオ
左右の信号を和/差信号とする。
量子化
聴覚心理モデルで決定した許容量子化雑音エネルギーと量子化雑音エネルギーが比例するようにスケールファクタ・バンド(近い周波数のMDCT係数をまとめたグループ)毎に量子化を行う。long blockのスケールファクタ・バンドの数は49 (44.1kHz) であり、21 であったMP3と比較して細かい制御が可能になっている。
ハフマン符号化
量子化された値を固定ハフマン符号化する。符号帳は 11 種類の中からサブバンド毎に選択される。
コンテナ対応
AVI, MOV, MP4, Matroska, MPEG-2 TS
備考
利用例
HTML5オーディオ - HE-AAC v2まで対応
YouTube
Dailymotion
radiko
NHKネットラジオ らじる★らじる
AccuRadio
Media Player Classic, VLC Media Player
iTunes, iTunes Store, QuickTime, FaceTime
iPod, iPhone, iPad
PSP, PS Vita,PS3,PS4
DSi(DSiサウンド), Wii(写真チャンネル) - v1.1から対応。
Blu-ray Disc (BDAV)
Bluetoothイヤホン - AirPodsなど
スマートスピーカー - HomePod, Google Home, Google Home対応スピーカーの一部機種
地上デジタル放送
BSデジタル放送
スカパー!プレミアムサービス
着うたフルプラス - KDDIおよび沖縄セルラー電話の一部のau携帯電話向け音楽配信サービス。
SD-Audio
Liquid Audio
Nero Digital
mora - ソニーグループの音楽配信サービス。2012年10月よりAACによる配信を開始(それ以前はATRAC3による配信)。